速递|Llama 4突袭周末发布!Meta用2万亿参数怪兽硬刚GPT-4.5,却暗禁欧盟用户

2025年04月06日16:20:31 科技 2706
速递|Llama 4突袭周末发布!Meta用2万亿参数怪兽硬刚GPT-4.5,却暗禁欧盟用户 - 天天要闻
图片来源:meta

meta在周六发布了其llama系列的新一代ai模型集合——llama 4(选在周末发布这一动作本身就很耐人寻味)。此次共推出四款新模型:llama 4 scout、llama 4 maverick和llama 4 behemoth。据meta透露,这些模型均通过"海量未标注的文本、图像及视频数据"训练,从而具备"广泛的视觉理解能力"。

有消息称,中国ai实验室深度求索(deepseek)开源模型的成功——其性能达到甚至超越meta前代旗舰llama模型——直接推动了llama研发进程的加速。据传meta紧急组建了战情室,试图破译深度求索如何降低r1、v3等模型运行和部署成本的技术路径。

目前scout和maverick已通过llama.com及hugging face等合作伙伴平台开放获取,而behemoth仍处于训练阶段。meta宣布其旗下跨whatsapp、messenger和instagram等应用的ai助手meta ai已完成升级,将在40个国家启用llama 4技术,不过多模态功能目前仅限英语版的美国用户使用。

速递|Llama 4突袭周末发布!Meta用2万亿参数怪兽硬刚GPT-4.5,却暗禁欧盟用户 - 天天要闻

图片来源:meta

llama 4的授权条款可能引发部分开发者争议。根据许可协议,欧盟境内注册或主要营业地的用户及企业被禁止使用或分发这些模型,这显然是受该地区ai与数据隐私法规的合规要求影响(meta此前曾公开批评这些法规限制过严)。此外延续既往政策,月活用户超7亿的企业须向meta申请特殊授权,而meta拥有绝对审批权。

"llama 4模型家族标志着llama生态系统新时代的开启,"meta在官方博文中宣称,"这仅仅是llama 4系列征程的起点。"

据披露,llama 4是meta首个采用混合专家(moe)架构的模型系列,该设计能显著提升训练及查询应答的算力效率。moe架构将数据处理任务分解为子任务,交由小型专业化"专家"模型处理。以maverick为例,其总参数量达4000亿,但通过128个"专家"模型仅激活170亿参数(参数规模大致对应模型的问题解决能力);scout则激活170亿参数,包含16个专家模型,总参数量1090亿。

meta内部测试显示,擅长创意写作等"通用助手与对话"场景的maverick,在编程、推理、多语言处理、长上下文理解和图像基准测试中超越了openai的gpt-4o和谷歌gemini 2.0,但逊色于谷歌gemini 2.5 pro、anthropic的claude 3.7 sonnet及openai gpt-4.5等最新顶级模型。scout的优势则体现在文档摘要和大规模代码库推理任务,其独特之处在于拥有1000万token的超大上下文窗口(token指文本基本单元,如"fantastic"可拆分为"fan""tas""tic"),这意味着它能处理包含数百万单词的庞杂文档。

根据meta测算,scout可在单块nvidia h100 gpu上运行,而maverick需要nvidia h100 dgx系统或同等配置。尚未发布的behemoth对硬件要求更为苛刻——该模型激活参数达2880亿,包含16个专家模型,总参数近2万亿。meta内部基准测试表明,在数学解题等stem能力评估中,behemoth表现优于gpt-4.5、claude 3.7 sonnet和gemini 2.0 pro(但不及2.5 pro)。

速递|Llama 4突袭周末发布!Meta用2万亿参数怪兽硬刚GPT-4.5,却暗禁欧盟用户 - 天天要闻

图片来源:meta

值得注意的是,llama 4全系均未采用类似openai o1和o3-mini的专用"推理"架构。推理模型会对答案进行事实核查,响应更可靠,但应答速度慢于传统"非推理"模型。

耐人寻味的是,meta宣称对llama 4全系模型进行了调优,使其更少拒绝回答"争议性"问题。据称相较于前代产品,llama 4现在会回应那些涉及政治社会议题的"争议性"提问。meta表示新模型在拒绝回答的提示词选择上也"显著更平衡"。

"[llama 4]能提供客观有益的回答而不带预设立场,"meta发言人向techcrunch表示,"我们持续提升模型的响应能力,使其能回答更多问题,兼容多元观点[...]且不偏袒特定立场。"这些调整正值白宫盟友团体指控ai聊天机器人政治立场过于"觉醒"之际。

包括亿万富翁埃隆·马斯克和加密货币与ai"沙皇"大卫·萨克斯在内的特朗普核心幕僚,多次公开指控主流ai聊天机器人审查保守派观点。萨克斯长期指称openai的chatgpt"被编程成觉醒派",在政治议题上存在不实陈述。实际上,ai偏见是行业公认的技术难题——马斯克自创的xai公司至今也未能打造出完全政治中立的聊天机器人。

这并不妨碍openai等公司持续调整模型策略,使其能应答更多(尤其是敏感争议话题类的)过往被规避的问题。


参考资料 

[1] meta releases llama 4, a new crop of flagship ai models  , https://techcrunch.com/2025/04/05/meta-releases-llama-4-a-new-crop-of-flagship-ai-models/



欢迎扫码加群参与讨论

科技分类资讯推荐

天马携手OPPO Find X8s:以“好屏”定义旗舰显示新高度 - 天天要闻

天马携手OPPO Find X8s:以“好屏”定义旗舰显示新高度

随着OPPO Find X8s系列开启网络预订,其1.25mm全球最窄四等边设计再次刷新边框记录,重新定义了手机屏幕的美学形态。这一突破不仅体现出对视觉美的极致追求,更凝聚了OPPO与国产显示领军企业天马微电子的联合创新成果。两者结合OPPO新一代芯片级封装技术与天马极窄边框工艺,共同打造出兼具科技与美学的全新无界视觉体验。...
索诺瓦携手清华大学共筑听力无障碍未来 - 天天要闻

索诺瓦携手清华大学共筑听力无障碍未来

作为清华大学无障碍发展研究院长期合作伙伴,索诺瓦集团日前宣布,加入清华大学无障碍发展研究院产业委员会,将进一步深化双方的合作,围绕提升听力健康公众意识,支持听力无障碍环境建设,推动听力无障碍政策标准建立、实施等方面不断探索和前行。在我国,截至2024年末,60岁及以上人口已超3.1亿。据相关调查,我国60岁以...
5.5mm超薄机身!iPhone17Air新机模被曝光,外观真变了 - 天天要闻

5.5mm超薄机身!iPhone17Air新机模被曝光,外观真变了

距离iPhone 17系列正式推出只剩下不到半年时间了。除了常规的iPhone 17、iPhone 17 Pro、iPhone 17 Pro Max以外,苹果这次还会推出全新的iPhone 17 Air。之前网上已经流出 iPhone 17 Air 的渲染图,最近又有爆料晒出了 iPhone 17 系列的机模照片。小雷带大家一块儿看看。图源:网络首先,新系列
小米SU7事故背后:被智驾教育的年轻人 - 天天要闻

小米SU7事故背后:被智驾教育的年轻人

定焦One(dingjiaoone)原创作者 | 金玙璠编辑 | 魏佳智能驾驶功能已成为新能源汽车的标配,年轻人正用亲身经历为这个新兴技术投票。起初,他们在社交平台分享使用智驾的兴奋,感叹“科技改变生活”,如今,他们也记录下了“智驾失控”导
华硕 RX 9070 显卡被刷入 9070 XT vBIOS:解锁更高频率与功耗 - 天天要闻

华硕 RX 9070 显卡被刷入 9070 XT vBIOS:解锁更高频率与功耗

IT之家 4 月 7 日消息,德国 PCGH Extreme 论坛用户 Gurdi 昨日发帖表示,其成功为华硕 Prime Radeon RX 9070 OC 显卡刷入了 Prime RX 9070 XT OC 的 vBIOS 文件。这未能改变 GPU 核心启用规模,但还是带来了明显的频率和功耗提升。▲ 图源 Gurdi根据 AMD 给出的官方设定,RX 9
海尔周云杰化身001客服探访老用户,用了30年的空调让人佩服! - 天天要闻

海尔周云杰化身001客服探访老用户,用了30年的空调让人佩服!

一台空调用了30年,光空调外罩都用了七八个,海尔周总这次探访的海尔老用户真心让人佩服,咱就说这老两口也太勤俭持家了!海尔周总探访老用户首先发现安全隐患近日,海尔周总化身公司客服探访老用户,当他到达用户家楼下看到空调外机时,第一个发现的问题就
万物新生:循环经济领跑者的荣光与荆棘 - 天天要闻

万物新生:循环经济领跑者的荣光与荆棘

来源:韭菜财经v在数字经济与可持续发展理念交织的时代浪潮中,万物新生集团(爱回收)作为中国最大的电子产品回收及以旧换新平台,凭借对循环经济的深刻洞察迅速崛起。
不能任由电商“图文游戏”玩下去了 - 天天要闻

不能任由电商“图文游戏”玩下去了

从抽纸规格模糊到质保期隐藏小字说明,再到袜子“买3送3”的话术,让不少消费者在收货后大呼上当。袜子套装“买3送3”只是买3双发3双,所谓的“送”不是赠送,而是发送。