
meta在周六发布了其llama系列的新一代ai模型集合——llama 4(选在周末发布这一动作本身就很耐人寻味)。此次共推出四款新模型:llama 4 scout、llama 4 maverick和llama 4 behemoth。据meta透露,这些模型均通过"海量未标注的文本、图像及视频数据"训练,从而具备"广泛的视觉理解能力"。
有消息称,中国ai实验室深度求索(deepseek)开源模型的成功——其性能达到甚至超越meta前代旗舰llama模型——直接推动了llama研发进程的加速。据传meta紧急组建了战情室,试图破译深度求索如何降低r1、v3等模型运行和部署成本的技术路径。
目前scout和maverick已通过llama.com及hugging face等合作伙伴平台开放获取,而behemoth仍处于训练阶段。meta宣布其旗下跨whatsapp、messenger和instagram等应用的ai助手meta ai已完成升级,将在40个国家启用llama 4技术,不过多模态功能目前仅限英语版的美国用户使用。
图片来源:meta
llama 4的授权条款可能引发部分开发者争议。根据许可协议,欧盟境内注册或主要营业地的用户及企业被禁止使用或分发这些模型,这显然是受该地区ai与数据隐私法规的合规要求影响(meta此前曾公开批评这些法规限制过严)。此外延续既往政策,月活用户超7亿的企业须向meta申请特殊授权,而meta拥有绝对审批权。
"llama 4模型家族标志着llama生态系统新时代的开启,"meta在官方博文中宣称,"这仅仅是llama 4系列征程的起点。"
据披露,llama 4是meta首个采用混合专家(moe)架构的模型系列,该设计能显著提升训练及查询应答的算力效率。moe架构将数据处理任务分解为子任务,交由小型专业化"专家"模型处理。以maverick为例,其总参数量达4000亿,但通过128个"专家"模型仅激活170亿参数(参数规模大致对应模型的问题解决能力);scout则激活170亿参数,包含16个专家模型,总参数量1090亿。
meta内部测试显示,擅长创意写作等"通用助手与对话"场景的maverick,在编程、推理、多语言处理、长上下文理解和图像基准测试中超越了openai的gpt-4o和谷歌gemini 2.0,但逊色于谷歌gemini 2.5 pro、anthropic的claude 3.7 sonnet及openai gpt-4.5等最新顶级模型。scout的优势则体现在文档摘要和大规模代码库推理任务,其独特之处在于拥有1000万token的超大上下文窗口(token指文本基本单元,如"fantastic"可拆分为"fan""tas""tic"),这意味着它能处理包含数百万单词的庞杂文档。
根据meta测算,scout可在单块nvidia h100 gpu上运行,而maverick需要nvidia h100 dgx系统或同等配置。尚未发布的behemoth对硬件要求更为苛刻——该模型激活参数达2880亿,包含16个专家模型,总参数近2万亿。meta内部基准测试表明,在数学解题等stem能力评估中,behemoth表现优于gpt-4.5、claude 3.7 sonnet和gemini 2.0 pro(但不及2.5 pro)。
图片来源:meta
值得注意的是,llama 4全系均未采用类似openai o1和o3-mini的专用"推理"架构。推理模型会对答案进行事实核查,响应更可靠,但应答速度慢于传统"非推理"模型。
耐人寻味的是,meta宣称对llama 4全系模型进行了调优,使其更少拒绝回答"争议性"问题。据称相较于前代产品,llama 4现在会回应那些涉及政治社会议题的"争议性"提问。meta表示新模型在拒绝回答的提示词选择上也"显著更平衡"。
"[llama 4]能提供客观有益的回答而不带预设立场,"meta发言人向techcrunch表示,"我们持续提升模型的响应能力,使其能回答更多问题,兼容多元观点[...]且不偏袒特定立场。"这些调整正值白宫盟友团体指控ai聊天机器人政治立场过于"觉醒"之际。
包括亿万富翁埃隆·马斯克和加密货币与ai"沙皇"大卫·萨克斯在内的特朗普核心幕僚,多次公开指控主流ai聊天机器人审查保守派观点。萨克斯长期指称openai的chatgpt"被编程成觉醒派",在政治议题上存在不实陈述。实际上,ai偏见是行业公认的技术难题——马斯克自创的xai公司至今也未能打造出完全政治中立的聊天机器人。
这并不妨碍openai等公司持续调整模型策略,使其能应答更多(尤其是敏感争议话题类的)过往被规避的问题。
[1] meta releases llama 4, a new crop of flagship ai models , https://techcrunch.com/2025/04/05/meta-releases-llama-4-a-new-crop-of-flagship-ai-models/