Meta 发布新一代旗舰 AI 模型 Llama 4

2025年04月06日05:02:04 科技 1257

Meta于周六发布了其 Llama 家族的全新 AI 模型系列Llama 4。总共有四种新模型:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。Meta 表示,所有模型都经过“大量未标记的文本、图像和视频数据”的训练,从而获得“广泛的视觉理解”。

中国DeepSeek的开放模型取得了成功,其性能与 Meta 之前的旗舰 Llama 模型相当甚至更好,这推动了 Llama 的加速开发。据说 Meta 已经组建了作战室来解密 DeepSeek 如何降低运行和部署R1和V3等模型的成本。

Scout 和 Maverick 已在Llama.com和 Meta 的合作伙伴处公开提供,包括 AI 开发平台 Hugging Face,而 Behemoth 仍在训练中。Meta 表示,其跨 WhatsAppMessengerInstagram 等应用的 AI 助手 Meta AI 已更新,可在 40 个国家/地区使用 Llama 4。目前,多模式功能仅限于美国英语版本。

一些开发人员可能对 Llama 4 许可证提出异议。

禁止在欧盟“注册”或“主要营业地点”为欧盟的用户和公司使用或分发这些模型,这可能是该地区人工智能和数据隐私法规定的治理要求的结果。(过去,Meta 曾谴责这些法律过于繁琐。)此外,与之前的 Llama 版本一样,每月活跃用户超过 7 亿的公司必须向 Meta 申请特殊许可,Meta 可自行决定授予或拒绝该许可。

Meta在一篇博文中写道: “这些 Llama 4 模型标志着 Llama 生态系统新时代的开始。这只是 Llama 4 系列的开始。”

Meta 发布新一代旗舰 AI 模型 Llama 4 - 天天要闻

Meta 表示,Llama 4 是其第一批使用混合专家 (MoE) 架构的模型,该架构在训练和回答查询方面具有更高的计算效率。MoE 架构基本上将数据处理任务分解为子任务,然后将其委托给较小的、专门的“专家”模型。

例如,Maverick 总共拥有 4000 亿个参数,但在 128 位“专家”中只有 170 亿个活跃参数。(参数大致对应于模型的解决问题的能力。)Scout 拥有 170 亿个活跃参数、16 位专家和 1090 亿个总参数。

根据 Meta 的内部测试,Maverick 在某些编码、推理、多语言、长上下文和图像基准上超过了 OpenAI 的GPT-4o和Google的Gemini 2.0等模型,该公司称 Maverick最适合创意写作等“一般助理和聊天”用例。然而,Maverick 还不如Google的Gemini 2.5 Pro、Anthropic 的Claude 3.7 Sonnet和 OpenAI 的GPT-4.5等功能更强大的近期模型。

Scout 的优势在于文档摘要和大型代码库推理等任务。它的独特之处在于拥有非常大的上下文窗口:1000 万个标记。(“标记”代表原始文本的片段 — 例如,“fantastic” 一词可拆分为“fan”、“tas”和“tic”。)用简单的英语来说,Scout 可以接收图像和多达数百万个单词,从而能够处理和处理非常长的文档。

据 Meta 称,Scout 可以在单个 NVIDIA H100 GPU 上运行,而 Maverick 则需要 NVIDIA H100 DGX 系统。

Meta 尚未发布的 Behemoth 将需要更强大的硬件。据该公司称,Behemoth 拥有 2880 亿个活跃参数、16 位专家和近 2 万亿个总参数。Meta 的内部基准测试显示,在多项衡量 STEM 技能(如数学问题解决能力)的评估中,Behemoth 的表现优于 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不是 2.5 Pro)。

值得注意的是,Llama 4 模型中没有一个是像 OpenAI 的o1和o3-mini那样的真正的“推理”模型。推理模型会核实其答案,并且通常能更可靠地回答问题,但因此比传统的“非推理”模型需要更长的时间来给出答案。

Meta 发布新一代旗舰 AI 模型 Llama 4 - 天天要闻

有趣的是,Meta 表示,它对所有 Llama 4 型号进行了调整,使其不再频繁地拒绝回答“有争议”的问题。据该公司称,Llama 4 会回应“有争议的”政治和社会话题,而之前的 Llama 型号不会回应。此外,该公司表示,Llama 4 的“平衡性大大提高”,它根本不会接受这些提示。

Meta 发言人表示:“你可以依靠 Lllama 4 提供有用的、基于事实的回答,而不会做出任何评判。我们正在继续提高 Llama 的响应能力,以便它能够回答更多问题,能够回应各种不同的观点,并且不会偏袒某些观点。”

这些调整是在白宫的一些盟友指责人工智能聊天机器人在政治上过于“觉醒”之际做出的。

唐纳德·特朗普总统的许多密友,包括亿万富翁埃隆·马斯克和加密与人工智能“沙皇”大卫·萨克斯,都声称流行的人工智能聊天机器人 会审查保守派观点。萨克斯曾指出, OpenAI 的 ChatGPT 是“被编程为唤醒”的,并且在政治话题上不诚实。

事实上,人工智能中的偏见是一个棘手的技术问题。马斯克自己的人工智能公司 xAI 一直在 努力 打造一款不会偏袒某些政治观点的聊天机器人。

这并没有阻止包括 OpenAI 在内的公司调整他们的人工智能模型来回答比以前更多的问题,特别是涉及有争议话题的问题。

科技分类资讯推荐

SU7事故:小米受“智驾反噬”影响最小 - 天天要闻

SU7事故:小米受“智驾反噬”影响最小

俗话说“成也萧何败也萧何”,造车新势力依靠“脑残粉”烘托的市场终于要被反噬了,那些为一句“遥遥领先”而欢呼雀跃的人群,现在是不是要倒戈了?上一周车圈最热门的事件就是小米SU7的事故,身边人借此次事故问我小米汽车如何,我说非常好,至少在所有新
芯片“教父”张忠谋:56岁创台积电,70岁娶女秘书 - 天天要闻

芯片“教父”张忠谋:56岁创台积电,70岁娶女秘书

张忠谋是全球半导体行业的传奇人物,56岁创业,70岁迎娶女秘书,晚年却因争议言论和商业抉择频频登上头条。他一手缔造了台积电——全球芯片代工领域的霸主,但也因“技术空心化”质疑和婚姻风波饱受争议。他是张忠谋,一个在战乱中成长、在美国崛起、在台
喊出“生死存亡”!三星能渡过中年危机吗? - 天天要闻

喊出“生死存亡”!三星能渡过中年危机吗?

有人扒出旧账称,当年小米某高管因供应链问题得罪三星,三星直接断了小米的货。如今风水轮流转,终于换到李在镕主动登门拜访了,甚至还有网友夸张地声称:“李在镕终于要给雷军赔笑脸了。”
我国的低价苹果正在大量出口,为什么低价苹果更受外国人欢迎? - 天天要闻

我国的低价苹果正在大量出口,为什么低价苹果更受外国人欢迎?

在众多的进口水果中,苹果是其中之一。进口苹果虽然在大多数时候“不显山不露水”,但其实价格一点也不低。如今我国水果市场上的进口苹果主要是新西兰苹果、南非苹果等。而我国进口的新西兰苹果在苹果价格上几乎是“天花板级别”的。一斤苹果有时候能卖到大几
美媒:苹果手机价格或飙升 - 天天要闻

美媒:苹果手机价格或飙升

根据彭博社的报道,目前苹果公司90%的手机在中国组装,这意味着,苹果公司将不得不面临一个艰难的选择:是自行消化关税成本,还是将其转嫁给消费者。