Meta 發布新一代旗艦 AI 模型 Llama 4

2025年04月06日05:02:04 科技 1257

Meta於周六發布了其 Llama 家族的全新 AI 模型系列Llama 4。總共有四種新模型:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。Meta 表示,所有模型都經過“大量未標記的文本、圖像和視頻數據”的訓練,從而獲得“廣泛的視覺理解”。

中國DeepSeek的開放模型取得了成功,其性能與 Meta 之前的旗艦 Llama 模型相當甚至更好,這推動了 Llama 的加速開發。據說 Meta 已經組建了作戰室來解密 DeepSeek 如何降低運行和部署R1和V3等模型的成本。

Scout 和 Maverick 已在Llama.com和 Meta 的合作夥伴處公開提供,包括 AI 開發平台 Hugging Face,而 Behemoth 仍在訓練中。Meta 表示,其跨 WhatsAppMessengerInstagram 等應用的 AI 助手 Meta AI 已更新,可在 40 個國家/地區使用 Llama 4。目前,多模式功能僅限於美國英語版本。

一些開發人員可能對 Llama 4 許可證提出異議。

禁止在歐盟“註冊”或“主要營業地點”為歐盟的用戶和公司使用或分發這些模型,這可能是該地區人工智能和數據隱私法規定的治理要求的結果。(過去,Meta 曾譴責這些法律過於繁瑣。)此外,與之前的 Llama 版本一樣,每月活躍用戶超過 7 億的公司必須向 Meta 申請特殊許可,Meta 可自行決定授予或拒絕該許可。

Meta在一篇博文中寫道: “這些 Llama 4 模型標誌着 Llama 生態系統新時代的開始。這只是 Llama 4 系列的開始。”

Meta 發布新一代旗艦 AI 模型 Llama 4 - 天天要聞

Meta 表示,Llama 4 是其第一批使用混合專家 (MoE) 架構的模型,該架構在訓練和回答查詢方面具有更高的計算效率。MoE 架構基本上將數據處理任務分解為子任務,然後將其委託給較小的、專門的“專家”模型。

例如,Maverick 總共擁有 4000 億個參數,但在 128 位“專家”中只有 170 億個活躍參數。(參數大致對應於模型的解決問題的能力。)Scout 擁有 170 億個活躍參數、16 位專家和 1090 億個總參數。

根據 Meta 的內部測試,Maverick 在某些編碼、推理、多語言、長上下文和圖像基準上超過了 OpenAI 的GPT-4o和Google的Gemini 2.0等模型,該公司稱 Maverick最適合創意寫作等“一般助理和聊天”用例。然而,Maverick 還不如Google的Gemini 2.5 Pro、Anthropic 的Claude 3.7 Sonnet和 OpenAI 的GPT-4.5等功能更強大的近期模型。

Scout 的優勢在於文檔摘要和大型代碼庫推理等任務。它的獨特之處在於擁有非常大的上下文窗口:1000 萬個標記。(“標記”代表原始文本的片段 — 例如,“fantastic” 一詞可拆分為“fan”、“tas”和“tic”。)用簡單的英語來說,Scout 可以接收圖像和多達數百萬個單詞,從而能夠處理和處理非常長的文檔。

據 Meta 稱,Scout 可以在單個 NVIDIA H100 GPU 上運行,而 Maverick 則需要 NVIDIA H100 DGX 系統。

Meta 尚未發布的 Behemoth 將需要更強大的硬件。據該公司稱,Behemoth 擁有 2880 億個活躍參數、16 位專家和近 2 萬億個總參數。Meta 的內部基準測試顯示,在多項衡量 STEM 技能(如數學問題解決能力)的評估中,Behemoth 的表現優於 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不是 2.5 Pro)。

值得注意的是,Llama 4 模型中沒有一個是像 OpenAI 的o1和o3-mini那樣的真正的“推理”模型。推理模型會核實其答案,並且通常能更可靠地回答問題,但因此比傳統的“非推理”模型需要更長的時間來給出答案。

Meta 發布新一代旗艦 AI 模型 Llama 4 - 天天要聞

有趣的是,Meta 表示,它對所有 Llama 4 型號進行了調整,使其不再頻繁地拒絕回答“有爭議”的問題。據該公司稱,Llama 4 會回應“有爭議的”政治和社會話題,而之前的 Llama 型號不會回應。此外,該公司表示,Llama 4 的“平衡性大大提高”,它根本不會接受這些提示。

Meta 發言人表示:“你可以依靠 Lllama 4 提供有用的、基於事實的回答,而不會做出任何評判。我們正在繼續提高 Llama 的響應能力,以便它能夠回答更多問題,能夠回應各種不同的觀點,並且不會偏袒某些觀點。”

這些調整是在白宮的一些盟友指責人工智能聊天機器人在政治上過於“覺醒”之際做出的。

唐納德·特朗普總統的許多密友,包括億萬富翁埃隆·馬斯克和加密與人工智能“沙皇”大衛·薩克斯,都聲稱流行的人工智能聊天機器人 會審查保守派觀點。薩克斯曾指出, OpenAI 的 ChatGPT 是“被編程為喚醒”的,並且在政治話題上不誠實。

事實上,人工智能中的偏見是一個棘手的技術問題。馬斯克自己的人工智能公司 xAI 一直在 努力 打造一款不會偏袒某些政治觀點的聊天機器人。

這並沒有阻止包括 OpenAI 在內的公司調整他們的人工智能模型來回答比以前更多的問題,特別是涉及有爭議話題的問題。

科技分類資訊推薦

SU7事故:小米受“智駕反噬”影響最小 - 天天要聞

SU7事故:小米受“智駕反噬”影響最小

俗話說“成也蕭何敗也蕭何”,造車新勢力依靠“腦殘粉”烘托的市場終於要被反噬了,那些為一句“遙遙領先”而歡呼雀躍的人群,現在是不是要倒戈了?上一周車圈最熱門的事件就是小米SU7的事故,身邊人藉此次事故問我小米汽車如何,我說非常好,至少在所有新
芯片“教父”張忠謀:56歲創台積電,70歲娶女秘書 - 天天要聞

芯片“教父”張忠謀:56歲創台積電,70歲娶女秘書

張忠謀是全球半導體行業的傳奇人物,56歲創業,70歲迎娶女秘書,晚年卻因爭議言論和商業抉擇頻頻登上頭條。他一手締造了台積電——全球芯片代工領域的霸主,但也因“技術空心化”質疑和婚姻風波飽受爭議。他是張忠謀,一個在戰亂中成長、在美國崛起、在台
喊出“生死存亡”!三星能渡過中年危機嗎? - 天天要聞

喊出“生死存亡”!三星能渡過中年危機嗎?

有人扒出舊賬稱,當年小米某高管因供應鏈問題得罪三星,三星直接斷了小米的貨。如今風水輪流轉,終於換到李在鎔主動登門拜訪了,甚至還有網友誇張地聲稱:“李在鎔終於要給雷軍賠笑臉了。”
我國的低價蘋果正在大量出口,為什麼低價蘋果更受外國人歡迎? - 天天要聞

我國的低價蘋果正在大量出口,為什麼低價蘋果更受外國人歡迎?

在眾多的進口水果中,蘋果是其中之一。進口蘋果雖然在大多數時候“不顯山不露水”,但其實價格一點也不低。如今我國水果市場上的進口蘋果主要是新西蘭蘋果、南非蘋果等。而我國進口的新西蘭蘋果在蘋果價格上幾乎是“天花板級別”的。一斤蘋果有時候能賣到大幾
美媒:蘋果手機價格或飆升 - 天天要聞

美媒:蘋果手機價格或飆升

根據彭博社的報道,目前蘋果公司90%的手機在中國組裝,這意味着,蘋果公司將不得不面臨一個艱難的選擇:是自行消化關稅成本,還是將其轉嫁給消費者。