
meta在周六發佈了其llama系列的新一代ai模型集合——llama 4(選在周末發佈這一動作本身就很耐人尋味)。此次共推出四款新模型:llama 4 scout、llama 4 maverick和llama 4 behemoth。據meta透露,這些模型均通過"海量未標註的文本、圖像及視頻數據"訓練,從而具備"廣泛的視覺理解能力"。
有消息稱,中國ai實驗室深度求索(deepseek)開源模型的成功——其性能達到甚至超越meta前代旗艦llama模型——直接推動了llama研發進程的加速。據傳meta緊急組建了戰情室,試圖破譯深度求索如何降低r1、v3等模型運行和部署成本的技術路徑。
目前scout和maverick已通過llama.com及hugging face等合作夥伴平台開放獲取,而behemoth仍處於訓練階段。meta宣布其旗下跨whatsapp、messenger和instagram等應用的ai助手meta ai已完成升級,將在40個國家啟用llama 4技術,不過多模態功能目前僅限英語版的美國用戶使用。
圖片來源:meta
llama 4的授權條款可能引發部分開發者爭議。根據許可協議,歐盟境內註冊或主要營業地的用戶及企業被禁止使用或分發這些模型,這顯然是受該地區ai與數據隱私法規的合規要求影響(meta此前曾公開批評這些法規限制過嚴)。此外延續既往政策,月活用戶超7億的企業須向meta申請特殊授權,而meta擁有絕對審批權。
"llama 4模型家族標誌着llama生態系統新時代的開啟,"meta在官方博文中宣稱,"這僅僅是llama 4系列征程的起點。"
據披露,llama 4是meta首個採用混合專家(moe)架構的模型系列,該設計能顯著提升訓練及查詢應答的算力效率。moe架構將數據處理任務分解為子任務,交由小型專業化"專家"模型處理。以maverick為例,其總參數量達4000億,但通過128個"專家"模型僅激活170億參數(參數規模大致對應模型的問題解決能力);scout則激活170億參數,包含16個專家模型,總參數量1090億。
meta內部測試顯示,擅長創意寫作等"通用助手與對話"場景的maverick,在編程、推理、多語言處理、長上下文理解和圖像基準測試中超越了openai的gpt-4o和谷歌gemini 2.0,但遜色於谷歌gemini 2.5 pro、anthropic的claude 3.7 sonnet及openai gpt-4.5等最新頂級模型。scout的優勢則體現在文檔摘要和大規模代碼庫推理任務,其獨特之處在於擁有1000萬token的超大上下文窗口(token指文本基本單元,如"fantastic"可拆分為"fan""tas""tic"),這意味着它能處理包含數百萬單詞的龐雜文檔。
根據meta測算,scout可在單塊nvidia h100 gpu上運行,而maverick需要nvidia h100 dgx系統或同等配置。尚未發佈的behemoth對硬件要求更為苛刻——該模型激活參數達2880億,包含16個專家模型,總參數近2萬億。meta內部基準測試表明,在數學解題等stem能力評估中,behemoth表現優於gpt-4.5、claude 3.7 sonnet和gemini 2.0 pro(但不及2.5 pro)。
圖片來源:meta
值得注意的是,llama 4全系均未採用類似openai o1和o3-mini的專用"推理"架構。推理模型會對答案進行事實核查,響應更可靠,但應答速度慢於傳統"非推理"模型。
耐人尋味的是,meta宣稱對llama 4全系模型進行了調優,使其更少拒絕回答"爭議性"問題。據稱相較於前代產品,llama 4現在會回應那些涉及政治社會議題的"爭議性"提問。meta表示新模型在拒絕回答的提示詞選擇上也"顯著更平衡"。
"[llama 4]能提供客觀有益的回答而不帶預設立場,"meta發言人向techcrunch表示,"我們持續提升模型的響應能力,使其能回答更多問題,兼容多元觀點[...]且不偏袒特定立場。"這些調整正值白宮盟友團體指控ai聊天機械人政治立場過於"覺醒"之際。
包括億萬富翁埃隆·馬斯克和加密貨幣與ai"沙皇"大衛·薩克斯在內的特朗普核心幕僚,多次公開指控主流ai聊天機械人審查保守派觀點。薩克斯長期指稱openai的chatgpt"被編程成覺醒派",在政治議題上存在不實陳述。實際上,ai偏見是行業公認的技術難題——馬斯克自創的xai公司至今也未能打造出完全政治中立的聊天機械人。
這並不妨礙openai等公司持續調整模型策略,使其能應答更多(尤其是敏感爭議話題類的)過往被規避的問題。
[1] meta releases llama 4, a new crop of flagship ai models , https://techcrunch.com/2025/04/05/meta-releases-llama-4-a-new-crop-of-flagship-ai-models/