速遞|Llama 4突襲周末發佈!Meta用2萬億參數怪獸硬剛GPT-4.5,卻暗禁歐盟用戶

2025年04月06日16:20:31 科技 2706
速遞|Llama 4突襲周末發佈!Meta用2萬億參數怪獸硬剛GPT-4.5,卻暗禁歐盟用戶 - 天天要聞
圖片來源:meta

meta在周六發佈了其llama系列的新一代ai模型集合——llama 4(選在周末發佈這一動作本身就很耐人尋味)。此次共推出四款新模型:llama 4 scout、llama 4 maverick和llama 4 behemoth。據meta透露,這些模型均通過"海量未標註的文本、圖像及視頻數據"訓練,從而具備"廣泛的視覺理解能力"。

有消息稱,中國ai實驗室深度求索(deepseek)開源模型的成功——其性能達到甚至超越meta前代旗艦llama模型——直接推動了llama研發進程的加速。據傳meta緊急組建了戰情室,試圖破譯深度求索如何降低r1、v3等模型運行和部署成本的技術路徑。

目前scout和maverick已通過llama.com及hugging face等合作夥伴平台開放獲取,而behemoth仍處於訓練階段。meta宣布其旗下跨whatsapp、messenger和instagram等應用的ai助手meta ai已完成升級,將在40個國家啟用llama 4技術,不過多模態功能目前僅限英語版的美國用戶使用。

速遞|Llama 4突襲周末發佈!Meta用2萬億參數怪獸硬剛GPT-4.5,卻暗禁歐盟用戶 - 天天要聞

圖片來源:meta

llama 4的授權條款可能引發部分開發者爭議。根據許可協議,歐盟境內註冊或主要營業地的用戶及企業被禁止使用或分發這些模型,這顯然是受該地區ai與數據隱私法規的合規要求影響(meta此前曾公開批評這些法規限制過嚴)。此外延續既往政策,月活用戶超7億的企業須向meta申請特殊授權,而meta擁有絕對審批權。

"llama 4模型家族標誌着llama生態系統新時代的開啟,"meta在官方博文中宣稱,"這僅僅是llama 4系列征程的起點。"

據披露,llama 4是meta首個採用混合專家(moe)架構的模型系列,該設計能顯著提升訓練及查詢應答的算力效率。moe架構將數據處理任務分解為子任務,交由小型專業化"專家"模型處理。以maverick為例,其總參數量達4000億,但通過128個"專家"模型僅激活170億參數(參數規模大致對應模型的問題解決能力);scout則激活170億參數,包含16個專家模型,總參數量1090億。

meta內部測試顯示,擅長創意寫作等"通用助手與對話"場景的maverick,在編程、推理、多語言處理、長上下文理解和圖像基準測試中超越了openai的gpt-4o和谷歌gemini 2.0,但遜色於谷歌gemini 2.5 pro、anthropic的claude 3.7 sonnet及openai gpt-4.5等最新頂級模型。scout的優勢則體現在文檔摘要和大規模代碼庫推理任務,其獨特之處在於擁有1000萬token的超大上下文窗口(token指文本基本單元,如"fantastic"可拆分為"fan""tas""tic"),這意味着它能處理包含數百萬單詞的龐雜文檔。

根據meta測算,scout可在單塊nvidia h100 gpu上運行,而maverick需要nvidia h100 dgx系統或同等配置。尚未發佈的behemoth對硬件要求更為苛刻——該模型激活參數達2880億,包含16個專家模型,總參數近2萬億。meta內部基準測試表明,在數學解題等stem能力評估中,behemoth表現優於gpt-4.5、claude 3.7 sonnet和gemini 2.0 pro(但不及2.5 pro)。

速遞|Llama 4突襲周末發佈!Meta用2萬億參數怪獸硬剛GPT-4.5,卻暗禁歐盟用戶 - 天天要聞

圖片來源:meta

值得注意的是,llama 4全系均未採用類似openai o1和o3-mini的專用"推理"架構。推理模型會對答案進行事實核查,響應更可靠,但應答速度慢於傳統"非推理"模型。

耐人尋味的是,meta宣稱對llama 4全系模型進行了調優,使其更少拒絕回答"爭議性"問題。據稱相較於前代產品,llama 4現在會回應那些涉及政治社會議題的"爭議性"提問。meta表示新模型在拒絕回答的提示詞選擇上也"顯著更平衡"。

"[llama 4]能提供客觀有益的回答而不帶預設立場,"meta發言人向techcrunch表示,"我們持續提升模型的響應能力,使其能回答更多問題,兼容多元觀點[...]且不偏袒特定立場。"這些調整正值白宮盟友團體指控ai聊天機械人政治立場過於"覺醒"之際。

包括億萬富翁埃隆·馬斯克和加密貨幣與ai"沙皇"大衛·薩克斯在內的特朗普核心幕僚,多次公開指控主流ai聊天機械人審查保守派觀點。薩克斯長期指稱openai的chatgpt"被編程成覺醒派",在政治議題上存在不實陳述。實際上,ai偏見是行業公認的技術難題——馬斯克自創的xai公司至今也未能打造出完全政治中立的聊天機械人。

這並不妨礙openai等公司持續調整模型策略,使其能應答更多(尤其是敏感爭議話題類的)過往被規避的問題。


參考資料 

[1] meta releases llama 4, a new crop of flagship ai models  , https://techcrunch.com/2025/04/05/meta-releases-llama-4-a-new-crop-of-flagship-ai-models/



歡迎掃碼加群參與討論

科技分類資訊推薦

天馬攜手OPPO Find X8s:以「好屏」定義旗艦顯示新高度 - 天天要聞

天馬攜手OPPO Find X8s:以「好屏」定義旗艦顯示新高度

隨着OPPO Find X8s系列開啟網絡預訂,其1.25mm全球最窄四等邊設計再次刷新邊框記錄,重新定義了手機屏幕的美學形態。這一突破不僅體現出對視覺美的極致追求,更凝聚了OPPO與國產顯示領軍企業天馬微電子的聯合創新成果。兩者結合OPPO新一代芯片級封裝技術與天馬極窄邊框工藝,共同打造出兼具科技與美學的全新無界視覺體驗。...
索諾瓦攜手清華大學共築聽力無障礙未來 - 天天要聞

索諾瓦攜手清華大學共築聽力無障礙未來

作為清華大學無障礙發展研究院長期合作夥伴,索諾瓦集團日前宣布,加入清華大學無障礙發展研究院產業委員會,將進一步深化雙方的合作,圍繞提升聽力健康公眾意識,支持聽力無障礙環境建設,推動聽力無障礙政策標準建立、實施等方面不斷探索和前行。在我國,截至2024年末,60歲及以上人口已超3.1億。據相關調查,我國60歲以...
5.5mm超薄機身!iPhone17Air新機模被曝光,外觀真變了 - 天天要聞

5.5mm超薄機身!iPhone17Air新機模被曝光,外觀真變了

距離iPhone 17系列正式推出只剩下不到半年時間了。除了常規的iPhone 17、iPhone 17 Pro、iPhone 17 Pro Max以外,蘋果這次還會推出全新的iPhone 17 Air。之前網上已經流出 iPhone 17 Air 的渲染圖,最近又有爆料曬出了 iPhone 17 系列的機模照片。小雷帶大家一塊兒看看。圖源:網絡首先,新系列
小米SU7事故背後:被智駕教育的年輕人 - 天天要聞

小米SU7事故背後:被智駕教育的年輕人

定焦One(dingjiaoone)原創作者 | 金玙璠編輯 | 魏佳智能駕駛功能已成為新能源汽車的標配,年輕人正用親身經歷為這個新興技術投票。起初,他們在社交平台分享使用智駕的興奮,感嘆「科技改變生活」,如今,他們也記錄下了「智駕失控」導
華碩 RX 9070 顯卡被刷入 9070 XT vBIOS:解鎖更高頻率與功耗 - 天天要聞

華碩 RX 9070 顯卡被刷入 9070 XT vBIOS:解鎖更高頻率與功耗

IT之家 4 月 7 日消息,德國 PCGH Extreme 論壇用戶 Gurdi 昨日發帖表示,其成功為華碩 Prime Radeon RX 9070 OC 顯卡刷入了 Prime RX 9070 XT OC 的 vBIOS 文件。這未能改變 GPU 核心啟用規模,但還是帶來了明顯的頻率和功耗提升。▲ 圖源 Gurdi根據 AMD 給出的官方設定,RX 9
海爾周雲傑化身001客服探訪老用戶,用了30年的空調讓人佩服! - 天天要聞

海爾周雲傑化身001客服探訪老用戶,用了30年的空調讓人佩服!

一台空調用了30年,光空調外罩都用了七八個,海爾周總這次探訪的海爾老用戶真心讓人佩服,咱就說這老兩口也太勤儉持家了!海爾周總探訪老用戶首先發現安全隱患近日,海爾周總化身公司客服探訪老用戶,當他到達用戶家樓下看到空調外機時,第一個發現的問題就
萬物新生:循環經濟領跑者的榮光與荊棘 - 天天要聞

萬物新生:循環經濟領跑者的榮光與荊棘

來源:韭菜財經v在數字經濟與可持續發展理念交織的時代浪潮中,萬物新生集團(愛回收)作為中國最大的電子產品回收及以舊換新平台,憑藉對循環經濟的深刻洞察迅速崛起。
不能任由電商「圖文遊戲」玩下去了 - 天天要聞

不能任由電商「圖文遊戲」玩下去了

從抽紙規格模糊到質保期隱藏小字說明,再到襪子「買3送3」的話術,讓不少消費者在收貨後大呼上當。襪子套裝「買3送3」只是買3雙發3雙,所謂的「送」不是贈送,而是發送。