這隻「羊駝」性能太炸裂!Llama 3用開源對抗GPT?

2024年03月02日12:45:19 科技 1545

Sora 引發的討論還在持續。有人認為 Sora 將是通往 AGI(通用人工智慧)的快車道,也有人只是認為 Sora 開拓了 Transformer 架構與擴散模型相結合的全新技術路線,還有人認為 Sora 與 AGI 沒有太大的關係,是一個產品上的重要里程碑,但在技術上並不比 ChatGPT 更重要。


不管 Sora 的出現意味著什麼,大模型之戰都還遠遠未到終局。如果說 OpenAI 已經佔據了今天閉源大模型生態的一極,那 Meta 無疑是代表開源大模型的另一極。


Meta 的 Llama(羊駝)可以說從一開始就是最強大的開源大模型之一。去年 7 月,Meta 更是發布更強的 Llama 2,最為關鍵的是開源協議從「僅研究可用」轉向了「免費可商用」,雖然也造就了一大批「套殼」的大模型,但毫無疑問一舉改變大模型的格局。


不過 AI 世界一天一變,前有法國開源「新秀」Mistral 將 Llama 2 挑落馬下(2 月又推出了「僅次於 GPT-4」的閉源大模型 Mistral Large),後有谷歌發布 Gemma 開源大模型碾壓 Llama 2。


Llama 3 該來了。


今年 1 月,Meta CEO 馬克·扎克伯格(以下簡稱「小扎」)就在 Instagram 視頻中宣布,Meta AI 已經開始訓練 Llama 3。而據 The Information 最新這隻「羊駝」性能太炸裂!Llama 3用開源對抗GPT? - 天天要聞

小扎的官宣視頻,圖/ Instagram


考慮到 Meta 在第一代 Llama 花了三個月的時間來訓練,在 Llama 2 花了大約六個月的時間來訓練,如果下一代模型遵循類似的時間表,也應該是在 2024 年 7 月的某個時間發布。


不僅如此,綜合相關報道以及 Meta 官方透露出的信息,預計將在四個月後發布的 Llama 3 還有著更大的野心,恐怕又將以開源之姿再次改變大模型世界。


Llama 3 繼續進化,Meta太豪橫了


至少在當下,算力依然是大模型「迭代」的關鍵因素之一,就連 OpenAI 也要時不時說明自身的算力儲備。


在 Instagram 視頻中,小扎就表示,預計到 2024 年底,Meta 將擁有 350000 塊英偉達 H100(官方定價單塊 3.5 萬美元,實際還在溢價),如果算上其他算力資源將達到近 600000 塊 H100:


目前可能也只有微軟、谷歌擁有與之可比的算力儲備。


這隻「羊駝」性能太炸裂!Llama 3用開源對抗GPT? - 天天要聞

H00 GPU,圖/英偉達


小扎的言下之意其實很明顯:Meta 有足夠的 AI 算力資源來支持 Llama 3 的大規模預訓練以及生成式 AI 的技術研究。


具體的參數大小暫且無法得知,但可以預計將會延續之前的多個參數規模版本,有傳聞稱最大版本將超過 1400 億參數,直接挑戰 GPT-4 等領先的大模型。


The Information 還引用內部消息指出,Llama 3 不僅會放鬆「安全圍欄」,與 GPT-4、Gemini 以及 Llama 2 相比,Llama 3 在處理爭議問題時提供更好的回答。Meta 顯然希望至少提供有關查詢的上下文,而不是忽略、拒絕回答用戶提出的問題。


想要做到這一點,除了要求 Llama 3 從技術更好地改善大模型的「幻覺」問題,或許也要求上下文長度的改進。在 Llama 2 上,Meta 就將上下文長度翻了一番,讓模型在推理期間(與 AI 聊天的過程)可以「記住」兩倍的 Token 上下文。


另一方面,如今大模型廠商普遍都在轉向多模態大模型(如 Gemini、GPT-4V)的研究,即在文本之外還支持和理解圖像和音頻,可以同時生成文字、圖片、聲音和視頻。Meta 大概也不例外。


小扎雖然只確認 Llama 3 和 Llama 2 一樣將包含代碼生成功能,卻沒有明確提及其他多模式功能,不過他在官宣視頻還是談到了「人工智慧」與「元宇宙」相結合的設想。


「眼鏡是讓人工智慧看你所看、聽你所聽的理想產品形態,」小扎在談到 Meta x 雷朋眼鏡時指出,「它隨時可以提供幫助。」雷科技在獨立 AI 終端 這隻「羊駝」性能太炸裂!Llama 3用開源對抗GPT? - 天天要聞

圖/雷科技報道團現場攝製


換言之,Meta 的方向一定是讓 AI 模型同時具備自然語言理解、視覺和聽覺能力。由此推測,Llama 3 甚至後續幾代 Llama 對於多模態的支持可以說是題中應有之義。


總得來說,我們可以合理地預期,就算 Llama 3 的規模還是維持在從 70 億參數到 700 億參數不等的範圍,仍舊會帶來顯著的性能提升,同時 Llama 3 也將帶來更大的想像空間。


更何況 Meta 還有對 AGI 的追求。


「越來越清楚的是,下一代服務需要構建全面的通用智能。」小扎明確地指出了 Meta 構建 AGI 的長期目標,「打造最好的人工智慧助手、創作者人工智慧、企業人工智慧等等——這需要人工智慧各個領域的進步,從推理到規划到編碼到記憶以及其他認知能力。」


當然,這並不意味著 Llama 3 就將實現(甚至試圖實現)AGI。但毫無疑問,Meta 正在有意以一種他們認為最終可能實現 AGI 的方式,進行研究和開發。


為了成功,Llama 3 還會繼續開源


公允地說,Llama 3 開不開源,將極大地影響到整個人工智慧行業。


作為行業被應用最多的開源大模型,Llama 2 及其為重要核心的上下游已經開始有意識構建生態。去年 12 月,為了對抗 OpenAI、谷歌為代表的閉源陣營,Meta 聯合甲骨文英特爾AMDIBM索尼戴爾等 57 家全球科技公司和研究機構成立了「AI 聯盟」。


這隻「羊駝」性能太炸裂!Llama 3用開源對抗GPT? - 天天要聞

AI 聯盟成員,圖/ IBM


這個聯盟有 6 大目標,其中很重要的一項就是搭建開源大模型生態,包括從研究、評估、硬體、安全、公眾參與等一整套流程。


小扎雖然從始至終沒有明確指出 Llama 3 開源與否,但 Llama 3 很大概率將會繼續開源。


官宣正在訓練 Llama 3 後,小扎就在 The Verge這隻「羊駝」性能太炸裂!Llama 3用開源對抗GPT? - 天天要聞

Yann LeCun,圖/ Meta


總而言之,開源能夠吸引更多廠商進行微調,吸引更多的開發者構建應用,也吸引更多的用戶進行使用,帶動生態的快速進步。特別當 Meta 佔據開源大模型的頂級生態位,除了最先進的閉源大模型,用戶恐怕會對其他所有模型失去興趣,Meta 也更容易在 OpenAI 的生態之外培育一個龐大的開發生態,甚至超越 OpenAI:


就如同當年 Android 的後來居上。


此外,監管問題也是無法迴避的。考慮到人工智慧的顛覆性,當人工智慧的進程不是由一家公司完全主導,而是由全球公司和開發者聯手打造,也更容易被監管機構所接受。


寫在最後


願景是美好的,現實卻不一定。問題是,Meta 還能夠重回開源「王座」,甚至超越 GPT-4 嗎?


這隻「羊駝」性能太炸裂!Llama 3用開源對抗GPT? - 天天要聞

圖/ X(原 Twitter


時移事易,Llama 3 發布之時,Meta 要面對的情況可能完全不同。谷歌 Gemma 的下場碾壓,Mistral 的黑馬之姿,都證明了 Meta 的開源「王座」並不穩固。尤其是谷歌,雖然次次都被 OpenAI 壓一頭,但沒有人敢真的忽視谷歌的錢、技術與號召力。


當然,這些問題最終還是要等到 Llama 3 發布之時,才會有更明確的答案。在那之前,大模型乾坤未定,一切皆有可能。



科技分類資訊推薦

百度前副總裁璩靜開醫美診所,人均消費2218元 - 天天要聞

百度前副總裁璩靜開醫美診所,人均消費2218元

紅星資本局7月2日消息,百度前副總裁璩靜在華為總部坂田基地附近開了一家醫美診所。據公開資料,璩靜名下新增一家存續企業——深圳大為診所。該診所成立於2024年12月23日,璩靜持股比例為100%,認繳出資額為100萬元,經營範圍為診所服務等。
千里智行,常用常新,傳祺嚮往S7 開啟重磅OTA升級 - 天天要聞

千里智行,常用常新,傳祺嚮往S7 開啟重磅OTA升級

7月2日,傳祺嚮往S7 OTA如期而至,OTA 2.0版本正式全量推送。本次升級新增16項功能,31項 功能升級和57項體驗優化,主要涉及智能座艙、智能輔助駕駛、娛樂系統、車機交互等多個維度,旨在為用戶提供常用常新的出行體驗,功能強大又好用。
九州風神推出大霜塔稜鏡風冷散熱器:雙塔稜鏡頂蓋,209 元 - 天天要聞

九州風神推出大霜塔稜鏡風冷散熱器:雙塔稜鏡頂蓋,209 元

IT之家 7 月 3 日消息,九州風神 DeepCool 現已推出大霜塔稜鏡 (AG620 ARGB V2) 風冷散熱器。其採用雙塔雙風扇六熱管直觸設計,雙塔頂部均配有 ARGB 燈效「稜鏡頂蓋」。大霜塔稜鏡長寬高 129×136×162 (mm),支持 45mm 高內存條。其六根 6mm 雙向恆定熱平衡熱管採用 CTT 2.0 核心觸控技術在塔體底部並管排
今年5月中國大陸筆記本電腦線上市場銷量增長,均價直逼7000元 - 天天要聞

今年5月中國大陸筆記本電腦線上市場銷量增長,均價直逼7000元

【TechWeb】洛圖科技(RUNTO)的報告顯示,2025年5月,中國大陸筆記本電腦線上公開零售市場的銷量達到了78.6萬台,同比增長了20.6%。銷售額方面,達到了54.1億元,同比增長了39.3%。值得注意的是,近兩年來,中國筆記本電腦線上市場的均價長期超過6000元,遠超其他IT及消費類電子產品。5月份,筆記本電腦線上市場的均價更是...
​ 產品性能獲認可,飛驤科技成功打入高端供應鏈 - 天天要聞

​ 產品性能獲認可,飛驤科技成功打入高端供應鏈

飛驤科技作為國產射頻前端晶元領域的領軍企業,近期在市場表現方面頻傳捷報。憑藉5G產品的持續放量及在國產替代浪潮中的突出表現,飛驤科技正逐步鞏固其在國內PA領域的市場地位,成為行業關注的焦點。在5G市場,飛驤科技展現出強勁的增長勢頭。2023
與 AMD FSR4 同源,索尼 PS5 Pro 遊戲機明年將迎新款超分演算法 - 天天要聞

與 AMD FSR4 同源,索尼 PS5 Pro 遊戲機明年將迎新款超分演算法

IT之家 7 月 3 日消息,外媒 Tom's Guide 此前同 AMD 和索尼 PlayStation 雙方高管就 Project Amethyst 合作項目的進展進行了交流。而根據事後報道,PS5 Pro 遊戲機將在明年迎來新款的超解析度演算法。▲ AMD 代表(左)和索尼 PlayStation 代表(右)各持被劈開的紫水晶的一半AMD 和索尼 Pla
消息稱某廠 SM8850 新機全系標配 50Mp 3X 中底潛望鏡 - 天天要聞

消息稱某廠 SM8850 新機全系標配 50Mp 3X 中底潛望鏡

IT之家 7 月 3 日消息,博主 @數碼閑聊站 今日爆料稱,某廠子系旗艦線 SM8850,目前全系標配 50Mp 3X 中底潛望鏡,現階段基本確定 50Mp+50Mp+50Mp。結合此前爆料來看,預計為 iQOO 15 手機。此前,該博主曾透露一款 SM8850 神秘新機將標配 6.85 英寸 2K 解析度三星 LTPO 定製四窄邊大直屏,支持 Pol-l
美媒:西門子收到美國商務部通知,特朗普政府已解除對華晶元設計軟體禁令 - 天天要聞

美媒:西門子收到美國商務部通知,特朗普政府已解除對華晶元設計軟體禁令

【文/觀察者網 熊超然】彭博社當地時間7月2日報道稱,根據德國西門子公司發布的一份聲明,美國商務部已通知該公司,在中國開展業務不再需要獲得「政府許可」。報道就此稱,特朗普政府至少已解除了對華晶元設計軟體銷售的出口許可要求,並認為這是中美兩國為促進關鍵技術流動而正實施的一項貿易協議的一部分。作為全球領先的...