Meta推出開源大模型Llama 3:最大底牌4000億參數,性能直逼GPT-4

2024年04月29日01:51:54 科技 5313

劃重點:

騰訊科技訊 4月19日消息,據國外媒體報道,美國科技巨頭meta推出了其最強大的開源人工智慧(ai)模型llama 3,以追趕行業領導者openai。meta首席執行官扎克伯格表示,llama 3有8b和70b兩個版本,大版本的llama 3將有超過4000億參數。由於預訓練和指令微調,llama 3相比llama 2有了極大的改進。

此外,meta還同時發布了ai助手的更新版本。該助手將在meta的facebook、instagram、whatsapp和messenger應用以及一個新設立的獨立網站meta.ai中獲得更突出的地位,讓llama 3能夠更直接地與微軟支持的openai的熱門產品chatgpt競爭。

Meta推出開源大模型Llama 3:最大底牌4000億參數,性能直逼GPT-4 - 天天要聞

meta在去年7月份發布了llama 2。此後,包括谷歌、馬斯克旗下的xai與mistral等在內的數家公司發布了開源的大語言模型,競爭十分激烈。

llama 3直接對標openai的gpt-4,後者已經成為一個強大的多模態模型,不僅能夠處理更長的文本,還支持圖像輸入。meta此前已推出三個版本的llama 2,其中最大的一個擁有700億個參數,另外兩個版本分別擁有130億和70億個參數。

在宣布這一消息之際,meta一直在努力向其數十億用戶推廣生成式人工智慧產品,包括對計算基礎設施進行全面改造,以及整合此前截然不同的研究和產品團隊,從而挑戰openai在該技術上的領先地位。

開源的llama是meta人工智慧戰略的重要組成部分。這家社交媒體巨頭希望利用人工智慧來提高其廣告工具的效率,並增強其社交媒體應用的吸引力。meta首席執行官馬克·扎克伯格(mark zuckerberg)在本月初向投資人表示,今年的主要關注領域包括推出llama 3和「擴大meta ai助手的實用性」。

追趕gpt-4

meta希望llama 3能趕上openai的gpt-4。不過知情人士透露,因為研究人員尚未開始對llama 3進行微調,所以尚未決定llama 3是否將是多模態模型。微調是開發人員為現有模型提供額外數據的過程,以便它可以學習新信息或任務。較大的模型通常會提供更高質量的答覆,而較小的模型往往會更快的提供答覆。有消息稱,正式版的llama 3將會在今年7月正式推出。

meta首席產品官克里斯·考克斯(chris cox)在接受採訪時表示,該公司為llama 3植入了全新的計算機編碼功能,如今它不僅可以輸出文本,還可以輸出圖像。他補充說,更高級的推理,如制定更長的多步計劃的能力,將在後續版本中推出。meta在官方博客中表示,計劃在未來幾個月發布的正式版也將具有「多模態」能力,這意味著它可以生成文本和圖像。

考克斯說:「最終的目標是幫助用戶擺脫煩心事。無論是與企業互動,無論是寫東西,還是計劃旅行,讓他們的生活更輕鬆。」他還表示,將圖像納入llama 3的訓練將增強今年推出的新一代雷朋meta智能眼鏡的功能,讓meta ai能夠識別使用者看到的物體並回答有關它們的問題。

meta還宣布與alphabet的谷歌建立新的合作夥伴關係,在助手的答覆中包括實時搜索結果,作為與微軟必應現有合作的補充。隨著此次更新,meta ai助手正在擴展到美國以外的十多個市場,包括澳大利亞、加拿大、新加坡、奈及利亞和巴基斯坦。考克斯說,meta「仍在努力以正確的方式在歐洲做到這一點」。歐洲的隱私規定更加嚴格,即將出台的人工智慧法案也準備提出披露模型訓練數據等要求。

生成式人工智慧模型對數據的巨大需求已開始限制該技術的發展。作為追趕努力的一部分,meta一直在發布像llama 3這樣的模型供開發人員免費商業使用,因為強大的免費模型的成功可能會阻礙競爭對手從其專有技術中賺取收入的計劃。

扎克伯格周四在發布會上稱meta ai是「你可以自由使用的最智能的人工智慧助手」。他表示,最大版本的llama 3目前正在用4000億個參數進行訓練,在mmlu(大規模多任務語言理解)測試中得分為85分。他表示,推出的兩個較小版本現在分別有80億個參數和700億個參數,後者mmlu的得分為82分。(編譯/無忌)

Meta推出開源大模型Llama 3:最大底牌4000億參數,性能直逼GPT-4 - 天天要聞

科技分類資訊推薦

別只盯著ChatGPT4o:Kimi Chat在中文搜索能力上不容小覷 - 天天要聞

別只盯著ChatGPT4o:Kimi Chat在中文搜索能力上不容小覷

在這個AI助手層出不窮的時代,剛剛‬發布‬的‬ChatGPT4o無疑成為了許多人心中的超級英雄,它的智能對話和信息處理能力讓人印象深刻。然而,當我們將目光聚焦於這顆璀璨的星辰時,另一顆新星正在中文搜索的天空中冉冉升起——它就是Kimi Chat。
GPT-4o 屠龍式震撼!多模態、實時交互、全員免費可用,絲滑語音交互的 ChatGPT 這把贏麻了 - 天天要聞

GPT-4o 屠龍式震撼!多模態、實時交互、全員免費可用,絲滑語音交互的 ChatGPT 這把贏麻了

作者:李寶珠 & 十九編輯:三羊OpenAI 發布 GPT-4o,ChatGPT 基於GPT-4o 實現了語音交互,並在文本與視覺能力上有顯著提升。從 5 月初爆出將在 9 日發布搜索引擎;到 5 月 11 日,官宣將在當地時間 5 月 13 日 10 時發布 ChatGPT 與 GPT-4 更新;再到 Sam Altman 親自下場闢謠「不是 GP
康佳天鏡Mini AI-LED A8 Pro問世,AI電視邁入嶄新時代 - 天天要聞

康佳天鏡Mini AI-LED A8 Pro問世,AI電視邁入嶄新時代

5月13日,康佳隆重舉辦2024康佳智鏡AI電視新品發布會,正式推出了備受矚目的旗艦新品——康佳天鏡MiniAI-LED A8 Pro。此款新品電視搭載康佳自主研發的業內首款智能平台——「AIERA人感大模型」生態平台,其設計理念旨在「讓電視,從此可以實時感知你」,實現人機互動的智能化新境界。同時,通過AI技術的加持,該產品在音畫...
半個月就後悔了?傳前北美充電業務主管已返回特斯拉公司 - 天天要聞

半個月就後悔了?傳前北美充電業務主管已返回特斯拉公司

財聯社5月14日訊(編輯 趙昊)據媒體報道,美國特斯拉公司已開始回聘一部分前超級充電業務的員工,上月這個約500人的部門被公司解散。知情人士透露,在已回到特斯拉的重要人員中,有負責北美充電業務的主管Max de Zegher。發稿前不久,de Zegher在社交媒體上轉發了「特斯拉充電」的一則帖文,或證實他本人已回歸特斯拉的這...
蘋果發布 tvOS 17.5 正式版、HomePod 17.5 更新 - 天天要聞

蘋果發布 tvOS 17.5 正式版、HomePod 17.5 更新

IT之家 5 月 14 日消息,蘋果今日發布了 tvOS 17.5 系統更新,這是去年 9 月發布的 tvOS 17 操作系統的第五次迭代更新,距上次的 tvOS 17.4 更新間隔兩個月。用戶可以通過 Apple TV 設備上的「設置」應用獲取該更新,前往「系統」 > 「軟體更新」即可下載安裝。對於開啟了自動更新功能的 Apple TV 設備,將會自動升級
9 核版蘋果 M4 晶元跑分出爐:多核性能較 M3 提升約 13% - 天天要聞

9 核版蘋果 M4 晶元跑分出爐:多核性能較 M3 提升約 13%

IT之家 5 月 14 日消息,配備 9 核 CPU M4 晶元的 iPad Pro 已現身 Geekbench 6 跑分網站,雖然相比於 10 核版本略有遜色,但整體表現依舊非常出色。IT之家注意到,此次曝光的是低配版 M4 晶元的跑分成績,該晶元擁有 9 個 CPU 核心。測試結果表明,9 核 M4 的多核性能相比 10 核版本大約低 10%。這一差距在
OpenAI發布全新生成式 AI 模型GPT-4o:語音對話更流暢,免費提供 - 天天要聞

OpenAI發布全新生成式 AI 模型GPT-4o:語音對話更流暢,免費提供

IT之家 5 月 14 日消息,OpenAI 宣布推出其最新旗艦生成式 AI 模型 GPT-4o,該模型將在未來幾周內分階段集成至 OpenAI 的各個產品之中。最讓人驚喜的是,GPT-4o 將免費提供給所有用戶使用。OpenAI 首席技術官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 將提供與 GPT-4 同等水平的智能,但在文本、圖像以及