谷歌的原生多模態大模型Gemini來了,劍指GPT-4

2023年12月07日21:30:10 財經 8921

在此前被OpenAI壓制了一整年後,就在2023年進入尾聲時,當年憑藉AlphaGo曾掀起人工智慧浪潮的谷歌,也終於揚眉吐氣了一把,揭開了原生多模態大模型Gemini的神秘面紗。據悉,Gemini號稱是谷歌迄今為止「最大、也最全能的AI模型」,擁有文本、圖像、視頻、音頻和代碼能力,而且有別與其他大模型Gemini更加靈活,其包括了能力最強、複雜度最高的Gemini Ultra,適用於多任務的Gemini Pro,以及端側的Gemini Nano(1.8B/3.25B)。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

從能夠在移動端到大型數據中心的所有設備上運行,就足以證明谷歌對Gemini寄予厚望。根據谷歌方面的說法,Gemini Nano將率先在Pixel 8 Pro上落地,Gemini Pro則將從當地時間本周三開始支持Bard,而Gemini Ultra則會在明年年初向公眾大範圍開放。

當然,外界更關心的應該是Gemini的性能究竟如何,以及與GPT-4相比孰強孰弱。

根據谷歌方面公布的信息顯示,在32項基準測試中,Gemini在30個項目上都實現了「遙遙領先」,同時Gemini Ultra在MMLU(大規模多任務語言理解數據集)中的得分率更是高達90.0%,成為了大模型中首個超越人類專家的產品。對於目前大模型在評測中刷題蔚然成風的現象,谷歌也特意強調,「對於以前的SOTA模型評估使用不同的提示技術」,也就是Gemini並未針對性的刷題。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

Gemini最大的亮點就是原生(native)多模態,谷歌口中的「anything to anything」也代表了Gemini和ChatGPT的本質區別。雖然兩者確實都實現了支持文本、圖像、音頻和視頻輸入,以及文本和圖片的輸出,但OpenAI的解決方案是在ChatGPT這個大模型(LLM)上不斷疊加多模態模塊,谷歌的Gemini則是從一開始就將各種模態的能力一同訓練,相當於一個是串聯、另一個是並聯。

比如在面對用戶輸入的同樣一張圖片,GPT-4的策略是用OCR技術分割圖片,獲得乾淨的字元圖像、再識別字元,並轉化為文本信息。而Gemini認知圖片的方式則更接近人類,就是綜合視覺、聽覺、語言來理解事物,這也是Gemini在谷歌展示的DEMO中,對於連續輸入的內容幾乎能即刻做出反應的關鍵。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

值得一提的是,在Gemini技術報告中,谷歌方面表示其基於谷歌自家的張量處理單元(TPU)v4和v5e進行大規模訓練,這也就意味著即使脫離了英偉達的CUDA生態,不使用英偉達GPU,業界依然有能力訓練出性能不錯的大模型。而且隨著Gemini的發布,谷歌同時公布了專為訓練先進AI大模型的Cloud TPU v5p,等於說是明晃晃地要搶英偉達的蛋糕。

作為在過去一年幾乎壓得谷歌幾乎喘不過氣的產品,GPT-4也是此次展示Gemini性能的標靶。例如Gemini Ultra在推理、數學、代碼等文本處理能力的得分,就均高於GPT-4,在圖像、視頻、音頻等多模態能力上也壓倒了GPT-4。

但事實真的如此嗎?其實仔細觀察谷歌在視頻中展示的關於Gemini和GPT-4評測的表格和圖片會發現,其中似乎暗藏了玄機。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

事實上,谷歌在對比中採用了被稱為「非對稱」的方式,例如在比拼MMLU測試集時,Gemini Ultra的得分率為90%、而GPT-4則是86.4%,但二者測試的方法卻截然不同。Gemini Ultra下方的CoT@32表明,它使用了思維鏈(CoT)技術,這也是目前大模型領域炙手可熱的一項技術,它在Prompt中除了任務的輸入和輸出外,還加入了推理的中間步驟,會使得大模型的性能度提升,而GPT-4下方的5-shot,則代表使用了Few-Shot Learning(少樣本學習)技術。

簡單來說,兩者的區別相當於是同樣參加一場考試,GPT-4的作答時間是1小時,Gemini Ultra則有一天時間。試想一下,如果高考的答題時間不是2小時、而是24小時,想必大家的成績都會更上一層樓。

除此之外,谷歌用未經過「AI對齊」(AI Alignment)的Gemini Ultra,來對比已經經過OpenAI對齊的公開版GPT-4。要知道,AI對齊要求AI的目標要與人類的價值觀和利益相對齊,使得其符合設計者的利益預期,不會產生意外的有害後果。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

AI對齊概念的出現,其實是OpenAI等廠商為了合規而設計,它的副作用就會是導致大模型性能的下降,這一點在GPT-4、New Bing上已經有了明確的體現。換而言之,谷歌是用一個無法商業化的Gemini Ultra版本,來對比已經商業化的GPT-4,難免就有些勝之不武了。當然,谷歌選擇投機取巧也不難理解,畢竟在過去的一年時間裡,他們在AI領域確實承受著巨大的壓力。

作為AI賽道曾經的領導者,谷歌也被外界批評由於過分僵化和謹慎,從而讓其他公司搶佔了大模型的先機,以至於創始人謝爾蓋·布林都重新出山、協助搭建下一代AI模型。CEO皮查伊在面對媒體時更是不得不放狠話,「不管他們怎麼說,我們在AI領域不會輸」。更何況,精心籌備的Bard首秀即翻車,在整個2023年OpenAI、微軟、Meta各領風騷的情況下,唯獨谷歌幾乎沒有了聲音。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

如此種種境況,使得谷歌想要讓Gemini Ultra在紙面上壓倒GPT-4也不難理解了,畢竟都已經傾注了所有的資源,再打不贏OpenAI可怎麼辦?不過即便Gemini Ultra不能超過GPT-4成為地表最強的AI大模型,但超越GPT 3.5幾乎是板上釘釘的事情。

或許有了實質性的競爭對手,未來OpenAI可能也會加速GPT-5的落地。

財經分類資訊推薦

瞞不住了!中國最會賺錢的鐵路,竟不是京滬高鐵? - 天天要聞

瞞不住了!中國最會賺錢的鐵路,竟不是京滬高鐵?

在我國鐵路運輸的龐大版圖中,有一條看似低調卻實力強勁的鐵路——朔黃鐵路。它並非如京滬高鐵那般聲名遠揚,但其賺錢能力卻堪稱一絕,以每秒超300元的速度「印鈔」,就連國鐵集團對它的管理也有著特殊的模式。西煤東運的關鍵紐帶朔黃鐵路作為我國西煤東運
民生證券:堅定看好AI產業長期敘事 國產替代加速突破 - 天天要聞

民生證券:堅定看好AI產業長期敘事 國產替代加速突破

智通財經APP獲悉,民生證券發布研報稱,堅定看好AI產業的長期敘事,英偉達(NVDA.US)持續強勢,雲廠商崛起,國產算力突破的當下,投資機遇也會更加多元化。全球AI算力需求持續高增,產品迭代加速推動產業鏈升級,國產算力在晶元、模型、基建等領域實現多點突破。具體到細分賽道,算力鏈重點關注伺服器、PCB、CPO、銅纜、電源...
技領暖界 泵通中國|萬和空氣能2025新品發布會暨經銷商旺季啟動大會圓滿舉辦 - 天天要聞

技領暖界 泵通中國|萬和空氣能2025新品發布會暨經銷商旺季啟動大會圓滿舉辦

6月29日,以「技領暖界 泵通中國」為主題的萬和空氣能2025新品發布會暨經銷商旺季啟動大會在河北省石家莊市富力洲際酒店拉開帷幕。這場匯聚行業專家、企業領袖、經銷商夥伴及媒體代表的年度盛會,不僅發布了顛覆行業的空氣能新品,更以全產業鏈戰略布局勾勒出中國熱泵產業的未來圖景。 萬和電氣 18 年深耕清潔能源的技術積...
「滬青優品」標準7月發布,青海特色農畜產品有了「入滬指南」 - 天天要聞

「滬青優品」標準7月發布,青海特色農畜產品有了「入滬指南」

6月28日,2025外貿優品市州行、東西部協作「滬青優品」品牌化研討會暨第二屆上海援青商品化與品牌化系列活動在青海省格爾木市舉辦。「品牌力的內涵是質形力,既要做好產品創新、服務內化、渠道趨近、組織效率和數字轉型,又要關注消費經驗、顧客忠誠、輿論評審、公共關係和對外溝通。產品和服務本身是內在資產,傳播是外在...
興化股份:子公司興化化工例行停車檢修 - 天天要聞

興化股份:子公司興化化工例行停車檢修

智通財經APP訊,興化股份(002109.SZ)發布公告,公司接到全資子公司陝西延長石油興化化工有限公司(簡稱興化化工)的通知,為了確保後期生產的安全平穩運行,按照計劃興化化工安排例行停車檢修。興化化工於2025年6月29日開始進行生產裝置例行停車檢修,預計停車約34天,具體復產時間以裝置實際開車時間為準。本次停車檢修是興...
科達利擬向兩家子公司合計增資4億元 - 天天要聞

科達利擬向兩家子公司合計增資4億元

智通財經APP訊,科達利(002850.SZ)發布公告,公司擬以自有資金共計人民幣4億元,向全資子公司四川科達利精密工業有限公司(簡稱「四川科達利」)和福建科達利精密工業有限公司(簡稱「福建科達利」)進行增資,增資方式為增加註冊資本,增資金額均為2億元。本次增資完成後,四川科達利的註冊資本將由5億元增加至7億元,福建科達...
港股異動丨協鑫新能源漲超6% 光伏政策持續發力 市場靜待需求修復 - 天天要聞

港股異動丨協鑫新能源漲超6% 光伏政策持續發力 市場靜待需求修復

光伏概念股協鑫新能源(0451.HK)午後漲幅擴大,現漲6.49%報0.41港元。消息面上,工信部印發《關於深入推進工業和信息化綠色低碳標準化工作的實施方案》。方案提出,加強綠色低碳產業培育標準引領。加快推動完善光伏、新能源汽車、綠色智算、綠色船舶、綠色航空、綠色電力裝備、綠色輕工、環保裝備等領域標準體系,支撐綠色發...
熱烈慶祝|瑞眾保險成立兩周年暨湖南分公司隆重表彰 - 天天要聞

熱烈慶祝|瑞眾保險成立兩周年暨湖南分公司隆重表彰

值此瑞眾保險成立兩周年之際,湖南分公司特在《三湘都市報》上,向長期以來關心支持公司發展的廣大客戶及社會各界致以衷心感同時,在瑞眾保險湖南分公司六月業務推動中,湧現出一批銳意進取的優秀團隊帶頭人。
林師聊糖市:4季度國內白糖現貨及期貨存在較大上漲動力 - 天天要聞

林師聊糖市:4季度國內白糖現貨及期貨存在較大上漲動力

過去兩個月國際及國內食糖價格下跌,原糖目前仍處於低位,下半年白糖市場又將發生什麼變化。總的觀點市場對巴西、印度食糖產量過於樂觀了,且原糖價格在過去2個月下跌也充分表達了市場對巴西、印度產量樂觀帶來利空。巴西、印度食糖真的能達到預期嗎,利空是