谷歌的原生多模態大模型Gemini來了,劍指GPT-4

2023年12月07日21:30:10 財經 8921

在此前被OpenAI壓制了一整年後,就在2023年進入尾聲時,當年憑藉AlphaGo曾掀起人工智能浪潮的谷歌,也終於揚眉吐氣了一把,揭開了原生多模態大模型Gemini的神秘面紗。據悉,Gemini號稱是谷歌迄今為止「最大、也最全能的AI模型」,擁有文本、圖像、視頻、音頻和代碼能力,而且有別與其他大模型Gemini更加靈活,其包括了能力最強、複雜度最高的Gemini Ultra,適用於多任務的Gemini Pro,以及端側的Gemini Nano(1.8B/3.25B)。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

從能夠在移動端到大型數據中心的所有設備上運行,就足以證明谷歌對Gemini寄予厚望。根據谷歌方面的說法,Gemini Nano將率先在Pixel 8 Pro上落地,Gemini Pro則將從當地時間本周三開始支持Bard,而Gemini Ultra則會在明年年初向公眾大範圍開放。

當然,外界更關心的應該是Gemini的性能究竟如何,以及與GPT-4相比孰強孰弱。

根據谷歌方面公布的信息顯示,在32項基準測試中,Gemini在30個項目上都實現了「遙遙領先」,同時Gemini Ultra在MMLU(大規模多任務語言理解數據集)中的得分率更是高達90.0%,成為了大模型中首個超越人類專家的產品。對於目前大模型在評測中刷題蔚然成風的現象,谷歌也特意強調,「對於以前的SOTA模型評估使用不同的提示技術」,也就是Gemini並未針對性的刷題。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

Gemini最大的亮點就是原生(native)多模態,谷歌口中的「anything to anything」也代表了Gemini和ChatGPT的本質區別。雖然兩者確實都實現了支持文本、圖像、音頻和視頻輸入,以及文本和圖片的輸出,但OpenAI的解決方案是在ChatGPT這個大模型(LLM)上不斷疊加多模態模塊,谷歌的Gemini則是從一開始就將各種模態的能力一同訓練,相當於一個是串聯、另一個是並聯。

比如在面對用戶輸入的同樣一張圖片,GPT-4的策略是用OCR技術分割圖片,獲得乾淨的字符圖像、再識別字符,並轉化為文本信息。而Gemini認知圖片的方式則更接近人類,就是綜合視覺、聽覺、語言來理解事物,這也是Gemini在谷歌展示的DEMO中,對於連續輸入的內容幾乎能即刻做出反應的關鍵。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

值得一提的是,在Gemini技術報告中,谷歌方面表示其基於谷歌自家的張量處理單元(TPU)v4和v5e進行大規模訓練,這也就意味着即使脫離了英偉達的CUDA生態,不使用英偉達GPU,業界依然有能力訓練出性能不錯的大模型。而且隨着Gemini的發佈,谷歌同時公布了專為訓練先進AI大模型的Cloud TPU v5p,等於說是明晃晃地要搶英偉達的蛋糕。

作為在過去一年幾乎壓得谷歌幾乎喘不過氣的產品,GPT-4也是此次展示Gemini性能的標靶。例如Gemini Ultra在推理、數學、代碼等文本處理能力的得分,就均高於GPT-4,在圖像、視頻、音頻等多模態能力上也壓倒了GPT-4。

但事實真的如此嗎?其實仔細觀察谷歌在視頻中展示的關於Gemini和GPT-4評測的表格和圖片會發現,其中似乎暗藏了玄機。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

事實上,谷歌在對比中採用了被稱為「非對稱」的方式,例如在比拼MMLU測試集時,Gemini Ultra的得分率為90%、而GPT-4則是86.4%,但二者測試的方法卻截然不同。Gemini Ultra下方的CoT@32表明,它使用了思維鏈(CoT)技術,這也是目前大模型領域炙手可熱的一項技術,它在Prompt中除了任務的輸入和輸出外,還加入了推理的中間步驟,會使得大模型的性能度提升,而GPT-4下方的5-shot,則代表使用了Few-Shot Learning(少樣本學習)技術。

簡單來說,兩者的區別相當於是同樣參加一場考試,GPT-4的作答時間是1小時,Gemini Ultra則有一天時間。試想一下,如果高考的答題時間不是2小時、而是24小時,想必大家的成績都會更上一層樓。

除此之外,谷歌用未經過「AI對齊」(AI Alignment)的Gemini Ultra,來對比已經經過OpenAI對齊的公開版GPT-4。要知道,AI對齊要求AI的目標要與人類的價值觀和利益相對齊,使得其符合設計者的利益預期,不會產生意外的有害後果。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

AI對齊概念的出現,其實是OpenAI等廠商為了合規而設計,它的副作用就會是導致大模型性能的下降,這一點在GPT-4、New Bing上已經有了明確的體現。換而言之,谷歌是用一個無法商業化的Gemini Ultra版本,來對比已經商業化的GPT-4,難免就有些勝之不武了。當然,谷歌選擇投機取巧也不難理解,畢竟在過去的一年時間裏,他們在AI領域確實承受着巨大的壓力。

作為AI賽道曾經的領導者,谷歌也被外界批評由於過分僵化和謹慎,從而讓其他公司搶佔了大模型的先機,以至於創始人謝爾蓋·布林都重新出山、協助搭建下一代AI模型。CEO皮查伊在面對媒體時更是不得不放狠話,「不管他們怎麼說,我們在AI領域不會輸」。更何況,精心籌備的Bard首秀即翻車,在整個2023年OpenAI、微軟、Meta各領風騷的情況下,唯獨谷歌幾乎沒有了聲音。

谷歌的原生多模態大模型Gemini來了,劍指GPT-4 - 天天要聞

如此種種境況,使得谷歌想要讓Gemini Ultra在紙面上壓倒GPT-4也不難理解了,畢竟都已經傾注了所有的資源,再打不贏OpenAI可怎麼辦?不過即便Gemini Ultra不能超過GPT-4成為地表最強的AI大模型,但超越GPT 3.5幾乎是板上釘釘的事情。

或許有了實質性的競爭對手,未來OpenAI可能也會加速GPT-5的落地。

財經分類資訊推薦

同日宣布被查!其中一人36歲執掌珠海香洲百億級龍頭國企 - 天天要聞

同日宣布被查!其中一人36歲執掌珠海香洲百億級龍頭國企

6月6日,廉潔珠海公號連續發佈兩則通報,珠海正方集團有限公司原黨委書記、董事長、總經理唐亮,以及該公司原副總經理郭偉涉嫌嚴重違紀違法,目前正接受珠海市香洲區紀委監委紀律審查和監察調查。珠海正方集團系珠海知名國企,也是主城區香洲區龍頭國企。此前正方集團高層遭遇人事地震,唐亮、郭偉均已離任,此次通報也是官...
血淚教訓!90%基民踩過的10大坑,第5個幾乎人人中招 - 天天要聞

血淚教訓!90%基民踩過的10大坑,第5個幾乎人人中招

這位網友問,基金投資如何閉坑,我換種說法來回答,基金行業的一些常識性的觀點、建議,你即使不了解原理,但也最好相信,既然是常識,都是有萬千投資者用真金白銀試出來的經驗結果,所以你還是需要認真對待。要點比較多,建議點贊收藏,以免以後找不到了。1
「製冷劑雙雄」,歷史新高 - 天天要聞

「製冷劑雙雄」,歷史新高

近兩日新消費行情回調,其他板塊迎來機會。昨天大科技反彈,今天上午,輪到周期股表現。具體看,有色金屬板塊漲幅居前,貴金屬、鋅、鉛等板塊大漲。隨着投資者對貴金屬避險屬性的需求從黃金擴展到白銀,白銀期貨價格最近走強。白銀概念股上午表現突出,興業銀
鄭州市政府發佈通知 - 天天要聞

鄭州市政府發佈通知

鄭州市人民政府關於印發鄭州市支持河南中牟新區加快發展若干先行政策措施的通知鄭政文〔2025〕63號各開發區管委會,各區縣(市)人民政府,市人民政府各部門,各有關單位:現將《鄭州市支持河南中牟新區加快發展若干先行政策措施》印發給你們,請認真組
國補再優惠2000元!這個618什麼遊戲本值得買? - 天天要聞

國補再優惠2000元!這個618什麼遊戲本值得買?

對於3A遊戲玩家來說,最大的小確幸就是能脫離電腦桌的束縛,無論是旅途、露營還是隊友聚會,都能隨時酣暢沉浸在遊戲世界中。因此,性能強勁、便攜性佳的遊戲筆記本電腦就成為玩家的心頭好。現在年中購物狂歡618已經開啟,更新裝備的絕佳時機已經來臨,聯想特意為玩家準備了兩
年產能2500萬噸,寶武和力拓在澳大利亞聯合開發的鐵礦項目全面投產 - 天天要聞

年產能2500萬噸,寶武和力拓在澳大利亞聯合開發的鐵礦項目全面投產

【文/觀察者網 陳思佳】當地時間6月6日,全球礦業巨頭力拓集團發表聲明,宣布其與中國寶武鋼鐵集團聯合開發的澳大利亞西坡鐵礦項目正式投產。該鐵礦位於西澳大利亞州皮爾巴拉地區,設計年產能為2500萬噸。《日經亞洲》6日發文稱,皮爾巴拉地區是澳大利亞重要的鐵礦生產中心之一,該地區開採的鐵礦石主要銷往中國。在美國總...
貨量增長70%!深圳物流公司24小時衝刺美線「囤貨」高峰 - 天天要聞

貨量增長70%!深圳物流公司24小時衝刺美線「囤貨」高峰

成堆的集裝箱在軌道上快速移動,叉車在倉庫通道間穿梭不息……深圳鹽田港的貨物集散倉,正迎來前所未有的繁忙景象。今年5月,中美兩國達成階段性關稅調整協議,宣布暫停部分加征關稅並設立90天窗口期。美國採購商加緊「囤貨」,美線海運熱度不斷上升。在鹽田港密集分佈的物流公司里,深圳市金運達國際物流有限公司(下稱「...
「A系列」寬基指數本周收紅,A500ETF易方達(159361)、A100ETF易方達(159686)等助力布局A股核心資產 - 天天要聞

「A系列」寬基指數本周收紅,A500ETF易方達(159361)、A100ETF易方達(159686)等助力布局A股核心資產

本周,中證A500指數上漲0.9%,中證A100指數上漲0.8%,中證A50指數上漲0.3%。摩根士丹利策略師表示,由於美元走弱以及投資者多元化意願增強等因素,未來6~12個月中國股票將吸引更多資金流入。由於投資者的預期更為現實以及美元走軟,中國公司的盈利增長潛力正在「逐步上升」。每日經濟新聞...