谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4

2023年12月07日12:15:20 財經 4437
谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

雷遞網 樂天 12月7日

美國科技巨頭谷歌今日宣布推出人工智慧模型Gemini,並針對三種不同的尺寸優化了 Gemini 1.0:

Gemini Ultra——谷歌最大、最有能力的模型,適用於高度複雜的任務。

Gemini Pro——谷歌可擴展各種任務的最佳模型。

Gemini Nano——谷歌最高效的設備端任務模型。

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

據谷歌稱,公司一直在嚴格測試Gemini模型並評估其在各種任務中的性能。從自然圖像、音頻和視頻理解到數學推理,Gemini Ultra 的性能在大型語言模型 (LLM) 研發中使用的32個廣泛使用的學術基準中的 30 個上超過了當前最先進的結果。

Gemini Ultra的得分高達90%,是第一個在 MMLU(大規模多任務語言理解)上超越人類專家的模型,該模型結合了數學、物理、歷史、法律、醫學和倫理學等 57 個科目來測試 知識和解決問題的能力。

Gemini新的 MMLU 基準方法使 Gemini 能夠利用其推理能力在回答難題之前更仔細地思考,從而比僅使用第一印象有顯著改進。

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

該圖表顯示了 Gemini Ultra 在常見文本基準測試中的性能與 GPT-4 的比較(在報告數字缺失的情況下計算的 API 數字)。Gemini 在文本和編碼等一系列基準測試中超越了最先進的性能。

Gemini Ultra還在新的MMMU 基準測試中取得 59.4% 的最先進分數,該基準測試由跨越不同領域、需要深思熟慮的推理的多模態任務組成。

根據谷歌測試的圖像基準,Gemini Ultra 的性能優於以前最先進的模型,無需從圖像中提取文本以進行進一步處理的對象字元識別 (OCR) 系統的幫助。這些基準凸顯了雙子座天生的多模態性,並表明了雙子座更複雜推理能力的早期跡象。

擅長複雜學科推理 能懂編程語言

Gemini 1.0 複雜的多模式推理功能可以幫助理解複雜的書面和視覺信息。這使得它在發現大量數據中難以辨別的知識方面具有獨特的能力。

Gemini 1.0 通過閱讀、過濾和理解信息從數十萬份文檔中提取見解的卓越能力將有助於在從科學到金融的許多領域以數字速度實現新的突破。

Gemini 1.0 經過訓練,可以同時識別和理解文本、圖像、音頻等,因此它可以更好地理解微妙的信息,並可以回答與複雜主題相關的問題。這使得它特別擅長解釋數學和物理等複雜學科的推理。

谷歌的第一個版本的 Gemini 可以理解、解釋和生成世界上最流行的編程語言(如Python、Java、C++ 和 Go)的高質量代碼。它跨語言工作和推理複雜信息的能力使其成為世界領先的編碼基礎模型之一。

Gemini Ultra 在多個編碼基準測試中表現出色,包括 HumanEval(用於評估編碼任務性能的重要行業標準)和 Natural2Code(我們內部保留的數據集),該數據集使用作者生成的源而不是基於網路的信息。

Gemini還可以用作更高級編碼系統的引擎。兩年前,谷歌推出 AlphaCode,這是第一個在編程競賽中達到競爭性能水平的人工智慧代碼生成系統。

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

使用Gemini 的專門版本,谷歌創建更先進的代碼生成系統 AlphaCode 2,它擅長解決超出編碼範圍、涉及複雜數學和理論計算機科學的競爭性編程問題。

Pixel 8 Pro將運行Gemini Nano

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

谷歌還將Gemini引入Pixel。Pixel 8 Pro是第一款運行Gemini Nano的智能手機,它支持 Recorder 應用中的 Summarize等新功能,並從WhatsApp開始推出Gboard中的Smart Reply,明年還會推出更多應用。

在接下來的幾個月中,Gemini將出現在谷歌更多的產品和服務中,例如搜索、廣告、Chrome 和 Duet AI。

谷歌已經開始在搜索中試驗 Gemini,它使用戶的搜索生成體驗 (SGE) 更快,美國英語的延遲減少了 40%,同時質量也得到了提高。

谷歌和 Alphabet 首席執行官桑達爾·皮查伊 (Sundar Pichai)說,每一次技術變革都是推進科學發現、加速人類進步和改善生活的機會。

「我相信我們現在所看到的人工智慧轉變將是我們一生中最深刻的轉變,遠遠大於之前向移動或網路的轉變。人工智慧有潛力為世界各地的人們創造從日常生活到非凡的機會。它將帶來新一波的創新和經濟進步,並以前所未有的規模推動知識、學習、創造力和生產力。」

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

皮查伊說,「我們正與Gemini一起邁出下一步,這是我們迄今為止功能最強大、最通用的模型,在許多領先基準測試中都具有最先進性能。我們的第一個版本 Gemini 1.0 針對不同尺寸進行了優化:Ultra、Pro 和 Nano。」

Google DeepMind 首席執行官兼聯合創始人Demis Hassabis代表Gemini 團隊發言,稱長期以來,我們一直希望構建新一代人工智慧模型,其靈感來自於人們理解世界和與世界互動的方式。人工智慧感覺不太像一個智能軟體,而更像是有用且直觀的東西——一個專家幫助者或助手。

「今天,當我們推出 Gemini 時,我們離這一願景又近了一步,這是我們迄今為止構建的最強大、最通用的模型。」

Demis Hassabis稱,Gemini是整個Google團隊(包括Google Research的同事)大規模協作努力的成果。它是從頭開始構建的多模式,這意味著它可以概括和無縫地理解、操作和組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。

「Gemini 也是我們迄今為止最靈活的模型 - 能夠在從數據中心到移動設備的所有設備上高效運行。其最先進的功能將顯著增強開發人員和企業客戶利用人工智慧進行構建和擴展的方式。」

雷遞由媒體人雷建平創辦,若轉載請寫明來源。

財經分類資訊推薦

通用電梯:行業領軍企業,未來增長可期 - 天天要聞

通用電梯:行業領軍企業,未來增長可期

通用電梯是一家在電梯行業中享有盛譽的企業,其產品和服務覆蓋了從電梯的設計、製造、安裝到維護和保養等多個環節。本文將從公司的市場地位、財務狀況、競爭環境和發展潛力四個方面,對通用電梯進行全面的分析和評價。
39.74億元!國投中電受讓融創中國四川項目70%股權 - 天天要聞

39.74億元!國投中電受讓融創中國四川項目70%股權

2月9日,融創中國發布公告,國投中電同意通過重組合作事項,受讓公司四川項目公司70%權益及債權,總代價約為39.74億元。公告披露,融創房地產實際間接擁有目標公司四川三岔湖長島國際旅遊度假中心有限公司70%的權益。為了解決目標項目後續開發建設資金投入問題及釐清和解決目標項目、集團與國投中電之間現有債務問題,於20...
社會壓力下的翻身之路:LPR降息後的生存挑戰 - 天天要聞

社會壓力下的翻身之路:LPR降息後的生存挑戰

在這個社會,似乎一切都變了。又降息了,這次是LPR 5年期降息,我們不禁要問:這個社會怎麼了?讓我們想翻身的人怎麼辦?圖片來源於網路2月20日,中國人民銀行授權全國銀行間同業拆借中心公布,1年期LPR為3.45%,維持不變;5年期以上LPR為3.95%,較前值下行25個基點。
進入3月以後,養老金調整信息會確定嗎?企業增長比例會更多嗎? - 天天要聞

進入3月以後,養老金調整信息會確定嗎?企業增長比例會更多嗎?

馬上即將進入3月份了,很多退休老人也在焦急的期盼2024年養老金調整的消息。3月份,養老金調整的消息究竟會不會出爐呢?讓我們結合往年的情況來一起了解一下。2024年的養老金肯定會如約來臨。每年調整一次養老金,既是國家對退休老人的照顧,也是國家的固有法定製度。
聊城各縣區2023年財政收入:1區負增長,陽谷縣高唐縣大漲 - 天天要聞

聊城各縣區2023年財政收入:1區負增長,陽谷縣高唐縣大漲

2023年1-12月,聊城市地方財政收入244.62億元,與2022年相比增加了14.02億元,同比增長6.1%。這個成績可以說是強勢大漲了,從各季度表現來看,也是穩步向上,第三季度反超了泰安市,第四季度反超了威海市,最終全年財政收入排名山東省第12位。
宗慶後傳奇人生:42歲創業,3年創立商業帝國,3次登頂中國富豪榜 - 天天要聞

宗慶後傳奇人生:42歲創業,3年創立商業帝國,3次登頂中國富豪榜

宗慶後是一位非常傑出的商業人物,他的創業經歷著實令人矚目。在42歲的時候,他從零開始,通過賣冰棍的方式創業,使用一輛三輪車開創了自己的事業。這樣的創業故事確實少見,更何況是在一個相對年長的年紀。他的成功不僅在於他的勇氣和決心,更在於他敏銳的商業洞察力和創新的經營理念。
1972年以來最猛連漲!大盤已突破5000點!誰會終結美股? - 天天要聞

1972年以來最猛連漲!大盤已突破5000點!誰會終結美股?

2024年初,美股再度上演史詩級逼空行情。隔夜收盤標普500指數站上5026點,創歷史新高,且在過去15周中有14周收陽,為1972年以來最佳連漲記錄。財報季企業盈利加速、AI熱潮的持續以及美國經濟樂觀的基本面,共同助推了美股強勁的上升勢頭。去年10月至今,美股累計新增9萬億美元市值。不過,自2009年全球金融危機時期以來,標...