谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4

2023年12月07日12:15:20 財經 4437
谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

雷遞網 樂天 12月7日

美國科技巨頭谷歌今日宣布推出人工智能模型Gemini,並針對三種不同的尺寸優化了 Gemini 1.0:

Gemini Ultra——谷歌最大、最有能力的模型,適用於高度複雜的任務。

Gemini Pro——谷歌可擴展各種任務的最佳模型。

Gemini Nano——谷歌最高效的設備端任務模型。

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

據谷歌稱,公司一直在嚴格測試Gemini模型並評估其在各種任務中的性能。從自然圖像、音頻和視頻理解到數學推理,Gemini Ultra 的性能在大型語言模型 (LLM) 研發中使用的32個廣泛使用的學術基準中的 30 個上超過了當前最先進的結果。

Gemini Ultra的得分高達90%,是第一個在 MMLU(大規模多任務語言理解)上超越人類專家的模型,該模型結合了數學、物理、歷史、法律、醫學和倫理學等 57 個科目來測試 知識和解決問題的能力。

Gemini新的 MMLU 基準方法使 Gemini 能夠利用其推理能力在回答難題之前更仔細地思考,從而比僅使用第一印象有顯着改進。

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

該圖表顯示了 Gemini Ultra 在常見文本基準測試中的性能與 GPT-4 的比較(在報告數字缺失的情況下計算的 API 數字)。Gemini 在文本和編碼等一系列基準測試中超越了最先進的性能。

Gemini Ultra還在新的MMMU 基準測試中取得 59.4% 的最先進分數,該基準測試由跨越不同領域、需要深思熟慮的推理的多模態任務組成。

根據谷歌測試的圖像基準,Gemini Ultra 的性能優於以前最先進的模型,無需從圖像中提取文本以進行進一步處理的對象字符識別 (OCR) 系統的幫助。這些基準凸顯了雙子座天生的多模態性,並表明了雙子座更複雜推理能力的早期跡象。

擅長複雜學科推理 能懂編程語言

Gemini 1.0 複雜的多模式推理功能可以幫助理解複雜的書面和視覺信息。這使得它在發現大量數據中難以辨別的知識方面具有獨特的能力。

Gemini 1.0 通過閱讀、過濾和理解信息從數十萬份文檔中提取見解的卓越能力將有助於在從科學到金融的許多領域以數字速度實現新的突破。

Gemini 1.0 經過訓練,可以同時識別和理解文本、圖像、音頻等,因此它可以更好地理解微妙的信息,並可以回答與複雜主題相關的問題。這使得它特別擅長解釋數學和物理等複雜學科的推理。

谷歌的第一個版本的 Gemini 可以理解、解釋和生成世界上最流行的編程語言(如Python、Java、C++ 和 Go)的高質量代碼。它跨語言工作和推理複雜信息的能力使其成為世界領先的編碼基礎模型之一。

Gemini Ultra 在多個編碼基準測試中表現出色,包括 HumanEval(用於評估編碼任務性能的重要行業標準)和 Natural2Code(我們內部保留的數據集),該數據集使用作者生成的源而不是基於網絡的信息。

Gemini還可以用作更高級編碼系統的引擎。兩年前,谷歌推出 AlphaCode,這是第一個在編程競賽中達到競爭性能水平的人工智能代碼生成系統。

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

使用Gemini 的專門版本,谷歌創建更先進的代碼生成系統 AlphaCode 2,它擅長解決超出編碼範圍、涉及複雜數學和理論計算機科學的競爭性編程問題。

Pixel 8 Pro將運行Gemini Nano

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

谷歌還將Gemini引入Pixel。Pixel 8 Pro是第一款運行Gemini Nano的智能手機,它支持 Recorder 應用中的 Summarize等新功能,並從WhatsApp開始推出Gboard中的Smart Reply,明年還會推出更多應用。

在接下來的幾個月中,Gemini將出現在谷歌更多的產品和服務中,例如搜索、廣告、Chrome 和 Duet AI。

谷歌已經開始在搜索中試驗 Gemini,它使用戶的搜索生成體驗 (SGE) 更快,美國英語的延遲減少了 40%,同時質量也得到了提高。

谷歌和 Alphabet 首席執行官桑達爾·皮查伊 (Sundar Pichai)說,每一次技術變革都是推進科學發現、加速人類進步和改善生活的機會。

「我相信我們現在所看到的人工智能轉變將是我們一生中最深刻的轉變,遠遠大於之前向移動或網絡的轉變。人工智能有潛力為世界各地的人們創造從日常生活到非凡的機會。它將帶來新一波的創新和經濟進步,並以前所未有的規模推動知識、學習、創造力和生產力。」

谷歌AI大模型Gemini亮相:擅長複雜學科推理,懂編程語言 PK GPT-4 - 天天要聞

皮查伊說,「我們正與Gemini一起邁出下一步,這是我們迄今為止功能最強大、最通用的模型,在許多領先基準測試中都具有最先進性能。我們的第一個版本 Gemini 1.0 針對不同尺寸進行了優化:Ultra、Pro 和 Nano。」

Google DeepMind 首席執行官兼聯合創始人Demis Hassabis代表Gemini 團隊發言,稱長期以來,我們一直希望構建新一代人工智能模型,其靈感來自於人們理解世界和與世界互動的方式。人工智能感覺不太像一個智能軟件,而更像是有用且直觀的東西——一個專家幫助者或助手。

「今天,當我們推出 Gemini 時,我們離這一願景又近了一步,這是我們迄今為止構建的最強大、最通用的模型。」

Demis Hassabis稱,Gemini是整個Google團隊(包括Google Research的同事)大規模協作努力的成果。它是從頭開始構建的多模式,這意味着它可以概括和無縫地理解、操作和組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。

「Gemini 也是我們迄今為止最靈活的模型 - 能夠在從數據中心到移動設備的所有設備上高效運行。其最先進的功能將顯著增強開發人員和企業客戶利用人工智能進行構建和擴展的方式。」

雷遞由媒體人雷建平創辦,若轉載請寫明來源。

財經分類資訊推薦

三名高管火速套現超千萬!萬辰集團股價閃崩9% - 天天要聞

三名高管火速套現超千萬!萬辰集團股價閃崩9%

7月2日,萬辰集團(300972.SZ)(下稱「萬辰」)股價開盤後一路下行,盤中一度跌超11%,截至收盤跌幅收窄至9.73%,報168.67元/股;總市值304億元,較上一日縮水約33億元。這一股價異動,或與前一日披露的高管減持公告有關。7月1日晚,萬辰發佈公告,公司董事兼總經理王麗卿、董事兼副總經理李博、副總經理王松,以集中競價...
再迎利好!萬億賽道大爆發 - 天天要聞

再迎利好!萬億賽道大爆發

【導讀】利好政策密集出台,海洋經濟概念股狂掀漲停潮中國基金報記者 牛思若海洋經濟領域再迎重磅利好!7月1日,中央財經委員會第六次會議指出,推動海洋經濟高質量發展,要加強頂層設計,加大政策支持力度,鼓勵引導社會資本積极參与發展海洋經濟。政策東風催熱板塊行情。7月2日,A股開盤後,海洋經濟概念股狂掀漲停潮,深...
田浩洋:7.3黃金午夜行情思路解析,順應趨勢回踩不破做多 - 天天要聞

田浩洋:7.3黃金午夜行情思路解析,順應趨勢回踩不破做多

來源:田浩洋愛看盤黃金周三的行情走勢基本已經接近尾聲了,回顧今日我們幾次下方3327-30區間內進行布局多單,多單也是完美全部獲利出局,近期行情漲跌幅度比較大,加上本周又是非農周,消息面也比較多,所以我們更加需要穩健操作來把握利潤,關注我文
A股復盤|指數縮量調整!熱點快速切換,市場還有上漲動能嗎? - 天天要聞

A股復盤|指數縮量調整!熱點快速切換,市場還有上漲動能嗎?

為投資者提供專業資訊服務 資訊傳遞價值,專業伴隨成長!——騰訊官方證券投資平台 為投資者提供專業資訊服務 資訊傳遞價值,專業伴隨成長!——騰訊官方證券投資平台7月2日市場全天縮量調整。截至收盤,上證指數跌0.09%,深證成指跌0.61%,創業板指跌1.13%。全市個股跌多漲少,全市下跌個股近3300隻;全市全天成交1.37萬億...
利好利空晚報|高層部署!加快產業創新;證監會發聲!持續提升A股吸引力、竟爭力 - 天天要聞

利好利空晚報|高層部署!加快產業創新;證監會發聲!持續提升A股吸引力、竟爭力

為投資者提供專業資訊服務 資訊傳遞價值,專業伴隨成長!——騰訊官方證券投資平台周三晚間,市場聚焦哪些新聞?一起來和自選哥看看吧:高層發聲,事關新型工業化、新質生產力;證監會召開會議,研究部署資本市場具體舉措。首先,一起來和自選哥看看高層關於新型工業化、新質生產力的發聲吧。國務院副總理張國清近日在湖北...
比特幣ETF或已成為貝萊德最創收產品 超越同門老將標普ETF - 天天要聞

比特幣ETF或已成為貝萊德最創收產品 超越同門老將標普ETF

財聯社6月24日訊(編輯 趙昊)對全球最大資產管理公司貝萊德來說,旗下的比特幣交易所交易基金(ETF)為其創造的收入可能已經超過了其標誌性的產品標普500指數ETF。數據顯示,貝萊德規模約為750億美元的iShares比特幣信託ETF(代碼:IBIT)受到機構與散戶投資者的共同追捧,過去18個月中17個月錄得資金流入,僅今年2月出現...
騰訊表態「不當接盤俠」!Nexon創始人遺產稅難交,250億元股票或再次流拍 - 天天要聞

騰訊表態「不當接盤俠」!Nexon創始人遺產稅難交,250億元股票或再次流拍

「 點擊上方"GameLook",訂閱微信 」近日,中國科技巨頭騰訊再次明確表示,無意收購韓國遊戲公司Nexon控股母公司NXC的股份。這批股份源於已故Nexon創始人金正洙的遺產稅,由其遺屬以實物形式上繳,佔NXC總股本的近30%。儘管韓國企劃財政部已通過韓國資產管理公社(KAMCO)啟動了這85萬1968股的出售程序,但騰訊並未參...
攜手沃滿客智慧便利店創業,共同開創智慧零售的新未來 - 天天要聞

攜手沃滿客智慧便利店創業,共同開創智慧零售的新未來

近年來,隨着消費升級浪潮的持續推進和數字化轉型的不斷深入,零售行業正經歷着前所未有的變革。在這一背景下,沃滿客智慧便利店憑藉其創新的商業模式和先進的技術支撐,正逐漸成為眾多創業者進軍智慧零售領域的首選合作夥伴。通過深度融合物聯網、大數據、人工智能等前沿技術,沃