谷歌發佈推理模型 Gemini 2.5,這是其迄今為止「最智能的 AI 模型」

2025年03月27日21:12:11 科技 1124

谷歌昨日宣布正式發佈Gemini 2.5,這是一種新的推理模型,該公司還聲稱這是其迄今為止「最智能的AI模型」。

谷歌發佈推理模型 Gemini 2.5,這是其迄今為止「最智能的 AI 模型」 - 天天要聞

「Gemini 2.5 模型是思維模型,能夠在做出反應之前通過思維進行推理,從而提高性能和準確性。在人工智能領域,系統的「推理」能力不僅僅指分類和預測。它指的是分析信息、得出合乎邏輯的結論、結合背景和細微差別並做出明智決策的能力,」谷歌 DeepMind 首席技術官 Koray Kavukcuoglu 在一篇博文中如此寫道。

Gemini 2.0 Flash Thinking是谷歌首個推理模型,而 Gemini 2.5 則在此基礎上改進了基礎模型,並改進了後期訓練。谷歌在公告中透露,未來所有 AI 模型都將內置推理能力。

谷歌發佈推理模型 Gemini 2.5,這是其迄今為止「最智能的 AI 模型」 - 天天要聞

第一個 Gemini 2.5 模型是 Gemini 2.5 Pro Experimental,它在 LMArena 基準測試中遠遠領先於 OpenAI o3-mini、Claude 3.5 Sonnet 和 DeepSeek R1 等其他推理模型。

它還在 Humanity's Last Exam 上獲得了 18.8% 的分數,這是「由數百名學科專家設計的數據集,旨在捕捉人類知識和推理的前沿」。它還擅長編碼,特別是創建 Web 應用程序和代理應用程序,以及處理代碼轉換。相比之下,OpenAI o3-mini 得分為 14%,DeepSeek R1 得分為 8.6%。

該模型現已在 Google AI Studio 和 Gemini 應用程序中供高級訂閱者使用。谷歌正在努力將其添加到 Vertex AI 中,並將在未來幾周內公布該模型的定價。

在推出時,它提供了 100 萬個令牌上下文窗口,並且該公司正在努力儘快添加 200 萬個令牌上下文窗口。

科技分類資訊推薦

甘肅省科技創業孵化協會到唐山機械人特色產業基地交流考察 - 天天要聞

甘肅省科技創業孵化協會到唐山機械人特色產業基地交流考察

近日,甘肅省科技創業孵化協會會長孫曉輝攜省內10餘家科技企業孵化器管理運營代表一行13人,在河北省科技企業孵化協會秘書長李靖的陪同下,到唐山機械人特色產業基地、百川機械人共享製造工廠交流考察。在唐山機械人展示體驗中心,考察團一行詳細了解了機械人系統集成、機械人視覺、服務機械人、自動化藥房、無人機技術服務...
OpenAI反訴馬斯克:當理想主義撞上商業鐵幕 - 天天要聞

OpenAI反訴馬斯克:當理想主義撞上商業鐵幕

美國時間4月9日,人工智能領域的「師徒反目」大戲迎來高潮:OpenAI正式向舊金山高等法院提交訴狀,指控其聯合創始人之一埃隆·馬斯克存在「系統性騷擾行為」,並要求法院禁止其通過社交媒體和公開言論實施的「惡意宣傳」。
劉強東和李斌一起吃飯,拍照姿勢大有深意! - 天天要聞

劉強東和李斌一起吃飯,拍照姿勢大有深意!

看到劉強東和李斌一起吃京東外賣,原來大佬喜歡這種拍照姿勢。李斌發文和劉強東一起吃京東外賣,並且對京東外賣盛讚有加。我覺得劉強東有一句話說的特別好,那就是京東要做父母,孩子,客人都能放心吃的品質外賣。
已修復:三星確認微軟 Swiftkey 不兼容 One UI 7,解鎖無回車鍵 - 天天要聞

已修復:三星確認微軟 Swiftkey 不兼容 One UI 7,解鎖無回車鍵

IT之家 4 月 10 日消息,三星公司昨日確認,輸入法應用 Microsoft Swiftkey 不兼容最新 One UI 7.0 更新,由於輸入鍵盤沒有顯示回車按鍵,可能導致部分用戶卡在鎖屏界面無法進入桌面。IT之家註:Microsoft Swiftkey 是一款熱門輸入法應用程序,由於豐富的 AI 功能和卓越的輸入體驗,得到了很多用戶的青睞,讓其取代三
谷歌發佈 Gemini 2.5 Flash AI 模型:專為省錢高效而生 - 天天要聞

谷歌發佈 Gemini 2.5 Flash AI 模型:專為省錢高效而生

IT之家 4 月 10 日消息,谷歌今日推出了一款名為 Gemini 2.5 Flash 的全新 AI 模型,該模型注重高效能,並提供強勁的性能。據IT之家了解,Gemini 2.5 Flash 即將登陸谷歌的 AI 開發平台 Vertex AI。谷歌公司表示,該模型具備「動態且可控」的計算能力,開發者能夠根據查詢請求的複雜程度靈活調整處理時間。谷歌在一篇博