谷歌發布推理模型 Gemini 2.5,這是其迄今為止“最智能的 AI 模型”

2025年03月27日21:12:11 科技 1124

谷歌昨日宣布正式發布Gemini 2.5,這是一種新的推理模型,該公司還聲稱這是其迄今為止“最智能的AI模型”。

谷歌發布推理模型 Gemini 2.5,這是其迄今為止“最智能的 AI 模型” - 天天要聞

“Gemini 2.5 模型是思維模型,能夠在做出反應之前通過思維進行推理,從而提高性能和準確性。在人工智能領域,系統的“推理”能力不僅僅指分類和預測。它指的是分析信息、得出合乎邏輯的結論、結合背景和細微差別並做出明智決策的能力,”谷歌 DeepMind 首席技術官 Koray Kavukcuoglu 在一篇博文中如此寫道。

Gemini 2.0 Flash Thinking是谷歌首個推理模型,而 Gemini 2.5 則在此基礎上改進了基礎模型,並改進了後期訓練。谷歌在公告中透露,未來所有 AI 模型都將內置推理能力。

谷歌發布推理模型 Gemini 2.5,這是其迄今為止“最智能的 AI 模型” - 天天要聞

第一個 Gemini 2.5 模型是 Gemini 2.5 Pro Experimental,它在 LMArena 基準測試中遠遠領先於 OpenAI o3-mini、Claude 3.5 Sonnet 和 DeepSeek R1 等其他推理模型。

它還在 Humanity's Last Exam 上獲得了 18.8% 的分數,這是“由數百名學科專家設計的數據集,旨在捕捉人類知識和推理的前沿”。它還擅長編碼,特別是創建 Web 應用程序和代理應用程序,以及處理代碼轉換。相比之下,OpenAI o3-mini 得分為 14%,DeepSeek R1 得分為 8.6%。

該模型現已在 Google AI Studio 和 Gemini 應用程序中供高級訂閱者使用。谷歌正在努力將其添加到 Vertex AI 中,並將在未來幾周內公布該模型的定價。

在推出時,它提供了 100 萬個令牌上下文窗口,並且該公司正在努力儘快添加 200 萬個令牌上下文窗口。

科技分類資訊推薦

人形機器人加速“進化”新時代畫卷 - 天天要聞

人形機器人加速“進化”新時代畫卷

人形機器人的“進化之旅”在科技的璀璨星河中,人形機器人宛如一顆耀眼的新星,正以驚人的速度加速“進化”,開啟屬於它們的新時代畫卷。從“蹣跚學步”到“小步快跑”曾幾何時,人形機器人還處在Demo演示和靜態展覽的階段,如同初生嬰兒般對世界充滿好奇
小米:犯罪團伙操縱近萬賬號詆毀小米,犯罪金額巨大 - 天天要聞

小米:犯罪團伙操縱近萬賬號詆毀小米,犯罪金額巨大

據@小米法務部 5月19日消息:2025年5月15日,公司從司法機關處獲悉,此前公司報案的一起有組織、有預謀的網絡黑公關案件,已經告破。目前,公安機關已依法對多名犯罪嫌疑人採取刑事強制措施,案件還在進一步調查。據了解,自2024年12月起,直至近期小米汽車相關的系列熱點事件,該犯罪團伙利用文案自動生成軟件捏造關於小米...
QQ瀏覽器推出QBot:全面升級為AI瀏覽器 聚合5大AI新能力 - 天天要聞

QQ瀏覽器推出QBot:全面升級為AI瀏覽器 聚合5大AI新能力

快科技5月19日消息,QQ瀏覽器宣布推出QBot,升級為AI瀏覽器,搭載騰訊混元和DeepSeek雙模型。升級後的QQ瀏覽器將成為超級助手,在瀏覽時提供多種AI功能,幫助用戶更高效地獲取和處理信息,滿足工作、學習等需求。據悉,新版QQ瀏覽器可體驗AI搜索、AI瀏覽、AI辦公、AI學習、AI寫作五大功能。如在搜索方面,支持用戶以文字、...