it之家 4 月 10 日消息,谷歌今日推出了一款名為 gemini 2.5 flash 的全新 ai 模型,該模型注重高效能,並提供強勁的性能。
據it之家了解,gemini 2.5 flash 即將登陸谷歌的 ai 開發平台 vertex ai。谷歌公司表示,該模型具備“動態且可控”的計算能力,開發者能夠根據查詢請求的複雜程度靈活調整處理時間。谷歌在一篇博客文章中寫道:“你可以針對特定需求來調整速度、準確性和成本之間的平衡。這種靈活性對於優化 flash 在大批量、成本敏感型應用中的性能至關重要。”
當前,旗艦 ai 模型的成本呈現不斷上升的趨勢,而像 gemini 2.5 flash 這樣價格較低且性能出色(儘管在準確性上可能稍遜一籌)的模型,為用戶提供了更具吸引力的替代選擇。
gemini 2.5 flash 是一款“推理”模型,與 openai 的 o3-mini 和 deepseek 的 r1 類似,意味着其在回答問題時會花費稍長的時間來進行事實核查。
谷歌指出,gemini 2.5 flash 非常適合用於“高容量”和“實時”的應用場景,例如客戶服務和文檔解析。谷歌在其博客文章中提到:“這款工作型模型專門針對低延遲和降低成本進行了優化,是響應式虛擬助手和實時總結工具的理想引擎,在大規模應用中,效率是關鍵。”
然而,谷歌尚未發布 gemini 2.5 flash 的安全或技術報告,這使得人們難以明確了解該模型在哪些方面表現出色,又在哪些方面存在不足。此前,谷歌曾表示,對於其認為是“實驗性”的模型,公司不會發布相關報告。
此外,谷歌在本周三宣布,計劃從第三季度開始將 gemini 模型(如 2.5 flash)引入本地環境。谷歌的 gemini 模型將在谷歌分布式雲(gdc)上提供,這是谷歌為有嚴格數據治理要求的客戶提供的一種本地解決方案。谷歌表示,公司正在與英偉達合作,將 gemini 模型引入符合 gdc 標準的英偉達 blackwell 系統,客戶可以通過谷歌或其首選渠道購買這些系統。