Google TPU成本僅為OpenAI五分之一!誰性價比最高?

本文由半導體產業縱橫(id:icviews)綜合

低成本 vs 成熟整合,tpu與gpu怎麼選?

在生成式ai競爭白熱化的時代,成本與效率成為企業導入ai 的核心考量。 google 近期以自研的tpu(張量處理單元)強勢進軍ai 市場,掀起一場ai 算力的價格革命,矛頭直指目前仍依賴英偉達高價gpu 的openai。

google tpu 登場:ai 算力成本壓到只剩openai 的20%

據報導,相較於openai 仰賴的英偉達gpu(如h100、a100),google 的tpu 成本只有其五分之一。在同樣或更優的ai 效能下,能大幅降低算力支出,讓企業能以更低成本建構生成式ai 服務。

目前一張英偉達h100 芯片成本約3,000 美元,但市價卻高達2 萬至3.5 萬美元;高毛利成為企業導入ai 的沉重負擔。

與此同時,google 的tpu 不僅效能媲美英偉達,價格策略更具優勢,迅速吸引企業級用戶轉向。

api 價格比一比:gemini 2.5 pro 完勝openai o3

除了硬件,api 價格也是企業選擇ai 平台時的重要指標。

google 的gemini 2.5 pro 在價格上遠低於openai 的o3 模型,不但輸入價格便宜8 倍;輸出價格也便宜4 倍。

這使許多中小型企業得以以較低預算導入生成式ai,加速內部流程自動化與內容生成應用。

ai 生態系之戰:google 走開放路線,openai 偏重整合

此外,ai 的競爭早已不僅是模型強不強,更是誰的生態系統完整且容易接入,而google 和openai 的策略,宛如兩條截然不同的賽道。

google:採用開放策略,透過agent-to-agent 通訊協議、agent development kit(adk)與agentspace 平台,打造開放式ai 代理市集,促進多平台ai 互通。

openai:深度整合微軟,與azure、office 365 等服務緊密結合,強調一體化、穩定、快速上手的企業應用體驗。

這兩種策略代表ai 即服務(ai-as-a-service)市場中的兩大方向,也讓企業需根據需求選擇適合的合作夥伴。

模型實力對比:gemini 穩定處理大資料,o3 強於邏輯推理

若從模型能力觀察,gemini 2.5 pro 擁有100 萬字元(tokens)上下文容量,極適合處理大量文本資料、長篇內容生成等任務;而雖然openai o3 模型上下文容量為20 萬字元,但其在邏輯推理、複雜任務處理方面表現卓越。

值得注意的是,根據openai 自家資料,o3 的幻覺率為前代的兩倍,對金融、醫療等高精準領域而言存在風險。而google gemini 則主打的穩定性與預測性,則更符合企業對安全性的期待。

實際應用落地:google 靠cloud 平台推進,openai 主攻chatgpt 擴張

導入ai 的最終目的在於提升業務效率。 google 透過將gemini 整合至google cloud 與vertex ai,提供企業快速建置、延伸既有雲端架構的能力。像wendy's、wayfair (w-us ) 等大型企業已開始導入。

openai 則主攻全球普及路線,依賴chatgpt 與microsoft 365 copilot 迅速滲透企業端與個人市場,月活用戶高達8 億人次,生態壓力不容小覷。

企業ai 導入選擇題:低成本vs 成熟整合,怎麼選?

在面對ai 快速演進與成本壓力下,企業正處於選google,還是選openai的十字路口:google 的tpu 大幅壓低算力成本,適合預算有限或初期建置ai 服務的公司。

然而,openai 在使用體驗與整合度上仍具明顯優勢,特別是在微軟azure、office 365 環境下的企業,部署與管理都更加順手。

去年8月,蘋果公司發布了一篇研究論文,論文顯示蘋果公司使用了谷歌開發的 tpu 芯片而非英偉達的 gpu 芯片來訓練其人工智能系統“蘋果智能”(apple intelligence)中的 ai 模型 apple foundation model(簡稱 afm)。蘋果公布其使用了 2048 片 tpuv5p 芯片來訓練擁有 27.3 億參數的設備端模型 afm-on-device ,以及 8192 片 tpuv4 芯片來訓練其為私有雲計算環境量身定製的大型服務器端模型 afm-server。

蘋果放棄英偉達 gpu 轉向谷歌 tpu 的戰略選擇,在科技界投下了一枚震撼彈,英偉達股價應聲下跌超 7%,創下近三個月最大跌幅,市值蒸發 1930 億美元。蘋果此次選擇依賴谷歌的雲基礎設施、使用谷歌 tpu 進行其 ai 模型訓練,充分反映了科技巨頭們在尖端 ai 訓練方面開始尋求更多元化的解決方案的趨勢。

這一次,蘋果雖然在論文中沒有明確表示其完全沒有使用英偉達 gpu,但蘋果在描述其訓練 afm 模型所用的 ai 基礎設施時詳細分享了使用谷歌 tpu 的很多數量、配置及性能細節,而刻意忽略了對英偉達硬件的任何提及,這一細節確實暗示了蘋果有意選擇了谷歌的技術。

蘋果過去一直極少披露自己用於開發目的的硬件選擇,再考慮到英偉達 gpu 一直以來的行業領導地位,這一次蘋果公開選擇從英偉達 gpu 轉向擁抱谷歌 tpu 的舉措,極大可能會激勵其他科技公司探索英偉達 gpu 之外的替代方案,tpu 的強大性能和用於ai模型訓練時的高能效比,定將吸引大量尋求優化 ai 工作負載的企業。

*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯繫後台。