Google TPU成本仅为OpenAI五分之一!谁性价比最高?

本文由半导体产业纵横(id:icviews)综合

低成本 vs 成熟整合,tpu与gpu怎么选?

在生成式ai竞争白热化的时代,成本与效率成为企业导入ai 的核心考量。 google 近期以自研的tpu(张量处理单元)强势进军ai 市场,掀起一场ai 算力的价格革命,矛头直指目前仍依赖英伟达高价gpu 的openai。

google tpu 登场:ai 算力成本压到只剩openai 的20%

据报导,相较于openai 仰赖的英伟达gpu(如h100、a100),google 的tpu 成本只有其五分之一。在同样或更优的ai 效能下,能大幅降低算力支出,让企业能以更低成本建构生成式ai 服务。

目前一张英伟达h100 芯片成本约3,000 美元,但市价却高达2 万至3.5 万美元;高毛利成为企业导入ai 的沉重负担。

与此同时,google 的tpu 不仅效能媲美英伟达,价格策略更具优势,迅速吸引企业级用户转向。

api 价格比一比:gemini 2.5 pro 完胜openai o3

除了硬件,api 价格也是企业选择ai 平台时的重要指标。

google 的gemini 2.5 pro 在价格上远低于openai 的o3 模型,不但输入价格便宜8 倍;输出价格也便宜4 倍。

这使许多中小型企业得以以较低预算导入生成式ai,加速内部流程自动化与内容生成应用。

ai 生态系之战:google 走开放路线,openai 偏重整合

此外,ai 的竞争早已不仅是模型强不强,更是谁的生态系统完整且容易接入,而google 和openai 的策略,宛如两条截然不同的赛道。

google:采用开放策略,透过agent-to-agent 通讯协议、agent development kit(adk)与agentspace 平台,打造开放式ai 代理市集,促进多平台ai 互通。

openai:深度整合微软,与azure、office 365 等服务紧密结合,强调一体化、稳定、快速上手的企业应用体验。

这两种策略代表ai 即服务(ai-as-a-service)市场中的两大方向,也让企业需根据需求选择适合的合作伙伴。

模型实力对比:gemini 稳定处理大资料,o3 强于逻辑推理

若从模型能力观察,gemini 2.5 pro 拥有100 万字元(tokens)上下文容量,极适合处理大量文本资料、长篇内容生成等任务;而虽然openai o3 模型上下文容量为20 万字元,但其在逻辑推理、复杂任务处理方面表现卓越。

值得注意的是,根据openai 自家资料,o3 的幻觉率为前代的两倍,对金融、医疗等高精准领域而言存在风险。而google gemini 则主打的稳定性与预测性,则更符合企业对安全性的期待。

实际应用落地:google 靠cloud 平台推进,openai 主攻chatgpt 扩张

导入ai 的最终目的在于提升业务效率。 google 透过将gemini 整合至google cloud 与vertex ai,提供企业快速建置、延伸既有云端架构的能力。像wendy's、wayfair (w-us ) 等大型企业已开始导入。

openai 则主攻全球普及路线,依赖chatgpt 与microsoft 365 copilot 迅速渗透企业端与个人市场,月活用户高达8 亿人次,生态压力不容小觑。

企业ai 导入选择题:低成本vs 成熟整合,怎么选?

在面对ai 快速演进与成本压力下,企业正处于选google,还是选openai的十字路口:google 的tpu 大幅压低算力成本,适合预算有限或初期建置ai 服务的公司。

然而,openai 在使用体验与整合度上仍具明显优势,特别是在微软azure、office 365 环境下的企业,部署与管理都更加顺手。

去年8月,苹果公司发布了一篇研究论文,论文显示苹果公司使用了谷歌开发的 tpu 芯片而非英伟达的 gpu 芯片来训练其人工智能系统“苹果智能”(apple intelligence)中的 ai 模型 apple foundation model(简称 afm)。苹果公布其使用了 2048 片 tpuv5p 芯片来训练拥有 27.3 亿参数的设备端模型 afm-on-device ,以及 8192 片 tpuv4 芯片来训练其为私有云计算环境量身定制的大型服务器端模型 afm-server。

苹果放弃英伟达 gpu 转向谷歌 tpu 的战略选择,在科技界投下了一枚震撼弹,英伟达股价应声下跌超 7%,创下近三个月最大跌幅,市值蒸发 1930 亿美元。苹果此次选择依赖谷歌的云基础设施、使用谷歌 tpu 进行其 ai 模型训练,充分反映了科技巨头们在尖端 ai 训练方面开始寻求更多元化的解决方案的趋势。

这一次,苹果虽然在论文中没有明确表示其完全没有使用英伟达 gpu,但苹果在描述其训练 afm 模型所用的 ai 基础设施时详细分享了使用谷歌 tpu 的很多数量、配置及性能细节,而刻意忽略了对英伟达硬件的任何提及,这一细节确实暗示了苹果有意选择了谷歌的技术。

苹果过去一直极少披露自己用于开发目的的硬件选择,再考虑到英伟达 gpu 一直以来的行业领导地位,这一次苹果公开选择从英伟达 gpu 转向拥抱谷歌 tpu 的举措,极大可能会激励其他科技公司探索英伟达 gpu 之外的替代方案,tpu 的强大性能和用于ai模型训练时的高能效比,定将吸引大量寻求优化 ai 工作负载的企业。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。