OpenAI o3 模型运行成本估算从 3000 美元涨至 3 万美元

2025年04月03日08:40:21 科技 1800

it之家 4 月 3 日消息,上周,负责维护和管理 arc-agi 的 arc prize foundation 对 openai 的 o3 “推理”人工智能模型在 arc-agi 基准测试中的成本估算进行了重大修订,现在看起来 o3 的运行成本没有那么低。

OpenAI o3 模型运行成本估算从 3000 美元涨至 3 万美元 - 天天要闻

去年 12 月 openai 推出 o3 模型时,与 arc-agi 的开发者合作,展示了该模型在解决复杂问题上的强大能力。然而,几个月后,其成本估算结果却发生了显著变化。arc prize foundation 最新估计,o3 模型中表现最佳的配置 o3 high,解决一个单一的 arc-agi 问题的成本可能高达约 3 万美元(it之家注:现汇率约合 21.8 万元人民币),而此前的估算仅为约 3000 美元(现汇率约合 21821 元人民币)

OpenAI o3 模型运行成本估算从 3000 美元涨至 3 万美元 - 天天要闻

OpenAI o3 模型运行成本估算从 3000 美元涨至 3 万美元 - 天天要闻

这一成本估算的大幅上调,凸显了目前最先进 ai 模型在特定任务上可能面临的高昂成本。尽管 openai 尚未公布 o3 模型的定价,也未正式发布该模型,但 arc prize foundation 认为,openai 目前最昂贵的 o1-pro 模型的定价可以作为参考。

“我们认为 o1-pro 更接近 o3 真实成本的比较对象,因为两者在测试时使用的计算量相近。”arc prize foundation 的联合创始人迈克・库诺(mike knoop)在接受 techcrunch 采访时表示,“但这仍然只是一个参考值,我们在排行榜上仍将 o3 标记为预览版,以反映在官方定价公布前的不确定性。”

o3 high 的高成本并非毫无依据。据 arc prize foundation 介绍,o3 high 在处理 arc-agi 任务时,使用的计算资源是 o3 模型中计算量最低的 o3 low 配置的 172 倍。如此巨大的计算资源消耗,使得 o3 high 的成本大幅上升。

此外,有关 openai 计划为面向企业客户的高端定制服务收取高额费用的传闻也由来已久。今年 3 月初 the information 报道称,该公司可能计划每月收取高达 2 万美元(现汇率约合 14.5 万元人民币)的费用,为企业提供像软件开发人员代理这样的专业 ai “代理”服务。

尽管有人认为,即使是最昂贵的 ai 模型,其成本也远低于人类承包商或员工的薪酬,但 ai 研究员托比・奥德(toby ord)在 x 网站上发表的一篇文章指出,这些模型的效率可能并不如人们预期的那么高。例如,o3 high 在 arc-agi 测试中,需要尝试 1024 次才能达到最佳成绩。

随着 ai 技术的不断发展和商业化进程的加速,如何在保持模型高性能的同时,有效控制成本,将成为行业面临的重要挑战之一。

科技分类资讯推荐

麒麟操作系统兼容适配性工具:轻松破解应用兼容性问题! - 天天要闻

麒麟操作系统兼容适配性工具:轻松破解应用兼容性问题!

兼容适配工具。麒麟兼容性适配工具(KAT)可用于测试开发者的自研应用,通过一件事的上传测试,多维度的兼容评估,生成可视化的测试报告,可识别常见兼容性适配问题,如应用图标显示异常、应用无法升级、运行库缺失、启动时间过长等,帮助开发者提升应用质
微软首席技术官:2030年AI将生成95%代码,工程师成为指令引导者 - 天天要闻

微软首席技术官:2030年AI将生成95%代码,工程师成为指令引导者

IT之家 4 月 5 日消息,据外媒 TechSpot 当地时间周四报道,微软首席技术官 Kevin Scott 预测,到 2030 年,95% 的编程代码将由 AI 生成。不过,他迅速澄清,这并不意味着软件工程的工作将完全由 AI 接管。他同时澄清说,这并不意味着 AI 将取代软件工程师 —— 人类依然会写代码,但这一变化会让我们从编程语言的输入大师...
字节跳动深夜回应:与美政府尚未达成任何协议 - 天天要闻

字节跳动深夜回应:与美政府尚未达成任何协议

4月5日凌晨,@字节跳动发布声明称,字节跳动公司尚在与美政府商谈之中,未达成任何协议,双方在很多关键问题上仍存分歧。按照中国法律规定,任何协议均须经有关审查程序。据央视新闻4月5日报道,当地时间4月4日,美国总统特朗普在社交媒体上宣布,将再次推迟执行TikTok禁令75天。美国总统特朗普当地时间1月20日签署行政令,...
3000公里秒传,中国特高压闪电都追不上?西方这次真的酸了 - 天天要闻

3000公里秒传,中国特高压闪电都追不上?西方这次真的酸了

中国的特高压输电技术,让国际上很多国家都惊叹不已,3000公里的遥远距离,送电时间达到“秒传”根本不是夸张,闪电都追不上的速度,让西方羡慕哭了。中国打造的特高压输电技术,能够实现几千里送电时间,以秒为单位,这样的闪电速度,简直太科幻了。
玩具工厂引进自动化设备 产品不良率从2%降至0.5% - 天天要闻

玩具工厂引进自动化设备 产品不良率从2%降至0.5%

万格积木的展厅仿佛一个微缩的世界建筑博览馆。 德馨童娱澄海工厂的生产车间内,工人正组装玩具产品。 华丰玩具引入自动化设备提高生产效率。 第七印象展柜中陈列的玩具。电影《哪吒2》的全球热映,不仅让全球看到中国文化的魅力,相关周边产品热卖也推动着潮玩产业的发展。广东潮玩产业发展现状如何?中国制造与文化IP的创...
华为PuraX全球屏幕首摔,维修价格把我看傻了! - 天天要闻

华为PuraX全球屏幕首摔,维修价格把我看傻了!

华为PuraX最近的热度太高了,又是一机难求。华为目前发布的新机,几乎发布之后就是一机难求,非常抢手。据称华为PuraX目前的销量已经超过了100000台,之前还被网友吐槽,说7499元的起售价格不是人人都买得起。但事实证明,华为PuraX
奥尔特曼:OpenAI将在未来几个月发布GPT-5 能力比预期的要好不少 - 天天要闻

奥尔特曼:OpenAI将在未来几个月发布GPT-5 能力比预期的要好不少

财联社4月5日讯(编辑 牛占林)当地时间周五,OpenAI首席执行官奥尔特曼表示,将在未来几周内发布o3和o4-mini,未来几个月将发布GPT-5。奥尔特曼当天在社交媒体上发文称,GPT-5的发布比预期要晚,但这是有原因的,最令人兴奋的是,现在有能力把GPT-5做得比最初预期的要好不少。“我们还发现,顺利整合所有内容比我们预想的...
微软预告 Copilot Avatar,用户可自由设计 AI 形象外观 - 天天要闻

微软预告 Copilot Avatar,用户可自由设计 AI 形象外观

IT之家 4 月 5 日消息,微软在 50 周年活动上宣布,将推出可自定义形象的 AI 助手功能“Copilot Avatar”。用户可为 Copilot 设计专属虚拟形象,该形象会在对话时通过表情增强互动体验。微软近日踏入《黑镜》式科幻领域,宣布为 AI 助手 Copilot 开发虚拟形象定制功能。在 50 周年活动上,该公司透露“Copilot Avat
微软推出 Copilot Pages / Deep Research:AI 自动整理研究笔记 - 天天要闻

微软推出 Copilot Pages / Deep Research:AI 自动整理研究笔记

IT之家 4 月 5 日消息,微软在成立 50 周年之际,为 AI 助手 Copilot 推出两项新功能 ——Deep Research(深度研究)和 Pages(页面)。前者可自动化多步骤研究任务,后者能将笔记、研究内容整合为草稿。Pages 功能可将用户提供的笔记、网页内容等素材自动整理成结构化草稿,并支持持续修改与对话交互。IT之家附上演示视频...