刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了

2025年05月17日05:00:15 科技 2498
altman 昨天早上还在 x 上卖关子,说有个研究预览版本快上线,要给它起个「如果它成了会很好记」的名字。
就在刚刚,openai 正式发布 codex。
这是一款基于云端运行的软件工程智能 agent,能够并行处理多个开发任务,协助开发者高效完成编程工作。
刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了 - 天天要闻
ui 设计没整花活,codex 提供一个输入框和两个按钮——「ask」(提问)和 「code」(编码)。你只需明确描述任务,它就会开始执行。
兴奋的 altman 在 x 平台连发数条推文表示:
像这样的工具,让一个人能开发出的软件数量,实在令人惊叹又令人兴奋。「你其实可以直接去做」是我最喜欢的梗之一;我原本没想到,它会这么快以如此重要的方式应用到 ai 本身以及它的使用者身上。
刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了 - 天天要闻
codex 能胜任的工作不仅仅是编写功能代码,还包括理解代码结构、回答关于代码库的问题、修复 bug,甚至直接提交可审查的拉取请求(pull request)。
每个任务都在云端独立的沙箱环境中执行,自动加载用户的代码仓库。运行时长从 1 分钟到 30 分钟不等,取决于任务复杂度,同时用户可以实时查看任务进度。
任务完成后,codex 会输出一整套可追溯的执行结果,包括终端日志、测试记录等验证信息。你可以对修改结果进行审查、提出建议,甚至直接在 github 上发起 pr,或者合并进本地项目。
借助项目中的 agents.md 文件,用户还可自定义 codex 的行为,让它更贴合具体项目的开发规范与测试标准。
刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了 - 天天要闻
codex 的核心模型为 codex-1,这是 openai o3 系列里专为软件工程微调过的版本。
基准测试结果显示,codex-1 在 swe-bench 的得分为 72.1%,纸面参数优于 claude 3.7 以及 o3-high。
刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了 - 天天要闻
训练方式也很「实战」,通过在真实开发环境中进行强化学习训练,codex 能够生成更符合人类编码风格和审查偏好的代码,严格按照指令执行,并不断运行测试,直到测试通过为止。
从今天开始,codex 将向 chatgpt pro、enterprise 和 team 用户开放,而 plus 和 edu 用户的支持也将很快上线。
刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了 - 天天要闻
安全性方面,codex 做得也够克制。执行任务时,它只会访问你提供的代码库和预设依赖,不能联网、不能访问外部 api,遇到不确定问题会停下来提示你处理。
并且,codex 经过专门训练,能够识别并拒绝与恶意开发相关的请求,避免被滥用于开发恶意软件。
目前,openai 已在内部广泛使用 codex,协助工程师完成重构、命名规范、编写测试等重复性任务,显著提升开发效率。一些外部合作团队也给出了积极反馈,比如 cisco 与 temporal 借助 codex 加快了开发与调试节奏。

在深夜直播中,openai 的员工展示了 codex 更具实用性的能力:

它能够理解整个代码库的结构,自动定位并修复 bug,处理超时设置或拼写错误等常见问题。即使是在命令行报错时,codex 也能分析出错原因,自动生成修复脚本和相应的测试用例。

此外,它还具备代码审查功能,能梳理所有改动点,并指出可能导致测试失败的风险。换句话说,codex 正在逐步进化为一个真正可用的编程协作助手。

刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了 - 天天要闻
openai 员工也分享了他们用 codex 管理大型代码变更的经验,即使这些变更代码从未跑过本地环境,也能顺利合并、通过测试。
知名科技作者 dan shipper 提前体验了 codex,并用一篇博客分享了他的使用感受。
在他看来,通过 codex,用户可以像管理团队一样分配任务,而不需要编写代码。codex 特别适合资深开发者,在执行任务时能够产生简洁高效的代码变更,并自动生成 pull request 提交到 github。
然而,codex 也有一些局限性,比如对于新手工程师不太友好,不擅长处理后续的修改与补充任务,并且尚未完全整合到主流开发平台如 github 和 slack。
刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了 - 天天要闻
它的设计主要面向专业开发者,而不是那些喜欢边聊边编程的用户。codex 的核心优势在于提高高级开发者的工作效率,使他们能够同时管理多个任务,从而加速开发进程。
如果你是技术主管、需要在已有项目中添加功能或修复 bug,那么 codex 是你会常用的工具;但如果你是在从零开始搞一个 「一人十亿级美元 saas」,可能就用不上它。
简单来说,如果你一个人做了一个网站或工具,用户通过订阅使用,每月收入达到几百万,年收入破千万甚至过亿,那么你就是在做「一人十亿级美元 saas」。
刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了 - 天天要闻
除了云端主力模型之外,openai 还同步推出了专为命令行优化的轻量模型 codex-mini-latest,支持开发者在本地环境快速接入 ai。
codex cli 登录流程简洁,可直接使用 chatgpt 账号接入,并享受基础的免费 api 配额。目前已向全球范围内的 pro、enterprise 和 team 用户开放,未来几周内还将陆续支持 plus 与 edu 用户。
对于接入 codex-mini-latest 的开发者,该模型可通过 responses api 调用,价格为每百万输入 tokens 花费 1.5 美元、每百万输出 tokens 花费 6 美元,支持高达 75% 的提示缓存折扣,进一步降低调用成本。
刚刚,OpenAI最强编程智能体上线ChatGPT!AI的「终极外挂」来了 - 天天要闻
openai 对 codex 的长线愿景很明确:
它不仅是一个写代码的工具,更是未来协作模式的雏形。多代理、异步执行、自动汇报进度,这一套逻辑未来可能内嵌进 ide、git 工具、甚至 slack 里,成为开发者真正的「副驾驶」。
目前 codex 仍处于研究预览阶段,图像输入等高级功能尚未开放。
但过去那些对 ai 编程助手的畅想,比如自动写代码、提 pr、修 bug,终于在 codex 身上以可用工具的形式落地,成为真正能上手、能跑进实际工作流的产品。

科技分类资讯推荐

Nothing 首款头戴式耳机 Headphone (1) 发布,复古透明设计 - 天天要闻

Nothing 首款头戴式耳机 Headphone (1) 发布,复古透明设计

IT之家 7 月 2 日消息,Nothing 首款头戴式耳机 —— Nothing Headphone (1) 今日正式发布。这款耳机延续了该品牌复古、透明的设计风格,摒弃了触控设计,采用了更复古的物理滚轮和按键控制。Nothing Headphone (1) 采用 CNC 铝制外壳,内部记忆泡沫耳垫可以贴合耳朵。硬件方面,Nothing 与音响品牌 KEF
小米YU7支持车外呼叫小爱开前备箱:三个条件都满足才能用 - 天天要闻

小米YU7支持车外呼叫小爱开前备箱:三个条件都满足才能用

快科技7月2日消息,小米YU7上首发了车外小爱同学的功能,在车外有8个麦克风和1个扬声器。无论在哪个角度,都可以很容易使用语音控车,比如在车外直接让小爱同学打开前备箱。这也让很多网友和准车主疑惑,会不会存在安全问题?对此,小米汽车在最新一期问答中表示,出于安全的考量,在车外通过小爱同学打开小米YU7的前备箱,...
小米汽车辟谣YU7交付插队费:都是假的 - 天天要闻

小米汽车辟谣YU7交付插队费:都是假的

快科技7月2日消息,小米汽车日前发布第166集答网友问。对于“网上有人自称小米汽车交付专员,宣称可以提前交付车辆,是真的吗?”小米汽车表示:如有收到类似短信,请大家切勿相信,更不要涉及金钱交易,以避免经济损失。涉及类似“提前交付”、“提前交付需转账给个人”或“支付插队费”等信息,请大家一定要仔细甄别。涉...
甜品上市!七彩虹iGameRTX 5050 Ultra显卡:温控性能两开花 - 天天要闻

甜品上市!七彩虹iGameRTX 5050 Ultra显卡:温控性能两开花

据悉,一线显卡品牌七彩虹的又一甜品级装备iGameGeForce RTX 5050 Ultra系列显卡现已正式上架各大电商平台和线下授权零售商!该系列RTX5050显卡搭载8GBGDDR6高速显存,2560个CUDACores,配合革命性DLSS4多帧生成技术,3A游戏全特效畅玩无压力,内容创作如虎添翼!更配备强劲的散热系统,性能与温控双优表现,让每一分预算
光追入门但超流畅!映众RTX5050 8GB曜夜发布 - 天天要闻

光追入门但超流畅!映众RTX5050 8GB曜夜发布

映众GeForceRTX 5050 8GB曜夜显卡现已和大家见面。基于NVIDIABlackwell架构打造,以紧凑双槽设计、高效散热及AI加速能力,为新一代RTX50系入门级市场注入新活力。作为GeForceRTX 50系列的入门主力,映众RTX5050 8GB曜夜凭借NVIDIABlackwell架构的革新设计,在AI与图形处理效率上有着不俗的性能表现。
从SEO到CRO:搜索优化的时代变革 - 天天要闻

从SEO到CRO:搜索优化的时代变革

在数字营销领域,搜索引擎优化(SEO)曾经是获取流量的黄金法则。我们习惯于在搜索引擎输入关键词,然后结果页面中寻找答案。但随着ChatGPT、DeepSeek等生成式AI的崛起,这个延续了二十多年的搜索模式正在被彻底改写。当AI能够直接生成完整答案时,传统的SEO策略突然变得力不从心——这就是为什么我们需要重新认识AI时代的...
全球可持续交通创新联盟可持续航空燃料专委会成立 - 天天要闻

全球可持续交通创新联盟可持续航空燃料专委会成立

7月1日,全球可持续交通创新联盟的第一个国际性专委会—可持续航空燃料专委会成立。该专委会的成立旨在整合产业链力量,构建“技术创新-产业协同-价值共享”三位一体的生态体系,为中国乃至全球能源绿色转型和航空业低碳未来发展提供“中国方案”。启动仪式上,中国能建联合行业头部企业共同发布《可持续航空燃料(SAF)产...
张勇出局,蒋凡上位:阿里权力大地震 - 天天要闻

张勇出局,蒋凡上位:阿里权力大地震

英雄难过美人关。京东创始人刘强东,曾因“明州事件”一度沉寂,事隔七年之后才真正重回公众视野。当年的天猫总裁蒋凡,亦因一场“桃色风波”消失在镁光灯下,直至近期才锋芒再现。
2025第25周销量最高的30款机型曝光 前三只有一款国产 - 天天要闻

2025第25周销量最高的30款机型曝光 前三只有一款国产

【CNMO科技消息】近日,有数码博主曝光了2025年第25周(6月16日到6月22日)中国智能手机市场上销量最高的30款机型: 第一名,iPhone 16 Pro 第二名,iPhone 16 Pro Max 第三名,OPPO Reno 14 第四名,iPhone 16 第五名,REDMI K80 第六名,小米15 第七名,华为nova 14 第八名,荣耀40