OpenAI最强写代码AI智能体来了:周五ChatGPT上线Codex研究预览版

ai编程工具的竞争正在白热化。传闻的30亿美元收购编程神器windsurf消息还未证实,openai已经先给chatgpt配置了自研的最强写代码ai智能体。

ai编程市场迅速扩大至数十亿美元规模。对投资者而言,这标志着ai应用场景从"玩具"转向真正的生产力工具,将重塑软件行业价值链和投资格局。

o3优化的新一代codex 同时运行多任务

5月16日周五,openai宣布推出codex研究预览版,周五当天起向chatgpt的pro、enterprise 和team版的用户推出,plus 和 edu版用户也将能很快使用codex的服务。

据openai博客介绍,周五上线的codex是一个基于云的软件工程智能体,能够同时处理多项任务。与2021年推出的原始codex模型不同,新版codex由codex-1驱动,这是openai o3模型的软件工程优化版本。

优化后的codex使用强化学习在各种环境中对真实编码任务进行训练,生成的代码能够高度反映人类的风格和pr偏好,精确遵循指令,并能够迭代运行测试,直到获得合格结果。。

codex可以执行编写功能、回答有关代码库的问题、修复bug以及提出拉取请求等任务。每项任务都在预加载了用户代码库的独立云沙盒环境中运行。视任务复杂性而定,新版codex完成任务通常需要1到30分钟,用户可以实时监控进度。

openai的ceo sam altman在社交媒体发帖力捧codex,称它是一个在云端运行的软件工程智能体,能同时运行多个任务,还称:

“一个人能就用这样的工具创造出如此多的软件,真是令人惊叹和兴奋。‘你只管做事’(you can just do things)是我最喜欢的一个梗,没想到它会这么快就以如此重要的方式用在ai自身及其用户上。”

altman还转贴了开发者对codex的花式吐槽、间接好评。有人说,用这个工具等于你招了个软件工程师,可每月花20美元的套餐竟然不能无限制用它,去你的吧;还有人说,这工具等于,你招了一名软件工程师,每月薪资都没有2万美元,搞什么鬼。

openai代理研究团队负责人josh tobin表示:

“我们认为智能体是能够通过与现实世界交互来代表你执行更长时间工作的ai系统。我们的愿景是chatgpt将成为一个虚拟同事——不仅回答快速问题,还能在各种任务上进行实质性合作。”

发布codex的同时,openai也更新了开源编码代理codex cli。该cli是用于本地开发的轻量级终端智能体,现在使用更小的模型codex-mini-latest,并针对低延迟编辑和问答进行了优化。它的定价为每百万输入token 1.50 美元,每百万输出token 6 美元,并提供75%的缓存折扣。

如何操作codex?不联网就能执行任务

用户可以通过chatgpt侧边栏访问codex,输入提示并点击"code"按钮分配新的编码任务,或点击"ask"按钮询问关于代码库的问题。每个任务在一个单独的环境中独立处理,该环境预加载了用户的代码库。

codex可以读取和编辑文件,并运行包括测试工具、代码检查器和类型检查器在内的命令。完成任务后,它会在环境中提交更改,并通过终端日志和测试输出的引用提供可验证的证据。

值得注意的是,codex在没有互联网连接的环境下即可执行任务,仅依赖用户提供的代码和依赖项。这种设计确保了操作安全,并最大限度地减少了潜在的滥用。

openai的桌面与智能体团队负责人alexander embiricos表示:"这不仅仅是一个模型api。因为它在有人工审查的隔离环境中运行,我们可以安全地给模型更多自由。"

为开发团队打造 不仅仅服务个人开发者

codex的设计初衷是服务专业开发者。现在看来,openai目的是让这款工具为整个开发团队、而不是开发者个人服务。

openai设想将 codex 打造为全新开发工作流程的核心,工程师可以将高级任务分配给智能体,并与之进行异步协作。openai正在努力实现与 github、chatgpt desktop、问题跟踪器和持续集成 (ci) 系统的深度集成。其长期目标是将实时配对和长期任务委派融合到无缝的开发体验中。

embiricos 指出,即使是产品经理也发现,在引入人类软件工程师 (swe) 之前,它有助于提出或验证变更。这种多功能性体现了 openai 构建工具以提升技术团队生产力的战略。

该项目的工程负责人trini 总结,codex背后的宏伟愿景是:“将彻底改变软件工程师与人工智能和计算机交互的方式。它能够放大每个人的潜力。”

除了codex openai可能还收购热门ai编码工具

openai上线codex的时机引人注目。ai编码工具正成为增长最快的技术领域之一。谷歌和微软的ceo各自表示,两家公司约30%的代码现在都是由ai编写。

最近媒体称,openai正在磋商,可能进行约30亿美元收购ai编码初创公司windsurf的交易。而就在codex发布前一天,windsurf推出了自己的编码基础模型系列swe-1。

还有媒体称,除了可能收购windsurf,openai之前还商谈过收购另一款快速增长的ai开发工具cursor,不过cursor一方据称已退出谈判。

媒体称,作为最受欢迎的ai编码工具之一,cursor今年4月达到了约3亿美元的年化收入。本月初,有媒体获悉,cursor的开发机构anysphere在进行新一轮融资,融资规模已达9亿美元,公司估值90亿美元。

similarweb数据显示,过去12周,面向开发者的ai工具流量增长了75%,这表明对编码助手的需求正在迅速增长。

对投资者而言,ai编程领域出现重大机遇,不仅因为像cursor这样的工具已经实现了可观收入,还因为这些工具正在改变整个软件开发过程。技术公司正越来越依赖这些工具,这意味着投资于此领域的公司或提供相关服务的公司可能会看到持续增长。

本文来自华尔街见闻,欢迎下载app查看更多