首位“AI软件工程师”亮相后爆火,系华人团队初创公司研发

2024年03月30日17:22:21 科技 5649

全球首位“ai软件工程师”诞生了。一家成立不到两个月但拥有十名天才工程师的初创公司cognition,引爆了科技圈。

3月13日,ai初创公司cognition ai在社交平台发布一条视频,宣布了首位完全自主的ai软件工程师的诞生。并表示,devin已经通过了一些“顶尖ai公司”的面试,甚至还在自由职业平台上完成了不少工作。

消息一出,推文浏览量很快冲上千万级,引爆了整个科技圈,连带着其背后刚刚成立两个月的华人团队,也一并冲上风口浪尖。

在演示视频里,devin熟练地使用着shell、代码编辑器和沙盒环境等开发工具,以惊人的速度(不到10秒)依照老板需求写好代码,写完之后自行debug,修复出现的错误,最终把写好的代码部署成功——从端到端地构建和部署应用程序,整个过程不过一分钟。

大家都在追问:这位ai程序员能做什么?他是如何诞生的?人类程序员是不是真要失业了?

首位“AI软件工程师”亮相后爆火,系华人团队初创公司研发 - 天天要闻

(cognition年轻团队)

自主写代码,还能自我训练

devin可以协助人类软件工程师完成诸多开发任务。不同于现有其他ai编码者,它可以从零构建网站、自行部署应用、修复漏洞、学习新技术等,人类只需扮演一个下指令和监督的角色。

据cognition官网介绍,devin只需一句指令,即可端到端地处理整个开发项目。

按照用户需求,devin可以同时执行多步骤工作流程,人类工程师则可以实时观察其进度,发现错误时,跳出指令进行修正。这便于工程师们将大部分工作“外包”给ai,自己则可以潜心于创意性工作。

在swe-bench基准测试中,devin的表现远超claude 2、llama、gpt-4等选手,能够完整正确地处理13.86%的问题。相较之下,gpt-4只能处理1.74%的问题。更重要的是,devin在测试中没有得到任何帮助,而其他所有模型都需要帮助,即人们要准确告知模型需要编辑哪些文件。

这一进展,标志着ai在自主理解和解决软件开发问题方面取得了显著进步。目前,devin已经成功通过一家ai公司面试,并且在upwork上完成了实际工作。

devin的厉害之处,还在于可以规划和执行异常复杂的工程任务,这类任务通常需要数千个决策才能完成。在这之中,无论进行到任何一步,它都可以回调所有相关的上下文信息,保证任务的逻辑性,也便于随时校正。

更让人震撼的是,devin不仅能帮人们解决代码,还囊括了与之相关的整个工作流。

譬如,当工程师需要设计一个网页游戏时,devin首先能生成网页,接着还能完成服务端的部署,最后直接发布上线,省去了中间大量人工操作。甚至在发现漏洞之后,devin还会回溯报错出现的位置及对应的数据,然后分析原因并给出解决方案。

年轻的华人创业团队

cognition ai团队的成就让外界感到兴奋,而令人惊讶的是,这个创立刚2个月的团队仅有10人的规模,而且没有固定的经营场地,成员分散在洛杉矶、旧金山、纽约等地。虽然他们的产品devin甚至还没有公开发行,但已经赢得了独具慧眼的投资人们认可,仅在a轮融资就筹集了2100万美元,投资者中包含推特前高管埃拉德以及知名投资大佬彼得·蒂尔(与马斯克联合创办过paypal)。

团队成员共10人,华人面孔居多。全体成员共拥有10枚国际信息学奥林匹克竞赛(ioi)金牌。

cognition ai团队成员非常年轻共10人,华人面孔居多。全体成员共拥有10枚国际信息学奥林匹克竞赛(ioi)金牌。拥有哈佛、斯坦福等名校背景和deepmind、meta等大厂工作经验,很多成员在青少年时期也参加过信息学国际奥林匹克竞赛等。

ceo斯科特·吴、首席技术官史蒂文·郝、工程师尼尔·吴(和斯科特是亲兄弟)等主要成员均为华人。另一位华人“高管”、首席产品官瓦尔登·严的经历更加神奇,他为了全身心投入创业甚至不惜从哈佛退学,为了暂时不让父母感到失望,他还要求校方对其退学状态进行保密。

斯科特·吴和他的兄弟尼尔·吴自青少年时期就开始参加并经常获胜于国际编程比赛,曾连续三年揽获ioi金牌,这些比赛提升了他们的编程能力。斯科特的背景和对算法问题的深入理解为 cognition ai 的开发提供了独特的视角。

除了三位核心成员,其他成员自青少年时期起就在国际编码比赛中竞争并常获胜利,这些比赛经验帮助他们在编程和解决问题方面拥有独特的方法。

cognition ai在官方资料中还是“谦逊”地表示,devin的任务是帮助人类进行编程,让程序员解决更难更有趣的问题,而不是要取代程序员的饭碗。尽管如此,媒体还是打出了这样的标题,“为什么一群编程天才会设计出取代自己工作的东西?”

九派新闻记者 龚凌蔚

(部门信息来源中新网、红星新闻)

【来源:九派新闻】

版权归原作者所有,向原创致敬

科技分类资讯推荐

快递服务质效持续提升 - 天天要闻

快递服务质效持续提升

工人在河北省固安县申通快递华北转运中心工作。 新华社记者 王 晓摄国家邮政局数据显示,今年1月至5月,我国快递业务量累计完成787.7亿件,同比增长20.1%。市场规模实现较快增长的同时,快递服务质效也持续提升。眼下,正值荔枝、水蜜桃等时令鲜果上市,快递企业综合发力提升时效。在广东省茂名市荔枝主产区,中通快递设置...
OpenAI控诉微软反竞争行为 科技巨头合作现裂痕 - 天天要闻

OpenAI控诉微软反竞争行为 科技巨头合作现裂痕

科技界最受瞩目的“联姻”正面临严峻考验。微软与OpenAI这对曾被视作天作之合的AI黄金搭档,如今关系紧张到可能重塑整个人工智能产业格局。这场风波始于OpenAI宣布从非营利组织转型为营利公司的计划。本该是常规的商业决策,却因微软对OpenAI未来拥有重大话语权而演变成复杂对峙。资金链背后的控制权博弈OpenAI亟需微软批准...
618存量之战:电商平台重新定义“增长” - 天天要闻

618存量之战:电商平台重新定义“增长”

当618走到第17个年头,这一曾经被电商平台及大小商家寄予厚望的“消费狂欢节”,正在趋于平静。跟去年相比提前了近一周,前后跨度超过一个月,这一承载着中国电商产业高速增长记忆的促销节点,随着消费市场的变化,正在悄然转型。
华为鸿蒙 HarmonyOS NEXT 系统新版实况窗通用胶囊模板发布 - 天天要闻

华为鸿蒙 HarmonyOS NEXT 系统新版实况窗通用胶囊模板发布

IT之家 6 月 19 日消息,在 6 月 11 日举行的华为 Pura 80 系列及全场景新品发布会上,华为全新实况窗正式亮相,号称“无需打开应用状态一眼便知”。IT之家注意到,华为开发者联盟官网现发布了新版实况窗通用胶囊模板。据介绍,新版实况窗拥有三种设备样式,将在挖孔居中的设备上进行软硬结合的显示,与状态栏固定元素(时...
【关注】三级医院评审标准深度迭代1:2025版精简架构与效能升级 - 天天要闻

【关注】三级医院评审标准深度迭代1:2025版精简架构与效能升级

摘要:《三级医院评审标准(2025 年版)》相较 2022 年版实现大幅精简与效能升级。结构上,从三大部分、107 节、364 条、24247 字精简为两大部分、97 节、232 条、9370 字,精简幅度超 63%,并删除 “现场检查” 独立章节,转向常态监测与内涵建设。标准说明部分定位更精准,划分为修订与使用说明板块,内容更详实;前置要...
机器人怎么变成了“果农”?|新质生产力调研 - 天天要闻

机器人怎么变成了“果农”?|新质生产力调研

编者按:发展“新质生产力”正成为我国推动高质量发展的内在要求和重要着力点。2024年2月29日,中共中央政治局会议指出,要大力推进现代化产业体系建设,加快发展新质生产力。为调研新质生产力的发展成果,财联社、《科创板日报》联合推出“新质生产力专题调研”。本次,新质生产力专题调研团走进中国联通重庆市分公司,实...
全闪存NAS遇上飞牛系统:零刻 ME mini 主机是否有惊喜呢? - 天天要闻

全闪存NAS遇上飞牛系统:零刻 ME mini 主机是否有惊喜呢?

作为一名数码极客玩家来讲,全闪存NAS我也尝试过好几台了。自己也深知全闪存NAS就是一小撮极客玩家才会尝试的产品,但是这样的产品也确实给我带来了不少的乐趣,出色的硬件性能以及低功耗高性能的特点都不断吸引我去尝试。正好我也拿到了零刻ME mi