首位「AI軟件工程師」亮相後爆火,系華人團隊初創公司研發

2024年03月30日17:22:21 科技 5649

全球首位「ai軟件工程師」誕生了。一家成立不到兩個月但擁有十名天才工程師的初創公司cognition,引爆了科技圈。

3月13日,ai初創公司cognition ai在社交平台發佈一條視頻,宣布了首位完全自主的ai軟件工程師的誕生。並表示,devin已經通過了一些「頂尖ai公司」的面試,甚至還在自由職業平台上完成了不少工作。

消息一出,推文瀏覽量很快衝上千萬級,引爆了整個科技圈,連帶着其背後剛剛成立兩個月的華人團隊,也一併衝上風口浪尖。

在演示視頻里,devin熟練地使用着shell、代碼編輯器和沙盒環境等開發工具,以驚人的速度(不到10秒)依照老闆需求寫好代碼,寫完之後自行debug,修復出現的錯誤,最終把寫好的代碼部署成功——從端到端地構建和部署應用程序,整個過程不過一分鐘。

大家都在追問:這位ai程序員能做什麼?他是如何誕生的?人類程序員是不是真要失業了?

首位「AI軟件工程師」亮相後爆火,系華人團隊初創公司研發 - 天天要聞

(cognition年輕團隊)

自主寫代碼,還能自我訓練

devin可以協助人類軟件工程師完成諸多開發任務。不同於現有其他ai編碼者,它可以從零構建網站、自行部署應用、修復漏洞、學習新技術等,人類只需扮演一個下指令和監督的角色。

據cognition官網介紹,devin只需一句指令,即可端到端地處理整個開發項目。

按照用戶需求,devin可以同時執行多步驟工作流程,人類工程師則可以實時觀察其進度,發現錯誤時,跳出指令進行修正。這便於工程師們將大部分工作「外包」給ai,自己則可以潛心於創意性工作。

在swe-bench基準測試中,devin的表現遠超claude 2、llama、gpt-4等選手,能夠完整正確地處理13.86%的問題。相較之下,gpt-4隻能處理1.74%的問題。更重要的是,devin在測試中沒有得到任何幫助,而其他所有模型都需要幫助,即人們要準確告知模型需要編輯哪些文件。

這一進展,標誌着ai在自主理解和解決軟件開發問題方面取得了顯著進步。目前,devin已經成功通過一家ai公司面試,並且在upwork上完成了實際工作。

devin的厲害之處,還在於可以規劃和執行異常複雜的工程任務,這類任務通常需要數千個決策才能完成。在這之中,無論進行到任何一步,它都可以回調所有相關的上下文信息,保證任務的邏輯性,也便於隨時校正。

更讓人震撼的是,devin不僅能幫人們解決代碼,還囊括了與之相關的整個工作流。

譬如,當工程師需要設計一個網頁遊戲時,devin首先能生成網頁,接着還能完成服務端的部署,最後直接發佈上線,省去了中間大量人工操作。甚至在發現漏洞之後,devin還會回溯報錯出現的位置及對應的數據,然後分析原因並給出解決方案。

年輕的華人創業團隊

cognition ai團隊的成就讓外界感到興奮,而令人驚訝的是,這個創立剛2個月的團隊僅有10人的規模,而且沒有固定的經營場地,成員分散在洛杉磯、舊金山、紐約等地。雖然他們的產品devin甚至還沒有公開發行,但已經贏得了獨具慧眼的投資人們認可,僅在a輪融資就籌集了2100萬美元,投資者中包含推特前高管埃拉德以及知名投資大佬彼得·蒂爾(與馬斯克聯合創辦過paypal)。

團隊成員共10人,華人面孔居多。全體成員共擁有10枚國際信息學奧林匹克競賽(ioi)金牌。

cognition ai團隊成員非常年輕共10人,華人面孔居多。全體成員共擁有10枚國際信息學奧林匹克競賽(ioi)金牌。擁有哈佛、斯坦福等名校背景和deepmind、meta等大廠工作經驗,很多成員在青少年時期也參加過信息學國際奧林匹克競賽等。

ceo斯科特·吳、首席技術官史蒂文·郝、工程師尼爾·吳(和斯科特是親兄弟)等主要成員均為華人。另一位華人「高管」、首席產品官瓦爾登·嚴的經歷更加神奇,他為了全身心投入創業甚至不惜從哈佛退學,為了暫時不讓父母感到失望,他還要求校方對其退學狀態進行保密。

斯科特·吳和他的兄弟尼爾·吳自青少年時期就開始參加並經常獲勝於國際編程比賽,曾連續三年攬獲ioi金牌,這些比賽提升了他們的編程能力。斯科特的背景和對算法問題的深入理解為 cognition ai 的開發提供了獨特的視角。

除了三位核心成員,其他成員自青少年時期起就在國際編碼比賽中競爭並常獲勝利,這些比賽經驗幫助他們在編程和解決問題方面擁有獨特的方法。

cognition ai在官方資料中還是「謙遜」地表示,devin的任務是幫助人類進行編程,讓程序員解決更難更有趣的問題,而不是要取代程序員的飯碗。儘管如此,媒體還是打出了這樣的標題,「為什麼一群編程天才會設計出取代自己工作的東西?」

九派新聞記者 龔凌蔚

(部門信息來源中新網、紅星新聞)

【來源:九派新聞】

版權歸原作者所有,向原創致敬

科技分類資訊推薦

OpenAI控訴微軟反競爭行為 科技巨頭合作現裂痕 - 天天要聞

OpenAI控訴微軟反競爭行為 科技巨頭合作現裂痕

科技界最受矚目的「聯姻」正面臨嚴峻考驗。微軟與OpenAI這對曾被視作天作之合的AI黃金搭檔,如今關係緊張到可能重塑整個人工智能產業格局。這場風波始於OpenAI宣布從非營利組織轉型為營利公司的計劃。本該是常規的商業決策,卻因微軟對OpenAI未來擁有重大話語權而演變成複雜對峙。資金鏈背後的控制權博弈OpenAI亟需微軟批准...
618存量之戰:電商平台重新定義「增長」 - 天天要聞

618存量之戰:電商平台重新定義「增長」

當618走到第17個年頭,這一曾經被電商平台及大小商家寄予厚望的「消費狂歡節」,正在趨於平靜。跟去年相比提前了近一周,前後跨度超過一個月,這一承載着中國電商產業高速增長記憶的促銷節點,隨着消費市場的變化,正在悄然轉型。
華為鴻蒙 HarmonyOS NEXT 系統新版實況窗通用膠囊模板發佈 - 天天要聞

華為鴻蒙 HarmonyOS NEXT 系統新版實況窗通用膠囊模板發佈

IT之家 6 月 19 日消息,在 6 月 11 日舉行的華為 Pura 80 系列及全場景新品發佈會上,華為全新實況窗正式亮相,號稱「無需打開應用狀態一眼便知」。IT之家注意到,華為開發者聯盟官網現發佈了新版實況窗通用膠囊模板。據介紹,新版實況窗擁有三種設備樣式,將在挖孔居中的設備上進行軟硬結合的顯示,與狀態欄固定元素(時...
【關注】三級醫院評審標準深度迭代1:2025版精簡架構與效能升級 - 天天要聞

【關注】三級醫院評審標準深度迭代1:2025版精簡架構與效能升級

摘要:《三級醫院評審標準(2025 年版)》相較 2022 年版實現大幅精簡與效能升級。結構上,從三大部分、107 節、364 條、24247 字精簡為兩大部分、97 節、232 條、9370 字,精簡幅度超 63%,並刪除 「現場檢查」 獨立章節,轉向常態監測與內涵建設。標準說明部分定位更精準,劃分為修訂與使用說明板塊,內容更詳實;前置要...
機械人怎麼變成了「果農」?|新質生產力調研 - 天天要聞

機械人怎麼變成了「果農」?|新質生產力調研

編者按:發展「新質生產力」正成為我國推動高質量發展的內在要求和重要着力點。2024年2月29日,中共中央政治局會議指出,要大力推進現代化產業體系建設,加快發展新質生產力。為調研新質生產力的發展成果,財聯社、《科創板日報》聯合推出「新質生產力專題調研」。本次,新質生產力專題調研團走進中國聯通重慶市分公司,實...
全閃存NAS遇上飛牛系統:零刻 ME mini 主機是否有驚喜呢? - 天天要聞

全閃存NAS遇上飛牛系統:零刻 ME mini 主機是否有驚喜呢?

作為一名數碼極客玩家來講,全閃存NAS我也嘗試過好幾台了。自己也深知全閃存NAS就是一小撮極客玩家才會嘗試的產品,但是這樣的產品也確實給我帶來了不少的樂趣,出色的硬件性能以及低功耗高性能的特點都不斷吸引我去嘗試。正好我也拿到了零刻ME mi
廣西首台工業版人形機械人在柳州下線,將進入車企開展實訓 - 天天要聞

廣西首台工業版人形機械人在柳州下線,將進入車企開展實訓

IT之家 6 月 18 日消息,綜合央視新聞、柳州日報報道,廣西首台工業版人形機械人 6 月 18 日在柳州下線,填補了廣西在高端機械人核心部件及整機製造領域的空白。這台機械人是來自柳州優必選智能科技有限公司的 Walker S1,此次共下線 20 台。與傳統機械臂相比,工業版人形機械人憑藉其類人形態、靈活關節及強大的智能決策能...
華為汪濤:解鎖5G-A潛能,共贏移動AI時代 - 天天要聞

華為汪濤:解鎖5G-A潛能,共贏移動AI時代

潮新聞客戶端 記者 張雲山 在2025 MWC 上海期間舉辦的全球移動寬帶菁英論壇上,華為常務董事汪濤發表了「共贏移動AI時代:解鎖5G-A潛能,釋放商業價值」主題演講。他表示,移動AI時....