剛剛,稚暉君旗下創企智元機器人官宣了兩個新動向——
一則是關於人事變動。
具身智能領域的國際領軍學者羅劍嵐博士,已於近日加盟並出任首席科學家。
羅劍嵐在該領域已深耕10年,曾擔任google x、google deepmind研究科學家,是uc伯克利17萬引大佬sergey levine團隊的核心成員。
他曾參與打造世界上首個超人類的機器人真機強化學習系統serl/hil-serl——首次實現將任務成功率提升到100%,在全球範圍內被廣泛應用。
接下來他將牽頭組建「智元具身智能研究中心」,主導前沿演算法研發與工程化落地。
另一則是關於公司新合作。
國際頂尖具身智能公司physical intelligence(pi)正式和智元機器人達成合作夥伴關係,雙方將圍繞動態環境下的長周期複雜任務,在具身智能領域展開深度技術合作。
以及實屬罕見的是,在競逐ai、機器人以及軟硬體的最前沿陣地,中美兩家明星公司,竟然聯手了。
稚暉君挖來具身智能領域大佬
羅劍嵐,出生於1993年,本科畢業於武漢理工大學汽車學院。其後在ai和機器人重鎮uc伯克利,拿到了博士學位。
從2015年開始,也是在機器人學習領域初步興起的階段,他就投身了機器人研究當中。
過程中,他逐漸將目光放在了將強化學習應用到真實機器人這一細分領域。
在積攢了一波學術經驗後,2020年他毅然選擇踏入工業界,進入谷歌多個機器人部門任職,包括google x、deepmind等。
在此期間,他與機器人學習領域的泰斗stefan schaal教授進行了一系列合作,主要學習了更多從底層動力學到上層控制的機器人系統知識。
值得一提的是,stefan schaal教授是uc伯克利機器人領域的領軍專家,曾多次與李飛飛共同發表論文。
兩年時間,當他所參與的項目被孵化為工業機器人創企intrinsic後,他重新回到了伯克利從事博士後研究,師從 sergey levine。
sergey levine是uc伯克利電氣工程和計算機科學系的副教授,專註於能夠使autonomous agents通過學習獲得複雜行為的演算法,特別是能夠使任何自主系統學習解決任何任務的通用方法。
sergey levine因兩件事而聲名遠播。
一是他是領域內的大神,不僅谷歌學術被引用量為超過12.7萬,還是不折不扣的頂會狂魔。
此前的不完全統計中,sergey levine 2018年在ml和nlp頂會上共發表22篇論文;icml 2019,他參與論文數量排名第三;neurips 2019、neurips 2020,他均有12篇論文被接收……
其二,他屬於uc伯克利的網紅教授,此前推出的深度學習課程deep reinforcement learning(課程代號cs 285)非常受歡迎。
回到羅劍嵐,正是在回歸學術界的這一時間,他參與產出了「強化學習+真機」這條路線上具有代表性的兩篇論文:serl和hii serl。
serl/hil-serl作為世界上首個超人類的機器人真機強化學習系統,首次實現將任務成功率提升到100%, 在全球範圍內被廣泛應用。
具體而言,在serl這項研究中,機器人能用20分鐘學會裝配電路板,成功率達到了100%。
這一結果真實驗證了強化學習的有效性,而在這之前,該方法一直受到行業詬病。
至於hil-serl,則是基於serl的升級版。不過與serl僅依賴人類的示範不同,hil-serl還結合了人類的糾正來訓練強化學習策略。
實驗結果顯示,使用強化學習框架hil-serl,研究者可以直接在現實世界中訓練基於視覺的通用機器人操作策略。
其中,機器人經過1~2.5小時的訓練後,就能完成主板、儀錶盤以及正時皮帶組裝等操作任務。
更重要的是,成功率也是100%。
手握上述重要機器人學習技術,羅劍嵐博士這次又選擇加入智元投身工業落地。
中美明星具身智能公司,罕見聯手
與此同時,智元機器人這次也選擇了和一家國外同行開展合作。
physical intelligence,去年3月官宣亮相的美國明星創業公司,其團隊全是一群機器人和ai大佬,聯合創始人就有羅劍嵐博士後研究期間的導師sergey levine。
據了解,這家公司在去年11月完成了4億美元的a輪融資,融資後估值為20億美元,主要投資者包括亞馬遜創始人貝索斯、openai、thrive capital等知名公司或投資機構。
關於智元為什麼會選擇這家公司合作的原因,可能還要從physical intelligence所推出的產品或技術來追蹤。
就在今年2月底,這家公司推出了「分層互動式機器人」(hi robot)系統,它能夠將視覺-語言-行動(vla)模型,如π0 ,納入一個分層推理過程。
劃重點,分層推理。
面對「如何讓機器人能像人類一樣執行複雜任務」這個行業難題,physical intelligence早已明確給出答案:
讓機器人學會以系統 2思維進行思考
合理推測,未來兩家可能會在讓機器人學會推理方面展開深度合作。
另外,據智元介紹,雙方的合作已經初有成效,可以實現一個通用模型根據不同的指令輸入執行多個任務。
同時也可以適配多種末端執行器,包括靈巧手、平行夾爪和旋轉夾爪,併兼容魚眼和針孔相機等多種感測器。
從演示demo可以看到,視頻中的智元機器人能完成在鏡子前戴上圍巾、換垃圾袋,將物品從傳送帶移入物流箱等覆蓋家庭和工業場景的多元複雜任務。
整體而言,對行業來說,兩家明星具身智能公司的強強聯合,不僅蘊藏了大模型推理技術在機器人領域的垂直應用趨勢,而且還將進一步加速機器人真實落地家用場景。
one more thing
當然,對於智元今日的人才大新聞,背後還有一段傳奇佳話。
本科畢業於武漢理工的羅劍嵐,實際也上演了一段「爽文男主」人生。
因為從中國一所211大學本科,能夠拿到uc伯克利競爭激烈的王牌專業offer,並且碩博連讀,每年5萬美元獎學金!羅劍嵐的故事堪稱傳奇,甚至被專門報道過。
據《長江日報》2015年報道稱,當年uc伯克利的機器人方向博士生競爭非常激烈,收到了全球1500份申請,而招生名額僅有30個,最後羅劍嵐成功脫穎而出,還打破了紀錄——成為唯一一位被機器人和智能機器實驗室錄取的中國人。
在採訪中,羅劍嵐坦承自己因為在科研項目中關注到uc伯克利分校卡澤洛尼教授領銜的實驗,其後有緣又在天津舉辦的機器人研究國際會議上,獲得了直接向卡澤洛尼教授發問的機會,並進一步在會後遞上了自己的簡歷,向教授明確表達:「我想讀您的研究生!」
卡澤洛尼也被年輕本科生的履歷吸引。據介紹,羅劍嵐從大二開始就跟著武漢理工大學的導師田哲文做項目,發表了4篇核心期刊論文,參加全國和省級重大科研項目有5個,還獲得了美國數學建模比賽一等獎。
卡澤洛尼教授給他的回答是:「或許我能有機會讓你到伯克利來。」
也正是這句認可,點燃了羅劍嵐心底的火苗。
回到武漢後,他又花了大半年時間,利用別人打遊戲的時間,啃下了卡澤洛尼教授實驗室發表的100多萬字的學術資料。
其後2014年8月,羅劍嵐更是上演了一段「孤身飛赴韓國追教授」的瘋狂。
他查到卡澤洛尼教授將赴韓國參加一場有關機器人的國際會議,隨即辦好籤證就追了過去。並在貴賓室外,等到了卡澤洛尼教授如廁的機會,再次表達了希望跟隨讀研讀博的想法。
卡澤洛尼記得羅劍嵐:哦,你住在首爾?
羅劍嵐回答:不!我住在中國武漢,我來這裡見您,就是希望讀您的研究生!
而且也是在這次會議上,羅劍嵐的半年苦功也換來了回報,他獲得提問機會,把幾個月來的思考化成幾個刁鑽的問題拋給了教授,卡澤洛尼會後再次找到他給出認可:「小夥子,不出意外,我想,我要把你帶到伯克利。」
於是回國後,羅劍嵐繼續與卡澤洛尼教授聯繫,並附上自己的思考,通過電子郵件給對方發了過去。卡澤洛尼教授告訴他:你寫的每篇綜述我都看了七八遍,我不敢相信這是一位來自中國的本科生所寫。
而也是在卡澤洛尼教授力薦下,羅劍嵐在2015年夏天收到了加州大學伯克利分校的offer。
機器人和智能機器實驗室,每年5萬美元獎學金,從全球1500份簡歷中脫穎而出,成為了當年唯一一位被該頂級實驗室錄取的中國人。