過去兩周,ai 行業最出圈的不是哪個產品,而是人。經常一覺醒來,社交媒體的時間線都在刷新換湯不換藥的新聞:又雙叒叕有哪位 ai 大牛被挖走了。
頂級 ai 人才,正成為 ai 賽道上最稀缺、也最具品牌效應的資產。
在這輪人才流動的風暴中心中,我們發現一個格外顯眼的細節:這群主導過 chatgpt、gemini、claude 等大模型研發的核心成員中,華人科學家的比例出奇地高。
這個變化並不是突然出現的,這幾年興起的 ai 浪潮中,美國的頂級 ai 人才中華人佔比不斷升高。 根據 macropolo 發布的《全球人工智能人才追蹤調查報告 2.0》,來自中國的頂尖 ai 研究人員佔比在 2019 年到 2022 年間,從 29% 提升到了 47%。
而在智譜研究此前發布的《chatgpt 團隊背景研究報告》,更是發現在 chatgpt 核心的 87 人團隊中,有 9 人都是華人,佔比超過 10%。
因此,我們也重新梳理了近期在硅谷頭部公司中廣受關注的華人 ai 研究員畫像,並試圖從中總結出一些特徵:
1️⃣ 頂尖名校出身,學術能力極強
他們大多本科就讀於清華、北大、中科大、浙大等頂尖高校,計算機或數學背景居多;研究生階段普遍進入 mit、斯坦福、伯克利、普林斯頓、uiuc 等名校深造,幾乎每人都有頂會高引論文傍身(neurips、iclr、siggraph 等)。
2️⃣ 年輕高產,爆發周期集中於 2020 年之後
年齡多在 30~35 歲;碩博階段恰逢深度學習的全球爆發期,學術基礎紮實,熟悉工程體系和團隊協作。不少人職業的第一站就是接觸大廠或服務大規模人群的 ai 產品或平台,起點更高、節奏更快。
3️⃣ 強多模態背景,攻堅模型後訓練
他們的研究方向普遍着重於跨模態(文本、語音、圖像、視頻、動作)的統一推理系統,包括 rlhf、蒸餾、對齊、人類偏好建模、語音語調評估等具體細節。
4️⃣ 即便頻繁流動,但基本不會脫離生態
google、meta、微軟、英偉達,anthropic、openai……他們的流動範圍橫跨 ai 初創與大廠巨頭,但研究主題、技術積累往往保持連貫性,基本不會更換賽道。
openai→meta
shuchao bi

shuchao bi 本科畢業於浙江大學數學系,後赴加州大學伯克利分校深造,先後獲得統計學碩士學位,並攻讀數學博士。
2013 - 2019 年,他在 google 擔任技術負責人,主要貢獻包括構建多階段深度學習推薦系統,顯著提升 google 廣告收益(數十億美元級別)。
2019 - 2024 年,他擔任 youtube shorts 探索負責人,期間,聯合創建並主導 shorts 視頻推薦與發現系統,並 組建並擴展大規模機器學習團隊,覆蓋推薦系統、評分模型、互動發現、信任與安全等方向。
2024 年加入 openai 後,他主要領導多模態後訓練組織,是 gpt-4o 語音模式與 o4-mini 的聯合創造者。
期間,他主要推進 rlhf、圖像/語音/視頻/文本推理、多模態智能體、多模態語音到語音(vs2s)、vla、跨模態評估系統等,也涉及多模態鏈式推理、語音語調/自然度評分、多模態蒸餾與自監督優化,其核心目標是通過後訓練構建更通用的多模態 ai agent。
huiwen chang

2013 年,huiwen chang 本科畢業於清華大學計算機系(姚班),後赴美國普林斯頓大學攻讀計算機科學博士,研究方向聚焦於圖像風格遷移、生成模型和圖像處理,曾獲微軟研究院獎學金。

在加入 openai 之前,她在 google 擔任高級研究科學家,累計工作超過六年,長期從事生成模型與計算機視覺研究,曾在 google research 發明 maskgit 和 muse 文本生成圖像架構。
早期的文本生成圖像主要依賴擴散模型(如 dall·e 2、imagen),這些模型雖然生成質量高,但推理速度慢、訓練開銷大。而 maskgit 和 muse 則採用了「離散化 + 並行生成」 的方式,大幅提升了效率。

maskgit 是非自回歸圖像生成的新起點,muse 則是將這一方法推向文本圖像生成的代表作。它們不像 stable diffusion 那樣廣為人知,但在學術與工程體系中,是非常重要的技術基石。

此外,她也是擴散模型頂級論文《palette: image-to-image diffusion models》的聯合作者之一。
這篇論文發表於 siggraph 2022,提出了一種統一的圖像到圖像翻譯框架,並在圖像修復、着色、補全等多個任務上超過 gan 和回歸基線,至今已被引用超過 1700 次,成為該領域的代表性成果之一。
2023 年 6 月起,她加入 openai 多模態團隊,聯合開發了 gpt-4o 圖像生成功能,繼續推動圖像生成、多模態建模等前沿方向的研究與落地。

ji lin

ji lin 主要從事多模態學習、推理系統與合成數據方向的研究。他是多個核心模型的貢獻者,包括 gpt-4o、gpt-4.1、gpt-4.5、o3/o4-mini、operator、以及 4o 圖像生成模型等。

他本科畢業於清華大學電子工程專業(2014–2018),從麻省理工學院獲得電子工程與計算機科學博士學位,導師為知名學者 prof. song han。
博士階段,他的研究方向聚焦於模型壓縮、量化、視覺語言模型、稀疏推理等關鍵方向。
在 2023 年加入 openai 之前,他曾在英偉達、adobe 和 google 擔任實習研究員,並在 mit 長期從事神經網絡壓縮與推理加速相關研究,積累了深厚的理論基礎與工程實踐經驗。

學術方面,他在模型壓縮、量化和多模態預訓練等方向有多篇高影響力論文,google 學術總引用數超過 17800,代表成果包括視頻理解模型 tsm、硬件感知量化方法 awq、smoothquant 以及視覺語言模型 vila。
他也是 gpt-4o 系統技術文檔的核心作者之一(比如 gpt-4o 系統卡),並憑藉 awq 論文獲得 mlsys 2024 最佳論文獎。
hongyu ren
hongyu ren 本科在北京大學獲得計算機科學與技術學士(2014–2018)學位,隨後在斯坦福大學獲得計算機科學博士(2018–2023)學位。

他曾獲得蘋果、百度以及軟銀 masason 基金會 phd fellowship 等多項獎學金,研究方向聚焦於大語言模型、知識圖譜推理、多模態智能與基礎模型評估。
在加入 openai 之前,他曾在 google、微軟以及英偉達有過多段實習經歷,比如 2021 年在蘋果擔任實習研究員期間,參與 siri 問答系統的搭建。

2023 年 7 月加入 openai 後,hongyu ren 參與構建了 gpt-4o、4o-mini、o1-mini、o3-mini、o3 和 o4-mini 等多個核心模型,並領導後訓練團隊。
用他的話來說:「i teach models to think faster, harder and sharper.(我教模型思考得更快、更努力、更敏銳。)」
學術領域,他的 google 學術總引用數超過 17742 次,高被引論文包括:《on the opportunities and risks of foundation models》(引用 6127 次);《open graph benchmark》(ogb)數據集(引用 3524 次)等。
jiahui yu
jiahui yu 本科畢業於中國科學技術大學少年班,獲得計算機科學學士學位,隨後在伊利諾伊大學香檳分校(uiuc)獲得計算機科學博士學位。
他的研究重點包括深度學習、圖像生成、大模型架構、多模態推理和高性能計算。

在 openai 任職期間,jiahui yu 擔任感知團隊負責人,主導開發 gpt-4o 圖像生成模塊、gpt-4.1、o3/o4-mini 等重要項目,提出並落地了「thinking with images」感知體系。
在此之前,他曾在 google deepmind 工作近四年,期間是 palm-2 架構與建模的核心貢獻者之一,並共同領導了 gemini 多模態模型的開發,是 google 多模態戰略中最重要的技術骨幹之一。

他還擁有在英偉達、adobe、百度、snap、曠視和微軟亞洲研究院等多家機構的實習經歷,研究內容涵蓋 gan、目標檢測、自動駕駛、模型壓縮、圖像修復與大規模深度學習訓練系統等多個方向。
jiahui 在 google 學術上總引用次數超過 34500 次,h 指數達 49,代表性研究成果包括圖文對齊基礎模型 coca、文本生成圖像模型 parti、神經網絡可伸縮設計 bignas,以及廣泛應用於 adobe photoshop 的圖像修復技術 deepfill v1 和 v2 等。
shengjia zhao

shengjia zhao 本科畢業於清華大學計算機系,曾在美國萊斯大學交換,後於斯坦福大學獲得計算機科學博士學位,專註於大模型架構、多模態推理和對齊方向的研究。
2022 年,他加入 openai,擔任核心研發成員,深度參與 gpt-4 和 gpt-4o 的系統設計工作。曾主導 chatgpt、gpt-4、所有 mini 模型、4.1 和 o3 的研發工作,還曾領導 openai 合成數據團隊。
他是《gpt-4 technical report》(被引超過 1.5 萬次)和《gpt-4o system card》(被引超過 1300 次)的聯合作者,並參與了多個系統卡(如 openai o1)的撰寫,是推動 openai 基礎模型標準化與公開化的重要貢獻者之一。

在學術表現上,他 google 學術總引用數超過 21,000 次,h 指數為 25,曾獲得過 iclr 2022 outstanding paper award、jp morgan phd fellow、qualcomm 創新獎學金(qinf)與 google excellence scholarship 等多項獎項。
google→meta
pei sun
2009 年,pei sun 在清華大學獲得學士學位,隨後前往卡內基梅隆大學攻讀碩士和博士學位,順利完成碩士階段學習,並在博士階段選擇退學。
他曾在 google deepmind 擔任首席研究員,期間主攻 gemini 模型的後訓練、編程和推理工作,是 gemini 系列模型(包括 gemini 1、1.5、2 和 2.5)後訓練、思維機制構建與代碼實現的核心貢獻者之一。

在加入 deepmind 之前,pei 曾在 waymo 任職近七年,擔任高級研究科學家,主導了 waymo 兩代核心感知模型的研發,是自動駕駛感知系統演進的中堅力量。
更早些時候,他曾在 google 擔任軟件工程師五年多,後又加入分布式存儲公司 alluxio 任職工程師超過一年,參與系統架構研發。

nexusflow→英偉達
banghua zhu
banghua zhu 本科畢業於清華大學電子工程系,後赴美國加州大學伯克利分校攻讀電氣工程與計算機科學博士,師從著名學者 michael i. jordan 和 jiantao jiao。

他的研究聚焦於提高基礎模型的效率與安全性,融合統計方法與機器學習理論,致力於構建開源數據集和可公開訪問的工具。他的興趣方向還包括博弈論、強化學習、人機交互以及機器學習系統設計。

他代表性論文《chatbot arena》提出了人類偏好驅動的大模型評測平台,成為 llm 領域的重要基準之一。
此外,他還在 rlhf、人類反饋對齊、開源對齊模型等方向有所貢獻。其 google 學術顯示引用總數超過 3100,h 指數為 23,也是大模型競技場「chatbot arena」、「benchbuilder」、「starling」等多個熱門開源項目的核心作者之一。

他曾在 microsoft 擔任研究實習生,在 google 擔任學生研究員,曾聯合創立 ai 初創公司 nexusflow,今年 6 月,他宣布加入英偉達 star nemotron 團隊擔任首席研究科學家,此外將於今年秋季入職華盛頓大學的助理教授。
根據其發布內容,他將在英偉達參與模型後訓練、評估、ai 基礎設施和智能代理構建等項目,強調與開發者及學術界的深度協作,並計劃將相關成果開源。
jiantao jiao
jiantao jiao 是加州大學伯克利分校電氣工程與計算機科學系以及統計系的助理教授。
他於 2018 年獲得斯坦福大學電氣工程博士學位,目前是多個研究中心的聯合負責人或成員,包括伯克利理論學習中心(climb)、人工智能研究中心(bair lab)、信息與系統科學實驗室(bliss)以及去中心化智能研究中心(rdi)。

他的研究集中於生成式 ai 與基礎模型,對統計機器學習、強化學習系統的隱私與安全、經濟機制設計以及自然語言處理、代碼生成、計算機視覺、自動駕駛與機器人等方向也頗有興趣。
和 banghua zhu 一樣,他也是 nexusflow 聯合創始人之一,目前已經正式加入英偉達,擔任研究總監兼傑出科學家。
jiao 的總引用次數達 7259,h 指數為 34,代表性論文包括《theoretically principled trade-off between robustness and accuracy》,以及與 banghua zhu 等人合作的《bridging offline reinforcement learning and imitation learning: a tale of pessimism》,均發表在 neurips 等頂會。

claude→cursor
catherine wu
catherine wu 曾在 anthropic 擔任 claude code 的產品經理,專註於構建可靠、可解釋、可操控的 ai 系統。據 the information 報道,catherine wu 已被 ai 編程初創公司 cursor 挖角,出任產品負責人一職。

在加入 anthropic 之前,她曾是知名風投公司 index ventures 的合伙人,任職近三年,期間深度參與多家頂尖創業公司的早期投資與戰略支持。

她曾在 dagster labs 擔任工程經理,主導公司首個商業化產品的研發,也曾在 scale ai 擔任早期產品工程師,參與多個關鍵產品的構建與運營擴張。
更早之前,她在摩根大通實習,並於普林斯頓大學獲得計算機科學學士學位,在校期間還曾赴蘇黎世聯邦理工學院進行交換學習。
特斯拉 | phil duan
段鵬飛(phil duan)是特斯拉 ai 的首席軟件工程師,現負責 autopilot 下的 fleet learning 團隊,致力於推動特斯拉自動駕駛系統(fsd)中「數據 + 感知」核心模塊的建設。

他帶領特斯拉團隊開發高吞吐、快迭代的數據引擎,從數百萬輛汽車中採集、處理並自動標註駕駛數據,強調數據質量、數量與多樣性的協同優化。
在感知方向,他主導構建多項關鍵神經網絡,包括視覺基礎模型、目標檢測、行為預測、佔據網絡、交通控制和高精度泊車輔助系統等,是 autopilot 感知系統的核心構建者之一。
他本科畢業於武漢理工大學,主修光信息科學與技術,隨後攻讀俄亥俄大學電氣工程博士與碩士學位,研究方向為航空電子,並以博士論文榮獲 2019 年 rtca william e. jackson award,該獎項是美國航空電子與電信領域授予研究生的最高榮譽之一。