孫劍 計算機科學家,一個幫助計算機「看」懂世界的人,原曠視研究院院長。2022 年 6 月 14 日突發疾病離世,享年 45 歲。
文丨姚胤米 賀乾明 程曼祺
編輯丨姚胤米
「計算機領域有點像是沉積的岩石,你貢獻薄薄的一層,使山變得更加高聳。但最終,人們只是站在山頂,只有帶著 X 光才能看到裡面是什麼樣子。」——喬布斯
自從計算機成為一門科學以來,人們對於互聯網技術將如何改寫我們族群的未來命運發表過諸多富有科幻感的想像。其中最具一致性的圖景是,計算機能夠像人類一樣 「理解」 世界。
現有的 AI 應用已經無處不在,從手機就能完成的夜間拍照到實時翻譯對話,從汽車的半自動駕駛到工廠查驗屏幕上的殘次品。像所有技術一樣,AI 的進展也被藏在產品營銷的背後,大企業雇一些工程人員,能跟著最前沿的研究,實現 AI 的功能。
這些應用看似輕盈,實則踩在科研人員的巧思和鑽研之上,是藉助超級算力和電堆積起來的數據龐然大物。過去二、三十年,科學家們日復一日的努力,不過是在計算機具有真正的智慧之前,把人類的感官先挪過去。
視覺是 「機器要擁有智能」 最重要的感官。而孫劍,是計算機視覺這一領域極具影響力的科學家。他擁有超過 40 項專利,在頂級學術會議和期刊上發表過 200 余篇論文,谷歌學術引用高達 28 萬次,H-index 指數高達 121。按照論文被引數量統計,全球做計算機視覺領域的學者中,孫劍位列前五名。
由孫劍帶隊完成的 ResNet 是深度學習領域最重要的研究之一,在很多人心中,「之一」 可以拿掉。亞馬遜首席科學家李沐曾評價:假設你在使用卷積神經網路,有一半的可能性就是在使用 ResNet 或它的變種。該論文的被引用量達到驚人的 12 萬次。
用戶未必總能意識到產品的便利性得益於更精確的 AI 技術。就像喬布斯所說的,技術的積累就像沉積的岩石。孫劍,以及諸多先行者和後來者,用盡一生將技術的山脈壘高一些,為更遠的社會變革積累一些基礎。
做最先回答問題的人
孫劍是成長於本土的計算機視覺科學家,本碩博都在西安交大完成。他原本讀自動化專業,大三時,被《數字圖像處理》課程激發了興趣。博士階段,孫劍被西安交大和微軟公司聯合培養,加入成立不久的微軟亞洲研究院(MSRA),進入視覺組,師從院長、首席科學家沈向洋。
博士畢業後,孫劍留在 MSRA,在微軟工作了十三年。後來,MSRA 在互聯網領域鼎鼎有名,被譽為 「中國互聯網的黃埔軍校」,為諸多公司貢獻了技術高管和首席科學家。
2000 年代初是外企在中國的黃金年代,MSRA 天才雲集。在西安讀完第一年博士課程,孫劍來到北京新微軟大廈實習。研究院里早已有研究員和助理研究工程師投入工作,「他們的編程能力都特別厲害」,孫劍一看,編程路可能走不通,「差距太大」,那就只剩一條路了:認真做科研。
不過,把畢生投入科研和實踐並不完全如孫劍所形容的,是一個自謙的選擇結果。孫劍對於科研有發自內心的熱愛,「有一顆赤子之心」,他的同事危夷晨這樣回憶道。孫劍曾和我們說,很多博士畢業後再也不想寫論文了,他卻一直想寫,也一直能寫。他在曠視管理近 200 人的團隊,但工位上仍有一塊顯示屏始終開著論文。
像許多科學領域一樣,計算機視覺的重要問題也只能被回答一次。在這個垂直的科研小宇宙里,有幾個核心問題一直都在,對應一些始終解決不了的目標。研究員們都很好奇,都想 「先」 弄清楚。
在 MSRA 期間,很多同事見證過孫劍痴迷科研、苦讀論文的樣子,他去洗手間的路上也讀,11、12 點大家都下班了,他還在讀。讀到靈感迸發時,孫劍會拿著論文衝出辦公室,穿過開放的工位,把同事拉過來熱絡地討論。
2003 年,智能手機還是少數極客的玩物,「當時我們都沒有敢想這個技術能用在手機上。」 孫劍當時已開始研究如何利用軟體和演算法拍出更好的照片。那個全新的研究領域後來被定義為 「計算攝影學」,改造的首要對象是數字相機。
條件有限,能看到當時在很好的大學裡都見不到的專用計算機圖形卡,都能讓他們很高興。為了研究,孫劍和賈佳亞把兩人的月薪湊起來,斥巨資買了當時市面上比較高端的單反相機,再結合 MSRA 的環境拿到更多實驗數據。他們一整天一整天地討論問題,每年都有很多個通宵要度過。
孫劍手上的項目最多,同事們體諒地幫他點好外賣。凌晨十二點,飯一到,孫劍快快地吃,吃完快快地走。有時大家做著做著項目,突然發現孫劍不見了,走到外面大廳一看,他已經在沙發上飛快地睡著了。等到被喊醒,孫劍又能精神抖擻地繼續做實驗和寫論文。賈佳亞羨慕極了,他的睡眠就沒有那麼好。
再後來,孫劍的洞察力越來越敏銳,在 MSRA 視覺組的地位也越來越高。賈佳亞說,很多人都意識到孫劍是一位很好的傾聽者,他總是能在討論中找到問題的本質,幫助他們打開思路。
多年之後,孫劍和賈佳亞躋身中國計算機視覺領域舉足輕重的人物之列。他們一位在 MSRA 就職十三年,成為曠視科技首席科學家;一位畢業後加入港中文做教授,曾任騰訊優圖實驗室聯合負責人,後創辦思謀科技。
在 MSRA,孫劍和賈佳亞並肩而坐,他們都是沈向洋的學生,總是一個講想法一個傾聽,背一樣的瑞典 THULE 拓樂雙肩包,合作了許多篇計算攝影學領域的重要論文。孫劍是 「大師兄」,大家喊他 「孫老大」。
後來他們共同參與一些活動,賈佳亞跟孫劍扛著幾斤重的單反一起爬山,一路拍了許許多多照片。孫劍在生活中總愛拍照,不僅因為他喜歡攝影,還因為他需要數據,別管多少,以後總能用上,他跟賈佳亞說。
答應了接受我們的採訪之後,賈佳亞寫了一篇情感真摯的悼文。到了約定的採訪時間,他無法平靜地讀下去,只能交給 AI 朗讀。近 5000 字的文章,機器人以並不波瀾語氣讀了近 20 分鐘。賈佳亞一直紅著眼睛,幾度離座,最後他乾脆關掉攝像頭。伴隨著黑暗的畫面,AI 讀完了悼文的結尾,接著,只剩下賈佳亞的幾聲抽泣聲。
「不做到最好就沒有存在的意義了。」
有些時候,一個人的行業地位高也許是因為他在這個領域待得足夠久。然而,孫劍的地位並非簡單努力的結果。計算機視覺曾經歷多次大大小小的技術變革,因為眼光獨到,轉型迅速以及一如既往的勤奮,孫劍得以一直站在技術前沿,引領著行業。
在深度學習之前的遠古時期,計算機視覺領域相對小眾,雖然也有些應用,但願沒有今天這麼廣泛和深入。「產品過不了一個技術門檻,就不能變成產品。」 人臉識別也曾是孫劍當年重要的研究方向,但那時的技術水平無法做出今天的人臉支付。
2012 年,多倫多大學 Geoffrey Hinton 團隊提出 8 層的卷積神經網路模型 AlexNet,在 ImageNet 上的識別錯誤率只有 16.4%,比之前最好的傳統視覺方法降低近 10 個百分點,一舉轟動整個視覺領域。但由於深度學習的長期低迷,依然有很多學者不相信也不願接受這個 「新生事物」。關鍵時刻,孫劍毅然帶領團隊徹底轉型。後來的故事大家都知道了。
孫劍的職業生涯和研究重心作過多次成功的轉型,從計算攝影學,到圖像檢索,到人臉識別,到自然人機交互界面,一直到深度學習。每一次的技術和方向轉型多少都會有些 「自廢武功」,在新的賽道上跟其他眾多的競爭者退回到同一起跑線,重新開始。
危夷晨深知這看似一筆就可帶過的決定需要何等的勇氣和果決。危夷晨自己就深有體會,他的博士研究課題是三維重建,那是一個相對更小眾但成熟的領域。在加入 MSRA 的初期,甚至找不到合適的科研課題。他曾迷茫了好一段時間:不轉型,看不到方向;轉型,則意味著之前的經驗和知識被束之高閣,實在不甘心。孫劍的一句話點醒了他:「就當重新讀一個 PhD。」 多年以後,危夷晨依然記得當時內心的觸動。
很多身邊的朋友都了解,孫劍有種 「大道至簡」 的本事。他擅長用最簡單的話講一個最能直擊人的內心,使那些道理生效的關鍵是,孫劍自己也踐行並做到了。
2015 年,由孫劍帶隊,何愷明、張祥雨、任少卿共同完成的深達 152 層的殘差神經網路模型 ResNet 參加 ImageNet 大規模視覺識別挑戰賽,誤差率降到 3.57%,首次超過人眼的準確率,奪得所有細分比賽冠軍。2016 年的計算機視覺頂級學術會議 CVPR 上,ResNet 論文被授予最佳論文獎,這也是孫劍帶領團隊第二次獲得該獎項,此前沒有科學家獲得過這一成就。
ResNet 已經被寫進教科書,是每個人工智慧從業者都要掌握的基本功。在 ResNet 出現之前,研究人員苦於無法成功訓練深度較大的神經網路(十多層已經是極限了),從而無法充分發揮神經網路超強的建模能力。ResNet 徹底地解決了這個基礎重要的問題。不僅對於計算機視覺,語音識別、機器翻譯等任務也適用。後來的 AlphaGo Zero——DeepMind 研發的升級版圍棋人工智慧,就使用了 ResNet。
也許孫劍一直珍視自己作為一個技術科研者所擁有的機會,「因為技術變革也不是經常發生,所以正好碰到,覺得挺幸運的。」
他對自己要求很高,電腦上曾貼過一張紙片,寫著 「只許成功,不許失敗」。他也要求他帶領的團隊 「必須在某一個字領域的一個特定問題的技術找到最好的演算法和最好的解決方案」,而且,還不能是靜態的,得一直保持最強,「不做到最好就沒有存在的意義了。」
技術一定要有用
科研是一個需要全力以赴的領域。他的人生成年後幾乎所有的時間都用來完成一件事,即,在他所熱愛的計算機視覺領域搞科研,並儘可能把他的研究成果應用到實踐中。
MSRA 是一個由企業主導的研究團隊,雖有學院氛圍,但強調技術的應用前景。孫劍是一個非常徹底的技術實用主義者,並留下了影響了他同事和學生的技術主張:
「價值務實。」
「這個東西 work 嗎?」
「既要做神,也要做鬼。」
孫劍很早就成為了 MSRA 視覺組的核心成員。每年,在微軟總部的技術節(TechFest)活動上,孫劍都帶領著同事們,找到產品部門的業務負責人交流,找到技術落地的方向。
微軟的圖像處理軟體 Digital Image Suite 在處理照片方面就大受孫劍團隊的幫助。有段時間,孫劍非常想把計算機視覺技術做到微軟 Office 辦公軟體里,「那一下就有上千萬用戶可以用。」 後來他真的做到了。
2016 年,微軟在當年的 Build 大會上發布了一個新的雲服務產品 CaptionBot。它被使用在為盲人設計的 Seeing AI 眼鏡等硬體設備上,能將攝像頭拍到的圖像變成文字描述,再用語音技術讀給盲人聽。後來,這個技術又演變成 Office Power Point 的一個小功能:插入圖片時,會自動生成文字描述,不再需要手動加文字就可為視障人士讀屏。
當時在微軟總部任職的 AI 科學家何曉冬邀請孫劍一起合作了這個項目。何曉冬後於 2018 年回國加入了京東,他也認同技術務實的主張,他說:「AI 工程化、產品化是保障 AI 不再回到寒冬的重要一點。」
一位曠視研究院的前員工對孫劍在內部論壇上的一次發言印象深刻,有研究員問孫劍,如何平衡工作和生活。孫劍表達的大意如下:為什麼要區分工作和生活?應該融在一起,工作對生活有幫助,生活也能給工作靈感。
倘若換成別人說同樣的話,這位前員工可能覺得是公司高管在暗示員工要為公司 「燃燒自己」,「但因為說這個話的是孫老師」,他認真地讀完,並想了想其中的道理,一直記到今天。
2016 年,孫劍加入 AI 視覺創業公司曠視科技,擔任首席科學家創始人印奇曾是他的學生,唐文斌也曾在 MSRA 實習。
那是科學家們紛紛 「下海」 進公司的年代。技術變革到來後,越來越多科研人員意識到,創業公司有更多的機會和資金,讓他們能在細分領域有更多自由度,讓自己的科研成果更快地應用到工業領域。
孫劍的同事和學生也多進入知名公司或自主創業。何愷明加入了 Facebook(Meta),在 Facebook AI 研究院(現 Meta AI)任研究科學家;曹旭東創辦了自動駕駛技術公司 Momenta;任少卿離開 Momenta 後,加入蔚來汽車,任北美自動駕駛助理副總裁;危夷晨 2018 年加入曠視,擔任曠視上海研究院院長。
在曠視,孫劍也要求研究員們報項目時,必須首先保證能在三年內有工業應用價值,才能啟動研究。他還要求項目的重要負責人必須 「下現場」,查看技術應用的現實環境,而不只是遠坐辦公室電腦前,用公式和代碼想像一個應用。
國內不少手機廠商和產品應用的便是曠視研究院的技術,更清晰的夜間攝影,更精準的工業攝像頭,都方便了現代人。
曠視公司從孫劍那裡收穫巨大。曠視研究院自孫劍接手以來,重要科研成果包括 AI 生產力平台 Brain++、開源深度學習框架天元 MegEngine、移動端高效卷積神經網路 ShuffleNet 等;並在多個頂級學術會議和期刊上累計發表學術論文 120 余篇,是中國人工智慧領域發表論文最多的公司之一。
曠視員工都尊敬孫劍,曠視研究院在公司里也有著非常重要的地位。有了孫劍之後,曠視容易吸引優秀的計算機視覺人才,很多年輕人加入,是沖著孫劍而來。
接過衣缽,砥礪前行
進入曠視後,「孫老大」 變成 「孫老師」,這個稱呼在全公司蔓延。比起世界上絕大多數公司里被稱呼的 「老師」,孫劍更接近於一個真正意義上的師者。
儘管管理工作十分繁重,但孫劍一直保持著對於科研的熱情,經常親自參與研究院重要論文的討論和寫作。經常有同事或學生向孫劍諮詢關於科研甚至人生的話題,孫劍總是耐心地跟他們交流,設身處地的為他們著想。「我覺得已經超出職場的責任了,按理說不需要那樣,大家是工作關係,所以說真的很難得。許多年輕人的學術上的三觀,受他影響很大。」 孫劍的一位師弟說。
在所有人的描述中,孫劍的形象都是一致的,他總是帶著溫和的笑容,即便不認同一些結論,他也很少直接站出來強烈表達自己的反對意見,從沒有人目睹過孫劍發脾氣。後來,熟悉了孫劍的同事和學生都知道,沉默代表著孫老師對討論有疑惑。
不論是 MSRA 視覺組還是曠視研究院,身處其中的研究員們都深深留戀那個環境單純的環境和努力的氛圍。多年來,孫劍默默地塑造和維護了這種獨特的氣質。
在公司走廊,被孫劍偶遇的研究員會被詢問上次討論的進度,有人答不上來(畢竟只過了一個周末),孫劍笑笑離開,留下溫柔但無形的壓力。後來,有的學生會故意繞過處在交通要道的孫劍工位。
改變和影響人很不容易。孫劍有一種潤物細無聲的力量。「早些年的時候,我的論文寫的不好,每次拿給孫老師看的時候都很彷徨。」危夷晨回憶道。「孫老師會盡量提出意見。有時候可能實在看不下去了,孫老師會委婉的說,要不你再回去想想」。神奇的是,這樣幾次之後,還真的就寫好了。人的潛力就是這樣被逼出來的。
孫劍謙和低調。他不太樂意參加公眾活動,更多地參加面向技術人士的活動。等到曠視的名氣越來越大後,孫劍依然推掉大部分採訪、活動和大眾評獎邀約,他總是說,叫印奇去吧,叫文斌去吧。後來,他還鼓勵張祥雨、范浩強、周而進等年輕骨幹代表研究院出席活動、分享學術和實踐成果。
而他個人,多年來維持著單純的生活方式,主要構成要素有三樣:科研、運動和美食。
早在 MSRA,孫劍就十分熱愛運動。孫劍和危夷晨常年一起打羽毛球。剛開始,孫劍連球都不會發。然而,沒過多久,危夷晨發現孫劍的技術突飛猛進。孫劍把他做科研的嚴謹專業拿來練習羽毛球,看大量教學視頻、請教練並堅持長期練習、總結方法和經驗,後來,他們一起拿了 MSRA 內部的羽毛球團體賽冠軍。
在曠視這幾年,孫劍又迷上了騎車和跑步,還要帶著研究院的同學們一起運動。在曠視的內部運動打卡群里,孫劍是少有的每周都能完成至少 3 次運動的打卡的人。研究院的團建一定和運動相關,孫劍會帶著學生一起爬山、跑步,還會去體驗射箭和冰壺。也有研究員苦於孫老師的運動熱情,不得不在電腦上發出無聲但無效的抗議——我不要舉鐵!
在論壇上,孫劍發表最多的內容不是談論技術,而是談論如何科學健身。他的家裡有很多健身和運動相關的書籍,也按照步驟告訴同事跑前如何科學熱身、跑步中間如何保護膝蓋、跑後怎麼拉伸。一位前同事記得,孫劍還曾認真做過一份 PPT 在公司內分享。他還開玩笑說,以後可以叫他 「孫健身」。
6 月 14 日凌晨,孫劍因突發疾病驟然離世。因為消息太過突然,他身邊的很多人仍不能很好消化這個事實。孫劍的工位還保持著原來的樣子,有員工上班時,為他的在辦公桌上擺了一束花。
6 月 18 日,是張祥雨的生日,往年這一天,孫劍會早早地為愛徒送上生日祝福。昨天,張祥雨帶著一束花來到公司,對著孫劍的位置深深地鞠了一躬。他在知乎上發布了自己註冊以來的第一條回答,他說:要獨立,要堅強;接過衣缽,砥礪前行。
人類的歷史很長,人的一生很短。一個人匆匆來到世上,又匆匆離開,他個人的痕迹或許總會被時間撫平,但他的智慧將成為世界的一部分。
*《晚點 LatePost》曾在 2020 年 6 月採訪孫劍,本文部分內容源自那次訪談。還要感謝賈佳亞、危夷晨、何曉冬、朱明傑老師,以及多位曾在曠視與孫劍有交集的人士為本文提供幫助。