
螞蟻集團研究院院長李振華表示,高質量的標註數據已成為制約模型智能上限的一大痛點。尤其在專業垂直領域,國內大模型和海外同行在高質量標註數據的搭建上存在明顯差距。
4月28日的2026數字中國峰會一場論壇上,李振華提到,通用大模型往往難以滿足專業場景的精度要求,核心原因在於缺乏足夠數量且足夠質量的專家級標註訓練數據。因此,構建高質量的領域專家標註數據體系,對於大模型在垂直行業的深度落地至為關鍵。
以醫療影像為例,診斷模型所需的不是普通標註員的簡單標籤,而是由臨床醫生提供的、符合診療邏輯的高質量標註;在金融領域,模型更依賴投資經理做出投資組合決策時的完整過程數據,包括知識數據、思維推導鏈條上的數據等。
但李振華髮現,國內數據標註行業總體上仍以低成本、大規模的通用標註為主。在醫療、金融等垂直領域,模擬專家思維進行決策的標註數據不足。這一困境由數據供需兩端共同導致。
在供給側,大量專業知識分散在高校、醫院、科研機構、行業專家群體中,缺乏有效的組織機制將其轉化為高質量訓練數據。一方面,真正可供出來被用於標註的數據很少。另一方面,即使具備相應的數據供給,從事數據標註的行業專家群體也稀缺——原因在於,缺少對專家的規模化招募組織機制、多元化的激勵機制等,而且很多專家不屑於從事數據標註工作。
在需求側,大模型廠商通常選擇自行解決高質量數據標註的需求,各自獨立對接專家、數據單位開展標註工作。這使得專門從事數據標註的機構難以準確把握模型廠商對數據的需求內容。
與此形成對比的是,海外形成了專業化的數據標註專業化分工,無需模型廠商親自下場。這也實現了標註後的數據在不同模型廠商進行共享。
李振華將美國數據標註公司Surge AI視為實現專家標註規模化的樣本。公開信息顯示,Surge AI的客戶包括 OpenAI、谷歌、微軟、Meta和Anthropic等,2024年年收入突破10億美元。公司官網介紹,為進行高質量專家標註數據的規模化生產,Surge AI匯聚了全球各領域最傑出的人才——醫生、律師、投資銀行家、菲爾茲獎得主、哈佛大學教授,以及來自科學、技術、工程、數學和人文領域的眾多精英。
李振華介紹,Surge AI構建了嚴格的專家資質分層體系,對標註者進行嚴格的技能評估和分層管理,根據不同任務的專業要求,匹配具備相應領域知識的專家。同時,公司深度參與標註任務的設計過程,協助客戶將複雜的專業判斷拆解為可操作、可量化的標註指令。此外,Surge AI對不同專業領域的標註任務實行差異化定價激勵機制,專家級標註報酬明顯高於普通任務。
「高質量專家標註數據的規模化生產,不是一個簡單的勞動力組織問題,而是一個專業知識工程化的系統性問題。」李振華強調。
國內政策制定部門已在重視數據標註產業的發展。2024年12月,國家發展改革委等四部門發佈的《關於促進數據標註產業高質量發展的實施意見》提到,加強交通、醫療、金融、科學、製造、農業等重點行業領域數據標註,建設行業高質量數據集,支撐人工智能在行業領域的應用賦能。
在李振華看來,探討如何解決高質量專家標註數據短缺問題時,必須充分考慮各國在科研製度、商業環境以及大模型廠商採購能力等方面的差異。以模型公司對外採購能力來說,高質量標註數據價格貴,比如金融領域標註數據的採購成本最高可達每條6000美元。國外大模型廠商融資多、資金充足,具備較強支付能力,但國內模型公司的採購能力相對有限。
李振華認為,我國可以依託國家人工智能中試基地,構建專家標註數據生產體系,使其真正成為中國高質量AI訓練數據的核心生產基地。具體做法上,應釐清中試基地、機構、專家、企業間的合作機制,由基地承擔統一發佈管理平台、質量認證存證機構等核心功能。他建議,中試基地可以聯合行業頭部機構,分領域制定專業標註指南、裁判標準和質控流程,逐步建立起標準化的專家標註任務設計和質量控制規範。
為了讓專家順利參與數據標註,李振華認為需要解決專家參與標註的「兼職」合規問題,他建議探索標註專家備案、科研項目合作等模式。而要讓專家有意願參與,多元激勵機制不可或缺:比如允許標註成果作為科研貢獻,納入職稱評定、科研考核體系;按專業難度和稀缺性給予專家合理的經濟報酬;探索專家獲得數據產品收益的一定比例分成。
采寫:南都N視頻記者 楊柳 李玲 發自福建福州