數據在身邊,殘疾人也能成為人工智慧時代的「煉油人」

正在工作的數據標註師

本報(chinatimes.net.cn)記者李氏瓊 王曉慧 瀋陽報道

發展人工智慧產業,既需要頂層設計型的戰略人才,也需要紮根實踐型的技能人才。

當前,我國各類通用型人工智慧大模型不斷湧現,而這些模型的研發與應用,都離不開最初對海量數據的分類標註。

數據被不少人工智慧領域的專家譽為「新石油」,而數據標註則是將數據「原油」煉成「汽油」的關鍵環節,通過給文本、語音、圖片、視頻等各類數據「打標籤」,讓模型逐漸了解學習相應事物。從事數據標註工作的人,常常被稱作數據標註師,他們負責給一張街景圖片標出行人和車輛、為一段語音標出發音和含義、給一段文本標出語義和表達內涵……在人工智慧技術得以廣泛落地應用的過程中,他們是重要一環。

數據標註工作需要工作人員坐下來,不斷在現有數據基礎上「打標籤」的耐心、細心和責任心,這恰好與殘疾人「重腦力專註、輕肢體強度」的工作需求契合。正因如此,越來越多的殘疾人也參與到「煉油」中來。

優勢凸顯與就業賦能

在數據標註行業,殘疾人有特殊優勢。比如,聽力障礙者有更敏銳的視覺感知,能在圖像標註中快速捕捉細微差異;肢體不便者手部動作更穩定,適配長時間鍵盤滑鼠操作的需求;腦癱人士行動受限,但是在節奏清晰、流程明確的重複性任務中,卻有遠超常人的專註力與持久性。

而且殘疾人參與數據標註工作,往往能更敏銳地識別出潛在的歧視性表達或不當標籤,反向優化人工智慧的工具屬性,提升整體標註質量,讓人工智慧大模型更具包容性、更貼合社會多元需求。

近年來,隨著「東數西算」工程的持續推進,全國七大數據標註基地的陸續建成,數據資源大量向中西部傾斜,依託地區勞動力成本優勢,崗位數據標註崗位得以大量布局,也解決了不少殘疾人就業難、離家遠的問題。

「我們這裡好多人一天能標註上萬條呢,而且多勞多得,越勤奮,掙得越多,幹勁都很足。」來自寧夏的韓好,今年40歲,幼時一次意外讓她從高處跌落,導致左腿殘疾。去年,寧夏殘疾人福利基金會網路就業培訓的工作人員來到她所居住的民樂小區推介網路就業項目後,她參加了就業培訓中心組織的第一期培訓班,之後順利上崗。現在,這份工作讓她有了穩定的收入和充實的生活,韓好說:「我挺滿意現在的狀態。」

正在開心交流工作的數據標註師

在瀋陽,23歲的孫欣宇通過網路招聘,主動找到了遼寧京數雲大數據科技有限公司的數據標註以及審核工作。《華夏時報》記者在辦公室見到他時,第一眼就注意到他的亮發和耳釘,盡顯時尚氣息,如果不是主動說明,很難察覺他是一位腦癱患者。

「我在這裡月薪3000左右,還享有和大家一樣的福利待遇,很不錯。」張欣宇說,在這裡他還交到了不少朋友。公司里像張欣宇一樣的殘疾員工有40多人,不少是大學生畢業後直接到這裡就業。大家年齡相仿,也自然而然地形成了一個融洽的交際圈。「平時我們同事一起吃中午飯,約著出去遛一遛,雖然現在是我自己一個人住,但是父母也比較放心。」

標註師的進階道路

人工智慧技術不斷更新迭代的背景下,數據標註行業也在加速轉型。

「以前大家覺得數據標註門檻低,甚至說是『寶媽行業』。但現在,簡單、重複性的標註工作,60%—70%已能通過人工智慧模型自動完成。人的價值,更多體現在處理新興領域、高複雜度或空白領域的標註任務上。」遼寧京數雲大數據科技有限公司的技術總監劉吉說,數據標註產業正從勞動密集型加速轉向技術密集型,這對數據標註師的標註精度、效率以及場景理解能力提出了更高要求。

近日,工信部印發的《工業互聯網和人工智慧融合賦能行動方案》,提到「引導龍頭企業基於工業互聯網帶動上下游開放數據資源,打造一批高質量行業數據集。」明確政策信號的釋放,正持續為數據標註產業發展帶來新動能。

行業在向上發展,從業者的技能也需要不斷更新。這種背景下,幫助殘疾人實現可持續發展,不斷深耕專業方向是關鍵。目前,不少地方政府、殘聯與科技企業正推動「政—校—企」深度協同,通過學用結合為殘疾人從事數據標註工作提供機會和指導。

全國首家殘健融合AI(人工智慧)數據標註基地

比如,遼寧京數雲大數據科技有限公司作為全國首家殘健融合模式的AI(人工智慧)數據服務基地,與各大科技企業及高校研發中心建立了聯繫,挖掘他們的業務需求,同時結合殘疾人身體機能實際,實現人崗精準匹配;甘肅舉辦的數據標註師培訓,聚焦數字圖像、文本及3D點雲標註等人工智慧產業鏈的基礎關鍵環節技術,助力殘疾人掌握實用技能,提升他們就業的可持續性。

「時代給了我們機會,我們也要有自己的態度,抓住機會去提升自己。」在上海工作的王笑,之前是一名推拿按摩師,後來在相應的培訓下,成為一名專註於交通領域數據標註的標註師。她說隨著人工智慧技術的不斷發展,他們也要把步子邁起來,技能提上來。

責任編輯:周南 主編:文梅