
每天,全球有數億人打開ChatGPT、Claude或Gemini,請它們幫忙寫郵件、整理思路、回答問題。大多數人覺得,這不過是在用一個更聰明的搜索引擎。
但南加州大學多恩西夫文理學院的研究人員在《行為與腦科學政策洞察》期刊發表的最新研究,給出了一個令人不安的結論:你以為在使用AI,AI也在塑造你。
它不是中立的鏡子,而是一面有偏角的透鏡
這項研究的核心發現,指向一個被研究者命名為"WHELM"的概念,這個縮寫代表西方化、高收入、受過良好教育、自由主義和男性化視角。研究者發現,目前主流的大型語言模型,在價值判斷、溝通方式乃至道德推理上,都系統性地向這一視角傾斜,原因很直接,它們的訓練數據絕大部分來自英語互聯網,而英語互聯網本身就高度集中於北美和歐洲的內容生產者。
這不是技術故障,而是一種結構性偏差。
論文第一作者、社會心理學博士生亞爾達·達里亞尼說得很直白:"當你向AI尋求建議時,你得到的並不是中立的答案,而是特定群體的觀點,即使它沒有明確說明這一點。"比如,當用戶用非英語語言提問時,這些模型仍然傾向於用美國節日、英語電影或歐洲文化習俗來舉例,對非西方傳統的描述則明顯粗糙,甚至充滿刻板印象。
更深的問題在於價值取向。研究顯示,AI系統在處理道德問題時,傾向於優先強調個人自由和公平,而對傳統、權威、社群歸屬這些在許多非西方文化中居於核心位置的價值觀,則表現出明顯的輕視或忽略,這並非AI的"選擇",而是訓練數據分布的必然投影。
發表於《認知科學趨勢》的相關研究進一步表明,這種同質化效應不只來自訓練語料的偏差,還被訓練過程本身放大了,因為模型在優化時傾向於產生"最被認可"的輸出,而認可標準本身就是由特定文化背景下的標註人員制定的,這形成了一條難以察覺的偏見傳導鏈。
反饋循環:越用越像,越像越用
南加州大學道德與語言實驗室主任莫爾特扎·德赫加尼描述了一個讓人警惕的自我強化機制。他說:"我們越依賴這些系統,它們的輸出就越成為我們共享知識的一部分,而這些知識又被用來訓練下一代AI,於是這個循環不斷自我強化。"
這個循環在現實中已經有了可見的早期跡象。當數億人每天使用AI輔助寫作時,文本風格開始趨同,措辭模式開始標準化,就連表達情緒和構建論點的方式,也在潛移默化中向AI的"偏好"靠攏。達里亞尼指出:"當數百萬人使用AI撰寫信息時,那些文化差異就開始消失,隨着時間推移,我們所有人的說話方式可能都會變得非常相似。"
這裡的"相似",並不是中性的趨同,而是朝向一個特定方向的收縮,語言多樣性減少了,溝通方式標準化了,最終可能波及的,是人們思考問題和理解世界的框架本身。研究者強調,文化多樣性不只是語言習俗的問題,它深刻影響着人類解決問題的方式和創造力的邊界,一旦這種多樣性系統性萎縮,社會將失去的遠不止幾種方言或節日。
面對這一挑戰,研究團隊提出了三個層面的干預建議。首先是擴大訓練數據的文化覆蓋,納入更多來自不同語言、地區和文化傳統的內容,系統性補充被低估的文化知識。其次是在模型微調階段引入更多元化的文化視角,諮詢人類學家、語言學家和不同社區的代表,而不只依賴單一標準評估輸出質量。第三是改變現有的評估機制,讓評審人員依據多元標準而非統一的西方化基準來判斷模型回應的質量。
達里亞尼在論文結尾的那句話,值得被記住:"語言、傳統、思維方式,一旦消失,就再也找不回來了。問題不在於修復起來是否困難,而在於我們是否能承擔不修復的後果。"
AI的時代才剛剛開始,而它能否容納整個世界,而不只是世界的一部分,將是這個時代最重要的技術倫理命題之一。