社會科學亟需21世紀的新型研究工具與數據支撐

2026年04月22日23:13:08 科學 1652

近日，一篇關於社會科學研究的社論引發廣泛討論。社論指出，社會科學研究結果可重複性差的問題長期存在，部分人士甚至藉此否定整個社會科學領域的價值。事實上，在人類行為這一複雜領域中，研究結果難以重複的原因是多方面的，包括研究方法、統計數據的誤用以及樣本特徵的差異等。

牛津大學約翰·里切爾博士指出，上述問題背後有一個鮮少被討論的深層原因：社會科學缺乏對日常環境中人類行為的系統性觀察，而這種觀察方式恰恰是自然科學研究其他物種行為的基本方法。他援引哲學家索倫·克爾凱郭爾1843年的名言——"生命只能向後理解，卻必須向前生活"——指出社會科學往往將那些為"向前生活"而形成的文化辭彙，直接套用為"向後理解"的科學概念。文化辭彙隨時間演變、因文化而異，且帶有強烈的主觀色彩，這使得以這類辭彙為基礎的研究天然地難以被重複驗證。

坎貝爾協作組織首席執行官威爾·莫伊則從更宏觀的角度表達了樂觀態度。他認為，人類對自身行為和社會運作的認知，遠比對星空、海洋乃至人體的了解更為有限，社會科學將成為人類探索的"最後一片偉大疆域"。然而，目前社會科學所使用的工具，與現代天文觀測設備相比，仍處於伽利略望遠鏡的水準。他強調，數據是自然科學的核心驅動力，同樣也將成為社會科學和AI發展的根本燃料。大語言模型若要真正兌現其潛力，必須與世界模型和人類行為模型協同發展。為此，社會各界需要大力投資公共數據基礎設施，在覆蓋範圍、更新速度、數據體量和細節精度上實現數量級的提升，這將同時為科學進步和政府決策提供堅實的原材料。

斯特靈大學行為科學碩士項目主任大衛·科默福德教授則聚焦於提升科學研究可靠性的具體路徑。他認為，當前科研人員的招聘與晉陞體系幾乎完全以著作成果為導向，對同行評審貢獻的認可度幾乎為零。他建議，應將研究者的同行評審活動納入學術評價體系。目前，Web of Science研究者主頁和ORCID平台已支持記錄評審活動，只需進一步完善機制，由期刊編輯對高質量評審給予積分獎勵，對劣質評審予以扣分，即可激勵研究者認真投入同行評審工作，從而在問題結果進入文獻之前加以識別和攔截。他強調，雙盲同行評審仍是人類迄今發現的"最不差"的真理識別機制，完善這一機制對所有人均有裨益。

Q&A

Q1：社會科學研究結果為何難以被重複驗證？

A：社會科學研究結果難以重複，原因是多方面的。首先，研究方法和統計數據的誤用會影響結果的可靠性；其次，研究缺乏對人類日常行為的系統性直接觀察；此外，社會科學大量借用文化辭彙作為科學概念，而這些辭彙本身隨時間變化、因文化而異，並帶有主觀色彩，導致基於這類概念的研究天然難以被重複。

Q2：大語言模型與社會科學研究有什麼關聯？

A：大語言模型若要真正發揮其潛力，需要與世界模型和人類行為模型協同發展。數據是推動自然科學和AI發展的核心驅動力，同樣也將成為社會科學進步的關鍵燃料。因此，社會各界需要投資建設高質量的公共數據基礎設施，在覆蓋範圍、更新速度、數據量和細節精度上大幅提升，為科學研究和政府決策提供支撐。

Q3：如何通過同行評審機制提升社會科學研究的可靠性？

A：可以將研究者的同行評審活動納入學術評價體系。目前Web of Science和ORCID平台已支持記錄評審活動，可進一步完善機制，由編輯對高質量評審給予積分獎勵，對劣質評審予以扣分。這樣既能激勵研究者認真開展同行評審，及早發現問題研究，也能幫助編輯更高效地找到合適的審稿人，整體提升學術研究的可靠性。