
近日,一篇關於社會科學研究的社論引發廣泛討論。社論指出,社會科學研究結果可重複性差的問題長期存在,部分人士甚至藉此否定整個社會科學領域的價值。事實上,在人類行為這一複雜領域中,研究結果難以重複的原因是多方面的,包括研究方法、統計數據的誤用以及樣本特徵的差異等。
牛津大學約翰·里切爾博士指出,上述問題背後有一個鮮少被討論的深層原因:社會科學缺乏對日常環境中人類行為的系統性觀察,而這種觀察方式恰恰是自然科學研究其他物種行為的基本方法。他援引哲學家索倫·克爾凱郭爾1843年的名言——"生命只能向後理解,卻必須向前生活"——指出社會科學往往將那些為"向前生活"而形成的文化辭彙,直接套用為"向後理解"的科學概念。文化辭彙隨時間演變、因文化而異,且帶有強烈的主觀色彩,這使得以這類辭彙為基礎的研究天然地難以被重複驗證。
坎貝爾協作組織首席執行官威爾·莫伊則從更宏觀的角度表達了樂觀態度。他認為,人類對自身行為和社會運作的認知,遠比對星空、海洋乃至人體的了解更為有限,社會科學將成為人類探索的"最後一片偉大疆域"。然而,目前社會科學所使用的工具,與現代天文觀測設備相比,仍處於伽利略望遠鏡的水準。他強調,數據是自然科學的核心驅動力,同樣也將成為社會科學和AI發展的根本燃料。大語言模型若要真正兌現其潛力,必須與世界模型和人類行為模型協同發展。為此,社會各界需要大力投資公共數據基礎設施,在覆蓋範圍、更新速度、數據體量和細節精度上實現數量級的提升,這將同時為科學進步和政府決策提供堅實的原材料。
斯特靈大學行為科學碩士項目主任大衛·科默福德教授則聚焦於提升科學研究可靠性的具體路徑。他認為,當前科研人員的招聘與晉陞體系幾乎完全以著作成果為導向,對同行評審貢獻的認可度幾乎為零。他建議,應將研究者的同行評審活動納入學術評價體系。目前,Web of Science研究者主頁和ORCID平台已支持記錄評審活動,只需進一步完善機制,由期刊編輯對高質量評審給予積分獎勵,對劣質評審予以扣分,即可激勵研究者認真投入同行評審工作,從而在問題結果進入文獻之前加以識別和攔截。他強調,雙盲同行評審仍是人類迄今發現的"最不差"的真理識別機制,完善這一機制對所有人均有裨益。
Q&A
Q1:社會科學研究結果為何難以被重複驗證?
A:社會科學研究結果難以重複,原因是多方面的。首先,研究方法和統計數據的誤用會影響結果的可靠性;其次,研究缺乏對人類日常行為的系統性直接觀察;此外,社會科學大量借用文化辭彙作為科學概念,而這些辭彙本身隨時間變化、因文化而異,並帶有主觀色彩,導致基於這類概念的研究天然難以被重複。
Q2:大語言模型與社會科學研究有什麼關聯?
A:大語言模型若要真正發揮其潛力,需要與世界模型和人類行為模型協同發展。數據是推動自然科學和AI發展的核心驅動力,同樣也將成為社會科學進步的關鍵燃料。因此,社會各界需要投資建設高質量的公共數據基礎設施,在覆蓋範圍、更新速度、數據量和細節精度上大幅提升,為科學研究和政府決策提供支撐。
Q3:如何通過同行評審機制提升社會科學研究的可靠性?
A:可以將研究者的同行評審活動納入學術評價體系。目前Web of Science和ORCID平台已支持記錄評審活動,可進一步完善機制,由編輯對高質量評審給予積分獎勵,對劣質評審予以扣分。這樣既能激勵研究者認真開展同行評審,及早發現問題研究,也能幫助編輯更高效地找到合適的審稿人,整體提升學術研究的可靠性。