在歷時7年,對3900篇社會科學論文進行研究後,一項近日發表於《自然》的研究指出,僅其中一半論文的結果能復現。
在AI崛起頻頻引發自然科學「可重複性危機」(replicability crisis),社會科學結論的可靠性也在被重新審視。
「文科危機」的鐵證?
這項研究名為「開放研究與證據中的系統置信度」(SCORE),經濟學、教育學、心理學及社會學等多個社會科學學科,865位研究人員對發表在這些學科的62種期刊上的論文做了詳細梳理。研究成果以三篇論文的形式發表在今年4月1日的《自然》期刊上,旨在開發出一套能夠對社會科學研究成果進行「置信度評分」的自動化工具。
對學術共同體來說,科學研究的可復現事關知識積累的基礎,它意味着若在相同條件下,對同一組數據進行完全相同的分析,理應得出完全一致的結論。可惜的是,研究人員在對這些論文的數據分析過程進行復現時發現,在他們重點關注的164項研究中,僅有49%的研究結果在統計學意義上得到了成功重現。
開放科學中心(Center for Open Science)的研究主管蒂姆·埃林頓(Tim Errington)表示,在「不發表,就出局」的整體學術環境下,這樣的結果並不令人太意外。或許對公眾來說,這一結果又成為本就遭遇嚴重質疑的「文科」危機新的鐵證。
電影《實驗者》劇照
但埃林頓提醒,這並不必然表示當前的科研工作質量低劣。可能有少數研究結果的不可復現是由於學術不端等原因,但更普遍的原因可能是因為其未能提供足夠翔實的數據或者實驗細節。
對此,埃林頓強調,對於科研人員來說,應該注重更開放地共享數據,對採用的研究方法保持更高的透明度,更方便後人檢驗。此外,參考前人研究的學者們也要保持相當的批判和懷疑精神,不應對論文的結論「照單全收」。加拿大渥太華大學「可重複性研究所」(Institute for Replication)的創始人、經濟學家阿貝爾·布羅德爾(Abel Brodeur)就表示,他對新發表的論文總是持懷疑態度:「我通常會耐心等待數年,直到看到大量其他研究也進行了類似的分析並得出了相似的結果,我才會對某項特定的研究發現產生信心。」
比危機更複雜的是人
與自然科學相比,社會科學領域的可復現性危機有其複雜性。
社會科學研究的對象是人,人複雜的社會行為可能更難量化,受到的影響因素也會更多。全美學者協會(national association of scholars)的大衛·蘭道爾(David Randall)就表示,研究領域內部的「政治傾向」與「群體思維定勢」,以及前文提到的巨大發表壓力,也很容易導致大量不可重複的研究被批量炮製出來。
如何改善這樣的狀況,讓社會科學研究的精確性變得更高?蘭道爾指出,首先應該強化研究的預註冊機制,確保研究數據的開放性。更重要的是,要將研究的數據收集和分析環節分離,將其指派給不同的、相互獨立的研究人員負責。
這並不僅僅是技術改變,蘭道爾認為,這涉及人文社科整體學術文化的一場巨變。比如,學術體制會面臨一個難題:如何在大規模的研究團隊中分配職位聘用、晉陞的機會?如何進行獎勵?畢竟,在這樣的模式下,可能更難判定哪個環節的成員對研究有最大的功勞。
更重要的是,對研究數據的嚴苛,可能讓社科研究變得更加昂貴。在一個世界範圍內的文科都遭遇經費緊張的時代,這是一個必須考慮的問題。