即使是最好的撲克牌手,也有「行為語言」,當他們用一隻手虛張聲勢時,可能會泄露他們打牌時的想法。
造假的科學家也是一樣。當他們在偽造數據時,一樣會試圖通過某種表述方式,來掩蓋作品中的虛假之處。
斯坦福大學的一組研究人員發明了一種方法,能夠識別這些書面上的線索。
這項發表在《語言與社會心理學雜誌》(Journal of Language and Social Psychology)上的研究成果,能夠幫助我們用一種獨特的方法識別出那些偽造的研究。
為了理解說謊者的撒謊方式,學界已有相當數量的研究成果。這些研究表明,說謊者通常傾向於表達更多的消極情緒,使用更少的第一人稱代詞。
(提個醒兒,小編最近開了個視頻號,專門為大家講考研,後面還打算出鏡兒,敬請關注點贊哦。)
在財務報告領域中,與準確的報告相比,那些虛假的報告通常存在更高程度的混淆性語言,這些語言乃是旨在用來分散或隱藏虛假數據的措辭。
為了探知科學界是否也存在類似的模式,斯坦福大學傳播學教授傑夫·漢考克(Jeff Hancock)和研究生大衛·馬科維茨(David Markowitz)從1973年到2013年檢索了生命科學期刊資料庫PubMed的檔案,找出了那些被撤稿的論文,以做研究。
他們確定了253篇主要來自生物醫學期刊的論文,這些論文因發現存在造假而被撤稿。
然後,他們將這些論文與同一期刊和同一出版年份、涵蓋相同主題的未被撤稿的論文進行了比較。
然後,他們用一個定製的「混淆指數」對每篇論文的欺詐程度進行了評級,該指數對作者試圖掩蓋虛假結論的程度進行了劃分。
這個程度劃分綜合考慮了文章中的因果詞、抽象語言、「行話」、積極的情感術語和易讀性等。
該論文的主要作者馬科維茨說:「混淆背後的潛在想法是矇混事實。偽造數據的科學家知道他們是在進行不當行為,不想被抓。因此,規避這一點的一個策略,可能就是模糊文中的部分內容。我們認為,語言可以是區分偽科學和真正科學的眾多變數之一。」
研究顯示,因造假而導致撤稿的論文,「混淆指數」顯著高於因其他情況而撤稿的論文。另外,在造假論文中,出現某些「行話」的比率比未撤稿論文高1.5%。
馬科維茨說:「與未被撤稿的論文相比,撤稿論文每篇多出有大約60個類似』行話』的單詞。這是一個不小的數字。」
研究人員說,科學家可能會因為各種原因而進行數據造假。先前的研究指出,一種「要麼發表要麼出局」(publish or perish)的壓力,可能會激發研究人員改動他們的研究成果,或者乾脆對之進行偽造。
在本研究中,研究人員發現了作者們的寫作風格與他們試圖通過操縱語言來掩蓋謊言之目的的直接相關性。
例如,一個造假的作者可能會使用較少的積極情緒術語來抑制對所得數據的讚揚,因為他們害怕引起調查。
研究者表示,基於雜誌對模糊語言的限制,未來可以開發一個計算機系統,用以識別新提交的論文,這樣編輯們就可以在文章發表前,對它進行更為嚴格的評審。
但作者警告說,鑒於存在假陽性率,這種方法目前或許還不可行。
漢考克說:「科學造假在學術界越來越受到關注,自動識別造假的工具可能會有用。但在考慮使用這種方法之前,還需要更多的研究。」
「顯然,需要解決的問題是,這其中存在一個非常高的錯誤率。但是,科學需建立在信任的基礎上的,在出版過程中引入『造假檢測』工具,可能會破壞這種信任。」他說。
分享最新科技資訊,發布前沿學術動態!一切盡在木木西里~ 服務科研,助力科技! 關注微信公眾號: 木木西里(mumuxilinj),更多精彩內容、新聞資訊、乾貨資源等你來看!
特別聲明:本文發布僅僅出於傳播信息需要,並不代表本公共號觀點;如其他媒體、網站或個人從本公眾號轉載使用,請向原作者申請,並自負版權等法律責任。
點擊文末了解更多,領取百萬豪禮!