為什麼「影響因子」是《葵花寶典》?
讀過金庸《笑傲江湖》的人都知道,《葵花寶典》是江湖中神秘的武學秘籍,練成之後威力極大,所以人人爭奪,鬧得江湖上腥風血雨。但《葵花寶典》有個致命弱點——「欲練神功,引刀自宮」!小說中所有練此「神功」的人一個個身心變異,全都沒有好下場。
正是在這個意義上,「影響因子」可以比作《葵花寶典》:發起這個遊戲的西方人和少數西方雜誌,已經在這個風靡全球的遊戲中大獲其利,但中國學術界如果跟著玩這個遊戲,其結果必將是「引刀自宮」!
我將持續數篇,為讀者講述這個當今學術江湖中還遠遠不為人所知的隱秘故事。這個故事包括如下要點:
「影響因子」是用來賺大錢的。用「影響因子」賺大錢的人,如何讓世人將他的私人商業公司誤認為「國際權威科學機構」?當初是哪些人和雜誌發起了「影響因子」遊戲,他們又如何從中大獲其利?「影響因子」可以如何使用「合法」手段操弄?為何中國學術界跟著玩這個遊戲就會「引刀自宮」?
「影響因子教父」尤金·加菲爾德
這次,我們先窺看一些《葵花寶典》中的具體內容——暫不包括「引刀自宮」的駭人場景。
「影響因子」計算公式的第一個問題:兩年期限
「影響因子」作為一個專門術語,1955年首次出現在「影響因子教父」尤金·加菲爾德(Eugene Garfield)發表在《科學》(Science)雜誌上的一篇文章中:
通過該系統(指「科學引用索引」SCI),可以有效檢索收錄期刊論文被哪些文章引用過,這在歷史研究中將發揮明顯作用,當人們嘗試評估某項研究成果的意義,或它對同時期的文獻或思想產生的影響時,「影響因子」應該比科學家出版成果的絕對數量更具說服力。
加菲爾德最初將一篇文章的被引用次數作為「影響因子」,但八年後的另一篇文章中他把「影響因子」定義修正為「期刊文章的平均被引用次數」。而湯森路透(Thomson Reuters,加菲爾德當初創建的出售SCI和「影響因子」的私人商業公司ISI後被它收購在旗下。2016年ISI又經轉賣,新主人是科睿唯安)此後逐年發布的「期刊引證報告」(JCR)上,影響因子演算法的標準定義是:
期刊X在前面兩年發表的「源刊文本」(source items)在當年度的總被引用數,除以期刊X在前面兩年發表的「引用項」(article)總數量,即為期刊X當年度影響因子的得數。其中「源刊文本」,指的是SCI(後來包括SSCI和A&HCI)任一收錄期刊上發表的所有文本,「引用項」指學術文本。算式表達為:
這個公式中的第一個問題是:源刊文本的「引用窗口」為什麼設定為兩年?為什麼SCI期刊文本只在發表後第二、三年度發生的引用,才對期刊「影響因子」產生有效貢獻?常識告訴我們此後引用肯定還會持續發生的。
加菲爾德1972年發表在《科學》雜誌上的文章,對這一設定作了解釋,他逐年統計1964-1970年SCI收錄期刊的參考文獻,其中發表年限在三年內的比例依次為:31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%。明明兩年內的引用只佔兩三成,但不知何故他就此卻得出了「論文被引用主要發生在發表當年後的兩年內」的論斷。照理說「兩年期限」作為「影響因子」演算法非常重要的一項準則,加菲爾德有必要單獨撰文或至少也應該在文章中詳細說明理由,但他卻只用一條注釋(該文注釋29)糊弄過去。難怪一些西方學者感到無從知曉「兩年」標準是依據什麼得來的。
針對這一問題,格蘭采爾(W.Glanzel)和莫伊德(H.Moed)2002年發表的論文已經提供了一個非常有力的反駁案例。他們考察了醫學期刊《柳葉刀》(Lancet)和社會學期刊《美國社會學評論》(American Sociological Review),對兩刊1980年發表文章在之後十年的平均被引用率進行逐年比較。發現在頭三年,《柳葉刀》論文的平均引用率明顯高於《美國社會學評論》,但隨著年限逐漸累積,到第十年《美國社會學評論》的引用率就大大高於《柳葉刀》了。
這一結果表明,對醫學期刊和社會學期刊採用同樣的「引用窗口」年限就不合理。醫學作為最活躍的研究領域,新舊理論頻繁更迭,其中某些成果發表後引發的關注甚至是爆髮式的。但在人文領域,新的思想和觀點提出後,往往需要等待若干年的「發酵」,才可能引發關注。
這就表明,湯森路透逐年公布的「影響因子」很難說是客觀的。然而,在「影響因子」被捧上神壇的今天,學界即使意識到了這一點,也已經別無選擇。2003年加菲爾德對這一問題的回應,就完全是一副「木已成舟能奈我何」的架勢:「我們不想等若干年後才了解一份期刊的被引用情況。ISI完全有能力計算三年、五年的影響因子,我們甚至有十年、十五年的影響因子資料庫,但它們需要單獨訂閱。」
在這個傲慢的表態中,「影響因子」的合理性是無所謂的,商業利潤才是王道。「它們需要單獨訂閱」,你想知道更多情況,另外再掏錢啊!——別忘了,SCI和JCR數據也都是要花錢向ISI購買的。
「影響因子」計算公式的第二個問題:分母變化
第二個問題出現在「影響因子」計算公式的分母中。作為分母的「引用項」(article)究竟指什麼呢?按照加菲爾德最後的定義,「文章」只包括「原創研究論文」(original research paper)和「評論」(review)。
我們中國人特別老實,辦學術刊物就只登research paper,至多偶爾登一兩篇review;辦普及刊物那就根本不會登任何research paper和review。所以對中國人來說,計算公式分母中的「文章」不會有任何問題——它就是一本學術刊物所刊登全部文章的數量。
可是到了洋人那裡,情況卻完全不同了!許多刊物除了刊登原創論文和評論,還要發表雜誌社論、技術通信、通告、讀者來信、科學訊息、觀察報告、書評、影評乃至科幻小說!如今「影響因子」遙遙領先的幾家最知名科學刊物——《自然》(Nature)、《科學》、《柳葉刀》、《美國醫學會雜誌》(The Journal of the American Medical Association),《新英格蘭醫學雜誌》(The New England Journal of Medicine)等等,無不如此。
在1972年發表於《科學》雜誌的文章中,加菲爾德將《自然》、《科學》、《柳葉刀》、《美國醫學會雜誌》這類刊物上的所有文本都計入算式分母,理由是「全部計入」不失為較為便捷的處理手段;況且「這些期刊上的非學術文本也是潛在的被引用文本」(見該文注釋28)。但這種做法對《自然》、《科學》之類的期刊非常不利,它們的排名全都在40名之後。
針對這一情況,在1975年的JCR報告中,加菲爾德對規則作了調整,規定分母項只包括三類「學術文本」:原創研究論文、評論和技術報告(technical notes)。1995年度的JCR報告中分母規則再次調整,「技術報告」也被剔除,只保留「原創研究論文」和「評論文章」兩項,這一做法保持至今。「非學術文本」不再計入的理由,已經變成「它們很難獲得引用」——後文將表明這並非事實。
分母大幅度減小對《自然》、《科學》這類期刊的「影響因子」產生了神奇的效果,它們的「影響因子」排名全部大幅上升,其中《美國醫學會雜誌》竟驚人地提升了100位。對此加菲爾德只委婉承認「部分歸結於這個原因」。
請注意《自然》雜誌——我已經在《科學外史Ⅱ》談過它刊登的那些科幻小說了,它和「影響因子」之間有著極為微妙的關係,且待後文慢慢道來。
來源:《科學外史》