DOI:數字資源的「條形碼」

2022年06月30日06:55:26 科技 1931

某一天,當我們坐在計算機前輕點鼠標打開一個常用的鏈接,卻發現屏幕上出現的並不是原先熟悉的網頁,而是一串令人懊惱的字符:「404 File not found」。相信這是跟互聯網打過交道的人都不只一次碰到過的不快經歷。互聯網為我們打開了一個全新的世界,使信息無遠弗屆理想成為現實,但這是一個充滿了變數和不確定性的世界。據估計每6個月就有約16%的鏈接成為「死鏈接」(Linkrot)。互聯網上最缺乏的已不再是信息,而是規則。

對學術研究來說,信息的不穩定和隨意流失是災難性的。建立在大量不確定信息基礎上的研究成果無異於沙灘上的城堡。一些組織和機構已經意識到這一問題的嚴重性,着手於互聯網上信息規範的建立,DOI 就是其中卓有成效的一種。

DOI(Digital Object Identifier)意為「數字對象標識符」,是一種對包括互聯網信息在內的數字信息進行標識的工具。在傳統的實體出版物中,無論是書刊,還是磁帶、光盤,都會被賦予ISBN、ISSN、ISCN等國際標準編號及其條形碼,作為出版物在書海刊林中的唯一性標識。這些標識使出版物得到有效的管理,便於人們查找和利用。而網上的文檔一旦變更了網址(URL),就消失得無影無蹤,讓人無從追索。如果給數字信息加上DOI,就如同出版物貼上了條形碼一樣,無論走到哪裡都有蹤可尋。因而DOI被形象地稱為數字資源的條形碼。

1 DOI 的編碼方式與技術特點

DOI 的誕生可追溯到1994年美國出版商協會(The Association of American Publishers,AAP)下屬「技術授權委員會」(Enabling Technologies Committee)的成立,該委員會的任務是設計一種在數字環境下保護知識產權和版權所有者商業利益的系統。首先要引進一種出版業標準的數字信息識別碼,以支持出版商與用戶之間各種系統的相互轉換,為版權與使用權之間的協調管理提供基礎。DOI 系統在1997年法蘭克福圖書博覽會上首次亮相,成為數字資源命名的一項標準。1998年在法蘭克福成立了非營利性的組織國際DOI 基金會(International DOI Foundation,IDF),負責有關DOI 的政策制定、技術支持、名址註冊等業務。

1.1

DOI的編碼方式

DOI 的結構式為:

<DOI>=<DIR>.<REG>/<DSS>

DOI 分為前綴和後綴兩部分,中間用一斜杠分開。前綴中又以小圓點分為兩部分,<DIR>為DOI的特定代碼,其值為10,用以將DOI 與其他應用Handle System(句柄系統)技術的系統區別開。<REG>(Registrant』s Code)是DOI 註冊代理機構的代碼,由DOI 的管理機構IDF(International DOI Foundation,國際DOI 基金會)負責分配,由四位阿拉伯數字組成。後綴<DSS>(DOI Suffix String)由DOI 註冊代理機構——目前主要是學術出版商自行給出,規則不限,只要在該出版商的所有產品中具有唯一性即可。如下面幾例都可以是DOI 的合法編碼:

10.1234/5678

10.2341/0—7645—4889—1

10.5678/978—0—7645—4889—4

10.1000/ISBN0764548891

10.1234/Norman-presentation

10.2224/2003—1—29—CENDI—DOI

DOI 的命名結構使每個數字資源在全球具有唯一的標識。DOI 不同於URL,它是數字資源的名稱,而與地址無關。實際上它是一種URI(Universal Resource Identifier,統一資源標識符)或URN(Universal Resource Name,統一資源名稱),是信息的數字標籤和身份證。有了它,就使信息具有了唯一性和可追蹤性。

1.2

DOI 的技術特點

DOI 以兩種技術為基礎:Handle System(句柄系統)和<indecs>元數據框架。

Handle System 是由美國研究創新聯合會(Corporation for National Research Initiative,CNRI)開發的技術平台,用於互聯網信息的命名、解析和管理。<indecs>(Interoperability of Data in Ecommerce Systems)是一套用於在電子商務環境下實現數據互操作的元數據框架,選擇<indecs>作為元數據框架為DOI 的多種應用提供了基礎。

Handle System 和<indecs>元數據框架為DOI 提供了從單一解析到多重解析的應用。首先應用的單一地址解析機製為用戶提供了對數字資源的永久性訪問。為了避免資源地址的改變造成用戶鏈接失效,DOI 系統對資源地址進行了有效的管理。出版商為其每項資源註冊DOI 時,要同時向Handle System 主機提交資源的DOI 名稱和網址(URL)。出版商負責對DOI 數據的維護,當資源地址發生改變,如網絡期刊文章從現刊目錄轉到存檔目錄時,出版商應通知Handle System 主機作相應的改變,以確保鏈接的有效性。當用戶點擊資源的DOI 索取信息時,用戶的請求被傳送到Handle System 服務器上,Handle System 服務器將DOI 解析為URL 返還給用戶終端,使用戶實現對資源的訪問。這一切都在後台進行,對用戶來說,無需理會資源地址的任何更動,面對的始終只是同一個DOI。理論上,DOI 提供的資源鏈接具有永久有效性。

提供對資源的永久性鏈接只是DOI 一個基本而初步的應用。事實上Handle System 技術本身還包含了多重解析(Multiple Resolution)的功能,即從一個DOI 不僅能指向一個URL,還可以指向多個URL,以及URL 以外的其他各種類型的元數據。下面的示意圖顯示了一個DOI 可以被解析為多種類型的數據:

DOI:數字資源的「條形碼」 - 天天要聞

DOI 的多重解析為用戶提供了更多的選擇和便利。在解析出多個URL 時,他們可以選擇離自己最近的一個鏡像站點下載數據;同時,還可以鏈接到該資源的許多相關信息,如獲取元數據、相關主題作品、相關評論文獻、同一作者的其他作品,及相關音樂、圖片、動畫等多媒體信息,版權人及出版商的信息及聯繫方式等等。多重解析不僅確保了對資源的訪問,而且為資源的各種深度利用打開了大門。

2 DOI 的應用及發展前景

目前,加入DOI 的組織和機構已超過300家,DOI 記錄數量接近一千萬個。應用DOI 的文獻開始從英語這一單一語種向多語種發展,應用於法語、德語、西班牙語、意大利語、朝鮮語等文獻。DOI 目前主要應用於文本,但用於聲音、圖像等非文本對象的編碼已在探索之中。

2.1

CrossRef 的成功應用

DOI 為確保網絡學術資源的穩定鏈接提供了一個強大的工具,它首先在這方面得到了有效應用,這就是CrossRef 的誕生。

CrossRef 是一個參考文獻鏈接系統,於2000年9月成為國際DOI 基金會所授權的第一個註冊代理機構。加入CrossRef 的學術出版商,對其出版的學術論文用DOI 進行標註,當用戶在其他論文的參考文獻列表中看到該論文時,只需點擊其DOI 即可鏈接至該論文所在頁面,閱讀摘要或全文。CrossRef實現了學術論文參考文獻之間的動態鏈接,為學術研究創造了極大的方便,取得了巨大的成功。

目前已有約200家出版機構加入CrossRef,自2001年1月以來,CrossRef 每年增加約3百萬個DOI標識,服務器每個月要處理約2百萬條解析。

2.2

電子商務方面的應用前景

實際上,確保對學術信息的穩定鏈接僅僅是DOI 的一個基本應用。前面已經說過,除了資源本身以外,多重解析機制還為用戶提供了大量相關信息的鏈接。但還不僅僅於此,DOI 是一個致力於激發行動的(Actionable)系統,一個促進和服務於電子商務的系統。DOI 之所以採用<indecs>元數據框架的原因正在於此。

回顧DOI 的歷史,可以看出DOI 主要是由出版界發起建立的一個標準,它更多地考慮到促進出版界開展電子商務,保護知識產權和出版商利益的需要。DOI 更大的、主要的目標是電子商務領域的應用。在DOI 通過多重解析導出的各種類型數據中,包含了開展電子商務所需的各項基本元素。讀者在點擊DOI 鏈接到相關的資源時,如果該資源是需要付費購買的,可以馬上引導讀者進入電子商務流程。例如在電子文獻閱讀軟件中內嵌DOI 系統,就可以實現文獻的在線訂購。用戶可以通過DOI 直接鏈接到出版商的網址購買eBook,或者付費打印電子文獻。DOI 在出版界電子商務領域的應用潛力是十分巨大的,雖然這個領域目前還處於開拓之中,但發展勢頭迅猛,一些試驗性的項目已經啟動。

2.3

DOI 的局限與圖書館界的參與

儘管DOI 已初具規模,發展潛力也很大,但也存在一定局限性。由於DOI 對註冊代理機構的審核比較嚴格,而且為了維持DOI 的運作要求會員交納並不算低的會費,目前參加DOI 的多為大出版商,眾多小出版商的產品仍處於DOI 應用範圍之外。雖然DOI 的記錄數量已相當可觀,但相對於海量的網絡信息來說仍只是杯水車薪。從DOI 的參與面來看,目前在DOI 的運作和發展中唱主角的仍是出版界的代表,這使得DOI 多少染上了些商業氣味,也阻礙了它作為一個信息標準在更大範圍的推廣和應用。

一個值得注意的現象是,政府機構、圖書館及其他信息用戶代表正在參與到DOI 的發展進程中來。英國負責出版政府文件的文書局(The Stationery Office,TSO)已成為來自政府方面的第一個註冊代理機構,同時德國、荷蘭國家圖書館和大英圖書館加入了DOI 的非正式論壇。畢竟數字信息資源是全人類的共同財富,而不是出版商的專利。數字信息的編碼和互通對信息資源的共享和利用關係至巨,需要有關各方的共同參與,體現各方的利益和要求。圖書館作為保存和傳播信息資源的公益機構,應積极參与數字資源共享規則的制訂,以維護公眾合理利用信息的權利,達成版權人和使用者之間利益的平衡。

原刊《圖書館工作與研究》2003年第5期

責任編輯:褚欣桐

作者簡介

DOI:數字資源的「條形碼」 - 天天要聞

何朝暉,歷史學博士,現任山東大學儒學高等研究院古典文獻研究所教授。主要研究領域為明史、版本目錄學、書籍史。著有《明代縣政研究》《晚明士人與商業出版》《書籍的社會史——中華帝國晚期的書籍與士人文化》(譯著)、《書史導論》(譯著)等。

出版六家

出版人的小家

出版六家公眾號的所有內容,均為原創。

未經許可,請勿使用。

歡迎合作、轉載。

科技分類資訊推薦

小米YU7 驚現第一批大冤種 - 天天要聞

小米YU7 驚現第一批大冤種

文 | AUTO芯球作者 | 雷慢小米YU7的第一批大冤種出現了!這麼大公司,這麼大的訂單量,我就沒見過這麼離譜的事,還記得6月26日發佈會當晚嗎?雷總在發佈會上怎麼說的?「SU7和SU7 Ultra鎖單未交付用戶可三天內改配YU7」,結果呢,當天晚上10點一開預訂,一大幫人就去改單了,改完出來一看,天塌了!這幫人名下躺着一輛SU7訂...
越級價值兌現!極狐6月交付10352輛 同比增漲65.13% - 天天要聞

越級價值兌現!極狐6月交付10352輛 同比增漲65.13%

在經歷爆髮式增長後,中國汽車行業步入成熟期,市場也逐漸進入「洗牌」階段,在競爭激烈的戰局中,卻有一個車企大幅增長,它就是北汽極狐。2025年6月,極狐全系交付突破10352輛。其中,明星車型阿爾法S5單月交付達3298輛,位列上半年12-15萬級最受歡迎純電轎
陽光新能源iSolarTool 3.0:提效400%,大型光儲電站設計有了最優解! - 天天要聞

陽光新能源iSolarTool 3.0:提效400%,大型光儲電站設計有了最優解!

「這款軟件解放了設計人員的雙手,讓大型光伏電站設計邁入智能化時代!」在2025SNEC國際光伏儲能展上,陽光新能源大型地面光伏電站智能設計軟件iSolarTool 3.0煥新發佈讓不少參展逛展的行業人員紛紛駐足停留、讚不絕口。在電力交易市場化浪潮中,iSolarTool 3.0以「兩首創、兩升級」重塑大型地面電站智能設計新格局:首創基...
盧偉冰回應小米青年公寓定價:反覆討論,最後還是決定1999 - 天天要聞

盧偉冰回應小米青年公寓定價:反覆討論,最後還是決定1999

【TechWeb】7月1日消息,今日,小米集團副總裁、採購委員會主席、資產與工程管理部總經理張劍慧在社交媒體平台發文稱,為提升員工幸福感,小米集團在北京昌平園區附近打造的小米青年公寓正式落成。小米集團合伙人盧偉冰發文回應小米青年公寓定價:定價是反覆討論,最後還是決定1999!他還表示,小米青年公寓的目標是讓剛剛...
科大訊飛等在銀川成立九星科技公司 - 天天要聞

科大訊飛等在銀川成立九星科技公司

每經AI快訊,天眼查App顯示,近日,銀川九星科技有限公司成立,法定代表人為楊陽,註冊資本1500萬元人民幣,經營範圍包括人工智能基礎資源與技術平台、人工智能理論與算法軟件開發、雲計算設備銷售等。股權全景穿透圖顯示,該公司由科大訊飛旗下安徽訊飛雲創科技有限公司以及九川科技(寧夏)有限公司、銀川創新發展投資集...
特斯拉中國宣布:漲價 - 天天要聞

特斯拉中國宣布:漲價

(文/觀察者網周盛明 編輯/高莘)2025年7月1日,特斯拉中國宣布,Model 3長續航全輪驅動版車型售價上漲1萬元,至28.55萬元。 特斯拉中國 在漲價的同時,該車型的續航和加速得到了提升——CLTC續航由713km提升至753km,百公里加速時間由4.4秒提升至3.8秒。值得注意的是,特斯拉Model 3的其他兩個版本售價不變。Model 3後輪驅.
儲能與鋰電領域動態頻出:巨頭競逐、項目簽約與跨界調整並行 - 天天要聞

儲能與鋰電領域動態頻出:巨頭競逐、項目簽約與跨界調整並行

【環球網財經綜合報道】近期,儲能與鋰電領域動態不斷。陽光電源(300274.SZ)與寧德時代(300750.SZ)圍繞第三代儲能電芯定義權展開激烈爭奪。6月,陽光電源發佈搭載684Ah電芯的新款儲能系統,電芯由欣旺達供應;寧德時代宣布587Ah電芯於4月投產。當前儲能行業處於二代向三代電芯過渡期,二代容量為314Ah,兩大陣營分化明...
亞馬遜CEO:生成式AI或致員工數量減少,但也將帶來新機遇 - 天天要聞

亞馬遜CEO:生成式AI或致員工數量減少,但也將帶來新機遇

【環球網財經綜合報道】亞馬遜CEO安迪·賈西周一表示,生成式人工智能的快速推出,意味着公司未來或需更少員工完成計算機可處理的工作,如同每次技術轉型,一些工作將因自動化而用人減少,但也會有新工作產生。東方IC儘管人工智能會消除部分職位需求,賈西稱亞馬遜仍會在人工智能、機械人等領域招聘更多員工。不過,本月早...