【編者的話】
「在北京,看上海」,「澎湃下午茶/京滬之間」系列於2024年5月17日正式啟動。「京滬之間」旨在解析中央政策,探討上海思路。
第一場研討會,暢談中國經濟轉型中的上海戰略。第二場研討會,聚焦國際金融中心建設。第三場研討會,關注科技金融。第四場研討會,討論新稅制與新業態。第五場研討會,探析什麼是高質量孵化器。第六場研討會,討論公共數據開放利用與上海建設國際數字之都。
第六場研討會,邀請了國家信息中心公共技術服務部發展規劃處處長王曉冬,國家數據專家諮詢委員會委員、北京交通大學信息管理與理論國際研究中心特聘教授張向宏,賽智產業研究院院長、北京賽智時代信息技術諮詢有限公司ceo趙剛,上海數據交易所副總經理、上海市數商協會秘書長盧勇。
以下為王曉冬的演講精要。王曉冬提出了公共數據在運營中要解決的八個問題。
國家信息中心公共技術服務部發展規劃處處長王曉冬 吳玉蓉 攝
公共數據是最易落實「數據二十條」的數據類型
公共數據的開發與利用已討論多年。早在2006年《信息資源開發利用指導意見》就已出台。很多今天想要推進的工作,那時就已經有所構思,只是當時條件尚不成熟。如今,在市場化配置改革的背景下,數據逐漸從資源轉變為新的要素,公共數據的研究與開發利用迎來了更好的時機。
近期發布的《關於加快公共數據資源開發利用的意見》,是落實《中共中央、國務院關於構建數據基礎制度更好發揮數據要素作用的意見》(「數據二十條」)的重要抓手。數據二十條對公共數據、企業數據和個人數據三類數據做出了明確界定。從實踐情況看,公共數據可能是最容易落地的數據類型,這與其基礎性、通用性、權威性、公益性和可控性等特點密切相關。
其中,公共數據的基礎性體現在它通常是各類基礎資料庫的集合。這些數據是各行各業進行基礎信息校驗的關鍵。例如,涉及個人信息的二要素(姓名、身份證)、三要素(姓名、身份證、手機)的基礎信息驗證在各行業中的需求很大。
公共數據的權威性源於其得到了行政行為的背書。隨著數據涉及的利益日益複雜,公共數據在法律和行政事務中發揮著重要作用。尤其公共數據現在常在司法過程中作為證據使用,具備法律效力。
公共數據的公益性也非常明確。在討論數據要素市場時,企業數據往往難以集中和匯總,而公共數據則可以通過行政手段進行集中匯聚,是各地數據集建設和國家數據局推動的重要方向。
如何界定公共數據?
理論上,企業數據、個人數據和公共數據的分類視角不在一個維度。實踐中,三者之間也有很大的交叉。例如目前,最大的企業數據集是法人庫,而最大的個人數據集則是人口庫。這三類數據的規模差異很大,公共數據的分量最大。從「數據二十條」來看,其中16處提到公共數據,4處提到企業數據,個人數據則主要集中在信息保護和個人信息保護的範疇。
但是,這些概念之間存在交叉關係。比如企業數據或個人數據達到一定規模時,它們就可能具有公共數據的屬性。也可以形象地說:數據的盡頭就是公共數據。只要數據達到一定規模,往往很難剝離其公益屬性,因為它最終會涉及個人信息和個人利益。因此,公共數據非常重要,因為它的特性最為鮮明。
這也說明,公共數據並不僅僅掌握在政府部門的手中,許多平台、企事業單位也在彙集大量的企業數據和個人數據。從另一個角度看,公共數據包含大量涉及企業和個人的數據,它是一個整體概念,企業數據和個人數據更多是從數據主體的角度來界定。
「數據二十條」在制度上實現了破冰,在權益上進行了強化,並在公益上進一步加強,確保公共數據「取之於民,用之於民」。創新上則留有一定的空間,特別是在如何授權運營、分類分級推進等方面,為各行業和地方留出了創新探索的發展空間。
在「數據二十條」中,還有兩個需要注意的問題。第一,在界定企業數據時,有一個定語,明確對於「不涉及個人信息和公共利益的數據」,市場主體享有依法依規持有、使用、獲取收益的權益。在實際工作中,各類市場主體在生產經營過程中產生的大量數據涉及個人信息和公共利益,界定難度也較大。
第二,安全兜底是一個重要方面。「數據可用不可見」,這一點對授權運營的下一階段具有指導意義。目前看,一些機構的原始數據存在流出情況,甚至通過一些灰色手段在流轉。
將公共數據授權事項納入「三重一大」
基於各行各業對公共數據的普遍需求,國家數據局出台了《關於加快公共數據資源開發利用的意見》,以及《公共數據資源登記管理暫行辦法》《公共數據資源授權運營實施規範(試行)》等兩個配套性文件,加上正在制定的公共數據產品指導定價相關文件,形成了「1+3」的政策體系。
《關於加快公共數據資源開發利用的意見》是國家數據局成立以來研究制定的首個中央文件,是貫徹落實黨的二十屆三中全會精神的重要改革舉措,是定規則、把方向的重大制度安排,是數據基礎制度建設的重要一環,釋放了鼓勵發展的鮮明政策導向。《意見》的核心內容可概括為「1125」:促進公共數據合規高效流通使用的一條主線,提高數據資源開發利用水平的一個目標,著力激發供數動力和著力釋放用數活力的兩個著力點,以及五方面具體舉措。
其中《意見》的重大突破在於將公共數據授權事項納入「三重一大」(編者註:即重大事項決策、重要幹部任免、重要項目安排、大額資金的使用,必須經集體討論做出決定的制度)決策範疇,旨在明確公共數據的授權、經營和使用權歸屬。
與其他領域不同,這是通過行政賦權的方式確定的,而非組織機構天然擁有。具體而言,某個部門的信息中心並不自然具備數據持有權,必須通過上級管理機構納入「三重一大」決策,以避免局限於局部利益,因為公共數據授權運營的核心在於超越局部利益進行考量。
此外,將來還要搭建統一的公共數據登記,需要回答誰來登記,登記什麼和如何登記等問題。目前最主要的問題是,登記是一種「存證」,是一種法律語言,後面是法律的背書,就像婚姻登記、住房登記那樣。但數據的權屬主體,現在來看更多是形式上的存證,因為不會有實質性審查。
做好公共數據運營要解決的六個問題
要確保公共數據運營順利推進,還需解決以下六方面關鍵問題:
第一,數據概念和內涵不清晰的問題。儘管已有明確定義,但在實際操作中仍落地困難。尤其是企事業單位的數據邊界劃分較為棘手,比如很多國企對此領域表現出濃厚興趣,但糾結於數據應歸類為公共數據還是企業數據。此外,企業數據的開發利用及文件間的銜接也需進一步強化。儘管各項定義已給出,但如何清晰劃分數據邊界仍是核心問題。
關於公共數據與企業數據的界定,特別是企業在生產經營過程中合法獲取和持有的數據(如12306掌握的個人售票信息),其開發利用需明確規定。相關政策文件應相互銜接,確保政策的宏觀一致性,避免企業因不清楚適用哪些政策而產生困惑。
第二,關於公共數據應開放還是授權運營的爭議。開放是將所有權、經營權和使用權完全放出,而授權運營則保留政府部門的所有權,轉讓使用權和經營權。由於數據具有可記錄、可批量下載的特性,開放可能導致數據流出難以收回,帶來不可控風險。相比之下,授權運營不僅在操作對象上更具指向性,主要面向專業機構,還對供給條件有更嚴格要求,能夠確保「原始數據不出域」以保障數據的安全與可控。
從供給收益角度看,授權運營具有反哺機制,能夠吸引技術、人才和資本的投入,並以更有針對性的方式組織運營,降低風險。相比之下,開發公共數據的風險較高,簡單的開放並不能解決所有問題,後續的潛在風險和顧慮需謹慎考慮。
政策導向是明確的,未來授權運營領域有巨大空間,而開放數據主要適用於基礎性、通用的公共服務數據。重要的是,授權運營不應削弱公共數據的開放基礎效應,這是一個明確的界限。不能將原本可以開放的數據,因考慮到法律風險或潛在威脅而全部收回,這需要在尺度上做出合理把握。
第三,公共數據的權屬決定問題。今天無論哪個機構獲取數據,都希望將其變現並自行開發利用。解決這一問題的方法是上文提到的,將數據納入「三重一大」管理體系。三重一大的重要意義在於,它能夠超脫部門利益和局部利益,從全局角度出發,考慮全社會的數據使用成本,並促進整個經濟社會數字化轉型的活力。通過這一管理體系,該問題已在一定程度上得到解決。
第四,公共數據開發利用的機制與模式問題。一是缺乏對公共事業單位和企業所掌握數據的明確指引。建議對公共數據進行分類管理,根據不同機構掌握的數據屬性,實施分類分級授權運營。二是現在許多機構和地方的研究人員未充分考慮授權運營的退出機制。三是《十四五規劃綱要》明確提出要探索數據的公共服務,但部門利益分割和數據資產問題依然存在,尤其是數據局與業務廳局之間的關係,這需要進一步統籌和協調。四是公共數據的可控性強,彙集價值巨大,但由於孤島效應和標準不統一,數據的質量問題嚴重。五是公共數據本質上是個人數據和企業數據的結合,涉及廣泛的個人隱私與安全問題。六是平台建設問題、建設模式、技術手段及現有平台體系的適配性也是當前面臨的挑戰。應建立公共數據授權平台,首先實現數據的集中授權模式。
第五,如何確定公共數據的定價和收益成為了難題。關於定價和收益問題,相關文件尚未出台,這一問題確實較為複雜:一方面,應大力推進公共數據授權運營,但另一方面,作為生產要素的數據,其價值不應免費釋放。
收益方面,無論是採用成本法還是收益法,都無法充分體現數據的特殊性。成本法可能低估數據的巨大效益,而收益法又無法全面衡量數據開發利用過程中的增值。比如,某些數據可能對某些人沒有價值,但對他人卻能創造巨大效益。因此,定價應採用混合模式。
在公共數據領域,政府應發揮指導定價的作用。政府並不直接設定具體價格,而是提供定價指導,幫助明確合理的成本與收益空間,確保遵循市場規律。此外,由於不同部門的數據需求迫切程度不同,定價應在合理範圍內形成指導性的價格區間。
第六,公共安全與合規問題不容忽視。數據彙集後自然會帶來更大的安全責任和風險,尤其是在數據流動的背景下。以往,數據安全主要依賴於靜態防護,而今天,數據流動需要實現動態安全,需確保數據在流轉過程中的全程監管和安全防護。目前,靜態安全技術尚未完全適應動態安全的需求,這就需要技術手段的進一步發展和完善。
此外,合規性同樣至關重要,特別是在審計和合規檢查方面。儘管政策已對數據管理進行一定程度的鬆綁,但審計和合規檢查仍然面臨巨大的挑戰。當前,運營模式的成熟度在各地差異較大,不同地區的探索尚不完全一致。全流程動態披露機制在相關文件中已有明確要求,必須在透明的環境下運營,避免私下授受。同時,審計作用應得到充分發揮,確保數據運營的合規性與透明度。
為解決上述問題,需要加快相關立法進程。目前,現有文件尚未上升至法律層面,而調節生產關係需要依賴法律手段。由於政策文件的動態性較強,具體提法可能與政策導向存在不一致。因此,應加強數據立法工作,從國家層面統一數據條例,避免地方性數據條例的差異帶來市場障礙。數據相關概念和內涵應通過法律手段進行嚴謹界定,並在政策制定和頒布過程中確保宏觀一致性。在政策貫徹落實過程中,應系統集成推進,避免不同文件之間的交叉和重複導致的混亂。
數據開放工作的原則和建議
在推進公共數據授權運營過程中需遵循以下四個原則。一是公益原則,要確保數據的基本公益屬性,避免完全商業化。二是增值原則,要推動數據的不斷增值,使其使用價值逐步提高。三是競爭原則,要加強各地競爭,避免由單一機構主導。四是回饋原則,要構建數據循環,連接治理、公益和商業場景。治理場景與數字政府相關,公益場景是數字社會建設,商業場景則是數字經濟。通過授權運營,形成數字政府、數字社會和數字經濟的閉環,避免數字化發展進入「孤島」狀態。
具體而言,對改善以上問題,我還要補充以下幾個建議。
首先,要注意主管部門與業務部門的協同,平衡好地方數據局的權責,避免過度集中或分散的模式帶來的困難。例如,上海等城市可以採取集中模式,而其他地方則需根據具體情況靈活選擇。
第二,要注意數據局的角色,並非所有數據都需通過數據局進行授權運營。例如,企業掌握的數據,如12306的個人售票信息,需在企業平台進行授權運營,因其數據同時具有公共和企業屬性,難以簡單區分。
第三,應推動公共數據轉化為標準化的產品和服務,進入市場流通。授權運營不僅要滿足企業需求,還應確保數據服務廣泛受益,而非僅限於少數企業。
第四,財政部推行的公共數據資產化工作需謹慎推進,避免風險過大。許多地方的資本化運作雖名為市場化,但最終由政府承擔風險,需特別審慎。
第五,數據應根據不同類型(政務數據、市政數據、產業數據等)進行分類授權運營。場景驅動是數據運營的重要經驗,必須根據實際需求推進,而不是空泛概念。
第六,定價規則應根據場景和領域進行靈活調整,避免一刀切。技術手段,如隱私計算、區塊鏈等,可增強數據授權運營的可控性和公平性。不同主體參與的數據平台應具備包容性。
第七,政府和企業平台的打通是未來發展的重點,尤其是國企和央企的數據,需整合成更大的公共數據集,激發潛在價值。
總體而言,數據授權運營不僅是技術和市場的挑戰,更是政策和管理層面的複雜問題,需通過靈活的機制設計,確保公平、安全、可持續地推動公共數據的開發與利用。