作者|賈瑞雪
內容提要
為了打開數字平台的「黑箱」,探究其個人數據收集的結構性特徵和風險,作者以國內用戶日常使用較為頻繁的應用平台(App形式)為樣本,以手機許可權機制和應用平台隱私政策文本為數據來源,在宏觀的「平台社會」視野下,將個人數據的內容結構表徵為三個網路模型。結合社會網路分析發現,安卓系統手機許可權機制的「把關人」角色正在弱化,隱私政策的呈現方式難以保障用戶充分知情,應用平台易於實現個人數據聚合使用與二次使用。根據結構化理論,個人數據的內容結構是個人數據收集實踐不斷結構化的中介和結果。這一結構更多地體現了平台企業的「結構性力量」,平台企業數據收集實踐的制約性與用戶能動性之間呈現出不平衡狀態。
關鍵詞
平台社會 個人數據 結構化
應用平台 隱私政策
正文
一、引言
作為數字新媒介,數字平台已成為人們開展各種實踐的新場景和新工具,並迅速延伸至衣、食、住、行、工作、學習、娛樂等各個領域。「平台化」作為「媒介化」在新型信息技術與社會環境下呈現出的一種特殊形式或具體表徵,使「平台社會」成為對當前「媒介化社會」的精準提煉。平台社會指新型信息技術環境下,人類在各類數字平台中開展社會實踐活動、共享社會資源的一種新型信息社會形態,為理解數字平台在整個社會中的建構性作用提供了概念基礎和理論視野。與此同時,人類生產、生活實踐平台化遷移的直接結果是,作為數據密集型基礎設施的數字平台無時無刻不在記錄和處理用戶的個人數據,並在整個社會層面形成了個人數據的內容結構。在數據成為新型生產要素和基礎戰略資源的平台社會,人們一邊享受著數據增值帶來的便捷且個性化的服務體驗,一邊對個人數據泄露、濫用、非法交易、隱私披露等風險懷有深深的憂慮。個人數據收集作為數據開發、利用的首要環節,形成了怎樣的結構性特徵和有哪些風險,成為當下較為迫切的議題。
人們常用「黑箱」(black box)來形容一個記錄設備,如數據監測系統,或者一個運行機制神秘的系統。數字平台顯然構成了一個黑箱,其持續不斷地收集用戶的個人數據,但是其數據收集機制卻不為用戶所知。一方面,用戶正經歷著一種無所不在的「無感傷害」,隱私權已較難保障其數據權益;另一方面,用戶既缺乏能力,也不願投入時間和精力去了解——其哪些個人數據出於何種目的被收集,就整個社會而言個人數據形成了怎樣的結構性特徵。為了使這一黑箱直觀可見,本研究跳出某一個(類)數字平台的微觀視野,將個人數據收集置於數字平台相互關聯的平台社會的宏觀視野下,將結構視角的相關理論引入個人數據研究中:一方面,基於社會網理論,以量化的關係模式對個人數據的內容結構進行網路化表徵,探究個人數據收集的結構性特徵和風險;另一方面,借鑒結構化理論,揭示個人數據收集的結構化內涵,反思平台企業數據收集實踐的制約性與用戶能動性之間的關係。
從關注媒介技術對受眾態度、認知和行為的影響,到數字媒介的物質性轉向,傳播學的研究範圍不斷拓展。就本研究在傳播學研究脈絡中的位置而言,對數字平台及其數據收集機制的探索,不僅能進一步拓寬數字媒介研究的理論面向,還能夠創新隱私和個人數據研究視角,對平台社會的洞察也有助於豐富媒介與社會研究視野。與此同時,本研究的現實意義在於增進人們對自身數據被收集情況的理解程度,為平台社會視野下個人數據治理提供創新性思路,進而助益於數字平台和數據在社會、經濟運行中發揮重要作用,並防範相關風險。
二、文獻回顧與研究問題
本研究主要從平台與平台社會、個人數據與隱私、個人數據收集機制、結構視角的相關理論基礎四方面進行了文獻回顧,繼而提出研究問題。
(一)從平台到平台社會
「平台」作為媒介化語境下新興的技術、經濟、政治和文化現象,一直是眾多學科研究的熱點:工程設計領域關注平台「模塊化的技術架構」;計算機領域強調平台是「能夠再編程的」;經濟學領域關注平台的「多邊市場性質」;政治經濟學領域批判「平台資本主義」。隨著傳播學界對「媒介」的認識逐漸超越大眾傳播意義上的媒介,「以前不被視為媒介的對象……由於其數字連接性而成為媒介」,對媒介的研究也逐漸跳出以文本為中心的思路。其中,平台研究作為數字媒介研究的新領域,為傳播學帶來了新議題和新視角,比如,平台作為媒介的數字化、中介性和可供性,平台演算法和平台勞工,平台的連接文化和數據化等。
進入21世紀,卡斯特(Castells)的「網路社會」一直是對信息技術影響下社會形態的精準概括。隨著網路基礎設施的「平台化」和數字平台的「基礎設施化」,數字平台已與新型信息技術融合發展並成為人類生產、生活實踐的物質基礎,重新組織、架構了社會諸領域。學術界的注意力也逐漸從平台的用戶界面和功能轉移到其後端資料庫的用戶數據集成上,從「平台作為事物」轉向「平台化作為過程」。在「平台範式」的推動下,網路社會經歷了平台化轉型,平台社會由此形成。平台社會是不同層面平台化的集合體,詮釋了數字平台與社會結構之間不可分割的關係。在這一媒介與社會研究的全新語境與理論視野下,平台研究的想像力被進一步釋放。因而,我們不能再孤立地研究某一個(類)平台,亟需將諸多平台視為相互關聯的網路,在平台社會視野下開展整體研究。另外,數據收集顯然不是某些平台的個別行動,而是整個社會的常規實踐,這一視野也為數據流動議題提供了較為精準的語境。
(二)從隱私到個人數據
隨著平台化日益深入社會生活,數據的流動性和商品化成為不可迴避的現實議題。「個人數據」作為橫跨計算機、信息管理和法學等領域的範疇,與「隱私」既相互重合,又互有界分:隱私強調私密性,其價值基礎在於人格尊嚴和人格自由發展,財產價值並不突出,對隱私權的保護主要是消極防禦;而個人數據集人格利益與財產利益於一體,強調人際交往過程中個人對自身數據的積極利用與控制,具有自主價值和使用價值。經過「去識別化」或「匿名化」處理後的數據利用問題,以及與此關聯的數據資產問題,構成二者的主要差異。
長期以來,傳播學一直在「隱私」的範疇內處理「個人數據」這一命題。隨著信息技術的發展,隱私權已從最初的「寧居權」演化為「信息自決權」,即便如此,其標準和規範也越來越不適應數字經濟快速發展的時代背景,表現出一定的局限性。尤其在數字平台已經邁入到對用戶數據原始積累的「非法興起2.0」階段。身處平台社會,用戶無償地進行著數字經濟原材料(數據)的生產活動,其一切都在被數據化。能夠識別自然人的、並不私密和敏感的公開個人數據,雖不受隱私權保護,但是其數據主體的個人數據權益也應得到保障。我國已將「隱私權」和「個人信息保護」並置於《民法典》人格權編下,明確了二者的邊界。因此,在數據化邏輯深入社會肌理的當下,傳播學的研究焦點亟需從「作為秘密的隱私」轉向「作為控制的個人數據」,尤其是平台研究視野下個人數據的實證研究。
(三)個人數據收集機制
個人數據兼具個體屬性、商業屬性和公共屬性,其權利主體多元,基於職權、法律授權或用戶授權形成了複雜的權力關係與結構。在這一權力結構中,平台企業需通過制定隱私政策和申請調用設備許可權的方式獲得用戶的「知情同意」後才能收集其個人數據。其中,隱私政策是平台企業消除用戶隱私顧慮的重要行業自律措施,也是平台運營的基本資質之一,旨在幫助用戶了解平台會收集其哪些個人數據,為什麼收集,如何收集、存儲、使用和保護等。隱私政策也被視為網站「引誘」網民主動提供其數據的「誘餌」以及發生侵害時的免責聲明。許可權機制是智能終端操作系統內置的訪問控制機制,系統以此來控制應用程序對系統資源和個人數據的訪問。
作為個人數據收集和使用的第一道關卡,隱私政策和許可權機制一般以三種方式呈現和提示:一是增強式告知,在用戶下載安裝、註冊登錄或首次使用某一數字平台時,以默認勾選、手動勾選或不可選擇的方式提示並向用戶徵求同意;二是即時提示,在使用數字平台具體服務的過程中,以提示框方式即時彈出並向用戶申請調用相應許可權;三是用戶主動查詢和管理。即使有隱私政策和許可權機製作為保障,個人數據收集依舊發生在不對稱的權力關係中,對於用戶是否被監視、平台企業如何處理收集到的數據,以及基於數據得出的結論將對用戶採取哪些行動,用戶幾乎沒有選擇權。總之,現有研究多從法理學層面論證個人數據權益的屬性、隱私政策與許可權機制的合規性,而對「數字平台的哪些功能需求對應哪些個人數據收集」以及「就整個平台社會而言個人數據收集形成了怎樣的結構性特徵」等基本問題缺乏實證研究。
(四)結構視角的相關理論基礎
事物都是由結構組成的,一組特性之所以被稱為「結構」,是由於它相對於其他特性而言具有穩定的決定作用。不同結構視角對應著不同理論基礎和分析路徑,本研究主要基於結構分析的關係傳統和文化傳統。關係傳統主要源於系統論和社會網理論。在系統科學中,「結構」指系統各元素之間相互關係、相互作用的總和,一旦形成,會反過來對元素之間的關係和行為施加約束和限制作用。作為結構的重要形式,網路由節點和連接構成,其核心是關係的集合,其中節點表示系統的元素,節點之間的連接表示元素之間的相互作用。隨著社會網理論和社會網路分析法的發展與成熟,用量化的關係模式對社會現象進行網路化表徵,已成為主流的研究方法。社會網路作為個人能動性與結構制約性相互作用的介面,能夠同時對行動和結構進行檢驗,是目前結構分析最有力的工具之一。
在文化傳統方面,關於結構與個體的關係,現代西方社會理論界具有這樣的認識論分野:強調「結構」的各種結構主義和功能主義,關注結構和制約問題;強調「個體」的各種解釋學思想傳統,關注主體性、行動和意義。吉登斯(Giddens)的結構化理論(structuration theory)拋棄了僅僅從主體或者客體出發研究社會的二元論視角,確立了從人類「社會實踐」出發看待社會的研究思路。其核心可提煉為「結構二重性」(duality of structure),結構中的行動與行動中的結構辯證統一地融合在一起,「社會系統的結構性特徵對於它們循環反覆組織起來的實踐來說,既是後者的中介,又是它的結果。」通過實踐,社會結構制約性與個人行為自主性之間的互構關係得以實現,結構得以跨越時間與空間被具有自主性、能動性的人類生產與再生產出來,繼而反作用於人類實踐。
綜上所述,本研究將結合社會網理論與結構化理論的結構視角,一方面通過網路模型表徵個人數據收集者(由不同功能模塊構成的應用平台)與收集內容(個人數據)之間的關係結構,發現個人數據收集的結構性特徵和風險;另一方面思辨地看待個人數據內容結構的構成性、實踐性和生產性等特徵,反思「結構-行動」互構過程中平台企業與用戶之間的相互作用關係。
(五)研究問題的提出
RQ 1:應用平台將通過申請調用哪些手機許可權類別來收集用戶的個人數據,這些應用平台與其會申請調用的手機許可權之間形成了怎樣的網路結構?
RQ 2:應用平台會收集用戶的哪些個人數據,這些應用平台與其會收集的個人數據之間形成了怎樣的網路結構?
RQ 3:應用平台將基於哪些功能模塊需求收集用戶的個人數據,這些功能模塊與其需求的個人數據之間形成了怎樣的網路結構?
RQ 3a:由於會被同一功能模塊收集,個人數據之間會形成怎樣的網路結構?
RQ 3b:由於需求相同類別的個人數據,功能模塊之間會形成怎樣的網路結構?
RQ 4:個人數據的內容結構是如何形成的?
三、研究設計
(一)應用平台樣本選取
應用平台和以智能手機為代表的智能終端平台是國內用戶日常使用較為頻繁的數字平台。截至2021年12月,我國通過手機接入互聯網的網民達10.29億,佔整體網民規模的99.7%,國內市場上監測到的App在架數量達252萬款。2020年6月,15-19歲網民人均手機安裝App數量最多,有83個;10歲以下人均手機安裝App數量最少,有28個。本研究根據大數據產品「易觀千帆」提供的對全網App活躍人數的排名,選取2019年5月榜單中的Top 80為研究樣本,覆蓋資訊閱讀、社交互動、電商服務、影音娛樂和實用工具五大類應用平台。
(二)編碼與數據採集
由於手機操作系統、應用平台及其隱私政策和許可權機制始終處於快速迭代狀態,本研究的編碼與數據採集工作主要集中於2019年7月8日-2019年7月20日。應用平台作為一種複雜、綜合的服務,由多種功能模塊和多類個人數據構成,因此本研究首先對「功能模塊類型」和「個人數據類別」進行了編碼,類目詳情見表1。然後,兩位編碼員根據編碼細則同時對80個應用平台的隱私政策文本進行數據採集,並以「應用平台-功能模塊-個人數據」三元組的形式記錄在Excel中,共計2197條記錄。每一行表示某一應用平台將會針對某一特定功能模塊收集某一類個人數據一次。在80個應用平台中隨機抽取10個共計335條記錄(超過5%),以獨立編碼者檢驗,krippendorff's=96.7%,具有較高的信度。最後,查詢手機中所安裝的80個應用平台的許可權情況,採集「應用平台-許可權」數據並以二元組的形式記錄在Excel中,共計814條記錄。每一行表示某一應用平台會申請調用某一類手機許可權。

(三)數據處理與分析
針對以上採集到的數據,本研究主要進行了隸屬網路(affiliation network)分析。隸屬網路是一個「2-模網」,用來表示一組行動者與一組事件之間的隸屬關係,由行動者集合N={n1,n2,…,ng}和事件集合M={m1,m2,…,mh}構成,可以表述為:行動者屬於某個事件,或者行動者是某個事件的成員。本研究採用「2-模關係矩陣」對三個隸屬網路進行標示,操作詳情如表2所示。此外,由於行動者和事件之間的關係具有對偶性(duality)——行動者由他們所屬的事件彼此關聯,同時,事件也由它們的行動者而關聯在一起,因此,隸屬網路可以從行動者和事件兩個視角分別進行研究。也就是說,「2-模關係矩陣」可以轉換成兩個「1-模關係矩陣」:「共同參與矩陣」XN,記錄了每對行動者同在的事件數目;「事件關聯矩陣」XM,記錄了同在兩個事件的行動者數目。本研究將根據研究需要對以上三個「2-模關係矩陣」進行相應的轉換。最後,通過社會網路分析工具UCINET對以上所有關係矩陣做進一步分析。

四、研究發現
通過建構網路模型,本研究從三個層次層層遞進地分析個人數據的內容結構。
(一)應用平台與其會申請調用的手機許可權類別分析
針對RQ 1,由Top 79應用平台構成的「應用平台-許可權」隸屬網路拓撲結構模型如圖1所示。其中,方形節點代表應用平台,共79個;圓形節點代表應用平台會申請調用的手機許可權,共21個;兩類節點之間共形成了814條連接,網路密度為0.5,表示實際的連接數(814)與理論上最大的連接數(79×21=1659)的比值,說明兩類節點較為緊密地連接在一起。節點大小代表了度數中心性,即與節點直接連接的其他節點的個數。手機許可權節點的度數中心性等於它所屬的應用平台的數目,平均度數中心性為38.8,表示每類手機許可權平均會被38.8個(49.1%)應用平台申請調用。如圖2所示,幾乎所有應用平台都會申請調用手機的存儲許可權、電話(設備信息)許可權、位置信息許可權和相機許可權。應用平台節點的度數中心性等於它會申請調用手機許可權的數目,平均度數中心性為10.3,表示每個應用平台平均會申請調用10.3類(49%)手機許可權。360手機衛士(18)、應用寶(17)、騰訊手機管家(17)、百度手機助手(17)、360手機助手(17)、QQ同步助手(16)等實用工具類應用平台會申請調用手機許可權的類別數較多。

(二)應用平台與其會收集的個人數據類別分析
針對RQ 2,由Top 80應用平台構成的「應用平台-個人數據」隸屬網路拓撲結構模型如圖3所示。其中,方形節點代表應用平台,共80個;圓形節點代表應用平台會收集的個人數據類別,共29個;兩類節點之間共形成了1162條連接,網路密度為0.5。每類個人數據平均會被40個(50%)應用平台收集,其中,操作和服務日誌數據(80)、設備數據(80)、位置數據(79)、手機號碼(75)、網路身份標識數據(75)、真實姓名(68)、交流互動數據(60)是大多數應用平台會收集的個人數據類別。每個應用平台平均會收集145類(50%)個人數據,其中,滴滴出行(24)、攜程(24)、高德地圖(23)、360手機衛士(22)、天貓(21)、酷我音樂(20)、手機淘寶(20)、中國工商銀行(20)等會收集較多類個人數據,多為電商服務類應用平台。

(三)應用平台功能模塊類型與其需求的個人數據類別分析
1. 「功能模塊-個人數據」隸屬網路分析
針對RQ 3,由Top 80應用平台構成的「功能模塊-個人數據」隸屬網路拓撲結構模型如圖4所示。其中,方形節點代表應用平台的不同功能模塊類型,共16個;圓形節點代表為實現不同功能需求應用平台會收集的個人數據類別,共29個;兩類節點之間共形成了251條連接,網路密度為0.5。每類個人數據平均會被8.7類(54.4%)功能模塊需求,其中,設備數據(16)、照片/視頻/錄音(15)、位置數據(14)、關係數據(12)、網路身份標識數據(12)、財產數據(11)、操作和服務日誌數據(11)、地址(11)、身份證(11)、手機號碼(11)、真實姓名(11)等個人數據會被更多功能模塊需求。每一類功能模塊平均會需求15.7類(54.1%)個人數據,其中,第三方提供的服務(21)、出行服務(20)、金融服務(20)、客服和售後(20)、運行和安全保障(20)、註冊登錄(19)、其他生活服務(19)、商品購買(18)、身份認證(17)等功能模塊需求的個人數據類別較多。

2. 「個人數據-個人數據」1-模網路分析
針對RQ 3a,由「功能模塊-個人數據」隸屬網路轉換而來的「個人數據-個人數據」1-模網路共有29個節點,391條連接。由於個人數據的共同參與關係是「有值的」,網路密度等於個人數據成對連接的平均值,為5.0,即每一對個人數據平均會參與5類功能模塊的建構。節點的度數中心性表示不同類別個人數據會共同參與功能模塊建構的次數。該網路中個人數據節點的平均度數中心性為139.1,最大值為235,最小值為42,其中,設備數據(235)、照片/視頻/錄音(225)、位置數據(205)、關係數據(194)、地址(192)、手機號碼(192)、真實姓名(192)、身份證(192)等個人數據與其他類個人數據共同參與功能模塊建構的次數較多。對該網路進行凝聚子群分析,能夠幫助我們進一步了解哪些類別的個人數據更有可能聚集在一起。派系(clique)是一種較為嚴格的凝聚子群概念,是至少包括三個節點、任何兩個節點之間彼此鄰接、關係緊密的最大完備子群。對於多值網路,首先要確定該子群的凝聚程度,即臨界值c,c值越大,則子群的凝聚力越強,節點之間的關係強度越大,其所包含的派系被稱為「c層派系」。該網路共有4個11層派系(c=11),見表3,這些派系由所有至少共同參與11類功能模塊建構的個人數據類別組成,相互重疊。
3. 「功能模塊-功能模塊」1-模網路分析
針對RQ 3b,由「功能模塊-個人數據」隸屬網路轉換而來的「功能模塊-功能模塊」1-模網路共有16個節點,120條連接,是一個全連通網路,即任意兩個功能模塊均會需求同一類個人數據,每一對功能模塊平均會需求9.5類個人數據。不同功能模塊類型需求同一類個人數據的次數的平均值為141.9,最大值為187,最小值為70。其中,第三方提供的服務(187)、客服和售後(185)、運行和安全保障(183)、出行服務(175)、金融服務(175)、其他生活服務(166)、商品購買(164)等功能模塊與其他功能模塊需求同一類個人數據的次數較多。該網路共有4個15層派系(c=15),見表3,這些派系由所有至少共同收集15類個人數據的功能模塊組成,相互重疊。

五、研究結論與討論
本研究主要從手機許可權機制的「把關人」角色、隱私政策的呈現方式、個人數據的聚合使用與二次使用,總結了平台社會視野下個人數據收集的結構性特徵和風險,並借鑒結構化理論對平台企業與用戶之間的不平衡關係進行了反思。
(一)安卓系統手機許可權機制的「把關人」角色正在弱化
智能手機的操作系統是控制用戶數據收集許可權的初始環節,應用平台是收集用戶數據的直接載體。安卓系統手機許可權機制理想的運行邏輯是,應用平台需要在AndroidManifest.xml配置文件中以明確聲明的方式(靜態方式),以及在代碼運行階段以請求的方式(動態方式)申請系統許可權。然而在實際運行中,由於安卓系統的開放性以及應用商店安全性審核的缺失,應用平台總是能夠利用許可權機制的固有缺陷超出其功能需求範圍收集用戶數據。作為應用平台收集用戶數據的「把關人」,安卓系統手機許可權機制並未充分發揮其保護用戶個人數據的作用。
第一,應用平台與其會申請調用的手機許可權之間形成了緊密相連的隸屬網路。存儲許可權、電話(設備信息)許可權、位置信息許可權、相機許可權、麥克風許可權和通訊錄(讀取聯繫人)許可權等幾乎成為每個應用平台都會獲取的「標配」,這意味著對照片/視頻/錄音、文件數據、設備數據、位置數據和關係數據等個人數據的普遍獲取。第二,應用平台強制、過度索取手機許可權的現象並不少見。比如,只要用戶不同意,應用平台就會持續不斷地彈窗申請許可權,為了流暢的使用體驗,用戶只能點擊允許,而且許可權一旦授予,應用平台就始終擁有該許可權,此外還有一些應用平台在安裝時就要求用戶「一攬子授權」。第三,安卓系統手機許可權機制的運行過於依賴用戶的判斷。為了正常使用應用平台,用戶授予許可權在某種程度上是一件無法拒絕的事,至於通過這些許可權獲取的個人數據是否會被用於與初始收集目的無關的其他目的,用戶一無所知。針對上述情況,需強化操作系統的隱私設計理念,將數據保護相關的智能程序預先「嵌入技術、商業準則和物理存在的基礎設施的設計標準中」,「使其成為系統運行的默認規則」,而無須用戶採取過多行動。與此同時,應用商店也要嚴格審核並對違反操作系統許可權要求的應用做下架處理,甚至和企業信用相關聯,共同從源頭上規範個人數據收集亂象。
(二)隱私政策的呈現方式難以保障用戶充分知情
分類與分級是認識世界的一種視角,解釋事物的一種方法,也是風險識別的基礎,對個人數據進行分類分級保護已成為學界共識。根據使用場景、安全級別、私密程度、敏感程度等維度,均可對個人數據類別進行劃分。然而,僅僅對個人數據分類只能呈現靜態、孤立的內容,而對個人數據類別與應用平台功能模塊類型之間關係的可視化則有助於表徵動態、關聯的個人數據內容結構。在隱私政策中,相互關聯的「功能模塊-個人數據」比現行的呈現方式更具治理層面的操作意義。這一細粒度的呈現方式能夠同時說明個人數據的類別與用途,不僅更符合用戶的認知習慣,而且能在一定程度上緩解用戶與平台企業之間的「信息不對稱」。
平台的生態系統本質,決定了其會以接入第三方服務的方式全方位拓展其功能,而更多的功能往往意味著更多的數據需求。我們可以將應用平台收集的個人數據概括為三類:一是為實現應用平台基本功能而必須收集的數據,若用戶拒絕則無法使用該平台,針對這一類數據的監管,中央網信辦、工信部、公安部、市場監管總局聯合制定了《常見類型移動互聯網應用程序必要個人信息範圍規定》;二是為實現應用平台附加功能而選擇收集的數據,若用戶拒絕則無法達到服務的預期效果;三是為實現應用平台第三方服務而選擇收集和共享的數據,第三方遵守其自身的隱私政策,平台只能敦促其為用戶數據提供足夠的安全保護,並不因其不當使用行為承擔法律責任。基於此,「功能模塊-個人數據」的呈現方式能夠避免將用戶置於「照單全收」或「全盤否定」的選擇困境中,使用戶能夠在使用某項功能或服務之前較為清晰地認識到哪些個人數據將會被收集以及用於何種用途,是否有其他備選方案,從而做出更加明智的選擇。
雖然我國法律規定了處理個人數據應當遵循「合法、正當、必要和誠信原則」,以及「公開個人信息處理規則,明示處理的目的、方式和範圍」。但是,由於隱私政策的形式化、低可讀性、告知條款不合規,平台企業的「告知」與用戶的「知情」之間存在不小的鴻溝。「告知同意原則」因此被戲謔為:告知不是真正的告知,同意也並非真正的同意。相較於晦澀難懂、冗長繁複的政策文本,平台企業可基於可視化方式,比如「功能模塊-個人數據」網路,主動將其收集、使用個人數據的類別和目的明確告知用戶,使用戶在充分知情的前提下同意授權平台企業處理其個人數據。此外,平台企業目前普遍採用的「一攬子」、「選擇退出」模式的同意機制,使得個人數據收集成為「一鎚子買賣」,難以保障用戶有效同意。因而,基於「功能模塊-個人數據」進行個人數據分類分級,以及「構建『選擇退出』+『選擇進入』的可協商式同意模式」,將有利於風險管控前置。
(三)應用平台易於實現個人數據的聚合使用與二次使用
平台是數據連接的載體,相較孤立、單個的數據,只有在網路中的數據才有價值。應用平台中同一功能模塊對個人數據需求的多樣性,使不同類別個人數據的聚合使用成為一種趨勢。應用平台中不同功能模塊對個人數據需求的同一性,使個人數據在不同功能模塊之間的二次使用成為可能。其中,「聚合」指統計意義上由平台編碼定義的用戶特徵或屬性創建新的、更高級別數據實體的計算操作。
個人數據的聚合使用與二次使用同時蘊含著巨大的利益與風險。對於前者而言,同時被一類或多類功能模塊需求的個人數據之間建立了連接,這一潛在的連接表明這些個人數據更容易被聚合,從而應用平台可以通過多樣化收集和聚合使用實現這些數據的整合價值。但是,由於脫離了社會文化語境,聚合建立了數不清的重數、再結合和重組數據的可能。因此,平台企業要注意個人數據聚合帶來的再識別與隱私披露風險,必要時開展個人數據安全影響評估,並基於風險評估採取有效的個人數據保護措施。對於後者而言,共同需求一類或多類個人數據的功能模塊之間建立了連接,這一潛在的連接表明,由於數據的非排他性和使用非損耗性,平台企業只需進行一次收集,就可以基於原始數據進行「二次-N次使用」,從而有效降低個人數據重複收集與管理的成本,提高個人數據使用效率並充分挖掘其價值。但是,平台企業也要注意,現行的告知同意原則往往建立在初次使用上,在變更個人數據處理目的、方式前,應重新取得個人數據主體的同意,以免將用戶置於失控的、「N次使用」的黑箱風險之中。
(四)平台企業數據收集實踐的制約性與用戶能動性之間的不平衡關係
藉助網路模型的表徵,本研究發現,在相互關聯的平台社會視野下,除非不使用應用平台服務,否則所有個人數據終將作為「免費使用」的「對價」交與平台企業:不是通過這一類功能模塊,就是通過那一類功能模塊;不是通過這一個應用平台,就是通過那一個應用平台。而且,個人數據還將在數據開放、共享的背景下高速流轉並充分聚合。基於多維度的開放關係,應用平台之間將形成基於後端個人數據流的開放關係網路結構,從而帶來個人數據風險範圍擴大、個人可識別與再識別出來的風險增加、個人對其數據的控制力削弱等問題。在被各類功能模塊需求較多的個人數據中,財產數據、銀行卡、個人生物識別數據、行蹤軌跡、健康生理數據、徵信數據等均屬於敏感個人數據,「一旦泄露或者非法使用,容易導致自然人的人格尊嚴受到侵害或者人身、財產安全受到危害。」而設備數據、操作和服務日誌數據等作為用戶在線交互的附隨產物,即不包含用戶勞動要素的「機器生成數據」,雖然無法用來單獨識別特定自然人,但往往能和其他數據結合識別特定自然人。這些聚合數據作為個人興趣、偏好、行為習慣等用戶畫像的重要來源,甚至能構成新型隱私。而且,國際移動設備標識(IMEI)和媒介訪問控制(MAC)地址等手機設備識別碼可以唯一識別一部移動設備,一旦該識別碼被收集並與用戶綁定,用戶在該設備上的行為就可以被追蹤。
前文已總結了個人數據收集的結構性特徵和風險,並簡要提出了應對措施,接下來,本研究將借鑒結構化理論進一步反思,以回答RQ 4。個人數據的內容結構是個人數據收集實踐不斷結構化的中介和結果。參與這一結構化進程的主體主要有平台企業、用戶和政府機構,它們分別扮演著個人數據收集者、被收集者和監管者的角色。個人數據的內容結構就是在三者的互動影響下形成的,其結構性特徵表明三者的利益並不均衡(本研究主要聚焦於前兩者),更多地體現了平台企業的「結構性力量」。在「結構-行動」的互構過程中,平台企業是「規則與資源的結構性佔有者」,權力的天平明顯偏向它,其通過許可權機制、隱私政策、前端用戶界面的功能模塊、後端數據的自動提取與集成,以及雲計算和大數據、人工智慧等強大的技術支撐,建構了個人數據的內容結構。而用戶的能動性極為有限,面對平台企業建立的數據收集機制,「知情同意」這一看似用戶自主選擇的背後其實暗含著平台企業「結構性力量」的壓制,二者處於極不平衡的狀態。雖然前文提到用戶可以根據細粒度的「功能模塊-個人數據」謹慎地使用相關功能並授予相應數據,然而,平台功能本身就是精心設計和操縱的結果。有研究表明:「社交媒體平台本質上是基於數據的組織,從它們自己設計的社交日常生活中提取價值和利潤。」也就是說,即使用戶具有一定的能動性,也很難對平台的整體架構施加太多影響。而且,當前的平台權力已不僅僅局限於單個企業,更在於作為一個整體的連接型生態系統的協調和規則制定權力,其重新組織了圍繞平台展開的一系列關係。此外,用戶對個人數據內容結構的反向建構能力和意願也極為有限。「個人數據素養」包括數據識別、數據理解、數據反思性、數據使用和數據花招五個領域的能力,這顯然不是任何一個普通用戶能夠輕易具備的。因此,「絕大多數的個體行動對結構影響微乎其微……社會結構制約性與個人行為自主性之間的互構,不是一種平等的互構。」換言之,平台企業的數據收集機制對用戶的制約性要遠遠大於用戶對這一機制的能動性。
數字化使人類進入一個「深度媒介化」的階段。在這一媒介環境中,社會世界的所有元素都與數字媒介及其基礎設施密切相關,這些基於軟體的、高度互聯的數字媒介不再僅僅是交流工具,還可以作為數據生成器,使自動數據處理成為我們社會世界建構的基本組成部分。數字平台作為我們這個時代最典型、價值創造效率最高的數字媒介,正在「使社會生活成為一種開放的、用於提取的資源」,並「圍繞數據收集利潤最大化實現對人類生命的重構」。隨著人類越來越深度地捲入「平台化生存」,方方面面的個人數據將聚合成一個個「數據化的自我」。在平台社會這一「超級全景監獄」中,個人將變得越來越透明,並呈現出客體化傾向。與此同時,平台這一黑箱將變得越來越隱秘,尤其是佔有技術、信息、市場等多種資源優勢的基礎設施平台將形成強大的「私權力」,從而「社會和經濟流量越來越多地受到一個由演算法和數據驅動的全球在線平台生態系統(絕大多數是企業)的調節」。由此,平台企業與用戶之間的商品化關係將形成一種新型控制方式,整個社會像是一面「單向鏡」,「重要的企業行動者對我們的日常生活細節有著前所未有的了解,而我們對它們如何利用這些知識影響我們和它們做出的重要決策卻幾乎一無所知。」「害怕的事情並不是失去隱私本身,而是單向的失去隱私——也就是說,我們無法監視那些監視我們的人。」長此以往,在時空向度上穩定下來的個人數據內容結構將隨著例行化的個人數據收集實踐不斷地被維持並再生產出來,而其中的風險也極易轉變為危機。本研究有助於引導人們關注使數據收集、處理成為可能的技術和物質的基礎設施,及其背後的政治經濟關係。面對平台企業數據收集實踐的制約性與用戶能動性之間的不平衡,適當干預這一結構化進程,讓用戶的能動性充分發揮出來,以實現「個人對個人信息保護的利益、信息業者對個人信息利用的利益以及國家管理社會的公共利益之間的平衡」尤為重要。從法律、經濟、行政和技術等層面制定的或改良、或激進的用戶賦能方案,均可作為走出結構困境的有益嘗試。
六、研究局限
第一,本研究按照「功能模塊-個人數據」方式對應用平台隱私政策文本中關於個人數據收集的內容進行了編碼與採集,但是,某些應用平台的隱私政策並沒有完全按照這一方式呈現。而且,隱私政策中的內容不一定符合現實實踐情況。未來可考慮採用其他打開黑箱的方法和技術手段進一步豐富數據來源。第二,本研究只選取了國內Top 80的App為樣本,只考察了安卓系統運行環境,這一個案研究雖然具有一定的代表性,但無法全面反映平台社會視野下個人數據內容結構的複雜性。未來可考慮進一步擴大樣本數量,並對比國內外平台的個人數據收集情況。第三,數據分類分級是數據治理的重要議題,本研究從功能維度對個人數據做了類型化分析,未來還應結合敏感性、重要性等維度做進一步分類分級。
載《新聞與傳播研究》2022年第7期
囿於篇幅,公號捨去注釋,完整版本請見刊物。
編輯 | 朱婧