摘要:在數據要素價值化背景下,檔案數據進入要素市場實現流通交易已是現實與趨勢,如何兼顧檔案數據隱私保護亟待解決。文章認為檔案數據隱私既來源于記載個人私密信息的各類傳統檔案,也來源于有關數據的檔案化。在數據要素的資源化、資產化和資本化的不同階段,檔案數據隱私風險主要表現為數據采集風險、數據共享風險和數據跨境流動風險等,其表現多樣且具有多種特征。對上述多樣性且特征各異的檔案數據隱私風險應依據檔案數據隱私治理模型,從法律手段、技術手段和行政手段三個角度開展治理。
關鍵詞:檔案數據隱私;檔案數據要素;數據價值化;隱私治理
分類號:G273.5
Research on Privacy Risks and Governance of Archival Data from the Perspective of Data Element Valorization
Zhou Yi, Chen Meijun
( School of Social Science, Soochow University, Suzhou, Jiangsu 215123 )
Abstract: Under the background of data factor valuing or transaction, it is a reality and a trend for archival data to enter the factor market and be circulated and traded, and it is urgent to solve the problem of how to take archival data privacy protection into account. In this paper, we analyze and identify the types of archival data and the sources and types of privacy risks in archival data valuing by using literature analysis and data value chain theory, and develop an archival data privacy governance model under the perspective of data factor valuing. The article argues that archival data privacy originates both from various types of traditional archives that record individuals’ private information and the archiving of data. At different stages of converting data factors into resources, assets and capital, archival data privacy risks are mainly manifested as data collection risks, data sharing risks and data cross-border flow risks. As these risks are diverse and have various characteristics, they should be managed from three perspectives, namely legal, technical and administrative means, in accordance with the archival data privacy governance model.
Keywords: Archival Data Privacy; Archival Data Factors; Data Valuing; Privacy Governance
數據是重要的生產要素已經成為重要的社會共識?!蛾P于構建更加完善的要素市場化配置體制機制的意見》《關于構建數據基礎制度更好發(fā)揮數據要素作用的意見》(簡稱“數據二十條”)《“數據要素×”三年行動計劃(2024—2026年)》等政策為數據要素流通和價值釋放提供了基本指引。
檔案數據是數據家族中的重要成員,其類型可初步分為公共檔案數據、企業(yè)檔案數據和個人檔案數據等,上述類型檔案數據在來源上相互交織。例如,公共檔案數據、企業(yè)檔案數據就包含大量個人數據,各類網絡服務平臺(如互聯網醫(yī)院或網絡問診平臺)在業(yè)務活動中會將用戶個人數據進行檔案化管理,從而形成企業(yè)檔案數據。從信息公開到數據開放再到數據要素流通交易的過程中,往往伴隨著個人檔案數據使用權的讓渡,如何保護檔案數據隱私已成為不可回避的問題。
1 研究進展與問題提出
1.1 研究進展
近年來,檔案數據要素價值問題逐漸引起學界關注,現有研究在概念界定和理論研究上已積累一定研究成果。有學者從歷史源流[1]、價值和使用價值[2]、治理價值[3]和開放共享價值[4]等角度對檔案數據是否能夠成為生產要素進行探析。部分學者在肯定檔案數據要素價值基礎上,結合數據生命周期理論和價值鏈理論構建檔案數據價值化模型,提出數字中國戰(zhàn)略下檔案數據要素價值實現路徑。[5-6]
在信息資源管理相關學科中,部分學者從政策、技術、實踐等不同視角對數據安全、數據隱私保護等相關問題進行研究,內容主要圍繞數據隱私風險類型、數據隱私風險識別與量化和數據隱私治理等方面展開。
目前,學界對如何劃分隱私風險類型尚未形成統一觀點?;谏芷诶碚撘暯?,蔣明敏等將隱私風險劃分為數據采集階段的數據知情權風險、數據組織和存儲階段的數據操作權和控制權風險、數據流動和傳播階段的數據真實性和隱私泄露風險、數據利用和服務階段的數據關聯性風險、數據遷移和銷毀階段的數據訪問風險[7];吳寧博等通過文本內容分析《中華人民共和國個人信息保護法》和相關文獻并結合實證調研,提出了16個隱私風險要素[8]。也有部分學者更傾向于從風險來源角度分析隱私風險類型,如劉新萍等認為隱私風險主要來源于法規(guī)政策、管理和數據三個層面[9];衛(wèi)瑋則將其劃分為政府部門泄露、社會公眾泄露、平臺技術泄露以及數據保密審查泄露四個方面[10]。
有關數據隱私風險評估的相關研究大多集中于構建隱私風險評估模型,并據此進行隱私風險量化研究。羅康等提出一種面向數據發(fā)布場景的隱私泄露風險量化評估方法,通過構建敏感數據矩陣并進行隱私等級標記,計算得到字段屬性隱私權重,利用矩陣范數計算得出隱私風險值[11];臧國全等分別基于個人通信數據[12]、個人金融數據[13]、個人教育數據隱私文本[14],識別敏感數據并計量隱私值。部分學者參考國外數據隱私風險評估實踐經驗為我國提供借鑒,如陳美通過總結和歸納英國經驗,結合我國在政府開放數據中存在的隱私風險隱患,提出應制定完善的開放數據政策、構建完善的隱私風險評估體系、加強隱私管理等[15]。
目前數據隱私治理的相關研究多聚焦于公共數據開放過程。盛小平等從治理主體、治理客體及治理活動3個要素構建數據隱私治理結構,形成數據隱私風險治理路徑[16];朱貝等在厘清科學數據共享隱私問題的基礎上,提出4項隱私治理原則,構建隱私治理模型,探索了科學數據共享中的隱私治理對策[17]。
從學界研究進展與業(yè)界實踐看,現有數據隱私保護一般基于個人主義保護范式來實現,而在數據要素流通背景下該范式已經日漸式微,很難改變具有身份識別性的檔案數據所指向的自然人(即檔案領域的數據主體,下文簡稱“檔案數據主體”)在隱私保護中所處的不對等地位。[18]
1.2 問題提出
檔案學界目前對數據要素價值化中的檔案數據流通交易和由此引發(fā)的數據隱私保護治理等問題的研究仍處在起步階段。據學者判斷,目前我國個人數據交易并非發(fā)軔于數據用戶與企業(yè)之間,更多的是在企業(yè)之間進行交易。由于個人數據交易的立法缺失,大量的個人數據交易無法在白市進行,而是在灰市和黑市交易。[19]與此相類似,與個人隱私有關的檔案數據交易已經普遍化,并已形成一定的產業(yè)規(guī)模,但其交易也有多在灰市或黑市進行的傾向,其中所暴露出的數據隱私安全問題十分突出。如何順應數據要素價值化要求,將檔案數據交易從地下或場外交易轉變?yōu)楹戏ê弦?guī)的場內交易,并規(guī)范和加強流通交易過程中的數據隱私保護成為一個緊迫問題。基于此,本文擬通過識別檔案數據要素價值化不同階段的隱私風險類型、來源或特征等,構建檔案數據要素的隱私治理框架,為檔案數據要素規(guī)范流通和主動融入數據要素市場提供借鑒和參考。
2 數據要素價值化過程中的檔案數據隱私風險識別
2.1 檔案數據隱私概念闡釋
進入價值化過程和流通的檔案數據有兩類:一是數據形態(tài)的檔案[20],二是具備檔案屬性的數據[21]。數據形態(tài)的檔案是存量檔案數字化成果和增量電子檔案的統稱。具備檔案屬性的數據的主要形態(tài)是以數字信號進行記錄和保存的、以數據為顆粒度的信息記錄,如關系型數據庫文件、GIS數據、三維數據、數字交付模型等[22],具體而言,其包含各類專題或特色基礎數據庫、公共數據庫,網絡信息或網頁數據,自媒體信息或數據,政務微博、政務微信、公務郵箱等平臺形成的數據或電子文件等。上述檔案數據均包含大量數據隱私。數據隱私是一種以個人數據形式記錄或以數字方式描繪的自然人的私人生活安寧和不愿為他人知曉的私密空間、私密活動和私密信息等。[23]
從檔案數據隱私主體的行為出發(fā),可以將檔案數據隱私細分為“主動數據”隱私和“伴生數據”隱私?!爸鲃訑祿彪[私是有關主體根據工作需要、有關管理規(guī)定等954G1PDUMLR3p0mGt2+vbA==,主動生成或提供的各類人事檔案數據,或其它上傳或授權服務平臺讀取的數據,如姓名、身份證號碼等身份標識符數據,銀行賬號等財務數據,住址和定位等行程數據,健康數據等個人屬性較為突出的數據。無論是人事檔案數據,還是在有關平臺上手動上傳與授權讀取的數據,數據使用者均可根據這些“主動數據”追蹤到個人數據主體。針對人事檔案數據,我國已形成了較為嚴格的管理與使用規(guī)定。針對上傳或授權平臺讀取的數據,大量網絡服務平臺在提供相關服務時,均通過隱私政策要求用戶同意默許平臺獲得上述有關數據以及數據的檔案化;目前我國對其雖也形成了一定的約束性規(guī)定,但這些個人數據是否為用戶獲得服務時平臺所必須采集的數據,以及平臺是否遵守了最小使用原則等仍存在很多疑問。從理論上看,此類檔案數據隱私的流通應該受到嚴格規(guī)制?!鞍樯鷶祿彪[私是有關主體通過主觀操作、網絡運用和加工整理而獲得的數據資源,如針對檔案數據行為主體的瀏覽歷史記錄、購物偏好、操作日志等,平臺對此類伴生數據進行整理、統計、分析等數據“挖掘”工作產生的財產價值,個人數據主體無權主張[24],它們也會成為平臺檔案的組成部分。對該部分檔案數據隱私是否能夠進行流通交易則應視情形而定。
檔案數據隱私的具體來源主要包括兩個方面:一是檔案信息內容本身就是隱私信息或隱私數據,如人事檔案、生物數據與健康檔案、稅務檔案、教育檔案、醫(yī)保檔案、婚姻檔案、財產檔案等;二是隨著人工智能技術不斷發(fā)展和數據檔案化推進,通過個人數據語料分析聚合而形成的精準的個人畫像隱私,或是在數據檔案化過程中,如對社交媒體數據、在線行為數據和移動設備數據等的檔案化并分析后生成的伴生檔案數據隱私。在技術加持和數據檔案化匯聚后,原本經過去標識化處理的數據集在整合后成為新的檔案數據隱私來源。從上述來源看,傳統的以私密信息為核心的隱私已轉化為以隱私數據為表征的內涵更為豐富、形式更為多元的數字化新樣態(tài)——整合型隱私。[25]這種整合型檔案數據隱私融合了傳統檔案中的數據和數據的檔案化中所包含或隱藏的隱私內容,數據隱私風險來源更為多元,表現形式更加多樣,在相關數據聚合中可挖掘更多、更深的檔案數據隱私線索。
2.2 數據要素價值化中的檔案數據隱私風險表現
在人工智能技術加持下,當前個人隱私風險已從傳統的私密信息泄露風險轉為抽象的隱私數據挖掘侵權風險。在檔案數據要素價值化過程中,運用人工智能技術輔助檔案數據開放審核、檔案數據編研開發(fā)等正在加緊推進,由此所帶來的整合型檔案數據隱私風險將會逐步加大。數據要素價值化可以劃分為數據資源化、數據資產化和數據資本化三個階段[26],在數據要素價值化的每個階段都有其特定的數據隱私風險表現。結合檔案數據運動特征[27]及其要素價值化的具體階段,可以將檔案數據隱私風險歸納為10種風險類型,如表1所示。
對多源異構的檔案數據而言,檔案數據資源化是將混亂無序的原始檔案數據整合為可利用的檔案數據資源的過程。檔案數據資源化是檔案數據進入數據要素市場的前提,也是檔案數據價值化的基礎,其本質是通過采集、清洗、加工、整理、存儲等環(huán)節(jié)深入挖掘檔案數據資源使用價值。國家檔案局統計數據顯示,截至2022年底,全國各級國家綜合檔案館館藏電子檔案2372.9tB,相較于2019年的119.3萬GB增長了兩萬多倍,數字化成果也同樣增長兩萬多倍。[36]由此可見,自數據被列為生產要素以來,可利用的檔案數據集已形成一定規(guī)模。檔案數據資源化階段主要的隱私風險表現為數據采集風險、數據存儲風險和數據聚合風險。數據采集風險即采集檔案數據時可能無意中捕獲敏感數據,如個人身份信息、健康數據或財務數據等。數據存儲風險指存儲環(huán)節(jié)操作不當或者受到惡意攻擊可能導致檔案數據泄露,在缺乏適當加密和訪問控制的情況下此類風險更易發(fā)生。數據聚合風險為當多個檔案數據集被整合時,原本經過匿名化處理的檔案數據可能因關聯分析而暴露出個人隱私。
檔案數據資產化是指檔案數據通過流通交易給使用者或所有者帶來經濟利益的過程,是實現檔案數據價值的核心,其本質是形成數據交換價值,初步實現檔案數據價值的過程。[37]從有關數據資產化的經驗看,以應用場景為導向構建檔案數據產品與服務是一種可行的策略選擇。浙江公共數據平臺將與個人相關的婚姻檔案、學籍檔案等9大類檔案數據進行聚合,開發(fā)了“惠民辦事”“出生智治”“基層治理”“居民健康”“共同富?!钡葓鼍?,這就是一種場景驅動檔案數據要素流通的有益探索。[38]這種探索基于不同行業(yè)領域的獨特性和差異化需求,以應用場景為導向進行檔案數據資源的選擇性開發(fā),并進行優(yōu)先級排序與可行性評估,確保檔案數據資源高效配置。檔案數據資產化階段主要的隱私風險表現為檔案數據共享風險、用戶畫像構建風險和檔案數據重用風險。檔案數據共享風險即為生產檔案數據產品,提供以應用場景為依托的相關服務,檔案數據可能跨越多個組織進行共享或交換,這在一定程度上增加數據隱私泄露的可能。用戶畫像構建風險則是指利用檔案數據創(chuàng)建用戶畫像時,即使使用去標識化數據,也可能通過數據挖掘和關聯分析追溯個人身份。檔案數據重用風險指在未經檔案數據主體同意情況下,對匿名化或進入銷毀階段的檔案數據進行重新識別,造成隱私泄露。
數據資本化是將數據要素資源以產權化和證券化等形式轉化為流通資本的過程,也是不斷尋求資本價值的過程。[39]檔案數據資本化是指通過流通交易方式來實現對檔案數據要素的社會化配置,從而使其具有生產價值的動態(tài)過程?,F有研究證實,數據分析技術的大量使用會直接對已有數據帶來價值增值。因此,在檔案數據資本化階段應當重視新技術的引入,積極發(fā)展數據分析技術,提升數據價值,從而積累數據資本。[40]檔案數據資本化階段的隱私風險表現為檔案數據所有權風險、檔案數據跨境流動風險和檔案數據市場化風險。檔案數據所有權風險是在檔案數據資本化過程中,因檔案數據所有權歸屬模糊,邊界不明,檔案數據主體可能失去對檔案數據的控制。針對具備檔案屬性的數據進行檔案化處理時,就較多面臨這種風險。檔案數據資本化往往伴隨數據跨境流動,數據跨境過程不僅可能影響國家數據主權,而且會導致數據隱私流失,滴滴公司用戶行程數據的出境就是一個典型例證。檔案數據市場化風險指檔案數據交易具有不透明性和非排他性,這可能使得數據主體無法知曉其數據如何被使用,以及是否在有條件開放的范圍內被使用,從而導致數據隱私泄露。
檔案數據要素價值化各階段的數據隱私風險具有不同特征。在數據資源化階段,檔案數據隱私風險溯源難度低,影響范圍相對有限,相較于其他數據,檔案數據在歸檔時須進行價值鑒定和真實性鑒定,因此其權威性更高,隱私風險影響程度更大,其影響范圍往往具有相對性特征,風險性質主要為技術性風險,隱私治理主體為檔案數據處理者;在數據資產化階段,檔案數據隱私風險復雜性與隱蔽性增強,溯源難度較高,影響范圍較大,其風險性質主要為業(yè)務合規(guī)性風險,隱私治理主體為數據產品開發(fā)者和數據控制者;而在數據資本化階段,受數據市場環(huán)境影響,檔案數據隱私風險源頭極難追溯,隱私風險影響范圍廣泛,其風險性質為法律和經濟風險,隱私治理主體轉變?yōu)榻鹑谑袌鰠⑴c者,包括投資者、數據監(jiān)管者等。
數據要素價值化不同階段的隱私風險具有一定內在聯系。一方面,數據隱私風險具有連續(xù)性與累積性,即隱私風險在數據價值化鏈條中是連續(xù)的,早期階段的風險處理不當會在后續(xù)階段累積,最終可能在資本化階段暴發(fā)。另一方面,在數據隱私風險反饋機制上,后一階段的隱私風險可以反饋至前一階段,促使數據檔案化、資源化等階段相關工作的改進,最終形成一個閉環(huán)的數據隱私治理鏈條。
3 數據要素價值化中的檔案數據隱私風險治理路徑
在數據要素價值化中,檔案數據隱私治理不僅要確保檔案數據的完整性、可用性、機密性和可追溯性,防止檔案數據隱私被非法獲取和篡改,而且還應確保檔案數據可以在合法合規(guī)的范圍內得到流通利用。
從宏觀來看,數據要素價值化中的檔案數據隱私治理應從法律手段、技術手段和行政手段等方面入手。法律手段提供數據處理的法律框架和市場規(guī)制,技術手段通過數據加密、去標識化、區(qū)塊鏈等技術實現數據隱私保護的實際操作,行政手段則實現對整個隱私治理過程的協調與監(jiān)管,三者協同作用,形成一個兼顧數據要素價值最大化和檔案數據隱私保護的治理框架?;诖?,本文構建了一個數據要素價值化視角下的檔案數據隱私治理模型,詳見圖1。
3.1 法律手段
在我國,個人信息保護相關制度在《網絡安全法》有專章規(guī)定,《民法典》和《數據安全法》等也對個人信息具體保護制度進行了規(guī)定。2021年11月,《個人信息保護法》的出臺為個人信息權益保護提供了體系化的法律依據。上述立法進步表明,我國個人隱私保護法律框架已初具雛形。從適應數據要素流通交易和檔案數據開放趨勢看,對數據要素價值化中的檔案數據隱私保護須重點進行以下規(guī)制。
在數據資源化階段,應構建完善的檔案數據隱私保護制度體系。對檔案數據從采集到開發(fā)應用全流程中的隱私保護進行規(guī)定,分別明確規(guī)定檔案所有者、檔案形成者和保管者等對檔案數據隱私享有受控或限制利用的權利,確保檔案數據隱私在合法、安全的前提下流通和使用。同時,針對網絡平臺的數據檔案化過程,特別是針對伴生數據的檔案化過程,應制定合規(guī)的檔案數據隱私采集、處理與使用協議標準。網絡平臺數據采集、處理與使用協議標準是確保數據處理活動合法、透明并尊重數據主體權利的關鍵文件,應當覆蓋數據的收集、存儲、處理和共享等全過程,它也是保證數據檔案化過程合理、合規(guī)的基本條件。檔案部門應站在數據檔案化立場上,協同有關網絡主管部門、大數據管理部門等制訂有關數據的檔案化管理與流通利用制度。
在數據資產化階段,應當建立檔案數據資產目錄,記錄檔案數據來源、使用狀態(tài)和流轉歷史,明確檔案數據要素價值化過程中的權屬權責關系,確保檔案數據資產的透明度和可追溯性。在具體操作上,一方面應當參照現存?zhèn)€人信息和個人隱私保護相關規(guī)定進行檔案數據隱私權屬權責界定,明確檔案數據處理者和存儲者應承擔的義務,確保其在檔案數據資產化過程中嚴格遵守隱私保護原則,充分尊重檔案數據主體的數據獲取權、數據修改權、限制處理權和數據被遺忘權等基本權利。另一方面,應當建立檔案數據確權機制,以法律形式明確數據權利的類別、權利的歸屬問題。[41]雖然《數據二十條》提出了數據資源持有權、數據加工使用權、數據產品經營權“三權分立”的產權運行機制構想,但對其如何具體實踐仍待探索。將上述構想在檔案數據要素資產化中進行探索實踐,對挖掘檔案數據要素價值具有重要意義。
在數據資本化階段,應當建立檔案數據交易規(guī)則與標準,規(guī)范檔案數據交易活動,確保合理分配檔案數據價值,同時保護檔案數據主體的隱私和權益。當檔案數據作為資產進行交易時,須確保買賣雙方均遵守數據隱私保護法規(guī),并在交易協議中明確數據的使用范圍、期限以及隱私保護條款;檔案數據交易有時涉及跨境傳輸,可能受到不同國家法律約束,導致隱私保護難度大大增加,此時還應遵守跨境數據流動法規(guī)并進行合規(guī)性審查。在進行檔案數據跨境傳輸時不僅應遵守國際數據傳輸協議,還應尊重其他國家或地區(qū)對境內產生的數據的管轄權和控制權,遵守數據主權國家的數據保護法,確??缇硵祿鬏斶^程和數據處理活動合法合規(guī)。
3.2 技術手段
技術手段在檔案數據要素價值化過程中發(fā)揮至關重要的作用,它有助于保障檔案數據的安全性和完整性,實現細粒度的隱私內容與利用權限管理。在檔案數據要素價值化過程中,檔案管理機構正在逐漸引入并應用多種隱私治理技術,這在一定程度上提升了檔案數據隱私保護水平。然而,目前技術應用深度和廣度仍顯不足,隱私治理技術的應用范圍也有待進一步擴大,可拓展覆蓋到更多檔案類型和檔案數據治理環(huán)節(jié)。
數據資源化階段的關鍵技術包括去標識化與匿名化、數據加密技術和邊緣計算。具體而言,去標識化是指通過對檔案數據的技術處理,使其在不借助額外信息的情況下,無法識別或者關聯檔案數據主體的過程。[42]如通過哈希函數處理個人標識符,其程度可根據數據的敏感性和用途進行調整。匿名化則采用K-匿名性、L-多樣性和t-接近性等技術,確保數據集中任W01Dv/mVKly58dhvVMY3jQ==何個體無法被唯一識別,具體通過分組和添加噪聲來實現,經過匿名化處理后的信息不能被復原。[43]數據加密技術主要分為對稱密鑰加密和非對稱密鑰加密?;趯ΨQ密鑰的AeS算法是一種迭代式數據包加密算法,使用一致性密鑰處理數據,每次加密時需要進行輪密鑰加、字節(jié)替換、行位移、列混淆等運算。[44]邊緣計算通過在數據生成地部署以減少數據向中心服務器的傳輸,不僅降低網絡延遲和帶寬消耗,還能夠在將數據上傳到云端之前執(zhí)行數據所有者的隱私策略。[45]綜上所述,在檔案數據資源化階段首先通過去標識化與匿名化技術降低檔案數據聚合時的可識別性,同時采用數據加密技術確保檔案數據存儲和傳輸過程中的安全性,并利用邊緣計算減少敏感數據的遠程傳輸需求。
數據資產化階段的關鍵技術包括訪問控制和數據質量控制。訪問控制旨在限制已認證用戶對系統資源的訪問權限,這是確保檔案數據隱私安全的重要手段之一。檔案管理機構應建立完善的訪問控制機制,對訪問檔案數據的用戶進行身份驗證和權限管理,通過設定合理的訪問權限規(guī)則,確保只有經過身份驗證和授權的用戶或應用程序才能訪問敏感檔案數據。具體可以通過基于角色的訪問控制、細粒度訪問控制和多因素身份驗證等手段來實現。檔案數據質量控制主要體現在兩個方面:一方面是要實現檔案數據隱私采集與使用的最小化,不僅應當僅采集實現特定目的所需要的最少量數據,還應當定義檔案數據保留期限和刪除策略,確保過期或失效檔案數據被安全銷毀,減少數據存儲量,以降低檔案數據隱私風險。2023年無錫市集中永久銷毀10億條涉疫個人數據的做法就是一個很好例證[46],它不僅確保涉疫個人數據隱私無法恢復,保障個人數據隱私安全,而且這也表明,數據檔案化過程也是一個選擇與鑒定的過程。另一方面應通過實施數據清洗和驗證流程,確保數據的準確性和完整性,避免因數據錯誤引起隱私泄露。
數據資本化階段的關鍵技術包括隱私計算、區(qū)塊鏈與智能合約、數字沙盒。隱私計算技術集成密碼學、計算機安全、數據科學等多種方法和技術,旨在確保數據隱私的前提下,實現對數據的安全分析和處理,即實現數據的“可用不可見”,關鍵技術包括多方安全計算、聯邦學習、可信執(zhí)行環(huán)境、同態(tài)加密、可信密態(tài)計算等。[47]在檔案數據資本化階段中,隱私計算技術能夠通過數種加密和隱私保護機制實現檔案數據價值挖掘與隱私保護之間的平衡。例如,同態(tài)加密技術允許在未解密狀態(tài)下對加密數據直接進行計算;安全多方計算使得多個參與方在不泄露各自輸入數據的情況下共同完成一個計算任務;差分隱私則通過向數據添加噪聲的方式,確保任何個體的信息都無法從查詢結果中被推斷出來;可信執(zhí)行環(huán)境則為數據處理提供一個隔離且可信的計算環(huán)境。區(qū)塊鏈作為一種分布式賬本技術,通過去中心化和加密算法確保數據的不可篡改性和透明性。智能合約則是部署在區(qū)塊鏈上的自動執(zhí)行協議,能夠根據預設條件自動執(zhí)行合約條款,無需第三方中介。[48]在檔案要素資本化進程中,應用區(qū)塊鏈與智能合約技術有助于確保每條數據交易都被記錄且無法更改,提高數據交易效率和可信度。數據沙盒是一種為數據處理和分析提供隔離環(huán)境的方法,它允許用戶在一個受控的安全環(huán)境中訪問和操作數據,而無須直接接觸原始數據,確保數據的隱私性,同時通過提供一系列工具和服務,如統計分析、機器學習模型訓練等,在保護隱私的同時發(fā)揮數據的價值,是解決隱私保護和數據挖掘之間矛盾的有效方案。[49]在檔案數據隱私治理中,數據沙盒技術能夠用于構建一個安全的數據處理平臺,數據處理者訪問經過隱私保護處理的數據副本進行分析,無須擔心泄露原始檔案中的數據隱私。
3.3 行政手段
行政手段是指在數據要素價值化中的程序性手段,即在檔案數據要素價值化過程中,通過制定并執(zhí)行一系列操作性的程序、制度和流程,對檔案數據的收集、處理、利用等環(huán)節(jié)進行規(guī)范和管理,旨在確保檔案數據有效利用與價值實現的同時,充分保護個人數據隱私。在行政層面進行檔案數據隱私治理需要綜合運用多種策略,以構建一個全方位、多層次的隱私治理體系。
在數據資源化階段,確保檔案數據采集的合法性和合規(guī)性至關重要。這一過程涉及合規(guī)化采集流程和建立數據保護影響評估(Data Protection Impact Assessment, DPIA)程序。合規(guī)化采集流程指采集檔案數據時應遵循適用的數據保護法規(guī)要求,確保數據主體知情同意,并明確告知其數據將被如何使用,同時遵循最小化收集原則,確保數據準確性、時效性和安全性。數據保護影響評估是歐盟在隱私影響評估(Privacy Impact Assessment, PIA)基礎上創(chuàng)設的一種系統性的風險評估方法,能幫助管理數據控制者或處理者處理個人數據對自然人權利和自由造成的風險。[50]DPIA通常在數據處理活動開始之前進行,用于識別和評估數據處理活動中的潛在隱私風險,并幫助數據控制者或處理者將風險最小化,以確保數據處理活動符合相關規(guī)定。由于檔案數據處理過程涉及的檔案數據主體較為復雜,如何應用DPIA還需要咨詢領域專家。
數據資產化階段的關YA/qv3tOX5CCsH5XFqAtpE+w87Au4lZe/NN4s35G31c=鍵手段包括應用場景控制程序和分類分級管理制度。應用場景控制程序基于不同業(yè)務需求和檔案數據使用場景,精細化控制檔案數據訪問和使用權限,確保數據使用既滿足業(yè)務需求又符合隱私保護原則,減少隱私泄露風險。在數據要素價值化過程中,檔案開放審核、數字化成果處理等都應明確界定數據使用范圍與目的,確保數據在授權范圍內被合理使用。例如,在檔案開放審核中,可利用深度學習、自然語言處理技術建立審核模型,同時,針對聲像檔案等特殊類型,可采用人臉識別、語音識別等AI技術進行處理,但須嚴格控制處理結果的傳播與利用,避免隱私泄露風險。分類分級管理制度是一種系統性方法,它根據檔案數據價值和敏感性對其進行分類分級,幫助檔案管理機構更好理解和管理檔案數據資產,確保檔案數據的安全性和合規(guī)性。通過數據分類對不同檔案數據資產進行編目和標準化,為責任劃分提供依據;通過數據分級將檔案數據根據其敏感程度和遭到泄露或非法利用后的影響范圍,按照一定原則進行排序,為評估檔案數據資產隱私風險提供依據。建立檔案數據分類分級制度要以檔案業(yè)務需求為基礎,利用知識圖譜技術等進行自動化掃描,通過預設參數對檔案數據進行分類分級,以簡化業(yè)務流程。
數據資本化階段的關鍵手段包括數據信托制度和檔案數據泄露應急響應程序。在信任不足、權利邊界難明確的情況下,諸如“信息受托人”、數據交易所等對于個人數據流通機制的探索仍不能解決個人數據處理中不平等的結構矛盾[51],數據信托制度作為一種創(chuàng)新的隱私治理模式,旨在通過第三方機構或組織來管理和保護數據,確保數據的所有權、使用權和價值分配的公平性。同時通過區(qū)塊鏈技術確保數據交易的透明度和不可篡改性,增強數據交易的信任基礎,并確保數據處理活動遵守相關規(guī)定,保護數據主體隱私權利。檔案數據泄露應急響應程序通過預先設計流程和策略快速檢測、響應和減輕數據泄露事件影響,包括定期進行風險評估、實施持續(xù)數據監(jiān)測機制、啟動快速響應計劃以及事后分析與改進,確保發(fā)生數據泄露事件時能夠迅速采取行動。
此外,檔案管理機構還應完善全流程組織架構并建立數據安全審計制度。[52]具體而言,應當設立專職檔案數據安全管理職能部門,制定檔案數據安全管理制度[53],不斷優(yōu)化檔案數據安全處理流程。同時,定期實施檔案數據處理活動安全審計程序,對檔案數據的共享、開放和使用情況進行分析,發(fā)現并及時糾正潛在安全隱患和違規(guī)行為。
4 結 語
本文在梳理檔案數據隱私來源及其風險表現基礎上,構建了一個數據要素價值化視角下的檔案數據隱私治理模型,并在此基礎上從法律手段、技術手段和行政手段三個角度提出檔案數據要素隱私治理路徑。數據要素價值化中的檔案數據隱私治理是一個理論與實踐交織的復雜議題,由于檔案部門目前尚游離在數據治理體系的整體框架之外,檔案數據是生產要素的理念也未形成共識,檔案數據的開放力度與范圍仍須進一步加大,因此,數據要素價值化中的檔案數據隱私治理需要結合檔案開放審核、檔案開發(fā)利用場景、檔案數據交易流通等實踐工作開展實證研究,以進一步發(fā)現檔案數據隱私治理的特征與可能途徑。
作者貢獻說明
周毅:確定論文選題及框架,論文撰寫、修改與定稿;陳美君:論文撰寫與修改。
注釋與參考文獻
[1]許曉彤,張嘉瑋,李照川.檔案數據要素化的歷史源流、關鍵問題與價值空間[J].檔案與建設,2024(5):12-21.
[2]趙躍,李琪,王月.關于檔案數據要素若干基本問題的思考[J].檔案與建設,2024(5):3-11.
[3]周毅.檔案數據治理的認識維度及其價值[J].檔案與建設,2023(2):8-12.
[4]周林興,黃星.大數據時代檔案數據開放共享機制探析[J].檔案與建設,2023(3):8-12.
[5]楊智勇,岳幸暉.檔案數據價值鏈模型構建及實現路徑探析[J].檔案與建設,2024(4):18-25.
[6]楊鵬.檔案數據要素價值論[J].檔案與建設,2024(4):26-35.
[7][30]蔣明敏,趙春雷.大數據環(huán)境下我國政府信息公開的安全風險及其應對[J].世界經濟與政治論壇,2020(2):93-107.
[8]吳寧博,李金燕,楊帆,等.我國政府數據開放的隱私風險判定及其治理路徑研究[J].情報雜志,2023(11):192-198.
[9]劉新萍,孫文平,鄭磊.政府數據開放的潛在風險與對策研究——以上海市為例[J].電子政務,2017(9):22-29.
[10]衛(wèi)瑋.政府數據開放中的個人隱私泄露及保護研究[D].哈爾濱:黑龍江大學,2020.
[11]羅康,彭長根,譚偉杰,等.基于屬性權重的隱私泄露風險評估方法[J].計算機技術與發(fā)展,2022(10):82-87.
[12]臧國全,張盼盼,柴文科,等.個人通信數據的敏感性識別與隱私計量研究[J].圖書情報知識,2024(2):110-120.
[13]肖洋,臧國全.個人金融數據的敏感性識別與隱私計量研究[J].情報理論與實踐,2023(9):105-114,86.
[14]臧國全,柴文科,張盼盼,等.個人教育數據的敏感性識別與隱私計量研究[J].情報理論與實踐,2024(8):84-94.
[15]陳美.政府開放數據的隱私風險評估與防控:英國的經驗[J].中國行政管理,2020(5):153-159.
[16]盛小平,唐筠杰.開放科學環(huán)境下的數據隱私治理研究[J].圖書情報知識,2024(4):57-66.
[17]朱貝,王傳清.我國科學數據共享中的隱私治理探析[J].圖書情報工作,2020(22):37-47.
[18]白銀.檔案數字化轉型中隱私保護的理論優(yōu)化與制度完善[J].檔案學通訊,2024(3):19-28.
[19]陽雪雅. 數據要素市場下個人數據交易的證成與實現[J].上海政法學院學報,2023(5):91-105.
[20]錢毅.技術變遷環(huán)境下檔案對象管理空間演化初探[J].檔案學通訊,2018(2):10-14.
[21][27]金波,添志鵬.檔案數據內涵與特征探析[J].檔案學通訊,2020(3):4-11.
[22]錢毅.在“三態(tài)兩化”視角下重構檔案資源觀[J].中國檔案,2020(8):77-79.
[23]盛小平,焦鳳枝.國內法律法規(guī)視角下的數據隱私治理[J].圖書館論壇,2021(6):85-99.
[24]王忠,王萌曄.平衡數據流通與隱私保護:第三方數據信托運行機制研究[J].經濟縱橫,2024(1):101-109.
[25]王德正.人工智能背景下隱私數據侵權責任的認定困境[J].法治論壇,2023(4):35-53.
[26][37]中國信息通信研究院政策與經濟研究所.數據價值化與數據要素市場發(fā)展報告(2021年)[R].北京市:中國信息通信研究院,2021.
[28][29]梅傲,陳子文.政府數據開放中的數據安全隱憂及其紓解[J].情報雜志,2023(5):76-85.
[31]張平.政務大數據環(huán)境下數據共享安全保密問題研究[J].保密科學技術,2019(6):42-46.
[32]徐偉,徐靜.數智時代用戶畫像數據安全風險及應對[J/OL].南京郵電大學學報(社會科學版),1-14[2024-07-29].https://doi.org/10.14132/j.cnki. nysk.20240719.002.
[33]郭維嘉,郭少友.開放政府數據中的個人隱私風險類型及消解機制研究[J].河南科技,2018(4):21-24.
[34]尹海員.數字經濟中的消費者數據隱私保護——基于數據倫理和數據所有權視角的探究[J].經濟學家,2023(4):79-87.
[35]覃浩華,李志.基于智能合約的數據跨境流動風險識別機制[J].中國人民警察大學學報,2022(6):31-37.
[36]2022年度全國檔案主管部門和檔案館基本情況摘要(二)[EB/OL].[2024-07-20].https:// www.saac.gov.cn/daj/zhdt/202308/0396ea569aa648f1befd 5c49bac87e6f.shtml.
[38]汪偉民,丁云.縣域公共數據檔案化治理的理論與實踐探索——以嵊州市“個人全生命周期檔案”綜合智治應用建設為例[J].浙江檔案,2023(4):11-13.
[39]劉震.數智化革命—價值驅動的產業(yè)數字化轉型[M].北京:機械工業(yè)出版社, 2022.
[40]劉濤雄,戎珂,張亞迪.數據資本估算及對中國經濟增長的貢獻——基于數據價值鏈的視角[J].中國社會科學,2023(10):44-64,205.
[41]趙蔡晶.國內數據要素價值化研究綜述及展望[J].信息資源管理學報,2024(2):41-53.
[42]袁紀輝.有關個人信息處理技術概念的厘清——匿名化、去標識化、假名化、去識別化之辨析[J].保密工作,2021(5):59-60.
[43]周娜,劉剛.個人數據共享中的匿名化技術現狀與建議[J].中國新通信,2023(17):43-45,75.
[44]范海峰.數據加密技術在計算機網絡安全中的應用[J].信息記錄材料,2023(6):58-60.
[45]高聰,陳煜喆,張擎,等.邊緣計算:發(fā)展與挑戰(zhàn)[J].西安郵電大學學報,2021(4):7-19.
[46]一地宣布:銷毀10億條涉疫個人數據![EB/OL].[2024-07-20].https://baijiahao.baidu. com/s id=1759303802451016147&wfr=spider&for=pc
[47]何安珣,李宏宇,韋韜.保障隱私安全促進數據流通——隱私計算應用技術發(fā)展趨勢綜述[J].人工智能,2023(6):35-42.
[48]王文悅.基于區(qū)塊鏈的物聯網訪問控制機制研究與實現[D].濟南:齊魯工業(yè)大學,2023.
[49]潘鶴中,韓培義,向夏雨,等.深度學習數據竊取攻擊在數據沙箱模式下的威脅分析與防御方法研究[J].通信學報,2021(11):133-144.
[50]肖君擁,張雪亭.歐盟數據保護影響評估制度及其鏡鑒[J].電子科技大學學報(社科版),2022(5):18-29,52.
[51]周輝,張心宇.新型數據信托機制的創(chuàng)新價值與構建路徑[J].南京社會科學,2024(4):98-108,120.
[52]卞咸杰.大數據時代智慧檔案信息服務平臺數據安全風險及其對策[J].檔案管理,2022(6):38-41.
[53]張艷麗.數據隱私與安全:檔案管理的挑戰(zhàn)與解決方案[J].蘭臺世界,2024(5):57-59.
(責任編輯:張 帆 馮婧愷)