徐孝娟 趙澤瑞 賈海洋 史如菊
(安徽大學(xué)管理學(xué)院,安徽 合肥 230039)
數(shù)字人文作為近幾年興起的交叉研究領(lǐng)域,因其研究工作量巨大、涉及內(nèi)容較為分散、經(jīng)費(fèi)支持有限及要求研究人員學(xué)科背景多元等特點(diǎn),結(jié)合眾包所具有的開放式創(chuàng)新和群體智慧理念,可有效幫助項(xiàng)目管理者從外部獲取更有效、更經(jīng)濟(jì)、更優(yōu)質(zhì)的問題解決方案,使得眾包在數(shù)字人文環(huán)境下迅速發(fā)展,不斷涌現(xiàn)理論及實(shí)踐研究成果,主題已延伸到美術(shù)、圖書館、檔案、博物館和教育機(jī)構(gòu)等領(lǐng)域[1-3]。如美國國會圖書館利用Flickr,邀請用戶對照片進(jìn)行標(biāo)簽和評論等;英國維多利亞和阿爾伯特博物館要求公眾評選最優(yōu)照片;國內(nèi)CADAL利用用戶定位描述不佳的圖書、修訂圖書的描述信息以及修訂期刊目次頁等;上海圖書館歷史文獻(xiàn)眾包平臺作為文本抄錄及元數(shù)據(jù)深度標(biāo)引的平臺。然而,眾包用戶在參與過程中會留下大量的個(gè)人信息被眾包項(xiàng)目平臺及第三方采集等,尤其是數(shù)字人文眾包這一非商業(yè)情境下,存在諸如密碼泄露、位置跟蹤、會話竊取、用戶權(quán)利不明確等隱私侵權(quán)問題[4-5];同時(shí),我國學(xué)者也指出,志愿者隱私泄露是數(shù)字人文眾包中個(gè)人信息風(fēng)險(xiǎn)的重要問題[6],且公眾隱私保障會顯著正向影響志愿者對公眾科學(xué)項(xiàng)目的信任[7]。
目前,有關(guān)眾包個(gè)人信息保護(hù)研究主要集中在個(gè)人數(shù)據(jù)保護(hù)、個(gè)人隱私和信息安全等主題[8-9],例如學(xué)者Yr A等和Meftah L等分別基于強(qiáng)化學(xué)習(xí)(PICRL)和軟件庫,在不影響數(shù)據(jù)集質(zhì)量的情況下加強(qiáng)移動眾包應(yīng)用程序?qū)τ脩粜畔⒌谋Wo(hù)力度[10-11];Xia H等基于索洛夫的隱私分類法,對眾包中個(gè)人隱私的保護(hù)策略加以探討[12];Xiong P等和Lan Z等分別基于優(yōu)化獎(jiǎng)勵(lì)分配策略框架和購買數(shù)據(jù)集框架來保護(hù)用戶隱私[13-14]。不難看出,上述研究多側(cè)重于從計(jì)算機(jī)方法技術(shù)的角度對眾包用戶個(gè)人信息的保護(hù)進(jìn)行探索。然而,對于眾包中隱私政策內(nèi)容設(shè)置的規(guī)范性及系統(tǒng)性等方面的研究尚需要進(jìn)一步完善。此外,隱私政策作為保障用戶個(gè)人信息權(quán)益和法律權(quán)益的重要一環(huán)[15-16],可以有效緩解用戶個(gè)人信息擔(dān)憂,優(yōu)化隱私保護(hù)框架[17-18]。目前國內(nèi)外學(xué)者已基于隱私政策在圖書館[19-21]、社交媒體APP[22-24]及移動健康[25-26]等領(lǐng)域?qū)€(gè)人信息保護(hù)展開探索,結(jié)果發(fā)現(xiàn),從隱私政策的角度可以幫助推進(jìn)個(gè)人信息保護(hù)政策的研究及實(shí)踐開展。與此同時(shí),從數(shù)字人文眾包情境開展個(gè)人信息保護(hù)方面的探索,可有效彌補(bǔ)非商業(yè)情境眾包理論及實(shí)踐應(yīng)用的不足,增加用戶對數(shù)字人文眾包項(xiàng)目的信任度,進(jìn)而提高參與度及忠誠度。綜上所述,本研究將以“隱私政策”為視角,對數(shù)字人文眾包平臺中個(gè)人信息保護(hù)展開探索。
美國是最早開展眾包項(xiàng)目的國家并取得了階段成果,自此澳大利亞、英國、新西蘭等國都相繼開展了數(shù)字人文眾包工作,并積累了豐富的理論及實(shí)踐經(jīng)驗(yàn)。與國外相比,國內(nèi)數(shù)字人文眾包平臺的數(shù)量和質(zhì)量仍存差距[27]?;诖?,本研究將聚焦于國外代表性的數(shù)字人文眾包平臺,對各平臺中隱私政策文本內(nèi)容進(jìn)行深入剖析,歸納總結(jié)其可供借鑒的相關(guān)研究成果,以期為我國數(shù)字人文眾包個(gè)人信息保護(hù)相關(guān)實(shí)踐的發(fā)展提供借鑒。
筆者利用網(wǎng)絡(luò)調(diào)查法并結(jié)合數(shù)據(jù)的可獲得性,依據(jù)各國(地區(qū))數(shù)字人文眾包項(xiàng)目的充實(shí)度和豐富性,從眾包項(xiàng)目影響力、資源類型的多樣性、地域分布的均衡性及公眾的完成度等層面進(jìn)行比較和篩選,最終選取美國、英國、澳大利亞、新西蘭4個(gè)國家的典型性數(shù)字人文眾包項(xiàng)目共47個(gè),按照圖書館、博物館、檔案館、第三方及其他類別進(jìn)行分類[28],其中圖書館平臺發(fā)起的項(xiàng)目共計(jì)14項(xiàng),博物館12項(xiàng),檔案館10項(xiàng),第三方及其他(如維基百科、麻省理工學(xué)院、書目研究中心及盈利性公司組織等)共計(jì)11項(xiàng),具體如表1所示。數(shù)據(jù)收集截止時(shí)間為2021年10月15日,資料均來源于其官方網(wǎng)頁。與此同時(shí),數(shù)字人文眾包因不同的項(xiàng)目類型的信息需求不同,在特定的任務(wù)信息需求下,對參與者個(gè)人隱私內(nèi)容的要求存在差異。為此,本研究基于Oomen和Aroyo的數(shù)字人文類眾包分類體系,按照轉(zhuǎn)錄型、修訂型、分類型及補(bǔ)充收集型進(jìn)行分類[29-30]。其中,轉(zhuǎn)錄型共計(jì)20項(xiàng)(圖書館4項(xiàng)、博物館5項(xiàng)、檔案館2項(xiàng)、第三方及其他9項(xiàng));修訂型共計(jì)6項(xiàng)(圖書館4項(xiàng)、博物館1項(xiàng)、檔案館1項(xiàng));分類型1項(xiàng)(檔案館1項(xiàng));補(bǔ)充收集型20項(xiàng)(圖書館6項(xiàng)、博物館6項(xiàng)、檔案館6項(xiàng)、第三方及其他2項(xiàng))。
表1 國外數(shù)字人文眾包項(xiàng)目概況
為了更好地探索國外數(shù)字人文眾包項(xiàng)目中隱私政策文本的內(nèi)容及規(guī)律,提煉分析個(gè)人信息隱私政策的特征指標(biāo),從而指導(dǎo)個(gè)人信息保護(hù)的開展。本研究主要從以下4個(gè)方面開展:
1)首先對原始隱私政策資料進(jìn)行可視化主題詞聚類分析,生成高頻詞云圖;其次采用LDA算法挖掘相關(guān)主題,一方面有助于快速了解隱私政策文本背后隱藏的主題思想;另一方面可為步驟2中主范疇的凝練、命名等提供客觀證據(jù)指導(dǎo)。
2)為保證研究的精準(zhǔn)度和深度,采用扎根理論這一探索性研究方法,借助Nvivo12文本分析工具,對數(shù)字人文眾包項(xiàng)目中隱私保護(hù)政策的具體內(nèi)容進(jìn)行提煉和編碼,對關(guān)鍵節(jié)點(diǎn)進(jìn)行梳理和總結(jié),最終形成個(gè)人信息隱私政策的類目體系。
3)在計(jì)量統(tǒng)計(jì)和分析的基礎(chǔ)上,挖掘不同國家、不同項(xiàng)目平臺及不同項(xiàng)目類型對各特征維度的關(guān)注程度,比較分析其個(gè)人隱私政策建設(shè)狀況的共性建設(shè)經(jīng)驗(yàn)及個(gè)性差異化特征。
4)結(jié)合我國當(dāng)前數(shù)字人文眾包項(xiàng)目隱私政策的制定現(xiàn)狀,為我國數(shù)字人文眾包個(gè)人信息保護(hù)提出意見與建議。
2.1.1 主題可視化
為探究國外數(shù)字人文眾包項(xiàng)目隱私政策的主題特征,本研究利用高頻關(guān)鍵詞云圖挖掘文本數(shù)據(jù)內(nèi)容,并基于LDA算法中文本困惑度進(jìn)行主題鑒別和主題詞抽取,其中困惑度越小則其泛化能力越強(qiáng)[31]。其中高頻關(guān)鍵詞字體越大、越靠近中心位置的詞匯被提及的頻率越高,且本研究主題數(shù)目為3時(shí)困惑度最低,因此最終抽取的主題數(shù)目為3,具體主題可視化分布如圖1所示。
主題主題詞特征Topic1信息 數(shù)據(jù) 提供 服務(wù) 個(gè)人信息 網(wǎng)站 收集 隱私 訪問 政策 第三方 電子郵件 用戶媒體 地址 共享圖書館 CookieTopic2個(gè)人信息 國家檔案館 信息 隱私 網(wǎng)站 記錄 訪問 收集 提供 圖書館 披露 投訴 政策 目的 用于 澳大利亞 App 數(shù)據(jù)Topic3網(wǎng)站 數(shù)據(jù) 信息 Cookie 研究 電子郵件 收集 訪問 頁面 用戶 選擇 隱私 注冊 地址 功能 項(xiàng)目 瀏覽器 政策主題—詞匯分布
由高頻關(guān)鍵詞和主題—詞匯分布可知:Topic 1的關(guān)鍵詞可將其歸納為“信息收集”,如收集渠道、機(jī)構(gòu)等;Topic 2的關(guān)鍵詞可將其歸納為“信息安全”,如隱私、法律、保護(hù)及披露等;Topic 3的關(guān)鍵詞可將其歸納為用戶個(gè)人“信息內(nèi)容”,如個(gè)人信息、身份、地址、國家(地區(qū))及瀏覽器等。
2.1.2 國外數(shù)字人文眾包項(xiàng)目隱私政策框架
為進(jìn)一步構(gòu)建國外數(shù)字人文眾包項(xiàng)目個(gè)人信息隱私政策的范疇并形成類目體系,本文借助Nvivo12質(zhì)性分析軟件對47個(gè)數(shù)字人文眾包項(xiàng)目網(wǎng)站所對應(yīng)的隱私政策文本,按照扎根理論的流程,首先將初始資料標(biāo)簽化、概念化,并將類似的概念聚類分析形成初始范疇;其次,對編碼所形成的初始范疇歸納分析,梳理隱私政策文本內(nèi)容初始范疇之間的關(guān)系,形成主范疇[32]。為了確保研究結(jié)果的可信度,生成更多的新概念和范疇,本文邀請兩位研究者分別對文本內(nèi)容進(jìn)行獨(dú)立編碼,并對兩位工作人員的編碼結(jié)果進(jìn)行一致性信度分析,其中相互度K=2M/(N1+N2)、信度R=n*K/(1+(n-1)*K),抽取結(jié)果一致性為0.89,大于0.8則說明研究可信[33],信度檢驗(yàn)通過。與此同時(shí),結(jié)合2.1.1得到的關(guān)鍵詞云圖和主題分布客觀證據(jù),最終提煉出84個(gè)初始范疇,經(jīng)過進(jìn)一步的整合和凝練,本文將其歸納為7個(gè)主要類別,分別是:信息內(nèi)容、信息安全、信息存儲、信息共享、信息使用、信息收集、用戶權(quán)利?;诖?,國外數(shù)字人文眾包項(xiàng)目隱私政策框架具體如表2所示。
表2 國外數(shù)字人文眾包項(xiàng)目類目體系及其范疇
1)信息內(nèi)容層面,主要指隱私政策中明確向參與者收集的信息。主要包括用戶姓名、出生日期、地址、電子郵件地址、電話號碼和性別等個(gè)人數(shù)據(jù)信息;使用項(xiàng)目服務(wù)或設(shè)施過程中以及與項(xiàng)目通信過程中提供的信息。
2)信息安全層面,主要指隱私政策中規(guī)定的對參與者個(gè)人信息的保護(hù)措施或手段以及對數(shù)字人文眾包項(xiàng)目中未成年參與者個(gè)人信息的處理規(guī)范。主要分為信息使用與披露和保護(hù)措施兩方面。信息使用與披露即如何采取合理措施保護(hù)個(gè)人信息免遭濫用、干擾、丟失、未經(jīng)授權(quán)的訪問、修改或披露,以及對于未成年訪問措施等特殊信息的處理;保護(hù)措施即以實(shí)現(xiàn)信息安全為目的,具體使用某種特殊的軟件程序和技術(shù)去識別未經(jīng)授權(quán)的上傳或更改信息的嘗試,以及對工作人員的培訓(xùn)和相關(guān)工作準(zhǔn)則的制定。
3)信息存儲層面,主要指隱私政策中明確對參與者的個(gè)人信息存儲保留,主要包括存儲方式、存儲時(shí)長及存儲位置。具體為:根據(jù)保留時(shí)間表對用戶的個(gè)人數(shù)據(jù)進(jìn)行保留,規(guī)定個(gè)人信息按照物理格式保存在紙質(zhì)文件中或是以電子形式保存在電子數(shù)據(jù)庫中,以及對無須再予以保留的個(gè)人信息數(shù)據(jù)將以何種方式安全刪除做出解釋。
4)信息共享層面,主要指隱私政策中明確參與者的個(gè)人信息在何種情況下會對外或?qū)Φ谌睫D(zhuǎn)讓、共享、公開披露、提供或傳輸。規(guī)定用戶共享信息的范圍、具體內(nèi)容,依據(jù)法律要求或用戶授權(quán)所規(guī)定的共享?xiàng)l件,選擇內(nèi)部團(tuán)隊(duì)、外部合作伙伴或政府部門等具體的共享對象,以及共享個(gè)人信息時(shí)所采用的具體方式。
5)信息使用層面,主要指隱私政策中明確對參與者信息進(jìn)行使用或加工的目的或方式。明確所處理收集的個(gè)人信息是何種用途,以及對為了達(dá)到某種目的所需的具體信息做出說明,同時(shí)闡明所收集的某項(xiàng)具體信息的合法依據(jù)。
6)信息收集層面,主要指隱私政策中明確信息收集的渠道、條件以及所采用的收集方式。具體包含收集方式、收集渠道、收集技術(shù),即平臺通過何種方式來達(dá)到收集個(gè)人信息的目的。如平臺通過Cookie交互功能等技術(shù)或在用戶自動提供相關(guān)數(shù)據(jù)、記錄個(gè)人信息時(shí)收集。
7)用戶權(quán)利層面,主要指隱私政策中參與者對自己信息處置的權(quán)利。明確用戶在參與數(shù)字人文眾包項(xiàng)目過程中所享有的具體合法權(quán)益。筆者通過對上述47個(gè)眾包項(xiàng)目的分析,共提取出享受服務(wù)權(quán)、更正權(quán)、限制權(quán)、建議權(quán)、投訴權(quán)、知情權(quán)、咨詢權(quán)、訪問權(quán)、使用權(quán)、撤回同意權(quán)、反對權(quán)、刪除權(quán)及數(shù)據(jù)轉(zhuǎn)移權(quán)13個(gè)權(quán)利。
為了更好地探究不同發(fā)起平臺、國家(地區(qū))、項(xiàng)目類型在數(shù)字人文眾包個(gè)人信息保護(hù)方面的差異,筆者基于所提取的7個(gè)指標(biāo),對47個(gè)數(shù)字人文眾包項(xiàng)目網(wǎng)站對應(yīng)的隱私政策文本進(jìn)行統(tǒng)計(jì),如圖2所示。
2.2.1 整體性差異
指標(biāo)上,“信息收集”“信息安全”“信息內(nèi)容”3個(gè)指標(biāo)的關(guān)注度都比較高,相對來說內(nèi)容完備性較好,再次驗(yàn)證了基本概況中主題可視化的“宏觀”結(jié)果。無論是不同發(fā)起平臺、不同國家(地區(qū))還是不同項(xiàng)目類型,上述3個(gè)指標(biāo)占比均達(dá)100%,其次分別為“信息共享”“信息使用”和“信息存儲”,在不同發(fā)起平臺層面平均占比分別為96.13%、93.18%和91.40%,國家(地區(qū))層面平均占比分別為93.25%、93%和89.25%,不同項(xiàng)目類型平均占比分別為93.33%、96.25%和95%,分別有44、44和43個(gè)項(xiàng)目提及;對用戶權(quán)利的整體關(guān)注度較低,不同發(fā)起平臺對“用戶權(quán)利”的平均關(guān)注度僅有67.85%,不同國家的平均關(guān)注度為69.5%,不同項(xiàng)目類型的平均關(guān)注度為81.25%,僅有32個(gè)數(shù)字人文眾包項(xiàng)目提及,可以看出各國隱私政策對于“用戶權(quán)利”這一維度的關(guān)注度相對較低。
2.2.2 發(fā)起平臺的政策內(nèi)容差異
不同發(fā)起平臺上,由檔案館、博物館所發(fā)起的指標(biāo)完整度相對較高。檔案館除“用戶權(quán)利”,其他指標(biāo)較為完備;圖書館更為關(guān)注“信息存儲”“信息共享”;博物館的“信息存儲”“信息共享”“用戶權(quán)利”3個(gè)指標(biāo)關(guān)注度高于平均水平;第三方及其他發(fā)起的項(xiàng)目中,僅有“信息使用”占比高于平均水平。
進(jìn)一步結(jié)合隱私政策文本,不同發(fā)起平臺所屬維度內(nèi)容上的特征:①信息內(nèi)容維度,各發(fā)起方均對所需收集的“個(gè)人信息數(shù)據(jù)”進(jìn)行說明。此外,“訪問鏈接”“訪問日期”也是各發(fā)起方關(guān)注的重點(diǎn)。但檔案館與“第三方及其他”機(jī)構(gòu)較重視對參與者“設(shè)備信息”的搜集,而圖書館、博物館更多提及參與者的“敏感信息”及“位置”,檔案館則關(guān)注參與者的“隸屬組織”;②信息存儲維度,博物館更側(cè)重于強(qiáng)調(diào)“存儲時(shí)長”,檔案館、圖書館則強(qiáng)調(diào)“存儲位置”;③信息共享維度,博物館側(cè)重說明“所需共享的內(nèi)容”,圖書館、檔案館側(cè)重說明“共享對象”,第三方及其他更側(cè)重于說明“共享?xiàng)l件”;④信息使用維度,圖書館、檔案館及“第三方及其他”機(jī)構(gòu)側(cè)重于網(wǎng)站內(nèi)部的優(yōu)化,如“產(chǎn)品與服務(wù)的改善”和“數(shù)據(jù)分析”。博物館則更側(cè)重于業(yè)務(wù)的拓展,如“營銷推廣”;⑤信息收集維度,各發(fā)起方均對所采用的“收集技術(shù)”進(jìn)行說明,此外博物館的“收集方式”更具多樣性;⑥用戶權(quán)利維度,各發(fā)起平臺均較為關(guān)注“更正權(quán)”與“刪除權(quán)”,此外,圖書館會進(jìn)一步關(guān)注“撤銷權(quán)”,檔案館進(jìn)一步關(guān)注“知情權(quán)”;⑦信息安全維度,各發(fā)起平臺均對其平臺所采取的安全保護(hù)措施進(jìn)行說明,圖書館和博物館開始關(guān)注未成年人信息安全。此外,僅有少部分博物館對信息安全用戶自身責(zé)任做出說明。
2.2.3 發(fā)起國家的政策內(nèi)容差異
不同發(fā)起國家中,英國和新西蘭指標(biāo)完整度較高,英國平均占比高達(dá)97.71%,新西蘭高達(dá)94.86%,澳大利亞和美國相對較低。除去“信息收集”“信息安全”和“信息內(nèi)容”3個(gè)關(guān)注度較高的指標(biāo),新西蘭對于其余4個(gè)指標(biāo)的關(guān)注程度均高于平均水平,英國對于“信息存儲”“信息共享”“用戶權(quán)利”3個(gè)指標(biāo)的關(guān)注度較高,美國更側(cè)重于“信息使用”這一指標(biāo),澳大利亞僅有“用戶權(quán)利”這一指標(biāo)高于平均水平。
基于隱私政策文本,所屬維度內(nèi)容上特征:①信息內(nèi)容維度,各發(fā)起國家均重視對“個(gè)人信息數(shù)據(jù)”的收集。此外,“瀏覽信息”也是美國關(guān)注的重點(diǎn);②信息存儲維度,美國和英國較為關(guān)注“存儲時(shí)長”,澳大利亞和新西蘭更關(guān)注“存儲位置”;③信息共享維度,各國對“共享對象”的關(guān)注程度都比較高,然而對“共享?xiàng)l件”的關(guān)注程度比較低,值得注意的是,英國隱私政策還單獨(dú)提到了“疫情追蹤”,將共享?xiàng)l件與疫情防控聯(lián)系起來;④信息使用維度,各國均側(cè)重于網(wǎng)站內(nèi)部的優(yōu)化,其中英國這一指標(biāo)的整體完整度較高?!熬W(wǎng)站數(shù)據(jù)統(tǒng)計(jì)”“記錄保存”“提供服務(wù)”這3項(xiàng)指標(biāo)的提及次數(shù)較高;⑤信息收集維度,4個(gè)國家項(xiàng)目除了采用“Cookies”對用戶信息進(jìn)行收集外,還會采用“Google Analytics”技術(shù)進(jìn)行輔助收集。在“收集方式”這一維度,美國與英國占比較高,澳大利亞的收集方式更豐富多樣;⑥用戶權(quán)利維度,英國對用戶權(quán)利的重視程度較高,還單獨(dú)提出了“數(shù)據(jù)轉(zhuǎn)移權(quán)”。美國和英國所提及的用戶權(quán)利較為多樣;⑦信息安全維度,美國的指標(biāo)完整度較高,各國均提及“訪問權(quán)限”和“安全措施審查”,說明這兩項(xiàng)措施更受隱私政策制定者青睞。
2.2.4 項(xiàng)目類型的政策內(nèi)容差異
不同項(xiàng)目類型中,修訂型、補(bǔ)充收集型、分類型項(xiàng)目完整度較高,平均占比分別為97.62%、94.29%以及100%;轉(zhuǎn)錄型指標(biāo)完整度相對較低,為88.57%。除去“信息收集”“信息安全”和“信息內(nèi)容”3個(gè)關(guān)注度較高的指標(biāo),分類型指標(biāo)覆蓋率均為100%;修訂型除“信息共享”這一指標(biāo),其余指標(biāo)覆蓋率均為100%;補(bǔ)充收集型更關(guān)注“信息共享”;轉(zhuǎn)錄型其余4個(gè)指標(biāo)均低于平均水平。
內(nèi)容進(jìn)一步細(xì)粒度挖掘如下:①信息內(nèi)容維度,轉(zhuǎn)錄型側(cè)重于對“設(shè)備信息”的收集,修訂型、補(bǔ)充收集型更側(cè)重于對“個(gè)人信息數(shù)據(jù)”的收集;②信息存儲維度,轉(zhuǎn)錄型和修訂型更側(cè)重于強(qiáng)調(diào)“存儲位置”,補(bǔ)充收集型更側(cè)重于強(qiáng)調(diào)“存儲時(shí)長”;③信息共享維度,“共享對象”是各類型項(xiàng)目隱私政策關(guān)注的重點(diǎn),補(bǔ)充收集型還進(jìn)一步強(qiáng)調(diào)“共享內(nèi)容”;④信息使用維度,各類型項(xiàng)目主要用于網(wǎng)站內(nèi)部的優(yōu)化,其中修訂型項(xiàng)目這一指標(biāo)的整體完善度更高;⑤信息收集維度,“收集技術(shù)”是各個(gè)項(xiàng)目關(guān)注的重點(diǎn),此外,轉(zhuǎn)錄型、補(bǔ)充收集型、分類型還側(cè)重于強(qiáng)調(diào)“收集時(shí)間”,修訂型還側(cè)重于強(qiáng)調(diào)“收集方式”;⑥用戶權(quán)利維度,修訂型與分類型所有項(xiàng)目隱私政策均對用戶權(quán)利進(jìn)行說明。然而,轉(zhuǎn)錄型的20項(xiàng)中僅有11項(xiàng)對用戶權(quán)利進(jìn)行說明。除關(guān)注度較高的“更正權(quán)”和“刪除權(quán)”,修訂型還進(jìn)一步關(guān)注“訪問權(quán)”和“知情權(quán)”;⑦信息安全維度,各類型項(xiàng)目多聚焦于說明平臺所采取的保護(hù)措施。此外,對14歲以下青少年群體以及用戶自身責(zé)任的關(guān)注度提升。
3.1.1 國內(nèi)數(shù)字人文眾包項(xiàng)目
目前,我國積極開展數(shù)字人文眾包項(xiàng)目,并取得了探索性的實(shí)踐成果,如上海數(shù)字人文眾包系列、Cadal眾包項(xiàng)目及北京記憶項(xiàng)目等,主要開設(shè)平臺聚焦為圖書館、博物館、檔案館以及其他第三方平臺(如高校、人文研究中心等聯(lián)合)。本文基于數(shù)據(jù)可獲得性選取代表性項(xiàng)目,具體發(fā)起方及工作內(nèi)容如表3所示。截至2021年10月7日,“盛宣懷檔案抄錄項(xiàng)目”已發(fā)布75項(xiàng)共計(jì)656個(gè)任務(wù),已完成431個(gè)[34];“古籍整理工作平臺”目前主要參與者有3 389位,整理成果4本,整理任務(wù)5 090個(gè)[35];“北京記憶項(xiàng)目”目前已添加2 271條記錄,1 041篇文集,8 683張圖片,444個(gè)視頻[36];“社會檔案人項(xiàng)目”目前已完成詞條編輯10個(gè)[37]。
表3 國內(nèi)代表性數(shù)字人文眾包項(xiàng)目
3.1.2 國內(nèi)數(shù)字人文眾包項(xiàng)目隱私政策
目前,我國所開展的數(shù)字人文眾包項(xiàng)目隱私政策如下:“北京記憶項(xiàng)目”在互動網(wǎng)站“我的北京記憶”中設(shè)置了隱私聲明[38];“盛宣懷檔案抄錄項(xiàng)目”在《上海圖書館網(wǎng)上注冊服務(wù)協(xié)議》中提到了隱私制度及保護(hù)措施[39];“古籍整理工作平臺”在《用戶注冊協(xié)議》中設(shè)置了隱私保護(hù)內(nèi)容[40]?!笆⑿麘褭n案抄錄”“古籍整理工作平臺”與“社會檔案人”目前還沒有制訂具體的隱私政策。筆者借助Nvivo12質(zhì)性分析軟件對國內(nèi)數(shù)字人文眾包項(xiàng)目隱私政策的具體內(nèi)容進(jìn)行提煉和編碼研究,共得到“信息收集”“信息共享”和“信息安全”3個(gè)主范疇。具體內(nèi)容如表4所示。
表4 我國數(shù)字人文眾包項(xiàng)目隱私文本內(nèi)容
筆者通過對我國數(shù)字人文眾包項(xiàng)目指標(biāo)體系的比較分析可知:第一,目前我國數(shù)字人文眾包項(xiàng)目平臺隱私政策在形式上仍處于摸索階段,具體表現(xiàn)為制訂缺失、無統(tǒng)一標(biāo)準(zhǔn)且尚未形成完整的政策體系。如“北京記憶項(xiàng)目”平臺制定了特定的《隱私聲明》,而“盛宣懷檔案抄錄”與“古籍整理工作平臺”兩者隱私保護(hù)內(nèi)容位于“注冊協(xié)議”中。第二,文本內(nèi)容覆蓋面相對較窄。隱私文本僅涉及“信息收集”“信息共享”“信息安全”3個(gè)指標(biāo)。相較于國外形成的“信息內(nèi)容”“信息安全”“信息存儲”“信息共享”“信息使用”“信息收集”“用戶權(quán)利”7個(gè)指標(biāo)體系尚有不足之處。因此,研究國外數(shù)字人文眾包項(xiàng)目隱私政策的成功經(jīng)驗(yàn),對我國探索與制定隱私政策具有較高的參考價(jià)值。
本研究以47個(gè)國外數(shù)字人文眾包項(xiàng)目為研究對象,整體上挖掘了隱私政策高頻關(guān)鍵詞圖譜、主題分布以及個(gè)人信息隱私保護(hù)政策的類目體系,并進(jìn)一步剖析了發(fā)起平臺、國家(地區(qū))及眾包項(xiàng)目類型間的差異,本研究在具有理論價(jià)值的同時(shí),也具有較強(qiáng)的針對性和現(xiàn)實(shí)意義。
第一,本研究構(gòu)建了國外數(shù)字人文眾包項(xiàng)目隱私政策框架,涉及信息內(nèi)容、信息安全、信息存儲、信息共享、信息使用、信息收集及用戶權(quán)利7個(gè)維度,并明確了各指標(biāo)具體內(nèi)容,可以為我國個(gè)人信息保護(hù)隱私政策的設(shè)置提供框架及內(nèi)容上的理論指導(dǎo)。雖然我國已從國家層面制定了《個(gè)人信息保護(hù)法》《網(wǎng)絡(luò)安全法》等保護(hù)個(gè)人信息的法律法規(guī),但目前數(shù)字人文眾包類項(xiàng)目尚未制定統(tǒng)一的行業(yè)標(biāo)準(zhǔn),因此,應(yīng)在國家相關(guān)個(gè)人信息政策法規(guī)的基礎(chǔ)上,結(jié)合我國數(shù)字人文眾包項(xiàng)目個(gè)人信息的特點(diǎn)以及國外現(xiàn)有成果,明確眾包項(xiàng)目隱私政策中應(yīng)包含的基本內(nèi)容和關(guān)鍵條款,制定統(tǒng)一的、有實(shí)際執(zhí)行意義的行業(yè)標(biāo)準(zhǔn),加強(qiáng)行業(yè)自律。
第二,剖析發(fā)現(xiàn)不同發(fā)起平臺、不同國家(地區(qū))及不同項(xiàng)目類型隱私政策文本側(cè)重點(diǎn)存在差異,如在信息存儲這一維度,博物館、美國和英國、補(bǔ)充收集型更側(cè)重于強(qiáng)調(diào)“存儲時(shí)長”,檔案館、澳大利亞和新西蘭、圖書館以及轉(zhuǎn)錄型、修訂型則強(qiáng)調(diào)“存儲位置”。由此,我國數(shù)字人文眾包項(xiàng)目應(yīng)在充分結(jié)合我國個(gè)人信息保護(hù)法規(guī)的基礎(chǔ)上,有針對性地制定條款細(xì)則,可以根據(jù)發(fā)起平臺、任務(wù)類型的差異,“有的放矢”地參鑒上述研究成果。
第三,各機(jī)構(gòu)、各國(地區(qū))在“用戶權(quán)利”這一維度的關(guān)注度均相對較低,隨著我國網(wǎng)民對用戶權(quán)利的重視增加,特別是《個(gè)人信息保護(hù)法》中明確規(guī)定了個(gè)人信息權(quán)利包括知情權(quán)、決定權(quán)、查閱權(quán)、更正權(quán)、刪除權(quán)等,可見未來強(qiáng)化數(shù)字人文眾包項(xiàng)目中個(gè)人信息主體權(quán)利變得尤為重要。國外數(shù)字人文眾包隱私政策在更正權(quán)、刪除權(quán)、撤銷權(quán)、知情權(quán)、訪問權(quán)和知情權(quán)等進(jìn)行的探索,可供我國參考。
第四,對于青少年群體的關(guān)注,已得到了國外的重視,應(yīng)優(yōu)化與完善我國數(shù)字人文眾包項(xiàng)目未成年人隱私保護(hù)政策。隱私政策的制定須權(quán)衡青少年個(gè)人信息保護(hù),提升隱私政策的針對性,對未滿18周歲,特別是14周歲這個(gè)界定,重點(diǎn)突出對其個(gè)人信息的個(gè)性化保護(hù)條款,并采取有針對性的具體保護(hù)措施:如對所有14周歲以下青少年采用更低的同意年齡閾值;提供“家長控制”功能,在收集和利用未成年人個(gè)人信息時(shí)應(yīng)做出明確的提示或征詢其父母(監(jiān)護(hù)人)的同意等。