趙天昀(鄭州大學(xué)信息管理學(xué)院)
隨著互聯(lián)網(wǎng)技術(shù)、通信技術(shù)以及智能終端技術(shù)的迅猛發(fā)展,圖書館由傳統(tǒng)的信息檢索中心轉(zhuǎn)變?yōu)橹R信息服務(wù)中心,各種結(jié)構(gòu)豐富的知識信息資源更是伴隨著社交網(wǎng)絡(luò)、語義網(wǎng)的發(fā)展呈現(xiàn)指數(shù)級增長。與此同時,用戶對于數(shù)字圖書館的內(nèi)容以及服務(wù)形式的需求呈現(xiàn)多樣化,使得傳統(tǒng)圖書館的服務(wù)內(nèi)容和服務(wù)方式已很難適應(yīng)時代的要求。此外,用戶不同的需求促進了數(shù)字圖書館個性化服務(wù)方式的開展,即以用戶為本,基于用戶個體信息需求,包括使用行為習(xí)慣、愛好及個性化信息服務(wù)要求,并顧及用戶的層次和需求的差異產(chǎn)生,向用戶提供滿足其個體信息化需要的一種信息服務(wù),及針對不同的用戶,提供差異化的信息服務(wù)形式和服務(wù)內(nèi)容。
目前,個性化服務(wù)成為數(shù)字圖書館信息服務(wù)的主流,大致包括自定義服務(wù)界面設(shè)定、符合個人需求的內(nèi)容定制、個性化信息推送服務(wù)以及智能的信息檢索定制等。為了實現(xiàn)用戶個性化的需求,圖書館不可避免地需要收集用戶個人信息,對用戶的信息進行深入的分析和挖掘,這種基于數(shù)據(jù)挖掘及個性化推薦的主動信息服務(wù),導(dǎo)致用戶個人隱私受到侵犯。尤其是在大數(shù)據(jù)時代,惡意攻擊者通過外部數(shù)據(jù)源與圖書館所掌握的個人信息進行推理,極有可能導(dǎo)致用戶個人信息外泄,產(chǎn)生不良影響。國外學(xué)者較早地意識到上述問題,2015年6月29日,美國圖書館協(xié)會(American library Association,ALA)知識自由委員會隱私小組組長Michael Robinson提出,圖書館伴隨著現(xiàn)代互聯(lián)網(wǎng)提供個性化服務(wù),與目前圖書館一直以來的隱私保護之間形成鴻溝現(xiàn)象,一定程度上凸顯了學(xué)術(shù)界對個性化服務(wù)與用戶隱私之間關(guān)系的重視。因此,如何有效地保護數(shù)字圖書館個性化信息服務(wù)中用戶的隱私,成為數(shù)字圖書館發(fā)展中亟待解決的一個敏感而重要的課題。[1,2]
通常來說,個人隱私是指不愿意告訴他人或者不愿公開的個人事宜。美國圖書館協(xié)會將圖書館用戶隱私定義為圖書館有能力對用戶的想法、情感、信仰、恐懼、計劃、想象和控制等個人信息在不能與別人分享時給予保護。[3]國內(nèi)的學(xué)者普遍將圖書館用戶隱私劃分為兩類:用戶信息隱私和用戶活動隱私。[4]本文所涉及個性化服務(wù)中用戶隱私包括讀者的年齡、專業(yè)、性別和學(xué)歷等個人基本信息,也包括讀者為了享受圖書館個性化信息服務(wù)而被圖書館記錄的讀者過往閱讀史、借閱及檢索關(guān)鍵詞以及日志、行為習(xí)慣以及學(xué)術(shù)偏好等內(nèi)容,甚至嚴格來說,通過大數(shù)據(jù)分析和挖掘,進一步得到的用戶所從事的行業(yè)、潛在的需求甚至工作單位等信息,都可以歸為用戶隱私的范疇。
由于數(shù)字圖書館的個性化信息服務(wù)是基于用戶個人信息和需求開展的,因此收集、存儲以及使用個人信息的過程中將有可能泄露用戶隱私。本文將用戶隱私數(shù)據(jù)的泄露主要劃分為三種渠道。
(1)用戶個人信息數(shù)據(jù)及個體活動的采集。用戶在使用數(shù)字圖書館服務(wù)之前,需要填寫個人姓名、電子郵件、研究方向、興趣偏好、工作地點及聯(lián)系方式等信息進行申請注冊,一些網(wǎng)站還要求輸入身份證號等,這些個人基本信息被數(shù)據(jù)集記錄。除此之外,日志文件(用戶使用數(shù)字圖書館各種服務(wù)的過程中產(chǎn)生記錄文件,包括使用時間、頻次、IP地址以及地理位置、用戶終端類型、檢索關(guān)鍵詞,甚至瀏覽頁面次序及鼠標懸停時間等)會被服務(wù)器采集并存儲,一旦個人信息被過度采集,進一步被黑客獲取或者被內(nèi)部人員泄露,就使得用戶毫無隱私可言。
(2)信息的傳輸和存儲過程。目前,數(shù)字圖書館一般使用傳統(tǒng)的存儲系統(tǒng),或者采用云儲存系統(tǒng),最常見的對數(shù)據(jù)進行安全和隱私保護的手段仍然是基于數(shù)據(jù)加密技術(shù),即用某種加密技術(shù),將加密后的數(shù)據(jù)存入磁盤或托管至云存儲系統(tǒng)中。以云存儲為例,由于云服務(wù)器存在“誠實但好奇”的特性,即誠實執(zhí)行用戶的要求,但存在窺探用戶數(shù)據(jù)隱私的可能,即使數(shù)據(jù)在服務(wù)器中以密文的形式保存,服務(wù)提供商也可以在統(tǒng)計用戶對密文請求次數(shù)的基礎(chǔ)上建立用戶與特定密文的關(guān)系,挖掘潛在的用戶興趣。如,2009年3月谷歌云計算服務(wù)系統(tǒng)發(fā)生用戶數(shù)據(jù)泄露事件,之后微軟、亞馬遜等公司也出現(xiàn)類似的問題。
(3)濫用采集到的用戶信息。個性化服務(wù)需要對采集到的一系列用戶信息基于數(shù)據(jù)挖掘方法來分析和推理,預(yù)測用戶的需求。服務(wù)方往往為了追求更加精準的服務(wù),對用戶各種敏感信息不加以清洗地使用。此外,隨著效率和精度更高的機器學(xué)習(xí)、數(shù)據(jù)挖掘算法的投入使用,將使得用戶更多的隱私信息愈發(fā)容易泄露。
(4)相關(guān)業(yè)務(wù)數(shù)據(jù)外包。圖書館業(yè)務(wù)外包是一種新型圖書館管理方法,尤其是在互聯(lián)網(wǎng)+時代的到來,數(shù)字圖書館外包業(yè)務(wù)范圍更寬,數(shù)據(jù)存儲、數(shù)據(jù)分析等業(yè)務(wù)的外包也存在安全和隱私信息泄露風(fēng)險。
郭明珠等[5]從廣義的角度對圖書館用戶信息的隱私保護進行了界定:防止第三方獲取圖書館用戶信息及當(dāng)這種信息需要與第三方共享時,圖書館實施控制的能力。也就是說,用戶隱私保護,應(yīng)該既保證用戶能夠獲取相應(yīng)的服務(wù),又能夠最大程度地保護用戶隱私。在當(dāng)前的大數(shù)據(jù)時代背景下,圖書館提供精準個性化服務(wù)的同時,用戶隱私保護面臨著如下挑戰(zhàn)。① 數(shù)字圖書館提供的個性化服務(wù)方式較多,仍然存在很多未知的泄露用戶隱私的渠道。如,隨著智能移動終端的普遍使用,通過移動終端來享受圖書館個性化服務(wù)越來越方便,但泄露個人隱私的途徑就更多。② 用戶隱私保護和個性化服務(wù)是一對矛盾體,服務(wù)質(zhì)量越高,則用戶隱私越容易泄露,如何設(shè)計一些準則來平衡用戶隱私保護需求和圖書館收集用戶數(shù)據(jù)并提供個性化服務(wù)的需求。同時,如何保證數(shù)據(jù)可用性和隱私保護程度的均衡,是圖情研究領(lǐng)域隱私保護涉及的重點,同時也是信息學(xué)科隱私保護領(lǐng)域亟待解決的問題。③ 不同的用戶對隱私保護的需求不同,甚至同一用戶在不同時間段和場景下對隱私保護的要求也可能不同,如何更好地滿足用戶的個性化需求也是一個挑戰(zhàn)。
作為圖書館,網(wǎng)站收集個人資料,利用數(shù)據(jù)挖掘算法對用戶日志文件、Cookies文件等進行分析,甚至還存在將這些數(shù)據(jù)外包進行挖掘的情況。雖然,初衷是為了更好地為用戶提供服務(wù),但僅依賴于法律法規(guī)等政策層面上的保護還遠遠不夠,需要信息安全和隱私技術(shù)的幫助。因此,本文從政策法規(guī)層面和技術(shù)層面提出構(gòu)建用戶隱私保護機制的方法。
將國家的網(wǎng)絡(luò)安全和隱私保護的法律與行業(yè)法規(guī)相結(jié)合。首先,制定確保用戶隱私權(quán),就法律角度而言,界定用戶網(wǎng)絡(luò)隱私權(quán),明確隱私權(quán)的概念及范圍,完善與用戶隱私權(quán)保護相關(guān)的法律、法規(guī)和政策,實現(xiàn)對網(wǎng)絡(luò)環(huán)境中隱私權(quán)的專門保護。我國2016年11月剛剛頒布的《中華人民共和國網(wǎng)絡(luò)安全法》,其中聚焦了個人隱私信息泄露問題,明確了網(wǎng)絡(luò)產(chǎn)品服務(wù)提供者、運營者的法律責(zé)任。
其次,圖書館行業(yè)內(nèi)部同步加快配套制度建設(shè),加強基礎(chǔ)支撐力量建設(shè),確保政策法規(guī)有效貫徹實施。圖書館應(yīng)制定并完善保護用戶個人隱私的規(guī)章,如,美國圖書館協(xié)會知識自由委員會于2015年6月批準“圖書館隱私指南——給電子書借閱和數(shù)字內(nèi)容供應(yīng)商”,該指南指出了廠商保護圖書館用戶隱私的最佳做法,旨在鼓勵內(nèi)容供應(yīng)商和圖書館一起努力,為圖書館讀者進行電子書借閱和數(shù)字內(nèi)容交付制定有效的隱私保護策略和程序。[6]而我國在圖書館法規(guī)和政策制定方面還有待進一步加強。圖書館應(yīng)對用戶個人數(shù)據(jù)的收集、存儲、使用以及銷毀等環(huán)節(jié)的行為準則加以詳細規(guī)定,使之成為工作人員處理用戶個人數(shù)據(jù)的標準和流程。此外,對工作人員進行相應(yīng)的安全技能培訓(xùn),也能有效地防止其有意或無意的泄密。作為用戶,也應(yīng)充分知曉圖書館的隱私政策,包括圖書館對用戶個人信息的掌握范圍、利用程度及相關(guān)目的,從而提升用戶對使用個性化服務(wù)的安全感和信任感。
在大數(shù)據(jù)時代下,惡意的攻擊手段更加多樣化,這對圖書館數(shù)據(jù)中心的安全保障提出了更高的要求,必須關(guān)注用戶個人數(shù)據(jù)的完整生命周期,全方位構(gòu)建完善的個人隱私安全體系。
在網(wǎng)絡(luò)安全技術(shù)的防護下,對個人信息數(shù)據(jù)的采集、傳輸過程中,利用最新的數(shù)據(jù)加密、身份認證、訪問控制等手段進行保護。針對數(shù)據(jù)挖掘等給用戶帶來的隱私問題,可以盡快地采用目前隱私保護數(shù)據(jù)挖掘方法。自從1999年Rakesh Agrawal在數(shù)據(jù)挖掘頂級會議KDD上提出,隱私保護數(shù)據(jù)挖掘作為數(shù)據(jù)挖掘領(lǐng)域研究的重點之一之后,學(xué)界目前已經(jīng)取得了豐富的研究成果,其中,基于加密技術(shù)、數(shù)據(jù)失真和數(shù)據(jù)匿名三類方法分別針對不同應(yīng)用目的而設(shè)計,可以根據(jù)圖書館提供不同服務(wù)的類型選擇相應(yīng)的隱私保護數(shù)據(jù)挖掘算法。[7]以個性化服務(wù)中常用的推薦系統(tǒng)為例,差分隱私模型的應(yīng)用已經(jīng)實現(xiàn)了較好的數(shù)據(jù)可用性和強隱私保護。[8,9]此外,云計算技術(shù)所提供的超級計算、海量存儲、虛擬化和云資源供給動態(tài)伸縮的特點,契合了數(shù)字圖書館中大數(shù)據(jù)應(yīng)用有效性的技術(shù)保障,使得云服務(wù)成為圖書館信息建設(shè)的另外一個重要選擇,當(dāng)然,對應(yīng)于云服務(wù)的安全與隱私保護策略[10-13]可使得讀者的隱私數(shù)據(jù)管理更上一個臺階。
關(guān)注并研究數(shù)字圖書館個性化信息服務(wù)中用戶隱私問題,不僅僅關(guān)系到讀者個人的合法權(quán)益,同時還關(guān)系到未來智慧圖書館的健康有序發(fā)展。不論在法律法規(guī)層面,還是在隱私保護技術(shù)層面,圖書館必須形成相應(yīng)的長效機制,才可以讓用戶更放心地享受圖書館提供的各種高效的個性化服務(wù)。同時,作為個性化服務(wù)的對象,用戶本身亦需要增強自我防范和保護意識,維護自身合法權(quán)益。
[參考文獻]
[1]易紅,任競.圖書館大數(shù)據(jù)服務(wù)環(huán)境下用戶隱私泄露容忍度的實證研究[J].圖書館論壇,2016,36(4):57-64.
[2]周姍姍,徐坤.大數(shù)據(jù)背景下信息服務(wù)中的用戶隱私權(quán)保護[J].現(xiàn)代情報,2015(11):43-48.
[3]羅曼.論圖書館用戶的隱私保護[J].大學(xué)圖書館學(xué)報,2005,23(1):63-65.
[4]王碧琴,等.?dāng)?shù)字圖書館用戶信息隱私的安全威脅分析[J].圖書館學(xué)研究,2015(10):34-36.
[5]郭明珠,等.個性化信息服務(wù)中用戶隱私保護對策探究[J].圖書館學(xué)研究,2010(8):62-66.
[6]李愛國,等.圖書館用戶信息資源化過程中用戶隱私信息保護問題與對策[J].圖書情報工作,2015(13):26-30.
[7]張海濤,等.隱私保護數(shù)據(jù)挖掘研究進展[J].計算機應(yīng)用研究,2013,30(12):3529-3535.
[8]鮮征征,李啟良.差分隱私保護在推薦系統(tǒng)中的應(yīng)用研究[J].計算機應(yīng)用研究,2016,33(5):1549-1553.
[9]彭飛,等.一種基于群組推薦的用戶隱私保護方法 [J].計算機應(yīng)用研究,2015,32(3):869-872.
[10]季正波,等.基于用戶行為記錄的云服務(wù)隱私保護體系和算法[J].計算機科學(xué),2015,42(8):185-189.
[11]祖紅波.云計算環(huán)境中圖書館讀者的個人信息保護初探 [J].圖書館工作與研究,2014,1(10):47-50.
[12]李暉,等.公共云存儲服務(wù)數(shù)據(jù)安全及隱私保護技術(shù)綜述[J].計算機研究與發(fā)展,2014,51(7):1397-1409.
[13]麥范金,等.云圖書館中移動用戶隱私五維保護模型的構(gòu)建[J].情報理論與實踐,2014,37(4):92-97.