趙想飛 常穎聰 黃閩 崔增輝
(河北師范大學圖書館,石家莊 050024)
大數據、云計算及人工智能等新技術給圖書館帶來了各種應用需求的機遇,要求圖書館以知識化和智慧化的形態(tài)來適應巨變形勢下的信息環(huán)境。為了更好地履行職責,圖書館的業(yè)務管理系統(tǒng)需要不斷地適應數字資源管理和讀者服務需求的變化。在這種趨勢的引領下,圖書館管理系統(tǒng)由最初以館藏管理為中心、以OPAC為代表的第一代圖書館自動化系統(tǒng),發(fā)展到“藏用一體”并使圖書館服務標準化的第二代圖書館集成管理系統(tǒng)(Integrated Library Management System,ILS),該系統(tǒng)雖然能夠實現資源導航與發(fā)現、文獻傳遞及新媒體服務等功能,但是難以有效地對數字資源進行集成管理,也無法按照知識信息流的規(guī)律去開展有效的知識服務,同時也存在跨平臺信息孤島等諸多問題,難以滿足圖書館深度專業(yè)的知識化和智慧化發(fā)展需求。基于這一趨勢,第三代圖書館服務平臺(Library Service Platform,LSP)應運而生,這一概念由Breeding[1]在2012年的報告中提出,很快得到圖書館界的認同,并傳播開來。他認為LSP應包括對印刷和電子資源的紙電合一的全媒體管理,支持業(yè)務和服務的全流程統(tǒng)一管理,具備全球知識庫,以多租戶的方式提供SaaS服務,通過APIs支持圖書館互聯(lián)互通和系統(tǒng)擴展,是將現有集成管理系統(tǒng)、電子資源管理工具以及數字資產管理系統(tǒng)整合在一起的平臺[2]。
除以上特點外,肖錚等[3]認為LSP的主要特征還具有云端化,借助云服務的高可用性、高擴展性和通用性,實現對圖書館各類數據的細致深入地分析,為圖書館的發(fā)展提供決策支持;張磊等[4]認為LSP通過可視化數據分析工具深度分析平臺上的海量數據,建立大數據分析平臺,幫助圖書館進行用戶監(jiān)測分析和服務優(yōu)化決策;施曉華等[5]認為LSP是在公有云和私有云協(xié)同的混合架構下構建的,要充分考慮平臺上的數據安全??梢哉fLSP不再僅僅是一個簡單的系統(tǒng),而是一個以“數據驅動”為目標的“互聯(lián)網+云平臺+大數據”的共贏的開放性學術生態(tài)系統(tǒng),數據安全是平臺建設要考慮的重要問題。
數據安全是圖書館提升管理效率和服務質量的基礎,是支撐圖書館應用LSP的前提。國際標準化組織(ISO)對計算機系統(tǒng)中數據安全[6]定義為:數據安全主要分為數據本身的安全、數據防護安全及數據存儲安全三方面內容,并采用相應的技術和安全保護措施以保護數據不被偶然與惡意的原因遭到破壞、更改與泄露。2021年6月頒布的《數據安全法》[7]規(guī)定:“數據安全,是指通過采取必要措施,保障數據得到有效保護和合法利用,同時明確了組織、個人在開展數據活動中對數據安全要承擔相應的保護義務和責任”。保障圖書館的各類數據安全是圖書館向服務智能化轉型要考慮的首要問題。
LSP的特點決定了其在部署應用過程中必然會涉及大量的用戶信息、隱私及知識產權問題。隨著大數據中心和云平臺成為網絡攻擊的主要目標,圖書館如何保障生產并存儲在云平臺上的數據安全是面臨的重要問題。雖然圖書館應用LSP后會在信息處理與利用方面提高工作績效,但是不可避免地會帶來數據安全風險。因此,做好圖書館數據安全工作,對服務質量的提升至關重要。
LSP在圖書館應用過程中,會產生海量數據,可分為以下兩種類型。①業(yè)務管理數據,例如:讀者數據(身份信息、行為數據等);數字資源(各種數據庫、電子書、特色庫)的利用數據,同時還包括版權信息、使用范圍、利用率等方面的數據;圖書管理系統(tǒng)中的館藏數據(入館時間、分類、元數據、閉/開架位置等書目信息)。②服務數據,如參考咨詢命題/項目、館際互借、查引查新、專題、閱讀推廣活動等數據。
LSP會深入分析、挖掘數據,具有全面化、自動化、深度化及動態(tài)化等特征。第一,LSP盡可能全面、實時地采集讀者的各種行為數據,除了借閱數據、入館數據,還包括讀者在館的運動軌跡數據、信息檢索數據、讀者空間設施使用數據,甚至還有讀者參與圖書館各種活動的數據,進而繪制出多維度的“讀者畫像”,而這些數據具有敏感性,需要對其訪問過程、方式及后續(xù)使用進行合理限制,以保障圖書館數據安全;第二,圖書館對讀者數據的采集程度變得非常細致,數據的形式不再局限于文本形式,也可以是圖像、聲音和視頻;第三,LSP能夠將OPAC系統(tǒng)、空間設施管理系統(tǒng)、門禁系統(tǒng)和數據庫管理系統(tǒng)等實現互聯(lián)互通,各種數據的集中管理和相關性分析能最大化地挖掘數據價值,但同時增加了數據安全的風險。
盡管LSP給圖書館應用環(huán)境和服務方式帶來深刻變革,但是云計算的引入使圖書館大量數據上傳至云服務器中,導致圖書館面臨云服務信息安全的威脅,影響數據的安全性及保密性。云服務提供商提供的數據安全服務協(xié)議中只有概括性的規(guī)定,沒有具體的數據安全方案,這也會給圖書館數據安全存儲帶來許多未知風險。區(qū)塊鏈技術雖然能夠提高數據存儲的安全性,但是其自身缺乏體系化安全防護,其全量備份的機制也容易遭遇到存儲瓶頸。
因此,在分析LSP本身安全風險的基礎上,再結合相關技術的安全風險分析,可以看出,LSP平臺下的數據安全保障策略非常必要,能夠幫助圖書館制定數據安全制度、框架、政策及服務流程[8],進而更好地促進圖書館在管理、服務、建設等方面的智慧化發(fā)展。
國內很多學者針對圖書館數據安全工作進行了深入研究,試圖尋求一些關于數據安全的解決方案。例如:周秀霞等[9]提出用Five Safety安全框架來規(guī)劃圖書館數據的安全訪問,對數據進行敏感度分級,提高圖書館數據安全訪問水平;梁俊榮[10]從圖書館信息系統(tǒng)安全管理方面著手,設計了圖書館安全風險識別與管理系統(tǒng)用于提高圖書館數據的安全性;萬映紅等[11]對智慧圖書館個人數據安全存在的問題進行解析,提出了保護個人數據安全的解決方案;張娟等[12]提出了完善信息安全管理和加強館際協(xié)作來應對圖書館安全風險的方案。
圖書館數據安全一直貫穿于數據的采集、存儲、訪問與利用、共享及更新等數據活動的全過程。但是,在不同階段,圖書館對數據的應用與數據安全的保護期望不同,因而,不同階段采用不同的措施能夠更詳細地制定數據安全方案(見圖1)。
圖1 數據安全方案
在數據采集階段,LSP會盡可能地細致、全面并動態(tài)地采集數據,這些數據主要包括兩種類型[13]:一是讀者身份數據和行為數據,如讀者身份信息、進館數據以及座位預約數據;二是資源數據,主要包括文本數據、數值型數據、數據庫記錄、媒體文件、檢索歷史,或其他數據及信息。數據采集的目的是為圖書館后期的數據分析和利用提供更多的參考依據。
(1)制定相應的數據安全政策。隨著網絡安全事件的頻發(fā),讀者對數據安全就更敏感,對信息保護的意愿就更加強烈。讀者在披露如身份證號、學工號等個人敏感信息時變得越來越謹慎。據《2019全國網民網絡安全感滿意度調查統(tǒng)計報告》[13]顯示:37.4%的網民認為個人信息泄露的比較多,網絡安全態(tài)勢仍然很嚴峻;50.15%的用戶遭遇過信息泄露的問題,個人信息安全的狀況仍需改善。為了保證各類數據安全,圖書館應該告知讀者收集的內容、目的以及關于數據安全的政策和承諾。目前,國內大部分圖書館都沒有明確地與讀者就個人數據采集和安全達成協(xié)議[14],也很少在圖書館網站上發(fā)布關于數據安全的管理規(guī)則。同時,云服務提供商通過相關技術很容易采集到圖書館的敏感數據,甚至擁有采集數據的超級權限,一旦管理失控,很容易帶來巨大的數據安全風險。因此,圖書館應該出臺相應的政策和措施來彌補這方面的漏洞。
(2)根據內容和目的確定不同的采集方式。第一,對于為滿足圖書館優(yōu)化資源、管理及服務需求而采集的凸顯讀者群體行為的數據,盡可能采用匿名化、模糊化的方法進行數據處理。如圖書館管理系統(tǒng)中的借閱量、資源使用量以及遠程訪問量、下載量的分析數據等都是按照時間軸來呈現借閱量、訪問量和下載量等讀者使用信息的[15],通過數據脫敏技術對讀者敏感數據進行模糊處理。第二,面向讀者采集帶有明顯身份特征的數據時,如學工號、院系以及訪問數據庫的時間和IP地址等,圖書館應該根據不同的數據應用環(huán)境,制定不同的數據安全策略,提前做好數據安全規(guī)劃。
基于LSP的云部署,其所采集的數據由本地存儲轉移到云平臺存儲,這意味著圖書館不再獨自享有數據,而云服務提供商也擁有這些數據,圖書館的數據安全面臨很大的威脅。雖然圖書館會盡可能地保證數據安全,但是在實際操作過程中會受到各種因素的影響,如數據存儲設備大小、安全技術儲備等。因此,現階段可以采用以下三大措施來保障數據安全。第一,根據重要性及安全等級等指標,采用不同的方式進行分級、分布存儲。涉及讀者身份、行為、圖書館核心資產的數據(專題活動數據、特色庫數據),需要本地存儲。第二,可以將一些安全級別低的數據進行加密脫敏存儲在公有云平臺上,借此降低存儲成本。例如,關于借閱量、數據庫訪問量、空間環(huán)境數據等表征讀者群體行為的數據。第三,圖書館應參照國家發(fā)布的《信息安全技術網絡安全等級保護基本要求》《信息安全技術網絡安全等級保護測評要求》等網絡安全領域的國家標準[16],引入Web防火墻軟件、網絡入侵檢測報警系統(tǒng)及采用網絡隔離等手段對主要業(yè)務系統(tǒng)進行分區(qū)分域和定級防護,建立一個“打防管控”的一體化網絡安全防護體系來保障數據存儲安全。
數據訪問與利用是圖書館、云服務提供商在管理和服務中對數據進行提取、分析,向讀者推薦其感興趣的主題,統(tǒng)計和識別讀者并分析讀者行為的過程,以便更深入地挖掘數據價值。在此階段,圖書館需要做出以下3個方面的努力。
(1)建立明確的數據訪問與利用制度。數據安全事件大多數情況下是由人為造成的,例如,學生身份證號的泄露,導致學生信息被企業(yè)冒用虛報個稅,引起法律糾紛[17]。圖書館需要從制度上制定一個數據訪問與利用的可行規(guī)范來保護各類數據安全,形成數據安全把控機制。一方面,圖書館應規(guī)范工作人員訪問與利用數據的行為,對相關人員進行定崗定責,本著“誰使用誰負責”的原則,根據崗位需求分配相應的權限,落實相關人員的主體責任,尤其是對數據安全人員錄用及轉崗等進行規(guī)范化管理[18];另一方面,可以將動態(tài)機器人安全防御技術應用在圖書館數據安全中,變被動防御為主動防御,使數據安全自動化和工具化,可以全時段、全方位地保護數據安全,保障圖書館與讀者、云服務提供商及數據商之間在數據訪問與利用過程中的數據安全。
(2)審核數據訪問和利用記錄。在大批量訪問、調取及分析圖書館核心數據時,一方面,圖書館應根據工作人員的權限執(zhí)行相應的審核程序,對館員的行為加以限制,同時對數據訪問、利用的時間、責任人、用途及去向做好記錄;另一方面,圖書館應就數據的訪問與利用和云服務提供商簽訂相應的訪問控制協(xié)議,如數據訪問主體的身份驗證、訪問及利用數據時是否告知并獲得圖書館數據授權書等。只有這樣才能保證數據不被濫用和泄露。
(3)分級與分布訪問數據?;跀祿姆旨壟c分布存儲特性,圖書館和云服務提供商可以對數據進行分級與分布訪問。第一,對于安全級別高且涉及讀者隱私及圖書館核心財產的數據,只有獲得權限的圖書館工作人員才能訪問,這些數據對云服務提供商不開放;第二,對于表征圖書館群體性質的管理與服務方面的數據,可以供云服務提供商訪問及利用,這樣做可以最大限度地保障數據安全。
圖書館資源、管理、服務方面的數據可以為圖書館的智能化和個性化服務提供數據支持,也可以為第三方機構提供改進和評估產品服務質量的數據依據。
因此,圖書館需要建立與讀者、第三方機構數據共享機制,在數據共享過程中必須遵循數據合理使用原則,綜合運用可靠的安全管理技術來保障數據安全。伴隨著數據應用及讀者信息的變化,數據的殘余價值也會發(fā)生階段性降低,因此為了降低數據運維成本,需要定期地對過期及冗余數據進行更新維護。
數據安全評估是從數據安全的角度出發(fā),分析數據活動全過程的安全風險,使風險可視化、可控化,提升圖書館數據安全防護水平,實現數據安全的規(guī)范化和精細化管理。
在數據采集階段,圖書館應關注采集環(huán)境、采集行為、采集傳輸及采集管理等方面的風險,并定期進行有針對性的安全評估,制定相應的數據安全評估指標。例如:采集人員的權限和角色是否明確;采集行為是否規(guī)范;采集后數據傳輸是否加密;采集的數據是否進行安全分級處理。
在數據存儲階段,需要關注數據存儲環(huán)境安全、數據存儲加密、數據存儲空間分級分布、數據存儲訪問控制、數據容災備份與恢復等安全問題,并針對這些安全風險定期評估。
在數據訪問與利用階段,需要評估以下風險:①云平臺對人員認證和權限管理不當,導致非法用戶越權訪問數據;②云平臺本身缺乏敏感數據發(fā)現與識別機制,導致敏感數據在分析后泄露[19];③云平臺的安全評估及審計手段缺失,導致無法有效監(jiān)督用戶訪問行為,增大敏感數據泄露的風險,給數據所有權人造成巨大的經濟損失和社會不良影響。
在數據共享與更新階段,需要評估以下風險:①在數據共享過程中,云服務提供商直接將未加密或未脫敏的數據傳輸給第三方機構共享;②云服務提供商與第三方機構共享圖書館數據,是用于改進自身的服務或產品還是有其他用途,圖書館和云平臺需要在簽訂使用服務協(xié)議時應該明確用途;③在數據生命周期結束后,數據未被徹底更新維護,還存有敏感數據的殘余介質。
LSP正在圖書館領域如火如荼地應用中,通過分析以上數據活動各階段安全風險,明確了需要評估的內容及指標,希望逐步縮小數據安全風險的現實情況與社會期望之間的差距,對于構建全方位防御的數據安全保障體系起到一定的作用。
現階段,我國對于數據安全保護的法律制度仍然不夠健全。近年來我國先后出臺了《網絡安全法》《公共圖書館法》《數據安全法》等法律,落實了數據安全的主體責任,明確了數據安全對于國家安全的重要性,但是在如何保障圖書館等公益性單位的數據安全方面卻描述得不詳細。為了保證LSP在圖書館的順利運行,圖書館應制定符合本館的數據安全規(guī)定,避免將來因數據泄露或數據產權而產生不必要的糾紛。相關的數據安全管理規(guī)定應涉及以下3個方面:①圖書館應當明確數據活動各階段的范圍、用途,數據安全所采用的技術及手段,數據公開的格式等,在網站上發(fā)布數據安全的管理規(guī)定;②對于圖書館數據的調用及訪問,要制定相關的身份認證、權限、職責審查機制,避免權責不明確而導致數據泄露;③須和云服務提供商等第三方簽訂數據安全協(xié)議,明確雙方在維護數據安全方面的權利和義務。
圖書館數據安全的很多措施和設想的付諸實施都需要相關技術的支撐。圖書館需要關注的相關技術有3個。①區(qū)塊鏈技術。它是將數據區(qū)塊以鏈的形式順序串聯(lián)在一起的數據結構,彼此相鄰的兩個數據區(qū)塊存在關聯(lián),在其中的一個數據區(qū)塊數據不修改的情況下,其余數據區(qū)塊的數據幾乎無法篡改,能夠提高圖書館數據存儲安全和可信度。國內學者對區(qū)塊鏈技術在數據隱私保護[20-22]、數據安全領域[23]、用戶畫像數據安全[24]等方面都有深入的研究,因此,區(qū)塊鏈技術在圖書館數據安全制度的建立方面會大有作為。②網絡安全態(tài)勢感知技術。加強數據安全傳輸防御措施,對可能遭遇的數據安全傳輸風險進行提前預判與監(jiān)測,布置安全防御手段,提高數據安全的保障水平。③云存儲技術。為了保證數據存儲的安全,各種云平臺及大數據的技術安全框架都在不斷升級,通過加密、脫敏等手段,加強數據在云平臺上訪問、存儲等方面的安全性,明確圖書館對數據的所有權。圖書館應當經常關注新技術的發(fā)展趨勢,探討新技術在圖書館數據安全方面應用的各種可能性,這是LSP將來應用過程中必須要重視的工作。
目前,LSP越來越受到廣泛重視,圖書館的發(fā)展也正朝著數據化、信息化、云端化的方向迅速邁進,但同時數據也時刻面臨安全威脅。因此,圖書館應該從以下3個方面提升數據管理水平:①圖書館應該根據本館的具體情況制定數據安全管理制度,對數據活動的各階段做出相應的程序規(guī)定[25],改進館內安全管理規(guī)則,降低數據被破壞的概率;②加強專業(yè)化人員的培訓,提升其處理和利用數據的安全知識技能,并根據業(yè)務崗位的需要進行定崗定責,遵循最小授權原則分配工作權限,讓館員樹立數據安全意識;③做好網絡安全等級保護工作,完善安全物理環(huán)境、安全通信網絡、安全區(qū)域邊界及安全計算環(huán)境等方面的工作,提升網絡及業(yè)務系統(tǒng)的安全應用防護能力、隱患發(fā)現能力及應急處置能力,切實保障圖書館的數據安全。
LSP是基于云平臺及大數據技術架構的開源信息業(yè)務系統(tǒng),其安全穩(wěn)定運行是一件極其重要的工作,如何保障數據安全是關乎圖書館發(fā)展和服務升級的重要因素。本文從數據活動的各個階段,分析了LSP運行過程中所面臨的數據安全威脅,提出構建數據安全方案,在《網絡安全法》實施及《數據安全法》發(fā)布的當下,期待能夠促進圖書館數據保護措施的制定和實施,對開展數據安全工作具有一定指導和實踐意義。