王 彤(山西大學(xué)經(jīng)濟(jì)與管理學(xué)院)
?
大數(shù)據(jù)時(shí)代下的圖書館跨界服務(wù)信息安全技術(shù)問題及對策
王彤(山西大學(xué)經(jīng)濟(jì)與管理學(xué)院)
摘要:在跨界服務(wù)概念為信息資源建設(shè)、圖書館服務(wù)模式轉(zhuǎn)型帶來優(yōu)勢的同時(shí),會伴隨產(chǎn)生新環(huán)境下的信息安全技術(shù)問題,這些問題的解決迫在眉睫。通過對大數(shù)據(jù)時(shí)代下圖書館跨界服務(wù)的特征及服務(wù)方式的分析,指出圖書館進(jìn)行信息服務(wù)過程中的知識產(chǎn)權(quán)保護(hù)、隱私數(shù)據(jù)保護(hù)、惡意攻擊和計(jì)算機(jī)病毒、數(shù)據(jù)存儲兼容和容災(zāi)等安全技術(shù)問題,并針對這一系列問題提出了對數(shù)據(jù)存儲及保護(hù)、知識產(chǎn)權(quán)的保護(hù)和訪問控制等相關(guān)對策。
關(guān)鍵詞:圖書館跨界服務(wù);大數(shù)據(jù);信息安全;技術(shù)問題;對策
在信息技術(shù)行業(yè),大數(shù)據(jù)產(chǎn)業(yè)被普遍定義為:“建立在對互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等渠道廣泛大量數(shù)據(jù)資源收集基礎(chǔ)上的數(shù)據(jù)存儲、價(jià)值提煉、智能處理和分發(fā)的信息服務(wù)業(yè)”,[1]通常將大數(shù)據(jù)的特征概括為以下4V:Volume(數(shù)據(jù)量大與數(shù)據(jù)完整性)、Variety(數(shù)據(jù)多樣性)、Velocity(響應(yīng)速度快)和Value(獲得洞察力和價(jià)值)。圖書館作為數(shù)據(jù)、信息、文獻(xiàn)、知識的高度集中機(jī)構(gòu)和信息服務(wù)提供場所,正是契合著這樣的數(shù)據(jù)特征和服務(wù)要求。大數(shù)據(jù)環(huán)境下,無論是對信息資源的有效整合及利用,還是所提供服務(wù)的深度、廣度和特色性、主動性,具有專業(yè)優(yōu)勢的圖書館缺乏核心競爭力,極易被網(wǎng)絡(luò)和內(nèi)容生產(chǎn)商、供應(yīng)商等搶去信息服務(wù)空間,甚至可能被完全替代。因此,圖書館跨界服務(wù)是尋求未來發(fā)展出路和實(shí)現(xiàn)自身變革的必然結(jié)果。然而,由于其開放性的必然要求,在跨界服務(wù)為信息資源建設(shè)、信息服務(wù)質(zhì)量、圖書館服務(wù)模式轉(zhuǎn)型帶來優(yōu)勢的同時(shí),信息安全技術(shù)的重要性也隨之上升到了新高度。
本文所描述的跨界服務(wù)是指圖書館在參與文獻(xiàn)、信息、知識的生產(chǎn)、分析、傳播和利用的過程中,以實(shí)現(xiàn)高效利用信息資源、拓展圖書館服務(wù)業(yè)務(wù)、提高各用戶的社會價(jià)值和經(jīng)濟(jì)價(jià)值為目的,在不同的信息系統(tǒng)或信息環(huán)境下與其他組織機(jī)構(gòu)開展業(yè)務(wù)協(xié)同或互聯(lián)互通的合作性服務(wù)。[2]圖書館跨界服務(wù)能夠創(chuàng)造性地提高自身和各合作組織機(jī)構(gòu)的信息資源利用率和信息的流通,拓寬信息服務(wù)領(lǐng)域,在低成本條件下不僅能夠?qū)崿F(xiàn)圖書館從圖書管理到知識整合、從傳播知識到全方位的知識服務(wù)、從被動接受用戶到主動推送服務(wù)完美轉(zhuǎn)型,而且,通過對用戶信息行為的深度挖掘,讓用戶享受到“一站式”的信息服務(wù),為知識創(chuàng)新提供有利的氛圍和條件。這不但順應(yīng)大數(shù)據(jù)時(shí)代下信息服務(wù)機(jī)構(gòu)的發(fā)展需求,還能更廣泛地實(shí)現(xiàn)各組織機(jī)構(gòu)以及用戶的社會價(jià)值。
2.1基于信息運(yùn)動的跨界服務(wù)
信息運(yùn)動是用信息鏈來描述的,信息鏈?zhǔn)怯墒聦?shí)、數(shù)據(jù)、信息、知識和情報(bào)五個(gè)鏈環(huán)組成的。劉細(xì)文教授認(rèn)為,圖書館的信息加工組織、服務(wù)提供甚至生存發(fā)展都依附于信息鏈的各個(gè)鏈環(huán),因此,圖書館應(yīng)該針對處于信息鏈不同層次用戶,結(jié)合數(shù)據(jù)分析、數(shù)據(jù)挖掘、信息過濾等技術(shù),加強(qiáng)對用戶行為數(shù)據(jù)的分析,提供個(gè)性化、多樣化和定制化的創(chuàng)新服務(wù)。[3]
2.2基于知識組織創(chuàng)新過程的跨界服務(wù)
即基于知識鏈的跨界服務(wù),可以看作是對信息運(yùn)動過程中從信息到知識這一環(huán)節(jié)的延伸。圖書館應(yīng)借助互聯(lián)網(wǎng)信息平臺,利用大數(shù)據(jù)環(huán)境特點(diǎn),發(fā)揮數(shù)字資源優(yōu)勢,匯集各種數(shù)據(jù)流、信息流、知識流,圍繞知識的生產(chǎn)過程、認(rèn)證過程、存儲過程、組織過程、傳播過程、利用過程、創(chuàng)新過程等一系列循環(huán)流程實(shí)現(xiàn)知識鏈的動態(tài)構(gòu)建與管理,開展集成化、系列化、一體化跨界信息服務(wù),成為重要的知識核心。這樣的跨界服務(wù)可以使得信息加工程度更加深化、圖書館服務(wù)范圍更加寬泛,既能夠滿足用戶的需求,又能夠促進(jìn)業(yè)界信息資源的共建共享,迎合知識經(jīng)濟(jì)時(shí)代信息服務(wù)機(jī)構(gòu)發(fā)展的要求。
2.3貫穿用戶工作流的柔性跨界服務(wù)
在大數(shù)據(jù)時(shí)代,圖書館更重要的是滿足用戶對知識概念的理解、知識邏輯關(guān)系的展示、知識推理、知識挖掘的需求,參與用戶知識創(chuàng)造的過程,[4]幫助用戶進(jìn)行一系列信息活動,主動向用戶提供高效率的跨界服務(wù)。如:圖書館提供跨界服務(wù)為用戶描繪知識圖譜,以時(shí)間、地域?yàn)檩S線,通過可視化方式將信息資源呈現(xiàn)給用戶。[5]以明尼蘇達(dá)大學(xué)圖書館提出的在線研究環(huán)境(Online Research Environment)為例,該系統(tǒng)集成了研究進(jìn)度管理、動態(tài)前沿跟蹤、交叉學(xué)科研究、信息資源推薦、研究團(tuán)隊(duì)協(xié)作交流、個(gè)性化知識樹構(gòu)建等新型服務(wù)。
2.4聯(lián)結(jié)服務(wù)主體的集成跨界服務(wù)
由于搜索引擎、網(wǎng)絡(luò)出版商、社交網(wǎng)絡(luò)平臺以及各種軟件應(yīng)用的逐步興起,圖書館提供信息服務(wù)的重要地位受到了嚴(yán)重沖擊。因此,圖書館應(yīng)該主動適應(yīng)新的信息環(huán)境,積極應(yīng)對,與搜索引擎服務(wù)方(如Google、百度)、文獻(xiàn)管理系統(tǒng)(如Endnote、NoteExpress)、網(wǎng)絡(luò)教育服務(wù)方 (如 Mooc、2tor、Blackboard)、網(wǎng)絡(luò)社區(qū)化知識平臺(如Cyworld、豆瓣、知乎、Linkedln)等大眾化、商業(yè)化的網(wǎng)絡(luò)信息平臺結(jié)成聯(lián)盟,形成集成優(yōu)勢,實(shí)現(xiàn)行業(yè)共贏的美好愿景。
信息資源同其他資源一樣,是有價(jià)值的。信息安全是圖書館跨界服務(wù)的基礎(chǔ)要求。如果信息安全缺乏保障,那么跨界系統(tǒng)建設(shè)就會是空中樓閣,一旦發(fā)生問題,損失不可估量。由于信息技術(shù)的迅猛發(fā)展,新的安全威脅不斷產(chǎn)生,因此信息安全的概念也在相應(yīng)地更新,尤其在大數(shù)據(jù)時(shí)代,其影響愈發(fā)深遠(yuǎn)。信息安全問題最大的一個(gè)特點(diǎn)就是隱蔽性,在不知不覺中就可能使信息服務(wù)機(jī)構(gòu)蒙受重大損失。不同于普通的圖書館聯(lián)盟,圖書館在進(jìn)行跨界信息服務(wù)過程中的信息安全要面臨來自更多不同領(lǐng)域的挑戰(zhàn),無論是安全技術(shù)、人的行為,還是管理理念及制度,都是不容忽視的重要方面。本文主要從安全技術(shù)方面進(jìn)行討論。
3.1對知識產(chǎn)權(quán)及衍生知識產(chǎn)權(quán)的保護(hù)問題
在大數(shù)據(jù)環(huán)境中,圖書館跨界服務(wù)會構(gòu)建由海量信息資源組成的共享知識庫,以實(shí)現(xiàn)信息資源共享與交流。大量的數(shù)字化信息資源在網(wǎng)絡(luò)環(huán)境中傳播,極易被截取或復(fù)制,各種尖銳的知識產(chǎn)權(quán)矛盾由此而生。更有其極,在云共享和分布式存儲成為數(shù)據(jù)存儲主要發(fā)展方向的今天,知識產(chǎn)權(quán)矛盾不斷產(chǎn)生新的問題:各機(jī)構(gòu)通過購買云服務(wù),把自己的數(shù)字資源交給云服務(wù)商托管。按照傳統(tǒng)知識產(chǎn)權(quán)觀念,數(shù)據(jù)所有者應(yīng)該完全擁有被托管數(shù)據(jù)的知識產(chǎn)權(quán),但是在現(xiàn)實(shí)過程中,當(dāng)數(shù)據(jù)被交給云服務(wù)提供商后,他們會深入挖掘自己作為“數(shù)據(jù)核心”的潛在價(jià)值,想方設(shè)法對這些數(shù)據(jù)加以利用。近年來,隨著云服務(wù)的推廣和技術(shù)的發(fā)展,不斷有服務(wù)提供方以數(shù)據(jù)整合、數(shù)據(jù)挖掘、知識服務(wù)的名義以用戶原始數(shù)據(jù)為基礎(chǔ)進(jìn)行二次開發(fā)。以O(shè)CLC(聯(lián)機(jī)計(jì)算機(jī)圖書館中心)為例,其每季推出的高校圖書館與科研圖書館推薦書目、作品的服務(wù),是其利用WorldCat聯(lián)合編目庫中集成的館藏?cái)?shù)據(jù)開發(fā)出的一系列新產(chǎn)品。其Web級云計(jì)算圖書館集成系統(tǒng)一旦上線,將會收集大量圖書館的讀者信息及借閱信息。這些數(shù)據(jù)本是僅屬于成員機(jī)構(gòu)的,但若云服務(wù)提供商加以二次開發(fā)而生成新產(chǎn)品或新服務(wù),其知識產(chǎn)權(quán)的界定將成為新的問題。[6]
3.2用戶隱私保護(hù)問題
大數(shù)據(jù)背景下,圖書館跨界服務(wù)能為用戶提供豐富的知識服務(wù)——知識挖掘、知識評價(jià)、數(shù)據(jù)分析等。在利用大數(shù)據(jù)手段整合、分析、挖掘館藏?cái)?shù)字資源內(nèi)匯集的海量數(shù)據(jù)信息時(shí),會涉及大量個(gè)體用戶和機(jī)構(gòu)的私密信息,如果沒能對這些數(shù)據(jù)進(jìn)行妥善處理,可能會對社會和自身帶來嚴(yán)重威脅。在提供跨界服務(wù)的過程中,圖書館收集的用戶信息包括用戶資料、讀者行為、習(xí)慣偏好、個(gè)人位置信息等,甚至已經(jīng)深入到微博、微信等社交網(wǎng)絡(luò),存在極大的商業(yè)價(jià)值,如果不慎泄露,對用戶的生活造成困擾,甚至威脅用戶安全。
3.3計(jì)算機(jī)病毒和惡意攻擊
圖書館跨界服務(wù)是通過互聯(lián)網(wǎng)傳遞信息與數(shù)字資源并提供服務(wù)的,海量的信息資源將吸引眾多攻擊者,不可避免地成為黑客容易攻擊的目標(biāo)。他們通過尋找互聯(lián)網(wǎng)環(huán)境內(nèi)的安全漏洞,廣泛利用0day漏洞和新型APT攻擊、各種病毒來竊取用戶資料或破壞存儲和傳輸?shù)男畔?。這會對服務(wù)的數(shù)據(jù)環(huán)境安全帶來巨大挑戰(zhàn)。尤其在混合云環(huán)境中的分布式存儲條件下,數(shù)據(jù)和業(yè)務(wù)流程既可以在本地部署也可以在云端部署,或者在本地和云端同時(shí)部署,而為保證云端數(shù)據(jù)不被意外毀損、丟失,不被非法獲取、分析或運(yùn)用,保證云服務(wù)的穩(wěn)定性、長期性、有效性、數(shù)據(jù)安全性等,都使得數(shù)據(jù)跟蹤和信息處理成為一大難題。
3.4訪問權(quán)限問題
在跨界服務(wù)的數(shù)據(jù)合作系統(tǒng)中,由于知識分類和內(nèi)部合作權(quán)限不同,圖書館及其上游的信息提供機(jī)構(gòu)都同時(shí)作為數(shù)據(jù)使用者和數(shù)據(jù)管理員登錄,都具有數(shù)據(jù)的創(chuàng)建、更新、整合及瀏覽的權(quán)限,用戶的復(fù)雜性帶來更加復(fù)雜的權(quán)限管理問題。另外,在云計(jì)算環(huán)境中,合作成員對放置在云服務(wù)器中的數(shù)據(jù)和計(jì)算的控制變得困難,對于數(shù)據(jù)是否受到保護(hù)、計(jì)算任務(wù)是否被正確執(zhí)行都不能確定。[7]并且訪問控制角色的動態(tài)授權(quán)和角色賦予后用戶訪問行為的監(jiān)控乃至角色類型的新增等,也都面臨更復(fù)雜的問題。
3.5數(shù)據(jù)存儲兼容需求
根據(jù)相關(guān)調(diào)查,當(dāng)前,數(shù)據(jù)庫類型數(shù)據(jù)每年以25%的速度增長,而傳統(tǒng)技術(shù)難以處理的音頻、視頻、圖片、網(wǎng)頁等非結(jié)構(gòu)化的數(shù)據(jù)每年以50%~75%的速度增長,海量數(shù)據(jù)的存儲對存儲技術(shù)提出了新的要求。[8]而且,由跨界服務(wù)的特點(diǎn)可以知道,圖書館作為數(shù)據(jù)中心,數(shù)據(jù)結(jié)構(gòu)多樣、存儲環(huán)境復(fù)雜、數(shù)據(jù)增長快、非結(jié)構(gòu)化數(shù)據(jù)量大,存儲技術(shù)還不夠成熟,同時(shí)還要滿足實(shí)時(shí)性、可靠性和可擴(kuò)展性等要求,對數(shù)據(jù)存儲結(jié)構(gòu)的兼容性提出了新的挑戰(zhàn)。另外,跨界服務(wù)合作組織具有眾多成員機(jī)構(gòu),不同機(jī)構(gòu)有可能使用的是不同廠商的不同信息系統(tǒng)、采用的是異構(gòu)的數(shù)據(jù)保護(hù)方案,當(dāng)系統(tǒng)進(jìn)行擴(kuò)展時(shí),無法利用現(xiàn)有資源而造成資源浪費(fèi),現(xiàn)有圖書館信息資源跨界服務(wù)是否對此兼容,也是異構(gòu)存儲管理難題。
3.6數(shù)據(jù)存儲容災(zāi)需求
圖書館數(shù)據(jù)中心有大量的數(shù)字信息需要存儲,服務(wù)系統(tǒng)和設(shè)備一旦遭受自然災(zāi)害、人為誤操作、病毒感染、設(shè)備故障、黑客入侵等破壞,出現(xiàn)數(shù)據(jù)損失的代價(jià)往往是極其高昂的。圖書館須為恢復(fù)數(shù)字資源和計(jì)算機(jī)系統(tǒng)采取技術(shù)上和設(shè)備上的保護(hù),以確保系統(tǒng)的正常運(yùn)行和服務(wù)順利提供。在以圖書館數(shù)據(jù)中心為核心的跨界存儲環(huán)境中,不同層次的服務(wù)器所需的保護(hù)層級是不同的。通常普通服務(wù)器所需容災(zāi)只要進(jìn)行定期備份即可滿足,部分關(guān)鍵服務(wù)器則需要實(shí)時(shí)備份保護(hù),而最核心層服務(wù)器則需要應(yīng)用容災(zāi)級的全面防護(hù)。這些服務(wù)器又往往會涉及不同的系統(tǒng)平臺和數(shù)據(jù)結(jié)構(gòu),這就需要構(gòu)建一個(gè)全面的、完整的保護(hù)策略,在面對跨界數(shù)據(jù)服務(wù)整體時(shí)要有統(tǒng)一性,在面對不同業(yè)務(wù)系統(tǒng)、不同業(yè)務(wù)層級時(shí)要有差異性和針對性。[9]因此,這對圖書館提供跨界服務(wù)數(shù)據(jù)存儲的容災(zāi)能力就有了很高的要求。
針對以上指出的信息安全問題和信息安全目標(biāo),圖書館應(yīng)做好對信息資源共享和服務(wù)提供環(huán)境的防御保護(hù)、實(shí)時(shí)保護(hù)和傳播保護(hù)的安全基本保障。據(jù)此,本文提出以下具體解決對策。
4.1知識產(chǎn)權(quán)保護(hù)對策
對于大數(shù)據(jù)背景下知識產(chǎn)權(quán)的保護(hù),圖書館的信息資源存儲中心需要根據(jù)云計(jì)算的相關(guān)協(xié)議和標(biāo)準(zhǔn),制定跨界合作組織內(nèi)部運(yùn)用云計(jì)算應(yīng)遵循的準(zhǔn)則和規(guī)范。同時(shí),對提供云計(jì)算服務(wù)的企業(yè)進(jìn)行評估及考核,細(xì)致地了解該企業(yè)提供產(chǎn)品的技術(shù)安全性能以及可持續(xù)使用情況,確??缃绾献鹘M織使用標(biāo)準(zhǔn)化規(guī)范化的云計(jì)算體系,并且對其采取相關(guān)的訪問控制管理也是必要的。更重要的是,國家相關(guān)部門應(yīng)盡快完善與新技術(shù)相適應(yīng)的法律制度,才能平衡云服務(wù)提供商與圖書館、著作權(quán)人以及用戶之間的利益關(guān)系,避免云服務(wù)供應(yīng)商利用圖書館豐富的館藏資源,導(dǎo)致資源的網(wǎng)絡(luò)傳播,侵害到著作權(quán)人的相關(guān)權(quán)益。
另外,信息加密、數(shù)字簽名、單向Hash函數(shù)、數(shù)字證書、水印防偽技術(shù)、安全容器技術(shù)、移動A-gent技術(shù)等手段能夠在一定程度上為打擊侵權(quán)行為提供有效防護(hù)。信息加密主要針對數(shù)據(jù)傳送過程,使得信息的傳輸安全可靠,以免被未授權(quán)人員獲取,更具體的技術(shù)與下文的數(shù)據(jù)保護(hù)、訪問控制重合。數(shù)字水印技術(shù)和數(shù)字指紋技術(shù)是在原始數(shù)據(jù)資源中嵌入有效的、不易察覺的并且不易破壞的產(chǎn)權(quán)標(biāo)識,為打擊侵權(quán)行為提供有力證據(jù)。安全容器技術(shù)以InterTrust公司的DigiBox技術(shù)和IBM公司的Cryptolope技術(shù)[10]為代表,通過封裝加密,對數(shù)據(jù)進(jìn)行保護(hù)。
4.2數(shù)據(jù)保護(hù)對策
在萬物互聯(lián)的時(shí)代,圖書館跨界服務(wù)的信息安全防護(hù)主要依托于積極主動防御。對于跨界服務(wù)這樣一個(gè)動態(tài)而又穩(wěn)定的系統(tǒng),加上以APT為典型代表的新型威脅和攻擊的不斷增長,傳統(tǒng)的、靜態(tài)的、單點(diǎn)的防御體系已經(jīng)無法滿足新環(huán)境下的信息安全防護(hù)需求。需要通過利用大數(shù)據(jù)的手段結(jié)合現(xiàn)代網(wǎng)絡(luò)安全技術(shù),比如添加大型的通用日志服務(wù)、能作實(shí)時(shí)關(guān)聯(lián)的引擎和針對合作組織中各個(gè)用戶的定制分析平臺,對數(shù)據(jù)的記錄、存儲進(jìn)行分析,主動發(fā)現(xiàn)異常和潛藏著的威脅,實(shí)現(xiàn)威脅與入侵的快速檢測、快速發(fā)現(xiàn)和及時(shí)響應(yīng)。
在大數(shù)據(jù)背景下,圖書館跨界服務(wù)數(shù)據(jù)存儲更多地依托于“云”。在“云”這種完全虛擬的環(huán)境中,同一臺物理機(jī)上可能連接著成百上千臺虛擬機(jī),虛擬機(jī)之間是通過虛擬交換機(jī)來傳輸信息的,使用的是虛擬機(jī)管理器。因此,基于“云計(jì)算”和虛擬技術(shù)的“云安全”近幾年被很多企業(yè)和機(jī)構(gòu)極力推崇。
IBM新興技術(shù)總監(jiān)David Barnes對于如何加強(qiáng)云環(huán)境安全,提出了其云安全模型“三大要素”的創(chuàng)新概念:細(xì)粒度上下文安全(Fine-grained Context Security)、溯源(Provenance)和蜜罐(Honey Pot)。① 確保細(xì)粒度上下文安全是為了發(fā)現(xiàn)異常行為,方法包括深度自省、前瞻探測以及為系統(tǒng)、工作和人員構(gòu)建行為模型。在高度虛擬的云環(huán)境中,對系統(tǒng)、工作負(fù)荷和人員的行為模式很容易進(jìn)行總結(jié),因此這樣做可以盡早減小攻擊造成的影響。② 溯源。為確保完全暴露在云環(huán)境中的數(shù)據(jù)和進(jìn)程的安全,需要尋求某種手段來對數(shù)據(jù)進(jìn)行驗(yàn)證并自動生成記錄,以及自動追蹤所有進(jìn)程的起源。通過溯源可以告知我們整個(gè)過程:誰(Who)在什么時(shí)間(When)以什么目的(Why)對數(shù)據(jù)進(jìn)行了什么操作(What)。③ 蜜罐是用來檢測非常規(guī)和新型黑客的誘餌,蜜罐檢測可以幫助盡早發(fā)現(xiàn)試圖入侵系統(tǒng)的惡意軟件。因此,這就需要設(shè)置高度虛擬化的環(huán)境,每個(gè)環(huán)境都采用不同的配置和不同的系統(tǒng)參數(shù),將真正的操作環(huán)境與誘餌隔離開來,引誘隱藏的惡意軟件,使其自動激活和暴露。這一切都通過不同于傳統(tǒng)數(shù)據(jù)中心的云端虛擬化實(shí)現(xiàn),它允許設(shè)置引誘環(huán)境,并將其置于關(guān)鍵的云計(jì)算機(jī)之外。憑借這一特點(diǎn),在惡意軟件入侵系統(tǒng)前,就可以將其檢測到并進(jìn)行隔離。[11]圖書館可以參考David的“三大要素”,探索出基于“云”的能夠誘發(fā)攻擊環(huán)境、減小攻擊影響,攜帶數(shù)據(jù)追蹤技術(shù)數(shù)據(jù)保護(hù)系統(tǒng),打造出比傳統(tǒng)信息存儲環(huán)境還要安全的云環(huán)境。
4.3數(shù)據(jù)存儲對策
(1)兼容。圖書館跨界服務(wù)可以通過構(gòu)建分布式存儲系統(tǒng)來面對海量數(shù)據(jù)存儲的需求和挑戰(zhàn)。非結(jié)構(gòu)化數(shù)據(jù)庫NoSQL(Not Only SQL)克服了傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)庫的缺點(diǎn),支持多樣化的數(shù)據(jù)結(jié)構(gòu)和分布式存儲,許多大型企業(yè)都會采取這種NoSQL數(shù)據(jù)庫。比如Google開發(fā)的 BigTable,Amazon推出的 Dynamo,F(xiàn)acebook研發(fā)的 Cassandra,新浪微博使用的 Redistribute,豆瓣網(wǎng)提出的BeansDB。這類系統(tǒng)成本低廉,對硬件設(shè)備要求不高,非常適合圖書館跨界服務(wù)使用。另外,基于圖書館跨界服務(wù)中存在不同系統(tǒng)的對接以及各種存儲設(shè)備,另一種可以使用的分布式存儲方式是基于云計(jì)算發(fā)展的云存儲。云存儲通過專門的應(yīng)用軟件將不同的存儲設(shè)備集合起來協(xié)同工作,使圖書館整合目前已有的存儲設(shè)備、滿足爆炸式增長的存儲需求、降低管理成本和復(fù)雜度,以實(shí)現(xiàn)數(shù)字資源的穩(wěn)定存儲和長期可用。目前,國內(nèi)主要的云服務(wù)提供商有:國內(nèi)最大的公共云計(jì)算服務(wù)提供商阿里云,國內(nèi)虛擬化與云計(jì)算產(chǎn)品及服務(wù)的開拓者紅山,具有自主知識產(chǎn)權(quán)的華為FusionSphere云平臺。這些云服務(wù)提供商已經(jīng)在政府、企業(yè)、醫(yī)療、教育等領(lǐng)域?qū)崿F(xiàn)了眾多成功案例,圖書館跨界服務(wù)也可以使用類似的云計(jì)算解決方案,還可以通過混搭平臺 (MS Drupal-Mashup)的方式解決資源整合問題。新一代的MS Drupal-Mashup平臺采用基于 Drupal及其擴(kuò)展模塊、API接口和混搭技術(shù),實(shí)現(xiàn)根據(jù)平臺建設(shè)需求將獨(dú)立于各云端的數(shù)字資源與圖書館現(xiàn)有資源相互整合。西安交通大學(xué)圖書館就是使用這一平臺將圖書館內(nèi)不同系統(tǒng)間信息資源共享融合。[12]
(2)容災(zāi)。對以圖書館為數(shù)據(jù)核心的跨界服務(wù)合作組織這個(gè)復(fù)雜的綜合體來說,對系統(tǒng)中的數(shù)據(jù)或應(yīng)用做好備份容災(zāi)是十分必要和重要的。備份的實(shí)時(shí)性、充分性和分布式的程度影響著系統(tǒng)的容災(zāi)能力,同時(shí)其采購及管理運(yùn)營成本也因此而不同。因此,圖書館可以依據(jù)自身特點(diǎn),選擇合適的容災(zāi)系統(tǒng)。這樣的容災(zāi)系統(tǒng)可以從以下幾個(gè)方面著手考慮。① 支持多系統(tǒng)平臺的兼容以及主流數(shù)據(jù)庫的備份和恢復(fù),同時(shí)還要提供更全面的虛擬化平臺保護(hù)。② 異地容災(zāi)。圖書館跨界服務(wù)可以將本地的實(shí)時(shí)數(shù)據(jù)備份到異地服務(wù)器中,或者將本地備份數(shù)據(jù)復(fù)制至云服務(wù)商,通過異地的備份進(jìn)行遠(yuǎn)程恢復(fù)數(shù)據(jù),從而提高抵抗各種可能的安全因素的容災(zāi)能力。核心業(yè)務(wù)要確保業(yè)務(wù)連續(xù),首先保證本地高可用性,另外還要有異地容災(zāi);③ 采用實(shí)時(shí)備份和細(xì)粒度恢復(fù)技術(shù),提供高的備份效率和恢復(fù)效率,常用的技術(shù)如存儲快照和CDP (Continuous Data Protection)持續(xù)數(shù)據(jù)保護(hù)技術(shù)(支持異構(gòu)存儲,可以實(shí)現(xiàn)在故障發(fā)生瞬間恢復(fù)到任何時(shí)間點(diǎn))。④ 核心數(shù)據(jù)的備份副本最好能夠接管訪問。同時(shí),圖書館可以通過使用多家運(yùn)營商網(wǎng)絡(luò)通道連接,允許在某一段線路中斷時(shí),立刻切換到其他運(yùn)營商的線路上,從而不會影響到對用戶的服務(wù)。同樣重要的是,圖書館應(yīng)該根據(jù)實(shí)際情況,定期進(jìn)行災(zāi)備演練以檢驗(yàn)數(shù)據(jù)副本回復(fù)和容災(zāi)系統(tǒng)的有效性。湖南省圖書館就是采用上海愛數(shù)軟件有限公司的一體化容災(zāi)系統(tǒng),實(shí)現(xiàn)了對虛擬平臺的集中保護(hù)。[13]
4.4訪問控制對策
盡管大多數(shù)云計(jì)算服務(wù)提供商都通過使用加密技術(shù)來保護(hù)用戶數(shù)據(jù),但也只能實(shí)現(xiàn)數(shù)據(jù)在網(wǎng)絡(luò)傳輸中是加密的,數(shù)據(jù)在使用、存儲和傳播時(shí)仍然缺乏妥善的保護(hù)。在圖書館跨界服務(wù)中,可以將RMS權(quán)限管理擴(kuò)展到各分享站點(diǎn)。只有被分配了相關(guān)權(quán)限的合作成員或者部門才能對有關(guān)數(shù)據(jù)進(jìn)行與分配權(quán)限相對應(yīng)的操作。這樣就可以做到無論數(shù)據(jù)是在機(jī)構(gòu)內(nèi)部還是外部,無論數(shù)據(jù)是處在傳輸中,還是存儲狀態(tài)甚至是使用中,都始終受到權(quán)限的保護(hù),提供端到端持久的信息安全防護(hù)。在組織內(nèi)部,還可以使用精細(xì)化的IP-guard加密系統(tǒng),對核心機(jī)密進(jìn)行全面而細(xì)致的保護(hù),實(shí)現(xiàn)不同機(jī)構(gòu)成員、不同部門甚至不同用戶之間的深度保密。另外一種技術(shù),數(shù)據(jù)丟失防護(hù)(Data Loss Prevention,DLP)可以幫助圖書館數(shù)據(jù)管理中心深入檢查數(shù)據(jù)內(nèi)容,實(shí)現(xiàn)數(shù)據(jù)定位和定級,了解數(shù)據(jù)的使用情況,跨端點(diǎn)、網(wǎng)絡(luò)和存儲系統(tǒng)自動地保護(hù)數(shù)據(jù)。這種技術(shù)不僅能做到對信息的加密保護(hù),還可以識別風(fēng)險(xiǎn),防止內(nèi)部成員或部門對數(shù)據(jù)和信息資產(chǎn)被有意或無意流出。[14]
[參考文獻(xiàn)]
[1]大數(shù)據(jù)時(shí)代的意義和特征[EB/OL].[2015-07-08].http://blog.sina.com.cn/s/blog_60bbe6a50101jjct. html.
[2]張波,等.跨邊界信息資源共享及其在企業(yè)創(chuàng)業(yè)過程中的作用分析[J].情報(bào)雜志,2014,33 (11):182.
[3]劉細(xì)文,熊瑞.圖書館跨界服務(wù)的內(nèi)涵、模式和實(shí)踐[J].中國圖書館學(xué)報(bào),2008(34):33-34.
[4]黃長著,等.網(wǎng)絡(luò)環(huán)境下圖書情報(bào)學(xué)科與實(shí)踐的發(fā)展趨勢[M].北京:社會科學(xué)文獻(xiàn)出版社,2010:56-60.
[5]數(shù)字圖書館迎大數(shù)據(jù)時(shí)代:將整合資源提供深度服務(wù)[EB/OL].[2015-08-27].http://culture.people.com.cn/n/2014/1105/c172318-25981395.html.
[6]OCLC Announces Strategy to Move Library Management ServicesWebScale[EB/OL].[2015-08-28].http: //www.oclc.org/news/releases/200927.html
[7]王于丁,等.云計(jì)算訪問控制技術(shù)研究綜述[J].軟件學(xué)報(bào),2015(26):1129-1150.
[8]中恒華瑞大數(shù)據(jù)存儲系統(tǒng)簡介[EB/OL].[2015-07-25].http://www.sinohuarui.com/Detail.aspx?id= 122.
[9]愛數(shù)軟件.通往大數(shù)據(jù)時(shí)代的備份變革——深入愛數(shù)一體化容災(zāi)產(chǎn)品 [J].軟件產(chǎn)業(yè)與工程,2013(21):22-23.
[10]莊超,等.網(wǎng)絡(luò)內(nèi)容安全分發(fā)與版權(quán)保護(hù)技術(shù)[J].計(jì)算機(jī)工程,2000(26):50-52.
[11]IBM混合云[EB/OL].[2015-07-25].http:// www.ibm.com/cloud-computing/cn/zh/landing/hybrid. html.
[12]李丹,等.Drupal的混搭技術(shù)在圖書館的應(yīng)用[J].現(xiàn)代圖書情報(bào)技術(shù),2013(10):79-84.
[13]愛數(shù)助力湖南省圖書館實(shí)現(xiàn)虛擬平臺集中保護(hù)[2015-08-15].[EB/OL].http://www.eisoo.com/ cn/case/casedetail.php?type=jgtsg&id=975?.
[14]孫繼銀,等.網(wǎng)絡(luò)竊密、監(jiān)聽及防泄密技術(shù)[M].西安:西安電子科技大學(xué)出版社,2011:241.
中圖分類號:G203
文獻(xiàn)標(biāo)志碼:A
文章編號:1005-8214(2016)06-0099-05
[作者簡介]王彤(1991-),女,山西大學(xué)經(jīng)濟(jì)與管理學(xué)院圖書館學(xué)碩士研究生,研究方向:信息生態(tài)。
[收稿日期]2015-11-28[責(zé)任編輯]李金甌
Issues and Countermeasures on Information Security Technology of Cross-boundary Service of Library in the Age of Big Data
Wang Tong
Abstract:The cross-boundary service of library,which well does great good to the construction of information resources and the transformation of library service mode,brings lots of security technology issues in the new information environment as well.To solve these issues is a matter of great urgency.This article points out possible problems in the process of cross-boundary library service for library including intellectual property protection,privacy protection,viruses and attacks,the compatibility and disaster tolerance of data storage.This article presents a series related countermeasures as well.
Keywords:Cross-boundary Service of Library;Big Data;Information Security;Technical Issues;Countermeasures