朱維喬
(廣州航海學(xué)院圖書(shū)館,廣東 廣州 510725)
隨著云計(jì)算、傳感網(wǎng)絡(luò)等信息技術(shù)的蓬勃發(fā)展和多種移動(dòng)終端、社交網(wǎng)絡(luò)的廣泛使用,數(shù)據(jù)量呈爆炸式增長(zhǎng)之勢(shì),“大數(shù)據(jù)”概念應(yīng)運(yùn)而生,一些研究機(jī)構(gòu)將其定義為數(shù)量超出傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)收集、存儲(chǔ)和分析能力的數(shù)據(jù)集[1],其所產(chǎn)生的影響已滲入社會(huì)生活的諸多領(lǐng)域。美國(guó)政府宣布的“大數(shù)據(jù)研究與發(fā)展倡議”將大數(shù)據(jù)定位為未來(lái)信息技術(shù)發(fā)展的核心,預(yù)示著其將對(duì)全球知識(shí)創(chuàng)新與知識(shí)服務(wù)形式產(chǎn)生深遠(yuǎn)的影響。時(shí)至今日,大數(shù)據(jù)技術(shù)的廣泛應(yīng)用使海量多結(jié)構(gòu)數(shù)據(jù)的即時(shí)獲取、深度挖掘和精確分析成為現(xiàn)實(shí),也將為正在興起的知識(shí)服務(wù)注入更多服務(wù)增長(zhǎng)點(diǎn)。國(guó)內(nèi)外圖書(shū)館界均對(duì)其展開(kāi)了如火如荼的研究與應(yīng)用。
國(guó)內(nèi)圖書(shū)館界的大數(shù)據(jù)應(yīng)用以清華大學(xué)圖書(shū)館為代表,其應(yīng)用大數(shù)據(jù)技術(shù)為讀者提供知識(shí)服務(wù),在檢索平臺(tái)上綜合運(yùn)用多來(lái)源數(shù)據(jù),將書(shū)、刊、文章等元數(shù)據(jù)匯聚在一起用于檢索,用戶可通過(guò)開(kāi)放鏈接技術(shù)定位及獲取資源[2]。國(guó)外圖書(shū)館界的大數(shù)據(jù)應(yīng)用由美國(guó)哈佛大學(xué)圖書(shū)館率先發(fā)起,其將圖書(shū)大數(shù)據(jù)公開(kāi)并在國(guó)家公共數(shù)字圖書(shū)館中提供下載,內(nèi)容包括書(shū)目數(shù)據(jù)、音頻、視頻、圖像、手稿等多種類型的非結(jié)構(gòu)化數(shù)據(jù),共計(jì)一千多萬(wàn)種資料[3],該項(xiàng)大數(shù)據(jù)服務(wù)旨在促進(jìn)全球圖書(shū)目錄的開(kāi)放共享與大數(shù)據(jù)技術(shù)的研發(fā),滿足急劇擴(kuò)張的知識(shí)服務(wù)需求;此外,新加坡國(guó)家圖書(shū)館管理局采用大數(shù)據(jù)技術(shù)對(duì)持續(xù)增長(zhǎng)的大量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,并在其門戶網(wǎng)站上將讀者最感興趣的信息實(shí)行自動(dòng)推送,目前已完成對(duì)“新加坡記憶”特色資源網(wǎng)站的上百萬(wàn)篇文章的文本分析,并為解決存儲(chǔ)與計(jì)算設(shè)備擴(kuò)展性的問(wèn)題建立了一整套分布式系統(tǒng)基礎(chǔ)架構(gòu)集群,由在主機(jī)上虛擬的數(shù)十臺(tái)服務(wù)器組成,這使其擁有了可擴(kuò)展的分布式計(jì)算平臺(tái),解決了應(yīng)用大數(shù)據(jù)技術(shù)挖掘和實(shí)現(xiàn)用戶知識(shí)服務(wù)需求的難題[4]。
圖書(shū)館特色資源服務(wù)平臺(tái)架構(gòu)以用戶的個(gè)性化和專業(yè)化需求為出發(fā)點(diǎn),提供面向用戶的經(jīng)過(guò)數(shù)據(jù)分析加工且能滿足實(shí)際需求的特色知識(shí)信息。本文將針對(duì)特色資源平臺(tái)架構(gòu)的主要環(huán)節(jié),將大數(shù)據(jù)作為一種技術(shù)方法與提供知識(shí)服務(wù)的新工具,如圖1所示,分析其在每一環(huán)節(jié)的具體應(yīng)用。
圖1 面向大數(shù)據(jù)的特色資源平臺(tái)體系架構(gòu)
評(píng)價(jià)特色資源平臺(tái)架構(gòu)的重要因素之一是其內(nèi)容與功能的設(shè)計(jì)科學(xué)性,內(nèi)容設(shè)計(jì)應(yīng)明確建設(shè)的重點(diǎn)方向與目標(biāo),基于用戶的使用特點(diǎn)與需求分析而進(jìn)行。OCLC(聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心)發(fā)布報(bào)告稱,圖書(shū)館正在經(jīng)受著技術(shù)障礙、人才瓶頸等問(wèn)題的困擾,用戶流失較為嚴(yán)重[5]。因此,如何在內(nèi)容設(shè)計(jì)環(huán)節(jié)應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行用戶分析,對(duì)特色資源平臺(tái)的內(nèi)容與功能進(jìn)行合理定位,構(gòu)建新型特色資源服務(wù)從而吸引更多的用戶,將成為特色資源建設(shè)工作的挑戰(zhàn)。圖書(shū)館應(yīng)通過(guò)分析大數(shù)據(jù)的主要信息源——即隱含在用戶檢索、咨詢等行為中的非結(jié)構(gòu)化數(shù)據(jù),如流通日志中的特色文獻(xiàn)借閱數(shù)據(jù)、OPAC日志中的點(diǎn)擊流數(shù)據(jù)、特色數(shù)字資源的瀏覽歷史、用戶信息反饋行為等可展示其偏好、習(xí)慣模式等特點(diǎn)的數(shù)據(jù),進(jìn)而識(shí)別、挖掘和推斷用戶的知識(shí)服務(wù)需求,按其需求進(jìn)行特色資源的內(nèi)容設(shè)計(jì),使相同主題、專業(yè)與相關(guān)學(xué)科的各類文獻(xiàn)重組、整合成完整的特色資源體系;與此同時(shí),還應(yīng)根據(jù)動(dòng)態(tài)反饋用戶需求的大數(shù)據(jù)進(jìn)行知識(shí)更新,使特色資源平臺(tái)的開(kāi)發(fā)者、提供者和使用者實(shí)現(xiàn)在各個(gè)方面提高效率的目標(biāo)[6],從而提高圖書(shū)館自身的核心競(jìng)爭(zhēng)力。
數(shù)據(jù)收集環(huán)節(jié)的大數(shù)據(jù)應(yīng)用,主要是為特色資源平臺(tái)建設(shè)提供更豐富的資源類型與多維化的數(shù)據(jù)來(lái)源。除圖書(shū)館自身的館藏資源,如數(shù)據(jù)庫(kù)中的書(shū)目信息、特色文獻(xiàn)數(shù)字化后形成的電子圖書(shū)圖像、自建特色數(shù)據(jù)庫(kù)等之外,還包括動(dòng)態(tài)的傳感器數(shù)據(jù)、RFID射頻識(shí)別數(shù)據(jù)、移動(dòng)設(shè)備數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)、用戶社交網(wǎng)絡(luò)交互數(shù)據(jù)等;另外,如網(wǎng)絡(luò)出版與傳播數(shù)據(jù)、館際之間的共享數(shù)據(jù)等圖書(shū)館外部的開(kāi)放知識(shí)源都將成為特色資源平臺(tái)主要的大數(shù)據(jù)來(lái)源。但由于數(shù)據(jù)質(zhì)量參差不齊,圖書(shū)館應(yīng)設(shè)置必要的信息采集規(guī)則和機(jī)制,以確保進(jìn)入特色資源庫(kù)中的知識(shí)將得到有效利用[7]??蛇\(yùn)用信息過(guò)濾技術(shù),針對(duì)特色學(xué)科、專題進(jìn)行信息收集分析、處理與存儲(chǔ),并按照一定的標(biāo)準(zhǔn)格式創(chuàng)建數(shù)字信息資源庫(kù),使特色資源平臺(tái)建設(shè)得以創(chuàng)新并得到更多用戶的肯定,體現(xiàn)出更高的價(jià)值。
根據(jù)數(shù)據(jù)生命周期理論與特色資源的被檢索頻率,特色資源庫(kù)中的大數(shù)據(jù)可分為熱數(shù)據(jù)與冷數(shù)據(jù),若二者使用同一存儲(chǔ)空間會(huì)影響數(shù)字資源的存儲(chǔ)質(zhì)量。因此,圖書(shū)館應(yīng)根據(jù)存儲(chǔ)成本、訪問(wèn)頻度、數(shù)據(jù)容量與更新頻率等因素將數(shù)據(jù)分層存儲(chǔ)。可將存儲(chǔ)空間分為三層:一為快速存儲(chǔ)層,適用于少量熱數(shù)據(jù),特點(diǎn)為價(jià)格高、容量低、運(yùn)行速度快;二為次級(jí)存儲(chǔ)層,適用于中等價(jià)值的數(shù)據(jù)與知識(shí),運(yùn)行速度為中等;三為硬盤存儲(chǔ)層,適用于冷數(shù)據(jù),特點(diǎn)為價(jià)格低、容量大、運(yùn)行速度慢。在系統(tǒng)中跟蹤并記錄特色資源庫(kù)中數(shù)據(jù)與知識(shí)的被檢索頻度,同時(shí)設(shè)置相應(yīng)的參數(shù),當(dāng)其符合某一存儲(chǔ)層的訪問(wèn)頻度時(shí)將自動(dòng)分配知識(shí)元到該存儲(chǔ)層,從而實(shí)現(xiàn)知識(shí)的效率存儲(chǔ),以提高大數(shù)據(jù)環(huán)境下特色資源平臺(tái)的建設(shè)質(zhì)量。
在知識(shí)組織與加工環(huán)節(jié),大數(shù)據(jù)為其引入更為專業(yè)的數(shù)據(jù)分析技術(shù),將分散、無(wú)序的大數(shù)據(jù)進(jìn)行組織、加工與分析,對(duì)數(shù)據(jù)資源的產(chǎn)生、發(fā)展及波動(dòng)規(guī)律進(jìn)行歸納,可依據(jù)其對(duì)特色資源進(jìn)行結(jié)構(gòu)調(diào)整。特色資源平臺(tái)的建設(shè)目標(biāo)是實(shí)現(xiàn)資源共享及各種數(shù)據(jù)庫(kù)之間的整合,為用戶提供來(lái)源、結(jié)構(gòu)、功能均不相同的多種數(shù)據(jù)庫(kù)的一站式檢索平臺(tái),構(gòu)建綜合化特色資源服務(wù)平臺(tái)。這就要求各類數(shù)據(jù)在加工時(shí)嚴(yán)格執(zhí)行統(tǒng)一且高質(zhì)量的標(biāo)準(zhǔn),在技術(shù)條件實(shí)現(xiàn)時(shí)才能使數(shù)據(jù)庫(kù)加入到整合檢索系統(tǒng)中。因此,需要對(duì)不同格式的數(shù)據(jù)進(jìn)行處理和深層次加工,將其轉(zhuǎn)換成數(shù)據(jù)庫(kù)所要求的文件格式,從而使其符合建設(shè)特色數(shù)據(jù)庫(kù)的規(guī)范要求。當(dāng)大量數(shù)據(jù)存儲(chǔ)于分布廣泛、多種類型的服務(wù)器中時(shí),需要借助新型處理手段進(jìn)行動(dòng)態(tài)數(shù)據(jù)集的收集、組織與加工和多格式數(shù)據(jù)的整合規(guī)范,將其轉(zhuǎn)換為規(guī)律的有序數(shù)據(jù)并從中提煉價(jià)值,為特色資源平臺(tái)建設(shè)構(gòu)建良好的數(shù)據(jù)支撐體系[8]。
特色資源平臺(tái)建設(shè)與特色資源服務(wù)共同發(fā)展、不可分割。基于大數(shù)據(jù)開(kāi)展的挖掘數(shù)據(jù)價(jià)值、提取知識(shí)的理念為特色資源服務(wù)模式的創(chuàng)新發(fā)展提供了良好的契機(jī)。
傳統(tǒng)的被動(dòng)服務(wù)模式既阻礙了特色資源的有效利用,又背離了特色資源平臺(tái)建設(shè)的初衷,因此向主動(dòng)推送服務(wù)模式的發(fā)展勢(shì)在必行,大數(shù)據(jù)應(yīng)用使這一轉(zhuǎn)變成為現(xiàn)實(shí)。通過(guò)了解關(guān)于用戶情感狀態(tài)及實(shí)際需求的實(shí)時(shí)大數(shù)據(jù),進(jìn)行用戶行為智能分析與知識(shí)需求預(yù)測(cè)等新型特色資源服務(wù),搜集與加工特色資源,并利用信息推送技術(shù)定期將相關(guān)特色資源主動(dòng)推送給用戶,能夠提高特色資源的利用率及拓寬特色資源服務(wù)范圍。
大數(shù)據(jù)環(huán)境下的海量數(shù)據(jù)資源,如文獻(xiàn)資源、科研成果、訪問(wèn)日志、社交信息等各類網(wǎng)絡(luò)資源,來(lái)源于不同的機(jī)構(gòu)知識(shí)庫(kù)與個(gè)體用戶,具有數(shù)量大、類型多、無(wú)序化等特點(diǎn),因而需要建立數(shù)據(jù)的統(tǒng)一標(biāo)準(zhǔn),實(shí)現(xiàn)異構(gòu)系統(tǒng)的有效整合,使整合后的數(shù)據(jù)更具應(yīng)用價(jià)值,為特色資源服務(wù)的開(kāi)展提供智力支持。在微觀層面的數(shù)據(jù)整合,通過(guò)定位、連接各類數(shù)據(jù)源,對(duì)不同數(shù)據(jù)賦予統(tǒng)一的元數(shù)據(jù)格式與資源標(biāo)識(shí)符(URI)來(lái)實(shí)現(xiàn),使每個(gè)數(shù)字資源擁有唯一地址,從而構(gòu)建元數(shù)據(jù)項(xiàng)目描述精確的數(shù)字資源庫(kù),使分布的各種異構(gòu)數(shù)據(jù)資源匯聚、融合為中心知識(shí)庫(kù),并通過(guò)引擎的方式為用戶提供簡(jiǎn)捷、快速的資源發(fā)現(xiàn)與獲取服務(wù),構(gòu)建一站式特色資源服務(wù)平臺(tái);在宏觀層面的數(shù)據(jù)資源庫(kù)整合,通過(guò)將數(shù)據(jù)資源按照類型、學(xué)科、主題等區(qū)別進(jìn)行分散聚合,形成跨數(shù)據(jù)庫(kù)、跨平臺(tái)的無(wú)縫鏈接的數(shù)字資源集成,力圖在各種數(shù)據(jù)庫(kù)系統(tǒng)之間建立多維度關(guān)聯(lián),允許用戶通過(guò)集成的資源界面進(jìn)入圖書(shū)館所有的資源、應(yīng)用與服務(wù)入口,方便快捷地一站式完成信息獲取[9]。
為了提升特色資源服務(wù)質(zhì)量,圖書(shū)館應(yīng)對(duì)所收集的大數(shù)據(jù)進(jìn)行加工,基于數(shù)據(jù)進(jìn)行知識(shí)發(fā)現(xiàn)與分析,滿足用戶的學(xué)科知識(shí)需求。如將不同學(xué)科用戶的信息行為數(shù)據(jù)進(jìn)行分類,進(jìn)而分析用戶檢索、瀏覽和下載的文獻(xiàn)特征并加入時(shí)間緯度,可歸納出某個(gè)學(xué)科用戶在特定時(shí)期感興趣的主題內(nèi)容;利用數(shù)據(jù)挖掘、聚類分析、相關(guān)性分析、社會(huì)網(wǎng)絡(luò)分析等大數(shù)據(jù)技術(shù)預(yù)測(cè)學(xué)科熱點(diǎn)及進(jìn)行交叉學(xué)科的分析研究;基于大數(shù)據(jù)進(jìn)行關(guān)聯(lián)關(guān)系分析,構(gòu)建學(xué)者、合作者、會(huì)議、期刊、學(xué)術(shù)成果等元素之間的知識(shí)網(wǎng)絡(luò)[10];為促進(jìn)特色學(xué)科發(fā)展而對(duì)數(shù)據(jù)集合進(jìn)行的分析,即從元數(shù)據(jù)倉(cāng)儲(chǔ)中提取文章關(guān)鍵詞等信息,基于時(shí)間軸進(jìn)行學(xué)科趨勢(shì)分析,可以通過(guò)研究關(guān)鍵詞在時(shí)間軸上分布的方法來(lái)分析特色學(xué)科領(lǐng)域在一個(gè)時(shí)間段的發(fā)展趨勢(shì)并預(yù)測(cè)未來(lái)的發(fā)展方向。
隨著知識(shí)經(jīng)濟(jì)的發(fā)展,用戶的信息需求愈加個(gè)性化和專業(yè)化,而傳統(tǒng)的大眾化服務(wù)模式不但無(wú)法為個(gè)體用戶提供有針對(duì)性的知識(shí)服務(wù),也不利于圖書(shū)館資源、技術(shù)和人才的整合??梢?jiàn),特色資源服務(wù)向個(gè)性化模式的發(fā)展勢(shì)在必行。圖書(shū)館應(yīng)基于對(duì)用戶信息使用行為習(xí)慣的分析和對(duì)資源特定需求的預(yù)測(cè),向其主動(dòng)提供可能需求但難以獲取的資源。通過(guò)對(duì)讀者顯式行為(如資源評(píng)分、贊/踩等)和隱式行為(如瀏覽下載記錄、頁(yè)面停留時(shí)間、社交網(wǎng)絡(luò)數(shù)據(jù)、借閱記錄等)的分析,建立用戶剖面(user profile)進(jìn)而精準(zhǔn)把握其需求特點(diǎn)、規(guī)律和趨向。挖掘其隱性需求,并搭建交互平臺(tái)進(jìn)而提供特色知識(shí)服務(wù),從而有針對(duì)性地開(kāi)展特色資源服務(wù)的個(gè)性化推送,實(shí)現(xiàn)特色資源服務(wù)效益的最大化。應(yīng)用知識(shí)發(fā)現(xiàn)、信息挖掘等大數(shù)據(jù)技術(shù)過(guò)濾各類信息源并對(duì)用戶進(jìn)行個(gè)性化知識(shí)推薦,包括基于內(nèi)容過(guò)濾與協(xié)同過(guò)濾等推薦方法,通過(guò)加工整理、綜合分析形成用戶所需的個(gè)性化特色資源,并通過(guò)電子郵件發(fā)送、系統(tǒng)消息發(fā)布或頻道推送等方式傳送給用戶。具體內(nèi)容包括:個(gè)性化定制服務(wù)根據(jù)用戶定制的目標(biāo)構(gòu)建個(gè)性化特色資源服務(wù)系統(tǒng),通過(guò)挖掘和深加工特定專題的信息資源,查詢并反饋滿足用戶需求的結(jié)果,并利用動(dòng)態(tài)網(wǎng)頁(yè)自動(dòng)生成所定制的頁(yè)面;個(gè)性化傳遞服務(wù)以用戶需求為導(dǎo)向,利用信息推送技術(shù)定期為用戶傳送相關(guān)的特色資源信息。
大數(shù)據(jù)在特色資源平臺(tái)建設(shè)與服務(wù)應(yīng)用中存在一些制約因素,圖書(shū)館可采取相應(yīng)對(duì)策緩解所受到的限制。
特色資源平臺(tái)建設(shè)與服務(wù)中的傳統(tǒng)數(shù)據(jù)處理方法在數(shù)據(jù)量不高于TB級(jí)時(shí)尚可承受,但其處理海量實(shí)時(shí)數(shù)據(jù)的時(shí)間與成本均至少增長(zhǎng)幾個(gè)數(shù)量級(jí),這成為制約大數(shù)據(jù)應(yīng)用的技術(shù)瓶頸。在數(shù)據(jù)量的增長(zhǎng)與數(shù)據(jù)復(fù)雜性的變化遠(yuǎn)超過(guò)存儲(chǔ)、計(jì)算能力增強(qiáng)的情況下,設(shè)計(jì)最合理的分級(jí)、分層數(shù)據(jù)存儲(chǔ)架構(gòu)成為特色資源服務(wù)體系中資源管理的重要環(huán)節(jié)。這對(duì)海量數(shù)據(jù)的存儲(chǔ)與計(jì)算能力提出了更高標(biāo)準(zhǔn),要求其具有高度的靈活性與可擴(kuò)展性,能夠支持PB級(jí)甚至更高規(guī)模的數(shù)據(jù)存儲(chǔ)、組織及分析??梢?jiàn),對(duì)特色資源服務(wù)技術(shù)架構(gòu)的革新和存儲(chǔ)、計(jì)算能力的提升成為大勢(shì)所趨。
大數(shù)據(jù)分析需要強(qiáng)大的硬件設(shè)備作為后臺(tái)技術(shù)支撐,設(shè)備存儲(chǔ)和計(jì)算規(guī)模隨著數(shù)據(jù)量的持續(xù)增加而增大,相應(yīng)成本也隨之提高,但作為公益性質(zhì)的信息服務(wù)機(jī)構(gòu),圖書(shū)館在基礎(chǔ)設(shè)施的資金投入上與大型IT企業(yè)相比差距甚大,從而使得大數(shù)據(jù)應(yīng)用受制于軟硬件成本而較難實(shí)現(xiàn)。為了解決成本問(wèn)題,圖書(shū)館可將高端服務(wù)器設(shè)備轉(zhuǎn)換為由中低端軟硬件組成的大規(guī)模計(jì)算機(jī)集群[11],利用云計(jì)算技術(shù)為大數(shù)據(jù)創(chuàng)造彈性可擴(kuò)展的基礎(chǔ)設(shè)施保障,這就要求存儲(chǔ)、分析非結(jié)構(gòu)化數(shù)據(jù)的基礎(chǔ)設(shè)施是根據(jù)大規(guī)模分布式數(shù)據(jù)的密集型應(yīng)用而設(shè)計(jì),具備將存儲(chǔ)和計(jì)算需求分布到其中并可獲取、存儲(chǔ)及分析海量數(shù)據(jù)的性能。
調(diào)查顯示,相關(guān)領(lǐng)域人才的稀缺是制約大數(shù)據(jù)技術(shù)發(fā)展的關(guān)鍵因素[12]。大數(shù)據(jù)作為一項(xiàng)前沿技術(shù),其研究人才需要具有跨學(xué)科的學(xué)習(xí)經(jīng)歷,如需要集成信息技術(shù)、人工智能、數(shù)學(xué)算法等多個(gè)學(xué)科領(lǐng)域的技術(shù)成果。在大數(shù)據(jù)時(shí)代,圖書(shū)館要提升以知識(shí)應(yīng)用為特征的特色資源服務(wù)效能,就需要館員既具有特色資源服務(wù)工作必備的基本素養(yǎng),更應(yīng)當(dāng)掌握大數(shù)據(jù)環(huán)境下的數(shù)據(jù)組織與數(shù)據(jù)挖掘等技術(shù),對(duì)特色資源做出有價(jià)值的預(yù)測(cè)性分析,以制定切實(shí)可行的知識(shí)服務(wù)方案。國(guó)外專業(yè)教育已開(kāi)始朝培養(yǎng)熟練駕馭大數(shù)據(jù)的“數(shù)據(jù)圖書(shū)館員”方向發(fā)展,我國(guó)圖書(shū)館界應(yīng)密切關(guān)注國(guó)外同行進(jìn)展,積極培養(yǎng)大數(shù)據(jù)技術(shù)人才,推薦優(yōu)秀館員加入科研團(tuán)隊(duì)中并承擔(dān)大數(shù)據(jù)研究的任務(wù),通過(guò)實(shí)踐積累數(shù)據(jù)分析的技能。
在大數(shù)據(jù)應(yīng)用的推動(dòng)下,特色資源服務(wù)向以數(shù)據(jù)為中心的創(chuàng)新型服務(wù)轉(zhuǎn)化,數(shù)據(jù)安全問(wèn)題也隨之顯現(xiàn)。海量數(shù)據(jù)的產(chǎn)生、存儲(chǔ)與分析意味著有更多數(shù)據(jù)可能被暴露,被黑客攻擊的可能性隨著特色資源數(shù)據(jù)價(jià)值的提高而增加。此外,為了將更優(yōu)質(zhì)的個(gè)性化知識(shí)服務(wù)提供給讀者,圖書(shū)館從多種渠道獲取用戶個(gè)人信息、地理位置和搜索歷史等數(shù)據(jù)進(jìn)而分析其信息查詢行為,這使其個(gè)人隱私在一定程度上受到威脅,成為制約大數(shù)據(jù)應(yīng)用的障礙。因此,數(shù)據(jù)安全、隱私保護(hù)等均成為特色資源平臺(tái)建設(shè)與服務(wù)中亟待解決的難題,應(yīng)盡快采取應(yīng)對(duì)方案。在知曉用戶信息的同時(shí)需要保護(hù)其隱私權(quán),這就要求館員自覺(jué)規(guī)范其行為、提高專業(yè)素養(yǎng)和職業(yè)道德,并通過(guò)為用戶設(shè)置權(quán)限,使其對(duì)個(gè)人檢索歷史等數(shù)據(jù)的保存時(shí)間和用途具有知情權(quán),從而消除用戶的顧慮。
綜上所述,大數(shù)據(jù)這一新技術(shù)可為特色資源服務(wù)平臺(tái)構(gòu)建良好的數(shù)據(jù)支撐體系,可為特色資源服務(wù)模式轉(zhuǎn)變等業(yè)務(wù)需求提供全新的解決方案,對(duì)加速特色資源的整合利用、提升圖書(shū)館數(shù)字化知識(shí)服務(wù)能力將起到積極的推動(dòng)作用。作為未來(lái)圖書(shū)館領(lǐng)域無(wú)可置疑的技術(shù)發(fā)展形態(tài),大數(shù)據(jù)應(yīng)用尚處于初期的探索與實(shí)踐階段,其在特色資源服務(wù)平臺(tái)架構(gòu)方向的研究還有待進(jìn)一步發(fā)展完善。
[1]張文彥,武瑞原,于潔.大數(shù)據(jù)時(shí)代的圖書(shū)館初探[J].圖書(shū)與情報(bào),2012(6):15-21.
[2]大數(shù)據(jù)環(huán)境下清華大學(xué)圖書(shū)館的實(shí)踐 [EB/OL].[2013-11-19].http://news.tsinghua.edu.cn/publish/news/mobile/4207/2013/20130829152841109507827/20130829152841109507827_.html.
[3]WATTERS A.Strata Week:Harvard library releases big data for its books[EB/OL].[2013-08-26].http://strata.oreilly.com/2012/04/harvard-book-data-cloudera-hadoop-splunk-ipo.html.
[4]Future Gov.Singapore library uses analytics and big data technology to ease users’search[EB/OL].[2013-11-6].http://www.futuregov.asia/articles/2013/sep/11/singapore-library-uses-analytics-and-big-data-tech/.
[5]MICHALKO J,MALPAS C,ARCOLIO A.Research libraries,risk and systemic change[R/OL].[2013-08-22].http://www.oclc.org/content/dam/research/publications/library/2010/2010-03.pdf?urlm=162937.
[6]王捷.大數(shù)據(jù)時(shí)代下圖書(shū)館開(kāi)展信息服務(wù)的對(duì)策[J].現(xiàn)代情報(bào),2013(3):81-83.
[7]孫卓.基于大數(shù)據(jù)構(gòu)建圖書(shū)館知識(shí)服務(wù)引擎研究[J].圖書(shū)館學(xué)研究,2013(18):48-51.
[8]周杰,蘇靜,曾建勛.下一代數(shù)字圖書(shū)館的發(fā)展思考[J].圖書(shū)情報(bào)工作,2013(8):35-39.
[9]張麒麟,陳雅.圖書(shū)館數(shù)字資源的服務(wù)模式比較研究[J].圖書(shū)館論壇,2013(4):28-31.
[10]朱靜薇,李紅艷.大數(shù)據(jù)時(shí)代下圖書(shū)館的挑戰(zhàn)及其應(yīng)對(duì)策略[J].現(xiàn)代情報(bào),2013(5):9-13.
[11]張興旺,李晨暉,秦曉珠.構(gòu)建于廉價(jià)計(jì)算機(jī)集群上的云存儲(chǔ)的研究與初步實(shí)現(xiàn)[J].情報(bào)雜志,2011(11):166-171,182.
[12]潘永花,相斌斌,周震剛,等.中國(guó)大數(shù)據(jù)技術(shù)與服務(wù)市場(chǎng)2012-2016年預(yù)測(cè)與分析[R/OL].[2013-09-19].http://www.idc.com.cn/prodserv/detail.jsp?id=NTAx.