亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)應(yīng)用實(shí)例對(duì)圖書(shū)館增值服務(wù)的借鑒與思考

        2017-06-27 19:01:01陶繼華
        新世紀(jì)圖書(shū)館 2017年5期
        關(guān)鍵詞:大數(shù)據(jù)圖書(shū)館

        摘 要 論文先分析了大數(shù)據(jù)在圖書(shū)館的應(yīng)用背景,繼而辨析國(guó)內(nèi)相關(guān)文獻(xiàn)研究的現(xiàn)狀與不足,再援引國(guó)外信息行業(yè)大數(shù)據(jù)的應(yīng)用實(shí)例,結(jié)合國(guó)內(nèi)外圖書(shū)館運(yùn)用大數(shù)據(jù)的具體實(shí)踐,對(duì)圖書(shū)館增值服務(wù)做借鑒式分析,最后提出大數(shù)據(jù)在圖書(shū)館增值服務(wù)中應(yīng)用的新思考。

        關(guān)鍵詞 大數(shù)據(jù) 圖書(shū)館 增值服務(wù)

        分類(lèi)號(hào) G252

        DOI 10.16810/j.cnki.1672-514X.2017.05.×××

        Abstract This paper begins with the analysis of the background of big data applied in library, then states the current situation and deficiencies in domestic related researches. Also, it quotes big data application examples in the information industry abroad, and combines with the practice of using big data in the value-added services in library to make reference analysis. Finally, it puts forward the new thinkings of the application of big data in the value-added services in library.

        Keywords Big data. Library. Value-added services.

        隨著移動(dòng)終端、云計(jì)算、物聯(lián)網(wǎng)等新技術(shù)應(yīng)用發(fā)展,大數(shù)據(jù)被越來(lái)越多的行業(yè)認(rèn)識(shí)和利用,而關(guān)于“大數(shù)據(jù)”的研究也隨之成為熱點(diǎn)。圖書(shū)館界也掀起研究熱潮,多以圖書(shū)館大數(shù)據(jù)的特征、涵義、應(yīng)用范圍為基礎(chǔ),進(jìn)行概念性的評(píng)述及策略研究。筆者試圖援引國(guó)外信息行業(yè)大數(shù)據(jù)的應(yīng)用實(shí)例,結(jié)合國(guó)內(nèi)外圖書(shū)館運(yùn)用大數(shù)據(jù)的實(shí)踐,“以實(shí)例說(shuō)數(shù)據(jù)”,對(duì)圖書(shū)館增值服務(wù)進(jìn)行借鑒式的分析與探索,便于對(duì)大數(shù)據(jù)更具客觀性與全面性地認(rèn)識(shí)和應(yīng)用,以期與業(yè)界同仁進(jìn)行學(xué)習(xí)和交流。

        1 圖書(shū)館大數(shù)據(jù)的應(yīng)用背景

        1.1 圖書(shū)館信息變革回溯

        從紙本數(shù)據(jù)采集到結(jié)構(gòu)化數(shù)據(jù)庫(kù)的建立,圖書(shū)館的“技術(shù)革命”經(jīng)歷著數(shù)次更迭。幾個(gè)世紀(jì)以來(lái),圖書(shū)館人和用戶一直用分類(lèi)法和索引法來(lái)存儲(chǔ)和檢索紙本信息資源。索引是事先設(shè)定好的,在信息化初期,它有不可替代的功能,但不可否認(rèn)在很大程度上也限制了用戶的搜索范圍和效率。

        20世紀(jì)90年代,隨著計(jì)算機(jī)數(shù)據(jù)集成系統(tǒng)的應(yīng)用,圖書(shū)館對(duì)文本進(jìn)行數(shù)字化加工,終于解決了卡片目錄弊端。經(jīng)過(guò)幾十年的發(fā)展,信息存儲(chǔ)和信息處理能力隨著技術(shù)和帶寬的提高,圖書(shū)館在文本等結(jié)構(gòu)化數(shù)據(jù)的傳播和服務(wù)方面,與以往相較已不可同日而語(yǔ)。但隨著互聯(lián)網(wǎng)、智能便攜終端和云計(jì)算技術(shù)的發(fā)展,數(shù)據(jù)量以前所未有的速度增長(zhǎng),“大數(shù)據(jù)”應(yīng)用而生,圖書(shū)館將不可避免地迎來(lái)“大數(shù)據(jù)”時(shí)代。

        1.2 大數(shù)據(jù)應(yīng)用的現(xiàn)實(shí)背景

        “大數(shù)據(jù)”并非一個(gè)確切的概念,它是指需要處理的信息量過(guò)大,超出一般電腦處理數(shù)據(jù)所使用的內(nèi)存量,必須改進(jìn)處理數(shù)據(jù)的技術(shù)。最先經(jīng)歷信息爆炸的學(xué)科,如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個(gè)概念[1]8。圖書(shū)館界對(duì)其特點(diǎn)有過(guò)詳盡論述,此處不再贅言。筆者認(rèn)為就圖書(shū)館而言,大數(shù)據(jù)應(yīng)用的現(xiàn)實(shí)背景是“量變”與“質(zhì)變”,即數(shù)據(jù)量的劇增和數(shù)據(jù)結(jié)構(gòu)的變化。

        1.2.1 數(shù)據(jù)的質(zhì)變與量變

        以谷歌為例,每天處理超過(guò)24PB字節(jié)的數(shù)據(jù),處理的數(shù)據(jù)量是美國(guó)國(guó)家圖書(shū)館所有紙質(zhì)出版物數(shù)據(jù)量的上千倍。南加利福尼亞州的馬丁.希爾伯特通過(guò)對(duì)書(shū)籍、圖片、電郵、照片、視頻、游戲、導(dǎo)航等數(shù)據(jù)增長(zhǎng)量和速度的長(zhǎng)期研究發(fā)現(xiàn),2007年全世界所有數(shù)據(jù)中只有7%的模擬數(shù)據(jù)存儲(chǔ)在報(bào)紙、書(shū)籍、圖片等媒介上,其余全部是數(shù)字?jǐn)?shù)據(jù);數(shù)字?jǐn)?shù)據(jù)的數(shù)量每三年多就會(huì)翻一倍,而模擬數(shù)據(jù)的數(shù)量基本上沒(méi)有增加[1]11-12。人類(lèi)存儲(chǔ)信息量的增長(zhǎng)速度比世界經(jīng)濟(jì)增長(zhǎng)速度要快4倍,計(jì)算機(jī)處理速度則是世界經(jīng)濟(jì)增長(zhǎng)速度的9倍[1]13。這些數(shù)據(jù)量和結(jié)構(gòu)的變化必將與現(xiàn)實(shí)沖突,在擁有海量、參差不齊的數(shù)據(jù)后,如果無(wú)法揭示數(shù)據(jù)間的相關(guān)關(guān)系和潛在價(jià)值,很多行業(yè)的普遍規(guī)則和方法將不再適用。

        1.2.2 圖書(shū)館知識(shí)增值服務(wù)面臨的問(wèn)題

        《大數(shù)據(jù)時(shí)代》作者維克爾指出:“大數(shù)據(jù)時(shí)代的來(lái)臨使人類(lèi)第一次有機(jī)會(huì)和條件,在非常多的領(lǐng)域和非常深入的層次獲得和使用全面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),深入探索現(xiàn)實(shí)世界的規(guī)律,獲取過(guò)去不可能獲取的知識(shí)。[1]”

        圖書(shū)館目前使用最普遍的數(shù)據(jù)庫(kù)查詢語(yǔ)言是結(jié)構(gòu)化語(yǔ)言,而適用于傳統(tǒng)數(shù)據(jù)庫(kù)的結(jié)構(gòu)化數(shù)字?jǐn)?shù)據(jù)只有5%,剩下的95%的非結(jié)構(gòu)化數(shù)據(jù)都無(wú)法被利用,如網(wǎng)頁(yè)與視頻資源[1]64。這就意味著圖書(shū)館面對(duì)洶涌而來(lái)的圖像、視頻和音樂(lè)等非結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)化、分析、應(yīng)用將會(huì)停滯不前,導(dǎo)致服務(wù)的貶值和落伍。如何轉(zhuǎn)變思維,把控新技術(shù)的脈搏,有效利用大數(shù)據(jù)為服務(wù)增值,重塑知識(shí)“領(lǐng)跑者”的形象,圖書(shū)館界也給予了關(guān)注,并在積極思考。

        2 圖書(shū)館大數(shù)據(jù)研究的現(xiàn)狀與評(píng)述

        2.1 研究現(xiàn)狀與作用

        筆者以“圖書(shū)館”+“大數(shù)據(jù)”為檢索詞,采用系統(tǒng)分析法、文獻(xiàn)閱讀法,通過(guò)檢索超星發(fā)現(xiàn)學(xué)術(shù)論文數(shù)據(jù)庫(kù)、中國(guó)知網(wǎng)期刊全文數(shù)據(jù)庫(kù),對(duì)2006年至2016年2月近十年圖書(shū)館有關(guān)大數(shù)據(jù)研究的文獻(xiàn)進(jìn)行檢索發(fā)現(xiàn),作為新興的信息技術(shù),大數(shù)據(jù)在圖書(shū)館界的研究2006年初現(xiàn)端倪,從2013年起呈逐年上升趨勢(shì),到2015年達(dá)到“井噴”狀態(tài)。圖書(shū)館對(duì)大數(shù)據(jù)的研究主要以大數(shù)據(jù)的基礎(chǔ)理論、給圖書(shū)館帶來(lái)的機(jī)遇與挑戰(zhàn)、對(duì)圖書(shū)館服務(wù)創(chuàng)新的影響、圖書(shū)館的應(yīng)用策略及其他相關(guān)問(wèn)題等作為主題,其發(fā)展趨勢(shì)如圖1所示。同時(shí),在對(duì)知網(wǎng)期刊全文數(shù)據(jù)庫(kù)論文主題統(tǒng)計(jì)中顯示,應(yīng)用策略、服務(wù)創(chuàng)新、基礎(chǔ)討論、機(jī)遇挑戰(zhàn)研究及其他分別占比為28%、25%、23%、12%和11%。

        我國(guó)圖書(shū)館對(duì)大數(shù)據(jù)的研究,正如陸靜在文中所說(shuō),大數(shù)據(jù)給圖書(shū)館所帶來(lái)的新機(jī)遇與挑戰(zhàn),開(kāi)啟了大數(shù)據(jù)與圖書(shū)館服務(wù)方式的創(chuàng)新研究,所提出的圖書(shū)館應(yīng)用大數(shù)據(jù)的策略,可以說(shuō)對(duì)圖書(shū)館實(shí)施和推動(dòng)大數(shù)據(jù)應(yīng)用,有效開(kāi)展服務(wù)創(chuàng)新提供了嶄新思路,對(duì)圖書(shū)館提升服務(wù)有較大的理論價(jià)值和現(xiàn)實(shí)指導(dǎo)意義[2]。

        2.2 研究中存在的問(wèn)題與不足

        總結(jié)近年來(lái)圖書(shū)館界對(duì)大數(shù)據(jù)的研究,雖然研究的論文數(shù)量激增,不僅有大數(shù)據(jù)的單一理論研究,還呈現(xiàn)出視角多樣化、多元化態(tài)勢(shì),開(kāi)展了多學(xué)科的交叉研究,但“重理論、輕實(shí)踐”的問(wèn)題突出應(yīng)用研究比較缺乏。筆者就研究?jī)?nèi)容發(fā)現(xiàn),目前圖書(shū)館界對(duì)大數(shù)據(jù)的研究還存在如下問(wèn)題:第一,理論架構(gòu)多有雷同,如諸多文章大幅對(duì)大數(shù)據(jù)的涵義、特征加以描述,其內(nèi)容照搬前人基礎(chǔ),重復(fù)太多;對(duì)大數(shù)據(jù)帶給圖書(shū)館機(jī)遇與挑戰(zhàn)的論述,缺少獨(dú)立的見(jiàn)解;第二,研究多停留于對(duì)國(guó)內(nèi)外理論的宏觀描述和表面探討層次,又困于技術(shù)力量薄弱,缺乏合理的團(tuán)隊(duì)合作研究,沒(méi)有持續(xù)增長(zhǎng)性;第三,雖然圖書(shū)館界對(duì)大數(shù)據(jù)的研究增長(zhǎng)迅猛,但普遍存在理論闡述多,實(shí)證實(shí)踐少的狀況。常此以往,會(huì)對(duì)圖書(shū)館學(xué)科發(fā)展和研究創(chuàng)新產(chǎn)生不利影響。

        3 國(guó)外信息行業(yè)大數(shù)據(jù)應(yīng)用實(shí)例

        在大數(shù)據(jù)急速增長(zhǎng)的進(jìn)程中,一些企業(yè)早已領(lǐng)略它的價(jià)值與潛力,如谷歌、百度、網(wǎng)飛、阿里巴巴、亞馬遜、騰訊和臉譜等。正是這些成功的行業(yè)典范,吸引了眾多關(guān)注大數(shù)據(jù)的目光??紤]圖書(shū)館運(yùn)用大數(shù)據(jù)主要為增值用戶服務(wù)和促進(jìn)行業(yè)發(fā)展,故援引國(guó)外相關(guān)信息產(chǎn)業(yè)的實(shí)例,以便明晰圖書(shū)館增值服務(wù)的效果和目標(biāo)。

        3.1 谷歌:從數(shù)字到數(shù)據(jù)化的發(fā)展

        2004年,谷歌與全球最大、最著名的圖書(shū)館進(jìn)行合作,試圖將所有版權(quán)條例允許的書(shū)本內(nèi)容全部數(shù)字化,此舉方便了全球用戶在不受時(shí)間和地點(diǎn)限制下查閱,不能不說(shuō)是個(gè)盛舉。但問(wèn)題隨之而來(lái),用戶需要知道要找的內(nèi)容在哪本書(shū)上,并在浩瀚文字中尋找自己所需要的片斷,因?yàn)檫@些數(shù)字文本沒(méi)有數(shù)據(jù)化,不能通過(guò)檢索詞查找,也不能被分析。只能說(shuō)谷歌擁有了海量的圖像,這些圖像還要依靠用戶的仔細(xì)閱讀、多次查找才能轉(zhuǎn)化為有用的信息。

        谷歌意識(shí)到只有將這些信息數(shù)據(jù)化,它的巨大作用才會(huì)發(fā)揮,因此它使用了能識(shí)別數(shù)字圖像的光學(xué)字符識(shí)別軟件來(lái)識(shí)別文本中的字、詞、句和段落,從而將數(shù)字化圖像轉(zhuǎn)化為數(shù)據(jù)化文本。谷歌數(shù)字圖書(shū)館利用它所擁有的圖書(shū)為數(shù)據(jù)資源,不僅可以對(duì)作者存在爭(zhēng)議的書(shū)籍進(jìn)行作品風(fēng)格鑒定,還可以讓學(xué)術(shù)作假行為無(wú)處藏身。

        3.2 Face book(臉譜):社交化網(wǎng)絡(luò)的再挖掘

        截止到2015年6月,F(xiàn)ace book擁有用戶量約15億[3]。通過(guò)上千億的朋友關(guān)系網(wǎng)進(jìn)行連接,使得Face book的社交網(wǎng)絡(luò)更加強(qiáng)大。Face book社交平臺(tái)的成功不僅僅是尋找朋友、建立關(guān)系的場(chǎng)所,它直接觸摸到用戶的關(guān)系、經(jīng)歷和情感,更將用戶日常生活的無(wú)形元素提取出來(lái),轉(zhuǎn)化為數(shù)據(jù)。在它之前,社會(huì)化關(guān)系一直被當(dāng)作信息存在,沒(méi)有清楚地界定為數(shù)據(jù),直到Face book“社交臉譜”的出現(xiàn)。

        Face book對(duì)數(shù)據(jù)的進(jìn)一步挖掘是“喜好”。它每天更新的照片量超過(guò)1000萬(wàn)張,用戶在此點(diǎn)擊“Like”按鈕或?qū)懺u(píng)論約有三十億次,其意義遠(yuǎn)不是表面上看到的照片分享、上傳、個(gè)人喜好那么簡(jiǎn)單,這為Face book挖掘用戶信息提供了大量的數(shù)據(jù)線索;Face book還通過(guò)用戶社交網(wǎng)絡(luò),跟蹤用戶的“狀態(tài)更新”,以確定最佳的廣告位賺取收入。

        3.3 亞馬遜:個(gè)性化推薦記錄系統(tǒng)

        亞馬遜的銷(xiāo)售額三分之一來(lái)自它的推薦系統(tǒng),它記錄用戶購(gòu)買(mǎi)過(guò)的書(shū)籍和瀏覽過(guò)的網(wǎng)頁(yè),分析個(gè)人愛(ài)好,為其提供個(gè)性化的服務(wù),推薦具體的書(shū)籍。亞馬遜總裁和創(chuàng)始人杰夫·貝索斯從一開(kāi)始就注意從每一個(gè)用戶身上捕捉大量數(shù)據(jù),如他們購(gòu)買(mǎi)什么類(lèi)型的書(shū),哪些書(shū)他們?yōu)g覽卻沒(méi)買(mǎi),瀏覽了多長(zhǎng)時(shí)間,哪些書(shū)是團(tuán)購(gòu)的等等。

        但在用戶信息量巨大時(shí),依據(jù)購(gòu)買(mǎi)信息樣本分析的作用越來(lái)越小。于是亞馬遜通過(guò)Kindle電子書(shū)閱讀器記錄用戶反復(fù)標(biāo)注和強(qiáng)調(diào)的內(nèi)容,書(shū)商樂(lè)意知道讀者喜歡哪些段落,從而提高他的銷(xiāo)量;作者知道哪些橋段為讀者喜歡,以便提高作品質(zhì)量;出版社則通過(guò)這些數(shù)據(jù),選擇出版更暢銷(xiāo)的書(shū)籍。值得一提的是亞馬遜并沒(méi)有將數(shù)據(jù)轉(zhuǎn)賣(mài)給書(shū)商或出版社。

        除此以外,國(guó)內(nèi)眾所周知的行業(yè)如:百度采集用戶的搜索數(shù)據(jù),阿里巴巴采集交易與信用卡數(shù)據(jù),騰訊采集社交數(shù)據(jù)等,對(duì)其服務(wù)的增值乃至企業(yè)的成功產(chǎn)生了巨大作用。

        4 國(guó)內(nèi)外圖書(shū)館運(yùn)用大數(shù)據(jù)的實(shí)踐

        2012年美國(guó)著名的信息咨詢公司(GARTNER)曾描述“大數(shù)據(jù)的技術(shù)目前正處于誘發(fā)階段,進(jìn)入真正實(shí)施及應(yīng)用推廣還需要2-5年”[4]41。可見(jiàn)大數(shù)據(jù)的處理和應(yīng)用仍在不斷磨合中,但國(guó)內(nèi)外一些研究型、大學(xué)圖書(shū)館作為“先行者”,就其應(yīng)用及推進(jìn)已展開(kāi)實(shí)踐工作,具體內(nèi)容如下:

        4.1 資源數(shù)據(jù)化的長(zhǎng)期保存和建設(shè)

        圖書(shū)館的數(shù)據(jù)資源比較單一,對(duì)隱藏著巨大價(jià)值的非結(jié)構(gòu)化數(shù)據(jù)的收集還是空白,但有些圖書(shū)館已優(yōu)先對(duì)在某一方面形成了一定規(guī)模的、結(jié)構(gòu)比較完整的文獻(xiàn)資源特別是原生資源,有系統(tǒng)、有組織地進(jìn)行開(kāi)發(fā)和整理,如美國(guó)國(guó)會(huì)圖書(shū)館的“美國(guó)記憶”項(xiàng)目,收集整理了照片、手稿、海報(bào)、樂(lè)譜、地圖、錄音、動(dòng)態(tài)圖像等記載美國(guó)歷史文化的特藏。澳大利亞國(guó)家圖書(shū)館、荷蘭國(guó)家圖書(shū)館等就原生數(shù)字資源和特色館藏進(jìn)行了長(zhǎng)期保存[5]。我國(guó)圖書(shū)館界也開(kāi)始注重結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的收集與豐富工作,如國(guó)家圖書(shū)館正在將云服務(wù)與關(guān)聯(lián)數(shù)據(jù)結(jié)合起來(lái),實(shí)現(xiàn)數(shù)字館藏的組織和聚合,以用戶需求為導(dǎo)向,建立超大型元數(shù)據(jù)倉(cāng)儲(chǔ)。改造建成后的數(shù)字圖書(shū)館的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)量將達(dá)到800TB左右[6]。

        4.2 基于“個(gè)人門(mén)戶”概念的個(gè)性化信息推送服務(wù)

        通過(guò)“個(gè)人門(mén)戶”能將圖書(shū)館最快、最有價(jià)值的信息聚集起來(lái),真正實(shí)現(xiàn)用戶的“一站式”個(gè)性化體驗(yàn),國(guó)內(nèi)外多家圖書(shū)館正在積極開(kāi)展此項(xiàng)目。經(jīng)美國(guó)研究圖書(shū)學(xué)會(huì)的調(diào)查,哥倫比亞大學(xué)、加州大學(xué)圣地亞哥分校、麻省理工學(xué)院、華盛頓大學(xué)等都紛紛建立了自己的數(shù)字圖書(shū)館門(mén)戶。國(guó)內(nèi)有條件的圖書(shū)館也在近幾年開(kāi)展了基于“門(mén)戶”的個(gè)性化服務(wù),如北京師范大學(xué)圖書(shū)館Metalib+SFX統(tǒng)一檢索型數(shù)字圖書(shū)館門(mén)戶、北航圖書(shū)館搭建的TRS數(shù)字圖書(shū)館門(mén)戶等[4]39。新加坡國(guó)家圖書(shū)館則采用大數(shù)據(jù)技術(shù)對(duì)持續(xù)增長(zhǎng)的大量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,在其門(mén)戶網(wǎng)站上將讀者最感興趣的信息實(shí)行自動(dòng)推送,目前已完成對(duì)“新加坡記憶”特色資源網(wǎng)站上的上萬(wàn)篇文章的文本分析[7]78。

        4.3 架構(gòu)大數(shù)據(jù)驅(qū)動(dòng)下的特色資源服務(wù)平臺(tái)

        大數(shù)據(jù)作為一種新技術(shù)與知識(shí)服務(wù)的新工具,對(duì)其特色資源平臺(tái)的內(nèi)容設(shè)計(jì)、數(shù)據(jù)收集與存儲(chǔ),知識(shí)組織與加工等構(gòu)建不容忽視。在此方面,國(guó)內(nèi)圖書(shū)館以清華大學(xué)圖書(shū)館為代表,應(yīng)用大數(shù)據(jù)技術(shù)為讀者提供知識(shí)服務(wù),在檢索平臺(tái)上綜合運(yùn)用多來(lái)源數(shù)據(jù),將書(shū)、刊、文章等元數(shù)據(jù)匯聚在一起用于檢索,用戶通過(guò)開(kāi)放鏈接技術(shù)定位及獲取資源。國(guó)外圖書(shū)館以美國(guó)哈佛大學(xué)圖書(shū)館為代表,率先在國(guó)家公共數(shù)字圖書(shū)館中公開(kāi)圖書(shū)大數(shù)據(jù)并提供下載,內(nèi)容包括書(shū)目數(shù)據(jù)、音頻、圖像、手稿等多種類(lèi)型的非結(jié)構(gòu)化數(shù)據(jù),共計(jì)一千多萬(wàn)種[7]77-78。

        5 大數(shù)據(jù)環(huán)境下圖書(shū)館增值服務(wù)相關(guān)問(wèn)題探析

        上述實(shí)例折射出大數(shù)據(jù)的加工、挖掘、個(gè)性化服務(wù)等方面的經(jīng)驗(yàn)和效果,為圖書(shū)館增值服務(wù)提供了良好的借鑒。筆者在此基礎(chǔ)上,結(jié)合對(duì)實(shí)例的借鑒分析,提出一些新的思考:

        5.1 技術(shù)分析法日益增強(qiáng)且多樣化

        隨著數(shù)據(jù)量的不斷增長(zhǎng),對(duì)數(shù)據(jù)的處理能力也隨之增強(qiáng),大數(shù)據(jù)的重點(diǎn)是否在技術(shù)方面,是計(jì)劃使用大數(shù)據(jù)的圖書(shū)館一直擔(dān)憂和探討的。不少業(yè)界人士認(rèn)為,大數(shù)據(jù)重點(diǎn)是技術(shù)層面的問(wèn)題,應(yīng)側(cè)重于硬件和軟件,但圖書(shū)館在此方面多有欠缺。

        對(duì)目前規(guī)模不等、類(lèi)型不同的行業(yè)使用的大數(shù)據(jù)分析技術(shù)進(jìn)行回顧和總結(jié),可以發(fā)現(xiàn),起先不同行業(yè)在不同領(lǐng)域采用不同分析算法,包括機(jī)器學(xué)習(xí)技術(shù)、統(tǒng)計(jì)學(xué)、圖形識(shí)別、人工智能、數(shù)據(jù)庫(kù)系統(tǒng)等?,F(xiàn)在,這些技術(shù)均進(jìn)化成了強(qiáng)大而復(fù)雜的大數(shù)據(jù)專(zhuān)用工具,如解決數(shù)據(jù)結(jié)構(gòu)多樣性的谷歌公司開(kāi)發(fā)的開(kāi)源式分布系統(tǒng)——Hadoop,它善于處理超大量的數(shù)據(jù)。

        為適應(yīng)新數(shù)據(jù)源不斷出現(xiàn)的局面,一些行業(yè)在大數(shù)據(jù)應(yīng)用方面采用多樣化的技術(shù)分析法:線索與目標(biāo)優(yōu)先排序、推介服務(wù)、發(fā)展成功概率打分、風(fēng)險(xiǎn)建模、用戶價(jià)值與收益率打分、用戶維系與流失預(yù)測(cè)、產(chǎn)品與服務(wù)內(nèi)容優(yōu)化、消費(fèi)意向分析等[8]。分析方式的多樣化提示圖書(shū)館應(yīng)考慮和有經(jīng)驗(yàn)的互聯(lián)網(wǎng)運(yùn)營(yíng)商、大數(shù)據(jù)服務(wù)商以大數(shù)據(jù)服務(wù)平臺(tái)聯(lián)盟與共享的方式,借助第三方在咨詢、研發(fā)、管理和服務(wù)方面的經(jīng)驗(yàn),為用戶提供需求預(yù)測(cè)、個(gè)性化推送、服務(wù)定制、閱讀風(fēng)險(xiǎn)評(píng)估等增值服務(wù)。只有這樣才能實(shí)現(xiàn)人、資源、技術(shù)三個(gè)要素的智慧交互與融合,才能體現(xiàn)圖書(shū)館大數(shù)據(jù)應(yīng)用的價(jià)值。

        5.2 預(yù)測(cè)能力和個(gè)性化服務(wù)是核心

        隨著大數(shù)據(jù)價(jià)值的顯現(xiàn),很多人關(guān)心的大數(shù)據(jù)運(yùn)用往往與自身相關(guān),比如購(gòu)物更便捷,觀影可以有更多選擇性,大數(shù)據(jù)應(yīng)用給自身帶來(lái)更多幫助。其實(shí)無(wú)論數(shù)據(jù)量和規(guī)模怎么變化,最核心的問(wèn)題還是要揭示隱藏的規(guī)律,即預(yù)測(cè)用戶需要,提供更精準(zhǔn)的服務(wù)。

        圖書(shū)館在大數(shù)據(jù)背景下,若想推出富有創(chuàng)新精神的顛覆性的戰(zhàn)略,就必須確立清晰的服務(wù)方向:要考慮大數(shù)據(jù)出現(xiàn)時(shí)會(huì)發(fā)生什么?在做大數(shù)據(jù)分析前,應(yīng)了解用戶最急迫的使用需要是什么?大數(shù)據(jù)經(jīng)分析后,能幫助用戶解決什么問(wèn)題?采取什么措施和方法才最為有效?只有預(yù)先洞察到用戶對(duì)哪些服務(wù)感興趣,會(huì)做出什么選擇,把握用戶做決定的原因和差異,提供個(gè)性化服務(wù),才能提升圖書(shū)館增值服務(wù)。

        目前圖書(shū)館的服務(wù)策略仍采用一種“逆向思維”,在數(shù)據(jù)化要求下,當(dāng)務(wù)之急是要改變傳統(tǒng)的“接收問(wèn)題—對(duì)問(wèn)題進(jìn)行查詢與分析—提交答案—發(fā)送與跟蹤”服務(wù)流程,遵循大數(shù)據(jù)的“正向思維模式”: “收集數(shù)據(jù)—量化分析—找出相關(guān)關(guān)系—預(yù)測(cè)需求—提出個(gè)性化方案”,主動(dòng)改變固有的服務(wù)方式,滿足用戶差異性需求[9]。

        通過(guò)以上方式,圖書(shū)館還可挖掘哪些用戶屬于行動(dòng)派、哪些用戶喜歡分享經(jīng)驗(yàn)、對(duì)服務(wù)如何評(píng)價(jià)等,這將是圖書(shū)館增值服務(wù)的具體手段和途徑。

        5.3 大數(shù)據(jù)的潛在價(jià)值和再利用是目標(biāo)

        提取海量數(shù)據(jù)的價(jià)值,使其從龐大的信息庫(kù)中釋放出能量,這是大數(shù)據(jù)的縮影。通過(guò)大數(shù)據(jù)的應(yīng)用與分析,許多行業(yè)都看到了大數(shù)據(jù)的潛在價(jià)值,極大地刺激他們進(jìn)一步采集、存儲(chǔ)、循環(huán)利用數(shù)據(jù)來(lái)尋求更多的利益。

        因?yàn)樯鐣?huì)化利用和私營(yíng)化對(duì)數(shù)據(jù)的利用更有創(chuàng)新性,其潛在價(jià)值也往往通過(guò)這些行業(yè)的利用來(lái)釋放,使得大數(shù)據(jù)的再利用大多帶有商業(yè)性質(zhì)。但非營(yíng)利性數(shù)據(jù)的二次利用,如美國(guó)幾大保險(xiǎn)公司創(chuàng)立的衛(wèi)生保健成本協(xié)會(huì)(Health Care Cost Institute),匯集了50億張保單,匿名分享這些數(shù)據(jù)后,發(fā)現(xiàn)美國(guó)的醫(yī)療花費(fèi)比通貨膨脹時(shí)增長(zhǎng)了3倍多,其中急診治療費(fèi)上漲了11%[1]175。此種再利用目標(biāo)更明確,運(yùn)行透明化,且富有社會(huì)責(zé)任心,值得非盈利的公共服務(wù)行業(yè)學(xué)習(xí)。2015年8月國(guó)務(wù)院(國(guó)發(fā)[2015]50號(hào))“關(guān)于促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知”將“加強(qiáng)數(shù)字圖書(shū)館、檔案館、美術(shù)館等公益設(shè)施建設(shè)”與“發(fā)展科學(xué)大數(shù)據(jù)、知識(shí)服務(wù)大數(shù)據(jù)應(yīng)用”緊密相聯(lián),表明政府對(duì)公共文化行業(yè)數(shù)據(jù)應(yīng)用和治理的決心[10]。

        圖書(shū)館界從實(shí)例與政策兩方面印證了圖書(shū)館大數(shù)據(jù)在真空里是沒(méi)有價(jià)值可言的,只有利用大數(shù)據(jù)來(lái)推動(dòng)實(shí)戰(zhàn),并從以往局限于少數(shù)象牙塔之中的學(xué)術(shù)精英圈子,擴(kuò)大到其他社會(huì)機(jī)構(gòu)和政府的決策部門(mén),它的潛力和作用才能釋放出來(lái)。其次,大數(shù)據(jù)的應(yīng)用將會(huì)輻射到更多領(lǐng)域,通過(guò)對(duì)行業(yè)重要職能進(jìn)行優(yōu)化的方式,實(shí)現(xiàn)跨行業(yè)的發(fā)展。圖書(shū)館收集數(shù)據(jù)固然重要,但要產(chǎn)生有意義的成果,仍需要一個(gè)過(guò)程,數(shù)據(jù)化只是過(guò)程的一部分,作為公共服務(wù)行業(yè)在推動(dòng)數(shù)據(jù)互動(dòng)的社會(huì)能力和責(zé)任感方面,仍有許多上升空間。

        6 結(jié)語(yǔ)

        世界邁進(jìn)大數(shù)據(jù)時(shí)代,大數(shù)據(jù)已深刻影響人們的生活、思考和學(xué)習(xí)方式,對(duì)圖情界的沖擊也將是驚人的,將研究成果運(yùn)用到圖書(shū)館增值服務(wù)的實(shí)踐中是研究的最終目的。鑒于大數(shù)據(jù)的實(shí)用案例分分秒秒都在刷新,因此筆者認(rèn)為并不存在所謂的“最佳分析模型”或“最佳實(shí)踐案例”。因水平有限,以上觀點(diǎn)難免有偏頗之處,唯希望業(yè)界多關(guān)注大數(shù)據(jù)行業(yè)動(dòng)態(tài)和應(yīng)用實(shí)踐,結(jié)合圖書(shū)館實(shí)際,形成全方位、多層面的理論與實(shí)踐相結(jié)合的研究態(tài)勢(shì),為圖書(shū)館迎接大數(shù)據(jù)提供良好導(dǎo)向。

        參考文獻(xiàn):

        [ 1 ] 維克爾.邁爾-舍恩伯格,肯尼思.庫(kù)克耶.大數(shù)據(jù)時(shí)代[M].盛楊燕,周濤,譯.2版.杭州:浙江人民出版社,2013.

        [ 2 ] 陸靜.我國(guó)圖書(shū)館界大數(shù)據(jù)研究評(píng)述與展望[J].圖書(shū)館雜志,2014(1):20-25.

        [ 3 ] Facebook/全球活躍用戶數(shù)為14.9億[EB/OL].[2015-08-02].http://mt.sohu.com/20150802/n418019391.shtml.

        [ 4 ] 江云,李鳳蘭.大數(shù)據(jù)在我國(guó)圖書(shū)館的應(yīng)用及推進(jìn)研究[J].圖書(shū)館工作與研究,2014(6):35-41.

        [ 5 ] 陳傳夫,錢(qián)鷗,代鈺珠.大數(shù)據(jù)時(shí)代的數(shù)字圖書(shū)館建設(shè)研究[J].圖書(shū)情報(bào)工作,2014(7):40-44.

        [ 6 ] 王天泥.知識(shí)咨詢:大數(shù)據(jù)時(shí)代圖書(shū)館的知識(shí)服務(wù)增長(zhǎng)點(diǎn)[J].圖書(shū)與情報(bào),2013(2):74-77.

        [ 7 ] 朱維喬.大數(shù)據(jù)驅(qū)動(dòng)的特色資源服務(wù)平臺(tái)架構(gòu)研究[J].圖書(shū)館研究,2014(4):77-81

        [ 8 ] 大數(shù)據(jù)時(shí)代的中國(guó)機(jī)遇:專(zhuān)訪美國(guó)西塞羅集團(tuán)(CICERO)首席執(zhí)行官Randy Shumway[EB/OL].[2015-12-22].http://www.cnii.com.cn/informatization/2015-12/22/content_1669513.htm.

        [ 9 ] 馬娜梅.大數(shù)據(jù)背景下圖書(shū)館知識(shí)咨詢服務(wù)策略[J].圖書(shū)館研究,2014(4):90-93.

        [10] 國(guó)務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知[EB/OL].[2015-09-05] http://www.gov.cn/Zhengce/content/2015-09/05/content_10137.htm.

        陶繼華 安徽行政學(xué)院圖書(shū)館信息檢索部館員。安徽合肥,230059。

        (收稿日期:2016-05-11 編校:陳安琪)

        猜你喜歡
        大數(shù)據(jù)圖書(shū)館
        圖書(shū)館
        文苑(2019年20期)2019-11-16 08:52:12
        時(shí)間重疊的圖書(shū)館
        文苑(2018年17期)2018-11-09 01:29:40
        圖書(shū)館
        飛躍圖書(shū)館
        大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
        新聞世界(2016年10期)2016-10-11 20:13:53
        基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
        科技視界(2016年20期)2016-09-29 10:53:22
        數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
        去圖書(shū)館
        一区二区三区婷婷中文字幕| 日本aⅴ大伊香蕉精品视频| 国内精品九九久久久精品| 男人天堂AV在线麻豆| japanesehd中国产在线看| 国产成人精选在线不卡| 岛国av一区二区三区| 亚洲国产av一区二区四季 | 亚洲天堂资源网| 国产精品一区二区三级| 中文字幕亚洲中文第一| 亚洲av无码专区在线| 四川丰满少妇被弄到高潮| 国产在线手机视频| 久久久国产不卡一区二区| 青青草视频在线播放观看| 亚洲精品一区二区三区麻豆| 无码精品国产va在线观看| 人妻丰满熟妇av无码区hd| 男女搞黄在线观看视频| 中文字幕亚洲一区二区三区| 亚洲国产aⅴ成人精品无吗| 18禁美女裸体网站无遮挡| 日韩精品人妻中文字幕有码| 亚洲另类丰满熟妇乱xxxx| 任你躁国产自任一区二区三区| 日韩av在线毛片| 亚洲精品综合久久中文字幕| 加勒比hezyo黑人专区| 欧美国产日韩a在线视频| 尤物无码一区| 亚洲av日韩精品一区二区| 无码av不卡一区二区三区| 亚洲日韩欧美一区二区三区| 中文字幕av人妻一区二区| 精品亚洲一区二区三区四区五区| 中文字幕精品久久久久人妻| 久久精品成人亚洲另类欧美| 久久精品女同亚洲女同| 国产一区二区女内射| 玩弄放荡人妻一区二区三区|