洪克詩
摘要:在大數(shù)據(jù)背景下,人們對圖書館的要求越來越高,圖書館扮演的角色越來越多樣,圖書館公共媒體數(shù)據(jù)庫的構(gòu)建得到了社會各界的廣泛關(guān)注。該文立足于現(xiàn)階段圖書館建設(shè)的現(xiàn)狀及問題,提出圖書館公共媒體數(shù)據(jù)庫建設(shè)具體方案,并著重分析了對圖書館公共媒體數(shù)據(jù)庫的應(yīng)用方向與方法,以期在大數(shù)據(jù)背景下,建設(shè)更加高效、科學(xué)的圖書館公共媒體數(shù)據(jù)庫平臺,充分發(fā)揮圖書館作用。
關(guān)鍵詞:大數(shù)據(jù);圖書館;公共媒體;數(shù)據(jù)庫建設(shè)與利用
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)11-0008-02
Abstract: Under the background of big data, it requires more and more of the library, the library's role more and more diverse, to build public media library database has been widespread concern in the community. Based on the Present Status and Problems of Library Construction proposed public media library database building specific programs, and analyzes the application direction and methods of public media library database to the data of the large background, building a more efficient, Science Library public media database platform, give full play to the role of the library.
Key words: big data; library; public media; database construction and utilization
1 圖書館資源建設(shè)現(xiàn)狀與現(xiàn)存問題
我國圖書館在長期數(shù)字化、信息化的影響下,取得了不錯(cuò)的成績,同時(shí)我們也不得不承認(rèn)還有很多需待解決和優(yōu)化的問題存在?,F(xiàn)階段圖書館資源建設(shè)中存在的問題主要包括:資源類型局限,缺乏高質(zhì)量灰色文獻(xiàn);主題分布不均,部分文獻(xiàn)資源不完善;資源落后,存在大量的過時(shí)信息;數(shù)據(jù)庫利用率低,開放程度不夠等。
在大數(shù)據(jù)的背景下,圖書館公共媒體數(shù)據(jù)庫的用戶本身及用戶行為有其顯著特征。主要體現(xiàn)在兩方面:一方面,體現(xiàn)在對信息量與信息種類的需求增長,用戶獲取信息的形式已不再局限于傳統(tǒng)的新聞報(bào)道、調(diào)查報(bào)告等,更包含社交網(wǎng)絡(luò)、音頻視頻網(wǎng)站等新興途徑,獲取的內(nèi)容也不再局限于消息本身,而是更大范圍的各種類型的數(shù)據(jù);另一方面,用戶對服務(wù)速度及質(zhì)量要求更高,比如,在進(jìn)行查詢時(shí),用戶希望能以最簡便快捷的檢索方式來獲取高匹配度、具備高價(jià)值的信息,這對數(shù)據(jù)庫信息查詢與信息過濾能力將是不小的挑戰(zhàn),與此同時(shí),信息服務(wù)不再局限于傳統(tǒng)的信息檢索功能,而是朝著更加多元化、綜合化的方向發(fā)展。
2 大數(shù)據(jù)環(huán)境下圖書館公共媒體數(shù)據(jù)庫具體建設(shè)
1)總體框架
圖書館公共媒體數(shù)據(jù)庫系統(tǒng)在設(shè)計(jì)時(shí)的目標(biāo)為:將傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)管理模式與非結(jié)構(gòu)數(shù)據(jù)管理模式有機(jī)結(jié)合,構(gòu)建具備高度可擴(kuò)展性與靈活性的數(shù)據(jù)庫系統(tǒng),最終達(dá)到提供智能化個(gè)性服務(wù)的要求。圖書館公共媒體數(shù)據(jù)庫建設(shè)從生命周期角度研究可分為獲取階段、整合階段和分析階段,分別進(jìn)行數(shù)據(jù)資源獲取、數(shù)據(jù)存儲和組織、數(shù)據(jù)分析工作。公共媒體數(shù)據(jù)庫數(shù)據(jù)庫包括用戶行為子數(shù)據(jù)庫、社交網(wǎng)絡(luò)子數(shù)據(jù)庫、公共管理子數(shù)據(jù)庫三個(gè)子數(shù)據(jù)庫。
2)用戶行為子數(shù)據(jù)庫的建設(shè)
當(dāng)用戶通過端口進(jìn)行瀏覽操作時(shí),服務(wù)器會自動記錄相應(yīng)信息,并保存在原始日志文件中,用戶行為子數(shù)據(jù)庫便可通過服務(wù)器日志來獲取用戶瀏覽信息。在進(jìn)行數(shù)據(jù)整合時(shí),首先要進(jìn)行數(shù)據(jù)的篩選,即對信息數(shù)據(jù)進(jìn)行分類并分配權(quán)值,根據(jù)瀏覽行為分析出喜好與習(xí)慣;其次要進(jìn)行數(shù)據(jù)組織,即將精簡后的數(shù)據(jù)按照分類分眾法進(jìn)行有序化;最后要進(jìn)行數(shù)據(jù)的存儲與索引,按照列式存儲方式進(jìn)行存儲,便于求得行為數(shù)據(jù)總量及平均值。
3)社交網(wǎng)絡(luò)子數(shù)據(jù)庫的建設(shè)
社交網(wǎng)絡(luò)的子數(shù)據(jù)庫建設(shè)是對用戶評論信息、發(fā)表博文、收藏情況、標(biāo)簽添加、文獻(xiàn)貢獻(xiàn)等信息進(jìn)行搜集、分析與整合,最終形成社交網(wǎng)絡(luò)子數(shù)據(jù)庫。其中,數(shù)據(jù)的獲取主要是通過社交網(wǎng)絡(luò)爬蟲抓取的方式,而數(shù)據(jù)的整合主要采用人物分類法。
4)公共管理子數(shù)據(jù)庫的建設(shè)
公共管理大多數(shù)據(jù)是借助傳感器等實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)轉(zhuǎn)移的過程。公共管理中的數(shù)據(jù)數(shù)量大且具備較高的實(shí)時(shí)性,需結(jié)合大數(shù)據(jù)技術(shù)來實(shí)現(xiàn)數(shù)據(jù)的有序存儲與資源的快速搜索。
3 對大數(shù)據(jù)環(huán)境下圖書館公共媒體數(shù)據(jù)庫利用方式的整體探索
3.1圖書館用戶流失分析與價(jià)值分析
(1)用戶流失分析。對圖書館用戶流失與用戶價(jià)值進(jìn)行分析是對圖書館綜合評價(jià)的有力依據(jù),同時(shí)也能為圖書館改善方向及措施提供參考。在用戶使用圖書館公共媒體數(shù)據(jù)庫的過程中,導(dǎo)致用戶流失的原因大致包括信息可靠性、搜索便捷度、服務(wù)人性化程度、數(shù)據(jù)更新速度以及能否符合用戶需求與期望等幾個(gè)方面,這同時(shí)也是圖書館公共媒體數(shù)據(jù)庫應(yīng)不斷加強(qiáng)的地方,以用戶的角度不斷進(jìn)行優(yōu)化與完善,才可能避免用戶的流失,增強(qiáng)用戶對圖書館甚至政府的認(rèn)可度。
(2)用戶價(jià)值。用戶價(jià)值主要包括用戶知識價(jià)值與用戶口碑價(jià)值兩方面。用戶知識價(jià)值指用戶在與平臺交互過程中,生成的基于自身顯性或隱性知識的內(nèi)容,這對對平臺知識的更新和豐富具有推動作用。用戶口碑價(jià)值體現(xiàn)在用戶在對圖書館自身感受的基礎(chǔ)上對外宣傳的價(jià)值,良好的口碑是圖書館擴(kuò)大用戶范圍,提高資源利用率的有利條件,也是圖書館平臺及政府應(yīng)當(dāng)努力的方向。
3.2開拓新的服務(wù)領(lǐng)域
在大數(shù)據(jù)背景下,圖書館的競爭力已不再是單純的館藏資源量比拼,還包括對數(shù)據(jù)的組織分析能力和知識化服務(wù)能力,在大量信息資源、知識資源、用戶資源的基礎(chǔ)上,圖書館能發(fā)揮的職能種類更加多樣。
(1)知識咨詢服務(wù)。知識咨詢服務(wù)主要是面對用戶需求,解決用戶疑問,這就需要高質(zhì)量的知識數(shù)據(jù)來做支撐,圖書館公共媒體數(shù)據(jù)庫恰恰符合要求。同時(shí)知識咨詢服務(wù)涉及領(lǐng)域較多,很多時(shí)候會出現(xiàn)多個(gè)學(xué)科交叉的情況,圖書館現(xiàn)有的按專業(yè)分門別類的數(shù)據(jù)庫難以滿足要求,而功能公共媒體數(shù)據(jù)庫以主題分類,并涵蓋基于灰色文獻(xiàn)資源和系統(tǒng)跟蹤分析的大量數(shù)據(jù),服務(wù)專業(yè)性與可靠性更高。
(2)市場情報(bào)服務(wù)。市場情報(bào)服務(wù)可為企業(yè)提供大量的用戶行為數(shù)據(jù),為企業(yè)確定市場方向、進(jìn)行科學(xué)分析以及市場預(yù)測提供數(shù)據(jù)基礎(chǔ),同時(shí),大規(guī)模的公共媒體數(shù)據(jù)庫資源對于企業(yè)研究現(xiàn)存問題進(jìn)行分析并相應(yīng)作出優(yōu)化調(diào)整具有相當(dāng)強(qiáng)的可行性。
3.3公共危機(jī)預(yù)警與決策分析
(1)公共危機(jī)預(yù)警。公共媒體數(shù)據(jù)庫的預(yù)警功能是指在一些公共危機(jī)未產(chǎn)生萌芽前,借助數(shù)據(jù)分析與數(shù)據(jù)挖掘技術(shù),找出潛在關(guān)系鏈,對事態(tài)進(jìn)行分析預(yù)測,及時(shí)向公眾發(fā)出警告,并協(xié)助引導(dǎo)積極走向。
(2)突發(fā)事件決策與輿論環(huán)境構(gòu)建。當(dāng)發(fā)生突發(fā)事件時(shí),政府的決策須實(shí)時(shí)、可靠、全面的信息作為決策支持,而當(dāng)事件處理過后,需重新建立政府與民眾間信任,恢復(fù)社會穩(wěn)定環(huán)境,此時(shí)圖書館公共媒體平臺可進(jìn)行正面宣傳,引導(dǎo)積極輿論導(dǎo)向。
4 結(jié)論
在信息更新快、數(shù)據(jù)數(shù)量大、種類多的大數(shù)據(jù)背景下,大數(shù)據(jù)可為圖書館公共媒體數(shù)據(jù)庫的資源制作提供數(shù)據(jù)篩選,促進(jìn)資源組織和管理能力的提升,并加速公共媒體服務(wù)的變革,從而最終滿足人們?nèi)找嬖鲩L的知識需求。隨著圖書館館藏資源中數(shù)字資源比例的逐漸升高,加之計(jì)算機(jī)技術(shù)、物聯(lián)網(wǎng)技術(shù)以及云計(jì)算的普及,未來圖書館可能成為以數(shù)字資源為基礎(chǔ)的復(fù)合型圖書館。
參考文獻(xiàn):
[1] 張瑜.大數(shù)據(jù)環(huán)境下圖書館公共媒體數(shù)據(jù)庫建設(shè)與利用研究[D].遼寧師范大學(xué),2014.
[2] 陳巧玲.智慧時(shí)代國內(nèi)高校圖書館服務(wù)創(chuàng)新研究[D].福建師范大學(xué),2014.
[3] 劉穎.高校圖書館嵌入式學(xué)科服務(wù)研究[D].武漢大學(xué),2010.
[4] 劉峰.大數(shù)據(jù)時(shí)代的電視媒體營銷研究[D].華東師范大學(xué),2014.