秦宗和
(忠縣圖書館,重慶 404300)
信息技術(shù)與經(jīng)濟(jì)全球化的發(fā)展促使信息量爆炸式增長,許多公共事務(wù)需要通過跨學(xué)科、跨平臺(tái)以及跨機(jī)構(gòu)的協(xié)同發(fā)展,許多與國計(jì)民生相關(guān)的項(xiàng)目都需要基于大數(shù)據(jù)來進(jìn)行智慧構(gòu)建[1]。在此背景下,具有智力資本和信息資源優(yōu)勢的智庫情報(bào)服務(wù)應(yīng)運(yùn)而生,智庫情報(bào)服務(wù)可以為圖書館決策者提供優(yōu)質(zhì)的情報(bào)決策服務(wù)。傳統(tǒng)的單一智庫運(yùn)營模式欠缺深層的大數(shù)據(jù)分析和數(shù)據(jù)挖掘支持,針對(duì)高質(zhì)量的情報(bào)分析存在困難,這種模式下,智庫學(xué)者與情報(bào)專家之間存在知識(shí)鴻溝,二者無法實(shí)現(xiàn)更廣泛的交流、合作,導(dǎo)致智庫的情報(bào)服務(wù)研究結(jié)果無法適應(yīng)現(xiàn)代化的信息技術(shù)發(fā)展和經(jīng)濟(jì)全球化的趨勢[2]。
近年來,圖書館智庫情報(bào)服務(wù)在大數(shù)據(jù)建設(shè)與發(fā)展的背景下,逐漸呈現(xiàn)出知識(shí)與情報(bào)緊密結(jié)合的發(fā)展趨勢,通過數(shù)據(jù)挖掘產(chǎn)生的知識(shí)不斷支撐高質(zhì)量的決策結(jié)果。實(shí)際上,圖書館的智庫與情報(bào)工作之間存在著天然的聯(lián)系,智庫的知識(shí)研究過程有較強(qiáng)的情報(bào)需求,情報(bào)研究能夠?yàn)橹菐熘R(shí)研究提供信息支撐和數(shù)據(jù)支撐[3]。在圖書館的情報(bào)研究中,通過智庫提供的大數(shù)據(jù)分析和數(shù)據(jù)挖掘工具,針對(duì)情報(bào)用戶需求中的環(huán)境分析、信息加工和情報(bào)分析等活動(dòng),為情報(bào)分析用戶提供穩(wěn)定的環(huán)境監(jiān)測、態(tài)勢跟蹤和深度分析,以及有效的風(fēng)險(xiǎn)預(yù)警和決策等功能,這些功能都具有巨大的需求和良好的發(fā)展前景。
一般來說,數(shù)據(jù)挖掘與智庫情報(bào)分析都是以數(shù)據(jù)為基礎(chǔ),通過挖掘和分析,獲得隱含在大數(shù)據(jù)中的知識(shí)或情報(bào),從而完成對(duì)目標(biāo)問題的指導(dǎo)和決策。因此,在數(shù)據(jù)挖掘與智庫情報(bào)分析中,應(yīng)該關(guān)注數(shù)據(jù)之間的多元融合以及多元數(shù)據(jù)之間的相關(guān)性,主要包括以下3個(gè)方面[4]:
(1)大數(shù)據(jù)的基本屬性為數(shù)據(jù)總量較大,數(shù)據(jù)挖掘需要通過機(jī)器學(xué)習(xí)獲得的規(guī)則對(duì)大量數(shù)據(jù)進(jìn)行分類,過濾掉冗余信息,減少數(shù)據(jù)存儲(chǔ)量;現(xiàn)代情報(bào)分析更依賴于信息技術(shù),通過人工對(duì)大量的信息進(jìn)行判斷和決策,最終形成穩(wěn)定的情報(bào)分析結(jié)論。
(2)數(shù)據(jù)挖掘能夠面對(duì)大量多元異構(gòu)數(shù)據(jù),從結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)中挖掘出有效信息;在提倡科學(xué)性的前提下,智庫情報(bào)分析應(yīng)該從多源異構(gòu)數(shù)據(jù)源中獲得深度數(shù)據(jù)信息。
(3)相關(guān)性分析是數(shù)據(jù)挖掘和智庫情報(bào)分析的基本原理,從提升數(shù)據(jù)挖掘和智庫情報(bào)服務(wù)之間的協(xié)調(diào)性和適應(yīng)性角度來看,通過相關(guān)性分析構(gòu)建多樣性數(shù)據(jù)之間的相關(guān)性有較大的意義。因此,在大數(shù)據(jù)時(shí)代下,采用數(shù)據(jù)挖掘?qū)χ菐烨閳?bào)分析能夠產(chǎn)生更為科學(xué)的分析結(jié)果。
圖書館智庫具有收集數(shù)據(jù)、信息和情報(bào),加工、檢索和提煉等功能,而這些服務(wù)也正是圖書館情報(bào)分析所需要的服務(wù)。實(shí)際上,由于職能的差異性,智庫研究中的情報(bào)檢索能力較差,遠(yuǎn)不如情報(bào)研究中的情報(bào)檢索能力,而情報(bào)研究中的決策能力遠(yuǎn)不如智庫研究中的決策能力[5]。然而兩者在數(shù)據(jù)挖掘、信息收集和檢索上都有較高的相似性。因此,若將情報(bào)研究過程加入到智庫的運(yùn)行機(jī)制中去,可以為圖書館智庫提供有力的信息共享和知識(shí)服務(wù)體系。圖書館情報(bào)研究的自身資源和技術(shù)平臺(tái)能夠?yàn)閳D書館智庫提供全面的數(shù)據(jù)支持和信息保證,其研究的價(jià)值能夠完美契合圖書館的智庫研究;反過來,智庫的構(gòu)建和開發(fā)也能夠提升和強(qiáng)化情報(bào)機(jī)構(gòu)的信息服務(wù)技能。
圖書館情報(bào)智庫構(gòu)建過程中,智庫研究一定要重視對(duì)情報(bào)運(yùn)營機(jī)制的構(gòu)建,情報(bào)研究的構(gòu)建需要借鑒智庫研究的服務(wù)機(jī)制。在二者的工作內(nèi)容上,智庫和情報(bào)研究為服務(wù)對(duì)象提供戰(zhàn)略決策,二者的服務(wù)形式都是知識(shí)創(chuàng)新和策略創(chuàng)新。智庫研究以問題為中心,針對(duì)圖書館公共事務(wù)決策提供智慧支持,情報(bào)研究則是以用戶需求為出發(fā)點(diǎn)的智能決策支持服務(wù)。因此,情報(bào)用戶的需求基礎(chǔ)為智庫的問題導(dǎo)向提供了基本保障,智庫的構(gòu)建則可以將情報(bào)研究中的需求導(dǎo)向融入到問題導(dǎo)向中,增加情報(bào)研究的多樣性。因此,圖書館智庫和情報(bào)研究之間具有較高的相似性,這將為構(gòu)建大數(shù)據(jù)背景下基于數(shù)據(jù)挖掘的圖書館情報(bào)智庫構(gòu)建奠定良好的理論基礎(chǔ)。
圖書館智庫情報(bào)服務(wù)平臺(tái)是一個(gè)集合資源檢索、數(shù)據(jù)處理、情報(bào)傳輸、智能數(shù)據(jù)挖掘等多個(gè)功能的有機(jī)整合系統(tǒng),并構(gòu)建于物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)平臺(tái)基礎(chǔ)上,能夠有效地將智庫研究和情報(bào)研究有機(jī)整合并相互滲透、共享資源。圖書館智庫情報(bào)服務(wù)平臺(tái)能夠借助于各種定量分析和定性分析的數(shù)據(jù)挖掘工具與方法,將大數(shù)據(jù)信息和資源轉(zhuǎn)化為有效的智能決策和支持[6]。該平臺(tái)的構(gòu)建既需要將環(huán)境分析、需求分析、任務(wù)設(shè)計(jì)、數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)、智能服務(wù)和情報(bào)服務(wù)等基本流程融合,也需要具備較強(qiáng)的認(rèn)知學(xué)習(xí)、控制評(píng)價(jià)的智能反饋能力,最終能夠應(yīng)用于圖書館的各項(xiàng)公共事務(wù)的決策和支持。
圖1 基于數(shù)據(jù)挖掘的圖書館情報(bào)智庫平臺(tái)組成模塊和功能
該平臺(tái)從圖書館智庫研究和情報(bào)工作入手,將用戶的決策需求作為服務(wù)出發(fā)點(diǎn),以為用戶提供決策支持作為需求的落腳點(diǎn),然后再在中間層根據(jù)用戶決策的需求來對(duì)資源和能力進(jìn)行各項(xiàng)整合,通過中間會(huì)話層將信息采集、知識(shí)創(chuàng)新、數(shù)據(jù)挖掘和服務(wù)決策能力凸顯出來。在整個(gè)平臺(tái)的運(yùn)作過程中主要包括4個(gè)不同的階段:
(1)第一階段:完成圖書館智庫情報(bào)數(shù)據(jù)的掃描,通過數(shù)據(jù)挖掘的技術(shù)對(duì)海量信息、數(shù)據(jù)和情報(bào)進(jìn)行掃描,在掃描過程中發(fā)現(xiàn)數(shù)據(jù)源中存在的問題,并根據(jù)掃描后的實(shí)際情況構(gòu)建理論假設(shè)。
(2)第二階段:完成圖書館智庫情報(bào)系統(tǒng)的需求判斷,基于決策和市場兩個(gè)層面構(gòu)建系統(tǒng)的需求分析。針對(duì)不同程度的外部環(huán)境掃描和對(duì)用戶需求的確認(rèn),不但包括智庫的問題導(dǎo)向需求,而且包括情報(bào)的用戶導(dǎo)向需求。
(3)第三階段:完成圖書館智庫情報(bào)系統(tǒng)的數(shù)據(jù)分析,針對(duì)明確的需求分析采用相關(guān)的技術(shù)和方法對(duì)海量數(shù)據(jù)進(jìn)行深度挖掘和提煉,形成具有初步價(jià)值的信息產(chǎn)出。
(4)第四階段:完成圖書館智庫情報(bào)系統(tǒng)的運(yùn)營和管理,展開對(duì)智庫資源和情報(bào)能力的推進(jìn)工作,形成高度整合數(shù)據(jù)的能力。將數(shù)據(jù)挖掘產(chǎn)生的各項(xiàng)決策成果進(jìn)行高度提煉,并整合構(gòu)建出研究成果,以快報(bào)或簡報(bào)的形式推送到不同用戶的手中以幫助用戶完成決策。
實(shí)際上,基于數(shù)據(jù)挖掘的圖書館智庫情報(bào)平臺(tái)是一個(gè)復(fù)雜的動(dòng)態(tài)系統(tǒng),能夠根據(jù)不同用戶的各項(xiàng)需求構(gòu)建解決方案,不但能夠?qū)⑶閳?bào)研究嵌入到智庫研究的運(yùn)營機(jī)制中,又能夠很好地在情報(bào)研究中采用智庫研究的原理與方法,最終實(shí)現(xiàn)一體化的管理流和信息流交互優(yōu)化,提升智庫和情報(bào)的專業(yè)水準(zhǔn)。
在圖書館智庫情報(bào)服務(wù)內(nèi)容構(gòu)建中,從數(shù)據(jù)收集、需求判斷、數(shù)據(jù)挖掘和結(jié)果推送4個(gè)方面進(jìn)行詳細(xì)的內(nèi)容分析[7]:
(1)數(shù)據(jù)收集是構(gòu)建圖書館智庫研究的基礎(chǔ),是構(gòu)建智庫情報(bào)服務(wù)平臺(tái)的基本任務(wù),是平臺(tái)研究的關(guān)鍵。一般來說,可以借助于數(shù)據(jù)挖掘工具,并采用情報(bào)分析方法,有針對(duì)性的對(duì)外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)進(jìn)行檢測,并跟蹤追蹤數(shù)據(jù),構(gòu)建策略風(fēng)險(xiǎn)預(yù)警和制訂各項(xiàng)預(yù)案。在數(shù)據(jù)采集過程中需要具有專業(yè)知識(shí)和技能的智庫相關(guān)工作人員進(jìn)行,這樣進(jìn)行的數(shù)據(jù)采集結(jié)果將會(huì)更為理想,構(gòu)建的數(shù)據(jù)資料具有更好的價(jià)值,可以描述出關(guān)聯(lián)事件的本質(zhì)信息,并將采集好的數(shù)據(jù)保存為相應(yīng)的數(shù)據(jù)形式,為數(shù)據(jù)挖掘提供必要的數(shù)據(jù)基礎(chǔ)。
(2)需求判斷是圖書館智庫情報(bào)平臺(tái)的重點(diǎn)內(nèi)容之一,通過跟蹤分析智庫的各項(xiàng)信息需求,構(gòu)建任務(wù)和確定智庫項(xiàng)目。在信息化、知識(shí)化和經(jīng)濟(jì)化的現(xiàn)代圖書館,智庫研究對(duì)于情報(bào)的需求不再滿足于簡單的文獻(xiàn)檢索和信息支持,而是更多樣化、個(gè)性化和深層次的信息需求。針對(duì)智庫情報(bào)服務(wù)的需求判斷是明確的任務(wù)過程,包括決策、相關(guān)領(lǐng)域動(dòng)態(tài)和行業(yè)發(fā)展的趨勢,旨在通過情報(bào)研究幫助智庫確定相應(yīng)的研究領(lǐng)域和目標(biāo)。因此,情報(bào)工作應(yīng)該先于智庫研究啟動(dòng),有助于提升智庫研究的環(huán)境感知能力,提升智庫研究朝著更為個(gè)性化、多樣化的方向發(fā)展。
(3)數(shù)據(jù)挖掘是圖書館智庫情報(bào)服務(wù)的關(guān)鍵內(nèi)容,在完成需求判斷以后,需要確定研究課題的學(xué)科范圍,選擇學(xué)科范圍內(nèi)的各項(xiàng)關(guān)聯(lián)數(shù)據(jù)庫,選擇正確的檢索用詞和策略。在數(shù)據(jù)挖掘的任務(wù)設(shè)計(jì)階段還應(yīng)該進(jìn)一步確定研究主題和內(nèi)容之間的邏輯關(guān)系,通過概念表達(dá)各項(xiàng)研究主題。一般可以投入專業(yè)人員編寫檢索表達(dá)式完成對(duì)數(shù)據(jù)資料的收集和檢索。數(shù)據(jù)挖掘階段的檢索策略將會(huì)影響到檢索的效果,所以智庫情報(bào)服務(wù)平臺(tái)應(yīng)該投入更多的資源構(gòu)建專家團(tuán)隊(duì),為數(shù)據(jù)挖掘設(shè)計(jì)出明確的工作方案,將數(shù)據(jù)挖掘任務(wù)細(xì)分到每一步驟,明確工作性質(zhì)和任務(wù)資源與工具。在數(shù)據(jù)挖掘過程中,情報(bào)機(jī)構(gòu)的任務(wù)是為智庫項(xiàng)目明確檢索策略,確定檢索數(shù)據(jù)庫和檢索關(guān)鍵詞,提供合理的排查方案。
(4)推送結(jié)果是構(gòu)建智庫情報(bào)服務(wù)平臺(tái)的目的,由于智庫研究的結(jié)果形式為智力成果,不能直接轉(zhuǎn)化生產(chǎn)力,其價(jià)值無法用利潤衡量,只能通過該智力成果如何影響圖書館公共事務(wù)決策來衡量。因此,需要智庫情報(bào)服務(wù)平臺(tái)利用網(wǎng)絡(luò)資源,通過多種途徑將智庫研究結(jié)果和情報(bào)工作結(jié)果推送給各個(gè)用戶,最終實(shí)現(xiàn)智庫研究和情報(bào)研究的價(jià)值。一般來說,在推送結(jié)果之前可以組建專家團(tuán)隊(duì)對(duì)結(jié)果進(jìn)行客觀評(píng)價(jià)。通過用戶的反饋意見,有針對(duì)性地對(duì)情報(bào)進(jìn)行修改,形成高質(zhì)量的智庫情報(bào)結(jié)果。確認(rèn)好智庫情報(bào)結(jié)果以后,應(yīng)該及時(shí)通過各項(xiàng)媒介手段推送給用戶,協(xié)助用戶進(jìn)行決策。
在物聯(lián)網(wǎng)和智能技術(shù)不斷發(fā)展的今天,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)增速加快,傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)挖掘方法已經(jīng)不能適應(yīng)大數(shù)據(jù)時(shí)代的需求[8]。在大數(shù)據(jù)背景下,對(duì)圖書館智庫情報(bào)數(shù)據(jù)挖掘方法提出了更高的要求。新時(shí)代的數(shù)據(jù)挖掘方法應(yīng)該具有采集、處理和分析多源異構(gòu)數(shù)據(jù)的能力,具有快速實(shí)時(shí)全面采集數(shù)據(jù)的能力,還需要具有處理各項(xiàng)不完備數(shù)據(jù)源的能力。同時(shí),新時(shí)代的數(shù)據(jù)挖掘還應(yīng)該綜合應(yīng)用多種數(shù)據(jù)挖掘工具,為用戶提供更便捷、有效的智庫及情報(bào)服務(wù)。
圖2 基于數(shù)據(jù)挖掘的圖書館智庫情報(bào)服務(wù)
圖書館進(jìn)入信息、智能時(shí)代,音頻、視頻、圖像和文本數(shù)據(jù)出現(xiàn)了爆炸式的增長,信息的快速更迭導(dǎo)致信息收集速度加快,信息極易出現(xiàn)失效。如果不對(duì)爆炸式的信息和數(shù)據(jù)進(jìn)行快速預(yù)處理,相繼產(chǎn)生的后續(xù)數(shù)據(jù)將會(huì)成為圖書館智庫和情報(bào)服務(wù)的負(fù)擔(dān)。圖書館智庫情報(bào)服務(wù)平臺(tái)應(yīng)該實(shí)時(shí)獲取各項(xiàng)數(shù)據(jù)源的全部,用于信息資源建設(shè),從新的渠道以及新的載體獲得更多的有價(jià)值數(shù)據(jù),應(yīng)用有效的數(shù)據(jù)挖掘工具從經(jīng)過預(yù)處理的數(shù)據(jù)中挖掘出有意義的知識(shí)信息,讓數(shù)據(jù)挖掘的結(jié)果能夠滿足不同用戶的不同需求,讓用戶享受更個(gè)性化和多樣化的服務(wù)。圖書館的智庫情報(bào)服務(wù)在面對(duì)海量的增長式數(shù)據(jù)時(shí)需要預(yù)處理有效的數(shù)據(jù),然后再通過情報(bào)分析人員對(duì)預(yù)處理過的數(shù)據(jù)進(jìn)行檢驗(yàn)和校正,最后用于各項(xiàng)課題的研究。
另外,除了構(gòu)建合理的預(yù)處理工具來對(duì)海量增長的數(shù)據(jù)完成預(yù)處理外,還要構(gòu)建具有融合多源異構(gòu)數(shù)據(jù)的處理工具。這是由于大數(shù)據(jù)時(shí)代下,在圖書館智庫情報(bào)服務(wù)平臺(tái)中,通過構(gòu)建多個(gè)數(shù)據(jù)傳感器,從網(wǎng)絡(luò)的多個(gè)數(shù)據(jù)獲取節(jié)點(diǎn)中實(shí)時(shí)傳遞、采集數(shù)據(jù),而通過這種方式采集到的數(shù)據(jù)一般具有多源異構(gòu)的特點(diǎn)。處理海量的多源異構(gòu)數(shù)據(jù)是大數(shù)據(jù)時(shí)代的數(shù)據(jù)處理重點(diǎn),針對(duì)海量的異構(gòu)數(shù)據(jù)處理工具成為了圖書館智庫情報(bào)構(gòu)建的關(guān)鍵。一般分為兩個(gè)部分,一個(gè)部分是通過關(guān)聯(lián)規(guī)則來消除海量多源異構(gòu)數(shù)據(jù)中的冗余數(shù)據(jù),另一個(gè)部分則是通過十字交叉驗(yàn)證的方式來對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行驗(yàn)證,減少存入數(shù)據(jù)庫中的數(shù)據(jù)錯(cuò)誤。
信息時(shí)代是人才競爭的時(shí)代,隨著數(shù)據(jù)挖掘技術(shù)、物聯(lián)網(wǎng)技術(shù)和智能技術(shù)的普及,各行各業(yè)都需要復(fù)合型人才。圖書館作為學(xué)科交叉行業(yè),一方面需要努力培養(yǎng)傳統(tǒng)的圖書館員,來增強(qiáng)圖書館的管理和運(yùn)維。另一方面,圖書館員不能僅僅只擁有傳統(tǒng)的圖書館管理技能,還需要培養(yǎng)更多、更全面的管理知識(shí)。針對(duì)智庫情報(bào)服務(wù)平臺(tái),首先可以通過專家講座的形式,為各個(gè)年齡段的管理員普及數(shù)據(jù)挖掘、互聯(lián)網(wǎng)的知識(shí),為圖書館進(jìn)入智能化做好人力資源儲(chǔ)備。其次,針對(duì)新加入圖書館的年輕人,著重培養(yǎng)他們?cè)跀?shù)據(jù)挖掘、互聯(lián)網(wǎng)和智能技術(shù)中的實(shí)際動(dòng)手能力,提拔一些有較強(qiáng)動(dòng)手能力的年輕人組建圖書館的智庫情報(bào)團(tuán)隊(duì)。其成員一方面具有較強(qiáng)的學(xué)習(xí)新知識(shí)能力,另一方面也具有融合智庫和情報(bào)之間優(yōu)勢的能力。在智庫的人員儲(chǔ)備中,圖書館可以購買半成品智庫以及相應(yīng)的二次開發(fā)方案,并讓智庫情報(bào)人員學(xué)習(xí)使用半成品智庫,在此基礎(chǔ)上通過二次開發(fā)方案構(gòu)建與該圖書館的特色相適應(yīng)的圖書館智庫。通過有圖書館管理和運(yùn)維經(jīng)驗(yàn)的智庫情報(bào)人員對(duì)智庫進(jìn)行二次開發(fā)形成的圖書館特色智庫,不但能夠滿足情報(bào)工作的需求,還能夠?yàn)椴煌脩籼峁﹤€(gè)性化、多樣化服務(wù)。在情報(bào)服務(wù)的構(gòu)建上,讓具有智庫服務(wù)經(jīng)驗(yàn)的人員參與到情報(bào)的收集和分析中去,這樣的情報(bào)分析工作能夠結(jié)合到智庫的數(shù)據(jù)挖掘優(yōu)勢,后續(xù)的智庫服務(wù)又能夠吸收情報(bào)分析的特點(diǎn)。
大數(shù)據(jù)時(shí)代數(shù)據(jù)類型多種多樣,通過單一的數(shù)據(jù)挖掘工具已經(jīng)無法滿足多樣化數(shù)據(jù)的分析過程。信息時(shí)代的圖書館用戶對(duì)信息的需求量和需求效率顯著提升,所以需要運(yùn)用更快捷的數(shù)據(jù)挖掘工具,來提供穩(wěn)定的智庫情報(bào)服務(wù)。此外智庫情報(bào)服務(wù)平臺(tái)在大數(shù)據(jù)時(shí)代背景下獲得了全面、穩(wěn)定的數(shù)據(jù)源,不同的數(shù)據(jù)源需要采用不同的數(shù)據(jù)挖掘工具進(jìn)行分析和挖掘,從各種類型的數(shù)據(jù)中挖掘出有意義的決策知識(shí),再綜合各個(gè)決策知識(shí)提供穩(wěn)定的決策服務(wù)。如果僅僅采用單一的數(shù)據(jù)挖掘工具,多源異構(gòu)數(shù)據(jù)和各種不完備的錯(cuò)綜復(fù)雜的數(shù)據(jù)類型,將會(huì)讓圖書館智庫情報(bào)服務(wù)的數(shù)據(jù)挖掘和分析成為平臺(tái)的負(fù)擔(dān)。作為智庫情報(bào)分析人員,首先需要建立好自己的專業(yè)知識(shí)基礎(chǔ),一般可以通過書本學(xué)習(xí)和講座學(xué)習(xí)等形式。其次,還需要通過動(dòng)手實(shí)踐建立好自己的實(shí)踐基礎(chǔ),可以通過跟蹤學(xué)習(xí)智庫技術(shù)和情報(bào)技術(shù)等方式完成。在理論基礎(chǔ)和實(shí)踐基礎(chǔ)上,智庫情報(bào)分析人員還應(yīng)該充分利用社交網(wǎng)絡(luò)進(jìn)行智庫情報(bào)分析,從海量的社交網(wǎng)絡(luò)數(shù)據(jù)中分析用戶的行為,為用戶提供合理的決策信息。大數(shù)據(jù)背景下的數(shù)據(jù)挖掘服務(wù),還應(yīng)該與傳統(tǒng)的情報(bào)分析服務(wù)相結(jié)合,通過情報(bào)分析的經(jīng)驗(yàn),對(duì)數(shù)據(jù)挖掘的方法和手段進(jìn)行補(bǔ)充和完善,形成全面、可靠的數(shù)據(jù)挖掘結(jié)果。圖書館應(yīng)該將財(cái)力、人力花費(fèi)至改進(jìn)和拓展工具與設(shè)備的分析能力上,保證情報(bào)分析人員能夠處理各種形式的數(shù)據(jù)規(guī)模,在多樣化、個(gè)性化數(shù)據(jù)背景下順利完成復(fù)雜、困難的情報(bào)分析工作,適應(yīng)各類用戶不同形式的圖書館智庫情報(bào)服務(wù)需求[9]。
數(shù)據(jù)挖掘形成智庫情報(bào)服務(wù),需要圖書館構(gòu)建并提供可持續(xù)發(fā)展的服務(wù)類型和形式。從近幾年的互聯(lián)網(wǎng)技術(shù)和智能技術(shù)的發(fā)展來看,圖書館由傳統(tǒng)的服務(wù)形式轉(zhuǎn)化到數(shù)字化服務(wù)形式,再轉(zhuǎn)化到智能化服務(wù)形式的過程非常快,所以要求圖書館能夠構(gòu)建可持續(xù)發(fā)展的智庫情報(bào)服務(wù)。一方面,智庫服務(wù)和情報(bào)服務(wù)隨著互聯(lián)網(wǎng)和智能技術(shù)的發(fā)展都獲得了較大的進(jìn)步空間和發(fā)展效果,需要圖書館投入更多的復(fù)合型人才形成可持續(xù)發(fā)展的智庫服務(wù)和情報(bào)服務(wù),以及結(jié)合二者的發(fā)展構(gòu)建更穩(wěn)定的智庫情報(bào)服務(wù),提供更優(yōu)質(zhì)的用戶決策信息。在可持續(xù)發(fā)展的構(gòu)建中,針對(duì)數(shù)據(jù)的不完整性和錯(cuò)誤數(shù)據(jù)形式是當(dāng)前最需要解決的問題之一。目前智庫情報(bào)服務(wù)數(shù)據(jù)挖掘過程中的有價(jià)值數(shù)據(jù)在數(shù)據(jù)總量中的比例較小,密度較低,不適合構(gòu)建可持續(xù)發(fā)展的智庫情報(bào)服務(wù)。另外,圖書館作為非盈利性質(zhì)的單位,沒有足夠的資金構(gòu)建海量的數(shù)據(jù)庫。為了構(gòu)建可持續(xù)發(fā)展的智庫情報(bào)服務(wù),圖書館應(yīng)該在數(shù)據(jù)的實(shí)施存儲(chǔ)過程中,控制數(shù)據(jù)庫的運(yùn)營、管理成本,通過構(gòu)建合理的預(yù)處理算法對(duì)存入數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)化,讓有效數(shù)據(jù)的密度增高,并利用重復(fù)檢索、聚類等算法對(duì)文檔、網(wǎng)頁或其他類型的信息資源進(jìn)行過濾、對(duì)海量圖像進(jìn)行檢索。圖書館還可以采用國際權(quán)威智庫的大數(shù)據(jù)算法,充分利用和擴(kuò)展分布式數(shù)據(jù),構(gòu)建底層基礎(chǔ)設(shè)施,從而形成對(duì)不完備數(shù)據(jù)處理的快速數(shù)據(jù)流。為保證圖書館的智庫情報(bào)服務(wù)的可持續(xù)發(fā)展,還應(yīng)該不斷改進(jìn)數(shù)據(jù)處理方法,提升數(shù)據(jù)準(zhǔn)備的效率,保證數(shù)據(jù)的時(shí)效性,控制好數(shù)據(jù)庫的存儲(chǔ)門檻,構(gòu)建高質(zhì)量的智庫、情報(bào)分析數(shù)據(jù),提高研究結(jié)果的科學(xué)性和準(zhǔn)確性。
經(jīng)濟(jì)全球化和信息智能化的飛速發(fā)展,對(duì)圖書館的智庫研究和情報(bào)分析研究提出了新的信息處理和數(shù)據(jù)挖掘需求。大數(shù)據(jù)與智庫,數(shù)據(jù)挖掘與智庫情報(bào)分析,構(gòu)成了大數(shù)據(jù)背景下基于數(shù)據(jù)挖掘的圖書館智庫情報(bào)服務(wù)體系。在今后的研究中,應(yīng)進(jìn)一步構(gòu)建更合理的數(shù)據(jù)挖掘體系,充分融合圖書館的智庫研究和情報(bào)分析研究,讓二者形成更為完整的服務(wù)體系,為各種用戶需求提供理論和實(shí)踐指導(dǎo)。