亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)時代高校圖書館嵌入式知識發(fā)現(xiàn)情報分析服務(wù)模式研究

        2017-03-15 16:53:32郝建軍
        河南圖書館學(xué)刊 2017年2期
        關(guān)鍵詞:高校圖書館

        郝建軍

        摘 要:文章介紹了大數(shù)據(jù)時代高校圖書館開展嵌入式知識服務(wù)的內(nèi)容,分析了大數(shù)據(jù)與情報的共性,并重點(diǎn)闡述了嵌入式知識發(fā)現(xiàn)情報分析服務(wù)的重要環(huán)節(jié),同時又設(shè)計(jì)了大數(shù)據(jù)時代高校圖書館嵌入式知識發(fā)現(xiàn)情報分析服務(wù)模型,該模型主要包括數(shù)據(jù)資源層、知識發(fā)現(xiàn)處理層和界面展示層。

        關(guān)鍵詞:大數(shù)據(jù)時代;高校圖書館;嵌入式服務(wù);知識發(fā)現(xiàn);情報分析

        中圖分類號:G252文獻(xiàn)標(biāo)識碼:A 文章編號:1003-1588(2017)02-0049-03

        大數(shù)據(jù)技術(shù)的快速發(fā)展促進(jìn)了科研方式的變革,基于數(shù)據(jù)緊密型的科研方式已經(jīng)成為自科研經(jīng)驗(yàn)方式、理論方式、計(jì)算機(jī)模擬方式之后的新的發(fā)展模式[1]?,F(xiàn)階段,海量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)給科研帶來了巨大挑戰(zhàn),而且數(shù)據(jù)存儲和共享功能缺乏合理性和有效性,這也給高校圖書館的服務(wù)模式造成不小的影響。在大數(shù)據(jù)時代,高校圖書館應(yīng)該更加重視用戶數(shù)據(jù)安全和服務(wù)質(zhì)量,積極利用先進(jìn)的數(shù)據(jù)分析和處理技術(shù)來提升高校圖書館服務(wù)的智能化和個性化,為高校圖書館的服務(wù)創(chuàng)新創(chuàng)造出有利條件[2]。高校圖書館應(yīng)該借助大數(shù)據(jù)技術(shù),充分了解用戶的服務(wù)需求,并以滿足用戶的服務(wù)需求為目的開展相應(yīng)的服務(wù)。

        1 大數(shù)據(jù)時代高校圖書館開展嵌入式知識服務(wù)的內(nèi)容

        1.1 用戶需求的分析

        在大數(shù)據(jù)環(huán)境下,首先,高校圖書館可以收集和存儲用戶的基本信息,比如:用戶的學(xué)歷、年齡、科研成果、學(xué)習(xí)經(jīng)歷以及工作單位等信息,并詳細(xì)記錄用戶的操作信息及檢索、查詢、收藏以及標(biāo)識等操作行為,可以與用戶查詢資料的內(nèi)容、學(xué)科類別以及相應(yīng)用戶權(quán)限進(jìn)行關(guān)聯(lián),還可以收集用戶具體的信息咨詢、科技前沿以及參考導(dǎo)航等服務(wù)情境[3]。其次,高校圖書館可以分析海量數(shù)據(jù),利用基于語義網(wǎng)的技術(shù)來規(guī)范用戶信息資源,并將其轉(zhuǎn)換為能夠被應(yīng)用程序理解和直接調(diào)用的數(shù)據(jù),從而可以更好地感知和預(yù)測用戶行為。最后,高校圖書館利用用戶數(shù)據(jù)作為決策依據(jù),為用戶制訂當(dāng)前目標(biāo)、短期目標(biāo)以及長期目標(biāo),并根據(jù)需求環(huán)境的變化動態(tài)分配硬件和軟件資源,從而讓高校圖書館的服務(wù)融入用戶的科研活動中。

        1.2 規(guī)律趨勢的分析預(yù)測

        針對某些行業(yè)或者學(xué)科進(jìn)行全面收集信息資源時,在專業(yè)研究成果的基礎(chǔ)上進(jìn)行深入分析,比如對比、推理以及綜合利用等科學(xué)分析手段,或參照專業(yè)學(xué)科發(fā)展規(guī)律,計(jì)量學(xué)發(fā)展規(guī)律等[4]。由于學(xué)科的知識特點(diǎn)和發(fā)展規(guī)律各不相同,因此需要運(yùn)用多種分析和處理手段來構(gòu)建不同的學(xué)科模型,從而能夠準(zhǔn)確地預(yù)測學(xué)科發(fā)展規(guī)律以及發(fā)展趨勢。常見的預(yù)測方法有以下幾種:①將大量文獻(xiàn)內(nèi)容進(jìn)行數(shù)據(jù)統(tǒng)計(jì),以歸納總結(jié)出文獻(xiàn)的內(nèi)在規(guī)律,比如齊普夫定律、洛特卡定律以及布拉德福定律等都是常見的基于文獻(xiàn)內(nèi)容的統(tǒng)計(jì)方式。②根據(jù)文獻(xiàn)的發(fā)展規(guī)律和趨勢來構(gòu)建數(shù)學(xué)模型,可以達(dá)到預(yù)測文獻(xiàn)發(fā)展規(guī)律的目的,比如普賴斯就專門構(gòu)建了基于指數(shù)增長規(guī)律的數(shù)學(xué)模型。③將其他領(lǐng)域的數(shù)學(xué)規(guī)律和數(shù)學(xué)模型移植到文獻(xiàn)發(fā)展的預(yù)測中,比如物理學(xué)中的半衰期規(guī)律、經(jīng)濟(jì)學(xué)中的人口增長規(guī)律以及生物學(xué)中的成長規(guī)律等。④依據(jù)模糊理論來搜集相似文獻(xiàn)內(nèi)容,存儲在計(jì)算機(jī)中,并利用統(tǒng)計(jì)技術(shù)進(jìn)行分析和對比數(shù)據(jù),以此幫助科研人員挖掘數(shù)據(jù)關(guān)聯(lián)性。

        2 大數(shù)據(jù)分析與情報分析的共性

        2.1 看重對數(shù)據(jù)的定量分析

        數(shù)據(jù)作為最直觀的資源,已經(jīng)潛移默化地改變了分析決策的方式,如何有效地收集、篩選以及整理各種數(shù)據(jù)資源,并利用合理的方法來挖掘數(shù)據(jù)的潛在價值,已經(jīng)成為評價一個組織是否具有競爭力的重要衡量方式。情報分析學(xué)科同樣十分重視數(shù)據(jù)資源的應(yīng)用,在情況分析研究的初期階段,分析人員主要依靠人員的智力來分析少量數(shù)據(jù)現(xiàn)象,并從中歸納總結(jié)出情報分析的規(guī)律。隨著科學(xué)技術(shù)的快速發(fā)展,學(xué)科之間的關(guān)聯(lián)性和交叉性逐漸加強(qiáng),學(xué)科知識的劃分越細(xì)致,所涉及的內(nèi)容也就越專業(yè)。目前,情報分析更多地依靠先進(jìn)的信息處理技術(shù),利用“機(jī)器學(xué)習(xí)”方式來挖掘數(shù)據(jù)、分析和統(tǒng)計(jì)相關(guān)聯(lián)系,還可以利用定量化方式來關(guān)聯(lián)基于關(guān)鍵字的詞匯共現(xiàn),其核心思路就是在計(jì)算能力的基礎(chǔ)上利用人工分析判斷數(shù)據(jù)聯(lián)系。因此,利用數(shù)據(jù)來闡述問題已經(jīng)成為情報分析的主要特點(diǎn),在情報分析報告中利用數(shù)據(jù)、公式以及圖表來說明理論的方式也充分體現(xiàn)了數(shù)據(jù)分析技術(shù)在情報分析領(lǐng)域的重要地位。

        2.2 關(guān)注多源數(shù)據(jù)融合

        大數(shù)據(jù)技術(shù)可以通過各種渠道,并利用各種收集手段來獲取各種數(shù)據(jù)信息,在進(jìn)行集中整理后,形成一種基于不同數(shù)據(jù)格式的統(tǒng)一處理方式,這種處理過程被稱為多源數(shù)據(jù)處理融合技術(shù)[5]。一方面,可以通過不同用戶和不同網(wǎng)絡(luò)途徑來獲取同一個研究方向的內(nèi)容;另一方面,根據(jù)信息數(shù)據(jù)的種類和用途的不同,比如:根據(jù)視頻、音頻及文本等方式進(jìn)行分類,也可以根據(jù)結(jié)構(gòu)化和非結(jié)構(gòu)化等方式進(jìn)行分類,同時也要考慮數(shù)據(jù)的異構(gòu)性。需要注意的是,相同類型的數(shù)據(jù)也有可能分布在不同的站點(diǎn),并由各自的數(shù)據(jù)供應(yīng)商提供,如論文分析研究的數(shù)據(jù)來源就包括中國知網(wǎng)、維普及萬方數(shù)據(jù)庫等[6]。一般情況下,針對前沿領(lǐng)域進(jìn)行情報分析時,只利用一種類型的數(shù)據(jù)是不夠全面的,應(yīng)該從其所涉及的期刊論文、圖書資源、專利以及項(xiàng)目等收集有效信息,進(jìn)行整合處理,這樣才能夠體現(xiàn)出該研究的整體特征。

        3 嵌入式知識發(fā)現(xiàn)情報分析服務(wù)的重要環(huán)節(jié)

        3.1 知識發(fā)現(xiàn)系統(tǒng)的利用

        將文獻(xiàn)分析方式與數(shù)據(jù)挖掘技術(shù)進(jìn)行有機(jī)結(jié)合已經(jīng)成為知識發(fā)現(xiàn)方面的熱門研究內(nèi)容,并且取得了可以直接應(yīng)用的研究成果,這為嵌入式知識發(fā)現(xiàn)情報分析服務(wù)提供了重要的研究方式。不可否認(rèn),選擇和使用合理的知識發(fā)現(xiàn)系統(tǒng)會提高信息數(shù)據(jù)的分析效果,其中比較有代表性的就是充分認(rèn)識到知識發(fā)現(xiàn)系統(tǒng)的優(yōu)勢,評估數(shù)據(jù)分析結(jié)果與用戶的契合程度,從而讓數(shù)據(jù)分析服務(wù)的效果得到用戶的認(rèn)同。比如:一些基于知識發(fā)現(xiàn)的軟件和系統(tǒng)比較適合大型結(jié)構(gòu)化文獻(xiàn)數(shù)據(jù)分析,可以根據(jù)結(jié)構(gòu)化數(shù)據(jù)的特點(diǎn)分析出信息的特定發(fā)展規(guī)律[7];還有一些基于主題和科研本身的知識發(fā)現(xiàn)模型,其可以利用文獻(xiàn)資源之間的相關(guān)性挖掘有效信息,并對文獻(xiàn)資料進(jìn)行多角度分析,根據(jù)關(guān)聯(lián)原則描述該學(xué)科領(lǐng)域的發(fā)展趨勢圖;另外還可以利用關(guān)聯(lián)和非關(guān)聯(lián)的知識發(fā)現(xiàn)方法,再結(jié)合相關(guān)語義分析、詞匯頻率統(tǒng)計(jì)等技術(shù),最后通過關(guān)鍵詞聚類方式來尋找潛在的知識發(fā)現(xiàn)。

        3.2 準(zhǔn)確獲取數(shù)據(jù)

        知識發(fā)現(xiàn)可以分析大量數(shù)據(jù)和信息資源,并從中挖掘明顯關(guān)聯(lián)或者非關(guān)聯(lián)的科學(xué)研究的內(nèi)在規(guī)律,情報分析人員可以向科研人員提供相關(guān)情報分析,一般采用的是定量和定性相結(jié)合的分析方法。在進(jìn)行定量分析之前,如果要獲取較為準(zhǔn)確的目標(biāo)數(shù)據(jù),除了要分析數(shù)據(jù)源以及檢索方式之外,還要對數(shù)據(jù)進(jìn)行預(yù)處理,如消除噪聲數(shù)據(jù)、集成數(shù)據(jù)等。大部分的數(shù)據(jù)分析軟件都具有數(shù)據(jù)篩選功能,其中常見的TDA(Threat Discovery Appliance)軟件就可以通過列表功能手工篩選原始數(shù)據(jù)。需要注意的是,當(dāng)自動篩選數(shù)據(jù)時,常常由于數(shù)據(jù)中檢測出偶發(fā)的錯誤或者不同的存儲格式導(dǎo)致篩選失敗,這就無法按照要求構(gòu)建知識圖譜。嵌入式的知識發(fā)現(xiàn)服務(wù)可以將篩選后的數(shù)據(jù)與專業(yè)數(shù)據(jù)分析專家共享,由此可以進(jìn)一步提高數(shù)據(jù)的準(zhǔn)確性,從而得到與研究對象關(guān)聯(lián)緊密的數(shù)據(jù)。

        3.3 應(yīng)用綜合分析方法

        科技創(chuàng)新活動不僅包括學(xué)科和領(lǐng)域的創(chuàng)新,而且還涉及社會各個方面的創(chuàng)新,所以嵌入式知識發(fā)現(xiàn)服務(wù)需要為決策人員提供情報分析服務(wù),幫助分析對象的社會行為,并為決策人員指明科研決策的發(fā)展方向;此外,還可以根據(jù)用戶的需求,結(jié)合經(jīng)濟(jì)學(xué)、社會學(xué)、管理學(xué)以及情報學(xué)等學(xué)科的分析方法,多方面地展現(xiàn)科技創(chuàng)新在社會環(huán)境中的具體狀況和發(fā)展趨勢。如今,國外已經(jīng)出現(xiàn)了專門提供情報分析服務(wù)的公司,比如美國的麥肯錫公司就對醫(yī)藥領(lǐng)域提供多方面的分析和研究服務(wù)。而國內(nèi)關(guān)于情報分析的研究還處于起步階段,高校圖書館可以借鑒國外成熟的研究成果,比如可以利用波士頓矩陣方法來分析文獻(xiàn)資源之間的關(guān)聯(lián)性。

        4 情報分析服務(wù)模型總體設(shè)計(jì)

        情報分析服務(wù)的主要功能就是針對數(shù)據(jù)進(jìn)行整理和分析,從而挖掘知識的內(nèi)在關(guān)聯(lián)性。該研究根據(jù)內(nèi)容解析方法來實(shí)施情報分析服務(wù),并專門構(gòu)建一個情報分析的服務(wù)模型。該模型采用了分層結(jié)構(gòu),自上向下共分成三個層次,即界面展示層、知識發(fā)現(xiàn)處理層、數(shù)據(jù)資源層等,具體結(jié)構(gòu)示意圖如圖1所示。

        首先是數(shù)據(jù)資源層,其確定研究對象包括三個步驟:確定分析目的、確定研究范圍、搜集情報等內(nèi)容。其次是知識發(fā)現(xiàn)處理層,它主要包括三個方面的內(nèi)容:①制定編碼標(biāo)準(zhǔn),并借助計(jì)算機(jī)輔助工具來構(gòu)建專屬詞典,其主要分為專業(yè)術(shù)語詞典、停止詞詞典、同義詞詞典等。②編碼部分,可以將文本文件轉(zhuǎn)換為計(jì)算機(jī)可識別的文本向量。③數(shù)據(jù)分析部分,可以利用相似度算法和聚類算法來處理文本向量,從而實(shí)現(xiàn)情報自動聚類和串并功能。最后是界面展示層,主要功能為針對數(shù)據(jù)進(jìn)行分析。

        4.1 數(shù)據(jù)資源層設(shè)計(jì)

        數(shù)據(jù)資源層為情報分析提供海量的數(shù)據(jù)資源,從各個數(shù)據(jù)源中收集數(shù)據(jù)并集成在情報員數(shù)據(jù)庫中。眾所周知,數(shù)據(jù)庫的性能會直接影響情報分析服務(wù)模式的處理效率。目前,比較成熟的數(shù)據(jù)庫種類主要有兩種:關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫。經(jīng)過幾十年的發(fā)展,關(guān)系型數(shù)據(jù)庫技術(shù)相對比較成熟,其中的行和列的關(guān)系非常明確,主要采用表型結(jié)構(gòu)存儲數(shù)據(jù),用戶比較容易接受。但是,隨著數(shù)據(jù)庫技術(shù)的不斷發(fā)展,關(guān)系型數(shù)據(jù)庫的弊端也逐漸顯現(xiàn)出來:①針對海量數(shù)據(jù)進(jìn)行查詢和存儲操作,海量數(shù)據(jù)信息時刻充斥在互聯(lián)網(wǎng)上,如果關(guān)系型數(shù)據(jù)庫還是采用表型存儲海量數(shù)據(jù),這時的存儲是以億為單位。當(dāng)利用SQL(Structured Query Language)語言查詢或者針對多張表進(jìn)行關(guān)聯(lián)查詢時,其查詢效率是非常低的。②數(shù)據(jù)庫的擴(kuò)展性較差。當(dāng)處理海量數(shù)據(jù)時,數(shù)據(jù)的結(jié)構(gòu)非常復(fù)雜,修改數(shù)據(jù)庫的表結(jié)構(gòu)是非常耗時的,因此復(fù)雜的數(shù)據(jù)結(jié)構(gòu)的處理效率無法達(dá)到用戶的要求。③數(shù)據(jù)庫的讀寫效率。針對動態(tài)的信息,每秒的讀寫次數(shù)要達(dá)到上萬次以上,而關(guān)系型數(shù)據(jù)庫的讀寫速度無法達(dá)到這種要求。

        4.2 知識發(fā)現(xiàn)處理層設(shè)計(jì)

        知識發(fā)現(xiàn)處理層的主要功能是針對數(shù)據(jù)資源層的數(shù)據(jù)進(jìn)行深度的分析和挖掘,它可以利用內(nèi)容分析方法進(jìn)行數(shù)據(jù)分析和情報編碼,具體的功能模塊圖如圖2所示。知識發(fā)現(xiàn)處理層主要包括四個功能模塊:情報自動聚類處理模塊、情報串并處理模塊、文本預(yù)處理模塊、文本向量表示模塊。

        4.3 界面展示層設(shè)計(jì)

        界面展示層主要包括兩個部分:知識圖譜展示功能和人機(jī)交互功能。知識圖譜展示功能形象展現(xiàn)出情報數(shù)據(jù)資源的分析結(jié)果,是針對情報數(shù)據(jù)資源分析的拓展,它可以準(zhǔn)確表達(dá)現(xiàn)象層面的具體信息,并通過更進(jìn)一步的分析來找出隱藏在情報中的規(guī)律,從而協(xié)助情報分析人員更好地處理情報。人機(jī)交互功能是利用操作界面來實(shí)現(xiàn)用戶和軟件之間的信息交流,更好地幫助用戶控制軟件。

        5 結(jié)語

        嵌入式知識發(fā)現(xiàn)情報分析服務(wù)模式是建立在先進(jìn)的信息處理技術(shù)的基礎(chǔ)上,為了更好地滿足科研人員對于知識服務(wù)的需求,同時也是情報服務(wù)可持續(xù)發(fā)展的重要保證??茖W(xué)技術(shù)的快速發(fā)展、大數(shù)據(jù)技術(shù)的研究以及數(shù)據(jù)分析方法的改進(jìn),都為嵌入式知識發(fā)現(xiàn)情報分析服務(wù)的個性化、智能化及多元化發(fā)展創(chuàng)造了有利條件,提供了良好的研究前景。

        參考文獻(xiàn):

        [1]顧濤.基于大數(shù)據(jù)的競爭情報協(xié)作分析研究[J].情報科學(xué),2013(12):114-118,135.

        [2]鄧仲華,李立睿,陸穎雋.基于科研用戶情景感知的嵌入式知識服務(wù)研究(上)[J].情報理論與實(shí)踐,2014(9):16-19.

        [3]韓翠峰.大數(shù)據(jù)時代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1):121-122.

        [4]田瑞強(qiáng),姚長青,潘云濤.關(guān)聯(lián)文獻(xiàn)的知識發(fā)現(xiàn)與創(chuàng)新研究進(jìn)展[J].情報理論與實(shí)踐,2013(8):117-123.

        [5]周曉英.數(shù)據(jù)密集型科學(xué)研究范式的興起與情報學(xué)的應(yīng)對[J].情報資料工作,2012(2):5-11.

        [6]化柏林.多源信息融合方法研究[J].情報理論與實(shí)踐,2013(11):16-19.

        [7]Bormer K.Boyack K Mapping interdisciplinary research(sidebar,systems sciencesection)[M].New York:Oxford University Press,2010:457-460.

        (編校:崔 萌)

        猜你喜歡
        高校圖書館
        讀者協(xié)會參與高校圖書館閱讀推廣工作的功能探析
        中文電子書館配市場發(fā)展探析
        出版廣角(2016年15期)2016-10-18 00:19:57
        高校圖書館閱讀推廣案例分析
        科技視界(2016年21期)2016-10-17 19:32:37
        微信公眾平臺在高校圖書館信息服務(wù)中的應(yīng)用研究
        科技視界(2016年21期)2016-10-17 19:25:20
        淺談高校圖書館辦公室的重要性
        商(2016年27期)2016-10-17 06:39:10
        高校圖書館閱讀推廣活動研究
        商(2016年27期)2016-10-17 06:38:27
        試論高校圖書館在網(wǎng)絡(luò)環(huán)境沖擊下的人文建設(shè)
        商(2016年27期)2016-10-17 06:30:59
        淺談高校圖書館隨書光盤的編目與管理作用
        當(dāng)代高校圖書館“大閱讀”服務(wù)模式探討
        高校圖書館閱讀推廣實(shí)踐探討
        科技視界(2016年20期)2016-09-29 13:17:57
        日韩少妇无码一区二区免费视频| 久久久国产乱子伦精品作者 | 国产美腿丝袜一区二区| 国产免费又爽又色又粗视频| 人妻少妇精品视频一区二区三区| 日韩啪啪精品一区二区亚洲av| 精品久久免费国产乱色也| 加勒比色老久久爱综合网| 久久夜色精品国产噜噜亚洲av| 在线观看亚洲AV日韩A∨| 日本在线一区二区三区四区| 色吧噜噜一区二区三区| 狠狠色噜噜狠狠狠狠米奇777| 精品少妇大屁股白浆无码| 亚洲国产综合久久精品| 亚洲国产婷婷香蕉久久久久久| 国产精品亚洲二区在线观看| 国产一区二区三区精品久久呦| 国产中文字幕一区二区视频| 国产精品免费看久久久无码| 日韩精品一区二区亚洲av| 级毛片无码av| 中文字幕乱码亚洲在线| 国产精品99精品无码视亚 | 亚洲av福利无码无一区二区 | 人妻av午夜综合福利视频| 少妇高潮久久蜜柚av| 曰韩亚洲av人人夜夜澡人人爽| 亚洲一区欧美二区| 中文字幕a区一区三区| 亚洲中文字幕舔尻av网站| 日本aⅴ大伊香蕉精品视频| 毛片av在线播放亚洲av网站| 亚洲高清一区二区精品| 久久久中文久久久无码| 日本五月天婷久久网站| 亚洲中文字幕永久网站| 国产精品亚洲专区无码不卡| 三上悠亚久久精品| 杨幂Av一区二区三区| 成人大片免费观看视频|