亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)時代下的圖書館數(shù)據(jù)挖掘和情報分析研究
        ——以中文發(fā)現(xiàn)系統(tǒng)為例

        2014-02-26 00:40:42鐘文一
        教育觀察 2014年25期
        關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)圖書館

        鐘文一

        (貴州師范大學(xué),貴州貴陽,550001)

        一、引言

        (一)大數(shù)據(jù)

        截止到2011年,全球信息總量已經(jīng)突破1.8千萬兆億,并不斷以驚人的速度膨脹變大,這意味著“大數(shù)據(jù)”時代已經(jīng)降臨。哈佛大學(xué)知名學(xué)者提出:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程?!贬槍@樣的一個變化,大數(shù)據(jù)時代最大的轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,取而代之的是關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。這就顛覆了千百年來人類的思維慣例,對人類的認(rèn)知和與世界交流的方式提出了全新的挑戰(zhàn)。

        (二)大數(shù)據(jù)下圖書館服務(wù)模式的轉(zhuǎn)變

        全球信息迅速膨脹帶來的數(shù)字資源的快速發(fā)展,使得有效利用大量結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的復(fù)雜數(shù)據(jù)逐漸成為圖書館工作的主旋律。隨著數(shù)據(jù)爆炸時代的來臨,以及網(wǎng)絡(luò)數(shù)字化環(huán)境的日益成熟,讀者迫切需要一個可以簡捷、快速獲得所有知識的理想平臺。同時,圖書館作為一個面向大眾的知識服務(wù)機構(gòu),不僅需要了解客戶需要什么服務(wù),更需要通過圖書館—用戶的服務(wù)關(guān)系去挖掘正在發(fā)生什么、預(yù)測和分析將來會發(fā)生什么,以便圖書館為讀者提供更好的服務(wù)模式并積極應(yīng)對未知的危機及挑戰(zhàn)。

        二、大數(shù)據(jù)時代下的數(shù)據(jù)挖掘和情報分析機理

        (一)知識挖掘

        引入先進(jìn)的技術(shù)手段,如知識挖掘算法、索引規(guī)則等,對各類文獻(xiàn)資源數(shù)據(jù)進(jìn)行處理和分析,使得文獻(xiàn)的揭示由表面信息深入到各類文獻(xiàn)之間存在的復(fù)雜關(guān)系中,繼而幫助用戶發(fā)現(xiàn)潛藏在數(shù)據(jù)背后的信息。通過知識挖掘處理,展現(xiàn)給讀者的文獻(xiàn)資源不再是一個點對點的結(jié)果表示,而是揭示各信息資源關(guān)聯(lián)關(guān)系的立體知識體系。深入分析用戶需要的甚至用戶潛在的知識需求,為其提供更加精準(zhǔn)化的知識發(fā)現(xiàn)服務(wù)。

        (二)情報分析

        基于已有的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的知識組織和表示,綜合應(yīng)用數(shù)據(jù)挖掘、學(xué)習(xí)和推理技術(shù),得出文獻(xiàn)資源的增減變動方向和變化趨勢,實現(xiàn)自動化、智能化的深入分析,幫助用戶獲取具有動態(tài)性、知識性和前沿性的情報知識。情報分析的主要作用是通過設(shè)置人機交互接口與用戶進(jìn)行交互。用戶可以通過一定的軟件環(huán)境指導(dǎo)學(xué)術(shù)原始數(shù)據(jù)的采集、抽取和分析處理過程及查看分析結(jié)果,并應(yīng)用可視化技術(shù)動態(tài)直觀地展現(xiàn)海量信息資源中潛在的規(guī)律和發(fā)展趨勢。

        (三)中文發(fā)現(xiàn)系統(tǒng)

        中文發(fā)現(xiàn)系統(tǒng)以各類結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)為底層基礎(chǔ),通過先進(jìn)的數(shù)據(jù)倉儲、數(shù)據(jù)挖掘及搜索引擎等技術(shù)手段,全面揭示館藏內(nèi)及館藏以外的各種學(xué)術(shù)文獻(xiàn)的應(yīng)用、管理,并深入挖掘大量數(shù)據(jù)資源背后的信息,為用戶和圖書館提供知識發(fā)現(xiàn)服務(wù)。

        圖1 中文發(fā)現(xiàn)系統(tǒng)

        讀者需要的知識往往大于圖書館或系統(tǒng)所能想到的范圍,考慮到用戶的這一實際需求,中文發(fā)現(xiàn)系統(tǒng)通過挖掘各類數(shù)據(jù)與用戶行為之間的立體關(guān)系,實現(xiàn)以下效果:

        發(fā)現(xiàn)知識:通過系統(tǒng)平臺、技術(shù)手段,深入分析圖書館員的工作與用戶的搜索行為,對信息資源進(jìn)行充分的挖掘、關(guān)聯(lián)和升值,更加全面和深入地揭示資源和服務(wù)的整體性,使得信息的查找和定位更加細(xì)化和快捷,幫助讀者發(fā)現(xiàn)所有所需資源。

        價值再生:深入挖掘各文獻(xiàn)資源之間的立體關(guān)系,實現(xiàn)圖書、期刊、學(xué)位論文、會議論文等資源之間互引的立體引證關(guān)系與趨勢發(fā)展關(guān)系,分析挖掘大數(shù)據(jù)背后的潛藏信息,從而幫助讀者發(fā)現(xiàn)潛在的知識需求與研究信息。

        三、中文發(fā)現(xiàn)系統(tǒng)功能案例分析

        (一)引文分析

        系統(tǒng)利用各種數(shù)學(xué)及統(tǒng)計學(xué)的方法進(jìn)行比較、歸納、抽象、概括等,對圖書、期刊、論文、著者等分析對象的引用和被引用現(xiàn)象進(jìn)行分析。使用的方法有圖論、模糊集合、數(shù)理統(tǒng)計等數(shù)學(xué)方法和邏輯思維方法,目的在于揭示文獻(xiàn)所蘊含的情報特征和相關(guān)關(guān)系。

        引文分析可以幫助讀者超越時間空間,跨學(xué)科組織文獻(xiàn),同傳統(tǒng)的分類法和主題法截然不同,使文獻(xiàn)有序化,有利于對文獻(xiàn)由表及里地深入展開分析,更易于量化。引文分析能夠幫助一些研究學(xué)者通過文獻(xiàn)引用頻率的分析研究測定某一學(xué)科的重要性或某一作者的影響力。通過文獻(xiàn)間的相互引證關(guān)系,分析某學(xué)科(或?qū)I(yè))文獻(xiàn)的參考文獻(xiàn)的來源和學(xué)科特性,不僅可以了解該學(xué)科與其他學(xué)科有哪些些聯(lián)系,而且還能探明其信息的來源及分布特征,從而為制定本學(xué)科的信息管理方案和發(fā)展規(guī)劃提供依據(jù)。另外可以通過被引用率與引用率來研究文獻(xiàn)老化規(guī)律??筛鶕?jù)某著者被別人引用的程度衡量該文獻(xiàn)學(xué)術(shù)價值和影響。

        系統(tǒng)通過引文分析不只實現(xiàn)期刊與期刊的引證,同時實現(xiàn)不同文獻(xiàn)類型、不同文獻(xiàn)信息要素之間的相互引證關(guān)系,最終實現(xiàn)一個立體的引用分析,方便讀者和圖書館全面掌握文獻(xiàn)信息的被引和施引關(guān)系。

        功能描述:提供期刊與期刊、圖書與圖書、圖書與期刊、期刊與圖書的前向與后向引證關(guān)系;提供被引和施引文獻(xiàn)列表與鏈接,方便反向分析研究;中文期刊引用分析數(shù)據(jù)由4000萬完善到7000萬;引文關(guān)系數(shù)據(jù)總共超10億條;提供圖書、期刊、學(xué)位論文、會議論文等不同文獻(xiàn)之間相互引用的立體引用分析,即引文鏈狀分析;提供作者、出版社、刊名、作者單位、主題詞、分類等信息的引文網(wǎng)狀分析。

        圖2 中文發(fā)現(xiàn)系統(tǒng)的引文分析功能

        (二)學(xué)術(shù)源流

        學(xué)術(shù)源流可以把文獻(xiàn)資源的研究單位從單一的文獻(xiàn)深化到文獻(xiàn)中存在的知識關(guān)聯(lián)中,通過學(xué)術(shù)源流可以按照知識概念形成知識相關(guān)鏈,這些關(guān)聯(lián)就是知識關(guān)聯(lián)的基礎(chǔ)。系統(tǒng)通過單向或雙向線性知識關(guān)聯(lián)構(gòu)成的鏈狀結(jié)構(gòu)延展開來,直到我們獲得解決問題的正確信息。通過學(xué)術(shù)源流可以按照作者形成學(xué)者相關(guān)鏈。針對文獻(xiàn)的基本要求,詳細(xì)分析出文獻(xiàn)學(xué)科領(lǐng)域與文獻(xiàn)作者信息間的關(guān)系;通過作者機構(gòu)可以按照機構(gòu)形式形成研究機構(gòu)相關(guān)鏈。建立作者機構(gòu)關(guān)聯(lián)后檢索作者所在機構(gòu)可以分析相關(guān)文獻(xiàn),了解作者所在機構(gòu)的研究情況,使讀者能夠更清楚地了解作者的研究方向以及作者所在機構(gòu)的研究方向。

        功能描述:知識相關(guān)鏈,提供通過分析知識源、知識活動和知識主體等得到的立體知識鏈,并提供這些知識鏈之間的關(guān)聯(lián)信息;作者相關(guān)鏈,提供作者與作者之間的多維關(guān)聯(lián)信息;作者機構(gòu)相關(guān)鏈,提供作者機構(gòu)與作者機構(gòu)之間的多維關(guān)聯(lián)信息。

        其他策略:提供知識、作者、作者機構(gòu)等要素之間的立體關(guān)聯(lián)信息,方便追溯與挖掘?qū)W科與文獻(xiàn)信息的研究領(lǐng)域和研究方向;提供學(xué)術(shù)關(guān)聯(lián)關(guān)系與文獻(xiàn)信息的反向鏈接,便于再次學(xué)習(xí)查找。

        首先,要求現(xiàn)有在職學(xué)生管理人員充分認(rèn)識到信息技術(shù)已成為了信息時代對高校學(xué)生管理工作最基本的能力要求,只有具有相應(yīng)的信息技術(shù),才能做好大學(xué)生管理工作。其次,通過開展輔導(dǎo)員沙龍等形式,為教師間搭建良好的交流平臺,促進(jìn)學(xué)生管理隊伍大數(shù)據(jù)分析能力的有效提升。最后,通過開展講座、報告及交流等活動,促進(jìn)高校學(xué)生管理團隊多媒體操作技能與學(xué)生管理信息化系統(tǒng)管理能力的全面提升。

        (三)趨勢分析

        趨勢分析是通過對搜索主題的年代和篇數(shù)的相關(guān)數(shù)字資料進(jìn)行分析,對比多個連續(xù)的相同指標(biāo),得出它們增減變動方向變化趨勢的一種分析方法。讀者通過搜索查找主題,得到該主題的趨勢曲線分析,并對其查找出的內(nèi)容結(jié)果根據(jù)年代進(jìn)行分析,可讓讀者快速了解搜索主題的學(xué)術(shù)趨勢??梢圆榭床煌甏搶W(xué)術(shù)主題的數(shù)據(jù)研究,無論是在上升或下滑趨勢曲線中,當(dāng)曲線在某一階段處于上升或者處于波峰階段時,即是在該時間段內(nèi)學(xué)術(shù)研究興盛的時段;當(dāng)曲線在某一階段處于下滑或者處于波谷階段時,即是在該時間段內(nèi)學(xué)術(shù)研究低迷的時段,同時也具有學(xué)術(shù)趨勢發(fā)展的預(yù)判分析,為預(yù)測該學(xué)術(shù)未來發(fā)展的趨勢提供幫助。

        功能描述:學(xué)術(shù)發(fā)展現(xiàn)狀,通過歸納、總結(jié)各類文獻(xiàn)數(shù)據(jù)的產(chǎn)出量與各項指標(biāo),總結(jié)出搜索主題在規(guī)定時間段內(nèi)的學(xué)術(shù)發(fā)展趨勢;深入挖掘、分析文獻(xiàn)信息發(fā)展趨勢的波峰與波谷,結(jié)合搜索主題的各項指標(biāo)與關(guān)聯(lián)指標(biāo),分析預(yù)測其未來發(fā)展趨勢。

        圖3 中文發(fā)現(xiàn)系統(tǒng)的趨勢分析功能

        (四)知識關(guān)聯(lián)與生長方向分析

        知識不僅是一個立體的存在,同時也有著廣泛的空間屬性,知識與知識之間有著千絲萬縷的聯(lián)系,這些聯(lián)系就是知識關(guān)聯(lián)的基礎(chǔ)。通過知識的關(guān)聯(lián),我們可以從A知識延伸至B知識、C知識……進(jìn)而延展開來,直到我們獲得解決問題的正確信息。知識關(guān)聯(lián)是我們從事知識活動和知識管理的基礎(chǔ),知識管理的目的是科學(xué)組織和有效利用知識,而知識關(guān)聯(lián)是科學(xué)組織和有效利用知識的基本出發(fā)點和理論依據(jù)。因此,可以說,知識管理的本質(zhì)是知識關(guān)系的管理,通過對知識關(guān)系的管理來達(dá)到科學(xué)組織和有效利用知識的目的。

        知識關(guān)聯(lián)是知識發(fā)現(xiàn)和知識創(chuàng)造的起點,揭示知識載體之間存在的各種關(guān)聯(lián)。可以從觸發(fā)一個知識點,從而帶動另一個知識點由平穩(wěn)過渡到加速發(fā)展的過程,同時支持多個主題或同類主題的學(xué)術(shù)產(chǎn)出等方面的對比與生長趨勢??梢酝ㄟ^對比同一領(lǐng)域發(fā)展相關(guān)性分析將來的發(fā)展趨勢,還可以通過知識關(guān)聯(lián)對生長方向進(jìn)行分析,發(fā)現(xiàn)這些行為之間的關(guān)聯(lián)性、連續(xù)性,或以某一中介為紐帶建立起具備參考價值的趨勢曲線。

        功能描述:提供同類主題、學(xué)科、領(lǐng)域等文獻(xiàn)資源的知識發(fā)展方向分析,方便研究某一學(xué)科領(lǐng)域或者主題方向的知識發(fā)展;挖掘分析多個主題、學(xué)科、領(lǐng)域等文獻(xiàn)資源的知識生長方向,便于發(fā)現(xiàn)不同學(xué)科領(lǐng)域或者主題之間的知識關(guān)聯(lián)性;提供不同機構(gòu)的學(xué)術(shù)文獻(xiàn)生長方向分析,便于合理有效地利用和掌握機構(gòu)的知識體系。

        圖4 中文發(fā)現(xiàn)系統(tǒng)的知識關(guān)聯(lián)與生長方向分析功能

        (五)可視化

        通過計算機可視化技術(shù),對統(tǒng)一結(jié)構(gòu)化的文獻(xiàn)信息字段進(jìn)行深度比對分析,繼而根據(jù)檢索關(guān)鍵詞的類型、時間、作者、學(xué)術(shù)價值等基本要素形成數(shù)量統(tǒng)計學(xué)方面的分析報告,并以可視化的圖表形式展現(xiàn)。同時,也可對相關(guān)研究主題進(jìn)行對比分析研究,并生成相關(guān)對比分析圖表,這可以幫助讀者了解相關(guān)學(xué)科熱門程度,合理選擇研究、開題方向,為科研人員宏觀研究數(shù)據(jù)提供了參考信息等,還可以幫助圖書館以直觀的方式直接查看圖書館信息資源的相關(guān)統(tǒng)計與發(fā)展趨勢信息。

        功能描述:查看——讀者可根據(jù)檢索關(guān)鍵詞的類型、時間、作者、學(xué)科、學(xué)術(shù)價值等要素,對得到的檢索結(jié)果進(jìn)行統(tǒng)計分析聚合后,查看圖表統(tǒng)計結(jié)果;輸出——讀者可以對檢索結(jié)果進(jìn)行下載、打印等操作。

        其他策略:提供圖書、期刊等學(xué)術(shù)發(fā)展趨勢曲線圖表;提供研究主題、學(xué)科的關(guān)聯(lián)對比分析曲線圖表;提供揭示圖書館各文獻(xiàn)信息現(xiàn)狀與發(fā)展趨勢曲線圖表。

        (六)智能輔助

        傳統(tǒng)的信息檢索系統(tǒng)中,用戶通過輸入檢索詞提交給系統(tǒng),得到檢索結(jié)果并從中查找所需要的信息。中文發(fā)現(xiàn)系統(tǒng)在此基礎(chǔ)上加入智能輔助系統(tǒng),主要方式是主動推送信息給用戶,在輸入檢索詞時系統(tǒng)自動判斷用戶所輸入的檢索詞是要找到什么,并將用戶所需要的信息推送給用戶。比如檢索一個作者時,系統(tǒng)會主動推送作者的簡歷與相關(guān)文章。

        功能描述:提供檢索關(guān)鍵詞的相關(guān)詞條解釋;提供圖書、期刊等導(dǎo)航推送;分析用戶搜索行為,提供常用學(xué)科的推送;提供搜索作者的簡歷、發(fā)表文章、學(xué)術(shù)研究產(chǎn)出等推送;通過用戶的搜索習(xí)慣,發(fā)現(xiàn)讀者的潛在搜索需求,并進(jìn)行主動推送。

        四、結(jié)論

        中文發(fā)現(xiàn)系統(tǒng)建立在日益增長的海量數(shù)字資源基礎(chǔ)之上,其宗旨在于打破以往的書刊目錄發(fā)現(xiàn)和文獻(xiàn)全文發(fā)現(xiàn)方式,為讀者提供具備完善的知識挖掘與情報分析功能的知識發(fā)現(xiàn)系統(tǒng)。以數(shù)據(jù)挖掘的相關(guān)技術(shù)為支撐,對這些文獻(xiàn)資源進(jìn)行數(shù)據(jù)關(guān)聯(lián)與情報分析處理,深入發(fā)現(xiàn)隱藏在大量數(shù)據(jù)背后的信息,從而建立功能強大的新一代學(xué)術(shù)資源發(fā)現(xiàn)平臺,幫助讀者簡捷、快速獲得所有需要的知識。對讀者來說,中文發(fā)現(xiàn)系統(tǒng)是學(xué)習(xí)的工具;對圖書館來說,它是一個研究學(xué)習(xí)平臺,也是一個功能強大的文獻(xiàn)管理平臺。

        [1] 王曉佳.大數(shù)據(jù)時代下的情報分析與挖掘技術(shù)研究[J].情報學(xué)報,2013(6).

        [2] 王偉.基于數(shù)據(jù)挖掘的圖書館用戶行為分析偏好研究[J].情報科學(xué),2012(3).

        [3] 韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(5).

        [4] 何少卓.淺談數(shù)據(jù)挖掘及其在圖書館的應(yīng)用[J].圖書館界,2004(3).

        [5] 蔣引娣.數(shù)字圖書館數(shù)據(jù)挖掘的基礎(chǔ)研究[J].現(xiàn)代情報,2007(8).

        [6] 楊曄.數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館建設(shè)中的應(yīng)用[J].現(xiàn)代經(jīng)濟信息,2008(7).

        [7] 劉海偉.淺談數(shù)據(jù)挖掘與圖書館期刊工作[J].內(nèi)蒙古科技與經(jīng)濟,2011(8).

        猜你喜歡
        數(shù)據(jù)挖掘關(guān)聯(lián)圖書館
        “苦”的關(guān)聯(lián)
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        圖書館
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        奇趣搭配
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        飛躍圖書館
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        去圖書館
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        猫咪免费人成网站在线观看 | 男人的精品天堂一区二区在线观看| 国产精品沙发午睡系列| 色综合视频一区中文字幕| 国产在线一91区免费国产91| 深夜福利国产| 青青草手机视频免费在线播放| 久久精品国产99国产精偷| 国产啪精品视频网站| 最新国产女主播福利在线观看| 国内精品女同一区二区三区| 成人影片麻豆国产影片免费观看| 婷婷中文字幕综合在线| 精品人妻中文av一区二区三区| 中文字幕一区二区人妻在线不卡 | 色婷婷精品久久二区二区蜜桃| 黑森林福利视频导航| 国产精品无码专区视频| 国产激情视频在线观看你懂的| 亚洲一区二区免费在线观看视频| 亚洲成av人片在线观看www| 国产美女白浆| 丝袜美女美腿一区二区| 99久久免费看精品国产一| 老少配老妇老熟女中文普通话 | 日韩精人妻无码一区二区三区 | 日本女优激情四射中文字幕| 天天摸夜夜摸摸到高潮| 亚洲成av人最新无码| 一区二区三区岛国av毛片| 午夜福利一区在线观看中文字幕| 极品新婚夜少妇真紧| 国产最新一区二区三区天堂| 日韩在线视频专区九区| 亚洲av无码一区二区三区网址| 永久免费观看的毛片手机视频| 国产精品人成在线观看| 亚洲一区二区三区精品| 大桥未久亚洲无av码在线| 亚洲另类激情专区小说婷婷久| 中文字幕中文字幕三区|