亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘技術(shù)的現(xiàn)代圖書(shū)館系統(tǒng)設(shè)計(jì)

        2013-09-25 07:52:40
        圖書(shū)館學(xué)刊 2013年2期
        關(guān)鍵詞:數(shù)據(jù)挖掘聚類(lèi)對(duì)象

        吳 燦

        (重慶圖書(shū)館,重慶 400037)

        吳 燦 男,1977年生。學(xué)士,助理館員。研究方向:圖書(shū)館辦公信息化、數(shù)字圖書(shū)館、數(shù)字資源共享。

        隨著圖書(shū)館信息化、數(shù)字化程度的提高,其職能也發(fā)生了較大的改變。數(shù)字化、信息化的圖書(shū)館除了具有傳統(tǒng)圖書(shū)館的職能外,還是館領(lǐng)導(dǎo)做決策的重要依據(jù),成為圖書(shū)館發(fā)展數(shù)據(jù)庫(kù)和知識(shí)庫(kù)的重要組成部分。如何有針對(duì)性地為讀者在紛繁復(fù)雜的信息中選取有效的參考信息,以及對(duì)圖書(shū)館的各種資源進(jìn)行科學(xué)化管理是現(xiàn)今圖書(shū)館工作面臨的重要任務(wù)。而數(shù)據(jù)挖掘技術(shù)的應(yīng)用為圖書(shū)館的系統(tǒng)升級(jí)提供了重要的技術(shù)支撐。

        著名的圖書(shū)館管理博士W·J·Frawley對(duì)數(shù)據(jù)挖掘是這樣定義的:數(shù)據(jù)挖掘就是從大量的、復(fù)雜的、不完整的應(yīng)用數(shù)據(jù)中提取被人們忽視的但又有很大利用潛能的數(shù)據(jù)的過(guò)程。數(shù)據(jù)挖掘技術(shù)是隨著數(shù)據(jù)庫(kù)和自動(dòng)化技能發(fā)展而出現(xiàn)的新的信息技術(shù),與數(shù)據(jù)分析的差別就在于,數(shù)據(jù)分析是通過(guò)分析數(shù)據(jù)來(lái)驗(yàn)證人們已知的假設(shè),而數(shù)據(jù)挖掘則是從大量人們已知的數(shù)據(jù)中挖掘出人們未知的信息。

        1 數(shù)據(jù)挖掘?qū)D書(shū)館管理提出新需求

        網(wǎng)絡(luò)信息服務(wù)是指專(zhuān)門(mén)提供信息服務(wù)的機(jī)構(gòu)運(yùn)用計(jì)算機(jī)、通訊網(wǎng)絡(luò)等設(shè)備、設(shè)施,提供因特網(wǎng)信息服務(wù)。信息服務(wù)主要有兩種,即傳統(tǒng)信息服務(wù)和現(xiàn)代信息服務(wù)。傳統(tǒng)信息服務(wù)主要包括利用報(bào)紙雜志、影視作品、電臺(tái)廣播等提供的服務(wù);而現(xiàn)代信息服務(wù)是以計(jì)算機(jī)提供的網(wǎng)絡(luò)為核心,以數(shù)字化的形式為客戶提供信息服務(wù),包括電子書(shū)、網(wǎng)頁(yè)新聞、網(wǎng)絡(luò)搜索和查詢、信息傳遞等。

        信息技術(shù)和數(shù)字化的發(fā)展為圖書(shū)館體系的升級(jí)提供了重要的前提和條件,數(shù)字圖書(shū)館便是信息化和數(shù)字化的產(chǎn)物。數(shù)字圖書(shū)館是圖書(shū)館提高網(wǎng)絡(luò)信息服務(wù)的重要途徑和條件,網(wǎng)絡(luò)信息服務(wù)是數(shù)字圖書(shū)館建設(shè)的根本目標(biāo),也是聯(lián)系數(shù)字圖書(shū)館和讀者之間的重要紐帶。

        隨著圖書(shū)館信息化、數(shù)字化的發(fā)展,圖書(shū)館體系的具體任務(wù)轉(zhuǎn)變成如何讓使用者更加有效地利用圖書(shū)館資源,以及如何更好地針對(duì)讀者需要從紛繁復(fù)雜的信息中找出關(guān)鍵的可靠信息。數(shù)據(jù)挖掘技術(shù)的最大優(yōu)勢(shì)就在于“意外”性,這便為圖書(shū)館的管理工作和服務(wù)質(zhì)量的提升提供了更多可能。

        數(shù)據(jù)挖掘技術(shù)可以從雜亂無(wú)章的數(shù)據(jù)中提取出最符合要求的參考信息,而在數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)研究中,筆者所要研究的數(shù)據(jù)主要來(lái)源于工作中的現(xiàn)有數(shù)據(jù)。通過(guò)選取讀者借閱信息進(jìn)行聚類(lèi)分析,了解圖書(shū)館的使用率和圖書(shū)的借閱率,挖掘出隱性的圖書(shū)館運(yùn)行規(guī)律,總結(jié)出數(shù)據(jù)挖掘技術(shù)在圖書(shū)館系統(tǒng)中的應(yīng)用模型,然后用此模型來(lái)指導(dǎo)圖書(shū)館的管理和服務(wù)工作,進(jìn)而提高圖書(shū)館服務(wù)和管理工作的效率。

        2 信息化數(shù)據(jù)挖掘技術(shù)

        2.1 圖書(shū)館信息化聚類(lèi)

        現(xiàn)階段,信息化數(shù)據(jù)挖掘技術(shù)發(fā)展迅速,理論研究不斷創(chuàng)新,已經(jīng)成功研發(fā)了各種數(shù)據(jù)挖掘軟件,被廣泛應(yīng)用到不同領(lǐng)域并逐漸得到認(rèn)可,正是這些領(lǐng)域的成功引起了圖書(shū)館的極大關(guān)注。在圖書(shū)館現(xiàn)代管理系統(tǒng)中能夠產(chǎn)生大量不同種類(lèi)的數(shù)據(jù),自動(dòng)化系統(tǒng)本身也包含很多數(shù)據(jù)??梢砸罁?jù)這類(lèi)數(shù)據(jù)的特點(diǎn),定向研究適合圖書(shū)館應(yīng)用的數(shù)據(jù)挖掘軟件,并通過(guò)運(yùn)用這類(lèi)軟件挖掘出對(duì)圖書(shū)館有意義的部分信息,進(jìn)而了解讀者訪問(wèn)圖書(shū)館的目的及整體趨勢(shì)。根據(jù)讀者的興趣需求,采取適當(dāng)措施及時(shí)完善服務(wù)質(zhì)量,以優(yōu)質(zhì)的服務(wù)提高讀者的滿意度。

        將物理或抽象對(duì)象的集合分成由類(lèi)似的對(duì)象組成的多個(gè)類(lèi)的過(guò)程被稱(chēng)為聚類(lèi)。人類(lèi)通過(guò)聚類(lèi)研究事物內(nèi)部規(guī)律,由聚類(lèi)所生成的簇是一組數(shù)據(jù)對(duì)象的集合,這些對(duì)象與同一個(gè)簇中的對(duì)象彼此相似,與其他簇中的對(duì)象相異。聚類(lèi)分析為進(jìn)一步分析處理數(shù)據(jù)提供前提。作為數(shù)據(jù)挖掘功能,進(jìn)行聚類(lèi)分析后,可以整體了解數(shù)據(jù)分布情況,了解數(shù)據(jù)所存在的特征,并對(duì)其特定部分進(jìn)行深入分析,識(shí)別出數(shù)據(jù)密集區(qū)和稀疏區(qū),縱觀全局?jǐn)?shù)據(jù)分布模式及其屬性關(guān)系等。由于大部分現(xiàn)實(shí)存在的大量數(shù)據(jù)庫(kù)中不可避免地要涉及空缺、孤立點(diǎn)、未知錯(cuò)誤數(shù)據(jù)等,那么只是單純地按照聚類(lèi)分析數(shù)據(jù)可能會(huì)直接影響聚類(lèi)分析結(jié)論的準(zhǔn)確性。

        2.2 圖書(shū)館信息化聚類(lèi)模型建設(shè)

        事物之間都有自己的特有屬性,我們可以假設(shè)對(duì)象A={ω1,ω2,ω3,…,ωn},其中 ω 為其特有的屬性,對(duì)象 B={ξ1,ξ2,ξ3,…,ξm},如若A與B之間存在某種相關(guān)性K,我們可以認(rèn)為在該相關(guān)性上對(duì)象A與B屬于同一類(lèi),而K為A,B對(duì)象在K關(guān)系上的函數(shù),可記為K(A,B)。顯然關(guān)系K是建立在A對(duì)象與B對(duì)象屬性的某一非空子集之上。

        兩個(gè)對(duì)象是否在K關(guān)系上屬于同一類(lèi)別,可以通過(guò)兩個(gè)對(duì)象之間的距離進(jìn)行表征。因此我們可以建立兩個(gè)對(duì)象變量之間的距離K函數(shù)關(guān)系:

        ωi為A的屬性結(jié)合;

        ξi為B的屬性結(jié)合;

        C為第i個(gè)屬性的控制權(quán)重因素,在不同的關(guān)系中,權(quán)重因素可能不一樣,通常情況下權(quán)重的取值為1~7。

        當(dāng)兩個(gè)函數(shù)之間的距離越近,這兩個(gè)對(duì)象之間就越緊密,可以認(rèn)為在K關(guān)系上這個(gè)值就越大,這兩個(gè)對(duì)象屬于同一類(lèi),反之,我們可以認(rèn)為這兩個(gè)對(duì)象不屬于同一類(lèi)型。

        從廣義上來(lái)講,K 也屬于關(guān)系集合 ψ={K1,K2,K3,K4,…,Ki}。所以我們可以根據(jù)實(shí)際需求對(duì)關(guān)系進(jìn)行分類(lèi)。在不同的關(guān)系之間建立距離K函數(shù)。從而判斷某兩個(gè)對(duì)象在該關(guān)系上是否聚為一類(lèi)。

        由表4可知,6上105-2工作面開(kāi)采初期頂板最大下沉量大于800 mm,壓架事故頻發(fā),嚴(yán)重影響安全生產(chǎn);實(shí)施舊支架升級(jí)后,頂板最大下沉量控制在600 mm左右,保證了煤礦安全生產(chǎn);實(shí)施新支架優(yōu)化選型后,6上109工作面頂板下沉量在300 mm以內(nèi),保證了工作面高產(chǎn)高效。

        為了方便圖書(shū)館數(shù)據(jù)挖掘管理,根據(jù)圖書(shū)館日常工作關(guān)系,首先建立圖書(shū)館關(guān)系集合,主要包括讀者需求關(guān)系、圖書(shū)采購(gòu)關(guān)系、個(gè)性化服務(wù)關(guān)系。其次建立圖書(shū)館進(jìn)步文獻(xiàn)屬性表。因?yàn)閳D書(shū)館管理是以文獻(xiàn)管理為依托,所以在工作中收集整理文獻(xiàn)基本屬性參數(shù)尤為重要。筆者所采用的文獻(xiàn)基本屬性有書(shū)目類(lèi)別、圖書(shū)數(shù)量、日借閱量、月借閱量、個(gè)人連續(xù)借閱量、預(yù)約量、出版時(shí)間等,其具體描述如表1所示。

        表1 圖書(shū)對(duì)象基本屬性

        最后,利用公式 K(A,B)=1-∑n1=0Ci|ωi-ξi|進(jìn)行在關(guān)系 K上的聚類(lèi)分析計(jì)算。

        如對(duì)讀者需求關(guān)系進(jìn)行聚類(lèi),通過(guò)需求聚類(lèi)分析,可以觀察到當(dāng)前讀者需求量較大的書(shū)目信息,從而方便圖書(shū)管理。

        ①?gòu)膱D書(shū)館后臺(tái)數(shù)據(jù)庫(kù)中讀取各書(shū)目數(shù)據(jù)信息,隨機(jī)抽取某一書(shū)作為原始對(duì)象。

        ②由該關(guān)系可知,書(shū)目預(yù)約量、日借閱量為主要考察對(duì)象,所以在該比重中,確定屬性權(quán)重關(guān)系相應(yīng)的設(shè)置較大,可設(shè)該權(quán)重值6,其余權(quán)重可設(shè)為1。

        ④設(shè)置閾值,將關(guān)系值進(jìn)行分層,處于同一層的書(shū)目在讀者關(guān)系上屬于同一類(lèi)別。通過(guò)設(shè)置閾值,對(duì)關(guān)系值進(jìn)行分層,同一層者為同一類(lèi)數(shù)據(jù)。設(shè)置的閾值大小應(yīng)該根據(jù)實(shí)際情況而定。如圖1所示,分配不同的閾值,可以將不同的相關(guān)書(shū)目聚為一類(lèi)。

        圖1 聚類(lèi)分層

        3 數(shù)據(jù)挖掘在圖書(shū)館系統(tǒng)中的應(yīng)用

        3.1 資源建設(shè)

        在圖書(shū)館信息資源系統(tǒng)中,保障圖書(shū)館信息資源的重要環(huán)節(jié)就是文獻(xiàn)采集。一般的采購(gòu)形式是依據(jù)出版社、期刊社或者書(shū)店新書(shū)書(shū)目等相關(guān)信息,由專(zhuān)人或館長(zhǎng)進(jìn)行采集。這種文獻(xiàn)采集方式不可避免地帶有個(gè)人主觀性。因?yàn)閳D書(shū)館文獻(xiàn)購(gòu)置經(jīng)費(fèi)有限,應(yīng)充分采集各門(mén)學(xué)科相關(guān)的專(zhuān)業(yè)信息,使采集經(jīng)費(fèi)的價(jià)值效益達(dá)到最大化。

        在該建設(shè)過(guò)程中,首先確定權(quán)重關(guān)系,其次通過(guò)公式聚類(lèi)分析計(jì)算,有目的地選擇當(dāng)前需要采購(gòu)的書(shū)目。可以了解圖書(shū)館在一段時(shí)間的借閱流通記錄、檢索請(qǐng)求,進(jìn)而統(tǒng)計(jì)出文獻(xiàn)拒借集及頻繁借閱集,明確文獻(xiàn)信息采集方向,定向補(bǔ)充并豐富圖書(shū)館信息資源。

        3.2 讀者信息服務(wù)

        數(shù)據(jù)挖掘技術(shù)有效拓寬了圖書(shū)信息服務(wù)范圍,使圖書(shū)館信息服務(wù)更有針對(duì)性,更能從客觀上滿足讀者需求,提高了服務(wù)質(zhì)量。通過(guò)對(duì)讀者信息進(jìn)行挖掘,得到有效的數(shù)據(jù)信息資源,并通過(guò)對(duì)其數(shù)據(jù)進(jìn)行整合,進(jìn)行相應(yīng)的圖書(shū)館管理,為讀者提供一個(gè)統(tǒng)一的知識(shí)文化平臺(tái),大大提高了讀者的信息服務(wù)質(zhì)量。

        3.3 個(gè)性化服務(wù)

        讀者是圖書(shū)館的寶貴財(cái)富,在圖書(shū)館管理中,如何為讀者提供個(gè)性化服務(wù),滿足其客觀需求,是圖書(shū)館的主要工作。

        從先前的數(shù)據(jù)挖掘?qū)嵗芍?,設(shè)定不同的關(guān)系可以得到不同聚類(lèi)分析結(jié)果,所以在圖書(shū)館管理中運(yùn)用數(shù)據(jù)挖掘技術(shù),對(duì)讀者歷史借閱信息進(jìn)行聚類(lèi)挖掘分析,可以通過(guò)數(shù)據(jù)分析結(jié)果得到讀者的基本需求。在該關(guān)系模型中,讀者預(yù)定信息與單個(gè)客戶單本書(shū)籍借閱次數(shù)應(yīng)該占有很大權(quán)重,通過(guò)利用該數(shù)據(jù)挖掘模型,可以了解讀者的研究方向,并以此為依據(jù),向讀者推薦相關(guān)書(shū)籍或者有目的地進(jìn)行圖書(shū)采購(gòu),從而發(fā)展穩(wěn)定的圖書(shū)館讀者群。

        4 結(jié)語(yǔ)

        隨著科學(xué)技術(shù)的發(fā)展,在原始海量數(shù)據(jù)中尋找有用信息資源無(wú)疑是信息化利用的有力途徑。通過(guò)數(shù)據(jù)分析,可以改進(jìn)圖書(shū)館需求方向。但同時(shí)在大量的數(shù)據(jù)中也存在著信息冗余,這也是數(shù)據(jù)挖掘中需要考慮的問(wèn)題。然而隨著圖書(shū)館數(shù)據(jù)挖掘模型的不斷完善,其在讀者服務(wù)以及圖書(shū)館資源建設(shè)管理方面將會(huì)發(fā)揮越來(lái)越重要的作用,為圖書(shū)館的管理決策提供相應(yīng)的數(shù)據(jù)支持。

        [1] 楊春,劉樹(shù)新,樓康華.論數(shù)據(jù)挖掘在讀者關(guān)系管理中的應(yīng)用[J].河北建筑科技學(xué)院學(xué)報(bào):社科版,2006(3).

        [2] 雒鳳軍.數(shù)據(jù)挖掘技術(shù)與讀者個(gè)性化服務(wù)[J].蘭臺(tái)世界,2008(6).

        [3] 駱?lè)f.基于數(shù)據(jù)挖掘的數(shù)字圖書(shū)館個(gè)性化服務(wù)[J].黑龍江科技信息,2009(5).

        [4] 王伯秋,等.基于數(shù)據(jù)挖掘的個(gè)性化信息服務(wù)[J].醫(yī)學(xué)信息,2010(1).

        [5] 黃蘭,孫林山,羅日輝.數(shù)據(jù)挖掘及其在圖書(shū)館管理中的應(yīng)用[J].華南熱帶農(nóng)業(yè)大學(xué)學(xué)報(bào),2005(2).

        [6] 牛根義.國(guó)內(nèi)圖書(shū)館數(shù)據(jù)挖掘研究[J].現(xiàn)代情報(bào),2009(1).

        [7]周軍.基于數(shù)據(jù)挖掘的數(shù)字圖書(shū)館個(gè)性化服務(wù)系統(tǒng)的構(gòu)建[J].圖書(shū)館學(xué)研究,2007(3).

        猜你喜歡
        數(shù)據(jù)挖掘聚類(lèi)對(duì)象
        神秘來(lái)電
        睿士(2023年2期)2023-03-02 02:01:09
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        攻略對(duì)象的心思好難猜
        意林(2018年3期)2018-03-02 15:17:24
        基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于熵的快速掃描法的FNEA初始對(duì)象的生成方法
        區(qū)間對(duì)象族的可鎮(zhèn)定性分析
        基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
        女人一级特黄大片国产精品| 国产丝袜在线福利观看| 国产一级自拍av播放| 丝袜美腿制服诱惑一区二区| 色婷婷亚洲一区二区三区在线| 国产手机在线观看一区二区三区| 亚洲精品久久久久久久蜜桃| 好日子在线观看视频大全免费动漫| 天天摸日日摸狠狠添| 国产乱子伦精品免费女| 日本成人三级视频网站| 国产一级自拍av播放| 日韩中文字幕一区二区二区| 精品久久久bbbb人妻| 国产精品成人va在线观看| 人妻久久久一区二区三区| 亚洲日本中文字幕天天更新| 亚洲AV无码精品色欲av| 国产精品伦人视频免费看| 激情人妻网址| 色婷婷亚洲一区二区三区在线| 亚洲av日韩av激情亚洲| 色欲人妻aaaaaaa无码| 一本色综合久久| 日韩五十路| 日韩精品一区二区三区视频 | 久久国产亚洲AV无码麻豆| 一本大道久久精品一本大道久久| 久久精品一区二区三区不卡牛牛 | 小12箩利洗澡无码视频网站| 亚洲精品美女久久久久久久| 麻美由真中文字幕人妻| 中文字幕亚洲精品在线| 国产一区二区三区三区四区精品| 亚洲精品国偷拍自产在线| 人妻精品动漫h无码网站| 日韩久久久久中文字幕人妻| 国产精品麻豆A在线播放| 亚洲综合一区二区三区在线观看| 9久久婷婷国产综合精品性色| 成人欧美日韩一区二区三区|