亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        聚類分析算法在圖書(shū)管理系統(tǒng)中的應(yīng)用分析

        2017-11-06 13:33:01彭燕
        卷宗 2017年29期
        關(guān)鍵詞:圖書(shū)館

        彭燕

        摘 要:文章首先對(duì)聚類分析算法的含義進(jìn)行了簡(jiǎn)明扼要的概括,并對(duì)“聚類”、“簇”等聚類分析算法涉及的重點(diǎn)詞匯進(jìn)行了說(shuō)明,然后又介紹了聚類分析算法——K-均值算法,和以該算法為基礎(chǔ)所延伸出的改進(jìn)算法,最后通過(guò)理論與實(shí)際相結(jié)合的方式,以圖書(shū)、讀者這兩個(gè)圖書(shū)管理工作主體為切入點(diǎn),對(duì)圖書(shū)管理系統(tǒng)中聚類分析算法的實(shí)際應(yīng)用進(jìn)行了分析,希望本文所討論的內(nèi)容能夠在某些方面為圖書(shū)管理工作的開(kāi)展提供參考或幫助。

        關(guān)鍵詞:圖書(shū)館;聚類分析算法;圖書(shū)管理系統(tǒng)

        隨著科學(xué)技術(shù)的進(jìn)步,各圖書(shū)館在對(duì)圖書(shū)進(jìn)行管理時(shí)應(yīng)用的系統(tǒng)與之前相比也出現(xiàn)了相應(yīng)的變化,將聚類分析算法應(yīng)用其中已成為大勢(shì)所趨。通過(guò)實(shí)踐能夠發(fā)現(xiàn),在圖書(shū)管理系統(tǒng)中對(duì)聚類分析算法進(jìn)行合理應(yīng)用,不僅能夠?qū)ψx者前往圖書(shū)館的主要目的加以了解,還能夠以讀者需求為導(dǎo)向,對(duì)服務(wù)工作進(jìn)行相應(yīng)的優(yōu)化,除此之外,在采購(gòu)圖書(shū)資源時(shí),工作人員也具有了更加科學(xué)、系統(tǒng)的參考依據(jù)。由此可以看出,本文所研究課題具有一定的現(xiàn)實(shí)意義。

        1 聚類分析算法的概述

        作為數(shù)據(jù)挖掘領(lǐng)域應(yīng)用頻率極高的技術(shù)之一,聚類分析計(jì)算的關(guān)鍵在于“聚類”。聚類指的是將抽象或是物理對(duì)象集合轉(zhuǎn)化為由類似對(duì)象組成的簇的全過(guò)程;對(duì)作為數(shù)據(jù)對(duì)象集合而存在的簇而言,同一簇所包含的對(duì)象往往存在高度的一致性,不同簇所包含的對(duì)象則具有高度相異性,這是需要人們準(zhǔn)確掌握的內(nèi)容[1]。只有對(duì)上文所提及的內(nèi)容進(jìn)行了解和掌握,才能準(zhǔn)確、科學(xué)的應(yīng)用聚類分析算法,也才能保證對(duì)數(shù)據(jù)分布特征進(jìn)行深入的挖掘和掌握。

        現(xiàn)階段,聚類分析算法已經(jīng)被廣泛應(yīng)用在諸多領(lǐng)域中,例如,模式識(shí)別、圖像分割、數(shù)據(jù)挖掘等。在商務(wù)領(lǐng)域,聚類分析法主要被用于對(duì)客戶信息進(jìn)行分析,保證人們能夠發(fā)現(xiàn)潛在客戶群體,并在購(gòu)買模式的輔助下對(duì)客戶群體具有的特征進(jìn)行刻畫(huà)。除此之外,聚類分析算法還能夠被應(yīng)用在對(duì)挖掘算法進(jìn)行預(yù)處理的過(guò)程中,例如,人們可以應(yīng)用該法對(duì)某些數(shù)據(jù)進(jìn)行聚類,然后再以所得出結(jié)果為基礎(chǔ),開(kāi)展相應(yīng)的研究或是處理工作,保證工作質(zhì)量和效率均能夠得到應(yīng)有的提升。

        2 聚類分析算法——K-均值算法的概述

        2.1 K-均值算法

        作為聚類分析法中相對(duì)典型的劃分方法,K-均值算法的本質(zhì)為迭代聚類算法,通過(guò)在迭代過(guò)程中對(duì)簇集成員進(jìn)行不斷移動(dòng)的方式,保證理想簇集的得出。通過(guò)實(shí)踐能夠發(fā)現(xiàn),K-均值算法具有的優(yōu)勢(shì)主要體現(xiàn)在簡(jiǎn)單和快速這兩個(gè)方面。在應(yīng)用該法展開(kāi)計(jì)算時(shí),需要將對(duì)象劃分為n個(gè)簇,并保證每個(gè)簇所包含對(duì)象具有高度相似性,另外,不同簇所包含的對(duì)象應(yīng)當(dāng)具有高度相異性。但是通過(guò)實(shí)踐發(fā)現(xiàn),K-均值算法受初始值影響較大,也就是說(shuō),如果初始值不同,運(yùn)行效率也會(huì)隨之發(fā)生變化。因此,想要保證運(yùn)行效率的有效提升,相關(guān)人員以K-均值算法為基礎(chǔ)提出了相應(yīng)的改進(jìn)算法。

        2.2改進(jìn)算法

        通過(guò)對(duì)K-均值算法的應(yīng)用過(guò)程進(jìn)行分析能夠發(fā)現(xiàn),如果能夠在數(shù)據(jù)分布相對(duì)密集的區(qū)域中心處對(duì)初始聚類中心進(jìn)行選擇,那么,位于該中心周圍的數(shù)據(jù),便能夠被劃分至最近類當(dāng)中,聚類收斂的速度自然能夠得到提升,迭代次數(shù)也會(huì)因此而減少。也就是說(shuō),以數(shù)據(jù)分布特點(diǎn)為主要依據(jù),對(duì)初代聚類中心進(jìn)行選取是十分重要的。想要保證針對(duì)數(shù)據(jù)分布情況所開(kāi)展分析工作的全面性和科學(xué)性,必然需要花費(fèi)更多的時(shí)間。根據(jù)數(shù)據(jù)具有的隨機(jī)分布這一特點(diǎn)可以看出,聚類數(shù)據(jù)應(yīng)當(dāng)位于數(shù)據(jù)均值周圍,除此之外,對(duì)數(shù)據(jù)分布進(jìn)行評(píng)價(jià)需要應(yīng)用到的指標(biāo)還包括標(biāo)準(zhǔn)差,因此,改進(jìn)算法和K-均值算法最大的區(qū)別體現(xiàn)在對(duì)初始聚類中心進(jìn)行選取的方面,改進(jìn)算法在選取初始聚類中心時(shí),需要應(yīng)用到的數(shù)據(jù)包括均值和標(biāo)準(zhǔn)差。

        可根據(jù)實(shí)際情況在1……n的范圍內(nèi)進(jìn)行選取[2]。通過(guò)實(shí)踐能夠發(fā)現(xiàn),與K-均值算法相比,改進(jìn)算法在準(zhǔn)確率和計(jì)算效率方面都具有十分明顯的提升,因此,下文所開(kāi)展研究工作應(yīng)用的均為改進(jìn)后的聚類分析法。

        3 圖書(shū)管理系統(tǒng)中,聚類分析算法的實(shí)際應(yīng)用

        3.1 圖書(shū)數(shù)據(jù)的聚類分析

        在應(yīng)用聚類分析算法對(duì)圖書(shū)進(jìn)行聚類分析時(shí),需要應(yīng)用到的數(shù)據(jù)包括圖書(shū)流通總次數(shù)以及圖書(shū)當(dāng)年流通次數(shù),也就是說(shuō)在開(kāi)展相關(guān)分析工作前,工作人員首先需要對(duì)上述數(shù)據(jù)進(jìn)行調(diào)查。圖書(shū)聚類分析的結(jié)果能夠?qū)D書(shū)借閱頻率的高低進(jìn)行準(zhǔn)確、直觀的呈現(xiàn),工作人員便可以在此基礎(chǔ)上對(duì)符合圖書(shū)利用情況、讀者需求情況的決策進(jìn)行制定,并對(duì)館藏資源以及布局加以優(yōu)化。圖書(shū)聚類分析步驟具體如下:

        3.1.1對(duì)數(shù)據(jù)進(jìn)行預(yù)處理

        通過(guò)實(shí)踐能夠發(fā)現(xiàn),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理時(shí)需要花費(fèi)挖掘全過(guò)程約70%的成本和時(shí)間,由此可以看出,想要保證數(shù)據(jù)挖掘工作的高效開(kāi)展,關(guān)鍵在于對(duì)數(shù)據(jù)預(yù)處理工作的質(zhì)量和效率進(jìn)行提升。完整的數(shù)據(jù)預(yù)處理工作分為四個(gè)步驟,分別是數(shù)據(jù)的清洗、集成、轉(zhuǎn)換和消減。

        在應(yīng)用聚類分析法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理時(shí),需要工作人員對(duì)數(shù)據(jù)主要屬性進(jìn)行重點(diǎn)關(guān)注,正常情況下,主要屬性不應(yīng)當(dāng)出現(xiàn)空值的情況,若在實(shí)踐過(guò)程中發(fā)現(xiàn)有某些屬性出現(xiàn)空值,則需要參考挖掘內(nèi)容和表的屬性,及時(shí)對(duì)空值進(jìn)行相應(yīng)的填充。具體來(lái)說(shuō),在對(duì)圖書(shū)數(shù)據(jù)進(jìn)行聚類分析時(shí),需要應(yīng)用到的分析屬性包括圖書(shū)流通總次數(shù)以及圖書(shū)當(dāng)年流通次數(shù),如果圖書(shū)館中存在某些從未被讀者借閱過(guò)的圖書(shū),那么這兩個(gè)字段就為空值,在實(shí)際處理的過(guò)程中,工作人員應(yīng)當(dāng)用0對(duì)空值處進(jìn)行填充,保證工作的順利進(jìn)行[3]。除此之外,如果需要挖掘的數(shù)據(jù)分散于數(shù)據(jù)庫(kù)的不同表內(nèi),工作人員還需要對(duì)數(shù)據(jù)庫(kù)字段進(jìn)行整合,并形成完整的表,這樣做的目的在于保證運(yùn)行效率能夠得到一定程度的提高。

        3.1.2應(yīng)用聚類分析算法對(duì)圖書(shū)數(shù)據(jù)加以分析

        在對(duì)圖書(shū)數(shù)據(jù)進(jìn)行聚類分析前,工作人員首先需要對(duì)聚類個(gè)數(shù)進(jìn)行設(shè)置,在本文中,聚類個(gè)數(shù)被設(shè)置為3,分別代表具有較高利用率、中等利用率和較低利用率的圖書(shū),然后再應(yīng)用上文所介紹的改進(jìn)算法,針對(duì)圖書(shū)借閱次數(shù)展開(kāi)聚類挖掘工作,得出相應(yīng)的聚類情況和統(tǒng)計(jì)結(jié)果。此時(shí),工作人員便可以將聚類分析結(jié)果作為主要依據(jù),從3個(gè)聚類中對(duì)圖書(shū)群體存在的共性特征進(jìn)行分析,明確對(duì)圖書(shū)利用率產(chǎn)生影響的主要因素,為后續(xù)關(guān)聯(lián)規(guī)則的挖掘工作奠定良好基礎(chǔ)。endprint

        3.2 讀者數(shù)據(jù)的聚類分析

        在應(yīng)用聚類分析算法對(duì)讀者進(jìn)行聚類分析時(shí),需要應(yīng)用到的數(shù)據(jù)為讀者對(duì)圖書(shū)進(jìn)行借閱的次數(shù),也就是說(shuō),工作人員在掌握讀者借閱次數(shù)后,便可以開(kāi)展相應(yīng)的聚類分析工作。

        3.2.1對(duì)數(shù)據(jù)進(jìn)行預(yù)處理

        應(yīng)用聚類分析法對(duì)讀者數(shù)據(jù)進(jìn)行聚類分析的步驟與圖書(shū)數(shù)據(jù)分析相同,本文不再贅述,具體參考上文。

        3.2.2應(yīng)用聚類分析算法對(duì)讀者數(shù)據(jù)加以分析

        在對(duì)讀者數(shù)據(jù)進(jìn)行聚類分析前,工作人員同樣需要對(duì)聚類個(gè)數(shù)進(jìn)行設(shè)置,本文將聚類個(gè)數(shù)設(shè)置為3個(gè),分別代表了活躍讀者、一般讀者以及不活躍讀者,然后再通過(guò)對(duì)改進(jìn)算法加以應(yīng)用的方式,針對(duì)讀者所借閱圖書(shū)的數(shù)量展開(kāi)聚類挖掘工作,得出相應(yīng)的聚類情況和統(tǒng)計(jì)結(jié)果。通過(guò)對(duì)計(jì)算結(jié)果進(jìn)行分析能夠發(fā)現(xiàn),不同類型讀者的圖書(shū)利用情況存在著十分明顯的差別,此時(shí),工作人員便可以對(duì)原有的借閱標(biāo)準(zhǔn)進(jìn)行改進(jìn),增加活躍讀者能夠借閱的圖書(shū)數(shù)量,減少不活躍讀者能夠借閱的圖書(shū)數(shù)量,這樣做不僅能夠?qū)Σ煌x者具有的需求進(jìn)行最大限度的滿足,還可以在一定程度上使圖書(shū)利用率得到提升。

        除此之外,工作人員還可以將統(tǒng)計(jì)結(jié)果作為主要依據(jù),針對(duì)不同讀者制定相應(yīng)的服務(wù)計(jì)劃,對(duì)活躍讀者具有的借閱習(xí)慣進(jìn)行分析,并推薦符合活躍讀者需求的圖書(shū);對(duì)不活躍讀者則可以進(jìn)行相應(yīng)的問(wèn)卷調(diào)查,了解導(dǎo)致他們較少借閱圖書(shū)的原因和需求,在此基礎(chǔ)上對(duì)館藏資源進(jìn)行優(yōu)化,這樣做能夠使不活躍讀者的借閱次數(shù)得到相應(yīng)的增加。

        4 結(jié)論

        通過(guò)對(duì)上文所敘述的內(nèi)容進(jìn)行分析能夠看出,文中所應(yīng)用聚類分析算法是以K-均值算法為基礎(chǔ)所延伸出的改進(jìn)算法。將改進(jìn)后的算法應(yīng)用在對(duì)圖書(shū)進(jìn)行管理的系統(tǒng)中,能夠?qū)D書(shū)數(shù)據(jù)以及讀者數(shù)據(jù)進(jìn)行準(zhǔn)確、高效的聚類分析,工作人員則可以通過(guò)對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行分析的方式,了解圖書(shū)館內(nèi)現(xiàn)有圖書(shū)的利用率以及讀者的需求和愛(ài)好,再以此為基礎(chǔ)開(kāi)展相應(yīng)的圖書(shū)管理工作,則可以取得事半功倍的效果。

        參考文獻(xiàn)

        [1]丁麗,詹林,孫高峰,馬健.數(shù)據(jù)挖掘技術(shù)在高職院校圖書(shū)管理中的應(yīng)用[J].綏化學(xué)院學(xué)報(bào),2013,3306:121-125.

        [2]肖健,刁洪祥.聚類分析算法在數(shù)字圖書(shū)館中的應(yīng)用研究[J].當(dāng)代圖書(shū)館,2013,03:14-17.

        [3]張衛(wèi)東.基于多維度屬性權(quán)重優(yōu)化的FCM聚類算法的圖書(shū)管理數(shù)據(jù)聚類研究[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊,2016,2806:50-57.endprint

        猜你喜歡
        圖書(shū)館
        去圖書(shū)館坐坐
        圖書(shū)館
        圖書(shū)館里送流年
        圖書(shū)館
        文苑(2019年20期)2019-11-16 08:52:12
        夜間的圖書(shū)館
        幽默大師(2019年5期)2019-05-14 05:39:38
        圖書(shū)館里的小驚喜
        圖書(shū)館 Library
        時(shí)間重疊的圖書(shū)館
        文苑(2018年17期)2018-11-09 01:29:40
        圖書(shū)館
        飛躍圖書(shū)館
        亚洲av永久无码精品漫画| 国产激情久久久久久熟女老人| 亚洲欧美精品伊人久久| 国产免费一区二区三区在线观看| 女同性恋精品一区二区三区| 国产av天堂亚洲国产av麻豆| 黄片在线观看大全免费视频| 中文亚洲一区二区三区| 日本av一区二区三区在线| 色婷婷亚洲一区二区三区| 国产精品久久久| 亚洲精品国精品久久99热一| 免费毛片性天堂| 精品少妇后入一区二区三区| 精品中文字幕久久久人妻| 蜜桃在线视频一区二区| 亚洲精品偷拍自综合网| 午夜视频国产在线观看| 无码区a∨视频体验区30秒| 人妻丝袜av中文系列先锋影音| 亚洲国产长腿丝袜av天堂 | 国产免国产免费| 精品国产av 无码一区二区三区| 中文在线√天堂| 99久久精品国产自在首页| 国产自拍精品视频免费观看| 日韩肥臀人妻中文字幕一区| 人妻精品久久无码区| 亚洲色大成网站www永久一区| 亚洲av永久青草无码精品| 国产精品美女主播在线| 白白色发布的在线视频| 亚洲熟妇无码久久精品| 狠狠躁天天躁中文字幕| 亚洲精品国产成人| 无遮挡十八禁在线视频国产制服网站 | 精品久久久久久777米琪桃花| 欧美在线资源| 丁香九月综合激情| 日本免费大片一区二区三区| 亚洲av日韩精品久久久久久a|