亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)挖掘在保山學(xué)院圖書館中的個(gè)性化服務(wù)應(yīng)用研究

        2020-08-20 07:48:57李朋飛高艷兵劉榮虎王波
        現(xiàn)代經(jīng)濟(jì)信息 2020年11期
        關(guān)鍵詞:個(gè)性化服務(wù)高校圖書館數(shù)據(jù)挖掘

        李朋飛 高艷兵 劉榮虎 王波

        摘要:互聯(lián)網(wǎng)發(fā)展的速度非常之快,也導(dǎo)致了信息化的盛行,在高校圖書館這一方面,圖書館就積累了大量數(shù)據(jù),也導(dǎo)致了數(shù)據(jù)的冗余和駁雜,讀者需要更多的時(shí)間來查找信息,想要更方便就要促使高校圖書館優(yōu)化服務(wù)手段,形成符合圖書館的個(gè)性化服務(wù)。作者以保山學(xué)院圖書館個(gè)性化服務(wù)為研究對象,對國內(nèi)外圖書館的個(gè)性化服務(wù)研究,對比分析二者之間的優(yōu)缺點(diǎn);然后對個(gè)性化服務(wù)需要用到的數(shù)據(jù)挖掘技術(shù)進(jìn)行了系統(tǒng)的闡述,了解圖書館個(gè)性化服務(wù)的知識;其次對學(xué)校圖書館的個(gè)性化背景、問題和技術(shù)手段進(jìn)行分析;最后,以保山學(xué)院圖書館的借閱信息為挖掘?qū)ο?,進(jìn)行具體的分析,再根據(jù)數(shù)據(jù)挖掘的結(jié)果提出建議。

        關(guān)鍵詞:高校圖書館;個(gè)性化服務(wù);數(shù)據(jù)挖掘

        一、緒論

        發(fā)展至今,高校的圖書館存在著大量的圖書數(shù)據(jù)和用戶群體,圖書館每天都會(huì)產(chǎn)生大量的數(shù)據(jù)信息,隨著圖書館各種文獻(xiàn)的增加、資源的豐富、形式的多種多樣,讀者在獲取信息上面的問題也就從獲取困難轉(zhuǎn)移到選擇困難了,給圖書館開展服務(wù)帶來不良的影響。

        高校圖書館基本上以書籍為基礎(chǔ)來給讀者提供服務(wù),因?yàn)閳D書館龐大的書籍信息,使得讀者在圖書館中查詢信息的效率會(huì)很低,遠(yuǎn)不如直接從網(wǎng)上搜索來的方便快捷,就會(huì)導(dǎo)致讀者獲取信息的目標(biāo)從繁瑣的圖書館上面轉(zhuǎn)變到快捷的互聯(lián)網(wǎng)上面,使得圖書館的利用率逐漸減低。由此看來圖書館傳統(tǒng)服務(wù)已經(jīng)不能滿足讀者的需求了,高校圖書館的服務(wù)模式也應(yīng)該進(jìn)行轉(zhuǎn)變,從被動(dòng)向主動(dòng)轉(zhuǎn)變。圖書館個(gè)性化服務(wù)的提出打破了傳統(tǒng)的被動(dòng)服務(wù)的模式,能夠充分利用各種資源優(yōu)勢,主動(dòng)開展以滿足用戶個(gè)性化需求為目的的全方位服務(wù)[1]。

        二、數(shù)據(jù)挖掘在保山學(xué)院圖書館個(gè)性化服務(wù)中應(yīng)用現(xiàn)狀調(diào)查

        目前,大部分高校圖書館都在積極地引進(jìn)個(gè)性化服務(wù)系統(tǒng),對個(gè)性化服務(wù)系統(tǒng)的研究也還在繼續(xù),但個(gè)性化服務(wù)開展參差不齊,服務(wù)能力還有待提高。為了準(zhǔn)確了解讀者對信息的需求,對個(gè)性化服務(wù)的滿意程度,筆者以個(gè)性化服務(wù)相關(guān)方面的內(nèi)容向?qū)W校的讀者設(shè)計(jì)了問卷調(diào)查,本次調(diào)查共隨機(jī)發(fā)放問卷調(diào)查,回收了235份,并進(jìn)行分析。

        (一)讀者一周去圖書館的頻率

        對讀者一周去圖書館的頻率進(jìn)行分析,從得到的餅形圖中可以看出大部分讀者每周都會(huì)去1—3次,圖書館對師生是有一定的幫助的,也表明了圖書館的個(gè)性化服務(wù)對讀者們是有必要的。

        (二)是否了解個(gè)性圖書館的個(gè)性服務(wù)

        對讀者是否了解圖書館個(gè)性化服務(wù)進(jìn)行分析,從中可以看出很多讀者對于圖書館的個(gè)性化服務(wù)不是特別的了解,表明了學(xué)校圖書館對此的宣傳力度不是很大,個(gè)性化服務(wù)的使用不普遍。

        (三)讀者對個(gè)性化服務(wù)的需求情況

        對讀者是否需要個(gè)性化服務(wù)進(jìn)行分析,得知讀者對圖書館個(gè)性化服務(wù)是想去了解和使用的,當(dāng)然,也不排除其中有些人已經(jīng)接觸過個(gè)性化服務(wù),比如:圖書續(xù)借,新書推薦,參考咨詢等。

        (四)讀者對已開展個(gè)性化服務(wù)的滿意度

        對個(gè)性化服務(wù)是否滿意進(jìn)行分析,從中可以看書讀者對保山學(xué)院圖書館的個(gè)性化服務(wù)有過接觸,對其還是比較滿意的,可能還有些地方不夠完善。

        (五)讀者需要的服務(wù)種類

        讀者對個(gè)性化服務(wù)的要求分析,對于“需要什么樣的個(gè)性化服務(wù)”從問卷中篩選出有用的信息,從中可以看出讀者對圖書館個(gè)性化服務(wù)的要求還是多種多樣的,并不局限于某一種服務(wù)。

        三、數(shù)據(jù)挖掘在圖書館個(gè)性化服務(wù)中的實(shí)施

        (一)數(shù)據(jù)源選取

        搜集保山學(xué)院圖書館的圖書流通數(shù)據(jù)、學(xué)生信息、圖書信息等需要的數(shù)據(jù),可以通過網(wǎng)絡(luò)爬蟲軟件來搜集或者找圖書館的工作人員要一份圖書館的圖書流通數(shù)據(jù)和圖書信息。包含了讀者基本信息,借閱信息,圖書信息,選擇2015—2018四年的圖書館數(shù)據(jù),圖書信息有1 032 839條,借閱記錄870 388條,讀者信息記錄13 256條。

        (二)數(shù)據(jù)清洗和集成

        數(shù)據(jù)一般是不完整、不一致的,數(shù)據(jù)清理用來填充空缺的值,識別孤立點(diǎn),消除噪音,糾正數(shù)據(jù)中的不一致。在數(shù)據(jù)的處理和整合上可以利用SAS Data Mining和Pentaho等軟件工具。

        1.數(shù)據(jù)清洗。在清洗數(shù)據(jù)方面可以利用忽略該記錄,手動(dòng)填寫空缺值、默認(rèn)值、平均值,使用最可能的值,分箱、聚類、回歸等方法來清洗數(shù)據(jù)。

        2.數(shù)據(jù)集成。將讀者信息和借閱信息匯總成借閱次數(shù)表,從上面的數(shù)據(jù)中根據(jù)自己需要的內(nèi)容創(chuàng)建表,圖書借閱數(shù)目表包含書號、書名和借閱數(shù)量幾個(gè)字段,讀者借閱數(shù)目表包含借閱號、姓名、借閱數(shù)量、類型和院系結(jié)構(gòu)

        信息。

        (三)關(guān)聯(lián)算法

        關(guān)聯(lián)規(guī)則挖掘算法是關(guān)聯(lián)規(guī)則挖掘研究的主要內(nèi)容,其中Apriori算法是發(fā)現(xiàn)關(guān)聯(lián)規(guī)則領(lǐng)域的經(jīng)典算法。如算法過程下圖1表示,設(shè)事務(wù)數(shù)據(jù)D,利用算法篩選出最小支持度為2的項(xiàng)集。

        考慮到很多因素,本文將采用Apriori算法,具體的算法如下:

        1.L1={頻繁1項(xiàng)集};

        2.for (k=2;Lk-1≠φ;k++) do begin

        3.? ?Ck=apriori-gen(Lk-1);//產(chǎn)生新的候選項(xiàng)集

        4.? ?for 所以事務(wù) t∈D do begin

        5.? ? ? ?Ct=subset(Ck ,t);//t中所包含的候選k項(xiàng)集

        6.? ? ? ?for 所以候選 c∈Ct do.

        7.? ? ? ? ? ?C,count++;

        8.? end

        9.? Lk={ c∈Ck | c.count ≥minsup

        10.End

        11.結(jié)果=∪kLk [2]

        (四)聚類算法

        在聚類算法中選擇K-Means算法。它也稱為k-平均算法,是一種常用的基于劃分的聚類方法,用來根據(jù)樣本屬性值之間的相似度來對樣本進(jìn)行分組。在聚類方面采用K-Means算法建立挖掘模型,對讀者進(jìn)行細(xì)分,定義式見(3-1):

        (1)

        這里的E是數(shù)據(jù)庫所以對象的平方誤差的總和,x是空間中的點(diǎn)表示給定的數(shù)據(jù)對象,是簇Ci的平均值。k-平均算法的算法描述。

        輸入:簇的數(shù)目k和包含n個(gè)對象的數(shù)據(jù)庫,

        輸出:k個(gè)簇,是平方誤差準(zhǔn)則最小

        1.assign initial value for means;//任意選擇k個(gè)對象作為初始的簇中心

        2.REPEAT

        3.FOR j=1 to n DO assign each xj to the cluster which has the closest mean;//根據(jù)簇中對象的平均值,將每個(gè)對象賦給最類似的簇

        4.FOR i=1 to k DO ;//更新簇的平均值,即計(jì)算每個(gè)對象簇中對象的平均值

        5.Compute ; //計(jì)算準(zhǔn)則函數(shù)E

        6.UNTIL E不再明顯變化[3]

        (五)基于聚類對讀者的細(xì)分

        從學(xué)校圖書館的數(shù)據(jù)庫中可以知道,借閱記錄中都有這些信息:讀者證、借閱數(shù)量、借閱圖書、讀者信息等。因此對讀者可以這樣細(xì)分:一是利用聚類挖掘?qū)D書館全部讀者的信息細(xì)分出來,進(jìn)行分組;二是將讀者的興趣和借閱情況進(jìn)行聚類挖掘,在從得到的聚類結(jié)果中分析出聚類中的共同點(diǎn),以此來建立讀者借閱模式。

        1.借閱情況聚類。筆者將聚類數(shù)k定為4,讀者細(xì)分成4個(gè)大類,生均借閱為60、25、12、5本,總共13 256位學(xué)生記錄,其中類1占了13.5%,利用率在45.12%;類2占20.2%,利用率為25.25%;類3占26.2%,利用率為19.61%;類4占40.1%,利用率為10.2%。從這個(gè)結(jié)果可以知道有五分之二多的學(xué)生年均借閱不足五本,總體上來說,學(xué)生對圖書館資源的利用率低。

        2.讀者喜好、信息聚類。將讀者的信息和借閱喜好通過聚類分析出用戶在總體上借閱的興趣,將具有相似興趣的讀者進(jìn)行分類,劃分出不同讀者相同愛好的類別,有針對性的提供個(gè)性化信息服務(wù),從部分讀者借閱信息表和部分借閱事務(wù)數(shù)據(jù)表中可以看出,學(xué)生在圖書館借書基本上都是借與專業(yè)相關(guān)的圖書,對其它的圖書都不感興趣,這樣就比較簡單了,將組內(nèi)讀者的借閱信息進(jìn)行關(guān)聯(lián)挖掘,找出里面的規(guī)則,形成一個(gè)整體的信息庫,向讀者提供個(gè)性化推薦服務(wù)。

        (六)關(guān)聯(lián)規(guī)則的挖掘

        關(guān)聯(lián)規(guī)則挖掘?qū)ふ医o數(shù)據(jù)庫中不同項(xiàng)之間的聯(lián)系,將讀者的全部信息當(dāng)作關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)源對讀者進(jìn)行分類,再找出每個(gè)類中產(chǎn)生的借閱信息之間的聯(lián)系,對讀者實(shí)行規(guī)則推薦。

        1.圖書的關(guān)聯(lián)分析。圖書的關(guān)聯(lián)分析主要是對讀者的借閱信息進(jìn)行分析,也就是找到讀者借過的圖書中存在的聯(lián)系。采用的是Apriori算法。

        由頻繁項(xiàng)集產(chǎn)生的規(guī)則,每個(gè)規(guī)則都自動(dòng)滿足最小支持度,是形如AB的蘊(yùn)涵式,其中A∩B=φ。支持度S和置信度C的定義式為(3-2)(3-3):

        S(AB)=P(A∪B) (2)

        C(AB)= P(B | A)(3)

        2.讀者所借圖書類別關(guān)聯(lián)挖掘。將最小支持度設(shè)為70%,最小置信度為70%;挖掘圖書類別,得到挖掘結(jié)果,比如:關(guān)聯(lián)規(guī)則C→I,P表示讀者借閱C類圖書的同時(shí)有72.49%的概率借了I和O類圖書,置信度也在70%以上,還是比較準(zhǔn)確的,從計(jì)算出的結(jié)果來看,將舍棄那些支持度小的結(jié)果。將支持度和置信度高的書籍放在一起可以方便管理和學(xué)生的查找,也可以在學(xué)生搜索某類書籍的時(shí)候向他推薦規(guī)則中的另一類書籍,滿足個(gè)性化的推薦。

        (七)改善圖書館個(gè)性化服務(wù)的建議

        數(shù)據(jù)挖掘后可以知道,一是圖書館應(yīng)該加強(qiáng)與學(xué)生的聯(lián)系,在表中學(xué)生對于圖書館的利用率極低,里面的書籍對學(xué)生幫助不大,四年來甚至有些同學(xué)沒去過圖書館,現(xiàn)在更多的學(xué)生只是利用圖書館提供的瀏覽室和自習(xí)室學(xué)習(xí)自己的東西,圖書館也失去了提供知識的意義。應(yīng)該構(gòu)建學(xué)生個(gè)人信息數(shù)據(jù)庫,根據(jù)讀者的專業(yè),愛好為其提供知識,將學(xué)生的興趣引入挖掘算法中,生成規(guī)則,建立模型,提高圖書館對學(xué)生和學(xué)校的作用。二是當(dāng)某類借閱頻率的支持度滿足最小支持度時(shí),學(xué)生借了一本書,根據(jù)支持度和置信度形成的規(guī)則模型,系統(tǒng)向其推薦另一本圖書,最大化地滿足學(xué)生的需求,提高館藏利用率。三是從表中得知學(xué)生是什么專業(yè)的就借什么樣的書,其他的書籍學(xué)生并不感興趣,圖書館館藏資源利用率低,圖書館在宣傳方面力度也不夠,現(xiàn)在開展了保山學(xué)院數(shù)字圖書館,但是有很多學(xué)生卻不知道有這個(gè)東西,依然以為保山學(xué)院還是傳統(tǒng)的信息服務(wù),這方面要重視推廣。四是建立一個(gè)評論模塊,學(xué)生在接受平臺(tái)服務(wù)的時(shí)候遇到問題,可以對平臺(tái)做出評價(jià),讓圖書館的個(gè)性化服務(wù)不斷地

        優(yōu)化。

        四、結(jié)語

        信息技術(shù)的發(fā)展使得圖書館的數(shù)據(jù)大量增長,這樣個(gè)性化服務(wù)應(yīng)用在圖書館中也是必然的了,它的優(yōu)點(diǎn)在于可以有針對性的為讀者提供服務(wù)。所以圖書館就要利用數(shù)據(jù)挖掘技術(shù),挖掘分析圖書館中借閱信息。本文首先對保山學(xué)院圖書館的個(gè)性化服務(wù)現(xiàn)狀做了了解,找出它的優(yōu)點(diǎn)和缺點(diǎn),其次就是將用戶的信息聚類分析,把類似的數(shù)據(jù)分成一組,建立模型,將每組的信息關(guān)聯(lián)挖掘,找出它們聯(lián)系,再根據(jù)得到的結(jié)果,為讀者提供個(gè)性化服務(wù)。在圖書館中構(gòu)造個(gè)性化服務(wù),有助于圖書館的信息管理,了解讀者的信息,方便讀者的借閱效率,還可以讓圖書館針對讀者借書的情況來擴(kuò)充館藏;并且可以優(yōu)化圖書館的服務(wù)模式。

        參考文獻(xiàn):

        [1]李靈芝.數(shù)據(jù)挖掘在圖書館個(gè)性化服務(wù)中的應(yīng)用研究[D].長春:吉林大學(xué)碩士論文,2014.

        [2]邵峰晶,于忠清,王驚龍,孫仁誠.數(shù)據(jù)挖掘原理與算法 [M].北京:科學(xué)出版社, 2009:96.

        [3]毛國軍,段立娟,王實(shí),石云.數(shù)據(jù)挖掘原理與算法 [M].北京:清華大學(xué)出版社, 2005,7:164-165.

        猜你喜歡
        個(gè)性化服務(wù)高校圖書館數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        淺析移動(dòng)時(shí)代的圖書館發(fā)展策略
        互聯(lián)網(wǎng)思維下數(shù)字圖書館個(gè)性化服務(wù)建設(shè)研究
        需求理論在高校圖書館就業(yè)服務(wù)中的應(yīng)用研究
        高校圖書館閱讀推廣案例分析
        科技視界(2016年21期)2016-10-17 19:32:37
        微信公眾平臺(tái)在高校圖書館信息服務(wù)中的應(yīng)用研究
        科技視界(2016年21期)2016-10-17 19:25:20
        高校圖書館閱讀推廣實(shí)踐探討
        科技視界(2016年20期)2016-09-29 13:17:57
        高校圖書館電子資源的宣傳與推廣
        科技視界(2016年20期)2016-09-29 11:22:45
        大數(shù)據(jù)對高校圖書館個(gè)性化服務(wù)的影響
        科技視界(2016年10期)2016-04-26 10:14:33
        亚洲一区二区欧美色妞影院| 精品国产一区二区三区av性色| 中文字幕免费在线观看动作大片| 亚洲国产美女精品久久久久∴| 久久99精品国产麻豆| 996久久国产精品线观看| 玖玖资源站无码专区| 亚洲av毛片一区二区久久| 丝袜美腿在线观看一区| 中文字幕在线日亚州9| 性色av无码不卡中文字幕| 日本色偷偷| 亚洲影院在线观看av| 丝袜美腿制服诱惑一区二区| 国产在线一区二区三区四区 | 国产精品自在拍在线拍| 久久国产精品二区99| 亚洲电影一区二区| 国产精品国产三级在线专区| 青青草手机免费播放视频| 亚洲欧洲免费无码| 少妇扒开毛茸茸的b自慰| 人体内射精一区二区三区| 人妻少妇喷水意淫诱惑| 一区二区三区日本视频| 日本一区二区精品高清| 骚片av蜜桃精品一区| 亚洲一区二区三区偷拍女厕| 久久精品国产av大片| 91久久综合精品久久久综合 | 久久人妻AV无码一区二区| 无码高潮少妇毛多水多水免费 | 国产av在线观看91| 免费看黄色亚洲一区久久| 粉嫩被粗大进进出出视频| 成人无码视频| 亚洲高清视频在线播放| 日本午夜艺术一区二区| 久久久久免费看成人影片| 18禁高潮出水呻吟娇喘蜜芽| 韩国无码精品人妻一区二|