亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Apriori算法在高校圖書(shū)館圖書(shū)推薦中的應(yīng)用

        2012-02-05 09:47:06陳錦吳揚(yáng)揚(yáng)
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)庫(kù)

        陳錦,吳揚(yáng)揚(yáng)

        (1.華僑大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,福建泉州362000;2.泉州經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院信息系,福建泉州362000)

        隨著高校學(xué)生數(shù)量的不斷增多,圖書(shū)館的藏書(shū)量也相應(yīng)地劇增,為了讓學(xué)生從浩瀚的館藏資源中快速找到自己所需的圖書(shū),圖書(shū)館工作模式應(yīng)該變“被動(dòng)”為“主動(dòng)”,可通過(guò)數(shù)據(jù)挖掘技術(shù)來(lái)挖掘大量的圖書(shū)借閱記錄,主動(dòng)向?qū)W生推薦圖書(shū).關(guān)聯(lián)規(guī)則用于分析隱藏在大量數(shù)據(jù)集中令人感興趣的聯(lián)系[1].Apriori算法是關(guān)聯(lián)規(guī)則的經(jīng)典算法,該算法的主要思想是首先尋找給定數(shù)據(jù)集中的頻繁項(xiàng)集,然后通過(guò)頻繁項(xiàng)集生成強(qiáng)關(guān)聯(lián)規(guī)則[2].

        1 Apriori算法

        一個(gè)事物數(shù)據(jù)庫(kù)中的關(guān)聯(lián)規(guī)則可以描述如下:

        設(shè)I={I1,I2,……In}是項(xiàng)的集合,D是任務(wù)相關(guān)數(shù)據(jù)數(shù)據(jù)庫(kù)事務(wù)的集合,TID作為每個(gè)事務(wù)的標(biāo)識(shí)符,每個(gè)事務(wù)T對(duì)應(yīng)I上的子集.設(shè)A是項(xiàng)集,事務(wù)T包含A當(dāng)且僅當(dāng)A?T.關(guān)聯(lián)規(guī)則是形如A?B的蘊(yùn)涵式,其中A?I ,B?I,A∩B=?.規(guī)則A?B在事務(wù)D中成立,具有支持度s,其中s是D中事務(wù)包含的百分比.規(guī)則A?B在事務(wù)D中具有置信度c,其中c是D中包含A的事務(wù)同時(shí)也包含B的百分比[3].即Suppor(tA?B)=P(A∪B),Confidence(A?B)=P(B|A).

        Apriori算法將關(guān)聯(lián)規(guī)則挖掘分解為兩個(gè)子問(wèn)題:

        (1)找到頻繁項(xiàng)集,即所有支持度大于最小支持度的項(xiàng)集;

        (2)使用第一步找到的頻繁項(xiàng)集找到強(qiáng)關(guān)聯(lián)規(guī)則即D在I上滿足最小置信度.

        在實(shí)際應(yīng)用中,發(fā)現(xiàn)Apriori算法存在如下一些主要的缺陷[4]:

        (1)需多次掃描事務(wù)數(shù)據(jù)庫(kù);

        (2)不適用于稠密集的關(guān)聯(lián)規(guī)則挖掘;

        (3)可能生成的關(guān)聯(lián)規(guī)則過(guò)于龐大.

        2 Apriori算法在圖書(shū)推薦中的應(yīng)用

        圖書(shū)推薦服務(wù)在圖書(shū)館個(gè)性化服務(wù)中非常重要,它既能提高用戶的滿意度,又可以讓信息得到更好的利用.傳統(tǒng)的Apriori算法需要對(duì)借閱借閱數(shù)據(jù)庫(kù)大量的掃描,所以算法的運(yùn)行效率低下.通過(guò)對(duì)讀者借閱數(shù)據(jù)的研究,發(fā)現(xiàn)大部分讀者在一次特定的借閱中,往往只會(huì)借閱某一類別的圖書(shū),通過(guò)傳統(tǒng)Apriori算法對(duì)借閱數(shù)據(jù)進(jìn)行挖掘后發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的左部和右部均為同類圖書(shū)的關(guān)聯(lián)規(guī)則占總挖掘關(guān)聯(lián)規(guī)則的90%以上[5].

        按照上述圖書(shū)借閱的特點(diǎn),在應(yīng)用Apriori算法挖掘數(shù)據(jù)前,先按照《中圖法》對(duì)圖書(shū)進(jìn)行分類,根據(jù)圖書(shū)分類號(hào)將借閱數(shù)據(jù)庫(kù)分為若干個(gè)子借閱數(shù)據(jù)庫(kù),每個(gè)子借閱數(shù)據(jù)庫(kù)都只包含某一分類的圖書(shū),然后再進(jìn)行挖掘,可減少時(shí)間的開(kāi)銷.

        3 實(shí)例說(shuō)明

        3.1 數(shù)據(jù)源

        從某學(xué)院的圖書(shū)館自動(dòng)化系統(tǒng)中導(dǎo)出讀者借閱記錄表lt_gck,學(xué)生基本信息表lt_reader,圖書(shū)信息表ydcc 3個(gè)EXCEL文件,將其導(dǎo)入到SQLSERVER2005中.

        3.2 數(shù)據(jù)的預(yù)處理

        (1)對(duì)表進(jìn)行連接,獲取所需分析的字段.對(duì)上述3個(gè)表進(jìn)行連接操作并創(chuàng)建視圖,將得到的視圖導(dǎo)入到數(shù)據(jù)庫(kù)中,得到最終可分析的數(shù)據(jù)表;

        (2)將第一步得到的表中續(xù)借的借閱記錄進(jìn)行刪除,由于借閱次數(shù)較少的學(xué)生借閱記錄比較沒(méi)有參考價(jià)值,所以這里只篩選出借閱次數(shù)≥5次的學(xué)生借閱記錄;

        (3)按照《中圖法》,將借閱記錄按照借閱的圖書(shū)類型,分成不同圖書(shū)類型的借閱記錄庫(kù),每個(gè)庫(kù)只含有同一類型書(shū)籍的借閱記錄.這里選取讀者借閱計(jì)算機(jī)技術(shù)類型書(shū)籍的記錄并只取“讀者號(hào)”和“索引號(hào)”兩個(gè)字段進(jìn)行分析,所以將索書(shū)號(hào)以“TP3”字符開(kāi)頭的記錄篩選出獨(dú)立成一個(gè)數(shù)據(jù)表.

        3.3 Apriori算法的應(yīng)用

        從對(duì)借閱記錄的觀察,發(fā)現(xiàn)要關(guān)聯(lián)規(guī)則到兩本具體的書(shū)籍很難,基本上很少有讀者借閱兩本一模一樣的書(shū)籍(書(shū)名,作者,出版社完全相同),而且也不切合實(shí)際,可能兩個(gè)讀者都借閱了數(shù)據(jù)結(jié)構(gòu)和C語(yǔ)言的書(shū)籍,但可以要求是不同作者,不同出版社的.所以從上述觀點(diǎn)考慮,這里我們只關(guān)聯(lián)到具體類別的書(shū)籍,比如數(shù)據(jù)結(jié)構(gòu)和C語(yǔ)言書(shū)籍之間是否有關(guān)聯(lián).若要推薦到具體一本圖書(shū)的話,可選擇推薦類別中借閱次數(shù)最高的圖書(shū)進(jìn)行推薦.將預(yù)處理過(guò)的數(shù)據(jù)表進(jìn)行轉(zhuǎn)換成表1這種可分析的形式.

        表1 借閱記錄Tab.1 Library record

        為了書(shū)寫(xiě)的方便,這里用I1,I2,……代表不同類別的索書(shū)號(hào),比如I1代表TP316.7,I2代表TP391.41,以此類推,得到表2.

        表2 借閱記錄事務(wù)Tal.2 Libraryrecord transaction

        關(guān)聯(lián)規(guī)則的挖掘工作也分為2步:頻繁項(xiàng)集的挖掘和關(guān)聯(lián)規(guī)則的產(chǎn)生[6].

        (1)頻繁項(xiàng)集的挖掘.就是要從事務(wù)數(shù)據(jù)表中,發(fā)現(xiàn)滿足最小支持度的頻繁項(xiàng)集.首先,假設(shè)最小支持?jǐn)?shù)為40%,得到頻繁1項(xiàng)集L1,如下表3所示.

        表3 頻繁項(xiàng)集Tal.3 Frequent itemset

        把所生成的L1相互進(jìn)行連接并生成候選頻繁2項(xiàng)集L2{(I2,I11),(I11,I12},(I11,I13),(I11,I15),(I12,I15)}以此類推,直到候選集為空,算法停止,得到所有的頻繁項(xiàng)目集為{I2,I11,I12,I13,I15,(I2,I11),(I11,I12),(I11,I13),(I11,I15),(I12,I15),(I11,I12,I13)}.

        (2)關(guān)聯(lián)規(guī)則的產(chǎn)生.找出所有頻繁項(xiàng)集之后,即可進(jìn)行第2步,找出其中滿足最小置信度要求的強(qiáng)關(guān)聯(lián)規(guī)則.假設(shè)取置信度為80%,可得到下表4數(shù)據(jù).

        表4 數(shù)據(jù)結(jié)果Tal.4 Data result

        從產(chǎn)生的關(guān)聯(lián)規(guī)則中看出:①可以給借閱過(guò)TP311.138FO(visual Foxpro),TP312C(C語(yǔ)言程序)這兩個(gè)類別書(shū)籍的學(xué)生推薦TP368.1(單片機(jī))類別的書(shū)籍;②可以給借閱過(guò)TP311.138FO(visual Foxpro),TP368.1(單片機(jī))這兩個(gè)類別書(shū)籍的學(xué)生推薦TP312C(C語(yǔ)言程序)類別的書(shū)籍;③可以給借閱過(guò)TP312C(C語(yǔ)言程序)這類書(shū)籍的學(xué)生推薦TP311.138FO(visual Foxpro)類別的書(shū)籍;④可以給借閱過(guò)TP368.1(單片機(jī))類別書(shū)籍的學(xué)生推薦TP311.138FO(visual Foxpro)類別的書(shū)籍;⑤可以給借閱過(guò)TP311.56(DELPHI)類別書(shū)籍的學(xué)生推薦TP311.138FO(visual Foxpro)或者TP312C(C語(yǔ)言程序)兩類的書(shū)籍.

        4 小結(jié)

        通過(guò)對(duì)借閱記錄庫(kù)先按照?qǐng)D書(shū)的類型分成若干個(gè)數(shù)據(jù)庫(kù)再應(yīng)用Apriori算法,可以提高挖掘的效率,減少內(nèi)存的占用.在篩選記錄時(shí),篩選出那些借閱次數(shù)比較多的學(xué)生的借閱記錄進(jìn)行挖掘,比如可規(guī)定借閱次數(shù)>5的學(xué)生記錄,可以使挖掘結(jié)果更具參考價(jià)值.而且,按照不同級(jí)別圖書(shū)分類號(hào)對(duì)記錄分類,所產(chǎn)生的挖掘效果也有很大的不同,選取圖書(shū)分類號(hào)的級(jí)別時(shí),要注意不宜過(guò)大或過(guò)小,過(guò)大會(huì)產(chǎn)生很多無(wú)關(guān)的關(guān)聯(lián)規(guī)則,過(guò)小則產(chǎn)生的關(guān)聯(lián)規(guī)則太少.

        [1] 康敏旸,張安.改進(jìn)的Apriori數(shù)據(jù)挖掘算法的應(yīng)用[J].火力與指揮控制,2009,34(10):111-114.

        [2] 黃鶴.關(guān)聯(lián)規(guī)則算法綜述[J].軟件導(dǎo)刊,2009,8(3):56-58.

        [3] 劉靜.數(shù)據(jù)挖掘算法在書(shū)目推薦系統(tǒng)中的應(yīng)用研究[D].鄭州:鄭州大學(xué),2011.

        [4] 鮑靜.關(guān)聯(lián)規(guī)則挖掘及其在圖書(shū)流通數(shù)據(jù)中的應(yīng)用研究[D].合肥:合肥工業(yè)大學(xué),2007.

        [5] 林郎碟,王燦輝.Apriori算法在圖書(shū)推薦服務(wù)中的應(yīng)用與研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21(5):22-24.

        [6] 雷蕾.基于關(guān)聯(lián)規(guī)則的個(gè)性化圖書(shū)推薦研究[J].情報(bào)探索,2011(1):49-50.

        猜你喜歡
        關(guān)聯(lián)規(guī)則數(shù)據(jù)庫(kù)
        撐竿跳規(guī)則的制定
        “苦”的關(guān)聯(lián)
        數(shù)獨(dú)的規(guī)則和演變
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        數(shù)據(jù)庫(kù)
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        国产乱码人妻一区二区三区| 国产高清黄色在线观看91| 亚洲天堂av在线免费看| 精品国产一区二区三区av天堂| 玩弄丰满奶水的女邻居 | 久久艹影院| 中文字幕乱码亚洲无线| 日本人妻精品有码字幕| 中文字幕中文有码在线| 久久亚洲av成人无码国产 | 亚洲成人免费久久av| 中文字幕一区二区人妻秘书| 日韩欧美人妻一区二区三区| 久久综合色鬼| 亚洲av性色精品国产| 国产在线播放一区二区不卡| 人妻丰满熟妇av无码区hd| 亚洲国产成人无码影院| 18禁成人免费av大片一区| 中国国产不卡视频在线观看| 国产精品无码午夜福利| 国产精品欧美久久久久老妞| 亚洲男人在线天堂av| 亚洲av无码成人精品国产| 国产精品人妻一码二码尿失禁| 欧美精品一区二区精品久久| 人妻熟女中文字幕av| 亚洲av乱码一区二区三区林ゆな| 国内a∨免费播放| 亚洲av午夜成人片精品| 国产激情综合五月久久| 精品无码国产一区二区三区av| 国产午夜精品电影久久| 国产免费99久久精品| 狠狠躁天天躁无码中文字幕图| 国产成人无码免费看片软件| WWW拍拍拍| 麻豆久久91精品国产| 无码国产福利av私拍| www插插插无码视频网站| 成人性生交大片免费看i|