亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用次序技術發(fā)掘讀者個人化書籍推薦

        2014-04-29 00:00:00李明
        計算機光盤軟件與應用 2014年9期

        摘 要:對于讀者在不同時間下借閱過之書籍項目,往往也反映出書籍被借閱的次序性,其可能顯示讀者在需求上或是書籍專業(yè)上的次序性。在此章節(jié)中,我們以讀者之借閱資料為探勘的數(shù)據(jù)源,每一筆借閱數(shù)據(jù)包含有曾經(jīng)借閱過的書籍項目,其中的書籍項目都依借閱的時間事先排序過,并以某一讀者為探勘的目標,利用數(shù)據(jù)探勘技術做為發(fā)掘具有借閱次序之讀者個人化的書籍推薦的依據(jù)。

        關鍵詞:次序;技術;發(fā)掘;讀者;書籍;推薦

        中圖分類號:TP311.13

        1 次序名詞定義

        其實所謂的次序,我們常用比較廣泛的說法也就是時間順序,就如同本文所使用的圖書館推薦系統(tǒng),它包含了讀者的借閱次序,而我們此研究提出了兩個次序方法,也就是利用讀者的借閱時間順序與借閱次數(shù),并依照借閱時間順序或者借閱次數(shù)高低,如果讀者想要探勘出他借閱次數(shù)時間順序或者借閱次數(shù)最高的書籍,那就可以利用次序去分析與探勘,并達到更進一步的推薦方法。

        1.1 次序

        為有次序性之k個項目組所組成的集合,k≥1,當中以sequencek表示之,例如某讀者先借閱A書籍與C書籍,然后再借閱B書籍、D書籍與E書籍,則以(AC,BDE)來表示一個次序,任何一讀者有次序性之借閱數(shù)據(jù)可視為一次序,但又有另一方法,那就是當讀者借閱A書籍為3次,B書籍3次,C書籍2次,那我們就可以列出(A=3,B=3)以A和B借閱次數(shù)為最高次數(shù)為3下去做推薦判別,也就是以A書籍和B書籍所借閱之關聯(lián)數(shù)據(jù)去做推薦其他同類型關聯(lián)的書籍,多出一個讀者使用推薦系統(tǒng)的方法與選擇,達到最有效率的效果。

        1.2 次序支持度

        包含有某一次序之事務數(shù)據(jù)的數(shù)量/全部事務數(shù)據(jù)的數(shù)量。若某一次序的支持度大于或等于最小次序支持度,則稱之為最大次序,一大次序若包含有k個項目組,則稱為大k-次序,以Lsequencek表示之,也就是書籍相似度,我們可以稱為次序支持度,但是這個常常會影響到一個探勘出來的準確度,所以我們常常會考慮是否將此支持度加入系統(tǒng)以防止準確度降低。

        2 發(fā)掘讀者個人化之書籍推薦

        我們可以知道有關探勘可以分出好幾種方法去作研究探勘,而傳統(tǒng)的關聯(lián)規(guī)則只考慮其項目是否出現(xiàn)在此集合中或者是否符合此集合,但并未考慮項目出現(xiàn)的次序性,畢竟借閱次序往往是包含了借閱時間的前后關系。次序分析是在一群有次序的數(shù)據(jù)集合中,找出其中時常出現(xiàn)的次序關系,也就是我們先前所提到的次序型樣,藉此可分析出讀者是否有次序性的借閱行為,其特點則是每個集合中的每個項目前后關系為識別的特征之一,也就是型樣中的項目之間是含有次序性,所以我們可以知道當我們在尋找次序時,會有一個用以決定項目先后次序的衡量方式,如時間因素,所有的項目或項目集合依據(jù)該衡量方式做次序排列,而我們要進一步的去尋找次序關系就是要在這些有關次序資料中,找出有趣的探勘規(guī)則。

        舉例來說,當某讀者在昨天下午2點借閱了A書籍,又再昨天下午5點借閱了B、C兩本書籍,在昨天晚上7點又借閱了D書籍,經(jīng)過排序與分析所有讀者的借閱數(shù)據(jù)之后,如果ACD是找出的次序型樣,表示讀者在借閱了A書籍之后,會有借閱C、D書籍的傾向。假設欲探勘之讀者的借閱數(shù)據(jù)為,為一次序,根據(jù)次序的定義,我們必須找出以下形式的最大次序:

        從上面定義可以再一次討論借閱傾向為:若讀者曾經(jīng)借閱過書籍,則接下來也會有借閱書籍的傾向。由于 ,表示最大次序與此一讀者具有相關性,且若愈相似于,則最大次序的相關性愈強,其借閱的傾向性也愈強。因此,藉由最大次序的傾向性,可做為發(fā)掘具有借閱次序之此一讀者個人化之書籍推薦的依據(jù)。

        而從上面依據(jù)來看,為了配合探勘的需要及避免計算與無關的項目包括進來,而修改次序相關算法的步驟,直接將中之項目組合與非中之項目而形成的項目中去作改良,并判斷這些項目組是否為大次序,擷取的過程說明如下:

        (1)從最初對所有讀者之借閱數(shù)據(jù)中的書籍項目中,依借閱時間做遞增或遞減的方式排序。

        (2)從中及非中找出序列1(Lsequence1),且必須至少各包含一個項目。

        (3)從(2)中組合兩個序列1(Lsequence1)形成序列2(Lsequence2),其中前面項目 ,而后面項目 。

        (4)找出Lsequencek-1,k>2。

        (5)由(4)中排列組合任兩個有k-2項目相同的Lsequencek-1,形成sequencek且其中前面項目 。

        (6)判斷由(5)所找出的sequencek其所有包括的sequencek-1之子集合是否都出現(xiàn)在(4)中,若sequencek-1∩= 、或sequencek-1∩非= ,則不列入考慮,假如成立就保留此sequencek,否則就刪除。

        (7)再檢查由(6)所擷取的sequencek是否滿足最小次序支持度,假如符合就成為Lsequencek,否則就刪除。

        (8)跳至(4)找Lsequencek+1,直到無法產(chǎn)生大次序為止。

        (9)確認Lsequencek之最大化,即若一大次序包含于另一大次序中,則刪除掉。

        從以上算法的(3)步驟開始,我們所擷取出的sequencek,其型樣必定為 ,表示與此一讀者之借閱資料有關聯(lián)性,且在(5)步驟中所排列組合形成的sequencek,可以產(chǎn)生不同的項目次序關系。

        因此我們計算出最大次序所形成的型樣,做成以下的定義:藉由最大次序所顯示出的借閱傾向關系,為具有借閱次序之此一讀者最適性的書籍推薦,且愈相似于,則借閱的傾向關系也愈強,也就是當讀者借閱X書籍后,之后所借閱的W書籍則是與X書籍有關聯(lián)性,那V書籍我們就可以做為具有借閱次序之個人化之書籍推薦之一。

        3 實例說明

        我們以表1的借閱數(shù)據(jù)庫D3來進行分析,當我們設定K={A,B,C,D,E}為所有書籍項目的集合,則設定S={S1,S2,S3,S4}為4筆讀者之借閱數(shù)據(jù)的集合。假設目前欲探勘之讀者為S4,可以知道其借閱數(shù)據(jù)為,以下我們說明發(fā)掘具有借閱次序之此一讀者最適性書籍推薦的探勘過程。

        而我們可以擷取與有相關之大次序的過程。

        刪除被包含于其他大次序的大次序,我們以最大次序為例,其所顯示出的傾向特征,因為讀者R4本身借閱數(shù)據(jù)為,因此可發(fā)掘出具有借閱次序之讀者R4個人化最適性的書籍推薦為。

        參考文獻:

        [1]張海營.圖書館個性化電子期刊訂閱[J].情報雜志,2011(06).

        作者簡介:李明(1982-),男,廣西賀州人,助教,學士學位,研究方向:圖書館現(xiàn)代化管理。

        作者單位:賀州學院,廣西賀州 542899

        成人综合激情自拍视频在线观看| 国产成人麻豆精品午夜福利在线 | 久久精品国产亚洲AV香蕉吃奶| 亚洲天堂av在线一区| 国产欧美综合一区二区三区| 激情第一区仑乱| 欧美在线资源| 成人一区二区三区蜜桃| 99久久精品在线视频| 久久久国产精品黄毛片| 毛片毛片免费看| 国产一区二区三区经典| 亚洲男人天堂一区二区| 国产二级一片内射视频插放| 国产午夜福利精品| 人妻少妇偷人精品久久人妻| 国产乱人伦偷精品视频免观看| 双腿张开被9个男人调教| 国产片AV在线永久免费观看| 色婷婷一区二区三区四| 精品国产yw在线观看| 日韩亚洲av无码一区二区不卡 | 欧美精品高清在线xxxx| 国产一区二区av在线免费观看| 狠狠人妻久久久久久综合蜜桃 | 国产精品视频一区二区三区,| 国产天堂av在线播放资源| 国产精品无码一区二区三区| 国产喷水福利在线视频| 在线观看中文字幕一区二区三区| 白浆国产精品一区二区| 麻豆成人精品国产免费| 亚洲国产成人AⅤ片在线观看| 中国黄色偷拍视频二区| 国产免费又爽又色又粗视频| 国产看黄网站又黄又爽又色| 亚洲精品2区在线观看| 高清中文字幕一区二区| 永久免费看啪啪网址入口| 国产精品一区二区三级| 国产精品一区二区三区av在线|