亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于關(guān)聯(lián)規(guī)則挖掘的分類隨機(jī)游走算法

        2017-09-19 07:25:58施海鷹
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則分類

        施海鷹

        (上海大學(xué) 計(jì)算機(jī)工程與科學(xué)學(xué)院,上海 200444)

        基于關(guān)聯(lián)規(guī)則挖掘的分類隨機(jī)游走算法

        施海鷹

        (上海大學(xué) 計(jì)算機(jī)工程與科學(xué)學(xué)院,上海 200444)

        隨著互聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步和互聯(lián)網(wǎng)的飛速發(fā)展,人們可以很方便地在互聯(lián)網(wǎng)上尋找各種各樣的信息。用戶在尋找他們真正感興趣的信息時(shí)會(huì)花費(fèi)大量的時(shí)間,從而導(dǎo)致效率不高,這種現(xiàn)象被稱作“信息過載”。推薦系統(tǒng)是解決信息過載問題的一種行之有效的方法。目前,推薦系統(tǒng)中應(yīng)用最廣泛的兩種推薦技術(shù)是基于內(nèi)容的推薦算法和協(xié)同過濾推薦算法,但其不能很好地處理冷啟動(dòng)和稀疏性問題。為了更好地解決這兩個(gè)問題,在對(duì)傳統(tǒng)分類隨機(jī)游走算法進(jìn)行改進(jìn)的基礎(chǔ)上,提出了基于關(guān)聯(lián)規(guī)則挖掘的分類隨機(jī)游走算法。該算法利用關(guān)聯(lián)規(guī)則挖掘的特性,挖掘用戶屬性與項(xiàng)目之間的關(guān)聯(lián),為新用戶構(gòu)造初始的評(píng)分向量,彌補(bǔ)了經(jīng)典算法的不足,較好地處理了冷啟動(dòng)問題。驗(yàn)證實(shí)驗(yàn)結(jié)果表明,該算法具有較好的有效性和精確性。

        推薦系統(tǒng);關(guān)聯(lián)規(guī)則;分類隨機(jī)游走算法;信息過載

        1 概 述

        隨著互聯(lián)網(wǎng)的不斷發(fā)展,用戶在互聯(lián)網(wǎng)上查詢感興趣的信息的效率越來越低,用戶將大量時(shí)間花在了瀏覽不相關(guān)的信息上。為了解決上述問題,推薦系統(tǒng)應(yīng)運(yùn)而生。推薦系統(tǒng)的任務(wù)主要是將信息和用戶有效地聯(lián)系起來,一方面讓用戶發(fā)現(xiàn)自己需要的、感興趣的、有價(jià)值的信息;另一方面讓這些信息出現(xiàn)在用戶面前。推薦系統(tǒng)的出現(xiàn)就是為了解決“信息過載”問題[1],讓用戶在查詢有價(jià)值的信息時(shí)具有更高的效率。推薦系統(tǒng)已經(jīng)廣泛應(yīng)用于各領(lǐng)域,最典型的就是類似于‘亞馬遜’的商業(yè)領(lǐng)域[2]。

        推薦系統(tǒng)通過分析用戶的歷史興趣和偏好信息,可以在項(xiàng)目空間中確定用戶現(xiàn)在和將來可能會(huì)喜歡的項(xiàng)目,進(jìn)而主動(dòng)向用戶提供相應(yīng)的項(xiàng)目推薦服務(wù)。推薦系統(tǒng)的優(yōu)劣很大程度上依靠其采取的推薦算法,不同的推薦技術(shù)具有不同的推薦質(zhì)量,產(chǎn)生的推薦結(jié)果也不同。推薦技術(shù)可以分為基于內(nèi)容的推薦[3]、協(xié)同過濾[4]、混合式推薦[5]。基于內(nèi)容的推薦是最早應(yīng)用的推薦算法,不需要征求用戶的評(píng)價(jià)意見,而是根據(jù)用戶喜歡的商品信息,分析信息的特征,根據(jù)這些信息來分析相似性。最早的基于內(nèi)容的推薦應(yīng)用于信息檢索中,所以很多與信息檢索相關(guān)的技術(shù)都可以用于基于內(nèi)容的推薦中。

        協(xié)同過濾是推薦系統(tǒng)中最常用也是最成功的推薦算法。協(xié)同過濾技術(shù)的基本思想是,相似的用戶喜歡的東西也可能是相似的。在現(xiàn)實(shí)生活中,如果一個(gè)用戶想要讀一本書,往往會(huì)選擇和自己品味相近的朋友的推薦?;趦?nèi)容的推薦算法和協(xié)同過濾算法各有各的優(yōu)缺點(diǎn),可以通過這兩種推薦技術(shù)的組合來實(shí)現(xiàn)推薦算法的互補(bǔ),這就是混合推薦算法。

        當(dāng)一個(gè)新的系統(tǒng)上線時(shí),這個(gè)系統(tǒng)中并沒有任何用戶對(duì)項(xiàng)目的評(píng)分信息可以利用,那么協(xié)同過濾技術(shù)也就無法使用,這就是冷啟動(dòng)問題[6]。除此之外,當(dāng)一個(gè)新用戶或者新的項(xiàng)目加入系統(tǒng)時(shí),這些項(xiàng)目既沒有得到其他用戶的評(píng)分,新用戶也沒有對(duì)系統(tǒng)中的其他項(xiàng)目進(jìn)行過評(píng)分,這樣,新項(xiàng)目既不會(huì)被推薦出去,同時(shí)新用戶也不會(huì)得到推薦。新用戶和新項(xiàng)目都面臨著冷啟動(dòng)的問題。由于基于內(nèi)容的推薦算法和協(xié)同過濾算法無法很好地解決冷啟動(dòng)問題,研究者們提出了新的算法,例如基于圖的推薦算法[7-8]。

        文中研究了Zhang Liyan等提出的分類隨機(jī)游走算法[9],并在此基礎(chǔ)上進(jìn)行改進(jìn),提出了一種新的分類隨機(jī)游走算法。首先建立用戶—項(xiàng)目的相關(guān)圖,在相關(guān)圖上利用基于項(xiàng)目分類的隨機(jī)游走不斷迭代計(jì)算推薦結(jié)果。算法避免了傳統(tǒng)推薦算法的缺點(diǎn),同時(shí)具有較好的推薦效果。

        關(guān)聯(lián)規(guī)則挖掘問題是R.Agrawal等于1993年提出的[10]。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中一組數(shù)據(jù)項(xiàng)之間的某種潛在關(guān)系的規(guī)則,即從數(shù)據(jù)集中識(shí)別出頻繁出現(xiàn)的屬性值集,也稱為頻繁項(xiàng)集[11],然后再利用這些頻繁集的創(chuàng)建描述關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則可以找到數(shù)據(jù)項(xiàng)中的關(guān)聯(lián)關(guān)系[12],應(yīng)用到推薦算法中可以找到新用戶的相關(guān)性。

        為了克服分類隨機(jī)游走算法不能為新用戶進(jìn)行推薦的缺點(diǎn)[13-14],將關(guān)聯(lián)規(guī)則算法引入到推薦系統(tǒng),提出了基于關(guān)聯(lián)規(guī)則挖掘的分類隨機(jī)游走算法,較好地解決了冷啟動(dòng)問題。

        2 基于關(guān)聯(lián)規(guī)則挖掘的分類隨機(jī)游走算法

        2.1相關(guān)圖模型

        對(duì)于給定的數(shù)據(jù)集D,該推薦算法涉及的相關(guān)數(shù)據(jù)包括用戶集U={u1,u2,…,u|U|}、項(xiàng)目集M={m1,m2,…,m|M|}和用戶對(duì)項(xiàng)目的評(píng)分ri,j,算法的輸入可以看成是一個(gè)用戶—項(xiàng)目矩陣T,矩陣中的元素Ti,j的值為ri,j。

        算法第一步是建立一個(gè)項(xiàng)目間的相關(guān)圖,以此表明各個(gè)項(xiàng)目之間的相關(guān)性。算法用同時(shí)選擇項(xiàng)目mi和項(xiàng)目mj的用戶數(shù)量來表示兩個(gè)項(xiàng)目間的相關(guān)性,即在矩陣T中第i列和第j列的值均不等于0的行的數(shù)量。

        定義ui,j表示矩陣T中第i列和第j列的值均不等于0的行的數(shù)量,當(dāng)i=j時(shí)ui,j=0。由于T中大部分?jǐn)?shù)據(jù)都為0,為了減輕計(jì)算量,計(jì)算時(shí)對(duì)T中的每一行,將其不為0的提取出來,將其中可能的兩兩組合的ui,j置為1,之后所有行將對(duì)應(yīng)位置的值相加,求得最后所有的ui,j的值。

        定義|M|×|M|階的相關(guān)矩陣M,其中元素的值計(jì)算如下:

        基于矩陣M構(gòu)建相關(guān)圖G,在G中,項(xiàng)目mi和項(xiàng)目mj之間存在一條邊(當(dāng)且僅當(dāng)Mi,j>0),邊的權(quán)重等于Mi,j。這樣就構(gòu)建了算法的基本模型—相關(guān)圖。相關(guān)圖表明了各項(xiàng)目間的關(guān)聯(lián)度,項(xiàng)目mi和項(xiàng)目mj具有高的關(guān)聯(lián)度,潛在的原因是它們具有某些相似的特征。

        假設(shè)用戶-項(xiàng)目矩陣T如下:

        則矩陣M為:

        根據(jù)M構(gòu)建相關(guān)圖G,如圖1所示。

        圖1 生成的相關(guān)圖

        2.2算法描述

        算法的基本思想是通過相關(guān)圖來預(yù)測(cè)用戶的喜好,相關(guān)圖揭示了項(xiàng)目與項(xiàng)目之間的關(guān)聯(lián)程度。訓(xùn)練數(shù)據(jù)集時(shí),通過給定的用戶-項(xiàng)目評(píng)分在相關(guān)圖中依靠項(xiàng)目間的連接來傳遞。例如,如果一個(gè)項(xiàng)目mi和用戶uj感興趣的多個(gè)項(xiàng)目之間都存在關(guān)聯(lián),則mi可以作為一個(gè)好的推薦結(jié)果推薦給用戶uj。如果一個(gè)項(xiàng)目是用戶所喜好的,則其一定還與該用戶其他的喜好物品有較高的關(guān)聯(lián)度。基于這樣的結(jié)論,可以用隨機(jī)游走的方法去計(jì)算用戶對(duì)其他物品的評(píng)分。

        用戶對(duì)某一項(xiàng)目的評(píng)分可以從一個(gè)項(xiàng)目向該項(xiàng)目鄰近的項(xiàng)目傳遞,不僅僅因?yàn)檫@兩個(gè)項(xiàng)目同時(shí)出現(xiàn)在一個(gè)用戶的喜好項(xiàng)目里的次數(shù)多,而且因?yàn)閮蓚€(gè)項(xiàng)目之間具有某些可見和不可見的相似性。由此定義一個(gè)新的概念—分類評(píng)分(Categorical Rank,CR),表示在特定分類上的項(xiàng)目評(píng)分,而分類隨機(jī)游走算法就是迭代計(jì)算每個(gè)用戶的CR值。

        為了計(jì)算CR值,先迭代計(jì)算矩陣Ruk,具體的迭代公式如下:

        (1)

        其中,R為|M|×n階矩陣,|M|是項(xiàng)目的總數(shù),n是項(xiàng)目類別的總數(shù),元素Rig表示對(duì)于某一用戶,項(xiàng)目mi在類別g上的評(píng)分;M為項(xiàng)目相關(guān)矩陣;F為|M|×n階的輔助矩陣;I為|M|×n階的矩陣,其元素的值由原始的用戶—項(xiàng)目評(píng)分生成;d和α分別為鏈接相關(guān)性參數(shù)和主題相關(guān)性參數(shù),通過實(shí)驗(yàn)分別取0.15和0.1。

        式(1)表明,對(duì)于某一用戶,項(xiàng)目mi在類別g上的評(píng)分由三部分組成:與項(xiàng)目mi所屬類別相同的近鄰項(xiàng)目的評(píng)分;與項(xiàng)目mi所屬類別不同的近鄰項(xiàng)目的評(píng)分;起始的用戶—項(xiàng)目評(píng)分。第一個(gè)方程的作用是在開始迭代之前初始化Ruk;第二個(gè)方程用來計(jì)算矩陣F,Pig表示項(xiàng)目mi屬于類別g的概率,由數(shù)據(jù)集中給出的項(xiàng)目分類信息可以計(jì)算得出;第三個(gè)方程中,Iuk中每一個(gè)元素的計(jì)算公式如下:

        (2)

        CRuk=Ruk(Profuk)T

        (3)

        其中,Profuk=RukP,揭示了用戶uk對(duì)不同類別項(xiàng)目的興趣。根據(jù)式(3)可以計(jì)算出用戶uk對(duì)所有項(xiàng)目的預(yù)測(cè)評(píng)分,如果一個(gè)項(xiàng)目最后的預(yù)測(cè)評(píng)分高,則表示用戶對(duì)該項(xiàng)目比其他項(xiàng)目更感興趣,將項(xiàng)目按照最后的預(yù)測(cè)評(píng)分逆序進(jìn)行排序,把排在前面的項(xiàng)目作為最后的推薦結(jié)果推薦給用戶。

        2.3改進(jìn)的FP-Growth算法

        分類隨機(jī)游走算法的缺點(diǎn)是不能為新用戶進(jìn)行推薦,為了解決這個(gè)問題,需要為新用戶構(gòu)建一個(gè)初始的評(píng)分向量,故提出了基于關(guān)聯(lián)規(guī)則的分類隨機(jī)游走算法。通過關(guān)聯(lián)規(guī)則找出用戶屬性與項(xiàng)目之間的關(guān)聯(lián)關(guān)系,根據(jù)新用戶的屬性給新用戶構(gòu)建初始的評(píng)分向量,對(duì)經(jīng)典關(guān)聯(lián)規(guī)則FP-Growth算法進(jìn)行了改進(jìn)。

        FP-Growth算法需要掃描事務(wù)數(shù)據(jù)庫,數(shù)據(jù)集D生成的用戶-項(xiàng)目矩陣T就作為事務(wù)數(shù)據(jù)庫。設(shè)定一個(gè)最小支持度,對(duì)T進(jìn)行第一次掃描,抽取出那些支持度大于最小支持度的項(xiàng)目和用戶屬性,并記錄其支持度計(jì)數(shù)(即其出現(xiàn)的次數(shù)),生成候選1-項(xiàng)集,記為L(zhǎng),將其按照支持度大小逆序排序。

        第二次掃描T,對(duì)它的每一行,選擇該行的頻繁項(xiàng)(項(xiàng)目和用戶屬性),按照第一步中生成的L的順序進(jìn)行排序。之后構(gòu)造FP-tree,設(shè)定排序后的頻繁項(xiàng)表為[p|P],其中p為第一個(gè)元素,P為剩余元素組成的表。過程如下:如果節(jié)點(diǎn)T有子女N與p是同一個(gè)項(xiàng)目,則N的計(jì)數(shù)加1,否則創(chuàng)建新的節(jié)點(diǎn)N,將其計(jì)數(shù)置為1,鏈接到它的父節(jié)點(diǎn)T,并且通過節(jié)點(diǎn)鏈結(jié)構(gòu)將其鏈接到具有相同項(xiàng)目的節(jié)點(diǎn),如果P非空,遞歸調(diào)用insert_tree(P,Tree)。

        建立FP-tree對(duì)應(yīng)的項(xiàng)頭表(item header table),逆序遍歷項(xiàng)頭表,找出FP-tree中由該節(jié)點(diǎn)到根節(jié)點(diǎn)的路徑。根據(jù)每個(gè)頻繁元素對(duì)應(yīng)的條件模式基,生成其對(duì)應(yīng)的條件FP-tree,并刪除樹中節(jié)點(diǎn)記數(shù)不滿足給定的最小支持度的節(jié)點(diǎn)。對(duì)于每一棵條件FP-tree,生成所有從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的路徑,由路徑中的集合生成其所有非空子集,所有非空子集和每一個(gè)候選1-項(xiàng)集中的元素共同構(gòu)成了原始數(shù)據(jù)集中的頻繁集,最后生成所有的用戶屬性與項(xiàng)目之間的關(guān)聯(lián)規(guī)則。

        運(yùn)用改進(jìn)的FP-Growth算法,根據(jù)已有的數(shù)據(jù)集D產(chǎn)生用戶屬性和項(xiàng)目之間的關(guān)聯(lián)規(guī)則之后,對(duì)規(guī)則R:X?Y中后項(xiàng)Y的每一項(xiàng)計(jì)算初始評(píng)分,對(duì)于Y中沒有的項(xiàng)目,其初始評(píng)分設(shè)為0,這樣就構(gòu)成了一個(gè)評(píng)分向量V;對(duì)于Y中有的項(xiàng)目,假設(shè)該項(xiàng)目在所有項(xiàng)目中是第i個(gè)項(xiàng)目,其初始評(píng)分的計(jì)算公式如下:

        (4)

        現(xiàn)有一新用戶uk=uk1,uk2,…,ukL,L為用戶的屬性總數(shù),對(duì)于生成的規(guī)則集合R={R1,R2,…,R|R|},其中的任一規(guī)則Ri:Xi?Yi,如果Xi包含于用戶uk的屬性集,則將Ri加入到R的子集R'中,這樣R'所有的規(guī)則都是前項(xiàng)中的用戶屬性是目標(biāo)用戶屬性集的子集,即全部是與目標(biāo)用戶相關(guān)的關(guān)聯(lián)規(guī)則,之后依據(jù)式(5)計(jì)算uk的初始評(píng)分向量:

        (5)

        其中,Vi為R'中第i個(gè)規(guī)則所生成的評(píng)分向量。

        式(5)根據(jù)R'中所有規(guī)則的評(píng)分向量的加權(quán)平均來生成uk的初始評(píng)分向量。有了初始評(píng)分向量后,改進(jìn)的分類隨機(jī)游走算法就可以開始為uk進(jìn)行推薦。

        3 算法流程

        基于關(guān)聯(lián)規(guī)則挖掘的分類隨機(jī)游走算法在第一次運(yùn)行時(shí),需要進(jìn)行用戶屬性與項(xiàng)目之間的關(guān)聯(lián)規(guī)則挖掘,之后只需要在一個(gè)新用戶對(duì)某個(gè)項(xiàng)目評(píng)分之后,再次進(jìn)行關(guān)聯(lián)規(guī)則挖掘。

        算法首先建立相關(guān)圖模型,之后對(duì)新用戶進(jìn)行推薦,需要根據(jù)挖掘的所有關(guān)聯(lián)規(guī)則,選出與該用戶相關(guān)的關(guān)聯(lián)規(guī)則,對(duì)每個(gè)關(guān)聯(lián)規(guī)則中的所有項(xiàng)目進(jìn)行初始評(píng)分,最后對(duì)所有與用戶屬性相關(guān)的關(guān)聯(lián)規(guī)則根據(jù)支持度和置信度計(jì)算加權(quán)平均值,得出為新用戶構(gòu)建的初始評(píng)分向量。將所有項(xiàng)目分類,計(jì)算項(xiàng)目類別概率矩陣P,根據(jù)式(1)初始化矩陣R,并迭代計(jì)算,之后再根據(jù)式(3)計(jì)算該新用戶的CR值,將CR按照逆序排序,將前幾個(gè)項(xiàng)目作為結(jié)果推薦給該用戶。至此算法結(jié)束,具體流程如圖2所示。

        圖2 算法流程圖

        4 實(shí)驗(yàn)結(jié)果

        實(shí)驗(yàn)環(huán)境:CPU為Intel(R) Core(TM) i3-2350M CPU @ 2.30 GHz ;內(nèi)存4 GB;操作系統(tǒng)為Windows 7(32位);編程語言為JAVA(JDK1.6)。

        實(shí)驗(yàn)使用了三個(gè)數(shù)據(jù)集,分別是MovieLens、Anonymous Microsoft Web Data和Entree Chicago Recommendation Data。MovieLens由著名的MovieLens網(wǎng)站上的電影推薦組成,該網(wǎng)站擁有超過50 000名用戶對(duì)3 000多部電影進(jìn)行評(píng)分,數(shù)據(jù)集中有943個(gè)用戶對(duì)1 682部電影的100 000條評(píng)分,用戶自己擁有三個(gè)屬性,包括年齡、性別和職業(yè)。Anonymous Microsoft Web Data記錄了網(wǎng)站內(nèi)38 000名匿名用戶過去一周在網(wǎng)站上的瀏覽記錄。Entree Chicago Recommendation Data記錄了用戶對(duì)芝加哥餐館主菜的評(píng)價(jià)。對(duì)每個(gè)數(shù)據(jù)集抽取100個(gè)用戶的數(shù)據(jù)作為測(cè)試數(shù)據(jù),將這100名用戶作為新用戶,在三個(gè)數(shù)據(jù)集上分別使用基于FP-Growth的分類隨機(jī)游走算法和改進(jìn)的FP-Growth分類隨機(jī)游走算法,以均方誤差(MSE)[13]為評(píng)價(jià)指標(biāo)。

        在三個(gè)數(shù)據(jù)集中,分別作10次隨機(jī)抽取100個(gè)用戶的實(shí)驗(yàn),結(jié)果如圖3~5所示。

        圖3~5顯示了三個(gè)數(shù)據(jù)集上算法的性能,算法成功地為新用戶做出了推薦,且改進(jìn)的FP-Growth分類隨機(jī)游走算法的性能普遍好于基于FP-Growth算法的性能。將每個(gè)數(shù)據(jù)集上10次實(shí)驗(yàn)的MSE取平均,結(jié)果如表1所示。

        從表1可見,改進(jìn)的FP-Growth分類隨機(jī)游走成功解決了分類隨機(jī)游走算法中新用戶的評(píng)分向量問題,利用改進(jìn)算法生成用戶屬性與項(xiàng)目之間的關(guān)聯(lián)規(guī)則去構(gòu)造新用戶的初始評(píng)分向量,之后用分類隨機(jī)游走算法為新用戶進(jìn)行推薦。相比于基于FP-Growth的分類隨機(jī)游走算法可以看出,該算法對(duì)新用戶具有較好的推薦結(jié)果。

        圖3 MovieLens的實(shí)驗(yàn)結(jié)果

        圖4 Anonymous Microsoft Web Data的實(shí)驗(yàn)結(jié)果

        圖5 Entree Chicago Recommendation Data的實(shí)驗(yàn)結(jié)果

        表1 結(jié)果對(duì)比 s

        5 結(jié)束語

        針對(duì)隨機(jī)游走分類算法的不足,提出了基于關(guān)聯(lián)規(guī)則挖掘的隨機(jī)游走分類算法。為了彌補(bǔ)分類隨機(jī)游走算法不能為新用戶進(jìn)行推薦的缺點(diǎn),即新用戶沒有任何評(píng)分?jǐn)?shù)據(jù)的問題,該算法利用關(guān)聯(lián)規(guī)則挖掘計(jì)算用戶屬性與項(xiàng)目之間的關(guān)聯(lián)規(guī)則,利用這些關(guān)聯(lián)規(guī)則為新用戶構(gòu)建一個(gè)初始的評(píng)分向量,之后為該用戶計(jì)算推薦結(jié)果。實(shí)驗(yàn)結(jié)果表明,該算法對(duì)于新用戶推薦具有較好的結(jié)果。隨著信息量的擴(kuò)大,算法效率也必定會(huì)受到一定的影響,為了提高算法在運(yùn)算大數(shù)據(jù)量時(shí)的效率,算法的并行化和分布式計(jì)算是未來研究的重要方向。

        [1] 鄧愛林,朱揚(yáng)勇,施伯樂.基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過濾推薦算法[J].軟件學(xué)報(bào),2003,14(9):1621-1628.

        [2] 陳 健,印 鑒.基于影響集的協(xié)作過濾推薦算法[J].軟件學(xué)報(bào),2007,18(7):1685-1694.

        [3] 許海玲,吳 瀟,李曉東,等.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報(bào),2009,20(2):350-362.

        [4] 曹 毅,賀衛(wèi)紅.基于用戶興趣的混合推薦模型[J].系統(tǒng)工程,2009,27(6):68-72.

        [5] 吳麗花,劉 魯.個(gè)性化推薦系統(tǒng)用戶建模技術(shù)綜述[J].情報(bào)學(xué)報(bào),2006,25(1):55-62.

        [6] 劉建國(guó),周 濤,汪秉宏.個(gè)性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009,19(1):1-15.

        [7] 梁昌勇,冷亞軍,王勇勝,等.電子商務(wù)推薦系統(tǒng)中群體用戶推薦問題研究[J].中國(guó)管理科學(xué),2013,21(3):153-158.

        [8] Zhou T,Jiang L L,Su R Q,et al.Effect of initial configuration on network-based recommendation[J].Physics,2008,81(5):58-62.

        [9] Zhang L,Xu J,Li C.A random-walk based recommendation algorithm considering item categories[J].Neurocomputing,2013,120(10):391-396.

        [10] Agrawal R,Imieliński T,Swami A.Mining association rules between sets of items in large databases[C]//Proceedings of the 1993 ACM SIGMOD international conference on management of data.New York:ACM,1993:207-216.

        [11] Minaei-Bidgoli B,Barmaki R,Nasiri M.Mining numerical association rules via multi-objective genetic algorithms[J].Information Sciences,2013,233:15-24.

        [12] Soni R K,Gupta N,Sinhal A.An FP-growth approach to mining association rules[J].International Journal of Computer Science and Mobile Computing,2013,2(2):1-5.

        [14] Tong Q L,Park Y,Park Y T.A time-based approach to effective recommender systems using implicit feedback[J].Expert Systems with Applications,2008,34(4):3055-3062.

        Random-walk Classification Algorithm with Association Rules Mining

        SHI Hai-ying

        (Schoolof Computer Engineering and Science,Shanghai University,Shanghai 200444,China)

        Along with the continuous progress of Internet technology and the rapid development of the Internet,people can easily find all kinds of information on the Internet.Users would spend a lot of time to search for information what they are really interested in,which is inefficient.The phenomenon is called information overload which is solved effectively by recommendation system as an effective method.However,the two most popular recommendation technologies in the current recommendation system are content-based recommendation and collaborative filtering recommendation,which cannot handle the problems of cold start and sparsity well.In order to better solve them,categorical random-walk algorithm based on association rules is proposed,which uses association rules to mine the association between user attributes and items and constructs the initial score vectors for new users.It has made up for the shortage of the classic algorithm and better handles the cold start problem.The results of experiments prove its effectiveness and accuracy.

        recommendation system;association rules;categorical random-walk;information overload

        2016-07-08

        :2016-11-02 < class="emphasis_bold">網(wǎng)絡(luò)出版時(shí)間

        時(shí)間:2017-07-11

        上海市科委重點(diǎn)資助項(xiàng)目(91330116)

        施海鷹(1979-),男,碩士研究生,研究方向?yàn)閿?shù)據(jù)挖掘、人工智能;導(dǎo)師:楊洪斌,副教授,研究方向?yàn)閿?shù)據(jù)挖掘、人工智能。

        http://kns.cnki.net/kcms/detail/61.1450.TP.20170711.1454.040.html

        TP301.6

        :A

        :1673-629X(2017)09-0007-05

        10.3969/j.issn.1673-629X.2017.09.002

        猜你喜歡
        關(guān)聯(lián)規(guī)則分類
        撐竿跳規(guī)則的制定
        “苦”的關(guān)聯(lián)
        數(shù)獨(dú)的規(guī)則和演變
        分類算一算
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        教你一招:數(shù)的分類
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        一区二区三区精品亚洲视频| 国产成人久久精品激情| 欧美黑人巨大videos精品| 狠狠色狠狠色综合网| 亚洲成av人片乱码色午夜| 任你躁国产自任一区二区三区| 久久精品国产夜色| 国产福利免费看| 亚洲情a成黄在线观看动漫尤物| 国产一区二区三区亚洲精品| 一区二区三区视频亚洲| 久久久中日ab精品综合| 久久精品国产亚洲av麻| 二区久久国产乱子伦免费精品| 91精品国产综合久久青草| 国产av自拍在线观看| 亚洲av精二区三区日韩| 成人欧美一区二区三区在线 | 日韩av一区二区无卡| 亚洲av网一区二区三区| 中文字幕在线观看亚洲日韩 | 亚洲乱码国产乱码精品精| 天天鲁在视频在线观看| 亚洲日韩精品欧美一区二区一| 国产日韩欧美911在线观看| 国产人妖直男在线视频| 无套内射在线无码播放| 亚洲 精品 综合 精品 自拍| 亚洲av日韩av综合aⅴxxx| 亚洲一区有码在线观看| 妃光莉中文字幕一区二区| 西西人体444www大胆无码视频 | 国产成人美涵人妖视频在线观看| 精品人无码一区二区三区| 日本50岁丰满熟妇xxxx | 午夜家庭影院| 亚洲国产日韩av一区二区| av在线高清观看亚洲| 免费操逼视频| 无遮挡亲胸捏胸免费视频| 亚洲二区三区在线播放|