亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于對(duì)象閾值變精度概念的啟發(fā)式推薦方法

        2024-04-23 04:35:00張國(guó)鋒
        關(guān)鍵詞:置信度背景閾值

        張國(guó)鋒,楊 凱

        (遼寧科技大學(xué) 計(jì)算機(jī)與軟件工程學(xué)院,遼寧 鞍山 114051)

        0 引 言

        形式概念分析(formal concept analysis,F(xiàn)CA)[1]是Wille基于序理論提出的理論體系,由于其核心數(shù)據(jù)結(jié)構(gòu)概念格對(duì)于稀疏數(shù)據(jù)的處理能力較強(qiáng),被應(yīng)用于推薦系統(tǒng)[2-8]領(lǐng)域。Boucher Ryan首次將形式概念分析與推薦系統(tǒng)結(jié)合[9]。Zou、陳昊文、朵琳、張喜征等相繼將形式概念分析的各種方法用于推薦算法研究[10-13]。

        概念格的構(gòu)造是FCA應(yīng)用于推薦的瓶頸,數(shù)據(jù)量較大時(shí),建造概念格會(huì)變得非常困難。曾利程等在Addintent算法的基礎(chǔ)上,提出了一種快速構(gòu)建概念格的算法[14]。JAM等構(gòu)造依賴空間模型來(lái)生成概念格[15]。其后,郭澤蔚、錢婷、姜琴等相繼在自己研究的領(lǐng)域?qū)Ω拍罡駱?gòu)造進(jìn)行改進(jìn)[16-18]。這些構(gòu)造算法雖然能一定程度上縮短建格時(shí)間,但未從根本上解決問(wèn)題,在大數(shù)據(jù)下構(gòu)造概念格依然難以完成。劉忠慧等提出了一種不建造格結(jié)構(gòu),而是利用強(qiáng)概念提取概念格規(guī)則的方法[19],時(shí)間復(fù)雜度大幅降低,從根本上解決了效率問(wèn)題,但應(yīng)用于推薦時(shí)準(zhǔn)確率和F1值過(guò)低,結(jié)構(gòu)仍需完善。

        本文將文獻(xiàn)[19]中的啟發(fā)式方法進(jìn)行優(yōu)化,將“形式背景”轉(zhuǎn)化為“對(duì)象閾值變精度形式背景”,“強(qiáng)概念”轉(zhuǎn)化為“對(duì)象閾值強(qiáng)概念”,提出了基于對(duì)象變精度概念的啟發(fā)式推薦方法(variable precision heuristic concept,VPHC)。此方法對(duì)每個(gè)用戶單獨(dú)考慮閾值的取舍,在降低建格復(fù)雜度的同時(shí)又能充分考慮用戶之間的差異,在推薦實(shí)驗(yàn)中取得了良好的效果。

        1 相關(guān)定義

        定義1 經(jīng)典形式背景[1]

        設(shè)形式背景K=(G,M,I),G為對(duì)象集合,M為屬性集合,I代表G和M之間的關(guān)系,I?G×M。 另設(shè)集合A、B,令A(yù)?G,B?M定義映射如式(1)、式(2)所示

        f(A)={b∈M|a∈A,aIb}

        (1)

        g(B)={a∈G|b∈B,aIb}

        (2)

        設(shè)f(A) 是對(duì)象集A?G中所有對(duì)象所共同擁有的屬性,g(B) 是屬性集B?M中所有屬性共有的對(duì)象。經(jīng)典形式背景和經(jīng)典概念格如表1和圖1所示。

        圖1 經(jīng)典概念格Hasse

        表1 經(jīng)典形式背景

        定義2 模糊映射[20]

        對(duì)于模糊形式背景中的每個(gè)屬性,選取兩個(gè)閾值k1和k2,滿足0≤k1

        F*(O)={d|o∈O,k1≤I(o,d)≤k2}

        (3)

        G*(D)={o|d∈D,k1≤I(o,d)≤k2}

        (4)

        定義3 變精度概念[21]

        在模糊形式背景K=(U,A,I) 中,類比模糊映射定義,針對(duì)任意X?U,B?A,設(shè)閾值k(0

        (5)

        (6)

        若二元組(X,B)滿足X=B*k,B=X*k,則稱(X,B)為閾值k下的變精度概念。變精度概念格共有3種,本文中變精度概念定義和結(jié)構(gòu)指的都是Crisp-crisp變精度概念格。

        定義4 概念領(lǐng)域[19]

        在形式背景K=(U,A,I) 中,任意X?U,B?A,形式概念C=(X,B) 的領(lǐng)域由它的面積決定,面積越大表明該概念具有較高的相似性和較強(qiáng)的穩(wěn)定性,具體如式(7)所示(|·|表示集合的基數(shù))

        Area(X,B)=|X|×|B|

        (7)

        定義5 強(qiáng)概念[19]

        設(shè)C=(X,B) 為x∈X的強(qiáng)概念,當(dāng)且僅當(dāng)不存在x∈X′,Area(X,B)

        2 基于對(duì)象閾值變精度概念的啟發(fā)式推薦方法

        2.1 對(duì)象閾值可變的變精度強(qiáng)概念

        在進(jìn)行電影推薦時(shí),設(shè)電影評(píng)分為“1~5”,兩人對(duì)一部電影評(píng)分,前者評(píng)分是“4”,后者評(píng)分為“3”,單純來(lái)看前者的評(píng)價(jià)高于后者,但若前者評(píng)分從未低于過(guò)“3”,后者評(píng)分從未高于過(guò)“3”,這樣看來(lái)二者對(duì)此電影的喜歡程度便會(huì)變得難以區(qū)分。

        若對(duì)每個(gè)用戶單獨(dú)進(jìn)行考慮,便不會(huì)再有這一麻煩。如,用戶1喜歡對(duì)其看過(guò)的電影打高分,若其對(duì)一部電影的評(píng)分為“3”,那么這一中檔評(píng)分便可歸于低分類別。用戶2喜歡對(duì)其看過(guò)的電影打低分,碰到用戶2打分為“3”的電影數(shù)據(jù)時(shí),這一評(píng)分則應(yīng)歸于高分類別。

        基于以上思想,根據(jù)數(shù)學(xué)中的變精度概念格結(jié)構(gòu),提出對(duì)象閾值變精度概念格定義和結(jié)構(gòu)(如定義6所示)。再將對(duì)象閾值變精度形式背景進(jìn)行規(guī)則提取,生成強(qiáng)概念,便形成了對(duì)象閾值變精度啟發(fā)式強(qiáng)概念。

        定義6 對(duì)象閾值變精度概念格

        設(shè)模糊形式背景為(U,A,I),對(duì)應(yīng)變精度閾值為k(0

        (8)

        (9)

        此定義針對(duì)變精度概念做出改進(jìn),讓其更適合于實(shí)際應(yīng)用。如表2所示,閾值K={0.5,0.4,0.5,0.5,0.35}, 這種改動(dòng)能將每個(gè)對(duì)象所需的隸屬度函數(shù)全部提出,避免因閾值統(tǒng)一對(duì)隸屬度函數(shù)均偏低或均偏高對(duì)象的影響。

        表2 對(duì)象閾值變精度形式背景

        通過(guò)μ和t的取值來(lái)控制對(duì)象的變精度閾值,如圖2~圖5所示。

        圖2 μ=0.6,t=0時(shí)對(duì)應(yīng)的Hasse

        圖3 μ=1,t=0時(shí)對(duì)應(yīng)的Hasse

        圖4 μ=1,t=0.2時(shí)對(duì)應(yīng)的Hasse

        圖5 μ=1,t=-0.2時(shí)對(duì)應(yīng)的Hasse

        以下是4種取值所產(chǎn)生的強(qiáng)概念集合,由于形式背景極小,內(nèi)涵閾值設(shè)為1,從左往右μ和t的取值依次為(μ=0.6,t=0)(μ=1,t=0)(μ=1,t=0.2)(μ=1,t=-0.2)。

        由于模糊形式背景和變精度形式背景,利用了評(píng)分?jǐn)?shù)據(jù),所以對(duì)強(qiáng)概念定義加入評(píng)分信息,對(duì)概念領(lǐng)域進(jìn)行修改,將面積轉(zhuǎn)化為加權(quán)面積,提出了加權(quán)概念領(lǐng)域定義。

        定義7 加權(quán)概念領(lǐng)域

        (10)

        例如:構(gòu)建用戶1的強(qiáng)概念,設(shè)有概念C1和概念C2備選。若由定義5概念領(lǐng)域定義計(jì)算,概念C1=(135,ad) 其面積為6,概念C2=(159,df) 其面積也為6,則兩者概念面積相同,只能由先進(jìn)入備選的概念作為強(qiáng)概念。對(duì)于加權(quán)概念領(lǐng)域定義來(lái)說(shuō),要在模糊形式背景中取兩概念的評(píng)分集,設(shè)u1對(duì)“a”的評(píng)分為0.6,對(duì)“d”的評(píng)分為0.8;u3對(duì)“a”的評(píng)分為0.5,對(duì)“d”的評(píng)分為0.8;u5對(duì)“a”的評(píng)分為0.4,對(duì)“d”的評(píng)分也為0.4,可得概念C1外延集{1,3,5}對(duì)于內(nèi)涵集{a,d}的評(píng)分集為 [{0.6,0.8},{0.5,0.8},{0.4,0.4}], 概念C1的加權(quán)面積可由其概念面積乘以評(píng)分集之和得到,即Area(C1)=3×2×(0.6+0.8+0.5+0.8+0.4+0.4)=21; 同理,設(shè)概念C2的評(píng)分集為 [{0.8,0.8},{0.4,0.6},{0.6,0.8}], 得到概念C2的加權(quán)面積:Area(C2)=3×2×(0.8+0.8+0.4 +0.6+0.6+0.8)=22.8; 由于Area(C1)=21

        2.2 推薦置信度計(jì)算

        通過(guò)計(jì)算基于強(qiáng)概念的推薦置信度,可以進(jìn)行群組推薦,推薦置信度如式(11)所示。

        定義8 推薦置信度[19]

        給定形式背景K=(U,A,I), 強(qiáng)概念C=(X,B), 對(duì)象u∈X,屬性i∈A-B,r(u,i)=0。 則基于強(qiáng)概念C向u推薦i的置信度為

        (11)

        置信度由群組中每個(gè)對(duì)象的推薦綜合決定,r(u,i)=0表示規(guī)定對(duì)象u的屬性i為0,即用戶u沒(méi)看過(guò)電影i。

        2.3 推薦流程

        2.3.1 數(shù)據(jù)處理

        在推薦之前要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,首先將電影數(shù)據(jù)轉(zhuǎn)化為形式背景,并且將形式背景轉(zhuǎn)化為對(duì)象閾值變精度形式背景(具體見(jiàn)算法1),在數(shù)據(jù)處理的過(guò)程中,把每個(gè)用戶所看過(guò)的全部電影作為一條數(shù)據(jù)輸入算法。

        算法1:數(shù)據(jù)預(yù)處理

        輸入:數(shù)據(jù)集(user Id,movie Id,rating,timestamp)

        輸出:對(duì)象閾值變精度形式背景K=(U,A,I)

        (1) (U,A,I)← ?; //構(gòu)建三維數(shù)據(jù)并將其初始化作為形式背景

        (2) len(U)=max(user Id),len(A)=max(movie Id); //對(duì)形式背景橫縱長(zhǎng)度進(jìn)行約束

        (3) a=max(user Id); //取a作為id最大的用戶

        (4) for(each user Id)//對(duì)數(shù)據(jù)集中的每條數(shù)據(jù)進(jìn)行遍歷,將一個(gè)用戶的全部數(shù)據(jù)作為每條數(shù)據(jù)

        (5) if (user Id<=a) then

        (6) n=len (movie(user Id)),rat=0;//n為用戶i看過(guò)的電影個(gè)數(shù)之和

        (7) for (each movie Id);

        (8) rat=rat+rating(user Id);//對(duì)每個(gè)用戶的所有評(píng)分求和

        (9) (U,A,I)←(user id,movie Id(rating)); //求和時(shí),需要遍歷所有此用戶看過(guò)的所有電影,這時(shí)便可寫入到形式背景中去

        (10) end for

        (11) k=rat/n;//算出每個(gè)user所對(duì)應(yīng)的基礎(chǔ)閾值k

        (12) (U,A,I)←k //將基礎(chǔ)閾值k作為一個(gè)單獨(dú)數(shù)據(jù)附到每個(gè)用戶所有電影評(píng)分之后。

        (13) end if

        (14) end for

        (15) return K=(U,A,I)

        2.3.2 強(qiáng)概念集構(gòu)造與置信度推薦

        預(yù)處理數(shù)據(jù)生成形式背景之后便可以進(jìn)行對(duì)象閾值強(qiáng)概念構(gòu)造,這一部分的思想和文獻(xiàn)[19,22]中的方法類似,但對(duì)概念領(lǐng)域的計(jì)算進(jìn)行了修改,將原本的概念面積乘以了評(píng)分集之和,具體思想如算法2所示。還需要注意的是對(duì)象閾值強(qiáng)概念集合,并不是只有一個(gè),根據(jù)μ和t值選取的不同可構(gòu)造出不同粒度的強(qiáng)概念集合,在之后的推薦中根據(jù)離線測(cè)評(píng)數(shù)據(jù)來(lái)判定最優(yōu)的強(qiáng)概念集合。

        算法中偽代碼為簡(jiǎn)潔明了省略了必要的循環(huán)步驟,如算法2第(16)行,需要對(duì)對(duì)象u的所有屬性進(jìn)行循環(huán),然后返回形式背景中找出每個(gè)屬性對(duì)應(yīng)的對(duì)象個(gè)數(shù),在算法中僅用一個(gè)公式來(lái)代替。

        算法2:對(duì)象閾值強(qiáng)概念集構(gòu)造

        輸入:μ,t,對(duì)象閾值變精度形式背景K=(U,A,I)

        輸出:強(qiáng)概念集合C

        (1) C←?;//初始化強(qiáng)概念集合C

        (2) for(eachu∈U)

        (3) if (A(u)>=μki+t) then//將對(duì)象u每個(gè)屬性的隸屬度函數(shù)與變精度閾值比對(duì),大于等于變精度閾值的可以保留并在形式背景中為“1”,其它的為“0”

        (4) ((U,A,I)→A(u))=1

        (5) else ((U,A,I)→A(u))=0

        (6) end for

        (7)P=sort(U); //建立全部對(duì)象的集合P,并將P進(jìn)行排序。

        (8) while (u∈P,P≠?) do //對(duì)集合P中的每一個(gè)對(duì)象u進(jìn)行強(qiáng)概念構(gòu)造

        (9) (X,B)←? //初始化強(qiáng)概念

        (10)m←0;//設(shè)置m為加權(quán)概念領(lǐng)域面積

        (11)b=arg max(len (a(u))); //表示b為對(duì)象u的所有屬性a中所包含對(duì)象數(shù)最多的屬性。

        (12)B=B∪; //將此屬性并入內(nèi)涵集

        (13) while(true)

        (14) for (eachj∈a(u)-B) //表示對(duì)對(duì)象u中的不屬于B的屬性進(jìn)行遍歷,即刨去b之外的其它屬性

        (15)a=B∪j;

        (16) uc=ac(u) //表示uc為屬性集ac所對(duì)應(yīng)的對(duì)象集

        (17)i=jwhere len(uc) is the biggest;//i為使對(duì)象集uc達(dá)到最大長(zhǎng)度所對(duì)應(yīng)的屬性j的取值

        (18) end for

        (19)mu=Area(uc,B∪i); //mu便為計(jì)算出的加權(quán)概念面積

        (20) if(mu>m∨(len(B)+1)<2) then //滿足兩個(gè)條件中的任一個(gè)就給B和m賦值繼續(xù)循環(huán)

        (21)B=B∪{i};

        (22)m=mu;

        (23) else //針對(duì)(11)行中的兩個(gè)條件皆不滿足表示強(qiáng)概念已經(jīng)滿足要求,此時(shí)退出循環(huán)。

        (24) break;

        (25) end if

        (26) end while

        (27)X=uc;

        (28) =C∪(X,B); //將對(duì)象u的強(qiáng)概念并入概念集合C

        (29)P=P-X(C); //將強(qiáng)概念的外延中所有對(duì)象在對(duì)象集P里面剔除

        (30) end while

        (31) returnC

        需要注意的是第(17)行i為單個(gè)屬性值,第(19)行Area函數(shù)表示的是加權(quán)概念領(lǐng)域,第(29)行表示在對(duì)象u生成強(qiáng)概念的同時(shí),其強(qiáng)概念外延中的對(duì)象便都以此為自身的強(qiáng)概念,避免了重復(fù)生成。

        最后便是構(gòu)造推薦預(yù)測(cè)矩陣進(jìn)行置信度推薦,構(gòu)造具體方式參見(jiàn)文獻(xiàn)[19],置信度公式為式(11),推薦的具體流程如圖6所示。

        圖6 推薦流程

        首先,將評(píng)分?jǐn)?shù)據(jù)集預(yù)處理生成模糊形式背景,對(duì)每一個(gè)用戶計(jì)算出對(duì)象變精度閾值;然后,將閾值加入模糊背景生成對(duì)象閾值變精度形式背景;對(duì)此背景進(jìn)行啟發(fā)式構(gòu)造生成對(duì)象閾值強(qiáng)概念集合;利用置信度公式對(duì)每個(gè)用戶進(jìn)行推薦度計(jì)算;最后構(gòu)建推薦矩陣對(duì)用戶進(jìn)行推薦。

        3 實(shí)驗(yàn)分析

        3.1 評(píng)測(cè)指標(biāo)

        推薦系統(tǒng)的評(píng)測(cè)指標(biāo),通常有如下幾種:

        設(shè)R(u) 是算法針對(duì)用戶u產(chǎn)生的推薦列表,T(u) 是用戶在測(cè)試集上的行為列表。

        (1)準(zhǔn)確率(precision)

        (12)

        (2)召回率(recall)

        (13)

        (3)綜合評(píng)價(jià)指標(biāo)F1-measure

        (14)

        3.2 對(duì)比算法介紹

        本文提出的VPHC算法將與User-KNN算法[2,5]、Item-KNN算法[2]、CNCF算法[11]、GRHC算法[22]進(jìn)行比對(duì)。

        User-KNN算法和Item-KNN算法是推薦系統(tǒng)經(jīng)典算法,相似度采用Jaccard相似度,計(jì)算公式參見(jiàn)文獻(xiàn)[2,5]。CNCF算法是基于概念格的協(xié)同過(guò)濾算法,其算法思想和公式表述參見(jiàn)文獻(xiàn)[11]。GRHC算法是啟發(fā)式概念的推薦方法,也是本文進(jìn)行優(yōu)化的方法,其推薦置信度如式(11)所示,推薦置信度閾值設(shè)置為0.5,內(nèi)涵閾值設(shè)置為2。

        3.3 生成概念數(shù)量及時(shí)間對(duì)比實(shí)驗(yàn)

        實(shí)驗(yàn)數(shù)據(jù)集見(jiàn)表3,其中MoveLens1~MoveLens4為MovieLens 100K的抽樣數(shù)據(jù)集,MovieLens 100K和Movie-Lens 1m數(shù)據(jù)集為經(jīng)典的推薦系統(tǒng)數(shù)據(jù)集,F(xiàn)ilmTrust數(shù)據(jù)集是2011年從整個(gè)FilmTrust網(wǎng)站上抓取的小型數(shù)據(jù)集,是高稀疏度下的推薦系統(tǒng)評(píng)測(cè)數(shù)據(jù)集。本文所用數(shù)據(jù)集中用戶對(duì)于電影的評(píng)分區(qū)間均為[1,5]。

        表3 數(shù)據(jù)集信息

        本文VPHC算法和其它算法在多種數(shù)據(jù)集下生成概念數(shù)量與所需時(shí)間對(duì)比見(jiàn)表4,VPHC算法中對(duì)象變精度閾值的選取為(μki+t),在表4中用(μ/t)表示。

        表4 生成概念數(shù)量與所需時(shí)間對(duì)比

        其中,CNCF算法構(gòu)造概念格時(shí)按照漸進(jìn)式Godin算法生成,所需時(shí)間較長(zhǎng),概念數(shù)量多。GRHC算法啟發(fā)式生成強(qiáng)概念,時(shí)間上比之極大縮短。VPHC算法采用加權(quán)面積的方式生成強(qiáng)概念,計(jì)算稍微復(fù)雜,但因?qū)ο笞兙乳撝祵⒁徊糠执蔚葦?shù)據(jù)剔除,運(yùn)行時(shí)間還要略低于GRHC算法。對(duì)比不同(μ/t)值下的VPHC算法,生成概念數(shù)量和所用時(shí)間都較為接近,在準(zhǔn)確率等指標(biāo)不同時(shí),可僅依靠離線評(píng)測(cè)指標(biāo)挑選出對(duì)特定數(shù)據(jù)集最優(yōu)的(μ/t)取值。

        3.4 三大離線評(píng)測(cè)指標(biāo)對(duì)比實(shí)驗(yàn)

        實(shí)驗(yàn)采用Movenlens4作為數(shù)據(jù)集,隨機(jī)選取80%訓(xùn)練集,20%測(cè)試集,因數(shù)據(jù)選取的隨機(jī)性,以5次測(cè)試的平均數(shù)為準(zhǔn)。抽樣數(shù)據(jù)集評(píng)測(cè)結(jié)果見(jiàn)表5。

        表5 Movelens4數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果

        由表5可以看出,GRHC算法和CNCF算法在此抽樣數(shù)據(jù)集中評(píng)測(cè)指標(biāo)相近,GRHC算法略低于CNCF算法,UserKNN算法準(zhǔn)確率較高,但召回率較低,VPHC算法明顯優(yōu)于UserKNN和ItemKNN算法,略高于CNCF算法和GRHC算法。其中,隨著(μ/t)值不同,導(dǎo)致所產(chǎn)生的強(qiáng)概念集合不同,VPHC算法準(zhǔn)確率等指標(biāo)有明顯的波動(dòng)。從表中可以看出在當(dāng)前數(shù)據(jù)集下,當(dāng)μ=1,t=-0.5時(shí)算法F1值最高。

        VPHC算法μ、t兩值單變量之間的比較如圖7和圖8所示(橫坐標(biāo)表示不同μ、t值下的VPHC算法,縱坐標(biāo)表示準(zhǔn)確率等3種指標(biāo)的結(jié)果)。

        圖7 VPHC算法(μ/t)在μ值逐漸增大t值不變時(shí)各類指標(biāo)比較

        圖8 VPHC算法(μ/t)在μ值不變t值逐漸增大時(shí)各類指標(biāo)比較

        通過(guò)圖7可以看出,算法在μ值增加t值不變時(shí),三大指標(biāo)前段平穩(wěn)并有緩慢上升的趨勢(shì),因?yàn)棣讨递^小時(shí)變精度閾值對(duì)每個(gè)對(duì)象來(lái)說(shuō)也會(huì)相對(duì)較小,致使一部分低評(píng)分信息用于強(qiáng)概念構(gòu)造,導(dǎo)致精度稍微下降;中段μ=1,t=0時(shí)達(dá)到最高;后段折線下降趨勢(shì)明顯,因?yàn)楹蠖坞S著μ值的增加變精度閾值對(duì)每個(gè)對(duì)象來(lái)說(shuō)越來(lái)越大,致使可用來(lái)構(gòu)造強(qiáng)概念的評(píng)分信息越來(lái)越少,強(qiáng)概念信息不全,導(dǎo)致評(píng)測(cè)指標(biāo)下降明顯。

        圖8是算法在μ值不變t值增加時(shí)的指標(biāo)比較折線圖,總體趨勢(shì)和圖7相似,變化趨勢(shì)較之圖7來(lái)說(shuō)略顯平穩(wěn),表示t值(±0.5)對(duì)于總體閾值的變動(dòng)略小于μ值(±0.2),VPHC算法指標(biāo)在μ=1,t=-0.5時(shí)達(dá)到最高。

        兩完整數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)結(jié)果見(jiàn)表6和表7。

        表6 MovieLens數(shù)據(jù)集中各算法實(shí)驗(yàn)結(jié)果

        表7 FilmTrust數(shù)據(jù)集中各算法實(shí)驗(yàn)結(jié)果

        由表6可以看出在MovieLens 100k數(shù)據(jù)集中μ=1,t=-0.5時(shí)VPHC算法效果最好,準(zhǔn)確率比GRHC算法高2.8%,召回率高0.82%,F(xiàn)1值高2.08%。

        對(duì)于FilmTrust數(shù)據(jù)集來(lái)說(shuō),VPHC算法在μ=1,t=0時(shí)效果較好,準(zhǔn)確率比GRHC算法高2.34%,召回率高2.29%,F(xiàn)1值高2.31%。并且這一數(shù)據(jù)集上基于概念結(jié)構(gòu)的算法離線指標(biāo)要遠(yuǎn)高于經(jīng)典kNN算法。例如,VPHC(1/0)算法F1值比UserKNN算法高19.01%,比ItemKNN算法高15.81%。

        綜合來(lái)看,本文在GRHC算法的基礎(chǔ)上提出的VPHC算法,在對(duì)其它算法的對(duì)比實(shí)驗(yàn)上表現(xiàn)出了較好的性能和精度。并且,根據(jù)表4可知,VPHC在各種(μ/t)值下的時(shí)間消耗均小于GRHC算法所需時(shí)間。

        4 結(jié)束語(yǔ)

        本文在啟發(fā)式推薦方法中加入對(duì)象閾值變精度概念,提出了基于對(duì)象閾值變精度概念的啟發(fā)式推薦方法。該方法既保留了啟發(fā)式方法對(duì)概念構(gòu)造的快速性,又提高了其精準(zhǔn)度,并且該方法根據(jù)對(duì)象變精度閾值(μki+t)中(μ/t)變量的取值不同可得到不同的對(duì)象閾值強(qiáng)概念,進(jìn)而產(chǎn)生不同的推薦。又因(μ/t)值變化時(shí)產(chǎn)生強(qiáng)概念的時(shí)間消耗接近,所以可找出最適合當(dāng)前數(shù)據(jù)集(μ/t)取值方式,使VPHC算法達(dá)到最優(yōu)。

        未來(lái)的工作主要包括以下方面:

        (1)本文推薦置信度公式過(guò)于簡(jiǎn)單,未來(lái)將考慮加入更多信息來(lái)完善置信度公式。

        (2)啟發(fā)式概念構(gòu)造打破了傳統(tǒng)概念格建格困難的屏障,將考慮將概念格中的其它優(yōu)秀結(jié)構(gòu)用啟發(fā)式概念構(gòu)造和提取規(guī)則。

        猜你喜歡
        置信度背景閾值
        “新四化”背景下汽車NVH的發(fā)展趨勢(shì)
        硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
        《論持久戰(zhàn)》的寫作背景
        小波閾值去噪在深小孔鉆削聲發(fā)射信號(hào)處理中的應(yīng)用
        基于自適應(yīng)閾值和連通域的隧道裂縫提取
        正負(fù)關(guān)聯(lián)規(guī)則兩級(jí)置信度閾值設(shè)置方法
        比值遙感蝕變信息提取及閾值確定(插圖)
        河北遙感(2017年2期)2017-08-07 14:49:00
        晚清外語(yǔ)翻譯人才培養(yǎng)的背景
        室內(nèi)表面平均氡析出率閾值探討
        置信度條件下軸承壽命的可靠度分析
        軸承(2015年2期)2015-07-25 03:51:04
        欧美疯狂做受xxxxx高潮| 文字幕精品一区二区三区老狼| 欧美成人看片一区二区三区尤物| 制服丝袜人妻中文字幕在线| 成人日韩av不卡在线观看| 自拍偷拍亚洲视频一区二区三区| 亚洲国产果冻传媒av在线观看| 国产午夜精品一区二区三区软件| 精品免费人伦一区二区三区蜜桃| 蜜桃视频网站在线免费观看| 久久伊人这里都是精品| 国产精品亚洲一区二区在线观看| 亚洲国产精品久久久久秋霞1| 中文字幕精品乱码一二三区| 蜜桃av在线免费网站| 国产精品久久久久久亚洲av| 欧美精品AⅤ在线视频| 国产精品午夜福利亚洲综合网| 国精产品一区一区三区| 国产精品久久毛片av大全日韩| 亚洲一区二区高清精品| 亚洲综合在不卡在线国产另类| 亚洲欧美中文字幕5发布| 18无码粉嫩小泬无套在线观看 | 日韩欧美在线综合网另类| 亚洲午夜福利在线观看| 国产精品98福利小视频| 午夜视频一区二区三区播放| 7m精品福利视频导航| 国产最新地址| 亚洲一区二区一区二区免费视频| 日日碰狠狠添天天爽超碰97久久 | 伊人网在线视频观看| 求网址日韩精品在线你懂的| 久久影院午夜理论片无码| 精品熟女日韩中文十区| 亚洲日产国无码| 精品一区中文字幕在线观看| 少妇无码太爽了不卡视频在线看| 人妻少妇无码中文幕久久| 狼狼色丁香久久女婷婷综合|