亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種新型電力大數(shù)據(jù)協(xié)同過(guò)濾推薦算法的設(shè)計(jì)與應(yīng)用

        2021-11-02 11:53:24楊凱利張其靜婁紅紅張雪清瞿強(qiáng)
        電力大數(shù)據(jù) 2021年6期
        關(guān)鍵詞:相似性關(guān)聯(lián)度物品

        楊凱利,張其靜,婁紅紅,張雪清,瞿強(qiáng)

        (貴州電網(wǎng)有限責(zé)任公司六盤水供電局,貴州 六盤水 553000)

        隨著智能電網(wǎng)時(shí)代的到來(lái),電力系統(tǒng)正在朝著數(shù)字化、信息化的方向快速發(fā)展,電力系統(tǒng)運(yùn)行數(shù)據(jù)也越來(lái)越快地產(chǎn)生與積累,如何基于用戶需求來(lái)高效地將海量數(shù)據(jù)中的有用信息提煉挖掘出來(lái),如何精準(zhǔn)地向用戶發(fā)送個(gè)性化的信息推薦,以便更好地提高電力系統(tǒng)的服務(wù)質(zhì)量,已經(jīng)成為當(dāng)前電力系統(tǒng)亟待思考的問(wèn)題[1-3]。推薦系統(tǒng)一直以來(lái)都是人工智能、數(shù)據(jù)挖掘、信息檢索等領(lǐng)域的“熱點(diǎn)”研究課題[4-7],電力系統(tǒng)也不例外。近年來(lái)國(guó)內(nèi)外先后出現(xiàn)了多種推薦算法,為電力大數(shù)據(jù)的個(gè)性化推薦打下堅(jiān)實(shí)的基礎(chǔ),包括混合推薦算法、基于圖結(jié)構(gòu)的推薦算法、協(xié)同過(guò)濾推薦算法、基于內(nèi)容的推薦算法等等。協(xié)同過(guò)濾推薦由于具備較佳的共享性與普適性,且推薦精度較高而被電力系統(tǒng)大規(guī)模應(yīng)用[8]。

        傳統(tǒng)協(xié)同過(guò)濾推薦算法通常都是對(duì)物品的相似性進(jìn)行計(jì)算,以計(jì)算結(jié)果為基準(zhǔn)來(lái)向用戶推薦,雖然推薦結(jié)果可對(duì)不同目標(biāo)之間的相似性進(jìn)行體現(xiàn),但并未考慮知識(shí)關(guān)聯(lián)度,而知識(shí)關(guān)聯(lián)度與目標(biāo)相似性沒有直接聯(lián)系[9]?;趥鹘y(tǒng)協(xié)同過(guò)濾推薦算法來(lái)看,與目標(biāo)相似的物品通常會(huì)取得較高的排名,而與目標(biāo)相關(guān)聯(lián)、但并不相似的物品則較易被忽略[10],這樣一來(lái),導(dǎo)致推薦結(jié)果的準(zhǔn)確度較低。有鑒于此,本文設(shè)計(jì)了一種新型電力大數(shù)據(jù)協(xié)同過(guò)濾推薦算法,有機(jī)融合了協(xié)同過(guò)濾技術(shù)與關(guān)聯(lián)規(guī)則挖掘技術(shù),將目標(biāo)之間的相似度與關(guān)聯(lián)度均納入到影響因素之中,推薦結(jié)果既存在著關(guān)聯(lián)性,又具備相似性。

        1 傳統(tǒng)協(xié)同過(guò)濾算法分類

        傳統(tǒng)協(xié)同過(guò)濾推薦算法通常可分為Item CF與User CF兩大類[11-12],其中,User CF是基于用戶的協(xié)同過(guò)濾推薦算法,更新次數(shù)較多、更新周期較短;其側(cè)重點(diǎn)在于對(duì)聚類組與用戶和的相似性進(jìn)行考慮,只要物品與用戶喜歡的類似物品相似,那么就會(huì)向用戶進(jìn)行推薦,其推薦順序往往是按照評(píng)分高低來(lái)確定[13-15],例如,若用戶曾經(jīng)在網(wǎng)上商城購(gòu)買或者搜索過(guò)洗衣機(jī)的網(wǎng)頁(yè),那么網(wǎng)站就會(huì)在短時(shí)間內(nèi)自動(dòng)向用戶發(fā)送大一堆與洗衣機(jī)相關(guān)的廣告和鏈接。

        Item CF則是基于物品的協(xié)同過(guò)濾推薦算法,它往往需要長(zhǎng)時(shí)間的在線計(jì)算才可獲得不同用戶之間的相似度關(guān)系,其計(jì)算復(fù)雜度并不會(huì)與用戶數(shù)量的多少直接相關(guān),故而可離線計(jì)算得出用戶相似度,準(zhǔn)確性更易于用戶接受。再加上物品數(shù)量要遠(yuǎn)小于用戶數(shù)量,且物品數(shù)據(jù)的穩(wěn)定性較強(qiáng),故而其計(jì)算復(fù)雜度要遠(yuǎn)低于User CF,再加上Item CF又能夠?yàn)橥扑]做出合理的解釋,具有很多優(yōu)勢(shì),故而被市場(chǎng)所大規(guī)模應(yīng)用,但是也存在著較大的改進(jìn)空間[16]。

        1.1 基于用戶的協(xié)同過(guò)濾推薦算法User CF

        基于用戶的協(xié)同過(guò)濾推薦算法User CF通常是以用戶所評(píng)分項(xiàng)目為基礎(chǔ)來(lái)對(duì)相似鄰居集進(jìn)行搜尋,再將相似鄰居集中的項(xiàng)目推薦給用戶。其計(jì)算原理為:在對(duì)不同用戶之間的相似度進(jìn)行計(jì)算時(shí),往往會(huì)將用戶對(duì)全部評(píng)分項(xiàng)目的偏好來(lái)作為計(jì)算向量,待將K鄰居找出來(lái)之后,再基于用戶對(duì)物品的偏好程度,以及鄰居的相似度權(quán)重來(lái)開展預(yù)測(cè)。所形成的項(xiàng)目序列作為用戶推薦序列[17]。

        協(xié)同過(guò)濾推薦算法User CF的主要優(yōu)點(diǎn)有三點(diǎn):第一,基于用戶的協(xié)同過(guò)濾推薦算法User CF特別適用于較為完整的用戶評(píng)分矩陣,可獲得較高的推薦精度;第二,基于用戶的協(xié)同過(guò)濾推薦算法User CF不需要對(duì)項(xiàng)目本身進(jìn)行深入分析,較好地適用于難以分析、結(jié)構(gòu)復(fù)雜的項(xiàng)目[18];第三,基于用戶的協(xié)同過(guò)濾推薦算法User CF可將目標(biāo)用戶的潛在興趣偏好進(jìn)行挖掘,所推薦的部分項(xiàng)目很有可能就會(huì)涵蓋用戶之前并未意識(shí)到的興趣偏好[19]。但是協(xié)同過(guò)濾推薦算法User CF也具有較為明顯的缺點(diǎn):第一,其擴(kuò)展性不太強(qiáng),若用戶數(shù)量越來(lái)越多,那么User CF的計(jì)算量異常龐大,計(jì)算復(fù)雜度很高;第二,矩陣稀疏性問(wèn)題較為嚴(yán)重,若存在著用戶-項(xiàng)目矩陣評(píng)分?jǐn)?shù)據(jù)稀疏的情況,那么就會(huì)直接導(dǎo)致用戶相似度計(jì)算結(jié)果出現(xiàn)嚴(yán)重失真的情況,難以向目標(biāo)用戶實(shí)現(xiàn)精準(zhǔn)推薦;第三,在新用戶剛加入系統(tǒng)時(shí),由于可用于評(píng)分的數(shù)據(jù)數(shù)量較少,甚至完全沒有評(píng)分?jǐn)?shù)據(jù),那么就較易出現(xiàn)“冷啟動(dòng)”現(xiàn)象,根本不能向目標(biāo)用戶進(jìn)行要推薦,就需要通過(guò)熱點(diǎn)推薦的方式來(lái)解決這一問(wèn)題,但效果并不太好[20]。

        1.2 基于物品的協(xié)同過(guò)濾推薦算法Item CF

        基于物品的協(xié)同過(guò)濾推薦算法Item CF并不從用戶角度來(lái)考慮計(jì)算問(wèn)題,而是從物品本身出發(fā)來(lái)進(jìn)行考慮。換而言之,就是通過(guò)用戶對(duì)物品的偏好程度來(lái)搜索出相似物品,而后再基于用戶歷史偏好來(lái)有針對(duì)性地推薦相似物品。例如,基于用戶歷史偏好購(gòu)買物品來(lái)看,偏好購(gòu)買物品A的用戶也傾向于喜歡物品C,那么就可得出:物品C與物品A之間的相似程度較高,而某一用戶C喜歡物品A,那么就可自然而然地判斷出它也有可能會(huì)偏好購(gòu)買物品C,那么就可向用戶C推薦其可能感興趣的物品?;谖锲返膮f(xié)同過(guò)濾推薦算法Item CF可離線計(jì)算得出用戶相似度,準(zhǔn)確性更易于用戶接受,計(jì)算復(fù)雜度要遠(yuǎn)低于User CF,再加上Item CF又能夠?yàn)橥扑]做出合理的解釋,具有很多優(yōu)勢(shì),市場(chǎng)應(yīng)用效果較佳。但是基于物品的協(xié)同過(guò)濾推薦算法Item CF也存在著較多的避免,主要體現(xiàn)在:第一,Item CF算法并不會(huì)對(duì)不同用戶之間的差異進(jìn)行考慮,但實(shí)際上不同的用戶往往會(huì)具有不同的特點(diǎn)及偏好,再加上使用者并不能予以確定,這樣一來(lái),就會(huì)造成推薦精度不高的現(xiàn)象[21]。第二,在新物品剛加入系統(tǒng)時(shí),由于可用于評(píng)分的數(shù)據(jù)數(shù)量較少,甚至完全沒有評(píng)分?jǐn)?shù)據(jù),那么必然很容易在很長(zhǎng)時(shí)間內(nèi)都難以向目標(biāo)用戶進(jìn)行推薦。

        2 基于知識(shí)關(guān)聯(lián)度的電力大數(shù)據(jù)個(gè)性化推薦

        2.1 知識(shí)樹的構(gòu)建

        電網(wǎng)領(lǐng)域知識(shí)主要分為兩大類,分別是動(dòng)態(tài)知識(shí)與靜態(tài)知識(shí),其中,動(dòng)態(tài)知識(shí)既包括了電力系統(tǒng)運(yùn)行過(guò)程中所形成的實(shí)時(shí)數(shù)據(jù),又包括了以時(shí)間為關(guān)鍵屬性的預(yù)測(cè)型知識(shí);靜態(tài)知識(shí)則涵蓋了電力故障診斷知識(shí)、電力運(yùn)行決策知識(shí)、電力規(guī)程類知識(shí)、電力設(shè)備知識(shí)等。不同知識(shí)之間的聯(lián)系通常并不明顯,往往會(huì)讓用戶難以理解,且不會(huì)給用戶提供易于查詢的推薦信息[22]。由此可見,選擇一種較佳的知識(shí)表示方法就顯得極為重要,既有利于構(gòu)建清晰的知識(shí)結(jié)構(gòu),又有利于提高知識(shí)檢索效率與知識(shí)存儲(chǔ)效率,還有利于縮短數(shù)據(jù)挖掘時(shí)間,進(jìn)而可在很大程度上增強(qiáng)數(shù)據(jù)挖掘效率。

        將電網(wǎng)領(lǐng)域知識(shí)劃分為粒度不同的知識(shí)項(xiàng),再采用知識(shí)樹結(jié)構(gòu)將其貫穿起來(lái),實(shí)現(xiàn)知識(shí)的可視化、關(guān)聯(lián)化、體系化,必然可較好地符合當(dāng)前知識(shí)表示的需求。本文以知識(shí)點(diǎn)為單元來(lái)分解電網(wǎng)數(shù)據(jù),使之形成若干個(gè)知識(shí)項(xiàng),通過(guò)構(gòu)建知識(shí)樹模型KT來(lái)將不同的知識(shí)項(xiàng)關(guān)聯(lián)起來(lái),如公式(1)。

        式中,KP為知識(shí)點(diǎn)屬性,KR為知識(shí)點(diǎn)關(guān)系。

        2.1.1 知識(shí)點(diǎn)屬性KP

        KP可通過(guò)五元組{KID,KN,KW,KI,KP}來(lái)進(jìn)行描述,其中,KP為與知識(shí)點(diǎn)相互對(duì)應(yīng)的資源路徑,KI為知識(shí)點(diǎn)的重要程度,KID為知識(shí)點(diǎn)的編號(hào),KN為知識(shí)點(diǎn)的名稱,KW為知識(shí)點(diǎn)的關(guān)鍵字。

        KI是知識(shí)點(diǎn)屬性的關(guān)鍵性因素,重要程度與其被引用次數(shù)直接掛鉤,若被引用次數(shù)越多,那么說(shuō)明該知識(shí)點(diǎn)越重要。假設(shè)x為某知識(shí)點(diǎn)的被引用次數(shù),那么可用隸屬函數(shù)公式(2)來(lái)描述其重要程度:

        2.1.2 知識(shí)點(diǎn)關(guān)系KR

        KP可通過(guò)四元組{RN,KPN,Relation,Degree}來(lái)進(jìn)行描述,其中,KPN為關(guān)聯(lián)知識(shí)點(diǎn)編號(hào)及主知識(shí)點(diǎn)編號(hào),RN為關(guān)系編號(hào),Relation為相關(guān)知識(shí)點(diǎn)與主知識(shí)點(diǎn)關(guān)系類型,Degree為相關(guān)知識(shí)點(diǎn)與主知識(shí)點(diǎn)關(guān)系程度。

        2.2 知識(shí)項(xiàng)相似度矩陣的生成

        從目前來(lái)看,電力系統(tǒng)的用戶數(shù)據(jù)存在著明顯的多變特征,而領(lǐng)域知識(shí)則要相對(duì)穩(wěn)定的多[23],所以,本文有機(jī)融合了協(xié)同過(guò)濾技術(shù)與關(guān)聯(lián)規(guī)則挖掘技術(shù),形成了一種新型電力大數(shù)據(jù)協(xié)同過(guò)濾推薦算法,即:聯(lián)合算法AR-Item CF。聯(lián)合算法AR-Item CF以電力運(yùn)行系統(tǒng)日志為載體,深入挖掘用戶評(píng)價(jià)、用戶關(guān)注、用戶收藏、用戶瀏覽等知識(shí)項(xiàng)行為;按照不同知識(shí)項(xiàng)行為的輕重程度來(lái)劃分為不同的權(quán)重,以此來(lái)計(jì)算得出用戶評(píng)分,在吸取Item CF算法優(yōu)點(diǎn)的態(tài)勢(shì),又將知識(shí)關(guān)聯(lián)度作為影響推薦結(jié)果排名的主要因素之一,同時(shí)融合了協(xié)同過(guò)濾技術(shù)與關(guān)聯(lián)規(guī)則挖掘技術(shù),將目標(biāo)之間的相似度與關(guān)聯(lián)度均納入到影響因素之中,推薦結(jié)果既存在著關(guān)聯(lián)性,又具備相似性,所形成的用戶-知識(shí)評(píng)分矩陣如表1所示。

        表1 用戶-知識(shí)評(píng)分矩陣Tab.1 Scoring matrix of user-knowledge

        (1)訓(xùn)練集選取用戶-知識(shí)評(píng)分矩陣中前四分之三的知識(shí)數(shù)據(jù)項(xiàng)集,測(cè)試集則選取用戶-知識(shí)評(píng)分矩陣中余下的后四分之一的知識(shí)數(shù)據(jù)項(xiàng)集;用戶興趣模型在訓(xùn)練集上進(jìn)行構(gòu)建,預(yù)測(cè)工作則在測(cè)試集上開展。

        (2)對(duì)知識(shí)項(xiàng)的相似性進(jìn)行計(jì)算。不同知識(shí)項(xiàng)之間的相似度可通過(guò)余弦相似性方法來(lái)進(jìn)行計(jì)算,以知識(shí)項(xiàng)i和知識(shí)項(xiàng)j為例,二者所能形成的相似性計(jì)算公式為(3):

        (3)以公式(3)為基準(zhǔn),可形成知識(shí)項(xiàng)余弦相似度矩陣ASK,如表2所示。

        2.3 關(guān)聯(lián)矩陣生成

        知識(shí)項(xiàng)與最近鄰知識(shí)項(xiàng)之間的關(guān)系屬于典型的顯性關(guān)系,緊緊圍繞著“以知識(shí)項(xiàng)為中心”;而知識(shí)項(xiàng)與非最近鄰知識(shí)項(xiàng)之間的關(guān)系以及不同知識(shí)項(xiàng)組合而衍生出來(lái)的新知識(shí)點(diǎn)等等均屬于典型的隱性關(guān)系,只有通過(guò)深入地挖掘與剖析之后才可顯現(xiàn)出來(lái),其關(guān)聯(lián)性通常是通過(guò)置信度來(lái)進(jìn)行表示??v觀國(guó)內(nèi)外關(guān)聯(lián)規(guī)則挖掘技術(shù)領(lǐng)域,最常用的經(jīng)典算法當(dāng)屬Apriori算法;無(wú)論是在置信度,還是在關(guān)聯(lián)支持度計(jì)算方面,Apriori算法均有較佳的應(yīng)用優(yōu)勢(shì)[24-25]。有鑒于此,本文在對(duì)不同知識(shí)項(xiàng)之間的關(guān)聯(lián)度進(jìn)行計(jì)算時(shí),所選用的算法依然為Apriori算法,其計(jì)算步驟為:第一,Apriori算法的輸入項(xiàng)為知識(shí)樹中的知識(shí)項(xiàng);第二,對(duì)數(shù)據(jù)集進(jìn)行逐一單遍掃描,進(jìn)而得出每個(gè)知識(shí)項(xiàng)的支持度,形成頻繁1-項(xiàng)集;第三,采用Apriori算法來(lái)掃描全部的數(shù)據(jù)集,候選2-項(xiàng)集的支持度計(jì)數(shù)通過(guò)子集函數(shù)來(lái)進(jìn)行計(jì)算;第四,為了防止出現(xiàn)低置信度的計(jì)算結(jié)果及高相似性的計(jì)算結(jié)果,只要候選項(xiàng)集的支持度計(jì)數(shù)低于minsup,那么則將其置信度設(shè)定為0;第五,對(duì)候選2-項(xiàng)集的置信度conf進(jìn)行計(jì)算,進(jìn)而形成如表3所示的知識(shí)項(xiàng)關(guān)聯(lián)矩陣。

        表2 知識(shí)項(xiàng)余弦相似度矩陣Tab.2 Cosine similarity matrix of knowledge term

        表3 知識(shí)項(xiàng)關(guān)聯(lián)矩陣Tab.3 Association matrix of knowledge item

        2.4 產(chǎn)生推薦

        (1)通過(guò)將知識(shí)項(xiàng)關(guān)聯(lián)矩陣與知識(shí)項(xiàng)余弦相似度矩陣進(jìn)行求和計(jì)算,那么就可形成計(jì)算用戶對(duì)知識(shí)項(xiàng)興趣度的矩陣ASRK。

        (2)基于用戶的目標(biāo)知識(shí)項(xiàng),可在計(jì)算用戶對(duì)知識(shí)項(xiàng)興趣度的矩陣ASRK中查找與其密切相關(guān)的前K個(gè)知識(shí)項(xiàng)。

        (3)用戶對(duì)知識(shí)項(xiàng)興趣度的計(jì)算公式為(4),由公式(4)可見,若知識(shí)項(xiàng)與用戶歷史上所查找的知識(shí)項(xiàng)較為相似,且關(guān)聯(lián)度較高,也就是同時(shí)兼具相似度與關(guān)聯(lián)度,那么就能夠在用戶推薦列表中位列前茅[26-29]。

        式中,Rui為對(duì)知識(shí)項(xiàng)i的興趣程度;N(u)為用戶歷史上所查找的知識(shí)項(xiàng)集合;ASRK(j,k)為K個(gè)知識(shí)項(xiàng)之集合,且這些知識(shí)項(xiàng)均與知識(shí)項(xiàng)j存在和較高的相似性與關(guān)聯(lián)度;Wji為知識(shí)項(xiàng)在K個(gè)知識(shí)項(xiàng)之集合的對(duì)應(yīng)值。

        3 實(shí)驗(yàn)分析

        3.1 測(cè)試指標(biāo)

        本文通過(guò)MAE(平均絕對(duì)偏差)來(lái)對(duì)實(shí)際用戶評(píng)分與預(yù)測(cè)用戶評(píng)分的偏差程度進(jìn)行計(jì)算和預(yù)算,以此為依據(jù)來(lái)評(píng)價(jià)推薦結(jié)果的精度,若平均絕對(duì)偏差越小,那么就表明推薦結(jié)果的精度越高、推薦質(zhì)量越高;若平均絕對(duì)偏差越大,那么就表明推薦結(jié)果的精度越低、推薦質(zhì)量越低。假定預(yù)測(cè)用戶評(píng)分的集合為{p1,p2,…,pN},實(shí)際用戶評(píng)分的集合為{q1,q2,…,qN},那么就可通過(guò)公式(4)來(lái)計(jì)算MAE(平均絕對(duì)偏差):

        假定某用戶的待推薦項(xiàng)目集為W={ω1,ω2,…,ωN},令N為待推薦項(xiàng)目數(shù),ωi為待推薦項(xiàng)目;若用戶的全部最近鄰居中均無(wú)與ωk相關(guān)的實(shí)際評(píng)估記錄,這樣一來(lái),就會(huì)出現(xiàn)ωk未能夠被推薦的情況,那么就會(huì)導(dǎo)致有M個(gè)項(xiàng)目未被推薦,當(dāng)然M的取值應(yīng)該要不大于N,那么該用戶的項(xiàng)目推薦率(IRR)就可通過(guò)(N-M)/N來(lái)進(jìn)行計(jì)算。項(xiàng)目推薦率(IRR)大多都用于對(duì)用戶周圍最近鄰居的查找效率進(jìn)行衡量,并且還可從另外一個(gè)角度來(lái)體現(xiàn)出用戶評(píng)分?jǐn)?shù)據(jù)庫(kù)的離散度。在平均絕對(duì)偏差MAE相同的情況下,項(xiàng)目推薦率(IRR)與算法的推薦效率呈現(xiàn)出較為明顯的正比關(guān)系,若項(xiàng)目推薦率(IRR)越高,那么就表明算法的推薦效率越高;若項(xiàng)目推薦率(IRR)越低,那么就表明算法的推薦效率越差。

        3.2 實(shí)驗(yàn)結(jié)果

        本實(shí)驗(yàn)所采用的數(shù)據(jù)集來(lái)自電力安全規(guī)程系統(tǒng)的資源庫(kù),從中隨機(jī)選擇1000條數(shù)據(jù),涵蓋700條知識(shí)、300個(gè)用戶。訓(xùn)練集選取實(shí)驗(yàn)數(shù)據(jù)集中前四分之三的數(shù)據(jù),測(cè)試集則選取實(shí)驗(yàn)數(shù)據(jù)集中余下的后四分之一的數(shù)據(jù),分別采用本文所提出的新型電力大數(shù)據(jù)協(xié)同過(guò)濾推薦算法(聯(lián)合算法AR-Item CF)與傳統(tǒng)的Item CF算法進(jìn)行對(duì)比,所得出的平均絕對(duì)偏差MAE實(shí)驗(yàn)結(jié)果對(duì)比如圖1所示,所得出的項(xiàng)目推薦率IRR實(shí)驗(yàn)結(jié)果對(duì)比如圖2所示。

        圖1 平均絕對(duì)偏差MAE實(shí)驗(yàn)結(jié)果對(duì)比Fig.1 Comparison of the results of the average absolute deviation MAE experiment

        圖2 項(xiàng)目推薦率IRR實(shí)驗(yàn)結(jié)果對(duì)比Fig.2 Comparison of IRR experiment results of project recommendation rate

        由圖1可知,無(wú)論是聯(lián)合算法AR-Item CF,還是與傳統(tǒng)Item CF算法,平均絕對(duì)偏差MAE均會(huì)隨著最近鄰居數(shù)的增大而小幅下降,而后其值又基本保持不變的狀態(tài),但在最近鄰居數(shù)不變的前提下,聯(lián)合算法AR-Item CF的平均絕對(duì)偏差MAE明顯要低于傳統(tǒng)Item CF算法,如前所述,若平均絕對(duì)偏差越小,那么就表明推薦結(jié)果的精度越高、推薦質(zhì)量越高;若平均絕對(duì)偏差越大,那么就表明推薦結(jié)果的精度越低、推薦質(zhì)量越低。由此可見,聯(lián)合算法ARItem CF推薦結(jié)果的精度更高、推薦質(zhì)量更高。由圖2可知,無(wú)論是聯(lián)合算法AR-Item CF,還是與傳統(tǒng)Item CF算法,項(xiàng)目推薦率IRR均隨著最近鄰居數(shù)的增大而逐漸增大,但在最近鄰居數(shù)不變的前提下,聯(lián)合算法AR-Item CF的項(xiàng)目推薦率IRR明顯要高于傳統(tǒng)Item CF算法,如前所述,若項(xiàng)目推薦率(IRR)越高,那么就表明算法的推薦效率越高;若項(xiàng)目推薦率(IRR)越低,那么就表明算法的推薦效率越差。由此可見,聯(lián)合算法AR-Item CF的推薦效率更高。綜合可知:本文所提出的新型電力大數(shù)據(jù)協(xié)同過(guò)濾推薦算法(聯(lián)合算法AR-Item CF)能夠在很大程度上增強(qiáng)推薦系統(tǒng)的推薦效率與推薦質(zhì)量,取得較佳的效果。

        4 結(jié)論

        (1)聯(lián)合算法AR-Item CF以電力運(yùn)行系統(tǒng)日志為載體,深入挖掘用戶評(píng)價(jià)、用戶關(guān)注、用戶收藏、用戶瀏覽等知識(shí)項(xiàng)行為;按照不同知識(shí)項(xiàng)行為的輕重程度來(lái)劃分為不同的權(quán)重,以此來(lái)計(jì)算得出用戶評(píng)分,在吸取Item CF算法優(yōu)點(diǎn)的態(tài)勢(shì),又將知識(shí)關(guān)聯(lián)度作為影響推薦結(jié)果排名的主要因素之一,同時(shí)融合了協(xié)同過(guò)濾技術(shù)與關(guān)聯(lián)規(guī)則挖掘技術(shù),將目標(biāo)之間的相似度與關(guān)聯(lián)度均納入到影響因素之中,推薦結(jié)果既存在著關(guān)聯(lián)性,又具備相似性。

        (2)本實(shí)驗(yàn)所采用的數(shù)據(jù)集來(lái)自電力安全規(guī)程系統(tǒng)的資源庫(kù),從中隨機(jī)選擇1000條數(shù)據(jù),涵蓋700條知識(shí)、300個(gè)用戶。訓(xùn)練集選取實(shí)驗(yàn)數(shù)據(jù)集中前四分之三的數(shù)據(jù),測(cè)試集則選取實(shí)驗(yàn)數(shù)據(jù)集中余下的后四分之一的數(shù)據(jù),分別采用本文所提出的新型電力大數(shù)據(jù)協(xié)同過(guò)濾推薦算法(聯(lián)合算法ARItem CF)與傳統(tǒng)的Item CF算法進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果表明:本文所提出的新型電力大數(shù)據(jù)協(xié)同過(guò)濾推薦算法(聯(lián)合算法AR-Item CF)能夠在很大程度上增強(qiáng)推薦系統(tǒng)的推薦效率與推薦質(zhì)量,取得較佳的效果。

        猜你喜歡
        相似性關(guān)聯(lián)度物品
        一類上三角算子矩陣的相似性與酉相似性
        稱物品
        “雙十一”,你搶到了想要的物品嗎?
        淺析當(dāng)代中西方繪畫的相似性
        誰(shuí)動(dòng)了凡·高的物品
        基于灰色關(guān)聯(lián)度的水質(zhì)評(píng)價(jià)分析
        低滲透黏土中氯離子彌散作用離心模擬相似性
        基于灰關(guān)聯(lián)度的鋰電池組SOH評(píng)價(jià)方法研究
        找物品
        基于灰色關(guān)聯(lián)度的公交線網(wǎng)模糊評(píng)價(jià)
        河南科技(2014年16期)2014-02-27 14:13:25
        亚洲中文字幕巨乳人妻| 欧美情侣性视频| 成人欧美日韩一区二区三区| 日本三级欧美三级人妇视频黑白配| 国产国语熟妇视频在线观看 | 国产人妻精品一区二区三区| 久久亚洲av成人无码国产| 国产一国产一级新婚之夜| 亚洲国产精品悠悠久久琪琪| 97久久综合区小说区图片区| 色老板在线免费观看视频日麻批| 99久久婷婷国产精品综合| 欧美高清精品一区二区| 一边做一边喷17p亚洲乱妇50p| 人禽无码视频在线观看| 国产AV无码一区精品天堂| 一本色道久久综合中文字幕| 亚洲精品中文字幕一二三四| 亚洲国产精品成人久久久| 天天爽夜夜爽人人爽一区二区 | 国产午夜亚洲精品国产成人av| 国产麻豆精品精东影业av网站| 亚洲日韩国产一区二区三区在线| 五月中文字幕| 国产午夜精品久久久久| 亚洲精品中文字幕码专区| 日本伊人精品一区二区三区| 国产丝袜美女一区二区三区| 久久水蜜桃亚洲av无码精品麻豆 | 国产精品亚洲专区无码web| av在线免费观看你懂的| 中文字幕日韩有码国产| 久久精品国产亚洲av果冻传媒 | 一区二区特别黄色大片| 日本女同性恋一区二区三区网站| 精品一二三四区中文字幕| 久久久久99精品成人片直播 | 精品一区二区三区国产av| 少妇伦子伦精品无吗| 人妻在线日韩免费视频| 精品久久久久一区二区国产|