亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)的推薦方法

        2020-03-15 10:15:04李亞瑩
        現(xiàn)代計(jì)算機(jī) 2020年4期
        關(guān)鍵詞:語義特征結(jié)構(gòu)

        李亞瑩

        (四川大學(xué)計(jì)算機(jī)學(xué)院,成都610065)

        0 引言

        近年來,由不同類型的節(jié)點(diǎn)和邊構(gòu)成的異構(gòu)信息網(wǎng)絡(luò)備受關(guān)注,它已被作為一種信息建模工具應(yīng)用于推薦系統(tǒng),稱為基于異構(gòu)信息網(wǎng)絡(luò)的推薦?,F(xiàn)有方法主要依賴節(jié)點(diǎn)相似性提取推薦輔助信息,其有效性略顯不足。因此,有學(xué)者提出基于異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)的推薦[1]。網(wǎng)絡(luò)表征學(xué)習(xí)為網(wǎng)絡(luò)中的節(jié)點(diǎn)學(xué)習(xí)低維表示向量,該向量被認(rèn)為保存著節(jié)點(diǎn)在網(wǎng)絡(luò)中的特征信息,可以直接用于現(xiàn)有機(jī)器學(xué)習(xí)算法解決問題。

        異構(gòu)網(wǎng)絡(luò)表征學(xué)習(xí)面臨著諸多挑戰(zhàn),如節(jié)點(diǎn)和邊的異構(gòu)性以及網(wǎng)絡(luò)中信息融合等帶來的挑戰(zhàn),而這些與基于異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)的推薦息息相關(guān)[2]。為解決上述問題,Shi等[1]利用元路徑抽取異構(gòu)網(wǎng)絡(luò)中的多個同構(gòu)網(wǎng)絡(luò)并對其進(jìn)行表征學(xué)習(xí),然后利用融合函數(shù)及矩陣分解進(jìn)行評分預(yù)測。實(shí)驗(yàn)結(jié)果展示了其在推薦性能上的提升,但依然存在不足。

        首先,元路徑只能表示簡單語義,對復(fù)雜語義無能為力。為了捕獲復(fù)雜語義,Huang等[3]提出元結(jié)構(gòu)。其次,網(wǎng)絡(luò)表征學(xué)習(xí)啟發(fā)自自然語言處理中詞向量學(xué)習(xí),多數(shù)算法將節(jié)點(diǎn)類比為詞匯,將節(jié)點(diǎn)序列類比為語句,在訓(xùn)練向量時亦采用訓(xùn)練詞向量的skip-gram模型。然而,語句長度通常多變,而由隨機(jī)游走生成的節(jié)點(diǎn)序列卻長度相同。

        針對以上問題,本文提出基于元結(jié)構(gòu)和截?cái)嚯S機(jī)游走的異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)MSHE,并將每個元結(jié)構(gòu)上學(xué)習(xí)到的節(jié)點(diǎn)向量作為特征融入推薦樣本,結(jié)合FFM模型預(yù)測評分,提出基于異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)的推薦方法MSHER。實(shí)驗(yàn)表明,該方法在推薦性能上表現(xiàn)良好。

        1 相關(guān)定義

        本節(jié)將介紹相關(guān)背景知識,以便對后續(xù)算法的闡述。

        定義1(異構(gòu)信息網(wǎng)絡(luò)[4])一個異構(gòu)信息網(wǎng)絡(luò)可以表示為G={V,E},其中V、E分別是節(jié)點(diǎn)和邊集合。網(wǎng)絡(luò)中還存在著映射φ:V→A以及φ:E→R,其中A、R分別是節(jié)點(diǎn)和邊的類型集合,滿足|A|>1、|R|>1。

        定義2(網(wǎng)絡(luò)模式[4])對于異構(gòu)信息網(wǎng)絡(luò)G={V,E},其網(wǎng)絡(luò)模式TG=(A,R)是定義在A和R上的有向圖。

        圖1 展示了一個構(gòu)建在Yelp數(shù)據(jù)集上的異構(gòu)信息網(wǎng)絡(luò),圖2是其網(wǎng)絡(luò)模式。在該網(wǎng)絡(luò)中,有6種類型的節(jié)點(diǎn):用戶(U)、商家(B)、類別(Cat)、城市(Ci)、評論(R)以及關(guān)鍵字(K);節(jié)點(diǎn)之間存在不同類型的關(guān)系,如用戶和項(xiàng)目的簽到關(guān)系、項(xiàng)目和類別的屬于關(guān)系等。

        圖1 異構(gòu)信息網(wǎng)絡(luò)示例

        圖2 網(wǎng)絡(luò)模式示例

        定義3(元路徑[4])元路徑P是定義在網(wǎng)絡(luò)模式TG=(A,R)上的路徑,用于表示節(jié)點(diǎn)之間的復(fù)合關(guān)系,其表示形式如下:可簡寫為A1A2···Al+1。

        定義4(元結(jié)構(gòu)[3])給定網(wǎng)絡(luò)模式TG=(A,R),元結(jié)構(gòu)S=(N,M,ns,nt)是一個以ns為源點(diǎn)、以nt為終點(diǎn)的有向無環(huán)圖,其中N、M分別是A和R的子集。

        圖3 展示了Yelp網(wǎng)絡(luò)中一個元路徑及元結(jié)構(gòu)示例。元路徑P表示由兩個用戶發(fā)表的評論包含同一關(guān)鍵字。而元結(jié)構(gòu)S表示由兩個用戶發(fā)表的評論不但包含同一關(guān)鍵字,并且針對同一商家。

        圖3 Yelp網(wǎng)絡(luò)中的元路徑及元結(jié)構(gòu)示例

        2 基于異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)的推薦

        2.1 基于元結(jié)構(gòu)和截?cái)嚯S機(jī)游走的異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)

        本文利用網(wǎng)絡(luò)表征學(xué)習(xí)的方法提取和表示異構(gòu)信息網(wǎng)絡(luò)中用于推薦的信息。本節(jié)將按照圖生成、隨機(jī)游走以及表示學(xué)習(xí)對MSHE模型進(jìn)行介紹。

        (1)圖生成

        給定一個由推薦數(shù)據(jù)集構(gòu)建的異構(gòu)信息網(wǎng)絡(luò),本文的目標(biāo)是為每個用戶、項(xiàng)目節(jié)點(diǎn)學(xué)習(xí)低維表示向量。與先前工作不同,本文主要基于元結(jié)構(gòu)挖掘網(wǎng)絡(luò)中的語義。為解決元結(jié)構(gòu)的非線性結(jié)構(gòu)問題,將以圖3中元結(jié)構(gòu)為例,提出如下方案:

        ①首先,從原網(wǎng)絡(luò)中抽取用戶和評論節(jié)點(diǎn),并依原網(wǎng)絡(luò)建立鏈接,構(gòu)成異構(gòu)圖BG;

        ②其次,從原網(wǎng)絡(luò)中找出既包含相同關(guān)鍵字又針對同一商家的評論對,并放入集合W;

        ③最后,遍歷集合W,將W中存在的評論對,于BG中建立鏈接,形成關(guān)系R-R。

        如圖4所示,BG中的R-R關(guān)系等價于圖3中元結(jié)構(gòu)的分支關(guān)系,在BG中沿元路徑URRU進(jìn)行矩陣運(yùn)算可得到具有元結(jié)構(gòu)語義的同構(gòu)鄰接矩陣AUU,根據(jù)該矩陣構(gòu)建同構(gòu)網(wǎng)絡(luò)HG,以便后續(xù)節(jié)點(diǎn)序列的生成。

        圖4 圖生成示例

        (2)隨機(jī)游走

        MSHE模型將在HG上進(jìn)行隨機(jī)游走。為了獲得更有意義且與語句特征更相符的節(jié)點(diǎn)序列,在隨機(jī)游走中引入節(jié)點(diǎn)相似性和停止概率。與當(dāng)前節(jié)點(diǎn)相似性越高的節(jié)點(diǎn),更有可能成為下一跳節(jié)點(diǎn);而停止概率則表示隨機(jī)游走在當(dāng)前節(jié)點(diǎn)終止的概率,若當(dāng)前節(jié)點(diǎn)到其鄰居節(jié)點(diǎn)的所有轉(zhuǎn)移概率均小于停止概率,則隨機(jī)游走在當(dāng)前節(jié)點(diǎn)終止。

        對于從當(dāng)前節(jié)點(diǎn)i到下一跳節(jié)點(diǎn)x的轉(zhuǎn)移概率,本文有如下定義:

        其中,O(i)表示節(jié)點(diǎn)i在HG上的度。

        (3)表示學(xué)習(xí)

        給定節(jié)點(diǎn)序列及固定窗長,便可構(gòu)建節(jié)點(diǎn)u的鄰居集合Nu。依照node2vec[5],得到如下優(yōu)化函數(shù):

        其中,g:V→Rd是將節(jié)點(diǎn)映射到d維特征空間的目標(biāo)學(xué)習(xí)函數(shù),Nu?V表示在給定元結(jié)構(gòu)上節(jié)點(diǎn)u的鄰居集合,可以利用SGD優(yōu)化式(3)學(xué)習(xí)映射函數(shù)g(·)。

        綜合上述三個過程,下面給出MSNE模型在單個元結(jié)構(gòu)上的整體描述。

        2.2 基于異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)的推薦方法

        通過MSNE模型,每個用戶節(jié)點(diǎn)u和項(xiàng)目節(jié)點(diǎn)b均會生成多組低維向量。不同于現(xiàn)有工作,本文并未學(xué)習(xí)融合函數(shù),而是以推薦為導(dǎo)向,將低維向量作為特征融入推薦樣本,助益推薦。對于每個推薦樣本xn,本文有如下定義:

        給定(4)式中的所有特征,本文利用FFM[6]計(jì)算樣本xn的評分:

        其中,w0是全局權(quán)重;wi是第i個特征的一階權(quán)重;fj是第j個特征所屬的域,vi,fj是第i個特征在域fj上的隱向量。本文域個數(shù)由元結(jié)構(gòu)數(shù)量決定,并規(guī)定由同一元結(jié)構(gòu)生成的特征屬于同一個域。上述模型參數(shù)可以通過下式學(xué)習(xí):

        其中,yn是第n個樣本的真實(shí)評分,N是所有樣本的數(shù)量。

        3 實(shí)驗(yàn)

        3.1 實(shí)驗(yàn)數(shù)據(jù)

        實(shí)驗(yàn)數(shù)據(jù)來自Yelp網(wǎng)站提供的Yelp數(shù)據(jù)集以及文獻(xiàn)[7]提供的Amazon數(shù)據(jù)集。表1和表2給出了兩個數(shù)據(jù)集的詳細(xì)信息,并于表3展示了本文設(shè)計(jì)的元結(jié)構(gòu)。

        表1 Yelp數(shù)據(jù)集

        表2 Amazon數(shù)據(jù)集

        表3 實(shí)驗(yàn)數(shù)據(jù)集上的元結(jié)構(gòu)

        3.2 實(shí)驗(yàn)分析

        本文使用均方根誤差RMSE作為評估指標(biāo),RMSE越小,算法性能越好。

        本文先比較算法本身。圖5的①、②分別展示了MSNER方法在兩個數(shù)據(jù)集上是否使用元結(jié)構(gòu)進(jìn)行推薦的結(jié)果。由圖可知,使用元結(jié)構(gòu)結(jié)果明顯優(yōu)于未使用結(jié)果。由此可見,挖掘語義信息時,元結(jié)構(gòu)的確優(yōu)于元路徑。

        圖5 實(shí)驗(yàn)結(jié)果

        除自身比較,還將算法與其他算法對比。由于使用基于元結(jié)構(gòu)的截?cái)嚯S機(jī)游走捕獲網(wǎng)絡(luò)語義信息,并且避免了學(xué)習(xí)融合函數(shù)帶來的損失,從圖5的③、④可以看出,MSNER算法在兩個數(shù)據(jù)集上性能均高于文獻(xiàn)[1]中使用元路徑及學(xué)習(xí)融合函數(shù)的HE-Rec算法,由此也說明了本文算法的有效性。

        4 結(jié)語

        隨著數(shù)據(jù)的海量增長,推薦系統(tǒng)對眾多線上應(yīng)用愈發(fā)重要。本文介紹了一種基于異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)的推薦方法,利用異構(gòu)信息網(wǎng)絡(luò)對推薦輔助信息建模,提出基于元結(jié)構(gòu)和截?cái)嚯S機(jī)游走的異構(gòu)信息網(wǎng)絡(luò)表征學(xué)習(xí)去刻畫用戶和項(xiàng)目特征。對于單個用戶和項(xiàng)目的多組特征,本文并未學(xué)習(xí)統(tǒng)一的融合函數(shù),而是將每組特征融入推薦樣本,直接利用FFM模型進(jìn)行評分預(yù)測。實(shí)驗(yàn)結(jié)果證明了該方法對推薦的有效性。

        猜你喜歡
        語義特征結(jié)構(gòu)
        《形而上學(xué)》△卷的結(jié)構(gòu)和位置
        語言與語義
        如何表達(dá)“特征”
        論結(jié)構(gòu)
        中華詩詞(2019年7期)2019-11-25 01:43:04
        不忠誠的四個特征
        抓住特征巧觀察
        論《日出》的結(jié)構(gòu)
        “上”與“下”語義的不對稱性及其認(rèn)知闡釋
        創(chuàng)新治理結(jié)構(gòu)促進(jìn)中小企業(yè)持續(xù)成長
        認(rèn)知范疇模糊與語義模糊
        亚洲人妻av综合久久| 久久久久人妻精品一区二区三区| 粉嫩国产av一区二区三区| 国产精品视频亚洲二区| 99久久免费国产精品| 欧美日韩在线观看免费| 国产情侣一区在线| 久久洲Av无码西西人体| 中文字幕亚洲一区二区三区| 92午夜少妇极品福利无码电影| 成人看片黄a免费看那个网址| 99久久国产综合精品女乱人伦| 神马不卡影院在线播放| 亚洲午夜久久久精品影院| 人妻中文字幕无码系列| 韩国三级中文字幕hd久久精品| 26uuu欧美日本在线播放| 精品一区二区亚洲一二三区| 国产让女高潮的av毛片| 国产又黄又爽又色的免费| 久久中文字幕人妻熟av女蜜柚m| 亚洲一级黄色毛片| 亚洲国产精品综合福利专区| 亚洲国产av综合一区| av国产传媒精品免费| 欧洲freexxxx性少妇播放| 国产91吞精一区二区三区| 偷亚洲偷国产欧美高清| 国产伦一区二区三区久久| 国产精品美女久久久网av| 国产啪精品视频网站| 国产91第一页| 放荡成熟人妻中文字幕| 屁屁影院ccyy备用地址| 色妞www精品视频| 成人无码激情视频在线观看| 日本高清视频在线观看一区二区| 国产精品理论片| 日韩欧美在线综合网| yy111111少妇影院| 日韩人妻久久中文字幕|