王雪純,呂晟凱,吳 浩,何 鵬,3+,曾 誠(chéng)
1.湖北大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,武漢430062
2.華中科技大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,武漢430074
3.湖北大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院 應(yīng)用數(shù)學(xué)湖北省重點(diǎn)實(shí)驗(yàn)室,武漢430062
近年來(lái),推薦系統(tǒng)有效地幫助人們?cè)跀?shù)量巨大的信息資源中獲取感興趣的信息。尤其對(duì)于互聯(lián)網(wǎng)服務(wù),推薦系統(tǒng)的地位日漸凸顯。出現(xiàn)了越來(lái)越多有關(guān)服務(wù)推薦方法的研究,其中,基于內(nèi)容和基于協(xié)作的推薦系統(tǒng)是最常用的推薦系統(tǒng),也有結(jié)合當(dāng)下熱門(mén)的機(jī)器學(xué)習(xí)框架的服務(wù)推薦方法,以及面向異質(zhì)信息網(wǎng)絡(luò)的服務(wù)推薦方法。
傳統(tǒng)的服務(wù)推薦方法(如協(xié)同過(guò)濾、矩陣分解)主要考慮用戶(hù)和服務(wù)直接影響的關(guān)系(如評(píng)分、標(biāo)注的標(biāo)簽、評(píng)論等)。但在現(xiàn)實(shí)中,這種直接的關(guān)系數(shù)據(jù)往往比較稀疏,隨之而來(lái)的是冷啟動(dòng)等問(wèn)題。為解決該問(wèn)題,大家趨向于綜合考慮用戶(hù)與服務(wù)的多種關(guān)系和元素。雖然綜合考慮多種關(guān)系能提高服務(wù)推薦的質(zhì)量,但是有效地協(xié)同各種關(guān)系仍面臨諸多挑戰(zhàn)。
網(wǎng)絡(luò)嵌入(network embedding)作為一種方便有效的網(wǎng)絡(luò)表征學(xué)習(xí)方法,不斷受到關(guān)注,最近已經(jīng)成為基于神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的熱門(mén)研究問(wèn)題。網(wǎng)絡(luò)嵌入學(xué)習(xí)能夠?qū)⑿畔⒕W(wǎng)絡(luò)投影到低維向量空間R,可以有效地提取出信息網(wǎng)絡(luò)的多維特征。并將這些特征融入節(jié)點(diǎn)的嵌入向量。利用嵌入向量進(jìn)行服務(wù)推薦比直接機(jī)械地利用信息網(wǎng)絡(luò)的結(jié)構(gòu)信息更加高效。不同結(jié)構(gòu)的關(guān)系網(wǎng)絡(luò)適用的網(wǎng)絡(luò)嵌入方法不同。對(duì)于同質(zhì)信息網(wǎng)絡(luò),通過(guò)隨機(jī)游走的方法將網(wǎng)絡(luò)轉(zhuǎn)換為頂點(diǎn)序列庫(kù),然后借用文本特征學(xué)習(xí)模型訓(xùn)練是一種常用的方法。對(duì)于異質(zhì)信息網(wǎng)絡(luò)建模,將隨機(jī)游走直接應(yīng)用在異質(zhì)信息網(wǎng)絡(luò)的效果并不理想。大多數(shù)異質(zhì)信息網(wǎng)絡(luò)嵌入方法都是通過(guò)在網(wǎng)絡(luò)中游走產(chǎn)生元路徑,并將不同的元路徑分別進(jìn)行嵌入學(xué)習(xí)?,F(xiàn)在有很多代表性的網(wǎng)絡(luò)嵌入算法:Node2vec、LINE(large-scale information network embedding)、SDNE(structural deep network embedding)和BINE(bipartite network embedding)等。
現(xiàn)在也有學(xué)者提出基于網(wǎng)絡(luò)嵌入的服務(wù)推薦,已有研究存在的不足:如在文獻(xiàn)[12-13]中,作者將網(wǎng)絡(luò)嵌入方法成功應(yīng)用于同質(zhì)信息網(wǎng)絡(luò)。該方法通過(guò)得到的用戶(hù)嵌入向量找出相似集群,基于相似集群進(jìn)行服務(wù)推薦,但該類(lèi)方法忽略了服務(wù)本身的特征。文獻(xiàn)[3]通過(guò)構(gòu)建復(fù)雜異質(zhì)信息網(wǎng)絡(luò),并通過(guò)構(gòu)建元路徑序列,分別得到用戶(hù)和服務(wù)的嵌入向量,最后訓(xùn)練優(yōu)化用戶(hù)與服務(wù)嵌入向量的映射模型,但是這種方法得到的是不同向量空間的嵌入向量。不同向量空間的嵌入向量之間沒(méi)有直接影響關(guān)系。需要借助矩陣分解或者深層映射等方法,建立各向量空間之間的聯(lián)系。
因此,這些學(xué)者并沒(méi)有從根源上將多個(gè)關(guān)系網(wǎng)絡(luò)協(xié)同考慮。而且異質(zhì)信息網(wǎng)絡(luò)具有特異性,針對(duì)一種特定的服務(wù)類(lèi)型,不同的服務(wù)類(lèi)型其異質(zhì)信息網(wǎng)絡(luò)的結(jié)構(gòu)是完全不同的,因此該方法不具有良好的魯棒性和拓展性。因此,有必要解決將多個(gè)不同種類(lèi)的關(guān)系網(wǎng)絡(luò)嵌入到同一個(gè)低維向量空間,得到統(tǒng)一的向量表示。但是現(xiàn)有的網(wǎng)絡(luò)嵌入方法都只針對(duì)某一種特定的信息網(wǎng)絡(luò),比如同質(zhì)信息網(wǎng)絡(luò)、異質(zhì)信息網(wǎng)絡(luò)等。
針對(duì)上述問(wèn)題,本文提出一種多網(wǎng)絡(luò)混合嵌入的服務(wù)推薦方法(service recommendation method based on multi-network hybrid embedding,MNHER),將多種關(guān)系網(wǎng)絡(luò)的節(jié)點(diǎn)嵌入到同一個(gè)向量空間,得到統(tǒng)一的向量表示。使得同類(lèi)節(jié)點(diǎn)的嵌入向量包含多關(guān)系網(wǎng)絡(luò)的特征,不同類(lèi)型節(jié)點(diǎn)的嵌入向量包含直接的影響關(guān)系,并且考慮到方法可擴(kuò)展性,將用戶(hù)與服務(wù)的關(guān)系分為兩類(lèi),如圖1 所示。一種是垂直關(guān)系:指用戶(hù)與服務(wù)的直接關(guān)聯(lián),如圖中直線所示。這種關(guān)系雖然是稀疏的,但是能直接地反映用戶(hù)的偏好特征。另一種是平行關(guān)系:指用戶(hù)之間、服務(wù)之間的相互影響,即圖中弧線所示。例如用戶(hù)之間的社交關(guān)系、服務(wù)之間的共享標(biāo)簽關(guān)系。這些關(guān)系可以間接地為服務(wù)推薦提供更多的依據(jù)。
圖1 用戶(hù)-服務(wù)關(guān)系網(wǎng)絡(luò)Fig. 1 User-service network
本文的主要貢獻(xiàn)可概括為:
(1)提出一種多網(wǎng)絡(luò)混合嵌入方法,將兩種不同類(lèi)型的節(jié)點(diǎn)映射到同一個(gè)低維向量空間,并適用于多種不同的關(guān)系網(wǎng)絡(luò)。
(2)提出一種基于多網(wǎng)絡(luò)混合嵌入的服務(wù)推薦模型MNHER。對(duì)用戶(hù)-服務(wù)評(píng)分關(guān)系網(wǎng)絡(luò)、用戶(hù)社交關(guān)系網(wǎng)絡(luò)和服務(wù)標(biāo)簽共有網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。
(3)在三個(gè)公開(kāi)數(shù)據(jù)集上與多種代表性的服務(wù)推薦方法進(jìn)行對(duì)比分析。多角度驗(yàn)證了本文方法的有效性和合理性,也討論了不同的關(guān)系網(wǎng)絡(luò)對(duì)推薦質(zhì)量的影響。
在Web 服務(wù)中流行對(duì)服務(wù)標(biāo)注標(biāo)簽,比如豆瓣電影網(wǎng)站會(huì)對(duì)電影標(biāo)注類(lèi)型、語(yǔ)言、作者、演員和年代等標(biāo)簽,豆瓣讀書(shū)網(wǎng)站會(huì)對(duì)書(shū)籍標(biāo)注作者、語(yǔ)言、類(lèi)型和年代等標(biāo)簽。這些標(biāo)簽可幫助用戶(hù)獲取到服務(wù)的基本特征,而且這些標(biāo)簽同樣也可以代表用戶(hù)的喜好。因此涌現(xiàn)出很多基于服務(wù)標(biāo)簽的服務(wù)推薦方法。
Luo 等人提出了一種基于coSVD(co-singular value decomposition)的模型來(lái)豐富單一數(shù)據(jù)源,可以有效控制矩陣分解中存在的過(guò)擬合問(wèn)題。用戶(hù)偏好不僅通過(guò)評(píng)級(jí)數(shù)據(jù)而且還通過(guò)標(biāo)簽數(shù)據(jù)來(lái)豐富。該方法可用于各類(lèi)專(zhuān)家智能系統(tǒng)中解決上述問(wèn)題,如廣告推薦、評(píng)分網(wǎng)站、社交媒體平臺(tái)等,這些都需要用戶(hù)輸入相對(duì)較大的數(shù)據(jù)。Shi等人使用基于媒體元數(shù)據(jù)的主題向量來(lái)比較被重新創(chuàng)建媒體和被重新創(chuàng)建媒體的主題之間的相似性,從而預(yù)測(cè)用戶(hù)對(duì)被搜索媒體單元的媒體再創(chuàng)建服務(wù)的評(píng)分。在不消耗大量時(shí)間的情況下,提高了效率,降低了MAE(mean absolute error)。為了解決冷啟動(dòng)和簡(jiǎn)化問(wèn)題,Zhang等人提出了一種基于矩陣分解的混合標(biāo)簽多樣化推薦算法,挖掘用戶(hù)現(xiàn)有的偏好和條目的相關(guān)性。結(jié)果表明,該方法能夠在保證準(zhǔn)確性的基礎(chǔ)上提高標(biāo)簽推薦的覆蓋率和多樣性。為了解決服務(wù)推薦效率低下的問(wèn)題,Qiang 等人提出了一種檢測(cè)重疊社區(qū)結(jié)構(gòu)的多標(biāo)簽傳播算法,然后利用重疊的社區(qū)結(jié)構(gòu)向目標(biāo)用戶(hù)推薦項(xiàng)目。結(jié)果表明,該方法提高了推薦效率,在線精度基本不變。
在基于標(biāo)簽的服務(wù)推薦中,TF-IDF(term frequencyinversion document frequency)是一種常用的信息檢索和數(shù)據(jù)挖掘的加權(quán)算法,通常用于評(píng)價(jià)用戶(hù)之間的相似度。Ba等人使用TF-IDF技術(shù)計(jì)算目標(biāo)用戶(hù)與其每個(gè)鄰居之間的相似度,而不考慮公共項(xiàng)的詳細(xì)評(píng)級(jí)。該方法可以提高推薦系統(tǒng)的精度、實(shí)時(shí)性和可擴(kuò)展性。為了幫助用戶(hù)找到與他們的興趣相關(guān)的新標(biāo)簽,Otsuka等人構(gòu)建了一個(gè)TF-IDF的變體——HF-IHU(hashtag frequency-inverse hashtag ubiquity)排名方案。在Twitter 大數(shù)據(jù)集上的實(shí)驗(yàn)表明,與TFIDF技術(shù)相比,該方法更加穩(wěn)定可靠。
社交應(yīng)用在當(dāng)今互聯(lián)網(wǎng)環(huán)境下迅猛發(fā)展,用戶(hù)可以擁有自己的社交關(guān)系網(wǎng)絡(luò)。研究證明社交關(guān)系對(duì)挖掘用戶(hù)喜好有積極作用,并且社交關(guān)系具有明顯的集群聚類(lèi)特征,同一個(gè)集群的相似用戶(hù)具有更大喜好交集,因此各種有關(guān)相似用戶(hù)聚類(lèi)和相似用戶(hù)挖掘的個(gè)性化推薦系統(tǒng)應(yīng)運(yùn)而生,推薦系統(tǒng)用于準(zhǔn)確主動(dòng)地為用戶(hù)提供潛在的信息或服務(wù)。Wang等人提出了一種基于EM(expectation-maximization)的算法,該算法可同時(shí)對(duì)社交網(wǎng)絡(luò)中的強(qiáng)弱關(guān)系進(jìn)行分類(lèi),賦予強(qiáng)類(lèi)型社交朋友更高的影響力。然而,考慮到原始社交網(wǎng)絡(luò)的高度稀疏性,提取的關(guān)系過(guò)于稀疏,無(wú)法有效提高推薦性能。
Zhou等人提出了一種基于分布式在線學(xué)習(xí)的云輔助差分推薦系統(tǒng)??紤]到社交媒體數(shù)據(jù)的稀疏性和異構(gòu)性,另提出了一種新的幾何差分模型,可以大大降低性能損失。Hu等人提出了一種功能張量分解方法來(lái)對(duì)用戶(hù)和時(shí)尚商品之間的交互進(jìn)行建模。使用基于梯度上升的方法來(lái)學(xué)習(xí)非線性目標(biāo)函數(shù),以將特征向量從特征空間映射到一些低維潛在空間。通過(guò)對(duì)來(lái)自流行時(shí)尚的社交網(wǎng)絡(luò)的真實(shí)世界用戶(hù)數(shù)據(jù)進(jìn)行的大量實(shí)驗(yàn),驗(yàn)證了該算法的有效性。協(xié)同過(guò)濾是一種廣泛采用的推薦方法,但是稀疏數(shù)據(jù)和冷啟動(dòng)用戶(hù)通常是提供高質(zhì)量推薦的障礙。為了解決這些問(wèn)題,Yang 等人提出了通過(guò)集成用戶(hù)提供的稀疏評(píng)級(jí)數(shù)據(jù)和相似用戶(hù)之間的稀疏社會(huì)信任網(wǎng)絡(luò)來(lái)提高協(xié)同過(guò)濾的性能。該方法采用矩陣分解技術(shù),根據(jù)用戶(hù)的信任關(guān)系將其映射到低維潛在特征空間,目的是更準(zhǔn)確地反映用戶(hù)對(duì)自己意見(jiàn)形成的相互影響,并更好地學(xué)習(xí)用戶(hù)對(duì)高質(zhì)量推薦的偏好模式。Jiang等人提出一種基于社會(huì)關(guān)系和時(shí)間影響的個(gè)性化服務(wù)推薦,綜合考慮了用戶(hù)熟悉度和偏好相似度。結(jié)果表明,該方法優(yōu)于一般的基于標(biāo)簽和基于社會(huì)的推薦方法,不用依賴(lài)于用戶(hù)的歷史數(shù)據(jù),可以滿(mǎn)足為新用戶(hù)和不活躍用戶(hù)進(jìn)行服務(wù)推薦的需求。
推薦系統(tǒng)作為互聯(lián)網(wǎng)產(chǎn)品的一項(xiàng)重要技術(shù),能夠幫助用戶(hù)獲取所需信息。近年來(lái)涌現(xiàn)了很多對(duì)于復(fù)雜網(wǎng)絡(luò)分析的工作,表征學(xué)習(xí)以其可以得到隱含的向量表示,而被大量應(yīng)用于推薦領(lǐng)域。Liu 等人提出了一種用于隱式反饋推薦的深度學(xué)習(xí)框架。在這個(gè)框架中,同時(shí)通過(guò)node2vec 學(xué)習(xí)用戶(hù)和項(xiàng)目的分布式表示,以改進(jìn)負(fù)抽樣策略。并開(kāi)發(fā)了一個(gè)深度神經(jīng)網(wǎng)絡(luò)推薦模型來(lái)集成用戶(hù)特征、產(chǎn)品特征和交互特征。在兩個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)證明了該框架和方法的有效性。Zhuang等人提出了一種新的表征學(xué)習(xí)框架——雙自編碼推薦ReDa(representation learning via dual-autoencoder)。通過(guò)自動(dòng)編碼器同時(shí)學(xué)習(xí)用戶(hù)和項(xiàng)目的隱性表示,并通過(guò)學(xué)習(xí)用戶(hù)和項(xiàng)目的表示最小化訓(xùn)練數(shù)據(jù)的偏差,該方法能夠一定程度上解決矩陣分解存在的缺陷。針對(duì)協(xié)同過(guò)濾算法只使用商品用戶(hù)評(píng)價(jià)矩陣而不考慮語(yǔ)義的問(wèn)題,Wu等人提出了一種基于表征推薦算法,利用知識(shí)圖表征學(xué)習(xí)方法,將已有的語(yǔ)義數(shù)據(jù)嵌入到低維語(yǔ)義空間中。通過(guò)計(jì)算項(xiàng)目間的語(yǔ)義相似度,將項(xiàng)目間的語(yǔ)義信息集成到協(xié)同過(guò)濾推薦中,克服了協(xié)同過(guò)濾算法不考慮項(xiàng)目語(yǔ)義信息的缺點(diǎn),在語(yǔ)義層次上提高了協(xié)同過(guò)濾推薦的效果。
Tang等人提出了一種新型網(wǎng)絡(luò)嵌入方法,分析了隨機(jī)游走方法存在的問(wèn)題,利用負(fù)采樣機(jī)制緩解隨機(jī)梯度下降過(guò)程中存在的缺陷,提高了網(wǎng)絡(luò)嵌入的有效率。Wu等人提出了一種新的基于上下文感知的用戶(hù)項(xiàng)目表示學(xué)習(xí)模型(context-aware user-item representation learning,CARL)。根據(jù)給定用戶(hù)-項(xiàng)對(duì)的單個(gè)潛在特征和潛在特征交互,導(dǎo)出它們的聯(lián)合表示,然后CARL采用因子分解機(jī),在用戶(hù)-項(xiàng)對(duì)的基礎(chǔ)上進(jìn)一步建立高階特征交互模型,進(jìn)行等級(jí)預(yù)測(cè)。實(shí)驗(yàn)表明,CARL 有更顯著的評(píng)級(jí)預(yù)測(cè)效果。Kong等人利用近年來(lái)文本和網(wǎng)絡(luò)表征學(xué)習(xí)在無(wú)監(jiān)督特征設(shè)計(jì)方面的研究成果,開(kāi)發(fā)了一個(gè)科學(xué)論文推薦系統(tǒng)VOPRec,滿(mǎn)足用戶(hù)科學(xué)論文準(zhǔn)確推薦的需求。Salah等人提出了一種新的用戶(hù)偏好和項(xiàng)目上下文生成模型——概率協(xié)同表征學(xué)習(xí)(probabilistic collaborative representation learning,PCRL)。依賴(lài)于貝葉斯泊松分解(Bayesian Poisson factorization)對(duì)用戶(hù)-項(xiàng)目交互進(jìn)行建模,并使用多層潛在變量體系結(jié)構(gòu)從上下文中學(xué)習(xí)項(xiàng)目的表征形式。作者在多個(gè)大型數(shù)據(jù)集上驗(yàn)證了該模型的優(yōu)越性。為了有效地捕獲用戶(hù)的偏好,Han等人設(shè)計(jì)了一種基于異構(gòu)網(wǎng)絡(luò)嵌入和卷積神經(jīng)網(wǎng)絡(luò)的方法,分別從用戶(hù)-項(xiàng)目交互結(jié)構(gòu)和查看文本中學(xué)習(xí)用戶(hù)和項(xiàng)目的特征表示。此外,Shi 等人設(shè)計(jì)了一種基于元路徑的隨機(jī)游走策略來(lái)生成網(wǎng)絡(luò)嵌入的節(jié)點(diǎn)數(shù),并將其集成到擴(kuò)展的MF(matrix decomposition)模型中。驗(yàn)證了該模型對(duì)冷啟動(dòng)問(wèn)題的有效性和能力,結(jié)果表明轉(zhuǎn)換后的嵌入信息確實(shí)提高了推薦性能。
本文方法分為三部分:(1)構(gòu)建信息網(wǎng)絡(luò)。構(gòu)建用戶(hù)-服務(wù)異質(zhì)信息網(wǎng)絡(luò)、服務(wù)標(biāo)簽共有網(wǎng)絡(luò)和用戶(hù)社交關(guān)系網(wǎng)絡(luò)。(2)多網(wǎng)絡(luò)混合嵌入。將上一步中得到的三類(lèi)信息網(wǎng)絡(luò)嵌入到同一個(gè)低維向量空間,得到用戶(hù)和服務(wù)的嵌入向量。(3)基于用戶(hù)的協(xié)同推薦。利用學(xué)習(xí)到的用戶(hù)和服務(wù)嵌入向量進(jìn)行服務(wù)評(píng)分預(yù)測(cè),并綜合考慮相似用戶(hù)的喜好影響,最終推薦Top-個(gè)服務(wù)序列,如圖2 所示。比如在豆瓣電影中需要為用戶(hù)推薦其感興趣的電影??梢愿鶕?jù)用戶(hù)對(duì)電影的打分構(gòu)建用戶(hù)-電影異質(zhì)信息網(wǎng)絡(luò),利用電影的類(lèi)型信息構(gòu)建電影標(biāo)簽共有網(wǎng)絡(luò),根據(jù)用戶(hù)之間的關(guān)注和交互信息構(gòu)建用戶(hù)社交網(wǎng)絡(luò)。然后通過(guò)多網(wǎng)絡(luò)混合嵌入得到用戶(hù)和電影的嵌入向量,最后利用基于用戶(hù)的協(xié)同推薦為用戶(hù)推薦其感興趣的電影。
圖2 多網(wǎng)絡(luò)混合嵌入學(xué)習(xí)模型Fig. 2 Multi-network hybrid embedding learning model
用戶(hù)-服務(wù)評(píng)分異質(zhì)信息網(wǎng)絡(luò)(user-service heterogeneous information network):異質(zhì)信息網(wǎng)絡(luò)簡(jiǎn)單的理解是指網(wǎng)絡(luò)中節(jié)點(diǎn)或連邊的種類(lèi)在兩種及以上的網(wǎng)絡(luò)。在本文中,根據(jù)用戶(hù)對(duì)服務(wù)的評(píng)分信息,可構(gòu)建用戶(hù)-服務(wù)異質(zhì)信息網(wǎng)絡(luò)=(,,),其中={,,…,u}為用戶(hù)集,={,,…,s}為服務(wù)集,={w=r|=1,2,…,,=1,2,…,} 為連邊集,當(dāng)r≠0 時(shí),代表用戶(hù)u在服務(wù)s上標(biāo)注的評(píng)分為r。
服務(wù)標(biāo)簽共有網(wǎng)絡(luò)(service co-tag network):現(xiàn)實(shí)中,每個(gè)服務(wù)都會(huì)被分配多個(gè)標(biāo)簽。通過(guò)計(jì)算不同服務(wù)之間共用的標(biāo)簽個(gè)數(shù)可以構(gòu)建服務(wù)標(biāo)簽共有網(wǎng)絡(luò)=(,)。服務(wù)s和s的連邊e′= w,w為兩個(gè)服務(wù)共有的標(biāo)簽個(gè)數(shù)。
用戶(hù)社交網(wǎng)絡(luò)(user social network):現(xiàn)有很多公共服務(wù)平臺(tái),比如Yelp和豆瓣,用戶(hù)通過(guò)這些平臺(tái)不僅可以對(duì)不同的服務(wù)進(jìn)行評(píng)分,也可以跟其他用戶(hù)交流。根據(jù)提供的用戶(hù)交互數(shù)據(jù),假如一個(gè)用戶(hù)u關(guān)注(contact)或follow了另一個(gè)用戶(hù)u,則可視兩個(gè)用戶(hù)之間存在一種社交關(guān)聯(lián)。因此,用戶(hù)之間的社交關(guān)系網(wǎng)絡(luò)=(,),={u|=1,2,…,}為用戶(hù)集,={e|,=1,2,…,}為連邊集,考慮到虛擬社交平臺(tái)中用戶(hù)之間的親密程度和影響權(quán)重是一個(gè)復(fù)雜的因素。把用戶(hù)之間的社交網(wǎng)絡(luò)只作為一個(gè)非加權(quán)的網(wǎng)絡(luò)處理。即,若用戶(hù)u和u之間有交互關(guān)系,則e=1,否則為0。
將網(wǎng)絡(luò)中的節(jié)點(diǎn)投影到低維向量空間R的方法,已在機(jī)器學(xué)習(xí)領(lǐng)域得到有效驗(yàn)證。網(wǎng)絡(luò)嵌入方法可以有效地提取出信息網(wǎng)絡(luò)的多維特征,并將這些特征融入節(jié)點(diǎn)的嵌入向量。
將多網(wǎng)絡(luò)建模分為兩個(gè)層次:垂直關(guān)系建模和平行關(guān)系建模。
垂直關(guān)系是指用戶(hù)和服務(wù)之間直接的關(guān)聯(lián)關(guān)系。在異質(zhì)信息網(wǎng)絡(luò)=(,,)中兩個(gè)節(jié)點(diǎn)u與s之間存在直接的連邊。利用節(jié)點(diǎn)之間的局部鄰近度對(duì)這種顯性關(guān)系建模。節(jié)點(diǎn)u與s聯(lián)合的概率定義為:
其中,w表示u與s連邊的權(quán)重。顯然,若w值越大,則u與s聯(lián)合的概率越大。借鑒當(dāng)下流行的word2vec模型,利用Sigmoid 函數(shù)將嵌入向量之間的聯(lián)系轉(zhuǎn)換成概率:
其中,u,s∈R都是節(jié)點(diǎn)u與s的嵌入向量。通過(guò)最小化(u,s)與^(u,s)之間的差異,學(xué)習(xí)得到嵌入向量u,s:
通過(guò)最小化,兩個(gè)節(jié)點(diǎn)的連邊權(quán)重越大,兩個(gè)節(jié)點(diǎn)的向量的聯(lián)系也越緊密。因此,可以將兩個(gè)節(jié)點(diǎn)之間的顯性關(guān)系融入到節(jié)點(diǎn)的嵌入向量中。
通過(guò)式(4)的處理后,可分別得到W、W兩個(gè)投影矩陣——兩個(gè)同質(zhì)信息網(wǎng)絡(luò)。這兩個(gè)同質(zhì)信息網(wǎng)絡(luò)可以進(jìn)一步轉(zhuǎn)化成節(jié)點(diǎn)序列進(jìn)行嵌入學(xué)習(xí)。
隨機(jī)游走方法是最常用的將網(wǎng)絡(luò)轉(zhuǎn)化成節(jié)點(diǎn)序列的方法,但傳統(tǒng)的隨機(jī)游走方法DeepWalk 并不能有效地保留網(wǎng)絡(luò)中節(jié)點(diǎn)的分布特征。BINE通過(guò)考慮節(jié)點(diǎn)的中心性進(jìn)行優(yōu)化,node2vec通過(guò)考慮局部的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化。本文將以上兩種優(yōu)化方法進(jìn)行合并,提出一種更有效的隨機(jī)游走算法,如算法1所示。
WalkGenerator(,,,)
輸入:同質(zhì)信息網(wǎng)絡(luò)=(,),嵌入向量維度,最短步長(zhǎng),控制游走結(jié)束的概率參數(shù)。
輸出:一個(gè)節(jié)點(diǎn)序列集合。
保留局部網(wǎng)絡(luò)結(jié)構(gòu)的計(jì)算機(jī)制,將固定的游走次數(shù)修改為根據(jù)節(jié)點(diǎn)中心性動(dòng)態(tài)計(jì)算,節(jié)點(diǎn)中心性度量()標(biāo)準(zhǔn)有很多,本文實(shí)驗(yàn)部分會(huì)進(jìn)行比較分析。增加控制游走停止的概率參數(shù),使產(chǎn)生的節(jié)點(diǎn)序列長(zhǎng)度不規(guī)則,其中是最低游走次數(shù)。
參照多種代表性的網(wǎng)絡(luò)嵌入方法,利用softmax函數(shù)將p(u|u)、p(s|s)、(u|u) 和(s|s) 參數(shù)化為:
并用利用負(fù)采樣對(duì)式(9)進(jìn)行優(yōu)化,其思想是利用負(fù)采樣代替全局參數(shù)進(jìn)行訓(xùn)練,從而減少大量的參數(shù)訓(xùn)練帶來(lái)的資源消耗。參考文獻(xiàn)[8]中的方法,以p(u|u)為例,可利用負(fù)采樣改寫(xiě)為:
為了從縱向和橫向兩個(gè)角度將多網(wǎng)絡(luò)中的用戶(hù)節(jié)點(diǎn)和服務(wù)節(jié)點(diǎn)聯(lián)合嵌入同一個(gè)向量空間,將其目標(biāo)函數(shù)結(jié)合,提出一個(gè)聯(lián)合訓(xùn)練的目標(biāo)函數(shù):
將聯(lián)合目標(biāo)函數(shù)按照縱向和橫向的關(guān)系分為三部分,分別通過(guò)權(quán)衡參數(shù)、、連接。考慮到本文方法的普適性,將橫向關(guān)系分為用戶(hù)和服務(wù)兩類(lèi)。并且將最小化轉(zhuǎn)化為與其他目標(biāo)函數(shù)一致的求最大化。
為了求聯(lián)合目標(biāo)函數(shù)最大值,利用隨機(jī)梯度上升(stochastic gradient ascent algorithm,SGA)去優(yōu)化。由于聯(lián)合目標(biāo)函數(shù)的三部分是不同的目標(biāo)函數(shù),設(shè)計(jì)了一個(gè)組合的訓(xùn)練模式。對(duì)不同的目標(biāo)函數(shù)也給出了詳細(xì)的訓(xùn)練計(jì)算方法,如算法2所示。
HINE訓(xùn)練
輸入:異質(zhì)信息網(wǎng)絡(luò)=(,,),用戶(hù)社交關(guān)系網(wǎng)絡(luò)=(,),服務(wù)標(biāo)簽共有網(wǎng)絡(luò)=(,),采樣窗口大小,負(fù)采樣集合大小,嵌入向量維度,最短步長(zhǎng),游走停止的概率參數(shù)。
輸出:節(jié)點(diǎn)嵌入向量集合和。
32.Return vertex embedding matricesand
算法2輔助說(shuō)明整個(gè)聯(lián)合訓(xùn)練的過(guò)程。其中第1行為對(duì)異質(zhì)信息網(wǎng)絡(luò)投影;2~3行為初始化各網(wǎng)絡(luò)的嵌入向量;4~7 行為對(duì)于4 個(gè)橫向關(guān)系的網(wǎng)絡(luò)通過(guò)隨機(jī)游走得到序列集;8~32行為聯(lián)合訓(xùn)練的過(guò)程。
縱向關(guān)系,如兩個(gè)節(jié)點(diǎn)u與s,通過(guò)正向累加梯度(SGA)訓(xùn)練嵌入向量u、s使-最大化。對(duì)于具體的計(jì)算方法如下:
其中,為學(xué)習(xí)率。括號(hào)內(nèi)的部分為-的梯度,推導(dǎo)過(guò)程省略。
通過(guò)之前的多網(wǎng)絡(luò)混合嵌入,得到用戶(hù)和服務(wù)的嵌入向量E、E后,因多網(wǎng)絡(luò)混合網(wǎng)絡(luò)嵌入方法已經(jīng)把用戶(hù)和服務(wù)節(jié)點(diǎn)嵌入到同一個(gè)向量空間,所以可以直接利用向量距離計(jì)算用戶(hù)對(duì)服務(wù)的喜好程度。本文還增加了對(duì)相似集群的考慮。首先需要得到目標(biāo)用戶(hù)的相似用戶(hù)集。利用余弦相似度衡量?jī)蓚€(gè)用戶(hù)向量的相似度,計(jì)算方法如下:
構(gòu)建了一個(gè)綜合考慮相似用戶(hù)喜好和目標(biāo)用戶(hù)喜好的評(píng)分預(yù)測(cè)器。對(duì)于目標(biāo)用戶(hù)u和服務(wù)s,預(yù)測(cè)評(píng)分計(jì)算方式如下:
其中,相似用戶(hù)的評(píng)分與目標(biāo)用戶(hù)的主觀評(píng)分通過(guò)權(quán)衡參數(shù)鏈接,目的是能夠有效地協(xié)同目標(biāo)用戶(hù)和相似用戶(hù)的喜好。按照預(yù)測(cè)的評(píng)分大小取前Top-個(gè)服務(wù),最后可返回向目標(biāo)用戶(hù)u一個(gè)未曾關(guān)注過(guò)的服務(wù)序列。給出了算法3 輔助說(shuō)明基于相似用戶(hù)的協(xié)同過(guò)濾過(guò)程。
RecSystem(u,E,E,,)
輸入:嵌入向量集合E和E,目標(biāo)用戶(hù)u,推薦服務(wù)個(gè)數(shù),相似用戶(hù)個(gè)數(shù)。
輸出:推薦的服務(wù)序列。
本文在3個(gè)公開(kāi)數(shù)據(jù)集上進(jìn)行實(shí)證分析,旨在回答以下研究問(wèn)題:
1 與各種具有代表性的服務(wù)推薦方法相比,本文所提方法的推薦質(zhì)量是否有所提高?
2 增加關(guān)系網(wǎng)絡(luò)進(jìn)行聯(lián)合訓(xùn)練的方式是否對(duì)提高推薦質(zhì)量有效?
3 考慮網(wǎng)絡(luò)節(jié)點(diǎn)重要性的隨機(jī)游走規(guī)則是否有利于節(jié)點(diǎn)的網(wǎng)絡(luò)表征學(xué)習(xí)?
首先介紹實(shí)驗(yàn)的基本設(shè)置,然后依次回答以上的研究問(wèn)題,最后說(shuō)明本文方法存在的不足和未來(lái)的改進(jìn)方向。
實(shí)驗(yàn)數(shù)據(jù)來(lái)源于Github平臺(tái)(https://github.com/librahu/Heterogeneous-Information-Network-Datasets-for-Recommendation-and-Network-Embedding)。Douan Movie數(shù)據(jù)集包括用戶(hù)13 367個(gè),服務(wù)(Movie)12 677個(gè)。Yelp 數(shù)據(jù)集包括用戶(hù)16 239 個(gè),服務(wù)(Business)14 284個(gè)。Movielens數(shù)據(jù)集包括用戶(hù)1 370個(gè),服務(wù)(Item)2 682個(gè)。實(shí)驗(yàn)數(shù)據(jù)信息如表1所示。
表1 實(shí)驗(yàn)數(shù)據(jù)集Table 1 Experimental dataset
數(shù)據(jù)集中,有用戶(hù)對(duì)服務(wù)標(biāo)注評(píng)分的行為數(shù)據(jù),也有用戶(hù)之間的交互數(shù)據(jù)。用戶(hù)信息網(wǎng)絡(luò)建模后,所得網(wǎng)絡(luò)信息統(tǒng)計(jì)如表2。為提高實(shí)驗(yàn)數(shù)據(jù)的質(zhì)量,過(guò)濾掉了關(guān)注服務(wù)個(gè)數(shù)少于5個(gè)的用戶(hù)。
表2 信息網(wǎng)絡(luò)數(shù)據(jù)統(tǒng)計(jì)情況Table 2 Data statistics of information network
本文采用F-Measure、NDGG、MRR 和MAP 四個(gè)指標(biāo)評(píng)價(jià)推薦系統(tǒng)的質(zhì)量。指標(biāo)的定義如下:
1@:是一種綜合評(píng)價(jià)召回率(@)和準(zhǔn)確率(@)的指標(biāo)。對(duì)于目標(biāo)用戶(hù)u,令S表示該用戶(hù)真實(shí)選擇的服務(wù)集合,令表示向該用戶(hù)推薦的Top-個(gè)服務(wù),為測(cè)試用戶(hù)集。
@:是一種求平均準(zhǔn)確率的指標(biāo)。平均準(zhǔn)確率越高,推薦質(zhì)量越高。定義如下:
@:是一種廣泛應(yīng)用于信息檢索領(lǐng)域的評(píng)價(jià)指標(biāo),也是一種求命中服務(wù)所在推薦序列的平均次序的指標(biāo),值越大表示推薦質(zhì)量越高。定義如下:
為了驗(yàn)證本文所提推薦方法的有效性,本文分別選取基于用戶(hù)-服務(wù)評(píng)分、基于社交關(guān)系和基于服務(wù)標(biāo)簽等不同類(lèi)型的代表方法做基準(zhǔn)。
(1)基于用戶(hù)-服務(wù)評(píng)分的推薦方法
Sorec是一種混搭用戶(hù)評(píng)分矩陣和社交關(guān)系的協(xié)同推薦方法。SemRec是一種基于加權(quán)的用戶(hù)評(píng)分異質(zhì)信息網(wǎng)絡(luò)的服務(wù)推薦方法。在服務(wù)推薦的過(guò)程中可以綜合考慮用戶(hù)-用戶(hù)、用戶(hù)-服務(wù)和服務(wù)-服務(wù)多種關(guān)系。
(2)基于社交關(guān)系的推薦方法
本文方法在BPR(Bayesian personalized ranking from implicit feedback)的基礎(chǔ)上將社交關(guān)系分成親密度不同的多個(gè)層次。改善了基于用戶(hù)服務(wù)推薦存在的冷啟動(dòng)和數(shù)據(jù)稀疏問(wèn)題。CPLR(collaborative pairwise learning to rank for personalized recommendation)是一種新型基于pairwise ranking 的服務(wù)推薦方法。UPCC(user-based pearson correlation coefficient algorithm)是一種經(jīng)典的基于相似用戶(hù)的協(xié)同推薦算法。
(3)基于服務(wù)標(biāo)簽的推薦方法
FM是一種基于上下文感知的矩陣分解器,該方法在對(duì)用戶(hù)-評(píng)分矩陣進(jìn)行分解的同時(shí)考慮服務(wù)的標(biāo)簽信息。MVIR(multi-view item recommendation)是最近被提出的一種基于事項(xiàng)的服務(wù)推薦方法,該方法從多視角挖掘事項(xiàng)的隱性特征。
為了公平比較分析,基準(zhǔn)方法的所有參數(shù)均取其默認(rèn)值。對(duì)于本文方法,參照多個(gè)網(wǎng)絡(luò)嵌入方法的參數(shù)設(shè)置,將用戶(hù)向量和服務(wù)向量的維度設(shè)置為128。將權(quán)衡參數(shù)設(shè)定為0.01,和在區(qū)間[0.01,0.05,0.10,0.50,1.00]中取值。設(shè)置最短步長(zhǎng)從[4,6,8,10,12,14]中取值。設(shè)置負(fù)采樣樣本個(gè)數(shù)從[1,2,4,6,8,10]中取值。設(shè)置游走停止的概率從[0.05,0.10,0.15,0.20,0.30,0.40]中取值。設(shè)置線性組合權(quán)重=0.6,相似用戶(hù)集|()|=25。根據(jù)文獻(xiàn)[8]中對(duì)學(xué)習(xí)率的討論,設(shè)置學(xué)習(xí)率為0.1。在3 個(gè)數(shù)據(jù)集上進(jìn)行實(shí)證分析,參數(shù)均保持一致。
為證明本文方法的有效性,分別在3個(gè)數(shù)據(jù)集上與基準(zhǔn)方法進(jìn)行比較實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表3所示。為了便于觀察,取訓(xùn)練比例為80%的實(shí)驗(yàn)數(shù)據(jù)繪制了增幅矩陣圖,如圖3所示。
圖3 在不同數(shù)據(jù)集上與基線的性能對(duì)比Fig. 3 Performance comparisons with baselines on different datasets
表3 不同模型在三個(gè)數(shù)據(jù)集上的推薦質(zhì)量比較Table 3 Comparison of recommendation quality of different models on three datasets
實(shí)驗(yàn)結(jié)果顯示,在絕大部分情況下,本文所提MNHER 方法的四個(gè)指標(biāo)均優(yōu)于七種基準(zhǔn)方法。特別是在數(shù)據(jù)集Movielens 上,MNHER 在四個(gè)指標(biāo)有可觀的提升。當(dāng)訓(xùn)練比例為80%時(shí),相比BPR方法,F(xiàn)1@10 的提升幅度為151%,NDGG@10 的提升幅度為145%,MAP@10的提升幅度為143%,MRR@10的提升幅度為159%;相比Sorec 方法,F(xiàn)1@10 的提升幅度為137%,NDGG@10的提升幅度為138%,MAP@10的提升幅度為196%,MRR@10的提升幅度為60%;相比MVIR方法,F(xiàn)1@10的提升幅度為35%,NDGG@10的提升幅度為44%,MAP@10 的提升幅度為28%,MRR@10 的提升幅度為60%。因此,本文方法的推薦質(zhì)量均優(yōu)于單獨(dú)的基于某一種關(guān)系網(wǎng)絡(luò)的服務(wù)推薦方法,在服務(wù)推薦中考慮多種關(guān)系網(wǎng)絡(luò)有助于提高推薦質(zhì)量,本文使用聯(lián)合嵌入的方法得到的多個(gè)關(guān)系網(wǎng)絡(luò)的特征向量,包含了更多目標(biāo)用戶(hù)的正積極因素。
為比較分析在對(duì)二分異質(zhì)信息網(wǎng)絡(luò)的表征學(xué)習(xí)中增加考慮其他關(guān)系網(wǎng)絡(luò)的影響,在三個(gè)數(shù)據(jù)集上對(duì)四種不同的關(guān)系組合進(jìn)行了實(shí)驗(yàn)分析,即MNHER僅考慮用戶(hù)與服務(wù)之間的垂直關(guān)系;MNHER增加用戶(hù)之間的平行關(guān)系,如社交關(guān)系;MNHER增加服務(wù)之間的平行關(guān)系,如標(biāo)簽共有關(guān)系;MNHER 綜合考慮以上用戶(hù)之間和服務(wù)之間的平行關(guān)系。實(shí)驗(yàn)結(jié)果如表4 所示,為了便于觀察,繪制了增幅矩陣圖,如圖4所示。得出以下幾個(gè)結(jié)論。
表4 考慮不同關(guān)系的實(shí)驗(yàn)結(jié)果對(duì)比Table 4 Comparison of experimental results considering different relations
圖4 考慮不同關(guān)系的實(shí)驗(yàn)結(jié)果對(duì)比Fig. 4 Comparison of experimental results considering different relations
首先,經(jīng)比較發(fā)現(xiàn),MNHER方法在三個(gè)數(shù)據(jù)集下的服務(wù)推薦質(zhì)量均為最低。增加考慮用戶(hù)之間或者服務(wù)之間的平行關(guān)系能夠提高整體服務(wù)推薦的質(zhì)量。因此增加考慮二分異質(zhì)信息網(wǎng)絡(luò)中的平行關(guān)系有助于挖掘用戶(hù)與服務(wù)之間的關(guān)系。其次,通過(guò)比較后三者的實(shí)驗(yàn)結(jié)果,發(fā)現(xiàn)綜合考慮兩種平行關(guān)系的方法的推薦質(zhì)量更優(yōu)于只考慮一種平行關(guān)系的方法。雖然數(shù)據(jù)存在一些波動(dòng),但可以明顯看出最優(yōu)的推薦質(zhì)量大部分來(lái)自MNHER。
本文進(jìn)一步對(duì)綜合兩種平行關(guān)系的組合權(quán)重進(jìn)行討論分析,實(shí)驗(yàn)結(jié)果如圖5所示。發(fā)現(xiàn)在三個(gè)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果中,當(dāng)取值在[0.2,0.3]區(qū)間中F1@10為最大值。進(jìn)一步證明綜合考慮平行關(guān)系更有利于對(duì)異質(zhì)信息網(wǎng)絡(luò)的表征,進(jìn)而提高服務(wù)推薦的質(zhì)量。
圖5 參數(shù)δ 的實(shí)驗(yàn)分析結(jié)果Fig. 5 Experimental analysis of parameter δ
為分析考慮網(wǎng)絡(luò)節(jié)點(diǎn)中心性的隨機(jī)游走規(guī)則對(duì)網(wǎng)絡(luò)表征學(xué)習(xí)的影響,本文比較分析了三種不同的網(wǎng)絡(luò)節(jié)點(diǎn)中心性,分別為BC(介數(shù)中心性)、EC(特征向量中心性)和PR(PageRank)。實(shí)驗(yàn)結(jié)果如表5 所示。實(shí)驗(yàn)結(jié)果顯示,考慮節(jié)點(diǎn)中心性的游走策略能有效提高服務(wù)推薦的質(zhì)量。考慮PageRank中心性的服務(wù)推薦質(zhì)量最高,在不同數(shù)據(jù)集的實(shí)驗(yàn)中各項(xiàng)指標(biāo)平均提升了20%。因此,考慮節(jié)點(diǎn)中心性的隨機(jī)游走策略有助于挖掘網(wǎng)絡(luò)中的節(jié)點(diǎn)關(guān)系。并且在Movielens 數(shù)據(jù)集上的實(shí)驗(yàn)中,提升幅度最明顯。因?yàn)镸ovielens 的數(shù)據(jù)集最為稀疏,所以增加考慮節(jié)點(diǎn)重要性有助于改善關(guān)系網(wǎng)絡(luò)數(shù)據(jù)稀疏的問(wèn)題。
表5 不同中心性度量方法下的實(shí)驗(yàn)結(jié)果Table 5 Experimental results under different centrality measurement methods
本文還在隨機(jī)游走算法中增加了兩個(gè)控制參數(shù)(,),一起控制隨機(jī)游走的步長(zhǎng),使每次隨機(jī)游走的步長(zhǎng)都是隨機(jī)的。本文也進(jìn)行了實(shí)驗(yàn)討論。實(shí)驗(yàn)結(jié)果如圖6 所示。在區(qū)間[6,8]取值為最優(yōu)。當(dāng)取值大于8時(shí),推薦質(zhì)量呈現(xiàn)降低的趨勢(shì)。因此,隨機(jī)游走的步長(zhǎng)不宜過(guò)長(zhǎng),而且最優(yōu)值也跟關(guān)系網(wǎng)絡(luò)的規(guī)模有關(guān)系,在區(qū)間[0.05,0.10]取值為最優(yōu)。當(dāng)取值大于0.10時(shí),曲線都呈現(xiàn)下降的趨勢(shì)。值過(guò)大會(huì)使得步長(zhǎng)都偏小,因此步長(zhǎng)也不宜過(guò)短。
圖6 參數(shù)mw、p實(shí)驗(yàn)分析Fig. 6 Experimental analysis of parameter mw,p
本文提出一種多關(guān)系網(wǎng)絡(luò)混合嵌入的服務(wù)推薦方法,利用混合網(wǎng)絡(luò)嵌入的方法,得到多關(guān)系網(wǎng)絡(luò)映射的用戶(hù)和服務(wù)表征向量。再利用嵌入向量對(duì)目標(biāo)用戶(hù)進(jìn)行服務(wù)推薦。在三個(gè)公開(kāi)數(shù)據(jù)集上與多種代表性的服務(wù)推薦方法進(jìn)行比較實(shí)驗(yàn)。相比基于單一關(guān)系網(wǎng)絡(luò)和簡(jiǎn)單融合多關(guān)系網(wǎng)絡(luò)的服務(wù)推薦方法,F(xiàn)mearsure值分別可提高21%、15%。證明了本文提出的多網(wǎng)絡(luò)混合嵌入方法可以有效地協(xié)同多關(guān)系網(wǎng)絡(luò),進(jìn)而提高服務(wù)推薦質(zhì)量。也證明了本文提出的多網(wǎng)絡(luò)混合嵌入方法也可以有效地映射出用戶(hù)和服務(wù)的表征向量,并且混合考慮多種關(guān)系網(wǎng)絡(luò)有助于提高服務(wù)推薦質(zhì)量。
本文提出的服務(wù)推薦模型目的是綜合考慮多種用戶(hù)與服務(wù)之間的關(guān)系。本文采取的是分離獨(dú)立的關(guān)系網(wǎng)絡(luò),如用戶(hù)社交關(guān)系網(wǎng)絡(luò)、服務(wù)標(biāo)簽共有關(guān)系網(wǎng)絡(luò),但是在現(xiàn)實(shí)生活中,應(yīng)該是異質(zhì)的復(fù)雜關(guān)系網(wǎng)絡(luò)。用戶(hù)和服務(wù)都是多樣的,關(guān)系也是多樣的。因此后續(xù)的工作中,希望能對(duì)異質(zhì)的復(fù)雜關(guān)系網(wǎng)絡(luò)進(jìn)行混合關(guān)系映射。并且本文進(jìn)行基于相似用戶(hù)集群的服務(wù)推薦時(shí),其實(shí)是一種目標(biāo)用戶(hù)與推薦服務(wù)的簡(jiǎn)單映射,通過(guò)機(jī)器學(xué)習(xí)優(yōu)化出一個(gè)數(shù)學(xué)模型和深度聚類(lèi)都是目前流行的優(yōu)化服務(wù)推薦模型的方法,后續(xù)工作也會(huì)考慮使用和改進(jìn)這些方法。