亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶記憶的對(duì)話推薦模型

        2023-10-25 02:11:52潘杰忠陳佳欽
        中文信息學(xué)報(bào) 2023年8期
        關(guān)鍵詞:記憶用戶信息

        袁 健,潘杰忠,孫 煜,陳佳欽

        (上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)

        0 引言

        隨著一大批電子商務(wù)平臺(tái)如淘寶、京東的出現(xiàn),在線購(gòu)物越來(lái)越普遍,滿足了人們?nèi)粘Y?gòu)物的需要。隨著在線商城的商品和用戶數(shù)量與日俱增,平臺(tái)中的人工客服難以同時(shí)回應(yīng)所有用戶的需求,為了緩解人工的壓力,同時(shí)幫助用戶在大量商品中更快速地找到心儀的商品,催生了面向任務(wù)的對(duì)話系統(tǒng),利用智能系統(tǒng)與用戶進(jìn)行對(duì)話來(lái)幫助用戶更快地找到心儀的商品[1],這也極大地促進(jìn)了對(duì)基于對(duì)話的推薦系統(tǒng)的研究[1-2]。

        傳統(tǒng)的推薦系統(tǒng)通常為靜態(tài)推薦模型,主要根據(jù)用戶過(guò)去的信息(如點(diǎn)擊記錄、對(duì)物品的評(píng)分)進(jìn)行離線訓(xùn)練,進(jìn)而預(yù)測(cè)用戶對(duì)某個(gè)項(xiàng)目的偏好。早期的方法,如協(xié)同過(guò)濾[3],應(yīng)用矩陣分解技術(shù)根據(jù)用戶購(gòu)買過(guò)的商品計(jì)算近鄰關(guān)系進(jìn)行推薦,然而缺少新用戶數(shù)據(jù)會(huì)出現(xiàn)冷啟動(dòng)問題[4]。最近的基于神經(jīng)網(wǎng)絡(luò)的推薦方法,假設(shè)用戶具有靜態(tài)偏好,進(jìn)而根據(jù)用戶的歷史數(shù)據(jù)來(lái)推斷用戶興趣,但是由于內(nèi)部或外部因素,用戶的興趣會(huì)隨著時(shí)間的推移而不斷變化[5],因而難以獲取用戶當(dāng)前興趣,同時(shí)用戶的歷史數(shù)據(jù)通常并不連續(xù),即數(shù)據(jù)存在一定的稀疏性,進(jìn)而影響推薦質(zhì)量[6]。并且,不同用戶購(gòu)買相同的商品雖然很常見,但他們的動(dòng)機(jī)可能不同[7],而靜態(tài)推薦模型很難發(fā)掘用戶消費(fèi)行為背后的不同原因。與傳統(tǒng)推薦方法相比,對(duì)話推薦方法將用戶置于推薦循環(huán)中來(lái)解決這些問題[1],對(duì)話推薦系統(tǒng)是一種動(dòng)態(tài)推薦模型,通過(guò)反復(fù)提問和收集反饋,可以很容易地引出用戶當(dāng)前的偏好,并理解用戶消費(fèi)行為背后的原因,從而為用戶生成更準(zhǔn)確的推薦。因此,對(duì)基于對(duì)話的推薦系統(tǒng)的研究有著較高的應(yīng)用價(jià)值[8]。

        目前的對(duì)話推薦系統(tǒng)大多通過(guò)詢問用戶當(dāng)前心儀商品的相關(guān)屬性來(lái)更新用戶偏好,但忽略了用戶的歷史偏好,例如,用戶的歷史記錄(對(duì)話、評(píng)論)中會(huì)反映出用戶對(duì)某一商品或商品屬性的偏好,這些偏好可能與用戶當(dāng)前想要購(gòu)買的商品相關(guān),但現(xiàn)有的對(duì)話推薦系統(tǒng)未有效利用用戶的歷史記錄中所隱藏的偏好信息,通常會(huì)以隨機(jī)順序詢問用戶當(dāng)前心儀商品的屬性,這種方式可能需要較多對(duì)話回合數(shù)才能達(dá)到一定的準(zhǔn)確性,進(jìn)而導(dǎo)致對(duì)話過(guò)長(zhǎng)而影響整個(gè)系統(tǒng)的效率。此外,在電子商務(wù)平臺(tái)中,用戶通常有多種行為(如點(diǎn)擊、購(gòu)買),這不同程度地反映出用戶的潛在興趣,如何有效利用這些行為數(shù)據(jù)來(lái)提高對(duì)話推薦系統(tǒng)的性能也是一個(gè)有待解決的問題。

        針對(duì)以上問題,本文首先提出了用戶記憶的概念來(lái)表示用戶可能遺忘的交互、對(duì)話記錄,用戶記憶包括用戶的行為記憶和關(guān)系記憶,其中行為記憶是用戶對(duì)商品產(chǎn)生的交互行為(點(diǎn)擊、加入購(gòu)物車和購(gòu)買)記錄,關(guān)系記憶是將離線和在線狀態(tài)下獲取到的用戶評(píng)論、對(duì)話記錄融入知識(shí)圖來(lái)得到基于用戶-商品的關(guān)系圖。在此基礎(chǔ)上,本文提出了基于用戶記憶的對(duì)話推薦模型(User Memory for Conversational Recommendation,UMCR),利用關(guān)系記憶來(lái)捕獲用戶、商品和屬性之間的關(guān)系信息,保證系統(tǒng)能夠始終詢問與用戶偏好最相關(guān)的問題,從而使對(duì)話盡可能簡(jiǎn)短地盡快捕獲用戶當(dāng)前偏好,并結(jié)合對(duì)話之外的行為記憶信息,在緩解用戶歷史記錄稀疏性的同時(shí),充分挖掘用戶的潛在興趣,以提高其對(duì)用戶需求和搜索結(jié)果的信心,進(jìn)而快速準(zhǔn)確地向用戶進(jìn)行推薦。

        1 相關(guān)工作

        在電子商務(wù)平臺(tái)中,用戶對(duì)商品的行為通常是序列化的,而不是獨(dú)立的,并且用戶的興趣是動(dòng)態(tài)變化的,通過(guò)序列機(jī)制可以很好地捕捉這種變化,進(jìn)而挖掘用戶的潛在興趣;而對(duì)話、評(píng)論數(shù)據(jù)中通常包括用戶、商品、屬性等多種實(shí)體,這些實(shí)體是離散的,通過(guò)圖結(jié)構(gòu)可以很好地在這些實(shí)體之間建立連接,從而捕獲它們的關(guān)聯(lián)關(guān)系,并且圖結(jié)構(gòu)可以跟蹤用戶到推薦項(xiàng)目的連接路徑,并將路徑呈現(xiàn)給用戶,使推薦系統(tǒng)具有可解釋性和透明性,因此本文利用基于序列和圖的方法分別對(duì)用戶行為記憶和關(guān)系記憶進(jìn)行處理來(lái)進(jìn)行對(duì)話推薦。本節(jié)首先介紹基于序列和圖的推薦算法研究現(xiàn)狀,然后介紹對(duì)話推薦的研究現(xiàn)狀。

        1.1 序列推薦

        序列推薦的目的是根據(jù)用戶的歷史行為序列進(jìn)行推薦。行為序列一般包含豐富的用戶偏好信息,充分地挖掘序列信息可以更好地理解用戶意圖。早期的基于序列的推薦方法如馬爾可夫鏈,利用序列數(shù)據(jù)計(jì)算物品之間的轉(zhuǎn)移概率來(lái)預(yù)測(cè)用戶的下一個(gè)可能點(diǎn)擊的項(xiàng)目。最近基于深度學(xué)習(xí)的技術(shù)得到越來(lái)越多的關(guān)注,Tan等人[9]應(yīng)用RNN建模用戶和物品的交互序列進(jìn)行推薦,通過(guò)并行方法加快模型的訓(xùn)練。You等人[10]利用卷積神經(jīng)網(wǎng)絡(luò)來(lái)解決RNN帶來(lái)的梯度消失問題,同時(shí)細(xì)化序列短期特征。但是深度學(xué)習(xí)模型難以捕獲序列中物品之間的長(zhǎng)期依賴,導(dǎo)致推薦效果較差[11]。

        注意力機(jī)制在序列數(shù)據(jù)建模方面展示出良好的性能,如機(jī)器翻譯[11],因此也被應(yīng)用于序列推薦來(lái)提高推薦性能和可解釋性[12-13]。例如,Li等人[12]在GRU中加入自注意力以捕獲用戶行為序列中的潛在興趣。上述方法只是將注意力機(jī)制作為原始模型的一個(gè)附加組件。相比之下,完全建立在多頭自注意力機(jī)制上的Transformer[11]在序列建模方面取得了最好的性能,Liu等人[14]提出基于Transformer的模型TiSAS,將時(shí)間戳信息合并到自注意力中來(lái)對(duì)用戶歷史行為序列建模,并通過(guò)實(shí)驗(yàn)證明了Transformer對(duì)序列推薦的有效性。但目前基于序列的方法存在以下局限性: 只是對(duì)單一行為序列進(jìn)行學(xué)習(xí),忽略了序列的上下文信息,并且在模型的多頭自注意力中使用相同的嵌入,這可能會(huì)浪費(fèi)時(shí)間學(xué)習(xí)重疊的信息。

        1.2 基于圖的推薦

        基于圖的推薦主要有兩種形式,第一種是將推薦建模為一個(gè)圖上的路徑推理問題,用于構(gòu)建可解釋的推薦系統(tǒng)[15]。另一種是通過(guò)基于圖的表示學(xué)習(xí)來(lái)提高推薦性能,利用圖的結(jié)構(gòu)信息進(jìn)行協(xié)同過(guò)濾,并將圖的嵌入表示作為上下文信息[16]。近年來(lái),圖神經(jīng)網(wǎng)絡(luò)(GNN)非常流行,其目的是學(xué)習(xí)離散圖結(jié)構(gòu)上的隱藏表示[17],可以學(xué)習(xí)到傳統(tǒng)推薦算法中無(wú)法學(xué)習(xí)到的用戶與物品相互之間的關(guān)聯(lián)關(guān)系,能夠很好地適用于基于圖的推薦模型,Wang等人[18]提出NGCF模型,將GNN應(yīng)用于圖的推薦,建模用戶與項(xiàng)目之間的關(guān)聯(lián)并依此做出推薦。

        最近有人提出基于圖的對(duì)話推薦,Moon等人[19]構(gòu)建一個(gè)語(yǔ)料庫(kù),將對(duì)話中的實(shí)體與知識(shí)圖譜中的路徑連接起來(lái),進(jìn)而預(yù)測(cè)下一個(gè)可能出現(xiàn)的實(shí)體來(lái)進(jìn)行推薦。Chen等人[20]提出基于知識(shí)圖的對(duì)話推薦系統(tǒng),通過(guò)GNN學(xué)習(xí)到的知識(shí)表示來(lái)有效集成推薦系統(tǒng)和對(duì)話系統(tǒng)。但目前的工作均利用的是外部知識(shí)圖,未考慮將用戶端信息即用戶歷史記錄中用戶與物品之間的關(guān)系作為圖的一部分,將用戶歷史記錄整合進(jìn)知識(shí)圖可以更快地找到合適的項(xiàng)目。

        1.3 對(duì)話推薦

        對(duì)話推薦系統(tǒng)可定義為通過(guò)實(shí)時(shí)多回合互動(dòng),來(lái)獲取用戶偏好并根據(jù)其當(dāng)前需求采取行動(dòng)的推薦系統(tǒng)[8]。對(duì)話推薦的雛形可追溯到早期設(shè)計(jì)的交互式對(duì)話搜索系統(tǒng),通過(guò)與用戶對(duì)話加快信息檢索。隨著自然語(yǔ)言處理技術(shù)的不斷發(fā)展,對(duì)話推薦得到越來(lái)越多的關(guān)注,現(xiàn)有的研究大多遵循系統(tǒng)詢問用戶響應(yīng)范式[2],當(dāng)收集到足夠多的用戶偏好時(shí)向用戶做出推薦。例如,Raymond等人[21]通過(guò)對(duì)話來(lái)獲取新用戶的偏好,然后與傳統(tǒng)推薦系統(tǒng)中類似用戶進(jìn)行匹配來(lái)解決冷啟動(dòng)問題。Zou等人[22]提出基于問題的對(duì)話推薦方法,通過(guò)自動(dòng)生成和算法選擇的問題來(lái)詢問用戶對(duì)物品屬性的偏好。這些方法對(duì)偏好的學(xué)習(xí)只是短期的,接近于面向任務(wù)的對(duì)話系統(tǒng)。Zhang等人[2]利用用戶評(píng)論模擬在線對(duì)話來(lái)更新現(xiàn)有用戶的偏好,并通過(guò)重排序方法進(jìn)行推薦。Ali等人[23]將強(qiáng)化學(xué)習(xí)應(yīng)用于對(duì)話推薦系統(tǒng)來(lái)提高問題與用戶的相關(guān)度,然后通過(guò)提問或推薦候選物品進(jìn)行迭代,直到達(dá)到用戶標(biāo)準(zhǔn)。Ma等人[24]在知識(shí)圖上進(jìn)行樹結(jié)構(gòu)推理以探索背景知識(shí),并利用實(shí)體之間的聯(lián)系進(jìn)行對(duì)話推薦。但是上述方法都未考慮用戶的歷史與潛在興趣,導(dǎo)致需要較多對(duì)話回合數(shù)才能準(zhǔn)確獲取用戶當(dāng)前偏好,進(jìn)而影響系統(tǒng)整體效率。

        本文利用用戶記憶信息來(lái)解決上述目前對(duì)話推薦系統(tǒng)存在的問題,主要貢獻(xiàn)如下:

        (1) 提出了基于用戶記憶的對(duì)話推薦模型UMCR,通過(guò)融入用戶的多行為序列和用戶-物品的關(guān)系信息來(lái)動(dòng)態(tài)管理用戶的過(guò)去偏好和當(dāng)前需求,以實(shí)現(xiàn)以最少的對(duì)話次數(shù)完成精準(zhǔn)推薦;

        (2) 針對(duì)目前序列建模方法的局限性,設(shè)計(jì)了一種基于改進(jìn)的Transformer的興趣提取單元,該單元在多頭自注意力中使用多類型上下文嵌入來(lái)捕獲序列中的多種特征,能更好地學(xué)習(xí)用戶行為記憶序列中的潛在興趣;

        (3) 針對(duì)目前圖的構(gòu)建方式的局限性,將用戶歷史評(píng)論、對(duì)話記錄融入外部知識(shí)來(lái)構(gòu)建用戶、商品和屬性之間的關(guān)系圖,基于學(xué)習(xí)到的圖的表示來(lái)調(diào)整對(duì)話策略,以生成下一個(gè)與用戶偏好最相關(guān)的問題,并隨著對(duì)話的進(jìn)行不斷更新圖以供長(zhǎng)期使用。最后,通過(guò)實(shí)驗(yàn)表明,本文提出的模型在保證準(zhǔn)確性的基礎(chǔ)上能以更少的對(duì)話次數(shù)成功推薦。

        2 基于用戶記憶的對(duì)話推薦模型

        本文提出基于用戶記憶的對(duì)話推薦模型UMCR,包括用戶記憶模塊、推薦模塊和對(duì)話模塊三部分,用戶記憶模塊包括行為記憶與關(guān)系記憶,分別通過(guò)序列方法和圖方法進(jìn)行處理來(lái)應(yīng)用于推薦和對(duì)話,UMCR的框架設(shè)計(jì)如圖1所示。首先應(yīng)用關(guān)系圖卷積網(wǎng)絡(luò)學(xué)習(xí)關(guān)系記憶中關(guān)系圖的節(jié)點(diǎn)嵌入,基于學(xué)習(xí)到的嵌入表示,將其加入對(duì)話模塊中來(lái)生成最符合當(dāng)前對(duì)話上下文的語(yǔ)句以盡快捕獲用戶當(dāng)前偏好,同時(shí)根據(jù)用戶的反饋不斷更新關(guān)系圖;其次,利用改進(jìn)的Transformer[9]建模多行為序列來(lái)生成用戶的潛在興趣向量,與關(guān)系圖的節(jié)點(diǎn)嵌入融合獲得用戶興趣表示,最后與候選商品嵌入進(jìn)行匹配來(lái)產(chǎn)生推薦。

        圖1 UMCR模型框架圖

        2.1 用戶記憶模塊

        通過(guò)用戶記憶模塊,在對(duì)話時(shí)利用關(guān)系記憶捕獲用戶當(dāng)前需求與歷史偏好之間的關(guān)聯(lián),從而生成與用戶偏好最相關(guān)的問題,以減少無(wú)效的詢問;在推薦時(shí)利用行為記憶獲取用戶的潛在興趣,并與關(guān)系記憶融合,在緩解數(shù)據(jù)稀疏性的同時(shí)做出更準(zhǔn)確的推薦。

        2.1.1 行為記憶

        在電子商務(wù)平臺(tái)中,用戶通常具有多樣化的行為,例如,點(diǎn)擊、加入購(gòu)物車和購(gòu)買。將用戶多行為序列引入對(duì)話推薦系統(tǒng)中,不僅緩解了數(shù)據(jù)稀疏性,而且在對(duì)話推薦時(shí)通過(guò)結(jié)合從行為序列中提取到的用戶潛在興趣,能顯著提高對(duì)用戶需求和搜索結(jié)果的信心。

        對(duì)于行為序列的處理,基于多頭自注意力機(jī)制的Transformer模型可捕獲序列中行為之間的依賴關(guān)系,并可實(shí)現(xiàn)并行訓(xùn)練,因此可被用于建模用戶多行為序列來(lái)提取用戶的潛在興趣。但用戶的不同行為通常有著不同的時(shí)間尺度(如用戶一天中會(huì)有許多點(diǎn)擊行為,但一周只有少數(shù)購(gòu)買行為),即不同行為序列中行為之間的依賴程度不同,進(jìn)而會(huì)不同程度地反映出用戶的潛在興趣,而目前的模型大多忽略了包含這些重要信息的時(shí)間尺度,或者考慮到了時(shí)間尺度卻在每個(gè)注意力上使用相同的嵌入,這可能難以有效利用時(shí)間特征,導(dǎo)致學(xué)習(xí)到的信息有限。為此,本文設(shè)計(jì)了一種興趣提取單元(Trans),通過(guò)在Transformer中引入多類型上下文(時(shí)間、位置)嵌入來(lái)關(guān)注序列的多種特征,不僅學(xué)習(xí)到行為的位置順序信息,也考慮到了行為之間依賴程度不同的特點(diǎn),并且在多頭自注意力的每個(gè)注意力上使用不同的嵌入,在提升計(jì)算效率的同時(shí)使每個(gè)注意力專注于特定的特征來(lái)學(xué)習(xí)更準(zhǔn)確的序列表示,進(jìn)而更準(zhǔn)確地提取用戶的潛在興趣。

        (1) 輸入和嵌入方法

        首先定義行為記憶的輸入為用戶的多行為序列,由一個(gè)可變長(zhǎng)度的商品序列表示。對(duì)于用戶u∈U,商品i∈I,輸入表示為B=[i1,i2,…,iL],其中L是序列的長(zhǎng)度,序列中的每個(gè)元素代表用戶u對(duì)商品i做出了此種類型的行為,本文考慮了三種類型的用戶行為序列: 點(diǎn)擊序列Bc,購(gòu)物車序列Ba和購(gòu)買序列Bo。同時(shí)對(duì)于序列中的每一個(gè)商品,都有其對(duì)應(yīng)的時(shí)間戳值和位置索引作為上下文信息,分別以序列T=[t1,t2,…,tL]和P=[p1,p2,…,pL]表示。

        然后利用嵌入方法將序列轉(zhuǎn)換為提供給興趣提取單元的隱藏特征。對(duì)于每一個(gè)商品i,使用其名稱id和標(biāo)簽id來(lái)表示,然后使用可學(xué)習(xí)的嵌入表將稀疏的名稱id和標(biāo)簽id轉(zhuǎn)換為低維稠密向量表示,再將這些向量串聯(lián)成單個(gè)嵌入向量el,最后獲得序列嵌入EB=[e1;e2;…;eL]∈Rd×L,el∈Rd表示維度為d的嵌入向量。對(duì)于時(shí)間戳序列T,序列中的元素代表用戶對(duì)商品產(chǎn)生交互行為的具體時(shí)間戳值,使用一個(gè)可學(xué)習(xí)的矩陣XT∈R|l|×h將每一個(gè)時(shí)間戳轉(zhuǎn)換為一個(gè)嵌入向量來(lái)獲得時(shí)間嵌入ET,其中h是隱藏特征大小,l是數(shù)據(jù)集中的時(shí)間跨度,考慮到矩陣大小和整體有效性,選擇“一天”作為時(shí)間長(zhǎng)度。為了更好地表達(dá)位置信息,類似于以往的工作[11],采用兩種方式建模位置序列P: 第一種是絕對(duì)位置嵌入,使用一個(gè)可學(xué)習(xí)的嵌入矩陣XP∈R|l|×h映射每一個(gè)位置索引,進(jìn)而獲得絕對(duì)位置嵌入EP;第二種是使用正余弦函數(shù)將序列的位置信息轉(zhuǎn)換為嵌入向量來(lái)表示相對(duì)位置嵌入ER。對(duì)于用戶id,將其表示為獨(dú)熱編碼向量作為用戶特征嵌入。

        (2) 興趣提取單元

        利用興趣提取單元(Trans)來(lái)提取行為序列中的用戶潛在興趣,其結(jié)構(gòu)如圖2所示。

        圖2 興趣提取單元

        多頭自注意力層興趣提取單元的輸入為行為序列嵌入和三種上下文嵌入(一種時(shí)間嵌入和兩種位置嵌入),嵌入特征首先通過(guò)多頭自注意力層。傳統(tǒng)的自注意力模塊使用注意函數(shù)將查詢和一組鍵值對(duì)映射到輸出,輸出的是值的加權(quán)和且查詢、鍵值都是向量,分配給每個(gè)值的權(quán)重由一個(gè)查詢和相應(yīng)鍵的函數(shù)計(jì)算,通過(guò)自注意力可以考慮到序列的整體相關(guān)性,具體計(jì)算公式采用的是縮放點(diǎn)積注意,如式(1)所示。

        (1)

        其中,Q,K和V分別代表查詢、鍵和值,查詢和鍵的維度相同都為dk,值的維度為dv,通過(guò)Softmax函數(shù)獲得值的權(quán)重。

        由于單個(gè)自注意力只能捕捉一種序列中的關(guān)系,因此在實(shí)踐中通常使用多個(gè)并行的自注意力模塊捕捉序列中的多種關(guān)系,即使用多個(gè)注意力矩陣和多個(gè)權(quán)重對(duì)輸入值進(jìn)行加權(quán)平均成為多頭自注意力,最后對(duì)加權(quán)平均的結(jié)果進(jìn)行拼接,這樣可以更好地捕獲序列中的相互關(guān)系。該過(guò)程可用式(2)、式(3)所示。

        其中,bK,bQ,bV∈Rdk,然后通過(guò)計(jì)算QKT可分別捕捉位置信息和包含key的內(nèi)容信息。

        但是序列中包含著豐富的上下文信息,僅僅利用位置信息難以捕捉行為之間不同的依賴關(guān)系,并且在多頭自注意力中的每個(gè)注意力頭都使用相同的位置嵌入,這可能會(huì)浪費(fèi)訓(xùn)練時(shí)間,學(xué)習(xí)到的信息也是有限的。因此本文設(shè)置了三個(gè)注意力頭,在每個(gè)注意力頭上使用不同的上下文嵌入,如圖2所示,分別是時(shí)間嵌入、絕對(duì)位置嵌入和相對(duì)位置嵌入,時(shí)間嵌入可以將注意力范圍限制在同一(周或類似)天內(nèi),從而更好地捕捉不同時(shí)間尺度下行為之間的依賴關(guān)系;絕對(duì)位置嵌入可以提取序列中不同位置的信息,從而在學(xué)習(xí)當(dāng)前行為表示時(shí)不僅用到之前的行為信息,還考慮到后面位置的行為信息;相對(duì)位置嵌入捕捉序列中的周期性行為信息,通過(guò)這樣設(shè)置將反饋給注意力模塊的上下文信息多樣化,從而關(guān)注序列的多種特征以更好地學(xué)習(xí)用戶潛在興趣。

        對(duì)于每個(gè)注意力頭中序列嵌入和上下文嵌入的合并方式,傳統(tǒng)的直接合并的方法(圖3左圖)僅適用于多頭自注意力只有單個(gè)位置嵌入的情況,難以適用于本文提出的多類型上下文嵌入機(jī)制,因此為了充分利用多種形式的上下文嵌入,在每個(gè)注意力頭上分別合并序列嵌入和上下文嵌入的查詢、鍵映射,從而使每個(gè)注意力頭專注于各自的上下文嵌入來(lái)學(xué)習(xí)更準(zhǔn)確地序列表示,如圖3右圖所示。

        圖3 多頭注意力設(shè)置

        位置全連接前饋網(wǎng)絡(luò)層在經(jīng)過(guò)多頭自注意力層后,應(yīng)用一個(gè)位置全連接前饋神經(jīng)網(wǎng)絡(luò)來(lái)提高模型的表達(dá)能力,使用更平滑的GELU激活函數(shù),如式(7)所示。

        FFN(x)=GELU(xW1+b1)W2+b2

        (7)

        其中,W1∈Rd×h,W2∈Rh×d,b1∈Rh,b2∈Rd為可學(xué)習(xí)的參數(shù),但是隨著網(wǎng)絡(luò)的層數(shù)增加,訓(xùn)練會(huì)變得困難,因此如圖2所示,在多頭自注意力層和位置全鏈接前饋網(wǎng)絡(luò)層這兩個(gè)子層的周圍都使用殘差連接和層歸一化步驟,具體表示如式(8)~式(10)所示。

        2.1.2 關(guān)系記憶

        本文通過(guò)提取用戶歷史(對(duì)話、評(píng)論)記錄中包含的所有實(shí)體(如商品、屬性)來(lái)構(gòu)建關(guān)系記憶,其基本思想是: 用戶的歷史記錄通常反映用戶對(duì)商品和屬性的偏好,通過(guò)提取歷史記錄中的實(shí)體并以不同的關(guān)系建立連接,由此構(gòu)建一個(gè)關(guān)系記憶網(wǎng)絡(luò)來(lái)具體記錄用戶、商品和屬性之間的關(guān)系信息,進(jìn)而在對(duì)話時(shí)通過(guò)關(guān)系記憶能夠找到與用戶當(dāng)前偏好最相關(guān)的商品或?qū)傩赃M(jìn)行詢問,以提高系統(tǒng)效率和用戶滿意度。

        由于歷史記錄中的實(shí)體大多是離散的,傳統(tǒng)的將歷史記錄直接編碼的方法難以捕獲實(shí)體之間的關(guān)系,在對(duì)話中存在實(shí)體候選空間過(guò)大的問題,通常需要較多回合才能找到與用戶偏好最相關(guān)的商品和屬性,而圖結(jié)構(gòu)可以很好地建立起離散實(shí)體之間的關(guān)聯(lián),從而能夠發(fā)現(xiàn)用戶對(duì)商品和屬性的偏好,因此本文以圖的方式處理用戶歷史記錄,并融入外部知識(shí)來(lái)得到基于用戶-商品的關(guān)系圖作為關(guān)系記憶。

        為了構(gòu)建和更新關(guān)系圖,需要將非結(jié)構(gòu)化的話語(yǔ)轉(zhuǎn)化為結(jié)構(gòu)化知識(shí),因此在預(yù)訓(xùn)練階段,本文根據(jù)Chen等人[20]的方法從亞馬遜語(yǔ)料庫(kù)[25]提取實(shí)體關(guān)鍵詞,主要包括用戶歷史記錄語(yǔ)句中的關(guān)鍵字詞和相關(guān)的商品屬性信息(名稱、類別、特征、品牌名、價(jià)格等領(lǐng)域詞匯),然后將獲得的實(shí)體關(guān)鍵詞作為起始節(jié)點(diǎn),在外部知識(shí)圖KG[26]上提取它們一跳范圍內(nèi)的三元組來(lái)構(gòu)建關(guān)系圖。在此基礎(chǔ)上定義關(guān)系圖中的三元組表示為,其中,e1,e2∈E表示圖中的實(shí)體,r∈R表示實(shí)體之間的關(guān)系。關(guān)系圖不僅捕獲了用戶對(duì)商品產(chǎn)生的歷史記錄,而且包含了豐富的商品元信息,圖中的實(shí)體代表用戶對(duì)話與評(píng)論記錄中出現(xiàn)過(guò)的關(guān)鍵詞、商品及其對(duì)應(yīng)的屬性,每個(gè)實(shí)體通過(guò)不同的關(guān)系互相連接。通過(guò)這種方式,在對(duì)話時(shí)能夠從捕獲到的不同類型節(jié)點(diǎn)(用戶、商品和屬性)之間的關(guān)系信息來(lái)快速定位與用戶偏好最相關(guān)的實(shí)體,從而縮小候選空間來(lái)減少對(duì)話詢問次數(shù),進(jìn)而更快速地為用戶做出推薦。并且隨著對(duì)話的進(jìn)行,圖中的實(shí)體不斷擴(kuò)展連接進(jìn)行更新,最后基于學(xué)習(xí)到的圖的表示,與用戶潛在興趣融合來(lái)產(chǎn)生推薦。

        例如,對(duì)于表1用戶當(dāng)前需求,利用圖4關(guān)系圖進(jìn)行的對(duì)話如下: 根據(jù)用戶的對(duì)話,得知當(dāng)前用戶需求為餅干,希望系統(tǒng)給出推薦,系統(tǒng)收到請(qǐng)求后通過(guò)關(guān)系圖獲取用戶對(duì)餅干的偏好可能與“卡夫公司”的產(chǎn)品相關(guān),從而縮小了詢問的范圍,避免餅干的種類過(guò)多難以選擇要詢問的類型。然后系統(tǒng)詢問用戶對(duì)“趣多多”類型的餅干是否感興趣,用戶做出肯定答復(fù)但想嘗試其他類型的餅干,然后系統(tǒng)進(jìn)一步根據(jù)用戶在評(píng)論中表達(dá)出對(duì)“健康”食品的偏好,詢問用戶是否偏好比較健康的餅干,然后得知用戶依然喜愛,再結(jié)合用戶潛在興趣推薦具有這些屬性的“無(wú)糖奧利奧”,最后獲得用戶肯定答復(fù)后表示推薦成功,再更新關(guān)系圖,如圖4所示。

        表1 對(duì)話示例

        圖4 關(guān)系圖示例

        為了在對(duì)話中利用關(guān)系記憶,首先需要學(xué)習(xí)關(guān)系圖中的實(shí)體表示和結(jié)構(gòu)信息,然后加入對(duì)話模塊??紤]到本文提出的關(guān)系圖中的邊表示為不同的關(guān)系,為了更好地學(xué)習(xí)圖中用戶、商品及屬性之間的相關(guān)性信息,應(yīng)用關(guān)系圖卷積網(wǎng)絡(luò)(R-GCN)將關(guān)系圖中的實(shí)體和關(guān)系信息編碼為隱藏表示,R-GCN是一個(gè)帶有類型化關(guān)系的圖卷積網(wǎng)絡(luò),其中每個(gè)關(guān)系都與它們自己的權(quán)重相關(guān)聯(lián)[17]。每個(gè)實(shí)體由多層R-GCN進(jìn)行編碼,節(jié)點(diǎn)在第l+1層的隱藏表示可通過(guò)式(1)計(jì)算。

        (11)

        2.2 推薦模塊

        其中,σ為激活函數(shù),W,b分別為可學(xué)習(xí)的參數(shù)矩陣和偏置向量,z表示門控信號(hào),通過(guò)門控機(jī)制來(lái)控制信息的融合速度,有選擇地加入新的信息和遺忘不需要的信息,并使模型能夠選擇與用戶當(dāng)前需求相關(guān)的信息來(lái)提高推薦的準(zhǔn)確性。

        然后根據(jù)學(xué)習(xí)到的用戶興趣表示,遵循一般的方法,計(jì)算從商品集合中向用戶u推薦商品i的概率,如式(14)所示。

        (14)

        其中,ei表示商品嵌入,根據(jù)式(14)可以得到所有商品的預(yù)測(cè)分?jǐn)?shù)進(jìn)行排序,然后將預(yù)測(cè)分?jǐn)?shù)最高的商品推薦給用戶。在訓(xùn)練階段,為了學(xué)習(xí)模型的參數(shù),定義以下交叉熵?fù)p失,如式(15)所示。

        (15)

        其中,t是對(duì)話的輪數(shù)索引,l是商品的索引,通過(guò)循環(huán)整個(gè)集合來(lái)計(jì)算交叉熵?fù)p失,由于損失函數(shù)相對(duì)于模型的參數(shù)是可微的,因此本文在基于梯度的數(shù)值優(yōu)化算法上使用反向傳播來(lái)訓(xùn)練模型。

        2.3 對(duì)話模塊

        Transformer[11]在人機(jī)問答、自然語(yǔ)言生成等任務(wù)中性能顯著,能順利進(jìn)行對(duì)話生成,因此本文將其作為基礎(chǔ)對(duì)話模塊。Transformer包括編碼器與解碼器,編碼器將輸入的用戶語(yǔ)句序列中的每個(gè)單詞進(jìn)行編碼,得到序列的高階表示;然后將其輸入解碼器解碼,得到輸出的語(yǔ)句詞向量序列;最后在詞向量序列上應(yīng)用Softmax分類函數(shù)來(lái)得到單詞表上的概率分布。

        為了生成與用戶偏好和當(dāng)前推薦任務(wù)最相關(guān)的對(duì)話,本文將關(guān)系圖的增強(qiáng)表示加入對(duì)話模塊。具體來(lái)說(shuō),將學(xué)習(xí)到的關(guān)系圖的實(shí)體隱藏表示矩陣XR加入解碼器中來(lái)增強(qiáng)相關(guān)實(shí)體的表示,方法為在經(jīng)過(guò)多頭自注意力層后,加入一個(gè)基于關(guān)系圖的自注意力層(RA)來(lái)融合關(guān)系圖的信息,可以表示為:

        通過(guò)上述方式將關(guān)系圖中的信息融入解碼器,使得對(duì)話模塊能夠依據(jù)此信息動(dòng)態(tài)地調(diào)整對(duì)話策略,然后生成與用戶偏好最相關(guān)的回復(fù)。不同于一般的對(duì)話模型(如開放域?qū)υ?,對(duì)話推薦系統(tǒng)生成的回復(fù)語(yǔ)句中的詞匯應(yīng)包含推薦的商品、相關(guān)屬性和描述性關(guān)鍵字等相關(guān)實(shí)體,并且應(yīng)最大限度地提高對(duì)話下一個(gè)語(yǔ)句與用戶偏好的相關(guān)性,因此采用復(fù)制機(jī)制[26]從關(guān)系圖中復(fù)制與對(duì)話相關(guān)的詞匯來(lái)增強(qiáng)語(yǔ)句中這些詞匯的生成,計(jì)算方式為: 在給定已知詞匯序列w1,w2,…,wn-1時(shí),生成wn作為下一個(gè)詞匯的概率如式(20)所示。

        (20)

        其中,p1表示解碼器輸出的詞匯概率分布,p2表示在關(guān)系圖R的節(jié)點(diǎn)上使用復(fù)制機(jī)制實(shí)現(xiàn)的復(fù)制概率,然后進(jìn)一步設(shè)置下列交叉熵?fù)p失來(lái)訓(xùn)練對(duì)話模塊,如式(21)所示。

        (21)

        其中,N表示對(duì)話的回合數(shù),通過(guò)計(jì)算對(duì)話中每個(gè)語(yǔ)句sn的損失來(lái)獲得對(duì)話模塊的交叉熵?fù)p失。

        3 實(shí)驗(yàn)

        3.1 數(shù)據(jù)集

        本文在COOKIE數(shù)據(jù)集[26]上評(píng)估模型的效果,COOKIE是一個(gè)基于Amazon Review數(shù)據(jù)集構(gòu)建的對(duì)話推薦數(shù)據(jù)集,用于電子商務(wù)平臺(tái)中基于知識(shí)圖的對(duì)話推薦,該數(shù)據(jù)集包含四個(gè)領(lǐng)域,分別是手機(jī)&配件、食品、玩具&游戲以及汽車。本文需要利用用戶評(píng)論記錄來(lái)構(gòu)建關(guān)系記憶,由于Amazon Review包含用戶評(píng)論信息,并且COOKIE建立在Amazon Review的基礎(chǔ)之上,因此根據(jù)COOKIE中的用戶id在Amazon Review中找到對(duì)應(yīng)的用戶,然后將其評(píng)論記錄加入COOKIE。對(duì)于每一個(gè)用戶,都有其點(diǎn)擊、購(gòu)買行為記錄,但缺少購(gòu)物車行為記錄。考慮到JD Recsys數(shù)據(jù)集是一個(gè)包含多種電商平臺(tái)數(shù)據(jù)的大型工業(yè)數(shù)據(jù)集,具有多行為記錄,于是將其用于推薦系統(tǒng)的訓(xùn)練,與COOKIE中的數(shù)據(jù)存在交叉,因此將COOKIE和JD Recsys中的用戶名稱與id進(jìn)行匹配,從而提取到當(dāng)前用戶的購(gòu)物車行為記錄,部分用戶可能無(wú)法找到對(duì)應(yīng)的購(gòu)物車行為記錄,本文將該部分用戶作為后續(xù)消融實(shí)驗(yàn)的數(shù)據(jù)。將數(shù)據(jù)整合后,刪除缺少用戶或商品屬性信息的行為數(shù)據(jù)、對(duì)同一商品的重復(fù)操作和只有一個(gè)回合的對(duì)話,以確保數(shù)據(jù)集的質(zhì)量。對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理后,得到的具體統(tǒng)計(jì)數(shù)據(jù)如表2所示。

        表2 數(shù)據(jù)集統(tǒng)計(jì)

        其中實(shí)體包括用戶、商品及屬性數(shù)量,關(guān)系表示唯一關(guān)系類型的數(shù)量,行為表示存在點(diǎn)擊、加入購(gòu)物車和購(gòu)買三種行為的商品總數(shù),三元組表示三元組數(shù)量,語(yǔ)句表示對(duì)話和評(píng)論語(yǔ)句總數(shù)。

        3.2 對(duì)比方法

        為了驗(yàn)證UMCR模型的有效性,選取序列推薦模型(傳統(tǒng)序列推薦和結(jié)合時(shí)間尺度的序列推薦)、對(duì)話推薦模型(傳統(tǒng)對(duì)話推薦和結(jié)合知識(shí)圖的對(duì)話推薦)和對(duì)話模型進(jìn)行比較,在比較整體性能的同時(shí)驗(yàn)證模型各模塊的有效性和生成的對(duì)話質(zhì)量。具體為: ①GRU4Rec[9]: 一種傳統(tǒng)序列推薦模型; ②TiSAS[14]: 一種將注意力機(jī)制與時(shí)間尺度相結(jié)合的先進(jìn)的序列推薦模型; ③PMMN[2]: 一種傳統(tǒng)對(duì)話推薦模型; ④CR-Walker[24]: 一種利用知識(shí)圖的先進(jìn)的對(duì)話推薦模型; ⑤Transformer[9]: 一種傳統(tǒng)對(duì)話模型。

        3.3 評(píng)價(jià)指標(biāo)

        為了評(píng)估UMCR的性能,采用不同的評(píng)價(jià)指標(biāo)來(lái)分別評(píng)估模型的推薦性能和對(duì)話生成質(zhì)量。對(duì)于推薦性能,采用平均回合數(shù)(AT)來(lái)評(píng)估模型推薦成功所需的平均回合數(shù),采用平均倒數(shù)排名(MRR)來(lái)評(píng)估對(duì)話n輪后推薦的準(zhǔn)確度,分別定義如式(22)、式(23)所示。

        MRR表示向用戶推薦正確的商品之前用戶必須瀏覽的預(yù)期數(shù)量,根據(jù)前10個(gè)商品計(jì)算。其中Q表示目標(biāo)商品的數(shù)量,ranki表示第一個(gè)正確推薦商品的位置。

        對(duì)于對(duì)話生成質(zhì)量的評(píng)估,采用自動(dòng)評(píng)估和人工評(píng)估兩種方式。自動(dòng)評(píng)估標(biāo)準(zhǔn)包括Distinctn-gram(n=2,3,4)和Item Ratio。Distinct用來(lái)衡量句子層面的多樣性。由于在對(duì)話推薦中生成與商品相關(guān)的信息性回復(fù)十分重要,因此通過(guò)Item Ratio來(lái)計(jì)算生成的對(duì)話中項(xiàng)目的比率。自動(dòng)評(píng)估指標(biāo)定義如式(24)、式(25)所示。

        其中,Count(uniquen-gram)表示回復(fù)中不重復(fù)的n-gram數(shù)量,Count(item)表示回復(fù)中與商品相關(guān)的實(shí)體數(shù)量,Count(word)表示回復(fù)中詞語(yǔ)的總數(shù)量。在人工評(píng)估方面,本文邀請(qǐng)10名具有語(yǔ)言學(xué)知識(shí)的注釋人員從Fluency(流利度)、Coherence(連貫性)、Informativeness(信息量)和effectiveness(有效性)四個(gè)方面對(duì)生成的對(duì)話進(jìn)行評(píng)分,分?jǐn)?shù)范圍為1到3,將10名人員的平均分?jǐn)?shù)作為最終結(jié)果。其中Fluency和Coherence側(cè)重于對(duì)話生成質(zhì)量評(píng)估,Informativeness評(píng)估模型是否引入了豐富的知識(shí),effectiveness評(píng)估模型是否讓用戶成功找到心儀的商品。

        3.4 實(shí)驗(yàn)設(shè)置

        3.4.1 用戶模擬器

        由于對(duì)話推薦模型的交互性,它需要通過(guò)與用戶對(duì)話來(lái)進(jìn)行訓(xùn)練和評(píng)估。因此采用文獻(xiàn)[1]中的用戶模擬器,讓其充當(dāng)真實(shí)用戶的代理,自動(dòng)生成用戶當(dāng)前需求和對(duì)商品的自然語(yǔ)言反饋,該過(guò)程類似于購(gòu)物客服和用戶之間的購(gòu)物對(duì)話場(chǎng)景。

        3.4.2 實(shí)現(xiàn)細(xì)節(jié)

        對(duì)于數(shù)據(jù)集中的每個(gè)領(lǐng)域,隨機(jī)選取80%、10%和10%的數(shù)據(jù)分別作為訓(xùn)練、驗(yàn)證和測(cè)試集,采用用戶模擬器與對(duì)話推薦模型交互并使用驗(yàn)證集在線訓(xùn)練模型。對(duì)于超參數(shù)的設(shè)置,用戶記憶處理模塊的嵌入維度和隱藏維度設(shè)置為64,R-GCN的層數(shù)為2,正則化常數(shù)設(shè)置為1。在訓(xùn)練中使用默認(rèn)參數(shù)的Adam優(yōu)化器,批量大小設(shè)置為32,學(xué)習(xí)率設(shè)置為0.001,其他超參數(shù)的設(shè)置本文一般遵循作者的建議并適當(dāng)?shù)卦隍?yàn)證集上優(yōu)化。本文從頭開始訓(xùn)練所有模型,直到精度只有微小變化或不再提高,同時(shí)為了排除單次實(shí)驗(yàn)的隨機(jī)性,重復(fù)訓(xùn)練各個(gè)模型10次,然后取平均值作為實(shí)驗(yàn)結(jié)果。

        3.5 實(shí)驗(yàn)結(jié)果及分析

        3.5.1 推薦性能評(píng)估

        首先將回合數(shù)設(shè)置為3來(lái)對(duì)各個(gè)模型的準(zhǔn)確性指標(biāo)進(jìn)行測(cè)試,均取最好的結(jié)果進(jìn)行比較。不同的回合數(shù)設(shè)置下模型的性能會(huì)不同,這將在后續(xù)各節(jié)中進(jìn)行分析。如表3所示,基于注意力的序列模型TiSAS的準(zhǔn)確性明顯優(yōu)于基于RNN的序列模型GRU4Rec,表明注意力機(jī)制對(duì)序列建模的有效性;同時(shí)基于對(duì)話的模型的準(zhǔn)確性高于基于非對(duì)話模型,表明通過(guò)與用戶對(duì)話可以更準(zhǔn)確地獲取用戶的偏好。UMCR在準(zhǔn)確性指標(biāo)上有最好的表現(xiàn),比非對(duì)話模型提高了15.7%,比先進(jìn)的對(duì)比模型提高了3.54%,可以推斷出通過(guò)利用用戶與物品之間的關(guān)系信息,并結(jié)合從用戶多類型行為序列中學(xué)習(xí)到的用戶潛在興趣,可以有效提高對(duì)話推薦的準(zhǔn)確性。

        表3 推薦性能評(píng)估

        其次,對(duì)各個(gè)模型的平均回合數(shù)(AT)指標(biāo)進(jìn)行測(cè)試,AT越小表示系統(tǒng)效率越高。在表3中,基于序列的推薦方法僅依賴用戶歷史數(shù)據(jù),難以獲取用戶當(dāng)前偏好,通常需要較多回合來(lái)做出令用戶滿意的推薦。基于對(duì)話的推薦模型通過(guò)向用戶詢問,可以在一定程度上加快對(duì)用戶當(dāng)前偏好的獲取,CR-Walker相比于PMMN引入了外部知識(shí)圖,從而盡量詢問與當(dāng)前對(duì)話中出現(xiàn)的項(xiàng)目相關(guān)的問題來(lái)減少與用戶的對(duì)話回合數(shù),但用戶不太可能對(duì)外部知識(shí)圖中的所有實(shí)體感興趣,因而導(dǎo)致候選空間過(guò)大,因此可能需要額外的詢問回合。UMCR相比于CR-Walker考慮到用戶與商品及其屬性之間的關(guān)系信息,在對(duì)話時(shí)可以快速定位到與用戶偏好最相關(guān)的實(shí)體上,從而大幅減少圖中的候選空間,因此能夠以更少的對(duì)話次數(shù)完成推薦。

        3.5.2 對(duì)話生成質(zhì)量評(píng)估

        表4和表5分別展示了不同模型對(duì)話生成質(zhì)量的自動(dòng)評(píng)估和人工評(píng)估結(jié)果。在自動(dòng)評(píng)估結(jié)果中, PMMN相比于Transformer生成的對(duì)話中項(xiàng)目比率更高,因?yàn)镻MMN利用預(yù)訓(xùn)練GRU模型對(duì)語(yǔ)句進(jìn)行編碼,并根據(jù)編碼來(lái)最大限度地提高對(duì)話中相關(guān)項(xiàng)目的出現(xiàn)概率。而Transformer生成的對(duì)話具有更高的多樣性,一個(gè)可能的原因是Transformer采用自注意力機(jī)制來(lái)捕捉語(yǔ)句中單詞之間的依賴關(guān)系,此GRU更適合建模單詞和項(xiàng)目之間的關(guān)系。其次,在基線模型中,CR-Walker生成的對(duì)話最為多樣,并且項(xiàng)目比率最高,即生成的對(duì)話中包含更多與用戶偏好相關(guān)的項(xiàng)目,表明利用知識(shí)圖能夠很好地指導(dǎo)信息性語(yǔ)言生成,從而提高項(xiàng)目和相關(guān)實(shí)體的出現(xiàn)概率。UMCR在所有評(píng)估指標(biāo)上表現(xiàn)最好,相比于對(duì)話生成質(zhì)量最好的基線模型,在Distinct和Item Ratio指標(biāo)上分別平均提高了5.1%和8.3%。UMCR采用Transformer作為對(duì)話基礎(chǔ)模塊,將用戶項(xiàng)目的關(guān)系信息注入解碼器并利用復(fù)制機(jī)制,在保證對(duì)話多樣性的同時(shí)增強(qiáng)了生成文本的信息性。

        表4 對(duì)話生成質(zhì)量自動(dòng)評(píng)估

        表5 對(duì)話生成質(zhì)量人工評(píng)估

        在人工評(píng)估結(jié)果中,Transformer作為對(duì)話模型具有較高的對(duì)話生成質(zhì)量,但可能會(huì)產(chǎn)生諸如“不知道”“請(qǐng)?jiān)僬f(shuō)一次”之類的安全回復(fù),因此對(duì)話在信息量和有效性方面有所欠缺。為了提高對(duì)話的信息量與有效性,模型應(yīng)有效利用用戶歷史記錄并了解用戶偏好。PMMN沒有在用戶偏好和對(duì)話之間建立連接,僅根據(jù)上下文進(jìn)行對(duì)話生成,在信息量和有效性方面顯著低于CR-Walker和UMCR。UMCR在人工評(píng)估中表現(xiàn)最好,其在引入外部知識(shí)圖的基礎(chǔ)上通過(guò)用戶歷史記錄構(gòu)建用戶和商品之間的關(guān)系,能夠更好地捕捉用戶偏好,并將這些信息加入對(duì)話解碼器來(lái)生成流暢連貫且信息豐富的響應(yīng),從而更有效地滿足用戶需求。

        3.5.3 對(duì)話回合數(shù)對(duì)模型準(zhǔn)確性的影響力分析

        本文進(jìn)行實(shí)驗(yàn)研究對(duì)話推薦模型在不同對(duì)話回合數(shù)(從0到10)下的準(zhǔn)確性指標(biāo)變化,在各個(gè)領(lǐng)域數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如圖5所示,可以看出隨著對(duì)話的進(jìn)行,各個(gè)模型的準(zhǔn)確性會(huì)不斷提高,并且在對(duì)話后期各模型的性能會(huì)越來(lái)越接近,這是因?yàn)槟P湍軌驈挠脩舴答佒蝎@取更多描述用戶需求的信息,從而更準(zhǔn)確地學(xué)習(xí)用戶的偏好,并獲得更高的概率來(lái)找到符合用戶需求的商品。UMCR在所有數(shù)據(jù)集和對(duì)話的每一回合都表現(xiàn)更好,并且在對(duì)話的中間階段,UMCR比其他模型表現(xiàn)更突出,即能夠在較短回合達(dá)到更高的準(zhǔn)確性。因?yàn)閁MCR在對(duì)話時(shí)利用關(guān)系記憶信息更快地定位到與用戶偏好相關(guān)的實(shí)體上,從而有效地減少較大的實(shí)體候選空間,因此能夠以更少的對(duì)話回合做出準(zhǔn)確的推薦。

        圖5 對(duì)話回合數(shù)對(duì)性能的影響

        當(dāng)對(duì)話回合數(shù)T=0時(shí)表示直接對(duì)初始請(qǐng)求進(jìn)行推薦,不考慮用戶的對(duì)話反饋,對(duì)話推薦模型可看作是一個(gè)搜索應(yīng)答系統(tǒng),UMCR能夠有效利用從歷史交互和對(duì)話、評(píng)論數(shù)據(jù)中獲取到的用戶興趣表示進(jìn)行推薦,因此在缺少用戶反饋時(shí)也能保證一定的準(zhǔn)確性。以上結(jié)果表明,相比于其他的對(duì)話推薦模型,UMCR在用戶、商品和對(duì)話建模方面具有顯著的優(yōu)勢(shì)。

        3.6 消融實(shí)驗(yàn)

        為了驗(yàn)證UMCR中各模塊及相關(guān)技術(shù)的有效性,本文進(jìn)行了廣泛的消融研究。

        3.6.1 用戶記憶模塊及相關(guān)技術(shù)有效性分析

        在本節(jié)中研究用戶記憶模塊及記憶模塊中相關(guān)技術(shù)的有效性。

        (1) 用戶記憶模塊有效性分析

        首先研究行為記憶是否能夠很好地學(xué)習(xí)用戶行為序列的潛在興趣,去除UMCR的關(guān)系記憶與對(duì)話模塊得到模型BMR進(jìn)行推薦(可看作是序列推薦模型),然后與基線序列推薦模型對(duì)比準(zhǔn)確性,結(jié)果如表6所示。

        表6 行為記憶有效性分析

        可以看出BMR取得了最好的結(jié)果,表明利用注意力機(jī)制建模用戶行為序列并融合上下文信息能夠很好地學(xué)習(xí)用戶潛在興趣。特別是,盡管基于注意力機(jī)制的TiSAS同樣使用了上下文信息,但相比于傳統(tǒng)的序列模型它的性能并沒有顯著提高,可以推斷出在多頭注意力中使用相同的上下文嵌入會(huì)使學(xué)習(xí)到的信息有限,阻礙了性能的提高。相比之下,BMR在每個(gè)注意力頭上使用不同的上下文嵌入來(lái)學(xué)習(xí)序列的多種特征,表明這種不同上下文嵌入和注意力機(jī)制的聯(lián)合設(shè)計(jì)能夠更有效地對(duì)序列進(jìn)行建模。

        其次,研究關(guān)系記憶對(duì)于對(duì)話推薦的有效性,去除UMCR的行為記憶部分得到模型RMCR與基線對(duì)話推薦模型對(duì)比平均回合數(shù),結(jié)果如表7所示??梢钥闯鲈诔晒ν扑]時(shí),CR-Walker比PMMN所需的對(duì)話回合更少,表明外部知識(shí)圖信息有助于增強(qiáng)數(shù)據(jù)表示,提高對(duì)話推薦的性能,而RMCR能夠以最少的對(duì)話回合數(shù)完成推薦,相比于CR-Walker僅利用外部信息,RMCR將用戶評(píng)論、對(duì)話記錄中的歷史偏好加入知識(shí)圖來(lái)探索用戶、商品及屬性之間的關(guān)系信息,進(jìn)一步增強(qiáng)了相關(guān)數(shù)據(jù)表示,從而更快地幫助用戶找到合適的商品。

        表7 關(guān)系記憶有效性分析

        最后,研究記憶模塊對(duì)模型整體的有效性,將模型BMR和RMCR與原模型UMCR對(duì)比,結(jié)果如圖6所示。可以看出,UMCR在缺少關(guān)系記憶時(shí),模型無(wú)法獲取用戶當(dāng)前偏好,導(dǎo)致準(zhǔn)確性平均下降了5.75%,并且推薦成功所需的回合數(shù)也平均增加了3.43;缺少行為記憶時(shí),模型無(wú)法獲得用戶的潛在興趣,需要額外的詢問來(lái)提高對(duì)搜索結(jié)果的信心,進(jìn)而導(dǎo)致對(duì)話回合數(shù)增加。綜上,模型在缺少關(guān)系記憶時(shí)對(duì)性能的影響較大,缺少行為記憶主要影響模型的對(duì)話效率,因此兩種記憶信息都有助于提高推薦的性能,使UMCR能夠以最少的對(duì)話次數(shù)準(zhǔn)確推薦。

        圖6 記憶模塊有效性分析

        (2) 用戶多行為序列有效性分析

        為了研究建模用戶多行為序列對(duì)模型性能的影響,設(shè)置了三種行為序列組合,分別是只有點(diǎn)擊行為序列,以及點(diǎn)擊購(gòu)物車行為序列、點(diǎn)擊和購(gòu)物車和購(gòu)買行為序列,然后對(duì)比不同行為序列組合下模型的準(zhǔn)確性,結(jié)果如表8所示??梢园l(fā)現(xiàn)同時(shí)建模點(diǎn)擊序列和購(gòu)物車序列比單獨(dú)建模點(diǎn)擊序列會(huì)獲得更好的性能。然而,當(dāng)進(jìn)一步增加購(gòu)買序列時(shí),模型的準(zhǔn)確性在不同領(lǐng)域會(huì)產(chǎn)生不同的變化: 在食品、玩具&游戲領(lǐng)域會(huì)提高準(zhǔn)確性,但在手機(jī)&配件和汽車領(lǐng)域存在一定程度的下降。根據(jù)經(jīng)驗(yàn)分析: 手機(jī)和汽車領(lǐng)域中的商品回購(gòu)期較長(zhǎng),用戶在購(gòu)買后不會(huì)在短時(shí)間內(nèi)再次購(gòu)買該商品;對(duì)于回購(gòu)期較短的商品(如食品、玩具),用戶在購(gòu)買后可能會(huì)在短時(shí)間內(nèi)再次點(diǎn)擊購(gòu)買。因此在商品回購(gòu)期較長(zhǎng)的領(lǐng)域加入購(gòu)買序列可能會(huì)干擾點(diǎn)擊和購(gòu)物車序列中的信息,從而造成準(zhǔn)確性下降,故模型僅適合在商品回購(gòu)期較短的領(lǐng)域加入購(gòu)買序列。

        表8 多行為序列有效性分析

        (3) 多類型上下文嵌入有效性分析

        為了研究模型在多頭注意力中使用多類型上下文嵌入(時(shí)間嵌入、絕對(duì)位置嵌入、相對(duì)位置嵌入)是否有效,設(shè)置了所有可能的上下文嵌入組合,如表9所示,然后對(duì)比在不同嵌入組合下模型的準(zhǔn)確性。結(jié)果顯示,使用多類型嵌入明顯比使用單一類型嵌入表示具有更好的性能,但是在不同領(lǐng)域的數(shù)據(jù)集中每個(gè)嵌入的重要性不同。時(shí)間嵌入和絕對(duì)位置嵌入能夠捕捉序列中短時(shí)間內(nèi)大量行為之間的依賴關(guān)系(如用戶在同一天會(huì)多次購(gòu)買食品),因此在用戶產(chǎn)生交互更頻繁的食品領(lǐng)域發(fā)揮更好的作用。相對(duì)位置嵌入主要捕捉序列中的周期性行為信息(如用戶會(huì)周期性地更換汽車配件),從而在汽車領(lǐng)域做出更準(zhǔn)確的預(yù)測(cè)。

        3.6.2 推薦模塊相關(guān)技術(shù)有效性分析

        為了研究推薦模塊中利用門控機(jī)制對(duì)兩種記憶表示進(jìn)行融合的有效性,設(shè)置UMCR的變體UMCR_Gate,表示移除門控融合機(jī)制直接拼接兩種記憶表示進(jìn)行推薦,然后與原模型對(duì)比準(zhǔn)確性。實(shí)驗(yàn)結(jié)果如圖7所示,可以看出原模型相比于移除了門控機(jī)制的模型,準(zhǔn)確性平均提高了3.7%,表明門控機(jī)制可以有效地提升推薦的準(zhǔn)確性,這是因?yàn)橥ㄟ^(guò)門控機(jī)制可以有效地將用戶潛在興趣與當(dāng)前偏好動(dòng)態(tài)結(jié)合,使模型能選擇與用戶當(dāng)前需求最相關(guān)的信息,從而提升推薦的準(zhǔn)確性。

        3.6.3 對(duì)話模塊及相關(guān)技術(shù)有效性分析

        為了研究對(duì)話模塊以及在對(duì)話模塊中加入基于關(guān)系圖的注意力層和復(fù)制機(jī)制的有效性,設(shè)置UMCR的變體UMCR_CM、UMCR_RA和UMCR_Copy進(jìn)行對(duì)比實(shí)驗(yàn),分別表示移除對(duì)話模塊、基于關(guān)系圖的注意力層RA和復(fù)制機(jī)制。首先與原模型對(duì)比平均回合數(shù),實(shí)驗(yàn)結(jié)果如圖8左圖所示。當(dāng)移除對(duì)話模塊后,模型可看作是靜態(tài)推薦系統(tǒng),無(wú)法通過(guò)對(duì)話獲取用戶實(shí)時(shí)偏好,僅僅通過(guò)用戶歷史記錄進(jìn)行推薦,成功推薦所需要的回合數(shù)大大增加,表明對(duì)話推薦相比于靜態(tài)推薦的優(yōu)越性。另一方面,當(dāng)移除RA和復(fù)制機(jī)制后同樣會(huì)增加推薦成功時(shí)所需的回合數(shù),平均增加了3.1個(gè)回合,這是因?yàn)榛陉P(guān)系圖的注意力層能夠通過(guò)多頭注意力機(jī)制將關(guān)系記憶信息有效地融入解碼器,復(fù)制機(jī)制能夠增強(qiáng)相關(guān)實(shí)體的生成,兩者都有利于生成與用戶偏好更相關(guān)的對(duì)話,從而有效提高對(duì)話的效率。

        其次,與原模型對(duì)比對(duì)話生成質(zhì)量,實(shí)驗(yàn)結(jié)果如圖8右圖所示。可以看出對(duì)話模塊中的基于關(guān)系圖的注意力層RA和復(fù)制機(jī)制都有助于提高對(duì)話生成質(zhì)量,并且RA更為重要,移除后會(huì)顯著降低對(duì)話質(zhì)量。基于關(guān)系圖的注意力層通過(guò)多頭自注意力可以有效地將融合后的關(guān)系圖信息注入解碼器,進(jìn)而提高對(duì)話文本的多樣性與信息量。

        4 結(jié)論

        本文提出了基于用戶記憶的對(duì)話推薦模型UMCR,通過(guò)關(guān)系記憶學(xué)習(xí)用戶、商品和屬性之間的關(guān)系信息,根據(jù)學(xué)習(xí)到的信息來(lái)更好地生成對(duì)話,并結(jié)合從用戶行為記憶中挖掘到的用戶潛在興趣做出更準(zhǔn)確的推薦。通過(guò)構(gòu)建大量實(shí)驗(yàn),UMCR相較于對(duì)比模型具有更好的性能,能夠以更少的對(duì)話次數(shù)準(zhǔn)確推薦。

        未來(lái)的工作中,我們將考慮融入更豐富的語(yǔ)義信息和對(duì)商品屬性的不同看法來(lái)生成更多樣化的對(duì)話,并適當(dāng)?shù)靥幚硪馔獾挠脩繇憫?yīng)。

        猜你喜歡
        記憶用戶信息
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        記憶中的他們
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        兒時(shí)的記憶(四)
        兒時(shí)的記憶(四)
        記憶翻新
        海外文摘(2016年4期)2016-04-15 22:28:55
        如何獲取一億海外用戶
        展會(huì)信息
        亚洲欧美色一区二区三区| 亚洲熟女一区二区三区不卡| 中文字幕亚洲一二三区| 成人免费a级毛片无码片2022| 真人与拘做受免费视频| 国产人成亚洲第一网站在线播放| 国产av黄色一区二区| 欧美乱妇高清无乱码免费| 天天弄天天模| 国产福利小视频在线观看| 中文乱码字幕人妻熟女人妻| 久久久精品午夜免费不卡| 国产精品久久久久影院嫩草| av天堂精品久久久久| 精品在线亚洲一区二区三区| 久久国产劲爆∧v内射| 欧洲成人午夜精品无码区久久| 亚洲是图一区二区视频| 色男色女午夜福利影院| 成人一区二区免费中文字幕视频| 无码熟熟妇丰满人妻啪啪| 少妇特殊按摩高潮惨叫无码| 国产在线观看午夜视频| 亚洲av日韩精品久久久久久久| 成人a在线观看| 好看的国内自拍三级网站| 日本免费一区二区三区在线看| 无码毛片高潮一级一免费| 亚洲全国最大的人成网站| 91成人自拍在线观看| 男女做爰猛烈啪啪吃奶动 | 久久精品亚洲精品国产色婷| 在线永久看片免费的视频| 亚洲人妻中文字幕在线视频| 亚洲一区二区三区偷拍女| 亚洲日本一区二区一本一道| 岛国大片在线免费观看| 网红尤物泛滥白浆正在播放| 无码熟妇人妻av影音先锋| 国产不卡一区二区三区免费视| 精品国产一区二区三区男人吃奶|