安政磊++姚文斌
摘要:伴隨隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,020餐飲領(lǐng)域發(fā)展迅速,然而平臺(tái)同質(zhì)化嚴(yán)重,個(gè)性化推薦已經(jīng)成為提升用戶(hù)體驗(yàn)和提高運(yùn)營(yíng)水平的一種主要方式。而傳統(tǒng)的協(xié)同過(guò)濾方法在數(shù)據(jù)稀疏的情況下,用戶(hù)推薦準(zhǔn)確率不高。本文研究基于020餐飲行業(yè)背景,研究用戶(hù)的行為對(duì)購(gòu)買(mǎi)意向的影響,綜合考慮購(gòu)買(mǎi)行為、評(píng)價(jià)行,為等多種用戶(hù)行為,判斷用戶(hù)的興趣點(diǎn),從而確定用戶(hù)的購(gòu)買(mǎi)意向,提出一種基于多種用戶(hù)行為的購(gòu)買(mǎi)意向模型?;诖颂岢龌谫?gòu)買(mǎi)意向的推薦方法。最后通過(guò)與傳統(tǒng)基于用戶(hù)的協(xié)同過(guò)濾算法進(jìn)行比較,確定了本文推薦方法的有效性。
關(guān)鍵詞:行為分析;個(gè)性化推薦;協(xié)同過(guò)濾;推薦模型
中圖分類(lèi)號(hào):TP391.3
文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.3969/j.issn.1003-6970.2015.12.019
本文著錄格式:安政磊,姚文斌.一種基于用戶(hù)購(gòu)買(mǎi)意向的個(gè)性化推薦模型[J].軟件,2015,36(12):80-82
0 引言
近兩年來(lái),隨著瓦聯(lián)網(wǎng)的發(fā)展,020餐飲領(lǐng)域已經(jīng)成為一種重要的商務(wù)模式。在豐要大城市中迅速的擴(kuò)展開(kāi)來(lái)。與此同時(shí),其中的推薦系統(tǒng)卻沒(méi)有跟隨發(fā)展,多數(shù)平臺(tái)還停留在用戶(hù)豐動(dòng)獲取商品信息的時(shí)代。這些平臺(tái)同質(zhì)化嚴(yán)重,全都標(biāo)榜以用戶(hù)為中心,然而由于原始的建站思路,并沒(méi)有完全應(yīng)用好快速發(fā)展的計(jì)算機(jī)技術(shù),導(dǎo)致發(fā)展上的瓶頸。
各種推薦系統(tǒng)層出不窮,推薦機(jī)制復(fù)雜多變。協(xié)同過(guò)濾算法已經(jīng)被廣泛的應(yīng)用到各個(gè)推薦系統(tǒng),但隨著用戶(hù)數(shù)量的增加和站點(diǎn)內(nèi)容結(jié)構(gòu)的日益復(fù)雜,協(xié)同過(guò)濾技術(shù)的一些缺點(diǎn)逐漸暴露出來(lái),首要問(wèn)題就是稀疏性,隨著用戶(hù)和項(xiàng)目的數(shù)量的增長(zhǎng),用戶(hù)相似性矩陣也會(huì)急劇擴(kuò)大。在維度巨大的相似矩陣并且用戶(hù)參與度不是很頻繁的情況下,推薦的可信度隨之降低。
目前多數(shù)協(xié)同算法研究和應(yīng)用都集中在傳統(tǒng)的電子商務(wù),對(duì)于基于餐飲行業(yè)的協(xié)同過(guò)濾算法的推薦研究較少。協(xié)同過(guò)濾算法的研究目標(biāo)豐要是商品。本文針對(duì)餐飲行業(yè)的特點(diǎn),研究的豐要原子單位是餐廳,考慮不同用戶(hù)行為對(duì)用戶(hù)的購(gòu)買(mǎi)意向的影響,基于用戶(hù)的購(gòu)買(mǎi)意向設(shè)計(jì)推薦算法,提高推薦準(zhǔn)確率。
1 用戶(hù)行為的研究分析
1.1 購(gòu)買(mǎi)行為分析
相交于傳統(tǒng)電子商務(wù)的購(gòu)買(mǎi)數(shù)據(jù),020餐飲行業(yè)的購(gòu)買(mǎi)行為確實(shí)不少,但是對(duì)于準(zhǔn)確的分析用戶(hù)購(gòu)買(mǎi)意向和購(gòu)買(mǎi)行為之間的關(guān)系這項(xiàng)復(fù)雜的工作來(lái)說(shuō),在數(shù)量上還是有一定差距。而用戶(hù)的購(gòu)買(mǎi)行為是用戶(hù)對(duì)某商品研究的結(jié)果,因此,用戶(hù)必然在前期進(jìn)行過(guò)一系列與該商品相關(guān)的用戶(hù)瀏覽行為,可見(jiàn)用戶(hù)的購(gòu)買(mǎi)行為還和用戶(hù)的瀏覽行為緊密相關(guān)。為此需要建立基于PV興趣統(tǒng)計(jì)出的用戶(hù)購(gòu)買(mǎi)行為模型,基于用戶(hù)的興趣發(fā)現(xiàn)用戶(hù)的購(gòu)買(mǎi)意向。分析步驟如下:
Stepl:根據(jù)日志文件中瀏覽記錄的定義找到所有餐廳訪問(wèn)的記錄,過(guò)濾沒(méi)有餐廳的瀏覽記錄。同時(shí),從數(shù)據(jù)庫(kù)獲取用戶(hù)的購(gòu)買(mǎi)記錄。這兩種記錄作為本次分析的依據(jù)。
Step2:針對(duì)以上數(shù)據(jù),統(tǒng)計(jì)每個(gè)餐廳的訪問(wèn)次數(shù)和購(gòu)買(mǎi)次數(shù)。兩種數(shù)據(jù)對(duì)用戶(hù)的購(gòu)買(mǎi)意向的影響的程度顯然不同,為了融合兩種數(shù)據(jù),為購(gòu)買(mǎi)數(shù)據(jù)進(jìn)行加權(quán)分析,餐廳的購(gòu)買(mǎi)數(shù)據(jù)加倍,將數(shù)據(jù)整合在一起。
Step3:根據(jù)商品的被訪問(wèn)時(shí)間和餐廳商品數(shù)量,來(lái)確定用戶(hù)對(duì)某商品的購(gòu)買(mǎi)意向。公式如1-1所示。
ti表示用戶(hù)瀏覽餐廳時(shí)間,Ci表示餐廳的商品數(shù)量。而現(xiàn)在多數(shù)平臺(tái)還有其他查看商品的具體信息的彈出框頁(yè)面以及能夠查看單獨(dú)商品評(píng)價(jià)和評(píng)分信息等。但是這些信息不具有代表性,所以行為分析時(shí)也對(duì)這些行為進(jìn)行忽略。
1.2 評(píng)價(jià)行為分析
評(píng)價(jià)行為是用戶(hù)購(gòu)買(mǎi)意向的直接反饋,不僅是對(duì)本次購(gòu)物感受的表達(dá),還能夠據(jù)此對(duì)用戶(hù)未來(lái)的購(gòu)買(mǎi)意向作出判斷??梢酝ㄟ^(guò)對(duì)用戶(hù)評(píng)價(jià)的情感分析,獲取用戶(hù)的購(gòu)買(mǎi)意向。
Stepl:建立基本語(yǔ)料庫(kù),選取常見(jiàn)情感表達(dá)詞語(yǔ),根據(jù)知網(wǎng)的基礎(chǔ)語(yǔ)料分析庫(kù),將這些情感表達(dá)詞語(yǔ)分別按照褒義詞和貶義詞的分別放到positive和negative兩個(gè)集合中。
Step2:短語(yǔ)或句子分詞。對(duì)于020餐飲行業(yè)來(lái)說(shuō),這個(gè)領(lǐng)域內(nèi)的表達(dá)情感的詞語(yǔ)是有限的,且本文只針對(duì)用戶(hù)的感情詞匯進(jìn)行處理。這樣對(duì)評(píng)價(jià)樣本進(jìn)行分詞,達(dá)到能夠滿足區(qū)分用戶(hù)情感趨向的程度。采用字符匹配算法來(lái)進(jìn)行分詞。
Step3:詞語(yǔ)分類(lèi)。為了構(gòu)造用戶(hù)評(píng)論的短語(yǔ)模型,需要對(duì)分詞進(jìn)行詞性分析,明確評(píng)價(jià)信息中的名詞、形容詞等詞性區(qū)別。
Step4:構(gòu)造評(píng)價(jià)內(nèi)容的短語(yǔ)模型。
Step5:計(jì)算短語(yǔ)的情感值。采用統(tǒng)計(jì)學(xué)方法,計(jì)算一個(gè)短語(yǔ)模型在positive和negative集合中的文本出現(xiàn)次數(shù),分別結(jié)尾GNumber和BNumber。情感值計(jì)算公式1-2所示。
Step6:根據(jù)用戶(hù)評(píng)價(jià)內(nèi)容分詞,采用單詞匹配分析算法,按照公式1-3計(jì)算整個(gè)評(píng)價(jià)內(nèi)容的購(gòu)買(mǎi)意向值。
2 基于購(gòu)買(mǎi)意向的推薦模型
2.1 購(gòu)買(mǎi)意向模型
對(duì)用戶(hù)行為進(jìn)行分析,根據(jù)上節(jié)所述的用戶(hù)購(gòu)買(mǎi)意向和用戶(hù)的購(gòu)買(mǎi)行為以及用戶(hù)購(gòu)買(mǎi)意向和評(píng)價(jià)行為的關(guān)系計(jì)算用戶(hù)的總體購(gòu)買(mǎi)意向值。需要分別計(jì)算每個(gè)用戶(hù)對(duì)每個(gè)餐廳的購(gòu)買(mǎi)意向值并求意向值之和,意向值之和定義為T(mén)。
T-upi+S
(1-4)
將購(gòu)買(mǎi)意向值T作為計(jì)算用戶(hù)相似度的指標(biāo)。
2.2 基于購(gòu)買(mǎi)意向的推薦模型
基于用戶(hù)購(gòu)買(mǎi)意向模型中用戶(hù)購(gòu)買(mǎi)意向的變化,構(gòu)建基于購(gòu)買(mǎi)意向的推薦模型。
(1)循環(huán)更新待推薦用戶(hù)的購(gòu)買(mǎi)意向值。
循環(huán)所有餐廳,通過(guò)購(gòu)買(mǎi)行為計(jì)算當(dāng)前用戶(hù)u對(duì)第i個(gè)餐廳的購(gòu)買(mǎi)意向度定義為T(mén)upi(u,i),通過(guò)用戶(hù)評(píng)論計(jì)算出當(dāng)前用戶(hù)u對(duì)第i個(gè)餐廳的購(gòu)買(mǎi)意向值Ts(u,i),計(jì)算用戶(hù)對(duì)該餐廳的購(gòu)買(mǎi)意向總和,記為T(mén)(u),更新當(dāng)前用戶(hù)u對(duì)該餐廳的購(gòu)買(mǎi)意向值。
(2)選擇該用戶(hù)u的購(gòu)買(mǎi)意向最強(qiáng)的10個(gè)餐廳作為用戶(hù)u的向量。作為和其他用戶(hù)進(jìn)行比較相似度的來(lái)源。采用余弦相似度進(jìn)行用戶(hù)相似度的比較,選擇m個(gè)相似用戶(hù),根據(jù)普通協(xié)同過(guò)濾算法,根據(jù)待選集合中用戶(hù)對(duì)餐廳的購(gòu)買(mǎi)意向,得到中間推薦結(jié)果L1。
(3)對(duì)于選擇出來(lái)的10個(gè)餐廳,從高到低分別附上10到1之間的權(quán)重,根據(jù)數(shù)據(jù)庫(kù)內(nèi)定的餐廳類(lèi)別進(jìn)行如下分析:1)統(tǒng)計(jì)每個(gè)類(lèi)別的餐廳個(gè)數(shù);2)將每個(gè)類(lèi)別餐廳的個(gè)數(shù)和每個(gè)類(lèi)別中權(quán)值最大的餐廳的權(quán)值相乘得到各個(gè)類(lèi)別的一個(gè)值;3)在該類(lèi)別中選擇2k個(gè)同類(lèi)餐廳作為中間推薦結(jié)果L:
(4)將中間推薦結(jié)果L1和L2求交運(yùn)算,當(dāng)最終結(jié)果不到k個(gè)時(shí),從L2剩余結(jié)果中在隨機(jī)補(bǔ)選兒個(gè),得到k個(gè)最終推薦結(jié)果
3 實(shí)驗(yàn)對(duì)比分析
3.1 實(shí)驗(yàn)對(duì)比標(biāo)準(zhǔn)
本文的豐要目的是為了完成用戶(hù)的推薦工作。針對(duì)推薦工作,有常用的兩個(gè)評(píng)價(jià)于段,分別是召回率(3-1)和準(zhǔn)確率(3-2)。
其中Tn代表數(shù)據(jù)集合中用戶(hù)u喜歡的物品的集合,Rn代表向用戶(hù)推薦的物品集合。
3.2 實(shí)驗(yàn)分析
根據(jù)以上模型和算法步驟,根據(jù)用戶(hù)日志文件和后臺(tái)數(shù)據(jù)庫(kù)提供數(shù)據(jù),設(shè)置取相似用戶(hù)數(shù)量取值范圍為[50,100],實(shí)驗(yàn)結(jié)果如圖l所示。
實(shí)驗(yàn)結(jié)果表明,基于用戶(hù)協(xié)同過(guò)濾算法和購(gòu)買(mǎi)意向模型差距不是十分大,在開(kāi)始時(shí)兩者兒乎準(zhǔn)確率同等大小。并且隨著召回率的增加,兩者的準(zhǔn)確率都在降低。區(qū)別是基于用戶(hù)的協(xié)同過(guò)濾算法在開(kāi)始時(shí)下降明顯,而后者下降不是很明顯,出現(xiàn)這樣情況的原因可能是,基于購(gòu)買(mǎi)意向模型的推薦算法綜合考慮了用戶(hù)的購(gòu)買(mǎi)行為、瀏覽行為、評(píng)價(jià)行為對(duì)用戶(hù)的購(gòu)買(mǎi)意向的影響,從而能夠比基于用戶(hù)的協(xié)同過(guò)濾算法在推薦任務(wù)上完成地稍微好一點(diǎn)。
4 結(jié)論
協(xié)同過(guò)濾技術(shù)已經(jīng)被廣泛應(yīng)用,但有很多還停留在最簡(jiǎn)單的基于用戶(hù)的協(xié)同過(guò)濾,隨著用戶(hù)行為種類(lèi)和數(shù)量的不斷增多,這些隱藏的行為比顯示的行為提供更多有關(guān)用戶(hù)購(gòu)買(mǎi)意向的信息,然而很多現(xiàn)有的用戶(hù)網(wǎng)絡(luò)行為卻被推薦系統(tǒng)忽視。針對(duì)以上問(wèn)題,本文從用戶(hù)行為角度出發(fā),并且抓住常見(jiàn)的隱式行為,分析用戶(hù)行為和用戶(hù)購(gòu)買(mǎi)意向的關(guān)系,進(jìn)而根據(jù)用戶(hù)行為建立用戶(hù)行為和用戶(hù)購(gòu)買(mǎi)意向的整合模型,根據(jù)這個(gè)模型設(shè)計(jì)出一套用戶(hù)推薦算法,經(jīng)實(shí)驗(yàn)證實(shí),該方法雖不能極大提高推薦效果,但確實(shí)在某些情況下提高了召回率和準(zhǔn)確率,為了更好地優(yōu)化推薦效果,還應(yīng)該繼續(xù)研究基于用戶(hù)行為的購(gòu)買(mǎi)意向的優(yōu)化計(jì)算方法。