萇道方,鐘 悅
(上海海事大學(xué)a.物流工程學(xué)院;b.科學(xué)研究院,上海 201306)
考慮行為和眼動跟蹤的用戶興趣模型
萇道方a,鐘 悅b
(上海海事大學(xué)a.物流工程學(xué)院;b.科學(xué)研究院,上海 201306)
針對以往用戶建模信息來源單一,用戶興趣判斷模糊等缺點,本文以“淘寶網(wǎng)”及其用戶為研究背景,將眼動跟蹤、人機交互行為記錄技術(shù)和回歸分析相結(jié)合,研究用戶人機交互行為和眼動跟蹤特征和用戶興趣三者之間的相關(guān)性,最終建立基于人機交互行為和眼動跟蹤的用戶興趣模型。并通過實驗驗證了該模型的有效性,為今后的智能化推薦系統(tǒng)建立奠定了基礎(chǔ)。
人機交互;眼動跟蹤;興趣模型;內(nèi)容推薦
隨著電子商務(wù)和物流的快速發(fā)展,網(wǎng)上購物越來越便利。但是由于信息過載給網(wǎng)上購物帶來了新的困擾[1]。而個性化內(nèi)容推薦系統(tǒng)可以為用戶解決這一問題,并且通過對用戶信息的挖掘分析發(fā)現(xiàn)用戶的需求偏好,最終把用戶感興趣的內(nèi)容和商品推薦給用戶?,F(xiàn)在國內(nèi)外的主要研究有用戶建模、內(nèi)容建模和推薦算法這三大核心模塊[2]。文獻[3-8]提出結(jié)合用戶的眼睛的基本參數(shù)運動特征來判斷用戶的興趣。
用戶的興趣并不是絕對靜止的,而是會隨著外部環(huán)境的刺激和用戶自身情況的改變而變化的,當(dāng)然也存在著一些相對穩(wěn)定的興趣[9]。用戶建模需要對用戶的興趣做出客觀準(zhǔn)確的描述,并建立合理的更新機制。為了客觀準(zhǔn)確地描述用戶的興趣就需要對得到的用戶數(shù)據(jù)進行結(jié)構(gòu)化處理,細化用戶興趣[10],力求做到及時有效的反映用戶的興趣狀態(tài)及特征。目前,多數(shù)研究只是結(jié)合了用戶的顯性信息反饋和簡單的行為及網(wǎng)頁內(nèi)容的挖掘,缺乏對用戶行為和相關(guān)心理外在反映的綜合考慮,往往忽略了用戶的簡單無標(biāo)記的行為,并不能真實反映其真實興趣這一事實。當(dāng)前用戶興趣研究對用戶的行為分析片面,未對相關(guān)的人機交互行為和眼動跟蹤特征做定量分析,用戶興趣分類模糊簡單,不利于推薦系統(tǒng)精度和準(zhǔn)確度的提高,最終影響推薦質(zhì)量。本研究結(jié)合“淘寶網(wǎng)”現(xiàn)有的商品及服務(wù)的分類方法,為方便系統(tǒng)推薦的項目內(nèi)容匹配和模型驗證,采用多維空間向量表示法來描述用戶興趣模型[11]。并將以基于人機交互和眼動跟蹤的用戶興趣判斷為基礎(chǔ),為用戶的興趣判斷提供新的方法,并依此為基礎(chǔ)為用戶興趣建模,可為更新機制提供新的理論依據(jù)。
為了建立準(zhǔn)確、合理的用戶興趣模型,真實可靠地反映用戶的興趣偏好,最終高效、準(zhǔn)確地給電子商務(wù)平臺的“淘寶網(wǎng)”用戶提供個性化的推薦服務(wù),本文結(jié)合用戶顯性和隱性反饋信息,經(jīng)過處理分析建立“淘寶網(wǎng)”用戶興趣模型。其用戶興趣建模流程如圖1所示。
1.1 用戶興趣度模型的建立
根據(jù)分析可得用戶對網(wǎng)頁i的興趣度Xi與用戶的人機交互行為和眼動跟蹤參數(shù)有關(guān)。人機交互行為的綜合反映指標(biāo)網(wǎng)頁觸發(fā)數(shù)Cf和用戶的相對注視時間[12]Rg及瞳孔直徑[13]Pg能很好地反映用戶在“淘寶網(wǎng)”網(wǎng)頁瀏覽時的興趣狀態(tài)。為了得到用戶興趣度Xi與用戶人機交互行為和眼動跟蹤特征之間的定量關(guān)系,通過實驗和分析,利用多元線性回歸挖掘用戶興趣度的函數(shù)表達式。
圖1 用戶興趣建模流程
設(shè)用戶對網(wǎng)頁i的興趣度Xi是人機交互指數(shù)Cf、相對注視時間Rg和用戶瞳孔直徑Pg的因變量,對每一組統(tǒng)計量Cf、Rg、Pg,如果有:
稱式(1)為多元線性回歸模型。其中,ε服從正態(tài)分布N(0,σ2);A,B,C,D為與Cf,Rg和Pg無關(guān)的常量;ε是隨機誤差。
稱式(2)為線性回歸方程,A、B、C為回歸系數(shù)。在本文中稱A為交互行為影響因子;B為注視影響因子;C為瞳孔影響因子;D為交互行為和眼動跟蹤特征綜合影響因子;A、B、C、D可由最小二乘法估計得到。
測試用戶隨機請求20個“淘寶網(wǎng)”超鏈接,并對請求網(wǎng)頁進行瀏覽。記錄其人機交互行為和眼動跟蹤參數(shù),經(jīng)統(tǒng)計分析計算得到人機交互行為指數(shù)Cf和相對注視時間Rg及瞳孔直徑Pg及用戶評分結(jié)果??傻茫篈=0.018 512,B=0.112 797,C=-0.145 92,D=0.527 731。即用戶興趣回歸模型為:
1.2 用戶興趣模型的建立
圖2 用戶興趣管理方式圖
對用戶的興趣進行細粒度管理,如圖2所示。本模型細化了用戶興趣分類,減少了相近模型之間的干擾,便于用戶興趣的更新,改善了模型質(zhì)量。
結(jié)合“淘寶網(wǎng)”商品和服務(wù)的分類規(guī)則,自上而下進行合并歸納,最終形成用戶興趣的精細化描述。
設(shè)用戶第m次登陸瀏覽了n個網(wǎng)頁,則用戶興趣的多維空間向量模型可采用如下四元組表示:
其中,I為用戶本體表述向量,用來描述用戶的基本信息和背景信息;Zm(l,p)為用戶興趣內(nèi)容的表述向量,其中l(wèi)代表網(wǎng)頁主題,P代表瀏覽網(wǎng)頁所包含的特征詞;Xm為用戶瀏覽內(nèi)容Zm的興趣度,兩者為一一對應(yīng)關(guān)系;Tm為對Zm的興趣度Xm的更新時間,初始值為0,主要用來描述用戶的興趣更新。如Umi={I,Zmi(li,pi),Xmi,Tmi},Zmi(li,pi)為用戶第m次登陸第i次瀏覽網(wǎng)頁的內(nèi)容,Xmi為用戶對瀏覽內(nèi)容Zmi的興趣度,Tmi為Zmi對應(yīng)的興趣度Xmi的更新時間,T={m1,m2,…,mn}。
1.3 用戶興趣模型的更新
由于用戶的興趣會隨著用戶自身情況的變化而改變。要準(zhǔn)確客觀地描述用戶的興趣,就要對用戶興趣模型進行適時更新,以適應(yīng)用戶興趣的變化,保證用戶興趣模型的質(zhì)量。為了節(jié)省存儲空間,保證系統(tǒng)運行效率,便于對用戶興趣模型的更新,規(guī)定用戶興趣模型在每次登陸結(jié)束后自動更新,也就是說T值變化一次用戶興趣模型即更新一次。假設(shè)用戶第m次登陸時的興趣模型為Um={I,Zm(l,p),Xm,Tm},用戶興趣的更新實質(zhì)上是對用戶興趣內(nèi)容Zm及其對應(yīng)興趣度Xm進行更新。其更新規(guī)則如圖3所示。
圖3 用戶興趣模型更新規(guī)則
用戶興趣更新主要為感興趣內(nèi)容和相應(yīng)興趣度的更新。在第m次登陸過程中,對用戶第i次瀏覽的網(wǎng)頁內(nèi)容進行提取并與Um模型中的Zm作對比,如果網(wǎng)頁i的內(nèi)容已存在于Zm中只需對相應(yīng)的興趣度Xmi進行更新,更新規(guī)則依照式(5)進行。如果網(wǎng)頁i的內(nèi)容不存在于Zm中,計算其興趣度,并將興趣度Xmi∈(Ⅲ,Ⅳ,Ⅴ)的內(nèi)容寫入Zm中。為了防止Zm中項目內(nèi)容過多數(shù)據(jù)量過大,同時對Zm中過于陳舊項目內(nèi)容進行擦除,如果Zm中項目內(nèi)容沒有在第m次登陸中被重新瀏覽,則按照式(6)更新其興趣度,并將興趣度Xm∈(Ⅰ,Ⅱ)的項目內(nèi)容擦除。當(dāng)Zm中所有內(nèi)容更新結(jié)束后,生成新的興趣內(nèi)容Zm+1,并更新T值。用戶基本信息由用戶自主更新,系統(tǒng)只進行適時提醒。
其中,X(m+1)j代表網(wǎng)頁i對應(yīng)的項目內(nèi)容j更新之后的興趣度;X(m)j代表網(wǎng)頁i對應(yīng)項目內(nèi)容j在第m次登錄之前的興趣度;X(mi)j表示第m次登陸第i次所瀏覽網(wǎng)頁的興趣度;α為興趣度X(m)j的權(quán)值,β為興趣度X(mi)j的權(quán)值,且α+β=1,調(diào)節(jié)α,β的值可以調(diào)節(jié)用戶實時興趣與過往興趣的比重。
其中,γ代表第m次登錄未瀏覽項目內(nèi)容的興趣度衰減指數(shù),γ∈(0,1),一般情況下γ>0.6;τ代表第m次登陸時未瀏覽到的項目內(nèi)容在接下來τ次連續(xù)登錄未被瀏覽。調(diào)節(jié)γ的值就可以調(diào)節(jié)用戶興趣模型中項目內(nèi)容的規(guī)模和更新速度。
對商品具體精確化描述是比較困難的,為了便于研究,本文推薦內(nèi)容選取原則為:商品屬于相同的項目,具有盡可能多的相同特征詞描述。根據(jù)上述建模和推薦規(guī)則,得到3名測試者模型的實驗驗證結(jié)果,如圖4所示。
由圖4可以看出:基于人機交互和眼動跟蹤的用戶興趣模型能較好地反映用戶的興趣,推薦準(zhǔn)確率大于0.25,最高達到0.46,達到了推薦系統(tǒng)的一般要求。當(dāng)推薦項目較少時,推薦準(zhǔn)確率較低,但推薦準(zhǔn)確率也是在合理范圍之內(nèi)的,隨著推薦商品數(shù)量的增加,推薦準(zhǔn)確率趨于穩(wěn)定。這一現(xiàn)象也是符合現(xiàn)實情況的,隨著用戶瀏覽網(wǎng)頁的增加,用戶興趣模型中的項目內(nèi)容規(guī)模越來越龐大,用戶興趣覆蓋面逐步增大,項目內(nèi)容規(guī)模也隨之變大,推薦精度也會有所降低,相對應(yīng)于用戶的興趣項目內(nèi)容規(guī)模會穩(wěn)定在相應(yīng)的水平。
圖4 用戶興趣模型驗證結(jié)果
本文對基于人機交互和眼動跟蹤的用戶興趣模型進行驗證分析,通過實驗證實了模型的有效性,并在此基礎(chǔ)上對提出的用戶興趣更新算法進行分析,將獲取的用戶信息經(jīng)過加工,可以有效地反映用戶需求和興趣。進一步地證明了用戶興趣更新機制與簡單的行為挖掘相比更為真實可靠,更能反映用戶的真實興趣。
[1] 陽曉萍,湯兵勇,宋月嬋.個性化服務(wù)綜述[J].科技情報開發(fā)與經(jīng)濟,2006,16(12):247-310.
[2] 王國霞,劉賀平.個性化推薦系統(tǒng)綜述[J].計算機工程與應(yīng)用,2012,48(7):66-76.
[3] Zhang C Y,Kang Y H,Lei JS.A Personalized Web Information Auto-retrieval System Based on Small Samples[J].鄭州大學(xué)學(xué)報:理學(xué)版,2006,38(4):44-49.
[4] Mackenzie G G,Wu M C,Eyal M R.Predicting Preference from Fixations[J].Psychnology Journal,2009,7(2):141-158.
[5] Kai P,Antti A,Samuel K.Learning to Learn Im plicit Queries from Gaze Patterns[C]//ICML’8,Proceedings of the 25th International Conference on Machine Learning.2008:760-767.
[6] Granka L A,Thorsten J,Geri K G.Eye-tracking Analysis of User Behavior in WWW Search[C]//SIGIR’04,Sheffield,South Yorkshire,UK.2004:478-479.
[7] Jeff H,Ryen W W.No Clicks,No Problem:Using Cursor Movements to Understand and Improve Search[C]//CHI’11 Proceedings of the 2011 Annual Conference on Human Factors in Computing Systems.2011:1225-1234.
[8] Chen L,Pearl P.Eye-Tracking Study of User Behavior in Recommender Interfaces[C]//UMAP2010,Lecture Notes Computer Science.2010:375-380.
[9] 劉忠寶,趙文娟.個性化搜索引擎中用戶興趣模型的構(gòu)建方法[J].計算機系統(tǒng)應(yīng)用,2012,21(11):1-6.
[10] 劉江濤,杜清運,彭子鳳.SDI信息服務(wù)部門用戶偏好挖掘方法研究[J].武漢大學(xué)學(xué)報:信息科學(xué)版,2013,38(3):329-333.
[11] 郝水龍,吳共慶,胡學(xué)鋼.基于層次向量空間模型的用戶興趣表示及更新[J].南京大學(xué)學(xué)報:自然科學(xué)版,2012,48(2):190-197.
[12] 張光強,沈模衛(wèi),陶嶸.可用性測試中的視線追蹤技術(shù)[J].人類工效學(xué),2001,7(4):9-13.
[13] 劉偉,袁修干.人的視覺-眼動系統(tǒng)的研究[J].人類工效學(xué),2000,12,6(4):41-44.
TP391
A
1672-6871(2014)01-0049-04
國家自然科學(xué)基金項目(71101090);上海頂尖學(xué)術(shù)學(xué)科建設(shè)項目管理科學(xué)與工程;上海教委項目(12ZZ148,13YZ080);交通運輸研究部項目(2012-329-810-180);上海海事大學(xué)研究項目(20120102,20110316,20120125)
萇道方(1978-),男,河南封丘人,副教授,博士,碩士生導(dǎo)師,主要研究方向為信息處理與智能決策、人機與環(huán)境工程.
2013-08-30