游 運,萬常選,陳煌燁
YOU Yun1,2,3,WAN Changxuan1,3,CHEN Huangye1,3
1.江西財經(jīng)大學 信息管理學院,南昌 330013
2.東華理工大學 理學院,南昌 330013
3.江西財經(jīng)大學 數(shù)據(jù)與知識工程江西省高校重點實驗室,南昌 330013
1.School of Information Technology,Jiangxi University of Finance and Economics,Nanchang 330013,China
2.School of Science,East China University of Technology,Nanchang 330013,China
3.Jiangxi Key Laboratory of Data and Knowledge Engineering,Jiangxi University of Finance and Economics,Nanchang 330013,China
近年來,隨著通信網(wǎng)絡、電子交易平臺和社會化媒體技術(shù)的快速發(fā)展,在網(wǎng)絡平臺上產(chǎn)生了大量的信息。對于消費者而言,信息缺乏無法理性決策,信息過量同樣會使決策陷入困境,因此有必要提高消費者信息查詢和分析的效率。通過推薦系統(tǒng)及其導航功能,決策者能在大量的網(wǎng)絡商品信息中快速搜尋滿足自身需求的商品,節(jié)約信息搜尋的成本,這在一定程度上有助于消費者擺脫由于“信息過載”所帶來的決策困境。在實際應用過程中,這些推薦系統(tǒng)一般包括基于推薦對象相似度(知識推理)的推薦方法、基于用戶興趣的協(xié)同過濾方法、基于推薦對象關聯(lián)挖掘的推薦方法或者這幾種方法相結(jié)合的推薦[1-3]?;谕扑]對象的相似度(知識推理)的推薦策略避免了協(xié)同過濾推薦的最初評價問題和數(shù)據(jù)稀疏性問題,但是當前基于推薦對象相似度(知識推理)的推薦方法存在兩個缺點:一是在進行相似度算法的設計時,由于該算法本身的局限性,導致只有與消費者已購買商品有相同屬性的對象才可能被最終推薦,這將導致推薦列表中對象類型過于單一;二是沒有考慮到消費者對互補性商品和情景關聯(lián)性商品的需求,忽視了消費者可能存在的對互補商品或情景相關商品的推薦需求,比如,在商品購買過程中,潛在的消費者更傾向于選擇那些與自己已購買過的商品功能互補或情景關聯(lián)的商品(如曾經(jīng)購買過打印機的用戶,隨后更有可能會需要購買打印墨盒)。
針對以上存在的問題,文中從推薦商品之間的關聯(lián)類型出發(fā),綜合考慮商品相似關聯(lián)、情景關聯(lián)和互補關聯(lián)三種關聯(lián)類型,提出了一種綜合推薦商品間多種關聯(lián)關系的多樣化推薦算法。算法首先從語義關聯(lián)實例的角度,進行基于領域本體的項目建模,通過分析用戶興趣本體,并對其進行偏好擴散,得到與用戶興趣本體可能存在關聯(lián)關系的其他商品對象集,形成推薦候選集。其次分析用戶興趣本體與推薦候選集中各商品實例之間的綜合相似度;再次分別分析用戶興趣本體與推薦候選集中各商品實例之間的層次互補度和商品互補關聯(lián)度,兩者綜合得出推薦候選集中各商品實例的綜合互補度;最后結(jié)合關聯(lián)規(guī)則考察用戶興趣本體與推薦候選集中各商品實例之間情景關聯(lián)特征,并結(jié)合對象間的綜合相似度、綜合互補度和潛在消費者興趣度,計算得出該消費者的多樣化商品推薦列表。
推薦系統(tǒng)按照所使用的數(shù)據(jù)來分類,可以分為內(nèi)容過濾[4-5]、協(xié)同過濾[6-7]和社會化推薦系統(tǒng)等。已有的社會化推薦算法雖然取得了一定的推薦效果,但它們大都是根據(jù)用戶間社會網(wǎng)絡關系和推薦商品直接的相似性進行研究,因此在一定程度上忽略了推薦商品之間互補關聯(lián)和情景關聯(lián)以及用戶偏好與推薦商品之間關聯(lián)的重要性。
本體是一種常用的建模方法,它主要是通過規(guī)范的知識結(jié)構(gòu)、合理的層次劃分,來進行知識的共享復用和邏輯推理[8]。文獻[9-10]通過對推薦對象的相關領域知識的分析,建立領域本體模型,但建模時僅考慮了對象之間層次關系,忽略了推薦對象之間的屬性語義關聯(lián)。這將導致用戶興趣本體與推薦對象實例之間相似度計算的準確性受到影響。文獻[11]利用不同領域中的語義本體信息和關聯(lián)數(shù)據(jù)庫,分析了音樂領域和建筑領域中的不同對象及這些對象之間的語義關聯(lián)關系,構(gòu)建了一個有向圖,即跨領域的語義概念模型,并在該有向圖的基礎上,分析不同領域?qū)ο笾g的語義關聯(lián)關系并進行知識推理,將不同領域的對象或知識推薦給消費者,實現(xiàn)跨領域的推薦。文獻[12]全面考慮推薦對象層次關系和屬性關系,并通過電影實例之間的語義關聯(lián)來改進實例的相似度計算算法,但忽略了互補關聯(lián)對象的推薦。
大多商品推薦系統(tǒng)主要考慮屬性相似的對象的推薦,從而導致推薦對象種類單一。多樣性匱乏的推薦結(jié)果導致了消費者已購買、已熟悉的商品的重復推薦,而忽視了購買行為之后的情景關聯(lián)性商品、互補性商品的實際推薦需求。朱郁筱等[13]對推薦系統(tǒng)的性能指標進行了歸納,認為推薦系統(tǒng)的好壞不僅要考慮準確率等傳統(tǒng)指標,還要考慮其他指標,并特別強調(diào)了推薦的多樣性指標及推薦商品在推薦列表中合理排序的重要性;文獻[14]針對推薦的多樣性問題,通過引入模糊相似測量等方法來提高基于內(nèi)容過濾算法的有效性。薛福亮等[15]提出基于Vague理論和商品相似性計算的商品多樣性選擇算法,以提高推薦結(jié)果的多樣性。文獻[16]通過用戶的需求調(diào)查和多領域知識的綜合分析,將多源關聯(lián)數(shù)據(jù)作為背景數(shù)據(jù)提出了基于多源關聯(lián)知識的推薦系統(tǒng),以實現(xiàn)推薦結(jié)果的準確性和有效性,但其并未從推薦對象間互補性關聯(lián)和情景關聯(lián)的角度來進行問題的綜合分析。
在商品銷售過程中,消費者購買了一件商品之后,可能會再一次購買相似的商品,更可能會購買與之具有功能互補或情景關聯(lián)的商品。能否滿足消費者對這些互補性和情景關聯(lián)性商品的推薦需求,增加推薦商品的多樣性,是當前的推薦方法務必考慮的問題,而這也將影響推薦結(jié)果的有效性。
本部分采用基于領域本體(Domain Ontology)的方法分別對商品(Commodities)和潛在消費者(Customers)進行建模,建立了領域本體Dom_O和潛在消費者模型PC_Model。
可以將商品領域本體表示為:Dom_O={G,RH,RP,RS,RC,P}。其中G代表領域中具有一定層級結(jié)構(gòu)的信息的集合;RH指信息或者商品之間的層級結(jié)構(gòu)關聯(lián);RP指概念之間的屬性關聯(lián)或?qū)嵗g的屬性關聯(lián),這些關聯(lián)將不同的概念和不同的實例組織起來,形成一個有機整體;RC指概念之間或?qū)嵗g的互補關系;RS指概念之間或?qū)嵗g的情景關系;P指商品實例集合,代表某個類別的具體實體集合。為了后面論述的需要,本文以家裝商品為例,繪制家裝領域本體片段(如圖1所示),將家裝領域本體中的類別、商品實例及其關聯(lián)以圖形的形式呈現(xiàn)出來。
圖1 家裝領域本體片段
可以將潛在消費者(Customers)模型形式化表示為一個三元組:Customers_Model=(Customers_Info,Customers_DOI,Customers_Onto)。
Customers_Info代表消費者基本信息,表示為Customers_Info={CustomersID,CName,CSex,CBirth,CProfession},用來表示消費者基本信息。Customers_Onto代表用戶興趣本體,表示為Customers_Onto={C,RN,RP,P},其中C表示消費者感興趣的概念集合,RN表示消費者之間的社交網(wǎng)絡關系(Social Network Relationship),RP指概念之間或消費者之間的屬性關系,P代表用戶感興趣的商品實例集合。Customers_DOI代表消費者興趣度,表示為Customers_DOI={CustomersID,pi,Di(t),t},其中 pi(1≤i≤n)用來表示消費者興趣本體P中的第i個商品實例,Di(t)(-1≤Di(t)≤1)表示在t時刻消費者對商品實例 pi的偏好值,當消費者對該商品有興趣,則Di(t)為正值,否則為負值。隨著時間的變化,Di(t)的值會發(fā)生變化。
本文基于領域本體中商品實例之間的語義關聯(lián)關系,分析了商品之間的相似關聯(lián)、互補關聯(lián)和情景關聯(lián),提出了基于商品之間關聯(lián)關系的多樣化推薦算法。
3.2.1商品相似度計算
商品的相似關聯(lián)是指商品之間由于類別、功能和屬性等相同或相近而產(chǎn)生的關聯(lián)關系??筛鶕?jù)領域本體中商品實例之間的層次關系計算對應的層次相似度,根據(jù)商品實例之間的屬性特征計算對應的屬性相似度,最后綜合得出商品實例的綜合相似度。若商品實例 pi和pj屬于同一個類或相似類的實例,則稱 pi和 pj之間存在層次相似關聯(lián)。
商品實例層次相交路徑所在分支的深度越深,節(jié)點離最近的公共類越遠,它們之間的層次相似度也越小。最近公共類的深度越深,商品實例 pi和 pj越具體,它們之間的層次相似度也越大。d(pi)和d(pj)表示商品實例 pi和pj的深度,d(A)為層次相交關聯(lián)中相交節(jié)點的深度,D表示對應的總深度,則商品實例 pi和 pj之間的層次相似度表示為:
若商品實例 pi和 pj分別有x和y個屬性,具有k個相似的屬性,則稱 pi和 pj之間存在屬性相交關聯(lián),體現(xiàn)實例之間的屬性相似性。當兩個商品實例相同的屬性越多,則k越大,說明兩個商品實例類別越相近;而商品實例之間屬性值越相似,則語義關聯(lián)長度L(PJAi)越小,兩個商品實例的屬性相似度越大。
由于商品實例屬性多為標稱屬性,因此兩個商品的屬性相似性可結(jié)合匹配率來計算。假設兩個商品實例的屬性值標準化后分別是(pi1,pi2,…,pix)和(pj1,pj2,…,pjy),其中k是匹配屬性數(shù)目,則商品實例 pi和 pj之間的屬性相似度表示為:
設層次相似度的權(quán)重為ε(0≤ε≤1),屬性相似度的權(quán)重為φ(0≤φ≤1),且ε+φ=1,則本體中任意兩個商品實例pi和pj的綜合商品相似度為:
在計算時,可以根據(jù)具體應用需要調(diào)整公式(3)中的參數(shù)。
3.2.2商品互補度計算
商品的互補關聯(lián)是指商品實例pi和pj之間由于功能上存在互補關系而產(chǎn)生的關聯(lián)關系,比如打印機和墨盒之間就存在互補關聯(lián)。通過層次語義互補度、商品互補關聯(lián)度和商品相似度可計算出商品實例pi和pj之間綜合商品互補度。若商品實例pi和 pj分別屬于最近互補類Ci和Cj,商品實例 pk屬于互補類Cj,相交類A為商品實例 pi和 pj的最近共同祖先,則稱 pi和 pj及pi和 pk之間存在互補關聯(lián),如圖2所示。
圖2 pi和 pj、pk之間的層次互補關聯(lián)
對于存在層次互補關聯(lián)的商品實例 pi和 pj,如圖2所示。對應的最近互補類Ci和Cj深度越深,商品實例 pi和 pj越具體,層次互補度也越大。同時,商品實例pi和 pj的深度越深,節(jié)點互補類Ci和Cj越遠,節(jié)點之間的層次互補度也越小。d(pi)和d(pj)表示商品實例pi和 pj的深度,d(Ci)和d(Cj)為最近互補類Ci和Cj的深度,D表示總深度,則商品實例 pi和 pj之間的層次互補度表示為:
假設商品銷售過程中,商品實例 pi和 pj之間存在對應關聯(lián)規(guī)則 pi?pj或 pj?pi,支持度Dsup(pi?pj)≥α或Dsup(pj?pi)≥α,且置信度 Dconf(pi?pj)≥β或Dconf(pj?pi)≥β,α和β分別為對應閾值,則商品實例 pi和 pj之間的商品互補關聯(lián)度可表示為:
假設商品銷售過程中,商品實例pi和pk之間有對應關聯(lián)規(guī)則 pi?pk或 pk?pi,但支持度Dsup(pi?pk)<α或Dsup(pk?pi)<α,且置信度 Dconf(pi?pk)<β或Dconf(pk?pi)<β,α和β分別為對應閾值,則商品實例 pi和 pk之間的商品互補關聯(lián)度表示為:
商品互補關聯(lián)度與對應商品的置信度和支持度有關。系統(tǒng)發(fā)現(xiàn)的關聯(lián)規(guī)則在過去可能具有較高的置信度或支持度,但隨著時間的推移對應的值可能會發(fā)生變化,從而導致在實際應用中,商品互補關聯(lián)度會隨時間推移而發(fā)生變化。
設層次語義互補度的權(quán)重為μ(0≤μ≤1),屬性相似度的權(quán)重為ω(0≤ω≤1),且μ+ω=1,則本體中任意兩個商品實例pi和pj的綜合商品互補度為:
在計算時,可以根據(jù)具體應用需要調(diào)整式(9)、式(10)中的參數(shù)。
3.2.3商品情景關聯(lián)度計算
商品的情景關聯(lián)是指某些商品可能需要在同一情景或場合下同時出現(xiàn)而產(chǎn)生的關聯(lián)關系,比如沙發(fā)和茶幾之間則存在情景關聯(lián)。若商品實例pi和pj是屬于不同領域本體的實例,在商品銷售過程中,支持度Dsup(pi?pj)≥α或Dsup(pj?pi)≥α,且置信度Dconf(pi?pj)≥β或Dconf(pj?pi)≥β,α和β分別為對應閾值,則稱 pi、pj之間存在商品情景關聯(lián)。商品實例 pi和 pj之間的商品情景關聯(lián)度可表示為:
商品情景關聯(lián)度與當前商品實例的置信度和支持度相關。系統(tǒng)發(fā)現(xiàn)的規(guī)則在過去可能具有較高的置信度或支持度,但隨著時間的推移對應的值可能會發(fā)生變化。因而在商品推薦過程中,應考慮商品情景關聯(lián)度的時效性。
若已知綜合商品相似度、綜合商品互補度和商品情景關聯(lián)度,則可計算該商品的推薦度:
其中,ζ+ψ+?=1(0≤ζ≤1,0≤ψ≤1,)0≤?≤1 。
根據(jù)消費者興趣本體Customers_Onto和消費者興趣度Customers_DOI,基于本文第3章提出的基于商品間關聯(lián)關系的多樣化推薦算法對消費者維與商品維(Customers*Commodities)進行匹配。該推薦算法根據(jù)領域本體中商品之間的語義關聯(lián),對消費者興趣本體進行偏好擴散,可以發(fā)現(xiàn)更多語義相似、互補和情景關聯(lián)的商品實例,然后通過綜合商品實例之間的相似關聯(lián)、互補關聯(lián)和情景關聯(lián),計算商品推薦度,并結(jié)合消費者興趣度的高低產(chǎn)生商品實例推薦列表?;谏唐穼嵗P聯(lián)關系的多樣化商品推薦方法包含以下幾點:
第一,結(jié)合領域知識對消費者興趣本體Customers_Onto進行偏好擴散,搜尋更多與消費者模型中商品實例存在相似關聯(lián)、互補關聯(lián)和情景關聯(lián)的商品實例,形成推薦商品候選集。該方法可使推薦結(jié)果不僅包含與消費者興趣本體相似的商品,還包含與之存在功能互補或情景關聯(lián)的商品,發(fā)現(xiàn)消費者多種潛在購買需求,改善推薦的效果,其步驟如下:
(1)根據(jù)消費者興趣本體Customers_DOI中的商品編號CustomersID,在領域本體Dom_O中搜尋所有已評分的商品實例。
(2)根據(jù)商品實例之間的相似關聯(lián)、互補關聯(lián)和情景關聯(lián)并結(jié)合商品實際銷售中的關聯(lián)規(guī)則數(shù)據(jù),在領域本體Dom_O中找出與Customers_Onto中的已評分商品實例有關聯(lián)的所有商品,形成推薦商品候選集CS,分
第二,根據(jù)商品實例與Customers_Onto中的已評分商品的相似關聯(lián)、互補關聯(lián)和情景關聯(lián)預測消費者對該商品興趣度,其計算步驟如下:
(1)針對某商品實例與用戶興趣本體的不同關聯(lián)
(2)分別根據(jù)商品實例 pi類型與消費者興趣本體pj(pj∈Customers_Onto)的綜合商品相似度、綜合商品互補度和商品情景關聯(lián)度,來預測消費者對該商品實例的興趣度D(pi),計算公式為:
其中,ζ+ψ+?=1(0≤ζ≤1,0≤ψ≤1,0≤?≤1)。
(3)根據(jù)預測興趣度的高低產(chǎn)生基于關聯(lián)數(shù)據(jù)的推薦列表Top-N。
在該算法中,由于可以在領域本體建模的基礎上,依據(jù)消費者興趣本體對當前商品集進行過濾,獲取推薦商品候選集,這將提高算法的計算速度,該算法的計算復雜度為O(nlnn)。
本章將利用“天貓”商城中某知名家裝店鋪的暢銷商品及其交易數(shù)據(jù)進行實驗設計,并對實驗結(jié)果進行對比分析,以評估基于推薦對象間關聯(lián)關系的商品推薦算法的有效性。本實驗數(shù)據(jù)的爬取、處理及最終計算主要采用Python語言編程實現(xiàn)。實驗數(shù)據(jù)集中包含了該店鋪2015年3月到2017年3月期間暢銷商品的基本信息,與之相關的消費者及其購買信息,產(chǎn)品涉及了床、床墊、餐邊柜、餐椅、書桌、衣帽架、茶幾、壁畫等多種商品類別,不同類別的商品基本屬性有所不同。購買信息主要包括消費者昵稱、購買商品ID、時間、評分等內(nèi)容。
在實驗中,著重考察推薦商品候選集CS中商品與消費者興趣本體Customers_DOI中商品的關聯(lián)和消費者的興趣偏好對商品推薦列表排序及推薦效果的影響。假設某消費者小明(CustomersID=1)在當前時刻t買過兩件商品 p1(商品型號:CP1A-A,商品類別:床)和 p2(商品型號:LA202-S,商品類別:餐桌),根據(jù)評分確定其對這兩種商品的興趣值分別為0.8和0.2,小明的消費者模型可以表示為Customers_Model=(Customers_Info,Customers_DOI,Customers_Onto),其中Customers Info={“1”,“小明”,“男”,“30”,“教師”},Customers DOI={(1,p1,0.8,t),(1,p2,0.2,t)}。
根據(jù)小明的消費者模型,結(jié)合本文的推薦算法,給出將為小明推薦的商品序列。
首先,對消費者興趣本體Customers_Onto進行偏好擴散,根據(jù)3.1節(jié)建立的領域本體模型在數(shù)據(jù)集中找出與Customers_Onto中商品 p1和 p2存在關聯(lián)關系的其他商品,形成推薦商品候選集CS={pi},其中i=3,4,…,75。在該候選集中包含了該店鋪2015年3月到2017年3月期間暢銷的73種商品。包含 p1、p2在內(nèi)的這75種產(chǎn)品有床、床墊、餐邊柜、餐椅、書桌等16種商品類別,實驗將涉及這些商品的基本信息,以及與之相關的21 524位消費者及其98 284條購買訂單信息。在本實驗中為使描述簡化,對這75種商品進行了重新編號,商品編號及類別信息如表1所示。
表1 商品編號及類別說明
其次,根據(jù)式(1)~(3)計算推薦商品候選集CS中商品與Customers_Model中兩個商品 p1和 p2的綜合相似度,其中ε=0.5,φ=0.5;根據(jù)式(4)~(10),計算偏好擴散后的商品實例與Customers_Model中兩個商品實例 p1和 p2的綜合商品互補度,式(10)中取 μ=0.5,ω=0.5;根據(jù)式(11)和式(12),計算偏好擴散后的商品實例與Customers_Model中兩個商品實例p1和p2的商品情景關聯(lián)度。t時刻Customers_Model中2個商品實例與其他73個商品實例的對應的支持度和置信度的部分數(shù)據(jù),如表2所示,計算結(jié)果部分數(shù)據(jù)如表3和表4所示。
表2 t時刻2個商品實例與其他實例對應的支持度和置信度的部分數(shù)據(jù)
表3 t時刻Customers Model中p1與其他實例的部分關聯(lián)數(shù)據(jù)
表4 t時刻p2與其他實例的部分關聯(lián)數(shù)據(jù)
設 ζ=0.3,ψ=0.3,?=0.4,則可通過式(13)計算其推薦度,如表5中給出了部分商品實例推薦度。
表5 t時刻關于p1、p2的部分推薦度數(shù)據(jù)
最后,根據(jù)式(14)計算消費者對推薦候選集中的每個商品的興趣度,計算結(jié)果如圖3所示。
圖3 基于關聯(lián)關系的候選商品推薦度
根據(jù)預測興趣度大小產(chǎn)生的基于推薦對象間關聯(lián)關系的推薦列表中排名前8的商品為:
傳統(tǒng)商品推薦算法中,大多只依據(jù)推薦對象的屬性相似度進行相似性計算。本文結(jié)合領域本體,提出了融合推薦對象間相似關聯(lián)、互補關聯(lián)和情景關聯(lián)的商品推薦算法。
首先,為了驗證該方法對推薦結(jié)果中商品排名的影響,在實驗中對比了這3種方法(即基于傳統(tǒng)商品的屬性相似度的推薦方法、基于綜合商品相似度的推薦方法、基于推薦商品間關聯(lián)關系的推薦方法)在該數(shù)據(jù)集上的推薦效果,計算結(jié)果如圖4所示。
圖4 3種方法的候選商品推薦度及排名變化
由圖4可知,基于推薦對象關聯(lián)關系的推薦算法對推薦商品類別及排名有較大調(diào)整,許多與消費者興趣本體有著互補關聯(lián)或情景關聯(lián)的商品,由于推薦度增加,獲得了推薦的機會,甚至有一些商品在推薦列表中排名非??壳啊H缇幪枮?p35的商品,與用戶興趣本體相似度較小,在基于傳統(tǒng)屬性相似度和綜合相似度的推薦列表中排名分別為4和11,但由于該商品與用戶興趣本體的互補關聯(lián)和情景關聯(lián),其在基于推薦商品間關聯(lián)關系的推薦列表中的排名上升為1。由此可見,相比于傳統(tǒng)的基于商品相似度的推薦算法,本文提出的方法可以較好地提高互補關聯(lián)或情景關聯(lián)商品的推薦度,在豐富推薦列表中的商品類型的同時,也滿足了消費者對與其已購買的商品具有互補或情景關聯(lián)的商品的推薦需求。
其次,為了驗證本文提出的算法的推薦效果,實驗根據(jù)數(shù)據(jù)集中同時購買了 p1、p2這兩種商品的消費者歷史交易及其評分信息,采用了較為常用的precision、recall、F-measure、diversity(推薦度大于0.5的推薦商品種類數(shù))等指標對上述3種方法的推薦效果進行對比,以全面地評價該算法的優(yōu)劣。其中為了使得比較數(shù)據(jù)更加可靠,對每一位同時購買了這兩種商品的消費者的相應指標分別進行計算,然后再求平均值,最終結(jié)果如表6所示。根據(jù)表6數(shù)據(jù),不難發(fā)現(xiàn),在該數(shù)據(jù)集中,基于商品間關聯(lián)關系的推薦方法的各項指標都要更優(yōu),這表明該算法的推薦結(jié)果更加有效,在一定程度上更能符合消費者的實際購買需求。
表6 3種方法的推薦效果
最后,分析了消費者偏好的變化對本文算法推薦效果的影響,通過實驗發(fā)現(xiàn)上述3種方法中用戶偏好的變化對各推薦指標值及推薦效果均有影響,結(jié)果如圖5所示。通過對比分析發(fā)現(xiàn)消費者興趣或偏好的變化對基于商品間關聯(lián)關系的推薦算法的推薦效果雖會產(chǎn)生影響,但相比傳統(tǒng)方法,其在推薦效果上仍然具有優(yōu)越性。而且如果能夠在推薦過程中根據(jù)實時交易數(shù)據(jù)準確把握消費者的偏好及其變化,則可以較大提高該算法的最終推薦效果。
圖5 消費者興趣偏好變化對推薦結(jié)果的影響
本文在商品實例關聯(lián)關系和領域本體建模的基礎上,提出了綜合商品相似度、商品互補度和商品情景關聯(lián)的多樣化商品推薦算法。該算法特點體現(xiàn)在:(1)相對于傳統(tǒng)推薦算法僅考慮相似性商品的推薦,該算法在領域本體的基礎上,結(jié)合消費者當前的購買情況,考慮了其對互補性商品及情景關聯(lián)性商品的推薦需求,并據(jù)此對推薦算法進行重新設計。實驗結(jié)果表明,該算法在一定程度上豐富了推薦商品的類型,提高了推薦的效果。(2)通過考慮推薦對象間關聯(lián)關系和用戶興趣,來調(diào)整推薦列表排序,全方位把握消費者購買需求與偏好,使得推薦結(jié)果更加符合消費者的購買實際需要和個性化需求;同時,該算法還可以用于協(xié)同過濾推薦和信息檢索中,以改善前者的稀疏性問題和后者的查全率和查準率不高的問題。
參考文獻:
[1]Burke R.Hybrid recommender systems:Survey and experiments[J].User Modeling and User-Adapted Interaction,2002,12(4):331-370.
[2]Adomavicius G,Tuzhilin A.Toward the next generation of recommender systems:A survey of the state-of-theart and possible extensions[J].IEEE Transactions on Knowledge&Data Engineering,2005,17(6):734-749.
[3]姜書浩,張立毅,張志鑫.一種基于相對相似性提高推薦總體多樣性的協(xié)同過濾算法[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2016,32(12):44-49.
[4]Musto C.Enhanced vector space models for content-based recommender systems[C]//Proceedings of Conference on Recommender Systems,2010:361-364.
[5]Song Y,Zhuang Z,Li H,et al.Real-time automatic tag recommendation[C]//Proceedings of International ACM SIGIR Conference on Research and Development in Information Retrieval,Singapore,2008:515-522.
[6]文俊浩,舒珊.一種改進相似性度量的協(xié)同過濾推薦算法[J].計算機科學,2014,41(5):68-71.
[7]王付強,彭甫镕,丁小煥,等.基于位置的非對稱相似性度量的協(xié)同過濾推薦算法[J].計算機應用,2016,36(1):171-174.
[8]Studer R,Benjamins V R,F(xiàn)ensel D.Knowledge engineering:Principles and methods[J].Data&Knowledge Engineering,1998,25(1/2):161-197.
[9]周莉,潘旭偉,謝玉開.情境感知的電子商務個性化商品信息服務[J].圖書情報工作,2011,55(10):130-134.
[10]李志隆,王道平,關忠興.基于領域本體的用戶興趣模型構(gòu)建方法研究[J].情報科學,2015,32(11):69-73.
[11]Fernández-Tobías I,Cantador I,Kaminskas M,et al.A generic semantic-based framework for cross-domain recommendation[C]//Proceedings of International Workshop on Information Heterogeneity and Fusion in Recommender Systems,2011:25-32.
[12]李楓林,陳德鑫,梁少星.基于語義關聯(lián)和情景感知的個性化推薦方法研究[J].情報雜志,2015(10):189-195.
[13]朱郁筱,呂琳媛.推薦系統(tǒng)評價指標綜述[J].電子科技大學學報,2012,41(2):163-175.
[14]Kant V,Bharadwaj K K.Enhancing recommendation quality of content-based filtering through collaborative predictions and fuzzy similarity measures[J].Procedia Engineering,2012,38:939-944.
[15]薛福亮,馬莉.利用動態(tài)產(chǎn)品分類樹改進的關聯(lián)規(guī)則推薦方法[J].計算機工程與應用,2016,52(4):135-141.
[16]Gordea S,Lindley A,Graf R.Computing recommendations for long term data accessibility basing on open knowledge and linked data[C]//Joint Proceedings of the Recsys 2011 Workshop on Human Decision Making in Recommender Systems,2011.