艾黎
〔摘 要〕淘寶網(wǎng)作為電子商務(wù)時(shí)代最大的網(wǎng)上零售平臺(tái),為用戶提供越來(lái)越多的商品與服務(wù)的同時(shí),也出現(xiàn)了信息過(guò)載等一系列問(wèn)題。鑒于此,本文提出了基于商品屬性與用戶聚類的個(gè)性化服裝推薦方法,通過(guò)用戶個(gè)人信息與對(duì)商品的評(píng)價(jià),計(jì)算用戶之間的相似度,進(jìn)行聚類分析。與此同時(shí),將商品化整為零,通過(guò)商品屬性來(lái)計(jì)算商品的相似度,得到top-N相似列表。以此,綜合商品與用戶兩者的權(quán)重值,實(shí)現(xiàn)為用戶提供個(gè)性化的商品推薦,解決用戶面對(duì)信息過(guò)載的難題,為用戶節(jié)省精力,提高用戶的購(gòu)物體驗(yàn)。針對(duì)某一淘寶網(wǎng)店鋪,本文提出了適合的混合推薦算法,并通過(guò)搜集實(shí)際數(shù)據(jù)進(jìn)行了實(shí)證研究,對(duì)推薦結(jié)果進(jìn)行準(zhǔn)確性評(píng)價(jià)。
〔關(guān)鍵詞〕個(gè)性化;商品屬性;用戶聚類;混合推薦
DOI:10.3969/j.issn.1008-0821.2015.09.031
〔中圖分類號(hào)〕F71336 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2015)09-0165-06
〔Abstract〕As the largest online retail platform in the era of e-commerce,Taobao provides users with more and more goods and services,but it also has a series of problems such as information overload.In this view,the paper proposed a personalized clothing recommendation method based on commodities attributes and users clustering.According to users personal information and his or her comment of the commodity,the paper could calculate the similarities between users,then divide them into different clusters.Meanwhile,the paper described the commodity as a set of attributes and calculate similarities of the products.Then the paper got a list of top-N similar products.With the weights of commoditys similarities and user comments,it provided users with personalized commodity recommendations,solving the problem of information overload.Its aimed to save energy,improve the users shopping experience.Take the example of one Taobao shop,empirical research is carried out by collecting the actual data to evaluate the precision of hybrid recommendation algorithm.And the results were not bad.
〔Key words〕personalization;commodity attribute;user clustering;hybrid recommendation
隨著信息技術(shù)與互聯(lián)網(wǎng)規(guī)模的發(fā)展,中國(guó)網(wǎng)民數(shù)量急劇增加,截至2014年12月底,我國(guó)網(wǎng)民數(shù)量達(dá)到649個(gè)億[1]?;ヂ?lián)網(wǎng)的用戶基礎(chǔ),給電子商務(wù)提供了發(fā)展的溫床。近10年來(lái),電子商務(wù)呈現(xiàn)迅猛的發(fā)展態(tài)勢(shì),中國(guó)即將進(jìn)入全民網(wǎng)購(gòu)的時(shí)代。根據(jù)艾瑞咨詢發(fā)布的網(wǎng)絡(luò)購(gòu)物市場(chǎng)數(shù)據(jù)[2],2014年中國(guó)網(wǎng)絡(luò)購(gòu)物市場(chǎng)交易規(guī)模達(dá)到28萬(wàn)億,增長(zhǎng)487%,占社會(huì)消費(fèi)品零售總額的107%。但是,隨著越來(lái)越多的商家進(jìn)入電子商務(wù)行業(yè),在線銷(xiāo)售市場(chǎng)更加的紛繁復(fù)雜。面對(duì)商品信息海洋,消費(fèi)者在選購(gòu)商品時(shí)需要采集、搜索大量的信息,才能做出最終的選擇。
信息過(guò)載問(wèn)題使得消費(fèi)者在進(jìn)行網(wǎng)絡(luò)購(gòu)物時(shí),需要花費(fèi)甚至多于在實(shí)體店購(gòu)物的時(shí)間與精力,這在很大程度上將會(huì)打擊消費(fèi)者的網(wǎng)購(gòu)信心。為了節(jié)省消費(fèi)者的購(gòu)物精力,提高消費(fèi)者的決策效率,電子商務(wù)網(wǎng)站的推薦系統(tǒng)應(yīng)用而生。個(gè)性化推薦技術(shù)就是根據(jù)消費(fèi)者的歷史行為數(shù)據(jù),預(yù)測(cè)消費(fèi)者的興趣愛(ài)好,并向消費(fèi)者推薦其可能感興趣的商品或服務(wù),例如亞馬遜網(wǎng)站的書(shū)籍推薦系統(tǒng),蝦米網(wǎng)站的音樂(lè)推薦等。
作為亞洲最大的網(wǎng)絡(luò)零售商圈,截至2013年,淘寶網(wǎng)擁有近5億的注冊(cè)用戶數(shù),每天有超過(guò)6 000萬(wàn)的固定訪客,每天同時(shí)在線商品數(shù)已經(jīng)超過(guò)了8億件,為消費(fèi)者提供海量商品與服務(wù)的同時(shí),也面臨著嚴(yán)重的信息過(guò)載問(wèn)題。盡管,目前淘寶網(wǎng)也有實(shí)現(xiàn)簡(jiǎn)單的個(gè)性化推薦的功能,不過(guò)更多的是為商家營(yíng)銷(xiāo)服務(wù)。針對(duì)商品的個(gè)性化推薦問(wèn)題,很多學(xué)者進(jìn)行了研究,基于客戶聚類的商品推薦[3],根據(jù)客戶的瀏覽、點(diǎn)擊、收藏行為進(jìn)行聚類,實(shí)現(xiàn)推薦;或是根據(jù)用戶對(duì)商品的評(píng)分矩陣,進(jìn)行協(xié)同過(guò)濾推薦[4]。
1 研究現(xiàn)狀
個(gè)性化推薦是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的智能推薦平臺(tái),以幫助電子商務(wù)網(wǎng)站為用戶提供個(gè)性化的購(gòu)買(mǎi)決策支持與信息服務(wù)。一個(gè)完整的推薦系統(tǒng)主要包括3個(gè)模塊:用戶模型、推薦算法與推薦輸出[5]。其中,用戶模型,主要指通過(guò)收集用戶的各方面信息,如基本人口統(tǒng)計(jì)信息、行為信息,以提取出能夠描述用戶的屬性信息,并將用戶實(shí)體以結(jié)構(gòu)化的形式表示出來(lái)。目前,用戶模型的表示技術(shù)主要包括:n維向量空間模型、神經(jīng)網(wǎng)絡(luò)、用戶-評(píng)分矩陣、案例、本體論5種形式[6]。endprint
根據(jù)國(guó)內(nèi)外的研究成果,推薦算法可以主要分為:基于內(nèi)容(Content-based,簡(jiǎn)稱CB)、協(xié)同過(guò)濾(Collaborative Filtering,簡(jiǎn)稱CF)和混合推薦[7]。
基于內(nèi)容的推薦算法,是信息資源領(lǐng)域的主要研究?jī)?nèi)容。該算法通過(guò)分析資源或是商品的內(nèi)容屬性,計(jì)算商品、資源之間相似度。根據(jù)用戶過(guò)去選擇過(guò)的商品,從推薦商品中選擇屬性值相近的商品作為推薦結(jié)果。這一推薦技術(shù)首先分析并提取推薦對(duì)象中的內(nèi)容信息,建立推薦對(duì)象的檔案,和用戶模型中的偏好檔案進(jìn)行匹配,相似度高的就可以作為推薦結(jié)果[8]。例如,蝦米音樂(lè)會(huì)根據(jù)用戶收聽(tīng)過(guò)、收藏的音樂(lè),分析出喜歡的音樂(lè)風(fēng)格、類型、歌手等特征,再根據(jù)此推薦具有相同特征的音樂(lè)?;趦?nèi)容的推薦(CB)實(shí)現(xiàn)原理簡(jiǎn)單、直觀,結(jié)果易于理解,不需要具備專業(yè)行業(yè)知識(shí)。而且,目前在信息研究領(lǐng)域,對(duì)文本的特征提取技術(shù)比較成熟,但是,對(duì)于互聯(lián)網(wǎng)時(shí)代涌現(xiàn)的各種多媒體信息,技術(shù)支持還有待提高。此外,基于內(nèi)容的推薦,只能根據(jù)用戶歷史偏好進(jìn)行推薦,不能很好地發(fā)現(xiàn)用戶的新興趣。
相對(duì)來(lái)說(shuō),協(xié)同過(guò)濾算法是目前使用比較廣泛的新一代推薦技術(shù)。它基于用戶-評(píng)分矩陣來(lái)研究用戶的興趣模型:對(duì)同一項(xiàng)目評(píng)分相似的用戶,具有相類似的偏好。因此,對(duì)于任意一個(gè)用戶,首先可以根據(jù)其對(duì)項(xiàng)目的評(píng)分找到具有相似偏好的用戶。然后,根據(jù)相似用戶對(duì)其他項(xiàng)目的評(píng)分,預(yù)測(cè)該用戶對(duì)新項(xiàng)目的喜好程度,形成推薦結(jié)果。早在1992年,John Riedl和Paul Resnick開(kāi)始創(chuàng)建基于協(xié)同過(guò)濾技術(shù)的新聞推薦系統(tǒng)GroupLens。該系統(tǒng)收集用戶對(duì)文章的評(píng)分,并預(yù)測(cè)用戶對(duì)其他文章的喜好程度。這是最早的自動(dòng)化協(xié)同過(guò)濾系統(tǒng)推薦引擎之一。協(xié)同過(guò)濾(CF)算法能夠很好的應(yīng)用于復(fù)雜、非結(jié)構(gòu)化推薦對(duì)象,如電影、視頻等。而且,它并不依據(jù)推薦對(duì)象的內(nèi)容,推薦結(jié)果具有多樣性,能夠較好的挖掘出用戶的興趣動(dòng)向[9]。
綜上所述,單個(gè)推薦算法都具有各自的優(yōu)點(diǎn)與局限,無(wú)論是基于內(nèi)容的推薦還是協(xié)同過(guò)濾都會(huì)存在冷啟動(dòng)的問(wèn)題。當(dāng)有新用戶出現(xiàn)時(shí),系統(tǒng)較難獲取用戶的偏好信息,也就無(wú)法為其提供精確的個(gè)性化推薦?;旌贤扑]算法在一定程度上能夠避免兩種算法的局限,最常使用的就是協(xié)同過(guò)濾與機(jī)器學(xué)習(xí)算法相結(jié)合。
由于商品種類的復(fù)雜性與非結(jié)構(gòu)化,商品推薦存在各種適應(yīng)性的問(wèn)題,各大電子商務(wù)網(wǎng)站的商品推薦技術(shù)也不盡相同,更有很多學(xué)者對(duì)這一問(wèn)題展開(kāi)研究。商品推薦主要可以概括為兩大類:基于單一推薦算法或是推薦技術(shù)與數(shù)據(jù)挖掘技術(shù)的結(jié)合。C2C在線拍賣(mài)興起之時(shí),李雪峰、劉魯?shù)忍岢龌趨f(xié)同過(guò)濾的拍賣(mài)商品推薦(2006)[10]。汲業(yè)、陳燕等引入知識(shí)工程的樹(shù)狀表示法,將商品推薦中的三要素轉(zhuǎn)化成描述樹(shù)進(jìn)行表達(dá),建立基于Prolog語(yǔ)言知識(shí)庫(kù)模型的個(gè)性化推薦(2010)[11]。溫廷新、唐小龍等提出基于商品內(nèi)容與基于用戶協(xié)同過(guò)濾的混合模式網(wǎng)絡(luò)超市商品推薦(2013)[12],其中商品的內(nèi)容特征提取太過(guò)寬泛,只有商品的外在屬性值如價(jià)格、重量、銷(xiāo)售量等。
2 理論基礎(chǔ)與模型
鑒于上述對(duì)推薦算法的研究分析,針對(duì)服裝商品,本文提出基于商品屬性內(nèi)容與用戶聚類的混合推薦模式。根據(jù)服裝商品的分類以及用戶在選購(gòu)服裝時(shí)考慮的因素,提取商品的屬性特征,構(gòu)建商品的模型。與此同時(shí),采集用戶的基本個(gè)人信息如身高、體重、地區(qū)、性別等與歷史購(gòu)買(mǎi)服裝的評(píng)價(jià)。通過(guò)分析評(píng)價(jià),得出用戶對(duì)商品哪些屬性比較看重,并將這些屬性特征納入用戶模型。
實(shí)現(xiàn)混合推薦模式的過(guò)程如圖1所示:
(1)對(duì)于任何一個(gè)進(jìn)入店鋪的用戶,根據(jù)用戶瀏覽的商品,基于商品屬性利用KNN函數(shù)找到最相近的TOP-N推薦候選集;
(2)基于構(gòu)建的用戶模型,進(jìn)行K均值聚類,得到用戶所屬的類;
(3)求出該用戶與類中其他用戶之間的相似度,將相似度作為權(quán)重值賦給用戶對(duì)商品的評(píng)分,綜合用戶的評(píng)分與權(quán)重值,對(duì)推薦候選集商品,進(jìn)行喜好排序,得到最終的推薦列表;
(4)若判斷用戶為新用戶,則可以在步驟3中根據(jù)用戶所屬類,直接給出推薦列表。
圖1 混合推薦流程圖
該混合推薦模式的創(chuàng)新點(diǎn)在于,對(duì)用戶的購(gòu)物評(píng)價(jià)進(jìn)行分析,抽取出用戶的購(gòu)物偏好屬性,并將屬性偏好加入用戶模型,更加生動(dòng)、真實(shí)的描述一個(gè)用戶實(shí)體。通過(guò)對(duì)用戶的聚類,找到偏好相似的用戶,能夠很好地解決新用戶的冷啟動(dòng)問(wèn)題。雖然,該推薦過(guò)程中,也涉及用戶-評(píng)分矩陣,但并不依賴該信息得到推薦結(jié)果,而是作為一個(gè)提高推薦精準(zhǔn)度的方式。
21 KNN算法
KNN算法相似近鄰的算法包括,固定數(shù)量的近鄰(KNN)與基于相似度的近鄰(Threshold-based Neighborhoods)。這里本文我們采用的就是前者,固定數(shù)量的近鄰,其中K就代表我們抽取的相似近鄰的數(shù)量。根據(jù)服裝行業(yè)商品的屬性描述以及選購(gòu)經(jīng)驗(yàn),提取出商品的屬性特征,構(gòu)建商品的檔案,用一個(gè)N維向量來(lái)表示,形式如{key,value}。對(duì)于任意兩個(gè)商品,分別用向量x,y表示,通過(guò)向量之間的余弦相似度,來(lái)度量商品的相似性。
其中,K表示商品模型中的屬性特征的數(shù)量,相似度越大,兩個(gè)商品的共性就越大。
依次計(jì)算其他商品與目標(biāo)商品的相似度,并按照相似度值的高低排序,K個(gè)最相似的近鄰,得到top-N推薦結(jié)果。
22 K均值算法
K均值算法是典型的基于距離的聚類函數(shù),采用距離作為評(píng)判相似度的標(biāo)準(zhǔn),認(rèn)為距離越大,兩者之間的相似度越小。同樣的,我們根據(jù)用戶的基本信息與商品評(píng)價(jià),提取用戶的屬性特征,用一個(gè)N維向量來(lái)表示。對(duì)于任意兩個(gè)用戶,分別用向量m,n表示,兩者間的距離采用歐幾里的方式測(cè)量:
d(m,n)=∑kj=1(uj,m-uj,n)2
(2)
其中,K表示用戶模型中的屬性特征的數(shù)量。進(jìn)行K均值聚類時(shí),首先從用戶群中隨機(jī)選取K個(gè)質(zhì)心,計(jì)算用戶到各個(gè)質(zhì)心的距離,并把該用戶歸于距離質(zhì)心最近的類,完成初步的聚類。然后,分別計(jì)算K類中的平均值,將平均值的點(diǎn)作為新的質(zhì)心。迭代上面兩步進(jìn)行聚類,直到質(zhì)心不變或是變動(dòng)的幅度小于一定的閾值,函數(shù)結(jié)束。根據(jù)歐幾里得距離,利用下面的公式轉(zhuǎn)換為相似度。endprint
sim(m,n)=11+d(m,n)
(3)
3 實(shí)證研究
本文的研究對(duì)象為特定用戶推薦個(gè)性化的服裝商品,目前淘寶網(wǎng)也有類似的功能推薦,如“看了又看”、“掌柜推薦”等,個(gè)性化不夠明顯,只是根據(jù)關(guān)鍵詞的簡(jiǎn)單關(guān)聯(lián)推薦,推薦結(jié)果不夠精確。鑒于此,我們將對(duì)這一問(wèn)題進(jìn)行改善研究。
31 商品屬性提取
針對(duì)服裝這一特定推薦對(duì)象,查找服裝行業(yè)相關(guān)的類目信息,不同類目下的服裝商品屬性特征具有一定的差別。此外,通過(guò)研究服裝消費(fèi)者的行為特點(diǎn),從消費(fèi)者的角度,找到最能描述商品的屬性,并摒除一些冗余的屬性特征。
王文興通過(guò)分析服裝消費(fèi)者行為特點(diǎn),對(duì)價(jià)格與非價(jià)格因素綜合定量分析,得到結(jié)論:在互聯(lián)網(wǎng)的環(huán)境下,影響女性服裝消費(fèi)的非價(jià)格因素主要包括服裝的材料、品牌以及時(shí)尚[13]。梁建芳、 李筱勝等以女性網(wǎng)購(gòu)消費(fèi)者為研究對(duì)象,通過(guò)調(diào)查問(wèn)卷方式,對(duì)網(wǎng)購(gòu)群體、購(gòu)買(mǎi)的服裝類別以及影響其購(gòu)買(mǎi)的決策因素進(jìn)行了統(tǒng)計(jì)分析。在分析在線服裝選購(gòu)的主要影響因素中,作者發(fā)現(xiàn)947%的網(wǎng)購(gòu)消費(fèi)者首先會(huì)關(guān)注產(chǎn)品特征,其次才是商家屬性和信用風(fēng)險(xiǎn)。產(chǎn)品屬性的關(guān)注度由高到低依次為:服裝的款式、質(zhì)量、色彩、價(jià)格、品牌、潮流和產(chǎn)地[14]。鑒于此,我們對(duì)商品提取以下幾個(gè)屬性:寶貝描述、寶貝顏色、尺寸、風(fēng)格以及適合的人群、季節(jié)等信息。其中,我們將顏色、尺寸、版型、適合年齡與季節(jié)這幾個(gè)屬性設(shè)置為尺度變量,屬性值之間存在著程度大小之分,圖案、面料與風(fēng)格設(shè)置為分類變量,屬性值之間沒(méi)有大小之分。
色彩是人類感知的第一要素,也是吸引視覺(jué)感知的重要元素之一。色彩能夠激發(fā)人們的心理反應(yīng),并激發(fā)著人們對(duì)色彩的審美和商品的購(gòu)買(mǎi)欲望和消費(fèi)欲望。色彩學(xué)上根據(jù)心理感受,把顏色分為暖色調(diào)(紅、橙、黃)、冷色調(diào)(青、藍(lán))和中性色調(diào)(紫、綠、黑、灰、白)。色彩的偏好與人的心理性格緊密相關(guān),每個(gè)人都會(huì)有自己比較偏好的色彩系[15],如表1所示。
32 用戶建模
許明李在傳統(tǒng)的購(gòu)買(mǎi)行為相關(guān)理論的基礎(chǔ)上,從經(jīng)營(yíng)者的角度獲得影響消費(fèi)者網(wǎng)上購(gòu)買(mǎi)服裝的因素。自有平臺(tái)B2C經(jīng)營(yíng)者認(rèn)為人口統(tǒng)計(jì)特征、相關(guān)群體都會(huì)對(duì)網(wǎng)絡(luò)購(gòu)物產(chǎn)生影響[16]。對(duì)于消費(fèi)者來(lái)說(shuō),在選購(gòu)服裝時(shí)合身是最重要的因素,即使再好看的衣服,若是不合身,消費(fèi)者也會(huì)放棄購(gòu)買(mǎi)。因此,我們對(duì)用戶提取基本人口特征信息,包括用戶名、身高、體重。通過(guò)分析服裝消費(fèi)者在選購(gòu)服裝時(shí)注重的服裝屬性特征,我們從評(píng)價(jià)中提取用戶所購(gòu)買(mǎi)商品的尺寸顏色信息,以及店鋪中用戶對(duì)商品的評(píng)價(jià)信息,包括評(píng)價(jià)等級(jí)、評(píng)價(jià)內(nèi)容,如寶貝有無(wú)色差、是否合身等。其中,體重、身高、是否合身、有無(wú)色差、購(gòu)買(mǎi)的顏色等屬性全部都為尺度變量,屬性值有著程度大小之分,如表2所示。
33 結(jié)果與評(píng)估
為了驗(yàn)證算法的準(zhǔn)確性,利用網(wǎng)頁(yè)數(shù)據(jù)采集軟件Gooseeker采集淘寶網(wǎng)上一家名為“柚子美衣”的店鋪所有的服裝信息和用戶信息。根據(jù),前面提取的商品、用戶特征屬性,進(jìn)行數(shù)據(jù)處理,可以將數(shù)據(jù)存儲(chǔ)為3張數(shù)據(jù)表:商品信息表、用戶信息表和用戶評(píng)分表。
331 結(jié)果展示
選定編號(hào)為1的用戶進(jìn)行檢驗(yàn),根據(jù)前面提取的商品屬性,該用戶瀏覽的商品表示為item(01,1,1,0,1,0)。將該商品輸入最近鄰KNN算法中,通過(guò)方法KnearestNeighbor(Listlist,double[] vec,int k)計(jì)算出K件最相似的商品。
取K=10,輸出10件與該商品最相近的商品,也就是初始的推薦列表,如表3所示。
對(duì)輸入的用戶進(jìn)行聚類,經(jīng)過(guò)多次迭代后,函數(shù)結(jié)束。得到用戶所屬類為2,計(jì)算類中各個(gè)用戶與指定用戶的相似度,如表4所示。
用戶對(duì)商品會(huì)有一個(gè)評(píng)分,將用戶相似度作為權(quán)重值賦給商品評(píng)分,計(jì)算得到加權(quán)后的商品評(píng)分。按照評(píng)分的高低對(duì)初始推薦列表進(jìn)行排序,得到最后的推薦結(jié)果。其中,編號(hào)為55的商品,加權(quán)分為0,是因?yàn)橛脩舻念愔袥](méi)有用戶對(duì)該商品有過(guò)評(píng)分,如表5所示。
332 評(píng)估
絕大多數(shù)的推薦系統(tǒng)都利用準(zhǔn)確度評(píng)價(jià)推薦算法的好壞,假設(shè)用戶可以對(duì)商品反饋喜歡或是不喜歡,那么準(zhǔn)確度可以定義為推薦算法中預(yù)測(cè)的商品,用戶喜歡的商品數(shù)所占比例。由于系統(tǒng)實(shí)際應(yīng)用不同,評(píng)價(jià)指標(biāo)缺乏標(biāo)準(zhǔn)化?,F(xiàn)在已有的準(zhǔn)確度指標(biāo)主要有:預(yù)測(cè)準(zhǔn)確度、分類準(zhǔn)確度、排序準(zhǔn)確度、距離標(biāo)準(zhǔn)化指標(biāo)等[17]。
文中主要采用分類準(zhǔn)確度來(lái)評(píng)估推薦系統(tǒng),其中分類準(zhǔn)確度包括兩個(gè)評(píng)估指標(biāo),分別為準(zhǔn)確率(precision)與召回率(recall)。準(zhǔn)確率是指在系統(tǒng)的推薦列表中,用戶喜歡的商品數(shù)所占的比率;而召回率是指推薦列表中用戶喜歡的商品數(shù)占用戶所有喜歡的商品數(shù)量的比率,如表6所示。
我們都希望推薦系統(tǒng)的準(zhǔn)確率與召回率兩者越高越好,但是,precision與recall指標(biāo)兩者在一定情況下是相互矛盾的。因此,本文采用綜合指標(biāo)F-Measure來(lái)評(píng)估。F-Measure是precision與recall的調(diào)和加權(quán)平均。
F1=2prp+r
(5)
通過(guò)設(shè)置推薦商品數(shù)N的不同,得到推薦系統(tǒng)在一系列推薦實(shí)踐下的評(píng)價(jià)指標(biāo)準(zhǔn)確率、召回率以及與F1的值。以此來(lái)驗(yàn)證推薦系統(tǒng)的穩(wěn)定性與持久性,排除偶然的因素。如下是推薦商品數(shù)N—F1曲線,如圖2所示:
圖2 評(píng)價(jià)指標(biāo)F1
我們可以看到雖然隨著推薦的商品數(shù)的變動(dòng),評(píng)價(jià)指標(biāo)F1的值一直穩(wěn)定在04~06之間,沒(méi)有很大的波動(dòng)??梢哉f(shuō),該推薦算法是比較穩(wěn)健的。
4 結(jié)論與展望
采用基于商品內(nèi)容與用戶聚類的混合推薦,能夠很好地解決推薦中的冷啟動(dòng)問(wèn)題。實(shí)現(xiàn)個(gè)性化的推薦,在提高用戶購(gòu)物體驗(yàn)的同時(shí),也能為商家增強(qiáng)消費(fèi)者粘性。在以后的研究中,可以進(jìn)一步研究豐富用戶的特征信息,建立更加全面的用戶興趣偏好模型。本文使用的用戶特征信息,主要還是用戶的人口特征信息,并沒(méi)有涉及用戶對(duì)商品屬性的需求特征。未來(lái),可以基于用戶對(duì)商品的評(píng)論內(nèi)容,對(duì)其進(jìn)行文本分詞處理,提取用戶對(duì)商品屬性的需求的關(guān)鍵詞,并賦予一定的權(quán)重,以此得到更加豐富的用戶特征模型。進(jìn)一步提高個(gè)性化推薦系統(tǒng)的精準(zhǔn)度。endprint
參考文獻(xiàn)
[1]三川.CNNIC發(fā)布第35次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[J].中國(guó)遠(yuǎn)程教育,2015,(2):31-31.
[2]張晶.關(guān)注兩會(huì):聚焦電商未來(lái)發(fā)展[J].物流技術(shù):裝備版,2015,34(3):18-22.
[3]唐曉波,樊靜.基于客戶聚類的商品推薦[J].情報(bào)雜志,2009,28(6):143-146.
[4]黃光球,靳峰,彭緒友.基于興趣度的協(xié)同過(guò)濾商品推薦系統(tǒng)模型[J].微電子學(xué)與計(jì)算機(jī),2005,22(3):5-8.
[5]肖蕾.點(diǎn)餐平臺(tái)推薦系統(tǒng)模型設(shè)計(jì)[J].漳州師范學(xué)院學(xué)報(bào):自然科學(xué)版,2013,(2):32-35.
[6]吳麗花,劉魯.個(gè)性化推薦系統(tǒng)用戶建模技術(shù)綜述[J].情報(bào)學(xué)報(bào),2006,25(1):55-62.
[7]楊博,趙鵬飛.推薦算法綜述[J].山西大學(xué)學(xué)報(bào):自然科學(xué)版,2011,(3):337-350.
[8]曾艷,麥永浩.基于內(nèi)容預(yù)測(cè)和項(xiàng)目評(píng)分的協(xié)同過(guò)濾推薦[J].計(jì)算機(jī)應(yīng)用,2004,24(1):111-113.
[9]王國(guó)霞,劉賀平.個(gè)性化推薦系統(tǒng)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(7):66-76.
[10]李雪峰,劉魯,張?.基于協(xié)同過(guò)濾的在線拍賣(mài)商品推薦[J].計(jì)算機(jī)工程,2006,32(23):18-20.
[11]汲業(yè),陳燕,屈莉莉,等.基于Prolog語(yǔ)言的商品推薦知識(shí)庫(kù)模型[J].計(jì)算機(jī)工程,2010,36(22):10-12.
[12]溫廷新,唐小龍,馬龍梅.基于混合模式的網(wǎng)絡(luò)超市商品推薦方法[J].現(xiàn)代情報(bào),2013,33(12):45-51.
[13]王文興.服裝網(wǎng)絡(luò)營(yíng)銷(xiāo)策略研究[D].上海:東華大學(xué),2010.
[14]梁建芳,李筱勝.電子商務(wù)環(huán)境下女性服裝消費(fèi)行為分析[J].浙江理工大學(xué)學(xué)報(bào),2011,28(5):728-733.
[15]郭東.論個(gè)人形象設(shè)計(jì)中的色彩設(shè)計(jì)與性格的關(guān)系[J].美與時(shí)代:上半月,2009,(3):11-14.
[16]許明李.服裝消費(fèi)者網(wǎng)上購(gòu)買(mǎi)行為影響因素研究[D].上海:東華大學(xué),2012.
[17]劉建國(guó),周濤,郭強(qiáng),等.個(gè)性化推薦系統(tǒng)評(píng)價(jià)方法綜述[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2009,6(3):1-10.
(本文責(zé)任編輯:郭沫含)endprint