亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電子商務(wù)環(huán)境下多元個(gè)性化服務(wù)推薦研究

        2019-01-11 06:03:04崔睿宇楊懷洲
        關(guān)鍵詞:度量準(zhǔn)確性協(xié)同

        崔睿宇, 楊懷洲

        (西安石油大學(xué) 計(jì)算機(jī)學(xué)院, 西安 710065)

        0 引 言

        隨著通信技術(shù)和經(jīng)濟(jì)環(huán)境的改變,消費(fèi)者的消費(fèi)模式發(fā)生了迅速的變化,網(wǎng)購(gòu)的趨勢(shì)也在逐年增加。而購(gòu)物網(wǎng)站上海量的商品信息對(duì)消費(fèi)者快速選擇目標(biāo)商品起到了一定的限制作用[1]。在這種背景下, 推薦系統(tǒng)( recommender systems)應(yīng)運(yùn)而生。服務(wù)推薦算法作為推薦系統(tǒng)的核心組成部分,成為個(gè)性化推薦領(lǐng)域的研究熱點(diǎn)。由于每種推薦算法都存在各自的優(yōu)點(diǎn)和不足,所以,服務(wù)推薦算法的組合和多元化研究對(duì)于提高推薦系統(tǒng)的準(zhǔn)確性和性能具有重要意義。

        1 個(gè)性化推薦技術(shù)

        1.1 推薦技術(shù)分類標(biāo)準(zhǔn)

        目前,對(duì)推薦系統(tǒng)的分類并沒有統(tǒng)一標(biāo)準(zhǔn),很多學(xué)者從不同角度對(duì)推薦方法進(jìn)行了不同的劃分[2-3]。文獻(xiàn)[4]給出了區(qū)別推薦技術(shù)的二維屬性:

        自動(dòng)化程度(degree of automation)與持久性程度(degree of persistence)。

        1.2 主流推薦算法

        (1)基于內(nèi)容的推薦算法。 基于內(nèi)容的推薦,又被稱為基于信息過濾的推薦,是由信息檢索(Information Retrieve)領(lǐng)域提出來的,是指用戶根據(jù)選擇的對(duì)象,推薦其它類似屬性的對(duì)象作為推薦結(jié)果。其核心思想是根據(jù)用戶興趣和物品特征的相似性進(jìn)行推薦[5]。

        (2)協(xié)同過濾推薦算法。協(xié)同過濾推薦(collaborative filtering recommendation)是目前研究最多的個(gè)性化推薦技術(shù)。該算法的基本思想是將用戶按照興趣的不同進(jìn)行分類,同類用戶具有極為相似的興趣,因此可以由其它用戶的偏好協(xié)同過濾得到對(duì)目標(biāo)用戶的推薦。

        協(xié)同過濾主要分為兩大類別[6]:Memory-Based Collaborative Filtering和Model-Based Collaborative Filtering。Memory-Based方法又進(jìn)一步分為User-Based Collaborative Filtering(UBCF)和Item-Based Collaborative Filtering(IBCF )。

        UBCF是一種基于用戶最近鄰(K-Nearest Neighbor, KNN)實(shí)現(xiàn)的推薦算法,該算法的關(guān)鍵過程在于對(duì)用戶最近鄰的查找——可以通過各種相似度計(jì)算方法進(jìn)行度量。UBCF中常用的相似度計(jì)算方法有:皮爾森相關(guān)系數(shù)(Pearson Correlation Coefficient, PCC)、夾角余弦相似度(Cosine SIMilarity, COSIM)及Jaccard系數(shù)(Jaccard Coefficient)等。由于用戶之間的相似度穩(wěn)定性較差,需要對(duì)用戶之間的相似度進(jìn)行頻繁更新等問題,UBCF不適用于用戶量大的信息系統(tǒng)。針對(duì)這一問題,基于項(xiàng)目的協(xié)同過濾算法(Item-Based Collaborative Filtering, IBCF)被Sarwar等人[7]提出。

        IBCF的關(guān)鍵在于挖掘項(xiàng)目間的相似性,分類相似項(xiàng)目,IBCF基本采用了與UBCF類似的相似性計(jì)算度量方法。常見的基于項(xiàng)目的相似度計(jì)算方法有以下幾種:基于項(xiàng)目的皮爾森相關(guān)系數(shù)(Item-based Pearson Correlation Coefficient)、基于項(xiàng)目的夾角余弦相似度(Item-based Cosine Similarity)和基于項(xiàng)目的修正夾角余弦相似度(Adjusted Item-based Cosine Similarity)等。

        由于基于內(nèi)存的協(xié)同推薦直接應(yīng)用評(píng)分?jǐn)?shù)據(jù)進(jìn)行相似度計(jì)算和評(píng)分預(yù)測(cè),基于模型的協(xié)作推薦大量采用機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法。在基于模型的協(xié)同過濾推薦算法中常用的模型和算法有貝葉斯網(wǎng)絡(luò)、聚類算法、回歸算法、馬爾科夫決策模型和關(guān)聯(lián)規(guī)則挖掘等。

        (3)基于關(guān)聯(lián)規(guī)則的推薦算法?;陉P(guān)聯(lián)規(guī)則的推薦(association rule-based recommendation)是根據(jù)關(guān)聯(lián)規(guī)則對(duì)項(xiàng)目排序產(chǎn)生的推薦[8]。電子商務(wù)領(lǐng)域中的購(gòu)物車效應(yīng)就是關(guān)聯(lián)規(guī)則效應(yīng)運(yùn)用的典型,通過研究分析用戶頻繁購(gòu)買的商品之間所存在的聯(lián)系,再利用商品之間的這種關(guān)聯(lián)關(guān)系為其它用戶產(chǎn)生推薦。

        (4)基于知識(shí)的推薦算法?;谥R(shí)的推薦(Knowledge-based recommendation)不是建立在用戶需要和偏好上的推薦,即無需考慮用戶-項(xiàng)目矩陣的歷史信息[9]。在某種程度上可以看做一種推理技術(shù)。

        (5)基于人口統(tǒng)計(jì)學(xué)的推薦算法?;谌丝诮y(tǒng)計(jì)學(xué)(Demographic-based Recommendation)的推薦算法是基于用戶個(gè)人屬性對(duì)用戶進(jìn)行分類,再按照類別的不同對(duì)各類中的用戶進(jìn)行推薦[10]。

        1.3 各推薦技術(shù)優(yōu)缺點(diǎn)比較

        每種推薦技術(shù)的優(yōu)缺點(diǎn)對(duì)比見表1。

        表1 各推薦算法優(yōu)缺點(diǎn)對(duì)比

        1.4 組合推薦技術(shù)

        組合推薦(hybrid recommendation)的一個(gè)最重要原則就是通過組合后應(yīng)能避免或彌補(bǔ)各自推薦技術(shù)的弱點(diǎn)。理論上有很多種推薦組合方法,不同的組合思路適用于不同的應(yīng)用場(chǎng)景。

        混合推薦的分類方法大致有2種,一種按照不同推薦技術(shù)混合發(fā)生階段的不同分為前融合、中融合和后融合[9];另外,根據(jù)不同的結(jié)合方式,Robin[11]提出7種組合思路:加權(quán)組合、變換、混合、特征組合、層疊、特征擴(kuò)充以及元層次組合[12]。

        1.5 推薦算法的評(píng)價(jià)

        推薦算法的評(píng)價(jià)要綜合考慮實(shí)驗(yàn)數(shù)據(jù)集和評(píng)價(jià)標(biāo)準(zhǔn)2方面的選擇。

        1.5.1 推薦算法的實(shí)驗(yàn)數(shù)據(jù)集

        推薦算法評(píng)價(jià)依賴的實(shí)驗(yàn)數(shù)據(jù)集有2種選擇——真實(shí)數(shù)據(jù)集或者人工加工數(shù)據(jù)集。真實(shí)數(shù)據(jù)集可反映目標(biāo)推薦系統(tǒng)的真實(shí)數(shù)據(jù)分布,但成本高,時(shí)效性差,缺乏統(tǒng)一的評(píng)價(jià)參考性。人工加工數(shù)據(jù)集往往具有較好的一致性,可人為控制數(shù)據(jù)的分布特征,但只能對(duì)特定應(yīng)用領(lǐng)域的算法評(píng)價(jià),數(shù)據(jù)分布特征難以反映實(shí)際應(yīng)用環(huán)境中的數(shù)據(jù)特征。

        推薦系統(tǒng)經(jīng)過多年的發(fā)展,收集和累積了大量的真實(shí)數(shù)據(jù),這些數(shù)據(jù)既具有一定的數(shù)量規(guī)模,又在一定程度上反映了各領(lǐng)域中真實(shí)數(shù)據(jù)的分布特征 ,具有較強(qiáng)的代表性。常用的具有參考意義的數(shù)據(jù)集有:MovieLens數(shù)據(jù)集、EachMovie數(shù)據(jù)集、Book-Crossing數(shù)據(jù)集、Jester Joke數(shù)據(jù)集和Netflix數(shù)據(jù)集。

        1.5.2 推薦算法的準(zhǔn)確性評(píng)價(jià)

        推薦系統(tǒng)及算法準(zhǔn)確性的度量至今仍無統(tǒng)一的標(biāo)準(zhǔn),一般可從預(yù)測(cè)準(zhǔn)確性和分類準(zhǔn)確性2個(gè)方面度量推薦算法的推薦質(zhì)量。

        1.5.2.1 預(yù)測(cè)準(zhǔn)確性

        針對(duì)評(píng)分預(yù)測(cè)推薦任務(wù),預(yù)測(cè)準(zhǔn)確性是主要的度量標(biāo)準(zhǔn)。常用的預(yù)測(cè)準(zhǔn)確性度量標(biāo)準(zhǔn)包括平均絕對(duì)誤差(Mean Absolute Error, MAE)、歸一化平均絕對(duì)誤差(Normalized Mean Absolute Error, NMAE)和均方根誤差(Root Mean Squared Error, RMSE)。

        MAE通過統(tǒng)計(jì)預(yù)測(cè)評(píng)分與真實(shí)評(píng)分之間絕對(duì)距離的均值來實(shí)現(xiàn)準(zhǔn)確性度量,與推薦的預(yù)測(cè)準(zhǔn)確性呈反比,對(duì)于n個(gè)真實(shí)評(píng)分R={r1,r2,…,rn},推薦算法生成的預(yù)測(cè)評(píng)分為P={p1,p2,…,pn},則MAE可表示為:

        (1)

        MAE是一種絕對(duì)誤差評(píng)價(jià)標(biāo)準(zhǔn),其往往因?yàn)樵u(píng)分范圍的不同而造成不可比。而NMAE的提出通過使用評(píng)分范圍對(duì)MAE進(jìn)行了歸一化處理,從而實(shí)現(xiàn)相對(duì)誤差度量,克服了MAE的不可比性。對(duì)于評(píng)分上、下限分別為rmax和rmin數(shù)據(jù)集,NMAE可表示為:

        (2)

        而RMSE可以提高預(yù)測(cè)準(zhǔn)確性的區(qū)分度,RMSE可表示為:

        (3)

        1.5.2.2 分類準(zhǔn)確性

        分類準(zhǔn)確性度量標(biāo)準(zhǔn)是對(duì)推薦算法進(jìn)行正確或錯(cuò)誤決策的頻率統(tǒng)計(jì),分類準(zhǔn)確性的度量與分類問題有著密切的關(guān)系,所以其度量標(biāo)準(zhǔn)大量借用了分類算法研究中使用的標(biāo)準(zhǔn),常用的分類準(zhǔn)確性度量標(biāo)準(zhǔn)主要有準(zhǔn)確率、召回率和F1評(píng)分。

        準(zhǔn)確率量化了在推薦系統(tǒng)所生成的推薦中,符合用戶信息需求的相關(guān)推薦結(jié)果所占比重,召回率反映了推薦系統(tǒng)實(shí)現(xiàn)推薦的全面性。

        系統(tǒng)可能實(shí)現(xiàn)旳正確推薦和錯(cuò)誤推薦狀態(tài)可以見表2的混淆表格表示,對(duì)應(yīng)不同推薦狀態(tài)的數(shù)量統(tǒng)計(jì)見表3。

        則準(zhǔn)確率可表示為:

        (4)

        召回率可表示為:

        (5)

        F1評(píng)分是對(duì)準(zhǔn)確率與召回率的一種綜合度量,通過二者的協(xié)平均將推薦系統(tǒng)的分類準(zhǔn)確性度量表示為單一評(píng)價(jià)標(biāo)準(zhǔn),數(shù)學(xué)表達(dá)式如下:

        (6)

        表2 推薦系統(tǒng)混淆

        表3 推薦系統(tǒng)推薦狀態(tài)數(shù)量混淆

        2 推薦系統(tǒng)存在的問題

        隨著推薦系統(tǒng)在電子商務(wù)領(lǐng)域的廣泛應(yīng)用,其面臨的一系列挑戰(zhàn)也得到了越來越廣泛的關(guān)注。推薦系統(tǒng)面臨的主要問題有以下幾點(diǎn):

        (1)特征提取問題。雖然在信息檢索中,文本特征的提取技術(shù)已經(jīng)比較成熟,但是推薦系統(tǒng)的對(duì)象不一定具有文本特征或者利用文本不足以作為描述[13]。對(duì)于多媒體數(shù)據(jù),如視頻、音樂、圖像等的特征提取方法需要結(jié)合多媒體內(nèi)容分析領(lǐng)域的相關(guān)技術(shù)。另外,大規(guī)模數(shù)據(jù)情況下對(duì)特征的區(qū)分性要求提高。

        (2)數(shù)據(jù)稀疏性問題。在大型的推薦系統(tǒng)中,對(duì)于一個(gè)用戶,總有大量的對(duì)象沒有經(jīng)過評(píng)價(jià)或者查看,而且這類數(shù)據(jù)常常比己經(jīng)有此用戶評(píng)價(jià)的數(shù)據(jù)量更大[14]。此外,用戶之間選擇的差異性大,也會(huì)加重?cái)?shù)據(jù)的稀疏性問題。

        (3)冷啟動(dòng)問題。冷啟動(dòng)問題是稀疏性問題的特例[5-14],冷啟動(dòng)問題可以細(xì)分為新用戶問題和新項(xiàng)目問題[15-17]。

        當(dāng)系統(tǒng)中出現(xiàn)新用戶時(shí),該用戶沒有對(duì)項(xiàng)目進(jìn)行評(píng)分,推薦系統(tǒng)缺乏關(guān)于新用戶的興趣信息和知識(shí)。對(duì)基于內(nèi)容的過濾算法,推薦系統(tǒng)無法建立關(guān)于新用戶的興趣模型;對(duì)基于用戶的協(xié)同過濾算法,推薦系統(tǒng)也無法確定該用戶的相似鄰居;對(duì)于基于項(xiàng)目的協(xié)同過濾推薦算法,盡管系統(tǒng)可以確定不同項(xiàng)目之間的相似程度,但由于缺乏新用戶的興趣評(píng)分,所以仍無法對(duì)項(xiàng)目進(jìn)行評(píng)分預(yù)測(cè)。

        對(duì)于協(xié)同過濾算法來說,新項(xiàng)目評(píng)分的缺失將造成相似度計(jì)算和評(píng)分預(yù)測(cè)無法完成。冷啟動(dòng)問題的主要成因在于推薦系統(tǒng)對(duì)于評(píng)分?jǐn)?shù)據(jù)的依賴性,所以需要在推薦系統(tǒng)中引入其它參考信息和知識(shí)[18-19],用來克服評(píng)分?jǐn)?shù)據(jù)的缺失對(duì)推薦系統(tǒng)的影響。

        (4)概念漂移問題。用戶在與推薦系統(tǒng)交互的過程中,其興趣與偏好會(huì)受到外部各種因素的影響,如社會(huì)、家庭、重大事件都會(huì)導(dǎo)致用戶模型發(fā)生變化,從而造成用戶興趣的概念漂移[20-23]。

        作為一種動(dòng)態(tài)人機(jī)交互系統(tǒng),推薦系統(tǒng)的概念漂移問題無法避免,因此應(yīng)建立感知概念漂移的機(jī)制[24],對(duì)用戶興趣變化進(jìn)行主動(dòng)跟蹤。在用戶興趣模型更新、相似度計(jì)算和評(píng)分預(yù)測(cè)等各關(guān)鍵過程中引入關(guān)于評(píng)分的時(shí)間特性,對(duì)用戶的歷史評(píng)分進(jìn)行區(qū)分,從而保證推薦結(jié)果符合用戶需求。

        (5)算法伸縮性問題。由于推薦系統(tǒng)的推薦精度和實(shí)時(shí)性是一對(duì)矛盾。目前大部分推薦技術(shù)的實(shí)時(shí)性是以犧牲系統(tǒng)的推薦質(zhì)量為代價(jià)的[24-26]。推薦系統(tǒng)可采用基于模型的推薦算法來提高其伸縮性,將大計(jì)算量的計(jì)算任務(wù)以離線方式進(jìn)行,如推薦系統(tǒng)中的特征抽取、用戶建模、相似度計(jì)算等都可以事先或定期進(jìn)行離線計(jì)算,但是基于模型的推薦算法往往會(huì)犧牲一定的推薦準(zhǔn)確性,造成推薦質(zhì)量的下降。

        3 研究展望

        對(duì)目前電子商務(wù)個(gè)性化推薦方面的研究,筆者認(rèn)為,協(xié)同過濾算法在未來一段時(shí)間內(nèi)仍會(huì)是電子商務(wù)領(lǐng)域中的主流算法,而該算法自身存在的諸如數(shù)據(jù)的稀疏性問題和冷啟動(dòng)問題始終是國(guó)內(nèi)外學(xué)者的研究熱點(diǎn)。除了對(duì)協(xié)同過濾算法本身進(jìn)行算法改進(jìn)之外,數(shù)據(jù)挖掘技術(shù)的興起無疑為克服協(xié)同過濾算法的短板提供了更多可能。

        隨著人們對(duì)推薦系統(tǒng)認(rèn)識(shí)的逐步深入,用戶需求也將更易于被研究者理解,更加符合用戶需求的協(xié)同過濾算法也終將被提出。同時(shí),評(píng)估協(xié)同過濾算法的度量也將隨著認(rèn)識(shí)的變化不斷改進(jìn)。此外,隨著移動(dòng)終端的普及,對(duì)諸如位置、時(shí)間和終端等上下文信息進(jìn)行充分利用也必將成為未來推薦系統(tǒng)的研究重點(diǎn)。

        猜你喜歡
        度量準(zhǔn)確性協(xié)同
        有趣的度量
        模糊度量空間的強(qiáng)嵌入
        淺談如何提高建筑安裝工程預(yù)算的準(zhǔn)確性
        蜀道難:車與路的協(xié)同進(jìn)化
        迷向表示分為6個(gè)不可約直和的旗流形上不變愛因斯坦度量
        “四化”協(xié)同才有出路
        汽車觀察(2019年2期)2019-03-15 06:00:50
        三醫(yī)聯(lián)動(dòng) 協(xié)同創(chuàng)新
        美劇翻譯中的“神翻譯”:準(zhǔn)確性和趣味性的平衡
        地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
        論股票價(jià)格準(zhǔn)確性的社會(huì)效益
        日本黑人人妻一区二区水多多 | 亚洲熟女一区二区三区不卡| 亚洲av精品一区二区| 人妻精品久久一区二区三区| 精品一区二区三区芒果| 亚洲av免费手机在线观看| 亚洲av日韩aⅴ无码色老头| 国产欧美日韩精品a在线观看| 久久国产精品二国产精品| 国产日本在线视频| 国产做床爱无遮挡免费视频| 少妇一级aa一区二区三区片| 激情五月天俺也去综合网| 亚洲精品国产二区在线观看| 亚洲一区二区三区地址| 夜夜春亚洲嫩草影院| 国产乱子乱人伦电影在线观看| 国产91一区二这在线播放| 男女上床视频免费网站| 亚洲av熟女传媒国产一区二区| 亚洲色图专区在线视频| 熟女人妻中文字幕av| 日韩夜夜高潮夜夜爽无码| 久久综合九色综合欧美狠狠| 中文字幕一区二区三区精华液| 春色成人在线一区av| 少妇人妻中文字幕在线| 不卡的高清av一区二区三区 | 中国国语毛片免费观看视频| 中文字幕永久免费观看| 97无码人妻一区二区三区蜜臀| 一区二区三区国产视频在线观看| 日本免费三片在线视频| 激情都市亚洲一区二区| 国产精品免费无遮挡无码永久视频| 娇妻在交换中哭喊着高潮| 亚洲中文字幕在线观看| 国产一区二区不卡老阿姨| 丁香婷婷色| av免费在线观看在线观看| 亚洲天堂亚洲天堂亚洲色图|