亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶協(xié)同過濾的電子商務(wù)推薦算法

        2015-12-28 12:44:42
        北方經(jīng)貿(mào) 2015年11期
        關(guān)鍵詞:相似性關(guān)聯(lián)協(xié)同

        楊 登

        (吉林化工學(xué)院經(jīng)濟(jì)管理學(xué)院,吉林吉林 132022)

        一、研究背景

        現(xiàn)今正從信息時(shí)代邁向推薦時(shí)代。明尼蘇達(dá)大學(xué)教授John Riedl提出“推薦系統(tǒng)將成為未來(lái)十年里最重要的變革,社會(huì)化網(wǎng)站將由推薦系統(tǒng)所驅(qū)動(dòng)”。作為電子商務(wù)先驅(qū)者,Amazon實(shí)現(xiàn)了35%的銷售額來(lái)自其推薦系統(tǒng)。美國(guó)ChoiceStream公司調(diào)查顯示:普通消費(fèi)者中的45%、高端消費(fèi)者中的69%更更愿意選擇有推薦功能的網(wǎng)站;消費(fèi)者購(gòu)物前平均查看的商品個(gè)數(shù)在推薦系統(tǒng)幫助下由11.7下降到6.6;有推薦系統(tǒng)時(shí)選擇更優(yōu)的產(chǎn)品的消費(fèi)者占比從65%上升到93%;有推薦系統(tǒng)的幫助消費(fèi)者將更改初始選擇的比率從60%下降到2l%。

        二、電子商務(wù)個(gè)性化推薦系統(tǒng)

        (一)定義

        Resnick和Varian在1997年提出了個(gè)性化推薦系統(tǒng)定義:“個(gè)性化推薦系統(tǒng)是利用電子商務(wù)網(wǎng)站向客戶提供商品信息和建議,幫助用戶決定應(yīng)該購(gòu)買什么產(chǎn)品,模擬銷售人員幫助客戶完成購(gòu)買過程”。

        (二)用戶偏好數(shù)據(jù)

        推薦系統(tǒng)要想推薦結(jié)果能夠反映出用戶的偏好,需要用戶偏好數(shù)據(jù)的支撐。收集用戶偏好數(shù)據(jù)是個(gè)性化推薦系統(tǒng)的重要工作,用戶偏好數(shù)據(jù)的質(zhì)量決定推薦的質(zhì)量。用戶偏好數(shù)據(jù)可分為顯式數(shù)據(jù)和隱性數(shù)據(jù)兩類。

        1.顯式數(shù)據(jù)。顯式數(shù)據(jù)要求用戶主動(dòng)地向系統(tǒng)提供本人的各種信息包括偏好信息,主要是通過特定的網(wǎng)頁(yè)直接請(qǐng)求用戶顯式輸入一些個(gè)人信息,包括對(duì)某些商品的數(shù)值評(píng)分,也包括用戶注冊(cè)的個(gè)人基本信息,如姓名、性別、年齡、生日、背景等。用戶不情愿的輸入個(gè)人信息數(shù)據(jù)導(dǎo)致用戶評(píng)分?jǐn)?shù)據(jù)的極為稀疏,這是顯式評(píng)分方式的明顯缺點(diǎn)。稀疏的評(píng)分?jǐn)?shù)據(jù)導(dǎo)致推薦系統(tǒng)推薦質(zhì)量的下降。

        2.隱性數(shù)據(jù)。隱性數(shù)據(jù)的收集方式主要是從系統(tǒng)的服務(wù)器上收集訪問日志和各類網(wǎng)絡(luò)資源的過程,數(shù)據(jù)的獲取過程其實(shí)是采用網(wǎng)絡(luò)數(shù)據(jù)挖掘的方法,以網(wǎng)絡(luò)內(nèi)容挖掘和網(wǎng)絡(luò)使用挖掘?yàn)橹?,然后進(jìn)行數(shù)據(jù)的預(yù)處理。

        用戶興趣偏好的收集過程是學(xué)習(xí)、分析、明確用戶的需求的過程。用戶的的需求會(huì)表現(xiàn)在與系統(tǒng)進(jìn)行交互的瀏覽行為,比如用戶經(jīng)常訪問的頁(yè)面集,用戶的點(diǎn)擊,收藏歷史,瀏覽時(shí)間,拉動(dòng)滾動(dòng)條的次數(shù),鼠標(biāo)點(diǎn)擊區(qū)域,鍵盤輸入輸出等有關(guān)操作等,推薦系統(tǒng)將這些用戶行為信息記錄并轉(zhuǎn)化為反映用戶興趣偏好的數(shù)據(jù)模型,再應(yīng)用于推薦生成。隱式數(shù)據(jù)依靠行為科學(xué)的研究結(jié)論,其優(yōu)勢(shì)在于:①數(shù)據(jù)獲取的自動(dòng)化程度高,用戶在訪問系統(tǒng)時(shí)不需要做其額外的事情,降低了用戶與系統(tǒng)交互的工作量。②數(shù)據(jù)收集的“成本”較低。③各種隱式數(shù)據(jù)能結(jié)合起來(lái)生成更精確的偏好信息。

        但是相對(duì)于顯式數(shù)據(jù),隱性數(shù)據(jù)的缺點(diǎn)也非常明顯,就是對(duì)它的獲取難度大、對(duì)用戶偏好進(jìn)行模型化的可信程度偏低。一般情況下,用戶的興趣偏好表現(xiàn)的多樣性和動(dòng)態(tài)性,所以為了提高收集數(shù)據(jù)的質(zhì)量,在很多實(shí)際應(yīng)用中都采用混合式,即顯示數(shù)據(jù)和隱性數(shù)據(jù)混合收集,優(yōu)勢(shì)互補(bǔ),目的是為了更加真實(shí)、全面地獲取用戶的偏好信息。

        三、電子商務(wù)推薦算法的研究

        (一)基于內(nèi)容的推薦算法

        基于內(nèi)容的推薦算法需要分析電子商務(wù)網(wǎng)站的資源內(nèi)容信息,根據(jù)用戶興趣建立用戶檔案,用戶檔案中包含了用戶的品位、偏好和需求信息。然后根據(jù)資源內(nèi)容與用戶檔案之間的相似性向用戶提供推薦服務(wù)。在一個(gè)這樣的系統(tǒng)中,通常采用相關(guān)特征來(lái)定義所要推薦的物品。

        (二)基于規(guī)則的推薦算法

        隨著數(shù)據(jù)挖掘的興起,關(guān)聯(lián)規(guī)則被應(yīng)用于推薦系統(tǒng),形成了一種新的推薦技術(shù)基于規(guī)則的推薦技術(shù)?;谝?guī)則的推薦技術(shù)在評(píng)價(jià)表上挖掘項(xiàng)目間的關(guān)聯(lián)規(guī)則(項(xiàng)目關(guān)聯(lián))和用戶間的關(guān)聯(lián)規(guī)則為當(dāng)前用戶進(jìn)行推薦。使用項(xiàng)目關(guān)聯(lián)進(jìn)行推薦時(shí),每條項(xiàng)目關(guān)聯(lián)的前件相當(dāng)于一個(gè)興趣組,而規(guī)則的后件則相當(dāng)于這個(gè)興趣組的推薦。如果當(dāng)前用戶對(duì)該規(guī)則前件中的所有項(xiàng)目都喜歡,那么就把規(guī)則的后件以一定可信度推薦給當(dāng)前用戶。而使用用戶關(guān)聯(lián)進(jìn)行推薦時(shí),用戶關(guān)聯(lián)的后件必須是當(dāng)前用戶,使用用戶關(guān)聯(lián)的前件中的用戶的共同興趣模擬當(dāng)前用戶的興趣,模擬的可信度就是用戶關(guān)聯(lián)的可信度,以此作為推薦的依據(jù)。

        (三)協(xié)同過濾推薦算法

        協(xié)同過濾主要是以屬性或興趣相近的用戶經(jīng)驗(yàn)與建議作為提供個(gè)性化推薦的基礎(chǔ)。透過協(xié)同過濾,有助于搜集具有類似偏好或?qū)傩缘挠脩?,并將其意見提供給同一集群中的用戶作為參考,以滿足人們通常在決策之前參考他人意見的心態(tài)。協(xié)同過濾推薦是迄今為止最成功的個(gè)性化推薦技術(shù),被應(yīng)用到很多領(lǐng)域中,協(xié)同過濾相當(dāng)突出的優(yōu)點(diǎn)是其決策基礎(chǔ)是“人”而不是“內(nèi)容的分析”,能針對(duì)任何形態(tài)的內(nèi)容進(jìn)行過濾,更能處理相當(dāng)復(fù)雜和艱難的概念呈現(xiàn),以獲得意料之外的結(jié)論。

        四、基于用戶的協(xié)同過濾

        基于用戶的協(xié)同過濾推薦根據(jù)相似用戶群的觀點(diǎn)來(lái)產(chǎn)生對(duì)目標(biāo)用戶的推薦。基本思想是如果某些用戶對(duì)部分項(xiàng)目的評(píng)分趨于一致或是很接近,可以認(rèn)為他們對(duì)其他項(xiàng)目的評(píng)分差異就比較小,進(jìn)一步,可以使用這些相似用戶的項(xiàng)目評(píng)分值對(duì)目標(biāo)用戶的未評(píng)分項(xiàng)目進(jìn)行估計(jì)。

        基于用戶的協(xié)同過濾使用數(shù)理統(tǒng)計(jì)的方法來(lái)尋找與目標(biāo)用戶有相似興趣偏好的最近鄰居用戶集合,再以最近鄰居用戶對(duì)特定項(xiàng)目的評(píng)分為基礎(chǔ)使用一定的數(shù)學(xué)方法來(lái)預(yù)測(cè)目標(biāo)用戶對(duì)該特定項(xiàng)目的評(píng)分,而預(yù)測(cè)評(píng)分最高的前N個(gè)商品可以看作是用戶最有可能感興趣top-N商品返回給目標(biāo)用戶(這就是所謂的top-N推薦)。

        基于用戶的協(xié)同過濾推薦算法的核心思想是利用數(shù)理統(tǒng)計(jì)的方法為目標(biāo)用戶尋找他的最近鄰居用戶集,再以最近鄰居用戶對(duì)特定項(xiàng)目的評(píng)分為基礎(chǔ)使用一定的數(shù)學(xué)方法來(lái)預(yù)測(cè)目標(biāo)用戶對(duì)該特定項(xiàng)目的評(píng)分,最終產(chǎn)生推薦結(jié)果。通過最近鄰居用戶對(duì)目標(biāo)用戶未評(píng)分項(xiàng)目的評(píng)分值進(jìn)行加權(quán)平均來(lái)逼近,這是該算法思想的關(guān)鍵?;谟脩舻膮f(xié)同過濾推薦算法的主要工作有:用戶之間相似性的衡量、最近鄰居集的查找和評(píng)分預(yù)測(cè)值的計(jì)算。

        由上引入,這里對(duì)基于用戶的協(xié)同過濾推薦算法過程進(jìn)行分析,該過程大致可以劃分成以下三個(gè)階段。

        (一)數(shù)據(jù)表示

        按用戶對(duì)項(xiàng)目的評(píng)分情況進(jìn)行建模,有效度量用戶之間的相似性。在基于用戶的協(xié)同過濾推薦算法中,數(shù)據(jù)源是用戶對(duì)商品的評(píng)分信息。算法必須在所有的用戶對(duì)每一種商品的評(píng)分信息的數(shù)據(jù)基礎(chǔ)上產(chǎn)生推薦結(jié)果,用一個(gè)m×n階矩陣,Rmn來(lái)表示用戶評(píng)分?jǐn)?shù)據(jù)。這里,m行代表m個(gè)用戶,n列代表n個(gè)項(xiàng)目,矩陣中的第i行第j列的元素Rij代表用戶i對(duì)項(xiàng)目j的評(píng)分。

        表用戶評(píng)分?jǐn)?shù)據(jù)矩陣

        (二)查找目標(biāo)用戶的最近鄰居用戶集

        最近鄰居用戶的意思就是若干個(gè)在購(gòu)買行為或評(píng)分行為上與當(dāng)前用戶比較一致的用戶。整個(gè)基于用戶的協(xié)同過濾推薦算法的核心部分就是最近鄰居的查詢。最近鄰居查詢本質(zhì)上是對(duì)評(píng)分?jǐn)?shù)據(jù)進(jìn)行建模,然后計(jì)算用戶模型的相似度,相似度高的用戶就是鄰居用戶。計(jì)算過程就是先收集用戶i和j評(píng)分過的項(xiàng)目集合,再計(jì)算他們之間的相似性程度,相似性程度記為sim(i,j)。相似性程度主要有以下三種計(jì)算方法。

        余弦相似性(Cosine):將用戶對(duì)所有項(xiàng)目的評(píng)分看作為n維項(xiàng)目空間上的向量,用這些用戶評(píng)分向量構(gòu)建用戶的數(shù)據(jù)模型,用戶間的相似度就是通過向量間的余弦夾角來(lái)度量,設(shè)用戶i和用戶j在n維項(xiàng)目空間上的評(píng)分向量分別表示為,則用戶i和用戶j之間的相似性sim(i,j)可按下面公式一計(jì)算。

        相關(guān)相似性:設(shè)用Iij表示用戶i和用戶j共同評(píng)分過的項(xiàng)目集合,則用戶i和用戶j之間的相似性sim(i,j)可以采用Pearson相關(guān)系數(shù)計(jì)算,如公式二所示。

        修正的余弦相似性:由于沒有考慮不同用戶的評(píng)分尺度的問題,余弦相似性方法存在缺陷。對(duì)余弦相似性方法的修正,主要通過減去用戶對(duì)項(xiàng)目的平均評(píng)分來(lái)實(shí)現(xiàn)。用Iij表示用戶i和j都評(píng)分的用戶集合,用Ii、Ij分別表示用戶i和用戶j評(píng)分的項(xiàng)目集合,則修正的余弦相似性計(jì)算sim(i,j)方法可用公式三表示。

        最近鄰用戶查詢的目標(biāo)就是對(duì)每一個(gè)用戶u,在整個(gè)用戶空間中查找與他相似的用戶集合 U={u1,u2,...,uk},并且u1到uk按相似度由高到低排序。

        (三)推薦產(chǎn)生

        根據(jù)目標(biāo)用戶的最近鄰居用戶對(duì)項(xiàng)目的評(píng)分信息通過相應(yīng)的數(shù)學(xué)公式計(jì)算目標(biāo)用戶對(duì)未評(píng)分項(xiàng)目的評(píng)分,取評(píng)分最高的N個(gè)項(xiàng)目進(jìn)行推薦(Top-N商品推薦)。

        根據(jù)過程2的相似性度量方法計(jì)算得到目標(biāo)用戶的最近鄰居用戶集,然后需要根據(jù)這些鄰居用戶的項(xiàng)目評(píng)分?jǐn)?shù)據(jù)通過一定的算法產(chǎn)生相應(yīng)的推薦結(jié)果。設(shè)用戶u的最近鄰居用戶集合用U表示,則用戶u對(duì)未評(píng)分項(xiàng)目i的預(yù)測(cè)評(píng)分Pui,可以通過用戶u對(duì)最近鄰居用戶對(duì)該項(xiàng)目的評(píng)分得到,計(jì)算方法如下公式。

        通過上面的計(jì)算方法預(yù)測(cè)用戶對(duì)所有未評(píng)分項(xiàng)目的評(píng)分,然后再選擇預(yù)測(cè)評(píng)分?jǐn)?shù)值最高的N個(gè)項(xiàng)目(top-N)作為推薦結(jié)果反饋給目標(biāo)用戶。

        一般情況下,電子商務(wù)網(wǎng)站的交易數(shù)據(jù)量是比較大,而且利用價(jià)值較高。當(dāng)使用交易數(shù)據(jù)作為輸入數(shù)據(jù)時(shí),基于用戶的協(xié)同過濾推薦算法就無(wú)法計(jì)算出用戶對(duì)項(xiàng)目的評(píng)分,進(jìn)而算法就不能進(jìn)行下去,為解決這個(gè)問題??梢园褑栴}簡(jiǎn)化,即只掃描目標(biāo)用戶最近鄰集合中每個(gè)用戶的購(gòu)買數(shù)據(jù),統(tǒng)計(jì)這些最近鄰用戶所購(gòu)商品的購(gòu)買次數(shù),然后將購(gòu)買次數(shù)最高且目標(biāo)用戶還未購(gòu)買過的前N項(xiàng)商品作為推薦結(jié)果,這就是最頻繁項(xiàng)推薦。

        猜你喜歡
        相似性關(guān)聯(lián)協(xié)同
        一類上三角算子矩陣的相似性與酉相似性
        蜀道難:車與路的協(xié)同進(jìn)化
        淺析當(dāng)代中西方繪畫的相似性
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        “四化”協(xié)同才有出路
        汽車觀察(2019年2期)2019-03-15 06:00:50
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        三醫(yī)聯(lián)動(dòng) 協(xié)同創(chuàng)新
        低滲透黏土中氯離子彌散作用離心模擬相似性
        協(xié)同進(jìn)化
        人妻少妇被猛烈进入中文字幕| 亚洲中文字幕在线爆乳| 亚洲欧美日韩在线精品2021| av网址在线一区二区| 成年美女黄网站色大免费视频| 中文字幕+乱码+中文字幕一区| 欧美激情二区| 国产大片在线观看三级| 丰满精品人妻一区二区| 亚洲国色天香卡2卡3卡4| 亚洲视频99| 国产一区二区三区在线观看蜜桃| 日本在线一区二区三区不卡| 欧美成人免费全部| 国内久久婷婷精品人双人| 神马不卡影院在线播放| 女人的精水喷出来视频| 午夜dj在线观看免费视频| 国产高潮流白浆免费观看不卡| 久久综合五月天啪网亚洲精品| 国内精品久久久久影院薰衣草| 深夜放纵内射少妇| 国产亚洲情侣一区二区无 | 久久久久人妻精品一区蜜桃| 亚洲AV一二三四区四色婷婷| 日本一区二区午夜视频| 久久国产成人精品av| 亚洲一本大道无码av天堂| 久久久久久一本大道无码 | 无码精品黑人一区二区三区| jiZZ国产在线女人水多| 日本黑人乱偷人妻在线播放| 无码人妻久久一区二区三区免费| 国产精品无码片在线观看| 国产成人亚洲精品一区二区三区 | 亚洲欧美一区二区三区在线| 麻豆国产乱人伦精品一区二区| 射进去av一区二区三区| 久久久久久久久毛片精品| 91尤物视频在线观看| 亚洲国产精品成人一区|