亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進的雙極Slope One算法的農(nóng)業(yè)信息推薦模型研究

        2014-04-29 00:00:00張啟宇宋瑤陳英義封文杰
        安徽農(nóng)業(yè)科學(xué) 2014年29期

        摘要 為了在海量信息中為用戶提供有價值的信息,個性化在線推薦系統(tǒng)是農(nóng)業(yè)信息化綜合服務(wù)平臺的重要組成部分。Slope One算法因簡單高效被許多在線推薦系統(tǒng)使用。對Slope One算法進行研究,并結(jié)合農(nóng)業(yè)信息化綜合服務(wù)平臺的特點,提出了農(nóng)業(yè)信息推薦模型。該模型按資源類別把用戶評分矩陣劃分為評分子矩陣,在此基礎(chǔ)上采用杰卡德統(tǒng)一算子距離相似度算法建立用戶類別近鄰用戶,采用改進的雙極Slope One算法和Item user average算法相結(jié)合的方式對未訪問資源進行評分預(yù)測,有效降低計算量,并提高了評分預(yù)測精度,既適合稠密數(shù)據(jù)集,又適合稀疏數(shù)據(jù)集。

        關(guān)鍵詞 杰卡德統(tǒng)一算子距離相似度算法;雙極Slope one算法;Item user average算法;農(nóng)業(yè)信息;個性化推薦

        中圖分類號S126文獻(xiàn)標(biāo)識碼A文章編號0517-6611(2014)29-10394-03

        基金項目山東省自主創(chuàng)新專項(2012CX90204)。

        作者簡介張啟宇(1977- ),男,山東榮成人,講師,碩士,從事計算機科學(xué)與技術(shù)研究。*通訊作者,從事農(nóng)業(yè)信息化研究。

        農(nóng)業(yè)信息化綜合服務(wù)平臺利用現(xiàn)代信息網(wǎng)絡(luò)技術(shù),為農(nóng)村、農(nóng)民、中小型企業(yè)及更多用戶提供海量的農(nóng)業(yè)相關(guān)信息,農(nóng)業(yè)新聞、科技動態(tài)、市場信息等等為用戶提供便捷的信息通道。但面對眾多信息,如何給用戶準(zhǔn)確提供所需信息是要解決的一個重要問題。個性化在線推薦系統(tǒng)是眾多網(wǎng)站的選擇。協(xié)同過濾技術(shù)是應(yīng)用最為廣泛的個性化推薦技術(shù),是推薦系統(tǒng)的一個重要組成部分。協(xié)同過濾通過參考與活動用戶具有相似興趣和需求的其他用戶的選擇來決定如何為該用戶進行信息過濾[1]。Slope One算法是基于評分的協(xié)同過濾算法[2],被許多在線推薦系統(tǒng)使用,如Hitflip DVD推薦系統(tǒng)、inDiscover MP3推薦系統(tǒng)、Value Investing News股票新聞網(wǎng)站、AllTheBests購物推薦引擎等[3]。

        Slope One算法族[2]包括Slope One算法、加權(quán)Slope One算法和雙極Slope One算法,是基于項目的評分預(yù)測算法,采用線性模型進行評分預(yù)測,簡單易實現(xiàn)、高效、準(zhǔn)確度高、支持在線查詢和動態(tài)更新。Slope One算法族主要有3個方面的缺陷[4-5]:沒有考慮用戶之間的相似性;沒有考慮項目之間的相似性;在數(shù)據(jù)稀疏的情況下,推薦效果不如傳統(tǒng)協(xié)同過濾算法好。為了解決上述問題,一些學(xué)者提出了改良辦法。如王小亮把K均值聚類算法和加權(quán)Slope One算法相結(jié)合[6],李文剛把基于用戶協(xié)同過濾算法和加權(quán)Slope One算法相結(jié)合[7],孫麗梅等提出了一種動態(tài)K近鄰和Slope One相結(jié)合的算法[3],這3種方法都是對用戶尋找鄰居用戶群,再利用近鄰用戶的評分?jǐn)?shù)據(jù)生成項目之間的平均偏差,進行評分預(yù)測。楊晶提出了基于用戶興趣模型的 Slope one算法,利用用戶興趣模型計算目標(biāo)的相似用戶群,以縮小預(yù)測目標(biāo)項目評分時的數(shù)據(jù)搜索范圍,提出改進的基于用戶相似度的項目評分平均差值公式,提高相似用戶在評分平均差值計算中的貢獻(xiàn)[8]。王毅等提出一種基于項目語義相似度的改進Slope One算法,但WordNet語義相似度只適合英文[9]。宋晗為Slope One算法引入了一種相似度權(quán)重[10]。林德軍提出了基于用戶興趣局部相似性的Slope One算法、基于Kmeans項目聚類的Slope One算法以及基于奇異值分解的Slope One算法[4]。董麗等對5種協(xié)作過濾算法Userbased(近鄰數(shù)為20)、Itembased、Item average、Item user average和Slope One進行測試,結(jié)果Item user average算法無論在稠密還是稀疏數(shù)據(jù)集上都有良好的表現(xiàn)[5]。

        為建設(shè)農(nóng)業(yè)信息化綜合服務(wù)平臺,推進農(nóng)村社會服務(wù)信息化,筆者按資源類別把用戶評分矩陣劃分為評分子矩陣,采用杰卡德統(tǒng)一算子距離相似度算法建立用戶類別近鄰用戶,采用改進的雙極Slope One 算法和Item user average算法相結(jié)合的方式建立個性化農(nóng)業(yè)信息推薦模型,能夠有效解決Slope One算法族3個主要缺陷。

        1Slope One算法族

        1.1Slope One算法Lemire等于2005年提出的Slope One算法族[2]是對項目評分進行預(yù)測的算法,該算法不會計算用戶或項目之間的相似度。依據(jù)Slope One算法,對如表1所示的用戶評分表中用戶B項目2進行評分預(yù)測。預(yù)測結(jié)果為:2+(1.5-1)/1=2.5。即Slope One算法的原理是基于線性回歸進行預(yù)測,預(yù)測器采用f(x)=x+b的形式,b為常數(shù),表示用戶對兩個項目評分的平均偏差。

        1.2加權(quán)Slope One算法在推薦系統(tǒng)中,用戶的評分項目數(shù)一般大于2,為了均衡每個項目對目標(biāo)項目的影響,產(chǎn)生了加權(quán)Slope One算法。如通過用戶A對項目J和K的評分預(yù)測用戶A對項目L的評分,其中2 000用戶對項目J和L評分、20用戶對項目K和L評分、用戶A對項目L的評分采用用戶A對項目J的評分比項目K的評分進行預(yù)測更好一些。因此Daniel Lemire等提出加權(quán)Slope One預(yù)測評分公式:

        1.3雙極Slope One算法雙極Slope One算法考慮用戶對項目的喜好,將用戶u的評分分為兩組:S1(u)={i∈S(u)|ui>}(喜歡)和S2(u)={i∈S(u)|ui<}(不喜歡)。對項目i和j,評分集合T分為兩組:S1ji={u∈T|i,j∈S1(u)}(喜歡)和S2ji={u∈T|i,j∈S2(u)}(不喜歡)。用戶喜歡和不喜歡的項目評分分別計算喜歡偏差dev1ji和不喜歡偏差dev2ji,再加權(quán)平均進行預(yù)測:

        2改進的雙極Slope One協(xié)同過濾算法

        改進的雙極Slope One協(xié)同過濾算法主要有4個步驟:評分表示、鄰居形成、評分預(yù)測和推薦生成。其流程圖如圖1所示。

        2.1評分表示用戶評分?jǐn)?shù)據(jù)可以用1個m×n階矩陣R表示,其中m行代表m個用戶,n列代表n個項目,第i行第j列的元素Rij代表用戶i對項目j的評分。評分方式一般有2種:①用0和1來表示用戶的偏好(喜歡/不喜歡)、購買狀態(tài)(已購買/未購買)或訪問狀態(tài)(訪問/未訪問);②用數(shù)字分級表示用戶對項目的喜好值,如MovieLens中用戶對電影的評分以從 0~5的整數(shù)來表示用戶的喜好,0表示沒有評分,數(shù)值越大表示用戶偏愛程度越大[11]。

        第1種評分方式比較簡單,不能表現(xiàn)出用戶的興趣。而讓用戶對資源進行顯式評分,不一定能夠得到真實的評分,因此在農(nóng)業(yè)信息化綜合服務(wù)平中,用戶對資源的評價采用隱式方式。該研究中,借鑒網(wǎng)絡(luò)上流行的點贊和分享的功能進行用戶對資源的打分。在每一個資源的頁面,參照點贊的形式,設(shè)置喜歡和不喜歡的點擊功能,參照分享的形式,設(shè)置分享到百度貼吧、QQ空間、豆瓣網(wǎng)、新浪微博、騰訊微博、網(wǎng)易微博和人人網(wǎng)等7個目前國內(nèi)比較常用的信息平臺。通過對用戶行為的監(jiān)測,來統(tǒng)計用戶對資源的評分。具體的評分規(guī)則為:①若用戶只訪問資源,+1;②若用戶點喜歡,訪問+1,喜歡+1,每分享一個+1;③若用戶點不喜歡,訪問-1,不喜歡-1,每分享一個-1;④若用戶直接分享,訪問+1,每分享一個+1;⑤沒有訪問的資源,評分為1。

        2.2鄰居形成度量用戶之間相似性的方法[12-13]有余弦相似性、相關(guān)相似性、修正余弦相似性、修正相關(guān)相似性等。孫慧峰提出了杰卡德統(tǒng)一算子距離相似度算法(Jaccard Uniform Operator Distance Similarity Measurement,簡記為JacUOD)進行相似度計算,并與上述4種方法進行對比驗證,表明JacUOD效果最好[13]。采用JacUOD對兩個用戶u、v進行相似度計算公式為:

        計算用戶相似度的目的是求出近鄰用戶集,通過近鄰用戶集對未訪問項目進行評分預(yù)測,提高預(yù)測精度。在農(nóng)業(yè)信息化綜合服務(wù)平臺中包含很多類別的頁面(項目),若是把全部項目用于計算用戶相似度,得到的近鄰用戶集不一定準(zhǔn)確。因為用戶一般有多種興趣愛好,不同的用戶之間在一種興趣上相似而在另外一種興趣上可能相異,若共同計算相似度,必然導(dǎo)致計算結(jié)果不準(zhǔn)確。利用項目類別把用戶評分矩陣劃分為m個子矩陣(m為類別個數(shù)),對每一個子矩陣?yán)霉剑?)進行相似度的計算,這樣得到的近鄰用戶集更準(zhǔn)確。

        為了獲取近鄰用戶集,設(shè)定一個閾值c。滿足simt(u,v)≥c的用戶v加入到用戶u的近鄰用戶集中。

        2.3評分預(yù)測用戶之間是否有共同評分項將評分預(yù)測方法分為2種。當(dāng)用戶之間有共同評分項時,可利用改進的雙極Slope One算法預(yù)測評分,重點利用JacUOD進行相似度計算,求鄰近用戶集,利用雙極Slope One算法計算獲得用戶評分;當(dāng)用戶之間沒有共同評分項時,利用Item user average算法求資源用戶平均值,獲得預(yù)測評分,流程圖如圖2所示。

        雙極Slope One算法要求用戶之間有共同評分項才能進行預(yù)測。若預(yù)測用戶u對項目i的評分,而項目i對應(yīng)的類別評分子矩陣計算的近鄰用戶集中沒有用戶和用戶u有共同評分項,那么無法進行評分預(yù)測。此時需要尋找其他的方法進行預(yù)測。因此選擇Item user average算法在雙極Slope One算法不能預(yù)測評分情況下進行預(yù)測評分。

        Item user average算法[5]即資源用戶平均值算法,預(yù)測用戶ui對資源tj的評分時,綜合考慮所有用戶對資源tj的評分均值rj(t),用戶ui對所有資源的評分均值ri(u),以及所有用戶對所有資源的評分均值,即:

        對用戶未訪問過即評分為1的項目進行評分預(yù)測,采用改進的雙極Slope One算法預(yù)測其評分;若改進的雙極Slope One算法不能預(yù)測,采用Item user average算法預(yù)測其評分。

        2.4推薦生成對用戶的每一個未訪問項目進行評分預(yù)測,取預(yù)測分值最高的N項作為用戶的推薦項。

        3結(jié)語

        該研究根據(jù)農(nóng)業(yè)信息化綜合服務(wù)平臺的特點,按資源類別把用戶評分矩陣劃分為評分子矩陣,在此基礎(chǔ)上采用杰卡德統(tǒng)一算子距離相似度算法建立用戶類別近鄰用戶,采用改進的雙極Slope One算法和Item user average算法相結(jié)合的方式對未訪問資源進行評分預(yù)測。該方法可降低計算量,并提高評分預(yù)測精度,既適合稠密數(shù)據(jù)集,又適合稀疏數(shù)據(jù)集。

        參考文獻(xiàn)

        [1] 孫小華.協(xié)同過濾系統(tǒng)的稀疏性與冷啟動問題研究[D].杭州:浙江大學(xué),2005.

        [2] LEMIRE D,MACLACHLAN A.Slope One predictors for online ratingbased collaborative ffiltering[C]//Proceedings of SIAM Data Mining Conference.Newport Beach,California,2005:471-475.

        [3] 孫麗梅,李晶皎,孫煥良.基于動態(tài)k近鄰的Slope One協(xié)同過濾推薦算法[J].清華大學(xué)學(xué)報:自然科學(xué)版,2011,5(9):857-864.

        [4] 林德軍.基于Slope One改進算法推薦模型的設(shè)計與實現(xiàn)[D].北京:北京郵電大學(xué),2012.

        [5] 董麗,邢春曉,王克宏.基于不同數(shù)據(jù)集的協(xié)作過濾算法評測[J].清華大學(xué)學(xué)報:自然科學(xué)版,2009,49(4):590-594.

        [6] 王小亮.基于協(xié)同過濾的個性化推薦算法 的優(yōu)化和應(yīng)用[D].杭州:浙江工商大學(xué),2010.

        [7] 李文剛.奢侈品電子商務(wù)推薦的協(xié)同過濾算法研究與應(yīng)用[D].上海:復(fù)旦大學(xué),2012.

        [8] 楊晶.用戶興趣模型及實時個性化推薦算法研究[D].南京:南京郵電大學(xué),2013.

        [9] 王毅,樓恒越.一種改進的Slope One協(xié)同過濾算法[J].計算機科學(xué),2011,38(S1):192-194.

        [10] 宋晗.基于加權(quán)偏差表的Slope One改進算法研究[D].昆明:云南大學(xué),2013.

        [11] 楊芳,潘一飛,李杰,等.一種改進的協(xié)同過濾推薦算法[J].河北工業(yè)大學(xué)學(xué)報,2010,39(3):82-87.

        [12] 王輝,高利軍,王聽忠.個性化服務(wù)中基于用戶聚類的協(xié)同過濾推薦[J].計算機應(yīng)用,2007,27(5):1225-1227.

        48沈阳熟女高潮嗷嗷叫| 久久99精品久久只有精品| 精品人妻av区乱码色片| 米奇7777狠狠狠狠视频影院| 国产欧美日韩在线观看| 成年女人片免费视频播放A| 在线观看国产一区二区av| 成在线人av免费无码高潮喷水| 97午夜理论片在线影院| 亚欧乱色束缚一区二区三区| 久久亚洲精品一区二区三区| 国产免费久久精品99久久| 国产高清乱理伦片| 国产精品亚洲综合色区韩国| 国产一区三区二区视频在线观看 | 中文字幕人妻丝袜成熟乱| 青青草97国产精品免费观看| 呦泬泬精品导航| 午夜桃色视频在线观看| 中文字幕精品一区二区精品| 亚洲欧美国产双大乳头| 无码流畅无码福利午夜| 邻居人妻的肉欲满足中文字幕| 久久9精品区-无套内射无码| 一级片久久| 中文字幕色婷婷在线视频| 国产大屁股喷水视频在线观看| 在线观看午夜亚洲一区| 欧洲国产成人精品91铁牛tv| 深夜黄色刺激影片在线免费观看| 色婷婷综合久久久中文字幕| 欧美性猛交xxxx乱大交蜜桃| 国产亚洲精品成人av在线| 91久久精品国产综合另类专区| 成人欧美一区二区三区的电影| 青青草综合在线观看视频| 一区二区三区四区黄色av网站 | 久久久中日ab精品综合| 亚洲综合一区二区三区四区五区| 国产精品成人黄色大片| 中文区中文字幕免费看|