亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于內(nèi)容的個性化新聞推薦

        2013-12-17 00:38:28蒲國林楊勇智
        四川文理學(xué)院學(xué)報 2013年5期
        關(guān)鍵詞:特征用戶模型

        蒲國林,王 剛,向 偉,楊勇智

        (1.四川文理學(xué)院 計算機學(xué)院,達(dá)州 635000;2.安康學(xué)院 科技處,安康 725000)

        0 引言

        信息量的暴漲,產(chǎn)品數(shù)量和種類的快速增長,使個性化推薦系統(tǒng)成為研究熱點.Mizzaro認(rèn)為,個性化服務(wù)是收集并存儲用戶的使用信息,分析這些信息得到用戶的特定興趣和需求,然后在合適的時間向每一位訪問者發(fā)送正確的信息.早期的推薦系統(tǒng)主要有:由Xerox Palo Alto研究中心開發(fā)的推薦系統(tǒng) Typestry;[1]1995年 3月,卡耐基.梅隆大學(xué)的Robert Armstrong等人提出的個性化導(dǎo)航系統(tǒng)Web Watcher;斯坦福大學(xué)的Marko Balabanovic等人推出的個性化推薦系統(tǒng)LIRA;1995年8月,麻省理工學(xué)院的Henry Lieberman提出的個性化導(dǎo)航智能體Litizia.近期的成功應(yīng)用主要有:Overstock運行個性化橫幅廣告取得了驚人的成果,“廣告的點擊率是以前的兩倍,伴隨而來的銷售增長也高達(dá)20%至30%”;國內(nèi)首個個性化推薦系統(tǒng)科研團(tuán)隊北京百分點信息科技有限公司專注于個性化推薦、推薦引擎技術(shù)與解決方案,[2]每天為數(shù)以千萬計的消費者提供實時智能的商品推薦.

        新聞推薦是推薦系統(tǒng)的一個重要應(yīng)用,其推薦算法有三類:協(xié)同過濾的推薦方法、基于內(nèi)容的推薦方法和混合推薦方法.協(xié)同過濾是從海量用戶中挖掘出興趣偏好相同或相近的用戶,并以“如果用戶A和用戶B具有相近的興趣偏好,那么用戶A感興趣的信息用戶B也感興趣”為假設(shè)前提,如 Let’s Browse.[3]基于內(nèi)容的推薦是將與用戶過去感興趣的新聞相似度高的新聞推薦給用戶,它以“如果用戶A過去對某類信息感興趣,那么用戶A現(xiàn)在甚至將來也對該類信息感興趣”為假設(shè)前提,如 Web Personalizer.[4]興趣具有指向性、持久性等品質(zhì).興趣的指向性,即對什么發(fā)生興趣;興趣的持久性,即興趣的穩(wěn)定程度.基于內(nèi)容的推薦符合興趣相對穩(wěn)定的特征,協(xié)同過濾的推薦又能發(fā)現(xiàn)或挖掘出用戶新的興趣指向,混合推薦則是將兩種方法綜合起來.

        1 系統(tǒng)架構(gòu)與關(guān)鍵技術(shù)

        如圖1所示,基于內(nèi)容的個性化新聞推薦系統(tǒng)可以分為三層:語義處理層、興趣模型層和用戶交互層.在語義處理層主要通過語義處理完成新聞分類;在興趣模型層主要實現(xiàn)興趣模型的建立與更新,以及興趣的發(fā)現(xiàn)與新聞推薦;在用戶交互層記錄用戶的相關(guān)行為信息,為用戶興趣模型的更新提供依據(jù).

        圖1 系統(tǒng)核心架構(gòu)圖

        在該系統(tǒng)架構(gòu)中,進(jìn)行個性化新聞推薦前的技術(shù)處理有:

        1)新聞獲取.網(wǎng)頁的獲取是通過Java的I/O操作完成.利用開源的目前公認(rèn)最好的html解析和分析工具Htmlparser,實現(xiàn)網(wǎng)絡(luò)爬蟲,獲取新聞資源.

        2)中文分詞.目前中文分詞方法主要有:使用詞典匹配分詞和詞頻統(tǒng)計分詞.本系統(tǒng)利用中科院的ICTCLAS完成中文分詞和頻數(shù)統(tǒng)計.ICTCLAS具有分詞、自定義用戶詞典、關(guān)鍵詞提取和指紋提取等功能.在關(guān)鍵詞提取中,還統(tǒng)計出了各關(guān)鍵詞的頻數(shù)權(quán)重.在系統(tǒng)中,考慮到標(biāo)題、關(guān)鍵詞和正文中的特征項具有不同的重要程度,還可以設(shè)置其對象權(quán)重 Wt、Wk和 Wb,如:Wt=1,Wk=0.9,Wb=0.5.

        3)文檔分類

        用特征項的頻數(shù)權(quán)重與其所屬對象權(quán)重之積來描述該特征項的權(quán)重,并將權(quán)重大于某一閾值的前n個關(guān)鍵詞作為該文檔的特征項,以此建立新聞文檔的特征模型.新聞文檔模型采用向量空間模型表示,[5]如式(1)所示:

        其中,NDMi表示第 i個新聞文檔的特征模型,Tj表示該新聞文檔的第j個特征項,Wj表示此特征項Tj在該文檔中的權(quán)重.在該模型中,閾值取得越大,特征項越少,計算越簡單,分類也越粗糙;閾值越小,特征項越多,計算越復(fù)雜,分類越精準(zhǔn).特征項取多少合適,這與個體的興趣取向的維度有關(guān)系.

        本系統(tǒng)在上述新聞文檔特征模型的基礎(chǔ)上,采用式(2)改進(jìn)的互信息法進(jìn)行新聞分類:

        其中P(Tk,Ci)代表特征項 Tk在Ci中出現(xiàn)的概率,P(Tk)表示特征項Tk在所有類別中出現(xiàn)的概率,P(Ci)表示Ci類在所有類別中的概率.對該新聞與所有類進(jìn)行互信息計算,與某類的互信息越多,則該新聞屬于該類的概率越大.

        4)用戶興趣模型

        用戶興趣模型表示用戶對信息的穩(wěn)定需求,能夠反應(yīng)用戶在一段時間內(nèi)對新聞的主要傾向.用戶興趣模型在個性化推薦系統(tǒng)中起到核心作用,真實地表現(xiàn)了用戶的偏好,在很大程度上決定個性化推薦的效果.用戶興趣模型有一個動態(tài)更新的過程,更新依據(jù)主要是用戶行為信息.良好的用戶興趣模型有利于個性化推薦,本文設(shè)計的用戶興趣模型具有指向性和持久性.用戶興趣模型亦用向量空間模型表示,在結(jié)構(gòu)上與新聞文檔模型一致,如式(3):

        其中,UIMi表示用戶Ui的用戶興趣模型,Cj表示用戶感興趣的類別,Wj表示該用戶對該類別感興趣的程度,即權(quán)重.如:{(軍事,0.2),(經(jīng)濟,0.1),(食品安全,0.2),……}.

        在文獻(xiàn)中,研究了用戶興趣模型的建立、更新、降維和興趣度的歸一化處理等問題,在此不再細(xì)述.[6]

        2 系統(tǒng)主要功能實現(xiàn)

        2.1 建立動態(tài)的用戶興趣模型

        考慮到用戶評價的惰性和被動性,在該系統(tǒng)中,設(shè)置一個“我感興趣”按鈕.如果用戶點擊“我感興趣”按鈕,則可直接判斷用戶對該類新聞感興趣;如果用戶未點擊該按鈕,則根據(jù)用戶在頁面的停留時間來判斷.一個人的正常閱讀速度是在每分鐘100字到300字左右.如果用戶的停留時間遠(yuǎn)遠(yuǎn)小于正常閱讀的時間,說明用戶對該類新聞不感興趣;如果用戶的停留時間遠(yuǎn)遠(yuǎn)大于正常閱讀的時間,同樣說明用戶對該類新聞不感興趣,因為用戶已離開電腦或者是在做其他操作.有用戶行為反饋的基礎(chǔ)上,動態(tài)更新用戶興趣模型.

        建立用戶興趣模型的AJAX代碼如圖2所示:

        圖2 建立用戶興趣模型

        動態(tài)更新用戶興趣模型的AJAX代碼如圖3所示:

        圖3 更新用戶興趣模型

        2.2 基于內(nèi)容的個性化新聞推薦

        系統(tǒng)根據(jù)用戶的注冊信息建立用戶的初始化興趣模型.并依據(jù)該模型進(jìn)行新聞推薦,同時根據(jù)用戶的行為對用戶興趣模型動態(tài)更新.這樣用戶可以不用花時間從大量的新聞中去尋找自己感興趣的新聞.

        用戶興趣模型和新聞文檔模型都是基于向量空間的表示方法,利用向量空間模型的相似度計算得到與用戶興趣模型匹配的新聞文檔集,并完成新聞推薦.關(guān)鍵代碼見圖4:

        3 系統(tǒng)測試

        推薦系統(tǒng)向用戶推薦新聞,可以向同一用戶推薦多條新聞,也可以向多個用戶推薦同一新聞.不同的用戶收到新聞后,會表現(xiàn)出不同的興趣度,其具體表現(xiàn)在用戶的不同的眼神和面部肌肉表情中.對于系統(tǒng)向用戶推薦的新聞,假設(shè)共得到n人次的用戶體驗,且第i人次用戶體驗的興趣度為Ii(已進(jìn)行了歸一化處理),則定義推薦系統(tǒng)的推薦效率即命中率h為:

        該式表明,系統(tǒng)推薦命中率的計算總是從第一條信息開始的.初期的較低的推薦命中率對后期的推薦命中率有較大的影響.總的說來,推薦系統(tǒng)的命中率高,則推薦效率高,用戶體驗好.對于商品廣告信息則可以增加廣告點擊率,提高銷售業(yè)績.

        圖5 命中率測試

        在三種情況下對該系統(tǒng)進(jìn)行了推薦命中率測試.I類,對用戶進(jìn)行隨機的新聞推薦;II類,對沒有興趣愛好等相關(guān)注冊信息的用戶進(jìn)行的個性化新聞推薦;III類,對提交了興趣愛好等注冊信息的用戶進(jìn)行的個性化新聞推薦.以各推薦100條新聞進(jìn)行測試,得到的推薦命中率變化曲線如圖5所示:

        由圖可知:

        I類的命中率(虛線)在0.5上下波動;

        在初期,III類的命中率(粗實線)明顯高于II類的命中率(細(xì)實線);

        在經(jīng)過一定數(shù)量的新聞推薦過后,II類和III類都經(jīng)過了多次用戶興趣模型更新,推薦命中率明顯提高,并逐漸接近同一個常數(shù).

        4 總結(jié)

        個性化推薦系統(tǒng)在商業(yè)領(lǐng)域有著很好的應(yīng)用前景.好的推薦系統(tǒng),既能做到“有的放矢”的推薦,還能讓用戶有良好的體驗.在新聞推薦系統(tǒng)中,用戶興趣模型的建立和更新是根本,推薦算法是關(guān)鍵.在實際應(yīng)用中,考慮到用戶興趣愛好的多元性,多渠道的綜合推薦算法更有利于發(fā)現(xiàn)用戶的新的興趣點,從而創(chuàng)造新的商機.

        [1]Goldberg D,Nichols D,Oki B,et al.Using Collaborative Filtering to Weave an Information Tapestry[J].Communications of t he ACM,1992(12):61270

        [2]柏林森,蘇 萌.百分點個性化推薦引擎[EB/OL].http://baike.baidu.com/view/4362864.htm,2013102119.

        [3]Lieberman H,Dyke N V,Vivacqua A.Let's Browse:Acollaborative Web Browsing Agent[J].International Conference on Intelligent User Interfaces,Los Angeles:ACM Press,1999:318.

        [4]Bamshad Mobasher,Robert Cooley,Jaideep Srivastava.Automatic Personalization Based on Web Usage Mining[J].Communications of the ACM,2000(8):142-151.

        [5]Salton G,McGill M J.Introduction to Modern Information Retrieval[J].NewYork:McGraw Hill,1983:147.

        [6]蒲國林,楊清平,王 剛,等.基于語義的個性化用戶興趣模型[J].計算機科學(xué),2008(7):181-184.

        猜你喜歡
        特征用戶模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        如何表達(dá)“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        3D打印中的模型分割與打包
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        成人免费无遮挡在线播放| 日本久久一级二级三级| 日本中文字幕有码在线播放| 91九色老熟女免费资源| 国产精品对白刺激久久久| 亚洲熟妇无码久久精品疯| 少妇人妻出水中文字幕乱码| 偷拍一区二区三区四区 | 性欧美老人牲交xxxxx视频| 麻豆成人在线视频| 日韩精品一区二区三区四区五区六 | 18禁裸体动漫美女无遮挡网站| 欧美成人午夜精品久久久| 亚洲精品国产一二三无码AV| 日韩av中文字幕少妇精品| 精品久久av一区二区| 手机看片福利一区二区三区| 亚洲精品中国国产嫩草影院美女| 亚洲一区二区三区资源| 久久成人成狠狠爱综合网| www国产无套内射com| 亚洲熟妇大图综合色区| 国产成人av区一区二区三| 一本一道vs无码中文字幕| 国产小受呻吟gv视频在线观看| 亚洲男人在线无码视频| 亚洲国产综合精品中久| 中文字幕乱码一区av久久不卡| 伊人99re| 国产精品久久婷婷六月| 国产成人精品免费久久久久 | 国产美女久久久亚洲综合| 精品少妇一区二区三区免费 | 熟妇人妻中文av无码| 国产精品人成在线观看| 天堂蜜桃视频在线观看| 亚洲熟妇av日韩熟妇在线 | 青青草免费视频一区二区| 午夜三级a三级三点在线观看| 天堂在线www中文| 亚洲一区二区观看网站|