亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于知識(shí)樹的推薦算法及其在移動(dòng)電子商務(wù)上的應(yīng)用

        2011-03-11 09:02:48楊翊平
        電信科學(xué) 2011年6期
        關(guān)鍵詞:評(píng)測(cè)類別文檔

        趙 華,林 政,方 艾,楊翊平

        (1.中國(guó)電信股份有限公司廣東研究院 廣州 510630;2.海量信息技術(shù)有限公司 北京 100190)

        一種基于知識(shí)樹的推薦算法及其在移動(dòng)電子商務(wù)上的應(yīng)用

        趙 華1,林 政2,方 艾1,楊翊平1

        (1.中國(guó)電信股份有限公司廣東研究院 廣州 510630;2.海量信息技術(shù)有限公司 北京 100190)

        本文提出了一種有別于傳統(tǒng)方法的、新穎的基于知識(shí)樹的文檔推薦算法,首先利用互聯(lián)網(wǎng)資源構(gòu)建基于詞的知識(shí)樹,然后運(yùn)用EM算法不斷用待分類的新文檔自動(dòng)更新知識(shí)樹,使得詞分類和文檔分類結(jié)果同時(shí)達(dá)到最優(yōu),該算法不依賴于標(biāo)注好的訓(xùn)練語(yǔ)料,是一種半監(jiān)督的機(jī)器學(xué)習(xí)算法。在實(shí)際應(yīng)用中,根據(jù)用戶在移動(dòng)互聯(lián)網(wǎng)的互動(dòng)行為,映射到知識(shí)樹的相關(guān)分類,將同類的商品推薦給用戶。在移動(dòng)電子商務(wù)網(wǎng)絡(luò)社區(qū)項(xiàng)目中,實(shí)驗(yàn)表明了該算法具有較高的執(zhí)行效率,推薦結(jié)果的用戶滿意度約為83%。

        移動(dòng)電子商務(wù);個(gè)性化推薦;知識(shí)樹;EM算法

        1 引言

        近年來(lái),隨著3G網(wǎng)絡(luò)的建設(shè),移動(dòng)互聯(lián)網(wǎng)和移動(dòng)電子商務(wù)得到飛速發(fā)展。據(jù)易觀國(guó)際發(fā)布的分析報(bào)告顯示,2010年中國(guó)移動(dòng)互聯(lián)網(wǎng)用戶達(dá)2.88億人,環(huán)比2009年增速達(dá)40.5%,預(yù)計(jì)2012年中國(guó)移動(dòng)互聯(lián)網(wǎng)用戶數(shù)將超過(guò)互聯(lián)網(wǎng)用戶數(shù)[1]。而移動(dòng)電子商務(wù)也得到了極速發(fā)展。據(jù)中國(guó)電子商務(wù)研究中心發(fā)布的 《2010年中國(guó)電子商務(wù)市場(chǎng)數(shù)據(jù)監(jiān)測(cè)報(bào)告》顯示,截至2010年12月,中國(guó)移動(dòng)電子商務(wù)實(shí)物交易規(guī)模(實(shí)物交易規(guī)模包括家電、日用品、服飾等實(shí)體商品的交易總額)達(dá)到26億元人民幣,同比增長(zhǎng)370%[2]。

        因此,電子商務(wù)、微博、轉(zhuǎn)帖、視頻等主流互聯(lián)網(wǎng)模式將占據(jù)大量資源和市場(chǎng),如何利用數(shù)據(jù)挖掘技術(shù)從大量的網(wǎng)絡(luò)信息中挖掘出對(duì)人們最有用、最關(guān)注的資源,已經(jīng)成為研究的熱點(diǎn)問(wèn)題。在這種背景下,個(gè)性化推薦系統(tǒng)[3](personalized recommender systems)應(yīng)運(yùn)而生。

        個(gè)性化推薦是根據(jù)用戶的特征,比如興趣愛好,推薦滿足用戶要求的資源并可以實(shí)時(shí)更新推薦。個(gè)性化推薦系統(tǒng)為客戶提供智能化、個(gè)性化的服務(wù),它能夠向客戶推薦產(chǎn)品或提供信息,來(lái)引導(dǎo)客戶有針對(duì)性地對(duì)網(wǎng)上商品或其他信息進(jìn)行關(guān)注,使互聯(lián)網(wǎng)從過(guò)去的“人找信息”發(fā)展到“信息找人”的智能階段。

        2 研究現(xiàn)狀與解決思路

        目前存在有許多個(gè)性化推薦系統(tǒng),它們提出了各種思路以實(shí)現(xiàn)個(gè)性化推薦服務(wù)。個(gè)性化推薦系統(tǒng)根據(jù)其所采用的推薦技術(shù)可以分為3種。

        (1)基于規(guī)則的系統(tǒng)

        根據(jù)用戶的靜態(tài)特征來(lái)制定規(guī)則,規(guī)則決定了在不同的情況下如何提供不同的服務(wù),例如IBM的WebSphere(www.ibm.com/websphere)和BroadVision(www.broadvision.com),其優(yōu)點(diǎn)是簡(jiǎn)單直接,缺點(diǎn)是規(guī)則不具有普適性,隨著規(guī)則數(shù)量的增多,系統(tǒng)將變得越來(lái)越難以管理。

        (2)基于內(nèi)容的過(guò)濾系統(tǒng)

        利用資源與用戶興趣的相似性來(lái)過(guò)濾信息,如Web Personalizer[4],其優(yōu)點(diǎn)是簡(jiǎn)單有效,缺點(diǎn)是難以辨別資源內(nèi)容的質(zhì)量,而且只能發(fā)現(xiàn)和用戶已有興趣相似的資源,不能為用戶發(fā)現(xiàn)新的感興趣的資源。

        (3)協(xié)同過(guò)濾推薦系統(tǒng)

        利用客戶的個(gè)人信息、歷史、喜好計(jì)算用戶之間的距離,目標(biāo)客戶對(duì)特定頁(yè)面或商品的喜好程度由最近鄰居對(duì)商品的評(píng)價(jià)的加權(quán)平均值來(lái)計(jì)算,如Let’s Browse[5],一個(gè)比較成熟的系統(tǒng)?;趨f(xié)同過(guò)濾系統(tǒng)的優(yōu)點(diǎn)是能為用戶發(fā)現(xiàn)新的感興趣的信息,缺點(diǎn)是存在兩個(gè)很難解決的問(wèn)題,一個(gè)是系統(tǒng)具有資源依賴性,另一個(gè)是隨著系統(tǒng)用戶和資源的增多,系統(tǒng)的性能會(huì)越來(lái)越低。

        與上述各方法不同,文本提出了一種全新的解決思路——基于知識(shí)樹的Web文檔推薦算法。這種算法可以克服以上方法的不足,既不依賴于人工制定的規(guī)則,也不依賴于大量的有類別標(biāo)記的語(yǔ)料資源,而且隨著時(shí)間的累積,系統(tǒng)性能還會(huì)逐漸提高并最終趨于穩(wěn)定。該算法是一種半監(jiān)督的機(jī)器學(xué)習(xí)算法:首先利用Web資源構(gòu)建一棵基于詞的知識(shí)樹,然后運(yùn)用EM迭代的思想不斷用待分類的新文檔自動(dòng)更新知識(shí)樹,使得詞分類和文檔分類結(jié)果同時(shí)達(dá)到最優(yōu)。

        3 知識(shí)樹的初始化

        百度百科(http://baike.baidu.com)是全球最大的中文百科全書之一,已收錄超過(guò)300萬(wàn)個(gè)詞條。本文以百度百科收錄的詞條為基礎(chǔ),通過(guò)挖掘詞與詞之間的層級(jí)關(guān)系,建立起一棵基于標(biāo)簽的知識(shí)樹。標(biāo)簽[6](Tag)又稱“自由分類”、“分眾分類”或“開放分類”,是用戶根據(jù)自己對(duì)事物的理解所添加的描述詞。因此,標(biāo)簽可以很好地描述用戶的喜好、興趣,可以借助標(biāo)簽來(lái)提供個(gè)性化推薦服務(wù)。

        對(duì)于知識(shí)樹,首先給出如下幾個(gè)定義:

        ·知識(shí)樹的非葉子節(jié)點(diǎn),在系統(tǒng)中被命名為標(biāo)簽詞,它是一個(gè)有限集合,完全依賴用戶的定義或者所使用的原型知識(shí)樹的非葉子節(jié)點(diǎn);

        ·知識(shí)樹的葉子節(jié)點(diǎn)是由文本提取的錨點(diǎn)詞集合逐步添加的;

        ·定義虛擬節(jié)點(diǎn)“萬(wàn)象”為0級(jí),往下級(jí)別累加;

        ·任意一節(jié)點(diǎn)(非根節(jié)點(diǎn))所指語(yǔ)義都可以被其上層節(jié)點(diǎn)所代表的路徑的語(yǔ)義解釋,則認(rèn)為該節(jié)點(diǎn)可以加入知識(shí)樹;

        ·允許某節(jié)點(diǎn)與其父節(jié)點(diǎn)有相同的詞形,不同層級(jí)含義不同。

        通過(guò)對(duì)百度百科詞條的關(guān)鍵詞提取以及對(duì)詞條與標(biāo)簽的層級(jí)關(guān)系的挖掘,可以構(gòu)建一棵知識(shí)樹,如圖1所示。

        圖1 知識(shí)樹示例

        在圖1的示例中,這棵初始化的知識(shí)樹有4層,總計(jì)30萬(wàn)個(gè)節(jié)點(diǎn)。樹中的父子關(guān)系可以很好地描述詞的類別歸屬,如“奧運(yùn)會(huì)”屬于“體育”類別。

        4 知識(shí)樹的更新

        基于知識(shí)樹的個(gè)性化推薦系統(tǒng)的實(shí)質(zhì)是不斷從待推薦(分類)的文本中學(xué)習(xí)新的知識(shí)以更新知識(shí)樹,并通過(guò)調(diào)用新的知識(shí)樹,使單文本的標(biāo)注(分類)更加準(zhǔn)確,從而提高個(gè)性化推薦服務(wù)的質(zhì)量。

        知識(shí)樹更新、優(yōu)化的過(guò)程借鑒了期望最大化(expectationmaximization,EM)算法[7]的思想,是一個(gè)迭代的半監(jiān)督學(xué)習(xí)的過(guò)程。EM算法可以從非完整數(shù)據(jù)集中對(duì)參數(shù)進(jìn)行最大似然估計(jì),主要包括以下兩個(gè)步驟。

        ·E步驟:估計(jì)期望值(estimate the expected value)。

        ·M步驟:最大化期望參數(shù)(re-estimate parameter)。

        知識(shí)樹的更新過(guò)程迭代使用E、M步驟,直至收斂。在本系統(tǒng)中E步驟是對(duì)一個(gè)新文本進(jìn)行類別標(biāo)注的過(guò)程,M步驟是參照標(biāo)注的文本重新對(duì)關(guān)鍵詞進(jìn)行類別標(biāo)注的過(guò)程。對(duì)有待分類的新文本首先根據(jù)現(xiàn)有知識(shí)樹進(jìn)行類別標(biāo)注,然后利用該文本提供的信息更新知識(shí)樹,使得對(duì)新本文的標(biāo)注更準(zhǔn)確。

        這里,E步驟實(shí)際上是對(duì)文本進(jìn)行類別標(biāo)注,M步驟是從標(biāo)注文本中獲得關(guān)鍵詞的類別信息以更新知識(shí)樹。因此,本文提出了文本以及詞的類別標(biāo)注算法,如下面所述。

        4.1 文本的類別標(biāo)注

        文本的類別標(biāo)注主要通過(guò)對(duì)現(xiàn)有知識(shí)樹的查找和分析來(lái)進(jìn)行未標(biāo)注文本的標(biāo)簽標(biāo)注,在介紹具體算法之前先引入3個(gè)概念。

        (1)路徑穩(wěn)定性

        路徑穩(wěn)定性描述了樹中一條自上至下的路徑的穩(wěn)定程度,計(jì)算方式見式(1):

        其中,a1為葉子節(jié)點(diǎn)即關(guān)鍵詞所在節(jié)點(diǎn),aj為標(biāo)簽詞所在節(jié)點(diǎn),j為路徑長(zhǎng)路。

        (2)樹的穩(wěn)定性樹的穩(wěn)定性

        描述了整棵樹的穩(wěn)定程度,它表達(dá)為穩(wěn)定路徑占所有路徑的比例,計(jì)算方式見式(2):

        (3)內(nèi)容關(guān)鍵詞

        本文采用信息檢索中經(jīng)典的tf·idf的計(jì)算方法來(lái)獲取內(nèi)容關(guān)鍵詞。該方法賦予文檔D中項(xiàng)i的權(quán)重wi為:

        其中,tfi為特征項(xiàng)在文檔中出現(xiàn)的頻率(term frequency,TF),idfi為倒文檔率(inverse document frequency,IDF),N 為訓(xùn)練集合中總的文檔數(shù),dfi為含有項(xiàng)i的文檔數(shù)。tf·idf的計(jì)算方法是很直觀的:如果某個(gè)詞或短語(yǔ)在一篇文章中出現(xiàn)的頻率越高,并且在其他文章中很少出現(xiàn),則認(rèn)為此詞或者短語(yǔ)具有很好的類別區(qū)分能力,適合用來(lái)分類。

        計(jì)算過(guò)程如下:通過(guò)內(nèi)容關(guān)鍵詞不斷加入路徑構(gòu)造樹,針對(duì)所有非葉子節(jié)點(diǎn)構(gòu)成的路徑,逐漸刪除不穩(wěn)定路徑,直到整棵樹穩(wěn)定下來(lái),具體分兩個(gè)步驟進(jìn)行。

        (1)初始化知識(shí)樹

        ①使用文本內(nèi)容關(guān)鍵詞,獲取所有路徑,nMaxMulty為所有詞形中對(duì)應(yīng)節(jié)點(diǎn)最多的那個(gè)詞形所對(duì)應(yīng)的節(jié)點(diǎn)數(shù)(路徑數(shù)),nCurMulty為當(dāng)前詞形對(duì)應(yīng)的節(jié)點(diǎn)數(shù) (路徑數(shù)),每個(gè)路徑的權(quán)重為:

        ②形成整棵樹,計(jì)算樹中每個(gè)節(jié)點(diǎn)的權(quán)重,計(jì)算方法如下:

        其中,nSubCnt為樹的總結(jié)點(diǎn)數(shù)。

        (2)對(duì)樹進(jìn)行迭代剪枝

        ①計(jì)算所有非葉節(jié)點(diǎn)的路徑權(quán)重(只包括葉節(jié)點(diǎn)的上一級(jí)節(jié)點(diǎn)),計(jì)算當(dāng)前樹的穩(wěn)定度。

        ②如果穩(wěn)定度達(dá)到1,則迭代結(jié)束。

        ③如果穩(wěn)定度小于1,則刪除當(dāng)前權(quán)重最低的路徑,返回 i。

        4.2 詞的類別標(biāo)注

        在對(duì)文本進(jìn)行了類別標(biāo)注之后,接下來(lái)是用這篇文本所提供的知識(shí)優(yōu)化知識(shí)樹。

        首先,對(duì)標(biāo)注后的文本進(jìn)行特征提取。單文本特征提取主要是針對(duì)單一的非結(jié)構(gòu)化文本提取有效的特征向量,特征向量由關(guān)鍵詞集組成。

        其次,對(duì)已有的多文本進(jìn)行詞關(guān)系提取以及聚類。多文本詞關(guān)系的提取是在多文本間對(duì)詞進(jìn)行同現(xiàn)統(tǒng)計(jì),本文采用卡方檢驗(yàn)方法獲得詞與詞之間的相關(guān)系數(shù)。聚類采用基于圖論的聚類方法,該方法原理如下。

        基礎(chǔ)假設(shè):網(wǎng)絡(luò)中兩個(gè)頂點(diǎn)間有K個(gè)以上的通路,且通路路徑長(zhǎng)度≤2,且合并后在派系中任何兩個(gè)頂點(diǎn)間的距離不大于L(L==5表示6度空間,即無(wú)限制,任何兩個(gè)可聚類點(diǎn)都可以作為派系成員),則稱該兩點(diǎn)可以合并在一個(gè)派系 C中。在派系 C 中,如果集合 c’屬于 C,v1,v2,v3…vn(隸屬于c’)中任意一個(gè)節(jié)點(diǎn)連接的鄰節(jié)點(diǎn)數(shù)為n-1個(gè),則稱該集合為C內(nèi)的全連通集合。

        在實(shí)際應(yīng)用中,可以定義C為一個(gè)派系,c’為派系C內(nèi)的一個(gè)全連通集合。

        該關(guān)系拆解后的聚類結(jié)果是:在派系參數(shù)定為K=3時(shí),考察該圖的派系可以劃分為:AD;DMLNOP;FXY;FHIKJ;GTSQ,如圖 2 所示。

        5 實(shí)驗(yàn)結(jié)果與分析

        在前面介紹的文本以及詞類別標(biāo)注方法的基礎(chǔ)上展開實(shí)驗(yàn)。包括利用未標(biāo)注文本更新知識(shí)樹以及根據(jù)用戶興趣結(jié)合知識(shí)樹查詢的結(jié)果向用戶推薦相關(guān)文檔,并進(jìn)行用戶滿意度評(píng)測(cè)。

        5.1 知識(shí)樹更新實(shí)驗(yàn)

        圖2 聚類示例

        如前面所述,初始的知識(shí)樹包含約30萬(wàn)個(gè)節(jié)點(diǎn)。通過(guò)對(duì)從新浪新聞采集到的包含財(cái)經(jīng)、科技、體育、娛樂(lè)、汽車、生活等6個(gè)頻道的約4000篇未標(biāo)注新聞文本用§4.1介紹的方法運(yùn)營(yíng),知識(shí)樹已經(jīng)增加到了80萬(wàn)個(gè)節(jié)點(diǎn),極大地豐富了原有的百度百科的知識(shí)。以經(jīng)濟(jì)類展開為例,如圖3所示。

        圖3 知識(shí)樹擴(kuò)展

        從圖3可見,原有的知識(shí)樹中僅有“經(jīng)濟(jì)學(xué)家”、“經(jīng)濟(jì)學(xué)派”、“西方經(jīng)濟(jì)學(xué)”這3個(gè)詞條,經(jīng)過(guò)運(yùn)營(yíng),又增加了“房地產(chǎn)泡沫”、“格林斯潘”、“經(jīng)濟(jì)學(xué)”、“美國(guó)經(jīng)濟(jì)”、“美聯(lián)儲(chǔ)”這些詞條,豐富了知識(shí)。除此以外,這些詞條還極其具有時(shí)效性,能反映最近一段時(shí)間發(fā)生的熱點(diǎn)新聞。

        5.2 個(gè)性化推薦滿意度評(píng)測(cè)

        在個(gè)性化推薦滿意度評(píng)測(cè)中,筆者通過(guò)“問(wèn)卷”的形式人工進(jìn)行評(píng)測(cè)。讓用戶選擇喜歡的類別,系統(tǒng)默認(rèn)給用戶提供初始化關(guān)鍵詞。抽樣選取130個(gè)目標(biāo)客戶,每日給用戶提供一定數(shù)量的推薦數(shù)據(jù)(不超過(guò)50條),讓用戶進(jìn)行閱讀并給本次推薦選擇滿意度。將滿意度分為5個(gè)刻度:1:符合;2:較符合;3:一般;4:不太符合;5:完全不符合。評(píng)測(cè)周期為期3周(21天),每天評(píng)測(cè)一次。

        考慮評(píng)測(cè)對(duì)用戶的友好性、真實(shí)性,不能強(qiáng)迫用戶閱讀完每日推薦的所有文章,所以將評(píng)測(cè)指標(biāo)分為兩類:閱讀的文章是否符合用戶興趣;推薦的文章是否符合用戶興趣。

        對(duì)于這兩類指標(biāo),分別對(duì)用戶每個(gè)時(shí)段的反饋進(jìn)行統(tǒng)計(jì)。兩類指標(biāo)(指占統(tǒng)計(jì)結(jié)果的比例)隨時(shí)間變化的統(tǒng)計(jì)結(jié)果見表1和表2。

        表1 閱讀的文章是否符合用戶興趣數(shù)據(jù)統(tǒng)計(jì)

        表2 推薦的文章是否符合用戶興趣數(shù)據(jù)統(tǒng)計(jì)

        縱向比較隨著時(shí)間的遷移用戶滿意度評(píng)測(cè)的結(jié)果,表 1和表2中可以看出,“符合”和“較符合”兩個(gè)指標(biāo)的滿意度在評(píng)測(cè)初期較低,隨著評(píng)測(cè)的開展?jié)M意度逐漸提高,而不滿意度則逐漸降低。在評(píng)測(cè)初期因?yàn)橛脩糸喿x量小,用戶的興趣(profile)的預(yù)測(cè)還沒(méi)有完全形成,待用戶的閱讀量增加后,興趣慢慢預(yù)測(cè)成型,所以推薦效果會(huì)提升。

        如果將“符合”和“較符合”都視為滿意的情況,那么可以得到用戶滿意度(“符合”、“較符合”占統(tǒng)計(jì)結(jié)果的比例)隨時(shí)間變化的柱狀圖,閱讀的文章每日滿意度以及推薦的文章每日滿意度分別如圖4和圖5所示。

        評(píng)測(cè)結(jié)果基本符合預(yù)期,推薦滿意度最初增長(zhǎng)得比較快,最后趨于平穩(wěn)。推薦結(jié)果的用戶滿意度約為83%。

        圖4 閱讀的文章每日滿意度

        圖5 推薦的文章每日滿意度

        6 總結(jié)與展望

        本文提出了一種全新的基于知識(shí)樹的個(gè)性化文檔推薦算法,該算法已成功應(yīng)用于實(shí)際工程項(xiàng)目中。本文的主要貢獻(xiàn)和創(chuàng)新之處體現(xiàn)在以下幾方面:

        ·提出了一種新穎的個(gè)性化推薦解決方案并應(yīng)用于實(shí)踐;

        ·提出了一種半監(jiān)督學(xué)習(xí)算法,既不依賴于規(guī)則也不依賴于標(biāo)注好的語(yǔ)料;

        ·提出了知識(shí)樹的結(jié)構(gòu)用于組織資源。

        在今后的工作中,希望能將以下兩個(gè)方面做得更細(xì)致:

        ·解決知識(shí)樹添加父子關(guān)系難的問(wèn)題,因?yàn)橹R(shí)樹的更新主要擴(kuò)展的是兄弟關(guān)系;

        ·進(jìn)一步提高知識(shí)樹的檢索效率和穩(wěn)定性,并在大規(guī)模用戶中進(jìn)行推廣。

        1 易觀智庫(kù).2010年第4季度移動(dòng)互聯(lián)網(wǎng)用戶達(dá)2.88億 全年?duì)I收637億元.http://www.analysys.com.cn/cache/1338/97059.html,2011-2-12/2011-5-18

        2 中國(guó)電子商務(wù)研究中心.2010年度中國(guó)電子商務(wù)市場(chǎng)數(shù)據(jù)監(jiān)測(cè)報(bào)告.http://b2b.toocle.com/zt/upload_data/down/2010dsjc.doc,2011-1-18/2011-5-18

        3 Yoon H C,Jae K K,Soung H K.A personalized recommender system based on web usage mining and decision tree induction.Expert Systems with Applications,2002,23(3):329~342

        4 Bamshad Mobasher, Robert Cooley, Jaideep Srivastava.Automatic personalization based on Web usage mining.Communications of the ACM,2000,43(8):142~151

        5 Lieberman H,DykeN V,VivacquaA.Let’sbrowse:a collaborative web browsing agent. In: the International Conference on Intelligent User Interfaces,Los Angeles,CA:ACM Press,1999

        6 Robert J schke,Leandro Marinho,et al.Tag Recommendations in Folksonomies.Lecture Notes in Computer Science,2007(4702):506~514

        7 Borman S.The expectation maximization algorithm:a short tutorial.University of Notre Dame,Tech Rep,July 2004

        8 金鐸,徐雄,梁冰,李云.號(hào)百電子商務(wù)平臺(tái)架構(gòu)建設(shè)探討.電信科學(xué),2010,26(8)

        9 楊震,陳曉勤.電信企業(yè)開展個(gè)性化信息服務(wù)的研究.電信科學(xué),2009,25(10)

        Knowledge Tree Based Recommendation Algorithm With Its Applications to Mobile e-Commerce

        Zhao Hua1,Lin Zhen2,Fang Ai1,Yang Xuping1
        (1.Guangdong Research Institute of China Telecom Co.,Ltd.,Guangzhou 510630,China;2.Hylanda Information Technology Co.,Ltd.,Beijing 100190,China)

        This paper presents a novel knowledge tree based recommendation algorithm,which is different from traditional approaches.At first we construct a word based knowledge tree using resources from the Internet,and then we employ EM algorithm to the tree.We automatically update the knowledge tree using unlabeled documents,making classification of both the terms and document optimized at the same time.Since the algorithm does not rely on any human annotations,it is an un-supervised machine learning algorithm.In real applications,user interactions in the mobile Internet are mapped to certain categories of the knowledge tree,and similar products are recommended to users according categories in the tree.Experiments in the mobile e-commerce network community project indicate the high efficiency of our algorithm,and the performance of user satisfaction achieves about 83%.

        mobile e-commerce,personalized recommendation,knowledge tree,EM algorithm

        2011-05-12)

        猜你喜歡
        評(píng)測(cè)類別文檔
        有人一聲不吭向你扔了個(gè)文檔
        次時(shí)代主機(jī)微軟XSX全方位評(píng)測(cè)(下)
        次時(shí)代主機(jī)微軟XSX全方位評(píng)測(cè)(上)
        攻坡新利器,TOKEN VENTOUS評(píng)測(cè)
        Canyon Ultimate CF SLX 8.0 DI2評(píng)測(cè)
        基于RI碼計(jì)算的Word復(fù)制文檔鑒別
        服務(wù)類別
        Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
        論類別股東會(huì)
        商事法論集(2014年1期)2014-06-27 01:20:42
        中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
        国产视频网站一区二区三区| 亚洲色欲久久久综合网| 成av人大片免费看的网站| 免费在线国产不卡视频| 国语对白在线观看免费| 青青草免费手机视频在线观看| 91中文人妻熟女乱又乱| 亚洲 日韩 激情 无码 中出 | 东北妇女xx做爰视频| 男受被做哭激烈娇喘gv视频 | 精品无码久久久久久久动漫| 综合激情网站| 亚洲国产精品久久久久婷婷软件| 国产精品一区二区三区色| 亚洲国产一区中文字幕| 国产亚洲一本二本三道| 神马影院午夜dy888| 少妇人妻综合久久中文字幕| 人妻有码中文字幕| 亚洲旡码a∨一区二区三区| 亚洲中文字幕第一页在线| 国产男女做爰猛烈视频网站| 久久久人妻丰满熟妇av蜜臀| 国内自拍色第一页第二页| 中国娇小与黑人巨大交| 骚片av蜜桃精品一区| аⅴ天堂国产最新版在线中文| 国产啪精品视频网站免| 日本岛国一区二区三区| 亚洲中文字幕乱码在线观看| 蜜桃视频在线观看网址| 一区二区三区无码高清视频| 亚洲av永久无码天堂网小说区 | 国产全肉乱妇杂乱视频| 精品一区二区三区在线观看l| 色噜噜亚洲精品中文字幕| 久久亚洲av无码精品色午夜| 精品无码一区在线观看| 国产思思99re99在线观看| 91国产自拍视频在线| 中国少妇久久一区二区三区|