亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于網(wǎng)絡(luò)信息提取系統(tǒng)中用戶興趣模型建立的研究

        2013-05-30 04:52:44朱強
        關(guān)鍵詞:網(wǎng)絡(luò)信息

        朱強

        【摘 要】介紹了網(wǎng)絡(luò)信息提取系統(tǒng)中用戶興趣模型建立的方法,在詳細分析了現(xiàn)有興趣模型的基礎(chǔ)上,提出了一種由短期興趣模型和長期興趣模型組成的混合型用戶興趣模型,采用加入時間因素的二層樹狀結(jié)構(gòu)表示用戶興趣模型,使模型既具有向量空間模型表示用戶興趣類的特點,又具有類型層次結(jié)構(gòu)模型的層次性。

        【關(guān)鍵詞】網(wǎng)絡(luò)信息;混合型用戶興趣模型;二層樹狀結(jié)構(gòu)

        1.存在問題

        用戶興趣模型是個性化信息過濾系統(tǒng)實現(xiàn)個性化的關(guān)鍵。目前的個性化信息過濾系統(tǒng)都不能很好的為用戶提供個性化服務(wù)。分析其原因,用戶興趣模型主要存在以下問題:

        (1)描述用戶對半結(jié)構(gòu)化的Web數(shù)據(jù)的興趣,現(xiàn)有的方法采用一個多維向量或者一組向量來表示。實驗證明,這種表示模型不能完全描述出用戶的真正興趣所在,而且獨立的向量也給興趣的更新帶來不便。

        (2)現(xiàn)有的系統(tǒng)大多要求用戶清楚地表述他們的興趣,然而有時讓用戶準確而清楚地描述他們的信息需求是相當困難的,因為用戶往往對模糊而好奇的東西會產(chǎn)生比較濃厚的興趣。

        (3)現(xiàn)階段很多系統(tǒng)都假設(shè)用戶興趣很少改變,但這與事實情況并不相符。當用戶興趣模型與用戶的實際興趣不一致時,查準率和查全率必然低。

        2.模型建立

        為了解決現(xiàn)有用戶興趣模型不能區(qū)分短期和長期興趣的問題,本文提出了一種混合用戶興趣模型,將用戶興趣模型分為短期興趣模型和長期興趣模型,短期興趣模型中存儲用戶的近期興趣,長期興趣模型中存儲用戶的長期偏好。同時提出了基于時間向量的二層樹狀結(jié)構(gòu)來表示用戶興趣模型,節(jié)點采用加入時間因素的向量空間表示法表示,然后通過層次和劃分結(jié)合的聚類算法把用戶興趣特征項聚類成不同的主題。

        系統(tǒng)通過收集用戶瀏覽過的網(wǎng)頁,除去不感興趣的頁面,得到用戶感興趣的頁面。把用戶感興趣的頁面進行預(yù)處理后,采用樹狀向量空間表示,并進行聚類分析得到用戶的興趣度,同時收集用戶的瀏覽行為,調(diào)整用戶的興趣度,由此建立短期興趣模型。系統(tǒng)通過用戶初次使用時填寫的注冊信息建立短期興趣模型,當用戶的某一短期興趣加入時間間隔達到一定程度,則認為該興趣為用戶的長期興趣,把此興趣加入用戶的長期興趣模型中,并在短期興趣模型中刪除此興趣。用戶的興趣模型采用基于優(yōu)化時間窗興趣漂移的遺忘機制進行更新。

        3.基于時間的二層樹狀空間向量模型表示

        用戶興趣模型表示是對從網(wǎng)頁中抽取的元數(shù)據(jù)(特征值)進行量化,以結(jié)構(gòu)化的形式描述和存儲用戶興趣信息,用戶模型的表示決定了模型反映用戶真實信息的能力和可計算能力,也在一定程度上限制了建模方法和模型更新算法的選取,同時是決定算法簡繁優(yōu)劣的重要因素之一,用戶興趣模型表示是建立用戶興趣模型的重要工作。

        用戶通常對多方面的內(nèi)容感興趣,并且其興趣不斷變化。用戶的一些長期興趣很少發(fā)生變化,而短期興趣卻會經(jīng)常發(fā)生變化。這就要求用戶模型既能夠考慮到用戶的長期興趣演變,也能夠迅速捕獲短期的興趣變遷,表達用戶當前的興趣。鑒于此,本系統(tǒng)需要能區(qū)分不同時期興趣的用戶興趣模型表示方法。本系統(tǒng)要求系統(tǒng)響應(yīng)時間短,而處理的數(shù)據(jù)量大,分析現(xiàn)有的用戶模型表示方法,向量空間模型能將文本和查詢簡化為易于數(shù)學(xué)處理的特征項及權(quán)值集合的向量表示,但是向量空間模型不能區(qū)分用戶的長短期興趣,所以在向量空間模型的基礎(chǔ)上進行了擴展,在其中加入時間向量來表示用戶興趣模型。但同時只采用加入時間向量的空間向量表示法并不能區(qū)分用戶的不同興趣類別,易造成用戶興趣混亂,故此本課題參考網(wǎng)易搜索引擎的“開放式目錄(ODP)”管理方式,把用戶興趣模型表示成二層樹類結(jié)構(gòu),上層父概念類是對下層所有子類的共同屬性的概括,而下層子概念類則是從不同角度對上層父概念類加以細化,所有子節(jié)點之間形成平等的兄弟關(guān)系,這能滿足本系統(tǒng)能區(qū)分不同興趣類別的要求。

        綜上所述,本系統(tǒng)通過基于時間向量的二層樹狀結(jié)構(gòu)來表示用戶興趣模型,第一層節(jié)點表示用戶的興趣主題,一個主題可以有很多主題特征項,第二層節(jié)點表示用戶某個興趣主題下的特征項,興趣主題和特征項采用加入時間因素的向量空間模型表示,這樣的二層樹狀結(jié)構(gòu)模型既具有特征項和權(quán)值表示用戶興趣類的特點,也具有類型層次結(jié)構(gòu)模型的層次性,同時還能通過特征項主題加入時間的不同來區(qū)分短期和長期興趣。

        因此整個模型樹分為兩級節(jié)點:第一級節(jié)點代表用戶的興趣類別,用一組興趣主題詞(I1,I2,…,In)來代表用戶的n個興趣類別,每一興趣類 Ii 根據(jù)用戶興趣度的高低賦予一定的權(quán)值Wi,且記錄加入時間Si。因此用戶的興趣可以表示為((i1,w1,s1),(i2,w2,s2),…,(in,wn,sn))的加權(quán)矢量形式。第二級節(jié)點,即葉子節(jié)點,它代表用戶某一興趣類別下的特征項,以加入時間因素的向量空間表示成(T,W,S)形式。

        在向量空間模型中加入時間向量S(s1,s2,...,si,...,sn),記錄新的特征項加入的時間,表示用戶對某一特征項的興趣持續(xù)程度。這樣每個用戶興趣特征項D由一個三元組(T,W,S)構(gòu)成。其中,T為特征項,W為特征項的權(quán)重,S為特征項的時間參數(shù)。得到的每個網(wǎng)頁表示為一個規(guī)范化特征矢量P(d)={(t1,w1,s1),…(ti,wi,si),…(tn,wn,sn)}。當把一張網(wǎng)頁加入短期興趣模型時,首先通過Web網(wǎng)頁預(yù)處理表示成向量形式P(d)={(t1,w1,s1),…(ti,wi,si),…(tn,wn,sn)},其加入短期興趣模型的時間表示為S。文檔的加入時間以絕對時間表示,如從2000年1月1日零點到當前時間的秒數(shù),進行程序設(shè)計時,使用一個long型變量來表示時間參數(shù)。

        為了適應(yīng)用戶興趣的變化,把用戶興趣分為長期興趣和短期興趣,對應(yīng)的也就用兩棵興趣樹來分別表示?;跁r間的樹狀模型能夠準確地描述用戶興趣所在,根據(jù)樹狀模型的第一級節(jié)點,就可以大概地知道用戶的興趣類型,及其對每一興趣類的興趣度高低。由于用戶興趣類型是根據(jù)對用戶瀏覽的內(nèi)容頁面進行聚類分析所得,每一興趣類的主題詞采用概化的方法在相應(yīng)聚簇的特征向量中歸納得到,每一興趣類的權(quán)值通過權(quán)值計算公式計算得到,所以這樣得到的興趣模型能夠滿足興趣模型的準確性和完整性要求。樹狀模型的第二級節(jié)點是加入時間因素的向量空間模型表示的特征項,這樣就能通過加入特征項的時間判斷此特征項是長期興趣還是短期興趣,而且能通過特征項的權(quán)值判斷用戶對此特征項感興趣程度。

        4.總結(jié)

        現(xiàn)有的信息過濾系統(tǒng)存在不能有效提取用戶興趣、用戶興趣變化得不到及時反饋等問題,究其原因是沒有很好地平衡系統(tǒng)準確性、適應(yīng)性以及用戶負擔之間的矛盾。本課題擬從統(tǒng)計學(xué)習(xí)、人工智能相結(jié)合的角度研究網(wǎng)絡(luò)提取系統(tǒng)的關(guān)鍵問題,關(guān)注如何在提高系統(tǒng)的準確度和穩(wěn)定性的前提下,最終達到向用戶提供高效率的個性化檢索的目的。該系統(tǒng)的研究將促進網(wǎng)絡(luò)信息提取技術(shù)的發(fā)展,提高現(xiàn)有的信息過濾技術(shù)。

        【參考文獻】

        [1]張衛(wèi)豐,徐寶文.基于WWW緩沖的用戶實時二維興趣模型.計算機學(xué)報,2004,27(4):461~470.

        [2]邵志峰,李榮陸,胡運發(fā).基于中圖分類法的用戶興趣模型研究.計算機應(yīng)用與軟件,2007,24(8):85~86.

        [3]張瑜,袁方.基于用戶興趣的個性化信息檢索方法.山東大學(xué)學(xué)報,2006,41(3):120~125.

        猜你喜歡
        網(wǎng)絡(luò)信息
        知識經(jīng)濟體系下網(wǎng)絡(luò)銀行人才管理模式研究
        網(wǎng)絡(luò)信息環(huán)境中的財會人員發(fā)展
        淺析信息終端(手機)對學(xué)生思維的影響
        互聯(lián)網(wǎng)+時代下的網(wǎng)絡(luò)信息安全挑戰(zhàn)與思考
        論如何有效應(yīng)對網(wǎng)絡(luò)信息安全問題所帶來的威脅
        淺談高校網(wǎng)絡(luò)信息安全問題與對策
        網(wǎng)絡(luò)信息下高中生投資理財觀念培養(yǎng)
        時代金融(2016年27期)2016-11-25 18:33:25
        透視網(wǎng)絡(luò)信息對中國共產(chǎn)黨和政府的隱性攻擊分析方法研究
        網(wǎng)絡(luò)發(fā)展對大學(xué)生思政教育帶來的挑戰(zhàn)及應(yīng)對策略
        對計算機網(wǎng)絡(luò)信息和網(wǎng)絡(luò)安全及其防護策略的探討
        无套内谢孕妇毛片免费看看| 久久精品国产亚洲av麻豆长发 | 午夜秒播久久精品麻豆| 亚洲中文字幕日产无码| 中文精品久久久久人妻不卡| 国产性生交xxxxx免费| 小sao货水好多真紧h视频| 亚洲男人av香蕉爽爽爽爽| 亚洲伊人久久大香线蕉影院| 国产综合久久久久| 福利视频一二三在线观看| 国产免费破外女真实出血视频| 天天躁日日躁狠狠躁一区| 无码高清视频在线播放十区| 厕所极品偷拍一区二区三区视频 | 免费国产一级片内射老| 欧美片欧美日韩国产综合片| 视频一区二区不中文字幕| 蜜桃在线视频一区二区| 日韩一区二区av极品| 亚洲国产av自拍一区| 亚洲人成未满十八禁网站| 亚洲成成品网站源码中国有限公司| 国产欧美一区二区成人影院| 一区二区三区熟妇人妻18| 国产精品久久婷婷六月丁香| 99久久免费看精品国产一| 放荡的美妇在线播放| 丰满多毛的大隂户毛茸茸| 欧美成人片一区二区三区 | 成人亚洲欧美久久久久| 日本一区二区久久精品亚洲中文无| 亚洲人妻御姐中文字幕| 日本一本一道久久香蕉男人的天堂| 国产成人精品无码片区在线观看| 亚洲国产日韩精品一区二区三区| 中国老妇女毛茸茸bbwbabes| 亚洲av高清在线观看三区| 久久夜色精品国产亚洲av老牛| av免费网站免费久久网| 色中文字幕在线观看视频|