耿小芬?
摘 要:隨著IPTV技術(shù)的迅速發(fā)展,IPTV系統(tǒng)為用戶提供的內(nèi)容也越來越豐富,用戶在龐大的互動(dòng)電視節(jié)目信息空間中,希望快速的找到自己喜歡的電視節(jié)目,因此,個(gè)性化推薦技術(shù)的研究和開發(fā)成為熱點(diǎn)。論文論述了目前推薦研究方面常見的幾種技術(shù),提出了混合推薦的優(yōu)越性,并指出該推薦是目前應(yīng)用最廣泛的技術(shù)。在論述的基礎(chǔ)上提出了用戶興趣模型創(chuàng)建的方法,為開發(fā)高效的推薦系統(tǒng)提供了理論依據(jù)。
關(guān)鍵詞:IPTV;相似度計(jì)算;個(gè)性化推薦
中圖分類號:G20 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-8122(2017)06-0122-02
一、引 言
IPTV(Internet Protocol Television)全名網(wǎng)絡(luò)協(xié)議電視,是集互聯(lián)網(wǎng)技術(shù)、多媒體技術(shù)和通訊等多種技術(shù)于一體,使用“互聯(lián)網(wǎng)機(jī)頂盒+普通電視機(jī)或計(jì)算機(jī)作為用戶終端”,為用戶提供節(jié)目直播、視頻點(diǎn)播、手機(jī)互動(dòng)、3D游戲、教育娛樂等多種交互式服務(wù)的網(wǎng)絡(luò)電視。IPTV的節(jié)目通過廣播,組播,單播等發(fā)布方式,實(shí)現(xiàn)了比傳統(tǒng)電視更人性化的服務(wù),如:互動(dòng)電視、預(yù)約節(jié)目、實(shí)時(shí)的快進(jìn)及計(jì)費(fèi)等管理方面的功能。除此之外,IPTV還能開展和互聯(lián)網(wǎng)相關(guān)的其它業(yè)務(wù),如電子郵件、電子理財(cái)和網(wǎng)絡(luò)游戲等。IPTV的發(fā)展使傳統(tǒng)的電視用戶在選擇自己喜歡的節(jié)目方面有個(gè)更大的自由空間,但是,傳統(tǒng)的電視用戶,在這些海量資源中如何快速找到自己喜歡的資源,如何快速定位到自己喜歡的節(jié)目變成了一個(gè)難題,因此設(shè)計(jì)具有個(gè)性化智能推送的系統(tǒng)也迫在眉睫。
二、個(gè)性化推薦技術(shù)研究現(xiàn)狀
個(gè)性化推薦就是建立用戶興趣模型,計(jì)算用戶對信息的感興趣程度,研究適合用戶的個(gè)性化內(nèi)容推送技術(shù),實(shí)現(xiàn)將用戶喜歡的內(nèi)容準(zhǔn)確的推送給用戶。1995年個(gè)性化服務(wù)技術(shù)的概念被正式提出,標(biāo)志性事件是在美國賓夕法尼亞州的卡內(nèi)基梅隆大學(xué),由 Robert Armstrong等人提出的一個(gè)名為Web Watcher 的系統(tǒng)。我國開始個(gè)性化服務(wù)研究的標(biāo)志性事件是路海明提出的基于多Agent混合智能個(gè)性化推薦系統(tǒng)[1]。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)民數(shù)量日益增多,《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》中指出,截至2016年12月,我國網(wǎng)民數(shù)量已達(dá)7.31億,很多領(lǐng)域的網(wǎng)民數(shù)量還出現(xiàn)了爆發(fā)式的增長,在這種態(tài)勢下個(gè)性化推薦的研究也一定是熱點(diǎn)。常見的推薦有購物類網(wǎng)站提供的商品推薦,行業(yè)類網(wǎng)站提供的信息推薦,視頻類網(wǎng)站提供的視頻推薦,門戶類網(wǎng)站提供的消息推薦等。個(gè)性化推薦帶來的便利使越來越多的用戶加入其中,也促使越來越多的學(xué)者和技術(shù)人員參與到個(gè)性化服務(wù)系統(tǒng)的研究之中。因此在IPTV發(fā)展過程中,個(gè)性化推薦技術(shù)的研究具有重要的意義。
1.基于用戶特性和資源特征的內(nèi)容推薦
基于內(nèi)容的推薦技術(shù)是信息檢索領(lǐng)域的研究內(nèi)容,該方法來源于信息獲取領(lǐng)域,該推薦方法要為每個(gè)需要推薦的資源建立該資源的屬性檔案,再為每個(gè)用戶構(gòu)建一個(gè)用戶的喜好檔案,計(jì)算用戶的喜好檔案與資源屬性檔案的相似度,相似度高說明用戶喜歡該資源,否則表示不喜歡該資源,根據(jù)喜好與否進(jìn)行推薦。該方法要在需要推薦的資源中進(jìn)行特征提取,利用加權(quán)的方法使那些顯著特征具有較高的權(quán)重,參考用戶的評價(jià)修改權(quán)重,并將資源的特征向量按比例加入到用戶特征向量中。計(jì)算推薦的依據(jù)可以利用余弦相似度的公式來計(jì)算,余弦相似度的計(jì)算方法為:
其中:US表示用戶對某資源S的喜好值,IS表示資源I中包含S的值。
基于內(nèi)容推薦只利用用戶特征和資源特征,因此適用于易于提取特征的文本內(nèi)容的推薦。該推薦根據(jù)資源的特征匹配,而且由于是基于用戶以前的興趣,并不能為用戶找到新的興趣,所以對于新用戶,沒有辦法根據(jù)以往的歷史數(shù)據(jù)發(fā)現(xiàn)興趣,因此無法得到準(zhǔn)確推薦[2]?;趦?nèi)容的推薦,如果想達(dá)到好的推薦效果只有等用戶有一定的記錄量后才有可能實(shí)現(xiàn)?;趦?nèi)容的推薦系統(tǒng)有:ifWeb、SIFTER、WebPersonalizer、ELFI和WebACE等,這些系統(tǒng)的出現(xiàn)使基于內(nèi)容的推薦研究得到了充分的實(shí)現(xiàn)。
2.基于用戶和項(xiàng)目的協(xié)同過濾推薦
協(xié)同過濾技術(shù)是目前研究比較成功也是應(yīng)用較多的一種推薦技術(shù)。協(xié)同過濾技術(shù)可分為兩類:一類是基于用戶(User-Based)的協(xié)同過濾,一類是基于項(xiàng)目(Item-Based)的協(xié)同過濾。
基于用戶的協(xié)同過濾基本原理是:基于用戶對物品的喜好找到相鄰鄰居,將相鄰鄰居喜歡的物品推薦給當(dāng)前用戶[3]。例如,在一個(gè)個(gè)性化推薦系統(tǒng)中,向用戶推薦時(shí),通過計(jì)算找到與該用戶有相似興趣的其他用戶,根據(jù)鄰居的相似度權(quán)重,以及他們對物品的偏好,為當(dāng)前用戶生成一個(gè)排序的推薦列表,這種方法為基于用戶的協(xié)同過濾算法?;谟脩舻膮f(xié)同過濾算法主要包括兩個(gè)步驟:
(1)找到和推薦用戶相似的用戶集合。
(2)在這個(gè)集合中找到用戶喜歡的,且推薦用戶沒有的物品進(jìn)行推薦。
基于項(xiàng)目的協(xié)同過濾和基于用戶的協(xié)同過濾原理相類似,不同的是在計(jì)算鄰居時(shí)不是從用戶的角度,而是從項(xiàng)目(或稱為物品)角度,即通過分析項(xiàng)目之間的相似性進(jìn)行推薦。該推薦算法采用統(tǒng)計(jì)技術(shù),找到與目標(biāo)項(xiàng)目有相似評分的鄰居項(xiàng)目,選擇預(yù)測評分高的前若干項(xiàng)推薦給目標(biāo)用戶 [4]。比如:對于物品甲,根據(jù)所有用戶的歷史記錄分析發(fā)現(xiàn)喜歡物品甲的用戶都喜歡物品乙,可以得出物品甲和物品乙有很高的相似度,所以當(dāng)向喜歡物品甲的用戶進(jìn)行推薦時(shí),可以推斷該用戶可能喜歡乙,并進(jìn)行推薦。
基于協(xié)同過濾的推薦從應(yīng)用的角度看是現(xiàn)今比較成功的推薦技術(shù)之一,很多網(wǎng)站都采用了這種方法進(jìn)行推薦,如亞馬遜、當(dāng)當(dāng)網(wǎng)等?;趦?nèi)容的推薦只分析資源文本內(nèi)容,而基于協(xié)同過濾的推薦加入了用戶對項(xiàng)目的評分,因此不僅能推薦除文本之外的其他資源,還避免了對資源內(nèi)容表達(dá)和推薦不準(zhǔn)確等問題,同時(shí)由于協(xié)同過濾算法是利用最近鄰居進(jìn)行推薦,因此有助于發(fā)現(xiàn)用戶潛在的興趣,這也是協(xié)同過濾技術(shù)應(yīng)用較多的原因。
3.基于聯(lián)合技術(shù)的混合推薦
在推薦系統(tǒng)中,為了提高推薦精度經(jīng)常把不同的推薦算法聯(lián)合起來,這種聯(lián)合技術(shù)稱為混合推薦。目前,最常用的混合推薦就是把基于內(nèi)容的推薦和協(xié)同過濾推薦聯(lián)合起來。聯(lián)合的方法主要有加權(quán)、轉(zhuǎn)換、融合、特征聯(lián)合、級聯(lián)、特征增加、分層?;旌贤扑]具有更好的準(zhǔn)確率,常見的混合推薦技術(shù)是在協(xié)同過濾的推薦系統(tǒng)中加入基于內(nèi)容的推薦算法。對于混合推薦的研究目前比較有代表性的有:Velasquez 等提出的基于知識的 Web 推薦系統(tǒng);Aciar 等實(shí)現(xiàn)的是基于知識和協(xié)同過濾的混合推薦系統(tǒng);Wang 等提出的基于虛擬研究群體的知識推薦系統(tǒng)[5]。
三種推薦技術(shù)各有特點(diǎn)也有其不足之處,其中基于內(nèi)容的推薦技術(shù)需要較高的文本分類技術(shù),而且只能實(shí)現(xiàn)相似內(nèi)容的推薦。各網(wǎng)站應(yīng)用較多的基于協(xié)同過濾技術(shù)雖然有很多優(yōu)點(diǎn),但是在剛開始使用時(shí),想通過計(jì)算找到與目標(biāo)用戶的相似用戶比較困難,可擴(kuò)展性也差?;旌贤扑]技術(shù)是將上述兩種技術(shù)進(jìn)行組合而產(chǎn)生的混合推送策略,能結(jié)合實(shí)際情況選擇恰當(dāng)?shù)幕旌喜呗?,進(jìn)而提高推送質(zhì)量。
4.其它的推薦技術(shù)
除了上述所說的三種推薦技術(shù)外,還有很多其它的推薦技術(shù)。一是通過用戶行為的關(guān)聯(lián)模式進(jìn)行推薦的基于關(guān)聯(lián)規(guī)則分析的方法。如:Agrawal 等通過對用戶與物品間關(guān)聯(lián)規(guī)則的分析提出的 Apriori 推薦算法;二是基于社會網(wǎng)絡(luò)分析的方法。如:Wand 等對在線拍賣系統(tǒng)中的拍賣者進(jìn)行推薦時(shí)就利用了社會網(wǎng)絡(luò)分析方法;三是基于上下文知識的方法。如:郭磊等提出的結(jié)合推薦對象間關(guān)聯(lián)關(guān)系進(jìn)行推薦的算法就是利用推薦對象間的關(guān)聯(lián)關(guān)系實(shí)現(xiàn)的。
三、用戶興趣模型的創(chuàng)建
要?jiǎng)?chuàng)建用戶的興趣模型,需要計(jì)算用戶的興趣度。為了計(jì)算用戶興趣度,通常要把用戶的興趣劃分為多個(gè)具體的興趣特征,先計(jì)算這些具體的興趣特征的興趣度,再用興趣特征的興趣度來計(jì)算和表示用戶的興趣度。目前,用戶興趣度大部分是采用二維向量表示的,隨著時(shí)間的變化,人的主觀認(rèn)識會發(fā)生變化,興趣會發(fā)生變化,對某件事的興趣度也會發(fā)生變化,但是用戶興趣的二維向量是不變的,因此不能動(dòng)態(tài)的反映用戶興趣和對某件事興趣度的實(shí)時(shí)變化。所以我們可以在表示用戶興趣時(shí)加上時(shí)間因素,也就是給興趣打上時(shí)間的標(biāo)簽,這樣可以更好地區(qū)分用戶興趣的變遷,重新構(gòu)建新的用戶興趣模型。
1.用戶行為數(shù)據(jù)的采集及建模
個(gè)性化用戶模型的表示通常根據(jù)項(xiàng)目實(shí)際要求來選取特定的表示方法,既要考慮模型是否反映用戶的真實(shí)信息,還要考慮系統(tǒng)本身的實(shí)際計(jì)算能力。目前,常用的表示方法有:基于矢量空間模型表示法、基于概率模型表示法(分類模型的訓(xùn)練可以采用樸素貝葉斯方式)、基于本體論的表示法、基于粗細(xì)興趣度表示法、基于用戶-項(xiàng)目矩陣表示法。計(jì)算的目的是讓系統(tǒng)自動(dòng)地分析獲取用戶感興趣的敏感詞,然后自動(dòng)進(jìn)行個(gè)性化模型創(chuàng)建。
2.用戶興趣模型的建立
要?jiǎng)?chuàng)建用戶興趣模型,首先要做的是用什么方法來表示用戶興趣模型,然后是用戶興趣模型在何時(shí)要如何更新。具體實(shí)現(xiàn)的方法是對興趣特征進(jìn)行多維度、細(xì)粒度劃分,采用數(shù)據(jù)挖掘技術(shù)、人工智能等知識建立用戶的興趣模型,之后對各粒度進(jìn)行定量分析,在興趣模型的基礎(chǔ)上加上時(shí)間因素,建立基于時(shí)間的向量興趣模型。同時(shí)在模型構(gòu)建時(shí)系統(tǒng)還會對數(shù)據(jù)進(jìn)行解釋、推理并分離出噪聲,只留下關(guān)于用戶興趣的有用知識,系統(tǒng)通過對這些有用的知識進(jìn)行格式化形成最終的用戶模型。
四、結(jié) 語
個(gè)性化推薦技術(shù)的研究可以實(shí)現(xiàn)在不需要用戶主動(dòng)提供關(guān)鍵詞的情況下,系統(tǒng)就能夠自動(dòng)建立用戶感興趣的信息庫,通過計(jì)算向用戶推薦感興趣的信息,這是傳統(tǒng)搜索引擎無法比擬的,個(gè)性化推薦技術(shù)研究既有重大的社會價(jià)值,也能帶來一定的經(jīng)濟(jì)效益,同時(shí)也能解決現(xiàn)代信息科學(xué)中的很多問題。
參考文獻(xiàn):
[1] 易偉.基于用戶行為的個(gè)性化內(nèi)容推送系統(tǒng)研究[D].華中科技大學(xué),2013.
[2] 龐秀麗,馮玉強(qiáng),姜維.電子商務(wù)個(gè)性化文檔推薦技術(shù)研究[J].中國管理科學(xué),2008(16).
[3] 肖杰.面向網(wǎng)絡(luò)電視的推薦系統(tǒng)框架及算法研究[D].華東師范大學(xué),2012.
[4] IE Shparlinski. On some weighted Average Values of L-function[J]. Bulletin of the AustralianMathematical Society.2009,79:183-186.
[5] 鄧愛林,左子葉,朱揚(yáng)男.基于項(xiàng)目聚類的協(xié)同過濾推薦算法[J].小型微型計(jì)算機(jī)系統(tǒng),2004,25(9):1665-1670.
[責(zé)任編輯:東方緒]