武慧娟 孫鴻飛 金永昌
摘要:[目的/意義]在社會化標注系統(tǒng)自組織運行的基礎(chǔ)上,構(gòu)建個性化信息推薦的多維度融合與優(yōu)化模型.進而在大數(shù)據(jù)環(huán)境下.為用戶提供精準的個性化信息推薦服務.從而進一步豐富個性化信息推薦的理論體系以及拓展個性化信息推薦的研究方法。[方法/過程]首先,對每一種個性化信息推薦方法的優(yōu)點和不足進行深入分析;然后,將基于圖論(社會網(wǎng)絡(luò)關(guān)系)、基于協(xié)同過濾以及基于內(nèi)容(主題)3種個性化信息推薦方法進行多維度深度融合,構(gòu)建個性化信息推薦多維度融合模型:最后,對社會化標注系統(tǒng)中個性化信息推薦多維度融合模型進行優(yōu)化,從而解決個性化推薦過程中用戶“冷啟動”、數(shù)據(jù)稀疏性和用戶偏好漂移等問題。[結(jié)果/結(jié)論1通過綜合考慮現(xiàn)有的基于圖論(社會網(wǎng)絡(luò)關(guān)系)、基于協(xié)同過濾以及基于內(nèi)容(主題)的個性化信息推薦方法各自的貢獻和不足,實現(xiàn)3種方法之間的多維度深度融合,并結(jié)合心理認知、用戶情境以及時間、空間等優(yōu)化因素,最終構(gòu)建出社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型。
關(guān)鍵詞:個性化信息推薦;社會化標注;多維度融合;優(yōu)化模型
DOl:10.3969/j.issn.1008-0821.2019.01.005
[中圖分類號]G203;G252 [文獻標識碼]A [文章編號]1008-0821(2019)01-0037-06
社會化標注系統(tǒng)是一種由它組織向自組織漸進漸變的復雜系統(tǒng),其內(nèi)部的信息組織并不是由外部力量直接安排的結(jié)果,而是在其內(nèi)部規(guī)律支配下的自身演進發(fā)展的結(jié)果。因此,在遵循社會化標注系統(tǒng)自組織運行的基礎(chǔ)上,構(gòu)建個性化信息推薦多維度融合模型,將目前現(xiàn)有的個性化信息推薦方法進行融合與優(yōu)化,從而發(fā)揮每種方法的優(yōu)點,回避它們的缺點,進而實現(xiàn)在大數(shù)據(jù)環(huán)境下,為用戶提供精準的個性化信息推薦服務。
開展社會標注系統(tǒng)中個性化信息推薦的研究具有十分重要的理論價值和應用價值,具體地主要體現(xiàn)在兩個方面:第一,從各類社會化標注系統(tǒng)的應用平臺角度出發(fā),機構(gòu)可以掌握用戶行為和用戶偏好的特點,能夠從宏觀、中觀和微觀三個層次逐層向用戶推薦個性化的信息,從而為政府部門、圖書館等信息服務機構(gòu)更好地為用戶提供個性化信息服務起到積極的理論與實踐指導意義。第二,從社會化標注系統(tǒng)的使用用戶角度出發(fā),面對海量數(shù)據(jù),用戶可以更有效地享用自己需求和偏好的信息資源以及發(fā)現(xiàn)與自己需求和偏好相同的其他用戶,從而為更有效率地使用網(wǎng)絡(luò)信息平臺起到積極的理論與實踐指導意義。
1國內(nèi)外相關(guān)研究現(xiàn)狀及研究趨勢
“社會化標注系統(tǒng)”最早引起國外學者的關(guān)注是在1999年,國內(nèi)是在2008年?!皞€性化推薦”則是在20世紀90年代提出的這一概念??偨Y(jié)國內(nèi)外關(guān)于社會化標注系統(tǒng)中個性化信息推薦方法,主要包括:基于內(nèi)容(主題)的個性化推薦、基于協(xié)同過濾的個性化推薦、基于圖論(社會網(wǎng)絡(luò)關(guān)系)的個性化推薦以及其他個性化推薦方法(包括:基于知識的個性化推薦、基于關(guān)聯(lián)規(guī)則的個性化推薦、混合推薦等)。
1.1基于內(nèi)容(主題)的個性化信息推薦
基于內(nèi)容的個性化信息推薦是指通過對用戶的歷史行為信息進行分析,提取用戶需求和偏好特征并且構(gòu)建相應的用戶需求和偏好模型,由此向用戶推薦與其需求和偏好模型相匹配的資源。該推薦方法的核心在于利用用戶需求和偏好與目標資源的相似性來過濾信息,進而實現(xiàn)個性化信息推薦?;趦?nèi)容的個性化信息推薦的不足之處在于雖然能夠較為準確地獲取用戶需求和偏好,但由于是根據(jù)用戶的歷史行為信息實現(xiàn)用戶需求和偏好的提取,而用戶的需求和偏好會隨著時間的推移發(fā)生變化和漂移,因此該推薦方法很難發(fā)現(xiàn)用戶潛在的需求和偏好以及難以實現(xiàn)所推薦資源的多樣性。
基于主題的個性化信息推薦是指從社會化標注系統(tǒng)的語義角度對信息資源進行深度挖掘,并且在此基礎(chǔ)之上再進行用戶需求和偏好和目標資源之間的相似性判斷,從而使得所推薦資源更加符合用戶的個性化需求和偏好?;谥黝}的個性化信息推薦的不足之處在于由于該推薦方法需要機器學習各種精確的數(shù)學匹配算法,以及需要機器分析語義的概念,從低維主題到高維主題進行用戶需求和偏好與目標資源之間的相似性檢索和匹配,因此為了實現(xiàn)更有效地從海量數(shù)據(jù)中進行相似性檢索和匹配,計算過程需要花費一定的時間才能夠挖掘出有價值的個性化信息。
1.2基于協(xié)同過濾的個性化信息推薦
基于協(xié)同過濾的個性化信息推薦是指根據(jù)具有相似興趣的用戶的歷史行為信息(例如以往的瀏覽記錄等)來預測目標用戶未來可能的需求和偏好,從而為之推薦相應的資源。類似地,用戶對于相似標簽的需求和偏好程度也在一定程度上反映了用戶之間的相似度??梢姡趨f(xié)同過濾的個性化信息推薦包括基于用戶的協(xié)同過濾方法和基于資源的協(xié)同過濾方法。
基于協(xié)同過濾的個性化信息推薦的不足之處在于以用戶過去的信息行為來計算相似度。因此需要大量的歷史數(shù)據(jù)才能較好地衡量相似性以及挖掘出用戶潛在的需求和偏好。同時,在海量數(shù)據(jù)的情況下計算相似度也是非常耗費時間的。此外,很多在線用戶的信息行為并不十分明顯(例如瀏覽過程中的關(guān)注和收藏行為等),甚至是“冷啟動”,從而導致初始推薦質(zhì)量較低、可擴展性較差等問題出現(xiàn),因此如何準確判斷這一類用戶的信息行為還是一個研究難題。
1.3基于圖論(社會網(wǎng)絡(luò)關(guān)系)的個性化信息推薦
由于社會化標注系統(tǒng)是一個復雜網(wǎng)絡(luò),所以許多學者利用圖論的相關(guān)理論來描述和刻畫標簽,分別使用了3部分圖、超圖和社會網(wǎng)絡(luò)分析等方法來描述社會化標注系統(tǒng)中的各種組成要素。特別是隨著社會網(wǎng)絡(luò)分析理論和方法的發(fā)展,從社會網(wǎng)絡(luò)的角度分析社會化標注系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu),對其中的資源、標簽、用戶三者各自的網(wǎng)絡(luò)結(jié)構(gòu)進行數(shù)據(jù)挖掘。
基于圖論(社會網(wǎng)絡(luò)關(guān)系)的個性化信息推薦采用向量來表示用戶—資源、資源—標簽、用戶—標簽兩兩之間的關(guān)系,尤其是從社會網(wǎng)絡(luò)分析的角度分析社會化標注系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu),分析用戶所在的群體特征,進行群體用戶行為的分析等。但是,其不足之處在于基于圖論(社會網(wǎng)絡(luò)關(guān)系)的個性化信息推薦是從宏觀的角度來劃分用戶群體,而對于每一個具體用戶行為的微觀分析略顯不足。
1.4其他個性化信息推薦
其他個性化信息推薦還包括基于知識的個性化推薦、基于關(guān)聯(lián)規(guī)則的個性化推薦以及混合推薦等等。其中,基于知識的個性化信息推薦是指利用特定領(lǐng)域的知識或規(guī)則進行推理,不是通過挖掘用戶的需求和偏好,而是通過用戶知識和資源知識實現(xiàn)個性化信息推薦;其主要缺點在于特定領(lǐng)域的知識或規(guī)則難以獲得而且屬于靜態(tài)推薦。基于關(guān)聯(lián)規(guī)則的個性化信息推薦是指利用資源之間的某種關(guān)聯(lián)規(guī)則,通過數(shù)據(jù)挖掘技術(shù)挖掘出用戶已有資源與目標資源之間的相關(guān)性,從而實現(xiàn)個性化信息推薦;其主要缺點在于存在數(shù)據(jù)稀疏性以及用戶“冷啟動”等問題。
綜上所述,每一種個性化信息推薦方法都有其優(yōu)點和不足之處,因此如何選取每種方法的優(yōu)點,進行相互融合與補充,從而規(guī)避它們的缺點,實現(xiàn)更加精準的個性化信息推薦,就成為當前個性化信息推薦領(lǐng)域亟待解決的重要問題。
2社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的研究框架
本文在利用自組織理論深度挖掘社會化標注系統(tǒng)內(nèi)部演化機理和個性化信息推薦機理的基礎(chǔ)上,多維度融合基于內(nèi)容(主題)、基于協(xié)同過濾以及基于圖論(社會網(wǎng)絡(luò)關(guān)系)3種個性化信息推薦方法的優(yōu)點,構(gòu)建社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型,以期解決社會化標注系統(tǒng)中個性化信息推薦的過程中有關(guān)用戶“冷啟動”、數(shù)據(jù)稀疏以及用戶偏好漂移等問題,最終實現(xiàn)更加精準的個性化信息推薦。
具體地說,開展社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型研究主要解決以下幾個關(guān)鍵問題:
1)在用戶沒有留下任何歷史記錄的情況下,個性化信息推薦多維度融合模型如何實現(xiàn)精準的信息推薦,即如何解決系統(tǒng)中用戶“冷啟動”問題。
2)隨著時間的推移,用戶的需求和偏好會發(fā)生漂移現(xiàn)象,個性化信息推薦多維度融合模型如何適應用戶的需求和偏好漂移現(xiàn)象,進而實現(xiàn)用戶的需求和偏好的動態(tài)跟蹤與信息推薦。
3)從現(xiàn)有的調(diào)研數(shù)據(jù)分析,目前的社會化標注系統(tǒng)中的標簽數(shù)據(jù)呈現(xiàn)出明顯的冪律分布,即大量的標簽用戶很少使用,而少量的標簽受到大量用戶的頻繁使用,同時用戶添加標簽的積極性并不高,這便產(chǎn)生了系統(tǒng)中數(shù)據(jù)的稀疏性問題。在這種情況下,個性化信息推薦多維度融合模型如何進行精準的信息推薦。
因此,本文首先提出社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的研究框架,如圖1所示。
從中可以看出,社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的研究主要包括以下3個方面的內(nèi)容:
1)基于社會化標注系統(tǒng)演化的個性化信息推薦機理分析
通過對基于社會化標注系統(tǒng)演化的個性化信息推薦機理進行研究,分析社會化標注系統(tǒng)的自組織超循環(huán)演化形式和耗散結(jié)構(gòu),從個性化用戶行為和信息發(fā)現(xiàn)兩個角度進行探討。
第一,從系統(tǒng)演化的角度,分析社會化標注系統(tǒng)的結(jié)構(gòu)特征,利用自組織理論分析社會化標注系統(tǒng)的自組織演化特性,借助超循環(huán)理論分析社會化標注系統(tǒng)以及3個集合(標簽集、資源集、用戶集)的自組織演化過程,構(gòu)建社會化標注系統(tǒng)的自組織超循環(huán)演化形式。
第二,根據(jù)耗散結(jié)構(gòu)理論,對社會化標注系統(tǒng)的耗散結(jié)構(gòu)進行多層次研究,具體分析社會化標注系統(tǒng)的內(nèi)部正熵和外部負熵之間的關(guān)系、系統(tǒng)整體熵的演化方向、系統(tǒng)的有序度和平衡態(tài),構(gòu)建社會化標注系統(tǒng)的多層級耗散結(jié)構(gòu)。
第三,利用社會化標注系統(tǒng)中蘊含的大數(shù)據(jù),從中挖掘出用戶行為數(shù)據(jù),進行深度分析,發(fā)現(xiàn)用戶行為特征,歸納用戶的個性化信息需求和偏好,揭示社會化標注系統(tǒng)中個性化信息推薦機理。
2)社會化標注系統(tǒng)中個性化信息推薦多維度融合模型的構(gòu)建
對于現(xiàn)有的基于圖論(社會網(wǎng)絡(luò)關(guān)系)、基于協(xié)同過濾和基于內(nèi)容(主題)的個性化信息推薦方法,通過深入分析這三種推薦方法各自的優(yōu)缺點,充分考慮它們的主要貢獻,規(guī)避它們的不足之處,尋找三者之間的融合點,采用適當?shù)娜诤戏椒ê腿诤瞎ぞ?,挖掘其?nèi)在的融合動因和融合機制,同時考慮社會化標注系統(tǒng)在結(jié)構(gòu)演化過程中的時間因素,結(jié)合用戶、資源、標簽為一體的向量空間因素,充分發(fā)揮基于社會網(wǎng)絡(luò)分析、內(nèi)容(主題)本體、協(xié)同過濾等方法的特點和優(yōu)點,實現(xiàn)3種方法的深度融合,最終構(gòu)建社會化標注系統(tǒng)中個性化信息推薦的多維度融合模型,使其能夠解決社會化標注系統(tǒng)中個性化信息推薦的過程中有關(guān)用戶“冷啟動”、數(shù)據(jù)稀疏和用戶偏好漂移等問題,最終實現(xiàn)更加精準的個性化信息推薦。
3)社會化標注系統(tǒng)中個性化信息推薦多維度融合模型的優(yōu)化
將社會化標注系統(tǒng)中個性化信息推薦多維度融合模型進行靜態(tài)優(yōu)化和動態(tài)優(yōu)化,從而揭示構(gòu)成個性化信息推薦多維度融合模型中各個要素之間的聯(lián)系以及動態(tài)變化。
第一,從系統(tǒng)學的角度,充分考慮所構(gòu)建的個性化信息推薦多維度融合模型的系統(tǒng)結(jié)構(gòu)是由許多要素組成的,要素是系統(tǒng)中對整體性質(zhì)和體系結(jié)構(gòu)起到主要和關(guān)鍵作用的主要元素,其中靜態(tài)優(yōu)化主要從功能要素、角色要素、組成要素3個方面對所構(gòu)建模型展開優(yōu)化。
第二,從系統(tǒng)動力學的角度,充分考慮所構(gòu)建的個性化信息推薦多維度融合模型的時間適用性、用戶偏好的漂移性,從模型的目標要求、適用條件,尤其是模型內(nèi)部各個要素的運行機制,將靜態(tài)優(yōu)化轉(zhuǎn)換成為動態(tài)優(yōu)化,從而實現(xiàn)個性化信息推薦的動態(tài)適應性。
3社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型構(gòu)建
結(jié)合前文所述社會化標注系統(tǒng)中個性化信息推薦領(lǐng)域存在的問題以及社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的研究框架及其內(nèi)容,本文提出構(gòu)建社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型。
首先,以個性化信息推薦領(lǐng)域存在的問題為導向,將基于圖論(社會網(wǎng)絡(luò)關(guān)系)、基于協(xié)同過濾和基于內(nèi)容(主題)的個性化信息推薦方法相融合,從而發(fā)揮社會網(wǎng)絡(luò)分析的宏觀作用,協(xié)同過濾算法的中觀作用以及本體語義分析的微觀作用,彼此之間相互融合,以解決個性化信息推薦過程中用戶“冷啟動”的問題。
其次,在構(gòu)建社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的過程中需要著重考慮:在時間方面,需要考慮在社會化標注系統(tǒng)自組織演化的過程中,用戶信息行為以及用戶信息需求和偏好所發(fā)生的變化;在空間方面,需要考慮用戶、資源、標簽三者在空間某一點進行統(tǒng)一的問題,即如何構(gòu)建用戶的個性化信息點。由此,使得所構(gòu)建的社會化標注系統(tǒng)中個性化信息推薦多維度融合模型,能夠解決個性化信息推薦過程中用戶偏好漂移的問題。
再次,在實現(xiàn)將3種個性化信息推薦方法深度融合的過程中,需要發(fā)現(xiàn)社會化標注系統(tǒng)在自組織演化過程中的平衡極點。社會化標注系統(tǒng)在有序度最高的時候,平衡達到極點,在此時對社會化標注系統(tǒng)進行用戶行為分析、資源相似性分析以及用戶信息需求分析,將會準確地分析出用戶的行為特征和偏好特征,準確地實現(xiàn)資源與偏好相匹配,使得個性化信息推薦的準確率更高。
最后,對個性化信息推薦多維度融合模型進行靜態(tài)優(yōu)化與動態(tài)優(yōu)化,既要體現(xiàn)出多維度融合模型的運行機制,展示其結(jié)構(gòu)特征——功能要素、角色要素、組成要素,以及各要素之間的內(nèi)部本質(zhì)聯(lián)系;又要體現(xiàn)出多維度融合的過程和個性化信息推薦的過程,遵循社會化標注系統(tǒng)自組織演化的過程,從而揭示出構(gòu)成個性化信息推薦多維度融合模型中各要素之間的動態(tài)變化。同時,結(jié)合用戶標注過程中的偏好漂移、信息推薦的目標要求、融合模型的運行機制等因素,從而解決冪律分布問題,突破用戶“冷啟動”和用戶偏好漂移的問題。
綜上所述,本文所構(gòu)建的社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型,具體如圖2所示。
從中可以看出,社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型主要包括以下幾個方面內(nèi)容:
1)通過對目標用戶的歷史行為信息進行深度挖掘,根據(jù)基于資源主題的內(nèi)容推薦方法形成資源主題模型,從中獲取用戶的歷史偏好;此外,對資源主題模型進行資源相似性分析,從中獲取用戶的當前偏好。利用基于資源主題的內(nèi)容推薦方法,結(jié)合用戶的歷史偏好和當前偏好,從而有效解決個性化信息推薦過程中用戶“冷啟動”的問題。
2)通過對目標用戶的歷史行為信息進行深度挖掘,根據(jù)基于用戶行為的協(xié)同過濾推薦方法形成用戶偏好模型,同時進行用戶相似性計算,找出相似用戶群,從中獲取用戶的潛在偏好。利用基于用戶行為的協(xié)同過濾推薦方法,結(jié)合用戶的潛在偏好,從而有效解決個性化信息推薦過程中數(shù)據(jù)稀疏的問題。
3)將目標用戶的社會網(wǎng)絡(luò)關(guān)系中的社會化行為及其所產(chǎn)生的社會關(guān)系網(wǎng)絡(luò)引入信息推薦之中,根據(jù)基于用戶關(guān)系的社會化推薦方法,對用戶群、資源群和標簽群進行深度挖掘,找出相應的用戶子群和資源子群,從中獲取用戶的潛在偏好。利用基于用戶關(guān)系的社會化推薦方法,結(jié)合用戶的潛在偏好,從而有效解決個性化信息推薦過程中數(shù)據(jù)稀疏的問題。
4)結(jié)合用戶的歷史偏好、當前偏好以及潛在偏好,基于效用知識理論進行用戶偏好的融合與優(yōu)化,在以用戶心理認知為基礎(chǔ)、用戶所處情境為條件以及信息發(fā)布時間與當前之間的差值小于某個閾值、在特定空間范圍之內(nèi)等優(yōu)化因素的作用下,形成推薦資源列表并且對目標用戶開展個性化信息推薦,從而有效解決個性化信息推薦過程中用戶偏好漂移的問題,最終實現(xiàn)更加精準的個性化信息推薦。
4結(jié)語
鑒于當前關(guān)于社會化標注系統(tǒng)中個性化信息推薦過程中所存在的主要問題:即用戶“冷啟動”問題、數(shù)據(jù)稀疏性問題以及用戶偏好漂移問題,本文深入探討了社會標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型研究的總體框架并且構(gòu)建了社會標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型。
利用本文所提出的社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型,能夠有效解決個性化信息推薦過程中所存在的問題,不僅在一定程度上豐富了個性化信息推薦的理論體系,而且也將在一定程度上拓展了個性化信息推薦的方法,從而實現(xiàn)在大數(shù)據(jù)環(huán)境下,為用戶提供更加精準的個性化信息,為信息資源的有效開發(fā)與利用提供借鑒意義。