亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        社會(huì)媒體多模態(tài)、多層次資源推薦技術(shù)研究

        2014-11-26 01:50:44王大玲馮時(shí)張一飛于戈
        智能系統(tǒng)學(xué)報(bào) 2014年3期
        關(guān)鍵詞:模態(tài)資源內(nèi)容

        王大玲,馮時(shí),張一飛,于戈

        (東北大學(xué)信息科學(xué)與工程學(xué)院,遼寧沈陽(yáng)110819;2.東北大學(xué)醫(yī)學(xué)影像計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室,遼寧沈陽(yáng)110819)

        “推薦”是系統(tǒng)為用戶提供的一種主動(dòng)的信息推送方式,它不同于搜索那樣具有直接而明確的用戶需求,因此涉及用戶興趣分析與推斷、推薦信息資源選擇2個(gè)主要部分。在用戶興趣推斷方面,傳統(tǒng)的推薦技術(shù)分為“基于內(nèi)容的推薦”、“基于協(xié)同過(guò)濾的推薦”及其混合技術(shù)[1]。近年來(lái),Web 2.0技術(shù)的發(fā)展促進(jìn)了社會(huì)媒體(social media)這一新技術(shù)的誕生和迅速發(fā)展。與傳統(tǒng)的媒體相比,社會(huì)媒體中用戶角色的變化、用戶關(guān)系的形成、特別是信息資源形式的豐富,均對(duì)推薦系統(tǒng)提出了新的要求。基于社會(huì)媒體的推薦中,無(wú)論用戶興趣的推斷、還是推薦信息資源的選擇,均被賦予了新的內(nèi)容。本文將首先分析社會(huì)媒體中的用戶與資源的關(guān)系,以及由此引出的社會(huì)媒體資源推薦的特點(diǎn),綜述當(dāng)前該領(lǐng)域研究的相關(guān)工作并進(jìn)行討論。在此基礎(chǔ)上,從多模態(tài)、多層次資源推薦方面提出進(jìn)一步的研究方向。

        1 社會(huì)媒體用戶、資源及推薦的特點(diǎn)

        1.1 社會(huì)媒體中的用戶與資源

        社會(huì)媒體作為一類(lèi)新的在線交互平臺(tái),允許用戶自發(fā)地撰寫(xiě)、傳播和獲取信息,具有廣泛的用戶參與性。本文中,將“資源”定義為用戶在社會(huì)媒體中發(fā)布的原始信息單元及其組合或劃分。與傳統(tǒng)媒體相比,社會(huì)媒體中的“用戶”和“資源”呈現(xiàn)出許多新的特點(diǎn)。

        首先,從社會(huì)媒體用戶的角度,呈現(xiàn)以下特點(diǎn):

        1)用戶角色雙重性。

        社會(huì)媒體中信息的傳播是“眾對(duì)眾”方式,用戶不僅是信息的接收者,也是信息的發(fā)布者,發(fā)布時(shí)不僅提供信息,而且在社交網(wǎng)站上建立詳細(xì)的個(gè)人檔案并分享這些信息[2]。

        2)社會(huì)網(wǎng)絡(luò)社群性。

        社會(huì)媒體的用戶(包括信息的發(fā)布者和接收者)在社會(huì)媒體中通過(guò)信息交流可以表達(dá)關(guān)注同一事件或人、具有相同觀點(diǎn)以及結(jié)為好友等,這些關(guān)系構(gòu)成各種網(wǎng)絡(luò)社群。

        3)信息網(wǎng)絡(luò)異構(gòu)性。

        將用戶與資源作為對(duì)象并相互鏈接起來(lái),即構(gòu)成信息網(wǎng)絡(luò)[3]。在此情況下,社會(huì)媒體中的信息網(wǎng)絡(luò)節(jié)點(diǎn)是異構(gòu)的,表現(xiàn)為用戶與信息是不同類(lèi)型的對(duì)象,而且不同媒體形式的信息內(nèi)容也是異構(gòu)的。

        4)用戶關(guān)系多元性。

        前面1)中所述的用戶角色雙重性表現(xiàn)為信息網(wǎng)絡(luò)中的顯式鏈接即為“用戶節(jié)點(diǎn)→資源節(jié)點(diǎn)”、或者相反。此外,除顯式鏈接外,還存在更多的隱式鏈接關(guān)系,如信息之間的相關(guān)性鏈接以及由此而導(dǎo)致的用戶之間的相關(guān)性鏈接等,構(gòu)成了多元化的用戶關(guān)系。

        第二,從社會(huì)媒體資源的角度,呈現(xiàn)以下特點(diǎn):

        1)信息的多模態(tài)性。

        在相關(guān)研究中,“模態(tài)”表現(xiàn)為不同的媒體形式(如文本、圖像、視頻等)[4],又可表現(xiàn)為同一媒體形式的不同特征(如圖像的顏色、紋理等特征)[5]。在本文中,從推薦的角度,網(wǎng)絡(luò)社群作為一種資源,其本身也是一種模態(tài)。

        2)資源的多層次性。

        由于社會(huì)媒體允許用戶自發(fā)地傳播和獲取信息,因此導(dǎo)致了社會(huì)媒體資源的多層次性。例如,在新浪博客中,用戶A撰寫(xiě)了一篇關(guān)于三亞旅游的圖文并茂的博文,用戶B轉(zhuǎn)發(fā)了其中的部分文字并加上了評(píng)論,用戶C又配發(fā)一些照片,…,這些博文、評(píng)論、圖片等信息構(gòu)成了同一資源的多個(gè)層次。同時(shí),社會(huì)媒體信息之間由于背景、事件、位置、人物等實(shí)體的聯(lián)系,同樣會(huì)構(gòu)成資源的不同層次。

        1.2 社會(huì)媒體推薦的特點(diǎn)

        如前所述,推薦系統(tǒng)涉及用戶興趣的分析和推薦資源的選擇2個(gè)主要部分。由于社會(huì)媒體中用戶和資源新的特點(diǎn),因而對(duì)基于社會(huì)媒體的推薦系統(tǒng)提出了新的要求,從而導(dǎo)致了社會(huì)媒體推薦呈現(xiàn)出新的特點(diǎn):

        1)多模態(tài)的用戶興趣內(nèi)容分析。

        在分析用戶興趣方面,傳統(tǒng)的推薦技術(shù)之一是“基于內(nèi)容的推薦”。即:對(duì)于一個(gè)用戶,推薦系統(tǒng)根據(jù)該用戶自己對(duì)資源的訪問(wèn)歷史推斷其興趣。在社會(huì)媒體推薦中,“基于內(nèi)容的推薦”同樣適用,但卻賦予了新的要求。首先,用戶對(duì)資源的訪問(wèn)歷史記錄中,其內(nèi)容可能包括不同的媒體形式;其次,對(duì)于某一種媒體形式(特別是非文本形式),用戶可能也會(huì)關(guān)注不同的方面。例如,對(duì)于用戶訪問(wèn)歷史中的一幅“裙子”的圖片,用戶興趣可能是裙子的顏色、質(zhì)地、圖案、款式等不同方面,而非這條裙子本身。用戶訪問(wèn)歷史內(nèi)容中不同的媒體形式和同一媒體形式的不同特征,構(gòu)成了多模態(tài)的用戶興趣。

        2)基于社會(huì)關(guān)系的協(xié)同過(guò)濾。

        傳統(tǒng)推薦技術(shù)中,用戶興趣分析的另一主要方法是“基于協(xié)同過(guò)濾的推薦”。即:對(duì)于一個(gè)用戶,推薦系統(tǒng)根據(jù)與該用戶興趣相似的其他相關(guān)用戶對(duì)資源的訪問(wèn)情況推斷其興趣,所依據(jù)的是“用戶-項(xiàng)目”點(diǎn)擊矩陣的相似性度量。社會(huì)媒體中,前述的“網(wǎng)絡(luò)社群性”使這種依據(jù)可以擴(kuò)展為基于用戶社會(huì)關(guān)系的推薦,從而解決“點(diǎn)擊矩陣稀疏”等問(wèn)題,而“用戶角色雙重性”、“信息網(wǎng)絡(luò)異構(gòu)性”及“用戶關(guān)系多元性”等用戶特點(diǎn)使這一問(wèn)題變成異構(gòu)信息網(wǎng)絡(luò)中的社群發(fā)現(xiàn)及社群的用戶興趣推斷問(wèn)題。

        3)面向用戶的多層次資源推薦。

        傳統(tǒng)的推薦系統(tǒng)中,無(wú)論“基于內(nèi)容的推薦”、“基于協(xié)同過(guò)濾的推薦”、還是其混合技術(shù),推薦結(jié)果的粒度大多是原始信息,即便是多媒體推薦,也較少考慮用戶不同粒度、不同層次的需求。這里重提前述“社會(huì)媒體資源多層次性”中的例子,即:用戶A撰寫(xiě)了一篇關(guān)于三亞旅游的圖文并茂的博文,用戶B轉(zhuǎn)發(fā)了其中的部分文字并加上了評(píng)論,用戶C又配發(fā)了一些照片,…。在推薦時(shí),通過(guò)對(duì)這些博文、評(píng)論、圖片等原始信息的分析,可以推薦:1)與博文中的圖片或某部分文字相關(guān)的信息;2)由多幅圖片和文字構(gòu)成的三亞某一景點(diǎn)的介紹信息;3)諸如“三亞旅游最佳路線”這樣的綜合信息。這里,推薦1)是原始信息的子集,推薦2)是若干原始信息基于某種方式的組合,推薦3)則是原始信息基礎(chǔ)上高度的分析、處理、總結(jié)和重組。上述推薦項(xiàng)目的不同粒度表明了從原始信息的子集、原始信息、到它們某種形式的組合、再到更高層次的綜合這樣不同的資源層次。

        綜上,對(duì)社會(huì)媒體推薦中涉及的“資源”和“用戶”給出如下定義:

        定義1 社會(huì)媒體用戶。社會(huì)媒體資源的發(fā)布者和使用者(一般需要注冊(cè)),包括上傳、轉(zhuǎn)載、共享、瀏覽、關(guān)注等一切對(duì)社會(huì)媒體資源進(jìn)行過(guò)操作的用戶。

        定義2 社會(huì)媒體資源。即用戶在社會(huì)媒體中發(fā)布的原始信息單元及其組合或抽象。原始信息單元如一篇博文、一條微博、一幅圖片、一段視頻、一首樂(lè)曲等,稱之為單一資源;單一資源中的某個(gè)部分稱為子資源,如微博中的圖片、視頻中的音樂(lè)等;單一資源的有序組合稱為復(fù)合資源,如不同用戶上傳的關(guān)于同一景點(diǎn)的多幅圖片及若干文本;通過(guò)對(duì)單一、復(fù)合資源的分析和挖掘,可望得到綜合資源,例如,對(duì)于某個(gè)景點(diǎn),對(duì)用戶上傳的圖片、撰寫(xiě)的博文、發(fā)布的微博、微信等進(jìn)行深入挖掘可構(gòu)成“旅游綜合資源”;針對(duì)某個(gè)學(xué)術(shù)問(wèn)題,對(duì)相關(guān)社群用戶的討論、發(fā)表的文章、乃至該社群本身的挖掘可構(gòu)成“學(xué)術(shù)綜合資源”。由于用戶社群因與資源的關(guān)系而形成、并通過(guò)分析和挖掘而發(fā)現(xiàn),因此,用戶社群也是一種綜合資源。

        根據(jù)定義2,本文提出的社會(huì)媒體推薦中的多模態(tài)、多層次資源如圖1所示。

        圖1 社會(huì)媒體推薦中的多模態(tài)、多層次資源Fig.1 Multi-modal and multi-level resource in social media for recommendation

        基于社會(huì)媒體平臺(tái),在用戶與相關(guān)信息構(gòu)成的異構(gòu)信息網(wǎng)絡(luò)中挖掘用戶社群并進(jìn)而推斷用戶興趣,在推薦內(nèi)容上實(shí)施不同粒度、分層次、高質(zhì)量的信息資源推薦,是用戶的潛在需求,更是推薦系統(tǒng)應(yīng)該、并且通過(guò)應(yīng)用相關(guān)技術(shù)可望實(shí)現(xiàn)的功能。

        當(dāng)前社會(huì)媒體資源推薦的特點(diǎn),實(shí)際上可以視為傳統(tǒng)的推薦技術(shù)被賦予了社會(huì)媒體新的內(nèi)容。在目前的相關(guān)工作中,作為最終目標(biāo)的“面向用戶的多層次資源推薦”主要表現(xiàn)為基于用戶社群、媒體內(nèi)容以及多種因素的推薦,而作為用戶興趣分析方法的“多模態(tài)的用戶興趣內(nèi)容分析”和“基于社會(huì)關(guān)系的協(xié)同過(guò)濾”則需要社會(huì)媒體用戶關(guān)系分析、社會(huì)媒體多模態(tài)信息挖掘以及社會(huì)媒體中多模態(tài)信息相似性度量等相關(guān)技術(shù)的支撐。文中對(duì)上述涉及的內(nèi)容進(jìn)行歸類(lèi),其結(jié)果如圖2所示(圖中虛線意為當(dāng)前工作并未完全具有的功能)。基于圖2,下文分別從社會(huì)媒體資源推薦策略和社會(huì)媒體推薦的支撐技術(shù)兩方面對(duì)相關(guān)工作進(jìn)行綜述,并在第4節(jié)進(jìn)行總結(jié)和討論。

        2 社會(huì)媒體資源推薦策略

        根據(jù)圖2的歸納,將從基于用戶社群的推薦、基于媒體內(nèi)容的推薦以及基于多種因素的推薦3方面綜述社會(huì)媒體資源推薦的相關(guān)工作。

        2.1 基于用戶社群的推薦

        用戶的網(wǎng)絡(luò)社群性是社會(huì)媒體的主要特點(diǎn)之一,挖掘社會(huì)媒體中的社群關(guān)系、并基于此進(jìn)行推薦,是社會(huì)媒體推薦的一個(gè)主要途徑。

        圖2 社會(huì)媒體資源推薦的特點(diǎn)與相關(guān)工作Fig.2 Characteristics and related work of social media resources recommendation

        在基于用戶社群或社會(huì)關(guān)系的推薦方面,Pavlidis等[6]基于用戶個(gè)人信息和朋友信息等社交媒體信息推斷用戶的興趣、用戶朋友的興趣以及朋友的親密度,找到推薦禮物的重要時(shí)機(jī),進(jìn)行禮物推薦;Popescu等[7]把個(gè)性化旅游推薦視為協(xié)同過(guò)濾問(wèn)題,挖掘在網(wǎng)絡(luò)上用戶的旅行數(shù)據(jù)、記錄數(shù)據(jù),并利用這些數(shù)據(jù)構(gòu)建一個(gè)用戶-用戶的相似度矩陣,為一個(gè)想去某地旅游的用戶推薦景點(diǎn);Schirru[8]基于用戶在Web2.0資源分享平臺(tái)上與其同事交換的感興趣話題的內(nèi)容,建立一個(gè)基于話題的推薦系統(tǒng),利用話題追蹤檢測(cè)算法,檢測(cè)用戶短期或長(zhǎng)期感興趣話題,提供基于話題的推薦,滿足用戶的需求和偏好;賈大文等[9]把用戶對(duì)具體媒體對(duì)象的偏好轉(zhuǎn)化成用戶對(duì)媒體對(duì)象所蘊(yùn)含興趣元素的偏好,將具有相同偏好的用戶聚合成“共同偏好組”,基于共同偏好組進(jìn)行社會(huì)媒體的共享與推薦;Koohborfardhaghighi等[10]在朋友網(wǎng)中向處在轉(zhuǎn)接點(diǎn)位置和具有高特征向量中心值的用戶實(shí)施推薦,認(rèn)為前者具有重要的信息,后者與其他用戶具有更多的聯(lián)系或者被重要的用戶所聯(lián)系;Li等[11]通過(guò)發(fā)現(xiàn)面向用戶和面向社群的話題來(lái)捕獲用戶興趣和社群焦點(diǎn),從而推薦有影響力的用戶和相關(guān)于話題的社群;Zhao等[12]在Twitte風(fēng)格的社會(huì)網(wǎng)絡(luò)中根據(jù)關(guān)注與被關(guān)注關(guān)系發(fā)現(xiàn)社群,并基于社群進(jìn)行粉絲推薦,從而改進(jìn)基于內(nèi)容推薦的低準(zhǔn)確率和協(xié)同過(guò)濾推薦的稀疏性問(wèn)題。

        在此領(lǐng)域,與上述工作相似的還有很多,這里不多贅述。總體上,這些工作的主要特點(diǎn)是基于用戶的社會(huì)關(guān)系及由于共同話題、關(guān)注點(diǎn)等原因形成的社群,發(fā)現(xiàn)當(dāng)前用戶的興趣偏好,從而進(jìn)行推薦。推薦的內(nèi)容包括社會(huì)媒體的原始信息[6-8],也包括用戶的相關(guān)信息,如社群[9,11]、朋友[10,12]等。

        2.2 基于媒體內(nèi)容的推薦

        無(wú)論是傳統(tǒng)的推薦系統(tǒng)還是社會(huì)媒體資源的推薦,基于內(nèi)容的推薦均是一個(gè)重要推薦技術(shù)。不同的是,社會(huì)媒體中的內(nèi)容已呈現(xiàn)多模態(tài)的信息表現(xiàn)形式,因此,用戶的訪問(wèn)記錄信息將由多模態(tài)的信息構(gòu)成,推薦的內(nèi)容也將是多模態(tài)、甚至是跨媒體(即基于一種媒體形式的訪問(wèn)歷史推薦其他媒體形式的資源)的。

        在基于媒體內(nèi)容的推薦中,Zhang等[13]、Bu等[14]結(jié)合多種類(lèi)型的社會(huì)媒體信息以及音樂(lè)原聲信號(hào)的多資源媒體信息,用超圖對(duì)社會(huì)媒體信息高階關(guān)系建模,利用各種多媒體信息數(shù)據(jù)以及基于音樂(lè)原聲的內(nèi)容進(jìn)行音樂(lè)推薦;Tan等[15]采用圖模型對(duì)評(píng)論間的關(guān)系以及評(píng)論與原始新聞間的關(guān)系進(jìn)行建模,捕捉用戶關(guān)注點(diǎn)的動(dòng)態(tài)變化,抽取話題模式,綜合考慮讀者和作者的觀點(diǎn),進(jìn)行相關(guān)信息推薦;Hu等[16]將在線社交網(wǎng)站 OSNs和視頻分享網(wǎng)站VSSes的度量標(biāo)準(zhǔn)結(jié)合起來(lái),提出了一種基于相似度的方法來(lái)為Youtube這樣的視頻分享網(wǎng)站VSSes增加推薦視頻列表;Ma等[17]將用戶在社會(huì)媒體中發(fā)表和查看的數(shù)據(jù)視為社會(huì)流,提出了一個(gè)新的在線協(xié)同過(guò)濾框架和流排名矩陣分解,通過(guò)分析社會(huì)流來(lái)進(jìn)行個(gè)性化主題推薦及發(fā)現(xiàn);Ernesto等[18]結(jié)合用戶評(píng)論、Li等[19]使用用戶產(chǎn)生的評(píng)論作為數(shù)據(jù)源,建模評(píng)論之間的關(guān)系,進(jìn)行新聞推薦。

        與上述工作相似的工作還有很多,這里不多贅述。就社會(huì)媒體資源推薦而言,除了新聞、評(píng)論等文本形式的社會(huì)媒體資源外,其他媒體形式的推薦主要還是如傳統(tǒng)多媒體推薦方法那樣以資源的原始粒度作為推薦單元,而缺少更小或更大粒度、特別是綜合資源的推薦。

        2.3 基于多種因素的推薦

        除前述基于用戶關(guān)系和資源內(nèi)容分析的推薦外,還有一些基于社會(huì)媒體多因素分析的推薦。

        在基于多因素的推薦中,Messenger等[20]基于用戶在社交網(wǎng)絡(luò)中與其他成員的關(guān)聯(lián)關(guān)系、社會(huì)數(shù)據(jù)以及詞相關(guān)因素進(jìn)行個(gè)性化書(shū)籍推薦;Pera等[21]研究基于用戶和標(biāo)簽的社會(huì)媒體推薦,表明將兩者結(jié)合起來(lái)的性能會(huì)更為優(yōu)異;Guy等[22]利用包括帖子內(nèi)容、帖子間相似度、帖子間或者其與博客間的鏈接以及與外部網(wǎng)站的鏈接在內(nèi)的多種特征訓(xùn)練了一個(gè)SVM排序分類(lèi)器,進(jìn)行用戶預(yù)測(cè)和鏈接預(yù)測(cè),應(yīng)用預(yù)測(cè)結(jié)果進(jìn)行推薦;Wu等[23]基于旅行者使用搜索引擎查詢旅游計(jì)劃的上下文信息,生成一些有代表性的旅游目的地;Xiang[24]構(gòu)建了相同類(lèi)型的實(shí)體(如用戶與用戶)和不同類(lèi)型的實(shí)體(如用戶與圖片)之間的關(guān)系圖,將推薦任務(wù)描述為一個(gè)在關(guān)系圖上的隨機(jī)游走過(guò)程;Chidlovskii等[25]挖掘 Tweet內(nèi)容,并用其哈希標(biāo)簽和內(nèi)容對(duì)youtube、Flickr、Photobucket、Dailymotion和 SoundCloud進(jìn)行標(biāo)注,實(shí)現(xiàn)對(duì)大量的未被充分標(biāo)注的用戶生成的Web資源進(jìn)行語(yǔ)義上的標(biāo)注,以此實(shí)現(xiàn)標(biāo)簽推薦;Liu等[26]獲取社會(huì)媒體中各種女性面部和發(fā)式圖像,提取其中化妝品特征,構(gòu)建一個(gè)化妝推薦系統(tǒng),提出一個(gè)多樹(shù)結(jié)構(gòu)的超圖模型來(lái)探索各種化妝面部圖像的高層美麗屬性、中層相關(guān)于美麗的屬性以及低層圖像特征,基于用戶輸入的短發(fā)、素顏正臉圖像,為其推薦最合適的發(fā)式和化妝模式,并展示合成結(jié)果。與上文論述的工作相比,本節(jié)中大部分推薦是基于社會(huì)媒體的多種因素,包括用戶關(guān)系和媒體相關(guān)內(nèi)容,但其中的“內(nèi)容”主要是以標(biāo)簽、鏈接等元數(shù)據(jù)或語(yǔ)義信息為主。此外,日常生活中經(jīng)常接觸的如“淘寶”、“當(dāng)當(dāng)”這類(lèi)購(gòu)物網(wǎng)站,均具有根據(jù)用戶訪問(wèn)歷史、好友關(guān)系等因素推薦商品的功能,但這種推薦也主要基于標(biāo)簽等語(yǔ)義、文本信息的分析,因此可能出現(xiàn)這樣的例子:對(duì)于一個(gè)用戶,如果本人或其好友關(guān)注一條裙子的圖片,推薦的也往往就是各種裙子圖片,而不去考慮該用戶到底是喜歡裙子的款式、花色、進(jìn)而據(jù)此進(jìn)行推薦。這個(gè)例子表明當(dāng)前的研究在針對(duì)不同模態(tài)和層次細(xì)節(jié)內(nèi)容方面的推薦受到一定限制。

        3 社會(huì)媒體推薦的支撐技術(shù)

        作為用戶興趣分析方法的“多模態(tài)的用戶興趣內(nèi)容分析”和“基于社會(huì)關(guān)系的協(xié)同過(guò)濾”需要許多相關(guān)技術(shù)的支撐。根據(jù)圖2,這些相關(guān)技術(shù)主要包括社會(huì)媒體用戶關(guān)系分析、社會(huì)媒體多模態(tài)信息挖掘、以及社會(huì)媒體中多模態(tài)資源相似性度量等,本節(jié)將從這3個(gè)方面綜述相關(guān)工作。

        3.1 社會(huì)媒體用戶關(guān)系分析

        社會(huì)媒體中的用戶關(guān)系分析和用戶社群發(fā)現(xiàn)是社會(huì)網(wǎng)絡(luò)研究中的一個(gè)重要組成部分。在社會(huì)媒體資源推薦中,由于用戶對(duì)資源的各種操作而表現(xiàn)出的“興趣相投”、“觀點(diǎn)相似”、“關(guān)注”、“跟隨”等關(guān)系構(gòu)成了各種網(wǎng)絡(luò)社群,這些社群所表達(dá)的用戶之間的關(guān)系成為“基于協(xié)同過(guò)濾推薦”的一個(gè)有效的擴(kuò)展。

        在用戶關(guān)系分析和用戶社群發(fā)現(xiàn)研究方面,Sun等[27]在多類(lèi)型對(duì)象構(gòu)成的異構(gòu)信息網(wǎng)絡(luò)中(如學(xué)術(shù)網(wǎng)絡(luò)中的術(shù)語(yǔ)、作者、文章等),提出基于元路徑與用戶指導(dǎo)聚類(lèi)的方法對(duì)社會(huì)網(wǎng)絡(luò)中的對(duì)象進(jìn)行聚類(lèi);Guv等[28]根據(jù)“認(rèn)識(shí)同一個(gè)人或者被同一個(gè)人認(rèn)識(shí)”、“對(duì)同樣的事情感興趣”、“都在相同的地點(diǎn)”發(fā)現(xiàn)社會(huì)媒體中的用戶關(guān)系;Barbier等[29]基于社會(huì)媒體存在大量群、數(shù)據(jù)有噪音、群不斷變化的問(wèn)題,提出發(fā)現(xiàn)群、根據(jù)群建立用戶profile、理解群對(duì)其他個(gè)人或群的影響、探索跨社會(huì)媒體群以補(bǔ)充群成員評(píng)價(jià)的社會(huì)媒體在線群的理解;Yang等[30]針對(duì)電子商務(wù)社會(huì)網(wǎng)絡(luò)中“許多具有相似興趣的社會(huì)媒體用戶可能沒(méi)有直接的交互或購(gòu)買(mǎi)相同商品、從而導(dǎo)致社會(huì)媒體中顯式鏈接稀疏”的問(wèn)題,提出識(shí)別用戶之間這種隱式關(guān)系來(lái)豐富社會(huì)媒體結(jié)構(gòu)的方法;Jorge等[31]認(rèn)為鏈接預(yù)測(cè)對(duì)于社會(huì)網(wǎng)絡(luò)成員未來(lái)關(guān)系的發(fā)現(xiàn)至關(guān)重要,針對(duì)此前的“鏈接預(yù)測(cè)基于結(jié)構(gòu)信息、而結(jié)構(gòu)信息在大規(guī)模社會(huì)網(wǎng)絡(luò)中不足以獲得好的預(yù)測(cè)性能”的問(wèn)題,研究將“Twitter”用戶的行為、興趣等非結(jié)構(gòu)信息引入用戶社群分析,改進(jìn)鏈接預(yù)測(cè)性能。

        總體上,社會(huì)網(wǎng)絡(luò)挖掘中的社群發(fā)現(xiàn)與推薦均屬此范疇,還有很多的研究工作,這里不多贅述。上述工作中,有只考慮用戶關(guān)系或者文檔相似關(guān)系的同構(gòu)網(wǎng)絡(luò),也有考慮用戶、資源及其關(guān)系的異構(gòu)網(wǎng)絡(luò),鏈接關(guān)系包括顯式鏈接,也包括隱式鏈接,其最終目標(biāo)還是發(fā)現(xiàn)各種用戶社群。

        3.2 社會(huì)媒體多模態(tài)信息挖掘

        社會(huì)媒體內(nèi)容豐富,為推薦系統(tǒng)提供了巨大的信息資源。但無(wú)論是用戶興趣分析、還是推薦資源的選擇,以及社會(huì)媒體信息具有的海量性、有噪音等特點(diǎn),均需要對(duì)社會(huì)媒體內(nèi)容(包括不同層次、粒度的內(nèi)容)進(jìn)行分析。由于當(dāng)前社會(huì)媒體信息呈現(xiàn)多模態(tài)特征,因此多模態(tài)信息挖掘成為這種分析的主要技術(shù)手段。

        在社會(huì)媒體多模態(tài)信息挖掘以及相關(guān)的信息檢索方面,Tang等[32]提出了社會(huì)媒體分析中去除噪音、多媒體數(shù)據(jù)及用戶的建模、標(biāo)簽代表性與資源相關(guān)性、大規(guī)模社會(huì)媒體數(shù)據(jù)的挖掘與檢索的擴(kuò)展性、數(shù)據(jù)的衡量標(biāo)準(zhǔn)等問(wèn)題;Lee[33]構(gòu)建了在線突發(fā)事件發(fā)展評(píng)價(jià)模型,提出了離線事件評(píng)價(jià)衡量指標(biāo),用以支持事件間隱性關(guān)系的分析;Jin等[34]提出社會(huì)媒體中的垃圾信息檢測(cè)問(wèn)題,通過(guò)圖像、文本、社會(huì)網(wǎng)絡(luò)中用戶歷史及其行為等特征的提取和分析,以識(shí)別垃圾內(nèi)容;Lee 等[35]通過(guò) Facebook、Twitter、DocTrack、MemRecap等文本集和查詢集等社交數(shù)據(jù)的測(cè)試,研究社會(huì)媒體個(gè)性化搜索和評(píng)價(jià)問(wèn)題;Choudhury等[36]提出一種對(duì)信息單元加權(quán)的維度表示,來(lái)描述大規(guī)模社交媒體空間,并通過(guò)一種抽樣方法來(lái)降低這種大型社交網(wǎng)絡(luò)空間的維度;Tsai等[37]應(yīng)用社交媒體并根據(jù)出現(xiàn)概率最大的話題對(duì)其進(jìn)行分類(lèi),進(jìn)而構(gòu)建分類(lèi)框架;Kaschesky等[38]提出在社會(huì)媒體中進(jìn)行觀點(diǎn)挖掘的過(guò)程,包括:社會(huì)媒體內(nèi)容分析,意見(jiàn)層建模、模擬和預(yù)測(cè),社交網(wǎng)絡(luò)的可視化、接口設(shè)計(jì),系統(tǒng)架構(gòu)和實(shí)時(shí)運(yùn)行平臺(tái);Jin等[39]提出了一個(gè)LikeMiner系統(tǒng)以便在社會(huì)媒體網(wǎng)路中挖掘“l(fā)ike”的內(nèi)容,針對(duì)社會(huì)媒體引入“l(fā)ike”異構(gòu)網(wǎng)絡(luò)模型,建立可視和文本話題空間,提出挖掘算法評(píng)價(jià)社會(huì)媒體的表現(xiàn)力和影響力;Cui等[40]提出社會(huì)媒體搜索中融合多特征及其相關(guān)性的方法進(jìn)行相似性度量,其特征涉及正文特征、視覺(jué)內(nèi)容特征和用戶特征,分別以這些特征為節(jié)點(diǎn)構(gòu)建特征交互圖,并考慮同模態(tài)節(jié)點(diǎn)邊和跨模態(tài)節(jié)點(diǎn)邊的定義和構(gòu)建。

        社會(huì)媒體多模態(tài)信息挖掘與傳統(tǒng)的多媒體挖掘技術(shù)相關(guān),因此還有很多研究成果,這里不多贅述。就支持社會(huì)媒體資源推薦而言,由于社會(huì)媒體中用戶發(fā)布、瀏覽信息時(shí)可能會(huì)為其賦予具有一定語(yǔ)義信息的標(biāo)簽,眾包[41]、分類(lèi)分眾[42]技術(shù)又使標(biāo)簽進(jìn)一步豐富和規(guī)范,加之用戶關(guān)系等線索,目前很多推薦策略是基于標(biāo)簽和用戶關(guān)系而避開(kāi)內(nèi)容(特別是非文本內(nèi)容)分析的。但是,針對(duì)前述“面向用戶的多層次資源推薦”的特點(diǎn)和需求,不同粒度的多模態(tài)內(nèi)容分析和信息挖掘是必不可少的。

        3.3 多模態(tài)資源相似性度量

        第2節(jié)所論述的各種社會(huì)媒體推薦策略中,均需要根據(jù)用戶興趣(通過(guò)用戶社群、媒體內(nèi)容及其他各種因素等渠道獲得)找到最相關(guān)的推薦資源,相似性度量是必不可少的。此外,前文論述的相關(guān)支撐技術(shù)中,分析用戶的相關(guān)或相似性,特別是多模態(tài)信息挖掘的很多算法,更需要進(jìn)行資源之間、特別是不同模態(tài)形式的資源之間的相似性度量。

        在多模態(tài)資源相似性度量方面,Liu等[43]研究社會(huì)媒體用戶所構(gòu)成的社會(huì)網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)與對(duì)等節(jié)點(diǎn)連接方式的多樣性問(wèn)題,提出捕獲多樣性語(yǔ)義的度量標(biāo)準(zhǔn),在社會(huì)媒體網(wǎng)站中獲得各種類(lèi)型的朋友、合作等關(guān)系;Ling等[44]提出一種支持跨媒體信息檢索的異構(gòu)媒體對(duì)象的相似性度量方法,該方法探索一種結(jié)合了原始的低層特征空間和第三公共空間特點(diǎn)的tri空間,基于該空間進(jìn)行不同媒體對(duì)象的相似性度量;Zhai等[45]提出一種使用最近鄰方法的異構(gòu)相似性度量方法,通過(guò)計(jì)算2個(gè)不同媒體對(duì)象屬于同一語(yǔ)義類(lèi)別的概率來(lái)獲得這兩個(gè)媒體對(duì)象之間的相似性;Jia等[46]構(gòu)建一個(gè)話題模型的Markov隨機(jī)域,將文本和與其松散相關(guān)的圖像結(jié)合起來(lái),對(duì)這兩種不同模態(tài)之間的聯(lián)系進(jìn)行編碼,用以進(jìn)行跨模態(tài)的話題學(xué)習(xí);Zhu等[4]提出一種跨模態(tài)哈希方法,在對(duì)每種模態(tài)的數(shù)據(jù)進(jìn)行聚類(lèi)基礎(chǔ)上,將得到的數(shù)據(jù)表達(dá)轉(zhuǎn)換成普通二進(jìn)制子空間,使所有模態(tài)的二進(jìn)制編碼是“一致”和可比較的,同時(shí)輸出針對(duì)所有模態(tài)的哈希函數(shù),用于將未知數(shù)據(jù)轉(zhuǎn)換成二進(jìn)制代碼,從而實(shí)現(xiàn)跨模態(tài)搜索;Wu等[5]提出一種在線多模態(tài)深度相似性學(xué)習(xí)框架,針對(duì)每種單一模態(tài)學(xué)習(xí)一種非線性轉(zhuǎn)換函數(shù),在此基礎(chǔ)上去學(xué)習(xí)發(fā)現(xiàn)多種模態(tài)的最優(yōu)組合,應(yīng)用于多模態(tài)圖像檢索任務(wù),與文獻(xiàn)[4]不同的是,文獻(xiàn)[5]中所述的模態(tài)是圖像的不同類(lèi)型的特征;Wu等[47]提出一種Bi-CMSRM的跨媒體特征表示方法,將圖像和文本2種不同媒體對(duì)象映射到相同的公共空間,支持“圖像→文本”和“文本→圖像”的雙向查詢。

        相似性度量一直是數(shù)據(jù)挖掘、信息檢索、資源推薦等領(lǐng)域的一個(gè)研究熱點(diǎn),包括相同模態(tài)信息、跨模態(tài)資源之間的相似性度量,涉及文本、圖像、視頻等不同媒體信息,還涉及數(shù)值、向量、樹(shù)、圖等不同的數(shù)據(jù)結(jié)構(gòu),更涉及距離與非距離等不同的相似性表達(dá)機(jī)制,因此相關(guān)工作還有很多。本節(jié)所述的工作更多側(cè)重于非文本和跨媒體的相似性度量,途徑是將不同模態(tài)特征在相同的新特征空間表示并度量,其余的不多贅述。

        4 社會(huì)媒體推薦面臨的問(wèn)題與挑戰(zhàn)

        縱觀前述第2、3節(jié)的相關(guān)工作,可以總結(jié)出以下的特點(diǎn)和問(wèn)題,并進(jìn)而引出社會(huì)媒體推薦面臨的挑戰(zhàn)。

        4.1 目前工作的特點(diǎn)和問(wèn)題

        前文論述了社會(huì)媒體資源推薦策略和支撐技術(shù)方面的相關(guān)工作,針對(duì)其中3方面推薦策略和3方面支撐技術(shù)進(jìn)行歸納,可以總結(jié)出如下特點(diǎn)。

        1)在社會(huì)媒體用戶社會(huì)關(guān)系分析方面,考慮網(wǎng)絡(luò)的異構(gòu)性、并進(jìn)行相關(guān)分析和挖掘,是一個(gè)新的研究熱點(diǎn)。在異構(gòu)信息網(wǎng)絡(luò)中如何更好地發(fā)現(xiàn)隱式社群并最終應(yīng)用于社會(huì)媒體資源推薦,仍有許多待解決的問(wèn)題;

        2)在基于用戶社群的推薦方面,相關(guān)工作主要是基于社群內(nèi)的用戶興趣或用戶關(guān)系本身進(jìn)行推薦。在社會(huì)媒體資源推薦中,還應(yīng)考慮如何在用戶社群發(fā)現(xiàn)的基礎(chǔ)上、進(jìn)一步推演用戶興趣并應(yīng)用于資源推薦;

        3)在社會(huì)媒體資源挖掘方面,除針對(duì)社會(huì)媒體海量、噪音等研究外,一方面基于傳統(tǒng)的多媒體挖掘技術(shù),另一方面基于社會(huì)媒體中豐富的語(yǔ)義、元數(shù)據(jù)信息;

        4)在社會(huì)媒體資源推薦方面,大多以資源原始粒度作為推薦單元,一些具有綜合資源推薦功能的工作也主要局限在“旅游”這樣特定需求方面,因而尚缺少更小或更大粒度、特別是綜合資源的推薦;

        5)在多因素分析的社會(huì)媒體資源推薦方面,相關(guān)工作結(jié)合了用戶關(guān)系和媒體內(nèi)容,但其中的內(nèi)容分析仍主要以文本形式的元數(shù)據(jù)和語(yǔ)義信息為主。

        實(shí)際上,內(nèi)容分析在傳統(tǒng)的推薦、特別是基于內(nèi)容的推薦中曾起過(guò)重要作用。在社會(huì)媒體中,豐富的標(biāo)簽、元數(shù)據(jù)等語(yǔ)義信息以及用戶關(guān)系等線索,使得很多推薦工作在未進(jìn)行內(nèi)容分析的情況下也能取得不錯(cuò)的推薦效果,甚至在ACM Multimedia 2012國(guó)際會(huì)議上還引發(fā)了在社會(huì)媒體環(huán)境下“內(nèi)容已死”與“內(nèi)容萬(wàn)歲”的討論[48]。但是,如果考慮前述異構(gòu)信息網(wǎng)絡(luò)的社群發(fā)現(xiàn)以及多層次、不同粒度的信息推薦,內(nèi)容分析是必不可少的:① 在構(gòu)建異構(gòu)信息網(wǎng)絡(luò)并分析用戶社群時(shí),信息節(jié)點(diǎn)的相關(guān)性分析與信息凈化(去噪、去重等)、以及隱式鏈接關(guān)系分析均離不開(kāi)內(nèi)容分析;②如果要推薦的信息比原始信息粒度更小,則需要對(duì)原始信息進(jìn)行內(nèi)容分割;③如果要推薦的是粒度更大的綜合信息,則更需要文本、圖像、視頻的內(nèi)容分析和挖掘。由于用戶通過(guò)社會(huì)媒體傳播和交流的信息形式的多媒體化,內(nèi)容分析更需要多模態(tài)內(nèi)容分析技術(shù)。

        可見(jiàn),為實(shí)現(xiàn)社會(huì)媒體的多層次推薦,內(nèi)容分析仍然有其他方法不可替代的作用。當(dāng)然,內(nèi)容分析在進(jìn)行跨媒體分析時(shí)有其局限性,除眾所周知的高維性以外,不同類(lèi)型媒體之間的相似性度量?jī)H依賴于內(nèi)容分析是難以完成的??紤]一幅圖片與一段音樂(lè)是否相似,不借助于其他信息幾乎無(wú)法實(shí)現(xiàn),因而也就限制了不同媒體之間(即跨媒體)的推薦。

        綜上,內(nèi)容分析能夠提供針對(duì)單一媒體精細(xì)的分析和比較結(jié)果,在推薦系統(tǒng)中的作用是其他分析方法不可替代的。但是,當(dāng)這種分析和比較涉及不同類(lèi)型媒體時(shí),內(nèi)容分析則不能直接應(yīng)用。此時(shí),內(nèi)容信息之外的語(yǔ)義信息、元數(shù)據(jù)信息等,成為不同媒體之間的“橋梁”?;诖耍梢哉J(rèn)為,結(jié)合社會(huì)媒體中的用戶信息,標(biāo)簽、媒體上下文、評(píng)論等用戶生成內(nèi)容,以及這些內(nèi)容中的術(shù)語(yǔ)、視覺(jué)、聽(tīng)覺(jué)等特征于一體的分析方法,能夠更好地支持社會(huì)媒體的多模態(tài)、多層次資源推薦和用戶關(guān)系挖掘。表1歸納了上述討論的結(jié)果,該表解釋了圖2中虛線的原因。

        4.2 社會(huì)媒體多模態(tài)、多層次資源推薦面臨的挑戰(zhàn)

        根據(jù)圖2、表1及上節(jié)的討論,社會(huì)媒體多模態(tài)、多層次資源推薦仍面臨諸多挑戰(zhàn)。

        1)異構(gòu)信息網(wǎng)絡(luò)構(gòu)建與用戶社群發(fā)現(xiàn)問(wèn)題。

        傳統(tǒng)的推薦系統(tǒng)中,基于內(nèi)容的推薦不考慮用戶關(guān)系,基于協(xié)同過(guò)濾的推薦主要依據(jù)“用戶-項(xiàng)目”的點(diǎn)擊情況,因而存在“用戶-項(xiàng)目矩陣稀疏”等問(wèn)題。社會(huì)媒體中,“網(wǎng)絡(luò)社群性”可望更好地解決上述問(wèn)題。但這里用戶與資源的關(guān)系已不僅是“點(diǎn)擊”操作,在“用戶角色雙重性”及在多種媒體形式構(gòu)成的社會(huì)媒體環(huán)境中,如何構(gòu)建“用戶-資源”異構(gòu)信息網(wǎng)絡(luò)并在其中挖掘用戶社群,并最終映射為用戶興趣,則是一個(gè)挑戰(zhàn)。

        2)多層次資源質(zhì)量與條件相關(guān)性判別問(wèn)題。

        社會(huì)媒體的資源是用戶發(fā)布的,因此存在大量噪音、重復(fù)數(shù)據(jù)等信息質(zhì)量問(wèn)題,不同用戶發(fā)布的相同內(nèi)容的資源質(zhì)量也不盡相同,信息質(zhì)量問(wèn)題較傳統(tǒng)媒體愈發(fā)嚴(yán)重。此外,就推薦而言,在傳統(tǒng)的推薦系統(tǒng)中,如果以項(xiàng)目或網(wǎng)頁(yè)序列表達(dá)用戶興趣,那么序列“A”與“AB”對(duì)應(yīng)的推薦應(yīng)該是不同的。在社會(huì)媒體中,這一特點(diǎn)同樣存在,然而不同的是,A、B資源的媒體形式更加多樣。而在多層次資源推薦中,A、B的粒度則可為子資源、資源和復(fù)合資源,推薦結(jié)果還可能是綜合資源,條件相關(guān)性的分析變得更加困難。

        3)用戶興趣與多層次資源的描述問(wèn)題。

        無(wú)論多層次資源模型、還是用戶興趣模型,均涉及用戶、各層次資源及其關(guān)系的描述,而資源之間關(guān)系的獲取需要不同模態(tài)的內(nèi)容分析,這種分析又將落實(shí)到特征分析,因此帶來(lái)如下問(wèn)題:首先,表現(xiàn)這些資源的數(shù)據(jù)本身大多是非結(jié)構(gòu)化的;其次,不同資源數(shù)據(jù)之間是內(nèi)容異構(gòu)的;第三,這些非結(jié)構(gòu)化數(shù)據(jù)的特征是高維的。若準(zhǔn)確而合理地表達(dá)不同資源之間的關(guān)系、并有效地支持綜合資源的挖掘以及多層次資源推薦時(shí)的搜索,這種描述非簡(jiǎn)單的數(shù)據(jù)結(jié)構(gòu)所能勝任。

        4)綜合資源的發(fā)現(xiàn)與推薦問(wèn)題。

        前述定義2中,多層次資源的“子資源”、“資源”和“復(fù)合資源”一般以顯式方式存在,而“綜合資源”則是隱式的,需要在資源和復(fù)合資源基礎(chǔ)上,通過(guò)分析和挖掘才能獲得。如何在多(跨)模態(tài)的社會(huì)媒體資源中,通過(guò)針對(duì)各種模態(tài)的內(nèi)容分析,發(fā)現(xiàn)并表達(dá)綜合資源、進(jìn)而向所需用戶推薦綜合資源,將涉及多(跨)模態(tài)挖掘以及推薦時(shí)的搜索與匹配等若干新問(wèn)題。

        5)多層次資源模型中的信息度量問(wèn)題。

        如本節(jié)內(nèi)容3)所述,表達(dá)社會(huì)媒體多層次資源推薦模型已非簡(jiǎn)單的數(shù)據(jù)結(jié)構(gòu),推薦時(shí)用戶興趣與資源的匹配又涉及條件相關(guān)性判別。在結(jié)構(gòu)化和純文本內(nèi)容中,由于特征形式單一,傳統(tǒng)的距離度量機(jī)制一般尚可奏效。但在社會(huì)媒體多模態(tài)內(nèi)容和多層次資源中,用戶興趣與資源之間、資源與資源之間的相似或相關(guān)性度量無(wú)法采用傳統(tǒng)的“距離”度量機(jī)制予以實(shí)現(xiàn)。

        5 進(jìn)一步的研究方向

        可以認(rèn)為,社會(huì)媒體中用戶角色的變化構(gòu)成了更加復(fù)雜的用戶關(guān)系,社會(huì)媒體資源表現(xiàn)形式呈現(xiàn)多模態(tài)特點(diǎn),社會(huì)媒體資源推薦應(yīng)該、并可以滿足多層次的用戶需求。基于此,提出進(jìn)一步的研究方向。

        1)社會(huì)媒體資源與用戶興趣模型結(jié)構(gòu)研究。

        令社會(huì)媒體資源集合為 R={r1,r2,...,rn},每個(gè)ri(i=1,2,...,n)為一個(gè)資源,n為資源總數(shù)。對(duì)一用戶 u,其興趣模型 Mu={mu1,mu2,...,mum}是根據(jù)該用戶對(duì)資源的操作歷史及其社群關(guān)系得到的資源序列集合,其中每個(gè)mu∈Mu為用戶u感興趣的一個(gè)資源序列。不失一般性,將mu表示為mu=r1r2...rm(m為該序列長(zhǎng)度,即用戶 u感興趣的一組相關(guān)資源數(shù)目,m<n)。就興趣模型存儲(chǔ)本身,將 r∈Rr表示為〈r,wr〉,wr為用戶對(duì) r的興趣度,基于用戶對(duì)r的操作(發(fā)布、轉(zhuǎn)發(fā)、...、以及來(lái)源于社群興趣等)賦予不同的權(quán)值。而在推薦時(shí),將根據(jù)興趣度對(duì)資源序列進(jìn)行篩選?;谥付ǖ膍u∈Mu的推薦,實(shí)際上需要在R中發(fā)現(xiàn)一個(gè)最適合推薦的資源序列Rr?R,使該序列中任一項(xiàng)r∈Rr滿足argmaxfrec(r|r1r2...rm),其中 frec為推薦指數(shù),frec(r|r1r2...rm)即用戶 u 對(duì) r1r2...rm感興趣的條件下、推薦資源r的指數(shù)。由于社會(huì)媒體推薦中“資源”已非原始粒度的信息,因此,資源的識(shí)別和描述將是一個(gè)新的問(wèn)題。同時(shí),如何對(duì)多層次資源和用戶興趣建模,如何進(jìn)行推薦條件判斷,乃至模型的維護(hù)和支持查詢的有效索引均為需要研究的問(wèn)題。

        2)社會(huì)媒體多模態(tài)內(nèi)容與資源質(zhì)量分析基礎(chǔ)研究。

        由于社會(huì)媒體中存在大量噪音、重復(fù)資源等質(zhì)量問(wèn)題,無(wú)論在構(gòu)建資源模型與用戶興趣模型、還是構(gòu)建用戶-資源信息網(wǎng)絡(luò)時(shí),均存在資源的質(zhì)量分析問(wèn)題,噪音和重復(fù)資源的檢測(cè)依賴于多模態(tài)內(nèi)容分析。此外,資源模型的表達(dá)是以計(jì)算兩資源ra、rb∈R的frec(ra|rb)為基礎(chǔ)的,而frec(ra|rb)正比于資源內(nèi)容相關(guān)性,內(nèi)容相關(guān)性的度量同樣依賴于多模態(tài)內(nèi)容分析。如前所述,這里的多模態(tài)內(nèi)容除包括媒體上下文線索、標(biāo)簽等元數(shù)據(jù)等語(yǔ)義信息外,視覺(jué)、聽(tīng)覺(jué)等內(nèi)容分析的基礎(chǔ)是特征提取,這需要將特征相關(guān)性問(wèn)題首先在不同類(lèi)別的特征中解決,再進(jìn)一步在多類(lèi)特征中融合。這樣,分層次、分類(lèi)別的特征提取將是一個(gè)重要的研究問(wèn)題。

        3)社會(huì)媒體異構(gòu)信息網(wǎng)絡(luò)社群挖掘技術(shù)研究。

        本節(jié)內(nèi)容1)中涉及的用戶興趣模型結(jié)構(gòu),是將用戶興趣模型表示為資源序列集合Mu={mu}m,一個(gè)用戶的Mu可以從該用戶對(duì)資源的發(fā)布和使用歷史獲得。在社會(huì)媒體中,一個(gè)更顯著的特點(diǎn)是基于用戶的網(wǎng)絡(luò)社會(huì)關(guān)系、也就是其所在的社群中其他用戶的興趣予以推斷。在本文中,社群本身也被視為一種綜合資源,通過(guò)社群挖掘獲得。前面提及,社會(huì)媒體中用戶和資源的關(guān)系構(gòu)成異構(gòu)信息網(wǎng)絡(luò),網(wǎng)絡(luò)中除顯式的鏈接(用戶對(duì)資源的操作)外,還包括資源內(nèi)容相關(guān)性以及由此導(dǎo)致的用戶相關(guān)性等隱式鏈接。

        4)社會(huì)媒體資源條件相關(guān)性挖掘技術(shù)研究。

        本節(jié)內(nèi)容1)、2)分別研究模型的結(jié)構(gòu)和各層次特征抽取及上下文線索的獲取問(wèn)題。而更為復(fù)雜的問(wèn)題是 frec(rl|rl-1,...,r1)關(guān)系的構(gòu)建,它涉及同一資源的不同模態(tài)、相同模態(tài)的不同資源以及不同模態(tài)的不同資源之間的條件相關(guān)性的計(jì)算問(wèn)題,多模態(tài)信息挖掘技術(shù)可望解決上述問(wèn)題。

        5)社會(huì)媒體綜合資源發(fā)現(xiàn)與推薦策略研究。

        綜合資源并非像單一資源或復(fù)合資源那樣顯式地存在,它是通過(guò)對(duì)系統(tǒng)資源挖掘并結(jié)合用戶興趣模型中的資源分析后發(fā)現(xiàn)的,是由若干相同或不同來(lái)源的、相同或不同媒體類(lèi)型的資源構(gòu)成的集合。此外,前面提及,用戶社群也是一種綜合資源。

        6)社會(huì)媒體資源與用戶興趣匹配機(jī)制研究。

        本節(jié)1)~5)的研究?jī)?nèi)容將資源模型表示為一系列 frec(ri|ri-1,...,r1)(i>1)關(guān)系及這些資源不同層次的特征,將用戶模型表示成一系列資源訪問(wèn)序列r1r2...rm及其中每個(gè)資源不同層次的特征。構(gòu)建該模型的最終目的是在系統(tǒng)資源中發(fā)現(xiàn)滿足用戶興趣的資源予以推薦。因此,應(yīng)用該模型推薦時(shí),首先應(yīng)在資源模型 frec(ri|ri-1,...,r1)的條件“ri-1,...,r1”中找到與用戶模型中的興趣資源序列“r1r2...rm”最匹配者,計(jì)算滿足該條件的所有frec(r|r1r2...rm),并將滿足 argmaxfrec(r|r1r2...rm)的資源 r(即具有最大推薦指數(shù)的資源)作為推薦候選。

        綜上所述,本文4.2節(jié)提出的挑戰(zhàn)與本節(jié)提出的研究方向之間的對(duì)應(yīng)關(guān)系如圖3所示。

        圖3 社會(huì)媒體推薦現(xiàn)狀、問(wèn)題挑戰(zhàn)與研究方向的對(duì)應(yīng)關(guān)系Fig.3 Relationship among present situation,challenges,and research direction in social media

        6 結(jié)束語(yǔ)

        本文分析了社會(huì)媒體中的用戶和資源所呈現(xiàn)的新特點(diǎn),提出社會(huì)媒體資源的推薦是對(duì)傳統(tǒng)的“基于內(nèi)容的推薦”、“基于協(xié)同過(guò)濾的推薦”及其混合模式的擴(kuò)展,具有“多模態(tài)的用戶興趣內(nèi)容分析”、“基于社會(huì)關(guān)系的協(xié)同過(guò)濾”和“面向用戶的多層次資源推薦”的特點(diǎn),進(jìn)而以此展開(kāi),綜述了基于社群的推薦、基于媒體內(nèi)容的推薦、基于多種因素的推薦等3種推薦策略的研究現(xiàn)狀,綜述了社會(huì)媒體用戶關(guān)系分析、社會(huì)媒體多模態(tài)信息挖掘、多模態(tài)信息相似性度量等3種社會(huì)媒體推薦的支撐技術(shù)的相關(guān)工作。在對(duì)研究現(xiàn)狀和相關(guān)工作討論的基礎(chǔ)上,將其概括為“社會(huì)媒體中用戶角色的變化構(gòu)成了更加復(fù)雜的用戶關(guān)系”、“社會(huì)媒體資源表現(xiàn)形式呈現(xiàn)多模態(tài)特點(diǎn)”、以及“社會(huì)媒體資源推薦應(yīng)該、并可以滿足多層次的用戶需求”,基于此提出了當(dāng)前社會(huì)媒體資源推薦面臨的挑戰(zhàn)及進(jìn)一步的研究方向。

        社會(huì)媒體是一個(gè)巨大的數(shù)據(jù)和信息資源,涉及眾多研究領(lǐng)域,基于社會(huì)媒體的資源推薦僅僅是其中的一個(gè)領(lǐng)域。本文僅從社會(huì)媒體資源推薦、特別是多模態(tài)與多層次資源推薦方面進(jìn)行了討論,其中所述的推薦策略和相關(guān)支撐技術(shù)本身均可作為一個(gè)研究方向并擴(kuò)展出更多新的研究和應(yīng)用,社會(huì)媒體與數(shù)據(jù)質(zhì)量、隱私保護(hù)、大數(shù)據(jù)分析處理等技術(shù)的結(jié)合,均為社會(huì)媒體研究的一些新領(lǐng)域。

        [1]ADOMAVICIUS G,TUZHILIN A.Toward the next generation of recommender systems:a survey of the state-of-the-art and possible extensions[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(6):734-749.

        [2]黃立威,李德毅.社交媒體中的信息推薦[J].智能系統(tǒng)學(xué)報(bào),2012,7(1):1-8.HUANG Liwei,LI Deyi.A review of information recommendation in social media[J].CAAI Transactions on Intelligent Systems,2012,7(1):1-8.

        [3]SUN Y,HAN J.Mining heterogeneous information networks:a structural analysis approach[J].SIGKDD Explorations,2012,14(2):20-28.

        [4]ZHU X,HUANG Z,SHEN H,et al.Linear cross-modal hashing for efficient multimedia search[C]//ACM Multimedia.Barcelona,Spain,2013:143-152.

        [5]WU P,HOI S,XIA H,et al.Online multimodal deep similarity learning with application to image retrieval[C]//ACM Multimedia.Barcelona,Spain,2013:153-162.

        [6]PAVLIDIS Y,MATHIHALLI M,CHAKRAVARTY I,et al.Anatomy of a gift recommendation engine powered by social media[C]//ACM SIGMOD Conference.Scottsdale,AZ,USA,2012:757-764.

        [7]POPESCU A,GREFENSTETTE G.Mining social media to create personalized recommendations for tourist visits[C]//2nd International Conference and Exhibition on Computing for Geospatial Research& Application.Washington,DC,USA,2011:37.

        [8]SCHIRRU R.Topic-based recommendations in enterprise social media sharing platforms[C]//ACM Conference on Recommender Systems.Barcelona, Spain,2010:369-372.

        [9]賈大文,曾承,彭智勇,等:一種基于用戶偏好自動(dòng)分類(lèi)的社會(huì)媒體共享和推薦方法[J].計(jì)算機(jī)學(xué)報(bào).2012,35(11):2381-2391.JIA Dawen,ZENG Cheng,PENG Zhiyong,et al.A user preference based automatic potential group generation method for social media sharing and recommendation[J].Chinese Journal of Computer,2012,35(11):2381-2391.

        [10]KOOHBORFARDHAGHIGHI S,KIM J.Using structural information for distributed recommendation in a social network[J].Applied Intelligence,2013,38(2):255-266.

        [11]LI L,PENG W,KATARIA S,et al.FRec:a novel framework of recommending users and communities in social media[C]//ACM International Conference on Information and Knowledge Management.San Francisco,CA,USA,2013:1765-1770.

        [12]ZHAO G,LEE M,HSU W,Et al.Community-based user recommendation in uni-directional social networks[C]//ACM International Conference on Information and Knowledge Management.San Francisco,CA,USA,2013:189-191.

        [13]ZHANG H,ZHA Z,YANG Y,et al.Attribute-augmented semantic hierarchy:towards bridging semantic gap and intention gap in image retrieval[C]//ACM Multimedia,Barcelona,Spain,2013:33-42.

        [14]BU J,TAN S,CHEN C,et al.Music recommendation by unified hypergraph:combining social media information and music content[C]//ACM Multimedia.Firenze,Italy,2010:391-400.

        [15]TAN S,BU J,CHEN C,et al.Using rich social media information for music recommendation via hypergraph model[C]//Social Media Modeling and Computing.London,UK,2011:213-237.

        [16]HU C,ZHANG C,WANG T,et al.An adaptive recommendation system in social media[C]//45th Hawaii International Conference on System Sciences.Maui,USA,2012:1759-1767.

        [17]MA X,WANG H,LI H,et al.Enhancing recommended video lists for youtube-like social media[C]//IEEE International Workshop on Multimedia Signal Processing.Banff,AB,Canada,2012:244-249.

        [18]ERNESTO D,LUCAS D,LARS S,et al.Real-time top-n recommendation in social streams[C]//ACM Conference on Recommender Systems.Dublin,Ireland,2012:59-66.

        [19]LI Q,WANG J,CHEN Y,et al.User comments for news recommendation in forum-based social media[J].Information Science,2013,180(24):4929-4939.

        [20]MESSENGER A,WHITTLE J.Recommendations based on user-generated comments in social media[C]//IEEE Third International Conference on Social Computing.Boston,MA,USA,2011:505-508.

        [21]PERA M,CONDIE N,NG Y.Personalized book recommendations created by using social media data[C]//WISE 2010 International Symposium WISS,and International Workshops CISE,MBC,Hong Kong,China,2010:390-403.

        [22]GUY I,ZWERDLING N,RONEN I,et al.Social media recommendation based on people and tags[C]//ACM SIGIR Conference on Research and Development in Information Retrieval,Geneva,Switzerland,2010:194-201.

        [23]WU S,RAND W,RASCHID L.Recommendations in social media for brand monitoring[C]//ACM Conference on Recommender Systems.Chicago,IL,USA,2011:345-348.

        [24]XIANG Z.Dynamic social media in online travel information search:a preliminary analysis[C]//International Conference in Innsbruck,Innsbruck,Austria,2011:343-353.

        [25]Chidlovskii B.Learning recommendations in social media systems by weighting multiple relations[C]//Machine Learning and Knowledge Discovery in Databases-European Conference.Athens,Greece,2011:328-334.

        [26]LIU L,XU H,XING J,et al."Wow!You are so beautiful today!"[C]//ACM Multimedia,Barcelona,Spain,2013:3-12.

        [27]SUN Y,NORICK B,HAN J,et al.Integrating meta-path selection with user-guided object clustering in heterogeneous information networks[C]//ACM SIGKDD Conference.Beijing,China,2012:1348-1356.

        [28]GUY I,JACOVI M,PERER A,et al.Same places,same things,same people?:Mining user similarity on social media[C]//ACM Conference on Computer Supported Cooperative Work.Savannah,Georgia,USA,2010:41-50.

        [29]BARBIER G,TANG L,LIU H.Understanding online groups through social media[J].Wiley Interdisciplinary Reviews:Data Mining and Knowledge Discovery,2011,1(4):330-338.

        [30]YANG C,YANG H,TANG X,et al.Identifying implicit relationships between social media users to support social commerce[C]//International Conference on Electronic Commerce.Singapore 2012:41-47.

        [31]JORGE C,ALNEU L.Exploiting behaviors of communities of twitter users for link prediction[J].Social Network A-nalysis and Mining,2013,3(4):1063-1074.

        [32]TANG J,WANG M,HUA X,et al.Social media mining and search[J].Multimedia Tools and Applications,2012,56(1):1-7.

        [33]LEE C.Unsupervised and supervised learning to evaluate event relatedness based on content mining from socialmedia streams[J].Expert Systems with Applications,2012,39(18):13338-13356.

        [34]JIN X,LIN C,LUO J,et al.SocialSpamGuard:A data mining-based spam detection system for social media networks[J].Proceedings of the VLDB Endowment,2011,4(12):1458-1461.

        [35]LEE C,CROFT W,KIM J.Evaluating search in personal social media collections[C]//International Conference on Web Search and Web Data Mining.Seattle,WA,USA,2012:683-692.

        [36]CHOUDHURY M,COUNTS S,CZERWINSKI M.Find me the right content!diversity-based sampling of social media spaces for topic-centric search[C]//International Conference on Weblogs and Social Media.Barcelona,Catalonia,Spain 2011.

        [37]TSAI F.Probabilistic models for social media mining[J].International Journal of Information Technology and Web Engineering,2011,6(1):13-24.

        [38]KASCHESKY M,SOBKOWICZ P,BOUCHARD G.Opinion mining in social media:modeling,simulating,and visualizing political opinion formation in the Web[C]//12th Annual International Conference on Digital Government Research.MD,USA,2011:317-326.

        [39]JIN X,WANG C,LUO J,et al.LikeMiner:a system for mining the power of‘like’in social media networks[C]//International Conference on Knowledge Discovery and Data Mining.San Diego,CA,USA,2011:753-756.

        [40]CUI B,TUNG A,ZHANG C,et al.Multiple feature fusion for social media applications[C]//Proc ACM SIGMOD,Conference.Indianapolis,Indiana,USA,2010:435-446.

        [41]SAXTON G,OH O,KISHORE R.Rules of crowdsourcing:models,issues,and systems of control[J].Information Systems Management,2013,30(1):2-20.

        [42]RAWASHDEH M,KIM H,EL-SADDIK A.Social media annotation and tagging based on folksonomy link prediction in a tripartite graph[C]//Advances in Multimedia Modeling.Huangshan,China,2013:24-35.

        [43]LIU L,ZHU F,JIANG M,et al.Mining diversity on social media networks[J].Multimedia Tools and Applications,2012,56(1):179-205.

        [44]LING L,ZHAI X,PENG Y.Tri-space and ranking based heterogeneous similarity measure for cross-media retrieval[C]//International Conference on Pattern Recognition.Tsukuba,Japan,2012:230-233.

        [45]ZHAI X,PENG Y,XIAO J.Effective heterogeneous similarity measure with nearest neighbors for cross-media retrieval[C]//Advances in Multimedia Modeling.Klagenfurt,Austria,2012:312-322.

        [46]JIA Y,SALZMANN M,DARRELL T.Learning cross-modality similarity for multinomial data[C]//IEEE International Conference on Computer Vision.Barcelona,Spain,2011:2407-2414.

        [47]WU F,LU X,ZHANG Z,et al.Cross-media semantic representation via bi-directional learning to rank[C]//ACM Multimedia.Barcelona,Spain,2013:877-886

        [48]XIE L,SHAMMA D,SNOEK C.Content is dead:longlive content![C]//ACM Multimedia.Nara, Japan,2012:7-8.

        猜你喜歡
        模態(tài)資源內(nèi)容
        內(nèi)容回顧溫故知新
        基礎(chǔ)教育資源展示
        一樣的資源,不一樣的收獲
        資源回收
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        主要內(nèi)容
        臺(tái)聲(2016年2期)2016-09-16 01:06:53
        國(guó)內(nèi)多模態(tài)教學(xué)研究回顧與展望
        基于HHT和Prony算法的電力系統(tǒng)低頻振蕩模態(tài)識(shí)別
        由單個(gè)模態(tài)構(gòu)造對(duì)稱簡(jiǎn)支梁的抗彎剛度
        多模態(tài)話語(yǔ)模態(tài)的協(xié)同及在外語(yǔ)教學(xué)中的體現(xiàn)
        日韩一区二区av极品| 三级国产女主播在线观看| 加勒比熟女精品一区二区av | 破了亲妺妺的处免费视频国产| 欧美成人免费全部| chinesefreexxxx国产麻豆| 欧美日韩性视频| 新久久久高清黄色国产| 久久久麻豆精亚洲av麻花 | 亚洲精品粉嫩美女一区| 蜜桃视频一区二区在线观看| 日本无码人妻波多野结衣| 国产成人精选在线不卡| 日本视频一区二区二区| 亚洲综合日韩精品一区二区| 国产裸体美女永久免费无遮挡| 秘书边打电话边被躁bd视频| 精品少妇一区二区三区免费观| 一进一出一爽又粗又大| 亚洲一本到无码av中文字幕| 免费中文熟妇在线影片| 亚洲av第二区国产精品| 国产三级精品三级在线专区| 日本免费视频| 久久久久亚洲av成人网人人网站| 亚洲女初尝黑人巨高清| 亚洲av无码乱观看明星换脸va | 精品国产天堂综合一区在线 | 中文字幕天堂网| 日本高清一区二区不卡视频| 国产av一区二区网站| 国产乱妇无码大片在线观看| 国产xxxx99真实实拍| 无码人妻精品一区二区三区下载| 国产毛片三区二区一区| 亚洲女优中文字幕在线观看 | 国产av麻豆mag剧集| 国产污污视频| 日本一区二区高清视频| 无码人妻一区二区三区免费看 | 亚洲国产福利成人一区二区|