張朝旭,劉 云
(北京交通大學(xué)通信與信息系統(tǒng)北京市重點(diǎn)實驗室,北京100044)
隨著互聯(lián)網(wǎng)進(jìn)入Web2.0時代,社交網(wǎng)絡(luò)作為Web2.0中的典型應(yīng)用和創(chuàng)新2.0模式在互聯(lián)網(wǎng)領(lǐng)域的典型體現(xiàn),逐漸成為當(dāng)前互聯(lián)網(wǎng)領(lǐng)域的一個研究熱點(diǎn)。
眾多社交網(wǎng)絡(luò)服務(wù)(SNS)網(wǎng)站在提供應(yīng)用服務(wù)的同時都積累了海量的數(shù)據(jù)信息,包括用戶個人信息、用戶關(guān)系信息,以及用戶之間的交互信息。用戶數(shù)目多、數(shù)據(jù)量大、用戶關(guān)系復(fù)雜,龐大而冗余的數(shù)據(jù)集給用戶行為分析、用戶發(fā)現(xiàn)潛在好友和興趣空間都造成了困難。建立一個合理的感知模型,通過科學(xué)的方法和手段從這些海量的數(shù)據(jù)中更加準(zhǔn)確和快速地感知用戶所需要的上下文信息,就可以幫助社交網(wǎng)絡(luò)的運(yùn)營商及時準(zhǔn)確地掌握用戶的興趣或行為的變化情況,更好地支持社交網(wǎng)絡(luò)中的用戶行為分析、潛在好友推薦等系統(tǒng)應(yīng)用。本文利用CSCW領(lǐng)域相對成熟的感知模型,結(jié)合社交網(wǎng)絡(luò)基于關(guān)系的基本特性,提出一種新穎的基于關(guān)系的社交網(wǎng)絡(luò)感知模型。
社交網(wǎng)絡(luò)作為Web2.0的典型和熱門應(yīng)用,是以一定的社會關(guān)系或共同興趣為聯(lián)系紐帶,提供各種形式在線聚合服務(wù)的互聯(lián)網(wǎng)應(yīng)用。社交網(wǎng)絡(luò)是由眾多節(jié)點(diǎn)以及節(jié)點(diǎn)之間的連線構(gòu)成的一種社會結(jié)構(gòu),節(jié)點(diǎn)通常是個人或者群體,節(jié)點(diǎn)之間的連線表示的是個人或群體之間的關(guān)系。通常是社交網(wǎng)絡(luò)代表各種社會關(guān)系,通過這些社會關(guān)系,把從偶然相識的泛泛之交到緊密結(jié)合的家庭關(guān)系的各種人或群體串連起來。社交網(wǎng)絡(luò)是一種基于網(wǎng)絡(luò)的服務(wù),并且為用戶提供以下幾種功能:
(1)在系統(tǒng)范圍內(nèi),創(chuàng)建并共享一個公開或半公開的個人資料;
(2)提供與他們共享同一個連接的其他用戶列表;
(3)查看和遍歷他們的好友鏈接列表和其他用戶的好友鏈接。
即使在CSCW領(lǐng)域,對于感知也并沒有明確的定義,但存在一個普遍認(rèn)同的共識,即感知是個人或群組主體對周圍環(huán)境上下文的了解和認(rèn)知。其中對周圍物質(zhì)環(huán)境的認(rèn)知稱為環(huán)境感知,在社交網(wǎng)絡(luò)中表現(xiàn)為社交網(wǎng)絡(luò)規(guī)模、特征、性質(zhì)和結(jié)構(gòu)等內(nèi)容的感知;對社會環(huán)境上下文的認(rèn)知則稱為群體感知,在社交網(wǎng)絡(luò)中表現(xiàn)為對網(wǎng)絡(luò)中用戶身份、共享的資源、用戶活動等的感知[1]。社交網(wǎng)絡(luò)和CSCW群組的幾個主要差異如表1。
表1 社交網(wǎng)絡(luò)和CSCW群組比較[2]
由表1可見,社交網(wǎng)絡(luò)與CSCW中的群組最大的區(qū)別在于前者以社會關(guān)系和個人興趣空間作為基礎(chǔ),而后者以任務(wù)為基礎(chǔ)。CSCW領(lǐng)域中環(huán)境感知和群體感知的內(nèi)容都可以歸為上下文信息。上下文信息是用戶在與社交網(wǎng)絡(luò)應(yīng)用程序交互的過程中產(chǎn)生的一系列數(shù)據(jù)集合,包括社區(qū)的環(huán)境信息,如社區(qū)規(guī)模、個人中心度、網(wǎng)絡(luò)集中性等;也包括群組信息,包括群組中其他用戶的身份,共享的資料(如興趣、偏好、位置等),用戶的活動(如發(fā)布狀態(tài)、共享日志、上傳照片等),用戶的社會關(guān)系(如用戶的好友資料、參加的小組等)等。
對于群體感知技術(shù)的主要研究方向有2個:(1)群體感知模型的建立。(2)感知的具體實現(xiàn)手段。其中前者主要研究群體感知的形式描述和性質(zhì)刻畫,后者主要研究的是具體的感知功能實現(xiàn)技術(shù)。本文研究的重點(diǎn)是前者群體感知模型的建立。當(dāng)前出現(xiàn)的群體感知模型有以下幾種:基于空間對象的感知模型、基于角色的感知模型、基于任務(wù)的感知模型和基于用戶的群體感知模型。下面對幾類模型的原理和特點(diǎn)做簡要的分析。
其中Benford和Fahlen提出的基于空間對象的感知模型[3],利用對象的空間特性作為2個對象之間交互的基礎(chǔ),通過對象的影響(aura)空間和興趣(focus)空間的交并關(guān)系描述2個對象之間的感知強(qiáng)度。但作者只提出了一個模型的概念,缺乏具體的理論推導(dǎo)過程和精確的感知強(qiáng)度計算方法。
葛聲等人提出了一種基于角色的群體感知模型及其實現(xiàn)機(jī)制[4~5]。該模型通過任務(wù)分解和角色細(xì)化,對用戶活動進(jìn)行基于角色的集合劃分,然后根據(jù)角色差異度確定用戶和活動之間的感知強(qiáng)度。該模型是建立在模型靜態(tài)的假設(shè)之上,無法適用于結(jié)構(gòu)動態(tài)變化的群組,更無法應(yīng)用于用戶可以自組和定義群組結(jié)構(gòu)的社交網(wǎng)絡(luò)。
閆臨霞和曾建潮提出了一種基于任務(wù)的群體感知模型[6],并提出了該模型的形式化描述[7]。該模型認(rèn)為用戶通過任務(wù)建立彼此之間的聯(lián)系,并且任務(wù)對群體感知特性的刻畫粒度要比角色更細(xì)。但該模型對感知粒度的控制還是比較困難,難以描述動態(tài)變化的感知信息。
丁振國等人提出了基于用戶的細(xì)粒度可控的群體感知模型[8],該模型基于多成員組成的有機(jī)群組結(jié)構(gòu)和事件處理機(jī)制,通過對用戶的角色和任務(wù)分解來計算協(xié)作感知強(qiáng)度。試圖解決感知粒度的控制??纱嬖谥巧腿蝿?wù)難以分解的問題,而且也沒有給出具體的實現(xiàn)機(jī)制。
由于以上提到的現(xiàn)有群體感知模型均是為CSCW系統(tǒng)而設(shè)計的,而且存在感知強(qiáng)度無法精確量化、難以描述動態(tài)變化感知信息等問題。在CSCW領(lǐng)域,通常采用任務(wù)、角色和活動這3個基本元素來描述群組結(jié)構(gòu),以此為基礎(chǔ)構(gòu)建群體感知模型。而社交網(wǎng)絡(luò)的核心是用戶之間的社會關(guān)系,不是基于任務(wù)、角色等其他屬性的。因此在社交網(wǎng)絡(luò)中研究的主體往往不是單個的用戶或者群體,而是2個或多個用戶之間的關(guān)系,并且用這種關(guān)系來描述群組結(jié)構(gòu)。
結(jié)合社交網(wǎng)絡(luò)的這個特點(diǎn),提出了下面基于關(guān)系的社交網(wǎng)絡(luò)感知模型。
互聯(lián)網(wǎng)上的用戶關(guān)系指的是2個或多個用戶之間的資源交換,每一次用戶之間的資源交換都可以認(rèn)為是一個用戶關(guān)系的基本單位,發(fā)出資源交換請求的用戶稱為關(guān)系請求方,接受資源交換請求的用戶成為關(guān)系接受方。而每一種類型的交換都可以認(rèn)為是一種互聯(lián)網(wǎng)用戶關(guān)系。
最早互聯(lián)網(wǎng)上的關(guān)系的形成是MSN、QQ、Gtalk等即時聊天工具(IM)構(gòu)建的一種雙向的關(guān)系,這種關(guān)系需要一方發(fā)出請求,另外一方接受請求后才構(gòu)建的。這種雙向用戶關(guān)系可以用無向圖來表示。之后以Twitter和新浪微博為代表的社交網(wǎng)絡(luò),將原來的雙向用戶關(guān)系切割成2個單向的關(guān)系。用戶可以主動關(guān)注別人,但是別人不一定要反過來關(guān)注,甚至可以屏蔽對方。實際上這種單向的關(guān)系是IM中雙向關(guān)系的一種延伸,用戶相互關(guān)注其實就可以認(rèn)為是一種IM上的好友的關(guān)系。而這種單向的用戶關(guān)系可以用有向圖來表示。
社交網(wǎng)絡(luò)中存在著一個由用戶自主維護(hù)的關(guān)系矩陣,該矩陣不僅能表示用戶關(guān)系的數(shù)量,也表示用戶關(guān)系的質(zhì)量。而這2者正是衡量用戶關(guān)系的2個基本元素,也是維持社交網(wǎng)絡(luò)正常運(yùn)作的2個關(guān)鍵因素。其中關(guān)系數(shù)量可以用關(guān)系復(fù)雜度來衡量,而關(guān)系質(zhì)量則用關(guān)系強(qiáng)度表示。
根據(jù)關(guān)系復(fù)雜度,社交網(wǎng)絡(luò)模型可以分為單一關(guān)系社交網(wǎng)絡(luò)模型和多關(guān)系社交網(wǎng)絡(luò)模型[2]。單一關(guān)系模型中只存在一種類型的用戶關(guān)系,可用有向圖來表示。其中有向圖的頂點(diǎn)表示用戶,邊表示用戶關(guān)系。而多關(guān)系模型中存在多種類型的用戶關(guān)系,如同事、親屬、好友等??捎糜邢蛉旧珗D來表示,其中有向染色圖的頂點(diǎn)表示用戶,邊表示用戶關(guān)系,顏色表示關(guān)系的類別,如圖1。
而關(guān)系強(qiáng)度,是對相同關(guān)系質(zhì)量或者說強(qiáng)弱度的描述,如剛認(rèn)識的人、普通好友和特別關(guān)注的好友等。關(guān)系強(qiáng)度通常包括用戶之間的緊密度、信任度、親密度、關(guān)系持續(xù)性和交互頻度等基本屬性。根據(jù)關(guān)系強(qiáng)度,社交網(wǎng)絡(luò)模型可以分為強(qiáng)關(guān)系模型和弱關(guān)系模型。弱關(guān)系通常存在于非親密交互和偶然性關(guān)系當(dāng)中,如社交網(wǎng)絡(luò)中對陌生人發(fā)表狀態(tài)的共享;而強(qiáng)關(guān)系則表示具有較高親密度的關(guān)系,如社交網(wǎng)絡(luò)中對好友上傳照片的分享和評價。
圖1 社交網(wǎng)絡(luò)的有向圖和有向染色圖表示
由以上分析可知,社交網(wǎng)絡(luò)中關(guān)系的強(qiáng)度和復(fù)雜度是描述社交網(wǎng)絡(luò)感知模型的2個基本元素。我們通過社交網(wǎng)絡(luò)中的關(guān)系強(qiáng)度和關(guān)系復(fù)雜度,更加科學(xué)和有效地刻畫和描述社交網(wǎng)絡(luò)的感知特性,構(gòu)建了基于關(guān)系的社交網(wǎng)絡(luò)感知模型。
本文將基于關(guān)系的社交網(wǎng)絡(luò)感知模型(Tiesbased Social Networks Awareness Model,簡稱TSNAM)定義為如下二元組:
其中C表示的是關(guān)系復(fù)雜度(Complexity),而I表示的是關(guān)系強(qiáng)度(Intensity)。
(1) 社交網(wǎng)絡(luò)中存在多種類型的關(guān)系,一般用多關(guān)系模型表示。因此社交網(wǎng)絡(luò)的關(guān)系復(fù)雜度可以用下面的無向染色圖公式表示:
其中USERsn表示頂點(diǎn)集合,也就是用戶集;TIEsn表示邊集合,也就是用戶關(guān)系集合;而COLOR表示的是顏色集合,也就是用戶關(guān)系類別。
(2)對于關(guān)系強(qiáng)度,我們可以用2個用戶之間的感知強(qiáng)度來表示。當(dāng)2個用戶user1和user2之間的距離Length(user1, user2)最近的時候,他們彼此之間的感知強(qiáng)度最大。計算方法如下:
其中k是經(jīng)驗系數(shù)。在不同的社交網(wǎng)絡(luò)和不同的應(yīng)用場景中,取不同的值,以得到最為準(zhǔn)確的感知強(qiáng)度計算方法。
本文在深入研究群體感知模型的基礎(chǔ)上,提出了基于關(guān)系的社交網(wǎng)絡(luò)感知模型。
由于感知技術(shù)和模型是社交網(wǎng)絡(luò)研究領(lǐng)域的主要組成部分,而社交網(wǎng)絡(luò)的根本是用戶的社會關(guān)系和興趣空間。因此本文提出的基于關(guān)系的社交網(wǎng)絡(luò)感知模型,對于實際社交網(wǎng)絡(luò)中的上下文感知有著很好的應(yīng)用。適用于社交網(wǎng)絡(luò)中的用戶行為分析、潛在好友發(fā)現(xiàn)以及推薦等應(yīng)用。
而本文下一步的工作是對基于關(guān)系的社交網(wǎng)絡(luò)感知模型,提出一個合理高效的算法和科學(xué)可行的實現(xiàn)機(jī)制,并且通過仿真過程驗證模型的科學(xué)性、算法的復(fù)雜度、實現(xiàn)機(jī)制的可行性。
[1] Joachim Kimmerle, Ulrike Cress. Group awareness and selfpresentation in computer-supported information exchange [J] .International Journal of Computer-Supported Collaborative Learning, 2008, 3(1): 85-97.
[2] 李建國,湯庸. 社交網(wǎng)絡(luò)中感知技術(shù)的研究與應(yīng)用[J] . 計算機(jī)科學(xué),2009,36(11):152-156.
[3] Steve Benford, Lennart Fahlen. A Spatial Model of Interaction in Large Virtual Environments[C] . Proceedings of the Third European Conference on Computer-Supported Cooperative Work. 1993(9).
[4] 葛聲,馬殿富,懷進(jìn)鵬. 基于角色的群體感知模型[J] . 軟件學(xué)報,2001,12(6):864-871.
[5] 葛聲,懷進(jìn)鵬. 基于角色的群體感知模型實現(xiàn)機(jī)制[J] . 計算機(jī)工程與應(yīng)用,2001,37(23):9-13.
[6] 閆臨霞,曾建潮.基于任務(wù)的群體感知模型的形式化描述[J] . 計算機(jī)工程與應(yīng)用,2005(30):84-88.
[7] 閆臨霞,曾建潮. 基于任務(wù)的群體感知模型[J] . 太原重型機(jī)械學(xué)院學(xué)報,2004,25(2):115-120.
[8] 丁振國,劉杰. 基于用戶的細(xì)粒度可控群體感知模型[J] .航空計算科學(xué),2008,38(6):39-42.
[9] 黃帆,湯庸. 上下文技術(shù)在群體感知中的研究與應(yīng)用[J] . 計算機(jī)研究與發(fā)展,2007(44):341-348.
[10] D Boyd, N Ellison. Social Network Sites: Definition, History,and Scholarship[J] . Journal of Computer-MediatedCommunication, 2008, 13(1): 210-230.