徐焱
摘要:采用傳統(tǒng)統(tǒng)計(jì)方法很難直觀了解大規(guī)模社交網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)和演化特征。通過對(duì)科學(xué)網(wǎng)博客域名下的網(wǎng)頁進(jìn)行搜索,建立一個(gè)由244 662個(gè)博主和113 062對(duì)好友關(guān)系構(gòu)成的復(fù)雜網(wǎng)絡(luò)——科學(xué)網(wǎng)博客博主好友關(guān)系網(wǎng)絡(luò)。采用復(fù)雜網(wǎng)絡(luò)理論進(jìn)行研究,測(cè)算網(wǎng)絡(luò)度分布、平均路徑長(zhǎng)度和聚類系數(shù),發(fā)現(xiàn)該網(wǎng)絡(luò)具有無尺度屬性和小世界屬性,存在相對(duì)較多的集散節(jié)點(diǎn),導(dǎo)致網(wǎng)絡(luò)的度分布冪指數(shù)小于正常范圍。通過逐步刪除高連接度節(jié)點(diǎn),觀察網(wǎng)絡(luò)破碎程度,分析了集散節(jié)點(diǎn)在維持社交網(wǎng)絡(luò)鏈接中的重要性,建議重點(diǎn)關(guān)注10%的最高度節(jié)點(diǎn),使網(wǎng)絡(luò)更加健壯。該研究有助于闡明在線社交網(wǎng)絡(luò)的自組織結(jié)構(gòu)性質(zhì)。
關(guān)鍵詞關(guān)鍵詞:在線社交網(wǎng)絡(luò);復(fù)雜網(wǎng)絡(luò);拓?fù)浣Y(jié)構(gòu);集散節(jié)點(diǎn)
DOIDOI:10.11907/rjdk.172730
中圖分類號(hào):TP319
文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào)文章編號(hào):16727800(2017)011017604
0引言
隨著Web 2.0技術(shù)的迅速發(fā)展,人們進(jìn)入了在線社交網(wǎng)絡(luò)(Online Social Network,OSN)時(shí)代。在線社交網(wǎng)絡(luò)成為一種廣泛使用的人際交往方式,為用戶帶來了新的體驗(yàn),社交網(wǎng)絡(luò)研究得到了廣泛關(guān)注。
社交網(wǎng)站與一般信息網(wǎng)站的不同之處在于其擁有數(shù)量龐大的注冊(cè)用戶,而且用戶之間存在錯(cuò)綜復(fù)雜的好友關(guān)系,這些好友關(guān)系將所有用戶連在一起,形成了一個(gè)龐大的好友網(wǎng)絡(luò)。隨著新用戶的注冊(cè),陌生人之間隨時(shí)都可能形成新的好友關(guān)系,這個(gè)好友網(wǎng)絡(luò)在快速演化。研究這個(gè)龐大的好友網(wǎng)絡(luò),從錯(cuò)綜復(fù)雜的關(guān)系中理出頭緒,挖掘和發(fā)現(xiàn)新的知識(shí),是研究工作的重點(diǎn)。
在線社交網(wǎng)絡(luò)涉及經(jīng)濟(jì)、政治、娛樂、軍事、衛(wèi)生、科技、體育和生活等領(lǐng)域,為知識(shí)共享、信息傳遞和人類交互提供了便捷的通信平臺(tái),帶來了巨大的商業(yè)機(jī)會(huì)。在線社交網(wǎng)絡(luò)中大量信息來源不確定,存在一些不良、虛假或煽動(dòng)性信息,可能對(duì)社會(huì)穩(wěn)定產(chǎn)生很大的負(fù)面影響。隨著在線社交網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)已經(jīng)成為輿論傳播的重要途徑。因此,如何通過社會(huì)網(wǎng)絡(luò)監(jiān)測(cè)控制輿論特別是恐怖行為的傳播,已經(jīng)成為一個(gè)非常急迫的問題[1]。社交網(wǎng)絡(luò)包含大量的內(nèi)容和鏈接數(shù)據(jù),可以用于分析。鏈接數(shù)據(jù)本質(zhì)是社會(huì)網(wǎng)絡(luò)和實(shí)體間通信的圖形結(jié)構(gòu)。在線社交網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的實(shí)證分析,有助于確定網(wǎng)絡(luò)的重要節(jié)點(diǎn)、社區(qū)、鏈路和演化區(qū)域,理解各種動(dòng)態(tài)過程。
在線社交網(wǎng)絡(luò)具有復(fù)雜性、大規(guī)模、非線性和快速演化等特征,與一般網(wǎng)絡(luò)有很大區(qū)別。因此,與傳統(tǒng)信息系統(tǒng)相比,其挖掘目標(biāo)和研究方法大不相同。
關(guān)于復(fù)雜網(wǎng)絡(luò)的研究方興未艾,1998年Strogatz和Watts[2]在《Nature》雜志上發(fā)表文章,提出了小世界(SmallWorld)網(wǎng)絡(luò)模型概念。1999年Barabasi和Albert[3]在《Science》上發(fā)表文章,提出了無尺度(ScaleFree)網(wǎng)絡(luò)概念,指出許多復(fù)雜網(wǎng)絡(luò)鏈接度分布具有典型的冪律形式。這兩項(xiàng)開創(chuàng)性研究掀起了一股研究復(fù)雜網(wǎng)絡(luò)熱潮。
著名科學(xué)家錢學(xué)森把復(fù)雜網(wǎng)絡(luò)定義為具有自相似、自組織、小世界、無尺度的網(wǎng)絡(luò)。復(fù)雜網(wǎng)絡(luò)在自然界、工程界、生物界和人類社會(huì)界中廣泛存在,如蛋白質(zhì)網(wǎng)絡(luò)、食物鏈網(wǎng)絡(luò)、新陳代謝網(wǎng)絡(luò)、萬維網(wǎng)、Internet、電力網(wǎng)、鐵路網(wǎng)、航空網(wǎng)、演員合作網(wǎng)絡(luò)、朋友關(guān)系網(wǎng)、科學(xué)家合作網(wǎng)及金融網(wǎng)絡(luò)等都是復(fù)雜網(wǎng)絡(luò)。
復(fù)雜網(wǎng)絡(luò)的復(fù)雜性主要體現(xiàn)在節(jié)點(diǎn)數(shù)量巨大,而且節(jié)點(diǎn)之間的連接關(guān)系較為復(fù)雜,既不像隨機(jī)網(wǎng)絡(luò)那樣具有完全不確定的連接關(guān)系,也不像規(guī)則網(wǎng)絡(luò)那樣具有完全確定的連接關(guān)系,而是介于兩者之間[4]。復(fù)雜網(wǎng)絡(luò)及其演化研究已經(jīng)成為多學(xué)科交叉的研究方向。
社交網(wǎng)絡(luò)擁有數(shù)量龐大的用戶,而且用戶之間的連接關(guān)系錯(cuò)綜復(fù)雜,是一種典型的復(fù)雜網(wǎng)絡(luò)。因此,可以用復(fù)雜網(wǎng)絡(luò)理論研究社交網(wǎng)絡(luò)。
本文重點(diǎn)研究科學(xué)網(wǎng)博客,即Science Net Blog[5]??茖W(xué)網(wǎng)博客是提供交流和共享科學(xué)信息的平臺(tái),在中國(guó)擁有2萬多注冊(cè)用戶。通過網(wǎng)絡(luò)爬蟲抓取網(wǎng)站上的公開信息獲取數(shù)據(jù),并將數(shù)據(jù)用于研究。研究重點(diǎn)是該網(wǎng)站內(nèi)的社交網(wǎng)絡(luò)用戶,具體研究用戶關(guān)系圖中最大連接片的屬性,而不是整個(gè)用戶社區(qū),這代表了構(gòu)建復(fù)雜系統(tǒng)模型的新框架。通過計(jì)算科學(xué)網(wǎng)博客網(wǎng)絡(luò)的拓?fù)涮匦?,包括度分布、平均聚類系?shù)和平均路徑長(zhǎng)度,進(jìn)行詳細(xì)分析,證實(shí)了科學(xué)網(wǎng)博客既是無尺度網(wǎng)絡(luò)又是小世界網(wǎng)絡(luò);此外,還證明了復(fù)雜網(wǎng)絡(luò)中重要節(jié)點(diǎn)的數(shù)量非常少,這意味著如果控制這些節(jié)點(diǎn),消息的傳播將被控制。
1復(fù)雜網(wǎng)絡(luò)拓?fù)鋵傩?/p>
1.1拓?fù)鋵傩?/p>
(1)節(jié)點(diǎn)度和度分布。節(jié)點(diǎn)的度是網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)連接到該網(wǎng)絡(luò)中其它節(jié)點(diǎn)的邊數(shù),用k表示。網(wǎng)絡(luò)的度分布是該網(wǎng)絡(luò)中所有節(jié)點(diǎn)的度的概率分布[6]。
(2)路徑長(zhǎng)度和平均路徑長(zhǎng)度。路徑長(zhǎng)度是從一個(gè)節(jié)點(diǎn)到另一個(gè)節(jié)點(diǎn)必須遍歷的最小邊數(shù)[7]。平均值長(zhǎng)度是任何節(jié)點(diǎn)對(duì)之間的路徑長(zhǎng)度平均值。
(3)聚類系數(shù)。聚類系數(shù)表示在一個(gè)網(wǎng)絡(luò)中同一個(gè)頂點(diǎn)的鄰居之間有邊連接的平均概率。按照Watts和Strogatz的定義,如果一個(gè)節(jié)點(diǎn)v有k個(gè)鄰居,其鄰點(diǎn)將可能存在的最大邊數(shù)是2,實(shí)際存在的邊數(shù)用Ei表示,則節(jié)點(diǎn)v的聚類系數(shù)定義為;所有節(jié)點(diǎn)的聚類系數(shù)的平均值定義為整個(gè)網(wǎng)絡(luò)的聚類系數(shù)C[2]。
1.2隨機(jī)、無規(guī)模和小世界網(wǎng)絡(luò)
20世紀(jì)60年代,鄂爾多斯(Red)和雷尼(Reyni)[8]發(fā)表了開創(chuàng)性的論文,之后隨機(jī)網(wǎng)絡(luò)被廣泛研究。隨機(jī)網(wǎng)絡(luò)圖通常通過隨機(jī)添加鏈接到靜態(tài)節(jié)點(diǎn)集來構(gòu)造,這意味著每個(gè)節(jié)點(diǎn)以相等概率p隨機(jī)連接到圖形中。大規(guī)模隨機(jī)圖具有高斯度分布,隨機(jī)網(wǎng)絡(luò)的主要特征是平均路徑長(zhǎng)度很短、聚類系數(shù)低。相反,規(guī)則網(wǎng)絡(luò)通常具有非常長(zhǎng)的平均路徑和高聚類系數(shù)。
描述真實(shí)世界網(wǎng)絡(luò)的大多數(shù)圖形顯著偏離了簡(jiǎn)單的隨機(jī)圖模型。Barabasi和Albert[3]發(fā)現(xiàn)一些網(wǎng)絡(luò)具有冪律形式的度分布:即節(jié)點(diǎn)具有度k的概率為Prob(k)~k-λ。度數(shù)指數(shù)λ通常在2~3之間,并且度分布的冪律衰減非常緩慢(“長(zhǎng)尾”),這意味著網(wǎng)絡(luò)缺乏特征尺度,這樣的網(wǎng)絡(luò)稱為“無尺度”網(wǎng)絡(luò)。Barabasi和Albert提出了“BarabasiAlbert模型”,并展示了無尺度網(wǎng)絡(luò)可以源自一個(gè)過程,每個(gè)連接到網(wǎng)絡(luò)的節(jié)點(diǎn)優(yōu)先連接那些度比較高的節(jié)點(diǎn)。endprint
Watts和Strogatz[2]發(fā)現(xiàn)了一些網(wǎng)絡(luò)介于規(guī)則網(wǎng)絡(luò)和隨機(jī)網(wǎng)絡(luò)之間。規(guī)則網(wǎng)絡(luò)的平均路徑長(zhǎng)度很長(zhǎng),但是它的聚類系數(shù)很高;隨機(jī)網(wǎng)絡(luò)平均路徑長(zhǎng)度小,但是聚類系數(shù)很低。而介于這兩者之間的網(wǎng)絡(luò),具有較小的平均路徑和較高的聚類系數(shù),這類網(wǎng)絡(luò)稱為小世界網(wǎng)絡(luò)。
社交網(wǎng)絡(luò)指社會(huì)個(gè)體成員之間通過社會(huì)關(guān)系結(jié)成的網(wǎng)絡(luò)體系,社交網(wǎng)絡(luò)由個(gè)體和個(gè)體間連接關(guān)系組成。在社交網(wǎng)絡(luò)中,節(jié)點(diǎn)代表社會(huì)環(huán)境中的人或其它實(shí)體,邊代表實(shí)體之間的相互作用、合作或相互影響。因此,社交網(wǎng)絡(luò)可被看作是一種特殊類型的復(fù)雜網(wǎng)絡(luò),建模為無向圖G=(V,E),即每個(gè)節(jié)點(diǎn)v∈V和無向邊緣∈E。
2數(shù)據(jù)采集
本文針對(duì)科學(xué)網(wǎng)(http://www.sciencenet.cn)中的科學(xué)網(wǎng)博客(http://www.sciencenet.cn/blog)進(jìn)行研究。科學(xué)網(wǎng)主要為網(wǎng)民提供快捷權(quán)威的科學(xué)新聞報(bào)道、豐富實(shí)用的科學(xué)信息服務(wù)以及交流互動(dòng),目標(biāo)是建成最具影響力的全球華人科學(xué)社區(qū)??茖W(xué)網(wǎng)博客采用實(shí)名注冊(cè),博主多為一線研究人員,有院士、重點(diǎn)實(shí)驗(yàn)室主任等知名學(xué)者,研究?jī)?nèi)容涉及生命科學(xué)、信息科學(xué)等多個(gè)領(lǐng)域,可在一定程度上反映不同領(lǐng)域的前沿研究。
隨著時(shí)間的推進(jìn),科學(xué)網(wǎng)博客注冊(cè)用戶不斷增加,用戶間的關(guān)系逐漸復(fù)雜。本文利用網(wǎng)絡(luò)爬蟲爬取到該博客中共有244 662個(gè)博主和113 062對(duì)好友關(guān)系,采集的數(shù)據(jù)截至2012年3月。這244 662個(gè)博主組成的好友網(wǎng)絡(luò)中包含大量的孤立節(jié)點(diǎn),即這些節(jié)點(diǎn)沒有任何好友關(guān)系,有一些很小的網(wǎng)絡(luò)碎片以及一個(gè)巨大的連接片。
因?yàn)楣铝⒌墓?jié)點(diǎn)與整個(gè)網(wǎng)絡(luò)中的其它節(jié)點(diǎn)沒有任何鏈接,無法傳播信息,因此不對(duì)網(wǎng)絡(luò)造成任何影響。同理,較小的網(wǎng)絡(luò)碎片之間存在的邊極少,因此傳播消息的范圍也很小,對(duì)整個(gè)網(wǎng)絡(luò)的影響幾乎為零。本文的研究對(duì)象就是由這個(gè)巨大連接片組成的子網(wǎng)絡(luò),包含了20 236個(gè)博客用戶節(jié)點(diǎn)和113 014對(duì)好友關(guān)系。這個(gè)僅有8.27%節(jié)點(diǎn)的巨大連接片中的好友關(guān)系占到整個(gè)網(wǎng)絡(luò)的99.96%。
下面詳細(xì)分析這個(gè)社交網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),以及一些統(tǒng)計(jì)屬性,包括度數(shù)分布、平均最短路徑長(zhǎng)度以及聚類系數(shù),揭示在線社交網(wǎng)絡(luò)的內(nèi)部特征。
3網(wǎng)絡(luò)結(jié)構(gòu)拓?fù)浞治?/p>
本節(jié)描述了網(wǎng)絡(luò)的拓?fù)涮匦?,并與現(xiàn)實(shí)觀察到的網(wǎng)絡(luò)進(jìn)行比較。
3.1度分布
許多復(fù)雜網(wǎng)絡(luò)的度分布都符合冪律分布,包括離線社交網(wǎng)絡(luò)。對(duì)科學(xué)網(wǎng)博主好友關(guān)系網(wǎng)絡(luò)中的最大連通子網(wǎng)進(jìn)行研究,繪制網(wǎng)絡(luò)的度分布和度分布的對(duì)數(shù)分布圖,如圖1所示。
圖1博客網(wǎng)度分布與度的對(duì)數(shù)分布
通過統(tǒng)計(jì)發(fā)現(xiàn)該網(wǎng)絡(luò)的度分布符合冪律P(k)~k-γ,其中γ=1.5±0.1,即該網(wǎng)絡(luò)是無尺度網(wǎng)絡(luò)。但是,通過表1發(fā)現(xiàn)該無尺度網(wǎng)絡(luò)不同于現(xiàn)實(shí)世界中已經(jīng)發(fā)現(xiàn)和驗(yàn)證的無尺度網(wǎng)絡(luò)?,F(xiàn)實(shí)世界中無尺度網(wǎng)絡(luò)的冪指數(shù)γ一般在2~3之間[9],但是本網(wǎng)絡(luò)的冪律指數(shù)非常小,只有大約1.5。下面詳細(xì)研究這一現(xiàn)象。
經(jīng)過研究發(fā)現(xiàn),隨著γ的增長(zhǎng),網(wǎng)絡(luò)從異質(zhì)向同質(zhì)轉(zhuǎn)變。
現(xiàn)實(shí)網(wǎng)絡(luò)中,γ≤1是不存在的。當(dāng)1<γ≤2時(shí),網(wǎng)絡(luò)包含比較多的集散節(jié)點(diǎn),即度較高的節(jié)點(diǎn)較多。當(dāng)2<γ
≤3時(shí),網(wǎng)絡(luò)中包含大量的度很小的節(jié)點(diǎn)和極少的集散節(jié)點(diǎn);當(dāng)γ>3時(shí),網(wǎng)絡(luò)中絕大多數(shù)節(jié)點(diǎn)的度很相近,但是基本不存在集散節(jié)點(diǎn)。
當(dāng)γ>3時(shí),網(wǎng)絡(luò)中由于基本不存在集散節(jié)點(diǎn),所以網(wǎng)絡(luò)消息傳輸率很低,這種網(wǎng)絡(luò)在現(xiàn)實(shí)生活中基本不存在。
當(dāng)1<γ≤2時(shí),集散節(jié)點(diǎn)較多,雖然此時(shí)消息傳輸率很高,但是維持這些集散節(jié)點(diǎn)花費(fèi)的代價(jià)太大,所以此種網(wǎng)絡(luò)在現(xiàn)實(shí)生活中也很少。
當(dāng)2<γ≤3時(shí),網(wǎng)絡(luò)既能確保消息的傳輸率又不需要花費(fèi)太高的代價(jià),所以此種網(wǎng)絡(luò)在現(xiàn)實(shí)生活中最為常見,例如:蛋白質(zhì)網(wǎng)絡(luò)、作家合作網(wǎng)、Internet路由網(wǎng)等等。
而本文研究的網(wǎng)絡(luò)是一個(gè)虛擬網(wǎng)絡(luò),不受資源限制,即使有較多的集散節(jié)點(diǎn)也不需要花費(fèi)人力物力進(jìn)行維護(hù),因此本研究網(wǎng)絡(luò)中γ<2并不奇怪。另外,還推測(cè)出該網(wǎng)絡(luò)的信息傳輸效率較高,因?yàn)樗讼鄬?duì)較多的集散節(jié)點(diǎn)。
3.2平均路徑長(zhǎng)度和聚類系數(shù)
計(jì)算網(wǎng)絡(luò)的平均路徑長(zhǎng)度,即任意兩個(gè)節(jié)點(diǎn)之間最短路徑的平均值。本網(wǎng)絡(luò)中該值為3.29,這意味著在一個(gè)有兩萬多個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)中,從一個(gè)用戶到另一個(gè)用戶平均只需點(diǎn)擊4次就可到達(dá)。圖2顯示了最短路徑長(zhǎng)度分布,很明顯,大部分的路徑長(zhǎng)度在2~4之間。雖然博客網(wǎng)絡(luò)節(jié)點(diǎn)很多,規(guī)模很大,且很稀疏,但是它的平均路徑很短,這驗(yàn)證了著名的“六度分隔”理論[10]。
圖2博客網(wǎng)最短路徑長(zhǎng)度分布
無向網(wǎng)絡(luò)中聚類系數(shù)
Ci=2Eiki(ki-1)(1)
Ei是節(jié)點(diǎn)i的所有鄰居之間存在的邊數(shù)目,ki(ki-1)/2是節(jié)點(diǎn)i的鄰居間存在邊的最大數(shù)量,網(wǎng)絡(luò)的聚類系數(shù)C是所有Ci的平均值。本網(wǎng)絡(luò)中C=0.193,而相同規(guī)模的隨機(jī)網(wǎng)絡(luò)聚類系數(shù)Crand=
綜合這兩點(diǎn)可以得出,研究網(wǎng)絡(luò)的聚類系數(shù)比隨機(jī)網(wǎng)絡(luò)的聚類系數(shù)大得多,而比規(guī)則網(wǎng)絡(luò)的平均路徑長(zhǎng)度小得多。因此,本網(wǎng)絡(luò)是具有小世界屬性的網(wǎng)絡(luò)。
3.3集散節(jié)點(diǎn)重要性
在電力網(wǎng)絡(luò)中,對(duì)重要的斷路器、發(fā)電單元等進(jìn)行監(jiān)控和保護(hù),可以有效防止由級(jí)聯(lián)故障引起的大范圍停電,從而避免大的經(jīng)濟(jì)損失;在大規(guī)模計(jì)算機(jī)網(wǎng)絡(luò)中,可以對(duì)關(guān)鍵節(jié)點(diǎn)的服務(wù)器有針對(duì)性地進(jìn)行備份,既能有效節(jié)省資源,又可保證網(wǎng)絡(luò)的魯棒性;在傳染病、病毒傳播網(wǎng)絡(luò)中,可以優(yōu)先治療、隔離病源,有效防止病毒的傳播和擴(kuò)散;在發(fā)掘復(fù)雜網(wǎng)絡(luò)社區(qū)時(shí),可以通過集散節(jié)點(diǎn)確定社區(qū)中心。社交網(wǎng)絡(luò)的結(jié)構(gòu)很大程度上依賴于高連接度的節(jié)點(diǎn),而這些高連接度的集散節(jié)點(diǎn)與信息傳播、蓄意攻擊的脆弱性和隨機(jī)攻擊的魯棒性都有很大關(guān)系[11]。下面研究在線社交網(wǎng)絡(luò)中解散節(jié)點(diǎn)對(duì)整個(gè)網(wǎng)絡(luò)的影響。
研究方法是逐步移除具有高連接度的節(jié)點(diǎn),然后計(jì)算剩下的最大連通片大小,剩下的最大連通片大小就是信息能在網(wǎng)絡(luò)上傳播的最大范圍。隨著高連接度節(jié)點(diǎn)移除,最大的連通網(wǎng)絡(luò)開始分解成較小的網(wǎng)絡(luò)碎片。逐步移除Top1%到Top10%的高連接度節(jié)點(diǎn)。當(dāng)移除1%的節(jié)點(diǎn)后,最大連通網(wǎng)絡(luò)是原網(wǎng)絡(luò)大小的68%;移除5%后,是原網(wǎng)絡(luò)的40%;移除10%,此時(shí)最大連通網(wǎng)絡(luò)是原網(wǎng)絡(luò)的10%。另外計(jì)算了移除20%的情況,此時(shí),整個(gè)網(wǎng)絡(luò)破碎成幾千個(gè)很小的網(wǎng)絡(luò),而最大的網(wǎng)絡(luò)只有18個(gè)節(jié)點(diǎn)。圖3顯示分解后最大連通網(wǎng)絡(luò)的大小。
圖3移除一定比例節(jié)點(diǎn)與最大連通網(wǎng)絡(luò)規(guī)模的關(guān)系
本研究網(wǎng)絡(luò)中只需關(guān)注10%的節(jié)點(diǎn),這種情況下,即使受到蓄意攻擊,網(wǎng)絡(luò)也不會(huì)癱瘓;即使有人發(fā)布恐怖消息,消息傳播的范圍也不會(huì)超過網(wǎng)絡(luò)規(guī)模的10%。如果關(guān)注網(wǎng)絡(luò)中20%的節(jié)點(diǎn),雖然監(jiān)控效果會(huì)更好,但是付出的代價(jià)太大。所以,選擇監(jiān)控10%的節(jié)點(diǎn)時(shí)監(jiān)控效果最好,而代價(jià)又是可以承受的。
4結(jié)語
本文對(duì)科學(xué)網(wǎng)博客采集的數(shù)據(jù)集進(jìn)行了在線社交網(wǎng)絡(luò)實(shí)證研究。數(shù)據(jù)顯示社會(huì)網(wǎng)絡(luò)的度分布具有無尺度網(wǎng)絡(luò)特征——冪律。然而它具有比現(xiàn)實(shí)世界網(wǎng)絡(luò)更小的冪律指數(shù)。本文驗(yàn)證了社交網(wǎng)絡(luò)具有非常短的平均路徑長(zhǎng)度和較高的聚類系數(shù),符合小世界網(wǎng)絡(luò)特征。研究了最短路徑長(zhǎng)度的頻率,證明了該網(wǎng)絡(luò)符合著名的“六度分離”理論。關(guān)注整個(gè)網(wǎng)絡(luò)10%的節(jié)點(diǎn)時(shí),網(wǎng)絡(luò)將更加健壯。本研究有助于了解在線社交網(wǎng)絡(luò)的拓?fù)涮卣?。今后將研究如何建立網(wǎng)絡(luò)的圖結(jié)構(gòu)和動(dòng)態(tài)演化,探討影響網(wǎng)絡(luò)增長(zhǎng)的因素等。
參考文獻(xiàn)參考文獻(xiàn):
[1]V KREBS. Mapping networks of terrorist cells[J]. Connections,2002,24(3):4352.
[2]D J WATTS, S H STROGATZ.Collective dynamics of “smallworld” networks[J].Nature,1998(393):440442.
[3]A L BARABASI, R ALBERT. Emergence of scalling in random networks[J].Science,1999(286):509512.
[4]王林,戴冠中.復(fù)雜網(wǎng)絡(luò)的Scalefree性、Scalefree現(xiàn)象及其控制[M].北京:科學(xué)出版社,2009:511.
[5]科學(xué)網(wǎng)[EB/OL].http://www.sciencenet.cn/blog.
[6]LAN AMARAL, A SCALA, M BARTHELEMY,et al. Stanley[EB/OL]. http://ishare.iask.sina.com.cn/f/23802485.html,Classes of small.
[7]E BULLMORE, O SPORNS. Complex brain networks: graph theoretical analysis of structural and functional systems[J].Nature Reviews Neuroscience,2009(3):186198.
[8]P ERDOS, A RENYI. On random graphs[J].Publications Mathematics,1959(6):290297.
[9]R ALBERT, A L BARAB′ASI.Statistical mechanics of complex network[J].Reviews of Modern Physics,2002(74):4797.
[10]艾伯特拉斯洛,巴拉巴西.網(wǎng)絡(luò)鏈接新科學(xué)[M].長(zhǎng)沙:湖南科學(xué)技術(shù)出版社,2007.
[11]P HOLM, B J KIM, C N YOON,et al.Attack vulnerability of complex networks[J]. Physical Review E,2002(65):254259.
責(zé)任編輯(責(zé)任編輯:杜能鋼)endprint