王學(xué)文,羅月娥,冀慎統(tǒng)
(1.景德鎮(zhèn)學(xué)院 信息工程學(xué)院,江西 景德鎮(zhèn) 333400;2.景德鎮(zhèn)學(xué)院 機械電子工程學(xué)院,江西 景德鎮(zhèn) 333400;3.貴州師范學(xué)院 物理與電子科學(xué)學(xué)院,貴州 貴陽 550018)
復(fù)雜網(wǎng)絡(luò)是研究復(fù)雜系統(tǒng)的有力工具.每一個復(fù)雜系統(tǒng)都可以從實際出發(fā),抽象成由大量具有相互作用的個體所組成的復(fù)雜網(wǎng)絡(luò)[1-3].例如在科學(xué)引文網(wǎng)絡(luò)中,用網(wǎng)絡(luò)中的節(jié)點來代表期刊上發(fā)表的科學(xué)論文,用節(jié)點之間的連邊來代表從一篇論文到另一篇之前發(fā)表的論文的引用[4].真實世界中普遍存在老化現(xiàn)象,因此,老化機制對復(fù)雜網(wǎng)絡(luò)的形成過程起重要的作用.例如在科學(xué)引文網(wǎng)絡(luò)中就存在著一個半衰期效應(yīng),表現(xiàn)為老的文獻很少被引用.為了研究老化效應(yīng)對網(wǎng)絡(luò)演化的影響,一些研究者考慮了時間老化因素的影響[5-19].Klemm等在對科學(xué)引文網(wǎng)絡(luò)研究時,發(fā)現(xiàn)節(jié)點在加入網(wǎng)絡(luò)后只有有限的時間獲得連邊,從而提出了基于度驅(qū)動的鈍化網(wǎng)絡(luò)模型(KE網(wǎng)絡(luò)模型)[8-9].在該模型中,節(jié)點的鈍化機制能夠顯著地增加網(wǎng)絡(luò)中的三角形數(shù)目,提高網(wǎng)絡(luò)的聚類系數(shù).近年來,許多國內(nèi)的學(xué)者也在KE網(wǎng)絡(luò)模型的基礎(chǔ)上做了許多有益的工作.例如在考慮了連邊權(quán)重的基礎(chǔ)上,吳枝喜等[11]提出了基于權(quán)重的鈍化網(wǎng)絡(luò)模型,在權(quán)重方面拓展了鈍化模型.考慮到網(wǎng)絡(luò)中當(dāng)前可選目標(biāo)的絕對重要性很難獲得,而相對重要性更加容易獲得的情況,許新建等提出了基于序排列的鈍化網(wǎng)絡(luò)模型[13].該網(wǎng)絡(luò)模型采用了序偏好機制來刻畫網(wǎng)絡(luò)節(jié)點的老化情況,在該方面對鈍化模型進行了擴展.考慮到實證引文網(wǎng)絡(luò)中有部分文章是在后期才被人們關(guān)注的現(xiàn)象[19-21].本研究小組提出了帶有活化機制的鈍化網(wǎng)絡(luò)模型,該網(wǎng)絡(luò)模型通過引入活化機制使得文章后期被引用成為可能[14-15].
在以上所提到的鈍化網(wǎng)絡(luò)模型中,要求新進節(jié)點必須與當(dāng)前的每個活躍態(tài)節(jié)點都連接,這樣的限定不能反映真實引文網(wǎng)絡(luò)中的隨機效應(yīng)[22].另外,考慮到真實引文網(wǎng)絡(luò)中可能被引用的文章數(shù)目大于最終被引用的文章數(shù)目的情況,對應(yīng)于鈍化網(wǎng)絡(luò)模型中的活躍態(tài)節(jié)點的數(shù)目大于新進節(jié)點的連邊數(shù),論文提出了一種廣義的帶有隨機活化機制的鈍化網(wǎng)絡(luò)模型.在該模型中,不僅考慮了節(jié)點狀態(tài)的轉(zhuǎn)變,還考慮了新進節(jié)點可以從當(dāng)前的活躍態(tài)節(jié)點中隨機選取一定數(shù)量的節(jié)點建立連接的情況.文中對該模型的整體入度分布進行了理論解析和數(shù)值模擬.最后,將3個實證科學(xué)引文網(wǎng)絡(luò)的實證數(shù)據(jù)與該模型的數(shù)值模擬結(jié)果進行了比較.
受之前工作的啟發(fā),文中提出了一個廣義的帶有隨機活化機制的鈍化網(wǎng)絡(luò)模型.在該模型中,網(wǎng)絡(luò)中已有節(jié)點的可能狀態(tài)有兩種,活躍態(tài)和休眠態(tài).新加入的節(jié)點一開始處于活躍態(tài),隨著網(wǎng)絡(luò)的演化逐漸老化直到失去活性變成休眠態(tài),然而處于休眠態(tài)的節(jié)點又存在一定的概率被選擇進行活化,從而成為活躍態(tài)節(jié)點.具體的網(wǎng)絡(luò)演化模型如下:
1)初始網(wǎng)絡(luò)中存在M個活躍態(tài)節(jié)點,其余的均為休眠態(tài)節(jié)點.
2)從當(dāng)前的M個活躍態(tài)節(jié)點中選取m(m≤M)個活躍態(tài)節(jié)點.
4)從當(dāng)前的所有休眠態(tài)節(jié)點中隨機選取一個休眠態(tài)節(jié)點進行活化,使其由休眠態(tài)變成活躍態(tài).
6)返回第2步,讓網(wǎng)絡(luò)進行循環(huán)演化直到網(wǎng)絡(luò)尺寸達到設(shè)定的規(guī)模N為止.
根據(jù)該模型,只有活躍態(tài)節(jié)點能夠獲得新進節(jié)點的連接,并且在網(wǎng)絡(luò)演化過程中活躍態(tài)節(jié)點可能成為休眠態(tài)節(jié)點,這個過程可以認(rèn)為是一個“遺忘”的過程.與此同時,休眠態(tài)節(jié)點能夠再次被選擇成為活躍態(tài)節(jié)點,從而再次受到關(guān)注與新進的活躍態(tài)節(jié)點進行連接,這個過程稱之為活化過程.網(wǎng)絡(luò)的平均連接度則是由新進節(jié)點出度m決定的.
設(shè)Ak′(t)為t時刻當(dāng)前網(wǎng)絡(luò)中具有入度為k′的活躍態(tài)節(jié)點的數(shù)目,Dk′(t)為t時刻當(dāng)前網(wǎng)絡(luò)中具有入度為k′的休眠態(tài)節(jié)點的數(shù)目.在網(wǎng)絡(luò)隨時間的演化過程中,可以分別寫出活躍態(tài)和休眠態(tài)節(jié)點的差分方程.
對于活躍態(tài)節(jié)點有
(1)
對于休眠態(tài)節(jié)點有
(2)
其中μk′(t)為t時刻入度為k′的休眠態(tài)節(jié)點被活化的數(shù)目.由于每次均活化一個休眠態(tài)節(jié)點,因此μk′(t)的數(shù)值與當(dāng)前網(wǎng)絡(luò)中入度為k′的休眠態(tài)節(jié)點被活化的概率一致.νk′(t)為t時刻入度為k′的活躍態(tài)節(jié)點被老化概率.其中,(1)式右邊第1項考慮了所有可能的沒有被選擇進行老化情況:1)當(dāng)前入度為k′-1的活躍態(tài)節(jié)點被隨機選出,被新進節(jié)點連接,并且沒有被選擇進行老化;2)當(dāng)前入度為k′的活躍態(tài)節(jié)點沒有被隨機選出,并且沒有被選擇進行老化;3)當(dāng)前被活化的入度為k′休眠態(tài)節(jié)點,并且沒有被選擇進行老化.
當(dāng)網(wǎng)絡(luò)規(guī)模足夠大時,網(wǎng)絡(luò)中活躍態(tài)節(jié)點的度分布趨于穩(wěn)定狀態(tài),則有穩(wěn)態(tài)條件?Ak′(t)/?t=0,代入(1)式可得
(3)
(4)
在該網(wǎng)絡(luò)模型中,考慮了休眠態(tài)節(jié)點的隨機活化情況,即當(dāng)前每個休眠態(tài)節(jié)點被活化的概率是相同的,即休眠態(tài)節(jié)點j被活化的概率為
(5)
因此,可以得到當(dāng)前t時刻入度為k′的休眠態(tài)節(jié)點被活化的數(shù)目為
(6)
應(yīng)用大規(guī)模網(wǎng)絡(luò)極限條件,從(6)式中可以得到
μk′=pk′.
(7)
該活化機制優(yōu)化了原有的鈍化網(wǎng)絡(luò)模型在描述引文網(wǎng)絡(luò)時所考慮的絕對老化情況.雖然活躍的論文可能會逐漸失去活性慢慢休眠,但其中一些已經(jīng)休眠了不活躍的論文,還是有可能被引用從而重新回到人們的視野中來.
在網(wǎng)絡(luò)的演化過程中,將活躍態(tài)節(jié)點的老化概率采用入度偏好的方式進行處理,即
(8)
將式(4),(7)和(8)式分別帶入(3)式中進行約化得到
(9)
對上述方程進行求解得到
(10)
由于該網(wǎng)絡(luò)模型的入度分布可以表示成活躍態(tài)節(jié)點的變化率,故有
(11)
(12)
因此,整個網(wǎng)絡(luò)的入度分布為
(13)
由于k=k′+m,該網(wǎng)絡(luò)中節(jié)點的度分布可以表示為
(14)
(15)
由上式可知,該網(wǎng)絡(luò)度分布的衰減指數(shù)τ依賴于活躍態(tài)節(jié)點數(shù)M、節(jié)點的出度m和初始吸引子α的取值.圖1a給出了生成網(wǎng)絡(luò)參數(shù)為M=m,α=m+2,網(wǎng)絡(luò)規(guī)模為105的整個網(wǎng)絡(luò)度分布的數(shù)值模擬和擬合結(jié)果.圖中的點表示數(shù)值模擬結(jié)果,實線對應(yīng)于(14)式的最小二乘法的擬合結(jié)果.當(dāng)m=10,20和40時,得到對應(yīng)衰減指數(shù)的擬合結(jié)果分別為3.46(7),3.18(8)和3.00(8),而利用公式得到的理論解析衰減指數(shù)τ=3.圖1b給出了M=5m,α=m-1.2,網(wǎng)絡(luò)規(guī)模為105的整個網(wǎng)絡(luò)度分布的數(shù)值模擬和擬合結(jié)果.此時,理論解析衰減指數(shù)τ=3.當(dāng)m=10,20和40時,對應(yīng)衰減指數(shù)的擬合結(jié)果分別為3.28(6),3.12(5)和2.99(7).比較可得,該網(wǎng)絡(luò)模型度分布的數(shù)值模擬擬合結(jié)果隨著m的增大與理論結(jié)果逐步趨于一致.
圖1 生成網(wǎng)絡(luò)的度分布的數(shù)值模擬和理論解析結(jié)果的比較
為了對當(dāng)前模型進行實證研究,從科學(xué)引文網(wǎng)絡(luò)中找出了3組實證數(shù)據(jù)進行了對比.這3組實證數(shù)據(jù)分別是
1)PNAS data:該數(shù)據(jù)來源于1998年到2007年在美國國家科學(xué)院院刊(PNAS)上發(fā)表的文章,其中包含23572篇文章和40853篇引用文章[23];
2)Hep-ph data:該數(shù)據(jù)同樣來源于arxiv.org網(wǎng)站上的預(yù)印本,覆蓋了從1992年1月到2003年4月期間總計127個月的文章數(shù)據(jù),共包含了34546篇文章和421578篇引用文章[24];
3)Hep-th data:該數(shù)據(jù)來源于arxiv.org網(wǎng)站上的預(yù)印本,覆蓋了從1992年1月到2003年4月期間總共127個月的文章數(shù)據(jù),共包含了27770篇文章和352807篇引用文章[24].
表1 3個實證網(wǎng)絡(luò)的度統(tǒng)計數(shù)據(jù)和生成網(wǎng)絡(luò)參數(shù)
利用表1中的數(shù)據(jù),給出了科學(xué)引文網(wǎng)絡(luò)實證數(shù)據(jù)的累積入度分布和生成網(wǎng)絡(luò)的數(shù)值模擬結(jié)果的比較,如圖2所示.可以看到,實證科學(xué)引文網(wǎng)絡(luò)的實證數(shù)據(jù)與該模型的數(shù)值模擬結(jié)果吻合較好.
圖2 生成網(wǎng)絡(luò)的度分布的數(shù)值模擬和理論解析結(jié)果的比較
文中提出了一個廣義的帶有隨機活化機制的鈍化網(wǎng)絡(luò)模型,該模型中節(jié)點的狀態(tài)分為活躍態(tài)和休眠態(tài),只有活躍態(tài)的節(jié)點有可能收到新進節(jié)點的連邊.整個網(wǎng)絡(luò)的增長動力學(xué)過程受控于節(jié)點狀態(tài)的轉(zhuǎn)變.研究發(fā)現(xiàn),每篇論文的平均引文數(shù)量m、當(dāng)前可選的論文數(shù)目M和不同科學(xué)領(lǐng)域的初始吸引子α決定了所生成網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu).如果M和α的取值分別為M=m,α=m+2時,網(wǎng)絡(luò)節(jié)點度分布為衰減指數(shù)為τ=3的無標(biāo)度分布.為了對當(dāng)前模型進行驗證,比較了科學(xué)引文網(wǎng)絡(luò)中的3組實證數(shù)據(jù),并且得到了與實證數(shù)據(jù)相一致的數(shù)值模擬結(jié)果.