譚桂敏,汪麗娜,2,臧臣瑞
(1.內(nèi)蒙古工業(yè)大學(xué)理學(xué)院,呼和浩特 010051;2.內(nèi)蒙古生命數(shù)據(jù)統(tǒng)計(jì)分析理論與神經(jīng)網(wǎng)絡(luò)建模重點(diǎn)實(shí)驗(yàn)室,呼和浩特 010051;3.中國聯(lián)合網(wǎng)絡(luò)通信有限公司內(nèi)蒙古分公司,呼和浩特 010050)
各個(gè)領(lǐng)域都蘊(yùn)藏了豐富的時(shí)空數(shù)據(jù)。隨著傳感器和通信技術(shù)的快速發(fā)展,累積了大量包含地理位置信息的時(shí)空數(shù)據(jù)。越來越多的科學(xué)家關(guān)注時(shí)空數(shù)據(jù)的信息挖掘。與關(guān)系數(shù)據(jù)不同,時(shí)空數(shù)據(jù)除了具有實(shí)體及實(shí)體之間的聯(lián)系屬性,還包含了時(shí)間屬性和空間屬性[1]。時(shí)空屬性的存在為分析數(shù)據(jù)帶來了挑戰(zhàn)。
二分網(wǎng)絡(luò)可以展示兩類不同屬性群組成員之間的聯(lián)系,如電影演員網(wǎng)絡(luò)中,演員演出電影關(guān)系由演員群組與電影群組中節(jié)點(diǎn)間的連邊表示?,F(xiàn)實(shí)中存在大量不同屬性群組之間的交互關(guān)系,利用二分網(wǎng)絡(luò)可以研究不同群組間交互關(guān)系的特征。二分網(wǎng)絡(luò)投影成單分網(wǎng)絡(luò)能夠提取二分網(wǎng)絡(luò)中的隱含信息,研究同類節(jié)點(diǎn)之間直接的聯(lián)系。在互聯(lián)網(wǎng)應(yīng)用領(lǐng)域,惡意域與客戶端[2]、用戶與應(yīng)用程序[3]、用戶與網(wǎng)頁[4]、編碼器與接收器[5]等存在聯(lián)系。根據(jù)網(wǎng)絡(luò)流量日志中存儲(chǔ)的網(wǎng)絡(luò)犯罪信息,Jeng等[2]構(gòu)造了惡意域與客戶端二分網(wǎng)絡(luò),分析網(wǎng)絡(luò)特征發(fā)現(xiàn)了其他無法識(shí)別的威脅情報(bào)系統(tǒng)的新惡意域。Zhang等[3]把用戶的偏好關(guān)系表達(dá)成用戶與音樂的二分網(wǎng)絡(luò),提出了一種改進(jìn)的二分圖鏈接預(yù)測音樂推薦方法。在醫(yī)學(xué)領(lǐng)域,藥物與靶細(xì)胞[6],藥物與蛋白質(zhì)[7]、基因組與連接體[8]等存在關(guān)聯(lián)關(guān)系。Manoochehri等[6]構(gòu)建藥物與靶細(xì)胞二分網(wǎng)絡(luò),研究藥物與靶細(xì)胞之間的潛在相互作用。Wang等[7]構(gòu)建藥物與蛋白質(zhì)二分網(wǎng)絡(luò),挖掘藥物疾病相互作用以理解潛在的生物機(jī)制。在學(xué)術(shù)研究領(lǐng)域,郗強(qiáng)等[9]以領(lǐng)域和關(guān)鍵詞、學(xué)者和領(lǐng)域、作者和機(jī)構(gòu)3個(gè)二分網(wǎng)絡(luò)分析了焦點(diǎn)、作者、機(jī)構(gòu)與領(lǐng)域之間的關(guān)系。
目前,人們主要研究源于現(xiàn)實(shí)的兩類群組中自然存在的關(guān)系,如演員—電影、學(xué)者—論文、用戶—網(wǎng)頁等。針對(duì)抽象的不同屬性的群組中基元之間聯(lián)系的研究比較少。比如,時(shí)空數(shù)據(jù)中的時(shí)間屬性可以抽象為時(shí)間節(jié)點(diǎn);空間屬性可以抽象為空間節(jié)點(diǎn),時(shí)空交互關(guān)系抽象為兩類節(jié)點(diǎn)之間的連邊,以構(gòu)建二分網(wǎng)絡(luò)。由于考慮了時(shí)空數(shù)據(jù)中包含基元的時(shí)間和空間相互作用關(guān)系,二分網(wǎng)絡(luò)可以研究基元的時(shí)空演化特征。二分網(wǎng)絡(luò)投影成單分網(wǎng)絡(luò),可以探討基元時(shí)間或空間的直接聯(lián)系。
上述時(shí)空數(shù)據(jù)建立二分網(wǎng)絡(luò)可以挖掘時(shí)空數(shù)據(jù)中的信息。除此之外,最近Yang等[10]提出了高斯核密度估計(jì)和滑動(dòng)窗口相結(jié)合的方法來挖掘交通流時(shí)空數(shù)據(jù)中的關(guān)鍵道路。Jiang等[11]利用無監(jiān)督分布學(xué)習(xí)方法提高了空間和時(shí)間相關(guān)預(yù)測的準(zhǔn)確性。Wang等[12]詳細(xì)挖掘在發(fā)生自然災(zāi)害時(shí),人類情緒的時(shí)空特征。Charakopoulos等[13]利用互相關(guān)分析和復(fù)雜網(wǎng)絡(luò)方法,提取隱藏的時(shí)空特征。時(shí)空聚類也是一種時(shí)空數(shù)據(jù)挖掘方法,可以發(fā)現(xiàn)基元之間的相似性。傳統(tǒng)的聚類方法并不適用于高維數(shù)據(jù)。傳統(tǒng)的時(shí)間序列聚類方法要么只考慮時(shí)間,不能保證得到的聚類群組在空間上是連續(xù)的[14];要么只考慮空間,不能確保不同的群組是不同的[15]。時(shí)空數(shù)據(jù)建立二分網(wǎng)絡(luò)的核心—邊緣聚類則可以綜合時(shí)間和空間信息,得到群組間差異最大的聚類結(jié)果。
移動(dòng)通信領(lǐng)域所有基站可看作復(fù)雜系統(tǒng),使用復(fù)雜網(wǎng)絡(luò)方法是研究基站系統(tǒng)的一個(gè)新視角。Wang等[16]提出了一種新的時(shí)間序列建網(wǎng)方法。此方法可以體現(xiàn)移動(dòng)通信業(yè)務(wù)量時(shí)間序列中單個(gè)值的細(xì)節(jié)變化。Wang等[17]用基于網(wǎng)絡(luò)理論的深度學(xué)習(xí)方法預(yù)測蜂窩數(shù)據(jù)流,預(yù)測結(jié)果優(yōu)于傳統(tǒng)的時(shí)間序列方法。Li等[18]通過將時(shí)間序列映射為復(fù)雜網(wǎng)絡(luò),捕捉時(shí)間序列的局部特征。Enami等[19]提出了一種軌跡數(shù)據(jù)的挖掘和預(yù)測算法,在時(shí)空上預(yù)測用戶未來的移動(dòng)性行為。從而預(yù)測流量需求,適當(dāng)分配網(wǎng)絡(luò)資源。因此從海量的移動(dòng)通信時(shí)間序列數(shù)據(jù)中發(fā)掘通信數(shù)據(jù)演化規(guī)律,應(yīng)用于智能通信系統(tǒng)以及時(shí)應(yīng)對(duì)突發(fā)流量激增的情況,可以提高網(wǎng)絡(luò)資源的利用率。
為探究移動(dòng)通信基站流量的時(shí)空特征,本文建立了耦合網(wǎng)絡(luò)模型。利用核心—邊緣聚類方法,分析時(shí)空尺度上吞吐量和話務(wù)量的聚類特征。
二分網(wǎng)絡(luò)可以將時(shí)空數(shù)據(jù)一體化,研究時(shí)間與空間的相互作用關(guān)系。在本文移動(dòng)通信基站時(shí)空數(shù)據(jù)的背景下,建網(wǎng)的具體過程為:
1)確定節(jié)點(diǎn)。空間節(jié)點(diǎn)為所選區(qū)域內(nèi)各個(gè)空間位置的基站,代表基站覆蓋范圍。時(shí)間節(jié)點(diǎn)為等長的時(shí)間序列片段。應(yīng)用滑動(dòng)相關(guān)法劃分時(shí)間序列,取時(shí)間窗口為24時(shí),步長為1,得到時(shí)間序列片段,代表吞吐量和話務(wù)量時(shí)間序列動(dòng)態(tài)變化特征(耦合過程)。
2)建立相似度矩陣。從時(shí)空序列矩陣出發(fā),計(jì)算任意一個(gè)基站上兩列時(shí)間序列片段的斯皮爾曼相關(guān)系數(shù),得相似度矩陣S
(1)
其中,元素sij≠sji,sij為時(shí)間段i內(nèi)基站j上兩列時(shí)間序列之間的相似度即耦合程度。相似度矩陣是一個(gè)非對(duì)稱矩陣。
3)構(gòu)建二分網(wǎng)絡(luò)。依據(jù)相似度和閾值σ確定節(jié)點(diǎn)間是否存在連邊。一般定義相似度r的絕對(duì)值|r|≥0.8為強(qiáng)相似??紤]到強(qiáng)相似代表耦合顯著,取閾值σ為0.8。如果某時(shí)間段內(nèi)任意一個(gè)基站上兩列時(shí)間序列的相似度絕對(duì)值不小于閾值,則對(duì)應(yīng)的時(shí)間節(jié)點(diǎn)和空間節(jié)點(diǎn)之間存在連邊;否則不存在連邊。即鄰接矩陣A中的元素aij為
(2)
其中,aij=1意味著時(shí)間節(jié)點(diǎn)i和空間節(jié)點(diǎn)j之間存在一條邊。此時(shí),認(rèn)為在時(shí)間節(jié)點(diǎn)i代表的時(shí)間段內(nèi)空間節(jié)點(diǎn)j上的兩列時(shí)間序列具有高相似性,表明時(shí)間段i內(nèi)基站j上的數(shù)據(jù)業(yè)務(wù)吞吐量和話音業(yè)務(wù)話務(wù)量耦合顯著。反之,aij=0意味著時(shí)間節(jié)點(diǎn)i和空間節(jié)點(diǎn)j之間不存在邊。此時(shí),認(rèn)為在時(shí)間節(jié)點(diǎn)i代表的時(shí)間段內(nèi)空間節(jié)點(diǎn)j上的兩列時(shí)間序列不具有高相似性,表明時(shí)間段i內(nèi)基站j上的數(shù)據(jù)業(yè)務(wù)吞吐量和話音業(yè)務(wù)話務(wù)量耦合不顯著。
在分析二分網(wǎng)絡(luò)時(shí),通常將它投影成單分網(wǎng)絡(luò),再分析單分網(wǎng)絡(luò)的拓?fù)湫再|(zhì)。二分網(wǎng)絡(luò)中有兩類屬性不同的節(jié)點(diǎn),因此可以投影得到兩個(gè)單分網(wǎng)絡(luò)。例如,在本文耦合二分網(wǎng)絡(luò)中,如果時(shí)間節(jié)點(diǎn)t1,t2都與某個(gè)空間節(jié)點(diǎn)s3相連,那么在對(duì)應(yīng)的時(shí)間單分網(wǎng)絡(luò)中,t1,t2之間就存在一條連邊。類似地,如果空間節(jié)點(diǎn)s1,s2都與某個(gè)時(shí)間節(jié)點(diǎn)t2相連,那么在對(duì)應(yīng)的空間單分網(wǎng)絡(luò)中,s1,s2之間就存在一條連邊。
上述無權(quán)的投影方法應(yīng)用廣泛,但是它的構(gòu)造方式使得原始二分網(wǎng)絡(luò)的一些信息丟失。比如,投影中并沒有保留兩個(gè)時(shí)間節(jié)點(diǎn)(空間節(jié)點(diǎn))共同連接的空間節(jié)點(diǎn)(時(shí)間節(jié)點(diǎn))的數(shù)量。通過給連邊賦予權(quán)重,可以彌補(bǔ)缺陷,在投影中保留這類信息。即如果時(shí)間節(jié)點(diǎn)t1,t2既與空間節(jié)點(diǎn)s3相連又與空間節(jié)點(diǎn)s5相連,那么在對(duì)應(yīng)的時(shí)間單分網(wǎng)絡(luò)中t1,t2之間連邊的權(quán)重為2。本文中,把兩個(gè)時(shí)間節(jié)點(diǎn)(空間節(jié)點(diǎn))共同連接的空間節(jié)點(diǎn)(時(shí)間節(jié)點(diǎn))的個(gè)數(shù)作為權(quán)重,投影得到加權(quán)的單分網(wǎng)絡(luò)。
Borgatti和Everett[20-21]提出二分網(wǎng)絡(luò)的核心—邊緣結(jié)構(gòu)模型,分析二分網(wǎng)絡(luò)的聚類特征。核心—邊緣結(jié)構(gòu)模型是將鄰接矩陣的行和列聚類為兩類(核心、邊緣)的理想模型,聚類結(jié)果的主對(duì)角線上是兩個(gè)子塊。其中一個(gè)是高密度塊,稱之為核心;另一個(gè)是低密度塊,稱之為邊緣。核心—邊緣結(jié)構(gòu)模型可以用來識(shí)別事件群聚群發(fā)的區(qū)域。本文的二分網(wǎng)絡(luò)聚類之后,核心區(qū)是時(shí)間和空間上頻繁發(fā)生的事件,邊緣區(qū)是時(shí)間和空間上發(fā)生頻率低的事件。核心—邊緣結(jié)構(gòu)模型的聚類過程如圖1所示。
圖1 聚類流程圖Fig.1 The process diagram of clustering
以3個(gè)基站構(gòu)成的系統(tǒng)為例說明建立二分網(wǎng)絡(luò)過程及投影成時(shí)間單分網(wǎng)絡(luò)和空間單分網(wǎng)絡(luò)過程。數(shù)據(jù)的時(shí)空序列矩陣Ds和Dh為
(3)
Ds中的3列分別對(duì)應(yīng)3個(gè)基站上的吞吐量時(shí)間序列,Dh中的3列分別對(duì)應(yīng)與Ds中相同的3個(gè)基站上的話務(wù)量時(shí)間序列。根據(jù)步驟1)中取時(shí)間窗口為24時(shí),步長為1劃分得到時(shí)間序列片段。每列時(shí)間序列經(jīng)過劃分得到3個(gè)時(shí)間序列片段。分別計(jì)算每個(gè)基站上的兩列時(shí)間序列片段(吞吐量,話務(wù)量)之間的斯皮爾曼相關(guān)系數(shù),得相似度矩陣S為
(4)
根據(jù)步驟3選取閾值為0.8。根據(jù)公式(2),得二分網(wǎng)絡(luò)的鄰接矩陣A
(5)
二分網(wǎng)絡(luò)如圖2a所示,二分網(wǎng)絡(luò)的單模投影得到的時(shí)間網(wǎng)絡(luò)和空間網(wǎng)絡(luò)如圖2b,2c所示,圖中邊的粗細(xì)和權(quán)重成正比。二分網(wǎng)絡(luò)中t1通過s2與t2相連,也通過s3與t2相連,如圖2b所示時(shí)間網(wǎng)絡(luò)中t1和t2連邊權(quán)重為2。同樣的s2可以分別通過t1和t2與s3相連,如圖2c所示空間網(wǎng)絡(luò)中s2和s3連邊權(quán)重為2。
圖2 二分網(wǎng)絡(luò)及投影的單分網(wǎng)絡(luò)Fig.2 Bipartite network and corresponding unipartite network
對(duì)如上二分網(wǎng)絡(luò)做核心邊緣結(jié)構(gòu)分析,聚類后的分塊矩陣為
(6)
核心區(qū)為時(shí)間節(jié)點(diǎn)t1和t3和空間節(jié)點(diǎn)s3,說明s3基站在t1和t3時(shí)刻發(fā)生耦合事件次數(shù)多。邊緣區(qū)為時(shí)間節(jié)點(diǎn)t2和空間節(jié)點(diǎn)s1和s2,說明s1和s2基站在t2時(shí)刻發(fā)生的耦合事件的次數(shù)少。密度矩陣如式(7)所示,主對(duì)角線上核心區(qū)密度為1,邊緣區(qū)密度為0。
(7)
本文所選數(shù)據(jù)為某市運(yùn)營商提供的基站自動(dòng)采集的數(shù)據(jù)。從2017年2月22日0:00至2月26日18:00,近90 000條數(shù)據(jù)。每條數(shù)據(jù)是一個(gè)具有三維屬性(時(shí)間屬性、空間屬性、流量屬性)的五維向量(時(shí)間,經(jīng)度,緯度,數(shù)據(jù)業(yè)務(wù)吞吐量,話音業(yè)務(wù)話務(wù)量),表示某時(shí)某地理位置處的基站,其覆蓋范圍內(nèi)的吞吐量和話務(wù)量。預(yù)處理后得到116個(gè)基站上的吞吐量與話務(wù)量時(shí)間序列,每個(gè)時(shí)間序列的長度為139。
首先,將時(shí)空數(shù)據(jù)一體化,建立一個(gè)耦合二分網(wǎng)絡(luò)。其中利用斯皮爾曼相關(guān)系數(shù)度量吞吐量和話務(wù)量時(shí)間序列的耦合是否顯著,耦合顯著則稱某基站在某時(shí)間段內(nèi)發(fā)生了耦合事件。再將耦合二分網(wǎng)絡(luò)投影成時(shí)間單分網(wǎng)絡(luò)和空間單分網(wǎng)絡(luò),分析拓?fù)湫再|(zhì)。
本文所建的耦合二分網(wǎng)絡(luò)代表3種情況:1)不同時(shí)間段內(nèi)的耦合事件發(fā)生在不同的基站;2)多個(gè)耦合事件發(fā)生在同一個(gè)基站;3)在同一個(gè)時(shí)期內(nèi),耦合事件發(fā)生在多個(gè)基站。耦合二分網(wǎng)絡(luò)可以反應(yīng)耦合事件的動(dòng)態(tài)演化過程,吞吐量與話務(wù)量耦合可以反映多種事件的疊加效應(yīng)。耦合二分網(wǎng)絡(luò)有116個(gè)時(shí)間節(jié)點(diǎn),116個(gè)空間節(jié)點(diǎn)。其中空間節(jié)點(diǎn)中存在42個(gè)孤立節(jié)點(diǎn),表示其對(duì)應(yīng)的基站上無耦合事件發(fā)生,本文不分析孤立節(jié)點(diǎn)。稱耦合二分網(wǎng)絡(luò)的最大連通子圖為C網(wǎng)絡(luò)(Coupling Network),如圖3所示,C網(wǎng)絡(luò)中有116個(gè)時(shí)間節(jié)點(diǎn),74個(gè)空間節(jié)點(diǎn)。
圖3 C網(wǎng)絡(luò)Fig.3 C network
藍(lán)色正方形代表空間節(jié)點(diǎn),即基站,紅色圓點(diǎn)代表時(shí)間節(jié)點(diǎn)即不同的時(shí)間段??臻g節(jié)點(diǎn)可以分為兩類:圖3中外圍藍(lán)色空間節(jié)點(diǎn)和中心綠色空間節(jié)點(diǎn)。綠色空間節(jié)點(diǎn)上的連邊數(shù)均超過50,大于藍(lán)色節(jié)點(diǎn)上的連邊數(shù)。其中,s99與s100空間節(jié)點(diǎn)上連邊數(shù)最多,為115條,這兩個(gè)空間節(jié)點(diǎn)和幾乎所有的時(shí)間節(jié)點(diǎn)(共116個(gè))都存在連邊。說明既存在沒有耦合事件發(fā)生的基站也存在幾乎一直發(fā)生耦合事件的基站。
耦合二分網(wǎng)絡(luò)中存在兩類節(jié)點(diǎn)(時(shí)間節(jié)點(diǎn)和空間節(jié)點(diǎn)),對(duì)應(yīng)地,存在時(shí)間節(jié)點(diǎn)度和空間節(jié)點(diǎn)度。時(shí)間節(jié)點(diǎn)度指時(shí)間節(jié)點(diǎn)代表的某時(shí)期內(nèi)有耦合事件發(fā)生的基站個(gè)數(shù)。時(shí)間節(jié)點(diǎn)度越大,表明此時(shí)期,空間上大范圍內(nèi)發(fā)生了耦合事件,即吞吐量和話務(wù)量動(dòng)態(tài)變化相似??臻g節(jié)點(diǎn)度指某基站耦合事件發(fā)生的次數(shù)??臻g節(jié)點(diǎn)度越大,表明此基站上耦合事件大量發(fā)生,即吞吐量話務(wù)量動(dòng)態(tài)變化高度相似。圖中綠色空間節(jié)點(diǎn)度大,說明其代表的基站上耦合事件多次發(fā)生。
將耦合二分網(wǎng)絡(luò)投影得到加權(quán)的時(shí)間單分網(wǎng)絡(luò),可以研究耦合事件發(fā)生時(shí)間的規(guī)律。時(shí)間單分網(wǎng)絡(luò)是一個(gè)完全圖,網(wǎng)絡(luò)中節(jié)點(diǎn)度均為115,說明任意兩個(gè)時(shí)間段內(nèi)至少一個(gè)基站上發(fā)生了耦合事件。邊權(quán)代表兩個(gè)時(shí)間段內(nèi)均有耦合事件發(fā)生的基站個(gè)數(shù)。時(shí)間單分網(wǎng)絡(luò)的邊權(quán)分布為對(duì)數(shù)正態(tài)分布,如圖4a所示,擬合函數(shù)為p(w)=0.156 4e-3.771 8(lgw-1.717)2,擬合優(yōu)度[22]R2=0.920 4。強(qiáng)度為邊權(quán)之和[23],代表某時(shí)間段與其他全部時(shí)間段內(nèi)發(fā)生耦合事件基站的總數(shù)。時(shí)間單分網(wǎng)絡(luò)的累積強(qiáng)度分布為線性分布,如圖4b所示,散點(diǎn)呈直線。擬合函數(shù)為P(s)=-0.001 0s+1.496 0,擬合優(yōu)度R2=0.981 3。
圖4 邊權(quán)分布和累積強(qiáng)度分布Fig.4 Edge weight distribution and cumulative strength distribution
耦合二分網(wǎng)絡(luò)中存在孤立節(jié)點(diǎn)42個(gè),投影成空間單分網(wǎng)絡(luò)后,空間單分網(wǎng)絡(luò)中也存在孤立節(jié)點(diǎn)42個(gè)。我們分析空間單分網(wǎng)絡(luò)的最大連通子圖,稱空間單分網(wǎng)絡(luò)的最大連通子圖為S網(wǎng)絡(luò)(Spatial Network)。S網(wǎng)絡(luò)的集聚系數(shù)為0.836,平均路徑長度為1.42,S網(wǎng)絡(luò)屬于小世界網(wǎng)絡(luò)。
節(jié)點(diǎn)度為與節(jié)點(diǎn)直接相連的邊的數(shù)量,S網(wǎng)絡(luò)節(jié)點(diǎn)度k表示此節(jié)點(diǎn)對(duì)應(yīng)的基站與k個(gè)基站在某時(shí)間段內(nèi)吞吐量與話務(wù)量發(fā)生了耦合。S網(wǎng)絡(luò)的累積度分布為線性分布,如圖5a所示,擬合函數(shù)為P(k)=-0.010 6k+0.773 6,擬合優(yōu)度R2=0.983 3。強(qiáng)度為節(jié)點(diǎn)連邊權(quán)重的和,S網(wǎng)絡(luò)節(jié)點(diǎn)強(qiáng)度表示此節(jié)點(diǎn)對(duì)應(yīng)的基站與其他所有基站有耦合事件發(fā)生的總數(shù)。S網(wǎng)絡(luò)的累積強(qiáng)度分布為指數(shù)分布,如圖5b所示,擬合函數(shù)為P(s)=0.606 4e-0.001 6s,擬合優(yōu)度R2=0.992 7。邊權(quán)為連邊的權(quán)重,S網(wǎng)絡(luò)中邊權(quán)w表示兩基站在w個(gè)時(shí)間段上都有耦合事件發(fā)生。S網(wǎng)絡(luò)的邊權(quán)分布為冪律分布,如圖5c所示,雙對(duì)數(shù)坐標(biāo)下,散點(diǎn)呈直線。擬合函數(shù)為p(w)=0.149 8w-0.794 8,擬合優(yōu)度R2=0.911 6。表明S網(wǎng)絡(luò)的邊權(quán)具有無標(biāo)度特性。
圖5 累積度分布、累積強(qiáng)度分布和邊權(quán)分布Fig.5 Cumulative degree distribution,cumulative strength distribution and edge weight distribution
基站可能會(huì)遭受突發(fā)攻擊,出現(xiàn)故障無法正常運(yùn)行,進(jìn)而影響整個(gè)系統(tǒng)的傳輸性能,本文對(duì)S網(wǎng)絡(luò)進(jìn)行抗攻擊性分析。突發(fā)事件可能是隨機(jī)的,也可能是蓄意的,如遭受黑客攻擊等。依度對(duì)S網(wǎng)絡(luò)做蓄意攻擊,從去除網(wǎng)絡(luò)中度最大的節(jié)點(diǎn)開始,有意識(shí)地去除網(wǎng)絡(luò)中一部分度最高的節(jié)點(diǎn)。圖6a和圖6b分別反映了隨機(jī)和蓄意攻擊下S網(wǎng)絡(luò)最大連通子圖相對(duì)大小R和最短路徑長度L隨刪除節(jié)點(diǎn)比例f的變化情況。
圖6 抗攻擊性表現(xiàn)Fig.6 Robustness performance
在復(fù)雜的現(xiàn)象中發(fā)現(xiàn)有序時(shí)空規(guī)律是聚類分析的目的。為了識(shí)別網(wǎng)絡(luò)聚類特征,常用核心—邊緣結(jié)構(gòu)模型來分析網(wǎng)絡(luò)[24-25]。核心—邊緣結(jié)構(gòu)模型是使核心區(qū)與邊緣區(qū)的差異最大化[26-27]。核心—邊緣結(jié)構(gòu)模型能識(shí)別出時(shí)間與空間聚集的區(qū)域。針對(duì)耦合二分網(wǎng)絡(luò)的最大連通子圖——C網(wǎng)絡(luò)做核心—邊緣模型結(jié)構(gòu)分析,識(shí)別吞吐量與話務(wù)量耦合事件發(fā)生的時(shí)間和空間聚集區(qū)域。C網(wǎng)絡(luò)中時(shí)間節(jié)點(diǎn)116個(gè),空間節(jié)點(diǎn)74個(gè)。得聚類后的密度矩陣為
表1 耦合比重劃分Tab.1 Division of coupling proportion
(8)
密度矩陣為兩行兩列,其中,第1行第1列的0.521為聚類后核心區(qū)的密度,第2行第2列的0.091為聚類后的邊緣區(qū)的密度。核心區(qū)與邊緣區(qū)的密度存在差異表示聚類后的核心區(qū)的兩類節(jié)點(diǎn)與邊緣區(qū)的兩類存在差異。聚類后得到核心空間節(jié)點(diǎn)(基站)30個(gè)、核心時(shí)間節(jié)點(diǎn)49個(gè),邊緣空間節(jié)點(diǎn)44個(gè)、邊緣時(shí)間節(jié)點(diǎn)67個(gè)。核心—邊緣模型劃分出了耦合事件的發(fā)生時(shí)期與空間聚集區(qū)域。
為直觀表示核心區(qū)與邊緣區(qū)的差異,根據(jù)基站在特定時(shí)間段內(nèi)吞吐量與話務(wù)量耦合事件發(fā)生的多少,定義耦合比重
(9)
其中,hi為基站耦合事件發(fā)生的頻數(shù),即耦合單元數(shù);n為核心區(qū)或者邊緣區(qū)時(shí)間節(jié)點(diǎn)的個(gè)數(shù)。fi取值為0到1,越接近于1表明基站上耦合事件發(fā)生的越多。確定如表l所示耦合比重劃分。
依據(jù)聚類結(jié)果,分別畫出在核心區(qū)與邊緣區(qū)時(shí)間節(jié)點(diǎn)代表的時(shí)間段內(nèi)的基站在地理位置上的分布。如圖7a和圖7b所示。圖7a為核心區(qū)時(shí)間段內(nèi)基站在地理位置上的分布;圖7b為邊緣區(qū)時(shí)間段內(nèi)基站在地理位置上的分布。其中,節(jié)點(diǎn)顏色是根據(jù)對(duì)耦合比重的劃分確定的,弱耦合為藍(lán)色,中弱耦合為綠色,中強(qiáng)耦合為黃色,強(qiáng)耦合為紅色。
圖7 核心區(qū)與邊緣區(qū)的基站在地理上的離散分布Fig.7 The geographical discrete distribution of base stations in the core area and the periphery area
總體來看,圖7a中紅色和黃色節(jié)點(diǎn)多,圖7b中除3個(gè)節(jié)點(diǎn)為綠色外,其余節(jié)點(diǎn)均為藍(lán)色。表明核心時(shí)間段內(nèi)的耦合比重高于邊緣時(shí)間段內(nèi)的耦合比重,核心區(qū)耦合事件的發(fā)生頻率高于邊緣區(qū)耦合事件的發(fā)生頻率。無論是時(shí)間上還是空間上,核心—邊緣模型有效識(shí)別了不同時(shí)間段內(nèi)的群聚群發(fā)區(qū)域。對(duì)于核心區(qū)域的節(jié)點(diǎn),尤其是核心區(qū)紅色節(jié)點(diǎn)代表的基站值得重點(diǎn)關(guān)注,考慮新增基站或基站擴(kuò)容以預(yù)防流量激增導(dǎo)致的網(wǎng)絡(luò)擁塞等問題。
基于吞吐量與話務(wù)量時(shí)空數(shù)據(jù),利用時(shí)間序列相似性度量與滑動(dòng)時(shí)間窗口等數(shù)理統(tǒng)計(jì)方法,本文分析了某地區(qū)近6天的吞吐量與話務(wù)量數(shù)據(jù)時(shí)空變化特征?;谙嗨脐P(guān)系建立耦合二分網(wǎng)絡(luò),將時(shí)空數(shù)據(jù)一體化。投影得到加權(quán)的時(shí)間單分網(wǎng)絡(luò)與空間單分網(wǎng)絡(luò),分析單分網(wǎng)絡(luò)拓?fù)涮卣?,展示耦合事件在時(shí)間和空間上的差異。對(duì)空間單分網(wǎng)絡(luò)做抗攻擊性分析,探討基站遭破壞后系統(tǒng)的穩(wěn)定性。利用核心邊緣模型分析吞吐量與話務(wù)量耦合的時(shí)空聚類特征。
耦合二分網(wǎng)絡(luò)中,空間節(jié)點(diǎn)間差異性比時(shí)間節(jié)點(diǎn)間差異性明顯,既存在沒有耦合事件發(fā)生的基站也存在幾乎一直發(fā)生耦合事件的基站。時(shí)間單分網(wǎng)絡(luò)為完全圖,邊權(quán)分布為對(duì)數(shù)正態(tài)分布。S網(wǎng)絡(luò)為小世界網(wǎng)絡(luò),邊權(quán)分布為冪律分布。S網(wǎng)絡(luò)邊權(quán)具有無標(biāo)度特性。此外S網(wǎng)絡(luò)的抗攻擊性強(qiáng),網(wǎng)絡(luò)具有魯棒性。核心—邊緣模型時(shí)空聚類可以有效劃分核心空間節(jié)點(diǎn)和核心時(shí)間節(jié)點(diǎn),核心區(qū)節(jié)點(diǎn)上吞吐量與話務(wù)量耦合事件發(fā)生頻率比邊緣區(qū)節(jié)點(diǎn)上的耦合事件發(fā)生頻率高。表明在核心區(qū)基站上,吞吐量與話務(wù)量動(dòng)態(tài)變化十分相似。會(huì)出現(xiàn)基站吞吐量與話務(wù)量同時(shí)增大或同時(shí)減少的情況,值得進(jìn)一步關(guān)注以預(yù)防流量激增導(dǎo)致的網(wǎng)絡(luò)擁塞等問題。
本文綜合了時(shí)間和空間維度信息以及時(shí)間與空間的相互關(guān)聯(lián)關(guān)系,構(gòu)建時(shí)空耦合網(wǎng)絡(luò)。利用核心—邊緣模型對(duì)耦合二分網(wǎng)絡(luò)做聚類,聚類結(jié)果是既考慮時(shí)間又考慮空間的一個(gè)劃分。得到基站上吞吐量與話務(wù)量的群聚群發(fā)特征,為基站建設(shè)和管理提供了一些建議。本文的研究方法也為探索多事件耦合研究提供了新思路。
復(fù)雜系統(tǒng)與復(fù)雜性科學(xué)2022年2期