王力梅
(天水師范學院 數學與統(tǒng)計學院,甘肅 天水 741001)
近年來,利用復雜網絡的多項指標進行多屬性決策成為了識別關鍵節(jié)點的熱點.韓忠明教授團隊提出了面向結構洞用復雜網絡的7種指標識別關鍵節(jié)點的方法[1].文獻[2]將結構洞融入多個指標來研究軍事指揮控制網絡.之后,學者將結構洞指標用于生物網絡領域的蛋白質識別.雖然很多學者提出了不同的基于結構洞的多屬性節(jié)點識別方法,但是大多數方法主要在理論研究方面,沒有應用到實際網絡.基于此,本文針對2020年的新冠疫情形勢下抗疫和防疫兩個階段,借助科研網絡數據,提取關鍵詞構建復雜網絡.利用復雜網絡的中心性、核數和結構洞等9種指標對關鍵詞網絡進行分析,運用模糊綜合方法得到節(jié)點重要性排序,從而得到此階段新冠疫情的研究熱點,同時引入戰(zhàn)略坐標方法分析聚類主題的演變.
以“COVID-19 和新冠肺炎”為檢索詞,共得到3 448篇相關文獻,具體檢索結果如表1所列.提取其中的關鍵詞構建網絡.本文將數據分為兩個階段,2020年1月至5月,在此時期全國中小學未全面復學,視為抗疫階段,搜索得到的數據有1 716篇文章.2020年6月至10月底(數據搜索截至時間),在此時期全國學校已經基本復學,各個行業(yè)也已經復工復產,本階段的關鍵在于預防,將其視為防疫階段,搜索得到的數據有1 732篇文章.
基于網絡模型G={V,E},其中V表示網絡節(jié)點集,E表示網絡的邊集,構建鄰接矩陣D.抗疫階段和防疫階段的網絡拓撲結構如圖1和圖2所示,兩階段網絡特征數據如表2所列.
圖1 抗疫階段節(jié)點網絡拓撲結構
圖2 防疫階段節(jié)點網絡拓撲結構
表2 兩階段網絡特征對比
由表2可見,防疫階段的網絡平均路徑較小,平均聚類系數較大,網絡中心勢較大,由此可知防疫階段的小世界網絡特征較抗疫階段更加明顯.防疫階段網絡更為集中,聯(lián)系緊密,從而可知關于新冠肺炎的科研熱點研究也更為聚集.
復雜網絡描繪關鍵詞之間的連接關系(本文網絡為無向網絡),用關鍵詞出現(xiàn)的頻次來表示該節(jié)點在網絡中的度值.網絡中節(jié)點分布如果滿足冪律分布y=tx-r,其中t為常數,r為指數變量,則認為該網絡為無標度網絡.抗疫階段和防疫階段的度分布結果如圖3和圖4所示.
圖4 防疫階段度分布
如圖3節(jié)點度的冪率擬合曲線所示,可以看出網絡的節(jié)點度分布基本上符合冪率分布,且可決系數R2(即冪函數擬合度)為0.8031,計算公式為:
(1)
從圖4可以看出,防疫階段的節(jié)點度分布滿足冪率分布且擬合度較高(R2為0.7443),明顯呈現(xiàn)無標度網絡的特征,適用于復雜網絡的各種測度.
本文中節(jié)點的網絡中心性反映的是此關鍵詞在研究中的相對重要性.中心性分為兩大類,一類是基于網絡整體的表征,如接近度中心性和中介中心性;另一類是基于鄰節(jié)點的表征,如度中心性和特征向量中心性.
度中心性是基于鄰節(jié)點個數的一種排序,表達式為:
(2)
介數中心性是基于網絡的整體,計算網絡中所有的節(jié)點對之間的最短路徑數目,表達式為:
(3)
接近度中心性體現(xiàn)了本文中關鍵詞在整個網絡中居于中心的程度,表達式為:
(4)
特征向量中心性是比較網絡中節(jié)點連接到影響力節(jié)點概率的一種測度,表達式為:
Ax=λx,
(5)
其中,A為節(jié)點的鄰接矩陣,各個特征向量將對應各自不同的特征值λ.
結構洞表征的是處于網絡中“洞”,即網絡中連接那些沒有關聯(lián)節(jié)點的橋梁節(jié)點,連接越多的節(jié)點(即洞)在網絡中所能獲得的信息越多,影響力越大.本文采用Burt方法,該方法中結構洞節(jié)點受到自身4個因素作用,主要包括有效規(guī)模、效率、限制度以及等級度,其中有效規(guī)模計算公式為:
(6)
其中,j表示與i相連的節(jié)點,q表示除了i,j的所有點.效率表征的是有效規(guī)模與實際規(guī)模的比值.
限制度表征的是節(jié)點運用網絡中結構洞的能力,表達式為:
(7)
其中,piq表示節(jié)點i的所有連接關系中與q相關的比例.
等級度表征的是節(jié)點對網絡的控制力,控制力越大,則該關鍵詞在研究中越處于核心位置,計算公式為:
(8)
其中,C/N表示節(jié)點限制度的均值.
核數表征的是節(jié)點在網絡中的位置,核數小的節(jié)點位于網絡邊緣,反之則處于核心位置.
計算上述各項指標,部分抗疫階段測試結果如表3所列.
表3 抗疫階段網絡基本特征
(1)指標精簡
(9)
(2)組合賦權
對剩余指標歸一化處理后利用熵權法和CRITIC法對各指標進行組合賦權.兩種方法都是基于客觀數據,但是側重點不同,組合賦權更有利于提高合理性[4].
組合賦權:組合賦權采用加權平均法φj=αωj+βθj,其中α,β采用變異系數法確定.
(3)模糊綜合
把指標的隸屬度函數值與其相應的權重通過模糊合成算子綜合計算[5].由于指標間量綱不同無法定量比較,隸屬度函數可以使異質指標同質化.正指標采用半梯形偏大型隸屬度函數A1(x),負指標采用半梯形偏小型隸屬度函數A2(x).由此得到模糊矩陣A.具體計算公式為:
(10)
(11)
進而計算模糊集H=A⊙Φ,⊙為模糊合成算子M(;+);Φ為指標相應的權重.
計算可得指標間特征向量中心性與核數的相關系數為0.93,中介中心性與有效規(guī)模的相關系數為0.96,故去掉指標特征向量中心性和有效規(guī)模.
剩余指標由熵權法所得權重依次分別為:0.1026,0.0544,0.4388,0.1464,0.1560,0.0489,0.0529;而采用CRITIC法所得的權重依次為:0.12,0.10,0.10,0.20,0.15,0.16,0.16.綜合可得Φj依次為:0.0183, 0.0482, 0.3416, 0.0590,0.3118,0.1151,-0.059.
經模糊綜合后的前6排序為:疫情防控、診斷治療、國務院、護理和人民政府及應急管理.而度中心排序的關鍵節(jié)點為:疫情防控、診斷治療、失業(yè)保險金、社會保險費、社會保險補貼和人民政府.
同理可得,防疫階段模糊綜合后的關鍵詞前6排序為:疫情防控、突發(fā)公共衛(wèi)生事件、中醫(yī)藥、心理狀況、臨床特征和影響分析.
(4)驗證識別關鍵節(jié)點
利用網絡的魯棒性驗證本文方法的有效性,采取攻擊特定節(jié)點來比較網絡連通比例,連通比例下降越大說明失去該節(jié)點網絡的性能越差,節(jié)點越為重要.采用度中心性的節(jié)點排序作為本文多屬性決策方法的對比,攻擊網絡兩種排序前2到6的節(jié)點對比情況如圖5和圖6所示.
圖5 抗疫階段兩種蓄意攻擊對比
圖6 防疫階段兩種蓄意攻擊對比
從圖5左邊部分可知,本文所提方法從第3次攻擊開始網絡的最大連通比例開始陡降,表明多屬性決策節(jié)點排序較度中心性排序更優(yōu).
從圖6可以看出本文排序與度排序攻擊節(jié)點相比,本文方法從第4次攻擊開始顯示更大破壞性,識別的節(jié)點更重要.
將抗疫階段的相似度矩陣導入SPSS軟件中,進行系統(tǒng)聚類,聚類的選擇標準為平方歐式距離.為了能夠統(tǒng)一處理數據則需要進行數據標準化,標準化過程采用Z分數方法.再根據戰(zhàn)略坐標理論計算各聚類的向心度與密度,具體聚類參數如表4所列.
表4 抗疫階段聚類參數
研究主題聚類內部和聚類之間的聯(lián)系與變化狀況如圖7所示[7].橫坐標表示向心度,縱坐標為密度.聚類的向心度越大,表示該類團與其他聚類的聯(lián)系越強,表明該聚類在新冠肺炎領域的研究中屬于研究熱點,處于網絡的核心地位.聚類密度越大,表明該聚類內部關聯(lián)更加緊密,在新冠肺炎領域的研究較為全面.
圖7 抗疫階段戰(zhàn)略坐標
由圖7可知c的向心度最大,因此中醫(yī)藥診治是該時期至關重要的研究重點.a的密度最大,表明突發(fā)衛(wèi)生事件及應急管理較其他聚類的內部關聯(lián)最緊密,研究更為具體深入.a處于防疫時期戰(zhàn)略坐標圖的第二象限,說明在此時期突發(fā)衛(wèi)生事件及應急管理已有一定發(fā)展;聚類b和c處于第四象限,說明社會保障和中醫(yī)藥診治雖處于核心位置卻沒有得到很好的研究,應加以重視.同樣的方法,得到防疫階段的系統(tǒng)聚類和戰(zhàn)略坐標,如圖8所示.
圖8 防疫階段戰(zhàn)略坐標
由圖8可知F的密度最大,表明復工復產復學及影響分析在此時期的研究較多,成熟度較高,說明該研究主題在本階段得到較好的發(fā)展 .B和D的密度最小但向心度卻最大,體現(xiàn)了醫(yī)院防疫和科技防疫雖然是本階段研究最為核心的部分,但是卻沒有得到良好的發(fā)展,是我們今后的研究重點.關于新冠肺炎的現(xiàn)代科技防疫如利用大數據和人工智能抑制疫情的擴散,是防疫階段的重點.
A和E處于第四象限,向心度高但是密度低,說明突發(fā)衛(wèi)生事件及應急管理與心理健康是本階段的研究熱點,但關于該主題的研究并不完善,在后續(xù)研究中要重點突破.聚類C處于第二象限,密度高但向心度低,表明中醫(yī)藥診治在前面的研究中有了一定成效,不再是防疫階段的研究核心.
a和A雖處于不同階段但研究主題大體一致,從抗疫階段的第一象限轉為防疫階段的第二象限,表明其在新冠肺炎研究領域的地位得到提升,成為現(xiàn)階段的研究核心.c和C的研究主題為中醫(yī)藥診治,從抗疫階段的第四象限轉為防疫階段的第二象限,表明其在研究領域的地位從核心轉為邊緣.
本文利用多指標識別新冠疫情形勢下科研網絡的關鍵節(jié)點,針對復雜網絡的中心性、結構洞以及核數這3種屬性,結合網絡中心性和拓撲結構進行分析得到9個指標.進一步運用模糊綜合方法建立節(jié)點識別體系,得到不同階段的節(jié)點排序即新冠的科研重點排序.同時進行多指標決策聚類分析,得到聚類主題戰(zhàn)略坐標圖,數值結果驗證了所提方法的有效性.