陳柏宏
(廣州大學(xué)管理學(xué)院,廣東 廣州510006)
近年來,社會網(wǎng)絡(luò)分析(SNA)應(yīng)用越來越廣泛,在許多學(xué)科領(lǐng)域都得到了良好的運(yùn)用。在破壞性創(chuàng)新的研究領(lǐng)域,很少有人注意到學(xué)者之間的合著網(wǎng)絡(luò)具有什么樣的潛力。文章運(yùn)用了sati 軟件[1]抓取web of science 上創(chuàng)新領(lǐng)域相關(guān)作者信息,并運(yùn)用Python 對sati 抓取到的信息進(jìn)行處理與清洗,最后運(yùn)用網(wǎng)絡(luò)可視化分析軟件Gephi 對破壞性創(chuàng)新領(lǐng)域作者的合作關(guān)系進(jìn)行分析,衡量合作網(wǎng)絡(luò)是否具有發(fā)展的潛力。
破壞性創(chuàng)新理論自提出至今,已成為最受關(guān)注的創(chuàng)新理論之一[2]。破壞性創(chuàng)新理論最初起源于christensen 提出的破壞性技術(shù)[3]?,F(xiàn)在主流的破壞性創(chuàng)新定義是:破壞性創(chuàng)新意味著不同于主流技術(shù)所提供的性能屬性。創(chuàng)新首次被引入時,往往在主流客戶最看重的性能屬性上表現(xiàn)不佳,故只會吸引看重非主流性能特征的低端或新興市場的小眾客戶。然而,隨著時間的推移,破壞性創(chuàng)新會比現(xiàn)有的技術(shù)在主流的性能屬性上得到更快地提升,使其在主流市場中具有競爭力,然后,它可以“入侵”主流市場,甚至取代主流的現(xiàn)有技術(shù)[2]。
社會網(wǎng)絡(luò)分析經(jīng)歷過較長時間的發(fā)展已經(jīng)具有較為完善的體制,基本可以從以下幾個角度進(jìn)行分析:
1.2.1 平均度分析:平均度是指整個網(wǎng)絡(luò)中各個節(jié)點的度,而一個節(jié)點度的定義是該節(jié)點有多少其它節(jié)點與之相關(guān)聯(lián),所以整個網(wǎng)絡(luò)的平均度可以一定程度上表示一個網(wǎng)絡(luò)各個節(jié)點直接關(guān)聯(lián)程度。
1.2.2 網(wǎng)絡(luò)密度分析:網(wǎng)絡(luò)密度可以測算整個網(wǎng)絡(luò)的結(jié)構(gòu)是密集還是松散,較為松散的結(jié)構(gòu)意味著節(jié)點間的合作較少,信息流通性差。計算公式為:
其中,l 表示網(wǎng)絡(luò)中存在的邊數(shù)量,n 表示網(wǎng)絡(luò)中節(jié)點的數(shù)量。
1.2.3 聚集系數(shù)分析:聚集系數(shù)可以分析出網(wǎng)絡(luò)的形狀是否規(guī)則覆蓋面以及集中性,是了解網(wǎng)絡(luò)整個結(jié)構(gòu)的重要方法。聚類系數(shù)與平均路徑長度結(jié)合時可以判斷該網(wǎng)絡(luò)是否具有小世界的特性。計算公式為:
Gephi 是應(yīng)用于不同學(xué)科(社會網(wǎng)絡(luò)分析、生物學(xué)、基因組學(xué)等)的網(wǎng)絡(luò)可視化軟件[4]。Gephi 的可視化模塊使用的是特殊的3D 渲染引擎來進(jìn)行實時的渲染,這可以讓圖形處理用到電腦的顯卡從而解放CPU 去處理其它的工作[5]。Gephi 是在網(wǎng)絡(luò)應(yīng)用中及其有力的工具,它不僅提供了技術(shù)上的準(zhǔn)確分析和視覺上的美觀性,它還可以自動生成一些隨機(jī)圖可以滿足ER 隨機(jī)圖理論的應(yīng)用,也可以生成動態(tài)網(wǎng)絡(luò)圖,觀察網(wǎng)絡(luò)整個生命周期內(nèi)的變化。作為一個可視化工具,布局算法就格外重要,下面介紹一種主要的布局方式。
Fruchterman Reingold 布局算法將所有的節(jié)點看做是電子,每個結(jié)點收到兩個力的作用:其它結(jié)點的庫倫力(斥力)以及邊對點的胡克力(引力)。那么在力的相互作用之下,整個布局最終會稱為一個平衡的狀態(tài)。Fruchterman Reingold 布局在不改變默認(rèn)值的情況下(主要是重力大小),圖形的布局最終會向一個規(guī)則的圓形發(fā)展,使整個圖形的布局安排合理恰當(dāng)且美觀。
本文獲取數(shù)據(jù)來源于Web of Science 核心數(shù)據(jù)庫。首先我們使用“Disruptive Innovation”為關(guān)鍵詞字段的核心數(shù)據(jù)庫的主題檢索,一共檢索到了2034 條結(jié)果。經(jīng)過初步的篩選剔除一些無關(guān)文獻(xiàn),一共得到573 篇文獻(xiàn),將573 篇文獻(xiàn)的題錄信息導(dǎo)出。
2.2.1 SATI 對文獻(xiàn)作者字段的提取
由于我們從Web of Science 導(dǎo)出的數(shù)據(jù)量過于龐大,且我們只需要相關(guān)的作者信息,我們考慮使用SATI 軟件對其的作者信息字段進(jìn)行提取。其實SATI 本可以完成相關(guān)共現(xiàn)矩陣的制作,而這樣的共現(xiàn)矩陣也能夠?qū)隚ephi 進(jìn)行處理,但是SATI 最多支持100 方格大小的矩陣,我們處理573 篇文獻(xiàn)超過了SATI 可以支持的數(shù)據(jù)量,所以只使用SATI 軟件對文獻(xiàn)的作者字段進(jìn)行提取。
2.2.2 Python 對數(shù)據(jù)進(jìn)行進(jìn)一步清洗
由于Gephi 對導(dǎo)入文件的格式有較為嚴(yán)格的要求,必須是共現(xiàn)矩陣的形式或者是特殊的表格形式,所以我們考慮使用Python 對其進(jìn)行處理。利用每篇文章中出現(xiàn)的作者名作為共現(xiàn)矩陣的數(shù)據(jù)來源,若兩個作者出現(xiàn)在同一篇文章里,則說明他們之間共現(xiàn)一次,以此類推,利用python 編寫程序?qū)崿F(xiàn)這個功能,并且讓共現(xiàn)次數(shù)作為網(wǎng)絡(luò)邊的權(quán)重。
處理經(jīng)過以上處理步驟之后,可以順利將數(shù)據(jù)導(dǎo)入Gephi,選擇圖的類型為無向圖,因為作者之間的合作關(guān)系是雙向的,一共產(chǎn)生了1364 個節(jié)點以及2311 條邊。直接導(dǎo)入得到的初始圖形非常雜亂,因為其節(jié)點過多,考慮使用Gephi 的布局對圖形進(jìn)行處理。
考慮多個算法不同的特性和優(yōu)點,本文所建立的網(wǎng)絡(luò)規(guī)模屬于中等,故選擇Fruchterman Reingold 布局對整個圖形進(jìn)行處理,采取默認(rèn)參數(shù)的配置處理后的圖形如圖1 所示??梢钥吹狡渲幸恍┑拇笾乱?guī)律:如果一個很大的集團(tuán)往往沒有一個節(jié)點與外部聯(lián)系,盡管他們內(nèi)部聯(lián)系非常緊密,但依舊對于整個網(wǎng)絡(luò)的影響不大。相反,比較小的集團(tuán),他們之間互有聯(lián)系,這樣往往對整個網(wǎng)絡(luò)才是具有貢獻(xiàn)的。
圖1 經(jīng)過Fruchterman Reingold 布局處理后的網(wǎng)絡(luò)圖形
之后利用Gephi 對網(wǎng)絡(luò)進(jìn)行量化的分析,見表1。由表可知,平均度數(shù)只達(dá)到了3.4 左右,說明整個合作網(wǎng)絡(luò)的比較低效,且整個網(wǎng)絡(luò)的密度為0.002,是處于比較松散的狀態(tài),節(jié)點之間交流傳遞比較差。一般來說我們現(xiàn)實世界中網(wǎng)絡(luò)最大的密度為0.5 左右[6]。網(wǎng)絡(luò)的平均聚類系數(shù)為0.981,本文模擬了同等規(guī)模的隨機(jī)網(wǎng)絡(luò)圖,發(fā)現(xiàn)隨機(jī)圖的平均路徑長度為3.46 且具有相同的平均聚類系數(shù),此合著網(wǎng)絡(luò)的平均路徑長度為1.121,遠(yuǎn)低于隨機(jī)網(wǎng)絡(luò),說明此作者合作網(wǎng)絡(luò)具有小世界性的特征。盡管網(wǎng)絡(luò)密度較小,但是具有小世界性可以讓網(wǎng)絡(luò)中的作者有機(jī)會得到與其他未合作的作者更多的合作機(jī)會,這樣的合作網(wǎng)絡(luò)極具潛力。
表1 網(wǎng)絡(luò)中的定量參數(shù)
本文利用Web of Science 的核心集檢索,以“Disruptive Innovation”作為關(guān)鍵詞字段進(jìn)行檢索,一共得到了2034 篇文獻(xiàn)的結(jié)果,篩選留下了573 篇文獻(xiàn)。之后將573 篇文獻(xiàn)導(dǎo)入SATI軟件進(jìn)行處理,SATI 軟件對其文本提取了作者字段。本文之后使用了Python 對其SATI 輸出后的文件進(jìn)行處理,將其導(dǎo)入Gephi 后無異常,得到一個1364 個節(jié)點,2331 條邊的無向網(wǎng)絡(luò)。之后進(jìn)行Fruchterman Reingold 布局處理得到更易于觀察的網(wǎng)絡(luò)圖,在圖中我們發(fā)現(xiàn),盡管存在一些較大的集團(tuán),但是他們是一個獨立的集團(tuán),即與外部沒有聯(lián)系;我們也發(fā)現(xiàn)一些較小的集團(tuán)之間有聯(lián)系,在這其中的聯(lián)系節(jié)點起了關(guān)鍵性的作用,這樣的節(jié)點對于整個網(wǎng)絡(luò)是關(guān)鍵的。之后本文對其相關(guān)網(wǎng)絡(luò)參數(shù)進(jìn)行輸出和分析,發(fā)現(xiàn)破壞性創(chuàng)新合著網(wǎng)絡(luò)具有較為松散的結(jié)構(gòu),但卻擁有小世界性的特征,這樣具有小世界性的網(wǎng)絡(luò)是極具發(fā)展?jié)摿Φ?,因為擁有大量未來合作的機(jī)會。