張理 魏奇鋒 顧新
摘 要:[目的/意義]面向科研合作網(wǎng)絡(luò)中的學(xué)術(shù)社群,提出基于合作者吸收能力的知識(shí)擴(kuò)散種子選擇方法,以提升社群知識(shí)擴(kuò)散效率,促進(jìn)社群成員知識(shí)吸收。[方法/過程]運(yùn)用R軟件完成仿真實(shí)驗(yàn)?;谒固垢4笮途W(wǎng)絡(luò)數(shù)據(jù)集(SNAP)的真實(shí)科研合作網(wǎng)絡(luò)數(shù)據(jù),運(yùn)用社團(tuán)檢測(cè)算法“WalkTrap”檢測(cè)出學(xué)術(shù)社群。將各學(xué)術(shù)社群中合作對(duì)象吸收能力總和最大的節(jié)點(diǎn)作為各社群的知識(shí)擴(kuò)散種子,基于此,在各社群內(nèi)部實(shí)施知識(shí)擴(kuò)散仿真實(shí)驗(yàn),并用其余4種基于網(wǎng)絡(luò)中心性的方法與本文方法作對(duì)比。[結(jié)果/結(jié)論]基于合作者吸收能力的種子選擇方法,在網(wǎng)絡(luò)整體知識(shí)水平、知識(shí)水平分布均勻性與擴(kuò)散初期的知識(shí)增長(zhǎng)速度等方面均優(yōu)于其它4種方法,且節(jié)點(diǎn)吸收能力差異越大,這種優(yōu)勢(shì)就越突出。節(jié)點(diǎn)平均吸收能力越強(qiáng)或網(wǎng)絡(luò)中節(jié)點(diǎn)平均度越大,知識(shí)擴(kuò)散效率受種子選擇方法的影響越小。
關(guān)鍵詞:種子選擇;知識(shí)擴(kuò)散;科研合作網(wǎng)絡(luò);知識(shí)吸收能力;社團(tuán)檢測(cè)
DOI:10.3969/j.issn.1008-0821.2020.02.014
〔中圖分類號(hào)〕G201 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2020)02-0122-10
A Study of Seed Selection for Knowledge Diffusion in
Scientific Collaboration Network
Zhang Li1 Wei Qifeng1* Gu Xin2
(1.Business School,Chengdu University of Technology,Chengdu 610059,China;
2.Business School,Sichuan University,Chengdu 610064,China)
Abstract:[Purpose/Significance]For the academic community in the scientific collaboration network,a method of selecting knowledge diffusion seeds based on the absorption ability of collaborators was proposed,so as to improve the diffusion efficiency of community knowledge and promote the knowledge absorption of community members.[Method/Process]R software was used to complete the simulation experiment.Based on the real scientific collaboration network data of Stanford large network dataset(SNAP),the community detection algorithm“WalkTrap”was used to detect the academic community.The node with the largest total absorption ability of collaborators in each academic community was used as the knowledge diffusion seed of each community.Based on this,knowledge diffusion simulation experiment was carried out within each community,and the other four network centrality based methods were compared with the method in this paper.[Results/Conclusion]The seed selection method based on the absorption ability of collaborators was superior to the other four methods in terms of the overall knowledge level of the network,the uniformity of knowledge level distribution and the growth rate of knowledge at the initial stage of diffusion.The greater the difference in the absorption capacity of nodes,the more prominent this advantage will be.The stronger the average absorption ability of nodes or the higher the average degree of nodes in the network,the less the influence of seed selection method on the knowledge diffusion efficiency.
Key words:seed selection;knowledge diffusion;scientific collaboration network;knowledge absorption ability;community detection
科研合作在知識(shí)生產(chǎn)和科學(xué)發(fā)展上發(fā)揮著重要作用,對(duì)知識(shí)創(chuàng)造與傳播具有重要意義[1-2]。合著論文是科學(xué)家協(xié)同研究、形成研究成果的一種重要形式,也是實(shí)現(xiàn)知識(shí)轉(zhuǎn)移的關(guān)鍵渠道。論文合著網(wǎng)絡(luò)同時(shí)也是一類社交網(wǎng)絡(luò),其節(jié)點(diǎn)代表論文作者,邊代表合著關(guān)系,二者共同體現(xiàn)了科學(xué)家之間的復(fù)雜合作關(guān)系,是一種典型的科研合作網(wǎng)絡(luò)[3]。知識(shí)擴(kuò)散是知識(shí)生產(chǎn)過程中的核心環(huán)節(jié),對(duì)知識(shí)繼承和創(chuàng)新存在重要作用與價(jià)值[4]??蒲泻献骰顒?dòng)中存在較強(qiáng)的關(guān)系嵌入屬性,網(wǎng)絡(luò)中知識(shí)擴(kuò)散的實(shí)質(zhì)是一種社會(huì)交換,知識(shí)擴(kuò)散的程度與效率受社會(huì)關(guān)系網(wǎng)絡(luò)中個(gè)體位勢(shì)的影響[5]。在科研合作網(wǎng)絡(luò)中,一些相互連接緊密的節(jié)點(diǎn)共同組成了學(xué)術(shù)社群,在社群內(nèi)部的學(xué)者之間,其合作頻次通常多于處于不同社群中學(xué)者之間的合作頻次。知識(shí)擴(kuò)散種子,即知識(shí)擴(kuò)散的主導(dǎo)者,在科研合作網(wǎng)絡(luò)中的位置將會(huì)對(duì)知識(shí)擴(kuò)散產(chǎn)生重要影響[6]。因而,從學(xué)術(shù)社群中優(yōu)選出知識(shí)擴(kuò)散種子,可以有效提高學(xué)術(shù)社群內(nèi)部的知識(shí)擴(kuò)散效率,從而促進(jìn)學(xué)者們對(duì)相關(guān)知識(shí)的吸收和創(chuàng)新。
1 文獻(xiàn)綜述
目前,國(guó)內(nèi)外學(xué)者從多方面、多角度對(duì)科研合作網(wǎng)絡(luò)進(jìn)行了一定分析,相關(guān)研究大多圍繞合著網(wǎng)絡(luò)主題。avu瘙塂
oglu A等[7]研究了跨學(xué)科合作網(wǎng)絡(luò)的一些統(tǒng)計(jì)和拓?fù)涮卣鳎缱髡邤?shù)量、度分布、每篇文章的作者數(shù)與每位作者的論文量直方圖與分布等,研究表明這些特征使得土耳其高等教育快速發(fā)展且增加了論文的出版數(shù)量,并提高了科研合作網(wǎng)絡(luò)的合作水平。Barbosa M W等[8]基于合著關(guān)系構(gòu)建了供應(yīng)鏈分析學(xué)研究領(lǐng)域的科研合作網(wǎng)絡(luò),按研究方向劃分了研究團(tuán)體,分析了不同研究方向的科研人員之間的合著關(guān)系,研究中使用的度量方法描述了網(wǎng)絡(luò)節(jié)點(diǎn)的重要性,研究發(fā)現(xiàn)國(guó)家之間的合著網(wǎng)絡(luò)存在小世界效應(yīng)。Gaskó N等[9]構(gòu)建了一個(gè)不同于合著網(wǎng)絡(luò)的網(wǎng)絡(luò),若文章有共同作者則將這些文章作為節(jié)點(diǎn)相互連接,研究表明這種網(wǎng)絡(luò)揭示了合作行為的模式,且能更好地定義社區(qū)結(jié)構(gòu)和直接代表合作的結(jié)果。此外,對(duì)科研合作網(wǎng)絡(luò)的研究還包括合作關(guān)系識(shí)別[10]、科研合作網(wǎng)絡(luò)演化分析[11]、識(shí)別重要作者[12]以及作者合作模式[13]等等。
知識(shí)擴(kuò)散的相關(guān)研究,主要包括如何提升知識(shí)擴(kuò)散效率[14]、知識(shí)擴(kuò)散機(jī)制[15]、特定知識(shí)擴(kuò)散模型的構(gòu)建與仿真[16-18]等。在科研合作網(wǎng)絡(luò)的知識(shí)擴(kuò)散相關(guān)研究中,部分學(xué)者聚焦于知識(shí)擴(kuò)散模型的仿真研究。比如,涂靜等[6]提出用不同的網(wǎng)絡(luò)中心性方法選擇知識(shí)源,以促進(jìn)知識(shí)擴(kuò)散,研究發(fā)現(xiàn)介數(shù)中心性前5%的節(jié)點(diǎn)作為知識(shí)源的情況下的知識(shí)擴(kuò)散充分程度最高。巴志超等[4]根據(jù)科研合作網(wǎng)絡(luò)中知識(shí)的流動(dòng)特征,構(gòu)建知識(shí)擴(kuò)散模型并進(jìn)行仿真實(shí)驗(yàn),發(fā)現(xiàn)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、網(wǎng)絡(luò)規(guī)模和專家高知識(shí)溢出效應(yīng)等因素,影響了知識(shí)在科研合作網(wǎng)絡(luò)中的數(shù)量水平、擴(kuò)散速率和分布的均勻性。岳增慧等[19]基于復(fù)雜網(wǎng)絡(luò)中的傳染病模型,設(shè)定科研合作網(wǎng)絡(luò)知識(shí)擴(kuò)散規(guī)則,建立了知識(shí)擴(kuò)散模型,通過仿真揭示科研合作網(wǎng)絡(luò)知識(shí)擴(kuò)散的動(dòng)力學(xué)影響機(jī)制,研究表明合作者的演化狀態(tài)和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)影響知識(shí)擴(kuò)散者的狀態(tài)演化。劉璇等[5]通過研究微觀個(gè)體對(duì)科研合作網(wǎng)絡(luò)知識(shí)擴(kuò)散的動(dòng)態(tài)影響機(jī)制,比較了4種經(jīng)典的社會(huì)網(wǎng)絡(luò)分析算法所具有的知識(shí)擴(kuò)散特征,發(fā)現(xiàn)處于“結(jié)構(gòu)洞”位置和度中心性高的個(gè)體在知識(shí)擴(kuò)散中最為重要。
綜上所述,前人對(duì)科研合作網(wǎng)絡(luò)的知識(shí)擴(kuò)散研究大多集中于整體網(wǎng)絡(luò)背景,而提升研究方向相近且合作關(guān)系密切的學(xué)術(shù)社群中的知識(shí)擴(kuò)散效率,將更有利于促進(jìn)科研人員的知識(shí)吸收和創(chuàng)新,從而進(jìn)一步促進(jìn)科研成果的產(chǎn)出。加之,學(xué)者們?cè)谥R(shí)源位勢(shì)對(duì)知識(shí)擴(kuò)散影響的研究中普遍忽略了個(gè)體吸收能力差異的因素。本文將科研合作網(wǎng)絡(luò)中各學(xué)術(shù)社群作為研究對(duì)象,提出基于合作者吸收能力的知識(shí)擴(kuò)散種子選擇方法,從各學(xué)術(shù)社群中選擇合適的知識(shí)擴(kuò)散種子,使得知識(shí)在社群內(nèi)部實(shí)現(xiàn)擴(kuò)散,以最大限度提升知識(shí)擴(kuò)散效率,從而提升學(xué)術(shù)成果的傳播和影響力。
2 科研合作網(wǎng)絡(luò)種子選擇與知識(shí)擴(kuò)散模型
2.1 科研合作網(wǎng)絡(luò)描述
科研合作網(wǎng)絡(luò)描述了學(xué)者之間的復(fù)雜合作關(guān)系,其中,網(wǎng)絡(luò)節(jié)點(diǎn)代表學(xué)者,網(wǎng)絡(luò)中的邊代表學(xué)者之間存在合作關(guān)系。用無向圖G(S,T)描述科研合作,G(S,T)中存在N個(gè)節(jié)點(diǎn),S={1,2,3,…,N}是節(jié)點(diǎn)的有限集,T={ij,|i,j∈S}是所有節(jié)點(diǎn)的連線的集合。所有與節(jié)點(diǎn)i存在直接連接關(guān)系的節(jié)點(diǎn)集合記為Γi,Γi={j|ij∈T},節(jié)點(diǎn)i的度ki為集合Γi中元素的個(gè)數(shù)。令vi(t)代表節(jié)點(diǎn)i在t時(shí)刻的知識(shí)存量,節(jié)點(diǎn)i所在的社團(tuán)中節(jié)點(diǎn)的集合記為Ci。
2.2 知識(shí)擴(kuò)散種子選擇
2.2.1 學(xué)術(shù)社群檢測(cè)
在合著網(wǎng)絡(luò)中,一些作者之間的連接比其他連接緊密,這些連接更密集的作者組成聚類,成為學(xué)術(shù)社群。同一個(gè)社群的作者可能來自同一個(gè)大學(xué)或科研組織,又或是通過參加了某個(gè)同行學(xué)術(shù)會(huì)議而彼此建立了合作關(guān)系等等。運(yùn)用社團(tuán)檢測(cè)方法可以在整個(gè)合著網(wǎng)絡(luò)中提取出學(xué)術(shù)社群。Pons P等曾于2005年提出了一個(gè)基于隨機(jī)游走的網(wǎng)絡(luò)社團(tuán)劃分算法,他們提出可以使用兩點(diǎn)到第三點(diǎn)的流距離之差來衡量?jī)牲c(diǎn)之間的相似性,從而為劃分社團(tuán)服務(wù)。一旦從流結(jié)構(gòu)中提取了節(jié)點(diǎn)相似性,社團(tuán)劃分就成為了一個(gè)聚類問題[20]。本文選用了這一效率較高的“WalkTrap”隨機(jī)游走算法。
2.2.2 種子選擇方法
本文考慮節(jié)點(diǎn)吸收能力的差異,提出將合作者吸收能力最大者作為知識(shí)擴(kuò)散種子,通過在每個(gè)學(xué)術(shù)社群內(nèi)部選擇一個(gè)種子點(diǎn),知識(shí)實(shí)現(xiàn)了在每個(gè)社團(tuán)內(nèi)部的擴(kuò)散。由于一些傳統(tǒng)的網(wǎng)絡(luò)中心性度量方法已被廣泛應(yīng)用于評(píng)估科學(xué)家在合作網(wǎng)絡(luò)中的重要性[21],分別將接近中心性、中介中心性、特征向量中心性和度中心性等4種復(fù)雜網(wǎng)絡(luò)中心性指標(biāo)最大的節(jié)點(diǎn)作為知識(shí)擴(kuò)散種子進(jìn)行知識(shí)擴(kuò)散仿真,與本文方法作對(duì)比。
1)合作者吸收能力(Collaborators Absorption Ability)
節(jié)點(diǎn)吸收能力的強(qiáng)弱影響知識(shí)擴(kuò)散效果,本文提出將節(jié)點(diǎn)合作者的吸收能力作為是否選其作為知識(shí)擴(kuò)散種子的依據(jù),節(jié)點(diǎn)i的合作者的吸收能力之和CAAi定義為:
其中aj為節(jié)點(diǎn)j的吸收能力,Γi為節(jié)點(diǎn)i的鄰接點(diǎn)的集合。
2)接近中心性(Closeness Centrality)
接近中心性描述網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)與網(wǎng)絡(luò)中其他所有節(jié)點(diǎn)的緊密程度,而此處的緊密度指節(jié)點(diǎn)間的跳數(shù)或連接數(shù)[22]。節(jié)點(diǎn)i的接近中心性的計(jì)算方式為節(jié)點(diǎn)i到其他所有節(jié)點(diǎn)的距離之和的倒數(shù),記為cci,若值越大,說明這個(gè)節(jié)點(diǎn)距離其他所有點(diǎn)的路徑越短。一個(gè)具有高接近中心度的點(diǎn),說明這個(gè)點(diǎn)離其他任何點(diǎn)都近。
其中dij為節(jié)點(diǎn)i到節(jié)點(diǎn)j的最短路徑,N為網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)。
3)中介中心性(Betweeness Centrality)
中介中心性度量了一個(gè)節(jié)點(diǎn)位于網(wǎng)絡(luò)中其他節(jié)點(diǎn)對(duì)之間的最短路徑的占比??煞磻?yīng)出節(jié)點(diǎn)成為中間人或媒介節(jié)點(diǎn)的程度,這會(huì)影響網(wǎng)絡(luò)的通信量或信息流[23]。它是一個(gè)全局指標(biāo),基于最短路徑長(zhǎng)度且強(qiáng)調(diào)了橋梁節(jié)點(diǎn)的重要性。因此,節(jié)點(diǎn)i的中介中心性bci定義為:
其中g(shù)st代表節(jié)點(diǎn)s與節(jié)點(diǎn)t之間的最短路徑數(shù),gist代表節(jié)點(diǎn)s與節(jié)點(diǎn)t的最短路徑中經(jīng)過節(jié)點(diǎn)i的路徑數(shù)。
4)特征向量中心性(Eigenvector Centrality)
特征向量中心性是對(duì)網(wǎng)絡(luò)中節(jié)點(diǎn)重要性的一種度量。節(jié)點(diǎn)的重要性取決于鄰接點(diǎn)的重要性[24]。它基于以下概念將相對(duì)分值分配給網(wǎng)絡(luò)中的所有節(jié)點(diǎn),即與得分高的節(jié)點(diǎn)的連接比與得分低的節(jié)點(diǎn)的連接對(duì)節(jié)點(diǎn)未來得分的貢獻(xiàn)更大。使用鄰接矩陣可以求得特征向量中心性,對(duì)于給定的圖G=(S,T),S為節(jié)點(diǎn)的集合,Γi為節(jié)點(diǎn)i的鄰接點(diǎn)的集合,N為節(jié)點(diǎn)數(shù),鄰接矩陣A中的元素Aij=1代表節(jié)點(diǎn)i與節(jié)點(diǎn)j之間有邊,節(jié)點(diǎn)i的特征向量中心性分值xi定義為:
5)度中心性(Degree Centrality)
度中心性是最直接的網(wǎng)絡(luò)拓?fù)鋵傩院饬恐笜?biāo),它僅使用了網(wǎng)絡(luò)中一步的局部信息以評(píng)估節(jié)點(diǎn)的中心性。節(jié)點(diǎn)的度中心性為節(jié)點(diǎn)的度,即與其相連的節(jié)點(diǎn)的數(shù)量。鄰接矩陣A中的元素Aij=1代表節(jié)點(diǎn)i與節(jié)點(diǎn)j之間有邊,則節(jié)點(diǎn)i的度中心性定義為:
其中N為網(wǎng)絡(luò)中節(jié)點(diǎn)的數(shù)量。
2.3 知識(shí)擴(kuò)散模型
知識(shí)擴(kuò)散種子產(chǎn)生的學(xué)術(shù)成果或獲取的新知識(shí)通過合作關(guān)系,被合作者吸收,進(jìn)而擴(kuò)散到整個(gè)學(xué)術(shù)社群。從科研合作網(wǎng)絡(luò)中的每個(gè)社群選擇一個(gè)種子點(diǎn)作為新知識(shí)的擴(kuò)散者,每個(gè)時(shí)間步長(zhǎng),所有節(jié)點(diǎn)從本社團(tuán)內(nèi)的鄰接點(diǎn)處吸收該知識(shí)。節(jié)點(diǎn)的吸收能力各不相同,節(jié)點(diǎn)i的吸收能力即每個(gè)時(shí)間步長(zhǎng),吸收到的知識(shí)在新知識(shí)中的占比,記為ai,ai∈(0,1)。
設(shè)定種子點(diǎn)知識(shí)量為1,t時(shí)刻,若節(jié)點(diǎn)i的知識(shí)存量小于1且鄰接點(diǎn)j和i在同一個(gè)社群,則t時(shí)刻,節(jié)點(diǎn)i從節(jié)點(diǎn)j處吸收的知識(shí)量Aabij(t)定義為:
則t時(shí)刻,節(jié)點(diǎn)i從社團(tuán)內(nèi)所有合作者吸收獲得的該知識(shí)Aabi(t)定義為:
其中Γi為i的鄰接點(diǎn)集合,Ci為i所在社團(tuán)中節(jié)點(diǎn)的集合。則節(jié)點(diǎn)i在t時(shí)刻的知識(shí)存量vi(t)定義為:
2.4 知識(shí)擴(kuò)散效率度量
用各時(shí)刻的網(wǎng)絡(luò)整體知識(shí)水平、知識(shí)增長(zhǎng)速度和知識(shí)水平分布的均勻性等指標(biāo)從多方面度量科研合作網(wǎng)絡(luò)的知識(shí)擴(kuò)散效率,這3個(gè)指標(biāo)分別描述了在各時(shí)刻科研合作網(wǎng)絡(luò)中節(jié)點(diǎn)平均知識(shí)存量的多少,知識(shí)增長(zhǎng)的快慢和節(jié)點(diǎn)間知識(shí)存量的差距。
2.4.1 整體知識(shí)水平
整個(gè)科研合作網(wǎng)絡(luò)t時(shí)刻的整體知識(shí)水平(t)定義為該時(shí)刻網(wǎng)絡(luò)中各節(jié)點(diǎn)知識(shí)存量的平均值。
2.4.2 知識(shí)增長(zhǎng)速度
網(wǎng)絡(luò)整體的知識(shí)增長(zhǎng)速度ρ(t)由不同時(shí)刻的整體知識(shí)水平確定,定義為:
2.4.3 知識(shí)水平分布的均勻性
知識(shí)擴(kuò)散的一個(gè)目的是縮小各節(jié)點(diǎn)之間知識(shí)存量的差距,網(wǎng)絡(luò)中主體知識(shí)水平的標(biāo)準(zhǔn)差用以度量知識(shí)水平分布的均勻性。標(biāo)準(zhǔn)差會(huì)隨著整體知識(shí)水平的增長(zhǎng)而增加,用t時(shí)刻的標(biāo)準(zhǔn)差系數(shù)c(t)衡量知識(shí)水平分布的均勻性,c(t)定義為:
其中,σ(t)為t時(shí)刻網(wǎng)絡(luò)中各主體知識(shí)存量的標(biāo)準(zhǔn)差。0 3 仿真分析 3.1 數(shù)據(jù)來源與仿真過程 本研究使用的科研合作網(wǎng)絡(luò)數(shù)據(jù)來自斯坦福大型網(wǎng)絡(luò)數(shù)據(jù)集[25]中的Collaboration Networks(協(xié)作網(wǎng)絡(luò)),網(wǎng)絡(luò)數(shù)據(jù)由相互連接的節(jié)點(diǎn)對(duì)組成,節(jié)點(diǎn)由編號(hào)進(jìn)行標(biāo)識(shí),無作者的具體信息。記錄了E-print arXiv(電子預(yù)印本文獻(xiàn)庫(kù))1993年4月至2003年4月(124個(gè)月)期間在線出版的論文中,包含5個(gè)研究領(lǐng)域作者間的科研合作關(guān)系[26]。該實(shí)驗(yàn)數(shù)據(jù)集中,若作者i與作者j合著了1篇論文,則圖中包含了節(jié)點(diǎn)i到節(jié)點(diǎn)j的無向邊;若論文是由k個(gè)作者合著,則在k個(gè)節(jié)點(diǎn)上生成一個(gè)完全連通子圖,網(wǎng)絡(luò)數(shù)據(jù)統(tǒng)計(jì)見表1。 本文運(yùn)用R軟件進(jìn)行仿真實(shí)驗(yàn)?!癢alkTrap”隨機(jī)游走社團(tuán)檢測(cè)算法與網(wǎng)絡(luò)中心性計(jì)量算法均來自R語(yǔ)言的Igraph包。首先,考慮到學(xué)者們的學(xué)習(xí)能力各不相同,設(shè)置節(jié)點(diǎn)的吸收能力a為[0.02,0.1]之間的隨機(jī)數(shù)。對(duì)每個(gè)網(wǎng)絡(luò)作隨機(jī)游走社團(tuán)檢測(cè),以區(qū)分出學(xué)術(shù)社群。隨后,為每個(gè)節(jié)點(diǎn)分別計(jì)算其合作者吸收能力之和(式1)、接近中心性(式2)、中介中心性(式3)、特征向量中心性(式4)和度中心性(式5),分別將各個(gè)學(xué)術(shù)社群中的上述5個(gè)指標(biāo)值最大的節(jié)點(diǎn)作為種子節(jié)點(diǎn)。為體現(xiàn)不同種子選擇方法在知識(shí)擴(kuò)散效率上的差異,采用5種種子選擇方法篩選的種子點(diǎn)不完全相同的社群參與下一步實(shí)驗(yàn),社群選擇數(shù)見表1。設(shè)置種子節(jié)點(diǎn)的知識(shí)存量為1,社群中其余節(jié)點(diǎn)知識(shí)存量為0。最后,遵循式(6)~(8)中定義的社群內(nèi)部知識(shí)擴(kuò)散模型,對(duì)5個(gè)網(wǎng)絡(luò)中的每個(gè)學(xué)術(shù)社群,分別以不同種子選擇方法篩選出的種子節(jié)點(diǎn)為起點(diǎn),進(jìn)行100個(gè)時(shí)間步長(zhǎng)的知識(shí)擴(kuò)散仿真實(shí)驗(yàn),知識(shí)由種子節(jié)點(diǎn)擴(kuò)散到整個(gè)學(xué)術(shù)社群。分別計(jì)算出各網(wǎng)絡(luò)不同種子選擇方法的整體知識(shí)水平(式9)、知識(shí)增長(zhǎng)速度(式10)和知識(shí)水平分布水平的均勻性(式11)。 3.2 社團(tuán)檢測(cè)與種子點(diǎn)選擇結(jié)果 從各網(wǎng)絡(luò)中所檢測(cè)出的學(xué)術(shù)社群數(shù)見表1,以HEP-PH網(wǎng)絡(luò)中第176號(hào)社群為例(見圖1),演示5種種子選擇方法下的種子選擇結(jié)果與不同時(shí)刻社群中節(jié)點(diǎn)知識(shí)存量的變化趨勢(shì)。圖中顏色不同于其他節(jié)點(diǎn)的為種子點(diǎn),節(jié)點(diǎn)的大小代表知識(shí)存量的多少,5種方法對(duì)該社群計(jì)算出的知識(shí)擴(kuò)散種子各不相同。在t=1時(shí)刻,各種子點(diǎn)的知識(shí)存量均為1,其余節(jié)點(diǎn)為0。在t=30時(shí)刻,不同種子點(diǎn)選擇方法下,節(jié)點(diǎn)的知識(shí)存量已顯示出差距,以中介中心性最大者為種子的情況下,社群中各節(jié)點(diǎn)的知識(shí)存量明顯低于其他幾種方法。社群內(nèi)部各節(jié)點(diǎn)之間的知識(shí)存量也顯示出差距。在t=60時(shí)刻,又經(jīng)過30個(gè)步長(zhǎng)的相互協(xié)作,同一社群中,節(jié)點(diǎn)之間的知識(shí)存量差距縮小,節(jié)點(diǎn)對(duì)知識(shí)的吸收趨近于飽和,不同種子點(diǎn)選擇方法之間的差距也逐漸縮小。
3.3 整體知識(shí)水平
5個(gè)科研合作網(wǎng)絡(luò)各時(shí)刻的網(wǎng)絡(luò)整體知識(shí)水平見圖2。圖中橫軸為時(shí)間步長(zhǎng),縱軸為網(wǎng)絡(luò)整體知識(shí)水平(式9)。采用不同的種子選擇方法,各網(wǎng)絡(luò)的整體知識(shí)水平在前期斜率最大,中期緩和,后期趨于水平。在5個(gè)網(wǎng)絡(luò)中,各種子選擇方法的網(wǎng)絡(luò)整體知識(shí)水平之間的差距均經(jīng)歷擴(kuò)大、縮小,最終趨于一致的過程。在知識(shí)水平達(dá)到飽和(即等于1)之前,各種子選擇方法在整體知識(shí)水平上的排序依次為合作者吸收能力、度中心性、中介中心性、接近中心性以及特征向量中心性。當(dāng)合作者吸收能力最大者作為種子點(diǎn)時(shí),僅考慮了網(wǎng)絡(luò)中第一層的局部信息,因其合作者吸收能力最大,在t=1時(shí)刻,種子點(diǎn)的合作者們吸收到的知識(shí)總和大于其他方法,在之后的擴(kuò)散過程中,其他方法也未能超過此方法。以度中心性最高者作為種子點(diǎn)的方法次之,在t=1時(shí)刻,種子點(diǎn)將知識(shí)轉(zhuǎn)移給相對(duì)于其他方法更多的節(jié)點(diǎn)。而基于中介中心性和接近中心性的方法考慮了網(wǎng)絡(luò)結(jié)構(gòu)的全局信息?;谥薪橹行男缘姆椒▽蛄汗?jié)點(diǎn)作為種子點(diǎn),基于接近中心性的方法將離各點(diǎn)距離之和最近的節(jié)點(diǎn)作為種子點(diǎn),因知識(shí)的吸收是從鄰接點(diǎn)處吸收而不是從種子
點(diǎn)處吸收,所以考慮全局結(jié)構(gòu)信息使得網(wǎng)絡(luò)整體知識(shí)水平低于前兩種方法?;谔卣飨蛄恐行男缘姆椒紤]的是節(jié)點(diǎn)鄰接矩陣的情況,各時(shí)刻整體知識(shí)水平最低。5個(gè)網(wǎng)絡(luò)在結(jié)構(gòu)上存在差異,因此在各網(wǎng)絡(luò)中5種種子選擇方法的整體知識(shí)水平存在差異。從劃分社群的結(jié)果發(fā)現(xiàn)每個(gè)網(wǎng)絡(luò)的社群平均規(guī)模大小不一,由于每個(gè)社群僅一個(gè)知識(shí)擴(kuò)散種子,社群規(guī)模越小,在t=0時(shí)刻,網(wǎng)絡(luò)整體知識(shí)水平越高。節(jié)點(diǎn)平均度越大的網(wǎng)絡(luò),學(xué)者的合作者越多,不同種子選擇方法的整體知識(shí)水平之間的差距越小。
3.4 知識(shí)增長(zhǎng)速度
圖3為5個(gè)網(wǎng)絡(luò)的知識(shí)增長(zhǎng)速度(式10)演化情況。5個(gè)網(wǎng)絡(luò)中各種子選擇方法的知識(shí)增長(zhǎng)速度均經(jīng)歷瞬時(shí)增大、急劇下降、降低放緩,最后趨近于零的過程。在t=0時(shí)刻,種子節(jié)點(diǎn)知識(shí)存量為1,其余節(jié)點(diǎn)的知識(shí)存量為0,種子節(jié)點(diǎn)與其余節(jié)點(diǎn)之間知識(shí)勢(shì)差最大。根據(jù)式(6),在t=1時(shí)刻,種子點(diǎn)將最多的知識(shí)量轉(zhuǎn)移給鄰居節(jié)點(diǎn),因此知識(shí)增長(zhǎng)速度達(dá)到最大值。5個(gè)網(wǎng)絡(luò)中,各方法的最大知識(shí)增長(zhǎng)速度的排序依次為基于合作者吸收能力、度中心性、中介中心性、接近中心性和特征向量中心性。在約t=10時(shí)刻,各方法的知識(shí)增長(zhǎng)速度降低為一致,之后差距加大,且與網(wǎng)絡(luò)的節(jié)點(diǎn)平均度成反比,之后趨于0。
3.5 知識(shí)水平分布的均勻性
知識(shí)水平分布的均勻性見圖4,各網(wǎng)絡(luò)的c(t)值(式11)在約12個(gè)時(shí)間步長(zhǎng)內(nèi)迅速降低,之后趨于水平。說明在知識(shí)擴(kuò)散初期,節(jié)點(diǎn)間知識(shí)水平差距較大,在不斷的協(xié)作中,節(jié)點(diǎn)間的知識(shí)水平差距越來越小。基于合作者吸收能力的種子選擇方法在知識(shí)擴(kuò)散的均勻性上優(yōu)于其他方法。且初始c(t)值較低的網(wǎng)絡(luò)在c(t)達(dá)到均衡狀態(tài)后也維持在相對(duì)較低的狀態(tài),經(jīng)過知識(shí)擴(kuò)散,各c(t)值均下降0.45~0.5,即初始知識(shí)均勻性較好的網(wǎng)絡(luò)到后期也繼續(xù)保持。
3.6 節(jié)點(diǎn)吸收能力對(duì)種子選擇的影響
節(jié)點(diǎn)的吸收能力是在知識(shí)擴(kuò)散模型中的重要參數(shù),節(jié)點(diǎn)間吸收能力的差距大小和網(wǎng)絡(luò)節(jié)點(diǎn)平均吸收能力的強(qiáng)弱是否會(huì)對(duì)種子選擇產(chǎn)生影響?為探究此問題,本文分別設(shè)置節(jié)點(diǎn)間吸收能力差異大、差異小、無差別和節(jié)點(diǎn)平均吸收能力低、中、高的情況下進(jìn)行知識(shí)擴(kuò)散仿真,觀察各種子選擇方法在知識(shí)擴(kuò)散效率上的差別,吸收能力設(shè)置情況見表2,時(shí)間步長(zhǎng)t=100。由于前文中不同種子選擇方法的知識(shí)擴(kuò)散效率的排序在各網(wǎng)絡(luò)中一致,因此選取網(wǎng)絡(luò)規(guī)模最小的GR-QC網(wǎng)絡(luò)作為實(shí)驗(yàn)數(shù)據(jù)。用于實(shí)驗(yàn)的學(xué)術(shù)社群為5種種子選擇方法獲取的種子點(diǎn)不完全相同的社群,而吸收能力的變化影響到基于合作者吸收能力方法的種子選擇情況,因此各吸收能力設(shè)置下選取的社群數(shù)量各不相同,選取情況表2。因吸收能力一致時(shí),基于合作者吸收能力的方法和基于度中心性的方法會(huì)選擇幾乎相同的種子,又因用于實(shí)驗(yàn)的社群為5種方法得到的種子不完全相同的社群,所以吸收能力一致時(shí)選取的社群數(shù)會(huì)明顯少于其他吸收能力的情況。
不同吸收能力差異下,GR-QC網(wǎng)絡(luò)的知識(shí)擴(kuò)散情況見圖5。從圖5得知,節(jié)點(diǎn)吸收能力的差異并未影響各種子選擇方法各時(shí)刻在整體知識(shí)水平高低的排序。節(jié)點(diǎn)吸收能力差異越大,基于合作者吸收能力的種子選擇方法與其他方法相比優(yōu)勢(shì)越明顯。節(jié)點(diǎn)間吸收能力差異的大小對(duì)基于接近中心性、中介中心性、度中心性和特征向量中心性等4種方法的整體知識(shí)水平之間的差距無明顯影響。當(dāng)節(jié)點(diǎn)吸收能力一致且同一社群存在多個(gè)度最大的節(jié)點(diǎn)時(shí),基于度中心性的方法和基于合作者吸收能力的方法可能會(huì)選擇不同的節(jié)點(diǎn)作為種子選擇的種子點(diǎn),其余情況下兩種方法會(huì)選擇同樣的節(jié)點(diǎn)作為種子點(diǎn),因此在吸收能力一致時(shí),兩種方法的整體知識(shí)水平存在細(xì)微的差距。在吸收能力差異大時(shí),基于合作者吸收能力方法的知識(shí)增長(zhǎng)速度在短時(shí)間達(dá)到最大值且明顯快于其他方法。各吸收能力差異下,約在t=20之后,基于合作者吸收能力的方法均下降至低于其他4種方法,在t=75之后各方法的知識(shí)增長(zhǎng)速度穩(wěn)定趨于0。不同吸收能力差異下,基于合作者吸收能力方法的知識(shí)水平分布均勻性始終最佳,且吸收能力差異越大,其均勻性與其余4種方法的差距越大。不同吸收能力差異下,基于中介中心性和接近中心性的方法在知識(shí)水平分布的均勻性始終最為接近,且吸收能力差異越大,這兩種方法的知識(shí)水平分布均勻性在更短的時(shí)間內(nèi)超過度中心性。
節(jié)點(diǎn)平均吸收能力不同的情況下,本文方法相較于其余方法仍體現(xiàn)出優(yōu)勢(shì)(見圖5)。節(jié)點(diǎn)平均吸收能力越小,同一時(shí)刻不同的種子選擇方法在整體知識(shí)水平、知識(shí)增長(zhǎng)速度和知識(shí)水平分布的均勻性上的差別越大。吸收能力越低知識(shí)增長(zhǎng)速度的最大值也最低,達(dá)到網(wǎng)絡(luò)知識(shí)均衡的時(shí)間也越長(zhǎng)。網(wǎng)絡(luò)整體吸收能力越強(qiáng),不同種子方法對(duì)知識(shí)擴(kuò)散效率的影響越小。
4 結(jié)論與展望
相較于宏觀整體網(wǎng)絡(luò)涌現(xiàn)出的知識(shí)流動(dòng)特征,學(xué)術(shù)社群內(nèi)部流動(dòng)的知識(shí)與學(xué)者研究?jī)?nèi)容的相關(guān)性更為具體?,F(xiàn)有對(duì)知識(shí)源位置選擇的研究大多基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)分析,普遍忽略了節(jié)點(diǎn)吸收能力差異這一“內(nèi)容性”因素,而節(jié)點(diǎn)吸收能力是網(wǎng)絡(luò)知識(shí)擴(kuò)散模型中必須考慮的核心參數(shù)。本文面向科研合作網(wǎng)絡(luò)的學(xué)術(shù)社群,考慮了學(xué)者間知識(shí)吸收能力
圖5 不同吸收能力設(shè)置下GR-QC網(wǎng)絡(luò)知識(shí)擴(kuò)散情況
差異,提出基于合作者吸收能力的知識(shí)擴(kuò)散種子選擇方法,以合作對(duì)象的吸收能力總和作為選擇知識(shí)擴(kuò)散種子的標(biāo)準(zhǔn),有助于顯著提升知識(shí)擴(kuò)散效率,從而促進(jìn)社群成員對(duì)科學(xué)知識(shí)的吸收和創(chuàng)新。對(duì)比以往類似研究只考慮網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)位置對(duì)知識(shí)擴(kuò)散效率的影響,實(shí)現(xiàn)了方法邏輯上的延拓。
源于斯坦福大型網(wǎng)絡(luò)數(shù)據(jù)集(SNAP),將Collaboration Networks(協(xié)作網(wǎng)絡(luò))中的天體物理學(xué)、凝聚物理學(xué)、廣義相對(duì)論和量子宇宙學(xué)、高能物理現(xiàn)象學(xué)以及高等物理理論學(xué)等5個(gè)研究領(lǐng)域的公開合著網(wǎng)絡(luò)數(shù)據(jù)作為研究對(duì)象,采用高效的“WalkTrap”隨機(jī)游走社團(tuán)檢測(cè)算法從中檢測(cè)出學(xué)術(shù)社群。利用本文提出的方法,從各學(xué)術(shù)社群中選出知識(shí)擴(kuò)散種子,令其作為起點(diǎn)將知識(shí)擴(kuò)散到社群內(nèi)部,并將該方法與基于接近中心性、中介中心性、特征向量中心性和度中心性的種子選擇方法作對(duì)比。采用整體知識(shí)水平、知識(shí)增長(zhǎng)速度和知識(shí)水平分布的均勻性3個(gè)知識(shí)擴(kuò)散效率指標(biāo),描述不同種子選擇方法背景下的知識(shí)擴(kuò)散效率差異。實(shí)驗(yàn)表明,采用本文提出的方法能達(dá)到最佳的知識(shí)擴(kuò)散效果,且節(jié)點(diǎn)間吸收能力差距越大,這種方法相較于其他方法的優(yōu)勢(shì)就更加突出。在各知識(shí)擴(kuò)散效率指標(biāo)下,另4種方法的知識(shí)擴(kuò)散效率排序依次為基于度中心性、中介中心性、接近中心性和特征向量中心性的方法,且在吸收能力的不同參數(shù)設(shè)置下,先后順序保持不變。節(jié)點(diǎn)平均吸收能力越高或節(jié)點(diǎn)平均度越大,各種子選擇方法的知識(shí)擴(kuò)散效率之間的差距越小。
在實(shí)踐中,為提升科研合作網(wǎng)絡(luò)中學(xué)術(shù)成果的傳播效率,可選擇合作者們的學(xué)習(xí)能力最強(qiáng)的學(xué)者作為知識(shí)擴(kuò)散者。其中學(xué)習(xí)能力的衡量可參考學(xué)者的學(xué)歷、單位時(shí)間內(nèi)成果的產(chǎn)出量等因素。相反,選擇那些合作者最多、在整個(gè)網(wǎng)絡(luò)中起到橋梁作用或跟其余學(xué)者關(guān)系都較近又或是選擇合作者重要性很強(qiáng)的學(xué)者作為知識(shí)擴(kuò)散者,其效果均不如選擇合作者學(xué)習(xí)能力強(qiáng)的科學(xué)家。
本文在得出上述結(jié)論的同時(shí),還存在一些不足之處。比如,沒有考慮到5個(gè)不同領(lǐng)域的科研合作網(wǎng)絡(luò)的其他網(wǎng)絡(luò)統(tǒng)計(jì)特征(如聚集系數(shù)、直徑等)的差異對(duì)社團(tuán)檢測(cè)和種子選擇的影響。又比如,目前的網(wǎng)絡(luò)數(shù)據(jù)僅含網(wǎng)絡(luò)結(jié)構(gòu)信息,節(jié)點(diǎn)為編號(hào),無作者姓名,因此在選擇種子時(shí)僅考慮了網(wǎng)絡(luò)的結(jié)構(gòu)信息和實(shí)驗(yàn)設(shè)置的吸收能力參數(shù),未考慮到作者自身的人口統(tǒng)計(jì)學(xué)變量情況等等。在今后的研究中,將進(jìn)一步搜集更充分的科研合作網(wǎng)絡(luò)數(shù)據(jù),以完善實(shí)驗(yàn),得出更具價(jià)值的結(jié)論。
參考文獻(xiàn)
[1]Tijssen R J W.Is the Commercialisation of Scientific Research Affecting the Production of Public Knowledge?Global Trends in the Output of Corporate Research Articles[J].Research Policy,2004,33(5):709-733.
[2]Wuchty S,Jones B F,Uzzi B.The Increasing Dominance of Teams in Production of Knowledge[J].Science,2007,316(5827):1036-1039.
[3]Newman M E J.The Structure of Scientific Collaboration Networks[J].Proceedings of the National Academy of Sciences of the United States of America,2000,98(2):404-409.
[4]巴志超,李綱,朱世偉.科研合作網(wǎng)絡(luò)的知識(shí)擴(kuò)散機(jī)理研究[J].中國(guó)圖書館學(xué)報(bào),2016,42(5):68-84.
[5]劉璇,李嘉,陳志高,等.科研創(chuàng)新網(wǎng)絡(luò)中知識(shí)擴(kuò)散演化機(jī)制研究[J].科研管理,2015,36(7):19-27.
[6]涂靜,楊中華,張志清.科研合作網(wǎng)絡(luò)中知識(shí)源中心性對(duì)知識(shí)擴(kuò)散效率的影響[J].情報(bào)理論與實(shí)踐,2017,40(5):76-81.
[7]avu瘙塂
oglu A,lker Türker.Patterns of Collaboration in Four Scientific Disciplines of the Turkish Collaboration Network[J].Physica A Statistical Mechanics & Its Applications.2014,413(11):220-229.
[8]Barbosa M W,Ladeira M B,Alberto D L C V.An Analysis of International Coauthorship Networks in the Supply Chain Analytics Research Area[J].Scientometrics,2017,111(3):1703-1731.
[9]GaskóN,Lung R I,Suciu M A.A New Network Model for the Study of Scientific Collaborations:Romanian Computer Science and Mathematics Co-authorship Networks[J].Scientometrics,2016,108(2):613-632.
[10]Kretschmer H,Beaver D D,Ozel B,et al.Who is Collaborating with Whom?Part I.Mathematical Model and Methods for Empirical Testing[J].Journal of Informetrics,2015,9(2):359-372.
[11]趙蓉英,王旭,亓永康.我國(guó)世界一流大學(xué)建設(shè)高校間科研合作網(wǎng)絡(luò)及演化研究[J].現(xiàn)代情報(bào),2019,39(3):132-143.
[12]Zhou J,Zeng A,F(xiàn)an Y,et al.Identifying Important Scholars Via Directed Scientific Collaboration Networks[J].Scientometrics,2017,114(3):1327-1343.
[13]王新明,丁敬達(dá).科研論文的著者合作模式研究綜述[J].現(xiàn)代情報(bào),2018,38(8):172-177.
[14]王世波,趙金樓.復(fù)雜網(wǎng)絡(luò)視角下技術(shù)創(chuàng)新擴(kuò)散種子選擇研究[J].科技進(jìn)步與對(duì)策,2018,35(13):28-33.
[15]李軍,朱先奇,史彥虎.加權(quán)網(wǎng)絡(luò)視角下產(chǎn)業(yè)集群創(chuàng)新擴(kuò)散機(jī)制仿真研究[J].重慶大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2017,23(6):13-20.
[16]馬永紅,張利寧,王展昭.基于采納者決策機(jī)制的競(jìng)爭(zhēng)性創(chuàng)新擴(kuò)散的閾值模型構(gòu)建及仿真研究[J].科技管理研究,2016,(22):12-17.
[17]盧燕群,何永芳.復(fù)雜網(wǎng)絡(luò)視角下企業(yè)集群技術(shù)創(chuàng)新擴(kuò)散仿真研究[J].中國(guó)科技論壇,2018,(3):73-80.
[18]朱曉霞,趙雪,劉萌萌.基于多層網(wǎng)絡(luò)的偽信息擴(kuò)散及干預(yù)研究[J].情報(bào)雜志,2017,(10):47,66-70.
[19]岳増慧,許海云,方曙.基于微分動(dòng)力學(xué)的科研合作網(wǎng)絡(luò)知識(shí)擴(kuò)散模型及影響機(jī)制研[J].情報(bào)學(xué)報(bào),2015,34(11):1132-1142.
[20]Pons P,Latepy M.Computing Communities in Large Networks Using Random Walks(Long Version)[J].Computer and Information Sciences-ISCIS,2005:284-293.
[21]Yan E,Ding Y.Applying Centrality Measures to Impact Analysis:A Coauthorship Network Analysis[J].Journal of the Association for Information Science & Technology,2009,60(10):2107-2118.
[22]Bavelas A.Communication Patterns in Task Oriented Groups[J].Journal of the Acoustical Society of America,1950,22:271-282.
[23]Bader D A,Kintali S,Madduri K,et al.Approximating Betweenness Centrality[M].Algorithms and Models for the Web-Graph.Springer Berlin Heidelberg,2007:124-137.
[24]Perra N,F(xiàn)ortunato S.Spectral Centrality Measures in Complex Networks[J].Physical Review E,2008,78(3):036107.
[25]Leskovec J,Krevl A.SNAP:Large Network Dataset Collection[DB/OL].http://snap.stanford.edu/data,2019-01-16.
[26]Leskovec J,Kleinberg J,F(xiàn)aloutsos C.Graph Evolution:Densification and Shrinking Diameters[J].Acm Transactions on Knowledge Discovery from Data,2007,1(1):1-41.
(責(zé)任編輯:孫國(guó)雷)