趙汝南,常志遠(yuǎn),姜 博,劉雅姝,陳 思,滕廣青(東北師范大學(xué)計(jì)算機(jī)科學(xué)與信息技術(shù)學(xué)院,長(zhǎng)春 130117)
?
基于網(wǎng)絡(luò)演化的領(lǐng)域知識(shí)發(fā)展趨勢(shì)研究
趙汝南,常志遠(yuǎn),姜博,劉雅姝,陳思,滕廣青
(東北師范大學(xué)計(jì)算機(jī)科學(xué)與信息技術(shù)學(xué)院,長(zhǎng)春 130117)
知識(shí)的演進(jìn)與發(fā)展問(wèn)題是圖書情報(bào)學(xué)界的重要課題之一。研究中從時(shí)間序列的視角出發(fā),通過(guò)對(duì)特定領(lǐng)域文獻(xiàn)關(guān)鍵詞的提取,基于關(guān)鍵詞共現(xiàn)關(guān)系構(gòu)建領(lǐng)域知識(shí)網(wǎng)絡(luò)。采用網(wǎng)絡(luò)密度、聚類系數(shù)、特征路徑長(zhǎng)度、點(diǎn)度中心勢(shì)、中介中心勢(shì)等多種分析方法,對(duì)領(lǐng)域知識(shí)網(wǎng)絡(luò)的發(fā)展態(tài)勢(shì)進(jìn)行跟蹤與分析。研究結(jié)果表明,領(lǐng)域知識(shí)的發(fā)展趨勢(shì)總體上向小世界狀態(tài)邁進(jìn),而且領(lǐng)域知識(shí)的中心性會(huì)隨著知識(shí)發(fā)展逐漸顯現(xiàn),為基于復(fù)雜網(wǎng)絡(luò)的理論與方法對(duì)領(lǐng)域知識(shí)的發(fā)展趨勢(shì)進(jìn)行分析與研判做出了有益的嘗試。
復(fù)雜網(wǎng)絡(luò);領(lǐng)域知識(shí);知識(shí)網(wǎng)絡(luò)
對(duì)學(xué)科領(lǐng)域知識(shí)的發(fā)展進(jìn)程進(jìn)行研究一直以來(lái)就是圖書情報(bào)學(xué)領(lǐng)域的重要課題。1965年,普賴斯(D J Price)[1]發(fā)表的《科學(xué)論文的網(wǎng)絡(luò)》中提出并界定了學(xué)科領(lǐng)域“研究前沿”的概念,為網(wǎng)絡(luò)思維下領(lǐng)域知識(shí)發(fā)展研究奠定了理論基礎(chǔ)。特別是近年來(lái),復(fù)雜網(wǎng)絡(luò)(Complex Network)[2]的理論與方法在眾多科學(xué)領(lǐng)域的研究工作中顯現(xiàn)出得天獨(dú)厚的優(yōu)勢(shì),為復(fù)雜網(wǎng)絡(luò)視角下的領(lǐng)域知識(shí)發(fā)展研究帶來(lái)了新的契機(jī)。
有鑒于此,本研究將以特定知識(shí)領(lǐng)域作為研究對(duì)象,借助復(fù)雜網(wǎng)絡(luò)的思想,基于關(guān)鍵詞共現(xiàn)關(guān)系構(gòu)建領(lǐng)域知識(shí)網(wǎng)絡(luò)。采用網(wǎng)絡(luò)密度、聚類系數(shù)、特征路徑長(zhǎng)度、點(diǎn)度中心勢(shì)、中介中心勢(shì)等分析方法,對(duì)領(lǐng)域知識(shí)的發(fā)展展開(kāi)時(shí)間序列的跟蹤與分析,以期通過(guò)對(duì)領(lǐng)域知識(shí)網(wǎng)絡(luò)發(fā)展過(guò)程中特征與規(guī)律的挖掘與研判,揭示領(lǐng)域知識(shí)的發(fā)展趨勢(shì)。
英國(guó)著名情報(bào)學(xué)家布魯克斯(B C Brooks)[3]在《情報(bào)學(xué)基礎(chǔ)》(The Foundations of Information Science)中最早提出了“知識(shí)地圖”的概念。隨后在布魯克斯“知識(shí)地圖”的雛形上,知識(shí)的網(wǎng)絡(luò)化描述思想逐漸融入圖書情報(bào)學(xué)的研究領(lǐng)域與實(shí)踐工作。20世紀(jì)90年代,埃格(L Egghe)[4]在《情報(bào)計(jì)量學(xué)引論》(Introduction to Informetrics)中對(duì)多元統(tǒng)計(jì)分析、網(wǎng)絡(luò)分析及其在引文網(wǎng)絡(luò)分析中的應(yīng)用進(jìn)行了闡述,豐富了引文分析方法,促進(jìn)了網(wǎng)絡(luò)思維在知識(shí)相關(guān)問(wèn)題研究中的應(yīng)用。事實(shí)上,早在20世紀(jì)60年代開(kāi)始,國(guó)際學(xué)術(shù)界就已經(jīng)掀起了一股網(wǎng)絡(luò)分析的熱潮。先是米爾格蘭姆(S Milgram)[5]“六度分割”的“小世界”理論,接著是弗里曼(L C Freeman)[6]的“網(wǎng)絡(luò)結(jié)構(gòu)決定網(wǎng)絡(luò)功能”的思想,這些都為網(wǎng)絡(luò)思想在多學(xué)科中的應(yīng)用奠定了基礎(chǔ)。特別是20世紀(jì)末,斯托加茨(S H Strogatz)[7]和巴拉巴西(A L Barabasi)[8]等人陸續(xù)在《自然》(Nature)和《科學(xué)》(Science)雜志上發(fā)表文章,在多個(gè)學(xué)科領(lǐng)域中將網(wǎng)絡(luò)視域下的結(jié)構(gòu)主義推向了學(xué)術(shù)的巔峰,使得復(fù)雜網(wǎng)絡(luò)分析的思想與方法真正被學(xué)術(shù)界普遍接受,并被應(yīng)用于眾多的學(xué)科領(lǐng)域。
近年來(lái),在知識(shí)領(lǐng)域的相關(guān)問(wèn)題研究中,復(fù)雜網(wǎng)絡(luò)分析的方法也被廣泛引入。IBM研究院的克勞斯(R Cross)[9]認(rèn)為,復(fù)雜網(wǎng)絡(luò)分析有助于可視化理解信息環(huán)境中眾多的關(guān)聯(lián)關(guān)系,并借助網(wǎng)絡(luò)分析提煉了潛在知識(shí)構(gòu)建所涉及的主要維度關(guān)系。約翰·霍普金斯大學(xué)的利博維茨(J Liebowitz)[10]則提出復(fù)雜網(wǎng)絡(luò)能夠提供更豐富的知識(shí)關(guān)聯(lián)關(guān)系,并能夠?yàn)閭鹘y(tǒng)的知識(shí)層級(jí)結(jié)構(gòu)做出更細(xì)致的解釋。華盛頓州立大學(xué)的薩卡爾(S Sarker)[11]將復(fù)雜網(wǎng)絡(luò)分析應(yīng)用于知識(shí)群落中的核心知識(shí)的識(shí)別研究,并采用網(wǎng)絡(luò)分析中的“結(jié)構(gòu)/關(guān)聯(lián)”方法,通過(guò)對(duì)網(wǎng)絡(luò)中節(jié)點(diǎn)關(guān)系的分析,揭示處于網(wǎng)絡(luò)中心位置的核心知識(shí)。加拿大紐芬蘭紀(jì)念大學(xué)的威爾遜(G Wilson)[12]借助網(wǎng)絡(luò)分析中的節(jié)點(diǎn)度、網(wǎng)絡(luò)密度、鄰近權(quán)威3個(gè)指標(biāo),探測(cè)機(jī)構(gòu)內(nèi)部電子郵件網(wǎng)絡(luò)。他們的研究表明,網(wǎng)絡(luò)密度和鄰近權(quán)威更有利于揭示和發(fā)現(xiàn)知識(shí)網(wǎng)絡(luò)的關(guān)鍵核心節(jié)點(diǎn)。胡(C Hu)[13]基于歷時(shí)5年的期刊文獻(xiàn)合著數(shù)據(jù),應(yīng)用復(fù)雜網(wǎng)絡(luò)分析探索特定學(xué)科領(lǐng)域的知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)屬性,通過(guò)文獻(xiàn)作者間的合著關(guān)系建立了知識(shí)內(nèi)容與作者混合網(wǎng)絡(luò),并重點(diǎn)分析了該網(wǎng)絡(luò)中的“核心-邊緣”結(jié)構(gòu)。研究結(jié)果顯示,在網(wǎng)絡(luò)的中心和外圍區(qū)域,學(xué)術(shù)論文的出版模式都呈現(xiàn)出冪律分布。楊(J Yang)[14]及其合作者運(yùn)用復(fù)雜網(wǎng)絡(luò)分析的方法對(duì)特定領(lǐng)域中的文獻(xiàn)內(nèi)容進(jìn)行分析,直接從文獻(xiàn)中抓取知識(shí)概念,并依據(jù)其上下文關(guān)系構(gòu)建知識(shí)網(wǎng)絡(luò),進(jìn)而根據(jù)知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)及其動(dòng)態(tài)演化規(guī)律提取網(wǎng)絡(luò)中知識(shí)單元間的關(guān)系。他們認(rèn)為,復(fù)雜網(wǎng)絡(luò)分析避免了二元關(guān)系模型的不足,能夠呈現(xiàn)知識(shí)間完整的關(guān)聯(lián)關(guān)系,并有利于更深層次地揭示網(wǎng)絡(luò)背后的屬性結(jié)構(gòu)關(guān)系。意大利學(xué)者考薩(M Coscia)[15]提出,數(shù)字化書目是一種匯集了海量學(xué)術(shù)出版物信息的強(qiáng)大的數(shù)據(jù)資源。他們把網(wǎng)絡(luò)分析應(yīng)用于書目數(shù)據(jù)庫(kù)的知識(shí)脈絡(luò)研究,基于關(guān)系呈現(xiàn)構(gòu)建了書目關(guān)系網(wǎng)絡(luò),進(jìn)而采用數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)分析相結(jié)合的方法,對(duì)局部和全局書目網(wǎng)絡(luò)進(jìn)行綜合的分析與揭示??死蛱兀↗ Krafft)[16]進(jìn)一步以復(fù)雜網(wǎng)絡(luò)分析為主要研究方法,對(duì)特定學(xué)科領(lǐng)域的知識(shí)動(dòng)力學(xué)展開(kāi)了研究。在這一研究中,研究者將專利文獻(xiàn)中的技術(shù)視為知識(shí)流動(dòng)的最小單位,知識(shí)的結(jié)構(gòu)被視為由具有社群屬性的技術(shù)節(jié)點(diǎn)及其相互關(guān)系構(gòu)成的網(wǎng)絡(luò)。進(jìn)而直接通過(guò)對(duì)基于技術(shù)共現(xiàn)形成的網(wǎng)絡(luò)密度、點(diǎn)度中心度、接近中心度、中介中心度等指標(biāo)的測(cè)算,提供關(guān)于知識(shí)結(jié)構(gòu)與演進(jìn)的綜合描述。研究表明,知識(shí)間關(guān)聯(lián)關(guān)系的演進(jìn)可以反映技術(shù)知識(shí)的新陳代謝及其生命周期。德國(guó)亞琛大學(xué)的范姆(M C Pham)[17]將期刊論文和會(huì)議論文結(jié)合起來(lái),采用復(fù)雜網(wǎng)絡(luò)分析的方法,借助論文中的引用關(guān)系分別構(gòu)建了期刊關(guān)系網(wǎng)絡(luò)、主題關(guān)系網(wǎng)絡(luò)、知識(shí)關(guān)系網(wǎng)絡(luò),綜合作者合著關(guān)系與引用關(guān)系調(diào)查知識(shí)間的引用行為,計(jì)算知識(shí)主題的中介中心度,判識(shí)子學(xué)科的發(fā)展趨勢(shì)。
國(guó)內(nèi)學(xué)術(shù)界這方面的研究成果主要集中于文獻(xiàn)計(jì)量學(xué)領(lǐng)域的合作關(guān)系分析[18]、科研團(tuán)隊(duì)發(fā)現(xiàn)[19]等問(wèn)題。其中,朱慶華[20]的研究表明,復(fù)雜網(wǎng)絡(luò)分析作為一種新的科學(xué)研究思想和方法,早已被應(yīng)用于圖書情報(bào)領(lǐng)域,學(xué)者們通過(guò)復(fù)雜網(wǎng)絡(luò)分析方法,在競(jìng)爭(zhēng)情報(bào)、知識(shí)管理、作者合著網(wǎng)絡(luò)及領(lǐng)域熱點(diǎn)分析等方面展開(kāi)了專門的研究。這其中,劉則淵[21]采用復(fù)雜網(wǎng)絡(luò)分析的方法對(duì)共詞網(wǎng)絡(luò)進(jìn)行了聚類分析,挖掘了特定學(xué)科領(lǐng)域的主題,并對(duì)領(lǐng)域的熱點(diǎn)和未來(lái)發(fā)展方向進(jìn)行了預(yù)判。趙蓉英[22]基于引文數(shù)據(jù)和主題數(shù)據(jù),采用復(fù)雜網(wǎng)絡(luò)分析的方法對(duì)特定知識(shí)領(lǐng)域的學(xué)科主題和研究熱點(diǎn)進(jìn)行了揭示。
綜上所述,在基于復(fù)雜網(wǎng)絡(luò)的理論與方法對(duì)知識(shí)相關(guān)問(wèn)題進(jìn)行研究方面,目前已經(jīng)取得了較為豐富的成果,但其中大多數(shù)研究尚停留在靜態(tài)分析層面。有鑒于此,本研究從時(shí)間序列的視角,以領(lǐng)域知識(shí)網(wǎng)絡(luò)的時(shí)序演化為基礎(chǔ),對(duì)領(lǐng)域知識(shí)的發(fā)展趨勢(shì)從多個(gè)方面展開(kāi)分析研究。
3.1 數(shù)據(jù)采集
本研究以中國(guó)國(guó)家知識(shí)基礎(chǔ)設(shè)施(National Knowledge Infrastructure,CNKI)數(shù)據(jù)庫(kù)作為基礎(chǔ)數(shù)據(jù)源,在高級(jí)檢索中選擇按主題檢索并將檢索主題設(shè)為“電動(dòng)汽車”并含“充電樁”,匹配模式為精確,發(fā)表時(shí)間為全部年限進(jìn)行檢索。檢索日期為2015年12月25日,共檢索到2009~2015年的相關(guān)期刊文獻(xiàn)共725篇。
以時(shí)間序列為線索,以年份為時(shí)間刻度,將文獻(xiàn)的累積數(shù)據(jù)按時(shí)間窗口分割,并繪制各年文獻(xiàn)累計(jì)量曲線。2009~2015年,電動(dòng)汽車充電樁領(lǐng)域的文獻(xiàn)累計(jì)量呈持續(xù)遞增趨勢(shì),具體參見(jiàn)圖1。
圖1 領(lǐng)域文獻(xiàn)累計(jì)量曲線
3.2 矩陣構(gòu)建與轉(zhuǎn)換
對(duì)檢索出的725篇相關(guān)文獻(xiàn)進(jìn)行關(guān)鍵詞提取,并按年份構(gòu)建領(lǐng)域關(guān)鍵詞的多值共現(xiàn)矩陣,即當(dāng)兩個(gè)關(guān)鍵詞出現(xiàn)在同一文獻(xiàn)中時(shí),則其兩者間存在關(guān)聯(lián)關(guān)系,計(jì)數(shù)為1。以此累計(jì),當(dāng)數(shù)值越大時(shí),就表明兩個(gè)關(guān)鍵詞之間的共現(xiàn)頻次越高,關(guān)系也就越密切。文獻(xiàn)中的關(guān)鍵詞經(jīng)過(guò)研究作者和審稿人的多層審核,極少出現(xiàn)歧義、近義等現(xiàn)象,即使個(gè)別文獻(xiàn)出現(xiàn)關(guān)鍵詞歧義、近義現(xiàn)象也不做單獨(dú)處理,而是通過(guò)二值轉(zhuǎn)化時(shí)的臨界值統(tǒng)一對(duì)不具備普遍意義的關(guān)鍵詞做出篩選。多值共現(xiàn)矩陣中對(duì)角線的數(shù)值為關(guān)鍵詞在所有文獻(xiàn)中總共出現(xiàn)的次數(shù)。根據(jù)上述方法對(duì)檢索得到的相關(guān)文獻(xiàn)的關(guān)鍵詞提取后,按照時(shí)間序列共生成2010~2015年各年的關(guān)鍵詞多值共現(xiàn)矩陣共6個(gè)。其中由于2009年文獻(xiàn)僅有兩篇,研究中將其并入2010年關(guān)鍵詞多值共現(xiàn)矩陣,不再單獨(dú)討論。以2011年關(guān)鍵詞多值共現(xiàn)矩陣為例,其矩陣結(jié)構(gòu)如表1所示。
表1 2011年關(guān)鍵詞多值共現(xiàn)矩陣(節(jié)選)
以各個(gè)時(shí)間窗口的共現(xiàn)頻次的均值為臨界值,將上述獲得的6個(gè)關(guān)鍵詞多值共現(xiàn)矩陣進(jìn)行二值化處理。即當(dāng)矩陣中兩個(gè)關(guān)鍵詞同時(shí)出現(xiàn)在一篇文獻(xiàn)中的頻次大于等于均值時(shí),視為具有顯著關(guān)聯(lián)關(guān)系,記為1;如果兩個(gè)關(guān)鍵詞同時(shí)出現(xiàn)在一篇文獻(xiàn)中的頻次小于均值,則視為不具有顯著的關(guān)聯(lián)關(guān)系,記為0。按此方法對(duì)矩陣進(jìn)行轉(zhuǎn)換,可以得到關(guān)鍵詞二值共現(xiàn)矩陣,以便于在后續(xù)研究中對(duì)領(lǐng)域知識(shí)發(fā)展趨勢(shì)進(jìn)行識(shí)別與分析。以其中2010年關(guān)鍵詞二值共現(xiàn)矩陣為例,部分?jǐn)?shù)據(jù)如表2所示。
表2 2010年關(guān)鍵詞二值共現(xiàn)矩陣(節(jié)選)
3.3 領(lǐng)域知識(shí)網(wǎng)絡(luò)構(gòu)建
以關(guān)鍵詞為節(jié)點(diǎn),以關(guān)鍵詞之間的顯著關(guān)聯(lián)關(guān)系為連線,基于轉(zhuǎn)換后的6個(gè)時(shí)間窗口下的關(guān)鍵詞二值共現(xiàn)矩陣,構(gòu)建時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò),如圖2所示。
圖2 時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)
在圖2中,各個(gè)時(shí)間窗口的領(lǐng)域知識(shí)網(wǎng)絡(luò)呈現(xiàn)的是領(lǐng)域中較為重要的知識(shí)節(jié)點(diǎn)及其關(guān)聯(lián)關(guān)系,由于經(jīng)過(guò)臨界值篩選,孤立節(jié)點(diǎn)和低頻次關(guān)聯(lián)關(guān)系已經(jīng)被剔除。因此,基于圖2中的時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)展開(kāi)分析工作,將能夠較好地把握領(lǐng)域中重要知識(shí)的發(fā)展趨勢(shì)。
4.1 領(lǐng)域知識(shí)網(wǎng)絡(luò)基本屬性分析
在復(fù)雜網(wǎng)絡(luò)中,網(wǎng)絡(luò)密度反映的是節(jié)點(diǎn)間聯(lián)系的密集程度,領(lǐng)域知識(shí)網(wǎng)絡(luò)的密度越大,則表明該網(wǎng)絡(luò)的知識(shí)節(jié)點(diǎn)間的聯(lián)系就越密集,知識(shí)之間產(chǎn)生的相互影響也就越大。表3為該領(lǐng)域6個(gè)時(shí)間窗口中領(lǐng)域知識(shí)網(wǎng)絡(luò)相應(yīng)的密度,由數(shù)據(jù)可以看出領(lǐng)域知識(shí)網(wǎng)絡(luò)的密度在時(shí)間序列上呈現(xiàn)出下降趨勢(shì)。這一現(xiàn)象說(shuō)明,隨著時(shí)間軸的延展,網(wǎng)絡(luò)內(nèi)各知識(shí)節(jié)點(diǎn)的整體聯(lián)系程度逐漸松散,大量的知識(shí)不斷涌入領(lǐng)域中。這進(jìn)一步表明該領(lǐng)域是一個(gè)處于發(fā)展中的學(xué)科領(lǐng)域,正處在不斷成長(zhǎng)過(guò)程中,相關(guān)的領(lǐng)域知識(shí)涉及多個(gè)其他學(xué)科領(lǐng)域,是一門與其他學(xué)科交互較多的領(lǐng)域。
表3 時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)整體密度
復(fù)雜網(wǎng)絡(luò)的聚類系數(shù)反映網(wǎng)絡(luò)節(jié)點(diǎn)群落特性的聚集程度,領(lǐng)域知識(shí)網(wǎng)絡(luò)的聚類系數(shù)描述出該領(lǐng)域內(nèi)知識(shí)之間趨近于團(tuán)簇或群落的情況。圖2所示的時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)的基于局部密度的聚類系數(shù)計(jì)算結(jié)果如表4所示。
表4 時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)聚類系數(shù)
表4中,盡管6個(gè)時(shí)間窗口的聚類系數(shù)稍有波動(dòng),但總體上保持較高的數(shù)值(大于0.88)。這說(shuō)明在整個(gè)時(shí)間區(qū)間內(nèi),基于關(guān)鍵詞共現(xiàn)關(guān)系構(gòu)建的領(lǐng)域知識(shí)網(wǎng)絡(luò)具有顯著的團(tuán)簇特征,或者說(shuō)具有較高程度的模塊結(jié)構(gòu)。即各個(gè)時(shí)間窗口的領(lǐng)域知識(shí)網(wǎng)絡(luò)中,較重要的知識(shí)節(jié)點(diǎn)(關(guān)鍵詞)之間具有較高的群落性,并且這種群落性在整個(gè)時(shí)間區(qū)間內(nèi)一直保持。
對(duì)時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)的特征路徑長(zhǎng)度進(jìn)行考察,計(jì)算獲得6個(gè)時(shí)間窗口領(lǐng)域知識(shí)網(wǎng)絡(luò)的距離分布如表5所示。
表5 時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)距離分布
表5的6個(gè)時(shí)間窗口中,距離為2的情況一直占有絕對(duì)多數(shù),其中最低的比率為占總數(shù)的75%(2013),其他時(shí)間窗口都在80%以上。這明確地顯示出,隨著領(lǐng)域知識(shí)的發(fā)展,領(lǐng)域中絕大多數(shù)知識(shí)之間的距離為2。進(jìn)一步對(duì)表5中時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)的平均距離進(jìn)行考察可以發(fā)現(xiàn),雖然隨著時(shí)間的推移,網(wǎng)絡(luò)中的知識(shí)節(jié)點(diǎn)不斷增加,但網(wǎng)絡(luò)中任何兩個(gè)知識(shí)節(jié)點(diǎn)之間的平均距離保持在1.803~2.252。這意味著網(wǎng)絡(luò)中2個(gè)知識(shí)節(jié)點(diǎn)之間僅有一個(gè)中間節(jié)點(diǎn),即領(lǐng)域知識(shí)網(wǎng)絡(luò)中知識(shí)之間平均通過(guò)1個(gè)中間知識(shí)就可以建立聯(lián)系。
將網(wǎng)絡(luò)密度、聚類系數(shù)和特征路徑長(zhǎng)度結(jié)合起來(lái)考察可以發(fā)現(xiàn),隨著時(shí)間軸的延展,領(lǐng)域知識(shí)不斷擴(kuò)容。在整個(gè)時(shí)間序列上,該領(lǐng)域的知識(shí)網(wǎng)絡(luò)的網(wǎng)絡(luò)密度逐漸下降,網(wǎng)絡(luò)越來(lái)越稀疏。而且整個(gè)網(wǎng)絡(luò)自始至終保持著高度的聚類性,特征路徑長(zhǎng)度總體上為2。結(jié)合圖2的時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)綜合分析,在時(shí)間序列的前半階段網(wǎng)絡(luò)是不連通的狀態(tài),時(shí)間序列的后半階段網(wǎng)絡(luò)演變?yōu)檫B通網(wǎng)絡(luò)。根據(jù)沃茨(D J Watts)[23]的觀點(diǎn)可知,領(lǐng)域知識(shí)網(wǎng)絡(luò)演化的過(guò)程中逐漸表現(xiàn)出小世界[5]的特征趨勢(shì)。
4.2 領(lǐng)域知識(shí)網(wǎng)絡(luò)中心性分析
網(wǎng)絡(luò)的點(diǎn)度中心性反映一個(gè)網(wǎng)絡(luò)的核心程度,研究中基于弗里曼(L C Freeman)[24]提出的方法,對(duì)基于關(guān)鍵詞二值共現(xiàn)矩陣構(gòu)建的時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)(參見(jiàn)圖2)的點(diǎn)度中心勢(shì)進(jìn)行了考察,相關(guān)指標(biāo)數(shù)據(jù)走勢(shì)如圖3所示。
圖3 時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)點(diǎn)度中心勢(shì)
圖3中領(lǐng)域知識(shí)網(wǎng)絡(luò)的點(diǎn)度中心勢(shì)并未表現(xiàn)出始終如一的發(fā)展趨勢(shì),而是呈現(xiàn)出一種先抑后揚(yáng)的態(tài)勢(shì)。在時(shí)間軸的前半段,領(lǐng)域知識(shí)網(wǎng)絡(luò)的點(diǎn)度中心勢(shì)逐漸下降,反映出這一時(shí)間區(qū)段內(nèi),領(lǐng)域知識(shí)不斷擴(kuò)充,大量的相關(guān)學(xué)科知識(shí)參加進(jìn)來(lái),隨著網(wǎng)絡(luò)節(jié)點(diǎn)的增加,領(lǐng)域的核心焦點(diǎn)也趨于淡化。在時(shí)間軸的后半段,領(lǐng)域知識(shí)網(wǎng)絡(luò)的點(diǎn)度中心勢(shì)逐漸上升,反映出這一時(shí)間區(qū)段內(nèi),領(lǐng)域知識(shí)不斷擴(kuò)充的同時(shí),領(lǐng)域知識(shí)的核心焦點(diǎn)也在重新凝聚。這一現(xiàn)象反映出研究中所選取的知識(shí)領(lǐng)域目前正處于發(fā)展時(shí)期,一方面發(fā)展過(guò)程中不斷加入和涌現(xiàn)的新知識(shí)使得核心知識(shí)的地位不再顯著;另一方面隨著研究工作的開(kāi)展,領(lǐng)域核心知識(shí)也在重塑甚至新生。領(lǐng)域知識(shí)的發(fā)展趨勢(shì)最終將走向具有鮮明的領(lǐng)域核心的狀態(tài)。
網(wǎng)絡(luò)的中介中心性反映的是節(jié)點(diǎn)對(duì)網(wǎng)絡(luò)資源的控制程度,在領(lǐng)域知識(shí)網(wǎng)絡(luò)中,中介中心性能夠描述通過(guò)中間知識(shí)將不同的知識(shí)進(jìn)行橋接的程度。研究中采用弗里曼(L C Freeman)[6]的中介中心性計(jì)算方法,對(duì)基于關(guān)鍵詞二值共現(xiàn)矩陣構(gòu)建的時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)(參見(jiàn)圖2)的中介中心勢(shì)進(jìn)行計(jì)算,獲得時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)的中介中心勢(shì)走勢(shì)如圖4所示。
圖4 時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)中介中心勢(shì)
在圖4中,時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)的中介中心勢(shì)雖然略有起伏,但整體上呈現(xiàn)出上升趨勢(shì)。網(wǎng)絡(luò)中介中心勢(shì)由初始時(shí)刻的45.69%增長(zhǎng)到2015年的60.64%,而且時(shí)間軸的后半段比前半段有普遍提高。這一現(xiàn)象說(shuō)明,在領(lǐng)域知識(shí)發(fā)展過(guò)程中,盡管網(wǎng)絡(luò)中的知識(shí)節(jié)點(diǎn)逐年增加,但是新增的知識(shí)節(jié)點(diǎn)并沒(méi)有一味地簡(jiǎn)單形成小規(guī)模碎片區(qū)域,而是隨著知識(shí)節(jié)點(diǎn)數(shù)量的增加,有許多知識(shí)節(jié)點(diǎn)通過(guò)中間知識(shí)建立起連接,并且這種連接呈現(xiàn)出總體上升趨勢(shì)。與圖2中領(lǐng)域知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)的時(shí)間序列發(fā)展過(guò)程結(jié)合考察,領(lǐng)域知識(shí)網(wǎng)絡(luò)從早期的不連通狀態(tài)到后期的聯(lián)通狀態(tài),反映出該領(lǐng)域知識(shí)在發(fā)展過(guò)程中也在不斷地成熟。
本研究通過(guò)對(duì)特定領(lǐng)域文獻(xiàn)關(guān)鍵詞的提取,基于關(guān)鍵詞共現(xiàn)關(guān)系構(gòu)建基于關(guān)鍵詞的領(lǐng)域知識(shí)網(wǎng)絡(luò)。從時(shí)間序列的視角采用網(wǎng)絡(luò)密度、聚類系數(shù)、特征路徑長(zhǎng)度、點(diǎn)度中心勢(shì)、中介中心勢(shì)等多種分析方法,對(duì)領(lǐng)域知識(shí)網(wǎng)絡(luò)的發(fā)展態(tài)勢(shì)進(jìn)行跟蹤與分析。通過(guò)各項(xiàng)指標(biāo)在時(shí)間序列上的變化情況,對(duì)于領(lǐng)域知識(shí)的發(fā)展趨勢(shì)初步可以得出如下結(jié)論:
(1)領(lǐng)域知識(shí)的發(fā)展趨勢(shì)總體上向小世界狀態(tài)邁進(jìn)。研究中發(fā)現(xiàn),一個(gè)特定的知識(shí)領(lǐng)域在其成長(zhǎng)發(fā)展過(guò)程中,領(lǐng)域內(nèi)相關(guān)知識(shí)文獻(xiàn)必然是不斷地積累和增長(zhǎng),從而促使領(lǐng)域內(nèi)的知識(shí)容量與規(guī)模不斷擴(kuò)大。從時(shí)間序列上看,這種領(lǐng)域知識(shí)的不斷擴(kuò)充導(dǎo)致領(lǐng)域知識(shí)網(wǎng)絡(luò)內(nèi)部知識(shí)節(jié)點(diǎn)數(shù)量的不斷增加,也使得知識(shí)網(wǎng)絡(luò)的密度在發(fā)展過(guò)程中呈下降趨勢(shì)。密度下降的同時(shí),領(lǐng)域知識(shí)網(wǎng)絡(luò)卻一直保持著較高的聚類系數(shù),這種高聚類系數(shù)標(biāo)志著領(lǐng)域知識(shí)內(nèi)部蘊(yùn)含著團(tuán)簇化、群落化的潛在發(fā)展模式。如果說(shuō)從大的方面看,知識(shí)領(lǐng)域內(nèi)部高內(nèi)聚,知識(shí)領(lǐng)域之間低耦合,那么這種高內(nèi)聚低耦合的特征也嵌套于知識(shí)領(lǐng)域內(nèi)部。由于知識(shí)領(lǐng)域自身的主題性,高聚類系數(shù)并沒(méi)有在領(lǐng)域內(nèi)部完全徹底地造成割據(jù),反而是較短的特征路徑長(zhǎng)度刻畫出領(lǐng)域內(nèi)部知識(shí)之間僅需少量知識(shí)就能夠聯(lián)系起來(lái)。這說(shuō)明在領(lǐng)域知識(shí)的不斷積累增長(zhǎng)過(guò)程中,其發(fā)展趨勢(shì)在總體上向小世界狀態(tài)邁進(jìn)。
(2)領(lǐng)域知識(shí)的中心性會(huì)隨著知識(shí)發(fā)展逐漸顯現(xiàn)。一方面,在復(fù)雜網(wǎng)絡(luò)理論中,小世界狀態(tài)除了較高的聚類系數(shù)和較短的特征路徑長(zhǎng)度特征外,往往還伴隨著去中心化。然而在針對(duì)時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)的中心性分析中發(fā)現(xiàn),在時(shí)間軸的前半段,領(lǐng)域知識(shí)網(wǎng)絡(luò)的點(diǎn)度中心勢(shì)呈現(xiàn)下降趨勢(shì),領(lǐng)域核心知識(shí)的顯著性并沒(méi)有趕上領(lǐng)域知識(shí)擴(kuò)充的步伐。然而隨著該知識(shí)領(lǐng)域逐漸發(fā)展成熟,網(wǎng)絡(luò)的點(diǎn)度中心勢(shì)在時(shí)間軸的后半段又逐年遞增,領(lǐng)域的知識(shí)核心被重新凝聚。另一方面,網(wǎng)絡(luò)的中介中心勢(shì)在整個(gè)時(shí)間區(qū)間內(nèi)呈現(xiàn)波動(dòng)性上升趨勢(shì),也就是說(shuō)盡管新知識(shí)的擴(kuò)充和加入給中介中心勢(shì)造成波動(dòng),在整體趨勢(shì)上領(lǐng)域知識(shí)網(wǎng)絡(luò)的中介中心勢(shì)卻保持著增長(zhǎng)勢(shì)頭。這與領(lǐng)域知識(shí)的小世界趨勢(shì)相契合的同時(shí),也進(jìn)一步說(shuō)明隨著領(lǐng)域知識(shí)的發(fā)展,更多的領(lǐng)域知識(shí)通過(guò)中間知識(shí)彼此建立了關(guān)聯(lián)關(guān)系,彰顯了格雷克(J Gleick)[24]在《信息簡(jiǎn)史》中反復(fù)強(qiáng)調(diào)的知識(shí)的連通性。
盡管本研究以特定領(lǐng)域知識(shí)的發(fā)展過(guò)程為對(duì)象,采用復(fù)雜網(wǎng)絡(luò)的諸多分析方法,從領(lǐng)域知識(shí)網(wǎng)絡(luò)演化的角度,對(duì)領(lǐng)域知識(shí)的發(fā)展趨勢(shì)進(jìn)行了較為細(xì)致的分析,但是研究中也還存在不足之處。所采用研究數(shù)據(jù)并沒(méi)有窮盡該領(lǐng)域知識(shí)的全部,不同知識(shí)領(lǐng)域所處的不同發(fā)展?fàn)顟B(tài)尚不全面,有待于未來(lái)工作中進(jìn)一步深入展開(kāi)研究。
[1] Price D J. Networks of scientific papers [J]. Science, 1965, 149(3683):510-515.
[2] Lewis T G.網(wǎng)絡(luò)科學(xué):原理與應(yīng)用[M].陳向陽(yáng),巨修煉,等,譯.北京:機(jī)械工業(yè)出版社,2011:87-140.
[3] Brooks B C. The foundations of information science: part IV. Information science: the changing paradigm [J]. Journal of Information Science, 1981, 3(1): 3-12.
[4] Egghe L, Rousseau R. Introduction to informetrics: quantitative methods in library, documentation and information science [M]. Amsterdam:Elsevier, 1990: 112.
[5] Milgram S. The small world problem [J]. Psychology Today, 1967, 1(1):61-67.
[6] Freeman L C. Centrality in social networks conceptual clarification [J]. Social Networks, 1979, 1(3): 215-239.
[7] Strogatz S H, Watts D J. Collective dynamics of "small world" networks [J]. Nature, 1998, 393(6684): 440-442.
[8] Barabasi A L, Albert R. Emergence of scaling in random networks [J]. Science, 1999, 286(5439): 509-512.
[9] Cross R, Parker A, Borgatti S P. A bird's-eye view: using social network analysis to improve knowledge creation and sharing [R]. Somers: IBM Corporation, 2002: 1-17.
[10] Liebowitz J. Linking social network analysis with the analytic hierarchy process for knowledge mapping in organizations [J]. Journal of Knowledge Management, 2005, 9(1): 76-86.
[11] Sarker S, Kirkeby S, et al. Path to "stardom" in globally distributed teams:an examination of a knowledge-centered perspective using social network analysis [J]. Decision Sciences, 2011, 42(2): 339-370.
[12] Wilson G, Banzhaf W. Discovery of email communication networks from the enron corpus with a genetic algorithm using social network analysis [C]// CEC'09 Proceedings of the Eleventh conference on Congress on Evolutionary Computation. Piscataway: IEEE Press, 2009:3256-3263.
[13] Hu C, Racherla P. Visual representation of knowledge networks: A social network analysis of hospitality research domain [J]. International Journal of Hospitality Management, 2008, 27(2): 302-312.
[14] Yang J, Shen Q, Ho M. An overview of previous studies in stakeholder management and its implications for the construction industry [J]. Journal of Facilities Management, 2009, 7(2): 159-175.
[15] Coscia M, Giannotti F, Pensa R. Social network analysis as knowledge discovery process: a case study on digital bibliography [C]// ASONAM '09 Proceedings of the 2009 International Conference on Advances in Social Network Analysis and Mining. Washington DC: IEEE Computer Society, 2009: 279-283.
[16] Krafft J, Quatraro F, Saviotti P P. The knowledge base evolution in biotechnology: A social network analysis [J]. Economics of Innovation and New Technology, 2011, 20(5): 445-475.
[17] Pham M C, Klamma R, Jarke M. Development of computer science disciplines—A social network analysis approach [J]. Social Network Analysis and Mining, 2011, 1(4): 321-340.
[18] 邱均平,王菲菲.基于SNA的國(guó)內(nèi)競(jìng)爭(zhēng)情報(bào)領(lǐng)域作者合作關(guān)系研究[J].圖書館論壇,2010,30(6):34-40,134.
[19] 李綱,李春雅,李翔.基于社會(huì)網(wǎng)絡(luò)分析的科研團(tuán)隊(duì)發(fā)現(xiàn)研究[J].圖書情報(bào)工作,2014,58(7):63-70,82.
[20] 朱慶華,李亮.社會(huì)網(wǎng)絡(luò)分析法及其在情報(bào)學(xué)中的應(yīng)用[J].情報(bào)理論與實(shí)踐,2008,31(2):179-183.
[21] 劉則淵,尹麗春.國(guó)際科學(xué)學(xué)主題共詞網(wǎng)絡(luò)的可視化研究[J].情報(bào)學(xué)報(bào),2006,25(5):634-640.
[22] 趙蓉英,王菊.圖書館學(xué)知識(shí)圖譜分析[J].中國(guó)圖書館學(xué)報(bào), 2011,37(3):40-50.
[23] Watts D J. Network, dynamics and the small-world phenomenon [J]. American Journal of Sociology, 1999, 105(2): 493-527.
[24] Gleick J.信息簡(jiǎn)史[M].高博,譯.北京:人民郵電出版社,2013:409-421.
趙汝南,女,1991年生,碩士研究生。
常志遠(yuǎn),男,1989年生,碩士研究生。
姜博,男,1983年生,碩士研究生。
劉雅姝,女,1993年生,碩士研究生。
陳思,女,1993年生,碩士研究生。
滕廣青,男,1970年生,副教授,研究方向:網(wǎng)絡(luò)信息資源管理,通訊作者,E-mail:tengguangqing@163.com。
Study on Development Tendency of Domain Knowledge Based on Network Evolution
ZHAO RuNan, CHANG ZhiYuan, JIANG Bo, LIU YaShu, CHEN Si, TENG GuangQing
(School of Computer Science and Information Technology NENU, Changchun 130117, China)
Evolution and development of knowledge is an important issue of Library and Information academia. In this study, from the perspective of time series, keywords of literature are extracted in particular domain, and domain knowledge networks are constructed based on keyword co-occurrence relationship. Using a variety of analytical methods network density, clustering coefficient, characteristic path length, degree centralization, betweenness centralization, etc., the development of situation in domain knowledge networks is tracked and analyzed. The results show that the overall trend of domain knowledge development is moving to the status of small world, and centrality of domain knowledge will appear gradually with the development of knowledge. A helpful attempt is made for analyzing and judgment on development tendency of domain knowledge based on complex network theory and methods.
Complex Network; Domain Knowledge; Knowledge Network
G353.1
10.3772/j.issn.1673-2286.2016.3.004
2016-02-01)