[摘要] 以科學(xué)引文索引( SCIE) 為數(shù)據(jù)源基礎(chǔ),下載以“inst chem* same (chin* aca* or acta*) same beijing)”為檢索字段的科學(xué)文獻(xiàn)全紀(jì)錄數(shù)據(jù),利用SCIE分析功能和信息可視化方法( citespace軟件),對(duì)2004-2008年間中科院化學(xué)所發(fā)表論文的文獻(xiàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和可視化分析,得出化學(xué)所發(fā)表論文的年代分布;通過(guò)繪制化學(xué)所發(fā)表的合著者、與化學(xué)所共作者的國(guó)家和機(jī)構(gòu),以及期刊共引和共詞的可視化圖譜,揭示對(duì)化學(xué)所起關(guān)鍵作用的共作者機(jī)構(gòu)和國(guó)家、核心期刊、學(xué)科領(lǐng)域、學(xué)科帶頭人和研究熱點(diǎn)。
[關(guān)鍵詞] 研究機(jī)構(gòu) 文獻(xiàn)計(jì)量 可視化分析 citespace軟件
在全球化知識(shí)經(jīng)濟(jì)環(huán)境下,作為支撐一流科技創(chuàng)新的院所文獻(xiàn)情報(bào)系統(tǒng),不僅要面對(duì)未來(lái)不斷創(chuàng)新的數(shù)字科研、e-learning環(huán)境和學(xué)科領(lǐng)域的交叉與飛速發(fā)展,滿(mǎn)足科研用戶(hù)對(duì)e-science學(xué)術(shù)信息利用環(huán)境不斷提高的需求,而且要有快速收集有效的文獻(xiàn)數(shù)據(jù)信息,利用文獻(xiàn)情報(bào)分析工具,發(fā)掘隱藏在數(shù)據(jù)背后知識(shí)內(nèi)涵和情報(bào)的能力,以滿(mǎn)足戰(zhàn)略決策者對(duì)研究機(jī)構(gòu)的科研產(chǎn)出和發(fā)展態(tài)勢(shì)情報(bào)的需求。
信息可視化(informaiton visualization,InfoVis或Iv)是近年來(lái)出現(xiàn)的數(shù)據(jù)挖掘方法之一,它能很好地利用人類(lèi)對(duì)可視化形式下的模型和結(jié)構(gòu)的獲取能力,解決科技文獻(xiàn)數(shù)據(jù)量過(guò)大、無(wú)法快速和有效交流的問(wèn)題,同時(shí)可視化數(shù)據(jù)挖掘可觀(guān)察、篩選、發(fā)現(xiàn)和理解信息,發(fā)現(xiàn)隱藏在數(shù)據(jù)和信息背后的含意[1]。
本文以開(kāi)展基礎(chǔ)研究為主,有重點(diǎn)地開(kāi)展國(guó)家急需的、有重大戰(zhàn)略需求的高技術(shù)創(chuàng)新研究,并與高新技術(shù)應(yīng)用和轉(zhuǎn)化工作相協(xié)調(diào)發(fā)展的多學(xué)科、綜合性研究所——中國(guó)科學(xué)院化學(xué)所(以下簡(jiǎn)稱(chēng)化學(xué)所)作為研究機(jī)構(gòu)的實(shí)例,以化學(xué)所近5年(2004-2008年)被科學(xué)引文索引數(shù)據(jù)庫(kù)(SCIE)收錄的國(guó)際論文為科研產(chǎn)出指標(biāo),利用SCIE分析功能,結(jié)合近年出現(xiàn)的信息可視化數(shù)據(jù)挖掘軟件——citespace,對(duì)收錄的科學(xué)文獻(xiàn)全紀(jì)錄數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和可視化分析。在傳統(tǒng)的對(duì)發(fā)表論文相關(guān)信息文獻(xiàn)計(jì)量分析的基礎(chǔ)上,更加注重利用citespace軟件對(duì)論文題目、摘要、關(guān)鍵詞、標(biāo)示符等數(shù)據(jù)提取詞集,從引文數(shù)量、共現(xiàn)和共引的頻次多方面進(jìn)行聚類(lèi)計(jì)算,發(fā)現(xiàn)隱藏在可視化數(shù)據(jù)背后的有價(jià)值情報(bào)。
1 方法與數(shù)據(jù)源
1.1 方法
采用美國(guó)Drexe1大學(xué)陳超美博士開(kāi)發(fā)的基于JAVA平臺(tái)的citespace在線(xiàn)可視化軟件,該軟件是一種適于多元、分時(shí)、動(dòng)態(tài)的復(fù)雜網(wǎng)絡(luò)分析的新一代信息可視化技術(shù)。使用citespace 的一般步驟:①確定一個(gè)研究領(lǐng)域或研究機(jī)構(gòu),收集盡可能多的文獻(xiàn);②收集數(shù)據(jù), 包括題目、摘要、被引文獻(xiàn)等信息的文獻(xiàn)全紀(jì)錄信息;③參數(shù)選擇:確定總的時(shí)間段范圍和時(shí)間分區(qū);選擇分析的節(jié)點(diǎn)類(lèi)型;引文數(shù)量、共被引頻次和共被引系數(shù)三個(gè)層次上分別設(shè)定閾值;選擇算法精簡(jiǎn)和合并網(wǎng)絡(luò);④顯示可視化圖譜;確定關(guān)鍵點(diǎn)。
citespace可用于進(jìn)行科學(xué)文獻(xiàn)全記錄數(shù)據(jù)共引網(wǎng)絡(luò)分析,通過(guò)對(duì)文獻(xiàn)信息的可視化,能夠較為直觀(guān)地識(shí)別研究機(jī)構(gòu)科研產(chǎn)出發(fā)展態(tài)勢(shì)的情報(bào)[2]。
1.2 數(shù)據(jù)源
選擇美國(guó)科學(xué)情報(bào)研究所ISI(International for Scientific Information)創(chuàng)建的SCIE數(shù)據(jù)庫(kù)為數(shù)據(jù)源,檢索策略為:地址= inst chem* same (chin* aca* or acta*) same beijing),出版年=2004-2008,檢索結(jié)果命中記錄4 065條,引文數(shù)據(jù)138 586條,總被因頻次為38 053次。將2004-2008年間化學(xué)所發(fā)表的4 065篇論文的作者、題目、主題詞、關(guān)鍵詞、文獻(xiàn)的引文等全紀(jì)錄信息導(dǎo)入citeSpace軟件,采用SCIE的分析功能和citespace軟件 ( 2009年3月20日發(fā)布2.2. R1 Webstart版本[3])進(jìn)行論文發(fā)表年代分布、合作者、學(xué)科領(lǐng)域、合作機(jī)構(gòu)、合作國(guó)家、期刊共引、作者共引信息分析,繪制網(wǎng)絡(luò)可視化圖譜。
2 化學(xué)所發(fā)表論文情況分析
2.1 發(fā)表論文年代分布
SCIE收錄的2004-2008年間化學(xué)所發(fā)表論文的數(shù)量和論文被引頻次分布結(jié)果如圖1所示:
在2004-2008年5年間,化學(xué)所論文數(shù)量保持平穩(wěn)增長(zhǎng),年均發(fā)表論文數(shù)量約800篇;但是5年間發(fā)表論文的被引頻次從2004年的186次,猛增到2008年的12 805次,呈逐年大幅度增長(zhǎng)的趨勢(shì),被引頻次的提高表明化學(xué)所發(fā)表論文的質(zhì)量有了顯著的提高。通過(guò)SCIE引證檢索結(jié)果的數(shù)據(jù):化學(xué)所論文年平均被引頻次達(dá)到6 604.67,篇平均被引頻次為9.36,h指數(shù)為66,進(jìn)一步反映化學(xué)所2004-008年5年在國(guó)際科學(xué)研究領(lǐng)域的影響力顯著加強(qiáng)。
2.2 化學(xué)所論文合著者分布(co-authors network)
利用citespace軟件對(duì)2004-2008年間化學(xué)所發(fā)表論文的合著者網(wǎng)絡(luò)圖譜進(jìn)行分析,選擇使用關(guān)鍵路徑(pathfinder)算法,網(wǎng)絡(luò)節(jié)點(diǎn)確定為作者,時(shí)間區(qū)選擇為1年,閾值為(6,6,40),(8,8,40),(10,10,40)。圖譜中不同大小和不同顏色的圓環(huán)組成的作者年輪來(lái)表示合著者頻次(freq)和合著年份[4]。如圖2、表1所示:
從圖2、表1中可以清晰地看出,2004-2008年化學(xué)所的論文合著者中合著頻次高于100次的有7人,其中,合著頻次位于前5位的分別是:Zhu DB院士、Jiang L研究員、Han BX研究員、Liu YQ研究員和Li YL研究員。對(duì)論文合著者進(jìn)行聚類(lèi)分析,可以看出圖譜可以聚為6大類(lèi),6大類(lèi)中合著頻次最高的作者分別是由Zhu DB院士、Jiang L研究員、Han BX研究員、Wan LJ所長(zhǎng)、Wan LJ研究員和Li YF研究員,因此通過(guò)化學(xué)所論文合著者的網(wǎng)絡(luò)圖譜分析,可以清楚地了解化學(xué)所研究領(lǐng)域的學(xué)科帶頭人及其研究團(tuán)隊(duì)的分布。
2.3 化學(xué)所論文學(xué)科領(lǐng)域分布(co-occurring subject category )
利用citespace軟件對(duì)1995-2008年化學(xué)所共現(xiàn)學(xué)科領(lǐng)域進(jìn)行分析,選擇使用關(guān)鍵路徑算法,網(wǎng)絡(luò)節(jié)點(diǎn)確定為學(xué)科領(lǐng)域,時(shí)間區(qū)選擇為1年,閾值為(2,2,5),(3,3,5),(3,3,20)。圖譜中不同大小和不同顏色的圓環(huán)組成的學(xué)科領(lǐng)域年輪表示學(xué)科領(lǐng)域的共現(xiàn)頻次和共現(xiàn)年份,用不同顏色的連線(xiàn)來(lái)表示學(xué)科領(lǐng)域間共現(xiàn)的年代。如圖3、表2所示:
從圖3、表2中可以看出,在化學(xué)所論文共現(xiàn)學(xué)科領(lǐng)域中,共現(xiàn)頻次大于20次的學(xué)科領(lǐng)域有16個(gè),其中化學(xué)、聚合物科學(xué)、物理、材料科學(xué)、納米科學(xué)及納米技術(shù)位于與化學(xué)所共現(xiàn)學(xué)科領(lǐng)域的前5位。
2.4 與化學(xué)所共作者的機(jī)構(gòu)分布(network of co-authors institutes)
利用citespace軟件對(duì)2004-2008年與化學(xué)所共作者的機(jī)構(gòu)網(wǎng)絡(luò)圖譜進(jìn)行分析,選擇使用關(guān)鍵路徑算法,網(wǎng)絡(luò)節(jié)點(diǎn)確定為機(jī)構(gòu),時(shí)間區(qū)選擇為1年,閾值為(2,2,5),(3,3,5),(3,3,20)。圖譜中不同大小和不同顏色的圓環(huán)組成的機(jī)構(gòu)年輪來(lái)表示機(jī)構(gòu)與化學(xué)所共作者頻次和共作者年份。如圖4、表3所示:
從圖4、表3中可以看出,在與化學(xué)所共作者的機(jī)構(gòu)中,中科院的節(jié)點(diǎn)(freq=3 718)遠(yuǎn)遠(yuǎn)大于其他機(jī)構(gòu),說(shuō)明化學(xué)所與中科院內(nèi)的共作者者頻次最高。還可以看出共作者頻次大于30次的機(jī)構(gòu)有14個(gè),其中北京大學(xué)、武漢大學(xué)、山東大學(xué)、清華大學(xué)、吉林大學(xué)位于與化學(xué)所國(guó)內(nèi)共作者的前5位,值得注意的是德國(guó)Max Planck Inst Colloids Interfaces的合作位居第10位,說(shuō)明化學(xué)所與該機(jī)構(gòu)的合作十分緊密。
2.5 與化學(xué)所共作者的國(guó)家分布(network of co-authors countries)
利用citespace軟件對(duì)2004-2008年與化學(xué)所共作者的國(guó)家網(wǎng)絡(luò)圖譜進(jìn)行分析,選擇使用關(guān)鍵路徑算法,網(wǎng)絡(luò)節(jié)點(diǎn)確定為國(guó)家,時(shí)間區(qū)選擇為1年,閾值為(2,2,3),(2,2,3),(3,3,5)。圖譜中不同大小和不同顏色的圓環(huán)組成的國(guó)家年輪來(lái)表示國(guó)家與化學(xué)所的共作者頻次和共作者年份。如圖5、表4所示:
從圖5、表4中可以看出,在與化學(xué)所共作者的國(guó)家中,中國(guó)的節(jié)點(diǎn)(freq=3 931)遠(yuǎn)遠(yuǎn)大于其他國(guó)家,說(shuō)明化學(xué)所與國(guó)內(nèi)共作者的頻次最高。還可以看出與化學(xué)所共作者的頻次大于10次的國(guó)家有9個(gè),其中美國(guó)、德國(guó)、日本、加拿大、英國(guó)位于與化學(xué)所合作的前5位。
2.6化學(xué)所期刊共引分析(journal co-citation network)
利用citespace軟件對(duì)2004-2008年化學(xué)所期刊共引進(jìn)行分析,選擇使用關(guān)鍵路徑算法,網(wǎng)絡(luò)節(jié)點(diǎn)確定為期刊,時(shí)間區(qū)選擇為1年,閾值為(30,30,30),(30,30,30),(30,30,40)。圖譜中不同大小和不同顏色的圓環(huán)組成的期刊年輪來(lái)表示期刊的共引頻次和共引年份,用不同顏色的連線(xiàn)來(lái)表示期刊間共引的年代。如圖6、表5和表6所示:
從圖6、表5、表6中可以清晰地看出,目前化學(xué)所使用的核心期刊中有9種期刊的共引頻次高于1 000,其中,期刊共引頻次位于前5位的分別是:《科學(xué)》、《自然》、《物理化學(xué)雜志B》、《先進(jìn)材料》、《化學(xué)評(píng)論》。尤其值得注意的是SCIE數(shù)據(jù)庫(kù)中化學(xué)所發(fā)文量位于前5位的期刊分別是:《物理化學(xué)雜志B》、《應(yīng)用聚合物科學(xué)》、《聚合物》、《大分子》、《蘭格繆爾》,與期刊共引頻次排在前5位的有所不同,因此,在關(guān)注學(xué)科領(lǐng)域核心期刊的時(shí)候,來(lái)源期刊發(fā)文量和共引頻次排名居前列的期刊都應(yīng)該是重點(diǎn)關(guān)注的期刊。通過(guò)化學(xué)所期刊共引網(wǎng)絡(luò)圖譜中期刊共引頻次的分析,能夠更快速、直觀(guān)地了解化學(xué)所的核心期刊分布。
2.7 共詞分析(network of co-occuring phrases)
利用citespace軟件對(duì)2004-2008年化學(xué)所文獻(xiàn)共詞和突現(xiàn)詞進(jìn)行分析,選擇使用關(guān)鍵路徑算法,網(wǎng)絡(luò)節(jié)點(diǎn)確定為關(guān)鍵詞,時(shí)間區(qū)選擇為1年,閾值為(10,10,20),(10,10,20),(10,10,20)。圖譜中不同大小和不同顏色的圓環(huán)組成的年輪來(lái)表示關(guān)鍵詞的共現(xiàn)頻次和共現(xiàn)年份,用不同顏色的連線(xiàn)來(lái)表示關(guān)鍵詞間共現(xiàn)的年代。最外層紫色圈突出顯示表示共詞中心性(centrality),即在整體網(wǎng)絡(luò)中所起連接作用大小。軟件還會(huì)根據(jù)某段時(shí)間內(nèi)關(guān)鍵詞共現(xiàn)頻次,將變化率高的詞從大量的主題詞中探測(cè)出來(lái),稱(chēng)為突現(xiàn)詞,用紅色字顯示。如圖7、表7所示:
從圖7、表7中可以清晰地看出,化學(xué)所論文共現(xiàn)詞,頻次高于100的關(guān)鍵詞有21個(gè),其中被引頻次位于前5位的分別是:聚合物(polymers)、形態(tài)學(xué)(morphology)、納米粒子(nanoparticles)、膜(films)和衍生物(derivatives)。通過(guò)高頻出現(xiàn)的關(guān)鍵詞在共詞網(wǎng)絡(luò)圖譜中展示的共現(xiàn)頻次,在一定程度上揭示了化學(xué)所的熱點(diǎn)研究方向。
3 小 結(jié)
本文通過(guò)繪制化學(xué)所的合作者、學(xué)科領(lǐng)域、合作機(jī)構(gòu)、合作國(guó)家、期刊共引和文獻(xiàn)共詞的可視化圖譜,以圖譜方式揭示了化學(xué)所近5年發(fā)展過(guò)程中起關(guān)鍵作用的學(xué)科帶頭人、重點(diǎn)學(xué)科、核心期刊、研究熱點(diǎn)等信息情報(bào)。目的在于通過(guò)研究機(jī)構(gòu)文獻(xiàn)計(jì)量的可視化分析方法,探索深度挖掘研究機(jī)構(gòu)內(nèi)部的重點(diǎn)學(xué)科領(lǐng)域分布、合作團(tuán)隊(duì)及學(xué)科領(lǐng)軍人物、研究機(jī)構(gòu)外部的合作研究機(jī)構(gòu)及合作國(guó)家的分布以及研究機(jī)構(gòu)的熱點(diǎn)研究方向等情報(bào)的方法,在滿(mǎn)足科研用戶(hù)學(xué)術(shù)信息查找利用需求的同時(shí),為研究所制定戰(zhàn)略規(guī)劃、提升國(guó)際競(jìng)爭(zhēng)能力提供有價(jià)值的情報(bào),從而進(jìn)一步提升學(xué)科館員融入研究所科研一線(xiàn)的知識(shí)化服務(wù)能力。
參考文獻(xiàn):
[1] Chaomei C.Searching for intellectual turning points:Progressive knowledge domain visualization.Proceedings of the National Academy of Sciences of the United States of America,Washington:US National Academy of Sciences,2004,101(Supp1.1):5303-5301.
[2] 劉則淵. 科學(xué)知識(shí)圖譜:方法與應(yīng)用. 北京:人民出版社,2008.
[3] CiteSpace. [2009-12-20]. http://cluster.cis.drexel.edu/~cchen/citespace/.
[4] 齊艷霞,劉則源, 趙玉鵬,等.信息可視化視野下的工程倫理前沿. 倫理學(xué)研究,2008,37(5):49-54
[作者簡(jiǎn)介] 吳 鳴,女,1964年生,副研究館員,發(fā)表論文30余篇。