胡 靜 舒 予
(四川大學(xué)圖書館 成都 610065)
我國高校圖書館情報服務(wù)由來已久,最初多是對情報資料的簡單收集、整理與利用,提供索引、檢索、查新等服務(wù)[1-3],近年來隨著高校雙一流戰(zhàn)略的推進(jìn)和學(xué)術(shù)環(huán)境的變化,賦予了高校情報服務(wù)新的內(nèi)涵,服務(wù)對象范圍不斷擴(kuò)展,不僅包括科研工作者,還包括職能管理部門的決策群體,甚至校外群體。服務(wù)內(nèi)容更加深入,形成了學(xué)科分析與評價、人才評估、對標(biāo)分析、科學(xué)態(tài)勢分析、領(lǐng)域熱點前沿挖掘、專利分析等深層次的情報分析服務(wù)[4-7]。
情報分析工具在此類深層次分析服務(wù)中必不可少,用以輔助情報服務(wù)工作者從多變的信息中快速定位高價值信息[8],發(fā)掘信息之間的內(nèi)在聯(lián)系,發(fā)現(xiàn)表面上難以發(fā)現(xiàn)的潛在規(guī)律[9]。付佳佳在高校圖書館情報分析服務(wù)框架體系中指出分析工具與分析方法是開展服務(wù)的基礎(chǔ),要根據(jù)服務(wù)內(nèi)容靈活組合工具和方法[10]。肖連杰等通過對國內(nèi)情報分析類文章進(jìn)行分析發(fā)現(xiàn)Citespace、Innography、RefViz、SA-TI和TDA等工具在情報分析中的使用率較高[11]。楊眉等歸納出領(lǐng)域態(tài)勢分析中常用的五類分析工具包括Web of Science、EI、Inspec等數(shù)據(jù)庫工具;JCR、ESI、Incites等評價工具;Gartner、網(wǎng)絡(luò)搜索引擎等網(wǎng)絡(luò)資源;DII、TI、Innography等專利數(shù)據(jù)庫;Bibexcel、TDA、CiteSpace、Pajek等數(shù)據(jù)分析工具[12]。實踐方面上海交通大學(xué)圖書館利用Elsevier、ESI和JCR等數(shù)據(jù)庫構(gòu)建指標(biāo)體系為學(xué)院遴選高水平期刊[5]、利用CiteSpace、Ucinet和TDA等對腦科學(xué)全球發(fā)展態(tài)勢進(jìn)行分析[12];清華大學(xué)圖書館利用ESI進(jìn)行學(xué)科分析和人才評估等服務(wù)[7]。與此同時部分學(xué)者提出情報分析工具的局限性,張家年等指出分析工具在關(guān)鍵技術(shù)方面存在不同程度的缺陷和不足,影響分析結(jié)果的準(zhǔn)確度,應(yīng)將工具分析與專家智慧相融合[13]。李紅等提出利用文獻(xiàn)計量分析法、知識圖譜工具得到的分析結(jié)果,還不能真正代表領(lǐng)域前沿,需要結(jié)合領(lǐng)域?qū)<业囊庖奫4],但目前較少有研究工具與專家該以何種方式融合。因此本文擬通過實例研究情報分析工具和專家判斷之間的差異及差異背后的深層原因,進(jìn)而提煉出兩者在情報分析中的適用特征,構(gòu)建一種工具和專家判斷對照的情報分析模式,以提升情報分析服務(wù)的精準(zhǔn)度和科學(xué)性,為廣大情報分析工作者提供參考。
本文研究思路如圖1所示,假設(shè)分析工具與專家判斷之間存在差異,以石墨烯研究為例進(jìn)行一系列研究驗證。首先在數(shù)據(jù)收集的基礎(chǔ)上,采用CiteSpace、Vosviewer、Pajek等分析工具對數(shù)據(jù)進(jìn)行分析,將分析結(jié)果交予領(lǐng)域?qū)<易雠袛?。其次將工具分析結(jié)果與專家判斷對照,如有差異,分析差異背后的原因。最后在差異原因分析基礎(chǔ)上提煉工具與專家各自在情報分析中的適用特征。
圖1 基于分析工具與專家判斷對照的情報分析模式研究思路框架
2.1數(shù)據(jù)收集本文數(shù)據(jù)來源于Web of Science核心集中的SCI-EXPANDED子集,檢索策略:篇名=“graphene”,限定檢索年份2004-2018年,文獻(xiàn)類型“article”,為了便于尋找學(xué)科專家,限定學(xué)科領(lǐng)域為所有“material”相關(guān)學(xué)科,選取其中被引次數(shù)大于10的記錄共計14 567條。
2.2.1 基礎(chǔ)領(lǐng)域分析 采用Citespace的文獻(xiàn)共被引聚類功能進(jìn)行分析。文獻(xiàn)共被引通過對現(xiàn)有文獻(xiàn)的參考文獻(xiàn)間關(guān)系研究,形成先驅(qū)研究的知識脈絡(luò),用以把握研究的整體發(fā)展歷程。聚類可將同時被一篇文章引用的論文集合在一起(認(rèn)為它們研究內(nèi)容相似),形成不同的研究領(lǐng)域。Citespace分析結(jié)果如圖2所示,其中聚類的模塊化ModularityQ=0.7779,共被引網(wǎng)絡(luò)中聚類主題的區(qū)分度較好。最終形成43個聚類,其中處于核心區(qū)域的有8個,根據(jù)工具給出的聚類的標(biāo)識詞(LLR算法)總結(jié)為:0#:大面積石墨烯(large area);1#:石墨烯帶(ribbon);2#:石墨烯氧化物(graphite oxide);4#:楊氏模量(younga modulus);7#:氧化還原反應(yīng)(oxygen reduction );8#:超級電容(supercapacitor);11#:貝里相位(berrys phase);12#:狄拉克費米子(dirac fermion)。
圖2 石墨烯研究共被引文獻(xiàn)聚類知識圖譜
專家判斷:分析結(jié)果基本可以反映目前石墨烯在材料學(xué)方面的研究領(lǐng)域,但命名不夠準(zhǔn)確,#7和#8、#11和#4在研究內(nèi)容上關(guān)聯(lián)度較高可劃分到一個領(lǐng)域中。另外光電子(optoelectronics)也是一個目前研究較多的領(lǐng)域,卻沒有在CiteSpace的核心聚類中反映出來,具體對照結(jié)果見表1。
表1 核心研究領(lǐng)域?qū)Ρ攘斜?/p>
2.2.2 重要文獻(xiàn)挖掘 利用CiteSpace的網(wǎng)絡(luò)轉(zhuǎn)折點(turning point)功能進(jìn)行分析,其借鑒了結(jié)構(gòu)洞和信息覓食理論,用于發(fā)現(xiàn)知識網(wǎng)絡(luò)中重要的橋梁文獻(xiàn),即不同學(xué)科和不同主題間的相互連接演化的關(guān)鍵,測度指標(biāo)為中介中心性(betweenness centrality)[14]。橋梁文獻(xiàn)是整個知識基礎(chǔ)網(wǎng)絡(luò)發(fā)展演化的要害節(jié)點,對橋梁文獻(xiàn)的發(fā)現(xiàn),有助于了解各基礎(chǔ)領(lǐng)域間的演化關(guān)系,更深入的認(rèn)識領(lǐng)域知識。本文從上述共被引聚類網(wǎng)絡(luò)的節(jié)點指標(biāo)發(fā)現(xiàn)了3篇中介中心性(Centrality)大于0.1的文獻(xiàn):
文獻(xiàn)1:A.K.Geim于2007年在NATMATER發(fā)表的TheRiseofGraphene,其位于#0聚類,連接著聚類#0和#1、#2、#4。是一篇綜述性的文獻(xiàn),闡述石墨烯極高的晶體和電子質(zhì)量,與不尋常的電子光譜,使其成為材料科學(xué)和凝聚態(tài)物理學(xué)視域中迅速崛起的新星。
文獻(xiàn)2:Y.Hernandez于2008年在NATNANOTECHNOL發(fā)表的High-yieldProductionofGraphenebyLiquid-phaseExfoliationofGraphite,位于#0聚類,連接著#2和#8聚類,研究通過大規(guī)模生長或剝離的方法生產(chǎn)石墨烯材料(石墨在有機(jī)溶劑如N-甲基-吡咯烷酮中的分散和剝離)。
文獻(xiàn)3:H.Lee于2005年發(fā)表的MagneticOrderingattheEdgesofGraphiticFragments:MagneticTailInteractionsbetweentheEdge-localizedStates,位于#4聚類,是連接#4聚類和#0聚類的重要文獻(xiàn),研究石墨碎片邊緣的磁性排序。
專家判斷:文獻(xiàn)1:該文是首屈一指的大師之作,其作者A. K.Geim和K. S .Novoselov因為發(fā)現(xiàn)石墨烯于2010年獲得諾貝爾物理學(xué)獎。該文在石墨烯研究的演進(jìn)過程中發(fā)揮著十分重要的作用,其中的重要論點被后期的很多論文引用,包括石墨烯晶體管(1#)、石墨烯氧化物(2#)和楊氏模量(4#)的研究成果,因此可作為連接0#聚類和1#、2#、4#的橋梁性文獻(xiàn)。
文獻(xiàn)2:該文是用液相剝離法制備石墨烯氧化物(Graphene Oxide Go)的代表性論文,對于石墨烯氧化物的制備(#2)具有重要影響,同時也開啟了氧化石墨烯在能源領(lǐng)域(#8)應(yīng)用的大門,因此是連接#0聚類和#2、#8聚類的關(guān)鍵性文獻(xiàn)。
文獻(xiàn)3:無法判斷是否有橋梁作用,且該文不算領(lǐng)域內(nèi)有影響力的論文。
另外專家還提出Li XS于2009年在SCIENCE上發(fā)表的Large-AreaSynthesisofHigh-QualityandUniformGrapheneFilmsonCopperFoils可以作為#0和#1聚類的橋梁文獻(xiàn),原因在于該文是真正能用的大面積石墨烯薄膜的開山之作,明確了大面積石墨烯生長的技術(shù)路線,尤其是應(yīng)用于石墨烯晶體管領(lǐng)域,在保證石墨烯大面積生長的同時,確保石墨烯具有較高的電子遷移率,為石墨稀晶體管的研制奠定基礎(chǔ)。
2.2.3 熱點研究分析 共詞分析是對關(guān)鍵詞詞頻及其相互關(guān)系的研究,可用于識別領(lǐng)域內(nèi)的研究特征和研究熱點。利用Vosviewer抽取文本關(guān)鍵詞,并限定關(guān)鍵詞詞頻閾值60,獲得312個主題詞,對其進(jìn)行共現(xiàn)聚類,結(jié)果如圖3所示,顏色深淺代表不同的熱點方向,原點大小代表關(guān)鍵詞詞頻,原點越大則關(guān)鍵詞出現(xiàn)頻率越高,研究越多。
圖3 石墨烯研究關(guān)鍵詞共現(xiàn)聚類知識圖譜
分析結(jié)果顯示材料學(xué)方面的石墨烯研究目前形成了以下五個研究熱點方向:
(1)石墨烯薄膜研究,規(guī)模最大,包含核心研究主題薄膜(films)、石墨(graphite)、拉曼光譜(raman-spectroscopy)、層(layer)、輸運(transport)等。
(2)石墨烯儲能材料研究,規(guī)模其次,包含核心研究主題氧化物(oxide)、性能(performance)、碳(carbon)、復(fù)合(composite)、超級電容器(supercapacitors)等。
(3)石墨烯在傳感器方面的研究,規(guī)模第三,包含核心研究主題氧化石墨(oxide graphite)、傳遞(delivery)、金納米粒子(gold nanoparticles)、熒光(fluorescence)、功能化(functionalization)等。
(4)石墨烯復(fù)合材料研究,規(guī)模第四,包含核心研究主題碳納米管(carbon nanotube)、片材(sheet)、納米復(fù)合材料(nanocomposite)、剝離石墨烯(exfoliate grapheme)、化學(xué)還原(chemical reduction)等。
(5)燃料電池催化劑研究,規(guī)模最小,包含核心研究主題氧還原反應(yīng)(oxygen reduction reaction)、燃料電池(fuel-cells)、氮摻雜石墨烯(nitrogen-doped grapheme)、催化劑(catalysts)、化學(xué)還原(chemical reduction)等。
專家判斷:上述研究方向?qū)儆谑┭芯康臒狳c。
2.2.4 前沿主題分析 前沿主題發(fā)掘采用Kleinberg 于2002年提出的突發(fā)詞檢測算法(Burst Detection),考察在一定時間內(nèi)詞的突然變化情況,根據(jù)詞的大量突然涌現(xiàn)判定一個新興研究主題的產(chǎn)生[15]。本文利用CiteSpace實現(xiàn)突變詞檢測,共抽取出60個突現(xiàn)詞,去掉不能代表研究內(nèi)容的關(guān)鍵詞,選取其中突現(xiàn)強(qiáng)度大于20的主題詞17個,詳情見表2。
表2 研究前沿
專家判斷:以上主題是目前的前沿研究,這些主題大部分屬于石墨烯薄膜研究,其中epitaxial graphene、nanoribbon、transport、large area和li ion battery等9個主題也是目前的研究熱點。
2.2.5 核心國家地區(qū) 采用Bibexcel抽取頻次大于40的國家構(gòu)建共現(xiàn)矩陣,用Pajek生成國家共現(xiàn)網(wǎng)絡(luò)如圖4,其中節(jié)點的大小與中介中心度有關(guān),節(jié)點越大中介中心度越大,代表節(jié)點在整體網(wǎng)絡(luò)中處于核心地位。從中介中心度值可以看出,中國和美國是處于整個網(wǎng)絡(luò)最核心的地位(中介中心度值:0.027),其余依次為德國(0.022)、英國(0.022)、韓國(0.018)、法國(0.018)、日本(0.017)。
圖4 石墨烯研究國家共現(xiàn)知識圖譜
專家判斷:中國在石墨烯研究方面確實取得了較多成果和突破性進(jìn)展,SCI論文量居世界領(lǐng)先,歐美等發(fā)達(dá)國家在核心研究和高精尖的前沿研究方面表現(xiàn)也很不錯。
3.1缺少光電子領(lǐng)域,領(lǐng)域間的合并作者回到14 567條數(shù)據(jù)源中,限制主題“optoelectronics or optics or plasma”,獲得1 395條文獻(xiàn),把1 395條結(jié)果再做共被引分析,將導(dǎo)出的共被引數(shù)據(jù)②與先前的共被引文獻(xiàn)數(shù)據(jù)①做比照,發(fā)現(xiàn)②中的文獻(xiàn)分別分布在石墨烯晶體管(#1)、石墨烯氧化物(#2)、物理性質(zhì)(#11、#4)和#5(Neutron)等領(lǐng)域中,#5中分布的文獻(xiàn)較集中,但由于#5的規(guī)模較小,因此沒有被顯示在核心聚類中。專家提出的石墨烯光電子領(lǐng)域主要涉及石墨烯在光電子領(lǐng)域的應(yīng)用,與“氧化石墨烯”“石墨烯晶體管”等領(lǐng)域有交叉(文獻(xiàn)存在共被引關(guān)系);分析工具是根據(jù)文獻(xiàn)的共被引情況,區(qū)分文獻(xiàn)之間的親疏關(guān)系,把關(guān)系較近的文獻(xiàn)劃分成同一類別,與文獻(xiàn)的共被引次數(shù)有關(guān),因而可能會導(dǎo)致光電子領(lǐng)域(#5)分布的文獻(xiàn)量較少,無法處于核心領(lǐng)域群。
關(guān)于#7和#8、#11和#4的合并,筆者抽取#7和#8做驗證,通過對四個領(lǐng)域內(nèi)文獻(xiàn)閱讀和咨詢學(xué)者,發(fā)現(xiàn)#7中的文獻(xiàn)主要關(guān)于氧化還原石墨烯的制備及儲能性能研究,與#8中的石墨烯超級電容特性確有關(guān)聯(lián),可以進(jìn)行合并。分析工具的領(lǐng)域劃分利用數(shù)學(xué)算法精準(zhǔn)而清晰的區(qū)分文獻(xiàn)間的親疏關(guān)系,但卻無法判斷內(nèi)容的關(guān)聯(lián)性。
3.2研究領(lǐng)域命名領(lǐng)域的命名上存在較大差異,主要原因在于CiteSpace LLR標(biāo)識詞是通過LLR聚類算法計算出log-likelihood ratio較大的詞匯[16],即工具是通過相關(guān)標(biāo)識算法,列出“最突出”的那個詞語來體現(xiàn)聚類的特征,與關(guān)鍵詞的出現(xiàn)頻次有關(guān)。而專家是基于對全文的理解或?qū)垲愄卣鞯睦斫庾龀龅木垲惛爬ā?/p>
3.3重要文獻(xiàn)挖掘分析工具挖掘的結(jié)果多數(shù)與學(xué)者意見相同,有兩篇存在爭議?;氐焦脖灰W(wǎng)絡(luò),發(fā)現(xiàn)工具分析出的橋梁性論文3屬于領(lǐng)域4#,與0#中TheRiseofGraphene(A.K.Geim,2007)有共被引關(guān)系,從研究內(nèi)容上看,橋梁論文研究的是石墨碎片邊緣磁矩的形成機(jī)制,是石墨烯物理性質(zhì)方面研究,而TheRiseofGraphene闡述了石墨烯異常的電子光譜,引起了一種新的“相對論”凝聚態(tài)物理范式,兩者在內(nèi)容上有關(guān)聯(lián)。說明這篇論文與4#和1#中的部分研究內(nèi)容相關(guān)。專家提到的Large-AreaSynthesisofHigh-QualityandUniformGrapheneFilmsonCopperFoils(Li XS,2009)是ESI高被引論文(被引6 000余次),說明是被廣泛認(rèn)可有較高影響力的文章,但工具計算出的中介中心性值為0.01,不構(gòu)成轉(zhuǎn)折點文獻(xiàn)。分析工具的計算方式強(qiáng)調(diào)了“跨界性”,即同時被多個領(lǐng)域的文獻(xiàn)引用,而專家是根據(jù)文章影響力和研究內(nèi)容上的關(guān)聯(lián)性進(jìn)行判斷。產(chǎn)生上述差異的可能原因是:專家受自身知識范疇限制和主觀偏見影響,忽視某些超出知識范圍或在學(xué)術(shù)圈影響力較低的文獻(xiàn);引用的不充分性和動機(jī)的復(fù)雜性[18],導(dǎo)致某些有影響力的文章沒有被恰當(dāng)引用,使工具的計算結(jié)果與專家判斷有差距。
3.4部分研究前沿主題屬于研究熱點,前沿主題大部分屬于石墨烯薄膜研究前沿與熱點之間本就存在交集,部分前沿也有可能具有較高的詞頻,屬于熱點前沿[17]。為了進(jìn)一步確認(rèn)專家提出的9個前沿主題屬于研究熱點,筆者統(tǒng)計了17個突現(xiàn)詞的詞頻,發(fā)現(xiàn)專家提出的9個熱點前沿都具有較高詞頻(>90),但部分未被提出的主題詞也具有較高詞頻,例如電化學(xué)性質(zhì)(electrochemical property)詞頻188、電子結(jié)構(gòu)(electronic structure)詞頻114。采用專家提出的“l(fā)i ion battery”和未被提出的“electronic structure”做研究文獻(xiàn)數(shù)量比較,前者在WoS中有研究文獻(xiàn)203篇,后者有1 427篇,說明后者的研究熱度比前者高。出現(xiàn)這種情況的可能原因有兩種:一是專家受自身知識范圍的限制,對于熱點的把握多集中在自己的研究范圍內(nèi),忽略了其他相關(guān)領(lǐng)域的研究;二是細(xì)粒度的內(nèi)容容易被專家忽視,例如以關(guān)鍵詞為代表的研究主題。
針對前沿探測出的主題大部分屬于石墨烯薄膜研究,筆者根據(jù)關(guān)鍵詞聚類和數(shù)據(jù)庫文獻(xiàn)閱讀發(fā)現(xiàn)這些主題確實大部分屬于石墨烯薄膜研究,少部分屬于石墨烯儲能材料研究和石墨烯復(fù)合材料研究等。
3.5國家合作網(wǎng)絡(luò)Pajek社會網(wǎng)絡(luò)分析中的中介中心度用來衡量點在網(wǎng)絡(luò)中的重要程度,以經(jīng)過這個點的最短路徑數(shù)來刻畫[19]。專家的判斷角度多是基于學(xué)術(shù)影響力、學(xué)術(shù)地位和高質(zhì)量學(xué)術(shù)成果等內(nèi)容。為了進(jìn)一步了解各國的學(xué)術(shù)地位,筆者分別統(tǒng)計了7個國家的各項學(xué)術(shù)表現(xiàn)指標(biāo),如表3所示,美國的各項指標(biāo)基本都處于第一的位置,英德法的被引百分比表現(xiàn)比中國好,但總體來看中國各項指標(biāo)都有不錯的表現(xiàn),學(xué)術(shù)地位應(yīng)該屬于世界前列。
表3 各國家學(xué)術(shù)表現(xiàn)比較
除上述差異及原因外,還有部分難以避免的因素可能會造成分析工具與領(lǐng)域?qū)<遗袛嗟牟町?,值得關(guān)注。首先,學(xué)科領(lǐng)域的知識傳播過程是知識流動和知識擴(kuò)散的過程,每一個學(xué)科領(lǐng)域并不是獨立存在的,他或多或少與其它任何一個學(xué)科領(lǐng)域有關(guān)聯(lián)[20],特別隨著科學(xué)技術(shù)的快速發(fā)展,學(xué)科領(lǐng)域之間知識的流動與擴(kuò)散越來越頻繁、邊界劃分越來越模糊[21]。且隨著時間的推移學(xué)科領(lǐng)域之間的知識關(guān)聯(lián)網(wǎng)絡(luò)也會發(fā)生動態(tài)變化,是一個不斷演進(jìn)的動態(tài)網(wǎng)絡(luò)。因此分析工具這種靜態(tài)的邊界清晰的分析并不能夠完全反映學(xué)科領(lǐng)域的真實情況,而專家受自身知識范圍的限制也不一定能夠準(zhǔn)確判斷。其次,在采集數(shù)據(jù)的過程中對字段、主題詞、年份、文獻(xiàn)來源和學(xué)科等內(nèi)容的限制,在一定程度上會影響數(shù)據(jù)源的完整性,從而導(dǎo)致工具分析結(jié)果與專家判斷的差異,例如本文在數(shù)據(jù)采集中為了便于匹配學(xué)科專家,限制WoS中所有的“material”學(xué)科,有可能導(dǎo)致“光電子”領(lǐng)域文獻(xiàn)的部分缺失。石墨烯本身是一種材料,但其優(yōu)異的物理、化學(xué)性能又受到物理、化學(xué)、電子等領(lǐng)域的關(guān)注,存在較多的學(xué)科交叉,在數(shù)據(jù)庫中搜索(graphene) and (optoelectronics or optics or plasma),不限學(xué)科,發(fā)現(xiàn)有物理應(yīng)用、工程電子、物理化學(xué)等領(lǐng)域的文獻(xiàn)至少占總文獻(xiàn)量的1/2,因此限定“material” 也可能導(dǎo)致在基礎(chǔ)領(lǐng)域劃分時,“光電子”領(lǐng)域由于規(guī)模較小,而無法處于核心領(lǐng)域群。第三,分析工具強(qiáng)大的分析功能背后是大量的數(shù)學(xué)算法,而每種數(shù)學(xué)算法本身都存在一定的局限性,例如CiteSpace中突變檢測采用的Kleinberg 算法,其最優(yōu)序列的確定受參數(shù)k,s,γ的影響, 而參數(shù)確定具有一定的主觀性,且Kleinberg 算法需要一定的時間積累,對較新的關(guān)鍵詞/文獻(xiàn)準(zhǔn)確度不高[22];層次聚類、Louvain 算法和譜聚類算法等是分析工具中常用的聚類算法,其中層次聚類和譜聚類在處理大規(guī)模數(shù)據(jù)中存在一定缺陷,Louvain 算法在數(shù)據(jù)輸入順序上敏感度較高[23]。另外在使用分析工具的過程中對各種參數(shù)的設(shè)置也會影響分析結(jié)果的最終呈現(xiàn)。
通過上述分析發(fā)現(xiàn)除某些不可避免的因素外,工具的優(yōu)勢首先在于對大量數(shù)據(jù)的快速運算,且抽取的關(guān)鍵信息與專家判斷的契合度較高。其次工具具有較強(qiáng)的客觀性,其分析結(jié)果是對信息數(shù)據(jù)的科學(xué)計算得來,也因如此其分析結(jié)果邊界清晰,少有模棱兩可、模糊不清的情況。同時工具善于識別和挖掘細(xì)粒度知識。但工具對于跨學(xué)科領(lǐng)域判斷的精準(zhǔn)度不夠,容易受算法影響忽略掉一些較小且交叉度較高的領(lǐng)域,工具對分析結(jié)果的語義理解欠缺,不善于進(jìn)行概況總結(jié)性評述。
專家的判斷基礎(chǔ)來源于自身長期的知識積累和對領(lǐng)域發(fā)展的內(nèi)化理解。專家進(jìn)行科研工作的過程中會吸納融合各相關(guān)學(xué)科的跨學(xué)科知識,對跨學(xué)科的把握較好。情報分析過程是綜合多因素的復(fù)雜判斷,存在許多無法用量化表征的因素,例如對研究內(nèi)容的理解、文獻(xiàn)信息背后的關(guān)聯(lián)知識,而專家更易于做此類判斷。專家的系統(tǒng)思維和邏輯推理能夠?qū)Ψ治鼋Y(jié)果進(jìn)行宏觀把控。但專家判斷又受限于自身知識范疇,對范疇外的知識把握不夠準(zhǔn)確,且容易受情感左右,對自己感興趣的領(lǐng)域有偏好。
情報分析的快速、高效、準(zhǔn)確離不開分析工具和專家判斷良好配合,工具與專家的關(guān)系是各取所長,優(yōu)勢互補(bǔ)的智能組合,在二者進(jìn)行融合的過程中需注意以下幾點:
a.分析工具是基礎(chǔ)。情報分析過程中需將工具分析作為基礎(chǔ),充分利用工具的快速、高效、客觀、細(xì)粒度等特性,全面挖掘研究對象的發(fā)展?fàn)顩r、研究內(nèi)容、內(nèi)在規(guī)律、學(xué)科影響力等內(nèi)容,為專家判斷做基礎(chǔ)。專家在科學(xué)分析的基礎(chǔ)上結(jié)合自身知識與經(jīng)驗,運用系統(tǒng)思維和邏輯推理做綜合判斷和宏觀把控,進(jìn)而形成更具深度和洞察力的分析結(jié)果。
b.多工具、多指標(biāo)、多角度為專家提供判斷依據(jù)。情報分析過程中可根據(jù)分析目標(biāo)選擇不同的分析工具,充分發(fā)揮各種工具的特色和優(yōu)勢,例如ESI善于學(xué)術(shù)成果評價,Citespace的特色在于知識基礎(chǔ)分析和突現(xiàn)詞檢測,Pajek的社會網(wǎng)絡(luò)分析功能強(qiáng)大。同時在對一個目標(biāo)進(jìn)行分析時可采用不同指標(biāo)、多角度評判,例如上述對國家核心地位的評判,每種指標(biāo)反映出的結(jié)果都有所不同。工具分析要從不同的角度將結(jié)果展示給專家,給專家充分的判斷依據(jù)。
c.情報分析工作者的輔助作用很重要。分析工作者不僅要進(jìn)行數(shù)據(jù)收集和工具使用,還要綜合評判各工具選取合適的分析工具,同時與專家溝通,成為工具與專家聯(lián)通的紐帶。對于工具做出的分析結(jié)果分析工作者需進(jìn)行初步篩選,去掉一些無用信息,減輕專家判斷的工作量。因此情報分析工作者需要具備較好的學(xué)科背景知識,熟練掌握各類型分析工具,具有較好的業(yè)務(wù)能力和溝通能力,熟悉情報學(xué)相關(guān)知識。
本文以石墨烯研究為例,分析情報分析工具與專家判斷之間的差異及差異背后的深層原因,發(fā)掘出分析工具與專家判斷在情報分析中的適用特征,構(gòu)建融合情報分析工具與專家判斷的情報分析模式。該模式較好的將工具特色和專家優(yōu)勢融合在一起,不僅能實現(xiàn)情報分析的速度與效率,還能實現(xiàn)情報分析的準(zhǔn)確度和科學(xué)性。