[摘 要]
以CNKI數(shù)據(jù)庫刊載的近十年(2000—2005年和2006—11年)我國文獻計量學(xué)研究論文為數(shù)據(jù)源進行共詞分析,利用Bicomb和SPSS軟件,并借助聚類分析和因子分析,研究高頻詞間的關(guān)系,探討了國內(nèi)近十年文獻計量學(xué)的研究主題:引文數(shù)量分析、引文網(wǎng)狀或鏈狀關(guān)系研究、科學(xué)知識圖譜與信息可視化及網(wǎng)絡(luò)計量學(xué)。
[關(guān)鍵詞]文獻計量學(xué);共詞分析;聚類分析
[中圖分類號]G250.252[文獻標志碼]A
[文章編號]1005-6041(2012)05-0041-04オ
1 前 言
文獻計量學(xué)是借助文獻的各種特征數(shù)量,采用數(shù)學(xué)與統(tǒng)計學(xué)方法來描述、評價和預(yù)測科學(xué)技術(shù)的現(xiàn)狀與發(fā)展趨勢的圖書情報學(xué)分支學(xué)科[1]。國外的文獻計量學(xué)研究始于1917年,至今經(jīng)歷了三個發(fā)展階段[2—3]。我國的文獻計量學(xué)研究較國外要晚半個多世紀,發(fā)展歷程分為三個階段,即起步階段(1979—1982年)、發(fā)展初期階段(1983—1987年)和全面發(fā)展階段(1988年至今)[4]。隨著信息技術(shù)和網(wǎng)絡(luò)的發(fā)展,文獻計量學(xué)的研究在內(nèi)容和手段上也產(chǎn)生了新的發(fā)展趨勢,使文獻計量學(xué)研究往更廣、更深的方向發(fā)展。
本文試圖通過對近十年國內(nèi)文獻計量學(xué)領(lǐng)域文獻高頻關(guān)鍵詞的共詞分析,深入揭示其研究結(jié)構(gòu),進而探討研究維度、學(xué)科背景和理論基礎(chǔ),以期進一步把握近十年我國文獻計量學(xué)的研究現(xiàn)狀、研究重點和發(fā)展趨勢。オ
2 數(shù)據(jù)處理
共詞分析法是一種內(nèi)容分析的方法,主要是通過對能夠表達某一學(xué)科領(lǐng)域研究主題或研究方向的專業(yè)術(shù)語共同出現(xiàn)在一篇文獻中的現(xiàn)象的分析,判斷學(xué)科領(lǐng)域中主題間的關(guān)系,從而展現(xiàn)該學(xué)科的研究內(nèi)容與結(jié)構(gòu)[5]。
作為共詞分析的基本單元,本研究所利用的關(guān)鍵詞樣本均來自于CNKI全文數(shù)據(jù)庫,收集過程如下:以“文獻計量學(xué)”為關(guān)鍵詞,通過關(guān)鍵詞路徑檢索,選擇模糊檢索,分別設(shè)定檢索時間范圍為2000—2005年和2006—2011年,檢索截止時間為2011年10月31日,共檢索到2000—2005年1 434篇文獻,其中去掉190篇無關(guān)鍵詞的文獻,剩下1 244篇文獻,關(guān)鍵詞共計1 448個;2006—2011年2 575篇文獻,其中去掉364篇無關(guān)鍵詞的文獻,剩下2 211篇文獻,關(guān)鍵詞共計2 838。
借助中國醫(yī)科大學(xué)醫(yī)學(xué)信息學(xué)系崔雷等人開發(fā)的書目共現(xiàn)分析系統(tǒng)Bicomb,進行詞頻統(tǒng)計處理,2000—2005年和2006—2011年分別選擇出詞頻不小于10次和20次的關(guān)鍵詞,從而都確定了共有42個高頻關(guān)鍵詞作為共詞分析的基礎(chǔ)。オ
3 共詞分析
聚類分析就是對共詞關(guān)系網(wǎng)絡(luò)中的詞與詞之間的距離進行數(shù)學(xué)運算分析,將距離較近的詞聚集起來,形成一個個相對獨立的類團,使得類團內(nèi)屬性相似性最大,類團間相似性最小[6]。本文首先用Bicomb軟件分別提取2000—2005年和2006—2011年兩個時間段頻次不小于10次和20次的詞篇矩陣,然后利用SPSS分別對兩個時間段的詞篇矩陣進行系統(tǒng)聚類法分析,選擇組間距離法和二值變量中的“Ochiai”系數(shù),采用樣本聚類。詞篇矩陣是指對關(guān)鍵字段中出現(xiàn)一定頻次的主題詞等字段在每篇文獻中的出現(xiàn)情況進行搜索,最終生成“詞篇矩陣”,是關(guān)鍵詞共詞矩陣形成的基礎(chǔ)[7]。
根據(jù)兩個時間段的因子分析碎石圖,顯示最佳的公共因子個數(shù)區(qū)間為[6,8],本研究將聚類個數(shù)的范圍值選定為6~8個,結(jié)果如表1和表2所示。通過分析和對比,結(jié)合關(guān)鍵詞的屬性,本研究認為2000—2005年和2006—2011年8個分類最適合。
表1 2000—2005年各樣品所屬類別表
關(guān)鍵詞8 類
7 類
6 類
文獻計量學(xué)111
引文分析222
統(tǒng)計分析331
核心期刊443
期刊111
文獻計量222
引文331
載文分析222
論文331
學(xué)報331
分析331
網(wǎng)絡(luò)計量學(xué)554
作者331
統(tǒng)計331
關(guān)鍵詞
8 類
7 類
6類
科技期刊443
參考文獻 222
情報學(xué)111
文獻665
作者分析222
網(wǎng)絡(luò)信息計量學(xué)554
中國776
普賴斯指數(shù)
2
2
2
圖書館學(xué)
1
1
1
影響因子
4
4
3
科學(xué)計量學(xué)
5
5
4
載文
3
3
1
醫(yī)學(xué)論文
1
1
1
科技論文
2
2
2
關(guān)鍵詞
8 類
7 類
6類
期刊評價
4
4
3
評價
3
3
1
文獻分析
7
7
6
半衰期
2
2
2
循證醫(yī)學(xué)
1
1
1
信息計量學(xué)
5
5
4
期刊研究
2
2
2
SCI
4
4
3
發(fā)展趨勢
1
1
1
載文量
3
3
1
數(shù)據(jù)庫
6
6
5
計量學(xué)
6
6
5
高校學(xué)報
2
2
2
布拉德福定律
8
5
4
表2 2006—2011年各樣品所屬類別表
關(guān)鍵詞8 類
7 類
6 類
文獻計量學(xué)
1
1
1
引文分析
1
1
1
統(tǒng)計分析
1
1
1
文獻計量
2
2
2
期刊
1
1
1
載文分析
1
1
1
核心期刊
1
1
1
期刊評價
1
1
1
作者
1
1
1
科技論文
3
3
3
引文
1
1
1
CSSCI
1
1
1
科技期刊
1
1
1
影響因子
1
1
1
關(guān)鍵詞8 類
7 類
6 類
作者分析
1
1
1
網(wǎng)絡(luò)計量學(xué)
4
4
4
載文
1
1
1
定量分析
5
2
2
文獻分析
6
5
5
論文
1
1
1
分析
1
1
1
h指數(shù)
5
2
2
中國
7
6
4
科學(xué)計量學(xué)
5
2
2
文獻計量學(xué)分析
6
5
5
被引分析
1
1
1
計量分析
7
6
4
文獻計量分析
3
3
3
關(guān)鍵詞8 類
7 類
6 類
文獻
7
6
4
SCI
3
3
3
共詞分析
2
2
2
情報學(xué)
2
2
2
研究熱點
2
2
2
學(xué)術(shù)影響力
1
1
1
信息計量學(xué)
5
2
2
Web of Science
5
2
2
針灸療法
8
7
6
學(xué)術(shù)期刊
1
1
1
載文量
1
1
1
研究論文
6
5
5
詞頻分析
2
2
2
圖書館
4
4
4
4 討 論
根據(jù)上述分析結(jié)果,結(jié)合相關(guān)論文內(nèi)容,我國文獻計量學(xué)大致可分為以下幾個方面:1)引文數(shù)量分析,主要指文獻分析和期刊評價;2)引文網(wǎng)狀或鏈狀關(guān)系研究;3)科學(xué)知識圖譜與信息可視化——科學(xué)計量學(xué)的研究熱點;4)網(wǎng)絡(luò)計量學(xué)研究。
4.1 引文數(shù)量分析
隨著文獻計量學(xué)的不斷發(fā)展,引文分析方法也隨著不斷豐富并逐漸完善,但最基本的也是最基礎(chǔ)的引文分析方法是從引文數(shù)量角度進行研究,主要用于評價期刊和論文[8]。
4.1.1 期刊評價。 2000—2005年期刊評價研究在原有的評價指標基礎(chǔ)上,嘗試加以一些指標、算法和統(tǒng)計學(xué)等處理結(jié)果[9—11]。2006—2011年,期刊評價研究側(cè)重于不同指標對比評價期刊,評價指標之間的相關(guān)性研究等[12—17]。
4.1.2 論文評價。2000—2005年,基于文獻計量學(xué)的論文評價研究主要利用引文計量法[18]、綜合模型法[19]、文獻計量法[20]、等比遞降法[21]、引文分析法[22]等方法對期刊論文、學(xué)位論文等進行學(xué)術(shù)評價。2006—2011年,論文評價研究主要利用直接和間接評價法、論文引證系數(shù)、主成分分析法、h指數(shù)法和層次分析法等定量研究方法和專題組討論法為代表的定性研究法評價論文的學(xué)術(shù)影響力、作者科研能力或者機構(gòu)科研水平[23—25]。
4.2 引文網(wǎng)狀或鏈狀關(guān)系研究
從引文間的網(wǎng)狀關(guān)系或鏈狀關(guān)系進行研究,主要用于揭示學(xué)科的發(fā)展和聯(lián)系,并展望未來前景等,主要指引文耦合、同被引、詞頻分析、共詞分析等。引文耦合反映引證文獻之間的關(guān)系,同被引反映被引證文獻之間的關(guān)系[8]。
4.2.12000—2005年引文網(wǎng)狀關(guān)系研究分析。綜合上述分析結(jié)果和檢索相關(guān)主題,2000—2005年對引文間網(wǎng)狀或鏈接關(guān)系研究相對較少,主要集中在同被引實證、詞頻分析及聚類分析。
4.2.22006—2011年引文網(wǎng)狀關(guān)系研究分析。隨著文獻計量學(xué)的不斷發(fā)展,2006—2011年引文網(wǎng)狀或鏈狀關(guān)系研究引起越來越多人的關(guān)注。該階段的引文網(wǎng)狀或鏈狀關(guān)系研究集中在引文耦合、同被引、詞頻分析及共詞分析。
4.3 科學(xué)知識圖譜與信息可視化——科學(xué)計量學(xué)的研究熱點
2000—2005年科學(xué)計量學(xué)的研究只停留于對數(shù)據(jù)庫的分析上,沒有向系統(tǒng)化和計算機化發(fā)展,沒有形成以自己的數(shù)學(xué)模式為基礎(chǔ)的計算機輔助的計量科學(xué);科學(xué)計量學(xué)的研究領(lǐng)域與范圍受限,其研究較多集中在科學(xué)領(lǐng)域,關(guān)于技術(shù)領(lǐng)域的計量學(xué)研究卻較單薄??茖W(xué)計量學(xué)的研究忽視了成果的推廣[26]。
2006—2011年,科學(xué)研究的指標體系、期刊評價、引文分析等內(nèi)容仍然是科學(xué)計量學(xué)界研究的重點,其前沿動態(tài)也依次經(jīng)過洛特卡定律、引文分析、合作研究等方向[27];其中科學(xué)知識圖譜與信息可視化是研究熱點。
4.4網(wǎng)絡(luò)計量學(xué)
2000—2005年該階段的網(wǎng)絡(luò)計量學(xué)研究現(xiàn)狀[28]:1)理論研究:主要研究網(wǎng)絡(luò)信息計量學(xué)作為一門學(xué)科存在而必須解決的基本問題;網(wǎng)絡(luò)信息計量的新概念和新規(guī)律;2)指標、算法和方法、工具研究;3)實證研究;4)應(yīng)用研究。該階段的研究重點和熱點是有關(guān)域名分析與鏈接分析、網(wǎng)絡(luò)影響因子(WIF)、網(wǎng)絡(luò)搜索引擎和網(wǎng)絡(luò)數(shù)據(jù)挖掘等問題。
2006—2011年該階段關(guān)于網(wǎng)絡(luò)計量研究方法主要涉及網(wǎng)絡(luò)信息的鏈接分析法、網(wǎng)絡(luò)信息內(nèi)容分析法、網(wǎng)絡(luò)影響因子分析法、圖論法、聚類分析法、網(wǎng)絡(luò)引文方法等方面,其中關(guān)于鏈接分析方法的文獻最多。應(yīng)用研究主要體現(xiàn)在四個方面[29]:1)網(wǎng)絡(luò)資源管理中的應(yīng)用;2)電子核心期刊評價中的應(yīng)用;3)數(shù)字圖書館資源建設(shè)中的應(yīng)用;4)在社會科學(xué)研究、科技發(fā)展和決策中的應(yīng)用。オ
5 結(jié) 語
綜上所述,根據(jù)多元統(tǒng)計分析方法,文獻計量學(xué)研究主題可分為四個領(lǐng)域:1)引文數(shù)量分析,主要是期刊和論文評價研究,其中h指數(shù)是研究熱點;2)引文網(wǎng)狀或鏈狀關(guān)系研究,其中引用認同、引證圖像、引文聚類、詞頻分析和共現(xiàn)分析是研究熱點和重點;3)科學(xué)知識圖譜與信息可視化——科學(xué)計量學(xué)的研究熱點;4)網(wǎng)絡(luò)計量學(xué),其研究熱點是網(wǎng)絡(luò)鏈接分析、網(wǎng)絡(luò)影響因子、評價、網(wǎng)絡(luò)搜索引擎等。
本文研究方法是定量和定性相結(jié)合的方法,采用聚類分析方法進行研究。本研究存在的局限性是:首先數(shù)據(jù)本身不夠完善,沒對關(guān)鍵詞進行規(guī)范處理,也沒標準主題詞表可參考;其次關(guān)于高頻關(guān)鍵詞的閾值仍是有待談?wù)摰膯栴},只根據(jù)筆者經(jīng)驗確定,未能全面反映整體的狀況;最后,只選取了2000—2011年的數(shù)據(jù),只揭示某個階段的學(xué)科結(jié)構(gòu),并不能反映整個學(xué)科發(fā)展狀態(tài)。下一步研究應(yīng)該對其數(shù)據(jù)進行預(yù)先處理,選取更廣泛的時間范圍,結(jié)合多種分析方法,如加入戰(zhàn)略坐標和可視化分析等,進行分析,從而揭示更加全面客觀的學(xué)科研究主題結(jié)構(gòu)和發(fā)展趨勢。
[參考文獻]
[1] 李 穎.中國文獻計量學(xué)實用研究的新進展[J] .現(xiàn)代情報,2005(4):168—170.
[2] 邱均平.文獻計量學(xué)[M].北京:科學(xué)技術(shù)文獻出版社,1988.
[3] 范全青,郭維真,鳳元杰.我國文獻計量學(xué)研30年之發(fā)展[J] .情報資料工作,2009(3):30—60.
[4] 邱均平,段宇鋒,陳敬全,等. 我國文獻計量學(xué)發(fā)展的回顧與展望[J] .科學(xué)學(xué)研究,2001, 23(2):143—148.
[5] 董 偉.國內(nèi)近十年數(shù)字圖書館領(lǐng)域研究熱點分析——基于共詞分析[J] .圖書情報知識,2009(5):60—65.
[6] 王莉亞,張志強,衛(wèi)軍朝. 基于共詞分析的近十年國外圖書情報學(xué)研究主題分析[J] .情報雜志,2011,30(3):50—58.
[7] 崔 雷.書目共現(xiàn)分析系統(tǒng)[EB/OL].[2011-11-08].http://www.doc88.com/p-01172739499.html.
[8] 邱均平.信息計量學(xué)[M].武漢:武漢大學(xué)出版社,2007.
[9] 邱均平,張 榮,趙蓉英. 期刊評價指標體系及定量方法研究[J] . 現(xiàn)代圖書情報技術(shù),2004(7):23—27.
[10] 趙大良,苗 凌,蔣汀華. 期刊質(zhì)量評價的二維排序方法[J] .編輯學(xué)報,2005,17(4):307—308.
[11] 姚 紅. 基于灰色關(guān)聯(lián)分析法的期刊綜合評價[J] .情報科學(xué),2003,21(7):730—734.
[12] 張 琳. CSSCI教育學(xué)期刊特征因子與影響因子比較分析[J] .情報雜志,2011,30(7):34—37.
[13] 趙 茜. 主成分分析法在科技期刊引用計量指標測評中的應(yīng)用[J] .科技與出版,2011(3):69—71.
[14] 郭 強,趙 瑾,劉新新,等. 下載次數(shù)與被引次數(shù)的同一與差異性研究[J] . 圖書館理論與實踐,2011(6):43—104.
[15] 鄭德俊. 期刊評價中的關(guān)鍵指標評析及相關(guān)性研究[J] .圖書情報工作,2011,55(4):143—147.
[16] 許海云,方 曙. 中文學(xué)術(shù)期刊評價中引文分析指標間關(guān)系的實證研究——基于2010年版中國期刊引證報告(擴刊版)[J] .圖書情報知識,2011(4):73—79.
[17] 黃賀方,孫建軍,李 江. 期刊影響力評價指標之間的相關(guān)性研究[J] .情報科學(xué),2011(9):1322—1326.
[18] 郭麗芳.評價論文學(xué)術(shù)質(zhì)量的文獻計量學(xué)指標探討[J] .現(xiàn)代情報,2005 (3): 11—12.
[19] 王孝寧,何 苗,何欽成.基于文獻計量學(xué)研究方法的科技論文定量評價[J] .科學(xué)學(xué)與科學(xué)技術(shù)管理, 2004 (4): 15—18.
[20] 郭繼軍,何欽成.科技論文評價中的文獻計量學(xué)分析[J] .中華醫(yī)學(xué)圖書館雜志, 2001(11): 60—61.
[21] 黃學(xué)忠.科研成果(或論文)量化評價體系的建立及初步應(yīng)用[J] .中華醫(yī)學(xué)科研管理雜志, 2004 (3): 145—146.
[22] 王 巖,劉雅娟.運用引文分析進行論文評價的方法初探[J] .科研管理, 2001(1): 133—138.
[23] 龍 莎,葛新權(quán).科技論文學(xué)術(shù)水平評估[ J].科技與管理,2007 (1): 133—135,138.
[24] 金 晶,何 苗,王孝寧,等.不同學(xué)科領(lǐng)域自然科學(xué)論文學(xué)術(shù)影響力評價與比較的可行性研究[ J].科技管理研究, 2009(14): 279—284.
[25] 章 娟,段志光,王 彤. 科學(xué)論文評價方法運用的比較分析——以世界一流生物醫(yī)學(xué)科學(xué)家為例[J] .科學(xué)學(xué)研究,20009,12(27):1809—1814.
[26] 羅式勝.從文獻計量學(xué)、科學(xué)計量學(xué)到科學(xué)技術(shù)計量學(xué)[ J].圖書館論壇, 2003(23): 151—153.
[27] 郭美榮,蘇 學(xué).科學(xué)計量學(xué)前沿演進可視化研究[J] .情報雜志,2010,29(12):1—4.
[28] 邱均平,張 洋.網(wǎng)絡(luò)信息計量學(xué)綜述[J] .高校圖書館工作,2005,25(105):1—12.
[29] 2005—2010年我國網(wǎng)絡(luò)計量學(xué)研究現(xiàn)狀淺析[EB/OL] .[2011-11-16]. http://wenku.baidu.com/view/6fe0658302d276a200292ed0.html.オ
[收稿日期] 2012-04-12
[作者簡介]李燕萍(1979—),女,碩士,館員,廣東藥學(xué)院圖書館。