周子番 邱均平 魏開洋
(1. 杭州電子科技大學(xué)中國科教評價(jià)研究院 杭州 310018;2. 杭州電子科技大學(xué)管理學(xué)院 杭州 310018)
所謂研究方法就是人們?yōu)榱诉_(dá)到某種目的而采用的方法、手段的總和。最初,文獻(xiàn)計(jì)量學(xué)方法脫胎于圖書情報(bào)學(xué)的交叉領(lǐng)域,因此在早期研究中也時(shí)常認(rèn)為文獻(xiàn)計(jì)量學(xué)就是圖書情報(bào)學(xué)方法體系的一種專門方法。王崇德認(rèn)為日益發(fā)展的文獻(xiàn)計(jì)量學(xué)方法極有可能成為情報(bào)學(xué)的特殊方法,它們既可以解決情報(bào)學(xué)中的一些問題,也會(huì)被其他學(xué)科作為研究方法廣泛移植[1]。葉繼元把圖書館學(xué)研究方法分為一般方法和專門方法,其中專門方法就包括文獻(xiàn)計(jì)量方法、引文分析法等[2]。近幾年有關(guān)圖書情報(bào)學(xué)研究方法使用情況調(diào)查研究的論文中,文獻(xiàn)計(jì)量學(xué)方法也常常作為圖書情報(bào)領(lǐng)域的方法來進(jìn)行編碼。但是方法的發(fā)展存在著泛化、分化和消亡的過程,引文分析由于對其研究的不斷深入,最終也獨(dú)立成為圖書情報(bào)學(xué)的一類專門方法[3],因此文獻(xiàn)計(jì)量學(xué)方法已經(jīng)成為一個(gè)方法集合[4]。
另一方面,因?yàn)槲墨I(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)與信息計(jì)量學(xué)在概念內(nèi)涵、研究對象和應(yīng)用方面既交叉重合又有區(qū)別經(jīng)常被合稱為“三計(jì)學(xué)”,而后學(xué)者發(fā)現(xiàn)文獻(xiàn)計(jì)量學(xué)(Bibliometrics)、科學(xué)計(jì)量學(xué)(Scientometrics)、信息計(jì)量學(xué)(Informetrics)、網(wǎng)絡(luò)計(jì)量學(xué)(Webmetrics)和知識(shí)計(jì)量學(xué)(Knowledgometrics)也在研究對象、研究內(nèi)容、研究方法、數(shù)據(jù)來源、計(jì)量指標(biāo)等方面也呈現(xiàn)出交叉關(guān)聯(lián)、互為引用的發(fā)展特征和趨勢[5]。邱均平教授便率先提出了“五計(jì)學(xué)”的概念,目前已經(jīng)得到了中國學(xué)界的廣泛認(rèn)可,2018年還獲批了國家級社會(huì)科學(xué)基金項(xiàng)目“中國‘五計(jì)學(xué)’融合和圖書情報(bào)學(xué)的方法創(chuàng)新研究”。但目前直接研究“五計(jì)學(xué)”的文獻(xiàn)還較少,主要分為兩類:“五計(jì)學(xué)”的研究進(jìn)展與“五計(jì)學(xué)”的演進(jìn)過程?!拔逵?jì)學(xué)”進(jìn)展研究從“五計(jì)學(xué)”個(gè)體的研究現(xiàn)狀、學(xué)科分布、文獻(xiàn)特征到作者合作情況全面分析了“五計(jì)學(xué)”的現(xiàn)狀[6-8]。從“五計(jì)學(xué)”的演進(jìn)來看,關(guān)于“五計(jì)學(xué)”的研究主要集中于理論和應(yīng)用兩方面[9]。隨后,趙蓉英進(jìn)一步從科研成果、科研基金、課程教育、人才與機(jī)構(gòu)、科學(xué)評價(jià)、軟件與工具等6個(gè)宏觀角度發(fā)現(xiàn)“五計(jì)學(xué)”在理論基礎(chǔ)、研究對象等方面相互區(qū)別又緊密聯(lián)系,“五計(jì)學(xué)”的影響逐漸擴(kuò)大,研究廣度擴(kuò)展、粒度變細(xì),支持工具也在增加[10]。
但上述“五計(jì)學(xué)”研究均集中于理論與應(yīng)用的討論,文獻(xiàn)計(jì)量學(xué)作為圖書情報(bào)學(xué)的一類專門方法,“五計(jì)學(xué)”方法研究也應(yīng)是其重要的研究主題。雖然當(dāng)前研究對圖書情報(bào)學(xué)領(lǐng)域的研究方法梳理已經(jīng)非常多,但是對“五計(jì)學(xué)”方法的分析仍然存在一定困難,一是國內(nèi)并沒有專門的計(jì)量學(xué)期刊,文獻(xiàn)計(jì)量學(xué)方法一直作為圖書情報(bào)學(xué)的專門方法存在于圖書情報(bào)領(lǐng)域的研究中,在概念與來源上看,文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)、信息計(jì)量學(xué)、知識(shí)計(jì)量學(xué)和網(wǎng)絡(luò)計(jì)量學(xué)在不同時(shí)期由不同學(xué)者提出,在概念上略有區(qū)別且研究對象不一致,然而縱觀國內(nèi)的研究,學(xué)者們對上述五個(gè)概念的使用存在著交叉混用現(xiàn)象,尤其是文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)和信息計(jì)量學(xué)這三個(gè)概念,最終文獻(xiàn)中使用哪個(gè)概念通常取決于學(xué)者的喜好,而且另一部分使用計(jì)量學(xué)方法的學(xué)者學(xué)科背景并非圖書情報(bào),對上述幾個(gè)概念的了解和區(qū)分更不明確,因此要識(shí)別出使用了“五計(jì)學(xué)”方法的文獻(xiàn)就存在一定困難;二是“五計(jì)學(xué)”存在微觀與宏觀兩種性質(zhì)的解釋,以文獻(xiàn)計(jì)量學(xué)為例,宏觀上來看文獻(xiàn)計(jì)量學(xué)本身就是一種方法,在文獻(xiàn)中的使用方式是通常為采用文獻(xiàn)計(jì)量學(xué)的方法分析某一領(lǐng)域的發(fā)展情況,但從微觀上看,文獻(xiàn)計(jì)量學(xué)是將數(shù)學(xué)和統(tǒng)計(jì)學(xué)的方法應(yīng)用于文獻(xiàn)分析中,因此文獻(xiàn)計(jì)量學(xué)自身也是由其他方法組成并且不斷豐富發(fā)展的,這也就意味著對“五計(jì)學(xué)”方法的梳理存在著兩面性,不僅要在宏觀上關(guān)注文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)、信息計(jì)量學(xué)、知識(shí)計(jì)量學(xué)、網(wǎng)絡(luò)計(jì)量學(xué)在研究中的應(yīng)用情況,還要在微觀上關(guān)注文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)、信息計(jì)量學(xué)、知識(shí)計(jì)量學(xué)、網(wǎng)絡(luò)計(jì)量學(xué)支撐方法的發(fā)展變化。
因此,本文提出了以下研究問題:宏觀上,使用了“五計(jì)學(xué)”廣義概念的研究如何演變發(fā)展?微觀上,“五計(jì)學(xué)”方法自身豐富與發(fā)展?fàn)顩r如何?如何構(gòu)建融合發(fā)展后的“五計(jì)學(xué)”方法體系?
1.1數(shù)據(jù)說明“五計(jì)學(xué)”方法還是較多應(yīng)用于圖書情報(bào)領(lǐng)域,因此本文以CNKI中“圖書情報(bào)”類的論文作為篩選基礎(chǔ)。又因?yàn)橹黝}檢索是在文章標(biāo)題、關(guān)鍵詞和摘要中檢索,只要在這三個(gè)位置提到主題詞的文獻(xiàn)就能夠被檢索到,盡可能滿足了查全率與查準(zhǔn)率。第一組數(shù)據(jù)就使用了主題檢索來篩選使用了“五計(jì)學(xué)”廣義概念的研究,檢索式為SU=“文獻(xiàn)計(jì)量+信息計(jì)量+科學(xué)計(jì)量+知識(shí)計(jì)量+網(wǎng)絡(luò)計(jì)量+Altmetrics+替代計(jì)量+選擇性計(jì)量”,在篩除無關(guān)文獻(xiàn)后最終得到了7 067篇文獻(xiàn);第二組數(shù)據(jù)為了得到?jīng)]有使用廣義概念但是也做了計(jì)量研究的文獻(xiàn),選擇以計(jì)量為主題詞做主題檢索,檢索式為SU=“計(jì)量” AND LY=(“大學(xué)圖書館學(xué)報(bào)”+“國家圖書館學(xué)刊”+“情報(bào)科學(xué)”+“情報(bào)雜志”+“情報(bào)資料工作”+“數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)”+“圖書館建設(shè)”+“圖書館論壇”+“圖書館學(xué)研究”+“圖書館雜志”+“圖書情報(bào)工作”+“圖書情報(bào)知識(shí)”+“圖書與情報(bào)”+“現(xiàn)代情報(bào)”+“信息資源管理學(xué)報(bào)”+“中國圖書館學(xué)報(bào)”+“情報(bào)理論與實(shí)踐”+“情報(bào)學(xué)報(bào)”),通過人工判讀的方式篩選掉無關(guān)文獻(xiàn)后得到了1 657條數(shù)據(jù),檢索時(shí)間為2021年3月5日。
如圖1所示,兩組數(shù)據(jù)的發(fā)文趨勢呈現(xiàn)較為明顯的階段性特征,雖然兩組數(shù)據(jù)并不完全一致,但是其發(fā)展階段的切分仍然存在一定共性。從圖中的分布特征來看,可以初步將研究階段分為三部分:①萌芽發(fā)展階段,論文長期增長平緩,出現(xiàn)了以文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)為核心的研究,研究對象以文獻(xiàn)信息為主,研究方法主要是文獻(xiàn)統(tǒng)計(jì)方法;20世紀(jì)90年代初,隨著互聯(lián)網(wǎng)的萌芽,對情報(bào)的認(rèn)識(shí)加深,信息計(jì)量學(xué)也隨之產(chǎn)生。②快速發(fā)展階段,較前一時(shí)期論文增長率大幅度提升,互聯(lián)網(wǎng)的快速擴(kuò)張也促使網(wǎng)絡(luò)計(jì)量學(xué)逐漸成為一支研究較多的分支,研究方法更推薦計(jì)算機(jī)輔助方法;在文獻(xiàn)和信息的基礎(chǔ)上,還出現(xiàn)了知識(shí)計(jì)量學(xué)。③發(fā)展瓶頸階段,帶有廣義“五計(jì)學(xué)”概念的文獻(xiàn)增長趨緩,出現(xiàn)下滑趨勢,直接攜帶“計(jì)量”一詞的文獻(xiàn)數(shù)量更在逐年減少,但本階段社交媒體的普及從網(wǎng)絡(luò)計(jì)量學(xué)中催生出了Altmetrics,更多學(xué)科的研究方法被吸收進(jìn)來。
圖1 兩組數(shù)據(jù)時(shí)間序列分析
1.2研究方法a.首先,在主題演化分析的研究中,Blei把文獻(xiàn)切分成幾個(gè)時(shí)間片,并分別構(gòu)建主題模型,再建立不同時(shí)間片之間的關(guān)聯(lián)[11],考慮到本文時(shí)間跨度較長,也將第二組數(shù)據(jù)平均分為8個(gè)時(shí)間切片,通過SATI對文獻(xiàn)的標(biāo)題、摘要和關(guān)鍵詞進(jìn)行分詞處理,刪除無意義通用詞,合并近義詞得到8個(gè)時(shí)間切片的詞匯;再利用Itginsight對上述詞匯進(jìn)行聚類分析得到每個(gè)時(shí)間切片的研究主題,主題名稱主要由聚類中出現(xiàn)頻次較高的詞語確定;其次,采用計(jì)算余弦相似度的方式計(jì)算不同時(shí)間切片中的研究主題的相似度,以此來構(gòu)建“五計(jì)學(xué)”方法的演進(jìn)過程。余弦相似度以向量空間中兩個(gè)向量夾角的余弦值為衡量標(biāo)準(zhǔn),以此來比較兩個(gè)被向量化的個(gè)體之間的相似度。在二維向量空間中,兩個(gè)二維向量:向量a(x1,y1)和向量b(x2,y2)在余弦定理中可表示為:
(1)
同理,在n維向量空間中,以上公式仍然成立:
(2)
且余弦值越接近于1,兩個(gè)向量越相似。本文就將時(shí)間切片中描述研究主題的特征詞匯向量化,構(gòu)建詞典并建立向量空間,通過兩兩計(jì)算比較余弦值來判斷主題是否關(guān)聯(lián)。
b.利用詞頻分布特征發(fā)掘研究熱點(diǎn)的研究已經(jīng)非常成熟[12]。首先,因文獻(xiàn)的研究方法沒有直接體現(xiàn)出來,本文參考了前人的研究方法編碼形成了本文所使用的編碼表,隨后對第二組數(shù)據(jù)逐一做了研究方法編碼,盡可能將每篇文獻(xiàn)中涉及的研究方法都列出來,能夠用明確的研究方法使用二級指標(biāo),不能確定具體研究方法的文獻(xiàn)使用一級指標(biāo);其次,研究方法的使用往往無法脫離其研究對象,本文還將第二組數(shù)據(jù)中的關(guān)鍵詞做了處理,去除掉方法類關(guān)鍵詞,只保留依據(jù)詞頻、詞量和累積詞頻算法計(jì)算得到的用以描述研究對象的中高頻關(guān)鍵詞;最后,通過對發(fā)文趨勢的觀察,本文將第二組數(shù)據(jù)分為三部分,再利用Access建庫得到研究方法和研究對象的二值矩陣并通過Ucinet可視化。研究方法編碼表如表1所示:
表1 研究方法編碼表示例
主題演進(jìn)可以反映研究主題隨時(shí)間的變化,包括主題內(nèi)容或強(qiáng)度隨時(shí)間推移的產(chǎn)生、增強(qiáng)、減弱、聚合、裂變、消亡過程,本文首先通過余弦相似度公式計(jì)算了8個(gè)時(shí)間切片的主題的相似度系數(shù),再根據(jù)相似度系數(shù)大于0.3即為具有演化關(guān)系的原則[13]。
“五計(jì)學(xué)”的研究主題主要是由文獻(xiàn)計(jì)量和科學(xué)計(jì)量兩個(gè)主題逐漸發(fā)展、裂變出信息計(jì)量、網(wǎng)絡(luò)計(jì)量、知識(shí)計(jì)量等研究主題;在萌芽發(fā)展階段,文獻(xiàn)計(jì)量與科學(xué)計(jì)量始終是研究中極為重要的兩類主題,直到1990-1994年出現(xiàn)了信息計(jì)量主題;而在快速發(fā)展階段,2000-2004年網(wǎng)絡(luò)計(jì)量研究主題最為突出,2005-2009年又誕生了知識(shí)計(jì)量主題;在爆發(fā)增長階段,聚類主題越來越多,主題間的演化關(guān)系也趨于復(fù)雜,引文分析、鏈接分析甚至可視化分析的主題出現(xiàn)意味著這些研究方法已經(jīng)趨于成熟,2015-2020年又在前五種計(jì)量學(xué)的基礎(chǔ)上發(fā)展出了Altmetrics主題。然而,雖然將頻次較高的詞語作為聚類主題具有一定代表性,但是并不能進(jìn)一步發(fā)現(xiàn)每個(gè)階段具體研究方法的發(fā)展情況。因此,為了探索不同階段的研究主題演化情況,本文分階段分析了每個(gè)時(shí)間切片主題聚類內(nèi)部高頻詞的演進(jìn)關(guān)系。
2.1萌芽發(fā)展階段的主題演化在本階段,科學(xué)計(jì)量和文獻(xiàn)計(jì)量是應(yīng)用最多的方法之一,90年代初產(chǎn)生的信息計(jì)量只在本階段末期研究較多,信息計(jì)量的研究對象雖然擴(kuò)展到任何活動(dòng)中產(chǎn)生的信息,但信息計(jì)量的方法也強(qiáng)調(diào)數(shù)學(xué)統(tǒng)計(jì)方法的應(yīng)用,因此也有研究確認(rèn)文獻(xiàn)統(tǒng)計(jì)方法、引文分析法等文獻(xiàn)計(jì)量方法和洛特卡分布等規(guī)律在信息計(jì)量中仍然適用。總體上來看,作為萌芽階段本階段的主題演化還較不明顯,因?yàn)楦嘌芯恐黝}立足于學(xué)科理論構(gòu)建與研究。
從方法來源上來看,本階段較多介紹和借鑒了國外的研究成果并在此基礎(chǔ)上形成了國內(nèi)的本土研究,介紹國外的著名學(xué)者如普賴斯、加菲爾德等的研究與貢獻(xiàn)以及科學(xué)計(jì)量學(xué)雜志;理論與定律的探索為方法應(yīng)用提供了基礎(chǔ),二八定律和文獻(xiàn)計(jì)量學(xué)的三個(gè)定律是最多的研究如布拉德福定律的函數(shù)分布、詞頻分布規(guī)律,還有如普賴斯文獻(xiàn)增長曲線、科學(xué)文獻(xiàn)半衰期等;另一方面,學(xué)科之間的交叉特征在本階段較為明顯,學(xué)者對科學(xué)計(jì)量與科學(xué)學(xué)、科技管理的關(guān)系,文獻(xiàn)計(jì)量與情報(bào)學(xué)、圖書館學(xué)等學(xué)科的關(guān)系做了較多的分析,論述了科學(xué)計(jì)量與文獻(xiàn)計(jì)量的學(xué)科根基與方法意義。從主要方法上來看,文獻(xiàn)統(tǒng)計(jì)方法是最先提出的方法,其次關(guān)于引文的方法如引文率、引文類型、自引率以及影響因子都有涉及,引文分析主要集中在引文數(shù)量的等級排序上;關(guān)于詞頻的分析,齊普夫第二定律確定了低頻詞的分布規(guī)律,Donohue J C基于文章詞頻為1的詞數(shù)量計(jì)算了低頻詞與高頻詞的臨界值,孫清蘭以不同詞數(shù)為基礎(chǔ)簡化了高頻、低頻詞分界臨界值計(jì)算公式[14];從工具上來看,本階段計(jì)算機(jī)輔助研究的趨勢在增強(qiáng),前期工具以書目、索引、圖書館文獻(xiàn)為主,在末期出現(xiàn)了數(shù)據(jù)庫,利用計(jì)算機(jī)處理引文索引等,詞頻分析也在計(jì)算機(jī)普及之后重新煥發(fā)活力,它在揭示研究趨勢上有較多應(yīng)用[15]。從方法應(yīng)用上看,主要用于評價(jià)科學(xué)生產(chǎn)能力,構(gòu)建綜合評價(jià)指標(biāo)。尤其是科學(xué)計(jì)量著眼于從投入產(chǎn)出評價(jià)科研成果,它還引入了專家加權(quán)法、量表打分法、排序法、關(guān)鍵事件法、目標(biāo)管理等方法[16]來評價(jià)科研人員的績效,而當(dāng)某些因素?zé)o法直接計(jì)量時(shí)還可以采用兌換計(jì)量法,如轉(zhuǎn)換計(jì)量法、互換計(jì)量法和成本計(jì)量法等將間接指標(biāo)轉(zhuǎn)化為可以計(jì)量的指標(biāo)[17]。
2.2快速發(fā)展階段的主題演化在文獻(xiàn)計(jì)量與科學(xué)計(jì)量兩個(gè)主題之外,本階段影響力最強(qiáng)的是網(wǎng)絡(luò)計(jì)量方法,隨著網(wǎng)絡(luò)信息資源的極大豐富,網(wǎng)絡(luò)計(jì)量學(xué)逐漸成為一個(gè)獨(dú)立分支,知識(shí)計(jì)量萌生于2005-2009年,但影響力并不如網(wǎng)絡(luò)計(jì)量廣泛。
從方法來源上看,新生事物的蓬勃發(fā)展刺激了新方法的誕生,互聯(lián)網(wǎng)的出現(xiàn)讓網(wǎng)頁、網(wǎng)站、網(wǎng)絡(luò)用戶等網(wǎng)絡(luò)信息資源及其使用者成為新生力量,文獻(xiàn)計(jì)量與科學(xué)計(jì)量并不完全適用于新生事物的計(jì)量,因此誕生了網(wǎng)絡(luò)計(jì)量學(xué)。另一方面,對信息的認(rèn)識(shí)深入到知識(shí)階段使本階段出現(xiàn)了知識(shí)計(jì)量、知識(shí)管理等研究主題,著重在于“知識(shí)單元”層次上考察知識(shí)的投入和產(chǎn)出、流量與存量、生產(chǎn)與應(yīng)用[18],知識(shí)單元又通常表現(xiàn)為信息內(nèi)容的概念、術(shù)語、詞語等。然而在具體操作方法上,能夠直接衡量文獻(xiàn)選題材料方法與結(jié)論的方法主要為同行評議[19]。盡管已經(jīng)提出了“知識(shí)元”的概念,但是其概念還不能清楚界定,它在標(biāo)引、組織、存儲(chǔ)、檢索、利用等方面具有不可操作性,無法脫離文獻(xiàn)單元而計(jì)量[20]。本階段的主流方法分為以下幾種:一是為了適應(yīng)網(wǎng)絡(luò)信息資源的存在形式而出現(xiàn)的新研究方法,如日志文件分析法、鏈接分析法、域名分析法、網(wǎng)絡(luò)內(nèi)容分析法、搜索引擎分析法、網(wǎng)絡(luò)描述法等。又因網(wǎng)絡(luò)計(jì)量學(xué)將網(wǎng)絡(luò)之間的鏈接視為文獻(xiàn)計(jì)量學(xué)中的引用關(guān)系,因此鏈接分析通過展示網(wǎng)頁鏈接網(wǎng)絡(luò)的密度、中心度、中心勢,能夠分析網(wǎng)站的網(wǎng)絡(luò)影響力等。二是逐漸發(fā)展壯大的數(shù)理統(tǒng)計(jì)分析方法,如聚類分析、因子分析等。三是對傳統(tǒng)計(jì)量方法的繼承發(fā)展,如本階段不僅僅是引文統(tǒng)計(jì)和詞頻排序,而更多從共詞、共引等角度觀察文獻(xiàn)中詞頻和引文的分布特征,從而提取研究主題,并利用多維標(biāo)度分析將共現(xiàn)網(wǎng)絡(luò)展示在二維坐標(biāo)系中。四是內(nèi)容分析的發(fā)展,上階段對文獻(xiàn)的計(jì)量主要集中在文獻(xiàn)的外部特征的描述分析,而內(nèi)容分析使研究內(nèi)容深入到文獻(xiàn)信息的內(nèi)部;但知識(shí)計(jì)量方法的發(fā)展主要還是采取替代計(jì)算的方法,單篇論文知識(shí)流量可以從論文背景、期刊影響因子和被引計(jì)算[21]。引入其他學(xué)科方法來輔助計(jì)算是另一種方式,知識(shí)的質(zhì)量測量如知識(shí)普及度,知識(shí)價(jià)值的計(jì)量方法如投入法或重置成本法、市場價(jià)值法、邊際生產(chǎn)法等[22]。從方法的應(yīng)用來看,在期刊評價(jià)、績效評價(jià)之外,大學(xué)評價(jià)、學(xué)科評價(jià)出現(xiàn),大學(xué)作為科研活動(dòng)的主體更受關(guān)注;另一方面,門戶網(wǎng)站的影響力逐漸增強(qiáng),網(wǎng)站評價(jià)研究也在增加,新出現(xiàn)的網(wǎng)絡(luò)部特征還可以作為計(jì)量指標(biāo),網(wǎng)頁數(shù)、鏈接數(shù)、流量、搜索量是描述網(wǎng)絡(luò)載體的主要特征指標(biāo),網(wǎng)絡(luò)影響因子是由此衍生的網(wǎng)絡(luò)影響力評價(jià)指標(biāo),但國內(nèi)外很多學(xué)者都對網(wǎng)絡(luò)影響因子的計(jì)算方法進(jìn)行過改進(jìn),而且計(jì)量結(jié)果各有差異。另外,傳統(tǒng)文獻(xiàn)計(jì)量指標(biāo)的發(fā)展也有h指數(shù)、g指數(shù)等指標(biāo)。
2.3發(fā)展瓶頸階段的主題演化總體上來看,網(wǎng)絡(luò)計(jì)量和知識(shí)計(jì)量研究在本階段影響力逐漸減弱,取而代之的是可視化分析和Altmetrics等新主題。
從方法來源上來看,大數(shù)據(jù)、云計(jì)算、人工智能等新生技術(shù)為研究方法的進(jìn)化提供了方向,開始有研究探索智能化的評價(jià)模型;同樣的,社交媒體的發(fā)展也令網(wǎng)絡(luò)計(jì)量發(fā)展到Altmetrics階段,科學(xué)研究不僅僅局限于學(xué)術(shù)界,隨著非正式科學(xué)交流活動(dòng)的增加,科學(xué)活動(dòng)的社會(huì)影響力也在增大,如何更好衡量社會(huì)影響力的Altmetrics指標(biāo)的開發(fā)也就成為研究的重點(diǎn)。從方法本身來看,首先本階段出現(xiàn)最多的研究方法是可視化分析,盡管從上一階段就已經(jīng)出現(xiàn)了知識(shí)圖譜與可視化的研究,但是真正成為主流還是在本階段,一系列可視化輔助工具如Citespace、Ucinet、VOSviewer、Gephi等的出現(xiàn)與應(yīng)用也大大降低了可視化分析的進(jìn)入門檻,使知識(shí)圖譜、可視化等研究呈現(xiàn)出繁榮趨勢。第二類方法是對Altmetrics指標(biāo)的開發(fā)與應(yīng)用,Altmetrics出現(xiàn)之后,將Altmetrics指標(biāo)與引文等傳統(tǒng)指標(biāo)結(jié)合成為主流,而且不僅只有外文指標(biāo),對中文Altmetrics指標(biāo)的研究利用小木蟲論壇中文期刊評價(jià)模塊與中文期刊點(diǎn)評網(wǎng)的指標(biāo)來評價(jià)中文期刊[23]。針對Altmetrics數(shù)據(jù)多樣化的特征,學(xué)者認(rèn)為后續(xù)應(yīng)該設(shè)計(jì)并研發(fā)相應(yīng)的數(shù)據(jù)清洗、格式轉(zhuǎn)換、詞性標(biāo)注和特征提取等方法來滿足后續(xù)需求[24]。從方法的應(yīng)用來看,本階段有關(guān)研究熱點(diǎn)、研究現(xiàn)狀、研究進(jìn)展、發(fā)展態(tài)勢、研究前沿和演進(jìn)路徑的研究急劇增多,主要還是源于研究方法的豐富。最初文獻(xiàn)計(jì)量方法提供了最基本的文獻(xiàn)統(tǒng)計(jì)分析,為了能夠更加準(zhǔn)確描述及數(shù)據(jù)量逐漸增加之后,數(shù)據(jù)收集方面,網(wǎng)絡(luò)日志、搜索引擎等都提供了新的數(shù)據(jù)收集和預(yù)處理方法,在計(jì)算數(shù)據(jù)關(guān)系時(shí)可以使用數(shù)據(jù)共現(xiàn)分析、聚類分析、數(shù)據(jù)挖掘、推論統(tǒng)計(jì)、圖論分析、關(guān)聯(lián)分析、內(nèi)容分析全面了解所分析的領(lǐng)域,在數(shù)據(jù)可視化展示方面,多維標(biāo)度分析、社會(huì)網(wǎng)絡(luò)分析和Citespace等可視化軟件得出的各種圖形結(jié)果都讓研究熱點(diǎn)與趨勢的結(jié)果展示更直觀。而且在前沿趨勢研究中,對主題模型的探索讓主題演進(jìn)分析更為清晰,組織生態(tài)學(xué)中的Lotka-volterra模型能描述在學(xué)科融合背景下某一學(xué)科發(fā)展演化過程[25]。另外一個(gè)得到發(fā)展的主題就是科學(xué)評價(jià),包括機(jī)構(gòu)、期刊、學(xué)者、論文、學(xué)科等評價(jià),定性評價(jià)有同行評議,定量評價(jià)有構(gòu)建評價(jià)指標(biāo)體系;在確定指標(biāo)時(shí),不同的計(jì)量方法提供不同角度的分析指標(biāo),確定評價(jià)體系權(quán)重的方法有主觀賦權(quán)法如專家咨詢法、德爾菲法、層次分析法,客觀賦權(quán)法如熵值法、變異系數(shù)法、相關(guān)系數(shù)法,篩選指標(biāo)、發(fā)現(xiàn)指標(biāo)間關(guān)系可以采取相關(guān)性分析、主成分分析、因子分析、聚類分析等,綜合評價(jià)有層次分析法、結(jié)構(gòu)方程模型、模糊綜合評價(jià)法、Topsis法、灰色關(guān)聯(lián)法等。
3.1萌芽發(fā)展階段如圖2所示,萌芽階段研究方法節(jié)點(diǎn)較少,節(jié)點(diǎn)網(wǎng)絡(luò)密度也較小,節(jié)點(diǎn)之間聯(lián)系并不緊密。研究主題節(jié)點(diǎn)中出現(xiàn)了文獻(xiàn)計(jì)量、科學(xué)計(jì)量、情報(bào)計(jì)量學(xué)等概念,盡管情報(bào)計(jì)量學(xué)此概念在后期幾乎不再使用,但本階段對它們概念的界定和使用仍未形成統(tǒng)一標(biāo)準(zhǔn)。除此之外,本階段也出現(xiàn)了一些較為明顯的研究主題如學(xué)科評估、學(xué)術(shù)隊(duì)伍建設(shè)、核心期刊確定和成果評價(jià)等;在研究方法的使用上,一般理論分析和描述性統(tǒng)計(jì)分析占據(jù)最主要的位置,因在發(fā)展初期理論梳理與概念構(gòu)建是較為重要的課題,因此理論分析占據(jù)著重要位置,而且在此時(shí)期以前國內(nèi)圖書情報(bào)領(lǐng)域研究也以理論為主,較少使用定量方法。
圖2 萌芽階段方法-關(guān)鍵詞二模圖譜
科學(xué)計(jì)量和情報(bào)計(jì)量關(guān)聯(lián)的方法有一般理論分析、描述性統(tǒng)計(jì)分析和引文分析,文獻(xiàn)計(jì)量關(guān)聯(lián)的方法有一般理論分析、描述性統(tǒng)計(jì)分析、詞頻分析、時(shí)間序列分析、比較分析和計(jì)算機(jī)輔助分析等。因正處于誕生初期,文獻(xiàn)計(jì)量、科學(xué)計(jì)量等作為方法集合時(shí)所包含的方法也是有限的,更多遵從于其定義將數(shù)學(xué)、統(tǒng)計(jì)學(xué)的方法應(yīng)用于文獻(xiàn)分析中,分析角度也多從文獻(xiàn)外部特征如地域、作者、機(jī)構(gòu)等出發(fā)。
3.2快速發(fā)展階段雖然圖3較前一階段選用了同樣數(shù)量的關(guān)鍵詞,但是研究主題仍然發(fā)生了很大變化,網(wǎng)絡(luò)化的沖擊使數(shù)字圖書館、電子政務(wù)等概念升溫,網(wǎng)絡(luò)輿情等數(shù)字化信息的研究爆發(fā)增長使信息計(jì)量、網(wǎng)絡(luò)計(jì)量嶄露頭角,對知識(shí)的研究也讓知識(shí)計(jì)量的概念出現(xiàn),包括對知識(shí)管理與服務(wù)、知識(shí)圖譜的研究;在研究方法數(shù)量上,計(jì)量學(xué)方法對其他方法的應(yīng)用吸收逐漸明顯,更多方法被吸收進(jìn)來,尤其是文獻(xiàn)計(jì)量所包含的方法發(fā)展迅速,計(jì)量學(xué)方法的應(yīng)用逐漸劃分為兩個(gè)領(lǐng)域:一是對發(fā)展現(xiàn)狀的分析,二是利用計(jì)量學(xué)指標(biāo)開展科學(xué)評價(jià)。
圖3 快速發(fā)展階段方法-關(guān)鍵詞二模圖譜
較之上一階段,文獻(xiàn)計(jì)量發(fā)展極為迅速,它幾乎囊括了圖中2/3以上的方法(見圖3)。不僅在傳統(tǒng)描述性統(tǒng)計(jì)分析的基礎(chǔ)上增加了相關(guān)分析、回歸分析、聚類分析、因子分析等,引文分析和詞頻分析還擴(kuò)展為分析引文之間的共現(xiàn)關(guān)系、突變關(guān)系檢測,共引分析可從引文網(wǎng)狀結(jié)構(gòu)入手,通過聚類與多維標(biāo)度方法將文章由共引形成的相互位置關(guān)系展示在圖中[26],而且文獻(xiàn)計(jì)量方法從文獻(xiàn)、作者、載文期刊等方面的計(jì)量深入到文獻(xiàn)內(nèi)容和主題的計(jì)量,新增了內(nèi)容分析、社會(huì)網(wǎng)絡(luò)分析、可視化分析等方法;因?yàn)榭茖W(xué)計(jì)量方法圍繞著科學(xué)家、科學(xué)成果、科學(xué)期刊、科學(xué)論文、科學(xué)交流活動(dòng)、科學(xué)資源配置等展開,以全面展示科學(xué)活動(dòng)水平和發(fā)展趨勢,尤其是涉及計(jì)量競爭力、績效、效果等,科學(xué)計(jì)量方法借鑒其他學(xué)科理論的色彩更強(qiáng),但是沒有文獻(xiàn)計(jì)量此概念使用廣泛;在本階段新增的信息計(jì)量本義是為了將對文獻(xiàn)的計(jì)量深化到對信息的計(jì)量,雖然大部分研究方法繼承自文獻(xiàn)計(jì)量與科學(xué)計(jì)量,但是文本分析也能體現(xiàn)出其特色;知識(shí)計(jì)量則在繼承前者的基礎(chǔ)上增加了對句法、語義的分析;最后,網(wǎng)絡(luò)用戶和企業(yè)網(wǎng)站等新的研究對象出現(xiàn),也促使以鏈接分析、流量分析、網(wǎng)絡(luò)數(shù)據(jù)分析、搜索引擎法等研究方法為主的網(wǎng)絡(luò)計(jì)量的誕生。
3.3發(fā)展瓶頸階段圖4呈現(xiàn)出的研究主題較前一階段發(fā)生的變化是:“五計(jì)學(xué)”主題基本穩(wěn)定,不過網(wǎng)絡(luò)時(shí)代交流活動(dòng)的方式出現(xiàn)了巨大的變化,連帶著科學(xué)交流也進(jìn)入了新階段,社交媒體對學(xué)界的沖擊不容小覷,Altmetrics指標(biāo)備受關(guān)注;雖然也延續(xù)了上一階段文獻(xiàn)綜述和科學(xué)評價(jià)的研究,但是本階段較多討論同行評議、學(xué)術(shù)影響力、學(xué)術(shù)評價(jià),綜述呈現(xiàn)模式也更多,可視化、知識(shí)圖譜、演進(jìn)路徑等研究激增。從研究數(shù)量上來看,與前一階段相比變化不大,尤其是核心研究方法并未有太多變化。
文獻(xiàn)計(jì)量仍然是最大節(jié)點(diǎn),幾乎連接了所有出現(xiàn)的研究方法,科學(xué)計(jì)量與信息計(jì)量關(guān)聯(lián)的方法差異不大,主要以聚類分析、可視化分析、共詞分析、引文分析、內(nèi)容分析、一般理論分析、描述性統(tǒng)計(jì)分析、詞頻分析等核心方法為主,但文獻(xiàn)計(jì)量方法涉及面更廣;知識(shí)計(jì)量在方法上并沒有新的發(fā)展,仍以理論分析和繼承其他方法為主;此階段的網(wǎng)絡(luò)計(jì)量連接的方法增加了計(jì)算指標(biāo)權(quán)重的熵權(quán)法,不過與網(wǎng)絡(luò)計(jì)量最相關(guān)的還是Altmetrics的發(fā)展,Altmetrics的指標(biāo)來源十分豐富,可以從多個(gè)角度計(jì)量,但這也是Altmetrics面臨的問題之一,各個(gè)數(shù)據(jù)源中之間的標(biāo)準(zhǔn)不統(tǒng)一,Altmetrics的相關(guān)研究也主要是對Altmetrics指標(biāo)與傳統(tǒng)指標(biāo)相關(guān)性的探索,Altmetrics指標(biāo)內(nèi)部的結(jié)構(gòu)與關(guān)系以及Altmetrics指標(biāo)如何應(yīng)用于科研活動(dòng)評價(jià)中,因此它關(guān)聯(lián)了一系列諸如層次分析、主成分分析、因子分析等指標(biāo)計(jì)算和構(gòu)建的方法。
4.1“五計(jì)學(xué)”方法的研究現(xiàn)狀與問題通過對“五計(jì)學(xué)”主題演進(jìn)過程和“五計(jì)學(xué)”內(nèi)部方法發(fā)展階段的分析可以看出國內(nèi)從文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)、信息計(jì)量學(xué)、知識(shí)計(jì)量學(xué)和網(wǎng)絡(luò)計(jì)量學(xué)發(fā)展至今,盡管它們五者在提出時(shí)間、概念、研究對象和方法上存在著一定差異,但是已經(jīng)在研究中出現(xiàn)了融合發(fā)展的現(xiàn)狀,此種融合的原因可以歸結(jié)為3點(diǎn):a.在主題演進(jìn)圖中“五計(jì)學(xué)”的研究對象是互有交叉的,或是隨著研究主題的復(fù)雜化,它們都被用于同一研究之中,尤其是在評價(jià)體系構(gòu)建研究多是混合使用了多種計(jì)量指標(biāo)以達(dá)到客觀評價(jià)的目的;b.在具體分析“五計(jì)學(xué)”內(nèi)部方法時(shí)也發(fā)現(xiàn)了在不同的發(fā)展階段,即使研究方法總量上存在差異,但其所囊括的具體方法存在繼承性和交叉性,尤其是文獻(xiàn)計(jì)量、科學(xué)計(jì)量和信息計(jì)量三者的交叉融合程度更深,所關(guān)聯(lián)的方法幾乎一致,知識(shí)計(jì)量因?yàn)閷χR(shí)單元的界定和研究還較困難,所以仍然以知識(shí)的載體即文獻(xiàn)為研究對象,研究方法仍然沿用文獻(xiàn)計(jì)量,網(wǎng)絡(luò)計(jì)量也有將文獻(xiàn)計(jì)量的方法遷移到網(wǎng)絡(luò)信息資源上,因此它們在研究方法上的融合非常顯著;c.很多學(xué)者在使用這五個(gè)概念時(shí),并沒有仔細(xì)區(qū)分概念之間的區(qū)別,更多以自身的偏好為主,筆者在研究方法編碼時(shí)發(fā)現(xiàn)了有較多文獻(xiàn)雖然在標(biāo)題或者關(guān)鍵詞中使用了文獻(xiàn)計(jì)量的概念,但實(shí)際上從概念上理解應(yīng)該算作科學(xué)計(jì)量的范疇,而且對于非圖書情報(bào)領(lǐng)域的學(xué)者來說,他們更傾向于使用那個(gè)被使用最頻繁的概念即文獻(xiàn)計(jì)量,這也導(dǎo)致在概念使用上出現(xiàn)了馬太效應(yīng),給后來人造成一定誤導(dǎo)。
4.2構(gòu)建“五計(jì)學(xué)”方法體系的建議
4.2.1 動(dòng)態(tài)化 從發(fā)展過程來看,計(jì)量學(xué)方法隨著認(rèn)識(shí)的加深及環(huán)境的變化而進(jìn)化,從文獻(xiàn)計(jì)量到信息計(jì)量到知識(shí)計(jì)量,從只關(guān)注圖書館學(xué)期刊等文獻(xiàn)情況發(fā)展到一切科學(xué)活動(dòng)中的信息,另一方面又深入文獻(xiàn)單元提出知識(shí)單元的概念,知識(shí)計(jì)量也成為發(fā)展方向。另外在互聯(lián)網(wǎng)發(fā)展下,網(wǎng)絡(luò)信息資源也立刻被納入計(jì)量體系之中誕生了網(wǎng)絡(luò)計(jì)量和Altmetrics。上述都是環(huán)境的劇烈變化而催生出的新研究分支,另外新研究工具的出現(xiàn)也催生了可視化等方法的成熟。因此,在構(gòu)建“五計(jì)學(xué)”方法體系時(shí)首先要明確的一點(diǎn)就是要為未來將會(huì)新增的方法留有余地,盡管大多數(shù)方法體系都會(huì)盡可能追求本體系能夠盡可能囊括當(dāng)前研究中使用的所有的研究方法,但是固定化的方法體系隨著時(shí)間發(fā)展會(huì)逐漸不適應(yīng)當(dāng)前研究現(xiàn)狀,尤其是對教學(xué)有不利影響。
4.2.2 多維度 如果用網(wǎng)絡(luò)圖來描述“五計(jì)學(xué)”的方法體系,它應(yīng)該是多層級、多維度的立體網(wǎng)絡(luò),“五計(jì)學(xué)”自身就存在著復(fù)雜的交叉融合衍生關(guān)系,并不能夠簡單地將它們分割成不同的部分,如引文分析在文獻(xiàn)計(jì)量、科學(xué)計(jì)量、信息計(jì)量、知識(shí)計(jì)量中都存在,在劃分歸屬關(guān)系難免無法抉擇,在研究主題于方法關(guān)聯(lián)圖譜中也能夠看到幾者在核心方法都存在關(guān)聯(lián),而且隨著某類方法的發(fā)展它也會(huì)逐漸擴(kuò)展二級方法,如引文分析再細(xì)一級還可以分為共引分析、共被引分析等。另外,研究方法的劃分標(biāo)準(zhǔn)不同,如按照研究對象或者分析角度劃分時(shí)的方法體系也是不同的,但是不同的劃分標(biāo)準(zhǔn)之間是不存在絕對的正確與錯(cuò)誤的,因?yàn)檠芯糠椒ū緛砭途哂胁煌膶傩?,只有多維度的劃分標(biāo)準(zhǔn)才能夠更準(zhǔn)確地描述研究方法。
4.2.3 問題導(dǎo)向 一方面,因?yàn)槲墨I(xiàn)計(jì)量、科學(xué)計(jì)量、信息計(jì)量、知識(shí)計(jì)量和網(wǎng)絡(luò)計(jì)量等概念在使用上的雙面性,其自身即使方法名稱也是方法集合,給初學(xué)者或是非本領(lǐng)域?qū)W者使用造成一定障礙,即使文中提及使用了文獻(xiàn)計(jì)量方法仍然不能知曉此方法在問題分析中起到了何種作用,又或者文獻(xiàn)直接使用了較文獻(xiàn)計(jì)量等概念次一級的概念如引文分析、鏈接分析等,這種概念使用混亂的狀態(tài)不利于理清“五計(jì)學(xué)”的方法體系;另一方面研究方法誕生的使命就是為了解決實(shí)際問題,只要有新的需求出現(xiàn)就會(huì)促使學(xué)者尋找合適的方法來滿足需求,如何歸類研究方法必須要考慮到對研究人員來說如何使用研究方法,類似于情報(bào)收集、整理、分析、輸出的過程,“五計(jì)學(xué)”方法在滿足不同需求時(shí)也是不同的,如在評價(jià)體系中作為計(jì)量指標(biāo)出現(xiàn),在綜述研究中提取研究主題可以采用共詞法,分析作者合作可以使用社會(huì)網(wǎng)絡(luò)分析。所以,在構(gòu)建“五計(jì)學(xué)”方法體系時(shí)還應(yīng)該分析“五計(jì)學(xué)”的研究對象以及它們能夠從哪些方面怎樣解決問題。