●任紅娟
(鄭州航空工業(yè)管理學(xué)院信息科學(xué)學(xué)院,鄭州450015)
國內(nèi)外引用認(rèn)同研究進(jìn)展文獻(xiàn)計量分析
●任紅娟
(鄭州航空工業(yè)管理學(xué)院信息科學(xué)學(xué)院,鄭州450015)
引用認(rèn)同;研究進(jìn)展;文獻(xiàn)計量
以文獻(xiàn)計量學(xué)方法為基礎(chǔ),分別選用Web of Science和中國知網(wǎng)、萬方知識服務(wù)平臺構(gòu)建數(shù)據(jù)集來分析國內(nèi)外引用認(rèn)同的研究現(xiàn)狀,對國內(nèi)外引用認(rèn)同的主要載文期刊、高產(chǎn)作者、高被引作者等基本統(tǒng)計信息進(jìn)行調(diào)查,并基于作者共被引方法分析了該領(lǐng)域的主要研究分支。在此基礎(chǔ)上綜合分析了國內(nèi)外引用認(rèn)同研究的內(nèi)容,概括了引用認(rèn)同的主要研究主題。
引用認(rèn)同(CitationⅠdentity)是一種全新視角的引文分析方法,該方法從引用者出發(fā)對引用者和被引者都加以研究,是評價個體學(xué)者的一種新方法。研究引用認(rèn)同在了解作者重復(fù)引用規(guī)律,把握作者研究風(fēng)格,洞悉作者影響力和研究領(lǐng)域等方面都具有重要的意義。2000年,美國德魯克賽爾大學(xué)教授Howard D. White在《The Web of Knowledge:A Festschrift in Honor of Eugene Garfield》文集中第一次提及“引用認(rèn)同”。[1]隨后于2001年在其論文“Authorsascitersovertime”中,White第一次正式提出了“引用認(rèn)同”概念,他指出:引用認(rèn)同是某位作者引用的所有作者的集合。[2]作為引用分析方法的新視角和重要組成部分,引用認(rèn)同方法提出十多年來,從國內(nèi)外的研究來看,對該方法的梳理和系統(tǒng)分析的研究還比較少。2010年,魯晶晶等發(fā)表了“引用認(rèn)同研究進(jìn)展分析”一文,對引用認(rèn)同的發(fā)展現(xiàn)狀進(jìn)行了簡要介紹。[3]本文擬利用文獻(xiàn)計量學(xué)的方法來綜合分析引用認(rèn)同的發(fā)展現(xiàn)狀,以期能夠全面地把握該領(lǐng)域的研究狀況,分析該研究領(lǐng)域的發(fā)展趨勢以及該引文分析方法的不足之處。
1.1 數(shù)據(jù)集構(gòu)建
國外數(shù)據(jù)選取Web of knowledge平臺的“Web of Science數(shù)據(jù)庫”,以“主題=citation identity*”進(jìn)行檢索,檢索時間為2012年11月20日,得到11篇相關(guān)文獻(xiàn)。從結(jié)果來看,數(shù)據(jù)量偏小,這是由于部分文獻(xiàn)在主題中沒有直接采用該主題詞,但研究內(nèi)容卻與之非常相關(guān)。按照邏輯,文獻(xiàn)的施引文獻(xiàn)是在某一個方面借鑒或者包含了與被引文獻(xiàn)相關(guān)的研究方法或者內(nèi)容,因此利用這些文獻(xiàn)的施引文獻(xiàn)來進(jìn)行數(shù)據(jù)集的擴(kuò)展,可以保障這些文獻(xiàn)主題上一定程度的相關(guān)性;另一方面由于Web of science只收錄了全世界范圍內(nèi)以英文語言為主的一小部分優(yōu)質(zhì)期刊資源,而利用這些文獻(xiàn)的施引文獻(xiàn)進(jìn)行數(shù)據(jù)集擴(kuò)展就可以把更大范圍內(nèi)的相關(guān)研究文獻(xiàn)納入其中,從而擴(kuò)大文獻(xiàn)的查全率。利用施引文獻(xiàn)擴(kuò)展檢索之后,經(jīng)過去重和不相關(guān)文獻(xiàn)的排除,共得到143篇相關(guān)文獻(xiàn),去除不相關(guān)文獻(xiàn)之后,共有126篇文獻(xiàn)。
1.2 基本統(tǒng)計信息分析
(1)引用認(rèn)同研究的起源及論文年代分布。對該數(shù)據(jù)集的論文年代分布進(jìn)行分析,結(jié)果如圖1所示。由圖1可知,引用認(rèn)同在2001年提出以后,起初幾年并沒有引起太多的關(guān)注,研究文獻(xiàn)增加速度比較緩慢,2005和2006年甚至還出現(xiàn)了下降的趨勢。2006年以后,相關(guān)論文數(shù)量經(jīng)歷了快速的增長,2009年達(dá)到了一個頂峰,發(fā)表了25篇相關(guān)的文獻(xiàn)。在2010年,發(fā)文數(shù)量出現(xiàn)了急劇的下降,2011年開始回升,2012年由于數(shù)據(jù)統(tǒng)計的不完全,相比2011年論文數(shù)量有所下降,但相差不大??傮w而言,引用認(rèn)同的相關(guān)研究以相對比較緩慢的速度在增長,在增長的過程中還伴隨著間或的下降。這也從一定程度上說明該領(lǐng)域的研究還不是很成熟,仍處在研究的起步階段。
圖1 國外引用認(rèn)同論文年代分布圖
圖2 國外引用認(rèn)同研究期刊分布圖
(2)被引頻次分析。126篇文獻(xiàn)的總被引頻次為1150次,篇均被引9.13次。被引用次數(shù)最高的是Borgman和Furner于2002年發(fā)表在《Annual Review of information Science and Technology》的一篇綜述文章“Scholarly communication and bibliometrics”,被引144次。排在第二的是2008年Bornmann和Daniel所著,題為“What do citation counts measures?A review of studies on citing behavior”的文獻(xiàn),被引111次。排在第三位的是Bar-Ⅰlan的“Which h-index?-A comparison of Wos,Scopus and Google Scholar”,被引97次。排在前兩位的文獻(xiàn)都是綜述性文獻(xiàn),對綜述性文獻(xiàn)的引用是獲取某一個主題研究全貌的一個很重要的途徑,因此其引用次數(shù)相對比較高,而實際上這些綜述文獻(xiàn)和引用認(rèn)同的深入研究相關(guān)性并不大,但無形中提高了該主題篇均被引次數(shù)。White的“Authors as citers over time”的文章被引次數(shù)為78次,排在第五位。在該數(shù)據(jù)集中,有29篇文獻(xiàn)從未被引用。從這些文獻(xiàn)的分布年代來看,2012年的文獻(xiàn)有11篇,2011年的文獻(xiàn)有8篇,由于這些文獻(xiàn)發(fā)表較晚,因此存在有些文獻(xiàn)還沒有被該領(lǐng)域研究學(xué)者關(guān)注到的可能性,但也存在一部分文獻(xiàn)已發(fā)表一段時間卻仍未被引用。
(3)期刊分布。對該數(shù)據(jù)集中文獻(xiàn)的主要出版平臺進(jìn)行分析,載文大于2的出版物如圖2所示。共包含了8種期刊,這8種期刊均集中在圖情領(lǐng)域,除了馬來西亞圖書館信息科學(xué)期刊之外,其余的期刊均為圖情領(lǐng)域的知名期刊。
(4)高產(chǎn)作者及高產(chǎn)機(jī)構(gòu)。該數(shù)據(jù)集共有作者181位,分別對第一作者和全作者(所有作者,不分署名順序)的發(fā)文情況進(jìn)行統(tǒng)計,結(jié)果如表1所示。表1中列出了產(chǎn)出大于1的35位作者,其中字體加黑的作者是以對第一作者產(chǎn)出進(jìn)行統(tǒng)計的結(jié)果,共有19位作者。發(fā)文變化是指作為第一作者發(fā)文的數(shù)量與不分署名順序進(jìn)行統(tǒng)計的全作者發(fā)文數(shù)量之間的差值。從表1中可知,沒有數(shù)量變化的均為所有作品都是以第一作者署名的作者,變化最大的是Shaw和Wolfram,說明這兩位作者的所有作品均不是以第一作者發(fā)表的。雖然他們的產(chǎn)出數(shù)量相對比較高,但是分析這些合作就會發(fā)現(xiàn),Shaw是印第安納大學(xué)圖書館信息科學(xué)系的主任,她以第二作者發(fā)表的這幾篇文章都是和Cronin合作的,而Wolfram的合作者為其指導(dǎo)的博士生。所以,從表1不難發(fā)現(xiàn),采用第一作者來進(jìn)行高產(chǎn)作者的統(tǒng)計在有些情況下要更科學(xué)一些,但鑒于合作關(guān)系以及署名規(guī)則在不同機(jī)構(gòu)之間的差異,可以把第一作者和全作者綜合的進(jìn)行統(tǒng)計分析來確定領(lǐng)域的高產(chǎn)作者。對這些作者,無論是第一作者還是全作者,所在的機(jī)構(gòu)進(jìn)行分析,排在前三位的機(jī)構(gòu)結(jié)果是一致的,分別是美國德魯克賽爾大學(xué)、美國印第安納大學(xué)和以色列巴伊蘭大學(xué)。
1.3 作者共被引分析
選擇被引頻次大于17的46位作者進(jìn)行共被引分析,將遴選出的46位作者進(jìn)行作者共被引分析,利用SPSS18.0對相似矩陣進(jìn)行因子分析,在分析的過程中選用最大方差正交旋轉(zhuǎn)的方法來簡化因子結(jié)構(gòu)。因子分析的結(jié)果共得到7個公因子,累積方差貢獻(xiàn)率為87.335%,可以代表引用認(rèn)同研究主題的不同的學(xué)術(shù)共同體及其核心作者。因子負(fù)載的絕對值超過0.5才被接受,超過0.7則認(rèn)為對解釋因子有幫助。[4]依據(jù)此標(biāo)準(zhǔn),將46位作者分配在7個公因子中。其中,因子7中只包含Hyland,作者Drucker在任何公因子中的絕對值都不超過0.5,將Ducker和Hyland歸為第7個公因子中,他們的研究主題分別集中在營銷和應(yīng)用語言學(xué)。通過對該數(shù)據(jù)集中引用高影響力作者文獻(xiàn)的作者關(guān)鍵詞以及標(biāo)題詞詞頻分析,并通過Web of science數(shù)據(jù)庫檢索作者的作品并輔以Google scholar以及Google個人主頁、個人相關(guān)介紹等內(nèi)容來為每個公因子進(jìn)行命名。除了第7個公因子之外,其余6個公因子的研究內(nèi)容分別是:科學(xué)計量學(xué)、網(wǎng)絡(luò)計量學(xué)、信息計量學(xué)以及文獻(xiàn)計量學(xué)領(lǐng)域的方法和實證研究;作者引用認(rèn)同、引文分析理論和方法研究;科學(xué)交流與文獻(xiàn)計量學(xué)關(guān)聯(lián)研究;引用質(zhì)量評價和影響因子;H指數(shù);期刊引用認(rèn)同及期刊評價。
表1 國外引用認(rèn)同高產(chǎn)作者分布表
2.1 數(shù)據(jù)集構(gòu)建
國內(nèi)數(shù)據(jù)選取中國知網(wǎng)和萬方知識服務(wù)平臺來進(jìn)行數(shù)據(jù)搜集,以“主題=引用認(rèn)同”進(jìn)行檢索,檢索日期為2012年11月20日,共得到27篇相關(guān)文獻(xiàn)。其中有兩篇為碩士學(xué)位論文,分別是中國科學(xué)院魯晶晶(2010)的“基于引用認(rèn)同的科研機(jī)構(gòu)認(rèn)知方法研究”和吉林大學(xué)高歌(2011)的“基于引用認(rèn)同的學(xué)科前沿?zé)狳c研究”,其余均為期刊論文。
2.2 基本統(tǒng)計信息分析
(1)文獻(xiàn)年代分布。2009年,馬鳳和武夷山撰文“引用認(rèn)同——一個值得注意的概念”,將引用認(rèn)同研究引入,引用認(rèn)同開始受到我國學(xué)者的關(guān)注。2010年發(fā)表了8篇相關(guān)成果,2011年達(dá)到10篇,2012年由于檢索時數(shù)據(jù)不完全,相比11年略有下降,但兩者的數(shù)值相差不大。由此可知,我國越來越多的學(xué)者認(rèn)識到引用認(rèn)同研究的重要性,以逐年增加的趨勢投入到該主題的研究中。
(2)期刊分布。國內(nèi)引用認(rèn)同的成果大多集中在圖書館學(xué)和情報學(xué)領(lǐng)域期刊,排在前三的依次是《情報理論與實踐》《情報雜志》《圖書情報工作》。在這些期刊中,只有《科學(xué)學(xué)研究》屬于科學(xué)學(xué)領(lǐng)域,由于《科學(xué)學(xué)研究》與科學(xué)計量學(xué)研究領(lǐng)域有著密切的聯(lián)系,因此,該期刊也屬于圖情領(lǐng)域的親緣學(xué)科期刊??傮w而言,從期刊分析結(jié)果來看,引用認(rèn)同的研究主要集中在圖情領(lǐng)域,在其他領(lǐng)域的拓展研究還比較少見。
(3)高產(chǎn)作者和高產(chǎn)機(jī)構(gòu)。選取發(fā)文數(shù)量大于1的作者及其作者所在機(jī)構(gòu)進(jìn)行分析,而且高產(chǎn)作者按照第一作者和全作者分別進(jìn)行統(tǒng)計。以第一作者發(fā)文最多的作者是蘇芳荔,其次是魯晶晶,鄭德俊等人并列第三。而對全作者進(jìn)行統(tǒng)計分析,排在第一位的仍是蘇芳荔,鄭德俊位居并列第一,魯晶晶仍然排在第二位,其余作者并列第三。
發(fā)文最多的機(jī)構(gòu)是南京農(nóng)業(yè)大學(xué)信息管理系,其次是南京大學(xué)信息管理系、鄭州航空工業(yè)管理學(xué)院信息科學(xué)學(xué)院以及中國科學(xué)院文獻(xiàn)情報中心,排在第三位的是武漢大學(xué)信息管理學(xué)院。
(4)高頻關(guān)鍵詞。對數(shù)據(jù)集中文獻(xiàn)的關(guān)鍵詞進(jìn)行統(tǒng)計分析,可以大體了解引用認(rèn)同研究的主要內(nèi)容。在統(tǒng)計分析的過程中,對同義詞進(jìn)行合并,如實證研究、實證分析以及實例分析的含義相似,都合并為實證研究。表2列出了國內(nèi)引用認(rèn)同研究頻次大于1的18個關(guān)鍵詞。由表2可知,國內(nèi)的引用認(rèn)同研究主要是對(作者)引用認(rèn)同、期刊引用認(rèn)同、機(jī)構(gòu)引用認(rèn)同的實證分析。
表2 國內(nèi)引用認(rèn)同高頻關(guān)鍵詞
3.1 不同研究對象的引用認(rèn)同實證研究
從國內(nèi)外引用認(rèn)同的研究文獻(xiàn)來看,引用認(rèn)同主要包含三個研究對象:作者、期刊和機(jī)構(gòu)。
White利用引用認(rèn)同對8位信息科學(xué)家的引用認(rèn)同進(jìn)行了分析,正式提出了引用認(rèn)同的概念。[2]Cronin和Shaw以3個圖情領(lǐng)域的教授為研究對象,分析了他們的引用認(rèn)同。[5]2004年,White選取了來自不同學(xué)科的28位作者進(jìn)行了引用認(rèn)同的分析,把引用認(rèn)同的研究拓展到了圖情領(lǐng)域之外。[6]高歌在其碩士論文中,利用引用認(rèn)同在臨床神經(jīng)學(xué)領(lǐng)域進(jìn)行了分析。[7]這些研究都是以作者為分析對象進(jìn)行的引用認(rèn)同研究。
2006年,Ellen Nebelong-Bonnevie將引用認(rèn)同的研究對象擴(kuò)展到期刊,利用期刊引用認(rèn)同作為期刊評價的指標(biāo)對《Journal of Documentation》的引用認(rèn)同進(jìn)行了分析。[8]鄭德俊和葉繼元對期刊引用認(rèn)同引申的期刊評價指標(biāo)有效性進(jìn)行了研究。[9]
魯晶晶等提出將引用認(rèn)同方法用于科研機(jī)構(gòu)的分析,選取印第安納大學(xué)圖書情報學(xué)院作為研究對象,研究該機(jī)構(gòu)的引用認(rèn)同,結(jié)果表明:引用認(rèn)同方法可以用來分析機(jī)構(gòu)的科研引用模式、科研領(lǐng)域布局和研究動向以及發(fā)現(xiàn)潛在的科研合作對象。[10]蘇芳荔對機(jī)構(gòu)引用認(rèn)同和機(jī)構(gòu)合作進(jìn)行了對比研究。[11]從構(gòu)建的數(shù)據(jù)集來看,國外還沒有看到有機(jī)構(gòu)引用認(rèn)同研究的成果。
3.2 多數(shù)據(jù)源選取的引用認(rèn)同研究
國外引用認(rèn)同的分析大多數(shù)都是基于Web of science數(shù)據(jù)庫,但是該數(shù)據(jù)庫自身收錄的期刊種類在全世界或者某個國家發(fā)行期刊中比例是非常低的,而引用認(rèn)同要求對作者某一段時間內(nèi)作品集的所有被引作者進(jìn)行分析。因此,數(shù)據(jù)庫選取以及數(shù)據(jù)覆蓋的全面與否對于最終的結(jié)果是有一定程度影響的。
Bar-Ⅰlan選用Web of Science、Google Scholar和Citeseer作為數(shù)據(jù)源,并對這三種數(shù)據(jù)源在計算機(jī)科學(xué)領(lǐng)域分析中的優(yōu)勢和不足進(jìn)行了深入的分析。[12]Cronin和Shaw選取網(wǎng)絡(luò)資源、圖書館館藏、作者個人簡歷等多種來源獲取該學(xué)者的作品集,然后利用web of science數(shù)據(jù)庫來收割分析對象所引用的作者列表。[13]
3.3 引用認(rèn)同研究方法研究
引用認(rèn)同的研究涉及分析對象作品集構(gòu)建、引用對象的提取、引用對象與分析對象關(guān)聯(lián)強(qiáng)度的分析以及在定量分析基礎(chǔ)上的定性分析。每一個步驟對于最終的分析結(jié)論都有一定程度的影響。White主要是基于Dialog來檢索數(shù)據(jù),如果作者X在他的5篇文獻(xiàn)當(dāng)中,每篇都引用作者Noam Chomsky兩次,則X對Noam Chomsky的引用認(rèn)同為5,而不是10,而且對于重復(fù)引用的次數(shù)統(tǒng)計,作者被引n次,重復(fù)引用次數(shù)應(yīng)該為n-1,White指出由于Dialog系統(tǒng)只給出被引次數(shù),他沒有進(jìn)行調(diào)整,把被引大于1的引用看做是重復(fù)引用。[2]
Ellen Nebelong-Bonnevie將引用認(rèn)同的研究對象從作者擴(kuò)展到期刊,他在期刊引用認(rèn)同研究中,將White的引用認(rèn)同度量方法進(jìn)行改變,提出用期刊參考文獻(xiàn)總數(shù)/被引期刊數(shù)得到的比值來計算期刊的引用認(rèn)同,與White提出的用絕對被引次數(shù)來計算引用認(rèn)同方法不同。魯晶晶等在研究機(jī)構(gòu)引用認(rèn)同時,對于采集到的機(jī)構(gòu)的被引數(shù)據(jù)沒有進(jìn)行去重處理,引用中出現(xiàn)1次,則引用認(rèn)同的數(shù)值加1,也就是說,對于同一篇文獻(xiàn)的多次引用,引用認(rèn)同值是累加的。[10]
本文利用文獻(xiàn)計量的方法對國內(nèi)外的引用認(rèn)同研究進(jìn)行了系統(tǒng)的梳理,采用定量和定性相結(jié)合的方法對該主題的研究進(jìn)行了深入的分析。從國內(nèi)外的研究來看,引用認(rèn)同作為引文分析的重要組成部分,具有很重要的研究價值,既可以用于描述特定作者、期刊、機(jī)構(gòu)的研究主題和主題的遷移,也可以用于評價作者、期刊、機(jī)構(gòu)等對象的寫作風(fēng)格、研究的廣度和深度、影響力以及引用行為特征等,是一個非常重要的研究領(lǐng)域。然而,國內(nèi)外相關(guān)研究也存在不足之處,總體而言還不太成熟,成果不夠豐碩。在現(xiàn)有的研究中,對于引用認(rèn)同系統(tǒng)化的研究成果還相對較少,對于如何才能更加科學(xué)的搜集到某個作者、某個機(jī)構(gòu)以及某個期刊的引用認(rèn)同數(shù)據(jù),缺乏全面的檢索工具和自動化的分析手段,以及如何才能進(jìn)行大批量的引用認(rèn)同分析,擴(kuò)大引用認(rèn)同研究對象數(shù)量的研究比較缺乏。同時,對于如何度量引用認(rèn)同數(shù)值以及引用認(rèn)同適用性的研究也有待進(jìn)一步加強(qiáng)。隨著更多的方法研究和實證研究的出現(xiàn),將會更有力的推動該研究領(lǐng)域的發(fā)展。
[1]Cronin B,Atkins H B.The Web of Knowledge:A FestschriftinHonorofEugeneGarfield[M].Medford:ⅠnformationToday,2000:475-496.
[2]White H D.Authors as citers over times[J].Journal of the American Society forⅠnformation Science and Technology,2001,52(2):87-108.
[3]魯晶晶,等.引用認(rèn)同研究進(jìn)展分析[J].圖書情報工作,2010,54(20):45-48.
[4]張勤,馬費成.國外知識管理研究范式——以共詞分析為方法[J].管理科學(xué)學(xué)報,2007,12(6):65-74.
[5]CroninB,ShawD.Ⅰdentitycreatorsandimagemakers: usingcitationanalysisandthickdescriptiontoputauthors in their place[J].Scientometrics,2002,54(1):31-49.
[6]WhiteHD.Reward,persuasion,andthesokalhoax:a study incitation identities[J].Scientometrics,2004, 60(1):93-120.
[7]高歌.基于引用認(rèn)同的學(xué)科前沿?zé)狳c研究[D].吉林:吉林大學(xué),2011.
[8]Nebelong B E,F(xiàn)randsen T.Journal citation identity and journal citation image:a portrait of the journal of Documentation[J].JournalofDocumentation,2006, 62(1):30-57.
[9]鄭德俊,葉繼元.期刊引用認(rèn)同及其被引評價新指標(biāo)有效性分析[J].中國圖書館學(xué)報,2010,36(4):106-114.
[10]魯晶晶,等.引用認(rèn)同用于科研機(jī)構(gòu)分析的探討[J].圖書情報工作,2011,55(6):53-56.
[11]蘇芳荔.機(jī)構(gòu)引用認(rèn)同和機(jī)構(gòu)合作的比較研究[J].情報理論與實踐,2012,35(11):125-128.
[12]Bar-Ⅰlan J.An Ego-centric citation analysis of the works ofJ].Ⅰnformation Processing&Management, 2006,42(6):1553-1566.
[13]Cronin B,Shaw D.Peers and spheres of influence: situating rob kling[J].Ⅰnformation Society,2007, 23(4):221-233.
G250.252
A
1005-8214(2014)08-0042-04
任紅娟(1979-),女,鄭州航空工業(yè)管理學(xué)院講師。
2013-07-04[責(zé)任編輯]菊秋芳
本文系教育部人文社會科學(xué)研究青年基金項目“引用認(rèn)同的相關(guān)規(guī)律及其應(yīng)用研究”(項目編號:12YJC870022),國家社科基金項目“引用認(rèn)同和引證形象在引文分析中的應(yīng)用研究”(項目編號:13TQ039)的研究成果。