文庭孝 劉曉英 (湘潭大學 湖南湘潭 411105)
文獻計量學和引文分析法告訴我們:科學發(fā)展具有連續(xù)性和繼承性。科學研究人員總是在現(xiàn)有研究的基礎(chǔ)上進行創(chuàng)新,對研究現(xiàn)狀掌握越充分,越能表現(xiàn)其創(chuàng)新性和創(chuàng)新能力。而把握研究現(xiàn)狀最好的方式就是了解現(xiàn)有文獻和信息,對現(xiàn)有文獻和信息了解越充分,就越能站在學科發(fā)展的前沿上進行創(chuàng)新。所以牛頓說:“我之所以比別人看得遠一點,是因為我站在巨人的肩膀上”。因此,對文獻和信息的查尋與獲取能力也自然成為衡量和評價研究人員研究能力和創(chuàng)新能力的重要依據(jù)和指標。創(chuàng)新是相對于已有的研究成果而言的,為了體現(xiàn)其研究成果的創(chuàng)新性,研究人員在從事研究過程中會盡量查尋現(xiàn)有文獻和信息,在學術(shù)論文寫作過程中會盡量列出相關(guān)文獻。據(jù)此,我們可以認為:一般來說,信息獲取能力越強,參考文獻列舉就越充分。除非研究者認為無須列舉或有意省略,而這往往會帶來學術(shù)風險,如違反學術(shù)規(guī)范和學術(shù)道德。
按照文獻引用規(guī)范的要求,被引用文獻應當是全部相關(guān)文獻中質(zhì)量最好和相關(guān)度最高的,而且只要引用就必須列舉。這就意味著,文獻引用必須建立在對相關(guān)文獻實現(xiàn)充分獲取的基礎(chǔ)上。在信息查尋中存在一個“索普定律(M·E·Soper)”[1][2]:文獻引用與相關(guān)文獻和信息的可獲得性密切相關(guān)。用戶在利用信息時總是傾向于選擇距離較近、容易獲取的信息源。這一方面說明,用戶在信息獲取中存在求便心理和占有準則,另一方面也說明,用戶信息獲取量與其能力大小有關(guān)。這種求便心理是建立在用戶平常注意信息源獲取和積累的基礎(chǔ)上的,這也是一種信息獲取意識和能力。由此可以認為,利用引文數(shù)量特征及分布規(guī)律來初步判斷研究者的信息獲取能力是可行的。
從根本上講,科學文獻之間的相互引證由科學本身的發(fā)展規(guī)律和科學研究活動的規(guī)律所決定。文獻計量學、信息計量學和科學計量學認為:[3][4]研究人員的引證行為和引證動機受一定規(guī)律的支配。科學文獻的引證與被引證,是科學發(fā)展規(guī)律的表現(xiàn),體現(xiàn)了科學知識和情報內(nèi)容的積累性、連續(xù)性和繼承性,也體現(xiàn)了科學發(fā)展的統(tǒng)一性原則以及學科之間廣泛的交叉、滲透和綜合現(xiàn)象??茖W文獻作者在創(chuàng)作科學論文時,不可避免地要引證他人的文獻,汲取別人的經(jīng)驗和成果。因此,科學工作者的引證行為是科學活動普遍存在的現(xiàn)象,是科學交流不可缺少的部分??茖W文獻的作者一般不會在論文中無緣無故地引證與其論述主題完全無關(guān)的文章。文獻的相互引證有多方面的原因。溫斯托克(M·Weinstock)在進行系統(tǒng)歸納后指出,文獻被引證大概有15種原因。引證行為和引證動機為我們從事引文分析提供了理論依據(jù)。
標注引文(參考文獻)在學術(shù)研究中具有重要意義,它不僅是學術(shù)規(guī)范和學術(shù)道德的基本要求,而且也在推動科學技術(shù)進步和科研活動健康發(fā)展等方面具有至關(guān)重要的作用。具體來說,在學術(shù)論文寫作和發(fā)表過程中標注引文可以起到如下作用:[5][6][7]
(1)體現(xiàn)科學文化的繼承性和發(fā)展歷史;
(2)尊重和保護他人的著作權(quán);
(3)精練文字,縮短篇幅,避免重復;
(4)便于編輯和審稿人準確評價論著的學術(shù)價值和技術(shù)水平;
(5)提供情報信息線索,與讀者共享信息資源;
(6)通過引文分析對論文、作者、期刊、機構(gòu)等的學術(shù)影響力(應用總被引頻次、影響因子、即年指標、他引率等指標)做出客觀的評價;
(7)有助于建立科學公正的國家科學技術(shù)和社會科學評價平臺;
(8)促進科技信息、信息計量學和科學計量學研究,推動學科發(fā)展。
這就要求科研工作者在論文寫作和發(fā)表過程中實事求是地標注參考文獻,而科研工作者在論文寫作和發(fā)表過程中也會根據(jù)所獲取的信息和實際需要來列舉參考文獻。
引文分析原理告訴我們:“引證行為為何會發(fā)生”、“引證行為的測度指標、工具與方法”、“引證原理的主要應用”,但并未指出“引文量大小的決定因素”以及“引文量與信息獲取能力的關(guān)系”。
一般來說,科學文獻中引文量的大小取決于如下因素:
(1)與信息獲取能力有關(guān),信息獲取能力強則引文量相對來說要大;
(2)與學術(shù)規(guī)范和引用規(guī)范有關(guān),學術(shù)研究越規(guī)范和引用要求越規(guī)范的領(lǐng)域和地區(qū),引文量相對來說要大;
(3)與科學論文的類型有關(guān),綜述性和述評性論文引文量相對來說要大,一般論文引文量相對來說要小;
(4)與學科領(lǐng)域有關(guān),不同學科領(lǐng)域的論文的包含的引文量大小不同;
(5)與研究主題有關(guān),原創(chuàng)性和前沿性主題研究論文引文量相對來說要小,熱點和焦點研究主題論文引文量相對來說要大,普通主題研究論文引文量相對來說要更大。
據(jù)美國科學基金會統(tǒng)計,一個科研人員花費在查找和消化科技資料上的時間自占全部科研時間的51%,計劃思考占 8%,實驗研究占 32%,書面總結(jié)占 9%。[8][9]由此可見,科研機構(gòu)、企業(yè)或者科研人員花費在科技出版物上的時間為全部科研時間的60%左右。如果能夠提高信息獲取能力,就能縮短文獻查閱時間,提高科研效率,將有限的時間和精力用于創(chuàng)造性的研究中??梢?,一個科研工作者如果其信息獲取和吸收能力不強,要想提高科研效率,開展創(chuàng)造性研究是不可能的。
基于引文分析原理,我們可以建立以下假設(shè):
假設(shè)一:所有的學術(shù)論文都是在遵守學術(shù)規(guī)范的前提下完成的,研究者在完成學術(shù)論文的過程中盡可能多的列出相關(guān)參考文獻,以體現(xiàn)其論文的創(chuàng)新性。
假設(shè)二:研究者在完成學術(shù)論文的過程中,一般都會盡量把其能夠搜集到的相關(guān)文獻列在參考文獻中,以表明當前研究現(xiàn)狀、論證其學術(shù)觀點。
假設(shè)三:研究者在完成學術(shù)論文的過程中,在列舉參考文獻時,一般都會優(yōu)先列舉容易獲得的文獻、權(quán)威人士的文獻、高質(zhì)量的文獻、高級別的文獻來論證其觀點。
假設(shè)四:學術(shù)論文中沒有列舉參考文獻,一般可以認為,要么研究者信息獲取能力有限,無法獲取所需信息;要么學術(shù)論文中所包含的觀點為完全創(chuàng)新,不需要列舉參考文獻;要么學術(shù)論文中所述觀點為常識性知識,無須列舉參考文獻。
假設(shè)五:基于以上假設(shè),可以認為,學術(shù)論文中所包含的參考文獻數(shù)量的大小在一定程度上能反映研究者在完成學術(shù)論文的過程中獲取相關(guān)文獻信息的能力,也就是說學術(shù)論文中所包含的引文量與研究者信息獲取能力相關(guān)。
如果以上假設(shè)成立的話,那么我們可以得出如下推論:
推論一:不同學科的學術(shù)論文中參考文獻的平均數(shù)能反映各自學科領(lǐng)域研究人員信息獲取能力。一般來說,不同學科對研究者在論文寫作過程中需要列舉的參考文獻要求不同,要求越高,學術(shù)研究越規(guī)范,列舉的參考文獻就越多,對研究人員的信息獲取能力要求就越高。
推論二:不同級別的學術(shù)期刊中的論文中所包含的參考文獻數(shù)量不同 (如按影響因子區(qū)分的期刊類別),一般來看,高級別的學術(shù)期刊中的論文創(chuàng)新程度要高于普遍期刊中的論文,為了體現(xiàn)其創(chuàng)新性,高級別的學術(shù)期刊中的論文應包含更多的參考文獻。
推論三:不同學科、不同級別學術(shù)期刊的學術(shù)論文所包含的參考文獻中,中文和外文參考文獻的比例不同,反映了不同學科和不同學術(shù)期刊對研究者外文水平的要求和獲取外文信息能力的要求。
推論四:不同學科和不同期刊的學術(shù)論文所包含的參考文獻中,不同類型載體的參考文獻數(shù)量不同 (如圖書、期刊、報紙、學位論文、會議論文、專利等),反映了研究者獲取不同類型載體文獻信息的能力。
推論五:不同學科和不同期刊的學術(shù)論文所包含的參考文獻中,被引期刊的影響因子之和和平均影響因子,反映了該領(lǐng)域研究者獲取高質(zhì)量信息的能力。
為了證明以上假設(shè)和推論的合理性,本文選擇了圖書情報、經(jīng)濟管理、法學、數(shù)學、物理、化學、計算機科學等學科領(lǐng)域中11種具有代表性的中文權(quán)威學術(shù)期刊來進行數(shù)據(jù)調(diào)查,基本覆蓋了社會科學和自然科學的重要學科領(lǐng)域。由于每種學術(shù)期刊每期的載文量及論文中所包含的引文量大體相當,變化不大,相對穩(wěn)定,因此本文僅以每種中文學術(shù)期刊2011年第1期刊出的論文中所包含的參考文獻為調(diào)查統(tǒng)計樣本。實際調(diào)查表明,這種隨機樣本抽取方法抽出的樣本盡管數(shù)量不大,但具有代表性,能夠有效反映樣本整體情況,具有穩(wěn)定性和可檢驗性。進行嘗試性研究是可行和有效的,能夠推廣。這11種權(quán)威中文學術(shù)期刊及所屬學科如表1所示。
表1 11種中文樣本學術(shù)期刊及所屬學科
根據(jù)引文分析原理,本文重點選取了5個關(guān)鍵指標來重點統(tǒng)計分析中文學術(shù)期刊中引文數(shù)量及分布特征,據(jù)此來考察引文量及分布與信息獲取能力的關(guān)系。5個關(guān)鍵指標如下:
(1)載文量:即每種中文學術(shù)期刊每期發(fā)表的論文數(shù)。
(2)引文量:即參考文獻總量,包括每篇論文的引文量和每種學術(shù)期刊每期的引文量。
(3)篇均引文量:即每種學術(shù)期刊中每篇論文的平均參考文獻含有或占有量,等于每種學術(shù)期刊每期的引文量除以每種學術(shù)期刊每期的載文量。篇均引文量可以反映每種期刊的平均引文量和每個學科論文的平均引文量。篇均引文量反映的是論文、作者、期刊和學科的信息吸納能力。
(4)中英文參考文獻的比例:即每篇論文所含參考文獻中中英文參考文獻在引文量中所占的比例,可以推廣至期刊和學科中英文參考文獻在引文量中所占的比例。它反映的是論文、作者、期刊和學科吸納英文信息的能力。
(5)不同類型參考文獻比例:即每篇論文所含參考文獻中圖書、期刊論文、會議論文、專利文獻、研究報告、學位論文、網(wǎng)絡(luò)引文等文獻類型的比例。它反映的是論文、作者、期刊和學科吸納不同類型信息源的能力。
通過調(diào)查統(tǒng)計,2011年第1期9種權(quán)威中文學術(shù)期刊引文量及分布情況如表2所示。
表2 11種權(quán)威中文學術(shù)期刊5大關(guān)鍵指標特征值
在文獻計量學中,引用一般分為兩類:一是“引”,即直接引用(觀點、數(shù)據(jù)、結(jié)論等的直接引用,一般用引號標出,按照一定的格式標注,如括注、腳注和尾注,通常也稱為注釋);一是“用”,即間接引用(觀點引用,援引已有的知識成果,作為信息源而利用,一般不用引號標出,以尾注的方式標注,通常稱為參考文獻或引文)。
在我國,不同學科領(lǐng)域的學術(shù)期刊對參考文獻的標注要求和格式不統(tǒng)一,即使是在同一學科內(nèi)的不同學術(shù)期刊對參考文獻標注的要求和格式也不統(tǒng)一,學科和期刊差異較大,不利于有效開展信息計量學和科學計量學中的引文分析研究,有待規(guī)范。借鑒國際標準或建立我國統(tǒng)一的參考文獻標注格式和標準都是有效的舉措,需要學術(shù)界呼吁和有關(guān)部門重視。如國際通用1979年創(chuàng)建溫哥華格式,2006年2月采用最新版本。我國文后參考文獻標注格式采用GB/T 7714-2005。但很多學術(shù)期刊并未規(guī)范使用這些標準。
從11種權(quán)威中文學術(shù)期刊引文(覆蓋經(jīng)濟學、法學、管理科學、哲學、歷史、文學、社會學、數(shù)學、化學、物理學和計算機科學等11個學科)的調(diào)查數(shù)據(jù)整體上來看,我國學術(shù)期刊引文標注存在以下問題:一是 “引”(注釋)、“用”(參考文獻)不分或不完全區(qū)分。大多數(shù)學科領(lǐng)域的期刊都沒有區(qū)分“引”(注釋)和“用”(參考文獻),或者是將兩者混在一起。如《管理學學報》、《中國管理科學》、《數(shù)學學報》、《化學學報》、《物理學報》和《計算機學報》就沒有區(qū)分“引”(注釋)和“用”(參考文獻),而《法學研究》、《中國社會科學》則將兩者混在一起腳注。二是格式不統(tǒng)一。自然科學各學科領(lǐng)域的期刊在標注格式上基本一致,而在社會科學領(lǐng)域,基本上是一個學科、一種期刊一種標注格式。三是標注不完整。在所調(diào)查的9種權(quán)威中文學術(shù)期刊中,除《管理學學報》、《中國管理科學》和《計算機學報》有文獻類型標識外,其它學科領(lǐng)域的學術(shù)期刊都沒有。《經(jīng)濟研究》期刊論文中還沒有標注引文序號。
論文和期刊的平均引文量,是考察論文、期刊和作者吸收他人學術(shù)思想的水平。平均引文量通??梢苑从痴撐?、期刊和作者吸收信息的能力以及科學交流程度的高低。篇均引文量反映的是論文、作者、期刊和學科等的情報信息吸收能力。篇均引文量是與情報信息吸收能力和信息獲取能力密切相關(guān)的,雖然篇均引文量小可能不能說明作者信息獲取能力差,但篇均引文量大則能表明作者信息獲取能力強。在從事科學研究過程中,研究人員應盡量對所從事的研究領(lǐng)域或主題進行全面的了解,這必須建立在充分掌握本領(lǐng)域或主題相關(guān)信息的基礎(chǔ)上,沒有一定信息獲取能力是很難做到這一點的。
從所調(diào)查的9種權(quán)威中文學術(shù)期刊篇均引文量來看,盡管每種期刊的篇均引文量都高于全國各種學術(shù)期刊的平均水平,但與國外學術(shù)期刊的篇均引文量相比仍有較大差距。據(jù)2008年版《中國科技期刊引證報告(核心版)》,國內(nèi)1 765種科技期刊發(fā)表的論文的平均引文量為10.01條/篇;另據(jù)2008年版《中國期刊引證報告(擴刊版)》,國內(nèi)6082種期刊發(fā)表的論文的平均引文量為7.92條/篇。而國外期刊的科技論文的平均引文量超過30條/篇。[10]這一方面說明國外研究者注重相關(guān)研究領(lǐng)域信息的獲取,另一方面也說明國外研究者在科學研究過程中注重信息獲取能力的培養(yǎng)。從所調(diào)查的9種權(quán)威中文學術(shù)期刊的篇均引文量來看,高于30條/篇的只有《法學研究》和《中國社會科學》兩種,分別為42.89和60.6,如果去掉注釋的話,則篇均引文量只有37.33和51.13。雖然仍高于國外科技論文的平均引文量,但是與國外高質(zhì)量、高水平的學術(shù)期刊相比,則又存在較大的差距。[11]據(jù)統(tǒng)計,每篇外文論文的引文量平均比中文論文的引文量要多6篇,它反映了國內(nèi)外研究者在文獻利用上的差距。[12]綜述性論文的引文量則尤其如此,我國綜述性學術(shù)論文的引文量一般在15~100篇之間,個別論文引文量較小。而國外綜述性論文一般較長,參考文獻量也較大,大多在100篇以上,多則達幾百篇。
隨著科學技術(shù)發(fā)展的國際化,世界各國的研究人員之間的相互借鑒和交流十分頻繁。研究者在從事創(chuàng)造性科學研究活動過程中,會盡力了解國內(nèi)外某研究領(lǐng)域的發(fā)展狀況,站在學科研究和發(fā)展的前沿上,才能生產(chǎn)出具有創(chuàng)新性的研究成果。研究科學論文中引文語種的分布,正是測度作者獲取和利用國外文獻和信息能力及情報信息吸收能力的一項重要指標。因此,查尋和獲取外文資料和信息的能力在科學研究活動過程中意義重大。
引文是由不同語種的文獻構(gòu)成的。中外文引文比例的大小反映的是研究獲取和吸取外文信息的能力。某一種語種的引文量越大,說明該語種比較重要和常用。對我國《大氣科學》、《金屬熱處理》等10種自然科學領(lǐng)域的學術(shù)期刊 1979年的引文統(tǒng)計表明:[13][14]中文引文量占全部引文總量的27%,英文引文量占58%。這說明在當時的情況下,只要掌握英文,再加上中文,就足以查閱所需文獻和信息的85%。 而對《數(shù)學學報》的引文統(tǒng)計分析表明:[15][16]引文語種只有四種,中文、英文、俄文和德文。其中英文占73.99%,中文占23.88%,約為英文的三分之一,俄文和德文數(shù)量極少,只占2.14%。在數(shù)學領(lǐng)域,我國科研工作者只要掌握英文,就可獲得97.86%的信息量。兩種調(diào)查的結(jié)果都表明英文引文所占的比例都特別高,這一方面說明國際上以英文發(fā)表可供查閱的相關(guān)學科文獻和信息數(shù)量多,另一方面說明我國研究人員多數(shù)是以英語為工具檢索國外資料的。
從本次調(diào)查的結(jié)果來看,11種權(quán)威中文學術(shù)期刊論文所包含的引文中,中英文引文所占的比例分別為:《中國圖書館學報》中文引文量占71.54%,英文28.46%;《情報學報》中文引文量占46.08%,英文占53.92%;《經(jīng)濟研究》中文引文量占39.23%,英文占60.77%;《法學研究》中文引文量占71.51%,英文占28.49%;《管理學學報》中文引文量占32.9%,英文占67.1%;《中國管理科學》中文引文量占39.69%,英文占60.31%;《中國社會科學》中文引文量占68%,英文占32%;《數(shù)學學報》中文引文量占6.22%,英文占93.78%;《化學學報》中文引文量占21.37%,英文占78.63%;《物理學報》中文引文量占33.87%,英文占66.13%;《計算機學報》中文引文量占6.99%,英文占93.01%。其它語種的引文極少,幾乎沒有。調(diào)查結(jié)果表明,除《中國圖書館學報》和《中國社會科學》兩種權(quán)威中文學術(shù)期刊中文引文量的比例大于英文之外,其它期刊9種學術(shù)期刊的英文引文比例都高于中文,自然科學中文學術(shù)期刊英文引文所占比例大于社會科學學術(shù)期刊。在社會科學領(lǐng)域,人文社會科學如哲學、歷史、法學、文學等中文引文所占比例大于英文,而經(jīng)濟學、管理科學和情報學等英文引文所占比例要稍高于中文?!稊?shù)學學報》和《計算機學報》英文引文所占比例最高,特別是《數(shù)學學報》,較之前的引文統(tǒng)計調(diào)查,英文引文所占比例大大提高了,從73.66%上升到93.78%,提高了近20個百分點。調(diào)查中還發(fā)現(xiàn),一些學術(shù)期刊在投稿須知中還明確規(guī)定了英文引文所占的比例不得低于三分之一或一半,如經(jīng)濟學和管理學學術(shù)期刊。如此看來,我國部分學術(shù)期刊在引文語種的分布上具有傾向性和導向性??傮w來看,英語已成為我國科研工作者獲取國外資料和信息的主要語種。
研究引文的文獻類型分布,可以了解本學科論著的文獻信息來源及其構(gòu)成比例,從而確定各類文獻載體的情報價值以及研究者獲取不同類型文獻信息的能力。引文統(tǒng)計調(diào)查表明:[17][18]在所有被引文獻中,期刊論文所占比例最大,其次是圖書,特種文獻中的專利說明書、科技報告、會議文獻、技術(shù)標準、產(chǎn)品樣本、學位論文等的被引率有上升的趨勢。
從這次調(diào)查的結(jié)果來看,9種中文學術(shù)期刊論文所包含的引文中,除《中國社會科學》圖書所占比例最高外,其它學術(shù)期刊引文中期刊論文所占比例都遠遠高于其它文獻類型??梢?,人文社會科學領(lǐng)域的研究者更多地傾向于引用圖書,尤其是經(jīng)典著作,如哲學、歷史、文學。本次調(diào)查還有一些新的發(fā)現(xiàn):一是期刊論文所占的比例在逐漸上升;二是計算機科學領(lǐng)域的研究者們更多的引用會議論文;三是網(wǎng)絡(luò)引文開始作為一種重要的信息來源逐漸增加,圖書情報和計算機科學領(lǐng)域的研究者關(guān)注最多,而經(jīng)濟、管理和哲學、歷史、文學等領(lǐng)域則極少使用網(wǎng)絡(luò)引文,法學領(lǐng)域使用網(wǎng)絡(luò)引文主要是做案例分析;四是報紙和各類報告受到經(jīng)濟、管理和法學領(lǐng)域研究者們的青睞;五是大量具有重要情報價值的信息源被我國科研工作忽略,如學會論文、專利等。這一方面可以說明我國研究者獲取信息的渠道狹窄,需要拓展,另一方面也證明我國科研工作者在獲取和利用不同類型信息方面的能力有待提高。
[1]文庭孝等.信息咨詢與決策[M].北京:科學出版社,2008:169.
[2][5][13][15]羅式勝.文獻計量學概論[M].廣州:中山大學出版社,1994:183-184,116-117,134-139.
[3][6][12][14][16][17]邱均平.信息計量學[M].武漢:武漢大學出版社,2007:317-318,370-371,424.
[4][7][18]王佃啟.人文社會科學學術(shù)論文寫作規(guī)范及幾個相關(guān)問題[EB/OL].[2011-04-28].http://yjsy.ncepu.e du.cn/fjdownload.jsp?action=gzzd&&filename...ppt.
[5][8][11]Maness J M.Academic librariessave researchers time and money[J].Library Connect Newsletter,2009,(2):12-16.
[9]楊紅兵.免費開放科技文獻資源是公益性回歸[EB/OL].[2011-04-28]http://www.scichi.com/new/duzhe/Article/219.html.2010-04-09.
[10]翟鳳岐,張芝蘭.我國圖書館學情報學期刊引文調(diào)查與分析[J].中國圖書館學報,1992,(1):35-46,95,98.