□李 瓊 王德平 徐霖杰
學(xué)科的文獻老化是任何一個學(xué)科在發(fā)展過程中普遍存在的問題,也是信息計量學(xué)和科學(xué)計量學(xué)的一個重要研究課題。早在1944年,美國紐約大學(xué)的戈斯內(nèi)爾(Gosnell)博士就對文獻的老化問題進行過研究[1]。1958年著名科學(xué)家貝爾納(Bernal)借用了放射化學(xué)術(shù)語“半衰期”來說明科技文獻的老化速度。后來伯頓(Burton)和開普勒(Kebler)將“中值引文年限”定義為文獻的半衰期[2]。1971年普賴斯(Price)提出了“普賴斯指數(shù)”,用來測度文獻老化的快慢。隨之,出現(xiàn)了許多應(yīng)用老化指標(biāo)來測度文獻生命衰退周期的研究。國內(nèi)文獻老化研究最早涉及自然科學(xué)領(lǐng)域,隨后人文社科領(lǐng)域也開始出現(xiàn)研究成果,而且近些年研究速度在加快。如2011年邱均平等以CSSCI 收錄的2006—2008年的所有人文社會科學(xué)引文數(shù)據(jù)為樣本,計量了各學(xué)科的半衰期、普賴斯指數(shù)、最大引文年限等文獻老化指標(biāo)[3]。接著,又有許多學(xué)者對人文社科領(lǐng)域的各子學(xué)科——社會學(xué)[4]、民族學(xué)與文化學(xué)[5]、宗教學(xué)[6]、歷史學(xué)[7]、語言文字學(xué)[8]、管理學(xué)[9]等的老化規(guī)律進行了更加深入地分析和探討。西夏學(xué)是中華民族傳統(tǒng)文化的重要組成部分[10],對中國文化的傳承具有重要的價值,已成長為一門具有國際性質(zhì)的學(xué)科。經(jīng)過對西夏學(xué)文獻的梳理發(fā)現(xiàn),國內(nèi)對該學(xué)科主要以質(zhì)性研究為主,量化研究不足[11]。本文以西夏學(xué)文獻為研究樣本,探析其在網(wǎng)絡(luò)傳播環(huán)境下的老化現(xiàn)象,以揭示該學(xué)科文獻老化的數(shù)量特征,尋求更準(zhǔn)確的數(shù)學(xué)解釋,為西夏學(xué)文獻的開發(fā)利用和科學(xué)評價提供依據(jù),并為促進科學(xué)研究和信息交流,改善科技管理和制定科技政策服務(wù)提供積極的借鑒作用。
本研究以知網(wǎng)(CNKI)學(xué)術(shù)期刊數(shù)據(jù)庫為文獻來源,發(fā)表時間限定為2014—2016年,在高級檢索項中設(shè)置檢索主題分別為西夏、黨項、黑水城、黑城、唐古特、唐兀。另外,由于西夏學(xué)科研力量薄弱,造成其研究成果不充裕,為了擴大研究樣本來源,我們從知網(wǎng)(CNKI)的國內(nèi)外重要會議論文全文數(shù)據(jù)庫中選取了《西夏學(xué)》,盡管從嚴格意義上講它并不屬于期刊,但是它對西夏學(xué)研究人員具有重要的參考價值,因此也將其納入研究范圍,收集其2014—2016年的題錄數(shù)據(jù)。我們首先從收集到的題錄數(shù)據(jù)中刪除了非學(xué)術(shù)類文獻、重復(fù)發(fā)表文獻,之后對涉及“黑水城”、“黑城”主題的文獻,從中剔除了研究元代文書的文獻。按照史金波先生對西夏學(xué)的定義,它是“利用過去的歷史資料、近代出土的西夏文和其他文字文獻以及文物資料,研究西夏歷史、社會和文化的學(xué)科。除西夏時期外,還上及西夏建國前主體民族黨項族的歷史,下至西夏滅亡后西夏后裔的歷史”[12],對所得題錄數(shù)據(jù)再次進行篩選,并請寧夏大學(xué)西夏研究院高仁博士進行甄別,最終獲得715篇題錄數(shù)據(jù)。之后,收集這715篇題錄的引文,剔除了少量查詢不到出版年代和超過統(tǒng)計年的數(shù)據(jù)(如出版年寫著“待刊發(fā)”)。最終,我們共獲得10753條引文數(shù)據(jù)。
我們采用共時半衰期、普賴斯指數(shù)和最大引文年限來評價學(xué)科文獻的老化趨勢。共時半衰期的計算方法[7]:假設(shè)半衰期的整數(shù)部分為x年,a=x+1,b=x。則a引文≥50%,b引文≤50%(a引文、b引文為第a、b年的引文累積百分比),半衰期H=x+(0.5-b引文)/(a引文-b引文)。普賴斯指數(shù)的計算方法[13]:Pr=(出版年限不超過5年的被引文獻數(shù)量/被引文獻總量)×100%。半衰期和普賴斯指數(shù)是既有聯(lián)系又有區(qū)別的兩個衡量科學(xué)文獻老化的定量指標(biāo)。一般地,某一學(xué)科或領(lǐng)域文獻的普賴斯指數(shù)越大,半衰期就越短,說明文獻的老化速度就越快。最大引文年限指引文峰值出現(xiàn)的時間,對于數(shù)據(jù)統(tǒng)計年來說,在所有引文中哪一年出版的在該年被引用得最多,它距統(tǒng)計年的出版年限就是最大引文年限[3]。
貝爾納早在1958年提出負指數(shù)老化模型,是利用共時數(shù)據(jù)得到的。該模型一般采用負指數(shù)函數(shù)形式[3]:C(t)=Ke-at。式中:C(t)為t年前發(fā)表的文獻的被引用頻次;K為常數(shù),隨不同學(xué)科而異;e為自然對數(shù)的底;t為文獻的出版年齡;a為文獻的老化率。如果以文獻的出版年齡為橫軸,現(xiàn)時正在使用的文獻數(shù)量為縱軸,可繪制出一條負指數(shù)曲線,即為文獻的老化曲線。它可以直觀地表達文獻的老化過程,反映了文獻利用率的衰減現(xiàn)象。對引文數(shù)據(jù)老化規(guī)律研究采用引文分析共時法和回歸分析法。采用Excel2011進行老化指標(biāo)計算,采用Origin8.5軟件制圖、建立文獻老化模型。
2014—2016年分別獲得西夏學(xué)來源文獻239、209、267 篇,對應(yīng)的引文量分別為3663、3079、4011條,計算各年被引文獻的出版年距統(tǒng)計年的時間差(引文年齡),繪制引文年齡與引文頻次的分布圖,時間段限制在100年,結(jié)果見圖1。文獻引文分布可以有力地反映文獻的老化規(guī)律,普萊斯研究發(fā)現(xiàn),一個學(xué)科的引文分布曲線與其老化曲線極為相似[3]。由圖1可見,西夏學(xué)引文年代分布呈震蕩衰減模式,并不嚴格遵循負指數(shù)曲線的形式,但這并不影響用負指數(shù)曲線描繪西夏學(xué)學(xué)科文獻的整體衰減狀態(tài)。
2014—2016年西夏學(xué)文獻引文峰值分別為142、128、164次。2015年引文峰值較2014年下降8.54%,2016年較2015年增長28.13%;2015年引文總量較2014年下降15.94%,2016年較2015年增長30.27%。分析可知,2015年引文峰值與引文總量呈現(xiàn)負增長,這可能與2015年來源文獻較2014年出現(xiàn)下降有關(guān),來源文獻越少,引文總量就越少,引文峰值也隨之降低。相較于2015年,2016年的引文峰值和引文總量快速爆發(fā);2016年相較于2014年,引文峰值和引文總量分別增加了15.49%,9.50%??傮w而言,西夏學(xué)來源文獻有所增加,其引文總量、引文峰值也在增長,2016年引文的強度與文獻之間聯(lián)系的緊密度比前兩年都大,且引文更加依賴于過去的文獻。
1.總體概況。考察西夏學(xué)各年文獻老化指標(biāo)及其差值的變化(表1),結(jié)果發(fā)現(xiàn)2014—2015年和2015—2016年引文半衰期差值均為正值(0.33、0.27),表明引文半衰期呈逐年增長的態(tài)勢;而普賴斯指數(shù)各年差值均為負值(-0.002766621、-0.007332143),表明普賴斯指數(shù)逐年減??;觀察最大引文年限,發(fā)現(xiàn)2014年最低、為4年,2015年最高、為10年,2016年有所降低??茖W(xué)文獻老化的根本原因是科學(xué)知識的不斷增長和更新。隨著人類社會的延續(xù),科學(xué)知識的增長過程由知識“疊加”和“更新”兩個方面組成。由于知識更新的不斷發(fā)生,必然造成科學(xué)文獻的新陳代謝。對于科學(xué)文獻的老化研究,實質(zhì)是對科學(xué)知識修正速度的探索,而文獻老化指標(biāo)反映了科學(xué)知識的修正速率[13]。總體而言,文獻半衰期、普賴斯指數(shù)變化不大,最大引文年限稍有波動,說明西夏學(xué)學(xué)科領(lǐng)域文獻的科學(xué)價值較高,因此文獻的利用壽命較為穩(wěn)定。從年際動態(tài)變化看,2014—2016年西夏學(xué)文獻半衰期不斷增大,普賴斯指數(shù)不斷減小,說明文獻老化速率有放緩趨勢。從文獻的增長率方面看,該學(xué)科領(lǐng)域并沒有出現(xiàn)指數(shù)級增長,再加上文獻的半衰期較長,平均為16.71年,綜合判斷西夏學(xué)的研究階段處在知識的積累期,學(xué)科仍在成長中。
表1 2014—2016年西夏學(xué)學(xué)科老化指標(biāo)值及其比較
2.半衰期分析。邱均平研究發(fā)現(xiàn),哲學(xué)、文學(xué)、歷史學(xué)等人文科學(xué)的半衰期比經(jīng)濟學(xué)、法學(xué)、教育學(xué)、管理學(xué)等社會科學(xué)長很多,尤其是歷史學(xué),它的半衰期在17年以上,是社會科學(xué)的3倍長[3],印證了人文學(xué)科文獻半衰期長于社會科學(xué)的規(guī)律。我們發(fā)現(xiàn)西夏學(xué)學(xué)科知識積累方式與人文學(xué)科的歷史學(xué)、民族學(xué)、宗教學(xué)、藝術(shù)學(xué)學(xué)科相似[13]。張迪等對2010—2012年民族學(xué)與文化學(xué)學(xué)科的半衰期進行了分析,發(fā)現(xiàn)在9年左右[5];吳偉成計算2009—2012年宗教學(xué)學(xué)科的半衰期,其值在10年左右[6];張磊計算得到2008—2012年歷史學(xué)學(xué)科的引文半衰期為11.02—12.89年[7]。如排除統(tǒng)計年的差異,西夏學(xué)的引文半衰期與人文學(xué)科中的歷史學(xué)最為近似。本研究中,西夏學(xué)文獻的半衰期在16年以上,且每年以0.3的速度遞增,說明該學(xué)科信息老化速度很慢,而且老化速度還在不斷減緩,推測2017年西夏學(xué)文獻的半衰期為17.3、2018年為17.6。有研究表明,網(wǎng)絡(luò)傳播環(huán)境為舊文獻的利用提供了便利,使其煥發(fā)了新的生命力,并直接導(dǎo)致了文獻整體老化速度的降低。[14]西夏學(xué)文獻老化速度的不斷降低與網(wǎng)絡(luò)傳播環(huán)境密切相關(guān),文獻利用的“長尾效應(yīng)”日益顯現(xiàn)。
3.普賴斯指數(shù)分析。普賴斯將出版年限小于5年的文獻稱為“現(xiàn)實有用”文獻,將出版年超過5年的稱為“檔案性”文獻。邱均平計算了2006—2008年人文社科各學(xué)科的普賴斯指數(shù),發(fā)現(xiàn)歷史學(xué)學(xué)科對檔案性文獻的依賴最強(Pr=0.1364~0.1545),其次是哲學(xué)(Pr=0.2133~0.2197),依賴性最弱的是管理學(xué)(Pr=0.4632~0.4985)和經(jīng)濟學(xué)(Pr=0.4648~0.4861)。而在本研究中,與其他研究相比,西夏學(xué)普賴斯指數(shù)非常低,僅為0.0716,說明西夏學(xué)對檔案性文獻的依賴比歷史學(xué)學(xué)科要強很多。我們統(tǒng)計數(shù)據(jù)時發(fā)現(xiàn),西夏學(xué)引用最早的文獻的出版年距統(tǒng)計年已有七八百年的歷史,而且引用的文獻多為傳統(tǒng)媒介的圖書、專著,數(shù)字資源明顯偏少。
4.最大引文年限分析。普賴斯早在1965年提出:當(dāng)年發(fā)表的文章被引用的峰值是該文章發(fā)表后的第二年。隨后,相關(guān)學(xué)者深入發(fā)展了該理論,對最大引文年限進行了更廣泛和多樣化的研究,多數(shù)研究認為文獻被引用的峰值大約在其發(fā)表后的2—4年[3]。與之相比,本研究中西夏學(xué)2014—2016年最大引文年限平均值為7.67,其值存在波動,2014年最小,為4年,2015年躍到10,總體上呈上升趨勢,也就是說該領(lǐng)域當(dāng)年文獻發(fā)表后至少在4年以后才能達到被引的高峰。這表明在學(xué)科發(fā)展的不同階段文獻的最大引文年限不同,建議調(diào)整西夏學(xué)期刊“影響因子”的測度方法,以8年作為測度年限。對于圖書管理人員以及情報工作人員,對于西夏學(xué)文獻可以考慮以8年甚至更長時間為年限來優(yōu)化館藏、更新資源、提高文獻情報服務(wù)效率。
5.老化指標(biāo)間的關(guān)系分析。有研究表明,引文半衰期(H)與普賴斯指數(shù)(Pr)之間成反比關(guān)系,二者存在簡單的數(shù)量關(guān)系:Pr(H)×H=C,C為常數(shù)。邱均平選取引文年限H=5,發(fā)現(xiàn)人文社會科學(xué)各個學(xué)科的C常數(shù)在2.6左右波動[3]。本研究中,西夏學(xué)引文半衰期與普賴斯指數(shù)之間的關(guān)系如下:2014年P(guān)r(4)×H=16.40×0.076167076=1.25,2015年P(guān)r(10)×H=16.73×0.073400455=1.23,2016年P(guān)r(9)×H=17.00×0.066068312=1.12??梢姡飨膶W(xué)C常數(shù)在1.2左右波動,這與其他人文社會學(xué)科的研究結(jié)果有所不同。
一般來說,學(xué)科在誕生和發(fā)展的初期,由于原始文獻較少,文獻數(shù)量會呈指數(shù)增長,文獻的老化符合負指數(shù)函數(shù)關(guān)系。但是我們研究發(fā)現(xiàn),對于誕生時間還不算長的西夏學(xué)來說并不符合這一規(guī)律,文獻的發(fā)表數(shù)量并沒有呈現(xiàn)指數(shù)級增長,甚至在2015年出現(xiàn)倒退,但是文獻的老化規(guī)律仍然遵循了負指數(shù)分布形式。表2 中,2014—2015年各年份西夏學(xué)引文時間分布回歸方程的R2在0.7左右,P值都小于0.001,說明方程有效,擬合效果較好。從圖1中可以看出,西夏學(xué)引文分布的時間曲線震蕩明顯,總是在經(jīng)歷了一兩個被引的小高峰后達到最大被引年限,之后還會有七八個比較大的被引高峰,引文才慢慢被研究者遺忘,真正到達生命的衰退期。
“西夏學(xué)是借助西夏文物考古而發(fā)展起來的,沒有新文物、文獻的發(fā)現(xiàn)就沒有西夏學(xué)的今天。”[10]西夏學(xué)學(xué)科建立在發(fā)現(xiàn)黑水城等出土文獻的基礎(chǔ)上,這些文獻也是該學(xué)科研究的主要內(nèi)容。為了更廣泛地傳播考古文物、文獻,傳承人類精神和物質(zhì)文明,它們中的許多會被翻拍、影印,以傳統(tǒng)書籍或是電子資源的形式出版,由于這些文物本身就具有保護和收藏的價值,使得由它們制成的文獻天然就具有“檔案文獻”的性質(zhì),所以在西夏學(xué)研究中檔案性文獻的占比之高在其他學(xué)科領(lǐng)域都是很少見的。這類檔案性文獻具有很高的引用價值,會在很長的一段時間內(nèi)被反復(fù)引用。通過對西夏學(xué)文獻第一作者的統(tǒng)計發(fā)現(xiàn)[11],2011—2016年國內(nèi)僅有585 位,學(xué)科團隊總體人數(shù)不多,而且多為瞬時性作者,固定作者較少。在這之前,西夏學(xué)學(xué)科的科研力量更為薄弱。因此,該學(xué)科的學(xué)術(shù)史很可能就是某幾個學(xué)者、專家的成長史,他們在各個研究階段和領(lǐng)域成為了代表人物,而個人的科研產(chǎn)出能力有限,產(chǎn)出的科研成果也就成為了經(jīng)典文獻。再者,因為研究人員少,多個人研究同一個問題或者文獻的情況就比較少,學(xué)術(shù)爭鳴少,等再次受到關(guān)注被引用時,可能就過去很久。更有甚者,西夏語文學(xué)研究主要集中在20世紀(jì)六七十年代,現(xiàn)在再有人研究,這些文獻的壽命也都有四五十年之久。這些因素共同導(dǎo)致了該學(xué)科引文的波動性和反復(fù)性,以及引文的不穩(wěn)定和不平衡。因此,西夏學(xué)文獻從誕生到被引的高峰,再到衰落會經(jīng)歷很長的周期,而且中間會不斷出現(xiàn)再次興起的跡象,比如年齡在30、40年,甚至60、80年的文獻還能出現(xiàn)被引的小高峰。
表2 2014—2016年西夏學(xué)文獻引文負指數(shù)老化模型
(1)西夏學(xué)學(xué)科仍處在新生階段,以知識的“疊加”為主,知識“更新”較少。就文獻老化指標(biāo)而言,表現(xiàn)為半衰期很長(16.71),普萊斯指數(shù)則很?。?.0716),最大引文年限存在波動(4—10),學(xué)科對檔案性文獻的依賴很強。
(2)西夏學(xué)的文獻老化規(guī)律基本符合負指數(shù)函數(shù)曲線,呈現(xiàn)震蕩衰老模式。其引文的波動性和反復(fù)性很強,造成引文的不穩(wěn)定和不平衡。
(3)西夏學(xué)引文半衰期與普賴斯指數(shù)之間存在簡單的函數(shù)關(guān)系,即普賴斯指數(shù)×半衰期=常數(shù),這個常數(shù)在1.2左右波動,不同于人文社會科學(xué)其他學(xué)科。
(4)西夏學(xué)學(xué)科半衰期以每年0.3的速度遞進,推測2017年西夏學(xué)文獻的半衰期為17.3、2018年為17.6。就西夏學(xué)最大引文年限而言,該領(lǐng)域當(dāng)年文獻發(fā)表后至少在4年以后才能達到被引的高峰,平均為7.67年,建議調(diào)整西夏學(xué)期刊“影響因子”的測度方法,以8年作為測度年限,圖情人員也可以依此展開文獻服務(wù)工作。
我們的研究歷經(jīng)了兩年,僅在基礎(chǔ)數(shù)據(jù)的收集和整理上就花費了至少一年半的時間,該領(lǐng)域文獻并不遵循統(tǒng)一的寫作規(guī)范,對于參考文獻的著錄有些采取的是腳注的形式,有些則鮮明地列在文后。因此,在引文數(shù)據(jù)的收集上,尤其是對于采取腳注形式著錄的參考文獻我們需要仔細甄別。依據(jù)《中華人民共和國新聞出版行業(yè)標(biāo)準(zhǔn):學(xué)術(shù)出版規(guī)范注釋》(CY/T 121—2015),按功能將注釋分為兩種:出處注和內(nèi)容注。出處注指正文中引用資料來源的注釋,內(nèi)容注指對正文中相關(guān)內(nèi)容進行解釋、校訂、補充和擴展的注釋。我們將出處注中的文獻作為參考文獻加以采集。另外,還有許多研究者并沒有遵守參考文獻的著錄規(guī)則,如許多歷史專著缺少出版年,我們通過超星的“讀秀學(xué)術(shù)搜索”和“豆瓣”進行搜索,選取在學(xué)界評價良好、校刻精良(出版社為中華書局、上海古籍出版社等)、版本最新的出版年進行著錄,這可能造成研究所得引文半衰期比實際值偏小,而普萊斯指數(shù)比實際值偏大。對于古籍的處理更難把握,如一些古籍中的卷號相當(dāng)于現(xiàn)代書籍中的章節(jié),對于此類參考文獻在同一篇論文中多次出現(xiàn)時我們只著錄一次;對于大部頭的叢書和古籍,因為其每冊(本)出版的時間都可能不同,我們對每冊(本)的出版信息都加以采集;屬于多人作品集合的專著,我們按匯編對待,即每個單篇作品都進行錄入。在對古籍的著錄中還有許多有待商榷的地方。
我們對網(wǎng)絡(luò)傳播環(huán)境下西夏學(xué)文獻老化規(guī)律的研究印證了史金波先生對西夏學(xué)的介紹:“西夏學(xué)是一門新興的學(xué)科。對西夏的研究雖然可以追溯到很早,但它作為一門真正的學(xué)科,其形成、發(fā)展只有大約百年的歷史?!保?4]在西夏學(xué)學(xué)科發(fā)展的初期,文獻老化速度較慢,并存在放緩的趨勢,建議在學(xué)科的發(fā)展和建設(shè)上,社會仍需給以重要和廣泛的支持,吸引更多的研究人員投身其中,進行多學(xué)科、多角度、多層次的研究,拓寬研究領(lǐng)域,不斷吸收其他學(xué)科知識,使其不僅在基礎(chǔ)理論研究上有所突破,而且在人文社會和自然科學(xué)的應(yīng)用研究上加快步伐,提高研究成果的利用速度和效率。在文獻的傳播利用上,建議加快數(shù)字資源平臺的建設(shè),尤其是西夏學(xué)文物、古籍善本、圖書資源的開發(fā)與整合,提高資源使用的便捷性和可獲得性。該學(xué)科的學(xué)術(shù)規(guī)范也需進一步提高,一是引文應(yīng)遵循統(tǒng)一的著錄格式,二是引文和注釋應(yīng)加以區(qū)分,以促進其在移動互聯(lián)網(wǎng)時代信息計量學(xué)的深入發(fā)展。
(致謝:感謝寧夏大學(xué)農(nóng)學(xué)院楊君瓏博士在數(shù)據(jù)處理方面給予的幫助,感謝寧夏大學(xué)阿拉伯學(xué)院本科生黃恩貴、黨璞在數(shù)據(jù)收集上給予的幫助?。?/p>