劉小琳
(重慶圖書館,重慶 400037)
民國時期的巴渝文獻是指1912—1949年間與巴渝歷史文化有直接關系,內(nèi)容涉及重慶的若干完整章節(jié)、民國時期巴渝籍人士(包括在重慶出生的外籍人士)的著作和寄居在巴渝的人士所撰寫的其他代表性著作和期刊所載單篇文獻。20世紀90年代,隨著民國文獻保護計劃的開展,全國各地政府依靠本地圖書館及相關文獻收藏單位,充分利用館藏優(yōu)勢資源,搜集、整理文獻,條件優(yōu)越的單位甚至對文獻進行數(shù)字化加工,形成具有地方特色或者時代特色的民國文獻數(shù)據(jù)庫。對民國時期巴渝文獻分布規(guī)律進行探索,有利于推動對巴渝文獻的高效整理與精準開發(fā)。上海師范大學的段曉林[1]“運用累積80%法,通過對2000年以來影印版民國文獻出版情況的實際數(shù)據(jù)分析,測定出8家核心出版社,進一步分析各核心出版社在出版內(nèi)容上的特色和重點,總結(jié)民國文獻出版的共同特點及存在的問題,為圖書館采購影印版民國文獻以及出版社對民國文獻的進一步整理出版提供依據(jù)?!北疚倪\用洛特卡定律探尋民國時期巴渝文獻在作者、出版和期刊中的分布規(guī)律,以達到有效開發(fā)的目的。
洛特卡定律(Lotka’s Law)是文獻計量工作的定律之一,是時任美國紐約都市人壽保險公司統(tǒng)計處的洛特卡(Alfred J.Lotka,1880—1949)首次研究并揭示的科技文獻數(shù)量與著者數(shù)量之間的關系[2]。為了考察研究科學生產(chǎn)率按作者分布的情況,洛特卡在化學學科領域選定《化學文摘》和1907—1916年累積索引,統(tǒng)計第一作者,在物理學科領域,選定《物理學史一覽表》的人名索引,即1900年以來有突出貢獻的 1 325 名物理學家。洛特卡使用物理和化學兩學科科學生產(chǎn)率的數(shù)據(jù),以橫軸表示發(fā)表的論文數(shù)量,以縱軸表示論文作者數(shù)量的百分數(shù),采用對數(shù)直接在坐標上描點連線,得到斜率為-2的一條直線,總結(jié)出數(shù)學表達式:fx=C/x2,其中,fx表示發(fā)表x篇論文的作者占有被統(tǒng)計的該學科科學工作者總數(shù)的百分比,x表示科學工作者發(fā)表的論文數(shù)量,C為常數(shù),即為發(fā)表一篇論文的科學工作者占有該學科科學工作者總數(shù)的百分比。后經(jīng)推演,C=6/π2≈0.6,文字表述為,寫2篇論文的作者數(shù)量約為寫1篇論文作者數(shù)量的1/4,寫3篇論文的作者數(shù)量約為寫1篇論文作者數(shù)量的1/9,而寫1篇論文的作者數(shù)量約占作者總數(shù)的60%,產(chǎn)出N篇論文的作者人數(shù)大約是產(chǎn)出一份論文作者總數(shù)的1/N*N。因此,有人將洛特卡定律稱為平方反比律,洛特定卡本人將此成果稱為科學生產(chǎn)率的頻次分布規(guī)律。
洛特卡定律在人類歷史上第一次提出了不同著述水平的科學工作者的頻率平方反比率,揭示科學生產(chǎn)率與其種類分布之間的關系。該定律最開始應用于物理、化學、醫(yī)學等自然科學領域,直到20世紀80年代末,美國伊利諾斯大學圖書館學院、美國國會圖書館在圖書館學領域展開大規(guī)模地統(tǒng)計分析,對洛特卡定律進行經(jīng)驗性檢驗,隨后幾十年時間里,洛特卡定律在圖書館學、情報學、文獻學、圖象圖形學[3]等領域得到廣泛應用。
《巴渝文庫總目》是《巴渝文庫》(2012年重慶市社會科學規(guī)劃重大項目)前期出版項目之一,共分為古代卷單篇文獻目錄、古代卷著作文獻目錄、民國卷單篇文獻目錄、民國卷著作文獻目錄。本文研究所需要的數(shù)據(jù)來源于《巴渝文庫總目》的民國卷部分。該目錄在重慶圖書館工作人員的努力下,于2016年順利出版。筆者將2012—2016年來對文獻梳理結(jié)果在Excel表格中形成元數(shù)據(jù),文獻總數(shù)為 30 247 種,其中,散見于期刊的單篇文獻 25 208 種(刊載期刊種數(shù) 2 090 種)和著作文獻 5 039 種。筆者利用Excel表格的數(shù)據(jù)透視功能,僅對民國時期巴渝著作文獻的出版時間、作者、出版機構(gòu)進行統(tǒng)計分析,揭示民國時期巴渝文獻的分布規(guī)律。
選取該項成果作為分析數(shù)據(jù)來源的原因是多方面的:一是民國時期的巴渝文獻往往最能詳細地記錄巴渝地方的著述概況??箲?zhàn)時期,以重慶為核心的抗戰(zhàn)大后方戰(zhàn)略地位形成,重慶取代了昔日上海、武漢的出版中心地位,拉動了整個巴渝地區(qū)出版業(yè)的發(fā)展,推動著巴渝地區(qū)出版業(yè)達到高潮;二是民國時期,重慶地區(qū)行政區(qū)劃變化不大,相對固定,直到抗戰(zhàn)全面爆發(fā)后,重慶由四川省政府直轄的乙種市,改為行政院直轄,重慶市的管轄范圍由6區(qū)增加為12區(qū)[4],行政區(qū)劃的擴大,更有助于巴渝文獻的產(chǎn)出;三是由于民國時期印刷條件落后,許多文獻以油印的形式出版,復本數(shù)量有限不易流傳,紙張脆弱不易保存,尤其是日軍對重慶的轟炸,許多珍貴文獻毀于戰(zhàn)火,不傳于世,故千方百計地搜羅流傳于世的巴渝文獻作為研究數(shù)據(jù)源,較有代表性。
在 30 247 種數(shù)據(jù)中,民國時期巴渝期刊文獻 25 208 種,巴渝著作文獻 5 039 種。文章以出版時間明確的著作文獻 26 359 種數(shù)據(jù)(著作文獻 4 877 種,單篇文獻 21 482 種)為對象,分析文獻在出版時間上的分布規(guī)律。
歷史文獻的出版與其所處社會歷史背景密切相關。年份是反映文獻所處社會歷史背景的時間坐標,是文獻組織、整理和研究的重要屬性,通過年份的分析可以發(fā)現(xiàn)事物發(fā)展深化規(guī)律[5]。筆者梳理了民國時期歷年來巴渝文獻的產(chǎn)出數(shù)量(見圖1)。
圖1 民國時期巴渝文獻出版時間與出版文獻種數(shù)
筆者對民國時期巴渝文獻的時間選取是從1912—1949年,在這三十多年的社會發(fā)展歷程中有幾個比較明顯的時間點與文獻的出現(xiàn)數(shù)量有著密切的關聯(lián)。第一個時間節(jié)點是1919年。1912—1919年五四運動爆發(fā),巴渝文獻產(chǎn)出數(shù)量呈波浪式上升,但上升幅度較小。1919年五四運動爆發(fā)后。在新思潮的推動下,巴渝文獻的產(chǎn)出量在原有基礎上有了一些突破性增長。第二個時間節(jié)點為1935年。1935年2月9日,劉湘就任四川省保安司令,10月就任四川省主席,劉湘就職后,在政治、軍事、經(jīng)濟著手統(tǒng)一川政,9月在四川統(tǒng)一發(fā)行了法幣,使四川的幣制與全國統(tǒng)一,至此,四川的軍、民、財政統(tǒng)一于南京國民政府之下。川政的統(tǒng)一不僅對于重慶范圍內(nèi)區(qū)縣的交流,更對重慶與外界的交流起到了很大的推動作用。1920—1935年,巴渝文獻的產(chǎn)出數(shù)量猛增。第三個時間節(jié)點是1938年重慶陪都地位的確立??箲?zhàn)全面爆發(fā)后,隨著上海、武漢、南京的淪陷,以重慶為核心的抗戰(zhàn)大后方戰(zhàn)略地位形成后,全國各地很多出版機構(gòu)內(nèi)遷重慶,鑄就了巴渝文獻產(chǎn)出的輝煌態(tài)勢。第四個時間節(jié)點是1945年日本受降??谷諔?zhàn)爭勝利后,戰(zhàn)前及戰(zhàn)爭期間遷入重慶的出版機構(gòu)等相繼遷出,巴渝文獻的產(chǎn)出數(shù)量下降。倘若認真觀察,也許第一個時間節(jié)點,每一段折線的背面都如實地反映出巴渝歷史進程中每個特定時期的特性。正是由于上層建筑對巴渝文獻的產(chǎn)出有著明顯的影響,筆者提議,對民國時期巴渝文獻的整理及開發(fā),可以根據(jù)上述文獻產(chǎn)出的時間階段有針對性地進行。
“作者作為創(chuàng)作主體是文獻最重要的屬性特征之一,也是文獻整理和著錄中最受關注的要素之一?!盵6]文章探尋了民國時期巴渝文獻在作者中的分布規(guī)律,可以更有效地提升相關文獻整理人員的工作質(zhì)量。前文略述的洛特卡定律在社會科學中被稱為冪律分布[7],亦被稱為“長尾效應”[8]?!伴L尾”這一概念是在互聯(lián)網(wǎng)出現(xiàn)后,人們關于新經(jīng)濟諸多理論中的一種經(jīng)濟模型構(gòu)想,最早由美國知名經(jīng)濟雜志《連線》的主編克里斯·安德森提出。他系統(tǒng)地研究了當時一些著名的網(wǎng)絡公司如亞馬遜、Google等互聯(lián)網(wǎng)公司的銷售數(shù)據(jù),與傳統(tǒng)零售商的銷售數(shù)據(jù)進行了對比,發(fā)現(xiàn)網(wǎng)絡公司的銷售數(shù)據(jù)同樣符合統(tǒng)計規(guī)律,它就像以數(shù)量、品種二維坐標上的一條需求曲線,只不過拖著一條更長的尾巴,向代表品種的橫軸盡頭延伸,“長尾理論”由此得名。洛特卡定律與長尾理論反映出一致性,意在將研究的注意力轉(zhuǎn)移到長尾部分。巴渝文獻中的高產(chǎn)作者主要集中在尾部,研究尾部的高產(chǎn)作者,更能優(yōu)化文獻資源的建設工作。
民國時期巴渝著作文獻作者分布曲線(見圖2)所示的坐標中,橫坐標為作者創(chuàng)作的著作種數(shù)N,縱坐標為創(chuàng)作N種著作的作者數(shù)量占有作者總?cè)藬?shù)(有明確作者的數(shù)量)的比例,該坐標中曲線走勢的長屬效應非常突出。創(chuàng)作文獻種數(shù)5種及5種以上的作者總計232人,占作者總?cè)藬?shù)的6.2%,他們產(chǎn)出的文獻種數(shù) 3 743 種,占文獻總數(shù)的62%。處于尾部的6.2%的高產(chǎn)作者應是文獻整理和開發(fā)人員重點關注的部分,不僅僅是因為他們產(chǎn)出大量作品,更是因為他們持續(xù)產(chǎn)出的文獻具有極高的開發(fā)價值。
圖2 作者創(chuàng)作文獻種數(shù)與占作者總數(shù)據(jù)比例圖
為了進一步具體展示這批有研究價值的文獻,文章對產(chǎn)出著作排名前20的作者進行了排序(見表1)。從表1來看,產(chǎn)出數(shù)量多的作者是中央訓練團、四川省政府、重慶市政府等機構(gòu)、中央政治學校、教育部、國民參政會秘書處、新運總會;也有蔣介石、胡煥庸、周恩來、胡次威、馮玉祥等當時在民國有影響的政界人物;有任鴻雋、沈起予等出生于重慶的科學家和作家;還有老舍、張恨水、郭沫若、豐子愷、巴金、王云五等在抗戰(zhàn)爆發(fā)后遷居重慶生活的著名作家及出版家。不管是機構(gòu)還是個體,不管是本土作家還是遷居作家,他們共同完成了民國時期巴渝文獻中處于尾部最為精粹的作品,是我們文獻整理工作的重心。
表1 抗戰(zhàn)時期巴渝著作文獻產(chǎn)出作者排行表
民國時期巴渝著作文獻在文獻著者中的分布與洛特卡定律是否有一致性,筆者按照洛特卡定律的要求,對創(chuàng)作文獻種數(shù)和作者占作者總數(shù)比例分別取對數(shù),形成一個有兩條走勢線的對比圖(見圖3)。其中,直線是洛特卡定律理想走勢線,曲線為民國時期巴渝著作文獻的直實走勢線,兩條線的走勢基本一致,但還存在一定的差別,從圖3中可以看出,巴渝著作文獻的斜率略小。洛特卡定律中的斜率為-2,代表作者創(chuàng)作作品總數(shù)的差異程度,斜率越大說明作者創(chuàng)作作品種數(shù)的差異程度就越大,斜率越小則反之。在創(chuàng)作作品為10種的節(jié)點前,創(chuàng)作文獻數(shù)量為1種的作者人數(shù) 1 042 人,占作者總?cè)藬?shù)的28%,創(chuàng)作文獻總數(shù) 1 042 種,占文獻總數(shù)的22%;創(chuàng)作文獻數(shù)量為2種的作者人數(shù)259人,占作者總?cè)藬?shù)的7%,創(chuàng)作文獻總數(shù)518種,占文獻總數(shù)的11%;創(chuàng)作文獻數(shù)量為3種的作者人數(shù)133人,占作者總?cè)藬?shù)的3.6%,創(chuàng)作文獻總數(shù)399種,占文獻總數(shù)的8.4%……創(chuàng)作文獻數(shù)量為10種的作者人數(shù)9人,占作者總?cè)藬?shù)的0.2%,創(chuàng)作文獻總數(shù)90種,占文獻總數(shù)的1.9%。民國時期巴渝著作文獻走勢線的總體斜率低于洛特卡理想走勢線,表明民國時期作者創(chuàng)作文獻數(shù)量的差異較小。在創(chuàng)作作品為10種的節(jié)點后,作者創(chuàng)作文獻種數(shù)作者之間的創(chuàng)作差異突顯,高產(chǎn)作者產(chǎn)出更多的文獻,低產(chǎn)作者產(chǎn)出的文獻更少,處于尾部的中央訓練團、四川省政府、重慶市政府,教育部、中央政治學校、國民參政會秘書處、新運總會等5個創(chuàng)作團體占作者總?cè)藬?shù)的0.13%,創(chuàng)作文獻數(shù)量為503種,占文獻總數(shù)的13.4%。出現(xiàn)這種情況的原因主要在于時局的動蕩,每個作者都希望有穩(wěn)定及能夠持續(xù)創(chuàng)作的社會環(huán)境,然而絕大部分作者在產(chǎn)出一部或幾部作品以后,因抗戰(zhàn)的爆發(fā)中斷了他們持續(xù)創(chuàng)作的環(huán)境,只有少數(shù)作者或者黨政團體能夠持續(xù)創(chuàng)作,他們?nèi)藬?shù)雖少,但產(chǎn)量極高,因此,處于長尾尾部的這些作者群體應該受到更多研究者的關注,進行專業(yè)開發(fā)。
圖3 洛特卡定律理想走勢線與民國時期巴渝著作文獻走勢線對比
出版社與作者一樣,都是文獻資源整理和建設過程中重要的文獻特征。出版是個萬花筒,每次都會看到不同的景象;出版是個多棱鏡,每個角度都會折射出無數(shù)難以辨別的光彩;出版是指南針,它指引著人類文明發(fā)展的方向,指引著人們生活的方向。它的活動關乎人類的存在,關乎社會的秩序,關乎民族國家的文化根基。民國時期的出版機構(gòu)呈現(xiàn)多樣性,它可能是黨機構(gòu)或團體,可能是獨立的出版社,總之,它們都是助推文獻產(chǎn)生的組織機構(gòu),是文獻產(chǎn)生的關鍵環(huán)節(jié)。本文分析民國時期巴渝著作文獻在出版機構(gòu)中的分布規(guī)律,同樣有利于文獻的整理、研究、開發(fā)與利用。重慶作為戰(zhàn)時陪都,理所當然為戰(zhàn)時全國的文化中心,書賈輻輳,引人注目。
與分析巴渝著作文獻在創(chuàng)作者中的分布規(guī)律一樣,本文選取有明確出版信息的著作文獻數(shù)據(jù)為統(tǒng)計分析對象,總數(shù)為 3 903 種。以出版機構(gòu)出版著作文獻種類為橫坐標,以占出版機構(gòu)總數(shù)的比例為縱坐標(見圖4)。由圖4可知,只出版1種文獻的出版機構(gòu)有662家,占出版機構(gòu)總數(shù)的61%;出版2種文獻的出版機構(gòu)有180家,占出版機構(gòu)總數(shù)的17%;出版3種文獻的出版機構(gòu)有65家,占出版機構(gòu)總數(shù)的6%。走勢線有明顯的長尾走勢,出版文獻3種及以下的出版機構(gòu)總數(shù)為907家,占出版機構(gòu)總數(shù)的84%,出版文獻 1 217 種,占出版總數(shù)的31%,部分數(shù)據(jù)集中分布在走勢線的左邊;出版文獻3種以上的出版機構(gòu)有177家,只占出版機構(gòu)總數(shù)的16%,但他們出版文獻 2 686 種,占出版文獻總數(shù)的69%,數(shù)據(jù)集中分布在走勢線的右邊即走勢線的長尾部分,出版機構(gòu)數(shù)量雖然較少,但是出版文獻的種數(shù)卻較多。在民國時期巴渝著作文獻的整理和開發(fā)過程中,研究人員應該當把關注點聚集在尾部16%的出版機構(gòu),通過這少量出版機構(gòu)的信息,就能得到69%的著作文獻。
圖4 出版機構(gòu)出版著作種數(shù)與占出版機構(gòu)總數(shù)比例
根據(jù)圖4,筆者列出了處于長尾尾部出版文獻前20的出版機構(gòu)(見表2)。這些出版機構(gòu),有民營出版機構(gòu)如商務館印書館、生活書店、開明書店、中華書局等;有官辦出版機構(gòu)如中國文化服務社、獨立出版社、國民圖書出版社、正中書局等;還有中共領導、支持和開辦的出版機構(gòu)生活書店等;也有黨政機關自身出版教材、調(diào)查報告,如中央訓練團、四川省政府、軍事委員會、中國國民黨中央執(zhí)行委員會等;亦有自行出版文獻的學術團體如四川農(nóng)業(yè)改進所等。從事文獻整理工作的人員也可以根據(jù)出版機構(gòu)的性質(zhì)與處于長尾尾部的數(shù)據(jù)結(jié)合,深入挖掘文獻,并集中研究與開發(fā),形成特色文獻數(shù)據(jù)庫。
表2 出版文獻種數(shù)排名前20的出版機構(gòu)
續(xù)表2
洛特卡定律只是反映出了巴渝著作文獻在作者中的分布規(guī)律,本文則進一步運用洛特卡定律,探尋巴渝著作文獻在出版機構(gòu)的產(chǎn)出規(guī)律(見圖5)。圖5中,菱形描點的走勢線為民國時期巴渝著作文獻在出版機構(gòu)中的真實走勢線,橫坐標為出版機構(gòu)出版文獻種數(shù)取對數(shù),縱坐標為占有出版機構(gòu)總數(shù)比例取對數(shù),黑色圓形描點為洛特卡定律的理想走勢線。在圖5中,出版文獻數(shù)量少于30種時,巴渝文獻在出版機構(gòu)中的走勢線與洛特卡走勢線呈現(xiàn)一致性;出版機構(gòu)出版30種以上時,兩條走勢線的差距較大。如果依照理想的洛特卡定律描繪,出版文獻數(shù)量不斷增加,則出版機構(gòu)應將持續(xù)減少,但據(jù)圖5中民國時期巴渝文獻在出版機構(gòu)中的走勢分布,出版30種以上的出版社仍較多。出現(xiàn)此種現(xiàn)象的原因在于抗日戰(zhàn)爭爆發(fā)后,隨著南京、武漢相繼失陷,重慶被升為戰(zhàn)時首都,一躍成為全國軍事、政治、經(jīng)濟、文化的中心,開拓出一個出版事業(yè)大發(fā)展的局面,先后內(nèi)遷的新建出版機構(gòu)和出版的文獻均占全國的1/3左右[9]。本文列舉的數(shù)據(jù)也是有利于巴渝著作文獻整理工作的開展,各相關部門工作人員可以將研究的重點放在這些出版文獻數(shù)量龐大的出版機構(gòu),通過少數(shù)的檢索點來完成多數(shù)文獻的搜集與梳理。
圖5 洛特卡定律理想走勢線與民國時期巴渝著作文獻在出版機構(gòu)中走勢線對比
本文利用Excel表格的透視功能,抽取了民國時期巴渝著作文獻的出版時間、作者和出版機構(gòu)3個角度分析了巴渝著作文獻的分布特征。
從時間角度的文獻分布規(guī)律可以看出,不同歷史時期表現(xiàn)出的特殊社會歷史進程對于巴渝文獻的產(chǎn)出有著顯著作用,巴渝文獻的整理與研究人員有必要分時段開展工作,根據(jù)圖1走勢線分布,筆者建議對民國時期巴渝著作文獻的整理分為5個階段:1)1912—1919年,民國成立到五四運動;2)1920—1935年,五四運后到川政統(tǒng)一;3)1936—1938年,川政統(tǒng)一后到國民政府遷都重慶前;4)1938—1945年,重慶抗戰(zhàn)陪都地位的確立到抗戰(zhàn)勝利;5)1946—1949年,抗戰(zhàn)勝利后到中華人民共和國成立前。
從作者與出版機構(gòu)兩個角度出發(fā),據(jù)圖3可以看出,巴渝著作文獻在作者中的分布規(guī)律與洛特卡定律有一致性,但在民國時期重慶特定的社會歷史進程中,巴渝著作文獻在作者中分布的走勢線斜率低于洛特卡定律理想線。據(jù)圖5可以看出,出版文獻種數(shù)較少的范圍內(nèi),與洛特卡定律的理想走勢線有很強的一致性,但隨著出版文獻數(shù)量的增加,出版機構(gòu)并沒有因此而減少,而是繼續(xù)保持一定的出版數(shù)量。
綜上所述,民國時期巴渝著作文獻在作者、出版機構(gòu)中的分布與洛特卡定律有著一定程度的一致性,分布走勢線都表現(xiàn)出了長尾的特征。因此,筆者建議從事文獻整理與研究的工作人員將工作的重心放在處于尾部的作者和出版機構(gòu)創(chuàng)作或者出版的文獻,能夠起到事半功倍的效果。本文用文獻計量的方法探討了民國時期巴渝著作文獻的分布規(guī)律,為特色地方文獻的整理與研究提供了思路。文章最后得出的結(jié)論之所以能夠成立,還要依賴于《巴渝文庫總目》所輯錄的文獻目錄資料這個樣本可以代表民國時期所有巴渝文獻這個整體,樣本與整體之間如果存在偏差,都會影響結(jié)論的準確性。本文的論斷真實有效否,還需要在后面的文獻整理與研究過程中加以考證。