陳忠海+董一超
摘要:檔案學研究中的統(tǒng)計分析法與文獻計量法既相互聯(lián)系,又存在差異。本文從方法體系、研究對象、適用范圍、實施步驟以及兩種研究方法在檔案學研究中的實際應用等方面對二者進行比較,發(fā)現(xiàn)兩者的方法體系既相互交叉,又不盡相同。統(tǒng)計分析法的研究對象、適用范圍和應用覆蓋面都更為廣泛,兩者的總體研究流程類似,但在具體實施步驟上卻有所區(qū)別。此外,在實際應用中,文獻計量法可單獨使用,而統(tǒng)計分析法就需要與其他研究方法協(xié)同應用。
關鍵詞:檔案學統(tǒng)計分析法文獻計量法
Abstract: Statistical analysis method and biblio? metric method are interrelated and discrepant in ar? chives science research. This paper compares the two methods from five aspects: methods system, re? search subjects, application scope, implementation steps and the practical application of the two meth? ods in archives science research, and then find that there are some intersections and differences be? tween the two methods of the methods system. The research subjects and the application scope of statis? tical analysis method are more widely used than the bibliometric method. The two methods have similar process of research, but they also have some differ? ent parts on the measures of the specific implemen? tation. Besides, the bibliometric method can be used alone in practical applications, and statistical analysis method needs to be coordinated applied with the oth? er research methods.
Keywords: Archival science; Statistical analysis method; Bibliometric method
一、引言
統(tǒng)計分析法指通過對研究對象的規(guī)模、速度、范圍、程度等數(shù)量關系的分析研究,認識和揭示事物間的相互關系、變化規(guī)律和發(fā)展趨勢,借以達到對事物的正確解釋和預測的一種研究方法。[1]統(tǒng)計分析法最早起源于社會經(jīng)濟領域,19世紀隨著統(tǒng)計學與數(shù)學融合的趨勢不斷發(fā)展,歐洲大學開設一門新的學科“統(tǒng)計分析科學”,這門課程的誕生是現(xiàn)代統(tǒng)計科學逐步興起的標志。此后,統(tǒng)計學家不斷地充實和發(fā)展統(tǒng)計學理論和方法,嘗試開拓新的統(tǒng)計學研究領域。其中,現(xiàn)代統(tǒng)計學代表人物之一的比利時統(tǒng)計學家萊博·阿道夫·奎特萊(Lambert Adol? phe Quetelet)認為統(tǒng)計分析科學是可以用于研究任何一種科學的一般研究方法,他嘗試將統(tǒng)計分析科學應用到工程技術科學、自然科學以及社會科學等領域并取得了成功。[2]至此,統(tǒng)計分析方法作為一種能夠揭示客觀事物的數(shù)量特征及其內(nèi)在發(fā)展規(guī)律的一般研究方法,被廣泛應用于各個學科和實踐領域的研究當中。
文獻計量法是指利用數(shù)學和統(tǒng)計學等方法對任何與文獻有關的媒介及其相關特征進行定量研究的一種科學的研究方法。國內(nèi)外圖書情報學學者普遍認為文獻計量法的研究始于20世紀初。1917年,文獻學家科爾(F.T. Cole)教授和伊爾斯(N.B.Eales)館長兩人合作,對歐洲各國解剖學論文進行定量研究,標志著文獻計量法的初步形成。[3]文獻計量法以此為起點,經(jīng)歷了從無到有、由少到多的發(fā)展過程,得到了國內(nèi)外各個學科領域?qū)W者們的重視。經(jīng)過數(shù)十年的發(fā)展,圖書情報學界對文獻計量法相關理論及其三定律的研究不斷深入,文獻計量法的方法論體系不斷得到補充并日益完善,其應用的范圍也從初始的圖書情報領域擴展至醫(yī)學、生物學、社會學、經(jīng)濟學以及科學學等相關領域。
從上述兩種方法的起源和定義上來看,在一定條件下,統(tǒng)計分析法與文獻計量法在應用目的、研究性質(zhì)等方面上是類似的。由于劃分標準的不同,不少學者經(jīng)?;煜齼烧咧g的關系,例如有的學者認為統(tǒng)計分析法應歸屬于文獻計量法,有的學者則認為文獻計量法是統(tǒng)計分析法的一部分,甚至還有學者將統(tǒng)計分析法等同于文獻計量法。我們認為,二者既有聯(lián)系,又有區(qū)別,文獻計量法可以作為一種研究方法獨立使用,而統(tǒng)計分析法則需要與其他的研究方法配合應用。為了進一步區(qū)分兩種研究方法,提高研究工作的效率和成果的可靠性,本文將從方法體系、研究對象、適用范圍、實施步驟以及兩種研究方法在檔案學研究中的實際應用狀況等方面分析兩者的共性和差異,以便為檔案學研究者更好地具體運用兩種研究方法提供借鑒和參考。
二、兩種研究方法在檔案學研究中的應用調(diào)查與分析
(一)兩種研究方法的比較
1.方法體系。統(tǒng)計分析法的基本內(nèi)容來源于統(tǒng)計學,以統(tǒng)計學和概率論原理為基礎,統(tǒng)計分析法的方法體系,若按照研究手段劃分,則有聚類分析、回歸分析、因子分析、相關分析等;[4]文獻計量法的顯著特點之一就是利用數(shù)學、統(tǒng)計學方法和系統(tǒng)學方法對文獻進行定量分析,在統(tǒng)計結(jié)果的基礎上建立數(shù)學模型。文獻計量法根據(jù)研究手段可劃分為文獻統(tǒng)計分析法、數(shù)學模型分析法、系統(tǒng)分析法、網(wǎng)絡分析法、矩陣分析法等。[5]
由此可知,二者的方法體系存在交叉部分,但又不完全相同。首先,當研究對象是文獻本身及其外部特征時,統(tǒng)計分析法可以看做是文獻計量法的組成部分,這里的統(tǒng)計分析法特指文獻統(tǒng)計分析法;其次,當研究對象擴展到各種與數(shù)量相關的事物時,有學者認為對文獻進行計量分析是統(tǒng)計分析法的組成部分,但這種認識卻忽略了數(shù)學方法和系統(tǒng)方法在文獻計量研究中應用的事實,因而不能簡單地將文獻計量法歸屬到統(tǒng)計分析法當中。
2.研究對象。統(tǒng)計分析法和文獻計量法都屬于定量研究方法。統(tǒng)計分析法并沒有特定的研究對象,其研究的并非是個體的“量”,而是現(xiàn)象總體的數(shù)量特征與規(guī)律性。文獻計量法的研究對象主要是各類科技文獻,尤其是各類科技文獻或文獻用戶的各種外部特征,如摘要、關鍵詞、書目、引文以及用戶信息等。從研究對象的范圍來看,兩者有共同的研究對象——文獻及其外部特征,但與僅以各類文獻外部特征為主要研究對象的文獻計量法相比,統(tǒng)計分析法的研究范圍更為廣泛,既包括各類文獻的外部特征,也包括文本所展示的隱含或潛在的信息內(nèi)容,資源類型涵蓋多樣,可以是文本,也可以是聲音、影像或是任意能產(chǎn)生數(shù)量關系的社會行為,可以說哪里有數(shù)據(jù),哪里就有統(tǒng)計分析。
3.適用范圍。統(tǒng)計分析法起源于經(jīng)濟學領域,目前已經(jīng)形成了一套能夠揭示數(shù)據(jù)內(nèi)在規(guī)律性的方法體系,具有廣泛的實用價值,已經(jīng)成為圖書情報學、經(jīng)濟學、政治學、社會學、歷史學、醫(yī)學等眾多學科數(shù)據(jù)收集和研究的基本方法之一。如在歷史學研究中,應用統(tǒng)計分析方法不僅可以為研究者提供新的研究思路,而且使歷史學研究更為精確。[6]文獻計量法作為圖書情報學領域獨特的研究方法,以布拉德福定律、洛卡特定律以及齊普夫定律等為基礎,在圖書情報學領域得到了充分的應用,常被用來作為學術評價、核心期刊選定、設計圖書情報系統(tǒng)、總結(jié)學術熱點或推斷學科研究趨勢等的工具。由于文獻計量法的研究對象主要是科學文獻,因而該方法對各門學科均適用,文獻計量法的應用領域也逐漸擴大到自然科學和其他社會科學領域。
由上述可知,兩種研究方法的應用領域都相當廣泛,但二者側(cè)重點不同。統(tǒng)計分析法作為一種定量分析工具,具有廣泛的適用性,是自然科學和社會科學的一般研究方法。文獻計量法雖被應用到許多科學研究領域,但每個經(jīng)典定律都有其特定的適用范圍,如洛卡特定律是由化學、物理兩門學科的文獻統(tǒng)計推出的,當其應用到其他學科時就必須進行修正。[7]比較而言,文獻計量法在圖書情報學領域的應用更為廣泛和深入,而統(tǒng)計分析法更容易被多個學科領域接受和應用。
4.實施步驟。統(tǒng)計分析法在其形成和發(fā)展的過程中,逐漸確立了較為完整的應用實施步驟。筆者通過閱讀多篇應用統(tǒng)計分析法的論文,認為其應用過程可以總結(jié)為以下幾個步驟:選定研究對象和目標,然后根據(jù)研究目的選擇指標變量,收集、整理統(tǒng)計數(shù)據(jù),接著選擇適當統(tǒng)計方法對樣本數(shù)據(jù)進行統(tǒng)計計算,建立統(tǒng)計模型并進行檢驗和修改,最后利用統(tǒng)計模型進一步研究問題,從而得出研究對象的一些規(guī)律性的結(jié)論。目前,各學科領域?qū)W者對應用文獻計量法進行研究的實施步驟逐步達成共識,其具體的實施步驟為:確定研究的目的,選擇某種文獻的外部特征作為分析單元,然后收集樣本文獻,針對分析單元進行統(tǒng)計分析,最后根據(jù)統(tǒng)計結(jié)果建立數(shù)學模型以揭示研究對象所包含的規(guī)律性內(nèi)容和特征。
通過上述兩種研究方法的實施步驟的比較可知,當研究對象是文獻及其外部特征時,統(tǒng)計分析法和文獻計量法的總體研究流程大致相同,首先都需要確定研究對象和目的,選擇分析單元,隨后收集一定的樣本文獻,并對其進行加工處理使之有序化,然后手工或利用統(tǒng)計軟件對分析單元進行統(tǒng)計,最后建立模型獲得研究對象的規(guī)律性結(jié)論。二者的區(qū)別在于具體的分析步驟上。在實際應用中,文獻計量法通常會在統(tǒng)計分析法的分析步驟的基礎上,進一步應用數(shù)學模型法或系統(tǒng)方法。
(二)兩種研究方法的實際應用調(diào)查與分析
由上述分析可知,統(tǒng)計分析法和文獻計量法在自然科學和社會科學領域均得到了廣泛的應用。為了進一步解讀兩種方法,筆者調(diào)查統(tǒng)計分析法和文獻計量法在檔案學研究領域的具體應用狀況,選取典型案例進行解讀,進而揭示兩種方法在檔案學研究實際應用中的共性和差異。
1.統(tǒng)計分析法
(1)統(tǒng)計分析法在檔案學研究領域的應用狀況
筆者以中國知網(wǎng)的“中國期刊全文數(shù)據(jù)庫”作為數(shù)據(jù)來源,首先,以SU=(統(tǒng)計分析法+統(tǒng)計+統(tǒng)計分析)*檔案學-文獻計量為檢索式,獲得175條記錄,通過逐一篩選得到117篇應用統(tǒng)計分析法的檔案學研究論文。其應用領域分布及所占比例,詳見表1。
表1應用統(tǒng)計分析法的檔案學樣本論文研究領域分布及占比
由表1可知,統(tǒng)計分析法在檔案學領域中的應用總體上呈現(xiàn)增長的趨勢,2006-2015年是統(tǒng)計分析法應用迅速發(fā)展的階段。此外,數(shù)據(jù)顯示,統(tǒng)計分析法應用研究的論文數(shù)量是純理論研究論文的近10倍。這表明檔案學研究者在對統(tǒng)計分析法理論分析層面有了深入了解的基礎上,將其作為一種實用的研究方法更多地應用于檔案學領域的專業(yè)研究。
(2)應用案例
案例一:此案例選自丁牧羊、王鶴淇發(fā)表在《檔案學通訊》2015年第6期的《<周禮>文檔名詞再研究》[8]一文。該文以《周禮》中的文檔名詞為研究對象,利用統(tǒng)計分析法研究《周禮》中通用與專有名詞、單音詞與雙音詞等具體問題。該研究以《周禮》為研究樣本,先是采用內(nèi)容分析法對《周禮》中的文檔名詞進行仔細區(qū)分,劃分類別,再利用統(tǒng)計分析法分門別類的整理和編碼文檔名詞,最后結(jié)合文檔名詞的使用展開深入研究,得出結(jié)論。
案例二:此案例選自李倢、胡燕發(fā)表在《檔案學研究》2015年第4期的《影響公眾檔案利用行為的個體特征因素分析——基于蘇州市居民的調(diào)查》[9]一文。該文通過調(diào)查蘇州近600名普通公眾的檔案利用行為現(xiàn)狀,具體分析了個體特征因素對公眾檔案利用行為的影響。作者以蘇州市民的檔案利用行為為研究對象,具體采用了問卷調(diào)查法和統(tǒng)計分析法。首先,劃分調(diào)查區(qū)域,按照職業(yè)發(fā)放和回收調(diào)查問卷;其次,根據(jù)回收問卷的反饋信息,對樣本個體的年齡、性別、文化程度、職業(yè)狀況、檔案利用內(nèi)容、方式、心理、行為等進行量化統(tǒng)計;最后,利用SPSS統(tǒng)計軟件進行方差分析,歸納得出結(jié)論。
2.文獻計量法
(1)文獻計量法在檔案學研究領域的應用狀況
筆者以中國知網(wǎng)的“中國期刊全文數(shù)據(jù)庫”作為數(shù)據(jù)來源,以SU=(文獻計量法+文獻計量+文獻計量學)*檔案學為檢索式,共得到100條記錄,經(jīng)過篩選得到75篇應用文獻計量法的檔案學研究論文。其年度分布及所占比例,詳見表2。
由表2可知,1990-2015年檔案學領域應用文獻計量法研究的論文數(shù)量總體上呈現(xiàn)不斷上升的趨勢,自2010年開始論文數(shù)量增長速度加快,在2014-2015年達到高峰。由此可見,檔案學由圖書情報領域引入文獻計量法進行研究的時間較早,但研究的興起和擴大卻是近幾年的事情。
對選取的75篇應用文獻計量法的論文進行逐篇排查,發(fā)現(xiàn)其中有3篇是純理論研究,有72篇實際應用了文獻計量法。本文以72篇實際應用文獻計量法的檔案學論文為樣本,通過查看每一篇論文的題名、摘要、關鍵詞以及全文,得到每篇論文的研究內(nèi)容和應用的文獻計量學具體研究方法,建立二者之間的對應關系,統(tǒng)計每種文獻計量學具體研究方法在不同類別研究主題中的應用頻次,結(jié)果詳見表3。
由表3可知,文獻計量法應用到檔案學研究領域時,可大致分為4種具體方法和9種研究主題,其中文獻統(tǒng)計分析法的應用領域最為廣泛,涵蓋了8種研究主題。而學術整體進展和學科某主題研究進展所應用的研究方法最為全面,均應用了4種文獻計量法具體研究方法。表3的數(shù)據(jù)反映出檔案學研究者對文獻計量法的應用尚處于起步階段,研究內(nèi)容較為單一,更多的是應用文獻計量法對檔案學或檔案學某個研究主題的研究歷程進行概括和歸納。此外,對研究主題的分析也不夠深入,作者大多采用的是文獻計量法方法體系中較為簡單的四種研究方法,缺乏數(shù)學模型的構(gòu)建。
(2)應用案例
案例三:選取中國科學院文獻情報中心碩士研究生毛天宇發(fā)表在《檔案與建設》2015第9期的《我國科技檔案研究的發(fā)展現(xiàn)狀與研究特征——基于國內(nèi)檔案學核心期刊的文獻計量分析》[10]一文。該文為考察國內(nèi)科技檔案研究而對檔案學核心期刊中科技檔案主題研究的1553篇論文進行了文獻計量分析。作者以年度、發(fā)文期刊、著者、機構(gòu)、關鍵詞作為文獻計量的指標,數(shù)據(jù)來源基于中國期刊全文數(shù)據(jù)庫,檢索時間不加限定;具體的分析方法是利用SATI、Excel和NoteExpress軟件對數(shù)據(jù)進行處理和統(tǒng)計,運用普萊斯定律判定核心作者群,并采用詞頻分析法探討論文的研究特征和趨勢;該研究從樣本論文的年度分布、期刊分布、核心作者群、研究特征等方面進行了計量分析。
通過以上對兩種研究方法在檔案學領域?qū)嶋H應用狀況和應用案例的描述,我們可以得出以下幾點結(jié)論:1.在實際應用中,文獻計量法可以作為一種研究方法獨立使用,而統(tǒng)計分析法則需要與其他的研究方法配合應用;2.相較于文獻計量法,統(tǒng)計分析法在檔案學領域的應用更為廣泛,其研究對象可以是檔案文獻,也可以是機構(gòu)、人員或檔案利用行為;3.兩者應用軟件有所差別,統(tǒng)計分析法常用軟件有Excel和SPSS,而文獻計量法常用的軟件有SPSS、SATI、UCINET和Pajek、CiteSpace、Netdraw以及VOSviewer等。
三、小結(jié)
從以上分析結(jié)果來看,統(tǒng)計分析法和文獻計量法作為各具特色的研究方法,兩者之間既有聯(lián)系,又在方法體系、研究對象、適用范圍、實施步驟和實際應用等方面存在一定的差異之處。它們之間的關系具體體現(xiàn)在以下幾個方面:1.兩者研究目的相似。兩種方法都是通過對研究對象的各類特征進行組合和統(tǒng)計,從而揭示其變化發(fā)展的規(guī)律;2.兩者的方法體系相互交叉,卻不盡相同;3.兩者有共同的研究對象——文獻及文獻外部特征,但統(tǒng)計分析法的研究對象的范圍更為廣泛;4.兩者應用領域都相當廣泛,但統(tǒng)計分析法的應用覆蓋面更廣;5.兩者的總體研究流程類似,但具體實施步驟上有所區(qū)別;6.在實際應用中,相較于文獻計量法可單獨應用的特點,統(tǒng)計分析法更像一種定量分析工具,需要與其他研究方法協(xié)同應用。
注釋及參考文獻:
[1]百度百科.統(tǒng)計分析法[EB/OL].[2015-03-02]. http://baike.baidu.com/view/1397463.htm.
[2]肖彥花.統(tǒng)計學理論與方法[M].長沙:國防科技大學出版社,2005:4-5.
[3]邱均平.文獻計量學[M].北京:科學技術文獻出版社,1988:2.
[4]何曉群.現(xiàn)代統(tǒng)計分析方法與應用[M].北京:中國人民大學出版社,2012:5.
[5]邱均平.文獻計量學[M].北京:科學技術文獻出版社,1988:20.
[6]袁山.統(tǒng)計分析工具在歷史研究中的應用[J].中國青年政治學院學報,2002(4):88-93.
[7]邱均平,王曰芬等.文獻計量內(nèi)容分析法[M].北京:國家圖書館出版社,2008:157-158.
[8]丁牧羊,王鶴淇.《周禮》文檔名詞再研究[J].檔案學通訊,2015(6):32-39.
[9]李倢,胡燕.影響公眾檔案利用行為的個體特征因素分析——基于蘇州市居民的調(diào)查[J].檔案學研究,2015(4):94-100.
[10]毛天宇.我國科技檔案研究的發(fā)展現(xiàn)狀與研究特征——基于國內(nèi)檔案學核心期刊的文獻計量分析[J].檔案與建設,2015(9):8-12.
作者單位:鄭州大學信息管理學院