李曉明,嚴京生,宮啟生
摘 要:為客觀反映近十年我國數(shù)字檔案館研究的相關(guān)情況,運用文獻計量和可視化分析方法,對CNKI收錄的2003年~2012年間研究數(shù)字檔案館的期刊論文、學(xué)位論文和會議論文從作者、機構(gòu)和主題角度,結(jié)合知識圖譜進行統(tǒng)計及可視化分析。結(jié)果表明,檔案類期刊特別是核心期刊是載文主體,高發(fā)文作者數(shù)量不多,作者及機構(gòu)合著較少,高等學(xué)校是研究主力,研究熱點緊跟信息技術(shù)發(fā)展。
關(guān)鍵詞:數(shù)字檔案館;2003年~2012年;文獻計量;統(tǒng)計分析;可視化分析;知識圖譜
1 引言
數(shù)字檔案館是近十幾年我國檔案領(lǐng)域研究重點和熱點之一。隨著時代及技術(shù)發(fā)展,數(shù)字檔案館出現(xiàn)多種叫法。羅沛霖早在1991年就提及“電子檔案館”,[1]1997年劉建平文中出現(xiàn)“數(shù)字化檔案館”、“虛擬型檔案館”,[2]1998年馮惠玲認為數(shù)字檔案館亦可稱為“電子檔案館”、“虛擬檔案館”或“無墻檔案館”。[3]
李繼紅1997年在《檔案學(xué)通訊》上撰文,論述了電子檔案館的8個特點,[4]開始了比較系統(tǒng)的數(shù)字檔案館研究。此后,國內(nèi)許多專家、學(xué)者和檔案工作者積極投身數(shù)字檔案館的研究與實踐,取得了大量的研究成果,國內(nèi)也不斷建成各種類型的數(shù)字檔案館。
為客觀準確地反映我國近十年數(shù)字檔案館研究的有關(guān)情況,作者收集了中國知網(wǎng)收錄的有關(guān)文獻,并對整理后的文獻進行統(tǒng)計分析和可視化分析。
2 文獻來源及數(shù)據(jù)整理
為使檢索結(jié)果盡量全面,以表達式“KY=(‘?dāng)?shù)字檔案館+‘電子檔案館+‘虛擬檔案館+‘無墻檔案館+‘?dāng)?shù)字化檔案館+‘虛擬型檔案館+‘虛擬化檔案館+‘?dāng)?shù)字型檔案館+‘電子化檔案館+‘電子型檔案館)”對中國知網(wǎng)的期刊、特色期刊、博士、碩士、國內(nèi)會議、國際會議、學(xué)術(shù)輯刊7個數(shù)據(jù)庫進行專業(yè)檢索,時間范圍為2003年~2012年,檢索結(jié)果2758篇。
為確保各項統(tǒng)計數(shù)據(jù)的準確,作者對檢索到的全文逐一進行了核對,剔除了重復(fù)文獻和“消息”、“動態(tài)”、“講話”、“書評”、“目錄”等不宜用作統(tǒng)計分析的文獻,以及有中國知網(wǎng)機標(biāo)關(guān)鍵詞但相關(guān)性不強或僅1頁的文獻,保留了檢索詞在關(guān)鍵詞中無但標(biāo)題中有的文獻。經(jīng)整理后,用于統(tǒng)計分析的各類文獻共計661篇(其中機標(biāo)關(guān)鍵詞文獻115篇),僅占檢索結(jié)果總數(shù)的24%,可見,文獻分析不能簡單地以檢索結(jié)果作為研究對象。統(tǒng)計文獻的年度及類型分布如圖1。
圖1 統(tǒng)計分析文獻年度及類型分布(單位:篇)
經(jīng)統(tǒng)計,以上文獻來源于178種期刊、20家研究生培養(yǎng)機構(gòu)和13次學(xué)術(shù)會議,其中期刊占比超過九成。載文前10位的期刊是《蘭臺世界》(81篇)、《檔案學(xué)通訊》(43)、《檔案學(xué)研究》(36)、《檔案》(34)、《浙江檔案》(27)、《北京檔案》(18)、《檔案與建設(shè)》(15)、《檔案管理》(14)、《科技情報開發(fā)與經(jīng)濟》(14)、《云南檔案》(13)。此外,《山西檔案》、《四川檔案》、《湖北檔案》、《城建檔案》的發(fā)文量均為11篇,檔案類期刊特別是核心期刊發(fā)文比重大,發(fā)文超過5篇的主要檔案類刊物的發(fā)文量達357篇,占期刊論文的59.3%。
為便于統(tǒng)計和確保統(tǒng)計數(shù)據(jù)的準確,對統(tǒng)計文獻的作者單位(機構(gòu))名稱、關(guān)鍵詞進行了統(tǒng)一和規(guī)范,如將機構(gòu)“南京政治學(xué)院上海分院”、“解放軍南京政治學(xué)院上海分院”、“中國人民解放軍南京政治學(xué)院上海校區(qū)”等統(tǒng)一為“解放軍南京政治學(xué)院上海分院”,將各級政府的“檔案館”、“檔案局”統(tǒng)一為“檔案局”,同屬兩個機構(gòu)的只統(tǒng)計第一個機構(gòu);將關(guān)鍵詞“檔案工作人員”、“檔案工作者”、“檔案館員”、“檔案人員”等統(tǒng)一為“檔案館員”, “大學(xué)”、“高校”、“高等學(xué)?!薄ⅰ案叩仍盒!苯y(tǒng)一為“高等學(xué)?!薄?/p>
3 文獻統(tǒng)計與分析
對文獻信息進行相關(guān)的統(tǒng)計與分析,可以從中發(fā)現(xiàn)知識發(fā)展脈絡(luò)、熱點前沿等,[5]本文以時間為主線,利用自編軟件對作者、機構(gòu)、關(guān)鍵詞等進行規(guī)范處理,統(tǒng)計分析了近十年我國數(shù)字檔案館研究的作者及機構(gòu)發(fā)文與合作、主題變化,并利用社會網(wǎng)絡(luò)分析可視化軟件,繪制數(shù)字檔案館研究的“高發(fā)文作者-年度共現(xiàn)”圖譜、“作者合著網(wǎng)絡(luò)”圖譜、“高發(fā)文機構(gòu)-年度共現(xiàn)”圖譜、“熱點主題-年度共現(xiàn)”圖譜。
3.1 作者統(tǒng)計與分析。(1)作者發(fā)文數(shù)量。統(tǒng)計文獻涉及作者702人,篇均作者1.37人,其中第一作者發(fā)文525人,人均發(fā)文不足1.26篇;獨著476篇,占72.01%;兩人合著文章142篇,占21.48%;三人合著31篇,占4.69%;三人以上合著12篇,占1.82%。
將發(fā)文數(shù)不少于3篇的作者和發(fā)文年度信息導(dǎo)入NetDraw軟件,得到以第一作者身份發(fā)文的作者-年度共現(xiàn)圖譜(圖2)。圖中方形節(jié)點表示發(fā)文年度,圓形節(jié)點表示作者,連線表示作者在該年度發(fā)表了論文,連線上的數(shù)字表示發(fā)文篇數(shù)。發(fā)文最多的作者潘連根在2004年~2007年共發(fā)表論文17篇,袁紅軍、金更達、薛四新、唐艷芳在四個年度內(nèi)均發(fā)表了論文,其他作者則在1年~3年間發(fā)表了不少于3篇論文。
圖2 高發(fā)文作者-年度共現(xiàn)圖譜
(2)發(fā)文第一作者地域分布。統(tǒng)計文獻中以第一作者發(fā)文最多的為河南省作者,其次是江蘇、浙江、上海和北京,以上省市第一作者發(fā)文接近統(tǒng)計文獻的一半,另外,湖北、廣東、山東和黑龍江第一作者發(fā)文數(shù)也都在30篇以上,作者涵蓋了28個?。ㄗ灾螀^(qū)、直轄市)。
表1 統(tǒng)計論文發(fā)文第一作者地域分布(單位:篇)
(3)作者合著網(wǎng)絡(luò)。合著網(wǎng)絡(luò)是因?qū)W者合著論文而形成的社會網(wǎng)絡(luò),[6]以圖譜形式來呈現(xiàn)清晰而直觀。圖3是合作發(fā)文2篇以上的作者合著網(wǎng)絡(luò)圖譜,圖中方形節(jié)點表示發(fā)文作者(附機構(gòu)以區(qū)分同名作者),合著關(guān)系通過連線體現(xiàn),連線上的數(shù)字為合作發(fā)文篇數(shù)。統(tǒng)計文獻獨著占比超過七成,合著網(wǎng)絡(luò)比較零散。
圖3 作者合著網(wǎng)絡(luò)圖譜
3.2 機構(gòu)統(tǒng)計與分析。(1)第一作者機構(gòu)發(fā)文數(shù)量。統(tǒng)計文獻中,第一作者發(fā)文機構(gòu)多達355家,其中224家僅發(fā)文1篇。最多的是解放軍南京政治學(xué)院上海分院(27篇),其次是浙江大學(xué)(22)、紹興文理學(xué)院(18)、武漢大學(xué)(17)、南京大學(xué)(16)、湘潭大學(xué)(15)。經(jīng)統(tǒng)計,第一作者發(fā)文數(shù)量前20個機構(gòu)的發(fā)文總數(shù)為246篇,占統(tǒng)計文獻的近四成。
利用NetDraw軟件繪出第一作者發(fā)文機構(gòu)-年度共現(xiàn)圖譜(圖4,發(fā)文大于等于5),圖中方形節(jié)點表示發(fā)文年度,圓形節(jié)點表示第一作者發(fā)文機構(gòu),連線表示某機構(gòu)在某年有第一作者發(fā)表了論文,連線上的數(shù)字表示發(fā)文篇數(shù)。解放軍南京政治學(xué)院上海分院、浙江大學(xué)、蘇州大學(xué)、中國人民大學(xué)、武漢大學(xué)、吉林大學(xué)連線校多,表明多數(shù)年份發(fā)表了論文。圖中可看出,高發(fā)文機構(gòu)僅一家基層檔案機構(gòu)。
圖4 高發(fā)文機構(gòu)-年度共現(xiàn)圖譜
(2)機構(gòu)類型發(fā)文分布。由于部分統(tǒng)計文獻作者機構(gòu)信息不完整,影響統(tǒng)計結(jié)果的準確性。統(tǒng)計文獻中,高校及其檔案館、圖書館發(fā)文量最大,占比達71.7%。
表2 第一作者機構(gòu)類型及發(fā)文數(shù)(單位:篇)
(3)機構(gòu)合著網(wǎng)絡(luò)。同作者合著網(wǎng)絡(luò)一樣,機構(gòu)合著網(wǎng)絡(luò)是因機構(gòu)合著論文而形成的社會網(wǎng)絡(luò)。利用NetDraw軟件可繪制機構(gòu)合著網(wǎng)絡(luò)圖譜(限篇幅,圖略),與圖2相似,機構(gòu)合著網(wǎng)絡(luò)也比較零散,沒有一家機構(gòu)與三家以上的機構(gòu)合作發(fā)文超過2篇。
3.3 主題分布與熱點分析。關(guān)鍵詞是從文獻的標(biāo)題和正文中抽取的最能夠反映文獻內(nèi)容的詞,通過分析其變化能把握學(xué)科發(fā)展的過程與規(guī)律,反映研究的熱點和發(fā)展動向。本文選用關(guān)鍵詞進行主題分析,并結(jié)合年度進行熱點分析。
統(tǒng)計文獻經(jīng)規(guī)范處理后,共有關(guān)鍵詞3050個,篇均4.61個(部分文獻有機標(biāo)關(guān)鍵詞,實際篇均數(shù)更少)。統(tǒng)計文獻涉及關(guān)鍵詞1139個,除“數(shù)字檔案館”外,前20位的其他關(guān)鍵詞出現(xiàn)的頻次在16~53之間,出現(xiàn)僅一次的關(guān)鍵詞達800個,可見研究的分散度較大。表3是頻次前20位的關(guān)鍵詞及出現(xiàn)頻次。
表3 頻次前20位的關(guān)鍵詞
表3體現(xiàn)了十年間數(shù)字檔案館研究的主要主題、研究熱點,但并不能很好地體現(xiàn)研究主題的演化和近期的熱點或趨勢。而利用NetDraw軟件繪出關(guān)鍵詞-年度共現(xiàn)圖譜(圖5,詞頻大于等于4),則能較好地得以體現(xiàn)(為使圖譜更清晰,隱藏了關(guān)鍵詞“數(shù)字檔案館”)。圖中方形節(jié)點表示年度,圓形節(jié)點表示關(guān)鍵詞,連線表示關(guān)鍵詞出現(xiàn)在該年度的論文中,連線上的數(shù)字表示關(guān)鍵詞各年出現(xiàn)的頻次。關(guān)鍵詞與年度的連線越多,表明該主題研究持續(xù)的時間越長,連線上的數(shù)字越大,則表明該年度該主題的研究越熱。
圖5 熱點主題-年度共現(xiàn)圖譜
從圖中可以看出,數(shù)字化、建設(shè)、檔案信息資源、電子文件等關(guān)鍵詞與年度連線較多,表明圍繞數(shù)字檔案館的這些研究持續(xù)時間較長,而云計算、信息技術(shù)、信息化、信息服務(wù)、知識管理等主要出現(xiàn)在近幾年,表明這些是數(shù)字檔案館研究的新熱點,體現(xiàn)出數(shù)字檔案館研究緊跟新技術(shù)、新研究的發(fā)展。
4 結(jié)論
通過以上統(tǒng)計和分析,可以得出以下基本結(jié)論。
4.1 檔案類期刊特別是核心期刊是數(shù)字檔案館研究的發(fā)文主體,是研究數(shù)字檔案館應(yīng)關(guān)注的重點文獻,當(dāng)然,學(xué)位論文也值得關(guān)注。
4.2 數(shù)字檔案館研究雖有一定數(shù)量的高發(fā)文作者,但高產(chǎn)作者占比偏低,同時鮮有發(fā)文較均勻出現(xiàn)在十年間或近幾年的核心作者,表明有關(guān)學(xué)者對數(shù)字檔案館研究的持續(xù)性和穩(wěn)定性不夠強。
4.3 作者獨立發(fā)文較多,合著較少,且合著作者多為同一單位,跨地域、跨機構(gòu)合作的情況較少,機構(gòu)合著情況亦如此,表明針對數(shù)字檔案館研究多為個人自由研究,缺乏較廣泛的合作。
4.4 高等學(xué)校及其檔案館、圖書館是發(fā)文主體,表明高校在數(shù)字檔案館研究方面的科研能力較強,同時有幾家高等學(xué)校十年間絕大多數(shù)年份有論文發(fā)表,表明部分高校該領(lǐng)域的研究有較強的持續(xù)性和穩(wěn)定性。
4.5 針對數(shù)字檔案館相關(guān)的數(shù)字化、建設(shè)、檔案信息資源等主題的研究持續(xù)時間長,且熱度不減,表明這些研究尚有待深入或完善;而近幾年針對數(shù)字檔案館的云計算、信息技術(shù)、信息化等研究,則表明數(shù)字檔案館的研究跟上了技術(shù)潮流,同時吸納和借鑒了其他領(lǐng)域的最新研究成果。
*本文系中央高?;究蒲袠I(yè)務(wù)費資助項目“檔案數(shù)字化的管理與應(yīng)用研究”(BESTI-JBKY-201104)成果之一。
參考文獻:
[1]羅沛霖.跨進21世紀的文化信息技術(shù)系統(tǒng)[J].中國科技論壇,1991(2):29~32.
[2]劉建平.中國檔案館的演化[J].蘭臺世界,1997(9):30~31.
[3]馮惠玲.無紙收藏《擁有新記憶——電子文件管理研究》摘要之二[J]. 檔案學(xué)通訊,1998(2):47~50.
[4]李繼紅.信息化進程中的檔案工作[J]. 檔案學(xué)通訊,1997(6):41~44.
[5]宗乾進,袁勤儉.回顧與展望:近十年我國檔案學(xué)研究全景透視[J]. 檔案學(xué)通訊,2012(2):12~16.
[6]程齊凱.檔案學(xué)合著網(wǎng)絡(luò)研究[J].檔案管理,2009(5):19~22.
(作者單位:北京電子科技學(xué)院圖書館(檔案館) 來稿日期:2013-12-18)