楊 楓
(南京師范大學(xué)檔案館, 江蘇 南京 210046)
數(shù)字檔案館作為傳統(tǒng)檔案館的虛擬形態(tài)和功能延伸,滿足了信息時代人們對于文件歸檔、長期保存及檔案信息開發(fā)利用等諸多需求[1]。數(shù)字檔案館在承擔(dān)永久保管數(shù)字化檔案使命的同時,還通過網(wǎng)絡(luò)和計算機(jī)為現(xiàn)代檔案工作者和傳統(tǒng)檔案館提供了開展數(shù)字化檔案收、管、用、數(shù)、研、展等方面的各種信息化服務(wù)功能。正因為數(shù)字檔案館符合時代發(fā)展的需要,因而越來越多的檔案館把數(shù)字檔案館建設(shè)作為重要工作內(nèi)容,關(guān)于數(shù)字檔案館的研究也越來越多。數(shù)字檔案館在研究和應(yīng)用上與檔案信息化有交集,以往研究成果顯示:我國檔案信息化研究的主體主要為高校的理論研究者,缺乏更廣域?qū)哟蔚难芯空遊2];檔案信息化研究成果數(shù)量呈穩(wěn)步增長趨勢,但總體質(zhì)量尚不理想,檔案信息化理論研究的成熟尚需時日[3];對數(shù)字檔案館信息資源問題的分析大多是從微觀角度出發(fā)進(jìn)行的探討[4],關(guān)于近10年來數(shù)字檔案館特征和發(fā)展趨勢的研究尚較為鮮見。
《檔案學(xué)研究》和《檔案學(xué)通訊》是檔案學(xué)領(lǐng)域非常重要的兩本核心期刊,也是中文社會科學(xué)引文索引(CSSCI)收錄的僅有的兩本檔案類核心期刊,其發(fā)表的論文在檔案學(xué)領(lǐng)域具有權(quán)威性,因此對這兩本期刊刊載的數(shù)字檔案館類論文進(jìn)行分析,可窺視該領(lǐng)域的最新發(fā)展趨勢和特點(diǎn)。本文擬從載文*除特殊標(biāo)注外,本文所指載文即為《檔案學(xué)研究》《檔案學(xué)通訊》兩刊載的數(shù)字檔案類論文。情況、作者情況、基金資助情況、引用情況和關(guān)鍵詞等方面來分析2007—2016年我國數(shù)字檔案館理論的研究特征和熱點(diǎn),總結(jié)該研究領(lǐng)域的發(fā)展趨勢。
1. 載文數(shù)量。2007—2016年《檔案學(xué)研究》和《檔案學(xué)通訊》兩刊每年所載數(shù)字檔案館類論文總體上無顯著增加或減少趨勢,載文量最低和最高的年份分別為2009年和2010年,分別為49篇和83篇。2007年、2008年和2015年、2016年的載文數(shù)量基本持平(圖1)。說明,在過去10年間,數(shù)字檔案館類研究成果數(shù)量無明顯的增減趨勢,研究者對該領(lǐng)域的關(guān)注度無明顯變化。
圖1 2007—2016年載文情況
2. 基金資助情況。2007—2016年《檔案學(xué)研究》和《檔案學(xué)通訊》兩刊在數(shù)字檔案館領(lǐng)域發(fā)表的624篇論文中,有239篇獲得了各類基金項目資助。其中,國家級項目、省部級項目、市廳級項目、校級項目分別為115項、111項、43項、28項。國家級項目包括國家社會科學(xué)基金項目和國家自然科學(xué)基金項目,其中國家社會科學(xué)基金項目數(shù)量最多(94項),類別包括重點(diǎn)項目、一般項目和青年基金項目。省部級項目中,教育部人文社會科學(xué)研究規(guī)劃項目有34項,是主要的資助類別,其余的省部級項目包括國家檔案局項目、省社會科學(xué)基金項目等。市廳級項目和校級項目所占比例相對較低??傮w來看,數(shù)字檔案類論文的基金資助級別較高,國家社會科學(xué)項目和教育部人文社會科學(xué)研究規(guī)劃項目是主要的資助類別,這為該類論文提供了一定的質(zhì)量保證。
3. 載文引用及下載情況。在2007—2016年發(fā)表的624篇數(shù)字檔案館類論文中,被引頻次10次以上的有202篇,約占32.4%,被引頻次在20次以上的有69篇,約占11.1%,而被引頻次在50次以上的僅有5篇,約占0.8%。由此可見,數(shù)字檔案類文章中高被引論文的數(shù)量仍不是很多,該領(lǐng)域論文的引用率有待進(jìn)一步提高。進(jìn)一步分析可知,數(shù)字檔案館類論文的被引頻次和下載次數(shù)之間存在極顯著(P<0.001)的一元線性回歸關(guān)系,這說明下載次數(shù)多的論文被引頻次也相應(yīng)更高(圖2)。
圖2 2007—2016年載文被引次數(shù)與下載次數(shù)關(guān)系
1.總體情況。根據(jù)洛特卡定律,生產(chǎn)1篇論文的作者數(shù)量約占所有作者數(shù)量的60%,并且生產(chǎn)n篇論文的作者數(shù)量大約是生產(chǎn)1篇論文作者數(shù)量的1/n2[5]。由圖3可知,生產(chǎn)1篇論文的作者數(shù)量約占所有作者數(shù)量的83.5%,遠(yuǎn)大于60%,并且本研究中載文的第一作者情況也不符合“生產(chǎn)n篇論文的作者數(shù)量大約是生產(chǎn)1篇論文作者數(shù)量的1/n2”這一規(guī)律。由此說明,我國數(shù)字檔案類研究具有相對較大的作者群,很多機(jī)構(gòu)和行業(yè)的作者參與其中。
(a)
(b)圖3 2007—2016年發(fā)文情況統(tǒng)計
2.核心作者群。本研究中的核心作者群是指在數(shù)字檔案館研究領(lǐng)域發(fā)文較多、對學(xué)科發(fā)展具有引領(lǐng)作用的研究群體。普賴斯定律指出,核心作者的最低發(fā)文量應(yīng)等于發(fā)表論文最多的作者的論文數(shù)開方的0.749倍[6]。2007—2016年《檔案學(xué)研究》《檔案學(xué)通訊》兩刊發(fā)文最多的作者10年間共發(fā)文12篇(表1),計算可得核心作者的最低發(fā)文量為2.59篇,約等于3篇,統(tǒng)計得到核心作者共有63人。這63人2007—2016年共發(fā)文296篇,占所有作者發(fā)文數(shù)(624篇)的47.4%,這與普賴斯定律所認(rèn)為的“核心作者發(fā)文量應(yīng)超過所有作者發(fā)文量的1/5[7]”相符。由此可見:一方面,我國數(shù)字檔案館研究領(lǐng)域已經(jīng)達(dá)到成熟學(xué)科所應(yīng)有的作者分布狀態(tài),該研究領(lǐng)域的論文作者比較集中,高產(chǎn)作者數(shù)量較多,已經(jīng)形成了具有一定規(guī)模的核心作者群;另一方面,該研究領(lǐng)域核心作者發(fā)文數(shù)大多為3篇以上,說明相關(guān)學(xué)者已經(jīng)對數(shù)字檔案館領(lǐng)域進(jìn)行了較深層次的研究甚至是追蹤研究。該核心作者群已經(jīng)成為我國數(shù)字檔案館研究領(lǐng)域的中堅力量。
3.核心單位群。2007—2016年以第一作者單位身份統(tǒng)計發(fā)文數(shù)5篇以上的單位共有27家,這27家單位發(fā)文總數(shù)量為457篇,占全部載文量的73.2%,這說明數(shù)字檔案館領(lǐng)域已經(jīng)形成了核心作者單位群,這些單位已經(jīng)成為發(fā)表數(shù)字檔案館類論文的骨干力量。其中,中國人民大學(xué)依托數(shù)據(jù)工程與知識工程教育部重點(diǎn)實驗室,在數(shù)字檔案館領(lǐng)域開展了卓有成效的研究工作,10年間發(fā)文數(shù)高達(dá)103篇。另外,值得關(guān)注的是,這些核心單位大多為“985工程”或“211工程”高校,其具有較為活躍的研究群體,在數(shù)字檔案館研究領(lǐng)域取得了令人矚目的成果(表2)。
表1 2007—2016年核心作者* 限第一作者。發(fā)文情況
表2 2007—2016年核心單位發(fā)文情況
通過對2007—2016年出現(xiàn)頻次超過2次的熱點(diǎn)關(guān)鍵詞進(jìn)行統(tǒng)計發(fā)現(xiàn),“電子文件”“數(shù)字檔案館”“電子檔案”“電子文件管理”“電子政務(wù)”“信息化”等詞匯的出現(xiàn)頻次較高,例如:“電子文件”在2007年、2009年、2011年、2012年、2013年、2014年、2015年的出現(xiàn)頻次均達(dá)10次以上,“電子文件”“電子檔案的傳遞方法”“保存機(jī)制”成為數(shù)字檔案館研究的核心內(nèi)容;“數(shù)字檔案館”在除2009年外的所有年份出現(xiàn)頻次均達(dá)5次以上。由此說明,雖然在過去10年間數(shù)字檔案館領(lǐng)域的研究方向各有側(cè)重,但這些關(guān)鍵詞所代表的研究內(nèi)容是持續(xù)的研究熱點(diǎn)?!半娮踊托畔⒒币恢笔菙?shù)字檔案館的研究熱點(diǎn),據(jù)此可推斷,它們也將是未來一定時期的研究熱點(diǎn)。此外,“檔案館網(wǎng)站”“信息安全”“前段控制”“長期保存”等關(guān)鍵詞出現(xiàn)的頻次也較高,說明學(xué)界對數(shù)字檔案館信息網(wǎng)絡(luò)系統(tǒng)的正常運(yùn)行及其安全保障方面的研究越來越重視。
2007—2009年是數(shù)字檔案館信息化重要時期,在此期間,“信息化”“信息服務(wù)”“檔案網(wǎng)站”等關(guān)鍵詞出現(xiàn)得較多;2012—2016年,隨著國家開始大力發(fā)展云計算、物聯(lián)網(wǎng)等高新技術(shù),“云計算”“物聯(lián)網(wǎng)”在數(shù)字檔案館研究中的出現(xiàn)頻次也相應(yīng)增加,而2015—2016年,大數(shù)據(jù)、互聯(lián)網(wǎng)+、移動互聯(lián)網(wǎng)(手機(jī)互聯(lián)網(wǎng))開始應(yīng)用于各行各業(yè),成為數(shù)字檔案館領(lǐng)域新的研究方向。
數(shù)字檔案館研究領(lǐng)域是一個不斷融入最新研究模型和方法的領(lǐng)域。在文獻(xiàn)分析中,OAIS模型、SOA法、DSGA法的出現(xiàn)頻次較高,這表明在過去的10年間,不同機(jī)構(gòu)的研究者應(yīng)用OAIS模型、SOA法、DSGA法進(jìn)行了較多的研究工作,這些研究工作對于提升數(shù)字檔案館的定量化研究水平和拓展新的研究領(lǐng)域起到了積極的作用。
盡管近10年來數(shù)字檔案館研究取得了較大的進(jìn)展,但目前該領(lǐng)域還存在以下問題。一是研究者地域分布不均衡,大多數(shù)研究者集中在東部經(jīng)濟(jì)發(fā)達(dá)地區(qū),而西部地區(qū)很少,這說明數(shù)字檔案館的建設(shè)和發(fā)展在我國還存在不平衡性。二是針對數(shù)字檔案館數(shù)據(jù)安全保障方面的研究還不夠深入,現(xiàn)有的研究還比較零散,缺乏數(shù)字檔案館數(shù)據(jù)安全長效維護(hù)機(jī)制和網(wǎng)絡(luò)防護(hù)方面的文章,也缺乏數(shù)字檔案館信息不穩(wěn)定問題方面的研究[8]。三是從法律角度對數(shù)字檔案館建設(shè)進(jìn)行維護(hù)的研究相對較少,缺少對數(shù)字檔案館的數(shù)字產(chǎn)品進(jìn)行知識產(chǎn)權(quán)保護(hù)的理論文章,也缺少數(shù)字檔案館法制人才建設(shè)方面的理論文章。四是對國外數(shù)字檔案館發(fā)展現(xiàn)狀和發(fā)展趨勢進(jìn)行研究的文章相對較少,而加強(qiáng)這方面的研究可為我國數(shù)字檔案館研究和建設(shè)提供可參考的經(jīng)驗。
近10年來數(shù)字檔案館研究領(lǐng)域呈現(xiàn)出與時俱進(jìn)的發(fā)展趨勢。2007—2011年,“信息化”“OAIS”等關(guān)鍵詞頻繁出現(xiàn),而在2012—2016年,“云計算”“物聯(lián)網(wǎng)”“互聯(lián)網(wǎng)+”等關(guān)鍵詞開始出現(xiàn),這些關(guān)鍵詞的轉(zhuǎn)換是與科技的進(jìn)步、網(wǎng)絡(luò)發(fā)展趨勢以及國家政策密切相關(guān)的,也促使數(shù)字檔案館研究領(lǐng)域向著以云計算、物聯(lián)網(wǎng)為支撐技術(shù)的方向發(fā)展。
面對數(shù)字檔案館建設(shè)進(jìn)程的不斷加速,檔案館藏模式會呈現(xiàn)實物與數(shù)字館藏并存、文本傳遞與網(wǎng)絡(luò)傳遞并存的特點(diǎn)。特別是隨著計算機(jī)科學(xué)的不斷發(fā)展,檔案部門將會把數(shù)字檔案館作為檔案建設(shè)的重要方向,在數(shù)字檔案館的建設(shè)中進(jìn)一步探索更成熟的理論。未來數(shù)字檔案館將不再是檔案館中獨(dú)立的部門,它將滲透到檔案館建設(shè)的方方面面,監(jiān)控各檔案職能部門的信息流和物質(zhì)流,面向社會各個階層提供開放的、高質(zhì)量的數(shù)字檔案文件。關(guān)于數(shù)字檔案館的研究也將上升到一個嶄新的高度。