肖榮時
自2002 年起,與數(shù)字檔案館有關(guān)的國家政策相繼出臺,如《全國檔案信息化建設(shè)實施綱要》《檔案事業(yè)發(fā)展“十二五”規(guī)劃》《數(shù)字檔案館建設(shè)指南》和《數(shù)字檔案室建設(shè)指南》等。2000 年,深圳率先開始了數(shù)字檔案館建設(shè)的探索[1]8。2014 年2 月,國家檔案局成立了“數(shù)字檔案館(室)建設(shè)領(lǐng)導小組”,開始統(tǒng)一領(lǐng)導全國數(shù)字檔案館的建設(shè)工作[2]1。但就目前國內(nèi)數(shù)字檔案館的研究現(xiàn)狀來看,雖然文獻數(shù)量較多,但對于數(shù)字檔案館的研究熱點、研究趨勢、研究前沿以及核心作者與研究機構(gòu)沒有交待清楚。隨著我國數(shù)字檔案館建設(shè)不斷地推進,對數(shù)字檔案館的相關(guān)研究進行系統(tǒng)回顧和總結(jié)的必要性顯得愈來愈突出。
本文使用定性分析和定量分析相結(jié)合的研究方法,借助知識圖譜軟件——CiteSpace,對目前國內(nèi)關(guān)于數(shù)字檔案館研究的相關(guān)問題進行全面的回顧與總結(jié)分析,以期為我國未來數(shù)字檔案館的研究以及數(shù)字檔案館的實踐發(fā)展提供有益的指導與幫助。
1.數(shù)據(jù)來源。本文以中國知網(wǎng)(CNKI)作為數(shù)據(jù)來源,結(jié)合領(lǐng)域的實際發(fā)展狀況,以“數(shù)字檔案館”為篇名或者關(guān)鍵詞進行檢索(檢索時間為2020 年5 月5 日),文獻時間跨度為1999—2020 年,文獻類型選擇核心期刊和CSSCI 來源期刊,剔除一些與主題不符的會議通知、公告等記錄,共獲得有效文獻1325 篇。
2.研究工具。知識圖譜以科學知識為研究對象,能夠清晰展示科學知識的發(fā)展歷程、研究趨勢以及不同知識域之間的結(jié)構(gòu)關(guān)系[3]242。CiteSpace 作為一款信息可視化軟件,在知識圖譜的相關(guān)研究中應(yīng)用廣泛,本文引入CiteSpace 信息可視化分析軟件,繪制關(guān)于國內(nèi)數(shù)字檔案館研究的關(guān)鍵詞共現(xiàn)知識圖譜、關(guān)鍵詞知識聚類圖譜、發(fā)文作者合作知識圖譜以及發(fā)文機構(gòu)合作知識圖譜等,探究我國數(shù)字檔案館目前的研究現(xiàn)狀和熱點問題以及未來數(shù)字檔案館的研究趨勢,并分析數(shù)字檔案館研究作者和機構(gòu)之間的合作關(guān)系。
除了知識圖譜外,本文還采用了文獻計量工具來反映文獻分布與增長規(guī)律。根據(jù)布拉福德定律[4]257,當某一研究領(lǐng)域相關(guān)文獻發(fā)表的學術(shù)期刊的發(fā)文量呈現(xiàn)不均勻分布時,發(fā)文數(shù)量與所發(fā)表期刊的專業(yè)密切程度相關(guān)。按期刊的載文量由高到低排序,可以把期刊分為核心區(qū)、相關(guān)區(qū)和非相關(guān)區(qū)。核心區(qū)數(shù)量計算方法是R0=2ln(eE*Y)。其中,R0為核心區(qū)數(shù)量,E 為歐拉系數(shù),E=0.5772,Y 為最大發(fā)文量期刊的載文量。
普萊斯定律能夠?qū)δ硞€領(lǐng)域核心作者進行衡量,核心作者是指能夠在某一研究領(lǐng)域進行持續(xù)地研究,并且是對該領(lǐng)域研究者產(chǎn)生一定影響的作者。作者發(fā)表該領(lǐng)域論文的數(shù)量,在一定程度上可以反映出其影響力。根據(jù)普賴斯定律[5]152,即“在某一特定領(lǐng)域中,全部論文的半數(shù)系由該領(lǐng)域中全部作者人數(shù)的平方根的‘核心作者’撰寫的”,其計算公式為:m=0.749,其中Nmax為最高產(chǎn)作者所發(fā)表的論文數(shù)。
1.文獻發(fā)表年份分析。從數(shù)字檔案館研究文獻的年份分布(圖1)可見,我國數(shù)字檔案館研究大致經(jīng)歷了三個階段。1999—2001 年為起步階段,關(guān)于數(shù)字檔案館研究的首篇核心期刊文獻出現(xiàn)于1999 年,介紹了一種新興的電子檔案著錄標準——EAD[6]15。其后,關(guān)于數(shù)字檔案館的介紹開始逐步增多[7]19,數(shù)字檔案館的相關(guān)概念也開始逐漸引起我國檔案界學者的重視。該階段的發(fā)文量較少(24 篇),占所有年份文獻數(shù)量的1.81%。2002—2013 年為快速發(fā)展階段,主要關(guān)注我國數(shù)字檔案館在發(fā)展過程中遇到的問題以及解決策略[8]6。該階段共發(fā)表文獻數(shù)量886 篇,占發(fā)文總數(shù)的66.87%。2014 年至今為成熟階段,更加注重數(shù)字檔案館的實際應(yīng)用[9]129,強調(diào)理論與實踐的結(jié)合。雖然該階段的文獻數(shù)量有所下降(415 篇),但文獻的質(zhì)量進一步提升。由此可見,我國數(shù)字檔案館研究隨著時間推移而不斷取得新進展。
圖1 數(shù)字檔案館文獻年度發(fā)文統(tǒng)計
2.期刊來源分析。分析數(shù)字檔案館研究文獻的來源期刊分布,既能為數(shù)字檔案館的相關(guān)研究學者發(fā)表論文提供指導,也方便辦刊者把握辦刊方向。經(jīng)過統(tǒng)計發(fā)現(xiàn),1325 篇文獻共分布在68 種期刊中,其中發(fā)文量大于等于10 篇的期刊共有12 種,從期刊的載文數(shù)量來看,《蘭臺世界》以225 篇載文量居于榜首;排名第二的是《中國檔案》,載文量160 篇;排名第三的是《浙江檔案》,載文量145 篇。
根據(jù)布拉福德定律,當某一研究領(lǐng)域相關(guān)文獻發(fā)表的學術(shù)期刊的發(fā)文量呈現(xiàn)不均勻分布時,發(fā)文數(shù)量與所發(fā)表期刊的專業(yè)密切程度相關(guān)。根據(jù)布拉福德定律的計算公式,核心區(qū)數(shù)量計算方法是R0=2ln(eE*Y),本研究中發(fā)文數(shù)量最多的期刊為《蘭臺世界》225 篇。因此R0=2ln(eE*225)=11.99,對R0進行取整,則R0=12。因此,可以判斷出排名前11 位的來源期刊為數(shù)字檔案館發(fā)文期刊的核心區(qū)。核心區(qū)的11 種期刊共發(fā)表文獻數(shù)量1207 篇,平均每本期刊載文數(shù)量為109.73 篇,占所有文獻比例的91.09%。根據(jù)布拉福德定律可以發(fā)現(xiàn),我國數(shù)字檔案館的相關(guān)研究文獻整體上呈現(xiàn)較為集中的分布特征,《蘭臺世界》《中國檔案》《浙江檔案》《檔案學研究》《檔案與建設(shè)》《檔案學通訊》《檔案管理》是我國數(shù)字檔案館相關(guān)研究的主要發(fā)文陣地。
1.核心作者分析。核心作者是指能夠在某一研究領(lǐng)域進行持續(xù)研究,并且對該領(lǐng)域研究產(chǎn)生一定影響的作者。作者發(fā)表該領(lǐng)域論文的數(shù)量,在一定程度上可以反映出其影響力。根據(jù)普賴斯定律,即,核心作者的計算公式為:M=0.749,其中Nmax為最高產(chǎn)作者所發(fā)表的論文數(shù)。在本研究中,發(fā)文最多的作者為來自紹興文理學院的潘連根,發(fā)表文獻數(shù)量為16 篇。根據(jù)普賴斯定理,Nmax=16,則計算得出M=3,則發(fā)表文章數(shù)量在3 篇及3 篇以上的作者為國內(nèi)數(shù)字檔案館研究的核心作者。本研究中發(fā)文量大于等于3 篇的作者共有67位,其中發(fā)文量最多的是潘連根(16 篇);其次為來自浙江大學公共管理學院的傅榮校、上海大學圖書館的倪代川、國防大學政治學院的程妍妍,發(fā)表文獻數(shù)量分別為15 篇、14 篇、14 篇。此外,清華大學檔案館的薛四新(13 篇)、上海師范大學人文與傳播學院的呂元智(11篇)、浙江大學檔案館的金更達(10 篇)、中國人民大學信息資源管理學院的安小米(10 篇)、湘潭大學公共管理學院的唐艷芳(10 篇)等作者也是國內(nèi)數(shù)字檔案館的主要研究作者。從作者所屬的機構(gòu)來看,發(fā)表文獻數(shù)量較多的學者主要來自中國人民大學、上海大學、上海師范大學等高校。從作者首次發(fā)表文獻的時間來看,吉林大學管理學院的王萍、浙江大學公共管理學院的傅榮校、上海師范大學人文與傳播學院的呂元智、湘潭大學公共管理學院的唐艷芳等,不僅是我國數(shù)字檔案館研究的核心學者,同時也是數(shù)字檔案館研究的起源學者。
2.作者合作分析。圖2 為利用CiteSpace 軟件繪制的核心作者的合作關(guān)系圖譜,每一個節(jié)點代表一位作者的發(fā)文,節(jié)點越大,表示該作者的發(fā)文數(shù)量越多,節(jié)點之間的連線表示作者之間的合作關(guān)系,連線越粗,表明作者之間的合作次數(shù)較少;反之,則合作次數(shù)越多。
圖2 數(shù)字檔案館研究作者合作知識圖譜
從所獲得的圖譜數(shù)據(jù)來看,圖譜中共有762 個節(jié)點,290 條連線,網(wǎng)絡(luò)密度為0.001。整體來看,我國數(shù)字檔案館研究作者之間的合作關(guān)系比較松散,從局部來看,部分作者之間也存在一定的學術(shù)交流與論文合作,如薛四新、陶水龍、徐華、張曉、崔偉等學者之間存在較強的合作關(guān)系;安小米、孫舒揚之間存在一定的合作關(guān)系;李慎民、楊秉光之間存在一定的合作關(guān)系;劉越男與張寧、傅榮校與解俞、顏祥林與王興婭、倪代川與金波、姚樂野與蔡娜、金更達與何嘉蓀、王萍與張衛(wèi)東、謝海洋與卞昭玲、謝永憲與王巧玲等之間存在一定的合作關(guān)系。但存在論文合著的研究作者占總體研究作者的很少一部分,反映出我國數(shù)字檔案館研究作者之間的合作較少,而且主要以同區(qū)域或者同機構(gòu)合作為主,跨區(qū)域、跨學科之間的合作相對較少。因此在未來的研究中,我國數(shù)字檔案館研究應(yīng)加深不同區(qū)域、不同學校之間的合作,促進不同學術(shù)觀點的交流與探討。
3.核心機構(gòu)分析。根據(jù)普賴斯定律,核心機構(gòu)的計算公式為:M=0.749 ,其中Nmax為最高產(chǎn)機構(gòu)發(fā)表文獻數(shù)。在本研究文最多的機構(gòu)為中國人民大學,發(fā)表文獻數(shù)量為73 篇,根據(jù)普賴斯定理,Nmax=73,計算得出M=6.40,即發(fā)文數(shù)量在6 篇及6 篇以上的機構(gòu)為國內(nèi)數(shù)字檔案館研究的核心機構(gòu)。經(jīng)過統(tǒng)計分析,國內(nèi)數(shù)字檔案館研究發(fā)文量大于等于6 篇的機構(gòu)共有35 所,其中發(fā)表文獻數(shù)量最多的為中國人民大學(73篇),其次為上海大學和南京政治學院上海校區(qū),發(fā)表文獻數(shù)量分別為58 篇和43 篇。此外,武漢大學(42篇)、南京大學(36 篇)、浙江大學(31 篇)、湘潭大學(24篇)、南昌大學(20 篇)、四川大學(20 篇)、國家檔案局(19 篇)等機構(gòu)也是國內(nèi)數(shù)字檔案館的主要研究機構(gòu)。從機構(gòu)所屬的地域范圍來看,北京、上海是我國數(shù)字檔案館研究的主要省份,反映出北京、上海憑借其地理位置、人才、資源等優(yōu)勢在我國數(shù)字檔案館的研究中占據(jù)重要地位。從機構(gòu)首次發(fā)表文獻的時間來看,武漢大學、四川大學、蘇州大學、中國人民大學、國家檔案局、浙江大學、上海大學等研究機構(gòu),不僅是我國數(shù)字檔案館研究的核心機構(gòu),同時也是數(shù)字檔案館研究的起源機構(gòu)。
4.機構(gòu)合作分析。利用CiteSpace 軟件繪制發(fā)文機構(gòu)合作知識圖譜(見圖3),圖譜中共有493 個節(jié)點,159條連線,網(wǎng)絡(luò)密度為0.0013。整體來看,我國數(shù)字檔案館研究機構(gòu)之間的合作關(guān)系比較松散,從局部來看,少數(shù)機構(gòu)之間也存在一定的學術(shù)交流與論文合作,如以中國人民大學為核心的研究機構(gòu)團體,其成員主要包括武漢大學、南昌大學、上海交通大學、北京航空航天大學、華中師范大學、江蘇大學、北京大學、遼寧省檔案局等。除此之外,上海大學與廣西民族大學也存在一定的合作關(guān)系;北京市檔案局、清華大學、北京聯(lián)合大學、福建師范大學等研究機構(gòu)之間也存在一定的合作關(guān)系;浙江大學、國家檔案局、浙江省檔案局等研究機構(gòu)之間也存在一定的合作關(guān)系;南京大學、西北大學等研究機構(gòu)之間也存在一定的合作關(guān)系;河北大學、華北電力大學等研究機構(gòu)之間也存在一定的合作關(guān)系;天津師范大學、天津市檔案局、天津大學等研究機構(gòu)之間也存在一定的合作關(guān)系。但論文合著的研究機構(gòu)僅占總體研究機構(gòu)的很少一部分,反映出我國數(shù)字檔案館研究機構(gòu)之間的合作關(guān)系還有待進一步強化。
圖3 數(shù)字檔案館研究機構(gòu)合作知識圖譜
1.研究熱點分析。關(guān)鍵詞可以反映出一個領(lǐng)域的研究熱點以及研究主題。一般而言,如果一個關(guān)鍵詞出現(xiàn)的次數(shù)越多,則表明該關(guān)鍵詞所反映的研究問題是該領(lǐng)域的研究熱點[10]111。中心度是度量關(guān)鍵詞在該研究領(lǐng)域的重要程度的量,其值越大,說明該關(guān)鍵詞越重要。利用CiteSpace 對所獲取的文獻數(shù)據(jù)進行可視化處理,同時使用CiteSpace 繪制出關(guān)于國內(nèi)數(shù)字檔案館研究的關(guān)鍵詞共現(xiàn)知識圖譜。為了便于統(tǒng)計與分析,分別提取出頻率和中心度排名前20 的關(guān)鍵詞。在數(shù)字檔案館研究關(guān)鍵詞共現(xiàn)知識圖譜中,每一個節(jié)點代表一個關(guān)鍵詞,節(jié)點間連線代表關(guān)鍵詞與關(guān)鍵詞之間的共現(xiàn)關(guān)系,關(guān)鍵詞字體的大小代表該關(guān)鍵詞出現(xiàn)的頻次的高低,即關(guān)鍵詞字體越大,該關(guān)鍵詞出現(xiàn)的次數(shù)越多,關(guān)鍵詞字體越小,該關(guān)鍵詞出現(xiàn)的次數(shù)越少。
圖4 數(shù)字檔案館研究關(guān)鍵詞共現(xiàn)知識圖譜
如圖4 所示,數(shù)字檔案館、檔案信息資源、電子文件是該關(guān)鍵詞知識圖譜中頻次最大的三個節(jié)點,關(guān)鍵詞頻次分別為936、118、82。除此之外,數(shù)字檔案、檔案、檔案信息化建設(shè)、電子檔案、電子文件中心、云計算、數(shù)字檔案資源、檔案信息、檔案局、國家檔案局、信息服務(wù)、智慧檔案館、檔案管理、檔案信息化、知識管理、檔案工作、企業(yè)、數(shù)字圖書館、檔案館、檔案部門、檔案資源、企業(yè)管理等關(guān)鍵詞的頻次也較高。
其次,關(guān)鍵詞的中心度越高,說明該關(guān)鍵詞所在的網(wǎng)絡(luò)位置越重要,在知識圖譜中發(fā)揮著越重要的作用。在中心性超過0.1 的關(guān)鍵節(jié)點中,檔案管理、檔案工作、檔案數(shù)據(jù)庫是中心度最高的三個關(guān)鍵詞,中心度的數(shù)值分別為0.4、0.3、0.27。除此之外,檔案信息資源、檔案局、現(xiàn)行文件、國家檔案局、檔案信息化建設(shè)、檔案室、檔案信息、檔案信息化、電子文件中心、企業(yè)、檔案事業(yè)、檔案資源、檔案服務(wù)、oai、館藏檔案數(shù)字化、數(shù)字檔案資源等關(guān)鍵詞的中心度也較高。
為了更好地分析和比較高頻關(guān)鍵詞背后的含義,利用CiteSpace 中的聚類功能,對關(guān)鍵詞共現(xiàn)知識圖譜進行聚類分析(見下頁表1)。通過CiteSpace 中的LLR算法提取關(guān)鍵詞數(shù)據(jù),自動生成國內(nèi)數(shù)字檔案館研究的高頻關(guān)鍵詞聚類知識圖譜(見圖5)。根據(jù)聚類圖譜中的Q 值和S 值顯示,Modularity=0.7677>0.3,Mean Silhouette=0.5585>0.5,說明聚類效果較好,聚類有明顯的輪廓。
圖5 數(shù)字檔案館研究關(guān)鍵詞聚類知識圖譜
通過關(guān)鍵詞聚類知識圖譜可以發(fā)現(xiàn),我國數(shù)字檔案館研究主要分為11 個小類別,在綜合高頻關(guān)鍵詞共現(xiàn)知識圖譜和關(guān)鍵詞聚類圖譜的基礎(chǔ)上可以發(fā)現(xiàn),我國數(shù)字檔案館的相關(guān)研究話題主要集中在數(shù)字檔案館的概念[11]50、數(shù)字檔案館的發(fā)展模式[12]87、數(shù)字檔案館的體系構(gòu)建[13]62、知識共享[14]64等相關(guān)熱點話題的研究上。
2.研究前沿分析。關(guān)鍵詞的突現(xiàn)度可以反映出某段時間內(nèi)影響力較大的研究方向或研究領(lǐng)域,是每一個階段的研究前沿具體體現(xiàn),利用CiteSpace 的突現(xiàn)詞可以分析我國數(shù)字檔案館的研究前沿。本次共獲取到25個突現(xiàn)詞的相關(guān)信息(如表2 所示)。從關(guān)鍵詞突現(xiàn)程度來看,排名前5 位的突現(xiàn)關(guān)鍵詞分別為智慧檔案館、數(shù)字檔案資源、數(shù)字檔案、云計算、知識管理。從突現(xiàn)關(guān)鍵詞的持續(xù)時間來看,“數(shù)字檔案資源”持續(xù)時間最長(9 年),檔案信息資源、大數(shù)據(jù)、智慧檔案館、數(shù)字檔案等突現(xiàn)詞持續(xù)時間也較長。從突現(xiàn)詞的時間分布來看,1999—2005 年,我國數(shù)字檔案館的研究前沿主要集中在檔案信息資源、檔案信息、數(shù)字化檔案信息、館藏檔案、數(shù)字化、利用者、檔案數(shù)據(jù)庫、館藏檔案數(shù)字化、檔案網(wǎng)站等相關(guān)研究話題;2006—2010 年,我國數(shù)字檔案館的研究前沿主要集中在oai、檔案用戶、電子文件中心、信息服務(wù)、知識管理、檔案信息化、檔案登記備份、信息資源等相關(guān)研究話題。從最新的突現(xiàn)詞來看,云計算、數(shù)字檔案資源、生態(tài)系統(tǒng)、大數(shù)據(jù)、智慧檔案館、數(shù)字檔案、電子檔案等相關(guān)話題是未來我國數(shù)字檔案館的研究重點以及研究前沿??梢?,我國數(shù)字檔案館研究每一階段都有不同的側(cè)重點,研究內(nèi)容也隨時間推移不斷發(fā)生變化。
表1 數(shù)字檔案館研究關(guān)鍵詞主要聚類分布
表2 Top 25 Keywords with the Strongest Citation Bursts
本研究以國內(nèi)數(shù)字檔案館研究文獻為對象,以中國知網(wǎng)中核心期刊和CSSCI 來源期刊中的1325 篇文獻為數(shù)據(jù)基礎(chǔ),使用CiteSpace 可視化軟件繪制了關(guān)鍵詞共現(xiàn)知識圖譜、關(guān)鍵詞聚類知識圖譜、突現(xiàn)詞、作者合作知識圖譜以及機構(gòu)合作知識圖譜,綜合利用布拉福德定律、普賴斯定律等文獻計量學基礎(chǔ)理論,對1325 篇文獻進行了定量與定性的科學分析。主要研究結(jié)論如下。
(1)從發(fā)文時間來看,我國國內(nèi)數(shù)字圖書館研究大致經(jīng)歷了起步階段、快速發(fā)展階段、成熟階段,我國數(shù)字圖書館的相關(guān)研究隨著社會實踐的不斷發(fā)展,取得新的研究成果。
(2)從期刊來源來看,利用布拉福德定律探究了我國數(shù)字檔案館研究的核心期刊,結(jié)果發(fā)現(xiàn),《蘭臺世界》《中國檔案》《浙江檔案》《檔案學研究》等相關(guān)期刊是我國數(shù)字檔案館研究文獻的核心發(fā)文期刊。
(3)從作者分布來看,利用普賴斯定律確定了潘連根、傅榮校、倪代川、程妍妍等是我國數(shù)字檔案館研究的主要學者;從作者之間的合作關(guān)系來看,作者之間的合作程度較低,在未來的相關(guān)研究中,應(yīng)加強不同學科、不同領(lǐng)域之間學者的溝通與交流。
(4)從機構(gòu)分布來看,利用普賴斯定律確定了我國數(shù)字檔案館研究核心機構(gòu),中國人民大學、上海大學和南京政治學院上海校區(qū)、武漢大學、南京大學、浙江大學等研究機構(gòu)是我國數(shù)字檔案館研究的主要機構(gòu);從機構(gòu)之間的合作關(guān)系來看,我國數(shù)字檔案館研究機構(gòu)之間的合作關(guān)系并不緊密,不同機構(gòu)之間缺乏合作,有待進一步強化合作。
(5)從研究熱點來看,當前我國數(shù)字檔案館的相關(guān)研究主要集中在數(shù)字檔案館的概念、數(shù)字檔案館的發(fā)展模式、數(shù)字檔案館的體系構(gòu)建、知識共享等熱點話題上。
(6)從研究前沿來看,未來我國數(shù)字檔案館的相關(guān)研究前沿將會主要集中在云計算、數(shù)字檔案資源、生態(tài)系統(tǒng)、大數(shù)據(jù)、智慧檔案館、數(shù)字檔案、電子檔案等相關(guān)話題上。