李順
(黑龍江大學(xué)信息管理學(xué)院 哈爾濱 150080)
基于知識(shí)圖譜的數(shù)字檔案館研究可視化分析
李順
(黑龍江大學(xué)信息管理學(xué)院 哈爾濱 150080)
隨著信息技術(shù)的發(fā)展與滲透,我國(guó)數(shù)字檔案館的理論研究碩果頗豐,實(shí)踐經(jīng)驗(yàn)不斷積累。本文以收錄于CNKI的核心期刊論文和碩博論文為文獻(xiàn)來(lái)源,以CitespaceⅤ為主要分析工具,對(duì)我國(guó)數(shù)字檔案館研究現(xiàn)狀和研究前沿進(jìn)行可視化分析,以期為過(guò)去的數(shù)字檔案館研究工作提供經(jīng)驗(yàn)總結(jié)和未來(lái)的數(shù)字檔案館研究方向提供思路。
數(shù)字檔案館 Citespace 可視化分析
以CNKI為檢索平臺(tái),以篇名為檢索項(xiàng),檢索詞為“數(shù)字檔案館”,將數(shù)據(jù)來(lái)源設(shè)定為北大最新核心期刊目錄中我國(guó)檔案事業(yè)的八本核心期刊:《檔案學(xué)研究》《檔案學(xué)通訊》《中國(guó)檔案》《北京檔案》《檔案管理》《浙江檔案》《檔案與建設(shè)》和《山西檔案》,選中“中英文擴(kuò)展檢索”,檢索時(shí)間為2016年11月25日上午10時(shí)56分,檢索到論文462篇,過(guò)濾掉與本文不相關(guān)的期刊卷首語(yǔ)和新聞報(bào)道30篇,得到有效論文樣本432篇。為了提高數(shù)據(jù)的完整性和分析結(jié)果的客觀性,再以CNKI為檢索平臺(tái),以關(guān)鍵詞為檢索項(xiàng),檢索詞為“數(shù)字檔案館”,年限不限,優(yōu)秀論文級(jí)別不限,檢索到碩博論文166篇,經(jīng)瀏覽、核對(duì),所有碩博論文均符合本文的數(shù)據(jù)要求,取全部作為有效論文樣本。
本文所使用的分析工具為Microsoft Excel 2013和CitespaceⅤ。Microsoft Excel 2013是微軟公司開(kāi)發(fā)的辦公軟件Microsoft Office的組件,具有強(qiáng)大的數(shù)據(jù)處理、分析的功能。本文擬運(yùn)用Microsoft Excel 2013統(tǒng)計(jì)每年的論文發(fā)文量,并以此得出折線圖,為分析我國(guó)數(shù)字檔案館研究現(xiàn)狀及變化趨勢(shì)提供依據(jù)。CitespaceⅤ是應(yīng)用Java語(yǔ)言開(kāi)發(fā)的基于共被引分析的可視化軟件,通過(guò)對(duì)科學(xué)文獻(xiàn)的共被引進(jìn)行分析,得出學(xué)科領(lǐng)域演化的路徑和知識(shí)拐點(diǎn)。運(yùn)用CitespaceⅤ,用戶可以根據(jù)同一數(shù)據(jù)樣本,通過(guò)不同的屬性設(shè)置,得出不同的知識(shí)圖譜,以從多個(gè)角度展示數(shù)據(jù)演化特征。在知識(shí)圖譜中,節(jié)點(diǎn)的大小與其出現(xiàn)的頻次呈正相關(guān)的關(guān)系,節(jié)點(diǎn)越大,說(shuō)明其出現(xiàn)頻次越多;節(jié)點(diǎn)越小,說(shuō)明其出現(xiàn)頻次越少。Burst Terms(突現(xiàn)詞)是指某段時(shí)間內(nèi)頻次變化率高的詞,用戶可以據(jù)此分析科學(xué)領(lǐng)域的研究前沿。本文擬運(yùn)用Citespace軟件探索我國(guó)數(shù)字檔案館研究的作者分布、研究熱點(diǎn)和研究前沿。
對(duì)檢索結(jié)果按照年度進(jìn)行匯總,得到表1。從表1中可以看出,我國(guó)最早研究“數(shù)字檔案館”的期刊論文是發(fā)表于2000年的三篇論文,最早的碩博論文發(fā)表于2001年。圖1是根據(jù)表1生成的折線圖,直觀地反映出17年間我國(guó)數(shù)字檔案館研究的期刊發(fā)文量、碩博論文量和論文總量走勢(shì)。圖1顯示,期刊發(fā)文量反復(fù)無(wú)常,共出現(xiàn)三個(gè)峰值和兩個(gè)低谷。在研究初期,碩博論文量穩(wěn)步上升,在2004年達(dá)到峰值,但是隨后迅速下降,直到2006年出現(xiàn)第一個(gè)低谷。在2006年至2009年,期刊論文量再次出現(xiàn)波動(dòng),隨后至2014年,能夠呈現(xiàn)穩(wěn)步發(fā)展的態(tài)勢(shì),并于2014年達(dá)到峰值,這是我國(guó)學(xué)者開(kāi)始研究“數(shù)字檔案館”以來(lái)的最高峰值。但是自2014年以來(lái),期刊論文發(fā)文量有下降趨勢(shì)??偟膩?lái)說(shuō),我國(guó)數(shù)字檔案館研究的發(fā)文量有多次波動(dòng),但是整體上呈現(xiàn)上升趨勢(shì)。與期刊論文不同,碩博論文的發(fā)文量波動(dòng)不大,發(fā)展平穩(wěn)。最早研究“數(shù)字檔案館”的碩博論文出現(xiàn)在2001年,在之后的三年內(nèi),成果寥寥。從2003年開(kāi)始,論文數(shù)量有所增加,但是并未持續(xù)太長(zhǎng)時(shí)間,2005年之后,開(kāi)始減少,并在2006年達(dá)到最低值。由此可以看出,“數(shù)字檔案館”在其發(fā)展初期,并未受到碩士生和博士生的青睞。2006年以后,碩博論文數(shù)量開(kāi)始增加,波動(dòng)微小,在2007年至2014年的八年間,碩博論文的數(shù)量每年都會(huì)保持在13篇以上,在2014年達(dá)到最大值21篇。近兩年來(lái),碩博論文又有下降的趨勢(shì)。
表1 數(shù)字檔案館研究年度論文量統(tǒng)計(jì)表
圖1 數(shù)字檔案館研究發(fā)文量年度分布折線圖
“數(shù)字檔案館”發(fā)展的17年,可以分為兩個(gè)階段:探索期(2000—2009)和拓展期(2010年至今)。在探索期,期刊論文量波動(dòng)較大,折線圖上清晰地呈現(xiàn)出兩個(gè)“∩”形狀,表示我國(guó)學(xué)者曾經(jīng)進(jìn)行過(guò)兩次艱難的探索,第二次探索的峰值和最低值都比初次探索大,由此可見(jiàn),在初次探索研究成果的基礎(chǔ)上,對(duì)“數(shù)字檔案館”的第二次探索吸引了越來(lái)越多的學(xué)者。在拓展期,2010年6月,國(guó)家檔案局發(fā)布了《數(shù)字檔案館建設(shè)指南》,對(duì)數(shù)字檔案館的建設(shè)、系統(tǒng)功能、開(kāi)發(fā)與服務(wù)平臺(tái)的構(gòu)建、檔案信息資源建設(shè)、保障體系建設(shè)等工作提出要求,這是我國(guó)第一個(gè)關(guān)于數(shù)字檔案館建設(shè)的政策性文件,它不僅為數(shù)字檔案館建設(shè)實(shí)踐作出指示、提供參考,還帶來(lái)了我國(guó)數(shù)字檔案館研究的新高潮。
1.高頻作者選取。在CitespaceⅤ軟件界面中,設(shè)置Time=“From 2000 To 2016”,Year Per Slicing=“1”,Node Type=“Auther”,Selection Criteria設(shè)置為T(mén)OP N,N=50。運(yùn)行CitespaceⅤ,設(shè)置Threshold=2,即選取出現(xiàn)頻次大于2的作者,得到數(shù)字檔案館研究作者分析圖譜(圖2)、數(shù)字檔案館研究高頻作者信息表(表2)和數(shù)字檔案館研究突現(xiàn)作者信息圖(圖3)。
圖2 數(shù)字檔案館研究作者分析圖譜
圖3 數(shù)字檔案館研究突現(xiàn)作者信息圖
表2 數(shù)字檔案館研究高頻作者信息表
從分析圖譜中可以看到,從數(shù)字檔案館研究的第一篇論文出現(xiàn)的2000年,到2016年的17年間,發(fā)文量最高的是傅榮校、薛四新等人,其中潘連根、金更達(dá)和程妍妍三人能夠在兩三年內(nèi)取得較多研究成果,平均每年發(fā)文量均在三篇以上。
2.高頻作者分析。傅榮校是我國(guó)最早研究“數(shù)字檔案館”的眾多學(xué)者之一,其最早關(guān)于數(shù)字檔案館的論文是發(fā)表于2001年的《關(guān)于數(shù)字檔案館的思考》和《認(rèn)識(shí)數(shù)字檔案館——兼論數(shù)字檔案館與虛擬檔案館的區(qū)別》。前者對(duì)數(shù)字檔案館的概念進(jìn)行了界定,并剖析了數(shù)字檔案館與檔案館上網(wǎng)、數(shù)字檔案館與檔案館的數(shù)字化的區(qū)別和聯(lián)系;對(duì)比了數(shù)字檔案館與傳統(tǒng)檔案館的功能,指出“數(shù)字檔案館無(wú)論在技術(shù)與管理理念上都要比傳統(tǒng)檔案館更先進(jìn)”;探索數(shù)字檔案館與電子文件的關(guān)系,認(rèn)為“電子文件的保管模式直接影響數(shù)字檔案館的技術(shù)支持”;研究了數(shù)字圖書(shū)館與數(shù)字檔案館的區(qū)別,建議數(shù)字檔案館的建設(shè)應(yīng)該借鑒圖書(shū)情報(bào)部門(mén)對(duì)數(shù)字圖書(shū)館的研究成果[1]26?!蛾P(guān)于數(shù)字檔案館的思考》在中國(guó)知網(wǎng)上被下載585次,被引用59次,被引率(被引用次數(shù)與被下載次數(shù)的比值)10%,觀點(diǎn)鮮明,為我國(guó)數(shù)字檔案館研究奠定學(xué)術(shù)基礎(chǔ)。
金更達(dá)對(duì)數(shù)字檔案館的建設(shè)問(wèn)題和服務(wù)模式作出了深入研究,認(rèn)為在政務(wù)信息公開(kāi)的環(huán)境下,集成管理和集成服務(wù)模式是數(shù)字檔案館的最佳模式[2]55,并且該模式已經(jīng)在杭州市濱江區(qū)數(shù)字檔案館實(shí)現(xiàn)。在《基于OAIS的數(shù)字檔案館系統(tǒng)框架研究》一文中,在OAIS參照模型的基礎(chǔ)上,構(gòu)建由四個(gè)應(yīng)用系統(tǒng)和兩個(gè)存儲(chǔ)系統(tǒng)組成的數(shù)字檔案館系統(tǒng)參照模型[3]42。在《功能需求分析——數(shù)字檔案館系統(tǒng)設(shè)計(jì)之一》一文中,分析了數(shù)字檔案館面臨的信息環(huán)境、管理對(duì)象與管理目標(biāo),并在此基礎(chǔ)上提出數(shù)字檔案館建設(shè)的九大功能需求,為我國(guó)數(shù)字檔案館的建設(shè)實(shí)踐提供參考[4]42。
薛四新的研究主題主要是數(shù)字檔案館建設(shè),但2012年以后有明顯的轉(zhuǎn)折,開(kāi)始對(duì)云數(shù)字檔案館的建設(shè)、運(yùn)行和安全問(wèn)題進(jìn)行探討?!睹嫦蚍?wù)架構(gòu)的數(shù)字檔案館建設(shè)方案研究》一文中,提出面向服務(wù)架構(gòu)的、基于IT集約化運(yùn)營(yíng)理念的數(shù)字檔案館的建設(shè)方案[5]47。在《云數(shù)字檔案館風(fēng)險(xiǎn)評(píng)估研究框架》一文中,建立云數(shù)字檔案館風(fēng)險(xiǎn)評(píng)估的研究框架并闡釋其核心內(nèi)容”,為云數(shù)字檔案館風(fēng)險(xiǎn)評(píng)估體系的構(gòu)建奠定基礎(chǔ)[6]90。
1.研究熱點(diǎn)。論文的關(guān)鍵詞(Keyword),是論文的研究精髓和議論核心,能夠高度概括文章的研究主題。本文擬選用關(guān)鍵詞分析研究熱點(diǎn)。設(shè)置Node Type=“Keyword”,其他選項(xiàng)設(shè)置不變,運(yùn)行CitespaceⅤ。為了使圖譜達(dá)到簡(jiǎn)潔、清晰的效果,本文在結(jié)果中作出如下處理:(1)剔除無(wú)實(shí)意機(jī)構(gòu)名如“國(guó)家檔案館”、“國(guó)家檔案局”、“市檔案館”等。(2)同一含義詞語(yǔ)的不同表達(dá)中,剔除所有頻次低的表達(dá),只保留頻次最高的。如檔案數(shù)字化、數(shù)字化檔案、檔案數(shù)字信息、數(shù)字化、數(shù)字檔案等均指經(jīng)過(guò)數(shù)字化處理的檔案,它們是不同作者對(duì)這一概念的不同稱(chēng)呼,本文只保留頻次為54的“檔案數(shù)字化”,過(guò)濾掉其他稱(chēng)呼。(3)剔除外延極大于本文研究主題“數(shù)字檔案館”外延的詞,如“檔案工作”“檔案事業(yè)”等。(4)設(shè)置Threshold=2。得到數(shù)字檔案館研究熱點(diǎn)圖譜,如圖4所示。
圖4 數(shù)字檔案館研究熱點(diǎn)圖譜
從圖4可以看出,數(shù)字檔案館研究的17年間,研究熱點(diǎn)有檔案數(shù)字化、數(shù)字檔案館建設(shè)、檔案數(shù)據(jù)庫(kù)、信息服務(wù)、電子政務(wù)、檔案利用、OAI、資源共享、云計(jì)算、信息安全等。
以四年為一個(gè)時(shí)間區(qū)間,對(duì)關(guān)鍵詞進(jìn)行如下處理:(1)將具有相同含義的不同表達(dá)進(jìn)行統(tǒng)一化處理。(2)出現(xiàn)某一概念的多個(gè)下位概念的,取其上位概念。得到表3。(3)表3顯示,2002年至2003年,研究熱點(diǎn)有數(shù)字檔案館、檔案信息、檔案數(shù)字化、數(shù)字檔案館建設(shè);2004年至2007年,研究熱點(diǎn)有電子政務(wù)、電子文件、檔案信息服務(wù)、OAI;2008年至2011年,研究熱點(diǎn)有云技術(shù)、信息生態(tài)、知識(shí)管理;2012年至今,研究熱點(diǎn)有生態(tài)系統(tǒng)、云計(jì)算技術(shù)、大數(shù)據(jù)、公共服務(wù)。
表3 時(shí)間區(qū)間研究熱點(diǎn)統(tǒng)計(jì)表
2.研究前沿分析。運(yùn)用CitespaceⅤ的突現(xiàn)詞探測(cè)功能,探測(cè)出數(shù)字檔案館研究領(lǐng)域從興起至今的17年間,共出現(xiàn)15個(gè)突現(xiàn)詞,如圖5所示。對(duì)15個(gè)突現(xiàn)詞進(jìn)行歸納總結(jié),得出數(shù)字檔案館研究的前沿領(lǐng)域有數(shù)字檔案館與電子政務(wù)、數(shù)字檔案館與云計(jì)算、數(shù)字檔案館與生態(tài)系統(tǒng)。
圖5 數(shù)字檔案館研究領(lǐng)域突現(xiàn)詞
(1)數(shù)字檔案館與電子政務(wù)。電子政務(wù)興起于20世紀(jì)90年代,是一種以計(jì)算機(jī)、網(wǎng)絡(luò)通信等技術(shù)為手段的新型政府運(yùn)作模式。電子政務(wù)建設(shè)與數(shù)字檔案館建設(shè)在技術(shù)基礎(chǔ)、結(jié)構(gòu)布局、運(yùn)作原理上均有相同之處,我國(guó)多名學(xué)者認(rèn)為二者應(yīng)該建立聯(lián)系,有機(jī)結(jié)合,達(dá)到共贏。連志英認(rèn)為“將電子政務(wù)和數(shù)字檔案館建設(shè)有機(jī)結(jié)合起來(lái),是我國(guó)數(shù)字檔案館建設(shè)及電子政務(wù)建設(shè)的必由之路”[7]54,強(qiáng)調(diào)數(shù)字檔案館建設(shè)在電子政務(wù)發(fā)展中的重要性。溫獻(xiàn)英指出,將數(shù)字檔案館建設(shè)納入電子政務(wù)建設(shè)規(guī)劃中,是加強(qiáng)數(shù)字檔案信息資源國(guó)家控制力的途徑之一[8]14。
(2)數(shù)字檔案館與云計(jì)算。云是一種抽象的說(shuō)法,通常指互聯(lián)網(wǎng)和通信設(shè)備。云計(jì)算在20世紀(jì)初得到了快速的發(fā)展,具有計(jì)算能力強(qiáng)、運(yùn)作成本低等優(yōu)點(diǎn),影響范圍大,應(yīng)用市場(chǎng)廣闊。云計(jì)算在我國(guó)數(shù)字檔案館研究領(lǐng)域備受青睞,大量學(xué)者對(duì)云計(jì)算在數(shù)字檔案館建設(shè)中的應(yīng)用進(jìn)行理論探討,并認(rèn)為云計(jì)算在數(shù)字檔案館建設(shè)中具有積極的影響力和明顯的優(yōu)勢(shì)。何正軍、金波說(shuō),“云計(jì)算的出現(xiàn)給數(shù)字檔案館建設(shè)帶來(lái)了新的機(jī)遇”,并對(duì)云計(jì)算應(yīng)用于數(shù)字檔案館建設(shè)進(jìn)行了優(yōu)勢(shì)分析,認(rèn)為云計(jì)算在異地檔案信息資源共享、檔案信息資源安全保障、節(jié)約數(shù)字檔案館建設(shè)成本和檔案信息資源個(gè)性化服務(wù)等方面均有優(yōu)勢(shì)[9]6。在《數(shù)字檔案館云計(jì)算建設(shè)模式的思考——以北京市區(qū)域性數(shù)字檔案館為例》一文中,薛四新等人指出為了區(qū)域內(nèi)檔案事業(yè)的整體發(fā)展,應(yīng)該在以云計(jì)算為基礎(chǔ)的IT集約化建設(shè)思想的牽引下建設(shè)區(qū)域性數(shù)字檔案館[10]63。
(3)數(shù)字檔案館與生態(tài)系統(tǒng)。生態(tài)系統(tǒng)屬于生態(tài)學(xué),本意是指生物群落與無(wú)機(jī)環(huán)境構(gòu)成的統(tǒng)一整體。這一概念引入檔案界之后,我國(guó)學(xué)者從其定義、特點(diǎn)、結(jié)構(gòu)、功能和發(fā)展動(dòng)力等方面進(jìn)行了探索。金波等人結(jié)合生態(tài)系統(tǒng)的概念,將數(shù)字檔案館生態(tài)系統(tǒng)定義為“數(shù)字檔案館空間范圍內(nèi)的人與其生存環(huán)境相互作用而形成的統(tǒng)一的復(fù)合體”[11]54,為數(shù)字檔案館生態(tài)系統(tǒng)的研究奠定基礎(chǔ)。在《論數(shù)字檔案館生態(tài)系統(tǒng)的功能》一文中,倪代川等人認(rèn)為數(shù)字檔案館生態(tài)系統(tǒng)具有集聚功能、整合功能、優(yōu)化功能、抵抗功能和競(jìng)爭(zhēng)功能并對(duì)其進(jìn)行了分析與探索。倪代川、金波在《數(shù)字檔案館生態(tài)系統(tǒng)發(fā)展動(dòng)力探析》一文中指出,在大、云、平、移等新技術(shù)的快速發(fā)展背景下,數(shù)字檔案館生態(tài)系統(tǒng)發(fā)展動(dòng)力源有四個(gè):政策保障、技術(shù)驅(qū)動(dòng)、資源劇增和用戶成長(zhǎng)[12]99。
[1]傅榮校.關(guān)于數(shù)字檔案館的思考[J].檔案學(xué)通訊,2001(05):26-28.
[2]金更達(dá),何嘉蓀.數(shù)字檔案館模式探討——基于元數(shù)據(jù)的電子文件集成管理與服務(wù)研究之二[J].檔案學(xué)通訊,2005(05):54-58.
[3]金更達(dá).基于OAIS的數(shù)字檔案館系統(tǒng)框架研究[J].浙江檔案, 2007(04):38-41+45.
[4]金更達(dá),何達(dá)多,何嘉蓀.功能需求分析——數(shù)字檔案館系統(tǒng)設(shè)計(jì)之一[J].檔案學(xué)研究,2005(04):42-46.
[5]薛四新.面向服務(wù)架構(gòu)的數(shù)字檔案館建設(shè)方案研究[J].檔案學(xué)研究,2007(04):45-47.
[6]徐華,薛四新.云數(shù)字檔案館風(fēng)險(xiǎn)評(píng)估研究框架[J].檔案學(xué)研究, 2016(05):90-93.
[7]連志英.電子政務(wù)中的數(shù)字檔案館[J].檔案學(xué)研究,2007(02):53-55.
[8]溫獻(xiàn)英.加強(qiáng)數(shù)字檔案館信息資源國(guó)家控制力的思考[J].山西檔案,2011(02):12-15.
[9]何正軍,金波.云計(jì)算與數(shù)字檔案館建設(shè)新機(jī)遇[J].檔案與建設(shè), 2015(12):4-8.
[10]薛四新,陶水龍,崔偉.數(shù)字檔案館云計(jì)算建設(shè)模式的思考——以北京市區(qū)域性數(shù)字檔案館為例[J].檔案學(xué)研究,2012(03):62-64.
[11]金波,湯黎華,何偉祺.數(shù)字檔案館生態(tài)系統(tǒng)的建構(gòu)[J].檔案學(xué)通訊,2010(01):53-57.
[12]倪代川,金波.數(shù)字檔案館生態(tài)系統(tǒng)發(fā)展動(dòng)力探析[J].檔案學(xué)研究,2016(04):97-102.
Visual Analysis of Digital Archives Based on Knowledge Map
Li Shun
(Information Management School of Heilongjiang University,Harbin 150080,China)
With the development and penetration of information technology,China's theoretical research on digital archives obtains great achievements and practical experience is constantly accumulated.With core journals and papers included in the CNKI as literature source,and Citespace V as the main analytical tool,this paper makes a visual analysis on current situation and research frontier of digital archives in China,in order to sum up experience of the past and provide ideas on the future development of the digital archives research.
digital archives;Citespace;visual analysis
G270.7
A
2016-12-14
10.16565/j.cnki.1006-7744.2017.08.01
李順為黑龍江大學(xué)信息管理學(xué)院檔案學(xué)專(zhuān)業(yè)在讀碩士,研究方向?yàn)樾畔⒓夹g(shù)與檔案信息管理。