周 露,黃曄凱
(南京航空航天大學 檔案館,江蘇 南京 210016)
基于Citespace的大數(shù)據(jù)時代檔案熱點研究
周 露,黃曄凱
(南京航空航天大學 檔案館,江蘇 南京 210016)
文章利用知識圖譜可視化軟件Citespace,對2012—2017年被CNKI收錄的672篇大數(shù)據(jù)時代檔案學領域相關研究論文進行關鍵詞分析,旨在對近6年研究熱點進行總結,分析現(xiàn)階段研究成果存在的一些問題,以期對大數(shù)據(jù)在檔案學領域研究的進一步深化及發(fā)展提供借鑒。
大數(shù)據(jù);檔案;Citespace;熱點
2008年nature雜志出版大數(shù)據(jù)???,介紹了大數(shù)據(jù)的概念、特征、組織形式和利用等[1]。根據(jù)2012年互聯(lián)網絡數(shù)據(jù)中心發(fā)布的《數(shù)字宇宙2020》報告,預計到2020年,全球數(shù)據(jù)總量將達到35~40 ZB,10年間將增長20倍以上?,F(xiàn)如今,各行各業(yè)都對大數(shù)據(jù)傾入一定程度的關注,走向“大數(shù)據(jù)化”,各類期刊雜志上關于大數(shù)據(jù)的科研論文數(shù)量也是呈指數(shù)增長。在此背景下,檔案人也緊跟時代發(fā)展,將大數(shù)據(jù)研究引入到檔案學領域,下面就基于Citespace對近6年大數(shù)據(jù)在檔案學領域的研究論文進行熱點分析。
關鍵詞是學術論文核心內容的提煉,是文章主題的高度概括,而頻次高的關鍵詞常被用來確定一個研究領域的熱點問題[2]。在中國期刊全文數(shù)據(jù)庫數(shù)據(jù)中以“大數(shù)據(jù)”并“檔案”為關鍵詞進行題名檢索,共檢索到學術論文672篇,其中包括學位論文18篇,學術會議論文21篇,報紙5篇,如圖1所示,從2012年僅有一篇相關論文,截至2017年5月,據(jù)不完全統(tǒng)計已經有110篇相關論文,可見大數(shù)據(jù)在檔案學的研究熱度仍持續(xù)上升。
圖1 2012—2017年大數(shù)據(jù)在檔案學領域研究論文數(shù)量
1.1 關鍵詞分析
利用陳超美博士開發(fā)的信息可視化軟件CitespaceⅢ對672篇學術論文的關鍵詞進行分析,通過高頻詞來確定大數(shù)據(jù)在檔案學領域的主要研究方向和熱點。剔除高頻詞和噪聲詞大數(shù)據(jù)(313次)、大數(shù)據(jù)時代(121次)、檔案(53次)、檔案工作(50詞)、管理(22次),頻次最高的10個關鍵詞如表1所示。
表1 大數(shù)據(jù)在檔案學領域研究論文出現(xiàn)頻次前10的關鍵詞
在Citespace中關鍵詞分析得到149個節(jié)點,212條連線,設置顯示出現(xiàn)頻率大于10的節(jié)點,得到圖2所示知識圖譜。
圖2 大數(shù)據(jù)在檔案學領域研究主題知識圖譜
從圖2我們可以大致看到當前大數(shù)據(jù)在檔案領域研究熱點及相關聯(lián)系,可以概括為以下幾點進行討論。
2.1 相關技術研究
王蘭成等[3-4]研究了大數(shù)據(jù)知識挖掘處理中的一些技術,包括數(shù)據(jù)集成、數(shù)據(jù)存儲、數(shù)據(jù)檢索、語義處理與可視化數(shù)據(jù)挖掘問題進行初步分析,初步指導計算機挖掘技術在檔案管理中的應用。張倩[5]則試圖將物聯(lián)網與大數(shù)據(jù)技術融合,提出高校檔案物聯(lián)網大數(shù)據(jù)處理平臺的構建。田偉等[6-7]分析了大數(shù)據(jù)處理工具TRIP數(shù)據(jù)庫系統(tǒng),并展現(xiàn)了若干TRIP數(shù)據(jù)庫系統(tǒng)檔案資源處理的案例。
2.2 部分領域檔案工作
這些研究學者中大部分均是高校檔案工作者,如表2所示。
表2 大數(shù)據(jù)在檔案學領域研究論文前10名作者單位
由表2可見,前八位均是高校檔案單位,而且其中有5個是遼寧省的檔案機構。張倩等[8-12]均對大數(shù)據(jù)時代高校檔案資源體系信息化建設以及檔案信息服務等提出思考。而談清輝等[13-15]站在企業(yè)檔案信息化角度,提出將大數(shù)據(jù)技術應用在企業(yè)檔案管理與技術創(chuàng)新。醫(yī)院信息化程度已經成為衡量綜合實力的標志之一,何瑩等[16-18]研究了如今大數(shù)據(jù)時代醫(yī)院電子檔案建設的對策。臨沂市國土資源局李曉虎[19]同樣提出利用大數(shù)據(jù)解決國土資源檔案管理中的問題的思路。
2.3 檔案管理及利用
更多的研究學者將目光聚集在利用大數(shù)據(jù)技術來管理和利用檔案上面。石峻峰等[20]用文獻計量學方法對國內外有關大數(shù)據(jù)時代數(shù)字檔案資源管理研究成果進行分析。程結晶等[21]用SWOT分析法對大數(shù)據(jù)時代檔案編研工作的內部優(yōu)勢、劣勢與外部機會、威脅因素進行分析。吳薇等[22-24]均研究大數(shù)據(jù)技術給檔案管理工作模式帶來的創(chuàng)新性改革,包括構建大數(shù)據(jù)集群、搭建檔案大數(shù)據(jù)云平臺、提供檔案云服務、智慧檔案館的深度挖掘大數(shù)據(jù)等。崔海莉[25]站在大數(shù)據(jù)時代數(shù)據(jù)安全角度,解讀了檔案信息的收集、管理、利用3方面思考檔案數(shù)據(jù)采集安全、檔案信息管理系統(tǒng)安全以及檔案數(shù)據(jù)提供利用安全的問題。
王霞等[26]利用層次分析法等原理構建出基于大數(shù)據(jù)背景的檔案信息資源利用評價體系,對高校檔案利用服務工作具有指導意義。朱建華等[27-29]探討了大數(shù)據(jù)時代檔案利用服務的方式和發(fā)展策略,提出了綜合提升館員業(yè)務素質、構建平臺整合資源、利用社交網絡平臺等對策。肖敏[30]提出從加強意識、隊伍、資源、服務平臺及信息安全建設等5個方面來構建和完善大數(shù)據(jù)時代檔案利用服務體系。
近幾年,大數(shù)據(jù)在檔案領域的研究發(fā)展勢頭迅猛,但并不代表相關研究已然成熟。相反,通過對研究論文的分析,筆者認為大部分的成果還處于比較淺顯的解讀探索階段,給我們帶來一些的啟示。
首先,檔案館信息化技術基本外包,技術研究層面非常淺顯。不斷地變革,注入新鮮血液,檔案工作才會不斷有新的活力,我們將大數(shù)據(jù)技術引入檔案學領域,不能僅僅停留在概念的引入,有相關計算機基礎的檔案人應當深入研究,站在專業(yè)角度,探析如何將大數(shù)據(jù)與檔案真正結合在一起。
其次,當前研究內容主要是對大數(shù)據(jù)時代檔案館管理利用、檔案工作機遇挑戰(zhàn)、數(shù)字檔案館建設等方面進行探討,涉及內容雖然廣但還是泛泛而談。很多論文只是反復討論大數(shù)據(jù)概念,存在著不同程度的概念泛化、夸大與誤讀。
最后,很多研究其實還是停留在數(shù)字化的階段,只是在理論上扣上了大數(shù)據(jù)這頂帽子而已,在國內檔案館內并沒有付諸實踐,而且短期內檔案館也難以真正實現(xiàn)大數(shù)據(jù)化。我們應當在做好傳統(tǒng)工作的基礎上,加快數(shù)字化的進程,在數(shù)字化的過程中,拓展適合自己新的發(fā)展路徑。
[1]Nature.Big data[EB/OL].[2014-02-18](2017-08-30).http://www.nature.com/news/specials/bigdata.
[2]張凌.基于CiteSpace的競爭情報研究的可視化分析[J].圖書情報工作網刊,2011(10):1-8.
[3]王蘭成,劉曉亮.網上數(shù)字檔案大數(shù)據(jù)分析中的知識挖掘技術研究[J].浙江檔案,2013(10):14-19.
[4]陳小莉.基于大數(shù)據(jù)的計算機數(shù)據(jù)挖掘技術在檔案管理系統(tǒng)中的研究應用[J].激光雜志,2017(2):142-145.
[5]張倩.高校檔案物聯(lián)網大數(shù)據(jù)處理平臺的構建方案研究[J].檔案與建設,2016(2):39-43.
[6]田偉,韓海濤.基于TRIP數(shù)據(jù)庫系統(tǒng)的大數(shù)據(jù)檔案資源處理[J].浙江檔案,2015(7):16-18.
[7]田偉,韓海濤.一種基于非關系型數(shù)據(jù)庫的大數(shù)據(jù)檔案資源處理策略[J].蘭臺世界,2015(9):21-22.
[8]張倩.“大數(shù)據(jù)技術”在高校檔案信息服務中的應用探索[J].檔案與建設,2014(3):27-31.
[9]周美蘭.大數(shù)據(jù)時代高校檔案資源體系建設的思考[J].山西檔案,2015(1):68-71.
[10]陳明九.大數(shù)據(jù)時代高校檔案管理系統(tǒng)建設研究—以山東建筑大學為例[J].山東建筑大學學報,2015(5):506-510.
[11]王莉娜,程鵬.大數(shù)據(jù)環(huán)境下高校人事檔案的管理與利用[J].蘭臺世界,2017(3):40-42.
[12]金波,蔡敏芳.大數(shù)據(jù)時代檔案學專業(yè)高等教育的變革與創(chuàng)新[J].檔案學研究,2016(6):12-17.
[13]談清輝.國有企業(yè)科技檔案檢索方法提升與大數(shù)據(jù)管理探究[J].檔案學研究,2014(5):60-63.
[14]王毅,趙淑梅.國有企業(yè)技術創(chuàng)新與檔案大數(shù)據(jù)管理安全戰(zhàn)略研究[J].檔案學通訊,2014(2):63-67.
[15]邱世魁,陳玉朕.大數(shù)據(jù),企業(yè)檔案信息系統(tǒng)的技術架構[J].中國檔案,2013(10):69-71.
[16]何瑩.大數(shù)據(jù)條件下醫(yī)院電子檔案管理研究[D].秦皇島:燕山大學,2015.
[17]李妙蓉.談大數(shù)據(jù)時代的醫(yī)院檔案管理[J].黑龍江檔案,2017(1):97.
[18]張濤.楊茜.大數(shù)據(jù)背景下醫(yī)院檔案管理的創(chuàng)新探討[J].山東檔案,2017(2):54-56.
[19]李曉虎.大數(shù)據(jù)時代的國土資源檔案創(chuàng)新管理探析[J].蘭臺世界,2017(4):53-55.
[20]石峻峰,周俐霞,付雙雙.大數(shù)據(jù)時代數(shù)字檔案資源管理研究現(xiàn)狀與趨勢分析[J].信息安全與通信保密,2014(9):87-93.
[21]程結晶,周咪咪,王齊,大數(shù)據(jù)時代檔案編研的SWOT分析[J].檔案學通訊,2015(5):58-62.
[22]吳薇.大數(shù)據(jù)時代下檔案管理機制與模式創(chuàng)新[J].蘭臺世界,2016(10):4-5.
[23]吳曼麗.大數(shù)據(jù)時代下檔案管理創(chuàng)新策略研究[J].蘭臺世界,2016(10):92.
[24]李小晨.大數(shù)據(jù)時代背景下的檔案管理探討[J].云南檔案,2013(6):48-50.
[25]崔海莉.“大數(shù)據(jù)”時代檔案信息安全管理新思考[J].檔案學研究,2015(1):93-96.
[26]王霞,祝彩鳳.大數(shù)據(jù)背景下的檔案信息資源利用評價體系研究[J].蘭臺世界,2017(5):54-56.
[27]朱建華.面向大數(shù)據(jù)的檔案信息資源服務與利用[J].信息與電腦,2014(8):46-47.
[28]金丹.大數(shù)據(jù)時代的檔案利用服務工作研究[J]蘭臺世界,2015(7):111-112.
[29]閻曉峰.大數(shù)據(jù)與檔案資源開發(fā)利用[J].中國檔案,2015(11):16-19.
[30]肖敏.大數(shù)據(jù)環(huán)境下檔案利用服務體系建設研究[D].湘潭:湘潭大學,2015.
Study on the archives of Citespace big data era based on hot spot
Zhou Lu, Huang Yekai
(Archive Department of Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)
This paper takes advantage of the knowledge visualization software Citespace to analyze the key words of 672 papers related to archival studies in the era of big data collected by CNKI, which is aim to summarize the research hot spots in the past 6 years and analyze the existing problems of research results at this stage, so as to provide reference for further research and development of archival data in the fi eld of archival science.
big data; archives; Citespace; hot spots
中央高?;究蒲袠I(yè)務費專項資金;項目編號:NR2016034。
周露(1988— ),女,江蘇東臺,碩士研究生,館員;研究方向:數(shù)字檔案館。