劉春年+陳通
摘? 要:檔案信息化是傳統(tǒng)檔案管理向信息化檔案管理轉型的突破口。對該主題相關研究文獻的共詞分析、聚類分析及多維尺度分析,有利于把握該研究領域的研究動態(tài),探索新的研究方向。論文研究發(fā)現:檔案信息化技術、檔案管理人員素質、高校檔案信息化、醫(yī)院和健康檔案、電子政務檔案、企業(yè)檔案、檔案信息安全等方面構成了檔案信息化研究主要結構,涵蓋計算機科學、檔案科學、信息科學、經濟管理學等學科領域。通過進一步文獻計量分析發(fā)現,目前檔案信息化研究還面臨諸多問題:缺乏國外檔案信息化研究狀況分析;理論研究偏多、實踐應用研究偏少;研究方法偏主觀定性;檔案信息化評估方面研究太少。
關鍵詞:檔案信息化,BICOMB 2,共詞分析,聚類分析
信息化背景下,檔案利用方式也產生了深刻的變化。從傳統(tǒng)檔案到信息化檔案的轉變?yōu)闈M足人們日益增長的檔案信息需求提供了新的渠道。從2000年開始,我國對檔案信息化的研究逐漸展開,近些年來,檔案信息化已然成為檔案學科及檔案學專業(yè)研究的熱點問題。本文采用共詞分析、聚類分析及多維尺度分析等方法,以CNKI中國學術期刊全文數據庫為數據源,對現有以檔案信息化為主題的文獻進行定量分析,發(fā)現該主題研究結構及研究趨勢,以求能客觀反映我國檔案信息化研究的整體狀況。
1? 數據來源與研究方法
1.1? 數據來源與預處理。本文的數據來源是中國學術期刊全文數據庫,檢索策略為“主題=檔案AND主題=信息化”,檢索過程中設置時間為2005年至2015年,共檢索到文獻記錄3169條。將記錄導入查重軟件NoteExpress中作預處理,通過剔除重復文獻記錄,最終得到有效文獻2962篇,關鍵詞4281個。
1.2? 研究方法與工具。本文主要的研究方法是共詞分析、聚類分析及多維尺度分析。通過觀測一組詞同時出現在一篇文獻中的次數從而得出這組詞之間的關系疏密程度的方法稱為共詞分析。[1]聚類分析可以得到兩個個體間的緊密聯(lián)系的程度,是描述兩個個案間對應程度的有效方法。多維可以直觀得到關鍵詞之間的位置,從而反映出文獻的研究結構。本文使用的軟件工具有NoteExpress、BICOMB2、SPSS19.0以及Excel。
2? 數據處理
2.1? 高頻詞統(tǒng)計。在BICOMB2中進行詞頻統(tǒng)計,得到3912個不重復的關鍵詞,并給出每個關鍵詞的詞頻及所占總頻次的百分比,結合文獻總數、關鍵詞總數等條件,將閾值定為95得到20個高頻關鍵詞及詞頻。如表1所示:
2.2? 共詞矩陣。BICOMB2的共現矩陣功能可以直接統(tǒng)計出高頻關鍵詞共同出現在同一篇文獻中的頻次,詞頻閾值確定10,統(tǒng)計得出30×30矩陣,用Excel宏工具箱結合余弦指數,做相關系數轉換,利用余弦指數可以計算出各高頻詞之間相互的關聯(lián)度。[2]余弦指數計算公式為
3 ?數據分析
3.1? 聚類分析。聚類分析是一種多元統(tǒng)計方法,主要針對研究樣本或指標進行分類。按照變量的不同特征或者是一批數據的個案情況,可以依據關系的疏密程度作出分類。[3]本文聚類方法為Q型聚類,類與類之間距離的計算采用組內平均鏈鎖法(Within-groups linkage)。將高頻關鍵詞的相似度矩陣作為數據源輸入,運用SPSS 19.0軟件進行聚類分析,得到結果如圖1所示:
聚類圖結構分析。首先從宏觀上觀察聚類樹圖的結構。聚類樹圖中的最左邊的一列標號(Label)和數字(Number)代表著高頻關鍵詞及其編號,本文采用凝聚聚類算法計算每兩個關鍵詞之間的相似程度,發(fā)現第15、21、48、32、30、31、29、40關鍵詞的相似性在所有主題詞詞對之間是最小的,因此,它們首先聚集成為一個類。隨著后續(xù)關鍵詞之間的距離拉大,最終所有詞構成一個大類。通過樹圖的結構可以看出,所有的關鍵詞從整體上可以分為6個部分:由15、21、48、32、30、31、29、40號詞組成類別A,由7、12、25、34、6、36、4、28、1、45、8號主題詞組成類別B,由5、13、2、3、9、10、16、17、19、22、20、23、39號詞組成類別C,由11、14、18、27、35、38、41號詞組成類別D,由47、49、33、24、26、37、43號詞組成類別E,由44、45、42號詞組成類別F。
3.2? 多維尺度分析。MDS(Multidimensional Scaling)即多維尺度法,是多元統(tǒng)計方法的一種,它通過樣本在低維空間中的坐標分布來反映多個研究樣本的特性與它們之間的相似程度。[4]每一個樣本在空間分布圖中都表示成一個點,兩個點之間可以通過距離的遠近來判斷兩個點之間的相似程度。以相似度矩陣作為SPSS多維尺度分析的輸入,數據結構選擇Square symmetric,數據測度水平選擇Ordinal,尺度模型選擇歐幾里德模型(Eu?clidean Distance),對高頻關鍵詞進行多維尺度分析,得到結果如圖2所示:
從多維尺度分析圖,再結合聚類分析的結果,把圖中所有所列舉高頻關鍵詞分成3塊區(qū)域比較合理,每一塊區(qū)域的關鍵詞都表示出檔案信息化研究的不同的結構。
4? 結果與討論
從本文計量結果分析我們可以看出目前關于檔案信息化研究的文獻很多。當前檔案信息化的研究主要涉及檔案信息化技術、檔案管理人員素質、高校檔案信息化、醫(yī)院和健康檔案、電子政務檔案、企業(yè)檔案、檔案信息安全等方面。同時,檔案信息化也是涉及計算機科學、檔案學、管理科學等諸多學科領域的問題。檔案信息化研究發(fā)展至今,檔案信息化的研究進程主要如下:
①萌芽階段:該階段主要對檔案信息化的重要性及可行性展開了研究,如劉雅萍在1999年研究了檔案信息化的重要性及可行性,是新技術革命的需要,是檔案事業(yè)向前發(fā)展的必然途徑,計算機技術的快速發(fā)展也為檔案信息化工作提供了更多途徑。此階段是我國檔案信息化的萌芽階段,是檔案信息化建設的出發(fā)點。
②起步及快速發(fā)展階段:檔案信息化的研究正處于快速發(fā)展階段,建立在信息技術日新月異的基礎之上,檔案信息化的技術體系、應用領域及發(fā)展方向也在不斷地進步,大量的研究成果顯現出了巨大的價值。結合檔案信息化研究的學術成果,目前檔案信息化研究熱點主要包括以下幾個方面:檔案信息化技術、人員素質、高校檔案信息化、醫(yī)院和健康檔案、電子政務檔案、企業(yè)檔案、檔案信息安全等。
檔案信息化技術方面,檔案信息技術集成了計算機技術、數據庫技術、網絡技術、數據挖掘,還包括一些信息推送、網格技術等。張婧分析了計算機技術在檔案信息化管理中應用的優(yōu)勢、存在的問題以及重要性,提出目前檔案信息化硬件設施薄弱、電子檔案信息安全也存在許多問題。[5]方昀總結云計算對檔案信息化的影響,指出可以依托各級黨政網絡及互聯(lián)網建設全國性云計算平臺,檔案部門利用這一平臺提供數字檔案管理系統(tǒng),為檔案管理信息化提供了新的方向。[6]
人員素質方面,檔案管理人員要充分認識到,當前信息化背景下,檔案管理對人才素質的要求已然不同,檔案管理人員要不斷提升自我,來適應檔案信息化的進程。倪麗娟認為高校在選擇檔案信息服務策略時應從高校管理信息化程度及發(fā)展現狀等方面出發(fā),注意服務的雙向性、主動性和創(chuàng)造性,服務手段的現代化,明確服務重點,建立高校檔案信息服務評價體系來檢驗檔案信息化服務效用。[7]
醫(yī)院和健康檔案方面,信息化在給檔案工作帶來便捷的同時也給傳統(tǒng)檔案管理帶來了挑戰(zhàn),醫(yī)院檔案信息化是適應新時期管理工作的重要一環(huán),是醫(yī)院可持續(xù)發(fā)展的重要保證。目前醫(yī)院檔案信息化建設也存在人才建設、硬件設施、安全防范等諸多問題,研究者提出從依托局域網構建電子信息管理平臺、加強高素質人才建設、構建健全的制度體系等方面做好醫(yī)院檔案信息化建設工作。
電子政務檔案方面,目前電子檔案已經成為電子政務工作重要手段,是政務信息重要載體之一,保障電子檔案的真實、完整和安全是檔案信息化建設的重要建設內容。信息化環(huán)境下檔案信息化建設要以電子文件歸檔和管理為重點,不斷加快數字化建設步伐,建立數字檔案信息資源庫,加強檔案應用系統(tǒng)建設。
企業(yè)檔案信息化方面,信息化背景下,企業(yè)檔案信息化建設已初步成形,基礎設施也在不斷完善。應參照國家標準以及其他行業(yè)標準并結合自身行業(yè)特點,制定自身規(guī)范與制度標準;建設高質量的、以數據形式集合而成的檔案信息數據庫。除此之外,建設過程中還要考慮其他影響信息化建設的因素:信息安全、建設成本、應用范圍等。具體來說,還要將信息化建設重點貫徹于企業(yè)會計檔案及電子檔案的管理之中。
檔案信息安全方面,在實現檔案信息資源共享的過程中,就會遇到權限控制的問題,必須保證檔案信息資源共享的安全即確保檔案原件完整性、數字化檔案準確性、保密檔案保密性,要針對不同檔案對安全保密的要求設置不同的權限。從管理層和奇數層兩個方面采取措施保障檔案信息資源共享時的安全。現有研究提出了檔案信息共享的隱私保護技術方案:基于訪問策略的檔案信息訪問控制和基于知識的信息匿名保護和隱私推理防范,不同內容的檔案信息資源有不同的法規(guī)標準、組織方法和技術保護策略。
我國檔案信息化研究處于高速發(fā)展階段,對檔案信息化技術、檔案信息化結構、高校檔案信息化、醫(yī)院和健康檔案、電子政務檔案、企業(yè)檔案、檔案信息安全等方面的研究構成了檔案信息化研究的架構。從研究內容上看,既有管理組織方面的理論研究,也有信息技術應用方面的實踐研究;從研究領域看,在高校、醫(yī)院、政務、企業(yè)等領域已經進行了大量的研究,總體來看內容比較豐富,研究范圍也比較廣泛。但是也存在一些問題:第一,研究多涉及國內行業(yè)檔案信息化建設研究,缺乏國外檔案信息化研究狀況分析比較;第二,理論研究偏多、實踐應用研究偏少;第三,研究方法多以定性方法為主,多數以歷史事實及研究者經驗為主要參照,缺乏定量統(tǒng)計分析過程;第四,缺乏檔案信息化評估評價方面的研究,檔案信息化建設達到怎樣的水平,如何構建評價指標體系,從哪些方面進行評價評估等研究較為缺乏。還需要更多的研究者從更高層次、更全面的角度展開研究,為我國檔案信息化建設提供寶貴的理論指導和技術支撐。
參考文獻:
[1]崔雷,鄭華川.關于從MEDLINE數據庫中進行知識抽取和挖掘的研究進展[J].情報學報,2003,22(4):425~433.
[2]邱均平,王曰芬.文獻計量內容分析法[M].北京:國家圖書館出版社,2008:343.
[3]楊丹.SPSS寶典(第3版)[M].北京:電子工業(yè)出版社,2013:316~332.
[4]Borg I,Groenen P. Modern Multidimensional Scaling[M].New York: Springer,1997.
[5]張婧, 檔案信息化管理中計算機技術的重要性[J],信息通信,2015(5):148~149.
[6]方昀,郭偉. 云計算技術對檔案信息化的影響和啟示[J].檔案學研究.2010(4):70~73.
[7]倪麗娟. 信息化背景下高校檔案服務策略研究[J].檔案學通訊.2011(5):92~94.
(作者單位:南昌大學管理學院? 來稿日期:2015-08-16]