薛衛(wèi)雙
(山東管理學(xué)院圖書館,山東 濟南250357)
自1998年北京市檔案館正式建立我國第一個檔案網(wǎng)站以來,我國檔案部門便開啟了檔案網(wǎng)站建設(shè)的熱潮,利用檔案網(wǎng)站這一平臺對傳統(tǒng)服務(wù)進行拓展和創(chuàng)新。經(jīng)過20 余年的發(fā)展歷程,我國檔案網(wǎng)站數(shù)量已初具規(guī)模,網(wǎng)站建設(shè)水平逐漸提高,網(wǎng)站應(yīng)用價值不斷提升。與此同時,學(xué)術(shù)界就檔案網(wǎng)站的應(yīng)用和發(fā)展展開了深入研究并取得了眾多研究成果。如錢澄等[1]對2000—2011 年檔案網(wǎng)站研究論文的關(guān)鍵詞進行了詞頻統(tǒng)計并構(gòu)建了高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖,通過節(jié)點中心性分析和多維尺度分析方法指出了檔案網(wǎng)站的研究熱點和不足。宣蓮等[2]運用文獻調(diào)研法對1996—2016 年我國檔案網(wǎng)站研究的主要內(nèi)容進行了總結(jié)和評析。為深入揭示當前我國檔案網(wǎng)站領(lǐng)域的研究熱點和發(fā)展態(tài)勢,筆者試圖采用共詞分析法,借助SPSS 軟件進行因子分析和聚類分析,并在此基礎(chǔ)上梳理和解析檔案網(wǎng)站的研究主題,為該領(lǐng)域未來的研究方向提供數(shù)據(jù)支撐和理論支持。
為研究檔案網(wǎng)站理論的熱點和現(xiàn)狀,筆者以CNKI期刊數(shù)據(jù)庫中的核心期刊文獻和CSSCI期刊文獻為數(shù)據(jù)統(tǒng)計來源,時間不限,檢索日期為2018年11月10日,并以“檔案網(wǎng)站”為主題詞進行精確檢索,經(jīng)人工排檢,剔除征稿通知、論壇講話等非學(xué)術(shù)性論文及不相關(guān)文獻,共得到有效期刊論文393篇,以此作為我國檔案網(wǎng)站研究的分析樣本。
筆者采用的主體研究方法為共詞分析法。共詞分析法是內(nèi)容分析法的一種,主要原理是對一組詞兩兩統(tǒng)計其在同一篇文獻中出現(xiàn)的次數(shù),以此為基礎(chǔ)進行聚類分析,從而反映這些詞之間的親疏關(guān)系,進而分析這些詞所代表的學(xué)科研究熱點、主題結(jié)構(gòu)變化和轉(zhuǎn)移趨勢[3]。筆者主要運用Bi?comb2.0 和Excel 軟件,統(tǒng)計了我國檔案網(wǎng)站研究文獻的關(guān)鍵詞并構(gòu)建高頻關(guān)鍵詞共詞、相關(guān)、相異矩陣,借助SPSS20.0 軟件進行因子分析和聚類分析,然后劃分聚類結(jié)果,確定不同的研究主題并進行解析。
筆者使用書目共現(xiàn)系統(tǒng)Bicomb2.0 提取文獻關(guān)鍵詞并進行詞頻統(tǒng)計,經(jīng)過數(shù)據(jù)清洗,合并和剔除意思相近或無實際意義的詞,最終在393篇論文中共得到有效關(guān)鍵詞1412個。將這些關(guān)鍵詞按頻次降序排序,確定頻次≥5 的43 個高頻關(guān)鍵詞(如表1所示)。表1顯示,我國檔案網(wǎng)站研究圍繞“檔案網(wǎng)站”產(chǎn)生了“網(wǎng)站建設(shè)”“檔案信息資源”“檔案館”“檔案信息服務(wù)”“檔案信息化”“資源整合”“網(wǎng)站設(shè)計”等一系列關(guān)鍵詞,頻次越高,說明對其的研究越深入。隨著我國檔案信息化建設(shè)工作的全面開展和推進,檔案網(wǎng)站建設(shè)作為其中的重要內(nèi)容逐漸成為檔案界乃至社會各界關(guān)注的焦點。檔案館作為服務(wù)性機構(gòu),在信息服務(wù)、資源整合、網(wǎng)站設(shè)計等方面面臨著巨大的考驗,檔案網(wǎng)站建設(shè)正推動著檔案館服務(wù)方式與手段的變革。
表1 我國檔案網(wǎng)站研究論文高頻關(guān)鍵詞
雖然高頻關(guān)鍵詞的頻次在一定程度上可以反映出檔案網(wǎng)站領(lǐng)域的研究熱點,但不能反映這些主題詞之間的關(guān)系,也難以精確地概括該學(xué)科的研究熱點領(lǐng)域,需采用共詞分析法進一步挖掘關(guān)鍵詞之間的關(guān)系。筆者使用Bicomb2.0 軟件對我國檔案網(wǎng)站研究的43 個高頻關(guān)鍵詞兩兩統(tǒng)計,構(gòu)建43*43的關(guān)鍵詞共詞矩陣,如表2所示。共詞矩陣為對稱矩陣,對角線上的數(shù)值表示該關(guān)鍵詞出現(xiàn)的總頻次,如“網(wǎng)站建設(shè)”在393篇文獻中共出現(xiàn)78 次,它與“檔案信息資源”在同一篇文獻中共同出現(xiàn)14次,與“檔案館”共同出現(xiàn)8次。
為消除關(guān)鍵詞頻次懸殊造成的影響,筆者引入Ochiia 系數(shù)[4]將共詞矩陣轉(zhuǎn)化為相關(guān)矩陣,用以反映高頻關(guān)鍵詞之間的實質(zhì)性關(guān)聯(lián)程度。因相關(guān)矩陣中0 值較多,為進一步減小誤差,更好地進行后續(xù)的因子分析和聚類分析,用“1”減去相關(guān)矩陣中的各數(shù)值得到高頻關(guān)鍵詞相異矩陣,如表3 所示。相異矩陣中的數(shù)值在0-1 之間,數(shù)值越小,表示兩個關(guān)鍵詞之間的距離越近,關(guān)聯(lián)程度越強,反之其距離越遠,關(guān)聯(lián)程度越弱。
表2 我國檔案網(wǎng)站研究論文高頻關(guān)鍵詞共詞矩陣(部分)
表3 我國檔案網(wǎng)站研究論文高頻關(guān)鍵詞相異矩陣(部分)
因子分析是研究從變量群中提取共性因子的統(tǒng)計技術(shù),進行因子分析的目的就是用盡可能少的因子去描述眾多指標或要素之間的聯(lián)系,從而使相關(guān)問題研究更加深入透徹。筆者將相異矩陣導(dǎo)入到SPSS20.0軟件中,利用主成分法、協(xié)方差矩陣和最大方差法進行因子分析,并在“輸出”選項中選擇“碎石圖”,得到的碎石圖如圖1所示。根據(jù)因子分析理論,公共因子特征值>1 且因子解釋貢獻率必須達到全部信息的60%以上。結(jié)果表明有15 個因子被提取,其累積方差貢獻率為72.179%。也就是說,將檔案網(wǎng)站研究的43 個高頻關(guān)鍵詞劃分為15 個類別,就可以解釋該領(lǐng)域72.179%的信息。但15個類別過于分散,根據(jù)碎石圖可知,前7個因子曲線較陡,因此從高頻關(guān)鍵詞中提取7個因子較為合適,為聚類分析提供依據(jù)。
圖1 因子個數(shù)碎石圖
聚類分析是按照距離的遠近將眾多數(shù)據(jù)劃分為若干個類別,將距離較近的數(shù)據(jù)聚集起來,形成一個個概念相對獨立的類團,使得類團內(nèi)數(shù)據(jù)的差異盡可能小,不同類團間的差異盡可能大。將檔案網(wǎng)站研究論文高頻關(guān)鍵詞相異矩陣導(dǎo)入SPSS20.0軟件中進行系統(tǒng)聚類分析,類間距的計算方法選擇組間聯(lián)接法,變量距離的測度方法選擇平方Euclid?ean 距離,標準化選擇全距從0 到1,生成聚類樹狀圖,如圖2所示。圖2將我國檔案網(wǎng)站研究熱點分為7類,分別為檔案網(wǎng)站建設(shè)現(xiàn)狀調(diào)查研究、高校檔案網(wǎng)站建設(shè)研究、檔案信息資源整合與組織、檔案網(wǎng)站評價、檔案網(wǎng)站設(shè)計與構(gòu)建、檔案網(wǎng)站技術(shù)與服務(wù)、國外優(yōu)秀檔案網(wǎng)站的分析與借鑒。
圖2 我國檔案網(wǎng)站研究論文高頻關(guān)鍵詞聚類結(jié)果樹狀圖
基于高頻關(guān)鍵詞的因子分析和聚類分析,并系統(tǒng)研讀和分析我國檔案網(wǎng)站研究領(lǐng)域的相關(guān)文獻,筆者對7個熱點研究主題進行詳細解析。
此熱點由“對策、問題、現(xiàn)狀、檔案網(wǎng)站、網(wǎng)站建設(shè)、調(diào)研、中國”等關(guān)鍵詞組成,主要從宏觀和微觀兩個角度出發(fā)對檔案網(wǎng)站的建設(shè)情況展開了全面調(diào)研,并取得了豐碩的研究成果,研究步驟大致為“現(xiàn)狀調(diào)研—問題分析—對策建議”。宏觀角度方面,學(xué)者對檔案網(wǎng)站建設(shè)的整體狀況進行調(diào)研分析。微觀角度方面,學(xué)者對檔案網(wǎng)站建設(shè)的某項功能、服務(wù)或欄目展開調(diào)研,內(nèi)容主要涉及對檔案網(wǎng)站的互動功能、在線服務(wù)功能、查閱功能、檢索功能、信息公開服務(wù)、咨詢服務(wù)、資源建設(shè)、信息化水平等的現(xiàn)狀調(diào)查與分析。衛(wèi)軍朝對我國33個省級檔案網(wǎng)站的基本信息、網(wǎng)站信息資源與服務(wù)、業(yè)務(wù)建設(shè)功能等方面進行了調(diào)研,發(fā)現(xiàn)存在網(wǎng)站信息更新慢、網(wǎng)站信息資源建設(shè)的數(shù)量和質(zhì)量有待加強、網(wǎng)站功能有待完善等問題[5]。劉帥偉等在對上海市17 個區(qū)縣檔案網(wǎng)站建設(shè)的基本情況、內(nèi)容信息、功能與服務(wù)等方面進行調(diào)研的基礎(chǔ)上,針對存在的問題提出加強網(wǎng)站的標準化建設(shè)、加強網(wǎng)站信息資源建設(shè)、完善網(wǎng)站服務(wù)功能等相應(yīng)對策[6]。學(xué)者們通過系統(tǒng)、周密、詳實的調(diào)查分析,指出了檔案網(wǎng)站建設(shè)過程中存在的諸多問題并提出可行性建議,為未來檔案網(wǎng)站的建設(shè)與發(fā)展指明了方向。
此熱點由“檔案”“高?!薄皺n案館”“檔案信息化”等關(guān)鍵詞組成。高校檔案網(wǎng)站是高校師生了解檔案工作、查閱檔案信息、獲取檔案服務(wù)的重要平臺,在高校檔案信息化建設(shè)中發(fā)揮著重要作用。目前該主題研究主要集中于國內(nèi)外高校檔案網(wǎng)站建設(shè)的對比、我國高校檔案網(wǎng)站建設(shè)的現(xiàn)狀、網(wǎng)站建設(shè)中存在的問題及對策等方面。邊文婧等從內(nèi)容設(shè)置、檢索工具、網(wǎng)站形式3 個方面對哈佛大學(xué)檔案網(wǎng)站與北京大學(xué)檔案網(wǎng)站進行了對比分析,發(fā)現(xiàn)我國高校檔案網(wǎng)站建設(shè)與國外相比存在明顯差距,提出從樹立正確的功能定位、豐富網(wǎng)站信息容量、優(yōu)化網(wǎng)站檢索工具、增強與用戶的交流功能等方面來加強我國高校檔案網(wǎng)站建設(shè)[7]。張曉等從內(nèi)容建設(shè)、建設(shè)技術(shù)、網(wǎng)站的管理與維護方面分析了高校檔案網(wǎng)站建設(shè)存在的諸多問題,提出從加強網(wǎng)站內(nèi)容建設(shè)、增強網(wǎng)站服務(wù)功能、建立高校檔案網(wǎng)站評價指標體系等方面來促進高校檔案網(wǎng)站建設(shè)的發(fā)展和完善[8]。
此熱點由“資源整合、綜合檔案館、檔案信息資源、網(wǎng)絡(luò)環(huán)境、資源開發(fā)”等關(guān)鍵詞組成,主要探討了在網(wǎng)絡(luò)環(huán)境、大數(shù)據(jù)、Web2.0等新環(huán)境與新技術(shù)背景下檔案網(wǎng)站信息資源的整合和組織問題。吳建華等在明確檔案網(wǎng)站信息資源范圍的基礎(chǔ)上對檔案網(wǎng)站信息資源整合和組織的內(nèi)涵進行了深入探討,并將檔案網(wǎng)站信息資源整合和組織與傳統(tǒng)檔案管理工作進行了比較分析,認為檔案網(wǎng)站信息資源整合和組織是網(wǎng)絡(luò)環(huán)境下傳統(tǒng)檔案管理工作的有機融合和發(fā)展[9-10]。王斌等提出了跨庫整合方法、元數(shù)據(jù)庫方法、實體倉庫方法和信息抽取方法4種不同的檔案網(wǎng)站信息資源整合方法,并對檔案網(wǎng)站信息資源整合方案進行了設(shè)計[11]。金凡從面向信息資源、面向信息交流過程、面向信息用戶3 個角度對檔案網(wǎng)站資源整合模式展開了探討[12]。從現(xiàn)有文獻來看,該領(lǐng)域的研究成果不多,僅有十余篇文獻,且我國檔案網(wǎng)站在資源建設(shè)方面存在可用資源乏善可陳、資源深層開發(fā)不足等諸多問題,國內(nèi)檔案界學(xué)者應(yīng)加強對檔案網(wǎng)站資源建設(shè)的研究力度,從多個角度探討如何推動網(wǎng)絡(luò)環(huán)境下檔案網(wǎng)站資源建設(shè)的發(fā)展。
此熱點由“網(wǎng)站評估、網(wǎng)站集群、評價體系”等關(guān)鍵詞組成。對檔案網(wǎng)站進行客觀和科學(xué)的評價,可以全面了解檔案部門在網(wǎng)站建設(shè)方面的優(yōu)勢和劣勢,從而有針對性地提高我國檔案網(wǎng)站建設(shè)水平。檔案網(wǎng)站評價在理論方面主要涉及評價對象及主體、評價方法、評價指標及指標體系的構(gòu)建等內(nèi)容。傅榮校等從檔案網(wǎng)站的宣傳、服務(wù)和交流三大功能角度出發(fā),構(gòu)建了一套檔案網(wǎng)站的三級評價指標體系[13]。陳玲霞等從感官體驗、交互體驗、情感體驗、瀏覽體驗和信任體驗5 個維度構(gòu)建了檔案網(wǎng)站用戶體驗二級指標體系[14]。檔案網(wǎng)站評價在實踐方面主要是第三方評價機構(gòu)或?qū)W者對省級檔案網(wǎng)站、市級檔案網(wǎng)站及地方檔案網(wǎng)站的測評和分析。中國人民大學(xué)檔案網(wǎng)站調(diào)查和測評項目組以我國省級檔案網(wǎng)站為測評對象,于2007年、2011年和2015年分別對測評對象的資源服務(wù)、業(yè)務(wù)建設(shè)和網(wǎng)站設(shè)計方面的建設(shè)情況進行了綜合測評。通過比較分析多期省級檔案網(wǎng)站的測評結(jié)果發(fā)現(xiàn),近年來我國省級檔案網(wǎng)站的建設(shè)有了長足進步,在檔案信息建設(shè)、功能設(shè)置、網(wǎng)站設(shè)計、用戶滿意度、網(wǎng)站的規(guī)范與維護等方面都有了明顯提升。陳忠海等從內(nèi)容建設(shè)、功能設(shè)置和規(guī)劃設(shè)計3個維度對中原經(jīng)濟區(qū)部分地市的檔案網(wǎng)站建設(shè)情況進行了評估與分析,結(jié)果顯示,山西省的各省地市檔案網(wǎng)站建設(shè)已達合格或基本合格水平[15]。除此之外,河南、云南等省參照“地市級檔案網(wǎng)評估指標體系”對省內(nèi)市級檔案網(wǎng)站的發(fā)展情況進行了評估分析,發(fā)現(xiàn)問題并提出優(yōu)化建議。
此熱點由關(guān)鍵詞“定位、功能、網(wǎng)站設(shè)計、網(wǎng)站內(nèi)容、國家檔案館”等組成。根據(jù)檔案網(wǎng)站建設(shè)的一般流程,可將該主題研究歸納為3 個研究熱點:一是網(wǎng)站的定位與功能。檔案網(wǎng)站建設(shè)首先應(yīng)準確把握檔案網(wǎng)站的定位及其擬發(fā)揮的功能。檔案部門應(yīng)根據(jù)政治、經(jīng)濟、文化等宏觀環(huán)境和自身職能認真研究自己的網(wǎng)站定位,并根據(jù)網(wǎng)站運行狀況及工作目標和重點的變化,對網(wǎng)站定位不斷地加以改進和完善。檔案網(wǎng)站的功能是在對網(wǎng)站定位的基礎(chǔ)上提出的,一般應(yīng)具備宣傳功能、服務(wù)功能、教育功能和交流功能。二是網(wǎng)站的規(guī)劃設(shè)計。學(xué)者通過對檔案網(wǎng)站的建站方案、入網(wǎng)程序、組網(wǎng)模式、視覺設(shè)計、域名規(guī)范、內(nèi)容建構(gòu)、組織架構(gòu)等內(nèi)容的探討來實現(xiàn)檔案網(wǎng)站的構(gòu)建。三是網(wǎng)站的管理與維護,主要涉及網(wǎng)站的維護與更新、宣傳與推廣、安全管理等內(nèi)容。檔案網(wǎng)站建立后,需要精心管理與維護才能為用戶提供及時、有效的服務(wù),從而樹立網(wǎng)站的良好形象。
此熱點由“高校檔案館”“檔案編研”“服務(wù)”“資源建設(shè)”“Web2.0”“網(wǎng)站技術(shù)”“網(wǎng)站構(gòu)建”等關(guān)鍵詞組成。該主題包含兩個研究熱點,一是新技術(shù)與新理念引入檔案網(wǎng)站建設(shè)的探討與實踐。隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展以及用戶需求的不斷提升,檔案網(wǎng)站的發(fā)展遇到諸多挑戰(zhàn),如何利用新技術(shù)和新理念為廣大用戶提供個性化服務(wù)和更友好的交互方式成為網(wǎng)站建設(shè)過程中面臨的重要問題。學(xué)者主要探討了Web2.0技術(shù)與信息構(gòu)建理論等新概念給檔案網(wǎng)站建設(shè)帶來的機遇和挑戰(zhàn)。崔偉指出,Web2.0 技術(shù)在應(yīng)用形式上會使檔案網(wǎng)站頁面更加豐富、服務(wù)功能更加多元,更重要的是,Web2.0 在實踐中重視提高網(wǎng)路用戶的使用意愿、參與意識和分享精神[16]。于淑麗將信息構(gòu)建理論融入到檔案網(wǎng)站建設(shè)中,運用該理論對我國檔案網(wǎng)站的設(shè)計理念、導(dǎo)航系統(tǒng)、搜索系統(tǒng)、組織系統(tǒng)和標識系統(tǒng)進行了考察,結(jié)合檔案網(wǎng)站存在的問題提出了信息構(gòu)建理論對檔案網(wǎng)站建設(shè)的啟示[17]。二是檔案信息服務(wù)研究。檔案網(wǎng)站的開發(fā)與應(yīng)用為檔案部門信息服務(wù)提供了新的模式與手段,在推動檔案部門服務(wù)創(chuàng)新的同時也引發(fā)了業(yè)界學(xué)者的廣泛探討,主要涉及服務(wù)質(zhì)量、服務(wù)方式、服務(wù)策略、服務(wù)功能及服務(wù)模式構(gòu)建等內(nèi)容,這些研究有力地推動了檔案部門信息服務(wù)向智能化、個性化方向發(fā)展。
此熱點由“檔案利用”“檔案展覽”“特色”“美國NARA 網(wǎng)站”“美國”“檔案檢索”“檔案系統(tǒng)”等關(guān)鍵詞組成。在我國檔案網(wǎng)站建設(shè)的整體水平與歐美等發(fā)達國家相比有較大差距的背景下,通過分析國外優(yōu)秀檔案網(wǎng)站的特色與優(yōu)勢,可以為我國檔案網(wǎng)站建設(shè)的實踐提供參考和借鑒。祝潔對美國國家檔案與文件署(NARA)網(wǎng)站信息服務(wù)的現(xiàn)狀進行了考察和分析,發(fā)現(xiàn)其具有根據(jù)用戶職業(yè)分組提供服務(wù)、以功能強大的在線數(shù)據(jù)庫和豐富的資源為支撐、全面利用政府信息資源、強調(diào)用戶參與等特點,對我國檔案網(wǎng)站信息服務(wù)質(zhì)量的提升具有重要的借鑒意義[18]。馮怡等從日本國立公文書館網(wǎng)站的設(shè)計、內(nèi)容、檢索、互動功能和人性化服務(wù)等角度分析了該網(wǎng)站各方面的建設(shè)情況,提出我國檔案網(wǎng)站建設(shè)可借鑒其“以人為本”的服務(wù)理念、豐富的數(shù)字化館藏、強大的檢索功能等寶貴經(jīng)驗[19]。張妍妍著重分析了澳大利亞國家檔案館(NAA)網(wǎng)站在檔案著錄和檢索方面建設(shè)的優(yōu)勢。NAA網(wǎng)站采用多級著錄的方式,分別制定出數(shù)據(jù)庫結(jié)構(gòu)、檔案信息內(nèi)容、檔案結(jié)構(gòu)形式等著錄標準來推進檔案著錄工作的標準化進程,并提供基礎(chǔ)檢索、高級檢索、人名檢索、照片檢索等多種檢索途徑來滿足用戶多方面的檢索需求[20]。
筆者以我國檔案網(wǎng)站研究論文的高頻關(guān)鍵詞為數(shù)據(jù)基礎(chǔ),通過運用詞頻統(tǒng)計和共詞分析等方法對該領(lǐng)域研究熱點進行分析,發(fā)現(xiàn)我國檔案網(wǎng)站研究集中于現(xiàn)狀調(diào)查、高校檔案網(wǎng)站建設(shè)、資源建設(shè)、網(wǎng)站評價、網(wǎng)站設(shè)計與構(gòu)建、網(wǎng)站技術(shù)與服務(wù)、國外優(yōu)秀檔案網(wǎng)站的分析與借鑒7個方面??傮w來說,我國檔案網(wǎng)站研究存在如下問題:眾多研究成果側(cè)重于理論探討,而對于網(wǎng)站開發(fā)建設(shè)的實踐研究卻很少;研究力度不均衡,研究集中于現(xiàn)狀調(diào)查研究以及國外優(yōu)秀檔案網(wǎng)站的分析與借鑒等方面,而在高校檔案網(wǎng)站建設(shè)、資源建設(shè)、網(wǎng)站評價、網(wǎng)站技術(shù)與服務(wù)等主題上研究內(nèi)容不夠深入和細化;研究視野局限,缺乏對檔案網(wǎng)站建設(shè)過程中涉及的法律問題的研究;學(xué)科交叉研究較少。未來國內(nèi)檔案界學(xué)者應(yīng)繼續(xù)深化和擴展檔案網(wǎng)站理論與實踐研究,建立、健全檔案網(wǎng)站管理與維護的長效機制,不斷學(xué)習(xí)和借鑒其他國家或行業(yè)網(wǎng)站建設(shè)的先進經(jīng)驗,根據(jù)用戶需求及實際需要不斷完善我國的檔案網(wǎng)站建設(shè)。