文 / 郭鵬
國際圖博檔三館融合研究的可視化分析
文 / 郭鵬
為了全面把握國際圖書館、檔案館和博物館融合研究的主體、理論基礎和發(fā)展趨勢,以Web of Science數據庫中二十年來相關研究文獻為分析對象,綜合分析研究文獻的時間分布,同時借助CiteSpace可視化軟件,對國際研究的主要力量和核心作者進行了統(tǒng)計,運用文獻共被引分析法剖析支撐該領域發(fā)展的關鍵文獻分布,最后通過共詞聚類分析解析該領域的熱點前沿和動態(tài)演進過程。
圖書館;檔案館;博物館;融合;可視化
圖書館、檔案館與博物館(Library, Archive and Museum,以下簡稱“LAM”)同為文獻信息資源的寶庫,承載著促進社會主義政治、經濟、文化發(fā)展的重任。英國現代檔案學家邁克爾·庫克先生認為,“國家檔案館與國家圖書館、國家博物館和國家文獻中心具有相同的文獻性質,同屬科學文化機關”?,F代社會圖書館、檔案館和博物館之所以成為三個獨立的文化機構,是人類社會分工日益細密的結果。本文運用可視化分析技術對國際LAM研究文獻進行計量分析,力求全面把握國內外LAM研究進展,以期為相關領域的研究提供參考和借鑒。
經過查閱發(fā)現,目前關于圖書館、檔案館和博物館數字化融合的綜述性論文中,鮮見以可視化分析技術對文獻進行計量分析。鑒此,本文以Web of Science(WOS)作為來源數據庫(數據最后的更新時間為2017年9月16日),以“l(fā)ibrary AND archive AND museum”為主題詞檢索,時間跨度為1997—2016年,引文數據庫選擇“SCI—EXPANDED,SSCI,A&HCI,CPCl—S,CPCl—SSH,ESCI”,共檢出549篇研究文獻,檢索時間為2017年9月17日。將這些研究文獻保存到一個文本格式文件里。該文件包括每篇研究文獻的標題、國家、機構、作者、關鍵詞、參考文獻等題錄信息。這些題錄信息即本文的主要分析對象。研究工具采用美國德雷塞爾大學(Drexel University)教授陳超美博士研發(fā)的科學文獻可視化軟件CiteSpace[1]。本文運用CiteSpace對“圖書館、檔案館和博物館融合”研究領域的主要研究力量、核心作者、關鍵文獻和熱點前沿進行計量分析。
1997—2016年間,國際范圍內“圖書館、檔案館和博物館融合”研究文獻的時間分布見圖1。2011年,首屆“圖書館、檔案館、博物館開放關聯(lián)數據峰會”(The International Linked Open Data in Libraries, Archives & Museums Summit,簡稱LODLAM)在美國舊金山舉行,三館的交流與融合在國際范圍得以順利開展,相關研究也隨之增加,特別是在2015和2016兩年,增幅尤為顯著。
圖1 LAM融合領域年度發(fā)文量
為了發(fā)掘圖書館、檔案館和博物館融合研究力量的分布,筆者通過CiteSpace進行機構(Institute)與國家(地區(qū))(Country/Region)的共性分析。時間跨度設置為1997—2016年,“Time scaling”設置為1,即將1997—2016年劃分為20個時間段進行處理,以文獻標題(Title)、摘要(Abstract)、關鍵詞(Keywords Plus)為主題詞來源(Term Source),以Top50(Top N per slice)為數據抽取對象,由此得到國內外有關LAM的主要研究力量知識圖譜。其中,圓圈節(jié)點代表國家(地區(qū)),與圓圈節(jié)點直線相連的分支小節(jié)點則代表機構,并且節(jié)點大小與其發(fā)文量成正比,有合作關系的國家(地區(qū))或機構則通過連線相連,見圖2。
圖2 LAM融合主要研究(國家/機構)分布知識圖譜
結合文獻的統(tǒng)計結果,筆者發(fā)現共有61個國家/地區(qū)對LAM融合發(fā)展做出貢獻。從圖2可知,美國的發(fā)文量(篇)最多,達到了148篇,占總發(fā)文量(篇)的近30%,遠遠高于其他國家和地區(qū)。發(fā)文量(篇)排名前十位的依次為美國(148)、英國(58)、澳大利亞(28)、德國(25)、意大利(24)、西班牙(23)、法國(18)、俄
羅斯(12)、奧地利(9)和加拿大(9)。我國發(fā)文總量為4,又以臺灣地區(qū)的發(fā)文量最多。
表1 LAM融合研究文獻的主要研究力量分布
表2 發(fā)文突增性最強的四個國家
從節(jié)點中心度可知,英國和意大利雖然發(fā)文量不大,卻分別排在第二和第五位。澳大利亞的發(fā)文量(篇)雖然僅次于英國,影響力卻略顯不足。由此可見,除美國外,英國和意大利在該領域取得的成果也是不可忽視的。從發(fā)文突增性可知,英國在該領域的研究起步較早,持續(xù)時間也較長。德國、美國和西班牙則是在2009年之后對LAM的研究才有了突破性的進展,對國際LAM融合研究領域有不可忽視的貢獻,如表1、表2所示。
表3 LAM融合研究力量分布(機構)
從表3中可以看出,各國關于LAM融合研究的力量主要來源于大學。美國在該領域的主要研究力量包括羅徹斯特理工學院(Rochester Institute of Technology)、羅徹斯特理工學院(Rochester Institute of Technology)、伊利諾伊大學(University of Illinois Urbana-Champaign)、北卡羅來納大學(University of North Carolina)、佛羅里達州立大學(Florida State University)等。英國的研究力量包括倫敦大學學院 (University College London)、倫敦大學(University of London)等。除此之外,還包括新西蘭惠靈頓維多利亞大學(Victoria University Wellington)、波蘭科學院(Polish Academy of Sciences)、挪威科技和自然大學(Norwegian University of Science and Technology)等。
筆者運用CiteSpace繪制國際作者共被引知識圖譜,研究LAM融合領域的核心代表人物,見圖3。
圖3 LAM融合研究的作者共被引知識圖譜
圖3中圓圈節(jié)點大小與作者被引頻次成正比,圓圈節(jié)點的不同顏色年輪表示作者被引年份,有合作關系的作者通過連線相連。從圖3可知,TRANT J、MARTY PF、ZORICH D等人被引頻次較高,排名前三。從中心度可知,高被引作者同樣具有較高的中心度,其中TRANT J、MARTY PF、ZORICH D、VERBORGH R位居前四位。
表4 LAM融合研究高被引作者列表
共被引聚類能夠展示學科領域的知識基礎,在文獻共被引網絡的演進軌跡中,連接不同文獻聚類的節(jié)點稱為關鍵點文獻,具有較高的中介中心度,在不同文獻聚類網絡中起著“知識拐點”的作用[2]。
通過對關鍵點文獻的分析能夠揭示支撐該學科領域發(fā)展的關鍵文獻分布。在CiteSpace生成的知識圖譜中,關鍵點文獻被定義為中心度大于或等于0.1的節(jié)點文獻,并用紫色圈突出顯示,見圖4和表5。
表5 LAM融合研究關鍵點文獻信息
圖4 LAM融合研究關鍵點文獻知識圖譜
從圖4中可以看出,LAM融合領域還未出現中心度較大的關鍵節(jié)點,仍處于探索研究階段。被引頻次最高的三篇文章分別是VERBORGH R等發(fā)表的“Evaluating the success of vocabulary reconciliation for cultural heritage collections”;TRANT J等發(fā)表的“Introduction: When Museum informatics meets the World Wide Web, it generates energy”和GIVEN LM等發(fā)表的“What’s old is new: The re-convergence of library, archives, and museum in the digital age”。其中,VERBORGH R等人就關聯(lián)數據在異構資源整合中的重要作用進行了論述,通過交換式數據轉換工具將本地元數據與國會圖書館的藝術與建筑主題實行開放式存取,并針對數據轉換過程中出現的問題提出解決方案,最大程度實現了現有元數據與受控詞匯表之間的自動轉換。TRANT J等人就互聯(lián)網環(huán)境下,傳統(tǒng)信息資源管理過程中遇到的機遇和挑戰(zhàn)以及應對策略進行了系統(tǒng)介紹。GIVEN LM等人認為,隨著新技術的出現,作為文化遺產寶庫的圖書館、檔案館和博物館實現了歷史性的融合;這種融合不但沒有偏離其作為文化機構的主要職能軌跡,而且在知識和信息的獲取、存儲、記錄過程中實現了歷史的傳承;通過對檔案的開發(fā)和利用,可以改變對圖書館和博物館的傳統(tǒng)認識,充分發(fā)揮文化機構再現歷史的重要功能。
特別值得注意的是,三篇文章分別從不同角度出發(fā),論述了圖書館、檔案館和博物館在資源融合過程中面臨的主要問題和解決辦法,不約而同地指出:“融合”是三館未來發(fā)展的新方向。
為了挖掘LAM融合領域的熱點和前沿,筆者運用CiteSpace繪制該研究領域的關鍵詞( Keywords)研究熱點主題詞聚類知識圖譜(見圖5)、共現時間區(qū)(TimeZone)知識圖譜(見圖6)和共現時間線(TimeLine) 知識圖譜(見圖7)。
圖5 LAM融合研究的關鍵詞聚類聚類知識圖譜
從圖5中可以看出,國際LAM融合研究的熱點主要集中在內容管理、外部環(huán)境、社會資本、文化遺產和情景分配五個方面。
1.內容管理(Content Management)。早期的“內容管理”偏向于出版管理,Bob Boiko認為:“內容管理是指在目標出版物(Targeted Publications)中有效地收集、管理和形成可利用的信息?!盵3]后來,它被廣泛地應用于數字圖書館、數字檔案館和數字博物館的建設和研究中,成為各類信息資源集成與共享的關鍵技術。南開大學劉玉照教授對“內容管理”的定義為:“針對實際問題提出的解決方案,既是有效地收集、管理和發(fā)布信息,使需求用戶得以滿足,同時也是人、過程與技術的集成?!盵4]內容管理技術的出現極大地拓展了圖書館、檔案館和博物館數字化資源的管理和應用范圍,促使更多智能手段的引入。
2.外部環(huán)境(Working Environment)。外部環(huán)境主要指對圖書、檔案、文物等各類文獻長期保存的外部條件的研究,主要包括空氣中水分、微生物、灰塵等對文獻載體的影響,元數據的采集和管理,以及各類信息技術手段等。
3.社會資本理論(Social Capital)。20世紀70年代以來,經濟學、社會學、行為組織理論以及政治學等多個學科都不約而同地開始關注一個概念——社會資本。它是指個人在一種組織結構中所處的位置和價值。于群體而言,社會資本是指群體中使成員之間互相支持的那些行為和準則的積蓄。[5]圖書館、檔案館和博物館作為文化機構中的成員,如何協(xié)調三者之間的關系,明確各自的責任和義務,社會資本理論是其重要依據之一。
4.文化遺產(Cultural Heritage)。文化遺產在概念上分為物質文化遺產和非物質文化遺產。物質文化遺產是具有歷史、藝術和科學價值的文物。歷史上重要的文獻、手稿、圖書、檔案等都屬于文化遺產的保護范圍。非物質文化遺產,是指各族人民世代相傳并視為其文化遺產組成部分的各種傳統(tǒng)文化表現形式,以及與傳統(tǒng)文化表現形式相關的實物和場所。[6]其重要途徑之一就是圖書館、檔案館和博物館之間協(xié)同合作。通過檔案化的記錄形式,可以將圖書館、博物館中的非物質文化遺產聯(lián)系起來,實現隱性知識的顯性化。因此,文化遺產保護也成為LAM融合研究的關鍵節(jié)點之一。
5.情景分配理論(situational appropriation)。情景分配理論[7]主要用來研究同一類型信息在多種情況下如何變得更加有用的問題。它有助于辨別不同情境影響的積極作用。與傳統(tǒng)知識管理相反,“信息情境分配”的概念是信息概念化的另一種表現形式,將信息的價值與實踐應用中表現出來的有用性綜合考量,更有助于解釋特定類型信息的應用實例,對于不同來源機構中文獻融合框架的闡釋方面具有十分重要的作用,成為LAM融合研究的前沿熱點之一。
圖6 LAM融合研究的關鍵詞共現時間區(qū)知識圖譜
我們從圖6中可以看到若干個紫色圈節(jié)點。這些節(jié)點具有較高的中心度,是整個知識網絡中的關鍵節(jié)點,代表LAM融合研究的前沿領域,也是近幾年研究的熱點問題。最初階段,中心詞匯除了“檔案館”、“圖書館”和“博物館”外,還有“數字化”(digital,2006)和“文化遺產” (cultural heritage,2013)。由此可見,在二十世紀初期,國際范圍內圖書館、檔案館和博物館研究之間的聯(lián)系并不十分緊密。之后的十幾年中,三館之間的研究熱點成交叉式前進的發(fā)展態(tài)勢,并逐漸趨向統(tǒng)一?!皵底只焙汀拔墨I遺產”成為促使趨同性產生的重要原因。首先,文獻數字化技術的出現使得信息內容不再受載體的限制,不同類型文獻信息資源的共享成為可能。其次,文化遺產活動的興起,使得三館開始意識到單靠任何一方的力量都無法保證信息的齊全和完整。在共同目標的驅動下,不同文化機構之間開始尋求合作,各自為政、條塊分割的傳統(tǒng)格局被逐漸打破。“2016年”成為LAM研究熱點的趨同性和交叉性表現最為明顯的一年。
圖7 LAM融合研究的關鍵詞共現時間線知識圖譜
從圖7中可知,國際LAM融合研究主要分為五個時間段,分別為2001—2004年、 2004—2007年、2007—2010年、2010—2013年、2013—2016年。
第一階段(2001—2004年)的熱點關鍵詞為“檔案館”(archive)和“圖書館”(library)。這一階段主要以檔案館和圖書館的合作為主,博物館的參與較少。第二階段(2004—2007年)的熱點關鍵詞為系統(tǒng)(system)、總統(tǒng)圖書館(presidential library)、民俗博物館-國家檔案(museum national archive)、檔案管理(archive management)、數字圖書館(digital library)。這一階段,博物館開始加入LAM融合研究陣營中,三館在合作領域、方式和技術上的探索更為深入。第三階段(2007—2010年)的熱點關鍵詞為遺產(heritage)和技術(technology)。由此開始,LAM之間的合作已經從機構和人員的協(xié)同工作,轉變到信息層面。研究人員開始試圖從宏觀的社會遺產保護視角和關聯(lián)數據、元數據等網絡技術層面尋找不同來源數據之間開放共享的解決辦法。第四階段(2010—2013年)的熱點關鍵詞開始出現多樣化的特點,主要有社交媒體(social media)、歷史文化(history cultural)、記憶(memory)、信息(information)、信息科學(information science)、文獻(document)、生物腐蝕(bio-deterioration)。這一時期,大型國際數字記憶、社會遺產保護項目相繼啟動。2011年,首屆“國際圖書館、檔案館、博物館開放關聯(lián)數數據峰會”在美國舊金山舉行,大大推動了LAM融合研究。同時,由于信息和網絡技術的發(fā)展,微博和公眾號等新型服務模式成為三館信息服務的新形式。理念和技術的革新,使檔案學、圖書館學和博物館學的研究人員開始突破本學科的限制,從文獻的角度重新審視自身的發(fā)展和未來。第五階段(2013—2016年)是LAM融合研究成果集中爆發(fā)的一個時期,熱點關鍵詞包括元數據(metadata)、整合(integration)、互用性/協(xié)同工作能力(interoperability)、開放數據(open data)、特藏(special collection)、增強現實技術(augmented reality,AR技術)、文化遺產(cultural heritage)、合并/聯(lián)合(consolidation)、融合(convergence)、背景(context)、信息管理(information management)、創(chuàng)新(i n n o v a t i o n)、文學方法(l i t e r a c y methodology)、生物腐蝕(biodeterioration)、真菌學(fungimation science)等。這一階段“數字人文、計算科學”的概念相繼出現,“融合”、“整合”、“聯(lián)合”等相關概念開始成為圖書館、檔案館和博物館研究新的熱點。技術領域的研究除了元數據、關聯(lián)數據、開放數據等基礎數據層,更增加了對AR、VR、3D等虛擬與現實互動信息顯示技術的研究。學者試圖通過資源與技術的融合,實現對人文學科的創(chuàng)新型發(fā)現。
綜上所述,隨著時代的發(fā)展,LAM領域的研究熱點在不斷增加,逐步面向歷史和技術雙重維度展開。面向歷史的視角下,圖書館、檔案館和博物館等文化機構開始從“文化遺產和社會記憶”的角度重新詮釋自我,進而成為LAM融合的源動力。技術的不斷進步,為數據的存取、轉換和遷移提供了更加安全、便捷的方法,為還原事件、再現歷史起到了重要的支撐和橋梁作用。
本文以1997—2016年WOS中收錄的以“圖書館、檔案館和博物館融合”為主題的549篇文獻為分析對象,借助CiteSpace可視化軟件,運用科學知識圖譜的方法,解析國際圖書館、檔案館和博物館研究的時間分布、主要研究力量和核心作者以及支撐當前國際LAM研究的重要文獻及代表人物,并探索了國際LAM研究的熱點前沿及動態(tài)演進過程,由此得出以下結論:①國際上有關LAM研究的學術文獻一直呈上升趨勢,著眼于LAM文獻的增長趨勢及關注度的增加,我們有理由相信,未來幾年內,這一領域研究的相關文獻還將繼續(xù)增加;②國際LAM主要研究力量是美國、歐洲等發(fā)達國家,我國的相關研究主要集中在臺灣地區(qū);未來幾年LAM有望成為大陸地區(qū)一個新的研究增長點。③國際LAM研究的熱點前沿主題包括內容管理、外部環(huán)境、社會資本、文化遺產和情景分配。通過對不同時期研究熱點的分析可以看出,國際LAM研究逐漸向宏觀歷史和微觀技術層面擴展。
[1][2]Chen C. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the American Society for Information Science and Technology,2006,57(3):359-377.
[3]Boiko B.Content Management Bible.New York:Wiley Pub-lishing Inc.,2002.
[4]劉玉照,劉建準,岳修志.內容管理技術及其在數字圖書館中的應用研究[J].情報理論與實踐,2006(6):681-684.
[5][英]杰森特·喬丹.集體行為理論與社會資本分析(A).社會資本與社會發(fā)展[M].北京:社會科學文獻出版社,2000.
[6]胡錦濤.中華人民共和國主席令第四十二號.中華人民共和國非物質產[EB/OL].http://www.ihchina.cn/3/10377.html.
[7]I Huvila.Situational appropriation of information, Aslib Journal of Information Management,2015,67(5).
本文系國家社科基金重大項目“圖書、博物、檔案數字化服務融合研究”(編號:10&ZD134)子課題研究成果之一。
(責任編輯:虞志堅)
G270;TP309
A
1005-9652(2017)05-0024-06
郭鵬(1983-),女,河北人,北京大學信息管理系博士研究生,北京大學檔案館助理研究員。