賀譚濤 文利君 黃裕宏 周文泓
摘 要:對數(shù)字人文實踐的調查研究旨在發(fā)現(xiàn)數(shù)字人文與檔案管理的關聯(lián)要點與作用內(nèi)容,為基于數(shù)字人文的檔案管理描摹發(fā)展方向。通過案例分析,歸納得出數(shù)字人文與檔案管理關聯(lián)的實踐表現(xiàn)為:檔案信息資源為數(shù)字人文提供內(nèi)容支持、檔案化為數(shù)字人文提供項目運營方向與方法、數(shù)字人文對檔案管理認知和方法論的拓展,從中解析出兩者的關聯(lián)由檔案領域融合數(shù)字需求的發(fā)展驅動,以檔案活動全方位流程再造為支撐,并以檔案對象的資源化關聯(lián)整合為內(nèi)核。由此,以數(shù)字人文為依憑,提出明確檔案管理的問題導向策略、管理體系系統(tǒng)性拓展和檔案管理的數(shù)字轉型擴張等發(fā)展方向。
關鍵詞:數(shù)字人文;檔案管理;數(shù)字轉型
分類號:G271
Research and Implication on the Correlation between Digital Humanities and Archives Management——Analysis on the Practice of Digital Humanities
He Tantao,Wen Lijun,Huang Yuhong,Zhou Wenhong
(School of Public Administration of Sichuan University, Chengdu, Sichuan, 610065)
Abstract:The research on the practice of digital humanities aims to identify the correlation between digital humanities and archives management, and traces the direction of archives management based on digital humanities. Through the case studies, It concludes that the practical performances of the correlation are as follows: archival resources provide content support for digital humanities, archiving provides project operation methods for digital humanities, and digital humanities expands the cognition and methodology of archives management. It is analyzed that the correlation is driven by the digital demand in the archival domain and digital humanities, and supported by the comprehensive process reengineering of archives management. Besides, the correlation takes the integration of archival resources as the core. Therefore, based on the digital humanities, it puts forward the development directions such as the problem-oriented strategy of archives management, the systematic development of management framework and the expansion in digital transformation of archives management.
Keywords:Digital Humanities;Archives Management;Digital Transformation
數(shù)字人文作為重要議題已逐步在檔案領域得到確立[1],正從多個方向展開實踐與理論探索。關于數(shù)字人文是什么、數(shù)字人文同檔案領域的關系、數(shù)字人文引領下的檔案實踐如何展開等問題逐步形成思路[2]。實踐層面,《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》已明確提出應加強數(shù)字人文在檔案信息深層加工和利用中的應用[3]。且威尼斯時光機、影谷、北京記憶[4]等項目亦顯示檔案、檔案活動、檔案機構與數(shù)字人文的直接互動,可促進檔案領域在理論、方法、流程、工具等方面的拓展。然而,當前實踐主要圍繞檔案信息資源開發(fā)與利用展開,數(shù)字人文作為重要方向的作用沒有得到充分明確,對應的發(fā)展空間也有待探索。
研究層面有著相似的情況,現(xiàn)有成果主要體現(xiàn)為:一是認知上探尋數(shù)字人文與檔案管理在理論與實踐上的關聯(lián)點,由檔案作為共同的作用對象確認二者協(xié)同并進的趨向和必要性,亦指出要厘清二者之間的差異[5]。二是以數(shù)字人文為目標、方法、工具貢獻于檔案管理的升級優(yōu)化[6]。一方面,各類檔案信息資源庫、服務平臺等依照數(shù)字人文的需求得到開發(fā),由此更新關于檔案服務內(nèi)容與形式的認知[7]。另一方面,以數(shù)字記憶為代表的實踐得到研究解析與推廣,從方法到流程上提供了檔案開發(fā)利用的再造方向[8]。三是將數(shù)字人文作為檔案學科建設的發(fā)展點,從研究方向中的議題與方法轉型[9]、人才培養(yǎng)中的教學內(nèi)容與形式創(chuàng)新[10]等方面提出建議。現(xiàn)有研究一定程度上確認了數(shù)字人文作用于檔案領域的著力點和對應策略。然而,亦有較大的研究空間供探討:一是缺少兩大領域互動視角的整體關系描摹,主要從數(shù)字人文的影響出發(fā)深入二者關系,尤其是對檔案領域的反作用研究有限。二是兩者的作用內(nèi)容主要著力于檔案信息資源開發(fā)利用,對檔案管理的其他環(huán)節(jié)以及其他方面涉及較少。
因而,文章對關聯(lián)數(shù)字人文和檔案領域的實踐案例進行調研,運用案例分析法,對數(shù)字人文領域的三大代表性網(wǎng)站ADHO[11]、EADH[12]、CenterNet[13]以及國內(nèi)的數(shù)字人文項目進行綜合考察,選取其中與檔案領域產(chǎn)生關聯(lián)且發(fā)展較好的22個數(shù)字人文實踐項目作為核心數(shù)據(jù)源[14-35]。隨后,對數(shù)字人文實踐項目進行解析,從中提取數(shù)字人文與檔案管理的關聯(lián)要點,并由此歸納出兩者的關聯(lián)邏輯,并基于此總結兩者相互關聯(lián)的連接點和相互作用的內(nèi)容。最后,為面向數(shù)字人文的檔案管理提出發(fā)展方向和未來展望。
基于對ADHO、EADH、CenterNET和國內(nèi)數(shù)字人文領域各類數(shù)字人文項目的調查可發(fā)現(xiàn),數(shù)字人文與檔案管理產(chǎn)生豐富交集,主要體現(xiàn)在三個層面。
2.1 檔案作為信息資源為數(shù)字人文提供內(nèi)容支持
各類歷史資料是數(shù)字人文項目的內(nèi)容基礎,檔案作為重要組成提供直接的內(nèi)容資源。作為社會活動的原始記錄,無論是僅依托檔案加工而成的產(chǎn)品與服務,還是同其他類型資料一道整合呈現(xiàn),均是檔案發(fā)揮作用的形態(tài)。
一是利用大量檔案資源支持基礎數(shù)字資源庫構建和相關工具開發(fā)。以柏林勃蘭登堡科學人文學院開展的項目Corpus Coranicum為例[36],項目旨在從版本的演變、文字史、歷史三個角度研究《古蘭經(jīng)》。為使早期的手稿能以文本和圖像形式被訪問,研究團隊以Gotthelf-Bergstr er照片檔案館一萬多份古蘭經(jīng)手稿照片檔案為基礎資源,運用OCR技術將手稿圖片轉化為XML編碼文本。而為了以數(shù)字形式記錄手稿所有的字符和字母,他們還以XML格式創(chuàng)建了單獨的音譯系統(tǒng)和特殊的“Coranica”字符集,并建立SQL數(shù)據(jù)庫用于存儲手稿和音譯數(shù)據(jù),形成了Coranicum語料庫和符合文本編碼倡議(TEI)和Unicode聯(lián)盟系統(tǒng)數(shù)字標準的《古蘭經(jīng)》手稿目錄。目前項目團隊已經(jīng)發(fā)布了一個包含數(shù)字化手稿、音譯詞、《古蘭經(jīng)》德語翻譯等內(nèi)容的網(wǎng)站,可以實時獲取相應數(shù)據(jù)庫或語料庫的內(nèi)容,網(wǎng)站還具備搜索功能以幫助用戶進行內(nèi)容搜索。
二是整合多類型資料,豐富資源內(nèi)容層次與表現(xiàn)形式。如“漫步于梅蘭鎮(zhèn)”項目[37],旨在介紹實驗性房屋建筑基地梅蘭鎮(zhèn)的發(fā)展歷史,進而使大眾反思個人與城市環(huán)境、住房、歷史的關系以設想當?shù)氐目沙掷m(xù)生活方式。梅蘭鎮(zhèn)位于法國巴黎大區(qū)93省努瓦西萊(Noisy-le-Sec),是二戰(zhàn)結束后創(chuàng)建的一個實驗性房屋建筑基地,自2000年起被列為歷史遺跡。項目團隊利用本市檔案館中眾多基建檔案資源和國家檔案館的部分館藏,建構了基地的可視化地圖模型,搜集了當?shù)氐臍v史照片,錄制了當?shù)氐沫h(huán)境聲和8位知曉其發(fā)展歷史的見證者對梅蘭鎮(zhèn)的介紹視頻,充分利用了包括檔案在內(nèi)的多種信息資源。項目成果網(wǎng)站以三個發(fā)展階段的不同地圖模型為基點,每個發(fā)展階段下配有三到四個主題視頻,地圖主頁配有相應文字、歷史照片、見證者的音視頻等信息資源進行說明,例如當時城市規(guī)劃部部長的命令文件、二戰(zhàn)后剛開始重建的街區(qū)照片等。用戶可通過交互式地圖查看相關內(nèi)容,特別地,依時空不同,網(wǎng)站會播放不一樣的環(huán)境聲,成功實現(xiàn)了“一個多聲道歷史街區(qū)的數(shù)字敘事”。
2.2 檔案化為數(shù)字人文項目提供運營方向與方法
數(shù)字人文于實踐中往往是以項目的方式表達,于數(shù)字情境中需要由信息資源、信息產(chǎn)品或信息服務來呈現(xiàn)。而“檔案化”作為數(shù)字人文項目重要的運營方法亦在其中有所體現(xiàn)。
一方面,數(shù)字人文項目以檔案庫建設為目標展開實踐,即此類項目聚焦于為特定的事物、事件或人物專題建立對應的檔案庫。盡管這里的檔案并不等同于嚴格界定的檔案,但項目實踐依舊呈現(xiàn)出為特定專題建立真實可靠記錄集的過程。以18世紀詩歌檔案館項目為例[38],為支持18世紀詩歌的教學和研究工作,具有文學研究背景的數(shù)字圖書館學者Alexander Huber的研究團隊通過對詩歌數(shù)字文本的多次編碼,并編程開發(fā)詩歌文本分析工具,成功構建了關于18世紀詩歌的交互式協(xié)作空間。具體而言,項目團隊以18世紀文獻作品庫(Eighteenth Century Collections Online)與牛津文本檔案庫(Oxford Text Archive)的數(shù)字化詩歌資源為基礎,首先對上述詩歌資源進行了縮微膠片圖像轉錄,字符大小寫、縮進等格式校對工作。其次完成詩歌作者、書目信息、參考文獻等基本信息的標記工作。隨后對單詞進行標識符分配、詞性標注、詞型還原、音節(jié)標記等著錄工作,形成了多層編碼的數(shù)據(jù)化詩歌文本資源。目前,該檔案館已收錄320位詩人的3105件詩歌作品,且上述詩歌作品能以文本、圖像、TEI/XML編碼等多種形態(tài)呈現(xiàn),并包含多種參考信息,從而成功構建了關于18世紀詩歌的檔案資源庫。
另一方面,數(shù)字人文項目實踐本身也是社會活動的一部分,對活動過程中所形成的記錄進行檔案化管理以維護項目的連續(xù)性與高效率是項目管理的重要手段。因而,對數(shù)字人文項目形成的信息展開檔案管理也是數(shù)字人文關聯(lián)檔案管理的要點之一。在這方面,倫敦大學國王學院數(shù)字實驗室提供了典型的實踐案例[39]。KDL在運營自身數(shù)字人文項目的同時,也為高校和記憶機構的數(shù)字人文項目提供從項目前期設計、可行性分析到中期網(wǎng)站、數(shù)據(jù)庫開發(fā),直至后期成效評估和歸檔維護的全流程管理服務??紤]到各類項目蘊含的知識和文化價值,KDL開展了歸檔和可持續(xù)保管工作,以檔案管理方法保證上述項目在結束之后的可檢索性和可訪問性:(1)動態(tài)網(wǎng)絡站點的維護,即保證項目網(wǎng)站更新、交互式查詢等動態(tài)功能。一是依據(jù)服務等級協(xié)議(Service Level Agreements)進行項目維護。對于外包給KDL并選擇可持續(xù)性維護的委托方,KDL將在項目完成后于協(xié)議期限范圍內(nèi)對數(shù)字研究項目進行持續(xù)的托管和維護。二是通過內(nèi)容遷移維護網(wǎng)站的動態(tài)功能。作為更為經(jīng)濟的方式,KDL可將數(shù)字研究項目及其數(shù)據(jù)遷移至倫敦國王學院的網(wǎng)絡站點或者其他商業(yè)機構的基礎網(wǎng)絡架構中。(2)動態(tài)網(wǎng)絡站點的靜態(tài)化,即將動態(tài)網(wǎng)站轉化成不提供搜索等動態(tài)功能的靜態(tài)網(wǎng)站。KDL提供免費的網(wǎng)絡站點靜態(tài)化服務以使現(xiàn)存項目網(wǎng)站成果及其數(shù)據(jù)集仍然是可訪問的,但現(xiàn)存的內(nèi)容將不再更新。(3)最低限度的歸檔保存。由于部分數(shù)字人文項目實踐存在資金缺乏或不適合轉化為靜態(tài)網(wǎng)站等原因,KDL便對其進行最低限度的歸檔保存。對于統(tǒng)一資源定位器(URL)受KDL控制的項目,則將其網(wǎng)站成果和數(shù)據(jù)在KDL的網(wǎng)絡基礎架構上至少保存兩年,并在URL上設置靜態(tài)頁面,介紹項目的基本信息以及其他可用鏈接,如互聯(lián)網(wǎng)檔案館歸檔的網(wǎng)絡快照。
2.3 數(shù)字人文為檔案管理拓展認知與方法論
數(shù)字人文連接了包括檔案在內(nèi)的多樣化信息資源、數(shù)字技術、人文學科以及特定問題涉及的其他領域,呈現(xiàn)出以檔案為代表的信息資源在跨學科融合的趨向中如何面向人文甚至更廣闊的社會需求,并依托數(shù)字技術構筑管理新模式,拓展檔案管理的認知與方法論,拓寬檔案管理作用于人類世界的邊界與形態(tài)。而在這其中,檔案面向研究領域甚至公眾的歷史記憶資源建設以及對應的管理流程再造與平臺建設,則顯現(xiàn)出數(shù)字人文導向之下的檔案管理新建。
一方面,數(shù)字人文項目中的檔案管理對象已細化至數(shù)據(jù)層,檔案認知與方法需持續(xù)拓展。一是數(shù)字人文項目中強化不同維度的數(shù)據(jù)關聯(lián)思想,使檔案領域從認知層面開始重視檔案數(shù)據(jù)化并進行檔案內(nèi)容的關聯(lián)、挖掘和分析。二是認知層面帶動管理環(huán)節(jié)的改進,更廣泛的技術方法與工具應用到了檔案管理工作中。
以“存檔警報”項目為例[40],為促進各形態(tài)檔案的保護與開發(fā),非盈利公司Taxis Archives在商業(yè)實驗室Mataroa的技術支持下開發(fā)了收集、保存歷史檔案和其他資料的創(chuàng)新工具——“存檔警報”,從而實現(xiàn)了數(shù)據(jù)層級的資源貢獻和社會化協(xié)同的顯著融合。例如,個人、團體或其他組織可在其線上平臺注冊成為用戶后,填寫相關表格聲明自己所擁有的或認為具有存檔價值但未得到妥善保存的文本、照片、音視頻、地圖等資料,闡明所述資料的一般特征、所處位置、形成日期并自愿上傳資源相關圖片。用戶提交表格后,平臺以電子方式將其提交給其合作的檔案機構。檔案機構如果認為用戶描述的資料是有檔案價值的,將會接受用戶的存檔請求,對材料進行搶救式保存,如果材料是私人文件,則將其記錄下來。同時,這些機構會對其負責保護的材料進行相應注冊,并將感興趣的材料納入館藏。在這一過程當中,各類用戶通過對檔案機構進行數(shù)據(jù)層級的資源貢獻參與到社會化協(xié)同的檔案管理之中。
另一方面,數(shù)字人文強化了檔案資源整合與服務的問題導向意識,檔案管理對象得以具體化,服務得以精細化。如考古資源編目系統(tǒng)(ARCS)項目[41],為實現(xiàn)研究需求同可用資源的高度匹配,密歇根州立大學數(shù)字人文與社會科學中心開發(fā)了基于Web的開源數(shù)字平臺——考古資源編目系統(tǒng)。ARCS項目源于早期設計的對Isthmia檔案庫進行在線訪問的數(shù)字檔案解決方案,在對方案的更新中,研究者發(fā)現(xiàn),考古檔案的特殊性要求更為精細的解決方案。因此,ARCS團隊聚焦于解決考古檔案的管理問題,開始構建專門的開源解決方案,形成了初步的ARCS版本,并在對Isthmia檔案庫的挖掘中得到可行性驗證。為使ARCS成為更具通用性的實用程序,項目團隊與MATRIX數(shù)字中心進行合作,對ARCS進行了更新,形成了最新版本。該版本的ARCS允許任何考古項目在平臺上存儲、注釋、組織、協(xié)作和共享數(shù)字化的已有材料,例如照片、田野日志和挖掘記錄。為實現(xiàn)對考古材料的規(guī)范描述,該平臺還專門開發(fā)了ARCSCore元數(shù)據(jù)框架,上傳的材料需符合該框架要求,并且要包含備整個考古項目的相關過程信息。除了各類資源共建共享功能外,平臺為每條資源提供討論空間,研究人員可以在此交流。考古資源編目系統(tǒng)中已存有上萬份考古資料,不僅作為考古檔案管理平臺、研究平臺被考古學者廣泛使用,還作為教學工具應用到了教學當中,取得了多方面的成效。
3.1 檔案領域融合數(shù)字需求的發(fā)展驅動
數(shù)字人文與檔案管理關聯(lián)模式呈現(xiàn)出雙方在各自領域面臨的問題驅動下,互相汲取長處,實現(xiàn)互補,產(chǎn)生以項目實踐為基礎的關聯(lián),最終借助項目實踐產(chǎn)出新知識與新結果。
第一,人類世界的發(fā)展需要依托問題導向為兩大領域找到根本連接點。于數(shù)字人文領域而言,歷史規(guī)律發(fā)現(xiàn)、新知識的創(chuàng)造、人類情感的維系等驅動著其對包含檔案在內(nèi)的信息資源的挖掘;而檔案領域需要在跨學科融合的趨向中面向人文甚至更廣闊的社會需求,依托數(shù)字技術構筑管理新模式,引導數(shù)字檔案資源整合與服務的優(yōu)化工作,拓展檔案管理的認知與方法論。因而,二者實現(xiàn)從需求點到檔案資源的連接??葾RCS項目的啟動目的就是解決考古學者在研究需求與可獲取資源不匹配,尤其是所利用紙質資料易丟失與難共享的問題,以建立考古資料的共建、共用、共挖掘的創(chuàng)造性空間。在這樣的需求驅動下,考古檔案亦面向更具體的問題而考慮如何依托數(shù)字技術實現(xiàn)資源整合與服務,其管理優(yōu)化方向更加明確。
第二,在共同的“問題解答或解決”中,數(shù)字人文同檔案管理是雙向融合,彼此借鑒,甚至輻射吸納其他學科如歷史學、政治學、傳播學、藝術等的知識。數(shù)字人文本身的跨學科特性意味著其需要接受不同學科領域的內(nèi)容,而數(shù)字人文與檔案管理的雙向融合能在跨學科融合的趨勢中,為檔案領域面向人文與社會的需求發(fā)展拓展新路徑。18世紀詩歌檔案館顯著體現(xiàn)了這一要義。為將詩歌檔案以及相關館藏開發(fā)為具有豐富編碼的文本資源,以支持18世紀詩歌的教學與研究工作,項目團隊以語言學與文學領域為重要的知識支撐,從數(shù)據(jù)層級對檔案進行組織、整理,通過對詩歌進行詞性標注、詞形還原、韻律分析、句法分析等文本處理工作,實現(xiàn)了對文本信息單元的詳細描述和解構。
第三,隨著協(xié)作融合的深入,數(shù)字人文與檔案管理的關聯(lián)并非簡單相加,而是在雙方的協(xié)同互補中產(chǎn)生了跨學科“化學反應”的新結果、新知識。計算檔案學中的部分內(nèi)容就可視作將數(shù)字人文中的計算思維映射到檔案領域中,以產(chǎn)生新管理方法的典型代表。以CLARIAH-CORE項目為例[42],來自荷蘭視聽研究所、阿姆斯特丹大學人文學院、特文特大學等機構的研究團隊將計算思維融入檔案管理環(huán)節(jié)中,與荷蘭的檔案工作者合作將Jupyter Notebook與現(xiàn)有的基于CLARIAH基礎設施構建的Media Suite API結合使用,提供了更通用的存檔界面,并使用元數(shù)據(jù)的統(tǒng)計數(shù)據(jù)和可視化來幫助學者提取檔案的信息、知識等有價值的內(nèi)容。項目將計算思維與技術方法應用到檔案管理中的重點利用環(huán)節(jié),產(chǎn)出了將Jupyter Notebook與存檔API結合,借助基于數(shù)字技術的元數(shù)據(jù)與檔案分析工具,對檔案進行深度挖掘與知識化利用的新方法。
3.2 檔案活動全方位流程再造作為支撐
在數(shù)字時代,檔案管理活動全方位流程再造指向檔案資源的增值利用。此過程須充分依托跨領域協(xié)作,且需在技術思維的指導下,利用技術工具開展實踐。而數(shù)字人文亦需要跨學科力量以及數(shù)字技術的支撐。由此,檔案活動全方位流程再造實現(xiàn)了檔案管理活動與數(shù)字人文實踐的自然銜接,已然成為了關聯(lián)過程中的重要支撐。具體而言,檔案管理的全方位流程再造可表現(xiàn)為以下四個方面:
一是數(shù)字人文強化了檔案增值管理的導向。數(shù)字人文的訴求之一即通過分析、挖掘包含檔案在內(nèi)的信息資源的具體內(nèi)容,實現(xiàn)對人文學科問題的探索和知識發(fā)現(xiàn)。由此,從檔案活動的視角來看,則要求對檔案信息資源進行充分開發(fā),以實現(xiàn)增值利用,進而滿足數(shù)字人文的研究訴求。且此種導向亦要求前端檔案活動應秉持增值管理理念,從而促進了以實現(xiàn)檔案開發(fā)利用為目標的管理流程再造。如在“漫步于梅蘭鎮(zhèn)”項目中,提升用戶體驗的項目目標引導著檔案收集的多元化、數(shù)字化整合質量的管控、跨形式資源的集成。
二是數(shù)字人文的跨學科特征賦予檔案管理以跨界協(xié)作要求。這一方面要求檔案管理團隊中具有跨學科研究背景的研究人員或由不同研究領域的成員組成;另一方面則表現(xiàn)為在檔案管理活動中,不同專業(yè)領域的知識和方法的融入,由此從團隊組織到具體活動執(zhí)行為檔案管理賦予了跨界協(xié)作的要求。例如,KDL項目團隊成員既有負責UI設計的前端Web開發(fā)人員,也包括具有文學、歷史教育背景的研究人員,以便在檔案增值管理中提出專業(yè)性要求和建議。其中,項目主管James Smithies所擁有的作為坎特伯雷地震數(shù)字檔案館項目經(jīng)理的實踐經(jīng)驗,使其能有效統(tǒng)籌從項目管理、人文需求分析到技術工具應用的各類工作。
三是數(shù)字人文激發(fā)了檔案管理數(shù)字轉型所內(nèi)涵的數(shù)字思維本質。數(shù)字思維的運用是數(shù)字人文研究過程中的關鍵要求之一。而在數(shù)字人文與檔案管理實踐關聯(lián)愈發(fā)顯現(xiàn)的背景下,此種訴求也在檔案管理領域得以凸顯,使得建模、算法設計、編程等成為檔案管理不可或缺的方法。如18世紀詩歌檔案館中自然語言處理技術的運用、ARCS平臺所不斷改進并開源公布的元數(shù)據(jù)框架以及“漫步于梅蘭鎮(zhèn)”項目中的街區(qū)建模,都是數(shù)字思維應用于人文和檔案領域進行資源管理的體現(xiàn)。
四是數(shù)字人文推動數(shù)字技術在檔案管理領域得到更加系統(tǒng)高效的應用。數(shù)字人文自身對技術工具的深層次運用亦要求參與其中的檔案管理以數(shù)字技術為工具,對檔案信息資源進行精細化管理,以保證數(shù)字人文中所用技術與信息資源的適配。由此,問題為導向的技術工具運用成為不同環(huán)節(jié)檔案管理活動服務數(shù)字人文項目不同需求的重要支持。如Corpus Coranicum項目中,項目團隊利用OCR對手稿圖片進行掃描后,還以XML格式創(chuàng)建了單獨的音譯系統(tǒng)和特殊的“Coranica”字符集,用以對特殊字符及希伯來語、古南阿拉伯語等不同語言的統(tǒng)一數(shù)字存儲,為后續(xù)的變體分析、語義分析等工作提供完整的內(nèi)容支持。
3.3 檔案對象的資源化關聯(lián)整合為內(nèi)核
數(shù)字人文為檔案管理領域營造了方法與理論應用上的數(shù)字情境,檔案得以與數(shù)字技術、人文領域等產(chǎn)生更多交集,新情境下以檔案為代表的信息資源需進一步“數(shù)據(jù)化”和“鏈條化”,這是自我發(fā)展創(chuàng)新的需要,也受數(shù)字人文項目所驅動,具體表現(xiàn)為兩方面內(nèi)容:
一是以人文需求為導向,革新管理活動,加強數(shù)據(jù)層級的細顆粒度描摹。為滿足數(shù)字人文項目實踐需要,多角度、深層次地詮釋人文內(nèi)涵,檔案管理活動需充分利用數(shù)字技術與借鑒其他學科知識,以深層次的數(shù)據(jù)挖掘為目標,在保證原有著錄、描述等工作完成的基礎上,不僅要從學科特定需求出發(fā),為檔案對象添加數(shù)據(jù)層面的單個數(shù)據(jù)對象描述,賦予其學科屬性更強的背景內(nèi)容,還要著重加強數(shù)據(jù)間關聯(lián)的描摹,揭示數(shù)據(jù)間的本質聯(lián)系。例如,18世紀詩歌檔案館項目中,Alexander Huber領導的研究團隊為打造生動的交互式協(xié)作空間,方便用戶對詩歌的閱讀和理解,依托Malt Parse和SEMAFOR等軟件,完成了一系列句法、語義等分析工作并添加了多層級描述。他們?yōu)槊渴自姼杼砑恿税瑯祟}、作者、音節(jié)模式和押韻方案等在內(nèi)的基礎性文件級描述,亦深入數(shù)據(jù)層級,對詩歌文本中的單詞和標點符號逐一賦予標準形式,標注詞根、語態(tài)、詞性和發(fā)音以幫助閱讀,同時通過語音層、形態(tài)層、句法層、語義層和實用層從不同方面描述單個詞匯。此外,項目團隊也致力于對詩歌韻律、音節(jié)、句法的分析,這有賴于對詞間關系的細致描摹,如在形態(tài)學分析中,可查看位于詩中其他位置的該詞及上下文;在句法分析中,名詞、代詞、動詞、形容詞和副詞,可用不同顏色突出顯示,而詞間關系也能以指向性線條加以表示,從而使數(shù)據(jù)間關聯(lián)得以加強并明確展現(xiàn)出來。
二是在檔案有機聯(lián)系的基本理念下,開展服務于人文需求的檔案資源整合與服務。隨著資源在數(shù)據(jù)層面的深層次開發(fā),資源間的自然聯(lián)系、歷史聯(lián)系顯現(xiàn)得更為明晰,使得構建更整體、多層次、多元形態(tài)、靈活獲取方式、多樣呈現(xiàn)形式的關聯(lián)性檔案資源成為了可能,而在人文學科問題的導向下,檔案資源的整體呈現(xiàn)有了實質目標與對象,這也成為了數(shù)字人文導向下檔案領域的活動焦點之一。以考古資源編目系統(tǒng)為例,項目開展了以下兩項工作:其一,加強項目內(nèi)資源原有關聯(lián)。ARCS官方會在資源導入時,以所在項目為基本單位,按照ARCSCore元數(shù)據(jù)框架對考古資源進行考古活動基本信息、考古時間段、單個挖掘單元、考古文件、考古主題等五個層次內(nèi)容的描述,其內(nèi)容充分涵蓋了考古資源的背景和內(nèi)容信息,建立了單個項目或是行動的資源集合,同時,ARCS還支持平臺內(nèi)外關聯(lián)性資源的鏈接。其二,鼓勵建立不同項目間資源的多樣聯(lián)系。平臺支持用戶按需選擇自己感興趣的文件,創(chuàng)建屬于自己的資源集合且該集合可共享給所有用戶檢索和瀏覽。ARCS在應用元數(shù)據(jù)框架進行資源關聯(lián)和集成外,還通過對資源背景信息的詳盡描述使資源獲取變得便捷高效。用戶能以14個字段檢索文件,涵蓋標題、標識符、日期等基本關鍵詞和文物結構材料、制造技術等更細致的著錄詞匯。
數(shù)字人文同檔案管理的關聯(lián)已經(jīng)逐漸在實踐層顯示,并在不斷清晰、豐富與完善的進程中。于我國而言,隨著檔案館與圖書館旗艦項目的培塑、數(shù)字人文研究中心的全國性蔓延以及各領域相關活動的開展,數(shù)字人文導向下的檔案管理探索成為檔案領域由學科建設到實踐優(yōu)化的重要載體。在現(xiàn)有經(jīng)驗的基礎上,基于上述分析,發(fā)展方向可描摹為:
4.1 強化人文需求建構以完備檔案管理的問題導向策略
長期以來,以檔案管理服務社會所需貫通于具體工作中,數(shù)字人文的實踐不僅對此深化印證,其中深度的項目實踐更指出,檔案管理應基于需求分析確認問題導向,即明確問題是什么與解決問題的方向。
一方面,面向人文科學乃至更多領域采取基于需求的建構方式。在檔案管理基于需求同各領域產(chǎn)生關聯(lián),并明確基本合作方向的基礎上,數(shù)字人文實踐不斷以精細深耕的方法實現(xiàn)檔案價值的多元與深度挖掘。這需要的是檔案管理者積極對接不同領域的實踐或研究內(nèi)容,以更開闊與主動的姿態(tài)去追蹤與發(fā)現(xiàn)需求,并對需求展開調查與分析,形成面向檔案的系統(tǒng)需求體系,以此指導檔案管理在連續(xù)的問題發(fā)現(xiàn)中展開布局與行動。
另一方面,數(shù)字人文的實踐顯示出了檔案管理可在問題導向下,通過開展旗艦式實踐實現(xiàn)精細化發(fā)展,面向更細膩的需求發(fā)現(xiàn)、分析與建構。基于固定流程的檔案管理方式與傳統(tǒng)的檔案資源形式已難以實現(xiàn)特定需求。與之對應的應是更加體系化的檔案管理與檔案資源,因而多元需求中應做到的是優(yōu)先級設定與部分檔案管理實踐運作模式的拓展。換言之,檔案管理者在以合規(guī)為前提提供檔案館藏基本服務的情況下,應以試點性實踐升級檔案管理體系,打造示范性與品牌性的引領點以及具體項目。
4.2 提升同數(shù)字人文的互動關聯(lián)以系統(tǒng)拓展檔案管理體系
數(shù)字人文實踐展現(xiàn)了檔案管理的重要功能,同樣促進了檔案管理從理念、具體活動至內(nèi)核方法的應用,這也啟示著檔案管理可以借助數(shù)字人文的項目式精細化實踐探索完善自身策略。其中,深化數(shù)字人文全過程參與,強化關聯(lián)表現(xiàn)力度與精細化活動顆粒度,建成更加整體與復雜的檔案管理體系極為關鍵。這要求檔案管理以更主動的參與姿態(tài)和引領協(xié)同的方式融合于數(shù)字人文項目中,這既是為了凸顯實踐規(guī)劃與具體行動中的檔案話語,也是為了豐富實踐探索經(jīng)驗和相關數(shù)據(jù)。
一方面,于認知層,數(shù)字人文與檔案管理的關聯(lián)需要從開發(fā)利用等環(huán)節(jié)上升至更整體的檔案概念、檔案方法、檔案管理框架與流程予以考量。例如,通過數(shù)字人文項目運營中強化檔案保管方法的應用,以數(shù)字人文顯現(xiàn)的增值管理要義推進檔案管理活動,加強前端的數(shù)據(jù)化管理。另一方面,基于理論設計與實踐應用,挖掘數(shù)字人文同檔案管理關聯(lián)的具象化要點,以構建細化的檔案活動,從而促進檔案管理更細粒度的重構。
4.3 依托數(shù)字人文為觸發(fā)點推進檔案管理數(shù)字轉型的擴張
檔案管理同數(shù)字人文在檔案作為“對象”的解構基礎上實現(xiàn)互通與相互成長,并由此映射至認知層與方法論層,這一現(xiàn)象本質上受益于數(shù)字情境,也需要檔案管理從更廣闊的視野看待與數(shù)字人文的關系,并基于數(shù)字人文面向數(shù)字情境實現(xiàn)更全面的數(shù)字轉型。
一方面,將數(shù)字人文作為方法論應用于更通用的檔案場景中。一是由當前聚焦的開發(fā)利用拓展至檔案各類管理環(huán)節(jié)中,以數(shù)字人文的方法與要求倒逼整體流程和具體活動的拓展設計。二是重構對歷史檔案的認知,在互聯(lián)網(wǎng)時空中擴張至更即時、現(xiàn)行的數(shù)據(jù)中,由歷史檔案數(shù)據(jù)化整合擴展至原生數(shù)字檔案管理,甚至將數(shù)字人文方法應用于前端的數(shù)據(jù)、信息、文件管理中。例如,網(wǎng)絡數(shù)據(jù)亦可立足網(wǎng)絡史學并將其及時納入檔案管理并用于設計相應的數(shù)字人文項目,實現(xiàn)兩者面向互聯(lián)網(wǎng)的升級再造。另一方面,以數(shù)字人文為基點實現(xiàn)同數(shù)據(jù)科學、數(shù)字治理等領域的交叉融合,促進檔案管理從理論到實踐的數(shù)據(jù)化發(fā)展。當前關于檔案管理的數(shù)字技術應用、計算檔案學、檔案數(shù)據(jù)治理等議題,都同數(shù)字人文有一定關聯(lián),檔案管理立足數(shù)字人文的探索均可成為重要數(shù)據(jù)以豐富相關議題,促進檔案管理數(shù)字轉型認知與方法論的系統(tǒng)建構,并應用于檔案實踐事業(yè)、檔案學科的建設中。
[1]馮惠玲,連志英,曲春梅等.回顧與前瞻:“十三五”檔案學科發(fā)展調查和“十四五”檔案學重點研究領域展望[J].檔案學通訊,2021(1):4-15.
[2]潘連根.數(shù)字人文在檔案領域中應用的理性思考[J].檔案與建設,2020(7):6-10.
[3]中共中央辦公廳,國務院辦公廳.“十四五”全國檔案事業(yè)發(fā)展規(guī)劃[EB/OL].[2021-06-10].https:// www.saac.gov.cn/daj/toutiao/202106/ecc a2de5bce44a0eb55c890762868683.shtml.
[4]人文北京研究中心.北京記憶[EB/OL].[2021-03-20].http:// www.pekingmemory.cn/.
[5]周文杰.從多元異構走向融合歸一——圖情檔新文科建設的趨向評析[J].情報資料工作:1-16[2021-03-20]. http://kns.cnki.net/kcms/detail/11.1448. g3.20210301.1016. 006.html.
[6]項潔,洪一梅.數(shù)字人文取徑下的淡新檔案重整與分析(上)[J].檔案學通訊,2020(6):4-13.
[7]魏歌,吳志杰.數(shù)字人文視域下的數(shù)字檔案館建設:合理性詮釋與策略探討[J].北京檔案,2021(2):15-18.
[8]牛力,高晨翔,張宇鋒等.發(fā)現(xiàn)、重構與故事化:數(shù)字人文視角下檔案研究的路徑與方法[J].中國圖書館學報,2021(1):88-107.
[9]李子林,龍家慶,王玉玨.交流與合作:美國數(shù)字人文與檔案領域的互動及啟示[J].檔案學研究,2020(2):130-137.
[10]李姍姍,邵華,宮平等.數(shù)字人文背景下圖情檔課程教學的融合與創(chuàng)新[J].檔案學通訊,2021 (1):107-108.
[11]ADHO. Our Mission[EB/ OL].[2021-03-20]. https://adho. org/.
[12]EADH. About[EB/OL].[2021-03-20]. https://eadh.org/ about.
[13]centerNet. About[EB/OL].[2021-03-20]. https://dhcenternet. org/about.
[14]Cendari. About Cendari[EB/ OL].[2021-03-20]. http://www. cendari.eu/about.
[15][36]Corpus Coranicum. About the project[EB/OL].[2021-03-20]. https://corpuscoranicum.de/ about/index.
[16][37]Caroline Bougourd. UNE BALADE AU MERLAN[EB/ OL].[2021-03-20]. http://www. unebaladeaumerlan.fr/.
[17][38]Eighteenth-Century Poetry Archive. About[EB/OL].[2 0 2 1-0 3-2 0]. http://www. eighteenthcenturypoetry.org/about/.
[18]The Digital Humanities Institute. Estoria de Espanna – Discovery of the Past[EB/OL].[2021-03-20]. https://www.dhi.ac.uk/projects/estoriade-espanna/.
[19]Europeana Newspapers. About[EB/OL].[2021-3-20]. http:// www.europeana-newspapers.eu/.
[20] Historical soundscapes(c.1200– c.1800). About[EB/OL].[2021-03-20]. http://historicalsoundscapes. com/acercade.
[21][39]Kings Digital Lab. Archiving and Sustainability[EB/OL].[2021-03-20]. https://kdl.kcl.ac.uk/ our-work/tag/Sustainability/.
[22]Trace. Introduction[EB/ OL].[2021-03-20]. https://trace. unileon.es/en/.
[23]人文北京研究中心. 北京記憶[EB/OL].[2021-03-20]. http:// www.pekingmemory.cn/.
[24][40]Archive Alert. What is Archive Alert [EB/OL].[2021-03-20]. https://archivealert.gr/web/en/ about.
[25]Dare to Remember. A Digital Memorial of Black Brooklyn[EB/OL].[2021-03-20]. http://blackbrooklyn. org/home/.
[26]Making Sense of Illustrated Handwritten Archives. About the project[EB/OL].[2021-03-20]. https://sites.google.com/naturalis.nl/ makingsenseproject/about.
[27]FRANKLIN. Home[EB/ OL].[2021-03-20]. http://www. fdrlibrary.marist.edu/archives/collections/ franklin/.
[28][41]The Archaeological Resource Cataloging System.About[EB/ OL].[2021-03-20]. https://arcs. matrix.msu.edu/blog.html.
[29]Forced Labor 1939-1945. Memory and History. Project Description:Goals and Work Stages[EB/OL].[2021-03-20]. https://www.zwangsarbeitarchiv.de/en/projekt/beschreibung/index. html.
[30][42]Mari Wigham. Jupyter Notebooks for Generous Archive Interfaces[EB/OL].[2021-03-20]. https://ai-collaboratory.net/wp-content/ uploads/2020/03/13.Wigham.pdf.
[31]上海圖書館. 盛宣懷檔案知識庫[EB/OL].[2021-03-20]. http://sd.library.sh.cn/sd/home/index.
[32]敦煌研究院. 數(shù)字敦煌[EB/ OL].[2021-03-20]. https://www. e-dunhuang.com/index.htm.
[33]Michael John Goodman. Victorian Illustrated Shakespeare Archive[EB/OL].[2021-03-20]. https:// shakespeareillustration.org/.
[34]VTM-Venice Time Machine. In Brief[EB/OL].[2021-03-20]. https://www.epfl.ch/research/domains/ venice-time-machine/.
[35]Edward L. Ayers. The Valley of the Shadow[EB/OL].[2021-03-20]. https://valley.lib.virginia.edu/.