李子林/中國人民大學信息資源管理學院
王玉玨/武漢大學信息管理學院
龍家慶/南昌大學人文學院
數字人文(Digital Humanities)概念源于20世紀40年代末文學與語言學領域的人文計算(Humanities Computing)。盡管當前學界對數字人文尚未形成統一、明確的定義,但是數字人文作為一個新興的跨學科研究領域,已引起國內外理論與實踐界的廣泛關注。從當前文獻來看,國外數字人文和檔案相結合的研究主要分布于歷史與地理、美術與攝影、文學與宗教學等人文和社會學科領域,重點關注數字時代背景下檔案在文化遺產傳承中的角色、功能和參與實踐活動。我國通常將數字人文研究劃歸為信息管理學科大類數字人文項目范疇,缺少獨立的分析探究。因此,我國檔案學界亟待厘清檔案工作與數字人文之間的關系,探索數字人文對檔案工作的影響,為我國檔案工作的創(chuàng)新發(fā)展提供思路。
數字人文不能簡單地界定為利用計算機開展人文活動,或者在計算機科學領域內進行感興趣的人文實驗,數字人文是新興技術與人文探究之間動態(tài)對話的結果[1],其發(fā)展歷程大致可劃分為三個階段。
人文與社會學科和計算機技術的合作最早可追溯到20世紀40年代末,意大利學者羅伯托·布薩首次將計算機技術用于人文領域的書籍編撰。在此啟發(fā)下,牛津大學于70年代開始嘗試開展檔案相關的數字人文研究項目[2]。伴隨計算機技術的不斷發(fā)展,數字化被視為擴展傳統人文學術研究工具的一種方法,向公眾擴大開放檔案材料和數據庫已成為可能。在圖書館員、信息專家的技術支持下,這些數字人文活動通常側重于人文語料庫建設、文本編碼標準制定、輔助人文研究的數據庫建設等方面。
從20世紀80年代末至21世紀初,數據庫技術、文本信息分析等數字技術的發(fā)展與應用拓展了人文計算的內涵與外延,人文計算逐漸被“數字人文”所取代。這一時期的數字人文項目雖然開展形式、涉及學科領域多種多樣,但存在共同、顯著的特點:關注文本分析和編目;研究語言特征;強調數字技術對人文教學的支持;將傳統文本材料轉換為數字化形式,基于結構化數據分析推進人文研究開展[3]。其中代表性案例如珀爾修斯項目,將古典文學語料庫轉換成數字化形式;影谷項目,展現了對原始文獻資料在文化史研究中扮演角色的深度思考。
21世紀以來,視覺影像設計、圖形界面設計、可視化技術、3D空間技術等超文本數字技術的產生與應用,為數字環(huán)境中人文與社會科學研究的創(chuàng)新、多媒體表達提供了新的工具和方法。同時在“屏幕文化”熱潮的推動下,層出不窮的沉浸式虛擬游戲、娛樂設施為基于文本分析的數字人文研究提供了轉型發(fā)展的方向,視覺化成為數字人文項目追尋的熱點。加州大學洛杉磯分校城市模擬團隊的“1893年哥倫比亞世界博覽會”項目對該屆博覽會靜態(tài)圖片、動態(tài)視頻片段進行抽取,運用一系列預定義和預先渲染圖像創(chuàng)建動態(tài)幻象,采取實時交互技術為用戶與模擬環(huán)境之間建立交互渠道,用戶通過操縱鼠標和鍵盤實現在虛擬數字場景中的自由參觀與游覽。但如何實現人文方法、價值觀念與數字技術的完美融合,仍然是數字人文研究需要持續(xù)關注和不斷探索。
數字人文背景下,檔案文獻研究和歷史研究、數字人文工具開發(fā)、語言與文化研究共同組成美國高校數字人文項目四大顯著熱點區(qū)域[4]。數字人文作為數字時代跨學科的新型交叉研究領域,在理論研究與項目實踐中與檔案產生關聯,主要體現在以下四個方面。
無論是人文計算領域還是數字人文領域,對文本的分析均是兩者研究的重點內容。檔案作為一種具有真實性、證據性價值的書面文本,是數字人文研究的核心對象之一。美國東北大學開展的“女作家檔案項目”通過對維多利亞時期女作家的作品等文本檔案進行組織、編碼和數字化處理,幫助廣大教師、學生、學者和普通用戶能夠實現檔案資源的線上瀏覽和檢索,以推動女性作家研究活動的開展。當前,美國70多家數字人文中心開展的數字人文項目中約70%集中于文本分析與挖掘,而這其中又有一半以上以檔案資料作為主要文本類型[5]。由此可見,檔案作為數字人文研究的核心對象之一,具有重要的人文研究價值。
數字人文研究重點關注的學科領域包括文學、語言學、歷史與哲學、考古學等人文學科。檔案作為數字人文研究開展的重要資料型工具,在一定程度上保證了數字人文研究者從歷史背景出發(fā)開展研究,有利于保障項目的真實性與權威性,充分發(fā)揮檔案在建構社會記憶中的重要作用。例如,2010年谷歌公司對旗下的應用谷歌地圖進行升級,增設“時間回返”功能,通過對1852年至1922年間紐約州和新澤西州房地產、郡縣市的地形圖、建筑結構圖進行收集、匯總和處理,實現當前地圖與歷史地圖的重新適配、關聯,幫助用戶了解特定歷史時間跨度內城市風貌變遷。
數字人文涉及以下幾方面:海量圖像集可視化(包括基于GIS的地圖可視化)、歷史文物3D建模、原生數字論文的管理、主題標簽應用與分析、虛擬現實游戲等,這與世界范圍內不斷興起和發(fā)展的數字檔案館項目“不謀而合”。如紙質文件數字化、信息資源的描述、分類與分級、元數據方案設計、關聯數據、信息開放存取、信息檢索、信息可視化等,都是數字人文與數字環(huán)境下檔案管理交叉與重合的工作環(huán)節(jié)或活動。“1990—1994年美國記憶”——歷史文獻資源試點項目直接使用檔案著錄標準(EAD)對歷史文獻進行數字化處理,并從檔案利用的角度確立數字化藏品用戶,實現數字化歷史文獻的在線傳播[6]。由此可見,數字檔案館、檔案數字化與數字人文存在相通之處。
數字人文項目的實現,除了要以高校及研究機構為依托,與圖書館、博物館和檔案館等文化服務部門的合作也密不可分。首先,檔案館館藏資源豐富,能為數字人文項目提供充足的研究和參考資料。如,法國國家檔案館與斯坦福大學圖書館合作推進“法國大革命數字檔案館”項目,將法國1789年大革命期間的印刷品、勛章、硬幣等進行數字化處理并建成數字圖像庫,研究人員可從藝術家、主題、風格、地點等維度進行檢索利用,探索法國大革命中意識形態(tài)和公民信仰等方面的情況。其次,檔案工作者具備扎實的檔案業(yè)務技能和史學知識,能為數字人文項目實施提供工具性輔助。如,美國“沃爾特·惠特曼檔案館”項目中,檔案工作者借助網站向公眾提供經TEI編碼處理的文件、音視頻和圖像檔案;編制資源庫查詢工具揭示原始檔案與數字圖像鏈接的關聯,為人文研究的開展提供更加完備、全面的數字資源背景信息。
數字人文的興起逐漸影響和改變了整個人文社會科學的思維方式、研究方法和研究工具。檔案學和基于館藏檔案的研究作為人文社會科學的一個部分,不可避免地迎接來自數字人文的沖擊與挑戰(zhàn)。
傳統文化遺產研究工作主要包括基于文化遺產的內容分析(文本型文化遺產)和外在分析(實物型文化遺產)兩種形式。美國學者麥克甘曾指出,“人文領域存在一個普遍承認的真理,即我們的文化遺產必須全部以數字化的格式并依據組織架構進行重新保管和重新編輯”[7]。檔案是文化遺產的重要組成部分,數字人文的理念正在逐步影響和改變檔案內容研究的思維方式。龍格等學者運用檔案內容研究成果重構奧森·威爾電影中丟失的影像序列,通過將傳統的檔案內容研究與數字人文緊密結合創(chuàng)作出影像動畫,既將檔案研究成果以可視化的形式展現,又再現檔案研究過程,賦予檔案文獻新的利用價值與生命力[8]。
如何將檔案文獻以社會化、層次化的方式存入集成電路板之中,為人文與社會科學研究服務,是數字人文項目實施的關鍵環(huán)節(jié),也是檔案學研究的新方向。數字人文背景下,電影檔案館的檔案工作者立足全面的、跨學科文化視角,摒棄電影檔案分類與組織揭示的傳統方法,開始研究、設計新的電影檔案元數據計劃,旨在構建館藏電影檔案資源展示的新模型(在線存?。?,提高館藏電影檔案資源的互操作性,推動館際、機構間的數據交換[9]。同時,隨著數字革命的深化,檔案館如何合理運用語義關聯技術、數據分析與挖掘技術、可視化技術等數字人文技術,實現對人文與社會科學研究中文獻及非文獻類資源的檔案化管理、長期存儲和檢索利用,成為檔案學研究延伸、拓展的新主題。
數字人文重點關注如何從海量的文獻信息資源中發(fā)現并獲取研究人員感興趣的內容。檔案館館藏資源具有來源主體廣泛、類型多樣、格式迥異等特點,這為檔案信息資源建設與信息檢索服務增加了難度。然而,文本挖掘、數據分析、可視化等數字人文技術的發(fā)展應用為檔案館信息資源建設與檢索服務創(chuàng)新提供技術工具支持。北卡萊羅納大學圖書館與檔案館“威廉姆·布萊克檔案館”項目借助文本內容分析與挖掘技術、高級圖像搜索工具、用戶定制Java程序、ImageSizer等數字人文技術幫助公眾高效、便捷地實現對威廉姆·布萊克數字作品的線上瀏覽、檢索與獲取。
傳統檔案資源開發(fā)利用基本以檔案館為依托,立足館藏資源開展檔案在線檢索、開放與利用服務。數字人文環(huán)境下,檔案資源開發(fā)利用工作不僅為學者進行研究提供檔案材料,還是一個跨領域、多方合作、協同創(chuàng)新的檔案內容服務。數字人文研究的深入發(fā)展,將人文學科領域與檔案領域緊密關聯,拓寬檔案開發(fā)利用與再創(chuàng)作的范圍,豐富檔案開發(fā)利用的手段與途徑。以英國利物浦大學“電影中的城市”數字人文項目為例,通過對由利物浦城市動態(tài)圖組成的檔案網絡進行空間數據采集與匯編,充實城市地理空間資源數據庫,以電影檔案為原始資料進行二次開發(fā),為地理空間研究和數字化城市地圖建設服務。
數字人文背景下,檔案機構應秉承取長補短、博采眾長的觀念,邀請數字人文機構合作開展檔案資源庫建設項目,采用與高校圖書館等機構共建數字人文中心的合作模式。數字人文項目實施與發(fā)展為檔案資源的深度加工提供了新技術與工具,其中數據庫技術、信息檢索技術、可視化技術、數據分析挖掘技術可以為檔案資源庫建設提供關鍵技術支撐。檔案館借助數字人文中心技術團隊與成果,建設兼容各類檔案資源格式、數據存儲空間充足、瀏覽與檢索功能強大、具備人文研究工具包的優(yōu)質檔案資源庫。如,臺灣文獻館、各級歷史館積極與臺灣大學數字人文中心合作,應用數位典藏聯合目錄系統建置技術,從主題、時代、地區(qū)及單位等維度整合數字歷史檔案資料[10]。
檔案館應參考圖書館設立數字人文研究中心的典型案例,從自身業(yè)務優(yōu)勢出發(fā),立足人文與社會科學研究實際需求,設立專題數字人文研究中心。數字化文件、圖像資源的歸檔與長期保管是檔案館研究和業(yè)務工作開展的重點環(huán)節(jié)。一方面,作為人文與社會科學研究核心對象的傳統文獻資料隨著時間推移,破損、老化、遺失等現象嚴重。因此,檔案館可積極承擔起文獻資料數字化、檔案化管理的重要任務,實現傳統文獻資料的數字策展。另一方面,數字環(huán)境下,對人文與社會科學研究項目中產生的數據、信息合理收集、妥善保存將直接影響項目的后續(xù)實施效果?;谝陨蟽煞矫嫘枨?,檔案館應立足檔案專業(yè)管理視角,設立專題數字人文研究中心,幫助人文與社會科學領域制定檔案資源保管策略,從資源格式、存儲介質、元數據方案、轉換格式等方面提出建議和要求,充分發(fā)揮檔案館保存人類文化遺產的職能,為數字人文資源策展服務。
數字時代需要進一步強化人文、社會科學研究與檔案館之間的關聯。傳統檔案館檔案服務主要目的是為歷史研究提供參考與咨詢,而史學研究作為人文研究的分支對檔案館檔案服務的需求是有限的。檔案館為充分發(fā)揮其人文和社會價值,應立足研究實際需求從以下途徑拓展服務領域:一是立足館藏,設計制作人文研究工具包。如,基于檔案內容的“臺灣歷史數位圖書館工具集”,廣受人文、歷史研究者好評。二是劃分人文研究主題,整合、匯編專題資料庫。如,英國國家檔案館將18至19世紀英國工業(yè)革命期間的室內設計和紡織品圖紙進行數字化處理和匯編,以彩色圖像形式在線發(fā)布。藝術設計研究者可從中汲取設計靈感,通過付費可以獲取該類設計圖紙的使用權限。三是設計特色檔案學習活動,輔助教育、學術研究。如,臺灣老照片數位博物館開設“互動式學習”服務專區(qū),下設“老照片E-Card”“放大鏡看臺灣”“老照片相簿管理”三個模塊,以老照片中人物、地點、事件、歷史情境作為公眾學習辨認的主要對象,設計互動環(huán)節(jié),為臺灣民眾學習本土歷史提供最佳素材[11]。
數字人文技術的發(fā)展與應用為創(chuàng)新檔案館檔案服務方式提供了契機,突出表現在兩大方面:第一,提供基于GIS技術的檔案可視化服務。GIS地理信息系統的設計與使用,提升傳統檔案文本信息服務的深度,將抽象的文本資料與具象的地理、空間圖像關聯疊加,向人文研究用戶呈現全面、生動的檔案內容信息和背景知識,有利于幫助其從多角度探索人文研究的切入點。日本虛擬京都項目引入4D-GIS系統,利用尖端科技將地理檔案資料、地圖集等進行3D模擬化,建立新京都地理空間資訊系統,展現京都城市景觀的動態(tài)變化[12]。第二,提供基于數據分析挖掘的檔案內容分析服務。運用Gephi、Alveo Virtual Laboratory、Recogito 2等數據分析、挖掘工具對檢索后的檔案資源進行重新組配,結合人文研究者的研究切入點,重構檔案資源脈絡,為人文研究者提供運用檔案講述自己故事的機會。影谷項目為人文學者提供基于時間節(jié)點的檔案資源分析服務,同時用戶在瀏覽、檢索檔案資源時可以自由創(chuàng)建標簽、筆記,搭建獨特的人文研究路徑。