宮 平
(遼寧大學(xué)歷史學(xué)院 遼寧沈陽(yáng) 110136)
數(shù)字人文研究和實(shí)踐不斷滲透和融合技術(shù),支持?jǐn)?shù)字人文研究的工具和平臺(tái)也不斷涌現(xiàn)。目前數(shù)字人文研究的支持工具主要分為三類(lèi):分析工具如文本分析工具、社會(huì)網(wǎng)絡(luò)分析工具;可視化工具如數(shù)據(jù)可視化工具、內(nèi)容可視化工具、全景可視化工具以及地理可視化工具;集成化工具即具有多種功能的工具或平臺(tái),如WORDSEER(集成化文本分析工具)、OMEKA(自由靈活的網(wǎng)絡(luò)出版與內(nèi)容展示平臺(tái))、MapScholar(數(shù)字地圖使用、分析與解釋工具)。技術(shù)與工具常常成為圖書(shū)館與數(shù)字人文的交叉領(lǐng)域,但國(guó)內(nèi)在數(shù)字人文研究工具與平臺(tái)開(kāi)發(fā)和應(yīng)用尚處于探索階段。文章以O(shè)MEKA為例,通過(guò)功能與特點(diǎn)分析,圖書(shū)館具體應(yīng)用案例跟蹤,具體展示圖書(shū)館在數(shù)字人文項(xiàng)目中可發(fā)揮的作用,為我國(guó)圖書(shū)館參與數(shù)字人文實(shí)踐尋找突破口與發(fā)展空間。
OMEKA是一個(gè)自由靈活、開(kāi)放源碼的Web發(fā)布平臺(tái),為圖書(shū)館、博物館、檔案館、學(xué)術(shù)收藏和展品提供一個(gè)展示的平臺(tái),它的“五分鐘設(shè)置”使推出一個(gè)網(wǎng)絡(luò)展覽如同創(chuàng)建BLOG一樣簡(jiǎn)單快捷。OMEKA站在Web內(nèi)容管理、收藏管理和檔案數(shù)字化收藏系統(tǒng)的交叉點(diǎn),讓用戶更加專(zhuān)注于內(nèi)容和解釋而不是編程,將Web2.0技術(shù)和方法運(yùn)用到學(xué)術(shù)和文化網(wǎng)站,增加用戶的互動(dòng)參與。使用OMEKA可以完成分享收藏、收集故事、建立展覽、創(chuàng)建簡(jiǎn)單網(wǎng)頁(yè)、定制網(wǎng)頁(yè)設(shè)計(jì)模板以及實(shí)現(xiàn)合作的多種功能與用途。
OMEKA針對(duì)個(gè)人用戶和機(jī)構(gòu)用戶提供不同的版本。其中omeka.net是針對(duì)個(gè)人用戶的,內(nèi)容存儲(chǔ)于omeka服務(wù)器,訪問(wèn)地址為http://www.omeka.net/。而omeka.org是針對(duì)機(jī)構(gòu)用戶的,內(nèi)容存儲(chǔ)于機(jī)構(gòu)服務(wù)器,訪問(wèn)地址為http://omeka.org/。除了存儲(chǔ)差異,omeka.net和omeka.org在功能上也略有差別。
omeka.net在網(wǎng)站上注冊(cè)后可以免費(fèi)使用500MB的存儲(chǔ)空間、15個(gè)功能插件和5個(gè)主題,但僅能創(chuàng)建一個(gè)站點(diǎn)。如果需要更多的功能,可以選擇付費(fèi)的版本。
OMEKA的主要特點(diǎn)有:第一,為學(xué)者、圖書(shū)館員、檔案館員、博物館專(zhuān)業(yè)人員及文化愛(ài)好者提供一套免費(fèi)開(kāi)源的數(shù)字出版工具。第二,無(wú)需合同與年費(fèi)。第三,使用簡(jiǎn)單。為非IT專(zhuān)家設(shè)計(jì),不需要編程,更加專(zhuān)注內(nèi)容?;趙eb的應(yīng)用,計(jì)算機(jī)和移動(dòng)設(shè)備均可訪問(wèn)。第四,強(qiáng)大的檔案與支持社區(qū)。擁有使用的分步教程視頻與截圖文檔、與用戶和研發(fā)人員的交流社區(qū)。第五,可擴(kuò)展性、可伸縮性與靈活性??梢蕴幚泶罅康臋n案元數(shù)據(jù)與文件。僅限在用戶個(gè)人服務(wù)器上。允許添加機(jī)構(gòu)特定的元數(shù)據(jù)到元素集(element sets),允許定制PHP(Hypertext Preprocessor,超文本預(yù)處理器,是一種通用開(kāi)源腳本語(yǔ)言)的zend框架。接收并存儲(chǔ)所有類(lèi)型的文件,包括圖像、視頻、音頻、多頁(yè)文檔、PDF、PPT等。單個(gè)項(xiàng)目可包含多個(gè)文件。
對(duì)于圖書(shū)館和圖書(shū)館員來(lái)說(shuō),可以使用OMEKA作為發(fā)布工具來(lái)補(bǔ)充在線目錄或推出數(shù)字展覽。這一集成化的網(wǎng)絡(luò)出版工具是數(shù)字人文資源組織與展示的一個(gè)平臺(tái),也為圖書(shū)館參與支持?jǐn)?shù)字人文提供了良好的發(fā)展機(jī)遇。
明尼蘇達(dá)大學(xué)紀(jì)念體育場(chǎng)項(xiàng)目是一個(gè)互動(dòng)數(shù)字檔案,由圖書(shū)館員發(fā)起數(shù)字化館藏項(xiàng)目,以O(shè)MEKA機(jī)構(gòu)用戶模式運(yùn)行。體育場(chǎng)不僅僅是開(kāi)展豐富多彩競(jìng)技活動(dòng)的場(chǎng)所,還需要有助于提升大學(xué)生的幸福感,切實(shí)有效地服務(wù)于學(xué)生生活。明尼蘇達(dá)大學(xué)紀(jì)念體育場(chǎng)的發(fā)展激發(fā)了明尼蘇達(dá)大學(xué)圖書(shū)館工作人員的熱情,他們嘗試?yán)脠D書(shū)館的豐富檔案資源與專(zhuān)業(yè)的數(shù)字化技術(shù)來(lái)捕捉并分享紀(jì)念體育場(chǎng)的歷史。圖書(shū)館員收集整理圖書(shū)館館藏中有關(guān)紀(jì)念體育場(chǎng)的照片、競(jìng)賽場(chǎng)面、活動(dòng)、信件、報(bào)告以及設(shè)計(jì)圖等檔案資料,并將這些珍貴資料進(jìn)行數(shù)字化后上傳至OMEKA,構(gòu)建一個(gè)交互式網(wǎng)絡(luò)出版平臺(tái),允許網(wǎng)站訪問(wèn)者分享與紀(jì)念體育場(chǎng)有關(guān)的故事。從不同角度反映紀(jì)念體育場(chǎng)的歷史,并且持續(xù)更新相關(guān)資源。
紀(jì)念體育場(chǎng)項(xiàng)目包括5個(gè)方面的內(nèi)容,分別是The Brickhouse、The Gridiron、The Pageantry、The Life Inside、Your Stories。通過(guò)珍貴的檔案資料展示了紀(jì)念體育場(chǎng)興建的過(guò)程、建成后開(kāi)展的各種競(jìng)技比賽,以及在紀(jì)念體育場(chǎng)上通過(guò)競(jìng)技獲得的各類(lèi)榮譽(yù)等。Your Stories欄目允許訪問(wèn)者添加自己的故事,提供個(gè)人擁有的與紀(jì)念體育場(chǎng)相關(guān)的各類(lèi)資料,形成與用戶的良好互動(dòng)。
消防檔案數(shù)字圖書(shū)館以保存和記錄消防服務(wù)的歷史為目的。這個(gè)項(xiàng)目是一位從事火災(zāi)、應(yīng)急管理等資源管理方面工作的圖書(shū)館員的個(gè)人項(xiàng)目,是他利用個(gè)人時(shí)間創(chuàng)建的。這是一個(gè)雖小卻新的項(xiàng)目,并定期更新,一旦發(fā)現(xiàn)有新的資料,就更新到網(wǎng)站以便獲取。目前,項(xiàng)目的主要收藏和展品有:①國(guó)家防火控制委員會(huì)相關(guān)的圖片、文件、信件以及公告等;②國(guó)家消防預(yù)警和控制管理局相關(guān)的宣傳冊(cè)、消防通訊、報(bào)告講演以及檔案資料等;③美國(guó)早期消防行政通訊等全面的通訊報(bào)道;④聯(lián)邦防火和公共教育海報(bào);⑤聯(lián)邦消防局的消防經(jīng)驗(yàn)報(bào)告、年度會(huì)議紀(jì)要與特別報(bào)道等;⑥消防部門(mén)的歷史。
許多優(yōu)秀消防部門(mén)的歷史現(xiàn)在已經(jīng)可以在網(wǎng)上查看,但往往很難找到。與消防相關(guān)的資源分布在不同大學(xué)館藏之中,也可能在歷史、社會(huì)學(xué)相關(guān)的數(shù)字圖書(shū)館中,這些內(nèi)容往往沒(méi)有被注意到。消防檔案數(shù)字圖書(shū)館將分散的資料集中在一個(gè)平臺(tái)上展示,為大眾了解消防相關(guān)服務(wù)的歷史提供了一個(gè)方便的在線目錄。該項(xiàng)目也提供添加條目的功能,以便瀏覽者分享消防有關(guān)的資料,以此保持項(xiàng)目的更新與互動(dòng)。
總統(tǒng)訪問(wèn)夏洛特在線展覽是北卡羅來(lái)納州立大學(xué)夏洛特分校圖書(shū)館(The J. Murrey Atkins Library)特藏的一個(gè)組成部分,于2010年秋季創(chuàng)建,以O(shè)MEKA個(gè)人用戶模式運(yùn)行,由圖書(shū)館特藏助理館員Katie McCormick指導(dǎo)研究生助理Evan Faulkenbury完成。這個(gè)項(xiàng)目也是圖書(shū)館實(shí)體展覽的一個(gè)部分。所有公開(kāi)的資料都被北卡羅來(lái)納州立大學(xué)夏洛特分校作為特藏收藏。目前該項(xiàng)目有4個(gè)專(zhuān)題,其中豪威爾總統(tǒng)專(zhuān)輯包括艾森·豪威爾1954年訪問(wèn)夏洛特展覽所展出的全部資料;羅斯??偨y(tǒng)專(zhuān)輯包括富蘭克林·羅斯??偨y(tǒng)1936年訪問(wèn)夏洛特展覽所展出的全部資料;塔夫脫總統(tǒng)專(zhuān)輯包括威廉·霍華德·塔夫脫總統(tǒng)1909年訪問(wèn)夏洛特展覽所展出的全部資料;總統(tǒng)視覺(jué)輔助專(zhuān)輯集中展示這次展覽中其他一些總統(tǒng)訪問(wèn)夏洛特的資料,特別是極少展出的珍貴展品。這次展覽并不是對(duì)訪問(wèn)過(guò)夏洛特的所有總統(tǒng)的全面歷史回顧,其目的是通過(guò)一個(gè)嶄新的視角體驗(yàn)這個(gè)城市歷史的重要部分。
OMEKA作為一個(gè)自由靈活、開(kāi)放源碼的Web發(fā)布平臺(tái),能夠?yàn)閳D書(shū)館提供一個(gè)簡(jiǎn)單快捷的展示平臺(tái),因此應(yīng)用于圖書(shū)館數(shù)字人文項(xiàng)目具有一些優(yōu)勢(shì)。第一,使用便捷、節(jié)省成本是它的最大優(yōu)勢(shì)。OMEKA如同創(chuàng)建BLOG一樣簡(jiǎn)單快捷,讓創(chuàng)建網(wǎng)絡(luò)展覽變得更加容易。Fire Files Digital Library項(xiàng)目?jī)H由一個(gè)圖書(shū)館員就可以完成,節(jié)省了人力成本。提供部分功能免費(fèi)使用,大大降低了經(jīng)濟(jì)成本。第二,將內(nèi)容管理與數(shù)字化收藏與展示有效融合,豐富了圖書(shū)館的特藏資源。已有案例都是對(duì)歷史檔案的收集整理與集成化展示。針對(duì)某一主題進(jìn)行全方位的資料收集后形成的特色館藏,或者對(duì)特色館藏的重新組織與數(shù)字化展示。OMEKA為圖書(shū)館資源管理與數(shù)字化展示提供了一個(gè)便捷可用的平臺(tái),只需要專(zhuān)注于內(nèi)容和解釋?zhuān)瑹o(wú)需再?gòu)氖路彪s的編程工作。第三,具有開(kāi)放性與互動(dòng)性。OMEKA將Web2.0技術(shù)和方法運(yùn)用到學(xué)術(shù)和文化網(wǎng)站,瀏覽者可以增加條目,不僅增加用戶的互動(dòng)參與,而且能夠獲得更多具有價(jià)值的資料,保持資源的持續(xù)更新。
從目前的應(yīng)用案例看,將圖片、文件與其他資料集成化組織與揭示,豐富了圖書(shū)館的特藏資源內(nèi)容與形式。但資源的揭示深度不夠,對(duì)平臺(tái)功能的挖掘與利用處于淺層次,尚未充分利用。國(guó)外圖書(shū)館的數(shù)字人文項(xiàng)目也處于探索階段,OMEKA如何更好地應(yīng)用到數(shù)字人文項(xiàng)目依然需要不斷嘗試與突破。通過(guò)OMEKA應(yīng)用于圖書(shū)館與數(shù)字人文項(xiàng)目的合作與實(shí)現(xiàn)案例,可以肯定圖書(shū)館員在數(shù)字人文社區(qū)承擔(dān)著有價(jià)值的工作,能夠提供專(zhuān)業(yè)知識(shí)與信息標(biāo)準(zhǔn),在促進(jìn)數(shù)字人文查詢與數(shù)據(jù)處理等方面是較好的合作實(shí)踐者,并能夠促進(jìn)知識(shí)構(gòu)建[1]。對(duì)人文資源的內(nèi)容挖掘、組織方法、各類(lèi)工具與技術(shù)的應(yīng)用等方面,圖書(shū)館員應(yīng)該發(fā)揮重要作用,支持并參與數(shù)字人文研究,讓圖書(shū)館成為數(shù)字人文研究的重要組成部分。
資源與技術(shù)是數(shù)字人文不可或缺的,也是圖書(shū)館與數(shù)字人文的交叉領(lǐng)域。資源是數(shù)字人文研究的基礎(chǔ),技術(shù)與工具是數(shù)字人文研究的手段與方法。目前我國(guó)在數(shù)字人文研究工具與平臺(tái)開(kāi)發(fā)和應(yīng)用上尚處探索階段,通過(guò)OMEKA的應(yīng)用案例分析,本文認(rèn)為我國(guó)圖書(shū)館參與數(shù)字人文實(shí)踐可以從資源和技術(shù)兩個(gè)維度尋找突破口與發(fā)展空間。
數(shù)字圖書(shū)館經(jīng)過(guò)20多年的發(fā)展,不僅豐富了圖書(shū)館資源的內(nèi)涵,而且強(qiáng)化了圖書(shū)館資源的智能性,為圖書(shū)館資源的應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ),也成為數(shù)字人文發(fā)展的基礎(chǔ)。目前,我國(guó)圖書(shū)館在資源建設(shè)方面雖然取得了一定成就,但并不能更好地支持?jǐn)?shù)字人文研究的需求,因此圖書(shū)館需要構(gòu)建面向數(shù)字人文研究的資源體系,不僅是簡(jiǎn)單實(shí)現(xiàn)資源的數(shù)字化,而是要完成資源的數(shù)據(jù)化與關(guān)聯(lián)化。
第一是資源整合。人文學(xué)者認(rèn)為目前國(guó)內(nèi)數(shù)據(jù)庫(kù)質(zhì)量還有待于提升。從宏觀而言,部分?jǐn)?shù)據(jù)庫(kù)建設(shè)缺乏長(zhǎng)遠(yuǎn)規(guī)劃和協(xié)調(diào),重復(fù)收錄現(xiàn)象較為突出,對(duì)相關(guān)學(xué)術(shù)領(lǐng)域有重大推進(jìn)的數(shù)據(jù)庫(kù)建設(shè)存在很大困難。圖書(shū)館應(yīng)該針對(duì)人文學(xué)者的研究需求,將與研究相關(guān)的資源進(jìn)行全面整合,促進(jìn)資源的統(tǒng)一與共享,提升資源檢索的時(shí)效性,為人文學(xué)者提供更為快速且準(zhǔn)確的資源檢索途徑,滿足差異化的資源獲取需求,創(chuàng)建支持?jǐn)?shù)字人文研究的靈活且有效的資源體系。
第二是資源組織與開(kāi)發(fā)。面向數(shù)字人文的圖書(shū)館資源組織與開(kāi)發(fā),需要更加注重關(guān)聯(lián)性。通過(guò)對(duì)資源的智能化處理,尋找有價(jià)值的資源單元,予以集合組織以及分類(lèi)組合,創(chuàng)建組織有序的資源體系。這種新型的資源組織可以實(shí)現(xiàn)對(duì)關(guān)聯(lián)資源的快速與準(zhǔn)確識(shí)別。在資源開(kāi)發(fā)過(guò)程中,需要立足于人文研究的具體需要,探尋資源和資源之間存在的內(nèi)在關(guān)聯(lián),發(fā)掘非數(shù)字環(huán)境無(wú)法發(fā)現(xiàn)的規(guī)律與問(wèn)題,為人文知識(shí)體系重構(gòu)提供可能。
第三是資源應(yīng)用。圖書(shū)館面向數(shù)字人文研究的資源整合、組織與開(kāi)發(fā)又一次拓展了圖書(shū)館資源應(yīng)用的范圍,使得人文學(xué)者獲取和利用資源的形式更為多樣化。人文學(xué)者不僅可以對(duì)資源予以分析,還能借助對(duì)資源的定向以及定量處理,了解和歸納其中隱含的、有用的資源,實(shí)現(xiàn)分析、建模和可視化等多種功能應(yīng)用,并預(yù)測(cè)發(fā)展趨勢(shì)。在數(shù)字人文背景下,圖書(shū)館資源應(yīng)用將處于跨越式發(fā)展,賦予圖書(shū)館資源更多前所未有的新特性與新發(fā)展,從而走向智能化以及更高的層次[2]。
數(shù)字人文研究作為一項(xiàng)學(xué)術(shù)活動(dòng),具有一般學(xué)術(shù)活動(dòng)的共性,而這一新興領(lǐng)域也具有其特性,因此所應(yīng)用的工具、技術(shù)與方法并不是單一的。這些因素決定了圖書(shū)館需要充分結(jié)合數(shù)字人文的特點(diǎn)在技術(shù)應(yīng)用方面多層次、全方位考慮[3]。
首先,為人文學(xué)者提供一些基本的學(xué)術(shù)研究工具及使用指導(dǎo)。如文獻(xiàn)管理軟件、內(nèi)容管理系統(tǒng)、網(wǎng)絡(luò)展示平臺(tái)等。面向大多數(shù)用戶對(duì)于計(jì)算網(wǎng)絡(luò)技術(shù)的普遍需求,圖書(shū)館可以依據(jù)人文研究特點(diǎn),結(jié)合研究設(shè)計(jì),將不同的研究工具、技術(shù)與研究應(yīng)用進(jìn)行分析總結(jié),提供一系列通用的模式。不同的研究人員可以根據(jù)研究需要選擇最合適的類(lèi)型與功能,為數(shù)字人文研究技術(shù)應(yīng)用提供有效的指導(dǎo)。
其次,為數(shù)字人文研究提供技術(shù)支撐。人文研究具有很大的個(gè)性化,不同學(xué)者對(duì)于同樣的資料有著不同的認(rèn)知與解釋?zhuān)虼?,?shù)字人文研究在技術(shù)應(yīng)用方面也具有很大的個(gè)性化。圖書(shū)館應(yīng)該全程參與數(shù)字人文研究。在研究設(shè)計(jì)階段,幫助人文學(xué)者選擇合適的技術(shù)與工具,完善研究設(shè)計(jì)。在研究過(guò)程中,在技術(shù)的具體應(yīng)用上給予支撐。如果圖書(shū)館的技術(shù)能力無(wú)法支撐,可以幫助人文學(xué)者尋找合作伙伴解決技術(shù)問(wèn)題。在研究后期,圖書(shū)館則需要承擔(dān)研究成果展示和推廣的職責(zé),并且將數(shù)字人文成果給予保存,納入館藏,解決長(zhǎng)期保存問(wèn)題。
最后,積極參與中文工具的研發(fā)。目前,我國(guó)已經(jīng)有很多全文數(shù)據(jù)庫(kù),但是數(shù)字人文工具的開(kāi)發(fā)仍任重而道遠(yuǎn)。目前,數(shù)字人文領(lǐng)域使用的很多工具都是專(zhuān)為英語(yǔ)而設(shè)計(jì)的,中文分詞問(wèn)題是一個(gè)技術(shù)難題。在香港和臺(tái)灣引進(jìn)的部分工具更關(guān)注現(xiàn)代漢語(yǔ),對(duì)古代漢語(yǔ)的重視程度還明顯不夠。而大量的古籍?dāng)?shù)字化之后需要相關(guān)的分析工具給予研究支撐。圖書(shū)館應(yīng)當(dāng)積極參與到中文工具研發(fā)之中,尤其在數(shù)據(jù)標(biāo)引、元數(shù)據(jù)創(chuàng)建等方面發(fā)揮專(zhuān)業(yè)價(jià)值。我國(guó)數(shù)字人文還沒(méi)有得到足夠的重視,尚處于起步探索階段,圖書(shū)館有責(zé)任推動(dòng)其發(fā)展[4]。在高級(jí)軟件工具開(kāi)發(fā)方面,需要跨學(xué)科、跨機(jī)構(gòu)團(tuán)隊(duì)的合作,面向中文語(yǔ)言環(huán)境和我國(guó)人文學(xué)科研究需求與特點(diǎn)開(kāi)發(fā)適合國(guó)情的軟件與工具,為我國(guó)的數(shù)字人文研究提供技術(shù)平臺(tái)支撐。