吳 倩 鄧 莉 王運(yùn)彬
(1.閩江學(xué)院人事處,福建福州,350108;2.福建師范大學(xué)社會歷史學(xué)院,福建福州,350117;3.湘潭大學(xué)公共管理學(xué)院,湖南湘潭,411105)
文化遺產(chǎn)是我國寶貴的精神財(cái)富與歷史根基,唯有從“養(yǎng)在深閨人未識”走入到尋常百姓中,才能使其真正“活起來”。2021年4月,文化和旅游部印發(fā)《“十四五”文化和旅游發(fā)展規(guī)劃》,明確提出要堅(jiān)持把保護(hù)文化遺產(chǎn)放在首位,建設(shè)國家文物資源大數(shù)據(jù)庫[1],文化遺產(chǎn)數(shù)字存儲庫建設(shè)與完善應(yīng)提上議程。
目前,學(xué)界針對文化遺產(chǎn)存儲庫開展的研究與實(shí)踐主要包括:其一,現(xiàn)狀研究,如公共圖書館文化遺產(chǎn)存儲庫建設(shè)現(xiàn)狀研究[2]、地區(qū)文化遺產(chǎn)存儲庫建設(shè)現(xiàn)狀研究[3]等;其二,構(gòu)建研究,如資源數(shù)字化[4]、框架設(shè)計(jì)[5]、技術(shù)應(yīng)用[6]及文化遺產(chǎn)數(shù)字化建檔[7]等,為我國文化遺產(chǎn)存儲庫的建設(shè)提供了理論依據(jù);其三,特色存儲庫建設(shè)研究,如巖畫遺產(chǎn)[8]與滿族文化遺產(chǎn)[9]等;其四,國外文化遺產(chǎn)存儲庫項(xiàng)目研究,包括威尼斯時(shí)光機(jī)[10]、美日地區(qū)的代表性文化遺產(chǎn)檔案數(shù)據(jù)庫[11]等。當(dāng)前,我國文化遺產(chǎn)存儲庫建設(shè)的研究主要停留在對項(xiàng)目本身或現(xiàn)狀的研究上,其理論研究深度與實(shí)踐發(fā)展需要存在一定的錯(cuò)位。
愛爾蘭數(shù)字存儲庫(Digital Repository of Ireland,以下簡稱DRI)是保存愛爾蘭歷史文化遺產(chǎn)和科學(xué)研究成果的國家數(shù)字資源庫[12],從2012年開始定期開展項(xiàng)目研究。當(dāng)前,DRI已廣泛納入都柏林城市圖書館和檔案館、愛爾蘭圖書館、愛爾蘭國家檔案館等38個(gè)學(xué)術(shù)機(jī)構(gòu)會員,與之共同推動(dòng)文化遺產(chǎn)資源的建設(shè)與發(fā)展。在信息化時(shí)代背景下,DRI作為愛爾蘭乃至歐洲范圍內(nèi)關(guān)于數(shù)字歸檔、存儲基礎(chǔ)設(shè)施、數(shù)據(jù)管理的最佳實(shí)踐研究中心,在文化遺產(chǎn)資源的數(shù)字化保存與服務(wù)方面都值得我國學(xué)習(xí)與借鑒。
DRI為用戶提供了自主存儲數(shù)據(jù)資源平臺。該平臺為文化遺產(chǎn)資源的永久保存創(chuàng)建了完整的資源存儲流程,涵蓋“收藏評估、數(shù)據(jù)準(zhǔn)備、理解管理角色、攝取數(shù)字對象、資源保存利用”的數(shù)據(jù)生命周期全過程(詳見圖1),為用戶存儲文化遺產(chǎn)資源提供指導(dǎo)。用戶可通過該平臺創(chuàng)建屬于自己的收藏,并上傳所需永久保存的文化遺產(chǎn)資源,從而提升用戶文化遺產(chǎn)永久保存與傳承的參與度與責(zé)任感。
圖1 DRI基于全生命周期的數(shù)據(jù)存儲流程圖
作為收集與保存愛爾蘭乃至歐洲文化遺產(chǎn)資源的存儲機(jī)構(gòu),DRI在技術(shù)框架、協(xié)同合作、多元服務(wù)與安全體系等方面具有較為成熟的建設(shè)經(jīng)驗(yàn)。
作為一個(gè)交互式、可信的由愛爾蘭機(jī)構(gòu)持有的社會和文化數(shù)字存儲庫[13],DRI具有人文社會科學(xué)領(lǐng)域服務(wù)與文化遺產(chǎn)資源保存開發(fā)的雙重職責(zé),必然離不開綜合性技術(shù)的全面支持,這主要體現(xiàn)在文化遺產(chǎn)的元數(shù)據(jù)接收、資源保存與3D文化遺產(chǎn)存儲方面。
首先,DRI支持一系列的元數(shù)據(jù)格式標(biāo)準(zhǔn),如EAD、MARC、XML等,且具有容納各種載體形式元數(shù)據(jù)的特性。多元化的元數(shù)據(jù)支持為DRI接收各種載體形式的文化遺產(chǎn)提供了技術(shù)保障。其次,DRI為實(shí)現(xiàn)存儲庫的高度信任與保存,建立了一個(gè)安全的存儲基礎(chǔ)設(shè)施,其中包括存儲集群、物理虛擬機(jī)(VM)服務(wù)器和虛擬環(huán)境等,以承載交付存儲庫功能所需的各種服務(wù)。Ceph和Bareos是該存儲架構(gòu)必備技術(shù)。Ceph是一種分布式文件系統(tǒng),具備自己的內(nèi)置校驗(yàn)和,能夠在維護(hù)數(shù)據(jù)兼容性的同時(shí)加入復(fù)制和容錯(cuò)功能,定期檢查和自動(dòng)修復(fù)在數(shù)據(jù)中發(fā)現(xiàn)的任何錯(cuò)誤[14],為DRI提供類似云的存儲服務(wù),用于虛擬機(jī)(VM)圖像和存儲庫數(shù)據(jù)的實(shí)時(shí)存儲。Bareos是一種備份/恢復(fù)系統(tǒng),保存著校驗(yàn)和,即在數(shù)據(jù)處理和通信領(lǐng)域中用以檢驗(yàn)的一組數(shù)據(jù)項(xiàng)之和,能夠有效地保證通信過程中數(shù)據(jù)的完整性與準(zhǔn)確性,在備份數(shù)字對象的同時(shí)也將其運(yùn)行檢查,以查看是否在磁盤或磁帶上發(fā)生任何錯(cuò)誤。[15]此外,DRI一直致力于收集和保存博物館藝術(shù)品、考古挖掘和歷史建筑等3D文化遺產(chǎn)數(shù)據(jù),并廣泛應(yīng)用于開放科學(xué)、教育等領(lǐng)域。DRI使用open3D和云比較等技術(shù)重建了場景的3D副本,再用Bender和Meshlab等技術(shù)去除不必要的噪聲。[16]同時(shí),DRI還不斷探索各種開放格式與標(biāo)準(zhǔn),如IFC、Collada、glTF等,以提高3D內(nèi)容的互操作性。
DRI多主體參與的團(tuán)隊(duì)建設(shè)、多渠道的資金來源及特色項(xiàng)目開發(fā)建設(shè)方面的協(xié)同合作機(jī)制建設(shè)推動(dòng)整個(gè)存儲庫的可持續(xù)運(yùn)行。
2.2.1 多主體參與的團(tuán)隊(duì)建設(shè)。DRI的成員來自各個(gè)領(lǐng)域,包括軟件工程師、設(shè)計(jì)師、數(shù)字檔案管理員、數(shù)字成像專家等。除了廣泛引入各領(lǐng)域的優(yōu)秀人才外,DRI也得到了學(xué)術(shù)、文化、社會合作伙伴的支持,如愛爾蘭的國家圖書館、愛爾蘭廣播電視臺等,他們?yōu)镈RI的運(yùn)轉(zhuǎn)提供了多領(lǐng)域的智慧型人才保障。
2.2.2 多渠道的資金來源。DRI最初從高等教育管理局獲得了2011—2015年第五周期的520萬歐元[17],同時(shí)還獲得了愛爾蘭企業(yè)、愛爾蘭科學(xué)基金會、歐盟委員會第七框架計(jì)劃(FP7)和愛爾蘭基金的資助。從2016年起,DRI通過高等教育管理局和愛爾蘭研究理事會獲得核心資金。
2.2.3 特色合作項(xiàng)目驅(qū)動(dòng)服務(wù)機(jī)制。DRI在立足自身項(xiàng)目建設(shè)發(fā)展的同時(shí),也在不斷地開展與其他機(jī)構(gòu)合作的特色項(xiàng)目,共同驅(qū)動(dòng)服務(wù)機(jī)制的運(yùn)行,詳見表1。
表1 愛爾蘭數(shù)字存儲庫特色合作項(xiàng)目表
為滿足用戶的需求、提高利用效率與優(yōu)化用戶的體驗(yàn)感,DRI向用戶提供了更為便捷的多元化服務(wù),主要體現(xiàn)在其多元化的檢索方式和鼓勵(lì)用戶參與資源建設(shè)。
2.3.1 多元檢索方式推動(dòng)資源利用。為挖掘館藏資源價(jià)值,使其得到高效利用,DRI為用戶提供多層次的檢索方式。首先,用戶通過DRI網(wǎng)站所提供的一站式檢索窗口,輸入所需資源的關(guān)鍵詞便可得到相關(guān)的數(shù)據(jù)資源。其次,用戶還可根據(jù)檢索結(jié)果的編成日期、發(fā)布日期、許可、學(xué)科、主題等優(yōu)化檢索結(jié)果。此外,DRI還提供相關(guān)性、創(chuàng)建日期、標(biāo)題(A-Z)、檢索結(jié)果等排序條件,以實(shí)現(xiàn)對檢索結(jié)果的二次優(yōu)化。DRI多層次的檢索途徑極大提高了資源的查全率與查準(zhǔn)率,同時(shí)也提高了館藏資源的利用率。
2.3.2 用戶參與推進(jìn)資源建設(shè)。DRI很好發(fā)揮了用戶在資源建設(shè)方面的作用,使其實(shí)現(xiàn)從“利用者”到“建設(shè)者”的角色轉(zhuǎn)變。2020年10月,DRI與愛爾蘭國家檔案館共同主辦“檔案行為主義:以社區(qū)為中心的檔案方法”在線合作網(wǎng)絡(luò)研討會[18],為DRI社區(qū)檔案計(jì)劃項(xiàng)目做出進(jìn)一步規(guī)劃。該項(xiàng)目通過建立可自由訪問的在線收藏等方式記錄、組織與共享社區(qū)用戶的檔案故事,永久保存“社區(qū)檔案工作者”的記憶。此外,DRI還定期舉辦社區(qū)檔案計(jì)劃評選,調(diào)動(dòng)用戶參與資源建設(shè)的積極性。由于有了用戶的參與,DRI的社區(qū)檔案計(jì)劃項(xiàng)目不僅提升了公民的檔案資源挖掘能力,也促進(jìn)了DRI與用戶共同參與推動(dòng)資源建設(shè)模式的發(fā)展。
DRI提供了交互式數(shù)據(jù)共享與異地備份,為應(yīng)對故障轉(zhuǎn)移與災(zāi)難恢復(fù)等危機(jī)提供安全保障。
2.4.1 交互式的數(shù)據(jù)共享模式。DRI將愛爾蘭各機(jī)構(gòu)所掌握的數(shù)據(jù)資源連接到一起,并提供一個(gè)中央互聯(lián)網(wǎng)接入點(diǎn)和交互式多媒體工具,構(gòu)建交互式可信數(shù)字存儲庫,實(shí)現(xiàn)資源交互式數(shù)據(jù)共享。[19]這一數(shù)據(jù)共享管理模式,在基于數(shù)據(jù)資源安全性保障前提下,實(shí)現(xiàn)了各機(jī)構(gòu)數(shù)據(jù)的共建共用。
2.4.2 數(shù)據(jù)資源異地備份。DRI的存儲集群為數(shù)字對象、虛擬機(jī)圖像以及元數(shù)據(jù)資源提供存儲與永久保存,該存儲集群分布于多個(gè)獨(dú)立站點(diǎn)上,當(dāng)系統(tǒng)發(fā)生故障時(shí),整個(gè)基礎(chǔ)設(shè)施與數(shù)據(jù)資源都會被復(fù)制到一個(gè)二級站點(diǎn)中,該站點(diǎn)為整個(gè)存儲集群提供安全的虛擬存儲環(huán)境與基礎(chǔ)設(shè)施,包括多元化的技術(shù)與高包容性的數(shù)據(jù)接納系統(tǒng),以規(guī)避整個(gè)DRI系統(tǒng)故障帶來的影響,并實(shí)現(xiàn)災(zāi)后迅速恢復(fù)數(shù)據(jù)。
縱觀我國文化遺產(chǎn)存儲庫的建設(shè)現(xiàn)狀,雖已具備一定的實(shí)踐經(jīng)驗(yàn),但仍存在實(shí)踐、合作、開發(fā)與技術(shù)等方面的不足。為此,可借鑒DRI的成功實(shí)踐經(jīng)驗(yàn),通過下列方式彌補(bǔ)我國數(shù)字文化遺產(chǎn)存儲庫建設(shè)上的短板。
我國文化遺產(chǎn)存儲庫建設(shè)已然取得一定的研究成果與實(shí)踐經(jīng)驗(yàn),但由于各地只專注于自身館藏資源建設(shè),文化遺產(chǎn)資源相對分散,暫無法實(shí)現(xiàn)各存儲庫之間的協(xié)同合作與資源共享,而文化遺產(chǎn)只有置于大數(shù)據(jù)時(shí)代背景下時(shí),才能真正發(fā)揮出其蘊(yùn)含的價(jià)值。因此,我國文化遺產(chǎn)存儲庫應(yīng)當(dāng)加強(qiáng)頂層設(shè)計(jì),強(qiáng)化政策支持,明確建設(shè)主體,構(gòu)建“1+N”分布式資源存儲庫的結(jié)構(gòu)體系。所謂“1+N”分布式資源存儲結(jié)構(gòu)體系,即構(gòu)建一個(gè)中央核心存儲庫接入點(diǎn),利用交互式多媒體工具連接N個(gè)存儲庫機(jī)構(gòu),實(shí)現(xiàn)交互式數(shù)據(jù)資源共享,詳見圖2。用戶通過本地文化遺產(chǎn)存儲庫進(jìn)行一站式檢索,當(dāng)檢索內(nèi)容存于本地存儲庫時(shí),用戶只需通過本地存儲庫便可便捷獲取資源及其相應(yīng)的服務(wù);當(dāng)檢索內(nèi)容存于其他存儲庫時(shí),可通過本地存儲庫向中央核心存儲庫發(fā)出資源請求,再由中央核心存儲庫向數(shù)據(jù)所在的存儲庫轉(zhuǎn)發(fā)該請求,并利用交互式多媒體工具獲得所需資源,提供給用戶,以滿足用戶的需求?!?+N”分布式資源庫體系打通了各存儲庫之間的界限,實(shí)現(xiàn)了資源互通。
圖2 “1+N”分布式資源庫運(yùn)行圖
我國文化遺產(chǎn)資源主要是通過網(wǎng)站或建設(shè)特色存儲庫進(jìn)行宣傳與推廣,開發(fā)力度遠(yuǎn)遠(yuǎn)不夠,在一定程度上影響了文化遺產(chǎn)資源潛在價(jià)值的挖掘與利用,同時(shí)也無法帶動(dòng)文化遺產(chǎn)數(shù)據(jù)管理與“活”態(tài)服務(wù)。因此,我國文化遺產(chǎn)存儲庫建設(shè)可引進(jìn)DRI的綜合性技術(shù)體系,形成覆蓋文化遺產(chǎn)數(shù)據(jù)形成、資源存儲、數(shù)據(jù)傳輸、永久保存及價(jià)值挖掘等一系列的周期性技術(shù)保護(hù)框架,在保證文化遺產(chǎn)永久保存的基礎(chǔ)上實(shí)現(xiàn)價(jià)值的挖掘與流程再造。
在數(shù)據(jù)存儲前期,存儲系統(tǒng)采用具包容性的技術(shù),如Ceph和Bareos等,以確保系統(tǒng)可識別與存儲各種載體類型的文化遺產(chǎn)資源,并為其提供相應(yīng)的存儲環(huán)境。在數(shù)據(jù)傳輸階段,構(gòu)建綜合性交互型技術(shù)框架,以保證數(shù)據(jù)資源在各存儲庫間實(shí)現(xiàn)共建共享,并為數(shù)據(jù)傳輸過程提供安全保障。而文化遺產(chǎn)的資源利用與價(jià)值挖掘處于流程末端,需系統(tǒng)運(yùn)用相應(yīng)的技術(shù)來充分保障資源的真實(shí)性與完整性。存儲庫可利用區(qū)塊鏈結(jié)合智能合約、數(shù)字簽名等技術(shù)保證數(shù)據(jù)交換安全,防止資源信息內(nèi)容被篡改或泄露。
要使文化遺產(chǎn)資源得以全面采集與永久保存,應(yīng)借鑒DRI在人才團(tuán)隊(duì)、資金合作以及特色項(xiàng)目開發(fā)建設(shè)等方面協(xié)同合作的實(shí)踐經(jīng)驗(yàn)?;诖耍覈幕z產(chǎn)存儲庫可建構(gòu)多元的協(xié)同合作運(yùn)行機(jī)制,以凝聚社會各方力量共同推動(dòng)存儲庫可持續(xù)發(fā)展。
一方面,要吸納第三方力量,打造穩(wěn)定的智慧人才隊(duì)伍。應(yīng)采取“自造”與“吸收”雙重人才培養(yǎng)機(jī)制。除與高校、科學(xué)院等教育機(jī)構(gòu)聯(lián)合培養(yǎng)相關(guān)專業(yè)技術(shù)人才外,還應(yīng)積極與政府、企業(yè)等社會機(jī)構(gòu)協(xié)同合作,形成人才資源協(xié)同發(fā)展態(tài)勢。
另一方面,轉(zhuǎn)變民眾角色,共同推進(jìn)資源建設(shè)。用戶的創(chuàng)新想法是無窮無盡的,唯有實(shí)現(xiàn)用戶從利用者向資源創(chuàng)建者的角色轉(zhuǎn)變,才能真正發(fā)掘用戶的價(jià)值與需求。我國文化遺產(chǎn)存儲庫建設(shè)可通過開設(shè)文化遺產(chǎn)文創(chuàng)比賽、搭建眾包平臺等渠道,不斷提高用戶文化遺產(chǎn)保護(hù)意識及檔案創(chuàng)新能力,將其發(fā)展成文化遺產(chǎn)存儲庫建設(shè)的主力軍之一。
數(shù)字文化遺產(chǎn)資源的不穩(wěn)定性要求在建設(shè)數(shù)字文化遺產(chǎn)資源庫的過程中,必須樹立危機(jī)意識,在做好安全技術(shù)保護(hù)的基礎(chǔ)上,搭建系統(tǒng)異地備份組織架構(gòu),以便當(dāng)系統(tǒng)被侵犯或受自然災(zāi)害破壞時(shí)可及時(shí)恢復(fù)數(shù)據(jù)或重建系統(tǒng)。
可借鑒DRI交互式數(shù)據(jù)共享與異地備份資源安全體系建設(shè),在基于全國“1+N”交互式分布的資源存儲系統(tǒng)上,打造全國文化遺產(chǎn)資源異地備份基地,增強(qiáng)存儲庫的容災(zāi)功能。異地備份存儲基地類似DRI系統(tǒng)的故障轉(zhuǎn)移功能,在異地備份前期,依托新型技術(shù)手段,為資源的收集傳輸、永久保存與利用等營造安全的存儲環(huán)境,形成前瞻性的保護(hù)框架。在異地備份中期,備份存儲基地必須具備匹配多元化資源格式的識別技術(shù),以保障電子文化遺產(chǎn)資源元數(shù)據(jù)與存儲環(huán)境數(shù)據(jù)的收集。此外還需與各存儲庫之間建立起資源實(shí)時(shí)相互映射機(jī)制,以確保資源的實(shí)時(shí)性與同步性,并定期檢查資源的完整性與安全性,為資源的永久保存提供保障。在異地備份后期,要運(yùn)用數(shù)字簽名、可信時(shí)間戳等電子文件防篡改技術(shù)對電子資源進(jìn)行驗(yàn)證[20],以確保輸出資源的真實(shí)性,為文化遺產(chǎn)資源恢復(fù)提供技術(shù)保障。以遼寧省電子檔案備份中心為例,其現(xiàn)為國家第一歷史檔案館、廣西、寧夏等地的電子檔案異地保管機(jī)構(gòu),所存儲的數(shù)據(jù)涵蓋國家、省、市、縣區(qū)四個(gè)行政級別的檔案資源[21],起著重要的數(shù)據(jù)容災(zāi)備份功能,這種數(shù)據(jù)備份模式目前在全國范圍內(nèi)得到了一定的推廣,具有較強(qiáng)的可操作性。