摘 要:文物保護單位對文物本體及相關(guān)資料數(shù)據(jù)采集的逐漸完善,產(chǎn)生了大量零散、無序的文物數(shù)據(jù)資源。隨著計算機、網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,數(shù)據(jù)資源的管理和利用對文物研究、保護和管理的發(fā)展越發(fā)重要,如何管理利用好這些數(shù)據(jù)資源成為是否能夠提升文物保護單位信息化建設(shè)的關(guān)鍵。文章以云岡石窟文物數(shù)據(jù)資源管理和利用為例,闡述了石窟寺文物數(shù)據(jù)資源的管理和利用方式,為文物保護單位數(shù)據(jù)資源管理和利用提供借鑒。
關(guān)鍵詞:石窟寺文物;數(shù)據(jù)資源;管理;利用
DOI:10.20005/j.cnki.issn.1674-8697.2025.05.039
1 我國數(shù)據(jù)資源管理與利用現(xiàn)狀
我國數(shù)據(jù)資源管理和利用總體處于起步階段,2024年2月,國家數(shù)據(jù)局聯(lián)合中央網(wǎng)信辦、工業(yè)和信息化部、公安部組織開展全國數(shù)據(jù)資源調(diào)查,形成《全國數(shù)據(jù)資源調(diào)查報告(2023年)》。該報告指出,我國數(shù)據(jù)產(chǎn)量、存量、算力規(guī)模大,數(shù)據(jù)流通、交易變化快,數(shù)據(jù)資源“產(chǎn)—存—算”規(guī)模優(yōu)勢基本形成,數(shù)據(jù)“供給—流通—應(yīng)用”主體逐漸豐富,海量數(shù)據(jù)和豐富場景優(yōu)勢潛力亟須釋放。在文物領(lǐng)域,我國現(xiàn)有1.08億件(套)可移動文物、76.7萬處不可移動文物和1372項非物質(zhì)文化遺產(chǎn),2000年以來,文化遺產(chǎn)數(shù)字化保護工作在全國廣泛開展,采集存儲了體量巨大的數(shù)據(jù)資源。但存在數(shù)據(jù)生產(chǎn)總量大,有效供給不足;數(shù)據(jù)流通交易需求旺盛,流通模式不完善;海量數(shù)據(jù)源頭即棄,數(shù)據(jù)價值有待釋放等問題。
2 石窟寺文物數(shù)據(jù)資源現(xiàn)狀
2.1 石窟寺文物數(shù)據(jù)資源類型
石窟寺文物保護管理單位在進行文物保護工作的過程中積累了大量的、多種類的、時間跨度大的數(shù)據(jù)資源,具體如下:
一是文書類數(shù)據(jù)資源。文書類數(shù)據(jù)資源是所有機構(gòu)中最基礎(chǔ)的一類數(shù)據(jù)資源,石窟寺管理機構(gòu)也不例外,石窟寺文物保護管理單位文書類的數(shù)據(jù)資源涵蓋了洞窟介紹、保護修復(fù)過程、數(shù)字化采集、文旅弘揚、科研、歷史資料、安全防范、設(shè)備儀器、財務(wù)管理、人事管理等文書類數(shù)據(jù)資源。
二是圖片類數(shù)據(jù)資源。由于文物具有時間跨度長的特殊性,圖片類數(shù)據(jù)資源是反映文物發(fā)展變化過程的重要資料,石窟寺文物保護管理單位圖片數(shù)據(jù)資源主要有石窟照片、歷史名人照片、手稿、拓片、書法及日常工作活動等照片。這些照片直接應(yīng)用于文物保護、文旅弘揚、科研出版等各項業(yè)務(wù)工作,具有十分重要的價值。
三是流媒體數(shù)據(jù)資源。與圖片數(shù)據(jù)相同,流媒體數(shù)據(jù)資源也是反映文物發(fā)展變化過程的重要資料,石窟寺文物保護管理單位流媒體數(shù)據(jù)資源主要有文物視頻、講解、學術(shù)會議錄音等,這些流媒體數(shù)字資源可以數(shù)字化形式進行展示與文化傳播,豐富了石窟寺文物保護管理單位傳承中華優(yōu)秀傳統(tǒng)文化的形式。并且流媒體資源越來越多地運用于石窟寺文物的陳列展覽、保護修復(fù)、社會教育等各項活動中。
四是三維數(shù)據(jù)資源。文物三維數(shù)據(jù)是指通過三維掃描技術(shù)將文物的幾何和紋理信息進行采集,構(gòu)造一個與真實文物盡可能一致的三維數(shù)據(jù)。石窟寺文物保護管理單位現(xiàn)有的三維數(shù)據(jù)資源主要有點云數(shù)據(jù)、文物三維模型數(shù)據(jù)等,此類型的數(shù)據(jù)資源可以用于文物虛擬修復(fù)、文物3D打印復(fù)制和宣傳展示等工作中。
五是其他數(shù)據(jù)資源。近年來許多新技術(shù)應(yīng)用到云岡石窟的保護研究領(lǐng)域,諸如高光譜、多光譜、人工智能算法等,這些新技術(shù)的應(yīng)用也會產(chǎn)生大量的數(shù)據(jù),對這些數(shù)據(jù)進行管理及利用,可以發(fā)現(xiàn)使用傳統(tǒng)方法發(fā)現(xiàn)不了的信息,有利于文物的進一步保護研究和利用。
2.2 石窟寺文物數(shù)據(jù)資源的來源
石窟寺文物的文本類數(shù)據(jù)資源一般是通過手寫版輸入、鍵盤輸入、互聯(lián)網(wǎng)下載、OCR掃描識別、語音錄入等方法進行采集。
石窟寺文物的圖片類的數(shù)據(jù)資源一般是通過數(shù)碼相機拍攝、掃描儀掃描、互聯(lián)網(wǎng)下載、攝像頭拍攝、三維模型輸出等方法進行采集。
石窟寺文物的流媒體類數(shù)據(jù)資源一般是通過數(shù)碼相機拍攝、互聯(lián)網(wǎng)下載、攝像機拍攝、攝像頭拍攝、電腦制作、錄音機錄制等方法進行采集
石窟寺文物的三維數(shù)據(jù)目前主要是通過三維激光掃描和攝影測量的方式進行采集和制作。
其他數(shù)據(jù)資源主要使用專門的儀器和設(shè)備進行相應(yīng)特殊數(shù)據(jù)的采集。
2.3 石窟寺數(shù)據(jù)資源管理與利用問題
諸如圖片數(shù)據(jù)、流媒體數(shù)據(jù)、三維數(shù)據(jù)等數(shù)據(jù)資源組成了石窟寺文物保護管理單位的基礎(chǔ)數(shù)據(jù)要素,具有分布性、自治性、變化性、持久性、共享性、多樣性等特點,在管理與利用上存在以下一些問題:
2.3.1 文物數(shù)據(jù)生產(chǎn)總量大,但供給不足
石窟寺文物數(shù)字化工作已經(jīng)實施多年,各個石窟寺文物保護管理單位積累了大量的數(shù)據(jù)資源,數(shù)據(jù)資源的類型豐富,但存在源頭即棄的問題,即采集到的數(shù)據(jù)只存儲在存儲設(shè)備中,沒有得到有效地開放利用。
2.3.2 數(shù)據(jù)質(zhì)量問題影響利用成效
石窟寺文物保護管理單位想要利用數(shù)據(jù)必須保障數(shù)據(jù)的準確性、完整性、一致性、及時性、可靠性,由于石窟寺管理單位技術(shù)力量的差異,采集到的數(shù)據(jù)質(zhì)量參差不齊,若數(shù)據(jù)質(zhì)量差,石窟寺文物數(shù)據(jù)資源的利用成效必然不高。
2.3.3 數(shù)據(jù)安全性保障相對較低
除個別較大型的石窟寺文物保護管理單位有相對健全數(shù)據(jù)安全保障措施,其他的石窟寺文物保護管理單位存儲設(shè)備和管理制度等設(shè)置相對不足,數(shù)據(jù)安全性保障不足,存在泄漏風險。
2.3.4 數(shù)據(jù)應(yīng)用場景落實加快,數(shù)據(jù)價值有待釋放
石窟寺文物數(shù)據(jù)的應(yīng)用場景呈現(xiàn)爆發(fā)式的增長,在文物展覽、游戲設(shè)計、服裝設(shè)計等方面應(yīng)用加快,成為引領(lǐng)數(shù)據(jù)開發(fā)利用的催化劑,文物數(shù)據(jù)的開放量增長速度較快,但數(shù)據(jù)的多場景應(yīng)用、多主體復(fù)用的難度較大,數(shù)據(jù)價值有待釋放。
2.3.5 開放動力不足削弱共享意愿
目前石窟寺文物保護管理單位缺少行之有效的激勵機制,影響到數(shù)據(jù)利用的積極性,同時職稱晉升多以期刊論文為主,產(chǎn)出的科研數(shù)據(jù)會被忽視,第三數(shù)據(jù)的產(chǎn)權(quán)歸屬問題不明確,石窟寺文物保護管理單位、資助單位及文物數(shù)據(jù)生產(chǎn)、管理相關(guān)單位的數(shù)據(jù)所有權(quán)爭議較大,造成共享意愿相對較低。
2.3.6 數(shù)據(jù)管理、使用需求旺盛,流通模式待完善
石窟寺文物數(shù)據(jù)交互活躍度較高,但是由于數(shù)據(jù)質(zhì)量、數(shù)據(jù)產(chǎn)權(quán)、效益分配等諸多因素的影響,數(shù)據(jù)的供給難以滿足大量的需求,亟須建立和完善多元的流通模式。
3 云岡石窟數(shù)據(jù)資源的管理
云岡石窟數(shù)字化工作起步于2003年,數(shù)字資源管理歸口云岡研究院數(shù)字化保護中心。
在三維數(shù)據(jù)方面,經(jīng)過多年的實踐積累和長期的研究與探索,突破了三維數(shù)據(jù)采集、運算、存儲與應(yīng)用等關(guān)鍵技術(shù),形成了以三維激光掃描技術(shù)、攝影測量技術(shù)為主的適用于高浮雕文物的數(shù)字化方法,為石窟保護、研究和展示工作提供了科學精確的數(shù)據(jù)支持。目前已完成云岡石窟三分之二洞窟的數(shù)字化工作,成功完成云岡第3窟、第12窟、第18窟等比例3D打印復(fù)制,在世界上首次實現(xiàn)大型不可移動文物的可移動展示,在文物變形監(jiān)測方面達到世界領(lǐng)先水平。
在其他類型數(shù)據(jù)方面,通過數(shù)字化手段,將云岡研究院收藏的大量珍貴書籍、歷史檔案、照片、流媒體數(shù)據(jù)等資料進行數(shù)字化加工,以永久保存和利用。同時積極協(xié)助其他文物單位開展數(shù)字化工作,先后完成包括5處世界遺產(chǎn)地的30多項文物數(shù)字化工程,涉及石窟寺、古建筑、墓葬、壁畫、雕塑、碑刻等。經(jīng)過多年的數(shù)據(jù)積累,云岡研究院數(shù)據(jù)中心形成了近2PB的多類型的文物數(shù)據(jù)資源。
3.1 云岡石窟數(shù)據(jù)資源的軟硬件建設(shè)
3.1.1 硬件建設(shè)
2020年投資2400萬建立云岡石窟計算中心,具有峰值算力234 TFLOPS(萬億次每秒),圖形圖像峰值計算能力為179 TFLOPS,存儲容量2.3 PB,共計1120個物理內(nèi)核,存儲聚合帶寬9.6 GB/s,綜合性能相當于5000臺普通PC的計算能力。同時綜合配套網(wǎng)絡(luò)交換設(shè)備、安全設(shè)備和備份設(shè)備,目前云岡石窟計算中心已投入使用,是全國文物系統(tǒng)首個計算中心,具備強大的文物數(shù)據(jù)存儲、運算、利用、展示能力。云岡石窟計算中心建成之后相當于人類的大腦,要想讓云岡石窟這個“人”發(fā)揮最大的作用,還需要強大的神經(jīng)系統(tǒng),這個神經(jīng)系統(tǒng)就是網(wǎng)絡(luò)。2023年我們在云岡研究院建設(shè)了萬兆網(wǎng)絡(luò)覆蓋,網(wǎng)線直通桌面,完成了全院內(nèi)網(wǎng)的建設(shè),為了實現(xiàn)在院外安全訪問云岡石窟計算中心,我們使用中國移動5G專網(wǎng),通過移動手機號碼白名單控制訪問計算中心數(shù)據(jù),達到數(shù)據(jù)高安全性的訪問。
3.1.2 軟件建設(shè)
硬件平臺建設(shè)完成后需要相應(yīng)的軟件平臺才能發(fā)揮高性能計算中心的效能,為云岡石窟文物保護工作提供支持,為此我們建設(shè)了“云岡云文物數(shù)字資源管理平臺”(圖1),在該平臺下根據(jù)云岡石窟文物數(shù)字化工作建設(shè)了8套系統(tǒng),分別為文物數(shù)字化與應(yīng)用系統(tǒng)、文物信息識別軟件、數(shù)據(jù)集成管理軟件、文物信息發(fā)布系統(tǒng)、文物數(shù)字導(dǎo)覽系統(tǒng)、三維模型遠程渲染系統(tǒng)、高清播放平臺、文物色彩還原管理系統(tǒng)。
數(shù)據(jù)資源管理實現(xiàn)了個人數(shù)據(jù)和團隊數(shù)據(jù)的雙重管理,每個用戶都有自己獨立的賬號和密碼,個人資源管理空間實現(xiàn)了個人數(shù)據(jù)的單獨空間。團隊空間實現(xiàn)了團隊賬戶的協(xié)同管理,每個團隊成員發(fā)布的數(shù)據(jù)整個團隊都可見,并且設(shè)置團隊資源的下載審批流程,由平臺管理員審核團隊成員下載數(shù)據(jù)的合法性,經(jīng)過審批后的數(shù)據(jù)才可下載使用,從而保證了文物數(shù)據(jù)的安全。知識圖譜將洞窟信息與其他知識發(fā)生關(guān)聯(lián),實現(xiàn)洞窟信息與其他知識的無限關(guān)聯(lián),最終形成知識網(wǎng)絡(luò),將所有的信息關(guān)聯(lián)起來。研究和保護人員可以通過本知識圖譜實現(xiàn)對相應(yīng)洞窟的全方位了解。
云渲染展示平臺可實現(xiàn)面向公眾的云岡石窟超大模型互聯(lián)網(wǎng)展示,無須安裝任何軟件實現(xiàn)可交互、可多人協(xié)同、跨平臺、跨設(shè)備終端的展示功能,同時顯示效果不受客戶端的限制。展示平臺可以720度展示彩色三維模型和三角面片,同時可以模擬不同類型(自然光、火把、蠟燭、手電筒)、不同強度光照下的石窟場景,實現(xiàn)距離與面積的測量,一鍵輸出視圖的功能。結(jié)合數(shù)字化石窟病害管理分析系統(tǒng),提供基于三維數(shù)字化模型為底圖的病害、論文、工程檔案的管理、標注、可視化,讓石窟的每一個位置、每一次變化都能夠得到有效的記錄,同時,關(guān)聯(lián)記錄石窟內(nèi)的各種監(jiān)測數(shù)據(jù),為未來的石窟本體保護研究提供充分的數(shù)據(jù)支撐,為文物保護研究人員提供數(shù)據(jù)即時輸出功能。
3.2 云岡石窟數(shù)據(jù)資源的組織
面對云岡石窟近2 PB的數(shù)據(jù)資源,數(shù)據(jù)的組織方式就顯得尤為重要,在數(shù)據(jù)組織上遵循按時間、洞窟和數(shù)據(jù)提供者進行分級、分類、分權(quán)限組織、管理和使用的原則。
3.2.1 圖片數(shù)據(jù)
云岡石窟目前擁有近50萬張照片,這50萬張照片分為五種精度級別,分別為100 MB以上、50 MB~100 MB、10 MB~50 MB、3 MB~10 MB、3 MB以下,以滿足不同場景的使用要求,使用唯一編號關(guān)聯(lián)不同級別數(shù)據(jù),并對每張照片進行分時段、分拍攝者、分窟、分壁面、分層進行命名(圖2),在“云岡云文物數(shù)字資源管理平臺”進行搜索使用。
3.2.2 三維數(shù)據(jù)
云岡石窟三維數(shù)據(jù)的采集精度可以到達8 K、0.03 mm,單個洞窟數(shù)據(jù)最大30 TB左右,單個模型數(shù)據(jù)最大560 GB左右,面對如此龐大的數(shù)據(jù)量,普通的計算機無法進行流暢的運行,同時模型數(shù)據(jù)的使用量又很大,為了解決這一問題我們使用模型輕量化技術(shù),在不改變模型視覺效果的前提下對模型輕量化,實現(xiàn)高精度數(shù)據(jù)展示。
3.2.3 結(jié)構(gòu)化數(shù)據(jù)
云岡石窟將大量的紙質(zhì)資料進行了數(shù)字化掃描,并且對紙質(zhì)資料的相關(guān)信息進行錄入,形成了大量的結(jié)構(gòu)化數(shù)據(jù)資源。在文獻資料方面形成了以編號、書名、作者、時代、出版社、出版日期、頁數(shù)、文獻類別、語言類別、ISSN、ISBN、密級、是否開放為主的結(jié)構(gòu)化數(shù)據(jù)表。在檔案資料方面形成了“案卷目錄+卷內(nèi)目錄”的結(jié)構(gòu)化數(shù)據(jù)表,案卷目錄數(shù)據(jù)表主要包括卷檔號、年度、案卷題名、檔案類別、件數(shù)、總頁數(shù)、起始時間、終止時間、保管期限等,卷內(nèi)目錄數(shù)據(jù)表主要包括:件檔號文件題名、責任者、文件編號、頁號、年度、頁數(shù)、文件時間、保管期限、密級等。在環(huán)境監(jiān)測方面形成了溫度、氣象、降雨量、溫濕度、泉水、大氣測定、日照、風力等結(jié)構(gòu)化數(shù)據(jù)表。這些結(jié)構(gòu)化數(shù)據(jù)表在云岡石窟保護與修復(fù)、學術(shù)研究、管理與決策、文化傳承與教育、數(shù)字化應(yīng)用等方面都發(fā)揮著不可或缺的作用。
3.3 云岡石窟數(shù)據(jù)資源的利用
數(shù)據(jù)資源有三個重要方面:一是數(shù)據(jù)資源的來源;二是數(shù)據(jù)資源的管理;三是數(shù)據(jù)資源的利用。這三個方面相輔相成,但最為重要的還是利用,數(shù)據(jù)只有用起來才能發(fā)揮其所蘊藏的巨大價值。在數(shù)據(jù)利用上我們制定了《云岡研究院數(shù)字資源資產(chǎn)管理辦法》,使數(shù)據(jù)利用做到了有規(guī)可依,每一條數(shù)據(jù)的使用都做到層層審批。我們實現(xiàn)了“云岡云文物數(shù)字資源管理平臺”的單位內(nèi)網(wǎng)訪問,對外我們使用中國移動5G雙域?qū)>W(wǎng)訪問,這樣既保證了數(shù)據(jù)傳輸?shù)男?,同時也保證了文物數(shù)據(jù)的安全。
4 結(jié)語
文物數(shù)據(jù)資源的管理和利用應(yīng)該有三個階段:第一階段,數(shù)據(jù)積累;第二階段,數(shù)據(jù)標注、算法開發(fā)及數(shù)據(jù)中臺建設(shè)等;第三階段,人工智能的引入。云岡石窟的數(shù)字化工作起步于2003年,經(jīng)歷了20多年的發(fā)展歷程,積累了2 PB多的數(shù)據(jù)資源,計劃到2030年完成全部洞窟的數(shù)字化采集工作,數(shù)據(jù)積累階段完成。目前也進行了諸如圖片數(shù)據(jù)標注、三維數(shù)據(jù)標注、虛擬修復(fù)算法開發(fā)等第二階段的一些工作,未來云岡石窟的數(shù)字化工作將集中在此,為第三階段的工作打下堅實的基礎(chǔ)。
目前大多數(shù)石窟寺文物保護管理單位還處在第一階段,個別領(lǐng)先的單位正在進行第二階段的探索,隨著數(shù)據(jù)積累的完成和數(shù)據(jù)標注、算法等的逐步完善,最終將會實現(xiàn)人工智能在文物保護領(lǐng)域的應(yīng)用,從而實現(xiàn)文物數(shù)據(jù)的高效利用。文物數(shù)據(jù)資源的管理與利用,是以數(shù)字化技術(shù)手段活化文化遺產(chǎn)資源,重構(gòu)文化遺產(chǎn)的存在方式、弘揚方式,對于數(shù)字時代發(fā)揮文化遺產(chǎn)的科學、宣傳等方面的價值具有十分重要的作用。隨著文物數(shù)據(jù)資源的進一步利用,將來文化遺產(chǎn)單位將更具知識化、智能化、趣味化和開放性,為社會不斷供給所需的文化信息,未來必將突出以人工智能為主要管理手段的文物數(shù)據(jù)資源平臺,這樣文物數(shù)據(jù)資源的管理與利用將更加科學、高效,更能滿足人民日益增長的文化生活需求,成為弘揚中華優(yōu)秀傳統(tǒng)文化的重要力量。
參考文獻
[1]趙海榮,周世菊,賈瑞雪.北魏方山永固陵數(shù)字化復(fù)原和傳播探究[J].新媒體研究,2021(19):29-33.
[2]盧民,邵云.博物館數(shù)字資源的管理與共享[J].中國博物館,2015(2):16-25.
[3]祁慶國.從行業(yè)數(shù)字資源建設(shè)邁向公共數(shù)字文化建設(shè):文物博物館行業(yè)信息化建設(shè)的實踐與思考[J].博物院,2017(1):46-52.