丁晨
明年是官方發(fā)行的第一張紙幣——交子誕生10 0 0年。無獨(dú)有偶,在距離交子誕生地——成都近20 0 0公里的上海,一項(xiàng)有關(guān)“紙幣數(shù)字化”的課題也于近日完成初步階段。這便是由國家文物鑒定委員會(huì)委員、上海博物館青銅研究部研究館員周祥主持的中宣部“文化名家暨四個(gè)一批人才”自選課題“民國紙幣研究信息化建設(shè)”。
周祥國家文物鑒定委員會(huì)委員 上海博物館青銅研究部研究館員
此項(xiàng)課題歷時(shí)5 年時(shí)間,對上海博物館收藏的民國紙幣進(jìn)行數(shù)據(jù)采集、信息識別、以圖識圖,從而建立了一個(gè)上海博物館館藏民國紙幣數(shù)據(jù)庫。這是全國文物博物館領(lǐng)域首次將人工智能技術(shù)運(yùn)用于學(xué)術(shù)研究的一種嘗試和探索。日前,《中國收藏》雜志記者在上海與周祥面對面,就這一課題做了一次深入訪談。周祥表示,他是從上海博物館舉辦的多次數(shù)字藝術(shù)大展中獲得的靈感。比如上海博物館曾于2 018年舉辦“丹青寶筏——董其昌書畫藝術(shù)大展”,其中所展示的“董其昌數(shù)字人文展示系統(tǒng)”依托博物館自身的藏品、研究轉(zhuǎn)化為以“董其昌”為中心的知識圖譜,收獲了不錯(cuò)的社會(huì)反響。周祥從中看到了博物館藏品數(shù)字化、信息化所帶來的機(jī)遇,“ 既然館藏書畫作品可以數(shù)字化展現(xiàn),為什么館藏紙幣不可以呢?”敢于突破、勇于創(chuàng)新的周祥認(rèn)為——紙幣數(shù)字化,勢在必行!但是在具體實(shí)施過程中,周祥卻面臨著一個(gè)又一個(gè)的難題。
據(jù)不完全統(tǒng)計(jì),上海博物館收藏民國紙幣有1萬余張,包括由國民政府、國家銀行、商業(yè)銀行、地方銀行等發(fā)行的各類紙幣。豐富的館藏對于課題的開展是一個(gè)便利條件,周祥也想借這個(gè)機(jī)會(huì)近距離接觸實(shí)物藏品。一張張平面的紙幣要用三維展示,怎么實(shí)現(xiàn)?圖像抓取、信息識別、數(shù)據(jù)庫建立……對于深植于傳統(tǒng)學(xué)術(shù)研究領(lǐng)域的周祥來說,數(shù)字化是一個(gè)完全陌生的領(lǐng)域。
《中國收藏》:為什么會(huì)選擇“民國紙幣研究信息化建設(shè)”這個(gè)方向作為課題?
通過智能標(biāo)注功能,系統(tǒng)可以提取民國紙幣主景圖組合的深層特征。
周祥:自從進(jìn)入上海博物館工作之后,我一直從事傳統(tǒng)的學(xué)術(shù)研究,習(xí)慣性根據(jù)經(jīng)驗(yàn)對文物進(jìn)行判斷。但是人的記憶不是恒定的,會(huì)在不同的時(shí)期產(chǎn)生偏差,即人的經(jīng)驗(yàn)和記憶會(huì)存在差錯(cuò)率。因此,我想借課題機(jī)會(huì),利用科技和信息化的手段,將紙幣上所包含的信息進(jìn)行拆解,將它們變成一組組真實(shí)可靠的數(shù)據(jù)。
得益于人工智能和A I技術(shù)的迅速發(fā)展,如果這個(gè)課題放到今天,可操作性和完成度會(huì)更高。但是,“ 民國紙幣研究信息化建設(shè)”課題啟動(dòng)時(shí)是在5 年前。當(dāng)時(shí),人工智能與A I 技術(shù)剛剛在國內(nèi)興起,所以,這些科技手段能成為紙幣數(shù)字化研究的手段嗎?關(guān)于這個(gè)問題,我當(dāng)時(shí)在心里畫了個(gè)問號。
《中國收藏》:開展課題的第一步是什么?
周祥:搭建數(shù)據(jù)庫。在這個(gè)過程中,圖像是最基礎(chǔ)也是最關(guān)鍵的一步。在博物館工作有一個(gè)很大的優(yōu)勢,那就是可以接觸到大量的珍貴文物,這些文物可以成為理論研究的重要實(shí)物支撐。這也是區(qū)別于以文獻(xiàn)作為主要參考對象的院校研究的最大不同。
因此,在課題開展過程中,我也參與到藏品拍攝、成像等過程中。專業(yè)的攝制團(tuán)隊(duì)對圖片進(jìn)行拍攝,在保管員的監(jiān)督下,由我將藏品取出,當(dāng)藏品四個(gè)角度的拍攝均完成后,再由我遞交給保管員入庫。盡管有部分藏品已經(jīng)進(jìn)行過圖像留存,但我還是選擇統(tǒng)一重新拍攝,為的就是用新的標(biāo)準(zhǔn)補(bǔ)全所有藏品的信息。在近距離接觸了這些館藏紙幣后,我對它們的了解也更加深入。
按照步驟來說,數(shù)據(jù)庫搭建完成之后,接下來應(yīng)該拆解藏品信息,并借助專業(yè)的軟件與技術(shù)提取相關(guān)信息。然而,究竟要提取哪些信息?不同的信息該如何分類?這就需要課題主持人對于這一領(lǐng)域有著深入的研究,且能夠在實(shí)際過程中結(jié)合所發(fā)生的各種變量,運(yùn)用個(gè)人知識儲(chǔ)備不斷修訂方案,而這也正是周祥的優(yōu)勢所在。
《中國收藏》:在拆解信息的過程中,您曾遇到過哪些難題?
周祥:一張紙幣上往往包含著許多信息,比如發(fā)行機(jī)構(gòu)名稱、印刷機(jī)構(gòu)名稱、底紋、顏色、邊框、簽名等。在拆解這一步驟時(shí),我初步確定了需要拆解的信息類目,有7 8 項(xiàng),然后請上海博物館多媒體信息中心的同事幫忙。他們依據(jù)我提供的參考標(biāo)準(zhǔn),運(yùn)用專業(yè)的軟件與先進(jìn)的技術(shù)提取相關(guān)信息。但是在這個(gè)過程中,我們卻再次遇到了難題。
這主要是因?yàn)椴煌募垘旁谟∷r(shí)并未采用固定的標(biāo)準(zhǔn),因此不同紙幣所承載的信息存在特殊性,而當(dāng)時(shí)確定好的細(xì)分項(xiàng)無法完全覆蓋每一張紙幣。比如,僅“底紋”一項(xiàng),不同的紙幣就可能給出不同的答案,因此只能用“有無底紋”進(jìn)行區(qū)分。但有時(shí)發(fā)現(xiàn),僅以“ 有”“無”進(jìn)行判斷,還是會(huì)略顯寬泛,因此我們進(jìn)一步調(diào)整了規(guī)范,將標(biāo)準(zhǔn)劃定為“有無底紋,底紋為數(shù)字、文字或圖案”。
大洋票、小洋票、銀元票、銅元票……眾所周知,中國紙幣發(fā)行的過程中產(chǎn)生了多種命名形式,不同的紙幣也各有其特征。但是在搭建系統(tǒng)進(jìn)行信息化采集與處理時(shí),需要盡可能簡化流程,而將不同的命名全部納入系統(tǒng)之中是不現(xiàn)實(shí)的,因此,如何將紙幣上的信息進(jìn)行標(biāo)準(zhǔn)化統(tǒng)一,也是一大難題。
《中國收藏》:通過搭建這一系統(tǒng),可以實(shí)現(xiàn)怎樣的效果?
周祥:有些紙幣自稱兌換券,我們就不能將其命名為銀元券。關(guān)于這些問題,都需要結(jié)合專業(yè)知識進(jìn)行規(guī)范化分類,將其劃分到不同的類目中,這樣等到數(shù)據(jù)庫建立完成之后,大家在檢索時(shí)才能一目了然。而且,我想要做的這個(gè)數(shù)據(jù)庫不僅需要提供文字檢索功能,還需要達(dá)到以圖搜圖、以圖識圖的效果。因此,當(dāng)明確與統(tǒng)一了不同紙幣之間的語義問題之后,系統(tǒng)搭建的最后一步是——運(yùn)用AI技術(shù)進(jìn)行識圖處理。
“民國紙幣研究信息化建設(shè)”是全國文物博物館領(lǐng)域首次將人工智能技術(shù)運(yùn)用于學(xué)術(shù)研究的一種嘗試和探索。
如今在這個(gè)系統(tǒng)中,如果我提交與“交通銀行”四個(gè)字有關(guān)的圖片,系統(tǒng)將會(huì)從宣統(tǒng)元年至2 0世紀(jì)4 0年代之間有關(guān)交通銀行發(fā)行的紙幣顯示出來。由于貨幣制度改革是中央銀行集中發(fā)行制定的,因此在這30余年的時(shí)間里,“交通銀行”四個(gè)字的書體也發(fā)生過改變。而這個(gè)識圖系統(tǒng)也運(yùn)用A I技術(shù)與精密的算法,對不同的書體進(jìn)行了標(biāo)注,以圖片的形式呈現(xiàn)出來。在識別到圖片之后,系統(tǒng)會(huì)根據(jù)這張圖片與所查詢圖片中相關(guān)書體的相似度,按照相似度大小進(jìn)行升降序排列,并顯示在圖片的信息介紹欄中。由此,查詢者可以通過這個(gè)系統(tǒng),掌握歷史上有關(guān)交通銀行行名的多種寫法,并且查詢到相關(guān)書籍以及使用數(shù)據(jù),形成知識累積。
不僅如此,通過這個(gè)系統(tǒng),還可以把目前學(xué)界已公開發(fā)表的理論著述和研究信息都導(dǎo)入其中,然后將相應(yīng)的資料和數(shù)據(jù)對應(yīng)到某張具體的紙幣上。在信息查閱的過程中,如果有人對當(dāng)前學(xué)界針對某張藏品的研究有誤或持有不同觀點(diǎn),系統(tǒng)也提供留言功能,查詢者可以將個(gè)人觀點(diǎn)發(fā)布在留言處。
每一關(guān)都是難題,每一關(guān)都是挑戰(zhàn)。在周祥的堅(jiān)持與努力下,目前,上海博物館收藏民國紙幣的數(shù)字化模型已初步搭建完畢,這預(yù)示著周祥“紙幣數(shù)字化”的課題也告一段落。作為紙幣數(shù)字化探索方面的先行者,提及課題開展的過程,周祥感慨良多,他坦言道:“這對于我來說是個(gè)不小的挑戰(zhàn),剛開始的時(shí)候確實(shí)有點(diǎn)摸不著頭腦,但真正開始著手項(xiàng)目之后,又十分想把它做好。受制于資金限制,目前這一項(xiàng)目只進(jìn)行到初步階段,要想進(jìn)一步深入研究,還需要以一張張紙幣為藍(lán)本,細(xì)細(xì)鉆研與提取其中的信息,也需要對系統(tǒng)進(jìn)行進(jìn)一步的維護(hù)與完善,這是一個(gè)長期的過程,需要更大的資金支持以及投入更多的精力?!?/p>
據(jù)悉,該系統(tǒng)目前僅限上海博物館內(nèi)部人員使用,周祥認(rèn)為:“運(yùn)用現(xiàn)代科技手段可以搭建起一個(gè)數(shù)字化的研究平臺,進(jìn)而在傳統(tǒng)研究的基礎(chǔ)上開辟出另一種新的研究路徑、研究手段與研究方法,為館內(nèi)研究員從事研究提供便利。我也很希望能有人將這個(gè)課題繼續(xù)做下去,并且期待未來這個(gè)系統(tǒng)能夠作為公開使用的平臺,惠及更多致力于錢幣領(lǐng)域研究的學(xué)者朋友?!保ㄗⅲ罕疚呐鋱D由周祥提供)
“民國紙幣研究信息化建設(shè)”系統(tǒng)目前僅限上海博物館內(nèi)部人員使用。周祥期待未來該系統(tǒng)能夠作為公開使用的平臺,惠及更多錢幣研究者和愛好者。