張 展,楊玉起
(1.安陽師范學院 甲骨文信息處理教育部重點實驗室,河南 安陽 455000;2.中國科學院自動化研究所 模式識別國家重點實驗室,北京 100190)
甲骨學專家根據(jù)甲骨學知識提出的人工綴合甲骨方式有多種,如鄭慧生提出綴合八法:1.裂紋的吻合;2.文字;3.文辭內(nèi)容;4.兆序;5.對貞二辭,即同文卜辭;6.部位,即甲骨所處的生理位置是否正確;7.字體;8.背面,甲骨的背面灼燒痕跡是否吻合一致。八種方法不能孤立看待,以一方為連,對勘其他方法,全無抵牾,才能拼接(1)林雅婷:《甲骨綴合研究》,(臺北)國立政治大學,2004年。。而黃天樹提出了四法:1.據(jù)字體判斷;2.據(jù)殘字判斷;3.據(jù)碴口判斷;4.據(jù)同文判斷(2)黃天樹:《殷墟王卜辭的分類與斷代》,科學出版社,2007年。。人工綴合的方式需要記憶大量的甲骨文信息,存在專業(yè)要求高、工作量大的問題。于是,甲骨學專家提出使用計算機綴合甲骨碎片的設想。
前人研究的計算機拼接甲骨碎片技術,可總結為數(shù)字編碼法(3)Hung-hsiang Chou, Opstad Dg. Computer Matching of Oracle Bone Fragments:A Preliminary Report on a New Research Method. Archaeology, 1973, 26(3): 176-181。童恩正、張陞楷、陳景春:《關于使用電子計算機綴合商代卜甲碎片的初步報告》,《四川大學學報(自然科學版)》 1975年第2期,第57-65頁。、邊角匹配法(4)林圭偵:《資訊科學在安陽出土甲骨拼合上的應用》,(臺北)清華大學人類學研究所碩士論文,2006年。Liu Yong-ge, Wang Tian-lin, Wang Ji-ping. The Application of the Technique of 2D Fragments Stitching Based on Outline Feature in Rejoining Oracle Bones, 2010, MCAA2010, p964-968.和角序列特征匹配法等(5)王愛民、劉國英、葛文英等:《 甲骨文計算機輔助綴合系統(tǒng)設計》,《計算機工程與應用》2010年第21期,第59-62頁。張長青、王愛民:《一種計算機輔助甲骨文拓片綴合方法》,《電子設計工程》2012年第17期,第1-3頁。。但并沒有形成有效的甲骨碎片圖像拼接軟件和系統(tǒng),實際的甲骨碎片拼接成果,也沒有應用于甲骨碎片圖像拼接中。在2019年甲骨文發(fā)現(xiàn)120周年紀念大會上,安陽師范學院甲骨文信息處理教育部重點實驗室的團隊,綜述了歷年來計算機綴合甲骨碎片圖像技術(6)張展、劉永革、郭安、劉成林:《計算機拼接甲骨圖像技術綜述》,《紀念甲骨文發(fā)現(xiàn)120周年國際學術研討會論文集》,中國安陽,2019年,第692-697頁。張展、高峰、 劉成林: 《計算機拼接甲骨碎片圖像技術簡論》,《殷都學刊》2020年第3期,第72-75頁。,并講述了該實驗室研發(fā)的計算機拼接甲骨碎片圖像技術,且在同年12月(如圖1),使用計算機輔助綴合了第1組甲骨碎片并得到實物驗證。并由林宏明老師協(xié)助發(fā)表在先秦史研究室網(wǎng)站(7)張展:《計算機輔助綴合甲骨第1則》,http://www. xianqin.org/blog/a -rchives/12626.html,2020年6月16日。,標志著計算機綴合甲骨碎片圖像技術有所突破。隨著人工智能技術的高度發(fā)展和甲骨學的需求,計算機拼接甲骨碎片圖像技術將會更加成熟,并應用于陶瓷、竹簡、碑刻、紙幣、發(fā)票等物體碎片的圖像拼接。本文主要探討計算機輔助拼接甲骨碎片圖像技術的問題、技巧、特點和重要性。
針對計算機綴合甲骨技術給計算機視覺和甲骨學領域帶來的爭論,本節(jié)將討論計算機拼接甲骨碎片圖像技術所帶來的問題,總結為以下幾個方面:
1.如何對待計算機拼接甲骨的技術
計算機拼接甲骨碎片圖像的技術是輔助甲骨綴合的工具,目前還不能完全地替代甲骨學專家某些特定的工作。比如,計算機綴合甲骨碎片后還需要專家驗證或者實物驗證綴合成果的正確性,所以甲骨學專家的驗證工作仍舊不可替代。然而“先進的生產(chǎn)工具代表先進的生產(chǎn)力”,計算機輔助拼接甲骨碎片的軟件無疑是先進的拼接工具,建議有辯證地接納并學會應用工具。
2.如何看待計算機錯誤拼接甲骨問題
計算機輔助拼接甲骨碎片軟件是先進的工具,但是拼接結果也會出現(xiàn)錯誤組合。計算機拼接甲骨程序是預先設定的、機械程序的和局限敏感的,對計算機輔助拼接甲骨碎片出錯的問題需要甲骨專家的理解包容。如何結合甲骨學專家拼接甲骨的經(jīng)驗,綜合甲骨文文例、甲骨碎片邊緣等各種信息綜合判斷、驗證拼接組合是否正確,是避免拼接結果出錯的關鍵。另外,計算機拼接甲骨碎片成果發(fā)表前需要驗證拼接正確性,可采用專家驗證和實物驗證的機制防止出錯,驗證結果正確后決定是否發(fā)表。對于出書刊印計算機拼接甲骨,需要做詳細說明。
3.計算機智能拼接甲骨碎片技術問題
當前的計算機拼接甲骨碎片方法,采用了先進的人工智能技術,實現(xiàn)了甲骨學專家使用計算機輔助拼接甲骨碎片的設想。但如圖1計算機首次拼接的甲骨碎片圖像當前的計算機輔助拼接甲骨綴合技術并不能達到專家設想的“百分之百的計算機工作”“綴合百分之百的正確”和“獲得大批量的綴合成果”等要求。只能采用或研發(fā)更先進的方法或技術,提高計算機拼接甲骨的正確率和效率,所以目前該項技術只能稱之為計算機輔助拼接甲骨碎片技術或者人工智能驅動的甲骨碎片綴合技術(8)張展:《計算機輔助綴合甲骨第1則》,http://www. xianqin.org/blog/a -rchives/12626.html,2020年6月16日。Zhang Chongsheng, Zong Ruixing, Cao Shuang, Men Yi, Mo bofeng. AI-Powered Oracle Bone Inscriptions Recognition and Fragments Rejoining, Proceedings of 29th International Joint Conference on Artificial Intelligence, Yokohama, Japan, 2020, 5309-5311。莫伯峰、張展:《計算機輔助綴合研討一則——談“日有即”》,https://mp. weixin.qq.com/s/V6xTu0tbUS77cSVQXq1CWA,2021年4月30日。張展:《計算機輔助綴合甲骨第31-32則》,http: //www. xianqin.org/blog/a -rchives/12626.html,2020年6月16日。。
1.甲骨碎片拼接的技巧
(1)采納專家拼接甲骨的經(jīng)驗
專家的經(jīng)驗一般是根據(jù)斷口、文例等,比如鄭慧生先生提出8法,白玉崢先生提出5法,黃天樹先生提出的4法等,在計算機輔助拼接甲骨碎片方面仍然適用,可以根據(jù)這些方法編寫程序,使計算機采集甲骨碎片圖像邊緣等信息,并搜索匹配的甲骨信息,然后保存結果。另外,盡量選擇出土于同一個坑、拼接可能性大的甲骨碎片數(shù)據(jù)集運行程序,這樣可以增加正確拼接的概率。
(2)自身學習和經(jīng)驗積累
以旅順博物館所藏甲骨為例說明:建立已拼接甲骨數(shù)據(jù)或者圖像集,即可避免拼接了已拼接的甲骨,又可在建立拼接數(shù)據(jù)集的同時積累甲骨拼接的經(jīng)驗,還可以用已拼接數(shù)據(jù)集檢驗程序的有效性穩(wěn)定性;將甲骨著錄的圖像以統(tǒng)一的標準剪切成單個甲骨碎片圖像,以統(tǒng)一甲骨碎片圖像的比例空間,使獲取甲骨邊緣信息更加準確有效;出土后斷裂甲骨碎片的斷口是新的、無泥土的,往往可以找到匹配的甲骨碎片;如果甲骨碎片中有殘字可以拼接,一般都能拼接正確。
(3)驗證方法的多樣化
一般可以采用多種方法相互驗證拼接組合的正確性。如甲骨碎片正反面圖像拼接驗證,甲骨碎片拓片圖像拼接驗證和摹本圖像拼接驗證,結合甲骨學的殘字、文例、兆序、鉆鑿、紋理等信息進行拼接正確性驗證,多種方法“全無抵牾,方可以綴合,孤立應用,難免不出錯誤”;也可參考甲骨學專家的意見,判斷拼接組合是否正確;最后,若是無法根據(jù)信息判斷,則進行甲骨碎片實物拼接驗證,這是最直接有效的方法。
2.計算機拼接甲骨的特點
(1)計算機拼接甲骨碎片圖像邊緣沒有規(guī)律可循。甲骨一般在鉆鑿、卜兆、齒紋處容易斷裂,但是斷痕的邊緣并無規(guī)律,計算機可以找到這種沒有規(guī)律的邊緣信息進行匹配。
(2)拼接甲骨文語句則有規(guī)律。甲骨文語句拼接,可根據(jù)殘字、上下文銜接、同文卜辭和正反對貞等方法進行軟件設計,這種方法是根據(jù)已有甲骨文語句尋找可拼接語句,是有規(guī)律的??梢愿鶕?jù)這種規(guī)律讓計算機尋找甲骨碎片圖像邊緣。
(3)綜合各種信息拼接甲骨。可以將甲骨碎片正反面的彩色圖像、拓片圖像和摹本圖像,以及甲骨文語句字體和分類分期等信息進行特征融合,開發(fā)計算機程序,使其綜合各種信息自動地搜索甲骨融合數(shù)據(jù)庫,找到可拼接的甲骨碎片。
4. 計算機拼接甲骨對細微信息敏感。對于人工拼接甲骨,可能忽略甲骨碎片上的某些細微信息。而利用計算機視覺技術可以將甲骨碎片圖像進行放大、旋轉、平移等處理,自然語言處理技術也可以對甲骨文語法字詞進行建模,用于搜索人工容易忽略的甲骨信息,對甲骨碎片綴合有重要的參考意義。
1.計算機拼接甲骨的重要性
(1)發(fā)現(xiàn)新的文例或文例組合
由于甲骨脆弱易碎,加以鉆鑿燋灼,又經(jīng)歷三千多年的歲月,所以在出土時多已裂成碎片,只有盡可能地將這些碎片拼接在一起,才能更好的了解其文例,更全面的研究新的文例或文例組合。專家依靠固有的甲骨文文例和甲骨碎片紋理的拼接經(jīng)驗,往往不容易發(fā)現(xiàn)可拼接信息和新文例。
(2)拼接無字的甲骨碎片
在甲骨拼接過程中,會存在很多無字甲骨的碎片,人工拼接要耗費大量的時間和精力,而通過計算機,依據(jù)甲骨碎片的圖像紋理特征,可以有效的輔助甲骨專家對其進行拼接與研究,提高拼接正確率。
(3)拼接甲骨專家所忽略的細微信息
有些細微之處是甲骨專家注意不到的,容易被忽略,計算機拼接過程可以很好地改善這方面的不足,加快修復甲骨碎片文物,加大綴合力度。
2.重要拼接成果
本文作者使用計算機輔助拼接技術,已經(jīng)成功綴合了屬于新發(fā)現(xiàn)、可綴合、被專家認可的甲骨碎片30余組,現(xiàn)給出4組具有重要內(nèi)容和研究價值的綴合成果。
第1組 北珍435+北珍438
如圖2,原文:
釋文:
圖2 有關日食信息的綴合
第2 組 旅藏1316+旅藏443
如圖3,原文:
釋文:
圖3 罕見辭例的綴合
第3組 旅藏1457 +旅藏1577
如圖4王系卜辭與卜雨同時出現(xiàn),原文:
(4) 貞其雨?
(5) 貞不雨? 二
釋文:
(1)甲子日占卜,□貞問,王舉行賓祭,不會有災咎吧?
(2)貞問,不會有災咎吧?
(3)甲子日占卜,貞問,王向太陽舉行賓祭,不會有災咎吧?
(4)貞問,下雨嗎?
(5)貞問,不下雨嗎?
第4組 俄藏99 +[俄藏15+俄藏16]
如圖5綴合出現(xiàn)王的命令卜辭,原文:
釋文:
隨著計算機技術發(fā)展日臻成熟,計算機技術輔助甲骨碎片拼接也成為研究甲骨文不可避免的發(fā)展趨勢。計算機自動地拼接甲骨碎片圖像,將有效地推進甲骨文研究的進程,擴大甲骨碎片圖像的整體視野,增加甲骨文語句的連續(xù)性、完整性以及可讀性,輔助專家修復甲骨碎片文物、考釋甲骨著錄的字詞含義和研究甲骨文記載的商朝歷史,同時增進甲骨文優(yōu)秀傳統(tǒng)文化的傳承發(fā)揚和挖掘利用。
附圖:
第3組:
圖4 王系卜辭與卜雨同時出現(xiàn)
第4組:
圖5 王命卜辭