亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        甲骨文研究中跨模態(tài)知識圖譜的重要性芻議

        2020-11-16 07:46:04韓勝偉
        殷都學刊 2020年3期
        關鍵詞:綴合甲骨甲骨文

        熊 晶, 韓勝偉

        (1.安陽師范學院 計算機與信息工程學院, 河南 安陽 455000;2.甲骨文信息處理教育部重點實驗室,河南 安陽 455000)

        一、前言

        甲骨文是目前發(fā)現(xiàn)的最早成體系的漢字,是中華民族傳統(tǒng)文化的瑰寶。甲骨文因其記錄了3000年前殷商時期各方面的事件,具有極高的文物價值、史料價值和研究價值[1]。從1899年甲骨文被發(fā)現(xiàn)以來,經(jīng)海內(nèi)外學者近120年前赴后繼的探索,甲骨文的歷史奧秘逐漸揭開,針對甲骨文的研究嶄然成為一門舉世矚目的國際性顯學——甲骨學[1]。甲骨學是以甲骨文和它的載體卜甲、卜骨及相關考古學現(xiàn)象為研究對象,整合古文字學、歷史學、歷史文獻學、文化人類學等多個學科的理論、方法和材料探析甲骨文和甲骨自身規(guī)律及商周歷史文化的專門性學科[2]。但是傳統(tǒng)的甲骨學研究方法存在知識體系龐大、學習難度高、學習周期長、知識關聯(lián)性弱、知識共享程度低等問題[3],若能將海量的甲骨學知識點以語義關聯(lián)方式進行組織和管理,可以有效解決或緩解這些問題。2019年10月18日,“殷契文淵”——甲骨文大數(shù)據(jù)平臺正式發(fā)布,該平臺為甲骨學研究提供大數(shù)據(jù)支持,標志著甲骨學研究進入智能化時代。正如中國社會科學院學部委員、中國社會科學院甲骨學殷商史研究中心主任宋鎮(zhèn)豪先生在紀念甲骨文發(fā)現(xiàn)120周年國際學術研討會學術工作委員會上所說:“新世紀、新機遇,新使命,在甲骨文的整理保護與科學研究方面,應該有新的作為?!币虼耍聲r代的甲骨學研究需要開啟新的研究模式。

        二、人工智能時代的甲骨學研究

        近年來,人工智能技術發(fā)展迅猛,在各行業(yè)都有了成熟的應用或突破性的進展,如人臉識別、語音助手、自動駕駛等??傮w而言,人工智能在感知層面的發(fā)展較好,如人臉識別技術。但是,在認知層面人工智能的發(fā)展相對滯后,如常識理解。其主要原因是目前的人工智能絕大多數(shù)是基于大數(shù)據(jù)、大算力和強算法的,需要大量的人工進行數(shù)據(jù)的標注和處理,呈現(xiàn)“人工有余而智能不足”的現(xiàn)象。而認知層面的人工智能需要計算機具備認知理解和知識推理的能力,需要有深厚的背景知識作為基礎。甲骨學是屬于融合了感知智能和認知智能且認知多于感知的綜合研究,因此勢必需要一個龐大的知識庫作為支撐。知識圖譜[4]就是一個可以提供領域背景知識超大規(guī)模的知識庫,它通過“節(jié)點-邊-節(jié)點”的方式,將知識點進行語義關聯(lián),從而構成一個龐大的知識網(wǎng)絡,可望實現(xiàn)人工智能從感知智能向認知智能邁進。因此,構建甲骨學知識圖譜是一項極其重要的基礎工程,可為甲骨學的知識共享和推理提供基本需求。

        因此,人工智能時代的甲骨學研究需要實行人機結合、分工明確、通力合作、機服務人的策略和部署。即甲骨文專家和計算機各自充分發(fā)揮自身優(yōu)勢,由計算機負責感知層面的圖像識別、信息檢索等有規(guī)律可循、有模式可用的重復性強的工作;由甲骨文專家負責認知層面的知識推理、正誤判斷等無固定模式、需要決策的創(chuàng)造性強的工作。在現(xiàn)階段,總體思路是計算機服務于甲骨文專家,輔助專家進行甲骨學研究。

        隨著甲骨學研究的不斷推進,我們已經(jīng)積累了相當規(guī)模的基礎數(shù)據(jù),包括甲骨學文獻、甲骨文著錄、數(shù)據(jù)庫、文本語料庫、視頻、圖像、3D模型等多種形式,已體現(xiàn)出多模態(tài)特征[3]。因此,我們的目標是基于多源異構數(shù)據(jù)源,構建跨模態(tài)的甲骨學知識圖譜。

        三、構建跨模態(tài)知識圖譜的重要性

        作為一門綜合學科,甲骨學的研究涉及到多領域多來源的知識,且知識存儲格式不統(tǒng)一,知識表示方式各異,涉及到字(甲骨文字形字體)、圖(甲骨文圖片)、文(甲骨文文本)、表(數(shù)據(jù)表格)、著(文獻及著錄)等多種形式。管理、共享和重用這些知識需要一個有效的工具,跨模態(tài)知識圖譜可堪此重任,且在解決甲骨文考釋和綴合兩大難題方面有著重要作用??缒B(tài)知識圖譜示意圖如圖1所示。

        圖1 甲骨學跨模態(tài)知識圖譜示意圖

        1.在知識管理和共享方面的重要性

        甲骨學研究必須依賴大量的文獻資料,并基于文獻進行一系列的知識關聯(lián)分析。如學者與文獻的關系、學者及其合作關系、研究機構及其合作關系、文獻之間引用與被引關系。而且,甲骨學的研究必須借助于相關的輔助學科。如借助于考古學,去解決甲骨出土的問題;借助于文獻學,去解決甲骨學中的殷商歷史問題;借助于語言學理論,去解決甲骨學的語言文字的問題;借助于自然科學中的天文學、地理學、物理學和數(shù)學,去解決甲骨學中的諸方面的問題[5]。這些問題都涉及到文獻的計量與分析技術,因此構建甲骨學文獻圖譜極其重要。

        甲骨文信息處理為改善傳統(tǒng)的甲骨學研究開拓了一條新的有效途徑。經(jīng)過20年的甲骨文信息處理的研究積累,我們設計和構建了一系列甲骨文數(shù)據(jù)庫,如甲骨文語義詞典、甲骨文著錄數(shù)據(jù)庫、甲骨文文獻數(shù)據(jù)庫、甲骨文綴合數(shù)據(jù)庫等。這些數(shù)據(jù)庫符合一定的模式,存儲的是知識元組,是從海量的甲骨文知識數(shù)據(jù)源中提煉出結果,是知識在一定程度的整理和總結。因此,建設甲骨文數(shù)據(jù)庫有著重要作用。

        利用計算機進行甲骨文研究,需要考慮甲骨文的語法結構、句法結構以及語義信息,因此甲骨文的文本整理成為一項基礎工作。甲骨文文本既包括甲骨文釋文,也包括甲骨文文獻及著錄的文本化,還包括涉及甲骨文研究的網(wǎng)頁、教材、評論等信息?;诩坠俏奈谋荆ㄟ^構建語言模型,可以進行文本挖掘、實體識別、關系抽取、語義相似度計算等機器學習和自然語言處理等自動化工作。因此,構建甲骨文文本語料庫具有重要作用。

        甲骨文研究的對象包括甲骨照片、拓片、摹本等圖像,如何從這些圖像中自動檢測和識別出甲骨文字,是甲骨文信息處理研究的重要任務。與其他自然場景的圖像處理不一樣的是,甲骨圖像含有更為特殊的噪聲,而且對拓片圖像進行處理時,往往會將甲骨上的生物紋理識別為文字筆畫。甲骨片的殘缺以及甲骨上的殘字模糊字給甲骨文字的檢測與識別帶來極大的挑戰(zhàn),往往需要綜合考慮和對照甲骨照片、拓片、摹本以及釋文等信息。因此,構建甲骨文圖像資源庫是極其重要的。

        甲骨學體系龐大,知識點眾多,知識表示及存儲格式不統(tǒng)一,而且甲骨文專家對甲骨文的辨識依靠長期的學術鉆研和經(jīng)驗積累,這種經(jīng)驗知識僅存儲在專家的頭腦中,并不能實現(xiàn)知識的有效共享。如何利用一種有效的技術實現(xiàn)現(xiàn)有甲骨文知識的共享,并方便計算機對其進行理解和處理?本體作為共享概念模型的明確的形式化規(guī)范說明[6]可以為這一問題提供解決方案。甲骨文信息處理研究中,為了給甲骨文基礎數(shù)據(jù)提供語義信息,需要采取一種機器可讀的表達形式。構建甲骨文本體可以為甲骨文數(shù)據(jù)提供語義表達及知識推理功能,因此,對甲骨文知識的共享、重用和推理具有極其重要的作用。

        綜上所述,管理和共享甲骨學知識需要整合各種數(shù)據(jù)資源,并從這些多源異構的數(shù)據(jù)中抽取知識實體,并挖掘和構建實體之間的語義關聯(lián),這樣就構建了一個大規(guī)模的跨模態(tài)知識圖譜。具體的構建流程如圖2所示。

        圖2 甲骨學跨模態(tài)知識圖譜的構建流程

        2.在甲骨文考釋方面的重要性

        甲骨文字考釋,是利用其他古文字材料和傳世字書把過去不認識的甲骨文字釋讀出來,從而把不易理解的甲骨卜辭講解清楚,為其他研究做準備。甲骨文考釋的常用方法有“字形比較法”“辭例推勘法”“偏旁分析法”等。

        “字形比較法”一方面要求熟悉每一個甲骨字的筆畫特征,還要深入把握同一個甲骨文字的不同異體,需要明確哪些筆畫區(qū)別字形,哪些筆畫不區(qū)別字形,通用無別;而且還要對甲骨文字的類組差異、異體分工等現(xiàn)象有深入理解,需要全面梳理甲骨用字情況。另一方面,要求把握每一個已識甲骨字的形體演變,總結出基本構字偏旁的歷時演變規(guī)律,因此需要掌握不同時期甲骨字關聯(lián)的其它形體的古文字。

        “辭例推勘法”主要通過不同辭例的互相比較、分析,歸納出甲骨未釋字的語義特征和范圍,鎖定釋讀方向。雖然多數(shù)情況下不能直接得出釋讀結論,但卻是“字形比較法”的重要補充,具有重要的作用。因此,在不能肯定某一未釋甲骨字究竟為何字時,能推測其所屬的語義范疇也是極其重要的。

        “偏旁分析法”是形體分析法的重要組成部分,也是學界常用的考釋文字的手段和方法,它是通過文字構成部件及其組構關系的分析來達到考釋文字的目的。把這種方法提高到一種具有科學意義的研究手段,是從清末孫詒讓開始的。其做法是先把已經(jīng)認識的古文字,按照偏旁分析為一個個單體,然后把各個單體偏旁的不同形式收集起來,研究它們的發(fā)展變化;在認識偏旁的基礎上,最后再來認識每個文字[7]。因此,明確偏旁和文字之間的關聯(lián)和位置關系也是一項重要工作。

        因此,對甲骨文考釋而言,知道哪一個字出現(xiàn)在哪些甲骨片上,知道某個甲骨字的異體字有哪些,知道哪些甲骨片記載于哪些著錄,知道哪些文獻研究過哪些甲骨片是至關重要的。這就勢必要求建立這些知識元素之間的關聯(lián)關系,并能通過關系獲取考釋線索,從而輔助甲骨文專家進行考釋研究??缒B(tài)知識圖譜可以很好地滿足這些要求,一個知識圖譜片段如圖3所示。

        圖3 甲骨字與甲骨片、異體字的關聯(lián)關系

        知識圖譜的另一個優(yōu)勢是鏈接預測和知識圖譜補全,通常知識圖譜補全以鏈接預測的形式來實現(xiàn)。簡言之,在知識圖譜的“節(jié)點(頭實體,可用h表示)-邊(節(jié)點之間的關系,可用r表示)-節(jié)點(尾實體,可用t表示)”結構中,可能會有缺失的元素,知識圖譜補全則是將缺失的元素補充完整。例如,假定有一個鏈接預測任務 (h, r, ?) ,對于一個給定的實體h,和一個給定的關系r,預測的任務就是確定哪個實體或者哪些實體可以形成一個知識三元組 (h, r, t)。利用知識圖譜補全的方法,可以預測甲骨文中殘缺或模糊字語義鏈接,從而為甲骨文專家進行考釋提供有價值的線索。

        綜上所述,跨模態(tài)知識圖譜在甲骨文考釋方面具有重要的作用。

        3.在甲骨文綴合方面的重要性

        通過綴合而得到的甲骨刻辭具有相當高的史料價值??虒懼淖值凝敿撰F骨,有的早在殷代就已斷裂,有的經(jīng)過三千多年地下的埋藏腐蝕,已成碎片殘骨,有的在出土后遭人為的原因而斷缺。把斷片盡可能綴合復原,是甲骨文研究的重要工作之一[8]。甲骨文經(jīng)過綴合復原的處理,才能找出各辭之間的相互關系,恢復當時的卜辭文例,從而成為認識商代社會的重要史料[9]。

        進行甲骨文綴合研究,需要綜合考慮多種數(shù)據(jù)來源和數(shù)據(jù)屬性,如甲骨圖片、甲骨綴合圖版、釋文考釋、綴合人、綴合方法、綴合時間、增量綴合(即在前人綴合成果上增加的綴合新例)情況、著錄、發(fā)表的綴合文章、綴合出處等,還需要考慮片形、文字、卜兆、文例、分期等信息。不同時期的甲骨綴合也采用了不同的方法,如甲骨綴合的初級階段多是傳世著錄拓片碎片的零散片斷的綴合,主要是靠學者的學識和聰慧;發(fā)展與成熟階段,董作賓首倡的甲骨拓片“定位法”研究,不僅對甲骨文例的研究,而且對零碎的甲骨拓本綴合研究也頗有啟示意義,并愈來愈得到1928年科學發(fā)掘殷墟出土甲骨實物的驗證和豐富;“甲骨形態(tài)學”研究的新階段,開始對甲骨文的載體——龜甲和胛骨進行深層次、全方位、多角度的研究。如黃天樹等學者對龜腹甲(包括背甲)和胛骨進行了化整為零的齒縫片形態(tài)和特征的深層次觀察,為甲骨碎片的求其全體的“定位”的“甲骨形態(tài)學”的完善和形成作出了貢獻,推動了甲骨綴合研究的發(fā)展[9]。

        由此可見,從事甲骨綴合研究,需要專家長期的科研積累和對甲骨材料、文獻的敏銳洞察,一點一滴的綴合線索往往隱含在海量的甲骨數(shù)據(jù)和傳世文獻中。而且,綴合過程中往往需要各種數(shù)據(jù)相互印證和信息互補。如較小的拓片無法確定材質時,通??梢杂谜掌?D來補充;候選綴合片組合是否正確時,通常利用釋文進行驗證。這些線索之間往往有著直接和間接的聯(lián)系,一旦找到其關鍵點,就能達到“綱舉目張”的效果。而這些關聯(lián)信息一旦存儲和記錄在跨模態(tài)知識圖譜中,通過節(jié)點路徑查找,可以尋覓“蛛絲馬跡”,從而輔助甲骨文專家進行綴合。

        計算機輔助甲骨綴合研究中,排除不正確的綴合候選項也是一個重要內(nèi)容。一方面,綴合后的甲骨有利于復原甲骨卜辭;另一方面,擬復原的甲骨卜辭也可以印證綴合候選項是否正確。但是,判斷擬綴合的候選甲骨是否正確是一項高要求高標準的工作,完全依賴甲骨文專家仍然無法擺脫現(xiàn)有的研究困境。而知識圖譜可在這一方面“助一臂之力”。基于知識圖譜進行查詢和推理,利用一致性檢驗、異常點分析、團組挖掘,可以發(fā)現(xiàn)潛在風險。正因為如此,知識圖譜在金融反欺詐場景中有著廣泛應用。同樣,這一優(yōu)勢可以遷移到甲骨綴合研究,通過發(fā)現(xiàn)“綴合異?!睘榧坠俏膶<姨峁┡袛嗑€索。

        綜上所述,跨模態(tài)知識圖譜在甲骨文綴合研究方面有著重要作用。

        四、 總結

        大數(shù)據(jù)時代,一個場景中缺失的信息往往在另一個場景中重復出現(xiàn),各種信息重疊和復現(xiàn),很容易就能實現(xiàn)“用戶畫像”,甲骨文信息處理的研究也是如此?;诩坠俏幕A研究數(shù)據(jù)的多模態(tài)特性,通過構建大規(guī)??缒B(tài)的甲骨學知識圖譜,將知識實體的屬性及關系進行知識表示和存儲,就能實現(xiàn)“甲骨畫像”。借助甲骨學知識圖譜,利用人工智能技術可以有效緩解或解決目前甲骨學研究中知識表示、管理、共享及重用等諸方面的問題,從而服務于甲骨文專家從事考釋及綴合方面的研究。

        猜你喜歡
        綴合甲骨甲骨文
        旅順博物館藏吐魯番蒙書敘錄與綴合
        尋根(2022年2期)2022-04-17 11:01:38
        字溯甲骨?文承龍韻
        說甲骨新綴所見的“南孟”與“奠子方”
        甲骨釋字四則
        甲骨文“禍”字新證
        三千年甲骨文
        遵義(2017年24期)2017-12-22 06:10:48
        最“萌”甲骨文——心
        敦煌本《大方等大集經(jīng)》殘卷綴合研究
        敦煌佛經(jīng)殘卷綴合釋例
        敦煌疑偽經(jīng)三種殘卷綴合研究
        国产精品一区二区暴白浆| 国产自拍视频在线观看网站| 日本一级特黄aa大片| 无码va在线观看| 亚洲精品老司机在线观看| 97人妻无码免费专区| av中文字幕一区人妻| 五月色丁香婷婷网蜜臀av| 国产又色又爽又高潮免费视频麻豆 | 青青草在线这里只有精品| 亚洲av无码成人网站在线观看| 无码国产午夜福利片在线观看| 999国产精品亚洲77777| 精品日韩欧美| 久久91精品国产91久| 亚洲精品99久91在线| 麻豆国产精品一区二区三区| 久久精品国产亚洲av四叶草| 日韩av无码精品一二三区| 精品乱码一区二区三区四区| 在线毛片一区二区不卡视频| 字幕网中文字幕精品一区| av在线观看一区二区三区| 无码国产精品一区二区免费模式| 久久综合第一页无码| 婷婷开心五月综合基地| 丰满少妇在线播放bd| 久久久亚洲av成人网站| 日韩亚洲中字无码一区二区三区| 美女叉开双腿让男人插| 日本熟妇中出高潮视频| 国产乱子伦| 亚洲综合色一区二区三区小说| 中文字幕一区二区网站| 日本老熟妇五十路一区二区三区| 丰满少妇被猛烈进入高清播放| 国产免费无码一区二区三区| 免费在线日韩| 91精品国产自拍视频| 狠狠人妻久久久久久综合蜜桃| 亚洲av无码一区二区三区在线|