亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        字書字料庫異體關系拓撲圖的設計與實現(xiàn)

        2022-06-18 02:45:14柳建鈺
        關鍵詞:拓撲圖字書異體字

        柳建鈺,秦 冕

        (渤海大學 文學院,遼寧 錦州 121013)

        字料庫(Chinese Character Form Database)是指以文字的整理和文字學的研究為目標,按照語言學和文字學的原則,收集實際使用中能夠代表特定文字或文字變體的真實出現(xiàn)過的文字書寫形態(tài),運用計算機技術建成的具有一定規(guī)模的大型電子文字資源庫[1]。字料庫的出現(xiàn)為新時代的漢字學研究提供了嶄新的研究方法與手段。字料庫不僅可以存儲和加工海量字料數(shù)據(jù),而且可以在此基礎上為漢字字際關系研究提供強有力的平臺與數(shù)據(jù)支撐,是當前漢字字際關系研究不可或缺的有力工具。

        異體關系是漢字字際關系典型類型之一,也是目前所有字際關系中最受學者關注、研究難度相當大的一種類型。在建設字書字料庫的過程中,我們對學界漢字異體關系研究的理論與實踐進行了深入考察,并對字料庫異體關系標注問題進行了充分探討[2]。隨著研究的不斷深入,我們對字料庫異體關系整理的相關問題有了新的思考。比如對于異體關系層級系統(tǒng)的標注與圖形化展示就是當前一個非常值得關注的問題。李國英先生根據(jù)異體字形成的方式,將異體字分為異構字和異寫字兩種類型,并認為整理異體字最好把異構、異寫的層級關系描寫清楚,排比出譜系[3]。周曉文等學者從漢字字形整理的角度將字形分為字種、字式、字樣三級單位,通過選取字種代表字串聯(lián)起整個異體關系層級系統(tǒng),其中代表字下一級為字式組(異構關系),字式組下一級為字樣組(異寫關系),由此將一組異體字分成三個層級[4]。郭敬燕在此基礎上在代表字下又分出一級異體字、二級異體字等層級,其中一級異體字只有異構字,二級(或以上)異體字主要為異寫字[5]。孫建偉認為區(qū)分異寫字、異構字的核心標準為構形理據(jù),由此他進一步指出,異寫字包括筆畫層面的異體字和靜態(tài)的構件層面的異體字兩類,異構字指動態(tài)的構件層面的異體字。同時,他對古文隸定字與傳承字、手寫變異字與傳承字、避諱字與傳承字、訛字與正字、造意本不同但在使用中功能重合之字的異寫、異構關系進行了討論[6]。邱龍升認為同一異體字組的異體字產(chǎn)生有先有后,應該從異體字的動態(tài)演變順序來構建異體關系層級系統(tǒng)。他認為異體字主要有三級,每一層級與本字之間的關系逐漸疏遠[7]。這些學者的研究成果為我們進一步研究該問題打下了堅實基礎。

        本文將以渤海大學CCFD 字書字料庫異體關系的標注為研究對象,介紹字料庫異體關系界面現(xiàn)有標注系統(tǒng),總結其優(yōu)點與不足。在此基礎上,提出增加“異體關系拓撲圖”界面的優(yōu)化意見,并詳細闡述這一界面所包含的主要內(nèi)容、標注流程、標注示例以及應用價值等相關問題。

        一 字書字料庫現(xiàn)有異體關系標注系統(tǒng)概說

        本部分主要介紹字書字料庫現(xiàn)有異體關系標注系統(tǒng),包括九個基本字段以及三大標注層次,并歸納現(xiàn)有系統(tǒng)的優(yōu)點與不足。

        (一)現(xiàn)有異體關系標注系統(tǒng)簡介

        渤海大學CCFD 字書字料庫是國內(nèi)首個字書字料庫系統(tǒng),它以歷代字書中真實出現(xiàn)過的字料為收錄對象,對字料進行了包括字頭基本信息、字頭構形信息和字際關系信息在內(nèi)的全方位標注。目前,字書字料庫已收錄歷代字書近70 部,標注完成的字料信息達200 多萬條。字書字料庫將所需標注的漢字基本屬性如“字體類別”“構形模式”“筆畫數(shù)”“構件組合類型”等都設計成字段存放于不同的界面之中。現(xiàn)有異體關系界面標注系統(tǒng)所設計的基本屬性字段如圖1 所示。

        圖1 字書字料庫現(xiàn)有異體關系標注界面

        具體來說,包括字頭列表、異體字頭、狹義或部分、異體產(chǎn)生原因、異體產(chǎn)生途徑、異體關系大類、異體關系中類、異體關系小類、相關參證文獻等九種?;緲俗⒖蚣芸煞譃槿齻€層次,每個層次之間相對獨立,可以相互組配,以求最大限度地標注出每個異體字的區(qū)別性特征。

        第一層次:將異體字分為“狹義異體字”與“部分異體字”。這組名稱來源于裘錫圭先生,他將用法(音義)完全相同的字稱為狹義異體字,將用法(音義)部分相同的字稱為部分異體字,兩者合在一起稱為廣義異體字[8]。設計這一字段的主要原因在于要兼顧漢字整理層面與學術研究層面兩方面的需要。

        第二層次:根據(jù)異體字的產(chǎn)生原因及途徑對異體字進行劃分,“漢字系統(tǒng)自身原因”下對應“造字方法不同”“字體演變”“使用流通”“其他原因”四種途徑;“漢字系統(tǒng)外因”下對應“歷史原因”“地域原因”“社會政治原因”“其他原因”四種途徑(本部分主要參考了章瓊先生《現(xiàn)代漢語通用字對應異體字整理》的研究成果)[9]。

        第三層次:根據(jù)漢字構形學理論進行劃分,首先將異體關系分為“異寫字”“異構字”“復生異體字”三大類?!爱悩嬜帧毕驴煞譃椤皹嬓畏绞较嗤迸c“構形方式不同”兩個中類?!爱悓懽帧毕驴煞譃椤肮P畫異寫字”與“構件異寫字”兩個中類?!皬蜕愺w字”下可分為“兩種以上異寫”與“異構且異寫”兩個中類。六個中類下又進一步作了切分,共分為47 個小類。大類、中類與小類之間可以在程序內(nèi)實現(xiàn)關聯(lián)互動。

        (二)現(xiàn)有異體關系標注系統(tǒng)的優(yōu)點與不足

        字書字料庫現(xiàn)有異體關系標注系統(tǒng)從三個層次六個小類對異體關系進行了全面分析,其優(yōu)點在于:首先,將狹義異體字與部分異體字共同收錄,再以字段屬性選項的形式予以區(qū)分,有利于兼顧漢字整理層面與學術研究層面的不同需求;其次,從異體字產(chǎn)生的原因以及途徑對異體字進行梳理,拓寬了異體關系分類與研究的視野,有助于從動態(tài)角度把握和研究異體關系;最后,對異寫字與異構字進行了細致區(qū)分,盡可能全面地展現(xiàn)異寫字與異構字內(nèi)部的細微差別。三個層次從不同角度對異體關系進行了劃分與整理,從而形成了一個多元立體的異體關系標注系統(tǒng)。

        但現(xiàn)有標注系統(tǒng)也存在不足。首先,現(xiàn)有標注系統(tǒng)將異寫與異構所判定的對象分為兩類,一是字種正字,一是其他異體字。系統(tǒng)將所有異體字置于同一層面上進行異寫、異構的判定。然而異寫與異構并非位于同一層次,每一個異構字都可能產(chǎn)生異寫字,異寫字處于異構字的下位次[10]。若是將一組異體關系中的每一個異寫字與異構字都直接同字種正字進行異體關系對比歸類,勢必會引發(fā)斷鏈甚至判斷失誤的問題。如:“流”與“”,《漢語大字典》(第二版)中溝通了二者的異體關系,可他們在字形上相去較遠,溝通起來比較困難。實際上,“流——”三字本是因簡省筆畫和形體混同而產(chǎn)生的一組異寫字,“流”字異寫為“”,之后“流”又異寫作“”(詳見下文)。若忽視這一演變過程中的關鍵鏈條而直接溝通“流”與“”的異體關系,便會引發(fā)無法溝通或牽強附會的問題。

        不僅如此,異體關系還存在層級系統(tǒng)性,即父級與子級的關系,一組異體字中任意一個成員都有可能產(chǎn)生其異寫或異構形體,此時這一成員相對于由它產(chǎn)生的異寫或異構形體來說屬于父級字,而由它產(chǎn)生的異體字屬于子級字,如此層層推衍開來,便構成了異體關系的層級系統(tǒng)。描寫和展示異體關系的層級系統(tǒng)有助于理清異體字組諸多字形的衍生順序,對包括異體關系認同、字位主形的確定、字種正字的優(yōu)選等在內(nèi)的異體字整理工作具有重要價值。但這一層級系統(tǒng)在字書字料庫異體關系現(xiàn)有標注系統(tǒng)中尚無法得到體現(xiàn)。

        鑒于此,對異體關系屬性庫現(xiàn)有標注字段進行優(yōu)化補充就顯得非常必要,而要將異體關系的層級系統(tǒng)信息體現(xiàn)在現(xiàn)有異體關系屬性庫中,需要借助異體關系拓撲圖來實現(xiàn)。

        二 異體關系拓撲圖的主要價值

        拓撲圖是從拓撲學引用的名稱,又稱拓撲結構圖,它由多個節(jié)點和鏈路構成網(wǎng)絡結構,是一種能夠以簡單化和規(guī)則化的圖形來傳遞信息的量化圖,也是當前大數(shù)據(jù)可視化技術采用的主要有效表現(xiàn)形式之一。所謂異體關系拓撲圖,就是以拓撲圖的形式來展現(xiàn)異體關系的層級系統(tǒng)信息。在字書字料庫框架內(nèi)設計并實現(xiàn)異體關系拓撲圖具有多方面的重要價值。

        首先,異體關系拓撲圖可以清晰直觀地展現(xiàn)異體字組內(nèi)諸成員的父子、兄弟關系以及他們的動態(tài)衍生過程。只要理清了衍生過程,不論是位于哪一層級的異體成員,都能做到“身世清晰”。異體字的產(chǎn)生有一個積少成多的過程,一組異體字中,哪一個字是字種正字,哪一個(或幾個)字是由字種正字演變而來的二級字,哪一個(或幾個)字是由二級字演變而來的三級字……弄清楚這些問題,對于異體字整理工作至關重要。借助異體關系拓撲圖來實現(xiàn)對異體字的分級整理,就可以使一組異體字的動態(tài)衍生過程清晰、簡潔地展示出來。

        其次,異體關系拓撲圖可以將異寫與異構之間的復雜關系清晰地展現(xiàn)出來。一般來說,異寫是異構的下位層次,異寫字是異構字形體書寫變異而形成的。但實際上,每一個異構字或者異寫字都有可能產(chǎn)生新的異寫與異構形體,異寫與異構的層級關系并不像我們想象的那樣簡單。通過異體關系拓撲圖,我們可以將復雜的異寫、異構關系清晰化,有利于進一步總結異寫字、異構字產(chǎn)生與發(fā)展的具體規(guī)律。

        再次,異體關系拓撲圖可以與字書字料庫現(xiàn)有的異體關系標注系統(tǒng)互為補充。字書字料庫現(xiàn)有異體關系標注系統(tǒng)重在分析異體字的產(chǎn)生原因、產(chǎn)生途徑以及異寫與異構及其小類。而異體關系拓撲圖重在展現(xiàn)異體關系內(nèi)部的層級系統(tǒng)以及一組異體字的動態(tài)演變過程,二者相互補充、互為表里,不僅能夠最大限度地將一組異體字所涉及的各種現(xiàn)象分析清楚,而且能夠同時滿足學術研究層面與漢字整理層面的雙重需求,進一步擴大字書字料庫異體關系界面的服務范圍[11]。

        三 字書字料庫異體關系拓撲圖的設計

        前文說過,異體關系拓撲圖是以拓撲圖的形式來展現(xiàn)異體關系的層級系統(tǒng)信息。要實現(xiàn)如上功能,可以將“異體關系拓撲圖”設計為一個獨立界面補充在字書字料庫現(xiàn)有異體關系標注系統(tǒng)中,標注完異體關系相關屬性后,就可以在拓撲圖界面顯示出異體關系的層級系統(tǒng)信息。下面,本文將依次對異體關系拓撲圖界面設計過程中涉及的層級單位、標注原則、所含字段、異體關系標注流程以及注意事項等五個方面的問題進行探討。

        (一)層級單位

        構建異體關系層級系統(tǒng)的前提是要確定漢字的層級單位。王寧先生將漢字分為三個層面。(1)字樣。在同一形制下,記錄同一個詞,構形、構意相同、寫法也相同的字稱為一個字樣。字樣是認同別異的基礎單位。(2)字位。在同一體制下,記錄同一個詞,構形、構意相同,僅僅是寫法不同的字樣,稱作異寫字。異寫字認同后歸納到一起,稱為一個字位。(3)字種。形體結構不同而音義都相同、記錄同一個詞、在任何環(huán)境下都可以互相置換的字,稱作異構字。異構字聚合在一起,稱為一個字種[12]。本文采取王寧先生的單位名稱與內(nèi)涵,以字樣、字位、字種三級單位來指稱異體關系內(nèi)部的層級關系。層級單位確定之后,便可以選取代表字了。異體關系中的代表字分別為字位主形與字種正字。字位主形是一組異寫字中的代表字形。一般來說,一組異寫字中,有一個字樣為本字,其他字樣均為本字的書寫變體,選定字位主形時,優(yōu)先選取這一字樣。字種正字是一組異構字中的代表字。字種正字往往優(yōu)先選取現(xiàn)代漢語通用字字形,有時這些字形并非本字,也并非構形理據(jù)最完整的字,但是它在使用中流通度最高,具有代表意義以及辨識度。由此異體關系層級系統(tǒng)便可以建立起來了。

        (二)標注原則

        1.開放性原則

        一組異體字其內(nèi)部成員的數(shù)量往往是不固定的,它會受到所選取字書不同、采集標準或手段不同、支撐材料的多寡等多種因素的影響。以“流”字為例,《漢語大字典》(第二版)中收錄“流”的異體字為9 個,而臺灣《異體字字典》(第六版)中收錄“流”的異體字有21 個,多出來的大都是異寫字形。收字數(shù)量的不固定直接導致了拓撲圖層級數(shù)的不固定。字書字料庫目前所收異體字以《漢語大字典》(第二版)為字料基礎,隨著入庫字書字料的不斷增加以及學界研究成果的不斷豐富,字料庫所收異體字的數(shù)量也會不斷增加。因此,異體關系拓撲圖標注必須遵循開放性原則,要隨時準備迎接更多異體成員的加入。

        2.共時性與歷時性相統(tǒng)一原則

        雖說異體關系的判定要在共時層面或同一形制下進行,但這并不妨礙我們從歷時的角度來考察異體關系的動態(tài)演變過程。共時層面上的異體字隨著時間的累積,有一部分會徹底“消亡”不再使用;有一部分功能發(fā)生變化,異體特征消失;有一部分固定下來,進入新的形制并一直保持其原有的異體關系;還有一部分是由原有字形產(chǎn)生的字形變體,這些字形變體經(jīng)過使用流通后固定下來,源源不斷地進入原有的異體關系中,歷代字書收字數(shù)目的不斷增加很大一部分是這些新增異體字的“貢獻”。因此,我們現(xiàn)在所看到的楷書層面上的異體字,其內(nèi)部實際上是具有動態(tài)層級系統(tǒng)的,層級之間具有父子關系。子級字由父級字產(chǎn)生,同時又可以作為父級字產(chǎn)生新的子級字。異體關系拓撲圖既要在同一形制上溝通一組字的異體關系,同時又要通過層級關系來展現(xiàn)一組異體字的動態(tài)演變過程,要滿足共時性與歷時性相統(tǒng)一原則。

        3.異寫關系與異構關系區(qū)分原則

        異寫本是異構的下位層次,異體關系拓撲圖的建立正是為了清晰地展現(xiàn)一組異體字中異寫與異構的層級關系,因此必須將異寫與異構進行明確區(qū)分。但若想僅通過層級來表現(xiàn)異寫與異構的區(qū)別是不現(xiàn)實的,因為異寫與異構并非絕對地分層而立。同一字樣,既可以存在其異寫字,同時又可以存在其異構字。例如通過調(diào)查字書字料庫可知,“哲”字既有兩個異構形體“悊”“嚞”,又存在“埑”“?!薄啊薄啊彼膫€異寫形體,它們均與“哲”字直接相關,因此都應位于“哲”的下一級。此時層級已經(jīng)不能區(qū)分異寫與異構了,因此我們采取不同形式的連接線來區(qū)分異寫與異構,異構字我們以粗線來連接,異寫字以細線來連接,如此一來,便能清晰地顯現(xiàn)同一層級中哪些字是異寫字,哪些字是異構字。

        4.狹義異體字與部分異體字兼收原則

        學界對于異體字的界定存在廣狹之分。從功能上說,音義全同的異體字為狹義異體字,音義部分相同的異體字為部分異體字,二者合在一起稱為廣義異體字。《漢語大字典》(第二版)、《通用規(guī)范漢字表》等權威性字書、字表均將狹義異體字與部分異體字共同收錄。這是因為二者能夠在不同層面上發(fā)揮作用。狹義異體字整理主要在學術層面發(fā)揮作用,廣義異體字整理主要在應用層面發(fā)揮作用。一旦把部分異體字納入異體字的整理范疇,許多音義部分相同的字形將會被取消,但實際上這些字形的記詞職能并沒有完全被保留下來的字取代[13],這就會影響表達的準確性,造成學術研究上的不便。漢字整理的任務是要告訴人們使用漢字時要用哪個字形或者不用哪個字形,將部分異體字作為整理對象是具有合理性的。異體關系拓撲圖的建立既要滿足學術研究的需要,又要在漢字整理層面發(fā)揮作用,因此必須將狹義異體字與部分異體字共同納入拓撲圖當中。

        雖然要將狹義異體字與部分異體字共同納入拓撲圖中以便研究,但也不能將二者混淆,否則會造成使用者的混亂。為了在拓撲圖中將二者清晰地區(qū)分開來,我們采取了不同的標注方式,狹義異體字用藍色線條連接,部分異體字用紅色線條連接。

        (三)所含字段

        字書字料庫異體關系拓撲圖界面除了拓撲圖圖形本身,還應包括“異體字頭”“狹義或部分”“異寫或異構”“所屬層級”“父級異體”“子級異體”六個基本字段。每一組異體字的異體關系拓撲圖,都是在這六個基本字段的標注過程中形成的。其基本界面如圖2 所示。

        圖2 異體關系拓撲圖界面

        1.異體字頭

        此字段下設選項與字書字料庫現(xiàn)有異體關系界面的“異體字頭”字段下設選項保持一致,隨著異體關系界面“異體字頭”的變化而變化。設置此字段的意義在于存放異體字頭,用于拓撲圖的點選標注。

        2.狹義或部分

        此字段下設選項與字料庫現(xiàn)有異體關系界面的“異體字頭”字段下設選項保持一致,用于區(qū)分狹義異體字與部分異體字。這一字段的標注結果直接反映在拓撲圖中所標注異體字的連接線顏色上,此字段選擇狹義異體字,拓撲圖中的異體字連接線顏色為藍色;選擇部分異體字,拓撲圖當中的異體字連接線顏色為紅色。

        3.異寫或異構

        這一字段用于標注異體字的類別,某一異體字究竟屬于異寫字還是異構字是異體關系拓撲圖標注的關鍵屬性,也是標注難度最大的屬性。對于這一屬性的判定要參考字料庫異體關系界面現(xiàn)有的標注成果以及其他參證文獻,且判定結果需要經(jīng)過專業(yè)人員校驗審查。這一字段的標注結果直接反映在拓撲圖中所標注異體字的連接線上,此字段選擇異寫,連接線為細線,此字段選擇異構,連接線為粗線。

        4.所屬層級

        雖然異體關系層級單位只有字種、字位、字樣三級,但異體關系層級系統(tǒng)可以是多層的,層級數(shù)根據(jù)異體關系的復雜程度而定,因此這一字段下雖然設置了“一級”“二級”“三級”等選項,但級數(shù)可以自由增加,以保證層級系統(tǒng)的開放性與包容性。此字段與拓撲圖自動關聯(lián),標注者通過為異體字頭中的某一異體字標注層級數(shù),來固定這一異體字在拓撲圖中的位置;而用戶可通過點擊拓撲圖當中的某一異體字,來觀察這一異體字在此字段中顯示的層級數(shù)。其中一級為字種正字,照此順序向下排列字級。

        5.父級異體

        此字段包含的選項與異體字頭內(nèi)選項保持一致,可通過點選來標注某一異體字在拓撲圖中的父級字也就是其來源字或上位字。通過這一字段可以展現(xiàn)某個異體字的來源。異體字的父級字只能有一個。

        6.子級異體

        此字段包含的選項與異體字頭內(nèi)選項保持一致,可通過點選來標注某一異體字在拓撲圖當中的子級字(也就是變形字或下位字)。要注意的是,一個異體字只能有一個父級字,但可以有一個或多個子級字,故而此字段是多項選擇字段,可以同時選擇一個或多個異體字頭。

        (四)代表字的選取

        前文提到,在異體關系拓撲圖當中字位主形與字種正字發(fā)揮著系聯(lián)與統(tǒng)領整個系統(tǒng)的重要作用,因此必須要按照一定的原則選取代表字。字位主形是一組異寫字中的代表字形;字種正字即一組異構字中的代表字形。選取代表字是為了將字位與字種內(nèi)的不同形體串聯(lián)起來,使其層級關系清晰明確。

        首先,代表字的選取因目的和適用范圍的不同而不同。例如用于中國大陸地區(qū)現(xiàn)代社會用字規(guī)范的異體字整理,其代表字應該優(yōu)先選取規(guī)范的簡化字;而用于中國臺灣地區(qū)社會用字規(guī)范的異體字整理,其代表字就應該優(yōu)先選取臺灣地區(qū)社會所通用的規(guī)范繁體字。其次,代表字的選取必須堅持一致性原則,要用新字形作代表字,層級系統(tǒng)內(nèi)的所有代表字都應選取新字形。要用舊字形作代表字,那么層級系統(tǒng)內(nèi)的所有代表字都應選取舊字形[14]。再次,代表字必須具有值得被優(yōu)先選取的特性。王寧先生提出了字形優(yōu)選的五項標準:“1.有利于形成和保持嚴密的文字系統(tǒng)。2.盡量保持和維護漢字的表意示源功能。3.最大限度地減少筆畫。4.字符之間有足夠的區(qū)別度。5.盡可能估計字符的社會流通度?!保?5]根據(jù)這五條標準并結合異體字整理與標注的實際情況,我們認為,在選取字位主形與字種正字時,應該優(yōu)先選取社會流通度高且具有辨識度與代表性的字形(這項工作需要首先建立基于大規(guī)模古今真實文本的漢字字料庫,在此基礎上生成古今文本用字字頻統(tǒng)計數(shù)據(jù),從而確定字符的社會流通度);在流通度差距較小的情況下,應該優(yōu)先選取構形理據(jù)更為完整的字形。

        (五)異體關系標注流程

        異體關系拓撲圖對異體關系的標注流程為:首先,進入字書字料庫異體關系界面點擊拓撲圖按鈕,進入當前字頭的拓撲圖標注界面,此時字種正字已經(jīng)位于拓撲圖中一級字的位置上了;其次,將界面現(xiàn)有標注系統(tǒng)內(nèi)的字段與拓撲圖內(nèi)的字段進行系聯(lián)對接,即將現(xiàn)有系統(tǒng)內(nèi)“異體字頭”字段中的內(nèi)容對接到拓撲圖中“異體字頭”“父級異體”“子級異體”三個字段當中,將現(xiàn)有標注系統(tǒng)“狹義或部分”字段中的內(nèi)容對接到拓撲圖中“狹義或部分”字段,完成標注前的準備工作;再次,由專業(yè)人員對當前字頭的異寫異構、層級數(shù)、父級異體、子級異體等屬性進行標注。隨著標注工作的進行,異體關系拓撲圖也會隨之建立。等標注工作完成,異體關系拓撲圖也建立完畢。最后,對照拓撲圖的演示圖示對異體層級系統(tǒng)標注內(nèi)容進行校驗審核,若有錯誤及時改正,若無錯誤,點擊保存。

        需要特別指出的是,拓撲圖當中的每一層級都可能產(chǎn)生不同的“字位主形”或“字種正字”。作為子級字的上層代表字,父級字不是一組異寫字的主形,便是一組異構字的正字。但是如此多的“字位主形”與“字種正字”放在一起勢必會為異體層級系統(tǒng)的梳理與構建帶來不便,而且這些“字位主形”與“字種正字”是同一系統(tǒng)中的不同層級的代表字。為了更好地串聯(lián)一組異體字的所有成員,使其層級關系清晰明確,不論異體關系存在多少層級,一組異體字中的字種正字只指位于一級層次的那個字樣,字位主形指的是優(yōu)選出字種正字的那一組候選字形,其余層次的父級字均用代表字來指稱即可。

        四 拓撲圖系統(tǒng)與字料庫現(xiàn)有異體關系系統(tǒng)的對接

        字料庫中現(xiàn)有異體關系標注系統(tǒng)可以清晰展現(xiàn)異體字的產(chǎn)生原因、產(chǎn)生途徑、異寫或是異構以及異寫與異構的具體類型,但是現(xiàn)有標注系統(tǒng)只能顯示字種正字與其他每個異體字之間的單線聯(lián)系,而不能顯示該組異體字的層級系統(tǒng)信息。如此一來,與字種正字不直接相關的那些異體字的來源、關系以及整個異體字組的演變過程及規(guī)律都無法得到有效體現(xiàn),由此產(chǎn)生了一些標注方面的問題。而異體關系拓撲圖能很好地解決這一問題,通過拓撲圖所展示的層級系統(tǒng),我們可以清晰地看到異體字之間的關系,理清每個異體字的來源及演變過程,異體字組內(nèi)諸成員的發(fā)展脈絡便清晰可見。由此可見,異體關系拓撲圖與字書字料庫現(xiàn)有的異體關系標注系統(tǒng)互為補充,二者結合在一起,不僅能夠把握異體字的整體分類,而且可以理清異體字的內(nèi)部層級系統(tǒng),真正達到科學、系統(tǒng)、大規(guī)模地整理異體字的目標。

        異體關系拓撲系統(tǒng)是在字書字料庫現(xiàn)有異體關系標注系統(tǒng)的基礎上進一步發(fā)展起來的。拓撲系統(tǒng)標注的字料來源以及層級數(shù)、父級子級、異寫異構的判定依據(jù)均以現(xiàn)有系統(tǒng)的標注成果為基礎,這就要求拓撲系統(tǒng)在建設過程中必須要做好與現(xiàn)有系統(tǒng)的對接工作。想要做好這一工作,首先要找出二者的共同點。第一,拓撲系統(tǒng)中的異體字頭、父級異體、子級異體、狹義或部分可以與現(xiàn)有系統(tǒng)的標注成果直接對接。第二,拓撲系統(tǒng)是按照異寫和異構來進行層級劃分的,而現(xiàn)有標注系統(tǒng)已經(jīng)對一組異體字的異寫與異構關系進行了初步整理,雖然只是字種正字與其他字形的直接對比結果,與拓撲系統(tǒng)存在本質(zhì)區(qū)別,但我們?nèi)阅荛g接利用現(xiàn)有標注成果對其內(nèi)在層級關系進行判斷,使拓撲系統(tǒng)的標注工作“有理可依”。因此,在進行異體關系現(xiàn)有系統(tǒng)的標注工作時,要有意識地標注出異體字之間的父子關系,為拓撲系統(tǒng)的標注工作打好基礎。

        五 字書字料庫異體關系拓撲圖標注舉例

        下面以“流”字為例,對字書字料庫異體關系拓撲圖進行標注實驗。

        “流”字在《漢語大字典》(第二版)中的異體字有9 個,分別是“”“”“ ”“”“”“”“”“”“”。下面我們進行逐字分析。

        5.

        同“流”。《玉篇·水部》:“ ,古文流?!保?0]

        圖3 “流”字異體關系拓撲圖

        六 結語

        以上,我們以渤海大學CCFD 字書字料庫異體關系的標注為研究對象,介紹了字料庫異體關系界面現(xiàn)有標注系統(tǒng),總結了其優(yōu)點與不足,又提出了增加“異體關系拓撲圖”界面的優(yōu)化意見,并詳細闡述了這一界面所包含的主要內(nèi)容、標注流程、標注示例、應用價值等相關問題。

        異體關系拓撲圖將異體關系數(shù)據(jù)轉(zhuǎn)化為視覺圖像,能夠幫助我們高效直觀地獲取數(shù)據(jù)中蘊含的異體關系層級信息,使我們有可能更容易發(fā)現(xiàn)數(shù)據(jù)背后隱藏的異體發(fā)生規(guī)律,是當前異體關系整理與展示模式的重要變革,將會成為當前異體關系深入整理的主要研究對象之一。與此同時,字料庫這一數(shù)字化漢字整理新平臺的問世為當前異體關系層級系統(tǒng)的建構提供了海量的字料基礎和強大的技術支持,無疑會將異體字科學化、可視化整理工作推向一個新的高度。希望學界能夠積極關注并投身于基于字料庫的異體關系拓撲研究,共同推進漢字異體整理研究工作的順利深入開展。

        【責任編輯 王 濤】

        猜你喜歡
        拓撲圖字書異體字
        低壓配網(wǎng)拓撲圖自動成圖關鍵技術的研究與設計
        簡單拓撲圖及幾乎交錯鏈環(huán)補中的閉曲面
        異體字字形類似偏旁的互用類型綜合字圖構建
        偏旁省略異體字研究
        基于含圈非連通圖優(yōu)美性的拓撲圖密碼
        大型字書疑難字新考
        常用隸書異體字表(二)
        丹青少年(2017年1期)2018-01-31 02:28:30
        無字書圖書館(節(jié)選)
        《音同》中的異體字與訛體字
        西夏研究(2016年1期)2016-07-19 10:09:11
        雁字書
        精品国产一品二品三品| 18成人片黄网站www| 三上悠亚精品一区二区久久| 精品国产亚洲av麻豆尤物| 不卡免费在线亚洲av| 精品国产一区二区三区2021| 三年片免费观看大全国语| 无遮挡中文毛片免费观看| 亚洲第一页在线观看视频网站| 丰满少妇按摩被扣逼高潮| 伊人久久大香线蕉综合影院首页| 国产黄页网站在线观看免费视频 | 国产一区二区毛片视频| 青青草在线免费视频播放| 精品日产卡一卡二卡国色天香| 国产亚洲一本大道中文在线| 国产精品国产三级厂七| 国产精品视频自拍在线| 99久久精品日本一区二区免费| 精品人妻中文av一区二区三区| 国产精品久久久看三级| 69国产成人精品午夜福中文| 国产香蕉尹人在线观看视频| 久久亚洲日本免费高清一区| 美女丝袜诱惑在线播放蜜桃| 亚洲综合网站久久久| 鲁一鲁一鲁一鲁一澡| 中文字幕亚洲乱亚洲乱妇| 国产日产在线视频一区| 久久中文精品无码中文字幕下载| 久精品国产欧美亚洲色aⅴ大片| av在线资源一区二区| 少妇伦子伦情品无吗| 色婷婷欧美在线播放内射| 色人阁第四色视频合集网| 国产毛女同一区二区三区| 国产成人无码a区在线观看视频 | 亚洲av日韩aⅴ无码电影| 国产免费一区二区三区在线观看 | 精品乱码久久久久久久| 中文字幕亚洲精品第1页|