楊福義
摘 要:雙語平行語料庫的數(shù)據(jù)資源建設(shè)是語言工程的前端。其中包含大量的術(shù)語及語言翻譯知識(shí)。深入研究和開發(fā)雙語語料庫,對(duì)術(shù)語翻譯具有重要意義。文章論述了平行語料庫的深加工流程和中文語料標(biāo)注的自動(dòng)化加工。使用“語法符號(hào)語言”建立文本的語法映像,生成短語組塊庫。按短語結(jié)構(gòu)規(guī)則采用人工智能方法自動(dòng)抽取術(shù)語翻譯組塊,自動(dòng)生成術(shù)語組塊詞典與詞表,列出部分術(shù)語組塊查詢應(yīng)用的實(shí)例和逆向追蹤雙語例句的實(shí)例。
關(guān)鍵詞:計(jì)算術(shù)語學(xué),語料庫,知識(shí)抽取,術(shù)語部件,組塊
中圖分類號(hào):H059;H083;H087文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.3969/j.issn.1673-8578.2018.02.002
Abstract: The construction of data resources of bilingual parallel corpora is the front end of language engineering, and contains a large number of terms and language translation knowledge. Full use of bilingual corpora for further research and development is of great significance to terminology translation. This article discusses the deep processing flow of parallel corpora and automatic processing of Chinese corpus annotation. Using the grammar symbol language, the grammar image of the text is set up, and the phrase chunk library is generated. According to the rules of phrase structure, the term translation chunk is automatically extracted by the method of artificial intelligence, and the lexicon and thesaurus of term chunks are automatically generated. Moreover, some examples of the application of terminology block query and examples of reverse tracing bilingual examples are listed.
Keywords: computational terminology, corpus, knowledge extraction, component, term block
引 言
雙語語料庫,能為英漢翻譯提供海量真實(shí)的參考譯文實(shí)例,從而幫助譯者改進(jìn)譯文質(zhì)量。同時(shí),雙語語料庫中的大量對(duì)應(yīng)文本還有助于進(jìn)一步認(rèn)識(shí)和研究翻譯過程。對(duì)于翻譯實(shí)踐來說,雙語語料庫還可以作為翻譯人員的參考工具,幫助提高翻譯質(zhì)量和效率,在雙語詞典編纂、翻譯教學(xué)、翻譯研究及機(jī)器翻譯中獲得廣泛的應(yīng)用。
本文重點(diǎn)介紹大型雙語平行語料庫采用的語言工程中自動(dòng)化深加工后的語言處理技術(shù),以及采用人工智能方式抽取深加工后的知識(shí)、生產(chǎn)大批量語塊庫并產(chǎn)生專用術(shù)語詞表的過程。批量中文術(shù)語新詞的自動(dòng)發(fā)現(xiàn),對(duì)術(shù)語審定和翻譯工作都有參考價(jià)值。
一 語料庫加工和術(shù)語專用詞表的自動(dòng)生成
(一)語塊抽取的指導(dǎo)思想
天下萬物,語言學(xué)的表示,就是名詞。天下萬事,都是反映萬物在時(shí)間和空間的運(yùn)動(dòng)狀態(tài),語言學(xué)的表示,就是動(dòng)詞。
名詞和動(dòng)詞是描述萬物萬事的基礎(chǔ),而形容詞和副詞分別修飾名詞和動(dòng)詞,反映程度、屬性。從概念本體的角度分析,這四個(gè)詞類是一切文本的核心,是反映萬事萬物的基本符號(hào),也是分析術(shù)語構(gòu)成的主要模式。
從哲學(xué)的角度分析,一個(gè)客觀事物,可用不同的語言來描述,但反映的都是一個(gè)事實(shí)。從符號(hào)學(xué)的角度分析,是用不同的符號(hào)體系來表示同一事物,這些體系相互構(gòu)成映像關(guān)系。
數(shù)理語言學(xué)將語言現(xiàn)象分析解讀為自然界所具有的規(guī)律,從而使人們認(rèn)清語言的本質(zhì)。符號(hào)學(xué)把人類對(duì)客觀事物的描述,轉(zhuǎn)換成以符號(hào)表示的信息世界。所有這些,對(duì)自然語言處理有著重要的啟示:語言中詞匯的虛和實(shí),是值得研究的一個(gè)重要方面。從符號(hào)學(xué)和信息論角度分析英漢平行語料庫,對(duì)表意文字和拼音文字兩種不同的語言系統(tǒng)進(jìn)行對(duì)比研究,具有深遠(yuǎn)的意義。
從虛實(shí)的角度對(duì)中英文平行語料庫進(jìn)行自然語言處理,對(duì)句子進(jìn)行分析,將為機(jī)器自動(dòng)翻譯提供最有價(jià)值的數(shù)據(jù)資源。在云技術(shù)蓬勃發(fā)展的現(xiàn)在,是一個(gè)具有探索性的試驗(yàn)。
自然語言處理需要正確理解詞義。詞有虛實(shí),句有主次。楊樹達(dá)在《詞詮》序例中指出:“凡讀書有二事焉:一曰明訓(xùn)詁,二曰通文法。訓(xùn)詁治其實(shí),文法求其虛。辨別實(shí)詞的意義,前人叫做‘明訓(xùn)詁;了解虛詞的作用,前人叫做‘審辭氣。”[1]
筆者根據(jù)這些理論,對(duì)雙語平行語料庫中的漢語句子進(jìn)行句型模式的分析描述,提出了一種語法描述語言,建立了語法描述語言和中文詞匯的平行對(duì)應(yīng),從而為句子分析做出了一個(gè)新的探索。使用與國(guó)家標(biāo)準(zhǔn)可以相互對(duì)應(yīng)轉(zhuǎn)換的符號(hào)體系,進(jìn)行中文詞性標(biāo)注,從而實(shí)現(xiàn)了實(shí)詞語塊的自動(dòng)切分,解決了語塊邊界的辨識(shí)問題。使用規(guī)則庫分析語塊,自動(dòng)化生成術(shù)語翻譯用的短語詞表。
(二)語塊抽取的重要意義
在建立大型雙語平行語料庫的基礎(chǔ)上,筆者通過大數(shù)據(jù)處理的關(guān)鍵技術(shù),基于人工智能的方法和思路,結(jié)合批量術(shù)語生成與發(fā)現(xiàn)的需要,構(gòu)建了超過百萬條目的短語庫,并且研制了復(fù)合術(shù)語的自動(dòng)抽取與發(fā)現(xiàn)應(yīng)用程序。
馮志偉在《現(xiàn)代術(shù)語學(xué)引論》中指出:“術(shù)語的自動(dòng)處理與機(jī)器翻譯系統(tǒng)的譯文質(zhì)量有密切的關(guān)系,此外,信息檢索、信息抽取、文本分類的運(yùn)算的基本單位都是單詞型術(shù)語或詞組型術(shù)語,也離不開術(shù)語的自動(dòng)處理?!盵2]
宗成慶在《統(tǒng)計(jì)自然語言處理》中指出:“語塊識(shí)別問題是自然語言處理領(lǐng)域研究的一個(gè)基礎(chǔ)性問題,關(guān)于漢語語塊的定義,至今沒有一個(gè)公認(rèn)的權(quán)威解釋,很多專家都給出了自己的詮釋和劃分標(biāo)準(zhǔn)?!?[3]
鄭家恒指出:“句法分析分為兩個(gè)過程。一是組塊的識(shí)別,即從句子中識(shí)別出組塊。二是組塊之間關(guān)系的判斷,即將組塊結(jié)合句子。語塊實(shí)際上就是一種短語。” [4]
馮敏萱指出:“短語庫是一個(gè)豐富的語言資源,可以進(jìn)行短語分類研究、短語和中心詞的研究、漢語短語與英文短語的對(duì)比研究。短語庫是綜合型語言知識(shí)庫的有機(jī)組成部分,它的建設(shè)將為短語結(jié)構(gòu)研究、句法分析和機(jī)器翻譯提供強(qiáng)大的語言知識(shí)支撐?!盵5]
筆者參考以上專家研究成果,實(shí)現(xiàn)了對(duì)語料庫的深加工,構(gòu)建了反映語法模式的符號(hào)語言。用語法符號(hào)語言建立雙語語料庫的中英文平行語料的語法映像,在此基礎(chǔ)上抽取、建立含有詞性標(biāo)注的大型短語語塊庫。使用短語語塊庫進(jìn)行智能化的信息抽取,用于基于語料庫的術(shù)語翻譯應(yīng)用研究和特定句法分析對(duì)比研究,從而實(shí)現(xiàn)了涉及句法、語法、語義、語塊研究的信息抽取。
(三)語塊及其相關(guān)術(shù)語的定義與語法描述語言
對(duì)于短語,各專家提出不同的分類標(biāo)準(zhǔn)。例如,山西大學(xué)將短語分為10種:名詞短語、動(dòng)詞短語、形容詞短語、副詞短語、時(shí)間短語、處所短語、區(qū)別詞短語、介詞短語、數(shù)詞短語、數(shù)量詞短語。
對(duì)于語塊,武漢大學(xué)則分為:名詞塊、動(dòng)詞塊、形容詞塊、副詞塊、時(shí)間詞塊、處所詞塊、數(shù)量詞塊、“的”字塊、“地”字塊和“得”字塊。
參考相關(guān)資料,本研究使用的術(shù)語定義如下(除標(biāo)明引用資料的術(shù)語定義外,均為筆者自定義術(shù)語):
語塊:小于句子,大于詞的語法功能單位。其中部分語塊又稱為“短語”。
自然語塊:語言文本中以標(biāo)點(diǎn)符號(hào)為間隔劃分的字詞符號(hào)的有序集合。
實(shí)詞語塊:不含有虛詞(介詞、助詞、連詞)的文本中的字詞順序集合。組成語塊詞的個(gè)數(shù)稱為語塊粒度。
術(shù)語組塊:含有專業(yè)術(shù)語的實(shí)詞語塊。
句子結(jié)構(gòu)模式:把漢語句子看作由實(shí)詞語塊、虛詞和標(biāo)點(diǎn)符號(hào)組成的語法符號(hào)的有序集合。
語法符號(hào):漢語語法詞類標(biāo)記符號(hào)。
語法描述語言:以有限的語法描述符表述的語法關(guān)系的符號(hào)序列,構(gòu)成與語言字符串平行對(duì)應(yīng)的詞性標(biāo)記串,構(gòu)成語法符號(hào)世界,從而可以分析句子模式的語法構(gòu)成。
以下定義引自《術(shù)語學(xué)、知識(shí)論和知識(shí)技術(shù)》[6]:
符號(hào)句子:符號(hào)復(fù)合體,它對(duì)應(yīng)于一個(gè)邏輯句子。
符號(hào)句子鏈:符號(hào)句子復(fù)合體,這些符號(hào)句子對(duì)應(yīng)于一個(gè)由邏輯句子形成的鏈條。
符號(hào)句子系統(tǒng):符號(hào)句子復(fù)合體,這些符號(hào)句子對(duì)應(yīng)于一個(gè)由邏輯句子組成的系統(tǒng) 。
以下定義引自國(guó)家標(biāo)準(zhǔn)《信息與文獻(xiàn) 術(shù)語》[7] :
術(shù)語短語(terminological phrase):至少包含一個(gè)術(shù)語和一系列其他詞匯的詞的組合,其選擇受到所涉及的術(shù)語的限制。
筆者基于以上定義來說明大型語料庫的組塊庫的自動(dòng)生成。從組塊庫抽取生成以術(shù)語部件為核心詞的候選術(shù)語詞表。生成核心專用詞詞表后,把詞表與已審定公布的術(shù)語比較可以批量生成詞組型術(shù)語新詞,從而自動(dòng)發(fā)現(xiàn)大批量術(shù)語短語。
語法符號(hào)語言采用單個(gè)字符定義,對(duì)應(yīng)語塊中的一個(gè)粒度(即一個(gè)詞),使得任何句子(包括復(fù)句)都可以采用語法描述語言進(jìn)行分析,從而研究句子構(gòu)成模式。
語法符號(hào)集的確定參考國(guó)家標(biāo)準(zhǔn)《GB/T 20532—2006 信息處理用現(xiàn)代漢語詞類標(biāo)記規(guī)范》[8],該標(biāo)準(zhǔn)劃分為13個(gè)詞類和7個(gè)切分單位。為保證詞性標(biāo)注為等長(zhǎng)度編碼,利于計(jì)算機(jī)計(jì)算處理,調(diào)整修改如表1。
此表中一個(gè)編碼代表一種語法成分。在短語詞典標(biāo)注時(shí),字母一律大寫,從而便于使用二分圖模型進(jìn)行詞語句和語法句的平行對(duì)應(yīng)分析處理,便于中英文詞組、短語和語塊的比較與計(jì)算。這樣語塊結(jié)構(gòu)不僅可以有詞類構(gòu)成分析,而且有句法功能分析和語塊類型統(tǒng)計(jì)分析。
(四)實(shí)詞語塊庫自動(dòng)生成的過程
實(shí)詞語塊庫通過計(jì)算機(jī)程序依據(jù)雙語語料庫自動(dòng)生成。在生成過程中使用了語法符號(hào)語言并建立了文本內(nèi)容與語法符號(hào)語言的平行對(duì)應(yīng)。
1.實(shí)詞語塊語法符號(hào)描述語言實(shí)例
實(shí)詞語塊語法符號(hào)描述語言實(shí)例如下(方括號(hào)內(nèi)是語法語言描述的塊結(jié)構(gòu),由語塊詞性標(biāo)注編碼構(gòu)成):
2.語塊庫自動(dòng)化生成過程
以下介紹生成過程。首先對(duì)中英文平行語料進(jìn)行語法標(biāo)注,然后:
a.對(duì)標(biāo)注后的語料,進(jìn)行語法模式的抽取,構(gòu)建與句子原型對(duì)應(yīng)的語法描述句庫。
b.按實(shí)詞語塊的定義,使用語法符號(hào)語言進(jìn)行語塊抽取,從自然語塊中自動(dòng)抽取實(shí)詞語塊,生成語塊庫。
c.對(duì)語塊庫進(jìn)行統(tǒng)計(jì)抽取,生成短語詞典。
d.對(duì)短語詞典進(jìn)行查詢檢索,生成大批量的復(fù)合術(shù)語詞表。
(五) 雙語平行語料庫加工后的成品庫
對(duì)大型語料庫的加工,會(huì)生成有重要意義的各類信息的數(shù)據(jù)庫。這些庫是資源庫的函數(shù)。
語料庫的批量加工所生成的數(shù)據(jù)庫有三類:
1.語法符號(hào)句子鏈?zhǔn)綆?/p>
語法符號(hào)句子鏈?zhǔn)綆旌?jiǎn)稱“符號(hào)句子庫”。符號(hào)句子庫是用語法符號(hào)表示每一個(gè)句子結(jié)構(gòu)的數(shù)據(jù)集合,用于研究句子結(jié)構(gòu)模型。
在符號(hào)句子庫中,可以看到實(shí)詞語塊和虛詞及標(biāo)點(diǎn)符號(hào)之間的關(guān)系,從而進(jìn)一步分析實(shí)詞語塊組成結(jié)構(gòu)和漢語句子(包括子句)的句子模式。
符號(hào)句子庫使用三類標(biāo)識(shí),實(shí)詞語塊標(biāo)識(shí)(用“·”表示)、虛詞類別標(biāo)識(shí)(介詞P,連詞C,助詞U)和標(biāo)點(diǎn)符號(hào)標(biāo)識(shí)。
符號(hào)句子庫舉例:語法描述句是“·(·)U·[1005614-7]”。表示其句子語法結(jié)構(gòu)是:實(shí)詞語塊+開括弧+實(shí)詞語塊+閉括弧+助詞+實(shí)詞語塊。
對(duì)句子結(jié)構(gòu)模式規(guī)律進(jìn)行統(tǒng)計(jì)分析可以分析各種語塊構(gòu)成模式的統(tǒng)計(jì)規(guī)律。對(duì)符號(hào)句子庫加工生成實(shí)詞結(jié)構(gòu)模式做頻次統(tǒng)計(jì)。
2. 語塊模式庫
語塊模式庫是語料庫加工生成的,用于分析自然語塊結(jié)構(gòu)和統(tǒng)計(jì)概率。
自然語塊構(gòu)成模式舉例:
·C·[1915]9實(shí)詞語塊+連詞+實(shí)詞語塊
C·U·[1724]10 連詞+實(shí)詞語塊+助詞+實(shí)詞語塊
上述實(shí)例的方括號(hào)內(nèi)是語塊模式的頻數(shù),最后是序號(hào)。
3.實(shí)詞語塊庫
實(shí)詞語塊庫是對(duì)語塊按詞分段與語法詞詞性對(duì)應(yīng)的描述,用于實(shí)詞語塊結(jié)構(gòu)分析和短語詞典的生成。
例如:“新興市場(chǎng)”語塊由形容詞“新興”加名詞“市場(chǎng)”組成,組塊粒度是2。
實(shí)詞語塊庫內(nèi)容舉例:
新興 市場(chǎng) [AN]
美國(guó) 恢復(fù) 活力 [SVN]
美國(guó) 私人 股本 公司 [SNNN]
超過 原先 預(yù)期 籌資 金額 [VDVVN]
(六)短語詞表
術(shù)語自動(dòng)抽取工程最終產(chǎn)品是由術(shù)語核心詞構(gòu)成的短語詞表。短語詞表是語料庫深加工應(yīng)用的最終產(chǎn)品之一。
查詢顯示特定術(shù)語部件的同時(shí),可生成以術(shù)語部件為核心的術(shù)語詞表。
復(fù)合術(shù)語的術(shù)語詞表,以核心術(shù)語加前綴構(gòu)成向心術(shù)語,表示類別聚合;以核心術(shù)語加后綴構(gòu)成離心術(shù)語,主要表示術(shù)語的屬性展開。
短語詞表的數(shù)據(jù)表示分為三項(xiàng):分詞后的詞組型術(shù)語、第一個(gè)方括號(hào)內(nèi)的詞性標(biāo)注和第二個(gè)方括號(hào)內(nèi)的出現(xiàn)頻次。
以上介紹了術(shù)語語塊生成的理論、技術(shù)方法與工具。大型平行語料庫和資源池的數(shù)據(jù)庫群共同構(gòu)成了滿足用戶基本需要的術(shù)語自動(dòng)發(fā)現(xiàn)與生成系統(tǒng)。將新術(shù)語自動(dòng)抽取工作納入依靠大數(shù)據(jù)和云技術(shù)的生產(chǎn)方式,進(jìn)行術(shù)語的發(fā)現(xiàn)、抽取和定義工程化、自動(dòng)化,使詞典編輯實(shí)現(xiàn)基于語料庫資源的自動(dòng)化生產(chǎn)。
二 術(shù)語語塊的查詢與應(yīng)用
(一)建立以云技術(shù)為指導(dǎo)的數(shù)據(jù)庫群檢索體系
單一的數(shù)據(jù)庫已經(jīng)無法滿足術(shù)語工作的需要。當(dāng)前,迫切需要建立以云資源為基礎(chǔ)的數(shù)據(jù)庫云資源檢索。
云資源檢索是為滿足用戶需要而在統(tǒng)一格式的系統(tǒng)下利用龐大的網(wǎng)絡(luò)數(shù)據(jù)庫群的服務(wù)檢索。
目前,最大的問題是語料庫只提供單一的查詢檢索,無法滿足用戶的需要。面對(duì)復(fù)雜的檢索表達(dá)式和龐大的反饋輸出,沒有哪個(gè)用戶會(huì)把幾千幾萬頁資料一一瀏覽,再屏幕拷貝、統(tǒng)計(jì)。用戶無法獲取相應(yīng)研究課題檢索與統(tǒng)計(jì)分析一體化的報(bào)告文本,限制了語料庫資源的深層次應(yīng)用。
應(yīng)用大數(shù)據(jù)和云計(jì)算技術(shù),目前使這種需求成為可能。
在筆者應(yīng)用的檢索試驗(yàn)中,將幾個(gè)大規(guī)模的數(shù)據(jù)庫檢索相關(guān)聯(lián)使用,方便了對(duì)語言學(xué)與術(shù)語的深入研究。
這里,僅對(duì)涉及術(shù)語及術(shù)語翻譯方面的應(yīng)用進(jìn)行介紹,重點(diǎn)介紹語塊查詢與輸出程序。
在檢索界面輸入以術(shù)語部件為核心的術(shù)語,則系統(tǒng)檢索、輸出含有該術(shù)語的全部短語,并且輸出以術(shù)語部件為核心的Ngram詞表。十萬條術(shù)語部件,可以批量生成各個(gè)部件的詞表和相關(guān)的實(shí)證例句。
這些,將為術(shù)語翻譯資源的建設(shè)提供堅(jiān)實(shí)的基礎(chǔ)。
(二)術(shù)語短語生成實(shí)例
以下介紹以部件詞檢索自動(dòng)生成該部件相關(guān)詞表的實(shí)例,見表2、表3。
在頻數(shù)大于等于2的“頭寸”詞表中,發(fā)現(xiàn)新術(shù)語有13個(gè),已經(jīng)審定收錄的術(shù)語有2個(gè)。所發(fā)現(xiàn)的新術(shù)語可在中英文雙語語料庫的原文對(duì)照實(shí)例中查詢。
(三)應(yīng)用新術(shù)語查詢實(shí)例
1雙語對(duì)照查詢實(shí)例
以“空頭頭寸”術(shù)語為例,百度百科的詞條如下:
空頭頭寸(bear covering/Short Position)
空頭頭寸 :由賣出空頭而產(chǎn)生的投資頭寸。由于此頭寸尚未被沖銷,因此可從市場(chǎng)價(jià)格下跌中獲利。即投資者因預(yù)料價(jià)格會(huì)下跌提前提出賣出價(jià)格大筆賣出或者使賣出大于買入的行為。
而在應(yīng)用實(shí)例中(見表4),報(bào)刊應(yīng)用的是“空頭頭寸”(short positions),這可作為術(shù)語審定與術(shù)語翻譯的參考,為術(shù)語部件譯為單數(shù)還是復(fù)數(shù)提供實(shí)證,從而確定以術(shù)語部件“頭寸”為中心的一系列術(shù)語的翻譯原則。
2. 從專用詞匯術(shù)語詞表中發(fā)現(xiàn)新術(shù)語及翻譯實(shí)例
例如,新術(shù)語“信用光譜”的發(fā)現(xiàn)及查詢過程:
a.查詢“信用”,從128萬短語詞典中抽取了“信用”詞表;
b.查看“信用”詞表,發(fā)現(xiàn)“信用光譜”新術(shù)語;
c.查詢“信用光譜”獲得信用光譜中英文術(shù)語翻譯和語用實(shí)例(見表5)。
三 結(jié) 語
雙語平行語料庫的大量資源可以用于多種語言課題的研究,是寶貴的資源。目前,已經(jīng)實(shí)現(xiàn)了跨語言領(lǐng)域的雙語平行資料檢索和語塊生成的自動(dòng)化。
下一步工作是對(duì)中英文句子做多叉多標(biāo)記短語塊的進(jìn)一步比較分析,為自動(dòng)生成英漢對(duì)譯語塊庫做語言工程實(shí)踐的探索,以期采用人工智能方式自動(dòng)生成英漢語塊翻譯詞典,對(duì)英語語料庫語塊進(jìn)行加工并對(duì)平行詞匯級(jí)別的雙語做對(duì)齊分析,從而為計(jì)算機(jī)輔助機(jī)器翻譯提供參考。
參考文獻(xiàn)
[1] 楊樹達(dá).詞詮[M].北京:中華書局,1954:五.
[2] 馮志偉.現(xiàn)代術(shù)語學(xué)引論[M].增訂本.北京:商務(wù)印書館,2011:569.
[3] 宗成慶.統(tǒng)計(jì)自然語言處理[M] 北京:清華大學(xué)出版社,2013:215.
[4] 鄭家恒.智能信息處理——漢語語料庫加工技術(shù)及應(yīng)用[M].北京:科學(xué)出版社,2010:180.
[5] 馮敏萱.漢英平行語料庫的平行處理[M].北京:世界圖書出版公司北京分公司,2011:138.
[6] [奧地利]費(fèi)爾伯.術(shù)語學(xué)、知識(shí)論和知識(shí)技術(shù)[M].邱碧華,譯;馮志偉,審校.北京:商務(wù)印書館,2011:296-321.
[7] 中華人民共和國(guó)國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì).GB/T 4894—2009.信息與文獻(xiàn) 術(shù)語[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2009.
[8] 中華人民共和國(guó)國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì).GB/T 20532—2006.信息處理用現(xiàn)代漢語詞類標(biāo)記規(guī)范[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2006.