尕藏卓瑪 安見(jiàn)才讓
摘? 要: 通過(guò)對(duì)藏語(yǔ)存在句的分析和研究,實(shí)現(xiàn)藏語(yǔ)存在句的識(shí)別。借助產(chǎn)生式的正向推理作為藏語(yǔ)存在句識(shí)別的知識(shí)表示方式,并用產(chǎn)生式規(guī)則搜索和匹配。從人工角度構(gòu)建的一種基于產(chǎn)生式規(guī)則的藏語(yǔ)存在句的識(shí)別系統(tǒng),以利藏語(yǔ)存在句的識(shí)別。該研究為實(shí)現(xiàn)藏語(yǔ)存在句的識(shí)別提供了基礎(chǔ)。
關(guān)鍵詞: 人工智能; 藏語(yǔ)存在句的識(shí)別; 產(chǎn)生式規(guī)則; 正向推理
中圖分類(lèi)號(hào):TP391.1? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1006-8228(2022)02-15-03
Research on recognition of Tibetan existential sentence based on production rule
Gazang Zhuoma, Anjian Cairang
(School of Computer, Qinghai Minzu University, Xining, Qinghai 810007, China)
Abstract: A recognition system of Tibetan existential sentences based on production rule is constructed from the artificial point of view to facilitate the recognition of Tibetan existential sentences. It uses the positive inference of production as the knowledge representation and inference algorithm of Tibetan existential sentence to search and match rules. The experiment has achieved the recognition of Tibetan existential sentence.
Key words: artificial intelligence; recognition of Tibetan existential sentence; production rule; forward reasoning
0 引言
識(shí)別藏語(yǔ)存在句,簡(jiǎn)單的說(shuō)就是以藏語(yǔ)句子的系統(tǒng)知識(shí)和理論為基礎(chǔ),準(zhǔn)確,有效,簡(jiǎn)便,適當(dāng)?shù)貜闹凶R(shí)別藏語(yǔ)存在句。從信息角度看,識(shí)別藏語(yǔ)存在句實(shí)質(zhì)上是一個(gè)在讀者和句子之間的信息運(yùn)動(dòng)過(guò)程。在這個(gè)過(guò)程中主要包括兩類(lèi)信息,一是藏語(yǔ)理論知識(shí)及學(xué)習(xí)經(jīng)驗(yàn)等藏語(yǔ)知識(shí)信息,二是句子的基本結(jié)構(gòu),包括句子的信息和應(yīng)用信息情況等。因此,在識(shí)別藏語(yǔ)存在句的信息化過(guò)程中如何準(zhǔn)確的表示并實(shí)現(xiàn)這兩類(lèi)信息之間的理解就成為了關(guān)鍵。
產(chǎn)生式系統(tǒng)是人工學(xué)科中的一個(gè)重要概念,它是構(gòu)造知識(shí)型系統(tǒng)和建立認(rèn)知模型時(shí)常用的知識(shí)表示的形式系統(tǒng)。它不僅用來(lái)對(duì)人類(lèi)的問(wèn)題求解方法建模[7],而且已經(jīng)在多個(gè)領(lǐng)域得到了廣泛的應(yīng)用,本文將產(chǎn)生式規(guī)則與藏語(yǔ)存在句的結(jié)構(gòu)結(jié)合,提出基于產(chǎn)生式規(guī)則的識(shí)別藏語(yǔ)存在句的研究方法。
1 識(shí)別藏語(yǔ)存在句
即便藏語(yǔ)句子的數(shù)量是上千萬(wàn),但其中蘊(yùn)含的最基本的規(guī)則是相對(duì)穩(wěn)定的,所以可以把上千萬(wàn)的句子用有限的句型去表示。對(duì)基于規(guī)則的藏語(yǔ)句法分析方法做了研究之后,按照句子的結(jié)構(gòu)模式,把藏語(yǔ)句子歸納到了六種句型,有及物句、不及物句、存在句、特征句、一體句和神態(tài)句,這六種句型在藏語(yǔ)中是最常見(jiàn)的,也是十分重要的句型[1]。本文根據(jù)藏語(yǔ)句子的結(jié)構(gòu)及藏語(yǔ)句型,對(duì)存在句進(jìn)行了推理研究。
1.1 存在句的定義及結(jié)構(gòu)
藏語(yǔ)句型存在句是表示某物依存于某地的表示方式,它的句型一般由依體(????????), 拉格助詞(????????????????? ???????????????一般用CP表示),被依體(?????????)和謂語(yǔ)(????????????????)組成,被依體是可選項(xiàng)。這些成分,分別由下列詞性擔(dān)任[1]:
1.2 存在句的推理
存在句中的依體是用一個(gè)名詞或方位詞等組成的。依體和拉格助詞(????????????????? ???????????????一般用CP表示)形成名詞性短語(yǔ)np 。被依體是可選項(xiàng),如(?????????????? ?????????????????????)第一個(gè)句子中沒(méi)有被依體,第二個(gè)句子中有被依體,但這都不會(huì)影響整體去理解的句子的內(nèi)容,我們還是能知道這是個(gè)存在句。還有(???????????????? ?????????????)存在句中的謂詞也扮演著重要的角色,因?yàn)楹竺嬷^詞的存在,能盡快的判斷該句子是一個(gè)存在句,一般常見(jiàn)的謂詞有“???? ????”等。被依體和謂詞形成存在性短語(yǔ)。在該實(shí)驗(yàn)中存在句中的詞性以常見(jiàn)的詞性為研究對(duì)象。根據(jù)存在句常見(jiàn)的詞性結(jié)構(gòu),知識(shí)庫(kù)中只包含以下23條規(guī)則:
r1:IF 句型中有詞性nj? ? AND? cp? THEN? np
r2:IF 句型中有詞性nds? AND? cp? THEN? np
r3:IF 句型中有詞性f? ? AND? cp? ?THEN? np
r4:IF 句型中有詞性nd? AND? cp? ? THEN? np
r5:IF 句型中有詞性nj? ?AND? aq? ?THEN? vp
r6:IF 句型中有詞性nj? ?AND? dd? ?THEN? vp
r7:IF 句型中有詞性nj? ?AND? vae? THEN? vp
r8:IF 句型中有詞性nd? ?AND? aq? ?THEN? vp
r9:IF 句型中有詞性nd? ?AND? dd? ?THEN? vp
r10:IF 句型中有詞性nd? AND? vae? ?THEN? vp
r11:IF 句型中有詞性nj? ?AND? ?cpANDaq? THEN? S
r12:IF 句型中有詞性nj? ?AND? ?cpANDdd? THEN? S
r13:IF 句型中有詞性nj? ?AND? ?cpANDvae THEN? S
r14:IF 句型中有詞性nds? AND? cpANDaq? ?THEN? S
r15:IF 句型中有詞性nds? AND? cpANDdd? ?THEN? S
r16:IF 句型中有詞性nds? AND? cpANDvae? THEN? S
r17:IF 句型中有詞性f? ? AND? ?cpANDaq? ?THEN? S
r18:IF 句型中有詞性f? ? AND? ?cpANDdd? ?THEN? S
r19:IF 句型中有詞性f? ? AND? ?cpANDvae? THEN? S
r20:IF 句型中有詞性nd? AND? ?cpANDaq? ?THEN? S
r21:IF 句型中有詞性nd? AND? ?cpANDdd? ?THEN? S
r22:IF 句型中有詞性nd? AND? ?cpANDvae? THEN? S
r23:IF 句型中有詞性np? AND? ?vp? ? ? ? ? THEN? S
名詞中有nj(隨立名),nds(地名),f(方位詞),nd(隨欲名)。用cp表示拉格助詞。謂語(yǔ)中有aq(形容詞),dd(否定詞),vae(助動(dòng)詞)詞性。np表示名詞短語(yǔ)。vp表示存在性短語(yǔ)。S表示存在句,如圖1所示。
2 產(chǎn)生式規(guī)則系統(tǒng)
2.1 組成
一個(gè)產(chǎn)生式系統(tǒng)包括以下三部分(圖2):綜合數(shù)據(jù)庫(kù),知識(shí)庫(kù)(規(guī)則庫(kù))和控制系統(tǒng)。綜合數(shù)據(jù)庫(kù)(database)用來(lái)存放與求解問(wèn)題有關(guān)的各種當(dāng)前信息的數(shù)據(jù)結(jié)構(gòu)。知識(shí)庫(kù)及規(guī)則庫(kù)用來(lái)存放與求解問(wèn)題有關(guān)的所有規(guī)則的集合,它包含了將問(wèn)題從初始狀態(tài)轉(zhuǎn)換成目標(biāo)狀態(tài)所需的所有變換規(guī)則??刂葡到y(tǒng)(control system)也稱(chēng)推理機(jī),是由一組程序組成,用來(lái)控制整個(gè)產(chǎn)生式系統(tǒng)的運(yùn)行,決定問(wèn)題求解過(guò)程的推理線路,實(shí)現(xiàn)對(duì)問(wèn)題的求解[2]。
2.2 產(chǎn)生式推理方法
控制系統(tǒng)對(duì)產(chǎn)生式規(guī)則的使用主要有兩種方法:正向推理和反向推理。指的是從現(xiàn)有事實(shí)出發(fā),搜索知識(shí)庫(kù)中的規(guī)則并檢查事實(shí)是否與規(guī)則的前提條件相符,不斷進(jìn)行直到預(yù)期目標(biāo)實(shí)現(xiàn)。反向推理,即從目標(biāo)出發(fā),尋找以此目標(biāo)為結(jié)論的規(guī)則,并對(duì)該規(guī)則的前提進(jìn)行判斷,反復(fù)直至能夠?qū)δ骋?guī)則的前提進(jìn)行判斷。若是既為正向推理又為反向推理方式,則稱(chēng)為雙向推理,它綜合了正向推理和逆向推理的長(zhǎng)處,并克服了兩者的短處。
3 基于產(chǎn)生式規(guī)則的識(shí)別藏語(yǔ)存在句
3.1 識(shí)別藏語(yǔ)存在句的產(chǎn)生式規(guī)則表示
知識(shí)庫(kù)是產(chǎn)生式系統(tǒng)的核心,識(shí)別藏語(yǔ)存在句的系統(tǒng)中,知識(shí)就是存在句的使用方式,存在句的組成包含相應(yīng)的詞性信息,詞性是識(shí)別藏語(yǔ)存在句的重要知識(shí)來(lái)源。而在識(shí)別藏語(yǔ)存在句中,存在句的基本結(jié)構(gòu)和詞性是主要知識(shí)來(lái)源。
在詞性識(shí)別中,其原理是根據(jù)輸入的詞性同輸入的詞性組在結(jié)構(gòu)組成上是否具有規(guī)則,如有則形成存在句。主要從句子的組成部分及內(nèi)部結(jié)構(gòu)的詞性來(lái)判斷輸入的句子是否是存在句,當(dāng)輸入的詞性有(????????/nj??/cp??????/nj???/vae)時(shí)判斷是存在句類(lèi)的,輸入的詞性有(????????/nj??/cp???/vae)時(shí)也會(huì)判斷是存在句類(lèi)。
3.2 識(shí)別藏語(yǔ)存在句的系統(tǒng)的推理機(jī)制
⑴ 把用戶提供的初始證據(jù)放入綜合數(shù)據(jù)庫(kù)。
⑵ 檢查綜合數(shù)據(jù)庫(kù)中是否包含了問(wèn)題的解,若已包含,則求解結(jié)束,并成功退出;否則執(zhí)行下一步。
⑶ 檢查知識(shí)庫(kù)中是否有可用知識(shí),若有,形成當(dāng)前可用知識(shí)集,執(zhí)行下一步;否則轉(zhuǎn)⑸。
⑷ 按照某種沖突消解策略,從當(dāng)前可用知識(shí)集中選出一條知識(shí)進(jìn)行推理,并將推出的新事實(shí)加入綜合數(shù)據(jù)庫(kù)中,然后轉(zhuǎn)⑵。
⑸ 詢問(wèn)用戶是否可以進(jìn)一步補(bǔ)充新的事實(shí),若可補(bǔ)充,則將補(bǔ)充的新事實(shí)加入綜合數(shù)據(jù)庫(kù)中,然后轉(zhuǎn)⑶;否則表示無(wú)解,失敗退出。
3.3 實(shí)驗(yàn)結(jié)果
在該實(shí)驗(yàn)中主要以常見(jiàn)的存在句為研究對(duì)象的,并從抽取了90個(gè)存在句。這些句子分成三部分,第一部分是(nj/nds/f/nd+cp+nj/nd+aq/vae/dd)詞性結(jié)構(gòu)組成的,第二部分是(nj/nds/f/nd+cp+aq/vae/dd)詞性結(jié)構(gòu)組成的。表1是產(chǎn)生式規(guī)則的藏語(yǔ)存在句識(shí)別的結(jié)果。
實(shí)驗(yàn)結(jié)果表明,語(yǔ)料中的句子的形成結(jié)構(gòu)的不同,對(duì)實(shí)驗(yàn)的準(zhǔn)確率各不相同,這主要原因是藏語(yǔ)句子結(jié)構(gòu)的復(fù)雜度。另外,存在句的規(guī)則庫(kù)的不完整和詞性結(jié)構(gòu)不齊全因素,所以還需要進(jìn)一步完善規(guī)則庫(kù)和豐富詞性結(jié)構(gòu)。
4 結(jié)束語(yǔ)
從人工的角度實(shí)現(xiàn)了識(shí)別藏語(yǔ)存在句推理,基本達(dá)到了設(shè)計(jì)目的,但由于藏語(yǔ)句型對(duì)識(shí)別藏語(yǔ)存在句知識(shí)的確定性和準(zhǔn)確性要求較高,因此該研究未能實(shí)現(xiàn)推理知識(shí)的更全面的知識(shí)內(nèi)容,同時(shí)由于藏語(yǔ)句子結(jié)構(gòu)的復(fù)雜性,識(shí)別藏語(yǔ)存在句的知識(shí)表達(dá)也有待進(jìn)一步完善。
參考文獻(xiàn)(References):
[1] 安見(jiàn)才讓.藏文信息處理原理與技術(shù)實(shí)現(xiàn)[M].青海民族出版社,2017.12
[2] 王萬(wàn)森.人工原理及其應(yīng)用(第三版)[M].北京:電子工業(yè)出版社,2012.9
[3] 李雷,高鐵曼.產(chǎn)生式規(guī)則專(zhuān)家系統(tǒng)的原理與實(shí)現(xiàn)[J].微計(jì)算機(jī)應(yīng)用,2006,27(5)
[4] 格桑居冕.實(shí)用藏文文法教程[M].四川民族出版社,2004.11
[5] 袁國(guó)忠.python基礎(chǔ)胡教程(第3版)[M],北京:人民郵電出版社,2018.2
[6] 劉穎.計(jì)算語(yǔ)言學(xué)[M].清華大學(xué)出版社,2014
[7] Luger GF. Artificial intelligence: Structures and strategiesfor complex problem solving(6th edition)[M].Boston: Addison-Wesley,2008