亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        藏語及物與不及物動詞的自動識別研究

        2014-02-21 02:16:38完么才讓曹玉林
        關鍵詞:藏語自動識別及物動詞

        完么才讓, 曹玉林

        (1.青海民族大學藏文信息處理與軟件研究所,青海 西寧 810007; 2. 青海師范大學計算機學院, 西寧 810008)

        藏語及物與不及物動詞的自動識別研究

        完么才讓1, 曹玉林2

        (1.青海民族大學藏文信息處理與軟件研究所,青海 西寧 810007; 2. 青海師范大學計算機學院, 西寧 810008)

        藏語動詞分類很細, 準確識別和判斷藏文動詞的詞性是藏語自然語言處理中一個基礎又關鍵的內容, 及物與不及物動詞的自動識別, 可以在用計算機生成自然語言句子時能很好地阻止不合法句子的生成, 也能從整體上減少句子生成量, 從而提高效率. 提出了一種在理想環(huán)境下, 通過句子中的使格助詞來自動判斷動詞及物性的方法, 這種自動識別方法是一種理性主義的判斷方法, 所以不需要大規(guī)模語料的支持. 因為是一種理想情況, 所以自動識別效率高, 準確率為100%.

        及物; 不及物; 自動識別

        1 引言

        動詞這一詞性在藏文傳統(tǒng)文法著作中就有研究, 后經藏族學者不斷探索、鉆研, 迄今為止, 對藏語動詞的研究較深. 對動詞的理解和運用程度已經成為衡量藏文藏語水平的一項重要指標, 然而鑒于藏語動詞的時態(tài)、形態(tài)的復雜性[1], 使藏語及物與不及物動詞的自動識別成為一個難點, 幸運的是, 藏語及物、不及物動詞和漢語、英語及物、不及物動詞不同, 當它出現(xiàn)在具體語境中的時候, 往往伴隨著某些具體的、可作為區(qū)別及物不及物動詞的特征, 因此, 藏語及物與不及物動詞的自動識別變得有規(guī)律可循, 以及在生成句子的時候, 限制了很多不合語法、不合語言習慣的句子的產生.

        2 及物與不及物動詞特點

        2.1 相關概念

        定義1[2]“及物”動詞:只要能帶賓語, 不管帶的是受事賓語、施事賓語還是處所賓語, 都是及物動詞, 我們用tv表示. 即包含tv的一個句子的完整結構可表示為S->np np vp, 其中, np表名詞短語[5-7], 前后兩個np分別為主語和賓語, 是兩個不同的事物, vp即tv.

        定義2[2]“不及物”動詞:不能帶任何賓語的動詞是不及物動詞, 我們用iv表示. 即包含iv的一個句子的完整結構可表示為S->np vp, 其中, vp即iv, iv的主語與賓語為同一事物np.

        2.2 藏語tv與iv的特點:

        設Bt和Bi分別表示tv與iv的基本輔音,則Bt∈C,Bi∈D;

        當然, 一般情況下上述結論是成立的, 也有極個別反例, 如在兩句中構成

        if vp->v+h(v表示一般動詞)

        then v=tv

        if vp->v+h=False

        then v=iv

        (6) 有無賓語不同

        這個特點在上述對及物不及物的定義中也有說明. 其實在藏語中, 賓語往往出現(xiàn)在動詞的前面, 根據(jù)定義1和定義2, 我們知道:在一個完整的合法句子中, 如果可以出現(xiàn)S->np np vp(其中S為語法的開始符號, v表示動詞, np表示名詞短語)這種語法結構, 那么可以判定此時的v為tv, 如果不能出現(xiàn)這種語法結構, 則v為iv. 可形式化描述為

        if S->np np vp

        then vp=tv

        3 及物與不及物動詞自動識別算法

        ⑴ 當句子中只有一個動詞時, 不管句子長短, tv與iv的識別都變得簡單, 如下表1所示:

        表1 實例1

        上表中, 因為每句都含使格助詞cm, 所以動詞字段所列動詞都為tv, 可表示為(v表示動詞). 如下表中的句子所示:

        表2 實例2

        我們可以利用上面的分析和2.2節(jié)的第四個特點, 讓計算機自動識別tv與iv. 假設句子是切分好的并標注了詞性的詞串w, 那么可用圖1所示算法流程圖表示自動識別過程.

        圖1 句中只有一個動詞時的tv與iv 自動識別算法流程圖

        圖2 當Vc=2且 cmc=2時tv與iv的自動識別算法流程圖

        ⑵ 我們用cmc表示使格助詞數(shù), vc表示動詞數(shù), cm1為第一個使格助詞, cm2為第二個使格助詞, s1是cm1的主語, s2是cm2的主語, 則:

        當Vc=2且 cmc=2時,即這兩個動詞都是及物動詞.

        看下面兩個例子:

        句子②與句子①的情況相似, 都有兩個tv和兩個cm, 第1個cm修飾第2個tv, 第2個cm修飾第1個tv.

        這種情況下, 我們可以再寫一個算法來判斷當Vc=2且 cmc=2時的動詞的及物性, 如圖2所示.

        ⑶ 當然, 一個句子不一定只有一個動詞, 我們用Vc表示一個句子中的動詞數(shù), 當Vc≥2時, 情況比較復雜,請看下面幾個例子:

        總之, 在一個句子中, 當Vc≥2時, tv、iv與cm的關系顯得很靈活, 所以這時, 計算機很難通過cm把tv和iv區(qū)別開來.

        這樣的句子數(shù)不勝數(shù), 情況也就復雜多變, 很難找出一個確定的規(guī)律. 一個句子中及物動詞和不及物動詞的數(shù)量及出現(xiàn)位置都不呈規(guī)則, 所以加大了研究的復雜度, 因篇幅有限, 在此不討論這種復雜情況, 有情趣的讀者可專門研究.

        ⑷ 看如下例句

        這三個句子中, 單下劃線和雙下劃線標記的分別是動詞(v)和助動詞(vh), 第一、二兩個句子中的v為tv, 第三個句子中的v為iv, 所以不管是tv還是iv, 自動識別算法在掃描過程中, 若發(fā)現(xiàn)一個v和一個vh連續(xù)出現(xiàn), 即若vp->v vh, 那么可把v vh視為一個動詞, 可用如下偽代碼描述如下算法:

        if vp->v vh then v+vh=v.

        4 結束語

        在實際語料中, 句子結構復雜多變, 并不是所有的句子都按照S->np np vp或者S->np vp這樣的固定格式出現(xiàn), 本文提出的算法適用于上述特定環(huán)境, 是一種理想狀態(tài)下的算法. 上述句子成分是嚴格遵循藏語語法的, 在真實語料中也占多數(shù), 要特別注意的是當句子中出現(xiàn)的所有并非都是真正意義上的使格助詞, 什么情況下不是真正的使格助詞, 上面有分析. 設計這個算法, 主要用于在生成句子時, 如果知道句子中包含的動詞為及物或不及物, 那么可以根據(jù)定義, 不及物不帶賓語, 及物動詞可帶可不帶, 從而大大減少句子的生成量, 也能產生很多符合語法或藏語表達習慣的句子.

        [1] 格桑居冕. 實用藏文文法教程[M]. 成都: 四川民族出版社, 2004. [2] 邵敬敏. 現(xiàn)代漢語通論[M]. 2版. 上海: 教育出版社, 2007.

        [3] 吉太加. 藏語語法研究[M]. 西寧: 青海民族出版社, 2011.

        [4] THUPTEN JINPA. A Modern Tibetan Grammar[M]. Tibetan Institute of Culture, 2010.

        [5] 才讓加. 藏語語料庫詞語分類體系及標記集研究[J]. 中文信息學報, 2009(4): 1-4.

        [6] 馬進武. 藏文語法四種結構明晰[M]. 北京: 民族出版社, 2008.

        [7] 羊毛卓瑪. 藏文詞性自動標注中歧義問題處理方法研究[J]. 計算機工程與應用, 2012: 4-5.

        [8] 毛爾蓋·桑木旦. 藏文文法概論[M]. 西寧: 青海民族出版社, 2005.

        Research on the automatic identification of Tibetan transitive and intransitive verbs

        WANMECAIRANG1, CAO Yu-lin2
        (1. School of Computer Science, Qinghai University for Nationalities, Xi’ning 810007, P.R.C.;
        2. School of Computer Science, Qinghai Normal University, Xi’ning 810008, P.R.C.)

        Tibetan verb has a very fine classification, so an accurate identification and judgment of Tibetan verb’s parts of speech is a foundation in the Tibetan natural language processing and key task. An automatic identification of transitive and intransitive verbs can enable the computer to prevent the formation of illegal sentences while generating natural language sentences, and also can help reduce the number of the sentences to be generated as a whole, so as to improve efficiency. The paper proposes a method which, under an ideal environment, can automatically determine the verb in the sentence and the property by using case of utterances. This method of automatic identification is a judgment method of rationalism which does not need the support of large-scale corpus. Because it is an ideal situation, the automatic identification is of high efficiency with an accuracy of 100%.

        transitive; intransitive; automatic identification

        TP301.4, TP391.1

        A

        1003-4271(2014)01-0132-05

        10.3969/j.issn.1003-4271.2014.01.27

        2013-09-22

        完么才讓(1988-), 男, 藏族, 甘肅甘南人, 碩士研究生, 研究方向: 藏文信息處理及應用; 曹玉林(1970-), 男, 土族, 青?;∪? 教授, 博士生, 研究網(wǎng)絡信息安全、傳感器網(wǎng)絡、社會網(wǎng)絡.

        猜你喜歡
        藏語自動識別及物動詞
        淺談藏語中的禮儀語
        客聯(lián)(2022年2期)2022-04-29 22:05:07
        漢藏語及其音樂
        中國音樂學(2020年2期)2020-12-14 03:07:24
        自動識別系統(tǒng)
        特別健康(2018年3期)2018-07-04 00:40:18
        藏語拉達克話的幾個語音特征
        西藏研究(2017年3期)2017-09-05 09:44:58
        金屬垃圾自動識別回收箱
        藏語地理分布格局的形成原因
        西藏研究(2016年5期)2016-06-15 12:56:42
        基于IEC61850的配網(wǎng)終端自動識別技術
        電測與儀表(2016年6期)2016-04-11 12:06:38
        蘭姆凹陷穩(wěn)頻工作點自動識別技術
        計測技術(2014年6期)2014-03-11 16:22:12
        Swagger:氣場壓人
        英語學習(2009年7期)2009-08-05 05:39:32
        及物與不及物動詞的用法與區(qū)別
        啦啦啦中文在线观看日本| 一区二区三区四区四色av| 日本在线综合一区二区| 久久久久av综合网成人| 中文字幕一区二区人妻性色| 欧美精品久久久久久久久| 成人影院免费观看在线播放视频| 国产女主播一区二区久久| 免费观看18禁无遮挡真人网站| 免费夜色污私人影院在线观看| 国产91在线|亚洲| 在线亚洲日本一区二区| 97se亚洲国产综合在线| 亚洲av无码成人黄网站在线观看| 亚洲熟妇中文字幕日产无码| av天堂亚洲另类色图在线播放| 日日摸天天摸97狠狠婷婷| 免费a级毛片无码a| 亚洲国产高清美女在线观看| 凹凸世界视频a一二三| 内射人妻无套中出无码| 一本一道av无码中文字幕﹣百度 | 国产精品白浆一区二区免费看| 日产精品一区二区在线| 精品国产一区二区三区性色| 久久久久久久综合综合狠狠| 亚洲欧美精品伊人久久| 韩国无码精品人妻一区二 | 四虎精品影视| 中文少妇一区二区三区| 免费久久久一本精品久久区| 一本色道无码道dvd在线观看| 欧美日韩电影一区| 一区二区三区熟妇人妻18| 国产免费在线观看不卡| 美女张开腿让男人桶爽| 91免费在线| 色视频日本一区二区三区| 亚洲综合精品中文字幕| 欧美一区二区三区红桃小说| 国产精品高潮无码毛片|