亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        句型轉(zhuǎn)換式漢英機譯的一些技術(shù)處理探討

        2014-03-03 13:50:16楊憲澤
        關(guān)鍵詞:分詞表達(dá)式句型

        楊憲澤

        (西南民族大學(xué)計算機科學(xué)與技術(shù)學(xué)院, 成都 610041)

        句型轉(zhuǎn)換式漢英機譯的一些技術(shù)處理探討

        楊憲澤

        (西南民族大學(xué)計算機科學(xué)與技術(shù)學(xué)院, 成都 610041)

        句型轉(zhuǎn)換式機器翻譯涉及的技術(shù)很多.主要工作有四部分:第一部分給出一種自動分詞邊界問題處理方法; 第二部分探討一般句與疑問句的句型結(jié)構(gòu); 第三部分研究漢英機器翻譯的譯文生成問題; 第四部分是一種“是”動詞“am; is;are”的處理方法.

        機器翻譯; 邊界問題; 句型轉(zhuǎn)換; 譯文生成

        對于兩種不同的自然語言(例如英語和漢語)句子在計算機上用程序?qū)崿F(xiàn)自動翻譯, 這就是機器翻譯.機器翻譯研究課題除了其相當(dāng)高的理論價值外, 還由于巨大的社會效益和經(jīng)濟(jì)效益, 被確定為21世紀(jì)要解決的科技難題之一[1-2].當(dāng)然, 研究目前還面臨許多困難, 因此, 各個方面的探討就顯得很有意義.

        在計算機上用程序?qū)崿F(xiàn)機器翻譯目前僅有三種實用方法:類比機器翻譯方法; 概率統(tǒng)計機器翻譯方法和轉(zhuǎn)換式機器翻譯方法.轉(zhuǎn)換式機器翻譯方法的程序處理就是兩種語言間單詞、短語和句型的匹配, 借助于詞法分析、句法分析、語法分析、語義分析、語用分析和語境分析, 最后調(diào)序及目標(biāo)語言的生成完成自動機器翻譯.

        我們在其它文獻(xiàn)中介紹了我們所做漢英機器翻譯研究的一些階段成果[3-5], 本文的工作是進(jìn)一步研究的探討.第一部分給出漢語句自動分詞邊界問題解決; 第二部分探討一般句與疑問句句型表達(dá)式的處理.第三部分研究漢英機器翻譯的自動調(diào)序問題.第四部分是一種“是”動詞“am; is; are”的處理方法.

        1 漢語句自動分詞邊界問題處理

        在機器翻譯過程中, 要把漢語句子翻譯成英語句子, 漢語句子首先要自動分詞.即把漢語句子切分成一個個單詞再作下一步處理.關(guān)于自動分詞方法, 文獻(xiàn)[6]已經(jīng)做過詳細(xì)介紹, 本文不再贅述.現(xiàn)在要介紹的是自動分詞遇到的邊界問題:文獻(xiàn)[6]介紹的分詞方法是一種正向分詞方法, 其思路是把待翻譯的漢語句子取前三個字查找單詞庫, 若不是一個單詞, 則刪除三個字的最后一個字再實施查找, 這樣一直循環(huán)查找, 至找到一個單詞為止.待翻譯的漢語句子剩余部分重復(fù)此工作, 直到把所有的待翻譯的漢語句子的詞都分出為止.這里可能就出現(xiàn)這樣的情況, 自動分詞到最后, 待翻譯的漢語句子剩下的不是三個字, 算法越界死機, 為避免這種情況, 我們作如下處理:

        步驟1:待翻譯的漢語句子的字?jǐn)?shù)≥3?是, 轉(zhuǎn)步驟 7.

        步驟2:待翻譯的漢語句子的字?jǐn)?shù)=2? 是, 轉(zhuǎn)步驟 6.

        步驟3:待翻譯的漢語句子的字?jǐn)?shù)=1? 是, 轉(zhuǎn)步驟 5.

        步驟4:已經(jīng)完全分詞, 進(jìn)入下階段處理.

        步驟5:進(jìn)入查找單字詞階段.

        步驟6:進(jìn)入查找兩字詞階段.

        步驟7:自動分詞算法正常運行.

        2 一般句與疑問句句型表達(dá)式的處理

        漢英機器翻譯采用句型轉(zhuǎn)換的方法就是把漢語句子的單詞和句型結(jié)構(gòu)映射為英文句子相對應(yīng)的單詞和句型結(jié)構(gòu), 能夠程序?qū)崿F(xiàn)翻譯的核心是句型結(jié)構(gòu)的表達(dá)式相同.但是, 一般句與疑問句的句型表達(dá)式可能相同, 但它們翻譯出的英語句子中的單詞順序卻不相同.例如:“你們是學(xué)生.”與“你們是學(xué)生?”句型表達(dá)式都是“pvn”, 但譯文應(yīng)該是不同的兩種, You are students.和 Are you students? 為此, 處理的方式根據(jù)待翻譯的句子結(jié)尾是句號還是問號來區(qū)別是一般句與疑問句.即, 一般句與疑問句的句型表達(dá)式建立在不同的模塊中, 處理步驟如下:

        步驟1:求待翻譯漢語句子字符長度, 記為x;

        步驟2:根據(jù)x求出待翻譯漢語句子最后一個字符, 記為fh;

        步驟3:fh是“?”?, 是轉(zhuǎn)步驟5;

        步驟4:一般句的句型表達(dá)式方式處理;

        步驟5:疑問句的句型表達(dá)式方式處理.

        顯然, 在不同的模塊中, 一般句與疑問句的句型表達(dá)式即使相同, 它們的譯文輸出表達(dá)式卻不相同.例如,“你們是學(xué)生.”與“你們是學(xué)生?”句型表達(dá)式都是“pvn”, 但在不同的模塊處理后, 譯文輸出表達(dá)式為yy(1)yy(2)yy(3)和 yy(2)yy(1) yy(3).

        3 漢英機器翻譯的自動調(diào)序問題

        調(diào)序指的是要翻譯的英語句子與漢語句子單詞表示的順序不同, 當(dāng)然這就需要程序自動處理, 完成調(diào)序.如果設(shè)一個英語單詞由yy(i)表示, 漢英句型轉(zhuǎn)換的機器翻譯句子的順序有下列情況:

        (1) 要翻譯的漢語句子單詞順序與生成的英語句子單詞順序相同.

        舉例:要把“現(xiàn)在我們詳細(xì)介紹計算機”, 這一漢語句子翻譯成英語句子, 首先建立句型表達(dá)式, zs = "dpdvn".其中, 第一個d是“現(xiàn)在”這一單詞的詞性標(biāo)注符; p是“我們” 的詞性標(biāo)注符; 第二個d是“詳細(xì)”的詞性標(biāo)注符; v是“介紹”的詞性標(biāo)注符; n是“計算機”的詞性標(biāo)注符.程序自動調(diào)序結(jié)果單詞順序任然是:yy(1)yy(2) yy(3)yy(4)yy(5).

        (2)要翻譯的漢語句子單詞順序與生成的英語句子單詞順序不同.

        舉例:要把“計算機對生產(chǎn)過程帶來根本變化”, 這一漢語句子翻譯成英語句子, 首先建立句型表達(dá)式, zs ="njnnvan".其中, 第一個n是“計算機”這一單詞的詞性標(biāo)注符; j是“對” 的詞性標(biāo)注符; 第二個n是“生產(chǎn)”的詞性標(biāo)注符; 第三個n是“過程”的詞性標(biāo)注符; v是“帶來”的詞性標(biāo)注符; a是“根本”的詞性標(biāo)注符; 最后的n是“變化”的詞性標(biāo)注符.程序?qū)⒆詣诱{(diào)序, 結(jié)果機器翻譯句子單詞順序成為:yy(1)yy(5) yy(6) yy(7)yy(2) yy(3)yy(4).即:Computer brought complete change to production process.

        4 關(guān)于“am; is; are”的處理

        在機器翻譯的漢譯英中, “是”動詞會遇到“am; is; are”的選擇, 人工翻譯按照人稱規(guī)則很容易選擇.為使翻譯程序?qū)崿F(xiàn)自動處理, 我們設(shè)計了如下子算法:

        若翻譯的漢語句動詞為“是”, 轉(zhuǎn)入子程序SDCCL

        yxz1:要翻譯生成的英語句“是”相鄰單詞出現(xiàn)“I”, “是”動詞選擇“am”, 轉(zhuǎn)yxz10;

        Yxz2:要翻譯生成的英語句“是”相鄰單詞出現(xiàn)“she”, “是”動詞選擇“is”, 轉(zhuǎn)yxz10;

        Yxz3:要翻譯生成的英語句“是”相鄰單詞出現(xiàn)“he”, “是”動詞選擇“is”, 轉(zhuǎn)yxz10;

        Yxz4:要翻譯生成的英語句“是”相鄰單詞出現(xiàn)“this”, “是”動詞選擇“is”, 轉(zhuǎn)yxz10;

        Yxz5:要翻譯生成的英語句“是”相鄰單詞出現(xiàn)“her”, “是”動詞選擇“is”, 轉(zhuǎn)yxz10;

        Yxz6:要翻譯生成的英語句“是”相鄰單詞出現(xiàn)“you”, “是”動詞選擇“are”, 轉(zhuǎn)yxz10;

        Yxz7:要翻譯生成的英語句“是”相鄰單詞出現(xiàn)“they”, “是”動詞選擇“are”, 轉(zhuǎn)yxz10;

        Yxz8:要翻譯生成的英語句“是”相鄰單詞出現(xiàn)“we”, “是”動詞選擇“are”, 轉(zhuǎn)yxz710;

        Yxz9:其它情況, “是”動詞使用“is”;

        Yxz10:子程序退出.

        5 結(jié)束語

        漢英機器翻譯的研究和軟件開發(fā)很難, 主要原因有許多基本問題的研究必須先解決.例如英語字母大小寫譯文中怎么加入; 被動語氣和主動語氣; “the”怎么加入和復(fù)數(shù)問題等等都是開發(fā)軟件需要面臨的問題.當(dāng)然, 最難的還是單詞的多義、漢語句子自動分詞的歧義問題和句子語義問題.我們充分認(rèn)識到, 由于不同國家、不同民族的自然語言發(fā)展有上千年歷史、他們的思維理念和傳統(tǒng)的一些文化方式肯定有不同點, 這就使機器翻譯兩種語言對于許多不同的部分, 不僅僅是單詞和短語, 也不僅僅是漢譯英, 英譯漢也會遇到同樣的問題.例如, How do you do ?

        人可以克服這個障礙, 計算機軟件怎么辦?如果不特殊處理, 只能翻譯成“你怎么樣?”這類需要研究和解決的問題不少.

        既然機器翻譯被列為本世紀(jì)要解決的科技難題之一.我們相信:只要相關(guān)科技人員努力去做, 隨著研究的深入, 隨著科技的進(jìn)一步發(fā)展, 隨著時間的推移, 許多問題都會解決, 機器翻譯的最終目標(biāo)一定會達(dá)到.

        [1]WANG,CHAO, MICHAEL,COLLINS, et al.Chinese syntactic reordering for statistical machine translation[C].In Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning(EMNLP-CoNLL), 2007:737-745.

        [2]XIONG DEYI, MIN ZHANG, AITI AW, et al.A linguistically Annotated Reordering Model for BTG-based Statistical Machine Translation[C].In Proceedings of ACL-08:HLT,Short papers (Companion Volume), USA: Columbus,Ohio, 2008: 149-152.

        [3]楊憲澤.漢英機器翻譯中短語處理與譯文生成研究[J].西南民族大學(xué)學(xué)報: 自然科學(xué)版, 2013: 39(3) :456-460.

        [4]楊憲澤.一種混合式機器翻譯方法的分析研究[J].計算機工程與科學(xué), 2012: 34(2): 168-171.

        [5]楊憲澤.機器翻譯的一些難點探討[J].西南民族大學(xué)學(xué)報: 自然科學(xué)版, 2011: 37(3) :447-451.

        [6]楊憲澤.混合式機器翻譯中單詞處理的一些技術(shù)探討[J].科技通報, 2011: 27(1): 101-104.

        Study on some technique processing of Chinese-English syntactic transfer machine translation

        YANG Xian-ze
        (School of Computer Science and Technology, Southwest University for Nationalities, Chengdu 610041, P.R.C.)

        The syntactic transfer machine translation involves many technologies.This paper comprises four parts.The first part gives a boundary problem treatment methods of automatic words segmentation.The second part studies the general and interrogative sentence construction.The three part is a research on some treatment methods of Chinese-English machine translation target-language generation.The four part presents a kind of processing method of verbs such asam, is, are.

        machine translation; boundary problem; syntactic transfer; target-language generation

        TP391.2

        A

        1003-4271(2014)02-0271-03

        10.3969/j.issn.1003-4271.2014.02.20

        2014-01-08

        楊憲澤(1954-), 男, 四川成都人, 教授, 研究方向: 自然語言處理與數(shù)據(jù)結(jié)構(gòu).

        國家自然科學(xué)基金面上項目(61379019); 中央高校科研平臺項目(11NPT02).

        猜你喜歡
        分詞表達(dá)式句型
        一個混合核Hilbert型積分不等式及其算子范數(shù)表達(dá)式
        表達(dá)式轉(zhuǎn)換及求值探析
        結(jié)巴分詞在詞云中的應(yīng)用
        智富時代(2019年6期)2019-07-24 10:33:16
        淺析C語言運算符及表達(dá)式的教學(xué)誤區(qū)
        值得重視的分詞的特殊用法
        強調(diào)句型的it和引導(dǎo)詞it有什么區(qū)別?
        高中英語表示比較和對照關(guān)系的句型
        高考分詞作狀語考點歸納與疑難解析
        議C語言中循環(huán)語句
        商(2012年11期)2012-07-09 19:07:55
        論英語不定式和-ing分詞的語義傳承
        北岛玲亚洲一区二区三区| 色窝窝免费播放视频在线| 欧美a级在线现免费观看| 亚洲一区极品美女写真在线看| 日本最新一区二区三区在线| 亚洲女同一区二区| 久久久久亚洲精品无码网址| 高清高速无码一区二区| 国产护士一区二区三区| 99久久99久久久精品齐齐| 午夜福利电影| 99久久精品久久久| 亚洲国产精品悠悠久久琪琪| 无码视频在线观看| 国产精品久久久久久久成人午夜| 日韩美女av二区三区四区| 美女人妻中出日本人妻| 国产亚洲日韩在线一区二区三区| 精品手机在线视频| 午夜精品一区二区三区视频免费看 | 亚洲视频观看一区二区| 一个人看的www片免费高清视频| 全部孕妇毛片| 久久午夜无码鲁丝片直播午夜精品 | 久久人妻少妇嫩草av蜜桃| 免费观看交性大片| 免费无码肉片在线观看| 成人国产自拍在线播放| 美女午夜福利视频网址| 变态 另类 欧美 大码 日韩| 偷亚洲偷国产欧美高清| 久久精品视频日本免费| 成人午夜福利视频| 在线观看欧美精品| 国产一级av理论手机在线| 国产玉足榨精视频在线观看| 精品福利视频一区二区三区| 丝袜 亚洲 另类 欧美| 国产成人一区二区三区乱| 福利体验试看120秒| 精品国免费一区二区三区|