亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺析機(jī)器翻譯瓶頸及研發(fā)趨勢(shì)

        2019-09-10 17:43:56安寧
        新教育論壇 2019年35期
        關(guān)鍵詞:歧義知識(shí)庫(kù)瓶頸

        機(jī)器翻譯(Machine Translation)是翻譯人員利用多種計(jì)算機(jī)翻譯軟件,將源語(yǔ)言(Source Language)文件,轉(zhuǎn)換成另外一種目標(biāo)語(yǔ)(Target Language)或者多種目標(biāo)語(yǔ)言,翻譯人員借助計(jì)算機(jī)器翻譯一直是人工智慧領(lǐng)域中的重要研發(fā)方向。機(jī)器翻譯進(jìn)行翻譯時(shí)涉及到自然語(yǔ)言(Natural Language,如中文、英文等)的加工合成,幾乎已經(jīng)覆蓋自然語(yǔ)言處理的所有技術(shù),并且有較為明確具體檢測(cè)手段,可以當(dāng)做自然語(yǔ)言處理技術(shù)的研發(fā)項(xiàng)目。不可避免的一個(gè)重要問(wèn)題就是機(jī)器翻譯若要占領(lǐng)翻譯市場(chǎng),就必須要面對(duì)來(lái)自人工翻譯者的挑戰(zhàn)。按照機(jī)器翻譯的流程,翻譯成品要譯者人工潤(rùn)色和審核,這部分的人力成本將會(huì)占實(shí)際運(yùn)作成本的大部分。也就意味著能夠節(jié)省的時(shí)間必須多到一定程度,機(jī)器翻譯才能達(dá)到實(shí)用化的階段。在理想情況下,人工潤(rùn)色盡量無(wú)須參照原文,直接進(jìn)行修飾即可。

        機(jī)器翻譯總體上可以分為直接式(Direct)、轉(zhuǎn)換式(Transfer)及中介語(yǔ)(Interlingua)三大類(lèi),實(shí)操一般都是采用轉(zhuǎn)換式。轉(zhuǎn)換式機(jī)器翻譯流程大致可分為三個(gè)階段:分析、轉(zhuǎn)換和生成。自然語(yǔ)言處理最大的難處,在于自然語(yǔ)言本身復(fù)雜更新較快,而且例外繁多。因此機(jī)器翻譯所面對(duì)的主要問(wèn)題,可以歸納為兩大項(xiàng):(1)文句中歧義(Ambiguity);(2)語(yǔ)法不合設(shè)定(Ill-formedness)現(xiàn)象。自然語(yǔ)言的語(yǔ)法和語(yǔ)意中需通過(guò)上下文線(xiàn)索加以判斷。以下是兩類(lèi)問(wèn)題:

        問(wèn)題一,歧義。就是一個(gè)句子有多種解釋。我們?nèi)粘I钪胁恢挥X(jué)地充滿(mǎn)了歧義句。雖然人們可以根據(jù)常識(shí)正確判斷句意,但是對(duì)于依照文字規(guī)則來(lái)理解句子的計(jì)算機(jī)翻譯軟件來(lái)說(shuō),這就是一個(gè)歧義句。在做句子分析時(shí),幾乎在每一個(gè)環(huán)節(jié)(如斷詞、句法分析、語(yǔ)意分析等)都可能出現(xiàn)歧義。單個(gè)字或者詞的解釋往往會(huì)因前后的內(nèi)容產(chǎn)生不同的意思。除此之外,判斷句義依靠的線(xiàn)索在不同范圍。因此在機(jī)器翻譯過(guò)程中,若采用線(xiàn)性流水式的處理程序(Pipelined Architecture),則前面的模塊則無(wú)法做出確定性的(Deterministic)判斷,而須盡量多地保留候選者,而讓后面的模塊進(jìn)行處理。所以,最終判斷的時(shí)機(jī)應(yīng)盡量延后,在累積足夠信息后,再選擇要使用的方法。這樣才不會(huì)在開(kāi)始就把正確的譯法排除到考慮范圍之外。

        問(wèn)題二,所謂的語(yǔ)法,是語(yǔ)言學(xué)家,依靠目前擁有的大量語(yǔ)料,歸納總結(jié)出的一些規(guī)則。這些規(guī)則是不完整的,往往有許多的例外。而且語(yǔ)言是一直在變遷的,無(wú)法要求語(yǔ)言的使用者,每字每句都合乎這些人為加工訂定的文法,自然地也難以避免這樣的情況出現(xiàn)在翻譯稿件中。這些與設(shè)定語(yǔ)法的例子不符的地方包括不明的字匯,如新生的專(zhuān)有名詞,和舊字新法的。這些現(xiàn)在部分來(lái)自單純的疏失,例如錯(cuò)字、漏字、贅字、轉(zhuǎn)檔或傳輸時(shí)產(chǎn)生的亂碼,或是不慎混入的標(biāo)簽(tag),也有些是已被大眾所接受的字匯和語(yǔ)法。理想化的機(jī)器翻譯,必須能夠處理這些與設(shè)定語(yǔ)法不符的問(wèn)題。

        如何解決上述的歧義或語(yǔ)法問(wèn)題,則需要大量知識(shí)。這些大量知識(shí)的管理,分類(lèi),儲(chǔ)存和應(yīng)用,是建立機(jī)器翻譯時(shí)最大重點(diǎn)和難點(diǎn)。我們首先要將這些包含在語(yǔ)言學(xué)之內(nèi)(intra-linguistic)、跨語(yǔ)言學(xué)的(inter-linguistic),以及超乎語(yǔ)言學(xué)之外(extra-linguistic)的知識(shí)抽取、表達(dá)出來(lái),解釋上述的語(yǔ)法和歧義問(wèn)題,而且還要維護(hù)這個(gè)龐大的知識(shí)庫(kù)。所以,我們要建立的知識(shí)庫(kù)必須包羅萬(wàn)象,吸收涵蓋各領(lǐng)域、各層面的知識(shí)。它本身就是一項(xiàng)艱難復(fù)雜的工作。也就是說(shuō)知識(shí)庫(kù)的建設(shè)維護(hù)是機(jī)器翻譯系統(tǒng)開(kāi)發(fā)最大的瓶頸。

        一般來(lái)說(shuō)知識(shí)的取得,和我們表現(xiàn)知識(shí)的方式有著緊密的聯(lián)系。知識(shí)表現(xiàn)方式可以有很多不同的存在形式。其一就是加入知識(shí)庫(kù)的規(guī)則,規(guī)則系統(tǒng)是由事先以人力建立好的大量規(guī)則所構(gòu)成。在進(jìn)行機(jī)器翻譯時(shí),翻譯軟件根據(jù)這些規(guī)則,進(jìn)行二擇判斷,進(jìn)行分析、轉(zhuǎn)換和生成步驟,最后給出明確答案。這種方法被機(jī)器翻譯廣泛采用。它的優(yōu)點(diǎn)在于貼近人的直覺(jué),容易理解,遵循已有的語(yǔ)言學(xué)知識(shí)和規(guī)則,充分利用已有的經(jīng)驗(yàn)和研究結(jié)果。逐漸使其參數(shù)化,不同的語(yǔ)言現(xiàn)象用幾率掃描進(jìn)行描述,積累量足夠大時(shí),語(yǔ)言模型就自然建立起來(lái)。其最大的優(yōu)點(diǎn)在于通過(guò)參數(shù),讓計(jì)算機(jī)翻譯軟件在不同的條件下根據(jù)不同的偏好進(jìn)行解釋和加工,依靠參數(shù)估算任務(wù)給計(jì)算機(jī)翻譯軟件進(jìn)行。

        機(jī)器翻譯的未來(lái),研發(fā)高品質(zhì)的翻譯系統(tǒng),需要的知識(shí)庫(kù)是巨大并且瑣碎的。對(duì)于知識(shí)的獲取和管理,是機(jī)器翻譯系統(tǒng)研發(fā)的瓶頸。近些年來(lái),機(jī)器翻譯系統(tǒng)的研發(fā),已經(jīng)漸漸地由規(guī)則庫(kù)的方式轉(zhuǎn)變成為參數(shù)化方式,并且其優(yōu)越性已經(jīng)得到了證明,也逐漸成為了主流。隨著計(jì)算機(jī)行業(yè)的發(fā)展,計(jì)算機(jī)硬件性能的大幅提升,機(jī)器翻譯軟件已經(jīng)突破了計(jì)算能力和記憶容量的限制。與此同時(shí),人們生活和語(yǔ)言的發(fā)展使得語(yǔ)料庫(kù)的規(guī)模也在爆炸似的增長(zhǎng),由譯者來(lái)制定和模擬模型,利用計(jì)算機(jī)的處理優(yōu)勢(shì)進(jìn)行語(yǔ)料庫(kù)的加工,可以大大提高計(jì)算機(jī)學(xué)習(xí)效率,降低知識(shí)獲取和管理的難度。這也是對(duì)機(jī)器翻譯研發(fā)瓶頸的突破。放眼未來(lái),如果能構(gòu)建精準(zhǔn)的模型,提高語(yǔ)言融合的鍥合度,利用合適的規(guī)則抽取語(yǔ)料庫(kù)中相關(guān)的知識(shí),可以在專(zhuān)業(yè)特種行業(yè)領(lǐng)域發(fā)揮巨大的作用,提供高品質(zhì)的翻譯。如此一來(lái),機(jī)器翻譯最終可以擁有廣泛的實(shí)用化領(lǐng)域和空間,也必將占有相當(dāng)大的翻譯市場(chǎng)份額。

        作者簡(jiǎn)介:安寧(1980.01-),男,漢族,吉林長(zhǎng)春人,吉林建筑大學(xué)國(guó)際合作與交流碩士,講師,從事外國(guó)語(yǔ)言文學(xué),機(jī)器翻譯研究。

        猜你喜歡
        歧義知識(shí)庫(kù)瓶頸
        eUCP條款歧義剖析
        基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
        English Jokes: Homonyms
        突破霧霾治理的瓶頸
        高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
        突破瓶頸 實(shí)現(xiàn)多贏
        “那么大”的語(yǔ)義模糊與歧義分析
        基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
        如何渡過(guò)初創(chuàng)瓶頸期
        繞過(guò)瓶頸
        国产精品麻豆一区二区三区| 日本欧美小视频| 伊人狠狠色j香婷婷综合| 国产特黄a三级三级三中国| www国产亚洲精品| 亚洲精品92内射| 亚洲综合色区无码专区| 国产一区二区一级黄色片| 中文字幕一区二区三区的| 熟妇激情内射com| 波多野结衣视频网址| 97人妻蜜臀中文字幕| 日本午夜理论片在线观看| 黑森林福利视频导航| 一级午夜视频| 久久少妇呻吟视频久久久| 亚洲最大免费福利视频网| 人人爽人人爽人人爽人人片av| 亚洲另类欧美综合久久图片区 | 国产精品一区二区三区色| 91精品国产乱码久久中文| 亚洲娇小与黑人巨大交| 中文字幕日韩高清| 91九色国产在线观看| 色综合天天综合网国产成人网| 3d动漫精品一区二区三区| 久久精品国产亚洲av大全相关| 精品精品国产一区二区性色av| 亚州性无码不卡免费视频| 亚洲不卡av不卡一区二区| 日本亚洲一级中文字幕| 亚洲精品有码日本久久久| 久久er99热精品一区二区| 亚洲AV无码秘 蜜桃1区| 国产精品自拍视频免费观看| 免费国产黄网站在线观看视频| 国产免费午夜a无码v视频| 最近亚洲精品中文字幕| 森中文字幕一区二区三区免费| 饥渴的熟妇张开腿呻吟视频| 精品少妇人妻成人一区二区|