亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語言學分析技術探究

        2016-04-29 00:00:00張雪
        教育·綜合視線 2016年38期

        機器翻譯實現(xiàn)過程中會涉及到形態(tài)自動分析方法、各種句法分析、語義分析等分析方法,是機器翻譯譯文質量的關鍵環(huán)節(jié)。

        形態(tài)自動分析

        形態(tài)自動分析主要包括詞例還原、詞目還原、詞性標注和詞性消歧四步驟。

        詞例還原是指自動分割出一個句子當中所有的單詞。英文中,詞與詞之間一般會有空格隔開,分割并非難事。如果是漢語,詞例還原用自動分詞方法即可。通過詞例還原以后,句子當中符號串變成詞例串,便利了形態(tài)分析過程。

        詞目還原是把詞的變體形式還原成單詞詞典存儲形式。這里詞目是指變體形式單詞,例如把復數(shù)形式單詞還原成單數(shù)形式(如translators- translator),把動詞的過去式或進行式改回動詞原形(如translated-translate),把形容詞的比較級改為沒有比較級時候形式(如easier-easy)。

        詞性標注是指為每個單詞指派一個詞類或詞匯類別進行標記。詞性標注與詞目還原均是形態(tài)分析最重要內容,同時詞性標注在語音識別技術與信息檢索技術中發(fā)揮重要作用。

        詞性標注難度大,歧義單詞較多。值得慶幸的是,40%歧義單詞可以消除歧義。詞性消歧是指消除詞的歧義性,具體是指詞多義性,多時態(tài)性。

        自動句法分析

        自動句法分析方法很多,例如基于上下文無關語法、基于特征結構、基于依存語法、基于轉移網(wǎng)絡等,簡要介紹一下基于轉移網(wǎng)絡自動句法分析。

        轉移網(wǎng)絡主要包括遞歸轉移網(wǎng)絡和擴充轉移網(wǎng)絡兩種。由于語言中嵌套結構比較復雜,有限狀態(tài)轉移網(wǎng)絡難以處理這種情況,所以必須對有限狀態(tài)轉移網(wǎng)絡做一些改進,便出現(xiàn)了遞歸性轉移網(wǎng)絡。遞歸性網(wǎng)絡是有限轉移網(wǎng)絡擴充來的,是把單個弧用一個弧串表示,再用子網(wǎng)絡表示這個弧串。然后通過子網(wǎng)絡的名稱來調用并遍歷此弧串,從而變成遞歸性網(wǎng)絡。遞歸性轉移網(wǎng)絡自身局限性是該網(wǎng)路不能處理好詞序調整問題。有時候源語言與目標語言的詞序恰好相反,例如源語言修飾詞在前,但是目標語言的修飾詞在后,這時候必須要把相應修飾詞對應起來,這樣一來在網(wǎng)絡一側分析源語言的修飾詞,在網(wǎng)絡另一側還要生成對應目標語言的修飾詞。顯然,這要增加弧才能處理這個問題,如果修飾詞不止一個,那么遞歸性網(wǎng)絡分析變得很復雜。其實解決這個問題關鍵在于對源語言前置修飾詞翻譯的時候,對所修飾的名詞進行翻譯成目標語言所對應名詞之后,把翻譯的修飾詞置于目標語言名詞之后。

        語義自動分析

        語義分析法有很多,例如句法驅動語義分析、淺層語義分析、語義語法等。語義分析通常分為四個步驟:把詞的一階謂詞驗算表達式附著至樹形圖的詞匯單元之上;把樹形圖無分叉子樹子女節(jié)點上語義值復制給父母節(jié)點;把類似函數(shù)的一個表達式附著至句子中心動詞之上,然后用該表達式處理此動詞的一個或者多個子女節(jié)點;將帶有邏輯量詞的表達式用復雜項處理,并將處理的表達式作為一個單獨項處理。

        句法驅動語義分析是基于組成性原則方法,弗雷格認為:句子的含義可以是句子幾個部分意義組合而成。即句子由詞組成,各個單詞的含義組合當然是句子代表的意義。值得思考的是,一個句子含義不僅依賴各個詞的含義,還與詞的順序以及詞與詞之間的關系有關,與句法結構有關。所以從句法角度驅動語義分析,是該分析法基本依據(jù),大致流程是:對輸入句子經(jīng)過剖析器進行句法分析,把結果作為語義分析器輸入,經(jīng)過語義分析器后便把其結果作為輸出。該過程被稱為“管道流方法”。句法驅動語義分析用到組成性原則時候,語義組成成分應和句法組成成分匹配。

        語用自動分析

        語用自動分析中語用指的是語言和使用所處環(huán)境之間的關系。這里使用所處環(huán)境包括話語上下文、人和物。其涉及到話語結構、聽話者如何理解話語對象以及語言指示或者回指人和物的內容。語用分析主要有所指判定和文本連貫的分析方法。

        所指判定是對所指語判定所指對象過程。一般句子與句子之間均存在某種關聯(lián),并非孤立存在的,而有時候靠單獨句子根本不能理解所指對象。例如“Tim told Tom that he had passed the examination”的he是指Tim還是指Tom?無法判定。如果前面有語句“Tom was worried about his examination”,則可以斷定he是指Tom。一般采用折半加權算法來判定代詞所指對象,具體過程為:(1)搜集所有可能所指對象;(2)排除和代詞在數(shù)、性不一致和句內句法同指約束的所指對象;(3)把話語模型在更新階段計算的顯著值和使用角色平行和提前指代的代詞顯著權重值相加,并計算所指對象總的顯著值;(4)選擇顯著值最高所指對象作為最終代詞指代對象。如果有顯著值相同則選擇靠的最近(指字符串位置)所指對象作為最終代詞指代對象。

        溯因推理既然是基于不可靠推理,那么就需要找出一種最佳解釋。一種策略是基于概率模型,通過計算相關概率參數(shù)來選出最佳解釋,不過概率模型前提需要一些事件語料庫,否則會出問題。另一種策略是基于啟發(fā)式策略。把假設數(shù)目最少的作為最佳解釋,也可以把最具體的輸入特征作為最佳解釋。第三種策略是基于概率模型和啟發(fā)式策略的混合策略。文本連貫中計算機模型構建十分重要,但現(xiàn)有推理方法難以覆蓋范圍更廣的應用領域,有待進一步研究。

        (作者單位:遼寧省機電工程學校)

        国产精品亚洲二区在线看| 国产91精品高潮白浆喷水| 中文字幕一区二区精品视频 | 天堂网www在线资源| 无码高清视频在线播放十区| 国产熟妇一区二区三区网站| 蜜桃网站入口可看18禁| 性欧美丰满熟妇xxxx性久久久| 国产精品久久国产三级国不卡顿| 亚洲av片不卡无码久久| 女同亚洲女同精品| 日本一区二区三区啪啪| 亚洲第一黄色免费网站| 国产伦精品免编号公布| 精品国产午夜福利在线观看| 久久久国产精品粉嫩av| 免费看黄片的视频在线观看| 国产草草影院ccyycom| 色婷婷久久综合中文久久蜜桃av| 欧美久久久久中文字幕| 国产精品av网站在线| 日本妇人成熟免费2020| 丰满岳妇乱一区二区三区| 欧美日韩中文亚洲另类春色| 日本高清在线播放一区二区| 手机看黄av免费网址| 婷婷综合缴情亚洲| 久久久精品国产视频在线| 视频一区二区三区黄色| 无码色av一二区在线播放| 亚洲av无码一区二区三区在线 | 亚洲国产99精品国自产拍| 亚洲综合新区一区二区| 国产a在亚洲线播放| 国产精品对白交换视频| 国产美女av一区二区三区| 亚洲婷婷久悠悠色悠在线播放| 熟女体下毛毛黑森林| 欧美韩国精品另类综合| 精品成人av人一区二区三区| 久久午夜av一区二区三区|