亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        文心一言對漢語歧義的翻譯研究

        2024-05-07 10:56:41唐紅芳李婧怡
        名家名作 2024年6期
        關(guān)鍵詞:文心歧義語境

        唐紅芳 李婧怡

        [摘要] 語言歧義一直都是自然語言處理系統(tǒng)面臨的最大挑戰(zhàn)之一,最近百度推出的人工智能模型文心一言引起了大眾的關(guān)注。通過實證研究,分析文心一言在漢語歧義句方面的翻譯現(xiàn)狀,探討其在漢語歧義句翻譯方面的特點和不足,得出文心一言可以通過人為反饋對結(jié)果進行優(yōu)化,而且關(guān)注語言的使用習(xí)慣,讓表達更地道,但是翻譯比較單一,且沒有一致性。這讓人們更好地了解自然語言處理機制,優(yōu)化人工智能的性能,讓其更好地為人類所用,達到“人機合作”的理想局面。

        [關(guān)? 鍵? 詞] 漢語歧義;人機互動;文心一言;翻譯

        一、引言

        我國著名語言學(xué)家朱德熙先生認為:“一種語言語法系統(tǒng)里的錯綜復(fù)雜和精細微妙之處往往在歧義現(xiàn)象里得到反映?!彪S著時代的發(fā)展,人工智能逐漸出現(xiàn)在生活中,比如機器翻譯、人機對話、智慧教學(xué)等,而語言是人機交流最基礎(chǔ)的媒介,自然語言的處理就變得十分關(guān)鍵。機器無法像人類一樣可以通過生活常識和對漢語的精準掌握來排除歧義,它只有掌握人類制定出來的一套消除歧義的規(guī)則才能破解這個難題。而機器翻譯就是一個不斷去除句子分析歧義的過程。因此,研究自然語言的歧義現(xiàn)象,并制定系統(tǒng)的消解歧義的規(guī)則,讓機器去掌握,是新時代語言學(xué)發(fā)展的一個關(guān)鍵方向。

        二、文獻綜述

        對于漢語的歧義研究最早可追溯到趙元任先生用英語發(fā)表的《漢語歧義問題》。此后,漢語研究者從多個方面對歧義進行了探討,主要有歧義定義、歧義類型、歧義格式、歧義比較和歧義消解方法等。劉悅怡等(2020)對歧義的分類文獻進行了詳細的梳理,將現(xiàn)代漢語的歧義類型劃分為語音歧義、詞匯歧義、句法歧義、語義歧義和語用歧義五大類,本文將按照此分類標準進行實驗。目前的歧義研究以書面語歧義為主,語用歧義的相關(guān)研究還不夠深入,且多注重口頭交際,書面交際中的語用歧義研究比較匱乏(尤天來,2022)。因此,這里主要探討兩個基本歧義層次,即詞匯歧義和句法歧義,這也是自然語言處理模型要面對的最基本的挑戰(zhàn)。

        目前對于人工智能在歧義句翻譯方面的研究還不多。劉海軍等(1997)基于全句翻譯的智能英漢機器翻譯系統(tǒng),構(gòu)造了一個語言環(huán)境以消除語境方面的歧義,如組合歧義、省略等語言現(xiàn)象。陳海東(2009)針對計算機翻譯系統(tǒng)中漢語詞匯切分的問題,提出在漢語標點中利用切分詞標點的解決方法。要想機器識別出漢語歧義句并準確翻譯成另外一種語言,需要大量的實證研究和推理,從而得到歧義消解的辦法。實際上,機器翻譯就是一個不斷去除句子分析歧義的過程(劉海軍等,1997)。

        根據(jù)上述文獻,研究人工智能對于漢語歧義句的翻譯現(xiàn)狀是有必要的。本文基于一篇研究ChatGPT語義模糊分析的實驗步驟,從漢語歧義角度出發(fā),讓文心一言翻譯一些典型的漢語歧義句,并對翻譯結(jié)果進行分析,探討其在漢語歧義句翻譯方面的特點和不足,進一步討論人工智能與語言學(xué)理論是否可以相適應(yīng)。

        三、結(jié)果與討論

        (一)詞匯歧義翻譯

        劉悅怡等(2020)認為,詞匯歧義是指由詞(字)形相同、意義不同的詞(字)所引起的歧義,且與詞匯結(jié)構(gòu)、句法結(jié)構(gòu)的差異無關(guān)。詞匯歧義又可進一步分為多音詞歧義和一詞多義歧義。比如說,“這是一本好書”,這句話中的“好”既可以是說書的“內(nèi)容”好,也可以是說書的本身完好、無損壞,兩者都是形容詞,所以這是一個詞類相同的一詞多義歧義。多音詞歧義只出現(xiàn)在書面語中,一旦讀出來就沒有歧義了,但是文心一言支持用戶語音輸入,因此這里不討論多音詞歧義的翻譯情況,只研究一詞多義造成的歧義現(xiàn)象。每個句子的實驗流程基本如下:(1)翻譯。(2)問是不是歧義句。(3)問句子中多義詞的含義。(4)再次翻譯這句話。

        首先,對它進行簡單句的測試,包括“桌子上放著蘋果”“菜不熱了”和“ 他走了一個小時了”,并判斷文心一言能否識別出其中的歧義現(xiàn)象,答案是不能。 像“桌子上放著蘋果”這句話中的“蘋果”既可以指水果,又可以指蘋果牌電腦,因此在沒有語境的情況下,這是一個歧義句。但是文心一言并沒有看出這里的歧義,堅持認為“蘋果”是指水果。這樣的情況在測試的三個例句中都有發(fā)生,文心一言都只能確認這個詞語最常見、用得最多的意思,對其進行英語翻譯也只提供了這一種翻譯方式,包括 “There is an apple on the table”,“The food is not hot anymore”,“He has been gone for an hour”。

        其次,通過多輪有意提問的方式,比如“有沒有可能‘菜不熱了中的‘熱字是作動詞表示加熱”等這種指向性的提問方式,獲得的反饋是積極的,通過人為提示,知道這個詞語可能還存在的幾個意思,不過也暗示用戶要提供更多的語境信息和明確表達自己的需求,才能避免句子歧義。但是也發(fā)現(xiàn)一個現(xiàn)象,即使它知道這是一個歧義句,其展現(xiàn)出來的歧義解釋有些不符合人們正常的思維規(guī)律,比如說對于“菜不熱了”中“熱”這個字的解釋是“菜已經(jīng)冷掉了”和“這不是一道熱菜”,后面一個解釋似乎不符合語言使用習(xí)慣,且已有文獻并未提供這個解釋(劉悅怡等,2020)。

        最后,在幾輪提問和獲得正向性反饋的基礎(chǔ)上,讓其再次翻譯一下這句話,并且提問方式換成了“這句話可以有哪些翻譯”,或許是受到提問中“哪些”這個詞的影響,一般會得到多種答案,大都包含了這個詞語不同意思的翻譯,并且對于用法沒那么常見的解釋,也會提供更加準確、地道的英語句子,比如說“他走了一個小時了”理解為“他已經(jīng)去世一個小時了”的話,比較直接的翻譯是“He has been dead for an hour”。但是這種翻譯并不符合英語的語用習(xí)慣,因此它建議翻譯成“He passed away an hour ago”。

        總的來說,文心一言很難識別出一詞多義歧義句,有時甚至還會提供錯誤的意思,但是通過人為有意的引導(dǎo)和提醒,它可以識別出這個多義詞的多重含義,說明文心一言具有根據(jù)用戶反饋從而提高回答準確度的能力,因此,我們可以通過有意識的訓(xùn)練提問方式,來獲得想要的答案,從而減少機器運行負擔。比如說,可以問“這句話有哪些翻譯”而不是“請翻譯一下這句話”,這樣得到的答案或許更符合我們的預(yù)期,也能擴寬知識量。

        (二)句法歧義翻譯

        句法歧義是指句子因結(jié)構(gòu)層次不同或句法成分之間的關(guān)系不同而產(chǎn)生的歧義,又可以細分為結(jié)構(gòu)層次歧義和結(jié)構(gòu)關(guān)系歧義(劉悅怡等,2020)。比如說,“小王和小張的同學(xué)”是典型的結(jié)構(gòu)層次歧義,句子由于層次切分的不同,可以產(chǎn)生兩種解釋,即“小王/和小張的同學(xué)”和“小王和小張的/同學(xué)”。像“學(xué)習(xí)文件”這句話,兩種解釋的結(jié)構(gòu)層次都相同,都是“學(xué)習(xí)/文件”,但是成分間的關(guān)系不同,“學(xué)習(xí)”和“文件”的關(guān)系既可以是偏正結(jié)構(gòu),也可以是動賓結(jié)構(gòu),因此稱為結(jié)構(gòu)關(guān)系歧義。這一部分我將分析五個句子,每個句子的分析步驟大致如下:(1)翻譯。(2)問是不是歧義句。(3)確定有歧義的部分。(4)再次翻譯這句話。

        首先分析一個結(jié)構(gòu)層次歧義句,在漢語中,“張三和李四的同學(xué)”屬于結(jié)構(gòu)層次歧義句,由于連詞“和”管轄領(lǐng)域的不同,其層次可以理解為(N1+和+N2)+的+N3,也可以理解為N1+和+(N2+的+N3),從而產(chǎn)生歧義,既可以表示“張三自己和李四的同學(xué)”,也可以表示“張三和李四兩個人的同學(xué)”,其中同學(xué)可能是一個,也可能是兩個或者很多個。當問文心一言這句話是不是歧義句時,它辨別了這是一個歧義句,然而它給出的歧義解釋并不全面,只包含 “張三和李四共同的同學(xué)”和“張三和李四各自的同學(xué)”這兩個意思。當繼續(xù)問能不能有“張三自己和李四的同學(xué)”這個意思時,它同意存在這個解釋。從最初的翻譯“Classmate of Zhang San and Li Si”增加了“Zhang Sans classmate and Li Si's classmate”另一種英文表述。因此,對于漢語中的結(jié)構(gòu)層次歧義句翻譯,我們可以在詢問時組織好措辭,盡可能簡明地表明問題,包括詞語的單復(fù)數(shù)形式、句子切分后的語序等,把潛在的歧義都顯化出來,以獲得更加準確的結(jié)果。

        同樣的結(jié)構(gòu)層次歧義句“咬死獵人的狗”卻有不同的實驗結(jié)果,一開始它不認為這是歧義句,翻譯出來的句子也是 “The dog that bit the hunter to death”。后面經(jīng)過多次提問,它認為這句話中的歧義問題可以通過上下文或者語境來消解,因此在實際使用中一般不會造成誤解。而且最后給出的翻譯都包含了這兩種釋義,即“The dog that bit the hunter to death”“The hunters dog that was killed by an attacking animal”“The hunters dog that was bitten and killed by another dog”這再一次印證了有效的提問方式和人為的反饋可以提高文心一言文本內(nèi)容生成的準確性。

        對于結(jié)構(gòu)關(guān)系歧義,我選取了兩種關(guān)系不同的短語,即“學(xué)生家長”這種并列或偏正結(jié)構(gòu),以及“學(xué)習(xí)文件”這種偏正或動賓結(jié)構(gòu)。第一種關(guān)系歧義句,它只識別出了偏正結(jié)構(gòu),即“學(xué)生的家長”,翻譯結(jié)果為“Students parents” or “students parents”。經(jīng)過提醒后,也指出并列結(jié)構(gòu)的解釋需要依靠語境,而且這是一個復(fù)數(shù)概念,或許是上一輪回答有提到“復(fù)數(shù)”概念,最后讓它再次翻譯的時候,“學(xué)生”都是復(fù)數(shù)形式,不同于第一次給出的有單數(shù)形式。第二種卻恰恰相反,最先給出的翻譯 “l(fā)earned document”到最后直接沒有了,只剩下動賓結(jié)構(gòu)的形式,這要歸于中間多輪刻意的詢問。它可以準確識別出這句話存在兩種解釋方式,即“學(xué)習(xí)這份文件的內(nèi)容”和“將文件作為學(xué)習(xí)資源”,但是在翻譯環(huán)節(jié)出現(xiàn)了錯誤,只翻譯出了動賓結(jié)構(gòu)這種形式。

        盡管文心一言前后回答存在出入,但經(jīng)過多次的詢問之后,其最后給出的翻譯結(jié)果也不十分完美,但是這對研究這個模型是如何自我學(xué)習(xí)有重要的作用,而且還有助于用戶學(xué)習(xí)如何與其互動,以達到更好的效果。文心一言可以通過人為干預(yù)來提升其回答的準確性,因此可以讓用戶自主學(xué)習(xí)有效的交流方式和提問方式,這或許不失為一個好辦法。

        四、歧義句生成測試

        想了解文心一言對于歧義句的概念界定,最直接的辦法就是讓其自己生成一個歧義句,結(jié)果它生成的句子是“他背著我去了一趟書店”,顯然這是一個歧義句,而且是多音詞歧義,但它給出的兩種解釋都屬于一個意思,即“他偷偷地去了書店,不想讓我知道”和“他去書店的時候,我是知道的,但是我是在店外等他,而他沒有告訴我他去書店干了什么”。因此,它對于漢語歧義句的定義完全沒概念,只知道有幾種不同的解釋方式就算作歧義句,不管解釋得對與否。這或許也是導(dǎo)致它前后回答矛盾、得出的翻譯結(jié)果不夠全面的原因之一,此次實驗的全部數(shù)據(jù)總結(jié)如下表:

        表格包含了文心一言對于漢語歧義句的翻譯測試結(jié)果,其中正確識別(解釋)行列是指通過提示后的結(jié)果,正確翻譯是指最后測試的翻譯結(jié)果。實驗結(jié)果表明文心一言可以借助用戶的提問方式和反饋來優(yōu)化其生成結(jié)果。不過它也多次提出,消除歧義的關(guān)鍵是充足的語境。但是,它正確且全面地把歧義句翻譯出來的比率只有識別的一半,即42. 8%,主要表現(xiàn)在句法歧義方面。英文的句法習(xí)慣不同于中文,可能受提問方式的影響,從而影響對中文歧義句的判斷。

        五、結(jié)論

        本文從漢語歧義角度出發(fā),讓文心一言翻譯一些典型的漢語歧義句,并對翻譯結(jié)果進行分析,探討人工智能在漢語歧義句翻譯方面的特點和不足,結(jié)果表明文心一言在歧義句翻譯方面有利有弊,它可以通過人為反饋對結(jié)果進行優(yōu)化,而且關(guān)注語言的使用習(xí)慣,讓表達更加地道,但是翻譯比較單一,且沒有一致性,答案多變不固定,有時還會出現(xiàn)有歧義的英語句子。然而,實驗也會存在一些局限性,文心一言作為一款人工智能模型,一直在優(yōu)化迭代,導(dǎo)致這個實驗中的一些數(shù)據(jù)和結(jié)果可能會與未來的模型存在出入。這需要做更多研究和實驗,以更好地了解和發(fā)展自然語言處理機制,優(yōu)化人工智能的性能,讓其更好地為人類所用,達到“人機合作”的理想局面。

        參考文獻:

        [1]陳海東.計算機翻譯存在的困難及解決方法新探[J].廣東科技,2009,18(16):87-88.

        [2]賈光茂.英漢語量詞轄域歧義的認知語法研究[J].現(xiàn)代外語,2020,43(4):451-462.

        [3]劉海軍.智能機器翻譯中的語境信息處理[D].北京:中國科學(xué)院研究生院(計算技術(shù)研究所),1997.

        [4]劉悅怡,宮齊.現(xiàn)代漢語歧義類型的再討論[J].暨南學(xué)報(哲學(xué)社會科學(xué)版),2020,42(5):24-32.

        [5]尤天來.言語行為理論視角下的語用歧義策略研究[D].長春:吉林大學(xué),2022.

        [6]于秒,周思敏,龍佳欣.內(nèi)隱韻律與語境對漢語均衡型歧義結(jié)構(gòu)歧義消解的作用[J].心理與行為研究,2022,20(6):739-746.

        [7]趙帥,鹿士義,陳婧,等.母語為韓語的漢語學(xué)習(xí)者加工“V+N1+的+N2”歧義結(jié)構(gòu)的眼動研究[J].心理與行為研究,2019,17(1):15-23.

        作者簡介:

        唐紅芳(1968—),女,漢族,湖南瀏陽人,教授,研究方向:語用學(xué)、應(yīng)用語言學(xué)、外語教學(xué)。

        李婧怡(2000—),女,漢族,湖南岳陽人,碩士研究生在讀,研究方向:外國語言學(xué)及應(yīng)用語言學(xué)。

        作者單位:湖南工業(yè)大學(xué)

        猜你喜歡
        文心歧義語境
        eUCP條款歧義剖析
        中國外匯(2019年12期)2019-10-10 07:26:58
        冬天來啦
        文心雜記
        請不斷修煉你的“文心”
        中國篆刻(2017年5期)2017-07-18 11:09:30
        English Jokes: Homonyms
        語言學(xué)習(xí)中語境化的輸入與輸出
        “那么大”的語義模糊與歧義分析
        跟蹤導(dǎo)練(三)2
        論幽默語境中的預(yù)設(shè)觸發(fā)語
        亚洲中文字幕av一区二区三区人 | 亚洲一级无码AV毛片久久| 日本少妇又色又紧又爽又刺激| 久久日日躁夜夜躁狠狠躁| 精品少妇无码av无码专区| 欧美精品一区二区性色a+v| 亚洲国产精品久久久久婷婷软件| 国产丝袜美腿在线视频| 欧美黑人又大又粗xxxxx| 双乳被一左一右吃着动态图| 中文字幕精品一二三区| 亚洲综合小综合中文字幕| 成人无码av免费网站| 中文字幕日韩一区二区三区不卡 | 亚洲精品在线观看一区二区 | 国产成人久久精品流白浆| 日韩麻豆视频在线观看| 乱中年女人伦av一区二区| 亚洲国产av一区二区三区四区| 国产经典免费视频在线观看| 亚洲av熟女中文字幕| 国产精品理论片| 欧美在线综合| 一区二区视频资源在线观看| 一边摸一边做爽的视频17国产| 国产情侣久久久久aⅴ免费| 亚洲av不卡电影在线网址最新 | 九九精品国产99精品| 免费国产一区二区视频| 无码精品人妻一区二区三区av| 欧美亚洲日本在线| 亚洲av成人无码一区二区三区在线观看 | 中文字幕成人精品久久不卡91| 成人欧美一区二区三区在线观看| 亚洲精品国偷拍自产在线观看蜜臀 | 亚洲国产欧美久久香综合| 日本少妇熟女一区二区| 日本大片免费观看视频| 国产精品视频久久久久| 中文人妻av大区中文不卡| 久久本道久久综合伊人|