亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機器翻譯質量評估與譯后編輯策略研究以中日專利文本為中心

        2025-08-21 00:00:00譚洪鑫
        中國科技術語 2025年3期
        關鍵詞:專業(yè)術語文心縮略語

        中圖分類號:H085;H315.9;TP391.2 DOI:10.12339/j. issn.1673-8578.2025.03.012

        Machine Translation Quality Assessment and Post-Editing Strategies :A Case Study of Chinese-Japanese Patent Texts//TAN Hongxin

        Abstract:WiththeincreasingfrequencyofscientificexchangesbetweenChinaandJapan,thedemandforpatentdocumentsandheir translatiohasgoapidlynteontextoftewidespradaplcationofachetranslationtisarticularlyimporattloe themachine translationof patentexts.Thisstudyselected Gogle Translate,Wenxiyiyan(4.O)and ChatGPT(4.O)tofocusonanalyzingtheirtranslationofprofesionaltermsinthefieldofelectroniccommuications.Combining theBLEUautomaticevauationindexandmulti-personmanual.Wecomparedthetranslationefectsofthereemacines,summarizedthemistranslationfeaturesand proposed corresponding post-editing strategies.

        Keywords: patent text; Terminology Translation; machine translation quality assessment; post-editing strategy

        近年來,電子通信領域專利翻譯需求激增,人才供不應求。同時神經網絡機器翻譯(NMT)與生成式人工智能(GAI)的快速發(fā)展為翻譯界帶來新挑戰(zhàn)與機遇。目前市場主流翻譯系統(tǒng)包括Google翻譯、DeepL、百度翻譯等,而ChatGPT、文心一言等GAI也備受翻譯界關注。

        專利文本兼具科技與法律文本特性,對表述標準化程度與術語準確性有較高要求。胡開寶、李翼指出,機器翻譯適用于特定領域的程式化或信息性文本[1]。而杜金華、張萌揭示未來翻譯市場中,“機器翻譯 + 譯后編輯”模式將成主流[2,提高機器譯文精度與翻譯效率成為關鍵課題。

        本研究構建中日電子通信領域對照語料庫,選取主流翻譯引擎Google翻譯,以及生成式人工智能ChatGPT(4.0)文心一言(4.0)作為翻譯系統(tǒng),運用Python計算BLEU值,結合基于《專利文獻機器翻譯質量評價手冊》的多人人工評估,重點分析專業(yè)術語的翻譯,以期提高專利機器翻譯的質量和效率。

        1 研究設計

        1.1 文本選擇

        本研究創(chuàng)建初始對照語料庫,包含40件2020-

        2024年間中國國家知識產權局電子通信領域專利文本的200句(180句非長句,20句長句,長句定義為70字以上3)中文原文、參考譯文及機器譯文。參考譯文源自日本特許局官方文件及人工翻譯校對,機器譯文均于2024年7月31日輸出。

        1.2 機器選擇

        本研究選取NMT與GAI的機器代表:Google翻譯、文心一言(4.0)和ChatGPT(4.0)(以下簡稱文心一言、ChatGPT)。Google 翻譯自2016年采用神經網絡技術后成為主流NMT系統(tǒng),而文心一言和ChatGPT作為大規(guī)模語言模型的杰出典范,可實現多語種文本轉換。三者翻譯效果的異同及發(fā)展?jié)摿χ档锰骄俊?/p>

        1.3 評估方法

        戴光榮、劉思折將機器翻譯質量測評方法分為三類:自動化評價(如BLEU)、基于錯誤分類的人工評價及兩者結合的半自動評價[4]。本研究采用半自動評價方式以確??陀^嚴謹。BLEU作為n-gram匹配度算法,通過量化機譯與參考譯文的詞匯重合度(得分 0~1 之間)來反映譯文準確度,但仍存在同義替換不敏感等局限,需結合人工評估。人工評估依據日本專利局《專利文獻機器翻譯質量評價手冊》,為質量評估提供權威指南。

        1.4 研究步驟

        ① 構建中日專利平行語料庫; ② 對機器譯文進行自動化評估; ③ 基于手冊進行多人人工評估;

        ④ 對評估數據進行量化歸因分析; ⑤ 分析誤譯實例,提出譯后編輯策略。

        2研究結果與分析

        本章從自動評價和相對的評價維度,評估各機器譯文質量,揭示不同句長文本中的翻譯差異,指出電子通信專利文本機翻的核心挑戰(zhàn)在于專業(yè)術語的處理。

        2.1 自動評價

        本研究未對文心一言和ChatGPT進行特別指令指示。將輸出的譯文經過Python計算,得到各自的BLEU分數。

        經統(tǒng)計,三個機器翻譯系統(tǒng)的BLEU得分多在0.65-0.85區(qū)間,表現良好。低于0.65分的案例中,Google翻譯較少(37例),高于0.85分時Google翻譯占比最高( (19.5% )。ChatGPT和文心一言分別有1例和3例滿分。另外,三者在非長文中表現均佳( >0. 7 分),但在長文中差異顯著:Google翻譯評分降幅達 8.13% ,ChatGPT微降0.96% ,文心一言提升 1.85% 。這表明GAI更善處理長距離文本關系,文心一言的長句翻譯優(yōu)勢或源于其本土化語料深度訓練。

        2.2 相對評價

        依據手冊,對機器譯文從內容傳達度、重要術語翻譯精度及流暢度三方面進行多人人工評價,結果以數值表示,滿分為5分(見表1、表2)。

        表1“內容傳達度”與“流暢度”人工評價得分
        表2“重要術語翻譯精度”人工評價得分

        以上表格顯示,三個機器在“內容傳達度”與流暢度”中的綜合評價相近,Google翻譯在長句表現上劣于GAI,與自動評價結果相符。

        表2數據基于術語統(tǒng)計與分數轉換,其中“適譯值”反映適譯詞(技術上同義且普遍使用的譯語)占比,可譯詞指意思正確但非技術用語詞,誤譯詞為翻譯錯誤詞匯,不譯詞涵蓋漏譯與不明詞語

        三個機器在術語翻譯上均有不足:Google翻譯非長句表現尚可,長句質量下滑;文心一言整體稍遜,非長句適譯值低且漏譯多;ChatGPT輸出穩(wěn)定,不譯情況最少。隨句長增加,三者適譯值均降,可譯值升;Google翻譯不譯值增加,而文心一言與ChatGPT不譯值降為0,這與機器文本分析能力密切相關。

        3誤譯案例分析與譯后編輯策略

        本章將機器譯文中頻發(fā)的誤譯現象具體歸類為專業(yè)復合詞、新生技術詞、行業(yè)縮略語及專利表達,并展開分析。

        3.1 技術復合詞解構失當及策略

        該誤譯源于機器翻譯對電子通信領域特定構詞規(guī)則缺乏認知,無法識別技術術語的語義凝固性。

        如: ① 正交頻分復用(直交周波數分割多重(OFDM)),文心一言和ChatGPT均譯為「直交周波數分割多重化」,錯誤添加動詞化后綴“化”,改變名詞性技術術語的詞法屬性。 ② 跳頻擴頻技術(周波數木ビンクスクトラ△摭散技術),文心一言誤譯為「波東オーミンアンナアレイ」,將完整技術概念“波束成形”(beamforming)割裂為「波束+才一ミン」,違反了日語技術術語中「ビー才ーミン」作為相位調控專有名詞的不可分割性,導致丟失“智能信號波束定向傳輸”的核心語義。

        針對專業(yè)復合詞的翻譯,領域譯員可預定義“技術主體 + 功能屬性”的強制對齊規(guī)則(如:跳頻擴頻 $$ 周波數木クスク卜ラ△擴散),阻斷機器拆分翻譯。同時還需同步強化語義分析能力,準確判定復合術語的內部邏輯關系。

        3.2 新生技術詞匯直譯偏誤及策略

        統(tǒng)計顯示,新興專業(yè)術語的機器翻譯直譯現象明顯,這一問題的根源在于術語庫更新滯后于技術發(fā)展,未建立新詞與知識體系的映射

        如: ① 量子密鑰分發(fā)(量子鍵配送(QKD))在文心一言中譯為|量子鍵分堯」,源于該專業(yè)詞匯的日文對譯未被收錄,機器傾向于利用日語中現有詞匯自行構造新術語。 ② 區(qū)塊鏈共識機制(□クチ工ーンコンセンサスアルコ)ス△),ChatGPT譯為「口クチ一ンコンセンサス機構」。“共識機制\"在區(qū)塊鏈領域特指密碼學協(xié)議(如 PoW/ PoS),需譯為專業(yè)術語コンセンサスアルコリ山」。而機構」在日語中多指物理結構或組織體系,導致技術精確性喪失。

        對于此類誤譯,譯員可通過3GPP/IEEE標準文檔逆向解析新詞生成路徑(如:非地面網絡 $$ Non-Terrestrial Network $$ 非地上礻卜ーク)。另外,可在AI系統(tǒng)或特定平臺中設置語義防火墻,禁止將跨學科詞匯直譯為基礎詞匯,強制調用領域專用詞庫。

        3.3行業(yè)縮略語還原失效及策略

        該類誤譯源于機器未能結合上下文判斷縮略語在目標語中的規(guī)范化表達慣例,頻發(fā)于Google翻譯。

        如: ① “eMBB”的正確日譯應為3GPP標準定義的「強化型移動帶域」,Google翻譯譯為「電子MBB」,應是未接入標準術語庫,從而生成非標表述。 ② “D2D”在專利的權利要求書中需首次展開為「端末間直接通信(D2D)」,而在摘要中可保留縮寫,但機器缺乏語境判斷規(guī)則。 ③ “mMTC”常譯為「大規(guī)模機械型通信(mMTC)」,機器翻譯常遺漏類型限定詞“型”,導致模糊技術應用場景。

        針對行業(yè)縮略語的翻譯,譯員可以建立「中文縮略語-英文全稱-日文規(guī)范譯法」動態(tài)數據庫(例: massive Machine-Type Communication$$ 大規(guī)模機械型通信)。另外,根據專業(yè)術語所在專利文本結構中的位置強制設定縮略語的標記,如標題/摘要:設定“全稱 + (縮寫)\"格式(例:サ一ビス品質(QoS));權利要求書:首次展開后鎖定縮寫(例:端末間直接通信(以下 D2D]∈(27) )。

        3.4專利特定術語和表達的誤譯及策略

        專利文本采用高度程式化表述,用于精確描述發(fā)明內容、背景技術等,以確保規(guī)范性和準確性。諸如,題目常用“一種”或“方法”;摘要常用“本發(fā)明公開了一種…”;權利要求首條為“1.一種…,其特征在于,…”,后續(xù)條目則基于首條展開;背景部分常表述為“本發(fā)明涉及…,尤其涉及一種……”。譯員需檢查翻譯機器是否已調整句型,必要時手動更正。如下例:

        原文:一種顯示裝置,包括如權利要求1-14任一所述的顯示面板

        參考譯文:請求項 ずれか1項に記載 ① 表示兒含表示裝置

        ChatGPT:表示裝置で、特許請求 範囤1辦 ずれかに記載された表示を含。

        此外,中日專利文本格式差異致使權利要求編號無法完全對應,此類誤譯源于機器難以識別專利結構知識,需人工校正。因此,譯員應增強專業(yè)素養(yǎng),研習平行文本,積累知識與經驗,

        4結語

        本研究綜合評估了Google翻譯、文心一言、ChatGPT在電子通信領域專利文本上的表現,采用自動及人工評價方式重點分析專業(yè)術語的誤譯,并提出了相應譯后編輯策略。結論表明:(1)電子通信領域專利文本的誤譯集中于專業(yè)術語的翻譯。(2)生成式人工智能在處理長句結構上優(yōu)于專業(yè)機器翻譯系統(tǒng),且隨句子長度增加漏譯減少。(3)Google翻譯在重要術語上精度最高,但隨句子增長精度下降,文心一言與ChatGPT譯出結果相似,整體精度相對較低。(4)專業(yè)術語的誤譯多集中于專業(yè)復合詞、新生技術詞、行業(yè)縮略語及專利特有表達,其譯后編輯策略可根據情況進行預定義、建立動態(tài)數據庫等。

        參考文獻

        [1]胡開寶,李翼.機器翻譯特征及其與人工翻譯關系的研究[J].中國翻譯,2016(5):10-14.

        [2]杜金華,張萌,宗成慶,等.中國機器翻譯研究的機遇與挑戰(zhàn)[J].中文信息學報,2013,27(4):1-8.

        [3]孔繁明.日漢翻譯要義[M].北京:北京中國對外翻譯出版公司,2004:128-129.

        [4]戴光榮,劉思圻.神經網絡機器翻譯:進展與挑戰(zhàn)[J].外語教學,2023,44(1):82-89.

        猜你喜歡
        專業(yè)術語文心縮略語
        基于“一帶一路”倡議探析國際商務英語翻譯策略
        外語詞中文譯寫規(guī)范效力實證研究
        漢語農業(yè)科技機輔英譯文本譯后編輯策略
        中國人工智能發(fā)展概述
        海外星云(2025年5期)2025-08-10 00:00:00
        跨文化交際視角下農業(yè)英語翻譯策略研究
        藝術科技(2025年7期)2025-08-07 00:00:00
        亚洲av无码码潮喷在线观看| 亚洲人成伊人成综合网中文| 久久久精品国产av麻豆樱花| 成熟了的熟妇毛茸茸| 国产午夜精品一区二区三区软件| 国产精品亚洲专区无码web| 一本久道视频无线视频试看| 最新中文字幕人妻少妇| 亚洲中文久久精品无码| 欧美成人久久久| 国产精品很黄很色很爽的网站 | 男女啪啪永久免费观看网站| 精品欧美久久99久久久另类专区| 亚洲国产天堂av成人在线播放| 影音先锋久久久久av综合网成人| 台湾无码av一区二区三区| 精品一区二区三区免费爱| 人妻有码中文字幕在线| 国产老熟妇精品观看| 欧美孕妇xxxx做受欧美88| 亚洲欧美久久婷婷爱综合一区天堂| 青青草视频在线观看绿色| 久久久www成人免费毛片| 久久艹影院| 亚洲天堂免费成人av| 丰满人妻一区二区三区视频| 久久久天堂国产精品女人| 甲状腺囊实性结节三级| 极品夫妻一区二区三区| 亚洲熟妇自偷自拍另欧美| 久青草国产视频| 亚洲国产精品二区三区| 亚洲乱码无人区卡1卡2卡3| 国产自偷亚洲精品页65页| 国产呦系列呦交| 国产精品国产av一区二区三区| 精品国产一区av天美传媒 | 国产人妖一区二区在线| 蜜臀av一区二区三区免费观看| 国产成人无码a区在线观看视频| 日韩AV无码一区二区三不卡 |