單宇 曹悅琪 汪韻
摘 要:術語規(guī)范及相關標準國際化成為中國高鐵“出?!钡闹匾A。文章以概念系統(tǒng)為切入點,闡述了多語種高鐵術語庫建設的內(nèi)容與方法,包括術語的收集、提取、翻譯與審核,術語庫的創(chuàng)建、維護與管理等。術語庫建設完成后,可應用于高鐵相關翻譯實踐、高鐵術語詞典編纂與BTI、MTI翻譯教學等領域,促進術語標準化建設,完善術語規(guī)范與統(tǒng)一。開展中國高鐵術語庫建設具有重要現(xiàn)實意義,有利于中國高鐵產(chǎn)品、技術和服務真正“走出去”,打造中國高鐵國際競爭話語權,彰顯中國智造和文化自信,提高中國國際影響力。
關鍵詞:中國高鐵;術語庫建設與應用;高鐵術語;高鐵術語庫
中圖分類號:H083;H059? 文獻標識碼:A? DOI:10.12339/j.issn.1673-8578.2022.03.012
Construction and Application of China’s High-speed Rail “Going Global” Termbase//SHAN Yu, CAO Yueqi, WANG Yun
Abstract:Standardization of terms and internationalization of relevant standards have become an important foundation for China’s high-speed railway “going global”. This paper expounds the contents and methods of the construction of multilingual high-speed railway termbase from the perspective of conceptual system, including term collection, extraction, translation and review, termbase construction, maintenance and management. The termbase completed could be applied to the various fields such as translation practice related to high-speed railway, compilation of high-speed railway term dictionary and teaching of BTI and MTI. The termbase can promote the standardization, specification and unification of terms, and will be conducive to the enhancement of China’s high-speed rail’s international competition advantages, enabling China’s high-speed rail products, technologies and services to “go global” indeed, which demonstrates China’s intelligent manufacturing and cultural confidence and improves China’s international influence.
Keywords: China’s high-speed rail; construction and application of termbase; high-speed rail related terms; high-speed rail termbase
收稿日期:2021-10-07? 修回日期:2022-04-14
基金項目:2019年教育部人文社會科學研究規(guī)劃基金項目(19YJA880004);2020年度湖南省哲學社會科學基金重點項目(20ZDB032);2020年國家社會科學基金重大項目(20&ZD312);2021年湖南省研究生科研創(chuàng)新一般項目(CX20210139)
引言
從“制造”到“智造”,從“輸血”到“造血”,從“引進來”到“走出去”,中國高鐵實現(xiàn)了由引進、消化、吸收到自主創(chuàng)新發(fā)展的飛躍。放眼國際,中國鐵路已經(jīng)在美洲、非洲、亞洲、中東等地區(qū)落地生根,推進包括術語規(guī)范在內(nèi)的高鐵相關標準國際化,加速“中國標準”的世界化,是中國高鐵“出海”的重要基礎。
1 研究背景
國外多語種術語庫的建設歷史悠久,如德國國防部投入開發(fā)的LEXIS術語庫(LEXIS Terminological Data-bank)、歐洲共同體委員會術語庫(Eurodicautom)、西門子公司投入建設的多語種術語庫 TEAM 、聯(lián)合國術語庫UNTERM(The United Nations Terminology Database)、歐盟 IATE 互動型術語庫(Inter Active Terminology for Europe)、加拿大政府術語數(shù)據(jù)庫TERMIUM等。
1989 年以來,國內(nèi)多個機構陸續(xù)建立不同類型的專業(yè)術語庫。經(jīng)過多年的發(fā)展,國內(nèi)重要的多語種術語庫有中國特色話語對外翻譯標準化術語庫、中國關鍵詞、中國核心詞匯等。相比而言,國內(nèi)術語庫建設從語種和規(guī)模上來看都不甚完善,大多僅包括漢英兩種語言,且所涉領域較為單一。
2 術語及概念系統(tǒng)
術語學探討的概念是同某一知識領域所研究的客體相對應的,因而有其內(nèi)在的系統(tǒng)性。在一個知識領域中,概念用定義描述,被賦予約定的指稱即術語。概念體系反映相應的知識體系。
概念系統(tǒng)的研究是術語工作不可缺少的一個環(huán)節(jié),它可以揭示專業(yè)領域內(nèi)各個概念之間的結構關系,因而為系統(tǒng)研究高鐵專業(yè)的術語提供了條件。例如,通過研究高鐵相關術語所表達的全部概念,可幫助研究者核查所收錄術語有無重大遺漏;通過透徹理解概念系統(tǒng)中各個概念之間的各種關系,可構成新的術語;通過研究漢、英、西、法不同語言之間的概念系統(tǒng)是否協(xié)調一致,可發(fā)現(xiàn)這些語言中相應的術語是否等價。根據(jù)概念系統(tǒng)編纂而成的詞典有很強的系統(tǒng)性,將其應用于術語系統(tǒng),便于進行聯(lián)機檢索,利于術語含義的理解,頗助于術語工作者的培訓和術語教學。
3 中國高鐵術語庫建設
3.1 總體目標
高鐵術語本體庫是以中國高鐵概念系統(tǒng)為基礎,建設以漢語術語為核心,英語、法語、西班牙語對應術語為映射,涵蓋術語知識各類相關條目的集合。多語種高鐵術語庫構建的基本思路是:收集高鐵相關權威資料,建成高鐵語料庫,從語料庫中提取核心術語,根據(jù)高鐵概念系統(tǒng)擴展術語的相關知識條目,如定義、例句、屬性關系等。
3.2 建庫原則
目的性。根據(jù)用戶對術語庫功能和數(shù)據(jù)的需求,充分考慮社會效益和經(jīng)濟效益,開發(fā)術語庫,避免盲目追求系統(tǒng)的大規(guī)模、高技術和多功能。
科學性。深入研究術語庫開發(fā)中涉及的各種學科的理論與技術,在科學的基礎上建設術語庫。
可擴充性。根據(jù)新的需求,對術語庫的數(shù)據(jù)、軟件與硬件等進行擴充。
3.3 術語提取
術語來源為國家鐵路局發(fā)布的鐵路工程施工安全系列技術規(guī)范等14項工程建設標準英文譯本。選擇Sketch Engine工具對所得語料進行術語提取。Sketch Engine作為一種在線語料庫索引工具,用于描述總結詞匯的語法知識,如關鍵詞與詞語搭配的使用頻率、顯著性,相關例句以及語法關系,同義詞辨析等功能。生成詞目表(lemma list)可從候選術語中選取有效術語,根據(jù)關鍵值(keyness)生成的詞表可過濾功能詞,Sketch Engine的“Word sketch”功能可以識別詞的搭配和語法行為,其中“Extract keywords and terms”功能可以通過N連詞(n-gram)精確索引。
在術語條目存儲格式方面,錄入建庫后,為了保證后期能夠將多語種詞目及對應關系順利導入本體知識庫,所有詞目均以xls格式存儲,方便使用OWL語言進行批量導入。
3.4 術語庫建設
3.4.1 建設工具
為方便后期轉向本體庫建設,選擇Protégé作為術語庫工具。Protégé是目前主流的開源本體構建工具,也是語義網(wǎng)中本體構建的核心開發(fā)工具,由斯坦福大學醫(yī)學院生物信息研究中心基于Java語言開發(fā),支持? DAML+OIL、OWL、XML、RDF(S)等多種本體描述語言,可實現(xiàn)類的建模、實例編輯、模型處理以及模型轉換等功能。
3.4.2 術語庫結構
本研究將高鐵術語庫設計為包含6大類以及31個子類的領域本體,具體分為工務工程(橋梁工程、站場工程、路基工程、軌道工程、隧道工程),牽引供電(供電系統(tǒng)、變電系統(tǒng)、接觸網(wǎng)系統(tǒng)、電力系統(tǒng)、遠程監(jiān)控系統(tǒng)),通信信號(地面子系統(tǒng)、聯(lián)鎖子系統(tǒng)、調度集中控制系統(tǒng)、車載子系統(tǒng)、通信系統(tǒng)),動車組(列車網(wǎng)絡系統(tǒng)、制動系統(tǒng)、總成、牽引系統(tǒng)、車體、轉向架),運營調度(供電管理、客運調度、綜合維修、車輛管理、運行管理、運輸計劃),和客運服務(客運組織管理、市場營銷策劃、旅客服務系統(tǒng)、票務系統(tǒng))。使用Protégé創(chuàng)建類(Class)并構建類之間的關系(Description)所得可視化本體結構如圖1所示。
3.4.3 屬性結構
根據(jù)Protégé工具的功能模塊,研究將術語條目分為三類來存儲:對象屬性(Object properties)、數(shù)據(jù)屬性(Data properties)和注解(Annotations)。其中對象屬性定義實體對象之間的關系,包括“isKindOf”“isPartOf”“isCharacterizedWith”“isPrototypeOf”“isEquippedWith”“isAssignedTo”等;數(shù)據(jù)屬性定義實體本身的屬性,除Protégé自帶的30余種數(shù)據(jù)類型外,自定義“Type”“Standard length”“Quantity”“Material”“Cycle”“Apply to”等;注解條目包括詞法信息(lexical information)、變體信息(term variations)、概念信息(conceptual information)、管理信息(administrative information),注解條目結構如圖2所示。
3.4.4 實例錄入
將術語作為實例錄入術語庫中,術語相關信息包括對象屬性、數(shù)據(jù)屬性和注解。由于語料庫產(chǎn)生的本體知識數(shù)據(jù)規(guī)模十分龐大,手工構建方法顯然效率太低,Protégé內(nèi)置的Cellfie模塊可以實現(xiàn)半自動化導入數(shù)據(jù)信息,用戶需使用MappingMaster[1]領域特定語言(DSL)自行編寫轉換規(guī)則[2],它可以定義從Excel工作表內(nèi)容到OWL本體的映射。正確規(guī)范編寫的轉換規(guī)則可以實現(xiàn)創(chuàng)建類、定義類之間的關系、添加實體、定義實體屬性等批量操作,顯著提高導入效率,同時減少手工輸入的錯漏情況。
引用Excel工作表的單元格內(nèi)容以字符“@”為前綴,字母表示列,數(shù)字表示行。工作表左上角的單元格為A1,其余依次向縱橫方向擴展,字符“*”指定一行或一列,如“@B*”表示引用第二列的單元格內(nèi)容,“@3*”表示引用第三行的單元格內(nèi)容。
聲明類與類之間的關系和實體及其屬性時,可以使用<CLASS> <INDIVIDUAL><ANNOTATIONS><TYPES><FACTS><SAME_AS>等語句,編寫轉換規(guī)則時可以限定需聲明單元格范圍,轉換規(guī)則聲明界面示意如圖3所示。應用轉換規(guī)則批量導入術語后的注解條目如圖4所示。
在“Individual”模塊點擊術語“pantograph”,“Description”顯示術語所屬類別以及對應的中文(受電弓)、西班牙語(pantógrafo)和法語(pantographe)術語,“Annotation”模塊顯示術語的語種、詞性、定義、例句等信息。應用轉換規(guī)則批量導入后術語的對象屬性如圖5所示。
“Property assertions”模塊顯示術語“sleeper”的對象屬性(Object property assertions)和數(shù)據(jù)屬性(Data property assertions)。如圖5所示,其對象屬性顯示“sleeper”應具有必要的“soundness”(堅固性)、“elasticity”(彈性)和“durability”(耐久性),數(shù)據(jù)屬性顯示“sleeper”的常用材料、單位長度鋪設數(shù)量和標準長度。
3.5 術語庫實例
經(jīng)以上各步驟建設完成的中國高鐵“出?!毙g語庫數(shù)據(jù)集,基本描述信息如表1。
4 結語
中國高鐵“出海”有利于建構連接絲綢之路經(jīng)濟帶的交通運輸網(wǎng)絡(歐亞、中亞、泛亞、中俄美加),促進中國“一帶一路”倡議構想的早日實現(xiàn)。高鐵“出海”應是產(chǎn)品、技術和服務三個層面全面“走出去”,語言先行,高鐵項目的招標、談判、修建及運營,都離不開明晰、準確、融洽的溝通,實現(xiàn)多語種術語的規(guī)范與統(tǒng)一,培養(yǎng)優(yōu)秀的專業(yè)化語言服務人才是“走出去”戰(zhàn)略實施過程的一個重要環(huán)節(jié)。
中國高鐵“出?!毙g語庫建設完成后,可應用于多個領域。在高鐵相關翻譯實踐方面,將高鐵術語庫與計算機輔助翻譯技術工具相結合,利用軟件的翻譯記憶和計算機匹配技術,既可以提高翻譯效率,又可提高翻譯的準確性和一致性。
在高鐵語言相關教學方面,高鐵語料庫可提供有效資源。高鐵多語語料庫包含漢語、英語、法語、西班牙語,其中收錄具有代表性的期刊論文和新聞等正規(guī)語料,可供查詢語言特征、檢驗語言設想、統(tǒng)計詞頻或進行縱橫對比分析等。
在高鐵術語詞典編纂方面,由于術語庫內(nèi)容豐富,可實時更新,利用動態(tài)術語庫編纂詞典可以反映語言的真實變化,還可大大縮短編纂周期。
中國高鐵“出?!毙g語庫既可成為術語標準化建設的有機組成,也可成為中國高鐵參與國際經(jīng)濟競爭的戰(zhàn)略武器。加快術語的規(guī)范與統(tǒng)一,進一步推進中國高鐵術語庫建設,將促成中國高鐵的產(chǎn)品、技術與服務真正地“走出去”,提升中國國際影響力。
參考文獻
[1] MappingMasterDSL[EB/OL]. (2020-10-29) [2021-04-13]. https://github.com/protegeproject/mapping-master/wiki/MappingMasterDSL.
[2] Transformation Rule Language[EB/OL]. (2020-03-07)[2021-04-13]. https://github.com/protegeproject/mapping-master/wiki/Transformation-Rule-Language.
作者簡介:單宇(1977—),女,博士,中南大學外國語學院教授。主要研究方向為科技翻譯、語料庫翻譯學、語言教學、翻譯史。先后主持教育部人文社會科學研究規(guī)劃基金項目,湖南省哲學社會科學基金項目,參與國家社會科學基金重大項目。公開發(fā)表學術論文35篇,出版學術專著3部、譯著2部、教材5部。通信方式:yushan@csu.edu.cn。
《中國科技術語》雜志社
曹悅琪(1997—),女,中南大學外國語學院碩士研究生。研究方向包括科技翻譯、專用語料庫、術語庫等。主持中南大學中央高校基本科研業(yè)務費專項資金資助項目1項。通信方式:cao123yq@sina.com。
汪韻(1999—),女,中南大學外國語學院碩士研究生,研究方向為科技翻譯。通信方式:wangyun12399@163.com。