關(guān)鍵詞:水利工程術(shù)語,平行術(shù)語庫,術(shù)語庫建設(shè)
DOI編碼:10.3969/j.issn.1674-5698.2023.05.017
1 引言
科學技術(shù)水平發(fā)展帶來了科技領(lǐng)域日益密切的國際交流,而對于特定領(lǐng)域的準確表述和翻譯也成為了剛需。信息化背景下,以網(wǎng)絡(luò)計算機為依托的科技領(lǐng)域?qū)I(yè)術(shù)語庫成為提高行業(yè)效率的重要輔助工具。
本文旨在介紹ICAT翻譯軟件輔助下,水利工程領(lǐng)域英漢雙語平行術(shù)語庫的主要建設(shè)流程,包括文本導入、術(shù)語識別、術(shù)語提取、導入系統(tǒng)等操作步驟,過程中也闡明水利工程領(lǐng)域?qū)I(yè)術(shù)語的科學認知及其應用價值,以期為科技類文本術(shù)語庫的建設(shè)提供借鑒,統(tǒng)一特定科技領(lǐng)域英漢雙語表達和對應互譯,提高翻譯效率和表達質(zhì)量,為專業(yè)技術(shù)人員學術(shù)技術(shù)交流提供語言支撐。
2 創(chuàng)建背景
水利工程是我國科技領(lǐng)域的重要組成部分,也是我校理工類優(yōu)勢學科,同時,以科技翻譯為主的英語筆譯也是我校本碩士英語專業(yè)人才培養(yǎng)特色,本術(shù)語庫的建立既滿足水利工程專業(yè)領(lǐng)域的實際需求,也是外語學科響應“新文科”號召的重要舉措,進一步推進水利工程領(lǐng)域新技術(shù)新成就的對外傳播。
3 《高拱壩抗震安全》雙語文本簡介
《高拱壩抗震安全》屬于水利工程學科專業(yè)著作,由中國工程院院士陳厚群所著,是國家自然科學基金,科技創(chuàng)新及水利部公益專項資助項目書籍。全書六百余頁從工程應用角度出發(fā),對地震作用下高拱壩的實際性狀、安全裕度、破壞機理,以及強震區(qū)水電建設(shè)工程抗震安全性評價方法等相關(guān)知識進行系統(tǒng)而全面地介紹,內(nèi)容包含大量的諸如地質(zhì)主題術(shù)語及水利水電術(shù)語等學科領(lǐng)域核心術(shù)語,以及一部分數(shù)學、化學學科相關(guān)的通用科技術(shù)語。本著作對我國水工結(jié)構(gòu)抗震和大壩混凝土動態(tài)性能研究具有重要價值。
《Seismic Safety of High Arch Concrete Dam》是《高拱壩抗震安全》一書英譯版,由西安理工大學英語系亢樹森教授(1939-2017)擔綱主譯??航淌诶脴I(yè)余時間歷時兩年完成了對本書的英譯工作,英譯版于2016年1月由荷蘭Elsevier出版集團正式在海外出版發(fā)行??航淌诘姆g語言準確靈活、通俗易懂,有鮮明的個人語言特色。《Seismic Safety ofHigh Arch Concrete Dam》是一部質(zhì)量上乘的科技英語漢譯英著作,不論是語言還是技術(shù)層面,都達到了相當高的水平,一經(jīng)出版,獲得了國際專業(yè)人士的高度稱贊。
4 水利工程專業(yè)術(shù)語界定術(shù)語界定
是準確提取術(shù)語的重要前提,水工專業(yè)術(shù)語是水利工程學科專業(yè)發(fā)展到一定階段的產(chǎn)物,有其獨有的特性和構(gòu)成方式,可以從其定義,形成過程以及語義方面對水利水電術(shù)語進行有效界定。
4.1 術(shù)語定義
“術(shù)語,或稱技術(shù)詞(Technical words),是準確地標志科學技術(shù)和社科領(lǐng)域的一定概念的詞語,是反映科學技術(shù)和社科領(lǐng)域進步的特殊標記,用來記錄和表述各種現(xiàn)象、過程、特性、關(guān)系、狀態(tài)等不同名稱[3]。”普通詞匯可以轉(zhuǎn)化為某個或某幾個專業(yè)領(lǐng)域的術(shù)語,但是這種轉(zhuǎn)化不僅要建立在明確這個詞的層次結(jié)構(gòu)和發(fā)展歷程的基礎(chǔ)上,還要反映出其本質(zhì)特征,并且使其符合某個領(lǐng)域術(shù)語構(gòu)詞法和組詞規(guī)則。
4.2 水利工程專業(yè)術(shù)語形成過程
“自古以來,伴隨著科學思想的產(chǎn)生與發(fā)展,總是要創(chuàng)造出一些用以確定并表述這些思想的專用詞匯??茖W語言是隨著科學本身同步發(fā)展的[5]”。水利工程專業(yè)術(shù)語的形成由彌漫到具體,可以分為3個階段:俗化、類化、標準化,這一過程也說明術(shù)語的發(fā)展和人類社會科學發(fā)展、認知水平是保持一致的。
在水利工程專業(yè)知識發(fā)展的前科學階段,科學概念尚未形成,人們對水利的認知處于“彌漫性”階段,也就是“俗化”階段,在這一階段中,人們只知道水可以灌溉莊稼,可以防止勞作時脫水,但是并沒有特定的語言去描述;隨著社會的進步,“俗化”開始走向“類化”,即人們對水利工程的粗糙認識逐漸走向自然性與人文性,19世紀末20世紀初,水利工程研究的迅速發(fā)展極大影響了術(shù)語系統(tǒng)的發(fā)展走向,弗雷格、羅素和維特根斯坦以及卡爾納普提出了創(chuàng)建形式化語言的設(shè)想,對日后的術(shù)語系統(tǒng)的形成產(chǎn)生了極大的影響。到了人文與自然科學發(fā)展的后期,用來描寫科學的專門詞語,也就是現(xiàn)代所說的術(shù)語,從“類化”邁向了“標準化”。所謂“標準化”,指的是此時的術(shù)語通常由描寫性短語、并列組合以及帶有形動詞、副動詞的詞組構(gòu)成,例如:本文提取的術(shù)語“加速度反應譜”(seismic response spectrumof acceleration)、“中震可修性能目標”(repairableperformance objectives in the meso-earthquakes)和“體系可靠度”(system reliability)等等,都屬于標準化術(shù)語,指稱專業(yè)性和固定性變得更強,并且這些術(shù)語只應用于水利工程行業(yè)范圍內(nèi),為水利學科服務,隨著學科分工細化,專有、標準的水利工程專業(yè)術(shù)語系統(tǒng)也形成了。
4.3 水利工程術(shù)語特征
水利工程專業(yè)術(shù)語呈現(xiàn)3個方面的特征。
(1)客觀性。水工術(shù)語邏輯嚴謹、表達客觀、重點突出,多數(shù)要表達的都是水工技術(shù)、理論概念。“概念是詞義的基礎(chǔ),詞義是概念在語言中的表現(xiàn)形式。兩者互為依存,但往往有所不同?!盵3]一般來說,詞義的內(nèi)涵要比概念廣,除了可以表達概念外,在具體的上下文中還可能具有指物性,具有一定的感情色彩和文體色彩。水工術(shù)語是反映水工領(lǐng)域科技概念的特殊詞語,所表述的科技概念沒有情感色彩,客觀性較強。
(2)單一性。水利工程術(shù)語作為專業(yè)化的語言符號,所指性比較單一固定,在水電領(lǐng)域具有自己特定的意義,譯者必須要嚴格按照規(guī)定翻譯,進行一詞一義,對其他的解釋不予包容。如:“水庫淤積測量”(reservoir accretion survey)這一術(shù)語專門用于對水庫泥沙淤積規(guī)律的研究,“庫區(qū)地殼形變觀”(crust deformation observation of reservoir zone)是用來確定壩區(qū)及其外圍地區(qū)地殼穩(wěn)定性,評價、驗證水庫誘發(fā)地震的可能性。符合該特征的術(shù)語將原語言與目標語的關(guān)系變得極為單一,但同時也方便了學術(shù)領(lǐng)域的溝通交流,促進了科學技術(shù)的發(fā)展。
4.4 水利工程術(shù)語語義
水工術(shù)語有時在語義關(guān)系和語義形式層面上呈現(xiàn)一定的復雜性。
(1)語義關(guān)系。水工術(shù)語語義關(guān)系主要表現(xiàn)在縱向的聚合關(guān)系,橫向的組合關(guān)系上。
在語言學中,橫向的組合關(guān)系是指“語言單位和其他單位,因它們處于同一序列而具有的關(guān)系[7]”。通俗來說,就是詞語的搭配問題。就組合關(guān)系而言,以“域”為例,在中文中“域”是所有區(qū)域的一個總稱,其對應英譯是zone,在本庫中跟“域”有關(guān)的術(shù)語包括“砂漿域”(mort ar z o ne)、“破壞過渡域”(damage and fracture zone),“斷裂面上盤域”(upper hanging site area on the fault fracture face)、“反應譜峰值域”(response peak zone)等,上述各種“域”都是由“類型(定語)+域”組合而成,這便形成了一種組合關(guān)系??v向的聚合關(guān)系是指“語言成分在序列結(jié)構(gòu)中占據(jù)某個相同位置的形式之間的垂直關(guān)系[9]。”即如果這些詞在意義,功能上相近且能夠進行互補與互換,便構(gòu)成了聚合關(guān)系。如:在地質(zhì)斷層中會根據(jù)地質(zhì)災害發(fā)育密度分為“上盤效應”(hanging wall effect)與“下盤效應”(footwalleffect),這兩個詞組在意義上互為補充,可以構(gòu)成聚合關(guān)系。
(2)語義形式。從語義形式上,水工術(shù)語可劃分為水工術(shù)語詞和水工術(shù)語詞組兩種主要類型。術(shù)語詞又可繼續(xù)分為根詞術(shù)語,如:設(shè)計峰值(designpeak);詞綴術(shù)語,如:斷層投影距離(fault projectiondistance)及復合術(shù)語,如:非線性彈塑性(non-linearelasticity-plasticity)等;術(shù)語詞組根據(jù)其組成詞性可分為名詞詞組、動詞詞組和其他詞性詞組術(shù)語。
5 水利工程雙語術(shù)語庫建立
水利工程雙語術(shù)語庫的建立主要包含兩個步驟:文本導入和術(shù)語識別提取。文本導入,指的是將目標語料按要求輸入軟件,從而利用軟件功能對文本進行一定的預處理,轉(zhuǎn)換和對齊工作。術(shù)語識別提取可分為機器提取和人工提取兩種,本術(shù)語庫的機器提取主要借助Dejavu X4翻譯軟件。人工提取是對機器提取的完善和補充,目的是保證術(shù)語的準確性和有效性。
5.1 文本導入
文本導入是成功構(gòu)建術(shù)語庫的第一步。針對語料的不同文件格式,可以選用不同的文本導入法。文件格式體現(xiàn)了一份文件在計算機中進行存儲時的特征,甚至可以用于對機器算法的學習。在日常生活中比較常見的文件格式有txt格式、word格式、pdf格式、tmx格式、Excel格式等等。在導入機輔翻譯軟件時,為避免因格式不支持導致軟件對術(shù)語表的不兼容,需提前將xlsx格式轉(zhuǎn)換為xls格式再進行導入。文本導入主要分為兩步。
(1)文本預處理。因為翻譯軟件導入文件大小一般不能超過10 0M,文件字符數(shù)不能超過10 0,0 0 0字,word文件或excel文件行數(shù)不能超過30,000行。原始雙語語料版本章節(jié)較多,全文字數(shù)遠超字數(shù)限定,如果強行一次性將文本全部導入會造成部分文本丟失、術(shù)語提取難度增大、雙語對應準確性降低,因此多層拆分法成為保證術(shù)語有效提取的最佳方案,也就是將原雙語文本拆分后再進行導入。如果一次拆分后,某些章節(jié)字數(shù)仍然沒有達到軟件字數(shù)要求范圍,則需進行二次拆分,拆分完畢之后建立中英雙語文件夾對拆分后的章節(jié)進行有效存儲。在這一過程中,要注意中英雙語的拆分章節(jié)要做到內(nèi)容完全對應。
(2)文本轉(zhuǎn)換與文本對齊。因翻譯軟件支持的版本有限,所以對拆分后的語料要進行格式轉(zhuǎn)換,然后再導入。在雙語文本中,地質(zhì)勘測模型圖、方程式以及表格分析圖占比較大,這些數(shù)據(jù)在導入翻譯軟件時會影響雙語內(nèi)容的對齊和文本內(nèi)容的連貫性,導致中英文錯位、不匹配,因此須通過人工對齊進行調(diào)整,將與術(shù)語提取無關(guān)的方程式與圖表進行定量刪除,只保留文字部分,必要時可采用文本移位法調(diào)整對齊章節(jié)內(nèi)容,確保刪除后的中英文內(nèi)容相匹配。最后可通過核查章節(jié)的行數(shù)是否相同對對齊文本進行校對。
5.2 術(shù)語提取
術(shù)語指的是能夠表示該領(lǐng)域知識概念的關(guān)鍵性單詞或詞組,術(shù)語提取即是指從原始語料中將這些單詞或者詞組找到并抽離提煉出來。水工術(shù)語的準確提取需要建立在對其形成過程充分了解以及對術(shù)語有效界定的基礎(chǔ)上,還需要對術(shù)語的長度和構(gòu)成方式加以限定,以保證術(shù)語在形式和內(nèi)容上的完整性和一致性。提取主要分為軟件提取和手動提取,前者精準度相對較低,因此在軟件提取之后,需要進行一定的手動篩選核對。
(1)軟件提取。Dejavu X4軟件主要使用神經(jīng)網(wǎng)絡(luò)智能提取法提取術(shù)語。該方法基于跨語言的神經(jīng)網(wǎng)絡(luò)術(shù)語識別,使用神經(jīng)網(wǎng)絡(luò)文本匹配模型,融合術(shù)語詞性和語法信息,根據(jù)上下文信息,將術(shù)語原文和術(shù)語譯文相匹配來獲取數(shù)據(jù),處理數(shù)據(jù),從而得到一批術(shù)語。具體操作步驟為:1)在語料對齊后,單擊軟件工具欄中的【術(shù)語提取】按鈕,系統(tǒng)將自動進行雙語術(shù)語提??;2)軟件系統(tǒng)根據(jù)詞義詞頻提取雙語術(shù)語后,用戶可根據(jù)自身需要,進一步篩選術(shù)語;3)篩選過程中可通過雙擊術(shù)語所在單元格,編輯術(shù)語內(nèi)容;4)確認好的術(shù)語文檔可以導出到Excel,保存至個人云術(shù)語庫或術(shù)語寶。
(2)人工提取。軟件提取出的術(shù)語有一定的刻板性,一次性通過軟件提取出的術(shù)語會比較混亂,缺乏條理性,因此還需人工提取進一步篩查。在進行人工提取時,首先需刪除一些機器提取出來的無用數(shù)據(jù),如:人名、機構(gòu)名、山名等,這些名稱只能算作普通名詞,并不能歸納入術(shù)語;此外,由于前期對原始語料做了多層拆分,因此很多地方會出現(xiàn)術(shù)語重復,尤其是使用頻率比較高的術(shù)語,因此人工篩查時,也需要留意這部分術(shù)語,進行刪除。最后還需要對每一部分生成的術(shù)語分庫進行合并,生成水工術(shù)語總庫。
(3)提取依據(jù)。術(shù)語軟件提取最主要的依據(jù)是術(shù)語含義與文本主題的相關(guān)性,以及術(shù)語出現(xiàn)的詞頻,這都標志著術(shù)語在行業(yè)話語體系內(nèi)的價值。而人工提取除了要考慮這兩個因素,還要注意觀察術(shù)語的語法結(jié)構(gòu)、長度、重復性等問題。兩種方法綜合考慮,提取要遵循5個因素。
1)專業(yè)相關(guān),廣為認可。本入庫術(shù)語最重要的特性便是與水工抗震主題相關(guān)性強,完全隸屬于本專業(yè),但排除了一般性的地名、人名、機構(gòu)名等各類名稱。舉例如下。
中文文本:1965年,Priestley,M.B提出了漸進功率譜的概念。漸進功率譜反映了地震過程中,各個頻率分量的能量分布隨時間變化的特性,具有清晰的物理概念。
英語文本:In 19 65, Pr iest ley.M.B suggested"the concept of evolutionar y power spectr um. Theevolutionary power spectrum can reflect the energydistribution behaviors with time changing of eachfrequency component in the seismic course,being ofclear physical concept.
該句中出現(xiàn)了年份以及人名,在語義層面與水工主題關(guān)聯(lián)性較弱,不予提取。但是“漸進功率譜”(evolutionary power spectrum)一詞,是表示地震各個頻率分量能量分布的詞組,專業(yè)性較強,與主題關(guān)系密切,因此作為專業(yè)術(shù)語入選庫中。
2)表述新穎,主題相關(guān)。隨著水利水電技術(shù)的不斷發(fā)展,人們對該領(lǐng)域的研究和探索不斷深入,就會衍生出一些新的專業(yè)表述,這些專業(yè)表述之前雖從未出現(xiàn)過,但與行業(yè)領(lǐng)域前沿發(fā)現(xiàn)聯(lián)系密切,表達方式耳目一新,對研究人員未來的研究起到至關(guān)重要的作用,像這種新術(shù)語本庫也會予以收錄,用于迎合時代發(fā)展。如:“水文遙感”(remote sensingin hydrology),“水文空間技術(shù)”(space technologyin hydrology)這兩個術(shù)語,是我國航天遙感技術(shù)與衛(wèi)星技術(shù)逐步成熟之后水利水電工程對這兩種技術(shù)進行有效利用,采用航空航天遙感,人造地球衛(wèi)星來采集和傳輸水文信息,獲得重要水文數(shù)據(jù),從而產(chǎn)生的術(shù)語。這些新術(shù)語不僅代表了水利行業(yè)的發(fā)展,也代表了其他行業(yè)領(lǐng)域技術(shù)的進步。
3)形成時間早,價值性強。本庫所提取的術(shù)語中包括一些長度較長的術(shù)語詞組,這些術(shù)語在行業(yè)發(fā)展初期就已經(jīng)形成,具有一定的理論價值,如:“大陸地震構(gòu)造系”(mainland seismic str ucturesystem)這一術(shù)語,指和地震蘊育和發(fā)生有關(guān)的地質(zhì)構(gòu)造,在人類探索地殼運動的早期就已形成,對地震構(gòu)造與深部結(jié)構(gòu)環(huán)境研究具有重要價值。除此之外,一些看似口語性較強的詞組,因其對水工領(lǐng)域具有一定的理論價值,本庫也予以提取。例如:“正常蓄水位”(normal pool level),雖然已經(jīng)廣泛用于日常生活,但是在水庫堤壩研究中它也具有重要作用,所以予以提取。
4)語義獨立,避免重復。軟件成功導出所有術(shù)語之后,需要進行匯總與剔除,手動刪除獨立導出的章節(jié)與章節(jié)產(chǎn)生的重復術(shù)語,比如:“強震區(qū)”(strong earthquake area)一詞,幾乎每一章節(jié)都會出現(xiàn),軟件把每一章節(jié)該術(shù)語都提取了出來,人工篩查時只一次即可。再如:“反應譜”(design responsespectrum)一詞,在第三章、第五章、第七章、第十章的軟件提取中均有出現(xiàn),也就是出現(xiàn)了4次,人工提取則需刪除其他3個相同的術(shù)語。
5)雙語對應,長度適中。術(shù)語詞條通常短小、簡練、精準,入庫術(shù)語不能太長、太泛,否則會破壞術(shù)語的精準性,影響查閱效率。剔除的時候要注意,有些較長的術(shù)語本身是不可分的整體,強行拆分開就失去了其真正含義,在手動提取的時候要格外注意,反復閱讀,了解其深層含義。如:“沖擊荷載加載速率”,英文對應:loading speed rate of impactingloading,這種術(shù)語長度雖然相對較長,但在意義上不可分開,故不做改變,予以收錄。
6 水利工程專業(yè)術(shù)語庫創(chuàng)建及試應用
水工術(shù)語庫前期語料篩選工作完成后,可以利用Dejavu X4翻譯軟件將其建成“庫”。Dejavu X4可以實現(xiàn)“一鍵化”反轉(zhuǎn),建庫時非常便捷,這個功能意味著對相反語言方向的記憶庫數(shù)據(jù)也可以順利添加并且應用在未來的翻譯項目里。該翻譯軟件的另一項優(yōu)勢是對想要長期使用的翻譯項目,可以將該項目保存為模板形式,以便未來需要時直接提取。下文對術(shù)語庫創(chuàng)建過程和應用進行分別闡述。
6.1 水工術(shù)語庫創(chuàng)建
水工術(shù)語提取完成后,可以形成一份以《高拱壩抗震安全》為語料基礎(chǔ)的專業(yè)雙語術(shù)語總表,即術(shù)語表,也就是水工術(shù)語庫的最初形態(tài)。術(shù)語庫是一種計算機化的數(shù)據(jù)集合,它必須存儲在某一個載體上,使其能夠根據(jù)程序進行檢索或者其他處理。這里借助Dejavu X4這一機輔翻譯軟件將術(shù)語表通過計算機的處理轉(zhuǎn)化成術(shù)語庫的形式,將第三方格式的術(shù)語表數(shù)據(jù)導入進術(shù)語庫當中。具體創(chuàng)建過程如下。
首先,打開Dejavu X4翻譯軟件和水工術(shù)語總表,點擊“Termbase”,選擇一個保存的位置和術(shù)語庫模板,這決定了將要創(chuàng)建的術(shù)語庫的外觀以及包含功能。結(jié)合建庫目的,本術(shù)語庫選擇Minimal結(jié)構(gòu)。接著對術(shù)語表進行導入,完成對中英文條目的設(shè)置后便可以點擊導出術(shù)語庫,Dejavu X4版本的水利工程英漢雙語平行術(shù)語庫建成。建成圖如圖1所示。
6.2 案例應用
為驗證水利工程雙語術(shù)語庫的功能是否可以實現(xiàn)術(shù)語搜索的便捷化、準確化和雙語譯文的對應化,筆者通過對部分水利工程領(lǐng)域?qū)I(yè)文本翻譯案例的操作,對該術(shù)語庫進行了試運用。
以任選水工專業(yè)文本英漢雙語互譯為例,第一步,在Dejavu X4中創(chuàng)建項目。點擊文件-新建-項目-翻譯項目,選定項目保存位置,設(shè)置好語言;第二步,把建立好的術(shù)語庫轉(zhuǎn)換為記憶庫,目的是為了在翻譯時進行更高效的提??;第三步,將待譯的英文文章或中文文章以Word形式添加進Dejavu X4中,如圖2所示,文章以每一分句的形式成功顯示在了界面上,從圖2可以看到,一旦某句話中出現(xiàn)了包含關(guān)鍵詞的專業(yè)術(shù)語,界面右側(cè)便出現(xiàn)眾多詞組,這些術(shù)語詞組即來自之前創(chuàng)建的水工平行術(shù)語庫,通過借鑒術(shù)語的雙語表達,大大提高了翻譯效率。
通過對文本的檢索翻譯發(fā)現(xiàn),文本中術(shù)語搜索成功度與術(shù)語匹配度和準確度均能達到95%以上,這說明該術(shù)語庫在進行水工翻譯時可以在術(shù)語上給予及時提示和有效回饋,即證明了本術(shù)語庫具有較強的實用性和有效性。
7 結(jié)論
水利工程英漢雙語術(shù)語庫已經(jīng)在翻譯課堂、翻譯實踐實習中推廣運行,效果良好。水利工程英漢雙語術(shù)語庫是以《高拱壩抗震安全》雙語文本為基礎(chǔ),術(shù)語的收集覆蓋并不完善,還需后期不斷更新和補充。在水利工程領(lǐng)域交流和翻譯項目實施過程中,機輔搜索引擎的幫助能夠快速鎖定意向術(shù)語,既保持了專業(yè)術(shù)語的統(tǒng)一,提高工作效率,也減輕了相關(guān)人員查詢資料和記憶的負擔,不論是對翻譯專業(yè)的師生教學實踐,還是對水利工程領(lǐng)域拱壩結(jié)構(gòu)抗震設(shè)計與研究都具有重要意義。