袁 潤(rùn) 劉邦國(guó) 王 丹
(江蘇大學(xué)科技信息研究所 鎮(zhèn)江 212013)
高校圖書館在開展信息服務(wù)過程中,經(jīng)常遇到翻譯工作。例如,在定題跟蹤、專題報(bào)告、文獻(xiàn)計(jì)量、競(jìng)爭(zhēng)情報(bào)、研究前沿探測(cè)等服務(wù)工作中,有時(shí)需要翻譯外文文獻(xiàn)的題名、摘要,也包括國(guó)家地區(qū)名稱、機(jī)構(gòu)名稱,有時(shí)還需要翻譯關(guān)鍵詞、主題詞、研究前沿等學(xué)術(shù)詞匯。雖然可以利用的在線翻譯工具很多,但是針對(duì)批量的重復(fù)性翻譯,工作量仍然顯得比較繁重。隨著技術(shù)的發(fā)展,各種工具已成為圖書館信息服務(wù)的好幫手,學(xué)科館員經(jīng)常利用CiteSpace 做文獻(xiàn)計(jì)量分析,使用Ucinet 做網(wǎng)絡(luò)分析,采用R 語言做各種統(tǒng)計(jì)分析等。因此,開發(fā)一個(gè)翻譯工具,以減輕館員工作量,是本文研究的目的所在。
目前,基于深度學(xué)習(xí)的神經(jīng)機(jī)器翻譯方法獲得迅速發(fā)展,已取代傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯成為學(xué)術(shù)界和工業(yè)界新的主流方法,翻譯質(zhì)量得到顯著提升[1]。研究機(jī)器翻譯在圖書館信息服務(wù)中應(yīng)用的文獻(xiàn)較少,具有代表性的研究工作是陳江萍[2-3]等對(duì)數(shù)字圖書館多語言信息存取和元數(shù)據(jù)記錄的機(jī)器翻譯,結(jié)果顯示,機(jī)器翻譯系統(tǒng)可以勝任翻譯一些常用的信息存取點(diǎn),如主題、創(chuàng)建者、標(biāo)題等,但是對(duì)概述或文摘的翻譯仍是一大挑戰(zhàn)。
有道翻譯API 接口提供的翻譯服務(wù),包含了中英翻譯和小語種翻譯功能,通過編程調(diào)用有道翻譯API,傳入待翻譯的內(nèi)容,并指定要翻譯的源語言和目標(biāo)語言種類,就可以得到相應(yīng)的翻譯結(jié)果。R 語言是一個(gè)自由、免費(fèi)、源代碼開放的軟件,特別在統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)繪圖方面具有強(qiáng)大功能,通過編程可以極大地減輕重復(fù)性的工作量。本文采用R 語言函數(shù)調(diào)用有道翻譯API,實(shí)現(xiàn)了自動(dòng)翻譯功能,并對(duì)翻譯結(jié)果開展了測(cè)評(píng)研究。
為保證翻譯與測(cè)評(píng)過程條理清晰,本研究工作分為四個(gè)步驟:第一,整理分類翻譯的內(nèi)容,主要包括題名、摘要、國(guó)家、機(jī)構(gòu)、研究前沿等;第二,調(diào)用R 語言函數(shù)完成翻譯;第三,從翻譯結(jié)果當(dāng)中隨機(jī)抽樣,生成測(cè)評(píng)試卷;第四,采用人工測(cè)評(píng)方法對(duì)翻譯結(jié)果打分并寫上評(píng)語。研究表明,翻譯結(jié)果基本能夠滿足圖書館信息服務(wù)需求,對(duì)專有名詞的翻譯表現(xiàn)最好,對(duì)句子、段落的翻譯表現(xiàn)較好,對(duì)縮寫詞匯、新生詞匯以及結(jié)構(gòu)過于復(fù)雜句子的翻譯欠佳。基于R 語言開發(fā)的翻譯工具在圖書館學(xué)科服務(wù)、定題跟蹤、專題報(bào)告、科技查新等服務(wù)中得到了應(yīng)用,一定程度上減輕了信息服務(wù)過程中的翻譯工作量。
國(guó)內(nèi)提供在線翻譯服務(wù)的公司主要有百度和有道,兩者均提供了互聯(lián)網(wǎng)應(yīng)用編程接口。目前,有道智云API 接口可以提供的翻譯服務(wù)主要包含中文在內(nèi)的8 種語言相互翻譯功能,分別是中文、日文、英文、韓文、法文、俄文、葡萄牙文和西班牙文。
API 是互聯(lián)網(wǎng)服務(wù)應(yīng)用編程接口,直接通過HTTP 協(xié)議與客戶程序進(jìn)行通信。應(yīng)用程序一般需要執(zhí)行三個(gè)步驟:第一步,按要求準(zhǔn)備好相關(guān)參數(shù),使用HTTP 協(xié)議調(diào)用接口;第二步,接口對(duì)源文數(shù)據(jù)進(jìn)行機(jī)器翻譯,并返回結(jié)果;第三步,按需要的格式提取返回結(jié)果。應(yīng)用程序無需關(guān)心接口處理的細(xì)節(jié),這使得第三方可以利用有道翻譯提供更具靈活性的,能夠滿足用戶個(gè)性化需求的特色服務(wù),例如,嵌入到瀏覽器、網(wǎng)站或應(yīng)用程序中。
調(diào)用有道智云API,需要向其傳入待翻譯的內(nèi)容、源語言的種類和目標(biāo)語言的種類,同時(shí)還需要傳入應(yīng)用ID 及其密鑰等參數(shù),若通過接口的認(rèn)證,就可以得到相應(yīng)的翻譯結(jié)果。這一過程可以分解為三個(gè)步驟:構(gòu)建HTTP 請(qǐng)求指令、獲取翻譯結(jié)果、轉(zhuǎn)換翻譯結(jié)果。
第一步,構(gòu)建HTTP 請(qǐng)求指令。HTTP 請(qǐng)求指令包含7 個(gè)變量,如表1所示。
表1 HTTP 請(qǐng)求指令變量說明
表1中的前三個(gè)變量很好理解,變量q 用來存儲(chǔ)要翻譯的文本,其使用的編碼必須是UTF-8格式;變量from 用來存儲(chǔ)源語言的類型,可以設(shè)置成auto 讓服務(wù)器自動(dòng)檢測(cè),由于本次僅對(duì)英文進(jìn)行了翻譯測(cè)試,故源語言類型為“EN”。變量to用來存儲(chǔ)要翻譯的目標(biāo)語言。由于有道智云API是一項(xiàng)收費(fèi)服務(wù),所以需要?jiǎng)?chuàng)建應(yīng)用ID 和密鑰,以便服務(wù)器根據(jù)該ID 提交數(shù)據(jù)的字節(jié)數(shù)來收費(fèi)。應(yīng)用ID(appKey)及其密鑰(secretKey)需要預(yù)先到有道智云網(wǎng)站申請(qǐng),步驟如下:①登陸有道智云官網(wǎng),點(diǎn)擊右上角“注冊(cè)”按鈕,在注冊(cè)頁面(http://ai.youdao.com/register.s)選擇用網(wǎng)易郵箱或者合作賬號(hào),比如QQ、微博和微信登陸,然后完善個(gè)人信息,成為開發(fā)者;②登陸有道智云平臺(tái)后,點(diǎn)擊“應(yīng)用管理”—>“我的應(yīng)用”—>“創(chuàng)建應(yīng)用”,根據(jù)提示信息,完成應(yīng)用創(chuàng)建;③選擇“自然語言翻譯”—>“翻譯實(shí)例”—>“創(chuàng)建實(shí)例”,完成實(shí)例的創(chuàng)建;④點(diǎn)擊“應(yīng)用管理”—>“我的應(yīng)用”,在應(yīng)用列表找到新需要綁定的應(yīng)用,點(diǎn)擊“綁定服務(wù)”。變量salt 存儲(chǔ)的是一個(gè)從1 到65 535 之間的一個(gè)隨機(jī)數(shù)。簽名變量(sign)需要通過MD5(appKey+q+salt+密鑰)生成。R語言代碼如下:
構(gòu)建的HTTP 請(qǐng)求指令保存在變量httpClient 當(dāng)中,其形式如下所示,其含義表示請(qǐng)求有道智云翻譯網(wǎng)站將英文“good”翻譯成中文。
http://openapi.youdao.com/api?q=good&from=EN&to=zh_CHS&appKey=ff889495-4b45-46d9-8f48-946554334f2a&salt=2&sign=1995882C5064805BC30 A39829B779D7B
第二步,訪問網(wǎng)站獲取翻譯結(jié)果。本文應(yīng)用R 語言的RCurl 包訪問網(wǎng)頁,返回JSON 格式的結(jié)果。將HTTP 請(qǐng)求指令代入RCurl 包的getURL函數(shù)即可得到Web 服務(wù)器返回的結(jié)果,用R 語言表示就是以下一條指令。
URI <- getURL(httpClient)
變量URL 當(dāng)中存放的是服務(wù)器返回的JSON 格式的翻譯結(jié)果。JSON 是一種輕量級(jí)的數(shù)據(jù)傳輸格式,能夠在多種語言之間進(jìn)行數(shù)據(jù)交換,具有簡(jiǎn)潔和易于使用的特點(diǎn),在Web 開發(fā)中得到廣泛應(yīng)用。JSON 有對(duì)象和數(shù)組兩種主要形式。對(duì)象是一個(gè)無序的“名稱/值”對(duì)集合,如圖1所示。一個(gè)對(duì)象以“{”開始,以“}”結(jié)束,每個(gè)“名稱”后跟一個(gè)“:”,“名稱”使用雙引號(hào)括起來,名稱的每個(gè)“值”之間使用“,”將其分隔。數(shù)組是值的有序集合,如圖2所示。一個(gè)數(shù)組以“[”開始,以“]”結(jié)束,值之間使用“,”將其分隔[4]。
圖1 JSON 對(duì)象格式
圖2 JSON 數(shù)組格式
圖3 返回的JSON 格式的結(jié)果
翻譯結(jié)果的JSON 格式示例如圖3所示。Web 服務(wù)器端在處理客戶端的HTTP 請(qǐng)求時(shí),將處理結(jié)果“序列化” (Serialization),即將對(duì)象狀態(tài)轉(zhuǎn)換為可保持或傳輸?shù)母袷降倪^程,然后傳輸?shù)娇蛻舳?。由于這種序列化的數(shù)據(jù)格式不便于閱讀,所以客戶端需要執(zhí)行“反序列化”操作,這就是接下來的第三步,將“數(shù)據(jù)流”轉(zhuǎn)換為“數(shù)據(jù)對(duì)象”。
第三步,轉(zhuǎn)換翻譯結(jié)果。JSON 是JavaScript Object Notation 的縮寫,在R 語言環(huán)境中可以使用rjson 包中的fromJSON 函數(shù)將JSON 文件轉(zhuǎn)換成R 語言的list 對(duì)象,指令如下。
obj <- fromJSON(URI)
數(shù)據(jù)對(duì)象obj 是一個(gè)包含10 個(gè)元素的列表結(jié)構(gòu),如表2所示。
表2 翻譯結(jié)果數(shù)據(jù)對(duì)象結(jié)構(gòu)
從表2可見,如果要獲取翻譯結(jié)果,可以直接通過obj$translation 指令操作,其它字段信息可以根據(jù)應(yīng)用需要,有選擇性地利用,例如,根據(jù)obj$ errorCode 代碼處理出錯(cuò)信息等。
本文使用的R 語言版本為R3.4.1,使用到的主要貢獻(xiàn)包(package)有4 個(gè):digest 包,通過digest()函數(shù)對(duì)sign 進(jìn)行md5 算法加密完成數(shù)字簽名,數(shù)字簽名是一種非對(duì)稱加密的認(rèn)證模式,其目的是為了讓接收方(服務(wù)器)確認(rèn)發(fā)送方的信息是否被篡改,這也是服務(wù)器常用的一種保證數(shù)據(jù)安全的方式;RCurl 包,通過包內(nèi)getURL()函數(shù)獲取拼接后的URL 地址返回的網(wǎng)頁內(nèi)容,通過這個(gè)包可以實(shí)現(xiàn)向服務(wù)器發(fā)送翻譯請(qǐng)求后再接收服務(wù)器返回的相關(guān)數(shù)據(jù),該數(shù)據(jù)內(nèi)的元素如表2中所示;rjson 包,通過包內(nèi)fromJSON()函數(shù)讀取JSON 并解析成R 語言能夠識(shí)別的list 結(jié)構(gòu),目的是為了讓非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化,再按需對(duì)list 對(duì)象中的翻譯結(jié)果、語音朗讀等具體內(nèi)容進(jìn)行展示。
機(jī)器翻譯結(jié)果測(cè)評(píng)就是對(duì)給定翻譯系統(tǒng)生成譯文的質(zhì)量進(jìn)行量化的評(píng)價(jià),一般分為人工測(cè)評(píng)與自動(dòng)測(cè)評(píng)兩類[5]。其中,人工測(cè)評(píng)是根據(jù)測(cè)評(píng)者的主觀判斷對(duì)翻譯結(jié)果進(jìn)行打分,該方法容易操作,也較為成熟,測(cè)評(píng)結(jié)果一般比較準(zhǔn)確,但成本較高,周期較長(zhǎng)。
人工測(cè)評(píng)的標(biāo)準(zhǔn)隨著機(jī)器翻譯的發(fā)展進(jìn)步和時(shí)間的推移,在描述上產(chǎn)生了一些變化。最早的人工測(cè)評(píng)可以追溯到1966年,分為“可理解性”和“保真度”兩個(gè)標(biāo)準(zhǔn)[6-7]。可理解性指的是翻譯后內(nèi)容應(yīng)使人能夠理解,保真度指的是翻譯后的內(nèi)容能夠真實(shí)還原原意。到90年代后,ARPA 提出了“忠實(shí)度”和“流利度”兩個(gè)標(biāo)準(zhǔn)[6,8],這也是90年代至今都應(yīng)用較為廣泛的人工測(cè)評(píng)指標(biāo)[9],忠實(shí)度指的是譯文是否如實(shí)表達(dá)原文的意思,流利度指的是語句是否流暢通順[10]。2000年后也出現(xiàn)過其它一些人工測(cè)評(píng)標(biāo)準(zhǔn),但其實(shí)質(zhì)是基于忠實(shí)度和流利度兩個(gè)標(biāo)準(zhǔn)的補(bǔ)充。2010年,LDC(語言學(xué)數(shù)據(jù)協(xié)會(huì))制定了以流利程度(fluency)和充分程度(adequacy)為機(jī)器翻譯人工測(cè)評(píng)指標(biāo)[3]。
本文通過R 語言自編函數(shù)完成了一批翻譯工作,包括ESI 學(xué)科分析過程中涉及的150 多個(gè)國(guó)家或地區(qū)的名稱,5 465 個(gè)機(jī)構(gòu)名稱,8 683個(gè)研究前沿的翻譯,還包括1 萬余篇論文題名和摘要的翻譯,從各項(xiàng)的翻譯結(jié)果中隨機(jī)抽樣并按一定標(biāo)準(zhǔn)生成試卷后進(jìn)行測(cè)評(píng)。
測(cè)評(píng)借鑒孫連恒等[11]的方法和測(cè)評(píng)標(biāo)準(zhǔn),我們聘請(qǐng)了四位具有博士學(xué)位且從教多年的英語教師對(duì)翻譯結(jié)果打分并給出相關(guān)評(píng)語。實(shí)際操作時(shí),針對(duì)“國(guó)家名稱、機(jī)構(gòu)名稱、研究前沿、論文題名、論文摘要”等5 個(gè)類別,隨機(jī)抽取翻譯結(jié)果組成試卷。每張?jiān)嚲淼目偡衷O(shè)為100 分,按照題量為4:4:4:4:1,分值為1:1:1:1:4 的比例隨機(jī)生成。前4 類每一類題量為4,每題5 分,這5 分全部來自充分程度的得分;論文摘要題量為1,每題20 分,這20 分中流利程度和充分程度各占10分。之所以對(duì)前4 類只進(jìn)行充分程度的評(píng)分,是因?yàn)榭紤]到這四類的內(nèi)容都是單詞、詞組或者名詞性短語、非完整句組成,所以對(duì)于國(guó)家、機(jī)構(gòu)、前沿和題名只做充分程度的測(cè)評(píng),對(duì)于摘要?jiǎng)t進(jìn)行流利程度和充分程度的測(cè)評(píng),具體標(biāo)準(zhǔn)如表3所示。
表3 流利程度和充分程度分值及含義
四位測(cè)評(píng)員根據(jù)以上測(cè)評(píng)標(biāo)準(zhǔn),對(duì)翻譯結(jié)果進(jìn)行人工測(cè)評(píng)打分。測(cè)評(píng)過程要求單獨(dú)進(jìn)行,且所有內(nèi)容須在2 小時(shí)內(nèi)完成,測(cè)評(píng)結(jié)果如表4所示。
表4 四位測(cè)評(píng)員的測(cè)評(píng)結(jié)果
表4為四位測(cè)評(píng)員的測(cè)評(píng)結(jié)果,其中“/”左側(cè)為該項(xiàng)得分,右側(cè)為該項(xiàng)總分。將各項(xiàng)標(biāo)準(zhǔn)差進(jìn)一步處理,假設(shè)每一項(xiàng)總分均為5 分,最大的標(biāo)準(zhǔn)差也僅為0.645,表明各項(xiàng)翻譯得分較為穩(wěn)定。
國(guó)家名稱、機(jī)構(gòu)名稱、研究前沿、論文題名、論文摘要這五項(xiàng)各20 分的翻譯內(nèi)容里,國(guó)家、前沿、題名這三項(xiàng)平均得分均大于14.5,單題平均也都都超過了3.6 分,在充分程度上均可以達(dá)到基本表達(dá)主要意思及以上的效果,尤其是研究前沿的翻譯上,單題得分接近4 分,效果最好。而在機(jī)構(gòu)名稱的翻譯上,有兩位測(cè)評(píng)員給出了12 分以下的分?jǐn)?shù),最低的一位評(píng)測(cè)員該項(xiàng)只給出了9 分,平均一題僅得2.25 分,這也是導(dǎo)致平均分低于12 分的原因所在,進(jìn)而分析這兩項(xiàng)得分較低的翻譯內(nèi)容,發(fā)現(xiàn)是由于機(jī)構(gòu)名稱的縮寫所致。
論文摘要得分上,“/”左側(cè)的得分包含了流利程度和充分程度,各占該項(xiàng)總分20 分的一半,得分可以看出充分程度和流利程度差別并不是很大,且充分程度得分均小于流利程度,這和對(duì)翻譯內(nèi)容分析后的結(jié)果相同,在句子段落的翻譯上,有道智云往往是流利度優(yōu)先,少數(shù)情況會(huì)出現(xiàn)個(gè)別單詞的漏譯或誤譯。在平均分上也達(dá)到了12 分,平均單題獲得3 分,總體達(dá)到基本通順。
接著我們分析了4 位測(cè)評(píng)員對(duì)試卷打分后給出的評(píng)語,并對(duì)每位測(cè)評(píng)員的觀點(diǎn)進(jìn)行了總結(jié)。測(cè)評(píng)員A 認(rèn)為,可以正確翻譯摘要中的主要單詞和短語,部分單句不符合漢語的語法規(guī)則;測(cè)評(píng)員B 認(rèn)為,譯文可以為科研人員提供輔助性的理解,但與人工翻譯仍存在差距;測(cè)評(píng)員C 認(rèn)為,根據(jù)翻譯的基本原則和要求,即忠實(shí)原文的基礎(chǔ)上可以達(dá)到通順,但倘若用于學(xué)術(shù)、商業(yè)、法律、外教、文化交流等方面的翻譯,后期的人工編輯(糾錯(cuò))非常重要;測(cè)評(píng)員D 認(rèn)為,基本通順,但存在不符合漢語語法規(guī)則的單句,句子之間的邏輯關(guān)系有待加強(qiáng)。
本文是實(shí)際工作的總結(jié),用R 語言開發(fā)的工具在學(xué)科信息、文獻(xiàn)檢索、科技查新等服務(wù)中得到了應(yīng)用,取得了預(yù)期效果,較大的減輕了館員的人工翻譯工作量。
2015年,國(guó)家將“雙一流”建設(shè)寫入“十三五”規(guī)劃,作為高等教育發(fā)展的一項(xiàng)重要決策[12]。在遴選一流學(xué)科中,ESI 成為一項(xiàng)重要指標(biāo),這使得全國(guó)高校開始追蹤ESI 學(xué)科排名,圖書館開展的相關(guān)服務(wù)工作量顯著增加,這其中就包括了ESI 高被引論文題錄信息的翻譯。由于ESI 每?jī)蓚€(gè)月更新一次數(shù)據(jù),分析工作呈現(xiàn)出重復(fù)性特征,非常適合采取工具軟件輔助完成分析任務(wù),以提高工作效率。本文利用R 語言編寫的計(jì)量分析軟件不但可以進(jìn)行統(tǒng)計(jì)分析,還可以對(duì)原始文獻(xiàn)的相關(guān)內(nèi)容提供翻譯,這既能滿足學(xué)者的學(xué)術(shù)信息需求,也能滿足科研管理部門的宏觀信息需求,翻譯工具對(duì)基于ESI 的學(xué)科服務(wù)發(fā)揮了輔助作用,為高校學(xué)科建設(shè)和科研活動(dòng)提供更有價(jià)值的參考。
科技查新是我國(guó)高校圖書館的一項(xiàng)特色工作,最早可以追溯到1980年[13],其目的是查證科研課題或成果的新穎性[14]??萍疾樾峦ǔI婕爸杏⑽臋z索,查全率和查準(zhǔn)率是其關(guān)鍵指標(biāo)。查新員經(jīng)常需要翻譯中英文專業(yè)術(shù)語,還需要大量閱讀檢索結(jié)果,這對(duì)圖書館員是一大挑戰(zhàn),目前通常應(yīng)用“取詞翻譯”和“劃詞翻譯”工具輔助閱讀外文文摘。事實(shí)上,可以在科技查新的過程中嵌入翻譯工具,自動(dòng)翻譯文摘,提高查新員閱讀外文文獻(xiàn)的效率。
此外,高校圖書館在定題跟蹤、專題報(bào)道、科技情報(bào)編譯等信息咨詢服務(wù)中,有時(shí)也需要提供翻譯工作,開發(fā)一個(gè)翻譯工具,有助于提高圖書館信息服務(wù)效率和水平。
基于4 位測(cè)評(píng)員的打分和評(píng)語,測(cè)評(píng)員們普遍認(rèn)為在國(guó)家名稱、研究前沿、論文題名的翻譯上,有道智云在大多數(shù)文本翻譯上已經(jīng)達(dá)到“信達(dá)雅”中“信”的基本水平,尤其是研究前沿等片段性的文本翻譯效果最好,滿足了圖書館在信息咨詢服務(wù)中使用機(jī)器翻譯替代人工翻譯提高效能的要求。在摘要這類長(zhǎng)文本的翻譯上,測(cè)評(píng)員們認(rèn)為盡管上下文中還會(huì)出現(xiàn)不合乎邏輯順序的問題,單句也會(huì)存在不符合語法規(guī)則的情況,但絕大多數(shù)情況下可以較好的翻譯句中主要單詞和短語,在忠實(shí)原文的基礎(chǔ)上達(dá)到基本通順。這依然表明了片段性文本內(nèi)容的翻譯在目前看來已對(duì)機(jī)器翻譯產(chǎn)生不了大的難度,也證明了有道智云API 提供的翻譯功能在圖書館信息咨詢中是有價(jià)值的,并且在科研工作中也可以提供一定程度上輔助性的幫助。而要達(dá)到為科研工作者提供更為有效的幫助,還是建議要把機(jī)器翻譯和人工翻譯結(jié)合起來,各取所長(zhǎng),在進(jìn)行高效的機(jī)器翻譯后有針對(duì)性的對(duì)部分內(nèi)容進(jìn)行人工校正和潤(rùn)色。同時(shí),本文的研究存在一定局限,僅對(duì)英文進(jìn)行了翻譯測(cè)試,未開展多語種測(cè)試分析,今后可進(jìn)一步開展其他語種的測(cè)試分析。
綜上所述,本文既驗(yàn)證了陳江萍[2]提到的文摘翻譯仍然存在挑戰(zhàn)以及人工打分主觀性較高導(dǎo)致了同一標(biāo)準(zhǔn)下得分的一致性較低的情況,又增加了其文中機(jī)器翻譯沒有實(shí)現(xiàn)的批量化、自動(dòng)化的功能。圖書館在提供信息咨詢服務(wù)時(shí),要翻譯的內(nèi)容存在很大一部分是片段性的文本,諸如關(guān)鍵詞、研究前沿、摘要等。R 語言調(diào)用有道智云API 所提供的批量化、自助化的翻譯服務(wù)是可以完成這些工作中的大多數(shù)內(nèi)容,從而也是可以解決信息咨詢服務(wù)中館員工作量大、效率低的問題。并且利用R 語言的便利性,可以很方便的對(duì)文獻(xiàn)數(shù)據(jù)進(jìn)行文獻(xiàn)計(jì)量操作。
機(jī)器翻譯作為人工智能具體研究方向之一,發(fā)展至今依然存在很大的前景和上升空間,隨著神經(jīng)機(jī)器翻譯等各類相關(guān)技術(shù)的不斷發(fā)展,各類方法的不斷優(yōu)化,未來機(jī)器翻譯可以更加完善,服務(wù)更多的用戶。