陳星潼 趙愛清
摘要:以ChatGPT為代表的新一代人工智能技術對中文期刊編輯出版產生了巨大沖擊,英文摘要生產環(huán)節(jié)作為翻譯與文字處理的代表,首當其沖。文章通過實證研究,利用ChatGPT分別翻譯、生成隨機抽取的某中文核心期刊文章摘要,以資深編輯精讀與海外專家評審兩種模式評估其質量,并探究人工智能大模型對中文期刊編輯出版的潛在影響及存在的風險。結果顯示,由ChatGPT翻譯的摘要總體上與現(xiàn)有模式水平相當,在專有名詞和中國特色詞匯選擇方面優(yōu)于現(xiàn)有模式;由ChatGPT生成的摘要通順明確,更符合國際慣例。但當前,基于人工智能大模型生成的摘要也存在直譯誤譯、意識形態(tài)把握難、時效性不足等問題,還無法完全替代編輯人工審校。文章提出,人工智能大模型已成為編輯出版的重要輔助工具,中文期刊一要重新審視英文摘要的生產方式及規(guī)范要求,推出明確翔實且適用于國際推廣的英文摘要范本;二要牢牢把握人的主導權,以批判性思維和創(chuàng)造性眼光面對新工具;三要用好人工智能大模型,以人機協(xié)同模式提升英文摘要質量、擴展傳播方式、提升工作效率;四要積極參與共建高質量中文語料庫、行業(yè)語料庫工作,為傳播好中國聲音貢獻力量。
關鍵詞:人工智能大模型;學術期刊;英文摘要;編輯;翻譯
中圖分類號:G237.5;TP18 文獻標志碼:A 文章編號:1674-8883(2024)03-0001-04
基金項目:本論文為2022年度四川省社會科學重點研究基地四川學術成果分析與應用研究中心資助科研項目“四川期刊發(fā)展研究專項”成果,項目編號:XSCG22QK-004
以ChatGPT為代表的人工智能大模型具有強大的泛化和通用能力,一經推出就引發(fā)全球關注。翻譯和文字處理工作被列為最容易被ChatGPT替代的工作[1],而中文學術期刊的英文摘要生產同時具有翻譯與文字處理的特征,因此被認為可能是出版中最先被ChatGPT取代的環(huán)節(jié)。
前人從文體[2]、體裁[3]、語言學[4]等視角評價了我國期刊英文摘要的發(fā)展,但從編輯視角研究英文摘要的較少。柯文輝等[5]探討了學術刊物在英文摘要處理過程中的關鍵點和創(chuàng)新嘗試;夏玲等[6]總結了神經機器翻譯發(fā)展對論文英文摘要編輯加工流程的影響。但總體來看,現(xiàn)有研究還鮮有關于大語言模型對英文摘要編譯的影響。
因此,本文通過實驗的方法,分別運用ChatGPT的翻譯和生成功能產生英文摘要,通過對比分析評估其真實效用與特點,進而得出預測性、前瞻性的判斷,旨在為提升中文期刊英文摘要的生產和編輯工作效率提供參考。
(一)英文摘要對中文期刊的重要性
摘要是現(xiàn)代論文的重要組成部分,其作為論文內容的高度概括、期刊質量的重要指標,受到論文作者、期刊編輯人員及文獻搜索者的高度重視[7]。國家標準《GB 6447-1986文摘編寫規(guī)則》對文摘的要素已有明文規(guī)定,即包含目的、方法、結果、討論和其他五個部分。國際上對英文摘要的寫作規(guī)范要求ISO214-1976(E)指出,要用簡練、規(guī)范、有力的語言表達英文摘要內容。
好的摘要對于增加期刊和論文的被檢索和引用機會、吸引讀者、擴大影響起著不可忽視的作用[8]。具體而言,摘要的主要功能有兩方面:一是便于讀者快速了解論文的主要內容及結論,判斷是否需要閱讀全文;二是成為國際主要檢索機構的數據庫加工索引、收錄論文的主要依據。英文摘要質量是美國《科學引文索引》(SCI)、美國《工程索引》(EI)等國際著名權威學術檢索機構決定是否收錄國內科技論文的主要依據之一。因此,中文期刊英文摘要的質量直接影響論文價值和國際傳播效果,對進一步提高我國期刊的國際影響力具有重要意義。
(二)當前學術期刊英文摘要的生產流程
目前,中文學術期刊的英文摘要生產模式,基本可以概括為在作者初次翻譯基礎上的編輯修正模式:多數期刊要求作者投稿時提供中英文摘要,稿件錄用后的編輯校對過程中,期刊編輯人員依據最終確定的中文摘要來修改或重新翻譯英文摘要,有些期刊聘請專業(yè)翻譯人員開展英文摘要的翻譯校對工作。
學術期刊一般通過優(yōu)化工作流程并采取必要的質量管理措施來保證英文摘要質量,主要包括:責任編輯對中文摘要進行嚴格審修,并與作者商榷完善,以高質量的中文摘要奠定英文摘要的學術質量基礎;部分期刊配置了專門的英文責任編輯崗位,以此保證英文摘要語言質量。
綜上,中文期刊英文摘要的生產是一個多方合作的過程,既有作者提供的英文摘要初稿,又有期刊編輯人員以及英文專業(yè)人士的后期加工。作者或翻譯人員借助一些智能機器翻譯工具來輔助開展工作,因此英文摘要的生成也體現(xiàn)了人與機器的協(xié)作。
(一)ChatGPT的特點
ChatGPT是美國OpenAI公司在GPT系列模型的基礎上,歷經4年迭代而來的大規(guī)模預訓練語言模型。大模型是一種基于深度學習的自然語言處理技術,主要是通過大量文本數據,自動生成符合語言規(guī)則的語句、段落甚至文章。其核心思想是利用深度神經網絡來學習自然語言的語法、語義等特征,從而預測下一個詞出現(xiàn)的概率,并根據概率生成新的語句。因此,以ChatGPT為代表的大模型呈現(xiàn)出令人印象深刻的文本翻譯能力。與神經網絡機器翻譯(NMT)相比,它具有通用能力和生成能力[9]。最新的大模型開始突破語言這一邊界,在其他感官結合的領域開始展現(xiàn)出較強的理解與生成能力。
(二)實驗設計
為了檢驗ChatGPT在翻譯和生成論文英文摘要中的實際效果,本文使用ChatGPT(GPT3.5版本),以筆者所在期刊為實驗對象,設計以下試驗。
實驗一:基于作者撰寫的中文摘要,對比由ChatGPT翻譯的版本與作者自行撰寫并經過編輯潤色出版的英文摘要質量。
實驗二:對比由ChatGPT自行生成的英文摘要與作者撰寫并經過編輯潤色出版的英文摘要質量。
筆者所任職的學術期刊中心現(xiàn)轄多本期刊,其中,《經濟學家》作為國內知名的大型經濟學專業(yè)期刊,自1989年創(chuàng)刊以來一直被收錄進入國內各主要文獻評價檢索數據庫,其學術影響力在國內同類期刊中名列前茅。目前,該刊的英文摘要由專職英文編輯負責翻譯校對,作者投稿時提供的英文摘要僅作為參考。選擇該刊作為實驗樣本來源具有良好的代表性,因此筆者從《經濟學家》2022年發(fā)表的文章中隨機抽取10篇作為實驗樣本。
為更好地對比質量,筆者使用兩種方法進行驗證。第一,通過國內資深英文期刊編輯與母語為英語的國外資深編輯人工精讀分析,對比內容一致性、語篇連貫性、語步語態(tài)合理性等方面的異同;第二,通過將不同版本的英文摘要發(fā)給海外專家匿名選擇的方式進行評估。本次所選海外專家共10人,均為英語母語的相關領域專家學者,符合語法規(guī)則、學術通用慣例等為不同版本排序,并分辨哪個版本摘要由AI撰寫。
(一)ChatGPT的翻譯能力與現(xiàn)有模式水平相當
使用ChatGPT時,要通過添加一些自然語言的提示信息,從而幫助計算機更好地理解該任務的語境,這些輸入的提示信息即為提示詞(Prompt)。為保證翻譯效果,本次實驗采用下頁表1的固定提示詞進行翻譯,比較作者自行撰寫并經過編輯潤色出版的英文摘要與ChatGPT翻譯的版本質量。52%的專家認為“作者撰寫+編輯潤色”的出版版本更優(yōu),48%的專家認為ChatGPT翻譯的版本更好,兩者差異不大。在10篇文章中,認為ChatGPT翻譯更佳的占40%,認為“作者撰寫+編輯潤色”的版本更佳的占40%,兩者亦旗鼓相當。值得注意的是,僅有40%的專家正確選擇了“哪一版本由AI翻譯而成”的問題。合理推測,作者與編輯在翻譯摘要的過程中借助了神經網絡機器翻譯工具,綜合判斷,ChatGPT的翻譯能力與現(xiàn)有的“人工智能翻譯+人工審修”的水平基本相當。
(二)專有名詞選擇超越傳統(tǒng)模式,但具有時效性
基于海量數據訓練,大模型在專有名詞選擇上具有較高的準確性。下例中,原文所說的“法償性”是指為保障法定貨幣在公私債務支付中的普遍效力,以法律強制力賦予法定貨幣的“不可拒收性”。出版版本中翻譯的legal compensation(法定賠償)是指允許雙方相互抵消彼此債務的法律原則。ChatGPT翻譯的legal tender status(法定貨幣地位)意為被法律承認為所有公共和私人債務的有效支付手段的貨幣,是債權人在清償債務時不能拒絕的一種付款方式。由此可知,ChatGPT翻譯的版本更加準確。
【中文原文】然而,央行數字貨幣在發(fā)展中同樣面臨貨幣發(fā)行權、法償性、金融風險防范、個人信息保護等難題。
【出版版本】However, central bank digital currency also faces such problems as currency issuance rights, legal compensation, financial risk prevention, personal information protection and so on.
【ChatGPT翻譯】However, CBDCs also face challenges such as currency issuance rights, legal tender status, financial risk prevention, and personal information protection during their development.
同時,對于中國特色詞匯,ChatGPT翻譯的準確性明顯超過出版版本。對于“一帶一路”“鄉(xiāng)村振興”“人類命運共同體”等詞,出版版本中有部分與官方翻譯版不能對應,但ChatGPT能夠準確表達。這是因為相關概念已成為英文世界中的固定搭配,即使ChatGPT訓練語料庫中92.6%為英文,僅0.1%為中文,也能準確表述。但是,由于ChatGPT的訓練數據庫僅更新至2021年,因此在其后出現(xiàn)的固定搭配,如“中國式現(xiàn)代化”等,其無法準確翻譯。
(三)ChatGPT智能生成的摘要更具優(yōu)勢
如前文所述,大模型的智能性體現(xiàn)在其生成功能上。本文選用ChatGPT的衍生工具ChatPDF作為測試工具輔助生成摘要。ChatPDF直接調用ChatGPT的應用程序編程接口,接受PDF格式的文件輸入。結果顯示,ChatGPT基本能夠準確理解全文意思并自動生成摘要。在涉及需要意譯的地方,ChatGPT翻譯版本只能照實翻譯,而ChatGPT生成版本在通讀全文的背景下可了解深意。例如,摘要中以“枝繁根淺”形容技術領域應用廣泛而核心薄弱,ChatGPT翻譯時僅能直譯為“shallow roots and branches”,但當其通讀全文,卻自動概括為“outstanding application technology but weak core technology”,與作者的原意更加貼合。
在已出版、ChatGPT翻譯版與ChatGPT生成的三個摘要中,100%的國外專家在匿名評價時認為ChatGPT生成的版本最優(yōu),認為其“通順、明確”。細究生成版與其他版本的差別,主要在于兩個方面:
一是在語步方面,ChatGPT生成版基本按照“目的—方法—結果—討論”的四步式寫作,結構分明。與著名的“引言—方法—結果—討論”四語步模式[10]相比,其省略引言而直入目的。與“背景—目的—方法—結果—結論”五語步模式[11]相比,其省略了背景。這與筆者近年來對國際經濟學類頂刊發(fā)表文章的摘要變化觀察呈現(xiàn)一致,也從側面體現(xiàn)出大語言模型的學習更新能力。相比之下,中文翻譯版雖然基本符合語步模式,但結構模糊,對背景的介紹較為詳細,對研究目的、使用方法的介紹不夠明確甚至缺失。
二是在語態(tài)方面,中文翻譯版本仍存在佶屈聱牙的中式英文情況[12],這對于后續(xù)營銷推廣中文期刊成果,獲取更多國際關注極為不利。
(一)革故鼎新:利用人工智能提升中文期刊英文摘要的質量
本次實驗中,ChatGPT直接生成而非翻譯的摘要獲得了國外學者的認可,從側面反映出當前中文期刊的英文摘要生產還有較大的優(yōu)化空間。因此,應重新審視中文期刊英文摘要的生產方式及規(guī)范要求,建議學術期刊編輯部不囿于中文與英文字字對照翻譯的思路,在研究世界一流期刊的基礎上,推出更加明確翔實且適用于國際推廣的英文摘要范本。
(二)相輔相成:大模型不能替代譯后審校
實驗可知,大模型在翻譯中仍然存在直譯誤譯、時效性差、意識形態(tài)把握難等問題。因此,深度譯后編輯仍然是必需的,人機協(xié)同的時代不可阻止,但編輯不能丟失作為人的主導權,而是要積極提升數字素養(yǎng),勇敢嘗試新興工具,以批判性思維和創(chuàng)造性眼光,洞悉新一代人工智能工具的風險與挑戰(zhàn),在牢牢把握我國期刊的本質屬性與出版規(guī)律的基礎上,為提升中文學術期刊的全球能見度貢獻力量。
(三)無遠弗屆:利用大模型拓展中文期刊顯示度大有可為
在編輯部人數有限的情況下,大模型可以極大地提升工作效率。根據MIT的研究,ChatGPT可以幫助員工提升59%的生產力。以優(yōu)化摘要為起點,中文期刊可以借助其能力通過多種渠道拓展國際顯示度。例如,可使用精準指示詞要求其生成適合不同語言、面向不同場景的宣傳文本[13]。未來,多模態(tài)大模型的使用可實現(xiàn)視頻生成、圖像生成,有利于高水平內容的快速傳播[14]。
(四)刻不容緩:發(fā)出中國好聲音須爭奪國際話語權
大模型研發(fā)需要極高的訓練成本且存在技術壁壘,很容易造成少數優(yōu)勢大國技術上的寡頭壟斷,還可能進一步強化西方價值觀隱蔽的支配地位。一方面,實驗結果表明,不能放棄英文宣傳陣地,要讓中國特色詞匯更加廣泛地出現(xiàn)在國際視野中,成為能夠被大模型識別的專有詞匯;另一方面,要建設基于高質量中文語料訓練的自主可控大模型[15]。中文期刊編輯部未來可以參與到補充高質量中文語義庫、行業(yè)語料庫的工作中,為大模型訓練提供基礎素材,擴展社會主義意識形態(tài)的潛在價值傳遞。
本文初步探索了ChatGPT在學術期刊摘要生產領域的應用效果。結果顯示,即使在編輯工作最簡單的環(huán)節(jié),ChatGPT之類的大模型仍然無法完全替代人力,但它已成為重要的輔助工具。風物長宜放眼量,講好中國故事、增強文化軟實力,還需業(yè)界學界共同努力,而用好新一代人工智能工具適當其時。
參考文獻:
[1] 賴少明,顧琛蘭,臧艷嬌.人工智能技術在新聞傳播領域的應用研究[J].新聞研究導刊,2023,14(23):1-3.
[2] 張春芳,劉雪立.國外結構式摘要研究回顧:以JamesHartley的研究為例[J].中國科技期刊研究,2012,23(1):56-61.
[3] 康勤,孫萍.基于語料庫的科研論文英文摘要的體裁分析[J].外語教學,2012,33(5):28-31.
[4] 趙永青,梁曉磊,高君,等.中外學術期刊實證類論文英文摘要推銷型式對比研究[J].外語與外語教學,2018(1):61-71,147-148.
[5] 柯文輝,林海清,黃愛萍,等.中文學術期刊英文摘要審修的編輯部工作流程[J].編輯學報,2016,28(5):443-444.
[6] 夏玲,李宜蔓,李弘武.人工智能背景下科技論文摘要的機器翻譯與譯后編輯[J].編輯學報,2022,34(4):396-401,406.
[7] 黃河清,韓健,張鯨驚,等.中外科技期刊英文摘要文體格式的變化及建議[J].中國科技期刊研究,2015,26(2):143-151.
[8] 原俊鳳,錢亦兵,彭永生,等.以外籍副主編對英文摘要的編校分析英文摘要中的常見錯誤[J].農業(yè)圖書情況報學刊,2014(2):154-157.
[9] 柳川,陳鋒. ChatGPT風暴[N].華夏時報,2023-02-13(001).
[10] 宋寶梅,孫善飛.基于語料庫的動物科學專業(yè)學術論文英文摘要研究[J].黑龍江畜牧獸醫(yī),2018(13):219-221.
[11] 鞠玉梅.中外學者英語學術論文摘要修辭勸說機制比較研究[J].解放軍外國語學院學報,2020,43(1):85-92,160.
[12] 劉偉.論科技期刊英文摘要的審譯:以《海洋技術學報》為例[J].編輯學報,2016,28(4):330-333.
[13] 譚曉荷.“ChatGPT+學術出版”融合模式:全產業(yè)鏈分析、正負效應與應對策略[J].傳播與版權,2023(23):36-40.
[14] 王琪.技術賦能與問題衍生:ChatGPT對學術期刊出版的影響[J].河南大學學報(社會科學版),2023,63(5):139-145,156.
[15] 曾煒,蘇騰,王暉,等.鵬程·盤古:大規(guī)模自回歸中文預訓練語言模型及應用[J].中興通訊技術,2022,28(2):33-43.
作者簡介 陳星潼,編輯,研究方向:出版編輯學。趙愛清,副編審,系本文通訊作者,研究方向:出版編輯學、經濟學。