陳星潼 趙愛清
摘要:以ChatGPT為代表的新一代人工智能技術(shù)對(duì)中文期刊編輯出版產(chǎn)生了巨大沖擊,英文摘要生產(chǎn)環(huán)節(jié)作為翻譯與文字處理的代表,首當(dāng)其沖。文章通過實(shí)證研究,利用ChatGPT分別翻譯、生成隨機(jī)抽取的某中文核心期刊文章摘要,以資深編輯精讀與海外專家評(píng)審兩種模式評(píng)估其質(zhì)量,并探究人工智能大模型對(duì)中文期刊編輯出版的潛在影響及存在的風(fēng)險(xiǎn)。結(jié)果顯示,由ChatGPT翻譯的摘要總體上與現(xiàn)有模式水平相當(dāng),在專有名詞和中國(guó)特色詞匯選擇方面優(yōu)于現(xiàn)有模式;由ChatGPT生成的摘要通順明確,更符合國(guó)際慣例。但當(dāng)前,基于人工智能大模型生成的摘要也存在直譯誤譯、意識(shí)形態(tài)把握難、時(shí)效性不足等問題,還無法完全替代編輯人工審校。文章提出,人工智能大模型已成為編輯出版的重要輔助工具,中文期刊一要重新審視英文摘要的生產(chǎn)方式及規(guī)范要求,推出明確翔實(shí)且適用于國(guó)際推廣的英文摘要范本;二要牢牢把握人的主導(dǎo)權(quán),以批判性思維和創(chuàng)造性眼光面對(duì)新工具;三要用好人工智能大模型,以人機(jī)協(xié)同模式提升英文摘要質(zhì)量、擴(kuò)展傳播方式、提升工作效率;四要積極參與共建高質(zhì)量中文語(yǔ)料庫(kù)、行業(yè)語(yǔ)料庫(kù)工作,為傳播好中國(guó)聲音貢獻(xiàn)力量。
關(guān)鍵詞:人工智能大模型;學(xué)術(shù)期刊;英文摘要;編輯;翻譯
中圖分類號(hào):G237.5;TP18 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-8883(2024)03-0001-04
基金項(xiàng)目:本論文為2022年度四川省社會(huì)科學(xué)重點(diǎn)研究基地四川學(xué)術(shù)成果分析與應(yīng)用研究中心資助科研項(xiàng)目“四川期刊發(fā)展研究專項(xiàng)”成果,項(xiàng)目編號(hào):XSCG22QK-004
以ChatGPT為代表的人工智能大模型具有強(qiáng)大的泛化和通用能力,一經(jīng)推出就引發(fā)全球關(guān)注。翻譯和文字處理工作被列為最容易被ChatGPT替代的工作[1],而中文學(xué)術(shù)期刊的英文摘要生產(chǎn)同時(shí)具有翻譯與文字處理的特征,因此被認(rèn)為可能是出版中最先被ChatGPT取代的環(huán)節(jié)。
前人從文體[2]、體裁[3]、語(yǔ)言學(xué)[4]等視角評(píng)價(jià)了我國(guó)期刊英文摘要的發(fā)展,但從編輯視角研究英文摘要的較少??挛妮x等[5]探討了學(xué)術(shù)刊物在英文摘要處理過程中的關(guān)鍵點(diǎn)和創(chuàng)新嘗試;夏玲等[6]總結(jié)了神經(jīng)機(jī)器翻譯發(fā)展對(duì)論文英文摘要編輯加工流程的影響。但總體來看,現(xiàn)有研究還鮮有關(guān)于大語(yǔ)言模型對(duì)英文摘要編譯的影響。
因此,本文通過實(shí)驗(yàn)的方法,分別運(yùn)用ChatGPT的翻譯和生成功能產(chǎn)生英文摘要,通過對(duì)比分析評(píng)估其真實(shí)效用與特點(diǎn),進(jìn)而得出預(yù)測(cè)性、前瞻性的判斷,旨在為提升中文期刊英文摘要的生產(chǎn)和編輯工作效率提供參考。
(一)英文摘要對(duì)中文期刊的重要性
摘要是現(xiàn)代論文的重要組成部分,其作為論文內(nèi)容的高度概括、期刊質(zhì)量的重要指標(biāo),受到論文作者、期刊編輯人員及文獻(xiàn)搜索者的高度重視[7]。國(guó)家標(biāo)準(zhǔn)《GB 6447-1986文摘編寫規(guī)則》對(duì)文摘的要素已有明文規(guī)定,即包含目的、方法、結(jié)果、討論和其他五個(gè)部分。國(guó)際上對(duì)英文摘要的寫作規(guī)范要求ISO214-1976(E)指出,要用簡(jiǎn)練、規(guī)范、有力的語(yǔ)言表達(dá)英文摘要內(nèi)容。
好的摘要對(duì)于增加期刊和論文的被檢索和引用機(jī)會(huì)、吸引讀者、擴(kuò)大影響起著不可忽視的作用[8]。具體而言,摘要的主要功能有兩方面:一是便于讀者快速了解論文的主要內(nèi)容及結(jié)論,判斷是否需要閱讀全文;二是成為國(guó)際主要檢索機(jī)構(gòu)的數(shù)據(jù)庫(kù)加工索引、收錄論文的主要依據(jù)。英文摘要質(zhì)量是美國(guó)《科學(xué)引文索引》(SCI)、美國(guó)《工程索引》(EI)等國(guó)際著名權(quán)威學(xué)術(shù)檢索機(jī)構(gòu)決定是否收錄國(guó)內(nèi)科技論文的主要依據(jù)之一。因此,中文期刊英文摘要的質(zhì)量直接影響論文價(jià)值和國(guó)際傳播效果,對(duì)進(jìn)一步提高我國(guó)期刊的國(guó)際影響力具有重要意義。
(二)當(dāng)前學(xué)術(shù)期刊英文摘要的生產(chǎn)流程
目前,中文學(xué)術(shù)期刊的英文摘要生產(chǎn)模式,基本可以概括為在作者初次翻譯基礎(chǔ)上的編輯修正模式:多數(shù)期刊要求作者投稿時(shí)提供中英文摘要,稿件錄用后的編輯校對(duì)過程中,期刊編輯人員依據(jù)最終確定的中文摘要來修改或重新翻譯英文摘要,有些期刊聘請(qǐng)專業(yè)翻譯人員開展英文摘要的翻譯校對(duì)工作。
學(xué)術(shù)期刊一般通過優(yōu)化工作流程并采取必要的質(zhì)量管理措施來保證英文摘要質(zhì)量,主要包括:責(zé)任編輯對(duì)中文摘要進(jìn)行嚴(yán)格審修,并與作者商榷完善,以高質(zhì)量的中文摘要奠定英文摘要的學(xué)術(shù)質(zhì)量基礎(chǔ);部分期刊配置了專門的英文責(zé)任編輯崗位,以此保證英文摘要語(yǔ)言質(zhì)量。
綜上,中文期刊英文摘要的生產(chǎn)是一個(gè)多方合作的過程,既有作者提供的英文摘要初稿,又有期刊編輯人員以及英文專業(yè)人士的后期加工。作者或翻譯人員借助一些智能機(jī)器翻譯工具來輔助開展工作,因此英文摘要的生成也體現(xiàn)了人與機(jī)器的協(xié)作。
(一)ChatGPT的特點(diǎn)
ChatGPT是美國(guó)OpenAI公司在GPT系列模型的基礎(chǔ)上,歷經(jīng)4年迭代而來的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型。大模型是一種基于深度學(xué)習(xí)的自然語(yǔ)言處理技術(shù),主要是通過大量文本數(shù)據(jù),自動(dòng)生成符合語(yǔ)言規(guī)則的語(yǔ)句、段落甚至文章。其核心思想是利用深度神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)自然語(yǔ)言的語(yǔ)法、語(yǔ)義等特征,從而預(yù)測(cè)下一個(gè)詞出現(xiàn)的概率,并根據(jù)概率生成新的語(yǔ)句。因此,以ChatGPT為代表的大模型呈現(xiàn)出令人印象深刻的文本翻譯能力。與神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)相比,它具有通用能力和生成能力[9]。最新的大模型開始突破語(yǔ)言這一邊界,在其他感官結(jié)合的領(lǐng)域開始展現(xiàn)出較強(qiáng)的理解與生成能力。
(二)實(shí)驗(yàn)設(shè)計(jì)
為了檢驗(yàn)ChatGPT在翻譯和生成論文英文摘要中的實(shí)際效果,本文使用ChatGPT(GPT3.5版本),以筆者所在期刊為實(shí)驗(yàn)對(duì)象,設(shè)計(jì)以下試驗(yàn)。
實(shí)驗(yàn)一:基于作者撰寫的中文摘要,對(duì)比由ChatGPT翻譯的版本與作者自行撰寫并經(jīng)過編輯潤(rùn)色出版的英文摘要質(zhì)量。
實(shí)驗(yàn)二:對(duì)比由ChatGPT自行生成的英文摘要與作者撰寫并經(jīng)過編輯潤(rùn)色出版的英文摘要質(zhì)量。
筆者所任職的學(xué)術(shù)期刊中心現(xiàn)轄多本期刊,其中,《經(jīng)濟(jì)學(xué)家》作為國(guó)內(nèi)知名的大型經(jīng)濟(jì)學(xué)專業(yè)期刊,自1989年創(chuàng)刊以來一直被收錄進(jìn)入國(guó)內(nèi)各主要文獻(xiàn)評(píng)價(jià)檢索數(shù)據(jù)庫(kù),其學(xué)術(shù)影響力在國(guó)內(nèi)同類期刊中名列前茅。目前,該刊的英文摘要由專職英文編輯負(fù)責(zé)翻譯校對(duì),作者投稿時(shí)提供的英文摘要僅作為參考。選擇該刊作為實(shí)驗(yàn)樣本來源具有良好的代表性,因此筆者從《經(jīng)濟(jì)學(xué)家》2022年發(fā)表的文章中隨機(jī)抽取10篇作為實(shí)驗(yàn)樣本。
為更好地對(duì)比質(zhì)量,筆者使用兩種方法進(jìn)行驗(yàn)證。第一,通過國(guó)內(nèi)資深英文期刊編輯與母語(yǔ)為英語(yǔ)的國(guó)外資深編輯人工精讀分析,對(duì)比內(nèi)容一致性、語(yǔ)篇連貫性、語(yǔ)步語(yǔ)態(tài)合理性等方面的異同;第二,通過將不同版本的英文摘要發(fā)給海外專家匿名選擇的方式進(jìn)行評(píng)估。本次所選海外專家共10人,均為英語(yǔ)母語(yǔ)的相關(guān)領(lǐng)域?qū)<覍W(xué)者,符合語(yǔ)法規(guī)則、學(xué)術(shù)通用慣例等為不同版本排序,并分辨哪個(gè)版本摘要由AI撰寫。
(一)ChatGPT的翻譯能力與現(xiàn)有模式水平相當(dāng)
使用ChatGPT時(shí),要通過添加一些自然語(yǔ)言的提示信息,從而幫助計(jì)算機(jī)更好地理解該任務(wù)的語(yǔ)境,這些輸入的提示信息即為提示詞(Prompt)。為保證翻譯效果,本次實(shí)驗(yàn)采用下頁(yè)表1的固定提示詞進(jìn)行翻譯,比較作者自行撰寫并經(jīng)過編輯潤(rùn)色出版的英文摘要與ChatGPT翻譯的版本質(zhì)量。52%的專家認(rèn)為“作者撰寫+編輯潤(rùn)色”的出版版本更優(yōu),48%的專家認(rèn)為ChatGPT翻譯的版本更好,兩者差異不大。在10篇文章中,認(rèn)為ChatGPT翻譯更佳的占40%,認(rèn)為“作者撰寫+編輯潤(rùn)色”的版本更佳的占40%,兩者亦旗鼓相當(dāng)。值得注意的是,僅有40%的專家正確選擇了“哪一版本由AI翻譯而成”的問題。合理推測(cè),作者與編輯在翻譯摘要的過程中借助了神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯工具,綜合判斷,ChatGPT的翻譯能力與現(xiàn)有的“人工智能翻譯+人工審修”的水平基本相當(dāng)。
(二)專有名詞選擇超越傳統(tǒng)模式,但具有時(shí)效性
基于海量數(shù)據(jù)訓(xùn)練,大模型在專有名詞選擇上具有較高的準(zhǔn)確性。下例中,原文所說的“法償性”是指為保障法定貨幣在公私債務(wù)支付中的普遍效力,以法律強(qiáng)制力賦予法定貨幣的“不可拒收性”。出版版本中翻譯的legal compensation(法定賠償)是指允許雙方相互抵消彼此債務(wù)的法律原則。ChatGPT翻譯的legal tender status(法定貨幣地位)意為被法律承認(rèn)為所有公共和私人債務(wù)的有效支付手段的貨幣,是債權(quán)人在清償債務(wù)時(shí)不能拒絕的一種付款方式。由此可知,ChatGPT翻譯的版本更加準(zhǔn)確。
【中文原文】然而,央行數(shù)字貨幣在發(fā)展中同樣面臨貨幣發(fā)行權(quán)、法償性、金融風(fēng)險(xiǎn)防范、個(gè)人信息保護(hù)等難題。
【出版版本】However, central bank digital currency also faces such problems as currency issuance rights, legal compensation, financial risk prevention, personal information protection and so on.
【ChatGPT翻譯】However, CBDCs also face challenges such as currency issuance rights, legal tender status, financial risk prevention, and personal information protection during their development.
同時(shí),對(duì)于中國(guó)特色詞匯,ChatGPT翻譯的準(zhǔn)確性明顯超過出版版本。對(duì)于“一帶一路”“鄉(xiāng)村振興”“人類命運(yùn)共同體”等詞,出版版本中有部分與官方翻譯版不能對(duì)應(yīng),但ChatGPT能夠準(zhǔn)確表達(dá)。這是因?yàn)橄嚓P(guān)概念已成為英文世界中的固定搭配,即使ChatGPT訓(xùn)練語(yǔ)料庫(kù)中92.6%為英文,僅0.1%為中文,也能準(zhǔn)確表述。但是,由于ChatGPT的訓(xùn)練數(shù)據(jù)庫(kù)僅更新至2021年,因此在其后出現(xiàn)的固定搭配,如“中國(guó)式現(xiàn)代化”等,其無法準(zhǔn)確翻譯。
(三)ChatGPT智能生成的摘要更具優(yōu)勢(shì)
如前文所述,大模型的智能性體現(xiàn)在其生成功能上。本文選用ChatGPT的衍生工具ChatPDF作為測(cè)試工具輔助生成摘要。ChatPDF直接調(diào)用ChatGPT的應(yīng)用程序編程接口,接受PDF格式的文件輸入。結(jié)果顯示,ChatGPT基本能夠準(zhǔn)確理解全文意思并自動(dòng)生成摘要。在涉及需要意譯的地方,ChatGPT翻譯版本只能照實(shí)翻譯,而ChatGPT生成版本在通讀全文的背景下可了解深意。例如,摘要中以“枝繁根淺”形容技術(shù)領(lǐng)域應(yīng)用廣泛而核心薄弱,ChatGPT翻譯時(shí)僅能直譯為“shallow roots and branches”,但當(dāng)其通讀全文,卻自動(dòng)概括為“outstanding application technology but weak core technology”,與作者的原意更加貼合。
在已出版、ChatGPT翻譯版與ChatGPT生成的三個(gè)摘要中,100%的國(guó)外專家在匿名評(píng)價(jià)時(shí)認(rèn)為ChatGPT生成的版本最優(yōu),認(rèn)為其“通順、明確”。細(xì)究生成版與其他版本的差別,主要在于兩個(gè)方面:
一是在語(yǔ)步方面,ChatGPT生成版基本按照“目的—方法—結(jié)果—討論”的四步式寫作,結(jié)構(gòu)分明。與著名的“引言—方法—結(jié)果—討論”四語(yǔ)步模式[10]相比,其省略引言而直入目的。與“背景—目的—方法—結(jié)果—結(jié)論”五語(yǔ)步模式[11]相比,其省略了背景。這與筆者近年來對(duì)國(guó)際經(jīng)濟(jì)學(xué)類頂刊發(fā)表文章的摘要變化觀察呈現(xiàn)一致,也從側(cè)面體現(xiàn)出大語(yǔ)言模型的學(xué)習(xí)更新能力。相比之下,中文翻譯版雖然基本符合語(yǔ)步模式,但結(jié)構(gòu)模糊,對(duì)背景的介紹較為詳細(xì),對(duì)研究目的、使用方法的介紹不夠明確甚至缺失。
二是在語(yǔ)態(tài)方面,中文翻譯版本仍存在佶屈聱牙的中式英文情況[12],這對(duì)于后續(xù)營(yíng)銷推廣中文期刊成果,獲取更多國(guó)際關(guān)注極為不利。
(一)革故鼎新:利用人工智能提升中文期刊英文摘要的質(zhì)量
本次實(shí)驗(yàn)中,ChatGPT直接生成而非翻譯的摘要獲得了國(guó)外學(xué)者的認(rèn)可,從側(cè)面反映出當(dāng)前中文期刊的英文摘要生產(chǎn)還有較大的優(yōu)化空間。因此,應(yīng)重新審視中文期刊英文摘要的生產(chǎn)方式及規(guī)范要求,建議學(xué)術(shù)期刊編輯部不囿于中文與英文字字對(duì)照翻譯的思路,在研究世界一流期刊的基礎(chǔ)上,推出更加明確翔實(shí)且適用于國(guó)際推廣的英文摘要范本。
(二)相輔相成:大模型不能替代譯后審校
實(shí)驗(yàn)可知,大模型在翻譯中仍然存在直譯誤譯、時(shí)效性差、意識(shí)形態(tài)把握難等問題。因此,深度譯后編輯仍然是必需的,人機(jī)協(xié)同的時(shí)代不可阻止,但編輯不能丟失作為人的主導(dǎo)權(quán),而是要積極提升數(shù)字素養(yǎng),勇敢嘗試新興工具,以批判性思維和創(chuàng)造性眼光,洞悉新一代人工智能工具的風(fēng)險(xiǎn)與挑戰(zhàn),在牢牢把握我國(guó)期刊的本質(zhì)屬性與出版規(guī)律的基礎(chǔ)上,為提升中文學(xué)術(shù)期刊的全球能見度貢獻(xiàn)力量。
(三)無遠(yuǎn)弗屆:利用大模型拓展中文期刊顯示度大有可為
在編輯部人數(shù)有限的情況下,大模型可以極大地提升工作效率。根據(jù)MIT的研究,ChatGPT可以幫助員工提升59%的生產(chǎn)力。以優(yōu)化摘要為起點(diǎn),中文期刊可以借助其能力通過多種渠道拓展國(guó)際顯示度。例如,可使用精準(zhǔn)指示詞要求其生成適合不同語(yǔ)言、面向不同場(chǎng)景的宣傳文本[13]。未來,多模態(tài)大模型的使用可實(shí)現(xiàn)視頻生成、圖像生成,有利于高水平內(nèi)容的快速傳播[14]。
(四)刻不容緩:發(fā)出中國(guó)好聲音須爭(zhēng)奪國(guó)際話語(yǔ)權(quán)
大模型研發(fā)需要極高的訓(xùn)練成本且存在技術(shù)壁壘,很容易造成少數(shù)優(yōu)勢(shì)大國(guó)技術(shù)上的寡頭壟斷,還可能進(jìn)一步強(qiáng)化西方價(jià)值觀隱蔽的支配地位。一方面,實(shí)驗(yàn)結(jié)果表明,不能放棄英文宣傳陣地,要讓中國(guó)特色詞匯更加廣泛地出現(xiàn)在國(guó)際視野中,成為能夠被大模型識(shí)別的專有詞匯;另一方面,要建設(shè)基于高質(zhì)量中文語(yǔ)料訓(xùn)練的自主可控大模型[15]。中文期刊編輯部未來可以參與到補(bǔ)充高質(zhì)量中文語(yǔ)義庫(kù)、行業(yè)語(yǔ)料庫(kù)的工作中,為大模型訓(xùn)練提供基礎(chǔ)素材,擴(kuò)展社會(huì)主義意識(shí)形態(tài)的潛在價(jià)值傳遞。
本文初步探索了ChatGPT在學(xué)術(shù)期刊摘要生產(chǎn)領(lǐng)域的應(yīng)用效果。結(jié)果顯示,即使在編輯工作最簡(jiǎn)單的環(huán)節(jié),ChatGPT之類的大模型仍然無法完全替代人力,但它已成為重要的輔助工具。風(fēng)物長(zhǎng)宜放眼量,講好中國(guó)故事、增強(qiáng)文化軟實(shí)力,還需業(yè)界學(xué)界共同努力,而用好新一代人工智能工具適當(dāng)其時(shí)。
參考文獻(xiàn):
[1] 賴少明,顧琛蘭,臧艷嬌.人工智能技術(shù)在新聞傳播領(lǐng)域的應(yīng)用研究[J].新聞研究導(dǎo)刊,2023,14(23):1-3.
[2] 張春芳,劉雪立.國(guó)外結(jié)構(gòu)式摘要研究回顧:以JamesHartley的研究為例[J].中國(guó)科技期刊研究,2012,23(1):56-61.
[3] 康勤,孫萍.基于語(yǔ)料庫(kù)的科研論文英文摘要的體裁分析[J].外語(yǔ)教學(xué),2012,33(5):28-31.
[4] 趙永青,梁曉磊,高君,等.中外學(xué)術(shù)期刊實(shí)證類論文英文摘要推銷型式對(duì)比研究[J].外語(yǔ)與外語(yǔ)教學(xué),2018(1):61-71,147-148.
[5] 柯文輝,林海清,黃愛萍,等.中文學(xué)術(shù)期刊英文摘要審修的編輯部工作流程[J].編輯學(xué)報(bào),2016,28(5):443-444.
[6] 夏玲,李宜蔓,李弘武.人工智能背景下科技論文摘要的機(jī)器翻譯與譯后編輯[J].編輯學(xué)報(bào),2022,34(4):396-401,406.
[7] 黃河清,韓健,張?chǎng)L驚,等.中外科技期刊英文摘要文體格式的變化及建議[J].中國(guó)科技期刊研究,2015,26(2):143-151.
[8] 原俊鳳,錢亦兵,彭永生,等.以外籍副主編對(duì)英文摘要的編校分析英文摘要中的常見錯(cuò)誤[J].農(nóng)業(yè)圖書情況報(bào)學(xué)刊,2014(2):154-157.
[9] 柳川,陳鋒. ChatGPT風(fēng)暴[N].華夏時(shí)報(bào),2023-02-13(001).
[10] 宋寶梅,孫善飛.基于語(yǔ)料庫(kù)的動(dòng)物科學(xué)專業(yè)學(xué)術(shù)論文英文摘要研究[J].黑龍江畜牧獸醫(yī),2018(13):219-221.
[11] 鞠玉梅.中外學(xué)者英語(yǔ)學(xué)術(shù)論文摘要修辭勸說機(jī)制比較研究[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2020,43(1):85-92,160.
[12] 劉偉.論科技期刊英文摘要的審譯:以《海洋技術(shù)學(xué)報(bào)》為例[J].編輯學(xué)報(bào),2016,28(4):330-333.
[13] 譚曉荷.“ChatGPT+學(xué)術(shù)出版”融合模式:全產(chǎn)業(yè)鏈分析、正負(fù)效應(yīng)與應(yīng)對(duì)策略[J].傳播與版權(quán),2023(23):36-40.
[14] 王琪.技術(shù)賦能與問題衍生:ChatGPT對(duì)學(xué)術(shù)期刊出版的影響[J].河南大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2023,63(5):139-145,156.
[15] 曾煒,蘇騰,王暉,等.鵬程·盤古:大規(guī)模自回歸中文預(yù)訓(xùn)練語(yǔ)言模型及應(yīng)用[J].中興通訊技術(shù),2022,28(2):33-43.
作者簡(jiǎn)介 陳星潼,編輯,研究方向:出版編輯學(xué)。趙愛清,副編審,系本文通訊作者,研究方向:出版編輯學(xué)、經(jīng)濟(jì)學(xué)。