■張 萍 張小強
重慶大學(xué)新聞學(xué)院,重慶市高新區(qū)大學(xué)城南路55號 401331
人工智能已經(jīng)被廣泛用于各學(xué)科的學(xué)術(shù)研究和論文寫作。由人工智能模型GPT-3寫作的一篇關(guān)于COVID-19疫苗有效性的論文獲得C等級分數(shù),其得分比人類作者高[1]。將完全由機器生成的論文偽裝成人類作者的作品,也能通過不少期刊的評審,最終被錄用,機器自動生成論文在近幾年撤稿原因中也呈現(xiàn)上升趨勢。早在2005年,美國麻省理工學(xué)院三名計算機專業(yè)的研究生編寫出論文生成軟件SCIgen,所生成的論文被學(xué)術(shù)會議錄用[2],此后機器生成的毫無意義的論文經(jīng)常被學(xué)術(shù)期刊或會議“錄用”。2008年,德國學(xué)生利用該軟件生成論文,并向武漢舉辦的IEEE國際會議投稿,機器虛擬的Schlangemann教授被當成知名學(xué)者,并受邀為會議主持人,機器暴露真實“身份”后讓舉辦方異常尷尬。2012年,康奈爾大學(xué)數(shù)學(xué)系博士后Nate Eldredge對SCIgen進行了修改,制成數(shù)學(xué)專業(yè)的論文自動生成器Mathgen,虛構(gòu)“Marcie Rathke”教授投稿,被廣受贊譽的期刊《理論數(shù)學(xué)進展》(AdvancesinPureMathematics)錄用[3]??梢姡瑳]有識別出機器生成假論文的不僅有一般學(xué)術(shù)期刊,也有知名學(xué)術(shù)期刊。據(jù)Nature2021年5月的報道,SCIgen軟件至今還在使用,導(dǎo)致科學(xué)文獻中仍然潛伏著數(shù)以百計的胡言亂語論文[4]。Cabanac和Labbé[5]的最新研究指出,截至2020年11月5日,還有197篇疑似機器生成的問題論文沒有任何警告或撤回通知,仍在被下載,主要來自中國(64%)和印度(22%)。
Babel Generator,一款輸入3個關(guān)鍵詞就能迅速生成一篇完整論文的軟件,自動生成的一篇內(nèi)容荒謬但文法正確的論文獲得了5.4分(滿分為6分)的高分,在“重點和意義”和“語言使用和風(fēng)格”方面被評為“高級”[6],該論文足以應(yīng)對一般的審查工具。隨著生成論文的機器越來越智能,生成的文本質(zhì)量越來越高,識別難度也越來越大。在基于神經(jīng)網(wǎng)絡(luò)的語言模型方面取得的重大進展可能遲早會產(chǎn)生新的科學(xué)寫作方式,且樂觀主義者認為,自動翻譯等智能工具可以幫助作者生成更好的科學(xué)論文[7],未來的寫作是協(xié)作式、算法式和自主式的[8]。從這一趨勢來看,機器參與論文寫作是無法完全禁止的現(xiàn)象,出版單位需要提高警惕并早做準備。
國外學(xué)者早已觀察到機器生成論文對學(xué)術(shù)誠信構(gòu)成重大挑戰(zhàn)[9],并提出不少識別機器生成論文的方法[10]。2015年Jones等[11]調(diào)查了學(xué)生利用軟件翻譯剽竊的行為,近來國外大學(xué)報告稱COVID-19疫情期間實施在線教學(xué)后,學(xué)生作弊行為因自動化寫作技術(shù)的進步而有所增加[12]。國內(nèi)對機器參與論文寫作的零星研究集中在學(xué)術(shù)不端方面,包括機器洗稿的學(xué)術(shù)不端問題[13]、利用軟件翻譯的“語際變換式”剽竊行為[14]等。國外研究機器寫論文是基于英文工具,隨著中文自然語言處理技術(shù)的進步,對中文寫作軟件的調(diào)查研究也非常重要。本研究對當前機器參與論文寫作的現(xiàn)狀進行調(diào)查,對參與論文寫作的工具展開網(wǎng)絡(luò)調(diào)查并進行實驗驗證,從出版?zhèn)惱硪暯欠治鰴C器參與論文寫作的識別方式和風(fēng)險,并提出防范對策。
從提供語法寫作指導(dǎo)的Grammarly到生成假論文的學(xué)術(shù)釣魚軟件SCIgen,技術(shù)可以幫助科研人員提高效率,也可運用于學(xué)術(shù)造假。科研人員使用的工具包括非智能的自動化數(shù)據(jù)分析工具、具有機器翻譯、機器寫作功能的智能繪圖工具,以及無法查明是否智能的學(xué)術(shù)釣魚軟件(可生成論文偽裝成人類投稿)、降重軟件等,本研究將這些工具統(tǒng)稱為“機器”。使用“機器”而不用“人工智能”的原因是部分軟件無法查明其智能程度,機器這一概念能涵蓋智能或非智能的相關(guān)工具。此外,機器相對于“程序”“軟件”而言,其能動者的意蘊更濃厚,表征的是當前直接或間接地參與論文寫作過程的具有計算功能的各種程序。機器參與寫作的論文(以下簡稱“機器參與稿”)是指研究或?qū)懽鳝h(huán)節(jié)使用了各種有不同程度自主性工具的那些學(xué)術(shù)論文。
(1) 規(guī)范研究。先以學(xué)術(shù)期刊出版?zhèn)惱頌闃藴?,判斷相關(guān)案例和實驗調(diào)查的機器參與稿的倫理問題;再以行動是否能推動出版?zhèn)惱硪?guī)范實施、降低出版?zhèn)惱盹L(fēng)險為判斷標準,提出相應(yīng)的風(fēng)險防范對策。
(2) 實驗調(diào)查。選取自媒體文章和用戶推薦最多的中文軟件A、英文軟件B展開實驗,共生成50篇稿件進行實驗觀察。在軟件A中輸入題名、學(xué)科類目、關(guān)鍵詞即可自動生成學(xué)術(shù)論文,生成的段落可以編輯、復(fù)制、刪除、調(diào)整順序,無限刷新生成新內(nèi)容,也可以生成空白段落由作者參與寫作,支持上傳云端保存等,軟件A因其強大的功能已經(jīng)俘獲了大量用戶。在軟件B中,只需要輸入論文標題就可以自動生成1000~2000字的英文內(nèi)容,并附詳細的引用來源。為了讓場景更真實,筆者從中國知網(wǎng)隨機抽取已發(fā)表的自然科學(xué)、社會科學(xué)論文標題,分別輸入A、B軟件中自動生成稿件,再將稿件提交Paperpass檢測系統(tǒng)檢測重復(fù)率(經(jīng)調(diào)查,該系統(tǒng)與中國知網(wǎng)檢測結(jié)果的誤差在5%左右)。
(3) 網(wǎng)絡(luò)調(diào)查。首先,對各類參與論文寫作工具的市場應(yīng)用情況展開調(diào)查;然后,對Retraction Watch中以“隨機生成的內(nèi)容”為撤稿理由的情況進行調(diào)查,分析機器寫作論文的撤銷情況。
2.1.1 機器間接參與寫作
自然科學(xué)和社會科學(xué)學(xué)科都越來越廣泛地使用人工智能進行研究互動,使用人工智能,特別是機器學(xué)習(xí)和深度學(xué)習(xí)方法的研究數(shù)量正在快速增長[15]。機器學(xué)習(xí)被用于多個領(lǐng)域的分類、回歸和優(yōu)化任務(wù),科學(xué)研究不再完全依賴人類研究者分析結(jié)果和得出結(jié)論,人類研究者還可以從機器學(xué)習(xí)中獲得新的見解和科研靈感[16]。機器作為科研成果產(chǎn)出的重要工具和方法,已經(jīng)廣泛地間接參與學(xué)術(shù)論文的寫作。但是,大多數(shù)人工智能參與的研究在規(guī)劃、實施和報告成果方面存在問題,其穩(wěn)健性、可重復(fù)性和適用性低[15]。對于這一新出現(xiàn)的問題,已經(jīng)有學(xué)會、期刊和學(xué)者針對其中的倫理風(fēng)險,提出有關(guān)人工智能參與研究的成果匯報指南。
2.1.2 機器直接參與寫作
機器直接參與論文寫作是指論文的文字表達闡述的部分或全部內(nèi)容由機器生成,以前這都是由人類作者完成的。這類論文分成兩種情況:第一種不涉及學(xué)術(shù)不端但存在倫理爭議,這類論文作者往往會在論文中聲明機器的參與,文中有“由算法生成(generated by algorithm)”“由機器生成(generated by a machine)”這類的表述,表明使用了算法或機器生成論文的部分內(nèi)容(圖片、數(shù)據(jù)、計算模型等)。雖然不被認定為學(xué)術(shù)不端,但仍然存在數(shù)據(jù)、代碼、軟件引用,算法黑箱,以及機器的貢獻署名等出版?zhèn)惱韱栴}。如果作者未直接說明,需要通過其他特征(如“人工智能”“算法”等研究成果)識別出來,則需要編輯鑒別是否存在學(xué)術(shù)倫理問題。第二種情況是指作者存在刻意隱瞞使用機器生成假論文的學(xué)術(shù)不端行為,涉及嚴重的學(xué)術(shù)不端問題。這時機器成為剽竊的工具,產(chǎn)生多種剽竊方式:(1)對現(xiàn)有文獻進行改寫降重,自動生成重新措辭的內(nèi)容,逃避剽竊檢測;(2)由機器利用現(xiàn)有文獻形成語料庫,根據(jù)輸入的標題、關(guān)鍵詞等參數(shù)直接生成論文;(3)機器翻譯并拼接來自其他語言的文獻,生成相關(guān)論文。近年來,因使用機器生成論文涉及學(xué)術(shù)不端被撤稿的情況越來越普遍,對此需要警惕。
本研究使用國際數(shù)據(jù)庫Retraction Watch進行調(diào)查,發(fā)現(xiàn)截至2022年3月14日,Retraction Watch中因“隨機生成內(nèi)容”(即機器參與論文寫作)原因被撤銷的論文共819篇,其中署名單位來自中國的論文有502篇。中國作者使用機器生成論文被撤銷始于2009年,在2021年此類論文數(shù)突增至361篇,可能有兩個原因:一是論文寫作技術(shù)進步了,有更多機器寫作論文被發(fā)表;二是學(xué)術(shù)不端檢測技術(shù)的進步,導(dǎo)致更多論文被發(fā)現(xiàn)。這些撤稿往往還有“虛假同行評審”“使用流氓編輯器”“論文工廠”等其他學(xué)術(shù)不端行為,說明這種刻意隱瞞使用機器直接生成論文并成功發(fā)表的假論文存在多種學(xué)術(shù)不端行為。
2.1.3 論文寫作工具調(diào)查
網(wǎng)絡(luò)調(diào)查發(fā)現(xiàn),當前機器直接參與論文寫作有直接生成論文、論文降重、翻譯論文、生成論文摘要、生成文獻綜述5種方式(表1)。使用最多的市場工具是機器降重、機器翻譯軟件,且完成度較高。直接生成英文論文的工具數(shù)量比直接生成中文論文的工具數(shù)量多,且?guī)缀醵夹枰顿M,每篇生成論文價格在50~500元范圍內(nèi)。
洗稿降重工具種類多、價格低、銷量大且增長明顯。截至2021年7月31日,通過搜索引擎檢索到29款降重工具,在淘寶檢索到25家店鋪。淘寶主要銷售“經(jīng)緯智能降重”和“早降重”,銷售價格平均為9.9元,部分賣家根據(jù)字數(shù)定價,每千字的價格為2~5元。有3家店鋪月銷量超1000,其中一家的銷量一周內(nèi)從200增至1000多,但部分用戶使用降重工具后在評論區(qū)留言“詞不達意” “內(nèi)容生硬” “勉強讀通”。2022年3月14日,筆者再次調(diào)查發(fā)現(xiàn),在淘寶中搜索“降重”已經(jīng)沒有任何商品,說明該平臺對這些工具進行了治理,但使用百度搜索“降重”,排在前4位的搜索結(jié)果是付費推廣的降重服務(wù)廣告。
網(wǎng)絡(luò)調(diào)查發(fā)現(xiàn)機器翻譯工具共有58種,大多數(shù)可免費使用且不限字數(shù),支持一鍵上傳自動翻譯整篇文檔。部分工具致力于特定領(lǐng)域的翻譯,如生物醫(yī)學(xué)領(lǐng)域的MedPeer,法律專業(yè)的云譯通等。工具的版本不斷更新升級,翻譯結(jié)果也越來越準確。
專門自動生成摘要的工具種類不多,多是在其他翻譯工具、降重工具中附加生成摘要功能。本研究隨機選取三款工具(E書聯(lián)盟、吉山數(shù)據(jù)、點心工具)進行調(diào)查,發(fā)現(xiàn)雖然這些工具生成摘要的邏輯性、連貫性、完整性不夠,但語句通順,可能達到一般期刊論文摘要的要求。
自動完成文獻綜述的工具種類最少,其中最受歡迎的工具是英文語言處理的Paper Digest,尚未檢索到中文語言處理的工具。
表1 論文寫作工具調(diào)查
2.1.4 機器直接生成論文實驗
本研究按照上文所述的方法進行實驗,結(jié)果如表2所示。機器自動生成的論文若不加修改,其重復(fù)率都達不到現(xiàn)有期刊的發(fā)表要求;即使經(jīng)過自動洗稿降重,也達不到大多期刊要求的15%以內(nèi)的重復(fù)率。但是,如果人工再加入其他內(nèi)容,則形成可投稿而不被檢測工具和編輯初審發(fā)現(xiàn)的論文并不難。
利用中文軟件A生成了20篇社會科學(xué)論文、10篇自然科學(xué)論文,文章長度為5000~6000字,稿件包含標題、摘要、關(guān)鍵詞和參考文獻,除公式和特殊符號亂碼外,語句通順流暢。查重檢測結(jié)果表明,當前中文機器寫作的智能程度并不高,生成的論文基本是對已有論文的復(fù)制組合并且不加引用,屬于嚴重的抄襲和剽竊行為。社會科學(xué)論文的最高重復(fù)率為99.50%,最低重復(fù)率為70.70%,平均重復(fù)率為88.96%;自然科學(xué)論文與社會科學(xué)論文的重復(fù)率差別不大。但是,使用“經(jīng)緯智能降重”軟件洗稿后,重復(fù)率的最大降幅為78.50%,降重效果明顯。
利用英文軟件B生成社會科學(xué)論文和自然科學(xué)論文各10篇,文章長度為1000~2000字,稿件包含標題、參考文獻,語句通順、無明顯語法錯誤。英文軟件B生成稿件的重復(fù)率明顯比中文軟件A低,說明英文軟件生成的稿件可能同時自帶洗稿降重功能。調(diào)查還發(fā)現(xiàn),個別稿件經(jīng)洗稿后的重復(fù)率反而比原稿件的重復(fù)率更高,其原因可能是表達的方式有限,英文軟件生成的稿子已經(jīng)被洗稿降重,再經(jīng)過其他軟件洗稿降重后又恢復(fù)了原來的表達方式,導(dǎo)致重復(fù)率上升。
表2 機器參與稿的重復(fù)率檢測結(jié)果
除了上文所述的機器參與論文寫作,當前還有將中文論文由機器翻譯成英文、再請第三方潤色機構(gòu)修改后投稿到英文期刊等情況。但是討論機器翻譯論文的學(xué)術(shù)倫理問題的研究卻很少,可能是因為機器翻譯沒有產(chǎn)生“創(chuàng)意表達”,忽略了機器翻譯的倫理問題。從學(xué)術(shù)論文應(yīng)真實給出作者貢獻的出版?zhèn)惱硪暯莵砜矗艨桃怆[瞞使用機器翻譯的內(nèi)容,起碼屬于沒有正確標示論文寫作中作者的真實貢獻。例如:機器生成的摘要雖然不是文章的創(chuàng)意部分,但也不屬于作者本人的貢獻。特別是自動生成摘要的相關(guān)技術(shù)也可以運用于文獻梳理,輔助文獻綜述寫作,如果不聲明機器參與文獻綜述寫作,同樣會涉及學(xué)術(shù)倫理問題。比較合理的做法是在文中適當?shù)奈恢糜枰哉f明或投稿時告知編輯部。已有論文通過腳注注釋了論文的摘要是由作者及其提出的模型共同撰寫[17]。
倫理問題未得到解決,也會影響相關(guān)工具的市場化。重慶大學(xué)的張小強教授在評審數(shù)字出版項目時發(fā)現(xiàn),國內(nèi)某知名學(xué)術(shù)文獻數(shù)據(jù)庫已經(jīng)開發(fā)出人工智能輔助論文寫作的專業(yè)網(wǎng)絡(luò)服務(wù),卻擔心大量使用該服務(wù)寫作的學(xué)術(shù)論文在投稿后帶來倫理爭議,給公司造成負面影響,故尚不敢向市場推廣。
當然,也有機構(gòu)大膽將類似工具推向市場,如目前多所高校圖書館購買的數(shù)據(jù)庫資源“筆桿網(wǎng)”,提供了選題分析、資料收集、在線寫作、參考文獻梳理、查重等一站式寫作服務(wù)。Trinka也是一個以學(xué)術(shù)論文寫作為核心的工具,不僅能修改專業(yè)術(shù)語、語法、句子結(jié)構(gòu)的錯誤,還可以根據(jù)學(xué)術(shù)出版標準改善論文的語法、表達和措辭[18]。SCInote可以根據(jù)參考文獻中的數(shù)據(jù)和實驗流程,將用戶自定義的內(nèi)容串聯(lián)起來,生成一篇學(xué)術(shù)論文的草稿,已有論文主動聲明使用SCInote管理參考文獻和實驗數(shù)據(jù)[19]。除了使用技術(shù)提供商的工具,部分作者還自己開發(fā)算法工具輔助論文寫作,如PaperRobot[20]。這將引發(fā)新的學(xué)術(shù)倫理爭議:若作者隱瞞機器的“學(xué)術(shù)思想和創(chuàng)意”將論文投稿,是否屬于學(xué)術(shù)不端?創(chuàng)意和思想由作者之外的人類提供,作者未添加署名,似乎屬于學(xué)術(shù)不端問題,但由機器提供則是一個新問題。因為要認定為學(xué)術(shù)不端的一個前提是由人類代寫論文,但現(xiàn)在代寫者是機器,而使用軟件輔助研究和寫作早已是慣例,本質(zhì)區(qū)別是現(xiàn)在的軟件自主性和自動化程度非常高,人類干預(yù)程度則非常低。這類論文投給期刊也帶來新的倫理挑戰(zhàn),如何界定人機的貢獻并署名?作者主動聲明機器參與論文寫作,機器產(chǎn)生了學(xué)術(shù)貢獻,且稿件質(zhì)量達到發(fā)表水平,具備了發(fā)表的前提條件。期刊是否接收?應(yīng)如何審查?如何發(fā)表?這將是編輯面臨的倫理大考。
2.2.1 數(shù)據(jù)倫理問題
數(shù)據(jù)倫理是機器學(xué)習(xí)的熱點話題之一,對數(shù)據(jù)源的收集、處理都有具體的倫理要求。機器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)源包括免費的開源數(shù)據(jù)、網(wǎng)絡(luò)和物聯(lián)網(wǎng)收集的數(shù)據(jù)、人工培訓(xùn)的數(shù)據(jù)集[21]。不同數(shù)據(jù)源可能潛藏著不同的學(xué)術(shù)不端風(fēng)險和倫理問題。免費的開源數(shù)據(jù)同樣存在數(shù)據(jù)污染的風(fēng)險,如公開數(shù)據(jù)中的部分科學(xué)數(shù)據(jù)所有者可能會出于保持既有競爭優(yōu)勢,更有甚者是個人主觀因素,蓄意造成原始數(shù)據(jù)污染,最典型的是數(shù)據(jù)造假[22]。編輯應(yīng)要求作者公開原始數(shù)據(jù),以審查防范數(shù)據(jù)污染的問題。
來源于網(wǎng)絡(luò)和物聯(lián)網(wǎng)的數(shù)據(jù),則易侵犯個人信息和隱私,違背研究倫理。立命館大學(xué)研究小組的研究論文因機器收集猥瑣詞語時公開了小說作者的網(wǎng)名和URL,發(fā)表的第二天就被撤銷了[23]。
此外,人工訓(xùn)練的數(shù)據(jù)集大多屬于作者的獨家數(shù)據(jù)(如實驗數(shù)據(jù)),這就涉及數(shù)據(jù)的可重復(fù)、可再利用,以及數(shù)據(jù)是否滿足算法充分訓(xùn)練的問題。編輯應(yīng)要求作者公開原始數(shù)據(jù)以便審查。
2.2.2 學(xué)術(shù)創(chuàng)新爭議
為了鼓勵學(xué)術(shù)和科學(xué)創(chuàng)新,只有那些創(chuàng)新性強、水平高的論文才能在學(xué)術(shù)期刊發(fā)表。而這類論文往往需要作者在學(xué)術(shù)研究上投入較多的時間,發(fā)表則是對投入的“獎賞”。學(xué)術(shù)和科學(xué)界在論文發(fā)表上展開激烈競爭,目前這種競爭主要是人類智力的競爭。機器生成內(nèi)容與人類寫作論文大不相同,特點是前期開發(fā)投入大,但開發(fā)出來后創(chuàng)作速度快、產(chǎn)出多。如果不提高算法創(chuàng)新性要求,作者利用算法完成多種同類型研究,一個算法可能就是一個“論文工廠”,造成研究內(nèi)容的“低水平重復(fù)”。如果作者使用某工具但又不了解工具的算法原理,無法提供算法透明度,也就無法得知算法是否存在學(xué)術(shù)不端或違背研究倫理。即使是作者自己開發(fā)新算法,也要做好算法透明度解釋。
由算法引起的學(xué)術(shù)創(chuàng)新爭議還涉及更嚴重的學(xué)術(shù)不端問題。如果同一算法生成不同論文發(fā)表,是否屬于傳統(tǒng)意義的“重復(fù)發(fā)表”?隨著技術(shù)進步,當前的論文買賣和論文工廠也由人工代寫朝著機器代寫方向演變,這對學(xué)術(shù)出版秩序的沖擊不容忽視。
2.2.3 算法黑箱與偏見問題
科學(xué)研究應(yīng)該透明、可重復(fù)、客觀中立,算法有可能破壞學(xué)術(shù)創(chuàng)作的這些規(guī)則。無論是作者開發(fā)的算法還是作者使用工具的算法,都可能帶有學(xué)術(shù)偏見或?qū)W術(shù)歧視。人類對權(quán)威期刊、高等院校、職稱的偏見也會體現(xiàn)在算法的學(xué)習(xí)中,因為算法的開發(fā)設(shè)計和數(shù)據(jù)篩選都有人的價值觀注入,算法承襲了這些偏見后會更嚴重地歧視期刊、學(xué)者單位,甚至是學(xué)者本人。網(wǎng)站Algowritten專門記錄算法寫作(如GPT-3)中的偏見問題,工具是有偏見的,機器寫作代表特定公眾的文化規(guī)范(即那些來自主流地區(qū)的文化),來自其他地區(qū)、亞文化和非主流文化的作者可能會發(fā)現(xiàn),他們的創(chuàng)造性表達受到這些工具的阻撓[24]。算法的數(shù)據(jù)來自互聯(lián)網(wǎng)和現(xiàn)有文獻,數(shù)據(jù)中出現(xiàn)的偏見必然會反映在算法輸出的結(jié)果中,還有可能造成人工不容易發(fā)現(xiàn)的偏見、偏差被累積放大。因此,算法寫論文也會造成學(xué)術(shù)論文中存在觀點或結(jié)果偏見。
參與論文寫作的算法的透明性和可解釋性是另一個重要的倫理問題。要解決這一問題,只有要求作者在論文或其他附屬材料中盡量詳盡、準確地解釋所用算法,或者要求作者提供相應(yīng)的代碼供其他學(xué)者檢查或重復(fù)研究。
2.2.4 引用問題
機器為得到充分訓(xùn)練,需要學(xué)習(xí)海量文獻資料。如果機器存在漏引、錯引的失誤,則也存在剽竊的學(xué)術(shù)不端風(fēng)險。如果正確引用所有文獻,機器參與稿的參考文獻所占據(jù)的篇幅甚至超過正文內(nèi)容。Springer Nature第一本機器產(chǎn)生的學(xué)術(shù)著作《鋰離子電池:機器生成的當前研究總結(jié)》4章的參考文獻數(shù)量分別有450、562、165、288條。如果大量的引用沒有得出新觀點和結(jié)論,通常會被判定為無效引用或違背學(xué)術(shù)規(guī)范中的適當引用原則。但機器參與稿有其特殊性,因為人工智能的優(yōu)勢是把大量文獻當做數(shù)據(jù)來完成寫作,而人類作者無法在短期內(nèi)消化大量文獻。機器寫作的綜述符合出版條件,說明機器也能產(chǎn)生學(xué)術(shù)貢獻,但其發(fā)表倫理問題則值得進一步研究。
機器學(xué)習(xí)文獻的方式不同于人的理解方式,機器使用文獻資料作為訓(xùn)練數(shù)據(jù),學(xué)習(xí)文獻的邏輯、表達、語言風(fēng)格等,再模仿寫作,形成自己的風(fēng)格。機器寫作的內(nèi)容可能既不是文獻觀點的直接引用,也不完全是轉(zhuǎn)述文獻觀點的間接引用,如何正確標注參考文獻成為難題。
在未經(jīng)許可的情況下,機器學(xué)習(xí)使用版權(quán)受保護的文獻訓(xùn)練算法,還涉及版權(quán)侵權(quán)的問題,但如果要求每一篇文獻都獲得授權(quán),又會產(chǎn)生較高的權(quán)利交易成本。對此,法學(xué)界提出的解決思路有:為人工智能的數(shù)據(jù)輸入創(chuàng)設(shè)不侵權(quán)的例外[25],“非作品性使用”(Nonuse)和“合理使用”(Fair Use)等未經(jīng)許可但合法的自由使用情況[26],以及機器形成的作品采用開放獲取的出版模式,因此上述機器生成的圖書可免費開放獲取。
此外,如果使用商業(yè)軟件參與論文寫作,也應(yīng)該按照出版規(guī)范給予引用。但當前國內(nèi)外不少學(xué)術(shù)出版規(guī)范中對如何引用代碼并沒有規(guī)定,作者們也沒有引用代碼或軟件的習(xí)慣。
2.2.5 署名問題
人和機器合作發(fā)表論文比人和人合作的情況更為復(fù)雜,機器參與稿很有可能出現(xiàn)由人機貢獻模糊導(dǎo)致不當署名的情況。特別是算法背后牽涉的責任主體眾多,包括算法的開發(fā)者、投資者、數(shù)據(jù)提供者,使用者等,從貢獻的角度來說他們都具有署名的權(quán)利。人和機器貢獻的界定困難體現(xiàn)在兩個方面:人與算法的關(guān)系、人與算法的貢獻比例。即使機器參與稿由算法獨立完成,也不能排除人類作者開發(fā)算法的貢獻,所以對機器參與稿貢獻的界定首先需要弄清楚人類作者和算法的關(guān)系。算法與作者的關(guān)系包括算法由投稿作者獨立開發(fā)、投稿作者與其他主體合作開發(fā)、投稿作者委托其他主體開發(fā)、投稿作者直接使用算法等情況。不同的關(guān)系代表研究創(chuàng)意和思想來源不同,署名的方式就不同。如何界定人機貢獻比例和署名方式都有待進一步研究。當然,除了署名,還有引用、致謝、在正文以腳注或其他形式表達機器的貢獻,對此還需要深入研究。
根據(jù)實驗機器參與稿的特征和Retraction Watch對機器生成稿的撤稿聲明,總結(jié)出以下幾種特征可供編輯參考。存在這些特征的稿件極有可能涉及學(xué)術(shù)不端,編輯需要特別留意。
(1) 警惕陌生奇怪的術(shù)語表達。在仔細閱讀實驗生成的50篇論文后,筆者發(fā)現(xiàn)為了降低重復(fù)率,降重軟件會通過詞語、句式轉(zhuǎn)換,將專業(yè)術(shù)語改成非常規(guī)用語,還出現(xiàn)一些奇怪的詞組表達。部分眾所周知的科學(xué)術(shù)語被“新”詞取代,如“深度神經(jīng)網(wǎng)絡(luò)”被修改成“深層神經(jīng)組織”[7]。國外降重工具Spinbot號稱“提供精心重新措辭的文章與100%獨特的內(nèi)容”,被懷疑已投入使用并成功發(fā)表了論文。這說明即使重復(fù)率低、語句流暢,如果有不常見的術(shù)語表達,編輯也需要警惕,因為這是軟件逃避檢測的慣用伎倆。
(2) 關(guān)注研究方法或研究結(jié)論反常。算法黑箱使機器生成的稿件具有“編造不符合實際或無法重復(fù)驗證的研究方法、結(jié)論等”[27]的風(fēng)險,正如算法雖然可以幫助檢測虛假新聞,但算法編造虛假新聞的能力更強[28]。IOP出版公司宣布撤回的5篇確認為計算機生成的會議論文[29]都存在編造研究方法的現(xiàn)象,研究結(jié)果與研究方法也毫無關(guān)聯(lián)。部分論文中的公式看似形式規(guī)范、推理步驟完善,但推理內(nèi)容與公式卻風(fēng)馬牛不相及,還有圖文不符等情況。這不僅需要編輯在初審時格外關(guān)注那些研究方法不規(guī)范、研究結(jié)論過于反常的論文,還需要同行評審專家嚴格把關(guān)。算法越高級,其編造的方法和結(jié)論可能越隱秘,更需要先進的檢測技術(shù)和高超的人工鑒別能力,甚至還需要專門審查算法的團隊發(fā)現(xiàn)問題。
(3) 提防引用過少等其他異常引用現(xiàn)象。實驗生成的稿件平均每篇論文遺漏的引證文獻有15篇,要么僅顯示引用標注,沒有具體的文獻內(nèi)容,或不能準確標出第一手文獻出處,或隨意標記參考文獻,加入實際未參考的文獻,甚至沒有參考文獻。機器生成的稿件還會引用根本不存在的文獻,這和Cabanac等[7]對某期刊已經(jīng)發(fā)表的人工智能生成論文的觀察結(jié)果一致。Labbé[30]利用SCIgen生成稿件進行虛假引用實驗,讓機器生成100篇論文并每篇都引用這100篇假論文,這些論文發(fā)布到網(wǎng)絡(luò)后被谷歌學(xué)術(shù)收錄,造成虛構(gòu)作者“Ike Antkare”成為計算機科學(xué)領(lǐng)域谷歌學(xué)術(shù)h指數(shù)排名第6的學(xué)者。可見,審查稿件的引用規(guī)范是編輯識別機器生成稿的重要技巧之一。
(4) 加強審查積極推薦審稿人的行為。同行評審造假是機器生成稿被錄用的重要原因,其造假的方式可能是編造審稿人信息、審稿意見,或者向編輯推薦與自己有利益關(guān)系的審稿專家,或者私下與審稿專家交流,甚至與評審專家交換同意票等。上述IOP出版公司撤回的機器參與稿沒有被同行評審專家發(fā)現(xiàn),原因就在于“有合理的證據(jù)表明,其中一些論文的同行評審過程受到了影響”[4]。因此,對作者自薦審稿人且審稿意見過于完美的論文,需引起編輯關(guān)注。編輯既需要審查審稿人的真實信息,也要盡可能調(diào)查兩者是否存在利益關(guān)系,督促審稿人遵守學(xué)術(shù)規(guī)范。
(5) 留意異常更改署名等論文買賣線索。調(diào)查發(fā)現(xiàn),部分網(wǎng)站、店鋪表面在銷售降重軟件,實際上還進行論文買賣業(yè)務(wù),當買家反饋工具寫作效果不佳時,賣家(中介機構(gòu))就會提出代寫代投的人工服務(wù),從而促成論文買賣。買賣的論文除了自帶論文工廠的上述特征,有時還體現(xiàn)在署名變更上。為了將論文賣出高價,論文工廠有時會先將論文投稿,待錄用后再待價而沽。如論文被錄用時要求更換署名信息或添加署名,編輯應(yīng)進一步核查更改署名原因,挖掘出背后可能存在的論文買賣。
(6) 根據(jù)關(guān)鍵表達識別其他類型機器參與稿。上述幾種情況是涉及學(xué)術(shù)不端的情況,識別更為緊迫。還有大量的論文在研究的某一環(huán)節(jié)使用了人工智能等工具,也需要編輯予以識別。編輯需要特別留意那些論文中提及的某些內(nèi)容或成果是由“算法”“人工智能”“機器”“大數(shù)據(jù)”等“自動”“自主”生成的情況。判斷的標準應(yīng)該是機器的獨立自主程度,如果情況不明,還應(yīng)進一步咨詢作者。
為防范機器參與論文寫作的學(xué)術(shù)倫理問題,期刊首先需要完善收稿規(guī)則,要求作者主動聲明是否使用機器參與寫作,凡是機器參與寫作的部分都需要區(qū)別標識,機器生成摘要也應(yīng)注釋說明。期刊可以設(shè)置有機器參與寫作和沒有機器參與寫作的兩種投稿通道,不同通道對應(yīng)不同的審稿流程,以選擇投稿方式來代表作者聲明。一般作者主動聲明使用機器輔助論文寫作的,可能不存在學(xué)術(shù)不端的故意,但仍可能存在學(xué)術(shù)倫理爭議和學(xué)術(shù)不端相關(guān)問題,應(yīng)要求作者在投稿時提交原始數(shù)據(jù)、算法原理說明甚至代碼,以供專家審查算法透明度,并提交人和機器的貢獻說明、署名理由等,以及署名機器作者的詳細信息,以供編輯、學(xué)界評價是否符合學(xué)術(shù)規(guī)范。作者不主動聲明的,則屬于故意學(xué)術(shù)不端或忽視機器的貢獻,兩種情況都應(yīng)防范。
在傳統(tǒng)審稿流程增加技術(shù)和人工審查,從詞匯、短語、語法、表達風(fēng)格等細節(jié)審查機器生成、降重的痕跡,排除機器自動生成的學(xué)術(shù)不端論文。智能機器參與論文寫作時,其學(xué)術(shù)不端行為更隱秘,存在“洗稿”式論文的風(fēng)險更高,現(xiàn)有檢測技術(shù)可能難以識別,編輯需要使用更高級的人工智能技術(shù)進行識別,例如通過大數(shù)據(jù)自動挖掘、人工智能分析、智能圖像數(shù)據(jù)庫的建立,以及區(qū)塊鏈技術(shù)的運用,應(yīng)對文字觀點和圖像剽竊、篡改、偽造研究數(shù)據(jù)、一稿多投、作者和審稿人身份問題等學(xué)術(shù)不端行為[31]。運用人工智能新技術(shù)打擊學(xué)術(shù)不端行為是必然的趨勢,出版單位需要投資升級稿件檢測系統(tǒng)??梢酝ㄟ^外包服務(wù),要求那些給編輯部提供采編系統(tǒng)的軟件公司升級自己的系統(tǒng)來提供相應(yīng)服務(wù)。
培訓(xùn)編輯對機器參與稿的鑒別能力,首先需要分析總結(jié)機器參與稿的共性特征,建立機器參與稿的問題庫,制定編輯處理機器參與稿的工作手冊。編輯應(yīng)特別留意機器參與稿的特點如洗稿式的語句、模板式的結(jié)構(gòu)、不當引用、專業(yè)詞匯錯誤較多等基礎(chǔ)問題,提高對機器參與稿的敏銳度。編輯還需要特別留意奇怪的機器表達方式,對未出現(xiàn)過的學(xué)術(shù)短語、沒有說明的新術(shù)語、無法直接推斷得出的語句都要仔細甄別。編輯也要調(diào)查那些提供寫作服務(wù)的工具,熟悉各類工具寫作的風(fēng)格特點后有針對性地應(yīng)對。學(xué)術(shù)期刊行業(yè)可以定期開展編輯討論會,通過編輯之間的交流學(xué)習(xí)與合作,不斷完善機器參與稿的問題庫,提高編輯處理機器參與稿的能力。
可以將論文出版的全流程置于評審和監(jiān)督之下,及時糾正機器參與稿可能出現(xiàn)的各種問題,防范作者對同行評審造假。通過專業(yè)編輯和開放同行評審保證機器參與稿的學(xué)術(shù)水準和質(zhì)量,并吸引更廣泛的學(xué)術(shù)社區(qū)參與,避免少數(shù)審稿人的判斷失誤或偏見。從版權(quán)角度來看,機器參與稿經(jīng)過開放同行評審后在期刊開放獲取出版,將現(xiàn)在的發(fā)表前同行評審制度轉(zhuǎn)變?yōu)榘l(fā)表前與發(fā)表后開放評審共存的模式,既保證了機器參與稿的質(zhì)量,又避免了可能存在的版權(quán)糾紛。
同時,出版單位應(yīng)在審稿意見書中增加對機器參與稿識別和審查的獨立模塊,借助更為專業(yè)的評議專家判斷是否有機器參與寫作、是否有學(xué)術(shù)不端風(fēng)險、人機貢獻比例不合理等問題。
為提高算法透明度,機器參與稿需要有專業(yè)的算法專家或團隊對算法進行審核評議。首先需要通過投稿者提供的信息,審查算法的原始數(shù)據(jù)是否存在污染、侵犯隱私、不充分等問題;其次,審查算法的科學(xué)性,是否有學(xué)術(shù)不端,特別是算法的反事實解釋。
對機器參與稿算法審查存在兩種方案:一種是作者在投稿前自行投遞給算法團隊審核,審核通過后交給編輯部審核;另一種是編輯部組織算法專家進行審核。選擇何種審核方案取決于科技期刊的算法審查隊伍的建設(shè)能力。
為了鼓勵更多優(yōu)秀的算法進入學(xué)術(shù)生產(chǎn),編輯部需要審查算法的創(chuàng)新性,并將其作為錄用標準之一。這樣既可避免作者利用算法生成大量機器參與稿擾亂學(xué)術(shù)出版市場,也可防范算法出現(xiàn)剽竊風(fēng)險。一個算法再次或多次使用生成的內(nèi)容,也可能有很高的學(xué)術(shù)價值,但應(yīng)降低其在學(xué)術(shù)評價和創(chuàng)新性方面的意義。如果作者使用一種算法發(fā)表過論文,第二次使用該算法時,所得論文的創(chuàng)新性評價應(yīng)相應(yīng)降低,這就需要編輯部根據(jù)辦刊宗旨來設(shè)置新的規(guī)則。此外,算法的偏見問題也需要通過專業(yè)的審稿人審核來避免。
為了能使編輯和審稿人更好地審查算法,應(yīng)該提高算法的透明性。除了要求作者在論文中更詳細準確地解釋算法外,還應(yīng)該在論文的相關(guān)環(huán)節(jié)詳細、明確地表達出算法使用的類型、用途、過程等信息。
現(xiàn)有國家標準和倫理規(guī)則均以貢獻度為署名標準,機器產(chǎn)生了貢獻應(yīng)該被署名,在期刊發(fā)表時需要注明機器貢獻的部分,避免把機器的貢獻混淆為學(xué)者的貢獻。在明確機器和人類各自的學(xué)術(shù)貢獻后,需要確立新的署名方式以及署名順序規(guī)則來指導(dǎo)機器參與稿的署名。
建議依據(jù)獨創(chuàng)性和貢獻度進行機器參與稿署名,以獨創(chuàng)性判斷機器能不能署名、如何署名,以貢獻度判斷署名的順序。這方面法學(xué)界的研究成果可供學(xué)術(shù)期刊出版界參考,例如:王熠等[32]提出以獨創(chuàng)性作為評價標準,在人工智能與人類共同署名的圖書中增加貢獻度聲明頁面以標明獨創(chuàng)性來源,創(chuàng)設(shè)人工智能專門的署名方式,將人工智能作者與人類作者區(qū)別署名。如果機器產(chǎn)生了具有獨創(chuàng)性的“學(xué)術(shù)思想和創(chuàng)意”,作者隱藏機器的貢獻,不署機器名投稿也屬于學(xué)術(shù)不端。
當前,由人工智能獨立生成全部內(nèi)容的出版作品,署名大多是人類給人工智能機器取的“名字”,如微軟的人工智能機器“小冰”創(chuàng)作的詩集在出版時署名為“小冰”,Springer Nature第一本機器產(chǎn)生的學(xué)術(shù)著作署名是“Beta Writer”。在版權(quán)研究中主張將機器的署名與機器的版權(quán)分開,如加拿大版權(quán)法中,“作者”“所有者”和“制造者”是不同的概念,認為智能主體創(chuàng)作的作品可以滿足獨創(chuàng)性和作者身份的檢驗,機器可能是作品的作者,但不是版權(quán)所有者[33]。許輝猛[34]也提出署名權(quán)規(guī)則應(yīng)將著作權(quán)行使人與署名人分開,人工智能作品的署名只能留給人工智能本身,如果人工智能有自己專屬的名稱,就署該名稱(如“小冰”);如果沒有自己的名稱,也可以署類似“微軟公司人工智能創(chuàng)作”之類的描述(或該人工智能的編號),人工智能的“署名”只是客觀事實的自然反映,并不構(gòu)成人工智能的人身權(quán)、財產(chǎn)權(quán)。因此,人工智能的署名可以與其背后復(fù)雜的相關(guān)利益主體分開。受此啟發(fā),算法的開發(fā)者、投資者、數(shù)據(jù)提供者可以通過適當?shù)姆绞?如致謝或聲明)出現(xiàn),但不能作為署名者。
署名的順序應(yīng)該通過獨創(chuàng)性檢驗后再依據(jù)貢獻度排序。不能區(qū)別人和機器的貢獻度的情況,可以參考現(xiàn)有規(guī)則署名為共同第一作者或者予以明確說明。對于人和機器的貢獻度評價,當然不能簡單地以篇幅判斷,而要綜合判斷,但是更多情況恐怕無法判斷,這是因為對人類和機器的寫作部分有不同認知,人類也可能無法理解機器的貢獻,爭議會比較大。穩(wěn)妥的操作是分別署名,并在論文中公布各自的貢獻,由學(xué)術(shù)界自行判斷。
機器的透明性,不僅僅是指其內(nèi)在代碼和算法的公開。本研究認為,從出版?zhèn)惱硪暯牵彩菣C器參與寫作的論文,都應(yīng)該在論文的顯著位置表達出來。本研究整理出當前國外期刊和學(xué)者們提出的人工智能在參與論文寫作時編輯加工的詳細指南,供國內(nèi)期刊編輯參考。該指南的核心內(nèi)容包括[15,35-36]:(1)在標題和摘要中匯報,即在標題或者摘要中明確表明使用何種類型人工智能。(2)在研究設(shè)計中匯報。明確針對什么重點問題使用了人工智能,說明使用人工智能工具的預(yù)期目的;在引言部分,明確人工智能對研究問題或研究假設(shè)的支持。(3)在研究方法中匯報。在方法設(shè)計部分,指出人工智能算法相對于其他方法的作用,特別是數(shù)據(jù)處理的詳細過程,包括數(shù)據(jù)篩選、缺失,建模過程,模型訓(xùn)練,評估、人工智能的可解釋性和可信度等,如果詳盡的描述導(dǎo)致論文篇幅超出了期刊的字數(shù)限制,需要在論文附件中提供完整的細節(jié)。(4)在研究結(jié)果和結(jié)論中匯報。在結(jié)果部分說明數(shù)據(jù)集的結(jié)果和模型的表現(xiàn);在結(jié)論與討論部分說明是否以及如何訪問人工智能模型/數(shù)據(jù),包括訪問或重復(fù)使用的限制。
規(guī)范科學(xué)數(shù)據(jù)引用(Data Citation)既能體現(xiàn)數(shù)據(jù)創(chuàng)建者的貢獻,又能對數(shù)據(jù)進行溯源驗證。對于機器參與稿使用的海量文獻數(shù)據(jù),可以參照科學(xué)數(shù)據(jù)引用規(guī)范審查這些引用是否正確。國內(nèi)外對數(shù)據(jù)引用規(guī)范高度重視,對如何引用、何時引用、引用什么的問題已有深入探討。對于機器參與稿,亟需完善的是數(shù)據(jù)引用規(guī)范,主要包括:完善數(shù)據(jù)引用對象——數(shù)據(jù)集的界定規(guī)范;完善引用強度、引用粒度的規(guī)范;完善引用元素的規(guī)范。
(1) 完善數(shù)據(jù)引用對象的界定規(guī)范。機器學(xué)習(xí)的數(shù)據(jù),無論是作為直接引用、間接引用的文獻,還是作為模仿對象的文獻,或是來自物聯(lián)網(wǎng)設(shè)備記錄的數(shù)據(jù),作者都需要將它們整理成數(shù)據(jù)集,再進行數(shù)據(jù)引用。
(2) 完善引用強度、引用粒度的規(guī)范。引用粒度是數(shù)據(jù)引用層次的問題,機器參與稿的引用粒度可能是整個數(shù)據(jù)集(所有文獻),或數(shù)據(jù)集子集(幾篇文獻),或一個特定記錄(文獻中某一句),機器參與稿學(xué)習(xí)文獻的多種方式注定了需要完善不同引用粒度的格式規(guī)范。引用強度是指引用內(nèi)容對施引文獻研究的重要性或支持程度[37],機器參與稿使用海量文獻,需要對不同重要性文獻的引用格式進行完善。
(3) 完善引用元素的規(guī)范。目前各個機構(gòu)對引用元素的規(guī)范并不統(tǒng)一,必需元素和可選元素的標準存在較大差異,機器使用多種類型的數(shù)據(jù),更需要統(tǒng)一的引用元素來防范學(xué)術(shù)不端。為了能夠?qū)?shù)據(jù)集進行溯源審查,統(tǒng)一標識符數(shù)據(jù)和解析網(wǎng)址是機器參與稿的必需元素。依據(jù)專業(yè)數(shù)據(jù)存儲機構(gòu)生成數(shù)據(jù)集的訪問網(wǎng)址,完善引用對象所處位置的規(guī)范。機器參與稿學(xué)習(xí)文獻的方式并不全是直接引用或間接引用,無法在正文中直接體現(xiàn),而科學(xué)數(shù)據(jù)的引用位置則需要行業(yè)共同約定并納入規(guī)范。
具有自主性或自動化的代碼、軟件、服務(wù)等工具若在論文寫作過程中發(fā)揮了重要作用,除了通過署名體現(xiàn)代碼和軟件開發(fā)者、服務(wù)提供者的貢獻,還可以通過被引頻次體現(xiàn)那些可以公開獲取的代碼、軟件和服務(wù)的貢獻。當前軟件引用尚未形成統(tǒng)一的標準。機器參與稿使用的代碼和軟件,無論是作者自己開發(fā)的,還是市場已有的軟件,都應(yīng)該作為參考文獻引用或者在腳注中添加說明,作者自己開發(fā)的軟件如果不存在保密需要,最好公開源代碼以供審查。FORCE 11軟件引用工作組發(fā)布了軟件引用規(guī)則,包括重要性、歸屬性、唯一標識性、持久性、可訪問性和特異性[38]。國外有出版機構(gòu)開始實施的這些軟件引用原則,可供出版單位編輯加工稿件和制定征稿簡則時參考。
軟件代碼也可以像數(shù)據(jù)出版一樣進行網(wǎng)絡(luò)共享。2018年,Taylor & Francis出版社和劍橋大學(xué)出版社與基于云計算的可復(fù)制平臺“代碼海洋”(Code Ocean)合作,使研究人員可以輕松共享和運行代碼,以幫助讀者和終端用戶理解、可視化和重復(fù)使用代碼,還可以通過包含文章鏈接的元數(shù)據(jù)來更好地實現(xiàn)軟件引用[39]。國內(nèi)也需要建設(shè)類似的基礎(chǔ)設(shè)施平臺支持代碼、軟件的共享和引用。
由于機器參與論文寫作的方式與人類不同,技術(shù)的貢獻、前人的貢獻因為無法像傳統(tǒng)論文一樣很好地在論文中界定和表達,很有可能帶來倫理問題和社會爭議。為了降低風(fēng)險,建議將機器參與論文寫作的版權(quán)模式變更為開放、共享。目前開放獲取出版商為了平衡各方利益,出現(xiàn)了很多新的模式,出版單位可以根據(jù)具體情況選擇更為適當?shù)拈_放獲取模式。
通過提供降重工具來逃避剽竊檢測的技術(shù)對學(xué)術(shù)規(guī)范構(gòu)成了極大威脅,應(yīng)將其納入“惡意軟件”的范疇進行限制治理。提供論文降重、論文代寫代投服務(wù)的軟件明顯是“懷有惡意目的”和“完成惡意功能”,理應(yīng)進行技術(shù)限制,治理工具買賣亂象。
首先,應(yīng)限制其傳播渠道。限制論文降重、代寫等相關(guān)敏感詞的搜索,如“論文代寫”“論文降重”“降重修改”等。當前在淘寶搜索“論文降重”已無內(nèi)容顯示,說明電子商務(wù)平臺已經(jīng)采取行動。但這種治理需要各平臺協(xié)調(diào)才能實現(xiàn)徹底根治,例如限制“論文代寫”“降重工具”等推薦介紹類的自媒體文章傳播。搜索引擎也應(yīng)該限制這類搜索結(jié)果。
其次,限制安裝和使用。利用軟件查殺降重、代寫軟件的下載和安裝,屏蔽論文降重、代寫的網(wǎng)址。部分工具使用時需要轉(zhuǎn)發(fā)宣傳頁,獲取點贊后才可以升級服務(wù),以達到宣傳擴散目的,技術(shù)上應(yīng)將其作為違規(guī)信息攔截轉(zhuǎn)發(fā),限制使用。限制軟件安裝則需要我國網(wǎng)絡(luò)安全和網(wǎng)信部門出臺相關(guān)的治理措施。
最后,學(xué)術(shù)出版業(yè)應(yīng)聯(lián)合抵制。各出版機構(gòu)、學(xué)術(shù)規(guī)范管理部門定期曝光參與論文代寫、改寫的降重工具,由行業(yè)共同抵制。
機器參與論文寫作是大勢所趨,但其投稿發(fā)表存在諸多倫理問題,編輯機構(gòu)需提高鑒別防范能力,以成文的出版?zhèn)惱硪?guī)范或編輯規(guī)范來約束作者、編輯、審稿人。由于倫理問題,本研究無法調(diào)查編輯部對機器參與稿的識別能力究竟如何;加上篇幅所限,對機器參與論文寫作出版?zhèn)惱韱栴}的分析還不夠系統(tǒng)和全面。未來可以繼續(xù)研究其中的問題,例如制訂機器參與論文寫作的編輯出版規(guī)范等。此外,由于機器寫作應(yīng)用是黑箱的,受專業(yè)局限還無法完全理解其工作原理,未來還應(yīng)該加強跨學(xué)科合作研究。