■石 鶴 夏黎明 汪 曉 楊 岷 明 橋 艾文霞
華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬同濟(jì)醫(yī)院《放射學(xué)實(shí)踐》編輯部,武漢市解放大道1095號(hào) 430030
科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)(AMLC)是由CNKI開發(fā)的、以中國學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫為全文比對數(shù)據(jù)庫,對文獻(xiàn)進(jìn)行檢測,判斷其是否存在學(xué)術(shù)不端行為的智能系統(tǒng)[1]?!斗派鋵W(xué)實(shí)踐》(以下簡稱本刊)雜志于2011年正式開始使用AMLC,迄今已檢測3500余篇稿件,已有100余篇論文被檢測后認(rèn)定為不端論文而退稿,有效遏制了抄襲、剽竊、重復(fù)發(fā)表等學(xué)術(shù)不端行為,在預(yù)防和打擊學(xué)術(shù)不端行為方面發(fā)揮了重要作用。現(xiàn)在國內(nèi)大部分期刊已經(jīng)采用AMLC對作者投稿進(jìn)行檢測,有關(guān)AMLC的應(yīng)用等方面已有多篇論文發(fā)表,對AMLC的應(yīng)用價(jià)值、存在的問題及應(yīng)該采取的對策等方面進(jìn)行了深入探討[2-6],如楊晨晨[2]認(rèn)為 AMLC存在不能有效地檢測圖表和公式等的重復(fù)性、不能有效地識(shí)別稍加變動(dòng)的多源性抄襲等問題;秦小川[6]認(rèn)為AMLC并不能真正地達(dá)到人工智能,編輯日常工作中不能完全依賴AMLC的檢測結(jié)果,應(yīng)進(jìn)行綜合分析。筆者發(fā)現(xiàn)此前發(fā)表的文獻(xiàn)都是對作者投稿的文章(未發(fā)表論文)進(jìn)行檢測,尚未發(fā)現(xiàn)有對已經(jīng)發(fā)表的論文進(jìn)行檢測的相關(guān)文獻(xiàn)。與未發(fā)表論文不同的是,已經(jīng)發(fā)表的論文在發(fā)表之前均經(jīng)過檢測(本刊論文發(fā)表之前需經(jīng)過兩次檢測),而經(jīng)過檢測而最終得以發(fā)表的不端論文,其學(xué)術(shù)不端的行為、方式更為隱蔽,更難以被系統(tǒng)和編輯識(shí)別,對此類論文的學(xué)術(shù)不端行為和方式進(jìn)行回顧性分析,能更好地掌握其特征,積累檢測經(jīng)驗(yàn)。本文對本刊2015年已經(jīng)發(fā)表的301篇論文利用AMLC進(jìn)行檢測,對檢測結(jié)果進(jìn)行深入分析,并對不端論文發(fā)表之前的檢測過程進(jìn)行追蹤、溯源,總結(jié)漏檢的不端論文的特征,為提高檢測效果、效率提供借鑒和參考。
根據(jù)文獻(xiàn)不端檢測系統(tǒng)的判定標(biāo)準(zhǔn)以及相關(guān)文獻(xiàn)的研究結(jié)論[2-7],將文字重合度≥40%作為初步篩選不端論文的標(biāo)準(zhǔn)較為合適,為了最大程度檢出不端論文,本研究將文字重合度≥20%或最大單篇文獻(xiàn)文字重合度≥10%(滿足其中任意一個(gè)條件即可)作為初步篩選不端論文的標(biāo)準(zhǔn),同時(shí)對每篇被檢論文的檢測結(jié)果進(jìn)行分析,對文字重合度<20%且最大單篇文獻(xiàn)文字重合度<10%的被檢論文,重點(diǎn)分析論文結(jié)果部分。本研究只是將文字重合度和最大單篇文獻(xiàn)文字重合度作為參考指標(biāo)和篩選條件,具體結(jié)論通過筆者綜合比對、分析得出。
關(guān)于博碩士論文,如果博碩士論文的第一作者(或通訊作者)將內(nèi)容整理后再以第一作者在期刊上發(fā)表,筆者遵守國內(nèi)的慣用方法,認(rèn)定為非不端論文,如果博碩士論文的其他作者再將其整理后以第一作者在期刊上發(fā)表,則認(rèn)定為不端論文[6,7]。
301篇被檢論文中,文字重合度≤20%的有241篇,占所有被檢論文的80.1%,20% <文字重合度<40%的有48篇,占所有被檢論文的15.9%,文字重合度≥40%的有12篇,占所有被檢論文的4.0%;最大單篇文獻(xiàn)文字重合度≥10%的論文有69篇,占所有被檢論文的22.9%。經(jīng)筆者綜合比對、分析,有6篇被認(rèn)定為不端論文,占所有被檢論文的2.0%。
301篇被檢論文中,有6篇被認(rèn)定為不端論文,這6篇不端論文的相關(guān)檢測數(shù)據(jù)見表1。從表1可以看出,有3篇論文的文字重合度≥40%,6篇論文的最大單篇文獻(xiàn)文字重合度均≥10%。對6篇不端論文的檢測過程進(jìn)行追蹤、溯源,發(fā)現(xiàn)論文發(fā)表之前進(jìn)行的兩次文獻(xiàn)不端檢測中,6篇論文的文字重合度均<40%,其中2篇論文的文字重合度≥20%且最大單篇文獻(xiàn)文字重合度≥10%。6篇論文中5篇的發(fā)表時(shí)間與被抄襲文獻(xiàn)的發(fā)表時(shí)間接近(不超過3個(gè)月)。
表1 6篇被認(rèn)定為不端論文的檢測數(shù)據(jù)
CNKI每年都會(huì)發(fā)布“已刊發(fā)論文學(xué)術(shù)不端分析表”,公布嚴(yán)重疑似學(xué)術(shù)不端文獻(xiàn),其中,嚴(yán)重疑似學(xué)術(shù)不端文獻(xiàn)包括:①本文與發(fā)表在前的且本文未標(biāo)明引用的其他文獻(xiàn)的文字重合度大于40%;②一稿多發(fā)稿件中第一次發(fā)表以后重復(fù)發(fā)表的稿件,包括同一作者改動(dòng)已經(jīng)發(fā)表的文獻(xiàn)再次投稿發(fā)表的文章,其改動(dòng)部分少于10%。筆者認(rèn)為僅通過以上標(biāo)準(zhǔn),無法判定是否為不端文獻(xiàn)。本研究結(jié)果顯示,301篇被檢論文中有12篇文字重合度大于40%,其中僅3篇為不端論文,因此僅將文字重合度大于40%作為鑒定標(biāo)準(zhǔn)值得商榷,最終的鑒定結(jié)論應(yīng)該通過仔細(xì)比對、綜合分析得出。本研究將文字重合度≥20%或最大單篇文獻(xiàn)文字重合度≥10%(滿足其中任意一個(gè)條件即可)作為初步篩選不端論文的標(biāo)準(zhǔn),同時(shí)對每篇被檢測論文的檢測結(jié)果均進(jìn)行分析,這樣做是為了最大程度避免漏檢不端論文。
本研究顯示6篇不端論文中5篇與被抄襲文獻(xiàn)的發(fā)表時(shí)間比較接近,發(fā)表時(shí)間間隔在3個(gè)月以內(nèi)。
此類論文在本研究中包括以下兩種情況:①對論文的核心部分,即結(jié)果部分進(jìn)行修改。本研究發(fā)現(xiàn)有1篇論文將結(jié)果部分的表格描述改為文字描述,由于文獻(xiàn)不端檢測系統(tǒng)對圖表不能進(jìn)行有效地檢測[2,8],所以躲過了系統(tǒng)的檢測;②現(xiàn)在有的作者通過各種途徑在投稿前對文章進(jìn)行檢測,如果發(fā)現(xiàn)文字重合度較高,就進(jìn)行人為的修改,這些修改大多是通過改變用詞、調(diào)整順序等方式,并不會(huì)對論文的觀點(diǎn)和結(jié)論造成影響,但可以躲避系統(tǒng)的檢測。
本研究顯示6篇中4篇不端論文與被抄襲文獻(xiàn)的作者單位一致,同時(shí)存在作者重合,4篇中2篇第一作者相同,另外2篇第一作者不同,但存在作者重合。
對6篇不端論文的檢測數(shù)據(jù)進(jìn)行分析,并對發(fā)表之前的檢測結(jié)果進(jìn)行追蹤、溯源,發(fā)現(xiàn)6篇論文發(fā)表之前的兩次檢測中文字重合度均在40%以內(nèi),其中1篇文字重合度兩次檢測均為0。同時(shí),稿件追蹤系統(tǒng)也未提示異常。6篇不端論文在發(fā)表前的不端檢測中未被檢出的原因,包括非人為漏檢和人為漏檢兩種情況:①非人為漏檢。6篇中4篇為非人為漏檢,漏檢的原因是論文發(fā)表之前的兩次檢測中對比數(shù)據(jù)庫中未出現(xiàn)被抄襲文獻(xiàn);②人為漏檢。6篇中2篇為人為漏檢,其中1篇為作者對結(jié)果部分的描述進(jìn)行了改動(dòng),將表格方式的描述改成了文字描述,同時(shí)文字重合度較低,未引起檢測編輯的注意;另外1篇為綜述論文,進(jìn)行檢測的編輯未仔細(xì)與被抄襲文獻(xiàn)進(jìn)行比對,同時(shí)文字重合度不是很高,從而造成了漏檢。雖然綜述論文本身就是引用別人的觀點(diǎn),但綜述論文也有主題思路,如果與被比對文獻(xiàn)在主題、引用文獻(xiàn)方面基本相同,也應(yīng)該被認(rèn)定為不端論文,因此對綜述論文的檢測不能疏忽。
學(xué)術(shù)期刊一旦發(fā)現(xiàn)已發(fā)表的論文涉及學(xué)術(shù)不端行為,決不遮掩,應(yīng)該采取有力措施予以處理??稍谄诳熬W(wǎng)絡(luò)上公開聲明,對情節(jié)嚴(yán)重的學(xué)術(shù)不端行為進(jìn)行充分曝光,將情況通報(bào)作者單位,懲治相關(guān)責(zé)任者,維護(hù)學(xué)術(shù)論文的嚴(yán)肅性[9]。除了對已經(jīng)發(fā)表的不端論文的作者進(jìn)行懲戒之外,更重要的是采取哪些措施能避免或減少漏檢的不端論文,根據(jù)本研究的結(jié)論,筆者認(rèn)為采取以下措施能起到不錯(cuò)的效果。
現(xiàn)階段大多數(shù)期刊只在稿件初審之前進(jìn)行檢測,并未進(jìn)行多次檢測。除了初審檢測外,期刊有必要進(jìn)行刊出前的再次檢測,初審檢測結(jié)合刊出前檢測的做法值得提倡[10]。部分期刊也采取多次檢測的方法,最后一次檢測是在收取版面費(fèi)之前,由于期刊收取版面費(fèi)后還要進(jìn)入等待發(fā)表的過程,這個(gè)時(shí)間也成了一個(gè)檢測的盲區(qū)。采用此檢測方法是考慮到如果在收取版面費(fèi)后、出刊前檢測為不端論文,容易就版面費(fèi)的退費(fèi)問題與作者產(chǎn)生矛盾。本刊對每篇來稿均進(jìn)行兩次檢測,第一次檢測的時(shí)間是作者投稿之后、初審之前,第二次檢測是在所有審稿通過之后、收取版面費(fèi)之前。但經(jīng)筆者統(tǒng)計(jì),本刊自使用文獻(xiàn)不端檢測系統(tǒng)以來,每年未通過檢測而退稿的文章不少于10篇(2015年為21篇),雖然本刊在檢測不端論文方面花費(fèi)了大量精力,也采取了很多卓有成效的措施,但每年仍然有為數(shù)不少的不端論文發(fā)表,筆者分析其原因,可能與第二次檢測距論文發(fā)表的時(shí)間較長有關(guān),本刊論文從收取版面費(fèi)到正式發(fā)表一般需要4個(gè)月以上,這段時(shí)間也成為了一個(gè)檢測的盲區(qū),因此本刊的第二次檢測時(shí)間定為論文發(fā)表前而不是收取版面費(fèi)之前顯得很有必要,一旦論文發(fā)表前檢測為不端論文,應(yīng)堅(jiān)決退稿,堅(jiān)定打擊學(xué)術(shù)不端行為的決心。
論文印制成紙質(zhì)版發(fā)表后或在論文發(fā)表的同時(shí),刊社將論文的電子版上傳至數(shù)據(jù)庫,數(shù)據(jù)庫要對論文進(jìn)行一定的匯編處理,導(dǎo)致中國學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫中的論文有一定的滯后性(現(xiàn)在為2個(gè)月),公開發(fā)表但尚未被總庫收錄的論文,該系統(tǒng)無法檢測[2,3],因此會(huì)造成檢測結(jié)果的不真實(shí)性。如果有不端論文的檢測時(shí)間處于其對應(yīng)的被抄襲文獻(xiàn)公開發(fā)表之后但尚未被總庫收錄這個(gè)時(shí)間段內(nèi),該篇不端論文將會(huì)被漏檢。如果能縮短從公開發(fā)表到被總庫收錄的時(shí)間,則能減小因?yàn)閿?shù)據(jù)更新不及時(shí)而造成的影響。
目前,中國知網(wǎng)的“文獻(xiàn)不端檢測系統(tǒng)”新增了“稿件追蹤”功能,編輯利用“稿件追蹤”功能可以清楚地查到每一篇稿件的投稿歷史,從而避免一稿多投及一稿多投導(dǎo)致的重復(fù)發(fā)表。同時(shí),“稿件追蹤”功能可以查看投稿論文的檢測時(shí)間[11],可以為編輯判斷此篇論文是否是作者經(jīng)過檢測后進(jìn)行人為修改提供參考。雖然本刊也加入了稿件追蹤平臺(tái),可以對稿件的投稿及檢測情況進(jìn)行追蹤,但稿件追蹤平臺(tái)發(fā)揮的作用有限,幾乎沒有不端論文被監(jiān)測到,因?yàn)槟壳凹尤敫寮粉櫰脚_(tái)的期刊較少,為編輯了解稿件投稿歷史增加了難度,因此,呼吁更多的期刊加入稿件追蹤平臺(tái),這樣更容易判斷一篇被多次檢測的稿件到底是作者自己檢測還是被已投的編輯部檢測,從而為在技術(shù)上防范一稿多投、一稿多發(fā)提供了保障。
AMLC是抵制科技期刊學(xué)術(shù)不端行為的有力工具,對不端論文的檢出有重要作用,但不是所有不端論文都能被檢測出來,為了減少漏檢情況的發(fā)生,筆者認(rèn)為做好以下三點(diǎn)最為重要:①檢測者采取正確的檢測策略,更加仔細(xì)地對可疑論文進(jìn)行比對,其中最重要的是堅(jiān)持在出刊前進(jìn)行最后的檢測;②AMLC及時(shí)更新對比數(shù)據(jù)庫;③呼吁更多的期刊采用“稿件追蹤”功能,讓一稿多投無處藏身。筆者相信,只要做好以上三點(diǎn),更多的學(xué)術(shù)不端論文將被檢出,AMLC對學(xué)術(shù)不端論文的漏檢也會(huì)大幅減少。
[1]CNKI科研誠信管理系統(tǒng)研究中心.學(xué)術(shù)不端文獻(xiàn)檢索系統(tǒng)手冊.http://check.cnki.net.
[2]楊晨晨.運(yùn)用學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)檢測醫(yī)學(xué)論文存在的問題及對策[J].編輯學(xué)報(bào),2014,26(1):42-44.
[3]康銀花.藥學(xué)論文學(xué)術(shù)不端的表現(xiàn)及責(zé)任編輯的應(yīng)對策略[J].中國科技期刊研究,2012,23(4):676-678.
[4]賀晉瑜,杜學(xué)梅,李敏生,等.科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)應(yīng)用探討[J].中國科技期刊研究,2013,24(4):777-779.
[5]石鶴,明橋,夏黎明,等.對正確使用學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)的探討[J].湖北第二師范學(xué)院學(xué)報(bào),2011,28(8):80-82.
[6]秦小川.《中醫(yī)學(xué)報(bào)》應(yīng)用AMLC檢測結(jié)果分析和體會(huì)[J].中國科技期刊研究,2013,24(6):1122-1125.
[7]鄭雨田.未發(fā)表文章與已發(fā)表文章內(nèi)容重合度分析——以醫(yī)學(xué)文章為例[J].中國科技期刊研究,2011,22(6):894-897.
[8]陸宜新.學(xué)術(shù)不端檢測中的隱性重復(fù)現(xiàn)象分析[J].中國科技期刊研究,2015,26(6):552-555.
[9]魏秀菊,王柳,趙光磊.學(xué)術(shù)期刊辦刊中防范學(xué)術(shù)不端行為的實(shí)踐及啟示——以《農(nóng)業(yè)工程學(xué)報(bào)》為例[J].中國科技期刊研究,2008,19(4):632-636.
[10]王曼.醫(yī)學(xué)期刊修回稿再次學(xué)術(shù)不端文獻(xiàn)檢測的必要性分析[J].編輯學(xué)報(bào),2013,25(2):146-147.
[11]王繼紅,鄧群,肖愛華.利用“稿件追蹤”系統(tǒng)高效識(shí)別一稿多投[J].科技傳播,2015,7(9):156-157.