[摘要]學術不端事件近些年越來越多地出現(xiàn)在學術期刊的出版中,如何杜絕和防止這種現(xiàn)象的不斷出現(xiàn),成為學術期刊編輯需要重視的問題。本文結合期刊界近些年使用比較普遍的學術不端檢測系統(tǒng)——知網檢測系統(tǒng)的使用情況,對其中常常出現(xiàn)的失真情況進行了一一分析和探討,以期對我們在實際應用中,更好地把握和判斷學術不端起到一個很好的提示和促進作用。
[關鍵詞]學術不端學術不公檢測系統(tǒng)
學術不端(學術抄襲和學術造假)是一個相當復雜的社會問題。近年來,從職稱評選材料之小論文大到國家基金課題,從普通學生到高端的科研者,學術不端的事例也層出不窮,參與者越來越多,涉及領域越來越廣。反對學術不端的呼聲也越來越高,學術不端已嚴重影響到一個國家的學術信譽和學術發(fā)展。
針對學術不端現(xiàn)象,國家和各有關單位也在積極開展反學術不端行動,研制出多種學術不端檢測軟件。這其中,最主要的是武漢大學的ROST反剽竊系統(tǒng)(文檔相似性檢測)、中國知網學術不端行為檢測系統(tǒng)、萬方數(shù)據庫檢測系統(tǒng)、PaperPass論文通行證等等。其中,使用最為廣泛的是中國知網學術不端檢測系統(tǒng)。該系統(tǒng)分TMLC(學位論文學術不端行為檢測系統(tǒng))、AMLC(科技期刊學術不端檢測系統(tǒng))、SMLC(社科期刊學術不端檢測系統(tǒng))、學術不端文獻檢測系統(tǒng)VIP、英文檢測系統(tǒng)、中英文對照檢測系統(tǒng)、PMLC(大學生論文抄襲檢測系統(tǒng))和中學生作文檢測系統(tǒng)等等。
知網檢測系統(tǒng)使用的相關概念主要有:對比范圍、重合字數(shù)、文字復制比、單源復制、多源復制、前部重合度、后部重合度、段落抄襲、整體抄襲等。該系統(tǒng)對被檢測文章有如下檢測結果:沒有問題的,就顯示為“綠色”;整個文章引用別的文章的原文內容“大于1000字或小于全部字數(shù)的40%”,整個文檔被診斷為“黃色”,即“輕度抄襲”;如果比對的文字重合大于5000字或占總字數(shù)的40%~50%,就會被標為“橙色”;重合大于10000字或在50%以上,就會被標為“紅色”,那就屬于“重度抄襲”了。這些標準也被各大期刊社所采用。
盡管學術不端檢測軟件在防止學術不端方面發(fā)揮了良好的作用,也取得了不俗的效果,但是,檢測畢竟是通過機器完成,而且,這款檢測軟件是建立在中國知網的數(shù)據庫上(其數(shù)據主要來自收錄的期刊、報紙、會議、工具書、年鑒、專利標準和博碩論文),筆者在多年使用該軟件的過程中,就發(fā)現(xiàn)有如下問題會導致檢測失真,影響了檢測者的使用效果?,F(xiàn)對這些問題進行討論,以期能引起共識,幫助使用者更好、更有效地運用檢測軟件。
1. 課題成員內部互抄
一般來說,每一個科研課題組有很多成員參與同一個課題,結題時要求成果發(fā)表,就會在其論文中出現(xiàn)對課題內容的重復書寫和表述。這樣,當各子課題負責人通過不同途徑、不同時間發(fā)表其成果時,不同期刊對投稿論文進行系統(tǒng)檢測時,會出現(xiàn)互抄的現(xiàn)象。對于此類情況,不能簡單地鑒定其為“學術不端”,編輯須認真對待,仔細甄別。
2. 數(shù)據庫數(shù)據的有限性
眾所周知,知網數(shù)據庫數(shù)據主要來自收錄的期刊、報紙、會議、工具書等,檢測系統(tǒng)數(shù)據庫以外的文獻或網絡文獻并沒有被收錄完整。筆者作為學術期刊編輯,經常碰到檢測文章一路綠燈,然而,通過百度或者其他搜索引擎搜索時,會發(fā)現(xiàn)網絡上出現(xiàn)雷同文章,而此文章常見于博客、空間或者其他網絡終端。另外,很多核心期刊和優(yōu)秀期刊也是各大期刊網爭奪的資源,而期刊網也希望這些期刊對其唯一授權入庫,導致知網不能收錄齊全這些核心期刊和優(yōu)秀期刊,而這些文獻卻是爭相抄襲的對象,所以知網的檢測系統(tǒng)依然無法查詢出此類文獻。數(shù)據庫的有限性和完善的滯后性使得部分抄襲的文章鉆了檢測系統(tǒng)的“空子”。
3. 數(shù)據庫的時效性欠缺
為確保論文能及時發(fā)表,很多作者喜歡一稿多投(當然各大期刊都反對一稿多投),如果被抄襲的文獻沒有及時公開發(fā)表卻在“準出版公開”狀態(tài),及時刊登的而沒有及時被知網數(shù)據庫收錄,抄襲往往就不能被系統(tǒng)檢測發(fā)現(xiàn)。知網數(shù)據收錄工作量非常之大,很多文獻都是在公開發(fā)表后兩個月內在數(shù)據庫才能查詢到,或者更長時間。另外,很多“文抄公”也很“聰明”地利用這一點,打個時間差,投稿成功。
4. 數(shù)據庫的語言限制
目前,知網數(shù)據庫主要針對中文,在所有數(shù)據庫的數(shù)據來源上,文字體現(xiàn)都是中文。如果一些作者抄襲知網數(shù)據庫的中文論文來完成自己的文章,那么很容易被檢測到有抄襲行為,但如果只是把外文的文章翻譯過來,投稿期刊,往往可以經過系統(tǒng)的檢測,導致期刊編輯難以得到準確的信息,造成學術不公。
5. 智力性因素限制
檢測的指標主要數(shù)據依據是文字復制比,主要描述文獻重合文字所占比例的大小程度,從客觀來講,并不能指該文獻的抄襲嚴重程度,必須人機結合才能做出精確的判斷。有時,我們編輯部經常發(fā)現(xiàn),有些文章經過專家審定,雖然檢測的文章為橙色,但是由專家全文認真審核后發(fā)現(xiàn),兩篇文章指示工具和引文上雖然重復,而研究方法和結果是不同的。有時,工科類文章,是一個作者的同一系列文章,只是用同一樣本進行不同的研究或者研究有交叉、重復的內容僅僅是對象和方法,而得出的結果是不相同的。這種情況下,并不能視為真正意義上的抄襲。
6. 收錄期刊標準化問題
在參考知網檢測系統(tǒng)評價標準的基礎上,對于引用、復制、抄襲的界定,不同期刊均會設計不同的標準,有一套自己嚴格的規(guī)定。筆者所在的期刊編輯部對錄用稿件的引用標準限定在15%以內。據筆者所知,各大期刊設定標準差異懸殊,有些期刊引用標準設定可以超越30%,有些期刊卻僅低于5%。這就致使投稿不同的期刊,收錄情況不一,導致作者投稿困惑。
7. 轉抄數(shù)據失真問題
當前網絡信息的迅速發(fā)展,使得利用檢測系統(tǒng)查學術不端行為受到了一定的限制。檢測系統(tǒng)只能查被收錄的已經發(fā)表過的數(shù)據,對于未發(fā)表過的文章與數(shù)據,其不具備檢測性。這就致使一部分通過轉載與抄襲他人博客、空間與其他網絡終端的文章?lián)屜雀`取了發(fā)表權。當這些博客、空間與其他網絡終端的作者再想發(fā)表其文章時,檢測系統(tǒng)查詢結果會顯示最先發(fā)表抄襲此文的數(shù)據,致使轉抄數(shù)據出現(xiàn)失真的問題。
8. 故意抄襲和臨摹仿效的界定問題
檢測系統(tǒng)對于涉及相同的部分,都會用紅色標注,而對于其抄襲的性質,卻無法體現(xiàn)。這其中涉及故意抄襲與臨摹仿效,這兩種性質的抄襲是需要明確界定的。因為按《中華人民共和國著作權法》的規(guī)定,少量的臨摹仿效是允許的,引用名言名句、國家政策、法律法規(guī)、時事新聞等,只要標注其引用且范圍在限定的標準內都是可以的,而故意抄襲屬于剽竊,是嚴重侵犯他人著作權與學術不端的行為,是需要嚴格限制的。所以在檢測系統(tǒng)查出抄襲部分后,我們期刊編輯需要對其標注的部分進行界定,區(qū)別其屬于故意抄襲還是臨摹仿效,針對具體情況提出修改意見。
9. 人機結合問題,專業(yè)性和相關創(chuàng)新性成果須專家審核
完全依賴檢測系統(tǒng)查抄襲與學術不端,顯然其力量是非常單薄的。期刊社須考慮邀請相關的專家,對學術的專業(yè)性和相關創(chuàng)新性成果進行審核,達到人機相結合,人腦互用。一是可避免因檢測系統(tǒng)的單一性而致使抄襲的文章通過審稿程序被錄用,造成學術不端;二是可增加期刊的權威性,使具有專業(yè)性與創(chuàng)新性成果的文章得到相關修改意見,得以完善。
10. 檢測軟件的穩(wěn)定性和專有性
檢測系統(tǒng)似乎不夠穩(wěn)定。很多雜志社編輯反映,檢測同一篇文章,在開頭加個空格和不加空格,檢測出來的數(shù)據居然不一樣。這就需要檢測系統(tǒng)設計人員對軟件進一步升級和完善,而使用人員要更加熟練掌握使用技能,使檢測軟件真正達到使用效果。另外,檢測軟件要提高性能,防止反檢測規(guī)避抄襲軟件的肆虐。如今,在網絡上,反檢測規(guī)避抄襲風氣在傳播,網上甚至開始熱賣“論文檢測系統(tǒng)”,相關人員只要花上幾十元至幾百元,就可以提前獲得檢測報告,并得到一定的修改意見,只要按要求進行修改,即使是抄襲的文章也能通過檢測。此行為助長了不良學風,值得重視。
歸根結底,檢測軟件不是萬能的,它只能起到警示、告誡學術人員遵守學術規(guī)范,盡可能地消除論文抄襲,是防止學術不端的一個輔助手段。目前學術界對學術不端行為約束力幾乎為零,在其缺乏一個強有力的制度來規(guī)范和保障學術的情況下,需要靠傳統(tǒng)的道德自律,從思想覺悟與道德境界上規(guī)范學術人員,以防止“學術不端”變成“學術不公”。
(作者單位:海南出版社)