張亙稼
(西安石油大學(xué)期刊中心,陜西 西安 710075)
科技期刊編輯在日常的審稿過程中,面對大量來稿,尤其是在國內(nèi)學(xué)術(shù)不端問題泛濫的情況下,初審稿件僅僅依靠編輯人員的專業(yè)知識及經(jīng)驗還遠(yuǎn)遠(yuǎn)不夠,為保證初審稿件質(zhì)量,科技期刊編輯一般需對稿件進行專門檢測。目前常見的文獻檢測軟件有國外的TURNITIN、CROSSCHECK、MYDROPBOX以及國內(nèi)的ROST反剽竊 (文檔相似性檢測)系統(tǒng)、CNKI學(xué)術(shù)不端文獻檢測系統(tǒng)等軟件。[1]而國內(nèi)科技期刊大多使用CNKI學(xué)術(shù)不端文獻檢測系統(tǒng),從實用的效果看,該系統(tǒng)獲得業(yè)內(nèi)人士一致好評,其便利性、迅捷性、準(zhǔn)確性顯而易見??祫叛芯康贸鋈缦陆Y(jié)論:CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)較國內(nèi)外同類系統(tǒng)優(yōu)勢明顯。[1]可以說,CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)為科技期刊編輯提供了遏制學(xué)術(shù)腐敗的有力武器。然而,我國高校研究學(xué)生,沒將精力用在論文寫作上,而是用在了如何讓反反剽竊的研究上,并總結(jié)出各種應(yīng)對反剽竊的秘籍,如知網(wǎng)的論文反抄襲檢測系統(tǒng)的算法與修改秘笈等,練就并掌握了各樣論文反反抄襲檢測修改技巧。筆者旨在對此問題進行歸類并加以分析,以期提出相應(yīng)的治理措施。
筆者通過實際調(diào)查結(jié)合網(wǎng)絡(luò)調(diào)查方法,收集、整理了反反抄襲檢測的方法及手段。
1.技巧一,外文文獻翻譯法。
原理:知網(wǎng)論文反抄襲檢測系統(tǒng)和萬方數(shù)據(jù)的系統(tǒng)都不收錄外文資料。方法:查閱研究領(lǐng)域外文文獻,特別是高水平期刊的文獻,比如Science,Nature,ES&T,Water Res等,將其中的理論講解翻譯成中文,放在自己的論文中。缺點:這種方法對英語水平有很高要求,不過,英語一般的同學(xué)也有自己的“門道”。有些同學(xué)付錢給學(xué)校里英語專業(yè)的研究生,請他們對自己的“雙語論文”全程把關(guān)。很多學(xué)校的墻上貼著這種小廣告,英語專業(yè)的學(xué)生為人操刀論文,價格也不菲,少則幾百元多則上千元。
2.技巧二,改寫法。
原理:不管是什么系統(tǒng),都只能按一定數(shù)量的文字是否相同來檢測是否為抄襲,無法做到語義分析,因此,我們又總結(jié)出來新的修改秘笈。方法:將別人論文里的文字,或按照意思重寫,或變換句式結(jié)構(gòu),更改主被動語態(tài),或更換關(guān)鍵詞。缺點:費時費力,在這個時間就是金錢的社會,大部分同學(xué)能抽出來寫論文的時間也就是幾天而已,這樣有點太沒效率了。
例1:原句:過熱故障中的過熱與變壓器正常運行下的發(fā)熱是有區(qū)別的,正常運行時的其發(fā)熱源來自于繞組和鐵芯,即銅損和鐵損,而變壓器過熱故障是由于受到有效熱應(yīng)力而造成的絕緣加速劣化,它具有中等水平的能量密度。
修改句:過熱故障中出現(xiàn)的過熱容易與變壓器正常運行下的發(fā)熱相混淆,后者是因為其繞組和鐵芯會出現(xiàn)銅損和鐵損的現(xiàn)象,這是正常運行過程中的發(fā)熱,而變壓器過熱故障是受到有效熱應(yīng)力造成的絕緣加速劣化。
例2:原句:在透明水杯的清水中放入少量纖維進行攪動,便可以直觀地發(fā)現(xiàn)纖維呈立體懸浮狀亂向分散,且長時間放置都不會有太大變化,說明合成纖維的質(zhì)量較好;質(zhì)量差的纖維經(jīng)攪動后可能分散,但時隔不久便會上浮為一絮狀層。質(zhì)量差的纖維在混凝土的實際配制過程中多不易均勻分散。
修改句:將少量纖維放入盛裝清水的透明容器中,邊攪動邊觀察纖維變化情況,如果合成纖維質(zhì)量較好,那么就可以直觀地看到纖維呈立體懸浮狀分散,隨著時間的推移,位置也不會發(fā)生明顯的變化;若合成纖維質(zhì)量較差,那么攪動的過程中,纖維可能分散,并且容易上浮形成絮狀層。質(zhì)量差的纖維在混凝土的實際配制過程中多不易均勻分散。
由此可見,科技論文造假者,在保證修改后句子通順的前提下,盡量和原句在字面上保持不同。
3.技巧三:google翻譯法。
原理:跟技巧二差不多,用翻譯軟件將語句多次翻譯后,語句結(jié)構(gòu),表達(dá)方式大不同,就算檢測系統(tǒng)再NB,也查不出來的。方法:將別人論文里的文字,用google翻譯成英文,再翻譯回來,句式和結(jié)構(gòu)就會發(fā)生改變,再自行修改語病后,即可順利躲過查重。復(fù)雜點可將文字翻譯成英文,再翻譯成日文,然后再翻譯回來。只要你愿意,可以隨意發(fā)揮。缺點:跟技巧二差不錯,需要較大的修改,有的話是一點都不通順的,需要一句一句的修改。
4.技巧四:轉(zhuǎn)換圖片法。
原理:知網(wǎng)的系統(tǒng)只能檢測文字,對圖片和表格則無法識別,常用的做法:將別人論文里的文字,截成圖片,放在自己的論文里。缺點:只能少量的用,如果你的論文里有大量的文字圖片,就可通過了系統(tǒng)檢測。
技巧五:抄書。原理:不管是中國知網(wǎng),還是萬方的論文反抄襲檢測系統(tǒng),哪家公司也沒有收錄書籍。當(dāng)然,前提是書籍上的東西在網(wǎng)上是找不到的,因為找得到的基本都被收錄了。[2]
1.CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)設(shè)計原理。
CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)是指利用全文文獻為比對資源,通過軟件全面檢測學(xué)術(shù)不端行為的系統(tǒng),該系統(tǒng)由CNKI(國家知識基礎(chǔ)設(shè)施工程)于2009年研發(fā)成功,功能類似的還有武漢大學(xué)信息管理學(xué)院開發(fā)的“ROST反剽竊系統(tǒng)”。
ROST反剽竊系統(tǒng)的工作原理。反剽竊軟件自動將目標(biāo)文檔切割為多個小文本,分解成一個個句子、提取信息指紋進行檢測。通過混合引擎將其與相關(guān)網(wǎng)頁和490萬篇文獻進行模糊匹配,標(biāo)示出每個文本塊與文獻庫中的某些文獻的最大相似度,并統(tǒng)計出上述兩者之間的相似字?jǐn)?shù)所占總字?jǐn)?shù)的比例。相似度大于或等于一個公認(rèn)值,則可認(rèn)定為抄襲。據(jù)了解,該系統(tǒng)根據(jù)重合字符數(shù)量與文字復(fù)制比例,檢測結(jié)果分為輕度句子抄襲、句子抄襲、輕度段落抄襲、段落抄襲、整體抄襲等5個類別。此外,還有針對數(shù)據(jù)篡改、內(nèi)容偽造、引用杜撰等方面的多個檢測指標(biāo)。
2.CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)漏洞。
(1)知網(wǎng)的論文反抄襲檢測系統(tǒng)不收錄外文資料。
(2)按一定數(shù)量的文字是否相同來檢測是否為抄襲,無法做到語義分析?!皩W(xué)術(shù)不端檢測儀”從2009年3月起在國內(nèi)部分高校研究生院開始使用。該系統(tǒng)在每一次檢測過程中,待檢文章首先按照篇章、段落、句子等層級分層處理,然后創(chuàng)建指紋。指紋即語言的特征,就好像每個人說話的口頭禪,之后比對數(shù)據(jù)庫中的比對文獻。
(3)只能檢測文字,對圖片和表格無法檢測。漢字是世界上歷史最悠久的文字之一。漢字能夠歷久不衰,漢字?jǐn)?shù)量繁多,字形結(jié)構(gòu)復(fù)雜;漢字具有一定的超時空性。漢語的詞類可分成的名詞、動詞、形容詞、副詞等類別[3]。句子成分包括主語、謂語、賓語、定語、狀語、補語等成分。漢語詞類和句子成分之間不存在一對一的關(guān)系是漢語語法的一個特點。漢語語法是缺乏嚴(yán)格意義的形態(tài)變化的,語序和虛詞是十分重要的語法手段,因此,漢語語法研究自然就把重點放在句法特別是虛詞方面。這樣,虛詞的研究當(dāng)然就成了就是將論文和數(shù)據(jù)庫進行比對,根據(jù)其重合處的比例,判斷該論文是否存在抄襲行為。由于CNKI論文反抄襲檢測系統(tǒng)就是將論文和數(shù)據(jù)庫進行比對,根據(jù)其重合處的比例,判斷該論文是否存在抄襲行為。[4]300字是一個大概值,并非臨界值。可見,引用的數(shù)量越低,就越不容易被檢測出來。更新以后的CNKI學(xué)術(shù)不端檢測系統(tǒng)將這一閥值調(diào)整到了3%,以前是5%,意味著檢測系統(tǒng)對引用的要求更加嚴(yán)格,但運用我們后面提到的方法也不是很難,具有中等水平的能力密度。而科技期刊論文中大量使用公式、符號,用以準(zhǔn)確表達(dá)復(fù)雜的概念,照片,不僅節(jié)省了大量文字說明,有時可起到文字表達(dá)無法表達(dá)的內(nèi)容,具有直觀、形象的特點。但CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)因功能問題對此無法識別。進而影響檢測效果。
(4)抄襲標(biāo)準(zhǔn)沒有明確界定。目前,我國沒相關(guān)的法律對此類型未進行規(guī)范,更沒有制定抄襲的具體判定標(biāo)準(zhǔn),于是,各高校、各科研學(xué)術(shù)機構(gòu)各自為政,制定自己的判斷抄襲的判斷標(biāo)準(zhǔn)。據(jù)筆者調(diào)查得知:在通常情況下,各高校將這個重合比的限度定為25%~30%。若經(jīng)過檢測發(fā)現(xiàn)某篇論文的文字重合比超過規(guī)定的范圍,論文就會被提交至該校學(xué)術(shù)委員會,由它們據(jù)此來判定論文是否存在抄襲行為。[4]顯然,這一標(biāo)準(zhǔn)太籠統(tǒng),對社科論文與科技論文、綜述類論文和研究型論文來說,如果簡單、機械地用文字重合率為標(biāo)準(zhǔn)來鋪安定論文作者是否抄襲,會造成新的不公平,因為對于社科類的綜述性論文來說,其研究是在梳理前人研究成果的基礎(chǔ)上,總結(jié)前人成果,分析其方法,探討其存在的問題,提出今后需要進一步研究的問題等,所以,此類論文引用文獻占有較高的比重。
1.增加參考文獻真?zhèn)握鐒e系統(tǒng)
在現(xiàn)有CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)的基礎(chǔ)上,進一步完善其功能,增加“科技論創(chuàng)新點比對數(shù)據(jù)庫”和“科技論文審讀系統(tǒng)”等質(zhì)量檢測系統(tǒng),實現(xiàn)系統(tǒng)升級,進而克服其簡單地進行文字比對,計算重復(fù)率,以此來甄別是否剽竊的弊端。參考文獻是論文或著作等寫作過程中參考過的文獻。參考文獻是在學(xué)術(shù)研究過程中,對某一著作或論文的整體的參考或借鑒。參考文獻是編輯校對工作一部分,主要內(nèi)容一是核查作者引用的參考文獻是否真實存在,有無真?zhèn)?二是檢查、改正標(biāo)著不正確、不規(guī)范的參考文獻。目前,CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)檢測中雖然能檢測出論文中引文的文獻源,但顯示結(jié)果不夠清楚、直觀。另外,沒有對原文的參考文獻真?zhèn)巫鳛榕卸?。因為,如原文后列有的參考文獻與檢測出的參考文獻有較大出入者,應(yīng)視為學(xué)術(shù)不端,應(yīng)予以否認(rèn)。建議CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)研究開發(fā)此功能。
2.增加注釋文獻真?zhèn)握鐒e系統(tǒng)。
按照GB/T 7714-2005《文后參考文獻著錄規(guī)則》的定義,文后參考文獻是指:“為撰寫或編輯論文和著作而引用的有關(guān)文獻信息資源?!保?]注釋是對已有作品中的詞語、內(nèi)容引文、出處等所作的說明,也就是一種講解。注釋一般是針對作品的疑難處來進行說明,目的在于能使人們更準(zhǔn)確、更完整地理解作品。注釋需要注釋者去搜集資料,進行考證、推敲、理解吃透原作品,其中包含注釋者大量的創(chuàng)作勞動。對于注釋部分,注者應(yīng)當(dāng)享有著作權(quán)。注釋他人作品,應(yīng)當(dāng)取得著作權(quán)人的同意,并且無權(quán)限制他人對同一作品進行新的注釋。因為征引過的文獻在注釋中已注明,不再出現(xiàn)于文后參考文獻中。故注釋不在CNKI學(xué)術(shù)不端文獻檢測系統(tǒng)檢測范圍之內(nèi)。而注釋文獻是作者寫作重要的素材,其真?zhèn)?、?zhǔn)確性是影響科技論文質(zhì)量構(gòu)成的因素,建議在CNKI學(xué)術(shù)不端文獻檢測系統(tǒng)增加此功能。
3.充分發(fā)揮編輯的能動性。
漢字?jǐn)?shù)量繁多、字形結(jié)構(gòu)復(fù)雜;漢語的詞類多樣,句子成分紛繁,且漢語詞類和句子成分之間不存在一對一的關(guān)系。而漢語語法又缺乏嚴(yán)格意義的形態(tài)變化,語序和虛詞是十分重要的語法手段豐富。在此語言環(huán)境下,如果文作者運用各種反反抄襲手段及技巧,CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)則顯得力不從心。因此,應(yīng)用CNKI學(xué)術(shù)不端文獻檢索系統(tǒng)反對學(xué)術(shù)不端,僅僅應(yīng)是一種輔助手段,更重要的手段還是要充分發(fā)揮廣大科技期刊編輯的主觀能動性,運用其豐富的知識、經(jīng)驗來進行反學(xué)術(shù)不端活動。
[1]康勁.“CNKI學(xué)術(shù)不端文獻檢測系統(tǒng)”較國內(nèi)外同類系統(tǒng)優(yōu)勢明顯[J].CNKI動態(tài),2012-12-20[2].多戈論文檢測網(wǎng):http://www.duoge007.com/a/miji/141.html.2012-01-!&
[3]試談漢語語法學(xué)史研究中的幾個問題http://new.060s.com/article/2011/10/10/407168.htm2011-10-
[4]學(xué)術(shù)不端檢測儀能否保證學(xué)術(shù)純潔[N].西安日報,2010-04-28.