羅 瑞,唐 璞,舒安琴,石 蕓*
(重慶市衛(wèi)生信息中心《重慶醫(yī)學(xué)》編輯部 重慶400014)
兩種學(xué)術(shù)不端檢測(cè)系統(tǒng)對(duì)醫(yī)學(xué)論文檢測(cè)結(jié)果的差異性研究
羅 瑞,唐 璞,舒安琴,石 蕓*
(重慶市衛(wèi)生信息中心《重慶醫(yī)學(xué)》編輯部 重慶400014)
選取《重慶醫(yī)學(xué)》編輯部2013—2014年20篇投稿論文,分別采用CNKI科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)(AMLC)和維普——通達(dá)論文引用檢測(cè)系統(tǒng)進(jìn)行檢測(cè),比較 2個(gè)系統(tǒng)檢測(cè)結(jié)果的差異性。結(jié)果發(fā)現(xiàn)同一篇論文經(jīng)過(guò)不同檢測(cè)系統(tǒng)檢測(cè)存在差異,復(fù)制率差異最小為 0.31%,最高為 40.9%?;诓煌瑢W(xué)術(shù)不端檢測(cè)系統(tǒng)的檢測(cè)結(jié)果存在一定差異性,編輯部應(yīng)該探索對(duì)投稿稿件進(jìn)行復(fù)制率檢測(cè)的合理方式。
學(xué)術(shù)不端 檢測(cè)系統(tǒng) 差異性
科技期刊編輯部對(duì)科研論文在審稿、刊前進(jìn)行學(xué)術(shù)不端檢測(cè)已經(jīng)在業(yè)內(nèi)達(dá)成一定的共識(shí),可有效避免違反學(xué)術(shù)規(guī)范、學(xué)術(shù)道德的行為。目前,國(guó)內(nèi)各大數(shù)據(jù)庫(kù)都推出了學(xué)術(shù)不端檢測(cè)系統(tǒng)(如中國(guó)知網(wǎng)、萬(wàn)方數(shù)據(jù)庫(kù)、重慶維普),但不同檢測(cè)系統(tǒng)對(duì)同一篇論文進(jìn)行檢測(cè)時(shí),檢測(cè)結(jié)果是否相同,有何差異性,其研究報(bào)道較少。本研究選取了 2013—2014年《重慶醫(yī)學(xué)》投審稿系統(tǒng)的 20篇稿件,采用中國(guó)知網(wǎng)和重慶維普 2個(gè)數(shù)據(jù)庫(kù)的學(xué)術(shù)不端檢測(cè)系統(tǒng)對(duì)相同論文進(jìn)行了檢測(cè),并對(duì) 2個(gè)系統(tǒng)的檢測(cè)結(jié)果進(jìn)行了差異性比較。
1.1 一般資料
選取《重慶醫(yī)學(xué)》編輯部2013—2014年投稿稿件 20篇,分為 CNKI科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)(AMLC)組(簡(jiǎn)稱“知網(wǎng)組”),維普——通達(dá)論文引用檢測(cè)系統(tǒng)組(簡(jiǎn)稱“維普組”)。所選取的論文欄目、字?jǐn)?shù)等一般資料比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),具有可比性。
1.2 方法
1.2.1 檢測(cè)方法
先后采用AMLC和維普2個(gè)數(shù)據(jù)庫(kù)的學(xué)術(shù)不端檢測(cè)系統(tǒng)對(duì)相同的 20篇論文進(jìn)行檢測(cè),比較知網(wǎng)組、維普組檢測(cè)結(jié)果的差異性。
1.2.2 結(jié)果分析
分析檢測(cè)結(jié)果包括 2個(gè)數(shù)據(jù)庫(kù)學(xué)術(shù)不端檢測(cè)系統(tǒng)檢測(cè)結(jié)果的差異性和 2個(gè)數(shù)據(jù)庫(kù)學(xué)術(shù)不端檢測(cè)系統(tǒng)復(fù)制率分段比較。
2.1 知網(wǎng)組、維普組學(xué)術(shù)不端檢測(cè)結(jié)果比較
經(jīng)過(guò)2個(gè)數(shù)據(jù)庫(kù)的學(xué)術(shù)不端的檢測(cè)發(fā)現(xiàn),2組中,相同論文的檢測(cè)結(jié)果存在差異,復(fù)制率差異最小為0.31%,最高為40.9%,具體結(jié)果如表1、圖1所示。
表1 兩種數(shù)據(jù)庫(kù)的學(xué)術(shù)不端的檢測(cè)結(jié)果比較(%)Tab.1 Comparison of test results from two Academic Misconduct Literature Detection Systems(%)
圖1 知網(wǎng)、維普文字復(fù)制比折線對(duì)比Fig.1 Broken line comparison of text replicate ratios of CNKI-AMLC and Vip-Tonda
2.2 知網(wǎng)組、維普組學(xué)術(shù)不端檢測(cè)結(jié)果分段比較
根據(jù)《重慶醫(yī)學(xué)》對(duì)初審稿件復(fù)制率的要求(0%~20%為合格,大于 20%~40%為轉(zhuǎn)增刊發(fā)表,大于 40%退稿),對(duì) 2組檢測(cè)結(jié)果進(jìn)行分段比較存在差異,如表2所示。
表2 知網(wǎng)組、維普組學(xué)術(shù)不端檢測(cè)結(jié)果分段比較[n(%)]Tab.2 Subsection comparison of test results from CNKIAMLC and Vip-Tonda [n(%)]
學(xué)術(shù)不端行為是指違反學(xué)術(shù)規(guī)范、學(xué)術(shù)道德的行為,關(guān)于學(xué)術(shù)不端行為最早的定義大約可追溯至1992年。當(dāng)時(shí),美國(guó)國(guó)家科學(xué)院、國(guó)家工程院和國(guó)家醫(yī)學(xué)研究院組成的22位科學(xué)家小組將學(xué)術(shù)不端行為定義為在申請(qǐng)課題、實(shí)施研究報(bào)告結(jié)果的過(guò)程中出現(xiàn)的捏造、篡改或抄襲行為。在我國(guó),學(xué)術(shù)不端行為的應(yīng)用范圍更為廣泛,指的是在學(xué)術(shù)研究過(guò)程中出現(xiàn)的違背科學(xué)共同體行為規(guī)范、弄虛作假、抄襲剽竊或其他違背公共行為準(zhǔn)則的行為,其中“其他”不端行為包括不當(dāng)署名、一稿多投、一個(gè)學(xué)術(shù)成果多篇發(fā)表等。[1]目前,國(guó)內(nèi)對(duì)學(xué)術(shù)不端行為的關(guān)注度越來(lái)越高,特別是在科技期刊行業(yè)中,普遍都對(duì)投稿論文采取了學(xué)術(shù)不端的檢測(cè)。一般認(rèn)為相似度大于 30%的稿件有抄襲嫌疑,而大于50%的稿件有全篇抄襲的嫌疑。所以,相似度在 30%~50%范圍內(nèi)的稿件會(huì)被重點(diǎn)排查,而相似度小于 30%的稿件容易被直接通過(guò),大于50%的稿件又容易被直接拒稿。[2]
如今,國(guó)內(nèi)主要的學(xué)術(shù)檢測(cè)系統(tǒng)主要有CNKI科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)、萬(wàn)方論文相似性檢測(cè)系統(tǒng)、維普——通達(dá)論文引用檢測(cè)系統(tǒng)。本研究采用CNKI科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)和維普——通達(dá)論文引用檢測(cè)系統(tǒng)分別對(duì)《重慶醫(yī)學(xué)》20篇論文進(jìn)行檢測(cè),結(jié)果發(fā)現(xiàn)2組中相同論文的檢測(cè)結(jié)果存在差異,復(fù)制率差異最小為 0.31%,最高為 40.9%。同時(shí),2組檢測(cè)結(jié)果進(jìn)行分段比較也存在差異,部分使用知網(wǎng)檢測(cè)復(fù)制率低的論文,采用維普檢測(cè)時(shí)出現(xiàn)復(fù)制率超高的情況,說(shuō)明不同學(xué)術(shù)不端檢測(cè)系統(tǒng)檢測(cè)結(jié)果存在差異性,這與張旻浩等[3]研究結(jié)果一致。針對(duì)這一情況,筆者對(duì)不同學(xué)術(shù)不端檢測(cè)系統(tǒng)檢測(cè)結(jié)果存在差異性的原因進(jìn)行了分析。
3.1 收錄論文統(tǒng)計(jì)源不同
CNKI科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)檢測(cè)范圍涵蓋中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)、中國(guó)博士論文網(wǎng)絡(luò)出版總庫(kù)、中國(guó)優(yōu)秀碩士論文網(wǎng)絡(luò)出版總庫(kù)、中國(guó)報(bào)紙全文數(shù)據(jù)庫(kù)、中國(guó)專利全文數(shù)據(jù)庫(kù)(知網(wǎng)版)、中國(guó)科技成果數(shù)據(jù)庫(kù)(知網(wǎng)版)、中國(guó)年鑒網(wǎng)絡(luò)出版總庫(kù)、中國(guó)工具書(shū)數(shù)據(jù)庫(kù)、中國(guó)標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)(知網(wǎng)版)等。維普——通達(dá)論文引用檢測(cè)系統(tǒng)涵蓋中國(guó)網(wǎng)絡(luò)論文庫(kù)、中國(guó)科技論文庫(kù)、中國(guó)期刊論文網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、中文科技期刊數(shù)據(jù)庫(kù)、中文重要學(xué)術(shù)期刊庫(kù)、中國(guó)重要文科期刊庫(kù)、中國(guó)中文報(bào)刊報(bào)紙數(shù)據(jù)庫(kù)、重要外文期刊數(shù)據(jù)庫(kù)等以及數(shù)百萬(wàn)的學(xué)位論文、高校特色論文庫(kù)等。由于 2個(gè)數(shù)據(jù)庫(kù)統(tǒng)計(jì)源的不同,造成數(shù)據(jù)庫(kù)收錄論文的差異性,在進(jìn)行學(xué)術(shù)不端的檢測(cè)時(shí)產(chǎn)生不同的結(jié)果。同時(shí),知網(wǎng)還和部分科技期刊編輯部簽訂獨(dú)家合作協(xié)議,如果某一編輯部簽訂這一協(xié)議之后,該編輯部刊出的所有文章只能在知網(wǎng)上才能檢索到,就勢(shì)必造成其他數(shù)據(jù)庫(kù)(如萬(wàn)方、維普)對(duì)該刊物的原始數(shù)據(jù)文獻(xiàn)缺失,也就造成了現(xiàn)今國(guó)內(nèi)沒(méi)有一家數(shù)據(jù)庫(kù)完整收錄了所有刊物文獻(xiàn)數(shù)據(jù)。[3]
3.2 優(yōu)先出版
近年來(lái),各大數(shù)據(jù)庫(kù)陸續(xù)建立起論文優(yōu)先出版的渠道,通過(guò)與各個(gè)編輯部簽署優(yōu)先出版協(xié)議,編輯部可以選擇近期優(yōu)質(zhì)論文由自己上傳到數(shù)據(jù)庫(kù)。優(yōu)先出版一般比常規(guī)形式快2個(gè)月左右,這在一定程度上解決了出版的滯后問(wèn)題,但是也對(duì)論文的學(xué)術(shù)不端檢測(cè)產(chǎn)生了影響。例如,某位作者在《重慶醫(yī)學(xué)》2014年7月發(fā)表了1篇文章,由于論文質(zhì)量好、創(chuàng)新性強(qiáng),編輯部采用優(yōu)先出版上傳到知網(wǎng),也就是說(shuō)在知網(wǎng)上立即能檢索到這篇文章,同時(shí)知網(wǎng)的學(xué)術(shù)不端檢測(cè)系統(tǒng)也能檢測(cè)到。但是因?yàn)榭餂](méi)有將這篇論文在維普的數(shù)據(jù)庫(kù)優(yōu)先出版,如果有其他作者抄襲或者過(guò)度引用這篇論文,在維普數(shù)據(jù)庫(kù)將這篇論文上網(wǎng)之前投稿,那么使用維普的學(xué)術(shù)不端檢測(cè)系統(tǒng)將不能發(fā)現(xiàn)后一位作者的學(xué)術(shù)不端行為,從而產(chǎn)生檢測(cè)結(jié)果的差異性。
3.3 檢測(cè)技術(shù)不同
在查閱相關(guān)文獻(xiàn)的過(guò)程中,作者還發(fā)現(xiàn)知網(wǎng)與維普進(jìn)行學(xué)術(shù)不端檢測(cè)時(shí)使用的技術(shù)方法也是不同的,他們?cè)诠ぷ鞣绞?、后臺(tái)核心數(shù)據(jù)庫(kù)平臺(tái)、技術(shù)特點(diǎn)、功能特點(diǎn)、算法特點(diǎn)等方面都存在差異。[3]這些在技術(shù)上的不同,會(huì)造成同一篇文章在不同的檢測(cè)系統(tǒng)檢測(cè)時(shí),所認(rèn)定為學(xué)術(shù)不端行為有所不同,如對(duì)論文關(guān)鍵語(yǔ)義片斷識(shí)別檢測(cè)、字段識(shí)別、近義同義識(shí)別上存在差異,最終造成檢測(cè)結(jié)果的差異性。
綜上所述,采用不同學(xué)術(shù)不端檢測(cè)系統(tǒng)的檢測(cè)結(jié)果存在一定差異性,如何使用學(xué)術(shù)不端檢測(cè)系統(tǒng)的檢測(cè)結(jié)果,對(duì)稿件質(zhì)量進(jìn)行把關(guān),成為目前亟待解決的問(wèn)題。無(wú)論檢測(cè)系統(tǒng)多先進(jìn),程序多優(yōu)良,它們只是刻板地按照指令執(zhí)行,檢測(cè)結(jié)果并非完全準(zhǔn)確,因此要求編輯人員理性使用學(xué)術(shù)不端檢測(cè)系統(tǒng),同時(shí)必須提升自身的業(yè)務(wù)素質(zhì)。[4-5]本研究的不足之處在于選取的樣本量較小,在下一步工作中,將擴(kuò)大樣本量繼續(xù)研究,并積極探索對(duì)投稿稿件進(jìn)行復(fù)制率檢測(cè)的合理方式,不斷優(yōu)化審稿流程,促進(jìn)科技期刊的發(fā)展。
[1]新華網(wǎng).關(guān)于學(xué)術(shù)不端行為的幾點(diǎn)思考[EB/OL].http://news.xinhua.net.com/edu/2009-10/27/content_123 35826.ht.2010-12-20.
[2]唐虹.編輯對(duì)學(xué)術(shù)不端檢測(cè)結(jié)果的判斷[J].中國(guó)報(bào)業(yè),2013,9(下):16-17.
[3]旻張 浩,高國(guó)龍,錢俊龍.國(guó)內(nèi)外學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)平臺(tái)的比較研究[J].中國(guó)科技期刊研究,2011,22(4):514-521.
[4]孔琪穎,蔡斐,張利平,等.正確看待科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)檢測(cè)結(jié)果[J].編輯學(xué)報(bào),2009,21(6):544-546.
[5]李丹.學(xué)術(shù)不端檢測(cè)系統(tǒng)的理性使用[J].學(xué)術(shù)界,2012(12):129-133.
Differences of Academic Misconduct Detection Results of Medical Research Articles:A Study of Two Academic Misconduct Literature Detection Systems
LUO Rui,TANG Pu,SHU Anqin,SHI Yun*
(Editorial Department of Chongqing Medicine,Chongqing Municipal Health Information Center,Chongqing 400014,China)
To compare the differences of detection results from different academic misconduct literature detection systems,both CNKI academic misconduct literature periodical detection system(AMLC)and Vip-Tonda text matching system were used to detect 20 papers submitted to Chongqing Medicine.The study showed that there were different values of replication rate at a range from 0.31% to 40.9% of the same paper’s detection result by different systems and different detection results were demonstrated by different academic misconduct literature detection systems.It is suggested that editorial departments should explore a reasonable way to detect the replication rate of manuscripts submitted.
academic misconduct;detection system;difference
Z62
A
1006-8945(2014)12-0071-03
*
2012年重慶報(bào)刊發(fā)展專項(xiàng)資助基金(渝新出版(2012)176號(hào))。
2014-11-05