郭衛(wèi)兵,葉繼元
近年來學術規(guī)范一直受到學界、教育界和管理界的重視,國家也已出臺了一些治理學術失范和不端的相關文件,但回望現實,學術不正之風尚未得到根本的扭轉,有關我國學術不端現象的新聞報道屢見不鮮,學術論文抄襲事件更是層出不窮。為此,行政管理機構、高等教育機構及科研機構等部門相繼出臺了各種防治學術不端的文件,學術界也發(fā)起了抵制學術不端的倡議,商業(yè)機構也研發(fā)了遏制學術不端行為的軟件。這些防治措施雖在一定程度上扼制了學術不端行為的蔓延,但尚未達到“治本”的目的,且一些學術失范、不端檢測軟件(以下簡稱“不端檢測軟件”或“檢測軟件”)本身也存在不少設計上的問題。為了更好地達到治理效果,改進和完善檢測軟件功能,本文采用文獻調查法、比較研究法,歸納和分析國內主要檢測軟件的功能、算法、使用范圍和存在的問題,從學術研究規(guī)范的角度,將學術研究規(guī)范,尤其是論文形式規(guī)范貫穿到檢測軟件中,為學術不端檢測及防范提供新思路。
20世紀40年代后期,美國學術界開始出現文字抄襲、編造實驗數據、篡改實驗結果等學術不端現象,當時并未引起足夠重視,直到1987年匹茲堡大學助理教授布魯寧的學術造假事件發(fā)生,學術不端行為才逐漸被學界關注和研究。1992年,美國公共衛(wèi)生局對學術不端行為正式定義為“在進行或報告研究時發(fā)生的捏造、篡改、剽竊行為,或嚴重背離科學共同體公認規(guī)則的其他行為”[1]。我國對學術不端行為的關注也差不多在同一時間,1996年專注于揭發(fā)我國學術不端行為的“新語絲”網站創(chuàng)辦,之后我國學術界開始出現對學術不端現象的相關解釋性研究[2]。曹樹基認為“學術不端主要指學者涉及抄襲、剽竊等不良行為,也指學者惡意的一稿多投行為”[3],此是“學術不端行為”概念初步形成。2016年中華人民共和國教育部發(fā)布《高等學校預防與處理學術不端行為辦法》,明確了學術不端行為的定義、具體行為表現及處理方式,指出學術不端行為是高等學校及其教學科研人員、管理人員和學生在科學研究及相關活動中發(fā)生的違反公認的學術準則、違背學術誠信的行為。這是我國第一份針對高校學術不端行為的規(guī)章性文件,標志著教育部對依法治理學術不端行為重視程度的提升,也引發(fā)了公眾和學界對當前我國高校學術不端行為的激烈討論。
以信息技術為支撐的學術不端檢測軟件,在一定程度上有助于發(fā)現抄襲、拼湊論文等學術不端行為,從而起到威懾作用。國外學術不端檢測軟件起步較早,又由于語言文字等方面的差異,其反抄襲技術較國內成熟。成立較早的Turnitin軟件是全球最權威的英文檢測系統[4],1998年作為同行評議的申請由四位大學生創(chuàng)立,2000年開始開展防抄襲服務,現支持英文、中文、阿拉伯文等30多種語言的檢測,被90多個國家7000多所高校采用[5]。我國學術不端檢測軟件最早于2008年研制成功并投入使用,包括武漢大學信息管理學院的“ROST論文反剽竊系統”、同方知網的“學術不端文獻檢測系統”和北京智齒數匯科技有限公司的PaperPass檢測系統,緊接著其他幾大數據庫商和信息服務機構都相繼推出了學術不端檢測軟件,國內的學術不端檢測技術研究進入繁榮時期,詳見表1。
國內相關學術不端檢測軟件的研究是從2008年同方知網的“學術不端文獻檢測系統”上線運行后開始的。本文以CNKI中國學術期刊網絡出版總庫、中國重要會議論文全文數據庫為統計源,以CNKI的高級檢索為檢索途徑,檢索1998-2017年時段內主題包含“學術不端檢測系統”“相似度檢測軟件”“相似度分析軟件”“論文檢測”等關鍵詞的文獻,去除非學術文獻和不相關文獻,最終得到204篇文獻。對204篇文獻的年度分布、來源分布和作者所屬機構進行定量統計分析,結果見圖1、圖2和表2。
圖1 2009-2017年文獻數量年度分布
圖2 文獻來源分布
表2 文獻作者所屬機構分布
在Turnitin誕生至“CNKI學術不端文獻檢測系統”誕生的10年間,我國并無學術不端文獻檢測軟件的相關研究,自“學術不端文獻檢測系統”誕生起,有關學術不端文獻檢測軟件的研究逐漸興起,總體呈上升趨勢,但文獻數量不多,2011-2014年是該領域的研究高峰期,2014年之后研究文獻數量略有下降,但趨于平穩(wěn)。有關學術不端文獻檢測軟件的研究文獻在《編輯學報》發(fā)表的數量最多,其次是《中國科技期刊研究》,這兩種期刊均為CSSCI來源期刊;發(fā)表相關文獻4篇以上的共6種期刊,合計發(fā)表文獻27篇(占13%)。從發(fā)表論文的期刊層次上看,學術不端檢測軟件相關研究文獻具有一定的質量。在文獻作者所屬機構方面,共有107篇文獻的作者來自學術期刊編輯部,其中發(fā)表文獻數量最多的為《陰山學刊》編輯部,可見學術期刊編輯對學術不端檢測軟件的關注度比其他任何一個職業(yè)都高。
在研究內容方面,較集中在檢測軟件使用評價、檢測平臺比較分析、軟件局限性分析、缺陷防范措施等方面,例如王宇[6]認為檢測軟件在數據來源方面存在檢測盲區(qū),在檢索結果方面存在檢測效果不理想、無法甄別合理引用的問題。肖駿等[7]測試了文獻內容篡改和字序變更對檢測軟件檢測結果的影響,發(fā)現字序更改和是否“觸媒”都能極大地影響學術不端檢測軟件的檢測結果。徐仲[8]、王福軍等[9]在對萬方論文相似性檢測系統(PSDS)和知網學術不端文獻檢測系統(AMLC)進行比較后,認為兩者在檢測范圍、文獻引證檢測和圖表相似性檢測上存在差異,并且這兩種檢測軟件都存在一定的問題。王文福[10]認為僅依靠技術手段來清除學術不端行為是行不通的,應構建以人為主導、網絡為主體,“人機合一”的防范體系。這205篇文獻對檢測軟件的討論主要是圍繞道德規(guī)范、法律、制度和技術扼制等幾個方面展開的,尚未見從學術研究規(guī)范的角度來討論檢測軟件局限和對策的文獻,道德規(guī)范、法律、制度建設固然是必不可少,但本文認為從檢測軟件的功能出發(fā),從學術研究規(guī)范的視角來討論其局限、分析對策并展開實施,是當下學術不端防治嚴峻形勢下的一條有效路徑。
目前國內提供學術不端檢測服務的機構有10余家,軟件各具所長,如表3所示。
這些學術不端檢測軟件的特點主要有如下幾方面:
(1)檢測軟件功能重合率高。大部分軟件僅具備論文檢測一項功能,除了檢測算法細節(jié)不一致、比對數據覆蓋量不同之外,并無其他異處。所有檢測軟件均已實現了在海量數據的基礎上的語義級別檢測技術,包括指紋特征檢測技術、知識挖掘技術、自然語言處理技術等,部分軟件已經能夠智能識別文字圖片、智能抓取公式內容并自動檢測觀點剽竊。比對數據庫文獻量均以億計,內容覆蓋了期刊論文、會議論文、學位論文、圖書、網頁、報紙等資源。多數軟件能夠針對不同的使用對象開發(fā)了相應的檢測版本,如博碩文論版、本科論文版、職稱論文版、圖書專著版等。
(2)學術研究規(guī)范應用簡單。除了學術不端檢測之外,部分檢測軟件拓展了軟件功能,嘗試將學術研究規(guī)范應用到檢測軟件中來。Gocheck論文引用檢測系統3.1版本提供一個“導師指導”功能,該功能使指導老師和學生能夠在線互動并記錄下互動內容,為導師指導貫穿畢業(yè)論文撰寫過程提供途徑。同方知網提供了一款名為Writeaid論文寫作助手的論文輔助寫作軟件,該軟件滲透到論文寫作的過程,即能在論文寫作之前根據不同高?;蚱诳恼撐膶懽饕笤O定模板并自動校對文本,使得論文的格式能符合形式規(guī)范。大雅相似度分析系統可將研究思路、成果主要內容在中文圖書中作全面的比對,從而協助找到相同或相似研究方向的課題和相關團隊。這些功能的擴展,豐富了檢測軟件的應用場景,擴大了使用范圍,然而這些應用僅利用了學術研究規(guī)范的部分條例,還不成體系。
(3)學術不端行為更加“隱秘”。學術不端檢測軟件引入的初衷是為了防范學術不端,然而技術進步并不能阻止學術不端行為的發(fā)生,比如檢測算法的升級很快就被發(fā)現有“漏洞”,而被不法分子所利用,如今社會上出現的支持被檢測者實施學術不端行為的“幫兇”[6],幫助被檢測者實施“一種升級版的造假[17]”的行為愈來愈猖狂,使得檢測成為了一場所謂“降重技巧”的比拼,失去了學術不端檢測應有的意義。筆者在百度中輸入“降重”,立即跳出“降重軟件”“論文降重”等關鍵詞,相關檢索結果多達927萬余條,各種所謂“自動降重軟件”“論文降重助手”比比皆是,在淘寶網中搜索“論文降重”也得到400余條檢索結果,并顯示有大量成功交易。這種做法助長了學術不端風氣,嚴重阻礙了相關學術研究的進步。
表3 國內主流學術不端檢測軟件比較
違反學術規(guī)范行為涉及到所有參加學術研究行為的主體,其行為紛繁復雜,在學術研究各個環(huán)節(jié)均有所表現。根據學術活動涉及到的人員可分為在校學生、學術期刊編輯、專門科研人員、評審專家、管理單位等,根據不端行為本身的性質可分為偽造類、剽竊類、贊譽類等[18]。本文根據已有研究成果,總結了不同的人員在學術研究程序各環(huán)節(jié)內可能發(fā)生的違反學術規(guī)范行為見表4。
表4 學術不端行為分類
由表4可以看出,在學術研究的研究選題、數據分析、總結研究成果和研究成果發(fā)表這四個階段最易發(fā)生違反學術規(guī)范行為,包括學術失范、學術不端和學術腐敗等。學術失范行為在大多數情況下可能是科學工作者在不經意間的失誤,并不是刻意的行為,是一種輕微的違反學術規(guī)則而造成的失誤。學術腐敗主要表現為學術組織的權力擁有者利用手中的權力侵占他人學術成果,其危害性更大。學術不端行為介于二者之間,界定在包括剽竊、數據篡改和捏造等情形中,不僅作者本人會產生學術不端行為,期刊編輯的不當轉載、互惠引用等行為也會使作者產生學術不端行為。
從20世紀80年代學術不端初露端倪開始,政府、學界和社會為規(guī)范學術行為開始了漫長的治理之路,其治理途徑主要包括道德規(guī)范建設、制度建設、法律建設和技術遏制[19]等幾個方面,所付出的努力有目共睹。本文總結學術不端治理路徑依據其可操作性認為學術不端防治可分為易操作、一般操作和難操作3個層次,如表5所示。
表5 學術不端治理路徑的三個層次
我國學術不端行為的治理之所以一直并沒有達到所期望的效果,是因為在這過程中存在配套機制缺失和執(zhí)行力度不夠等問題,比如匿名評審制度,由于學術研究的專門化,小同行之間相互熟悉,匿名評審專家很容易判斷出作者是誰,專家?guī)斓娜笔А㈠噙x機制的不透明等都使得匿名評審制度在學界存在異議。學術單位和管理部門在懲戒違反學術規(guī)范、追究相關責任人、完善項目申請和評審制度方面有著非常嚴格的制度[20],但是執(zhí)行的力度往往卻礙于名聲、熟人等原因而有所折扣,且“問題”往往跟著“制度”相繼出現,甚至出現來不及堵漏洞的現象。全面、系統的學術規(guī)范教育、完善學術評價機制、加強學術立法等手段無法立竿見影且不易操作,比如學術規(guī)范道德建設就容易被操作成泛泛意義上的道德說教,學術評價容易被操作成重量不重質。
學術不端檢測是最易操作、也是當前最流行的一種基于計算機技術的學術不端防治手段,學術論文要想公開發(fā)表就必須通過檢測審核。經過10年的發(fā)展,檢測軟件在實踐中不斷進步,算法、操作、服務等方面均有所改進,但仍然存在一定的功能局限:第一,存在時間上的檢測盲區(qū)。收集論文存在一定程度的滯后性,無法檢測未及時上傳的、未能公開發(fā)表的或僅在一定范圍內公開發(fā)表的抄襲源文獻;第二,存在技術上的檢測盲區(qū)。檢測算法不夠智能,無法檢測翻譯的外文文獻,無法檢測表述方式變動、語序調整、同義詞替換等深層學術不端行為,只能避免“文字”抄襲而不能防止“思想”抄襲[21];第三,存在相似度判定盲區(qū)。不能區(qū)分必要自引、合理他引和抄襲,對作者正常、必要的自引一律判定為“重復”,會將引用權威著作、歷史材料、法律法規(guī)等情況判定為抄襲,將統一格式的醫(yī)學論文的前言、資料與方法、結果、討論等內容判定為抄襲[22],如此修改后有損論文整體內容結構,也浪費作者寶貴的時間和精力;第四,檢測軟件功能單一。檢測軟件只具備文本相似度檢測的功能,被檢測者有若干手段可繞過相似度檢測,缺乏論文選題、師生互動、學術積累等其他功能對學術行為的佐證;第五,檢測軟件只檢測結果,不檢測過程。對于篡改、偽造、剽竊數據、偽造輔證、實驗違規(guī)、提前發(fā)表不成熟的成果、不當署名、學術泄密這一類學術不端行為無能為力。
學術不端防治的道德規(guī)范、制度、法律和技術遏制等四種路徑在措施上存在不妥之處,且未能達成學術治理的良性互動,應用較為廣泛的學術不端檢測軟件也有著存在檢測盲區(qū)、檢測功能單一等局限,因此,學術不端行為得不到有效遏制。2018年5月,中共中央辦公廳、國務院辦公廳印發(fā)了《關于進一步加強科研誠信建設的若干意見》(以下簡稱《意見》),對進一步推進科研誠信制度化建設等方面做出部署。本文認為,升級技術遏制手段,全面系統地融入學術研究規(guī)范條例,延展檢測軟件的功能和使用范圍,在檢測前開展學術規(guī)范教育、檢測中增加檢測軟件的實用功能、檢測后建立學術信用數據庫,同時利用學術制度和學術立法來約束學術研究參與者在學術研究過程中的行為,是短期內防治學術不端行為的一個有效措施。
期刊編輯部應將已錄用未發(fā)表論文納入學術不端檢測源,甚至可進一步將該部分文獻提供給軟件公司或檢測機構,同時檢測軟件應在法律允許范圍內盡可能收集更多的灰色文獻資源作為檢測源,擴大比對數據量。對于科研院所、期刊編輯部等用戶來說,應利用多種檢測軟件分時段多次檢測,以避免單一檢測軟件數據收錄不全面的漏洞。此外,檢測軟件記錄了學者檢測過的學術成果以及檢測結果,學術成果可進一步擴充檢測數據源,檢測結果則可累積進而建立學者學術信用數據庫。《意見》第七條指出“科技部會同中國社科院建立完善覆蓋全國的自然科學和哲學社會科學科研誠信信息系統,對科研人員、相關機構、組織等的科研誠信狀況進行記錄”。我國至今仍未建立學術信用信息系統,相比歐美等發(fā)達國家差距較大。盡管建立學術信用數據庫需要有規(guī)范的學術信用評估標準和制度規(guī)范的信息收集及傳播途徑等前提條件保障[23],但就檢測軟件來說,其記錄的檢測結果數據可為一定范圍內的學術信用監(jiān)管和學術評價活動提供依據。
所謂的“降重技巧”往往隨著檢測軟件的升級而“升級”,它們試圖通過翻譯、替換同義詞、調整語序等方式來逃避檢測軟件的檢測,嚴重擾亂了學術秩序。檢測軟件的這種“不強大”也成為了一些人抵制學術不端軟件的理由。打鐵還需自身硬,檢測軟件應積極利用近年來蓬勃發(fā)展的人工智能技術來壯大自己,其中的跨語言檢測技術和語義識別技術等可幫助檢測軟件有效解決“思想抄襲”的問題。跨語言檢測通過語言規(guī)范化、候選文檔檢索、分類器訓練、剽竊行為分析等幾個步驟來進行跨語言相似性分析,該技術剛剛起步不久,國內外都正處于研究快速發(fā)展階段[24]。語義識別技術是通過對文獻的詞語解析、信息抽取、時間因果、情緒判斷等技術處理實現對文獻的語篇理解,能較好地識別替換同義詞、調整語序等學術不端行為。
學術不端檢測軟件的使用范圍越來越廣,涉及到學生畢業(yè)、學者論文發(fā)表、職稱評定、評獎評優(yōu)等學術活動的方方面面,因誤判而帶來的風險越來越大。檢測軟件應積極利用大數據技術,建立語料庫,充分進行數據訓練,提高相似度判定的準確率。首先,檢測軟件要能夠智能區(qū)分待檢測論文的學科并根據學科特點來判定待檢測論文的引用情況,疑似抄襲文字是否為權威著作、歷史材料、法律法規(guī)或名人名言,若有如此情況應不可判定為抄襲。其次,檢測軟件還可根據文獻類型對待檢測論文的文體特征進行分析,智能判定學術論文中是否提供研究的學術背景、前沿動態(tài),真實報道研究方法、研究步驟、研究結果、研究結論等內容,是否遵守包括題名、署名、摘要等在內的內容格式規(guī)范,以確保檢測論文符合學術形式規(guī)范要求。需要說明的是,人工智能的判定結果應再交予專家進一步鑒定,例如在學位論文檢測時,檢測軟件應提供文字復制比由導師介入判定是否存在學術不端行為;期刊編輯部檢測待發(fā)表論文時如發(fā)現論文相似度比例過高,應由編輯或審稿專家人工介入判定是否為抄襲行為。
《意見》第三條指出要“加強科研活動全流程誠信管理”。作為當前使用最為廣泛的學術治理軟件,如果將學術規(guī)范的相關規(guī)范條例貫穿到學術不端檢測軟件中去,學術不端檢測軟件深入到學術研究的各個環(huán)節(jié),不僅可以檢測學術研究結果,還可以監(jiān)督學術研究過程,研究成果和研究過程可以相互印證,相關學術評價活動也能夠依此開展過程評價而不再把預期目標和研究成果作為唯一的評價依據,可在一定程度上防止篡改、偽造、剽竊數據、不當署名等學術不端行為的發(fā)生。
在研究選題階段,可根據科研人員的公開發(fā)表論文和論文被引情況得到學術信息、科研能力和學術影響力,開發(fā)學術前沿發(fā)現功能,可協助學術新人進行研究選題;在文獻調研階段提供文獻管理功能,科研人員可將其搜集到的與待檢測論文相關的文獻分類標注存儲起來,一方面作為研究筆記;另一方面可為檢測提供參考依據;在研究方法選擇階段提供研究方法記錄功能,記錄下科研人員的研究方法,研究方法不同則研究步驟就不同,如研究方法與研究步驟不相匹配,則該論文必有瑕疵;在資料數據分析階段提供數據記錄功能,詳細記錄實驗過程及其數據,為其他研究人員驗證論文結果提供依據;在總結研究成果階段提供自動校對論文格式功能,能夠根據前期文獻積累和研究記錄、實驗數據等情況自動生成并校驗論文相關內容,同時根據論文參與人員的貢獻程度生成署名;在研究成果發(fā)表階段增加互動功能,記錄每一次的檢測記錄和作者修改記錄;在學術評價階段提供形式評價功能,根據成果的類型和形式制定評價標準并開展初步評價,為專家評審提供初步意見。
加強學術規(guī)范教育和學術規(guī)范意識養(yǎng)成是防范學術不端行為的重要手段?!兑庖姟返谖鍡l提出要“切實加強科研誠信的教育和宣傳”。由于種種原因限制,過往的多數科研誠信和學術規(guī)范教育多為口頭傳達,學生對于學術規(guī)范僅理解為“引文格式”“寫作規(guī)范”“規(guī)范標注”等,期刊編輯部大都要求與作者簽署版權協議和責任聲明,其中包含作者杜絕學術不端行為的承諾,但實際上大多數流于形式,沒有真正起到防范作用[25]。學術不端檢測軟件是所有學生和學者在學術成果發(fā)表之前必須使用的軟件,可在檢測軟件的訪問界面上提供學術規(guī)范自主學習平臺,內容包括科研誠信、道德修養(yǎng)、政策法規(guī)、研究規(guī)范、寫作規(guī)范等,提供在線閱讀、視頻觀看、案例分析、在線練習等功能,作者需完成一定時長的學術規(guī)范學習或通過學術規(guī)范測試后方可使用檢測軟件。
學術規(guī)范是每一位科研人員所必須進行的“規(guī)定動作”,科研人員遵守學術規(guī)范,所進行的學術研究才有價值,才能與國內外同行進行有效的交流,才能促進學術創(chuàng)新和知識增長[26]。盡管目前國內相關學術不端檢測軟件存在各種缺點,但作為學術不端治理的技術遏制手段之一,也發(fā)揮了其應有的作用。本文分析了學術不端檢測軟件的功能和局限以及學術研究規(guī)范在學術不端防治技術手段中的有限應用,探討如何將學術不端檢測軟件深入到學術研究過程中去,提出學術不端行為防治規(guī)范化和流程化措施建議,為我國學術不端行為的防范與治理提供思路借鑒。