□文│叢立先
相似度檢測,是指通過一定方式檢測學(xué)術(shù)論文或?qū)I(yè)文章在內(nèi)容上的重合或相似程度,一般通過軟件檢測自動(dòng)完成,可形成包含引用率、復(fù)制比、自寫率及不正常引用內(nèi)容標(biāo)示等信息的檢測報(bào)告,又被稱為文章查重、相似率檢測、重合度檢測、復(fù)制比檢測、重復(fù)率檢測、學(xué)術(shù)不端檢測、學(xué)術(shù)抄襲檢測,等等。相似度檢測是隨著互聯(lián)網(wǎng)的興起而發(fā)展起來的現(xiàn)象,互聯(lián)網(wǎng)內(nèi)容尤其是論文文章的集聚、數(shù)據(jù)庫的不斷發(fā)展完善、受眾群體的大量需求,是相似度檢測產(chǎn)生的三大決定性因素。這三個(gè)因素不但為相似度檢測提供了可行的基礎(chǔ)條件,也為其提供了發(fā)展壯大的市場條件。一方面,高校、科研院所、學(xué)術(shù)期刊出版單位將相似度檢測作為論文審核的必備事項(xiàng),有的論文即因相似度過高而被否定,而有的創(chuàng)作者為求順利達(dá)標(biāo)則提前自行購買相似度檢測服務(wù)。另一方面,開展相似度檢測的網(wǎng)站、數(shù)據(jù)庫等公司主動(dòng)迎合上述單位和個(gè)人的相似度檢測需求,將相似度檢測當(dāng)成高盈利的生意來做。實(shí)際上,相似度檢測的大行其道,在帶來積極效果的同時(shí),亦引發(fā)了很多問題,非常值得我們從其學(xué)術(shù)意義、版權(quán)意義和社會(huì)意義三個(gè)角度加以審視。
時(shí)下,我國高?;旧隙紝?duì)本校的畢業(yè)論文提出了論文相似度檢測的要求,有的高校規(guī)定為不超過30%,有的高校規(guī)定為不超過20%,還有的高校規(guī)定為不超過15%,個(gè)別高校甚至規(guī)定為10%以下。與此相似,學(xué)術(shù)期刊出版單位通常也有論文相似度檢測的要求,要求的標(biāo)準(zhǔn)也是不一而足。應(yīng)該說,從學(xué)術(shù)意義的角度看,相似度檢測具有相當(dāng)?shù)姆e極性,有助于創(chuàng)作者學(xué)術(shù)素養(yǎng)、能力和水平的提升,有助于學(xué)位論文、期刊論文等研究成果的質(zhì)量提升,有助于學(xué)術(shù)成果信息環(huán)境的創(chuàng)建和改善。但同時(shí),相似度檢測的消極意義亦不容忽視,主要體現(xiàn)為檢測系統(tǒng)不可避免的技術(shù)缺陷會(huì)降低學(xué)術(shù)成果信息、學(xué)術(shù)素養(yǎng)的控制效果,檢測結(jié)果過于依賴復(fù)制比的不合理應(yīng)用降低學(xué)術(shù)成果信息質(zhì)量的管控力度,檢測機(jī)構(gòu)的管理不到位和檢測監(jiān)管不嚴(yán)加深檢測系統(tǒng)缺陷及檢測結(jié)果不當(dāng)使用的負(fù)面影響。[1]并且,在實(shí)踐過程中,部分學(xué)術(shù)和出版機(jī)構(gòu)對(duì)于相似度檢測的理解陷入了誤區(qū),過于依賴相似度檢測,甚至認(rèn)為檢測出來的相似度越低,論文質(zhì)量越高,將檢測結(jié)果報(bào)告中標(biāo)明的相似內(nèi)容或重合內(nèi)容徑行認(rèn)定為學(xué)術(shù)失范、學(xué)術(shù)不端或抄襲。
實(shí)際上,學(xué)術(shù)失范和學(xué)術(shù)不端的概念界定、包含的具體行為都非常寬泛,而抄襲則是一種確定的學(xué)術(shù)概念或法律概念,是一種具體的行為類型。有學(xué)者認(rèn)為:從語義上分析,學(xué)術(shù)不端重于學(xué)術(shù)失范,學(xué)術(shù)失范主要指學(xué)者違背學(xué)術(shù)規(guī)范所犯下的技術(shù)性過失,學(xué)術(shù)不端主要指學(xué)者涉及抄襲、剽竊的不良行為,也指學(xué)者惡意的一稿多投行為。[2]簡而言之,學(xué)術(shù)失范是應(yīng)予糾正的不規(guī)范行為,學(xué)術(shù)不端是需要預(yù)防和懲治的錯(cuò)誤或違法行為,一般體現(xiàn)為偽造、篡改、抄襲等各種行為。而抄襲則是學(xué)術(shù)不端當(dāng)中的一種性質(zhì)較為嚴(yán)重并須承擔(dān)學(xué)術(shù)和版權(quán)責(zé)任的具體行為類型,抄襲認(rèn)定問題將在下文相似度檢測的版權(quán)意義中詳述。
關(guān)于學(xué)術(shù)不端與抄襲的關(guān)系,可以從教育部《高等學(xué)校預(yù)防與處理學(xué)術(shù)不端行為辦法》第二十七條所列舉規(guī)定的學(xué)術(shù)不端的具體類型看出端倪:“下列行為之一應(yīng)當(dāng)認(rèn)定為構(gòu)成學(xué)術(shù)不端行為:(一)剽竊、抄襲、侵占他人學(xué)術(shù)成果;(二)篡改他人研究成果;(三)偽造科研數(shù)據(jù)、資料、文獻(xiàn)、注釋,或者捏造事實(shí)、編造虛假研究成果;(四)未參加研究或創(chuàng)作而在研究成果、學(xué)術(shù)論文上署名,未經(jīng)他人許可而不當(dāng)使用他人署名,虛構(gòu)合作者共同署名,或者多人共同完成研究而在成果中未注明他人工作、貢獻(xiàn);(五)在申報(bào)課題、成果、獎(jiǎng)勵(lì)和職務(wù)評(píng)審評(píng)定、申請(qǐng)學(xué)位等過程中提供虛假學(xué)術(shù)信息;(六)買賣論文、由他人代寫或者為他人代寫論文;(七)其他根據(jù)高等學(xué)?;蛘哂嘘P(guān)學(xué)術(shù)組織、相關(guān)科研管理機(jī)構(gòu)制定的規(guī)則,屬于學(xué)術(shù)不端的行為?!倍袊茖W(xué)院《關(guān)于加強(qiáng)科研行為規(guī)范建設(shè)的意見》將科學(xué)不端行為概括為6項(xiàng)行為:編造數(shù)據(jù)或虛假陳述等學(xué)術(shù)科研造假、抄襲或侵害他人著作權(quán)、一稿多投或改頭換面發(fā)表、騙取經(jīng)費(fèi)或隱瞞濫用科研信息資源等違反社會(huì)道德、非法利用他人學(xué)術(shù)研究信息、故意干擾或妨礙他人的研究活動(dòng)。
由上可知,學(xué)術(shù)失范、學(xué)術(shù)不端和抄襲各有不同的界定和指向,可能都和相似度檢測有關(guān)系,但都不能簡單地以相似度檢測作為界定和衡量的唯一標(biāo)準(zhǔn)或決定性標(biāo)準(zhǔn)。我們并不能否定相似度檢測在學(xué)術(shù)失范、學(xué)術(shù)不端和抄襲認(rèn)定當(dāng)中的實(shí)際作用,一些低級(jí)抄襲、明顯的學(xué)術(shù)失范和學(xué)術(shù)不端行為,相似度檢測不但能發(fā)揮及時(shí)發(fā)現(xiàn)的作用,也能作為認(rèn)定的事實(shí)依據(jù)。但是,一些相對(duì)復(fù)雜的學(xué)術(shù)失范和學(xué)術(shù)不端行為,例如改頭換面式的高級(jí)抄襲,或者一些與前期成果有著共同話題和關(guān)鍵詞的創(chuàng)新成果,相似度檢測往往無法做出準(zhǔn)確的檢測,甚至出現(xiàn)檢測結(jié)果的誤判。相似度檢測的工作原理其實(shí)就是將被檢測作品與基礎(chǔ)數(shù)據(jù)庫進(jìn)行內(nèi)容復(fù)制比對(duì)和分析,基礎(chǔ)數(shù)據(jù)庫的數(shù)據(jù)資料翔實(shí)與否,比對(duì)和分析的方法科學(xué)與否,是制約相似度檢測科學(xué)性的兩大核心要素。我們可以以中國知網(wǎng)生成的文本復(fù)制檢測報(bào)告的參數(shù)指標(biāo)來具體分析基礎(chǔ)數(shù)據(jù)庫與比對(duì)分析方法。從基礎(chǔ)數(shù)據(jù)庫來看,相似度檢測的數(shù)據(jù)來源一般可能收納學(xué)術(shù)期刊論文或期刊文章網(wǎng)絡(luò)版數(shù)據(jù)庫、博士碩士等學(xué)位論文全文數(shù)據(jù)庫、會(huì)議論文全文數(shù)據(jù)庫、報(bào)紙全文數(shù)據(jù)庫、專利文書全文數(shù)據(jù)庫、外文文獻(xiàn)全文數(shù)據(jù)庫、互聯(lián)網(wǎng)文檔資源、圖書資源等。但是,囿于授權(quán)渠道和版權(quán)問題等因素所限,外文資料、圖書資源不能有效保證大數(shù)量的納入,互聯(lián)網(wǎng)文檔資料的可靠性也無法保證,因此基礎(chǔ)數(shù)據(jù)庫的完備程度尚需客觀理性評(píng)價(jià)。從比對(duì)和分析的方法來看,通過軟件的程序和算法,將被檢測作品與基礎(chǔ)數(shù)據(jù)庫內(nèi)容進(jìn)行比對(duì)和分析后,得出總文字復(fù)制比(被檢測文章總重合字?jǐn)?shù)在總字?jǐn)?shù)中所占的比例)、去除引用文獻(xiàn)復(fù)制比(去除系統(tǒng)識(shí)別為引用的文獻(xiàn)后,計(jì)算出來的重合字?jǐn)?shù)在總字?jǐn)?shù)中所占的比例)、去除本人已發(fā)表文獻(xiàn)復(fù)制比(去除作者本人已發(fā)表文獻(xiàn)后,計(jì)算出來的重合字?jǐn)?shù)在總字?jǐn)?shù)中所占的比例)等指標(biāo)。上述指標(biāo)一般是由各檢測機(jī)構(gòu)的軟件系統(tǒng)根據(jù)自身設(shè)定的不端行為界定標(biāo)準(zhǔn)自動(dòng)生成,存在的問題是軟件系統(tǒng)往往很難將處于公有領(lǐng)域的內(nèi)容有效排除,對(duì)于關(guān)鍵詞和基本表述相同、但思想的表達(dá)又有實(shí)質(zhì)區(qū)別的內(nèi)容會(huì)誤判為復(fù)制,關(guān)于復(fù)制比的設(shè)置不合理,沒有分門別類針對(duì)不同的文章類型進(jìn)行特定化比對(duì)和分析,比如小說類虛擬作品和說明書式的文字作品的比對(duì)和分析方法應(yīng)該是完全不同的。所以,我們不但要對(duì)相似度檢測的學(xué)術(shù)意義加以客觀對(duì)待,相似度檢測機(jī)構(gòu)還應(yīng)結(jié)合上述問題和缺陷不斷改進(jìn)和完善軟件系統(tǒng)。總的來看,我們?cè)谶x擇論文相似度檢測工具的比對(duì)數(shù)據(jù)類型時(shí),可以遵循“全面建設(shè)、重點(diǎn)保障”的原則。一方面,不斷豐富比對(duì)數(shù)據(jù)類型,全方位預(yù)防學(xué)術(shù)不端行為;另一方面,重點(diǎn)收錄引用或非典型性引用甚至可能的抄襲出現(xiàn)頻率較高的文獻(xiàn)類型,對(duì)其進(jìn)行重點(diǎn)防治。[3]
相似度檢測結(jié)果對(duì)于學(xué)術(shù)評(píng)價(jià)具有一定作用,但由于其并沒有形成確定性的評(píng)價(jià)標(biāo)準(zhǔn),因此,對(duì)于學(xué)術(shù)評(píng)價(jià)真正起作用的相似度檢測結(jié)果,還要與版權(quán)責(zé)任的認(rèn)定聯(lián)系起來。從版權(quán)責(zé)任的角度看,相似度檢測雖然會(huì)標(biāo)識(shí)出來具體重合或相似的內(nèi)容,但并不能按照版權(quán)法的需要科學(xué)性地甄別有版權(quán)保護(hù)和無版權(quán)保護(hù)的內(nèi)容,通常只是簡單地以內(nèi)容重合或相似的數(shù)量來計(jì)算出重合率或相似率,這在版權(quán)責(zé)任的認(rèn)定上有著明顯缺陷或瑕疵。
由于相似度檢測系統(tǒng)設(shè)計(jì)的局限性,很多情況會(huì)造成誤判,將公共領(lǐng)域的知識(shí)和信息作為版權(quán)保護(hù)的私權(quán)禁止他人利用,動(dòng)輒冠以復(fù)制、抄襲之名。并且,由于沒有細(xì)分科技期刊的學(xué)科門類,導(dǎo)致不同學(xué)科之間用一種尺度來衡量時(shí)出現(xiàn)誤判以致得出比較荒謬的結(jié)論。另外,作者通過比對(duì)系統(tǒng)替換同義詞、近義詞、改變句式結(jié)構(gòu)等手法規(guī)避雷同,檢測系統(tǒng)卻無能為力。[4]實(shí)際上,在目前的技術(shù)水平和基礎(chǔ)條件下,軟件系統(tǒng)自動(dòng)完成的相似度檢測結(jié)果可能會(huì)成為發(fā)現(xiàn)版權(quán)侵權(quán)的線索,也可能會(huì)作為版權(quán)侵權(quán)的認(rèn)定證據(jù)被使用,但絕不能成為認(rèn)定侵權(quán)的結(jié)論性依據(jù)。一些相似度檢測機(jī)構(gòu)出具的檢測報(bào)告上關(guān)于疑似抄襲或剽竊的指標(biāo)只能作為版權(quán)責(zé)任認(rèn)定的參考因素而不能作為版權(quán)責(zé)任認(rèn)定的事實(shí)和法律依據(jù)。另外,在對(duì)待相似度檢測的重合率或相似率時(shí),還要把握好重合或相似內(nèi)容的剽竊認(rèn)定與合理借鑒再創(chuàng)作的關(guān)系,重合率或相似率高并不一定是剽竊,亦有可能是合理借鑒之下的再創(chuàng)作。究竟是構(gòu)成剽竊的版權(quán)侵權(quán)還是學(xué)術(shù)不端或?qū)W術(shù)失范,認(rèn)定程序和責(zé)任后果均應(yīng)由司法機(jī)構(gòu)、行政機(jī)構(gòu)或其他有職權(quán)的專業(yè)機(jī)構(gòu)基于專業(yè)人工分析比對(duì)作出判斷,這里所說的其他有職權(quán)的專業(yè)機(jī)構(gòu)一般指被指控對(duì)象的任職單位、學(xué)位頒發(fā)單位組織成立的學(xué)術(shù)評(píng)價(jià)機(jī)構(gòu)。
在版權(quán)法意義上,相似度檢測可能關(guān)聯(lián)的版權(quán)侵權(quán)責(zé)任一般包括抄襲和剽竊的版權(quán)責(zé)任、非法改編的版權(quán)責(zé)任。關(guān)于抄襲和剽竊,中文語義下前者側(cè)重于形式的竊取,而后者側(cè)重于思想的竊取。西方語義下抄襲和剽竊都表達(dá)為“plagiarism”,此概念主要來源于拉丁語“plagiare”,意思是“誘拐”。[5]我國《著作權(quán)法》最初將兩個(gè)名詞均寫入立法中,后來在實(shí)踐中認(rèn)為抄襲和剽竊的著作權(quán)法含義應(yīng)該是相同的,對(duì)此國家版權(quán)局在1999 年發(fā)布的《關(guān)于如何認(rèn)定抄襲行為的答復(fù)》中作了規(guī)定:“著作權(quán)法所稱抄襲、剽竊是同一概念,指將他人作品或者作品的片段竊為己有發(fā)表。從抄襲的形式看,有原封不動(dòng)或者基本原封不動(dòng)地復(fù)制他人作品的行為,也有經(jīng)改頭換面后將他人受著作權(quán)保護(hù)的獨(dú)創(chuàng)成分竊為己有的行為,前者在著作權(quán)執(zhí)法領(lǐng)域被稱為低級(jí)抄襲,后者被稱為高級(jí)抄襲。” 相較于低級(jí)抄襲,高級(jí)抄襲的認(rèn)定要更為復(fù)雜。但無論如何,相似度檢測結(jié)果的復(fù)制比和重合字?jǐn)?shù)對(duì)于版權(quán)法上的剽竊侵權(quán)認(rèn)定來說并不是決定性的。剽竊的認(rèn)定,是具有認(rèn)定職權(quán)的機(jī)構(gòu)以內(nèi)容重合或構(gòu)成實(shí)質(zhì)性相似來進(jìn)行認(rèn)定。判斷兩個(gè)作品是否構(gòu)成實(shí)質(zhì)性相似,司法實(shí)踐中一般以“抽象過濾分析”結(jié)合“綜合比對(duì)”來進(jìn)行專業(yè)判斷,這方面的司法實(shí)踐案例及經(jīng)驗(yàn)分析很多,對(duì)此不予贅述。并且,版權(quán)法上所指的內(nèi)容重合或?qū)嵸|(zhì)性相似是指兩個(gè)作者的兩個(gè)作品的情況。由此,即便是相似度檢測出來的復(fù)制比為100%的情況,也就是一篇文章與另一篇文章內(nèi)容完全重復(fù),也不能徑行認(rèn)定為剽竊。從版權(quán)責(zé)任的角度看,這種情況下也有極端的例外情況不需要承擔(dān)版權(quán)責(zé)任,那就是版權(quán)法規(guī)制的只是剽竊他人作品的行為,而抄襲自己的行為并不在版權(quán)法規(guī)制的范圍內(nèi),即通常所說的“抄自己不算抄”。當(dāng)然,這種現(xiàn)象因不是版權(quán)法的規(guī)制對(duì)象從而沒有版權(quán)責(zé)任,并不代表其沒有不利后果,其作為學(xué)術(shù)不端情況中的一種,需要承擔(dān)學(xué)術(shù)不端的懲戒后果。關(guān)于非法改編的版權(quán)責(zé)任,是指未經(jīng)原作品權(quán)利人的許可而改變?cè)髌凡?chuàng)作出具有獨(dú)創(chuàng)性的新作品從而引起的版權(quán)責(zé)任,非法改編的情況下只承擔(dān)民事責(zé)任,而且只承擔(dān)著作財(cái)產(chǎn)權(quán)的侵權(quán)責(zé)任,一般不承擔(dān)賠禮道歉等著作人身權(quán)的侵權(quán)責(zé)任。這與剽竊的版權(quán)責(zé)任有所不同,剽竊的版權(quán)責(zé)任是一般情況下需要承擔(dān)停止侵權(quán)、消除影響、賠禮道歉、賠償損失的全面彌補(bǔ)人身權(quán)和財(cái)產(chǎn)權(quán)損害的民事責(zé)任,在抄襲的同時(shí)并大量復(fù)制、發(fā)行、信息網(wǎng)絡(luò)傳播等特殊情況下,還可能會(huì)引起行政責(zé)任和刑事責(zé)任。
本文所說的相似度檢測的社會(huì)意義,是指提供相似度檢測服務(wù)的數(shù)據(jù)庫制作者(數(shù)據(jù)庫權(quán)利持有者)基于公共利益的需要應(yīng)該承擔(dān)必要的社會(huì)責(zé)任。相似度檢測服務(wù)的立身之本是數(shù)據(jù)庫,對(duì)于數(shù)據(jù)庫的權(quán)益保護(hù),一般有版權(quán)保護(hù)、反不正當(dāng)競爭法保護(hù)及特殊權(quán)利保護(hù)三種方式。我國和世界上提供數(shù)據(jù)庫權(quán)益保護(hù)的多數(shù)國家,都采取了前兩種保護(hù)方式,歐盟及其成員國則提供了上述三種方式的保護(hù),即歐盟通過《數(shù)據(jù)保護(hù)指令》為數(shù)據(jù)庫設(shè)定了一種特殊權(quán)利加以保護(hù)。
相似度檢測服務(wù)不只是一種商業(yè)服務(wù),更是一種社會(huì)公共服務(wù)。用于相似度檢測的數(shù)據(jù)庫,不只是一種具有私權(quán)利益的數(shù)據(jù)庫,更是一種公共知識(shí)資源數(shù)據(jù)庫。此種社會(huì)公共服務(wù)屬性很強(qiáng)的公共資源數(shù)據(jù)庫,其形成往往借助于公共機(jī)構(gòu)的助力,其產(chǎn)品具有較強(qiáng)的社會(huì)公共屬性,其服務(wù)對(duì)象具有社會(huì)廣泛性,其價(jià)值也包含了較強(qiáng)的社會(huì)價(jià)值。因此,對(duì)于相似度檢測及其基礎(chǔ)數(shù)據(jù)庫,我們并不能等同于一般的數(shù)據(jù)資源服務(wù),給予過度的私權(quán)利保護(hù)。過度的權(quán)利保護(hù)可能帶來權(quán)利濫用。數(shù)據(jù)庫制作者濫用權(quán)利的壟斷行為可被歸為兩種類型:訂立“獨(dú)家授權(quán)協(xié)議”的限制競爭性協(xié)議和濫用市場支配地位。訂立“獨(dú)家授權(quán)協(xié)議”是將數(shù)據(jù)庫中收錄的作品通過版權(quán)協(xié)議形式進(jìn)行獨(dú)占利用,以達(dá)到排除市場競爭的目的。濫用市場支配地位主要包括:不正當(dāng)?shù)拇_定、改變或維持價(jià)格;附加不合理交易條件;不正當(dāng)?shù)馗缮嫫涫褂谜叩恼=?jīng)營活動(dòng);在相同的交易情形下,不公正地對(duì)交易當(dāng)事人給予不同的交易條件。[6]在線學(xué)術(shù)資源的商業(yè)壟斷,本質(zhì)上是出版商利用網(wǎng)絡(luò)平臺(tái)壟斷性經(jīng)營科學(xué)知識(shí)產(chǎn)品,而論文發(fā)表過程中版權(quán)的轉(zhuǎn)移則是形成這種壟斷的重要條件。[7]
研究表明,數(shù)據(jù)庫商(即上文所述數(shù)據(jù)庫制作者、數(shù)據(jù)庫權(quán)利持有者)通過期刊收錄鎖定了作者和期刊出版者。數(shù)據(jù)庫商通過數(shù)據(jù)庫購買鎖定了科研機(jī)構(gòu)和公共圖書館。數(shù)據(jù)庫商通過學(xué)術(shù)不端檢測鎖定了期刊出版者,尤其是權(quán)威性較低的或新辦的期刊。這一結(jié)論說明期刊數(shù)據(jù)庫發(fā)展僅依靠市場機(jī)制不但不能消除壟斷,反而還會(huì)加強(qiáng)其壟斷地位。要治理數(shù)據(jù)庫商的壟斷行為,政府產(chǎn)業(yè)政策的干預(yù)是必要的: 要抑制期刊的“獨(dú)家授權(quán)”;要鼓勵(lì)高校的自辦期刊轉(zhuǎn)向開放獲取,推進(jìn)第三方平臺(tái)整合資源;由政府出資建立專題期刊公共數(shù)據(jù)庫,降低商業(yè)數(shù)據(jù)庫的期刊版權(quán)擁有量。[8]這其中,構(gòu)建科學(xué)合理、良性健康的版權(quán)利用機(jī)制是核心和關(guān)鍵。一方面,用于相似度檢測的基礎(chǔ)數(shù)據(jù)庫的構(gòu)建及其后續(xù)版權(quán)資源的獲取應(yīng)該按照版權(quán)法要求的授權(quán)許可模式來進(jìn)行。期刊文章、期刊論文、學(xué)位論文、會(huì)議論文、報(bào)紙文章、受保護(hù)的文書、外文文獻(xiàn)、受保護(hù)的互聯(lián)網(wǎng)文檔、圖書、內(nèi)部資料等版權(quán)資源的有效獲取,不但是前期數(shù)據(jù)庫構(gòu)建的保證,也是后期數(shù)據(jù)庫建設(shè)的保障。我國部分知識(shí)資源數(shù)據(jù)庫在前期構(gòu)建時(shí),并沒有完全按照版權(quán)授權(quán)的規(guī)范模式進(jìn)行操作,這種版權(quán)原罪因歷史和客觀因素一定程度上可以被諒解,但不能再成為今后進(jìn)一步發(fā)展的版權(quán)罪孽。另一方面,數(shù)據(jù)庫利用中版權(quán)商業(yè)利益與社會(huì)利益的兼顧非常重要。即便是普通的出版者,一以貫之的一項(xiàng)重要原則就是經(jīng)濟(jì)效益和社會(huì)效益的兼顧,更何況社會(huì)服務(wù)屬性很強(qiáng)的知識(shí)資源數(shù)據(jù)庫制作者。具體說來,數(shù)據(jù)庫制作者除了基于版權(quán)保護(hù)、反不正當(dāng)競爭法保護(hù)享有權(quán)益,不應(yīng)從事反壟斷法上禁止的通過獨(dú)家授權(quán)協(xié)議方式限制競爭、濫用市場支配地位行為,以保證社會(huì)公眾作為數(shù)據(jù)庫使用者的權(quán)益。并且,數(shù)據(jù)庫制作者不得侵犯數(shù)據(jù)庫中作品權(quán)利人的權(quán)利,保證數(shù)據(jù)庫中的作品著作權(quán)人獲得充分、及時(shí)、有效的版權(quán)利益。也就是說,數(shù)據(jù)庫制作者不但要建立構(gòu)建數(shù)據(jù)庫取得作品版權(quán)授權(quán)的渠道和鏈條,還應(yīng)建立數(shù)據(jù)庫產(chǎn)生收益后的版權(quán)利益分配渠道和鏈條。這其中,各種作品的出版者和收集者扮演著十分重要的角色。作品的出版者和收集者應(yīng)將自身權(quán)益與作者緊密捆綁從而完成價(jià)值實(shí)現(xiàn),而不是為了小利益而通過稿件采納格式條款迫使作者一定程度放棄版權(quán)權(quán)利從而為數(shù)據(jù)庫收錄創(chuàng)造不對(duì)等的便利。而且從長遠(yuǎn)看,要鼓勵(lì)知識(shí)資源數(shù)據(jù)庫的市場化競爭發(fā)展,鼓勵(lì)學(xué)術(shù)知識(shí)資源數(shù)據(jù)庫的開放獲取和利用,從根本上消除少數(shù)數(shù)據(jù)庫制作者壟斷網(wǎng)絡(luò)學(xué)術(shù)知識(shí)資源服務(wù)的不利局面,消除知識(shí)傳播阻礙,營造開放進(jìn)步的知識(shí)資源版權(quán)利用環(huán)境。
互聯(lián)網(wǎng)技術(shù)快速發(fā)展帶動(dòng)的數(shù)字化作品的聚合、數(shù)據(jù)庫的不斷完善、算法軟件的不斷進(jìn)步,為相似度檢測提供了現(xiàn)實(shí)基礎(chǔ)。社會(huì)對(duì)于原創(chuàng)知識(shí)成果檢驗(yàn)的需求,為相似度檢測提供了蓬勃發(fā)展的市場條件。應(yīng)運(yùn)而生的相似度檢測由此成為了一種較為熱門的社會(huì)服務(wù)?,F(xiàn)階段的相似度檢測,囿于基礎(chǔ)數(shù)據(jù)庫內(nèi)容資源的有限性、比對(duì)與分析方法的局限性,其檢測結(jié)果并不能作為學(xué)術(shù)評(píng)價(jià)的決定性標(biāo)準(zhǔn),更不能作為版權(quán)責(zé)任認(rèn)定的結(jié)論性依據(jù)。當(dāng)然,相似度檢測并非毫無意義,其可以作為學(xué)術(shù)評(píng)價(jià)的參考,可以作為發(fā)現(xiàn)版權(quán)侵權(quán)的線索,可以作為版權(quán)責(zé)任認(rèn)定的證據(jù)。
說到底,相似度檢測仍然是人類的工具和可控的機(jī)器,檢測結(jié)果是否具有實(shí)際意義的最終決定權(quán)仍要由“人本”來決定。人類的科學(xué)利用和規(guī)范使用,會(huì)使得相似度檢測服務(wù)發(fā)揮積極意義和實(shí)際作用,而盲目夸大其作用并過度依賴其自動(dòng)生成的檢測結(jié)果,則會(huì)帶來適得其反的不利后果。所以,我們不但要警惕相似度檢測的學(xué)術(shù)評(píng)價(jià)能力,還要清醒認(rèn)識(shí)相似度檢測的版權(quán)責(zé)任意義,并要從公共利益的角度深刻理解相似度檢測數(shù)據(jù)庫的社會(huì)服務(wù)。版權(quán)作為知識(shí)產(chǎn)權(quán)的一種重要類型,同樣有著公共利益屬性,版權(quán)資源利用不當(dāng)?shù)脑?,亦有可能產(chǎn)生權(quán)利濫用的現(xiàn)象。相似度檢測數(shù)據(jù)庫作為知識(shí)資源數(shù)據(jù)庫,除了實(shí)現(xiàn)商業(yè)利益的目的,還應(yīng)該承擔(dān)必要的社會(huì)公共服務(wù)職能,因此,應(yīng)從制度和規(guī)則上促使相似度檢測服務(wù)健全良性版權(quán)利用機(jī)制,避免形成危害社會(huì)公共利益的壟斷現(xiàn)象。
注釋:
[1] 葉磊,婁策群.論文檢測對(duì)學(xué)術(shù)成果信息生態(tài)系統(tǒng)健康的影響及優(yōu)化策略[J] .現(xiàn)代情報(bào),2017(6)
[2] 曹樹基.學(xué)術(shù)不端行為:概念及懲治[J] .社會(huì)科學(xué)論壇,2005(3)
[3] 蔣勇青,劉芳,于洋.學(xué)術(shù)文獻(xiàn)相似性檢測比對(duì)資源應(yīng)用分析與建設(shè)策略探究[J] .數(shù)字圖書館論壇,2017(12)
[4] 陳燕,丁嵐.學(xué)術(shù)不端檢測系統(tǒng)缺陷分析[J] .中國出版,2014(8)
[5] Shukla A, Maurya SK. Plagiarism Detection and Avoidance Consequences in Academic World[J] .J Adv Res Lib Inform Sci 2017,4(4)
[6] 馮偉.數(shù)據(jù)庫特殊權(quán)利濫用的反壟斷法規(guī)制[J] .電子知識(shí)產(chǎn)權(quán),2003(6)
[7] 丁大尉.場域理論視角下數(shù)字知識(shí)資源的壟斷與反壟斷[J] .自然辯證法研究,2019(1)
[8] 雷兵,鐘鎮(zhèn).社會(huì)福利視角下中文期刊數(shù)據(jù)庫定價(jià)機(jī)制分析與策略建議[J] .中國科技期刊研究,2018(10)