余瑞芬?朱丹
【摘要】? 當(dāng)下,算法在學(xué)術(shù)評(píng)價(jià)中具有較大影響,引發(fā)了使用檢測(cè)報(bào)告時(shí)人與技術(shù)誰是主宰的爭(zhēng)辯。從應(yīng)用特征來看,算法具有不透明性、局限性及權(quán)力擴(kuò)張化等特點(diǎn),誘發(fā)了其與著作權(quán)法的深層次不融合。要解決因算法權(quán)力擴(kuò)張而形成的制度適應(yīng)問題,就要以著作權(quán)法為出發(fā)點(diǎn)去考量算法,細(xì)分比對(duì)庫(kù)的文類,拓寬識(shí)別對(duì)象,從作者自覺遵守學(xué)術(shù)論文規(guī)范和他人有效監(jiān)督兩方面,讓學(xué)術(shù)論文評(píng)價(jià)回歸社群自治。
【關(guān)? 鍵? 詞】著作權(quán);學(xué)術(shù)論文;相似度檢測(cè);算法
【作者單位】余瑞芬,江西科技學(xué)院教育學(xué)院;朱丹,江科學(xué)術(shù)研究編輯部。
【中圖分類號(hào)】D923.41 【文獻(xiàn)標(biāo)識(shí)碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2021.19.021
隨著互聯(lián)網(wǎng)的興起與發(fā)展,各大知識(shí)資源數(shù)據(jù)庫(kù)相繼開發(fā)了相似度檢測(cè)系統(tǒng),這類系統(tǒng)通過算法計(jì)算得出檢測(cè)報(bào)告。在評(píng)價(jià)學(xué)術(shù)論文時(shí),這些報(bào)告被視為重要的甚至決定性的標(biāo)準(zhǔn)。算法檢測(cè)之所以成為主流,很大程度上是因?yàn)閿?shù)字便利化產(chǎn)生的積極效應(yīng),但也引發(fā)了很多問題。探討算法檢測(cè)引發(fā)的問題,對(duì)于探索我國(guó)學(xué)術(shù)論文評(píng)價(jià)路徑優(yōu)化是一項(xiàng)重要課題。
一、著作權(quán)法視角下算法檢測(cè)的考量
本文定位于算法本身,從相似度檢測(cè)、反檢測(cè)考量、數(shù)字痕跡處理三個(gè)角度去反觀著作權(quán)法視角下的算法檢測(cè)。
1.相似度檢測(cè)與作品獨(dú)創(chuàng)性認(rèn)定有偏差
新出臺(tái)的論文行業(yè)標(biāo)準(zhǔn)對(duì)相關(guān)術(shù)語(yǔ)進(jìn)行了定義,認(rèn)定標(biāo)準(zhǔn)更加細(xì)致實(shí)用。但在實(shí)際操作中,高校和期刊需要更為便捷高效的評(píng)價(jià)方法,比如很多高校評(píng)價(jià)學(xué)位論文時(shí)習(xí)慣使用算法檢測(cè)方法,以初步篩查人工答辯的范圍,這極容易造成一些不良后果。首先,為了保證比對(duì)庫(kù)作品的“質(zhì)”和“量”,相關(guān)機(jī)構(gòu)試圖積累各種“充分?jǐn)?shù)據(jù)”,擴(kuò)大超文本和“數(shù)據(jù)湖”容量,這使得各資源庫(kù)陷入無序的市場(chǎng)競(jìng)爭(zhēng)中。其次,以連續(xù)多個(gè)字為單位,待檢測(cè)論文被分解成無數(shù)小單位,這在一定程度上破壞了作品的思想獨(dú)創(chuàng)性。
當(dāng)下,算法檢測(cè)越來越多地被作為學(xué)術(shù)論文評(píng)價(jià)的手段,但這與作品獨(dú)創(chuàng)性認(rèn)定原則有偏差?!蹲罡呷嗣穹ㄔ宏P(guān)于審理著作權(quán)民事糾紛案件適用法律若干問題的解釋》第15條規(guī)定了獨(dú)創(chuàng)性需滿足兩個(gè)條件:其一,是否由作者獨(dú)立完成;其二,是否具備“創(chuàng)作屬性”。就第一個(gè)條件來看,數(shù)據(jù)學(xué)習(xí)和分析使人們的關(guān)注點(diǎn)集中在檢測(cè)結(jié)果本身,作者的創(chuàng)作過程得不到應(yīng)有的重視,在網(wǎng)絡(luò)空間里,“獨(dú)立完成作品”這個(gè)條件很難論證;就第二個(gè)條件來看,檢測(cè)機(jī)構(gòu)最終提供一份數(shù)據(jù)報(bào)告,以規(guī)定的重復(fù)率為標(biāo)準(zhǔn),這使得作者的創(chuàng)作行為不再具有原本意義上的創(chuàng)作屬性。
2.“反檢測(cè)”考量異化了表達(dá)規(guī)則
本文所說的“反檢測(cè)”考量是指在相似度檢測(cè)的前提下,作者對(duì)檢測(cè)系統(tǒng)和方法的關(guān)注,以及在一系列技巧的指引下對(duì)論文的修改。我們可以看到,在體現(xiàn)學(xué)術(shù)自由上,“反檢測(cè)”考量與表達(dá)規(guī)則是背道而馳的。學(xué)術(shù)自由是內(nèi)在思想和外化表達(dá)結(jié)合的體現(xiàn),作者有權(quán)利在公開場(chǎng)合展示知識(shí),并且有權(quán)利選擇是否公開表達(dá)自己的思想。但學(xué)術(shù)自由和“表達(dá)”在“反檢測(cè)”考量中受到了較大影響。其一,“反檢測(cè)”考量影響了表達(dá)的多樣性。同一思想可以外化成不同的表達(dá)方式,過于倚重文字這一表達(dá)方式,就容易忽略圖片等方式。其二,“反檢測(cè)”考量割裂了思想與表達(dá)。思想與表達(dá)是作品不可或缺的組成部分,“反檢測(cè)”考量使人們無法真正了解作品所要體現(xiàn)的思想,從而割裂了思想和表達(dá)。
3.數(shù)字痕跡處理消解了著作權(quán)的私權(quán)屬性
數(shù)字痕跡處理將數(shù)字曝光在公眾視野里,使得數(shù)字痕跡擁有公私兩種屬性。一方面,數(shù)字痕跡“精準(zhǔn)刻畫”個(gè)人信息,其對(duì)象、主體和媒介都具有私權(quán)屬性;另一方面,基于公共基礎(chǔ)設(shè)施,數(shù)字通過相互配合與社交泛化,形成全數(shù)據(jù)模式。而作品自創(chuàng)作完成時(shí)依法享有著作權(quán),這是一種原始權(quán)力保護(hù),帶有“依照受控行為界定專有權(quán)利”的特點(diǎn),本質(zhì)屬于不是權(quán)利人自用而是他人禁止權(quán)的私權(quán)。在一個(gè)封閉計(jì)算的流程中,待檢測(cè)論文生成的數(shù)字痕跡至少交互了兩次,在格式化檢測(cè)中被初次支配,在匹配算法中被深度計(jì)算,或許還將在檢測(cè)報(bào)告中被循環(huán)轉(zhuǎn)換。可見,數(shù)字痕跡處理在消解作品本身的同時(shí)也在消解著作權(quán)的私權(quán)屬性。
二、根源——算法的應(yīng)用特征不融合
1.算法的不透明性
(1)技術(shù)因素:算法技術(shù)保護(hù)模式具有私法屬性。目前,國(guó)外對(duì)算法的技術(shù)保護(hù)有商業(yè)秘密模式與專利模式兩種,都屬于私法保護(hù)模式。商業(yè)秘密模式重點(diǎn)在于全方位的保護(hù),當(dāng)算法造成實(shí)際損害時(shí),對(duì)其追責(zé)效率降低。而在專利模式下,常見的“黑箱”算法、“感知”算法和“奇異”算法則超越了人類當(dāng)前的認(rèn)知范疇,連發(fā)明人都很難清晰地描述技術(shù)方案里的具體操作規(guī)程[1]。
(2)人為因素:對(duì)算法技術(shù)不了解,但絕對(duì)信任。算法常常被視為中立的、權(quán)威的、科學(xué)的代號(hào),它的出現(xiàn)把人們從具體的可信賬本中解放出來,轉(zhuǎn)而信任普遍主義的抽象系統(tǒng)。數(shù)字經(jīng)濟(jì)依靠平臺(tái)擴(kuò)張,產(chǎn)生信用資產(chǎn)化效應(yīng),用戶在信任中創(chuàng)造并獲得價(jià)值。陌生人在數(shù)字世界通過一定的合約機(jī)制就可以建立信用共識(shí),不需要第三方的調(diào)處[2]。在這種絕對(duì)信任下,人類想“利用算法、模型等數(shù)學(xué)方法重塑一個(gè)更加客觀的現(xiàn)實(shí)世界”,被學(xué)者生動(dòng)地定義為盲目的“數(shù)學(xué)洗腦”。
2.算法的局限性
(1)比對(duì)庫(kù)資源有限,沒有細(xì)分文類。無論是全樣本數(shù)據(jù),還是傳統(tǒng)抽樣小數(shù)據(jù),都可能存在樣本偏差。在樣本識(shí)別與設(shè)計(jì)中,樣本不完整問題越突出,特征數(shù)據(jù)就越容易“以偏概全”,導(dǎo)致檢測(cè)結(jié)果缺乏完整性與代表性。因此,各大知識(shí)資源數(shù)據(jù)庫(kù)積極爭(zhēng)搶數(shù)字情報(bào),擴(kuò)大文獻(xiàn)類型的覆蓋面。但目前國(guó)內(nèi)大多數(shù)比對(duì)庫(kù)尚未在文類上細(xì)分文獻(xiàn)資源,文獻(xiàn)規(guī)模也無法實(shí)現(xiàn)“充分?jǐn)?shù)據(jù)”。
(2)計(jì)算序列有限,執(zhí)行過于機(jī)械化。算法是將輸入轉(zhuǎn)化為輸出的計(jì)算步驟的序列[4],在算法模式下,對(duì)同一類問題的任何初始輸入,機(jī)器都能展開計(jì)算,在完成有限步驟之后終止計(jì)算。如果一個(gè)算法有缺陷或不適合某個(gè)問題,在經(jīng)過有限步驟的計(jì)算后,機(jī)器將得不出結(jié)果,進(jìn)入死循環(huán)。可見,過于機(jī)械化的執(zhí)行可能會(huì)讓系統(tǒng)陷入困境。
3.算法權(quán)力擴(kuò)張化
算法在為人類數(shù)據(jù)評(píng)估和行為分析帶來便利的同時(shí),也因“黑箱”操作而泛化為權(quán)力擴(kuò)張。首先,權(quán)力在政府治理中的擴(kuò)張。如果學(xué)術(shù)評(píng)價(jià)比較重視重合率,那么教育等相關(guān)機(jī)構(gòu)就會(huì)推廣使用相似度檢測(cè)的方法,在這樣的背景下,各大高校和期刊也只愿意購(gòu)買能提供該項(xiàng)服務(wù)的知識(shí)庫(kù)。其次,權(quán)力在物理邊界上的擴(kuò)張?;ヂ?lián)網(wǎng)的虛擬數(shù)字傳播極快,下載功能極為便捷,推進(jìn)了自然語(yǔ)言信息化,擴(kuò)大了知識(shí)共享的接觸空間。如今的學(xué)術(shù)文獻(xiàn)浩如煙海,數(shù)據(jù)庫(kù)發(fā)生集聚,數(shù)據(jù)聯(lián)系強(qiáng)化,這讓處于某個(gè)細(xì)分領(lǐng)域的作品與自然語(yǔ)言之間的關(guān)系更加密切。數(shù)據(jù)分析框架對(duì)人和世界產(chǎn)生了決定性影響,論文檢測(cè)不僅是事后對(duì)抄襲行為的監(jiān)測(cè),而且成為框定論文是否符合原創(chuàng)標(biāo)準(zhǔn)的一種調(diào)控技術(shù)[5]。
三、應(yīng)對(duì)——學(xué)術(shù)論文評(píng)價(jià)路徑的優(yōu)化
日前,中央宣傳部、教育部、科學(xué)技術(shù)部、工業(yè)和信息化部、公安部、文化和旅游部、國(guó)家市場(chǎng)監(jiān)督管理總局、國(guó)家廣播電視總局等九部委印發(fā)《關(guān)于加強(qiáng)互聯(lián)網(wǎng)信息服務(wù)算法綜合治理的指導(dǎo)意見》,提出利用三年左右的時(shí)間,逐步構(gòu)建治理機(jī)制健全、監(jiān)管體系完善、算法生態(tài)規(guī)范的算法安全綜合治理格局。這顯示我國(guó)在法律框架下已開展算法治理。在這樣的背景下,筆者認(rèn)為,應(yīng)當(dāng)推動(dòng)學(xué)術(shù)論文評(píng)價(jià)人類自覺化,規(guī)制算法權(quán)力。由于算法檢測(cè)在技術(shù)層面尚無法完全優(yōu)化,在學(xué)術(shù)論文評(píng)價(jià)中只能作為輔助手段,筆者建議,可從相似度檢測(cè)規(guī)則的優(yōu)化和對(duì)學(xué)術(shù)論文規(guī)范的遵守與監(jiān)督兩方面展開探索。
1.相似度檢測(cè)規(guī)則的優(yōu)化
檢測(cè)規(guī)則優(yōu)化包括文類細(xì)分與拓寬對(duì)象范圍兩方面,要研究這兩方面內(nèi)容,首先要明確回答兩個(gè)問題:文類細(xì)分怎么從侵權(quán)判定中找到切口?相似度檢測(cè)怎么識(shí)別非“實(shí)質(zhì)性相似”的作品?
(1)參照侵權(quán)判定制度,細(xì)分比對(duì)庫(kù)文類。在司法實(shí)踐中,對(duì)整體觀感法與抽象分離法的適用范圍和標(biāo)準(zhǔn)沒有進(jìn)行嚴(yán)格區(qū)分,二者因讀者不同而形成了一個(gè)相對(duì)平衡的彈性空間。不同的讀者又因作品屬性不同,做出不同的處理,從而形成相似判斷的考量因素[6]。但是從屬性細(xì)分來看,文哲史類論文對(duì)功能和事實(shí)的表達(dá)勝過對(duì)審美或藝術(shù)性的表達(dá),其承載了更多的技術(shù)特征和功能性元素,包含更多的公共領(lǐng)域素材,因而其獨(dú)創(chuàng)性認(rèn)定有一定特殊性。一般來說,我們把論文上傳數(shù)據(jù)庫(kù)時(shí)已經(jīng)做了文類細(xì)分,但建立比對(duì)庫(kù)時(shí)沒有進(jìn)行同樣的操作,導(dǎo)致數(shù)據(jù)循環(huán)在起點(diǎn)和終點(diǎn)處形成矛盾,檢測(cè)實(shí)效不匹配。因此,根據(jù)思想表達(dá)原則進(jìn)行文類細(xì)分,是彌補(bǔ)算法評(píng)價(jià)局限性的關(guān)鍵。將作品的功能、思想、事實(shí)等元素剔除后,再進(jìn)行相似度認(rèn)定,更為科學(xué)規(guī)范。
(2)把識(shí)別對(duì)象拓寬到非“實(shí)質(zhì)性相似”范圍。在司法實(shí)踐中,侵權(quán)裁判規(guī)則能夠解決一部分學(xué)術(shù)論文“實(shí)質(zhì)性相似”的糾紛,但只靠作品比對(duì)不能實(shí)現(xiàn)學(xué)術(shù)論文的強(qiáng)勢(shì)保護(hù),還需要利用學(xué)術(shù)專業(yè)判斷進(jìn)行約束。具體來說,應(yīng)拓寬識(shí)別對(duì)象,不限于識(shí)別“實(shí)質(zhì)性相似”。我們應(yīng)當(dāng)尊重任何一種原創(chuàng)行為,加強(qiáng)對(duì)高級(jí)抄襲、公有領(lǐng)域的合理使用、翻譯、改寫、思想剽竊等行為的識(shí)別。為此,有關(guān)部門應(yīng)重視學(xué)術(shù)專業(yè)判斷,使專業(yè)判斷能夠自主應(yīng)對(duì)學(xué)術(shù)問題,而不是僅僅依靠公權(quán)力規(guī)制算法。
2.對(duì)學(xué)術(shù)論文規(guī)范的遵守與監(jiān)督
目前,對(duì)于算法規(guī)制,學(xué)者大多轉(zhuǎn)向法律和社會(huì)規(guī)范的互動(dòng),嘗試在法社會(huì)學(xué)理論中找到進(jìn)路,避免自己陷入“法律更多而秩序更少”的境遇。
(1)作者遵守學(xué)術(shù)論文規(guī)范的自覺。為了開展自我保護(hù),防止被數(shù)字權(quán)力評(píng)分與貼標(biāo)簽,作者更愿意約束自身行為,做到合法合規(guī),將自己納入道德規(guī)范的框架。這說明作者具有良好的“合作者”品質(zhì)[7],而這種品質(zhì)促使作者自覺遵守相應(yīng)規(guī)則,維護(hù)學(xué)術(shù)氛圍。
(2)他人對(duì)學(xué)術(shù)論文規(guī)范的有效監(jiān)督。他人對(duì)學(xué)術(shù)論文規(guī)范的監(jiān)督行為,如成立論文評(píng)價(jià)小組,實(shí)質(zhì)上是讓論文評(píng)價(jià)更為民主化??偟膩碚f,要實(shí)現(xiàn)他人對(duì)學(xué)術(shù)論文規(guī)范的有效監(jiān)督,應(yīng)從兩方面著手。其一,須提高論文評(píng)價(jià)小組成員對(duì)算法的警惕性,并以監(jiān)督者身份督促創(chuàng)作者重視學(xué)術(shù)規(guī)范,從社群層面構(gòu)建學(xué)術(shù)論文評(píng)價(jià)的共建共治共享規(guī)則,而非過于依賴算法檢測(cè)結(jié)果。這樣,學(xué)術(shù)論文評(píng)價(jià)才有可能回歸到人工審核的社群自治[8]。另一方面,構(gòu)建新型的學(xué)術(shù)秩序空間,讓作者回歸智力創(chuàng)造主體本身,形成治理機(jī)制健全、監(jiān)管體系完善、算法生態(tài)規(guī)范的算法安全綜合治理格局,促使評(píng)價(jià)機(jī)制更加民主化。
在評(píng)價(jià)學(xué)術(shù)論文時(shí),算法檢測(cè)雖然給人們帶來了便利性,但也限制了人類智力成果獨(dú)立自信的表達(dá),造成很多風(fēng)險(xiǎn)隱患。因此,在著作權(quán)法框架內(nèi),從算法應(yīng)用特征出發(fā),找到相似度檢測(cè)的優(yōu)化規(guī)則,并發(fā)揮學(xué)術(shù)論文規(guī)范的作用,對(duì)于推動(dòng)大數(shù)據(jù)時(shí)代論文行業(yè)的高質(zhì)量發(fā)展具有現(xiàn)實(shí)意義。
|參考文獻(xiàn)|
[1]孫建麗. 論算法的法律保護(hù)模式[J]. 西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2019(5):148-154.
[2]郝國(guó)強(qiáng). 從人格信任到算法信任:區(qū)塊鏈技術(shù)與社會(huì)信用體系建設(shè)研究[J]. 南寧師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2020(1):126-136.
[3]TYLERWOODS.“Mathwashing”Facebook and the zeitgeist of data worship[EB/OL]. (2016-06-08)[2021-06-18]. https://technical.ly/brooklyn/2016/06/08/fredbenenson-mathwashing-facebook-data-worship.
[4]算法導(dǎo)論(第3版)[M]. 殷建平,等譯. 北京:機(jī)械工業(yè)出版社,2012.
[5]段偉文. 數(shù)據(jù)智能的算法權(quán)力及其邊界??盵J]. 探索與爭(zhēng)鳴,2018(10):92-100+143.
[6]梁志文. 版權(quán)法上實(shí)質(zhì)性相似的判斷[J]. 法學(xué)家,2015(6):37-50+174.
[7]羅伯特·C.埃里克森. 無需法律的秩序[M]. 蘇力,譯. 北京:中國(guó)政法大學(xué)出版社,2016.
[8]謝嘉圖. 論規(guī)制網(wǎng)絡(luò)洗稿的社會(huì)規(guī)范路徑:以反思著作權(quán)法的功能為邏輯展開[J]. 電子知識(shí)產(chǎn)權(quán),2019(8):14-29.