人工智能訓練與著作權沖突的解決策略需兼顧技術創(chuàng)新與權利保護,結合國內外現(xiàn)有法律規(guī)范、技術手段與行業(yè)協(xié)作探索構建綜合治理體系
生成式人工智能技術(AIGC)的快速迭代與場景滲透,正在對傳統(tǒng)版權制度形成系統(tǒng)性沖擊,傳統(tǒng)的版權制度也已給AIGC技術的快速發(fā)展帶來制約。為此,探討具有可操作性的兼容技術創(chuàng)新與版權保護制度性的解決方案,成為亟待解決的問題。
AIGC訓練三階段潛在的版權風險
AIGC作為人工智能的重要分支,通過分析數(shù)據(jù)分布特征生成新穎的合成內容(如文本、圖像、視音頻等)。訓練過程通常分為三個階段:一是數(shù)據(jù)準備階段,收集海量數(shù)據(jù)并進行清洗、標注與分類;二是數(shù)據(jù)處理階段,依托文本與數(shù)據(jù)挖掘(TDM)實現(xiàn)結構化轉換與特征提??;三是結果輸出階段,通過生成內容驗證模型效果并迭代優(yōu)化。
數(shù)據(jù)準備階段的侵權風險
數(shù)據(jù)準備階段離不開對海量數(shù)據(jù)作品的抓取與復制,“海量數(shù)據(jù)作品的抓取與復制”與著作權法之間的沖突,已成為當前全球法律和技術領域的熱點問題。如GPT-4整合使用超1萬億的token語料(含1200萬版權圖片),數(shù)據(jù)量遠超《日本著作權法》第30-4條TDM例外的“必要限度”,也突破了《伯爾尼公約》第9條“三步檢驗法”之“少量使用”原則。數(shù)字時代,復制權的內涵已從傳統(tǒng)物理載體擴展至虛擬形式。永久復制(如存儲于服務器供長期調用)因具備再現(xiàn)性與重復性被認定為侵權,而臨時復制(如內存暫存)的合法性仍然存在法條空白。如我國《著作權法》第10條未明確RAM緩存的法律地位,與《WIPO互聯(lián)網(wǎng)條約》第11條技術措施義務形成解釋裂隙,導致司法實踐中分歧較大,使得AI訓練面臨較大的侵權風險。
數(shù)據(jù)處理階段的侵權風險
數(shù)據(jù)處理階段通過數(shù)字化與結構化轉換作品,可能觸發(fā)改編權,甚至是翻譯權。業(yè)界學者通常采用“表達性使用”這一標準來判斷人工智能訓練對作品數(shù)據(jù)的使用行為是否合法。人工智能訓練一般被分為“表達型訓練”和“非表達型訓練”。非表達型訓練是將獲取的數(shù)據(jù)作品僅用于人工智能系統(tǒng)內部學習,不涉及對外生成新表達性內容。如人臉識別系統(tǒng),為訓練完善人臉識別算法,技術人員從雅虎網(wǎng)站中收集整理了約50萬張新聞圖片并對其中的人臉人像進行分析加工、整合為數(shù)據(jù)集,提供給相關開發(fā)主體使用。但這類訓練使用并不涉及侵權,其提取、使用的人臉面部特征不具有創(chuàng)造性,不涉及新聞圖片作品中具有獨創(chuàng)性表達的部分。而微軟的“下一個倫勃朗”項目,無論從訓練資源還是生產(chǎn)結果,都極具針對性。系統(tǒng)完全以倫勃朗作品為訓練資源進行智能學習,生成的畫作明顯帶有倫勃朗風格。盡管技術中立觀點認為算法處理不涉及表達繼承,但司法實踐強調結果導向——如果AI生成的畫作與某幅受版權保護的現(xiàn)代臨摹作品高度相似,可能構成侵權。
結果輸出階段的信息網(wǎng)絡傳播權
傳播權是《著作權法》中的一項重要權利,包括信息網(wǎng)絡傳播權、廣播權、發(fā)行權等,控制作品向公眾傳播的方式。人工智能生成作品的傳播權,目前各國法律體系尚未形成完全統(tǒng)一的規(guī)則。在我國,現(xiàn)行法律不保護純AI生成內容(如2020年深圳AI生成文章案,法院認定“無人類獨創(chuàng)性貢獻不構成作品”)。但如果人類對AI生成內容進行了實質性選擇、編排或修改,生成內容可能受保護,傳播需遵守《著作權法》。如全國首例“AI文生圖”著作權糾紛案,首次從司法裁判的角度確認人工智能生成的內容具有作品屬性,該案入選2024中國數(shù)字經(jīng)濟發(fā)展與法治建設十個重大影響力事件。今年3月,最高人民法院院長張軍在十四屆全國人大三次會議上作最高人民法院工作報告時提到:“依法妥善審理涉人工智能糾紛案件,支持人工智能依法應用;懲治利用人工智能技術侵權行為,促進規(guī)范有序發(fā)展?!睓嗬鲝埲艘脖硎荆骸斑@個事情,核心價值還是給AI行業(yè)的開發(fā)者、創(chuàng)作者表達出一個中國司法態(tài)度,即法院是愿意也傾向于去保護新技術、新成果的。”即使AI生成內容本身無版權,但如果訓練數(shù)據(jù)未經(jīng)授權使用受版權保護的作品,傳播AI生成內容仍可能構成侵權。
AIGC凸顯傳統(tǒng)合理使用規(guī)則的困境
生成式AI與合理使用的矛盾本質是技術紅利與版權保護的利益沖突。目前法律尚未明確解決這一問題,但趨勢表明:完全依賴“合理使用”豁免AI訓練的風險正在不斷增加。
一是有關法律條規(guī)的滯后性?!叭綑z驗法”(three—step test)是知識產(chǎn)權領域,特別是《著作權法》中用于判斷某些行為是否構成對著作權的限制或例外的關鍵標準。但AIGC的“學習”行為既非直接復制,亦非傳統(tǒng)轉換性使用,法律定性模糊。二是尺度失準。傳統(tǒng)合理使用針對“少量作品”,而AI訓練依賴全網(wǎng)數(shù)據(jù)爬?。ㄈ鏑ommon Crawl包含PB級數(shù)據(jù)),數(shù)據(jù)規(guī)模呈現(xiàn)爆炸式增長,“三步檢驗法”未預計預設此類規(guī)模。三是行為主體錯位。合理使用原為人類行為設計(如學者引用等),但AI訓練是機器自動化過程,是否適用“合理使用”存在較大法理爭議。四是全球化與碎片化沖突。AIGC所需海量數(shù)據(jù)不再局限于一地一國,而是全球數(shù)據(jù)的歸集。世界各國對AI訓練數(shù)據(jù)以及生成的產(chǎn)品是否侵權,法律立場到目前為止還是各自表述解釋,尚未統(tǒng)一。如我國《生成式AI服務管理辦法》要求“尊重知識產(chǎn)權”,但未明確訓練合法性。歐盟則傾向嚴格授權(如《數(shù)字單一市場指令》要求權利人可“選擇退出”AI訓練)。美國各州相關法律也是不盡一致,部分案例支持合理使用。
探索AIGC與著作權之間沖突的解決方案
人工智能訓練與著作權沖突的解決策略需兼顧技術創(chuàng)新與權利保護,結合國內外現(xiàn)有法律規(guī)范、技術手段與行業(yè)協(xié)作探索構建綜合治理體系。
在立法層面應建構系統(tǒng)性規(guī)范框架,強化風險全周期治理的制度設計。當前各國人工智能立法普遍采用分散式路徑,如歐盟《人工智能法案》聚焦高風險系統(tǒng)分級管控,美國各州立法側重“算法歧視”治理,我國現(xiàn)有法條多集中于數(shù)據(jù)安全環(huán)節(jié),暴露出分散立法模式在治理效能上的結構性缺陷,缺乏對技術黑箱性、社會嵌入性等本質風險的制度響應。建議立法機關盡快啟動體系化重構工程,建立“風險識別—過程控制—結果追溯”的全鏈條規(guī)制框架,既包含算法透明度、數(shù)據(jù)治理等微觀技術標準,又要統(tǒng)籌產(chǎn)業(yè)發(fā)展、促進國際競爭。
抓住全球AI立法競爭的關鍵窗口期,盡快修訂《著作權法》。在《著作權法實施條例》或司法解釋中增設AI相關條款,明確訓練數(shù)據(jù)的合法性、生成內容的權屬,解決侵權責任認定困難。在保護創(chuàng)作者權益的同時,為技術創(chuàng)新提供清晰的法律框架,確保我國在AI時代的知識產(chǎn)權治理中占據(jù)主動地位。
(作者單位:浙江工商大學法學院)