亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工智能大模型研發(fā)應(yīng)用所涉數(shù)據(jù)權(quán)益的三大法律問題

        2024-02-08 00:00:00李振華
        數(shù)字法治 2024年6期

        內(nèi)容提要:數(shù)據(jù)是人工智能大模型性能的決定性因素,也是法律關(guān)系最復(fù)雜、責(zé)任主體最繁復(fù)的領(lǐng)域。大模型廠商在使用數(shù)據(jù)來訓(xùn)練和應(yīng)用大模型時,普遍面臨著作權(quán)侵權(quán)、違反個人信息處理要求和觸發(fā)不正當(dāng)競爭等三大數(shù)據(jù)權(quán)益上的法律風(fēng)險,亟待從法律法規(guī)層面完善相關(guān)規(guī)則,發(fā)展負(fù)責(zé)任的人工智能。本文建議,合理平衡大模型廠商和大模型應(yīng)用服務(wù)商“兩個主體”、大模型研發(fā)訓(xùn)練和應(yīng)用服務(wù)“兩個階段”的法律責(zé)任。具體包括:一是將作品僅用于大模型訓(xùn)練適度納入著作權(quán)“合理使用”范疇,進(jìn)一步明確人工智能生成內(nèi)容享有著作權(quán)的認(rèn)定條件;二是適度放寬大模型訓(xùn)練階段對個人信息數(shù)據(jù)的使用限制,完善“匿名化”在實(shí)踐中的認(rèn)定標(biāo)準(zhǔn);三是適度包容用于大模型訓(xùn)練的數(shù)據(jù)爬取中的輕微不規(guī)范行為,為大模型的發(fā)展構(gòu)建鼓勵創(chuàng)新、包容審慎的監(jiān)管環(huán)境。

        關(guān)鍵詞:大語言模型 數(shù)據(jù)權(quán)益 合理使用 著作權(quán) 個人信息數(shù)據(jù)

        一、人工智能大模型研發(fā)應(yīng)用在數(shù)據(jù)權(quán)益上存在三大法律問題

        (一)著作權(quán)侵權(quán)問題

        其主要表現(xiàn)在訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)和大模型生成內(nèi)容著作權(quán)侵權(quán)兩方面。

        1.開源數(shù)據(jù)和網(wǎng)頁爬蟲數(shù)據(jù)是大模型訓(xùn)練數(shù)據(jù)的主要來源,但著作權(quán)侵權(quán)風(fēng)險較為突出

        以國內(nèi)某大模型使用的訓(xùn)練數(shù)據(jù)為例,爬取自通用網(wǎng)頁和開源社區(qū)的數(shù)據(jù)量約占訓(xùn)練數(shù)據(jù)總量的84%。然而,這兩類數(shù)據(jù)有突出的侵犯著作權(quán)的風(fēng)險。一是開源數(shù)據(jù)“有原罪”,比如,Books3、Bookcorpus等開源圖書數(shù)據(jù)集中采集的大量圖書并未獲得版權(quán)持有人的同意授權(quán),而大模型廠商使用相關(guān)數(shù)據(jù)之前無法逐一核實(shí)圖書的侵權(quán)風(fēng)險。二是爬取數(shù)據(jù)“難許可”,比如,微信公眾號、知乎、貼吧等內(nèi)容平臺上用戶原創(chuàng)發(fā)布的很多作品受法律保護(hù),但要取得用戶一對一的授權(quán)使用許可用于大模型訓(xùn)練在實(shí)踐中很難操作。

        同時,緣于人工智能大模型訓(xùn)練是近年來的新生事物,《著作權(quán)法》中規(guī)定的著作權(quán)豁免情形中,尚不包括“將作品用于人工智能大模型訓(xùn)練”。《著作權(quán)法》規(guī)定,只有在“個人使用”“適當(dāng)引用”“學(xué)習(xí)研究使用”等情形下可以豁免著作權(quán),用于大模型訓(xùn)練難以歸納到上述情形中。比如,“個人使用”僅限于個人用途,而大模型的訓(xùn)練應(yīng)用均由企業(yè)主導(dǎo)、開拓商業(yè)化的場景,顯然不符合要求;“適當(dāng)引用”的適用前提是“為介紹、評論說明某一作品”或“說明某一問題”,而大模型是通過將語言token化、學(xué)習(xí)其中蘊(yùn)含的概率關(guān)聯(lián)、形成參數(shù),與評論和介紹作品沒有關(guān)系;“科學(xué)研究”對作品的利用限定在“少量復(fù)制、僅用于學(xué)校課堂教學(xué)或者科學(xué)研究”,而大模型訓(xùn)練中需要大量復(fù)制作品,且未局限在科研或教育用途中,故也不適用。

        2.使用生成式人工智能(AIGC)創(chuàng)作的內(nèi)容生產(chǎn)模式,導(dǎo)致作品著作權(quán)界定存在模糊地帶

        人類借助AIGC進(jìn)行創(chuàng)作,勢必對內(nèi)容創(chuàng)作權(quán)益的生成、保護(hù)模式產(chǎn)生巨大沖擊,這里涉及三個層層遞進(jìn)的問題:一是AIGC生成內(nèi)容是否可能侵犯著作權(quán);二是AIGC生成的作品是否受著作權(quán)保護(hù);三是使用AIGC服務(wù)創(chuàng)作內(nèi)容的權(quán)責(zé)應(yīng)該如何分配。目前這三個問題已有實(shí)踐探索,但仍有待深化研究。

        一是AIGC生成的內(nèi)容可以構(gòu)成侵犯著作權(quán),但侵權(quán)責(zé)任主體有待明確。廣州互聯(lián)網(wǎng)法院對“AI畫出奧特曼”一案作出裁決,認(rèn)定被告(AI應(yīng)用服務(wù)提供商)未盡到合理的注意義務(wù)、未使用技術(shù)措施阻止侵權(quán)作品生成,侵害了原告對奧特曼作品享有的復(fù)制權(quán)和改編權(quán)。這是實(shí)踐的創(chuàng)新探索,未來對于用戶、大模型廠商和AI應(yīng)用服務(wù)商的責(zé)任應(yīng)當(dāng)如何分配的一般性原則,有待進(jìn)一步提煉和說明。

        二是在AIGC輔助創(chuàng)作的情況下,作品可以享有著作權(quán),但輔助創(chuàng)作和替代創(chuàng)作的界限需要明確。北京互聯(lián)網(wǎng)法院裁定,用戶以向stable diffusion模型輸入提示詞、調(diào)整參數(shù)、裁剪拼貼等形式創(chuàng)作,體現(xiàn)了用戶的審美選擇和個性判斷,對生成的獨(dú)創(chuàng)性圖片享有著作權(quán)。這一判例的前提是,AIGC是輔助人類創(chuàng)意表達(dá)的工具、人類在創(chuàng)作中居于主導(dǎo)地位。目前,關(guān)于AIGC創(chuàng)作模式屬于輔助人類創(chuàng)作還是替代人類創(chuàng)作,需要法官結(jié)合個案情況作出具體判斷。

        三是AIGC生成內(nèi)容的權(quán)屬由服務(wù)商和用戶按照約定分配,但部分協(xié)議的權(quán)責(zé)分配明顯不對等。由于多個主體(應(yīng)用開發(fā)者、創(chuàng)作者、大模型廠商等)參與了作品的形成,生成內(nèi)容的權(quán)屬多以用戶協(xié)議來約定,但部分協(xié)議有權(quán)責(zé)分配不公的傾向。比如,有些協(xié)議規(guī)定“用戶的知識產(chǎn)權(quán)屬于平臺所有,但侵權(quán)風(fēng)險和對平臺造成的損失由用戶承擔(dān)”,顯然有失公平。

        (二)違反個人信息處理要求問題

        大模型訓(xùn)練數(shù)據(jù)中不可避免地包含一些個人身份信息和個人行為信息,國外廠商如Open AI、Meta均在用戶協(xié)議中提示用戶個人生成的內(nèi)容會被用于大模型訓(xùn)練。面對個人信息數(shù)據(jù),國內(nèi)大模型廠商一般先對個人信息進(jìn)行去標(biāo)識化或匿名化處理、達(dá)到無法識別具體個人的程度后,再用于模型訓(xùn)練、優(yōu)化。但是,這種實(shí)踐面臨合規(guī)風(fēng)險。

        一是“處理目的”變更需重新取得個人同意,給大模型訓(xùn)練帶來了巨大的合規(guī)成本。《個人信息保護(hù)法》第14條第2款規(guī)定,“個人信息的處理目的、處理方式和處理的個人信息種類發(fā)生變更的,應(yīng)當(dāng)重新取得個人同意。”將原本用于其他用途的個人信息數(shù)據(jù)轉(zhuǎn)用于大模型訓(xùn)練,應(yīng)當(dāng)屬于“處理目的”變更,需尋求個人重新授權(quán)。然而,大模型訓(xùn)練數(shù)據(jù)量非常大、應(yīng)用場景的迭代非常快,如果變更一次要重新取得個人同意授權(quán),會產(chǎn)生非常大的溝通成本。

        二是處理已公開個人信息的“合理范圍”和“對個人權(quán)益有重大影響”內(nèi)涵模糊?!秱€人信息保護(hù)法》規(guī)定,“個人信息處理者可以在合理的范圍內(nèi)處理個人自行公開或者其他已經(jīng)合法公開的個人信息”,“個人信息處理者處理已公開的個人信息,對個人權(quán)益有重大影響的,應(yīng)當(dāng)依照本法規(guī)定取得個人同意”。倘若用于大模型訓(xùn)練屬于“合理范圍”并不屬于“對個人權(quán)益有重大影響”,大模型廠商的合規(guī)成本將大幅下降。然而,關(guān)于“合理范圍”和“對個人權(quán)益有重大影響”如何界定,尚未有權(quán)威的解釋或指導(dǎo)性的判例。

        三是關(guān)于“匿名化”的標(biāo)準(zhǔn)還不夠清晰可行。個人信息匿名化處理后可以不受《個人信息保護(hù)法》的約束,這是大模型訓(xùn)練解決個人信息安全的根本方法。但客觀上,絕對的“匿名化”在技術(shù)上是無法實(shí)現(xiàn)的,目前對于經(jīng)過怎樣的處理才能夠達(dá)到“匿名化”的標(biāo)準(zhǔn),還沒有清晰可行的標(biāo)準(zhǔn)規(guī)范。

        (三)觸發(fā)不正當(dāng)競爭的風(fēng)險問題

        爬取網(wǎng)頁數(shù)據(jù)是國產(chǎn)大模型最重要的數(shù)據(jù)來源。盡管大模型廠商一般對爬取數(shù)據(jù)有規(guī)范嚴(yán)格的流程,基本可規(guī)避刑事責(zé)任、侵犯商業(yè)秘密等顯性風(fēng)險。然而,業(yè)內(nèi)通行的方式爬取數(shù)據(jù),用于訓(xùn)練大模型,還可能引發(fā)不正當(dāng)競爭風(fēng)險,主要表現(xiàn)在兩方面。

        一是繞開網(wǎng)站反爬機(jī)制、在不影響網(wǎng)絡(luò)運(yùn)行的情況下仍有違法風(fēng)險。“是否影響被爬取方正常提供網(wǎng)絡(luò)服務(wù)”是此類不正當(dāng)競爭的第一個判斷標(biāo)準(zhǔn),比如,網(wǎng)絡(luò)爬蟲很多情況下要繞開網(wǎng)站的robots協(xié)議等反爬蟲機(jī)制,盡管robots協(xié)議本身并不具有法律效力、突破robots協(xié)議一般不會對被爬取網(wǎng)站的網(wǎng)絡(luò)服務(wù)構(gòu)成負(fù)擔(dān),但從司法案例看,是否突破robots協(xié)議常被視作判斷數(shù)據(jù)爬取方是否具有主觀惡意的重要依據(jù)。

        二是基于被爬取數(shù)據(jù)訓(xùn)練的產(chǎn)品可能被認(rèn)定為與被爬取方存在“實(shí)質(zhì)性替代”。不正當(dāng)競爭的第二個判斷標(biāo)準(zhǔn)是“是否存在實(shí)質(zhì)性替代”。司法實(shí)踐中,一般以“足以導(dǎo)致被爬取方的產(chǎn)品被擠出現(xiàn)有市場”作為存在“實(shí)質(zhì)性替代”的判斷標(biāo)準(zhǔn)。盡管基于AI大模型開發(fā)的產(chǎn)品是通過學(xué)習(xí)被爬取方數(shù)據(jù)的內(nèi)在關(guān)聯(lián)、參數(shù)化之后,再提供內(nèi)容生成服務(wù),與被爬取方直接向用戶提供數(shù)據(jù)的模式有實(shí)質(zhì)差異,但倘若被爬取方產(chǎn)品的市場份額由此下降,可能被認(rèn)定為存在“實(shí)質(zhì)性替代”。

        二、域外相關(guān)實(shí)踐案例總結(jié)和法律動向

        (一)多傾向于豁免大模型訓(xùn)練數(shù)據(jù)的著作權(quán)責(zé)任,但基本不認(rèn)可AI生成作品享有著作權(quán)

        歐盟通過設(shè)置文本和數(shù)據(jù)挖掘的著作權(quán)保護(hù)例外,支持豁免大模型復(fù)制網(wǎng)絡(luò)公開作品著作權(quán)責(zé)任。歐盟《單一數(shù)字市場著作權(quán)指令》明確了“在合法訪問的作品或載體上進(jìn)行復(fù)制和提取時,豁免著作權(quán)責(zé)任;除非權(quán)利人以適當(dāng)方式明確保留上述權(quán)利”。換言之,歐盟通過明確著作權(quán)方“默示許可+Opt-out(選擇退出)”的模式,減免了大模型廠商復(fù)制公開作品的著作權(quán)責(zé)任。日本援引“非欣賞性利用”原則,明確了用于大模型訓(xùn)練的所有作品均不受著作權(quán)限制。2018年,日本修改了著作權(quán)法,將“不以欣賞作品原有價值的利用”視為對著作權(quán)的“合理使用”范圍,并在兜底條款中特別補(bǔ)充了“在電子計算機(jī)信息處理過程中對作品表達(dá)所進(jìn)行的不為人類所感知和識別的利用情形”,實(shí)質(zhì)上將復(fù)制、存儲、處理作品用于大模型訓(xùn)練的全流程給予著作權(quán)豁免。新加坡明確“出于數(shù)據(jù)分析的目的可以復(fù)制著作權(quán)作品”。2021年,新加坡修訂了著作權(quán)法,新增規(guī)定“在訪問合法的情況下,著作權(quán)作品可用于計算數(shù)據(jù)分析,如情感分析、文本和數(shù)據(jù)挖掘,或訓(xùn)練機(jī)器學(xué)習(xí),無需尋求每個著作權(quán)所有者的許可”,豁免了大模型廠商訓(xùn)練數(shù)據(jù)的著作權(quán)限制。美國的“四要素+轉(zhuǎn)換性使用”認(rèn)定標(biāo)準(zhǔn)為豁免大模型著作權(quán)責(zé)任預(yù)留了空間。美國判定著作權(quán)是否“合理使用”需要考量使用目的與性質(zhì)、著作權(quán)作品的性質(zhì)、使用部分占被引用作品質(zhì)與量的比例、該使用對著作權(quán)市場造成的潛在影響“四要素”,同時要考察新作品相對于原作品“轉(zhuǎn)換性”的程度(產(chǎn)生了新作品還是僅替代了原作品)。參照谷歌圖書館案判決先例,有較大的可能豁免大模型訓(xùn)練數(shù)據(jù)的著作權(quán)責(zé)任。

        歐盟、美國認(rèn)為AIGC作品只有在體現(xiàn)人類創(chuàng)意性工作的時候才能享有著作權(quán)。歐盟認(rèn)為,AIGC生成內(nèi)容是否屬于作品,必須根據(jù)屬于文學(xué)、藝術(shù)、科學(xué)領(lǐng)域,人類智力活動,獨(dú)創(chuàng)性,表達(dá)四個要件綜合判斷;只有AIGC生成內(nèi)容中體現(xiàn)了人類智力活動的獨(dú)創(chuàng)性,才能被認(rèn)定為作品。美國的認(rèn)定原則與歐盟基本相同,但在實(shí)際操作上,傾向于認(rèn)為當(dāng)前AIGC創(chuàng)作作品無法體現(xiàn)人類創(chuàng)意的主導(dǎo)地位,故不能受著作權(quán)保護(hù)。比如,美國著作權(quán)局拒絕對利用人工智能平臺Mid journey創(chuàng)作的科幻漫畫書給予著作權(quán)登記,理由是并沒有體現(xiàn)作者創(chuàng)意的主導(dǎo)地位。英國是僅有的少數(shù)認(rèn)可“完全由計算機(jī)生成的作品”也可以享有著作權(quán)的國家。英國《1988年著作權(quán)、外觀設(shè)計和專利法》規(guī)定,沒有人類作者的計算機(jī)生成作品的保護(hù)期為自作品制作之日起50年(人類作品的著作權(quán)有效期為70年)。

        (二)對于個人信息的收集處理要求,歐盟以“opt-in”為原則、美國一般以“opt-out”為原則,尺度上較寬松

        歐盟在采集個人信息時以“opt-in”(選擇進(jìn)入)為原則,整體尺度上較寬松。歐盟《通用數(shù)據(jù)保護(hù)條例》(GDPR)中規(guī)定了包括取得個人同意、維護(hù)公共利益以及實(shí)現(xiàn)數(shù)據(jù)處理者或第三方合理利益等六種合法處理個人信息的情形。而我國《個人信息保護(hù)法》僅認(rèn)可“個人同意、公共利益和人力資源管理”等情形,并不認(rèn)可數(shù)據(jù)處理者實(shí)現(xiàn)自身利益是合法性基礎(chǔ)。同意規(guī)則上,歐盟認(rèn)為“同意必須是自由給出的、特定的、知情的、以清晰的聲明或者肯定的行為表明數(shù)據(jù)主體對于處理其個人數(shù)據(jù)的明確意愿”;我國則規(guī)定“敏感個人信息收集處理要求獲得單獨(dú)同意,甚至?xí)嫱狻薄?/p>

        美國對個人信息收集處理大多采用“opt-out”(選擇退出)原則,傾向于減輕信息處理者的義務(wù)。根據(jù)《平等信用機(jī)會法》《金融服務(wù)現(xiàn)代化法》等法律法規(guī),美國聯(lián)邦對于收集個人信用有關(guān)信息采用“opt-out”原則,消費(fèi)者若沒有明確拒絕,視為同意對外提供個人財務(wù)信息。美國《加利福尼亞州消費(fèi)者隱私法案》(CCPA)和《加利福尼亞州隱私權(quán)法案》(CPRA)規(guī)定,信息處理企業(yè)收集個人信息無需事先征得主體同意,但在后續(xù)使用、售賣過程中需要給予用戶拒絕的權(quán)利(opt-out)。從對個人信息的保護(hù)程度看,我國《個人信息保護(hù)法》高于歐盟GDPR、高于美國加州CCPA和CPRA。

        (三)海外對爬取網(wǎng)頁信息用于大模型訓(xùn)練傾向于不認(rèn)定為不正當(dāng)競爭

        美國HIQ訴Linked in案確認(rèn)了“網(wǎng)頁爬取”個人已公開信息屬于“合法訪問”。HIQ公司是一家有償銷售人力資源信息的數(shù)據(jù)服務(wù)供應(yīng)商,其重要數(shù)據(jù)來源是從Linked in上爬取的個人公開數(shù)據(jù)。2017年,Linked in切斷了HIQ公司爬取數(shù)據(jù)的渠道,HIQ公司起訴了Linked in。法院審理認(rèn)為,HIQ公司訪問公開數(shù)據(jù)的行為具有合法性,網(wǎng)站的授權(quán)訪問只意味著對訪問身份的認(rèn)可,使用技術(shù)手段訪問網(wǎng)站與普通用戶的個人訪問并不存在合法性的差異。

        日本傾向于認(rèn)為大模型廠商爬取無償利用、合法公開的數(shù)據(jù)訓(xùn)練大模型,不構(gòu)成不正當(dāng)競爭?!度毡静徽?dāng)競爭防止法》規(guī)定,“與公眾可以無償利用的信息相同的數(shù)據(jù)”不受《不正當(dāng)競爭防止法》保護(hù)。另外,基于此類數(shù)據(jù)加工的成果與原始數(shù)據(jù)不同的情況,對成果的轉(zhuǎn)讓和交易不構(gòu)成不正當(dāng)競爭。這實(shí)質(zhì)上豁免了廠商爬取免費(fèi)、已公開的數(shù)據(jù)訓(xùn)練大模型的法律責(zé)任。

        三、相關(guān)政策建議

        總體建議是國家從支持國產(chǎn)大模型搶占國際競爭制高點(diǎn)的導(dǎo)向出發(fā),區(qū)分大模型廠商和大模型應(yīng)用服務(wù)商“兩個主體”、區(qū)分大模型訓(xùn)練開發(fā)與大模型應(yīng)用“兩個階段”,適度放寬大模型廠商和大模型訓(xùn)練開發(fā)階段的法律法規(guī)限制,適度強(qiáng)化大模型應(yīng)用服務(wù)商主體責(zé)任,構(gòu)建鼓勵創(chuàng)新、包容審慎的監(jiān)管環(huán)境。

        (一)適度豁免大模型訓(xùn)練數(shù)據(jù)的著作權(quán)責(zé)任,進(jìn)一步明確AIGC生成內(nèi)容享有著作權(quán)的認(rèn)定條件

        一是在法律法規(guī)中明確“出于商業(yè)或非商業(yè)目的,復(fù)制作品僅用于文本挖掘和模型訓(xùn)練”屬于“合理使用”的情形。建議在《著作權(quán)法》或者配套法律法規(guī)中,認(rèn)定“復(fù)制的作品僅用于文本挖掘和模型訓(xùn)練”屬于對著作權(quán)的“合理使用”情形。同時,采用“opt-out”(選擇退出)模式保障著作權(quán)方的權(quán)利。探索著作權(quán)方、大模型廠商和大模型應(yīng)用服務(wù)商三方的合理利益共享機(jī)制。根據(jù)調(diào)研,大模型廠商有意愿直接向著作權(quán)方采購正版作品數(shù)據(jù),以節(jié)省數(shù)據(jù)爬取、清洗和結(jié)構(gòu)化的成本;著作權(quán)方則希望借助大模型應(yīng)用服務(wù)為作品引流,三方主體的利益導(dǎo)向較為一致,存在一定的合作空間。因此,要鼓勵著作權(quán)方、大模型廠商和應(yīng)用服務(wù)商按照“以應(yīng)用端收益反哺著作權(quán)方”的邏輯,探索流量互引、收益共享的三方協(xié)作模式。建議國家相關(guān)職能部門牽頭建設(shè)合規(guī)的線下數(shù)據(jù)集。設(shè)置圖書電子化專項(xiàng)資金,重點(diǎn)推動公共著作權(quán)圖書電子化;由國家圖書館、國家版本館、國有出版機(jī)構(gòu)等牽頭建設(shè)線下語料“著作權(quán)聯(lián)盟”,引導(dǎo)民營出版機(jī)構(gòu)等深度參與,建設(shè)高質(zhì)量的授權(quán)中文語料庫;加大國家資助科研成果開放力度,大力支持公益性學(xué)術(shù)開放平臺建設(shè),促進(jìn)學(xué)術(shù)成果高效共享。

        二是進(jìn)一步明確AIGC內(nèi)容享有著作權(quán)的實(shí)施細(xì)則,建議通過出臺司法解釋、制定指導(dǎo)性案例等形式,進(jìn)一步明確在AIGC生成內(nèi)容中體現(xiàn)人類“獨(dú)創(chuàng)性智力活動”、繼而享有著作權(quán)的認(rèn)定標(biāo)準(zhǔn)。合理劃定主體之間的權(quán)責(zé)邊界。要在尊重服務(wù)商、用戶意思自治的基礎(chǔ)上,以“公平合理、權(quán)責(zé)對等”為原則,研究制定AIGC服務(wù)商用戶協(xié)議示范文本,明確服務(wù)商和用戶的權(quán)責(zé)邊界。指導(dǎo)AIGC服務(wù)商制定風(fēng)險防控機(jī)制。建議出臺《AIGC生成內(nèi)容風(fēng)險防控機(jī)制建設(shè)指南》,指導(dǎo)AIGC服務(wù)商建立關(guān)鍵詞過濾、風(fēng)險提示、輸出內(nèi)容控制等防控體系,總結(jié)提煉一批行業(yè)最佳實(shí)踐,合理管控侵權(quán)風(fēng)險。

        (二)適度放寬大模型訓(xùn)練階段個人信息的使用限制,完善“匿名化”的認(rèn)定標(biāo)準(zhǔn)

        一是適度放寬大模型訓(xùn)練中對個人信息的使用限制。大模型訓(xùn)練中使用個人信息是為了將語言邏輯參數(shù)化、形成技術(shù)底座,不是直接面向用戶提供服務(wù)、不存在特定的使用目的。建議明確:將個人信息僅用于模型訓(xùn)練的,不屬于處理目的變更,不需要重新征求個人同意;而在應(yīng)用服務(wù)開發(fā)階段,倘若涉及變更個人信息處理目的,則需要重新征求用戶的同意。對于個人已公開信息的使用,要明晰“合理范圍”的界定標(biāo)準(zhǔn),探索制定“對個人權(quán)益影響”的分類分級指南,指導(dǎo)大模型廠商實(shí)踐。

        二是盡快完善個人信息“匿名化”的認(rèn)定標(biāo)準(zhǔn)。只有認(rèn)可匿名化處理的相對性,在實(shí)踐中企業(yè)才敢依據(jù)匿名化條款向第三方提供個人信息相關(guān)數(shù)據(jù),最大限度地發(fā)揮數(shù)據(jù)的社會價值。建議配套制定《個人數(shù)據(jù)匿名化實(shí)踐指南》或相應(yīng)的工作標(biāo)準(zhǔn),明確個人信息匿名化的標(biāo)準(zhǔn)、技術(shù)路徑、示范案例等,為業(yè)界實(shí)踐舉旗定向。

        三是認(rèn)可履行個人信息刪除義務(wù)的多種可行方案。刪除權(quán)是保障信息主體自主決定個人信息的重要途徑?!渡墒饺斯ぶ悄芊?wù)管理暫行辦法》第11條第2款規(guī)定:“提供者應(yīng)當(dāng)依法及時受理和處理個人關(guān)于查閱、復(fù)制、更正、補(bǔ)充、刪除其個人信息等的請求?!睂?shí)踐中,倘若訓(xùn)練數(shù)據(jù)進(jìn)入模型,個人信息已token化,直接定位并刪除特定個人信息困難較大。建議監(jiān)管層在尊重用戶意愿的基礎(chǔ)上,認(rèn)可多樣化的個人信息刪除方式。比如,對于尚未用于訓(xùn)練的個人信息,可以由大模型廠商從訓(xùn)練集中刪除;對于已經(jīng)用于訓(xùn)練、嵌入應(yīng)用場景當(dāng)中的個人信息,可以由大模型應(yīng)用服務(wù)商設(shè)置輸出內(nèi)容過濾機(jī)制,確保個人信息刪除權(quán)的實(shí)現(xiàn)。

        (三)適度包容用于大模型訓(xùn)練的數(shù)據(jù)爬取中的輕微不規(guī)范行為,明確訓(xùn)練大模型不構(gòu)成對被爬取方產(chǎn)品的實(shí)質(zhì)性替代

        一是建議適度包容數(shù)據(jù)爬取中的輕微不規(guī)范行為。用于大模型訓(xùn)練所實(shí)施的數(shù)據(jù)爬取行為,不是簡單的數(shù)據(jù)搬運(yùn),而是在數(shù)據(jù)深度挖掘基礎(chǔ)上的創(chuàng)新性使用??紤]到人工智能大模型是世界各國競爭激烈的關(guān)鍵領(lǐng)域,而我國目前面臨數(shù)據(jù)開放利用不足、漢語語料不多的情況,建議在未對被爬取方網(wǎng)絡(luò)服務(wù)產(chǎn)生明顯負(fù)擔(dān)、未對被爬取方正常運(yùn)營造成影響的情況下,適度包容數(shù)據(jù)爬取中的輕微不規(guī)范行為。

        二是建議認(rèn)定用于訓(xùn)練大模型不構(gòu)成對數(shù)據(jù)被爬取方產(chǎn)品的實(shí)質(zhì)性替代。大模型訓(xùn)練不會再現(xiàn)被爬取的原始數(shù)據(jù),而是轉(zhuǎn)化為模型的參數(shù)。同時,大模型本身僅僅是技術(shù)基座,不是直接面向用戶的數(shù)據(jù)產(chǎn)品。故而訓(xùn)練大模型本身不存在對被爬取方產(chǎn)品的實(shí)質(zhì)性替代。

        Abstract:Data is the decisive factor in the performance of AI large models, and also the most complex area in terms of legal relationship and subjects of responsibility. When using data to train and develop large models, manufacturers generally face three major legal risks concerning data rights: copyright infringement, violation of personal information processing requirements, and triggering unfair competition. Therefore, it is urgent to improve relevant rules to develop responsible AI.

        This article suggests balancing legal responsibilities of the two subjects of large model manufacturers and large model application service providers, and of the two stages of large model training in Ramp;D and application services. Specifically, it suggests firstly, incorporating the works only for large model training into the category of “fair use” of copyright to some extent, and clarifying the conditions for enjoying copyright of the content generated by AI; Secondly, relaxing the restrictions moderately on the use of personal information and data during the training stage of large models, and improving the standards of “anonymization” in practice; And thirdly, tolerating minor misbehaviors in data crawling for large model training. All these measures will contribute to building a prudent and inclusive regulatory environment that encourages innovations for the development of large models.

        [責(zé)任編輯 邢峻彬]

        欧美日韩一二三区高在线| 日日碰狠狠添天天爽| 131美女爱做视频| 久久中文字幕日韩无码视频| 日韩中文字幕一区二十| 亚洲女人毛茸茸粉红大阴户传播| 麻豆影视视频高清在线观看| 亚洲国产精品自拍一区| 成年人视频在线播放视频| 三级日韩视频在线观看| 18禁成人黄网站免费观看| 少妇内射视频播放舔大片| 中文字幕人妻系列一区尤物视频| 男女激情视频网站免费在线| 五月天中文字幕mv在线| 蜜臀av免费一区二区三区| 国产成人自拍小视频在线| 亚洲综合在线观看一区二区三区| 激烈的性高湖波多野结衣| 国产一区视频在线免费观看| 国产麻豆精品久久一二三| 国产又爽又黄又不遮挡视频| 少妇被啪出水在线视频| 亚洲av成人片在线观看| 无码专区久久综合久中文字幕| AV无码专区亚洲AVL在线观看| 日韩中文字幕不卡在线| 久久久久亚洲精品无码网址蜜桃 | 欧美老熟妇又粗又大| av有码在线一区二区| 日韩 亚洲 制服 欧美 综合| 成午夜精品一区二区三区| 无码中文字幕在线DVD| 亚洲精品一区二区三区国产| 97精品人妻一区二区三区蜜桃| 国产精品久久久久av福利动漫 | 亚洲视频中文字幕更新| 日本视频在线播放一区二区| 永久黄网站色视频免费看| 久草视频这里有精品| 亚洲乱色视频在线观看|