《法人》特約撰稿 張逸瑞 張津豪 張一凡 周彤
編者按:
7月31日,蘋果APP Store 宣布對(duì)中國(guó)大陸提供Chat GPT 類服務(wù)的應(yīng)用集中下架。在面向應(yīng)用開發(fā)者給出的回復(fù)中,蘋果官方表示,相關(guān)應(yīng)用未依據(jù)中國(guó)大陸地區(qū)法律要求取得許可證,故“需下架整改,整改完畢上架”。某種角度而言,該情況可以理解為《生成式人工智能服務(wù)管理暫行辦法》(下稱《AIGC 暫行辦法》)施行在即引發(fā)的“連鎖反應(yīng)”。
8月15日施行的《AIGC 暫行辦法》是中國(guó)亦是全球針對(duì)生成式人工智能服務(wù)領(lǐng)域制定的首部法規(guī),其中提出了對(duì)生成式人工智能服務(wù)的分類分級(jí)監(jiān)管要求,明確了提供和使用生成式人工智能服務(wù)總體要求。一定程度上,其標(biāo)志著中國(guó)生成式人工智能服務(wù)領(lǐng)域進(jìn)入強(qiáng)監(jiān)管和高合規(guī)標(biāo)準(zhǔn)的新階段。
中國(guó)對(duì)生成式人工智能服務(wù)的合規(guī)監(jiān)管強(qiáng)化早已有跡可循。早在今年年初,國(guó)家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部針對(duì)深度合成服務(wù)制定的《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》(下稱《深度合成管理規(guī)定》)順利施行,明確了深度合成服務(wù)相關(guān)方的義務(wù)與主體責(zé)任,強(qiáng)化了對(duì)互聯(lián)網(wǎng)信息服務(wù)深度合成領(lǐng)域的管理?!禔IGC 暫行辦法》將與《深度合成管理規(guī)定》一并為中國(guó)大模型領(lǐng)域構(gòu)建更為完善的治理和監(jiān)管框架。
本文對(duì)中國(guó)監(jiān)管體系項(xiàng)下的大模型領(lǐng)域合規(guī)要素予以梳理,并重點(diǎn)關(guān)注現(xiàn)實(shí)環(huán)境下落地應(yīng)用的大模型主要合規(guī)義務(wù)。
大模型即Foundation Models,通常指具有大量參數(shù)和復(fù)雜結(jié)構(gòu)的深度學(xué)習(xí)模型。其內(nèi)含大量參數(shù),需要數(shù)十億甚至上百億個(gè)參數(shù),相較于傳統(tǒng)的較小規(guī)模模型,大模型具有更高容量和表達(dá)能力。大模型可以通過訓(xùn)練大規(guī)模數(shù)據(jù)集,實(shí)現(xiàn)更準(zhǔn)確預(yù)測(cè)和更高性能,并依據(jù)相關(guān)指令,完成各種目標(biāo)任務(wù)。熟知的OpenAI 的ChatGPT 與Google 的Alpha Go 就是典型的語言類大模型:ChatGPT 以Transformer 模型為基礎(chǔ),具有1750 億個(gè)參數(shù);而Alpha Go 具有超過1億個(gè)參數(shù)。
根據(jù)百度、華為等企業(yè)近期密集發(fā)聲的情況來看,目前企業(yè)應(yīng)用大模型主要體現(xiàn)為以下三種模式:一是自主構(gòu)建基礎(chǔ)大模型,但考慮到訓(xùn)練大模型的成本和技術(shù)壁壘非常高,只有少數(shù)企業(yè)自建大模型;二是建立行業(yè)大模型,通常是了解行業(yè)know-how 的企業(yè),結(jié)合自身掌握的行業(yè)數(shù)據(jù),用基礎(chǔ)大模型精調(diào)出更貼合實(shí)際場(chǎng)景的垂類行業(yè)大模型;三是在基礎(chǔ)大模型和行業(yè)大模型之上開發(fā)AI 應(yīng)用,這也是目前大多數(shù)企業(yè)采取的模式。
以大模型為技術(shù)基石的生成式人工智能,是以大模型為技術(shù)基石,繼專業(yè)生產(chǎn)內(nèi)容(Professionally-Generated Content,PGC)、用戶生成內(nèi)容(User-Generated Content,UGC)之后的新型內(nèi)容創(chuàng)作方式。在大模型支撐下,早期生成式人工智能在文本生成領(lǐng)域以內(nèi)容創(chuàng)作為主,后逐漸向音頻生成、圖像生成等領(lǐng)域推廣,逐步在企業(yè)端和消費(fèi)者端變現(xiàn),并完成在消費(fèi)、產(chǎn)業(yè)、學(xué)術(shù)等諸多場(chǎng)景的落地和應(yīng)用。
目前,微軟已將ChatGPT 嵌入微軟各大系列產(chǎn)品,包括將GPT-4 接入搜索引擎New Bing 和Edge 瀏覽器、推出集成New Bing 和其他插件的AI 助手平臺(tái)Copilot 以應(yīng)用于Office、協(xié)作軟件Teams 以及其他商業(yè)應(yīng)用。同時(shí),OpenAI 正著手打造基于語言類大模型的應(yīng)用商店,打通所有接入ChatGPT 的應(yīng)用體系。
總體而言,大模型在自然語言處理、圖像識(shí)別、語音識(shí)別等領(lǐng)域取得了顯著成果,帶來更精準(zhǔn)和高效的機(jī)器學(xué)習(xí)和人工智能應(yīng)用。但大模型迅速推廣應(yīng)用引發(fā)一系列隱患,如大模型服務(wù)被惡意利用開展違法犯罪活動(dòng)、協(xié)助罪犯進(jìn)行AI 詐騙。又如部分高校師生利用大模型大量生成文章或研究?jī)?nèi)容,在學(xué)術(shù)造假、學(xué)術(shù)不端的同時(shí),不知不覺侵犯了潛在權(quán)利人的知識(shí)產(chǎn)權(quán)。此外,還引發(fā)了虛假信息傳播、數(shù)據(jù)和隱私信息泄露、偏見歧視等諸多問題。因此,大模型的推廣應(yīng)用,勢(shì)必伴隨著系統(tǒng)規(guī)范建立大模型合規(guī)監(jiān)管體系。
在中國(guó)當(dāng)前監(jiān)管體系下,大模型合規(guī)要素主要涉及范疇包括平臺(tái)運(yùn)營(yíng)合規(guī)、內(nèi)容合規(guī)、平臺(tái)管理合規(guī)、網(wǎng)絡(luò)安全與數(shù)據(jù)合規(guī)、算法技術(shù)合規(guī)、國(guó)際聯(lián)網(wǎng)合規(guī)等方面。
對(duì)上述合規(guī)要素提及的“生成式人工智能技術(shù)”“深度合成技術(shù)”“算法推薦技術(shù)”“具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù)”等大模型合規(guī)重要概念,需要說明的是,大模型的核心概念其實(shí)是“深度學(xué)習(xí)+自動(dòng)生成”,而生成式人工智能技術(shù)、深度合成技術(shù)和算法推薦技術(shù)并非相互獨(dú)立,三者相互配合運(yùn)作才形成完整的大模型結(jié)構(gòu)。同時(shí),在滿足一定條件情況下,基于生成式人工智能技術(shù)、深度合成技術(shù)和算法推薦技術(shù)所提供的服務(wù)會(huì)成為具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù),而該等服務(wù)需要滿足特殊的合規(guī)要求。
大模型服務(wù)提供者,即利用大模型技術(shù)提供服務(wù)的組織、個(gè)人。具體來講,大模型服務(wù)提供者分為以下兩類:平臺(tái)運(yùn)營(yíng)方和技術(shù)支持方。
平臺(tái)運(yùn)營(yíng)方指負(fù)責(zé)大模型的商業(yè)性開發(fā),依據(jù)相關(guān)規(guī)定取得相應(yīng)資質(zhì)證照,承擔(dān)相應(yīng)義務(wù)與責(zé)任,提供大模型技術(shù)應(yīng)用服務(wù)的組織、個(gè)人。在大部分情形下,平臺(tái)運(yùn)營(yíng)方針對(duì)的是面向終端消費(fèi)者的大模型應(yīng)用場(chǎng)景,比如百度文心一格網(wǎng)站、抖音快手的一些AI 特效功能。
技術(shù)支持方指負(fù)責(zé)大模型的技術(shù)性開發(fā)的組織、個(gè)人。技術(shù)支持方是大模型的設(shè)計(jì)者、開發(fā)者和完成者,掌握著大模型背后的核心算法和運(yùn)行規(guī)則,負(fù)責(zé)處理數(shù)據(jù)訓(xùn)練、生成內(nèi)容標(biāo)記、模型優(yōu)化等技術(shù)性事項(xiàng)。在大部分情形下,技術(shù)支持方針對(duì)的是面向企業(yè)的大模型應(yīng)用場(chǎng)景,通常以API 形式為企業(yè)等提供大模型技術(shù)支持。
在《深度合成管理規(guī)定》中,合規(guī)主體分為“深度合成服務(wù)提供者”和“深度合成服務(wù)技術(shù)支持者”,分別對(duì)應(yīng)上述“平臺(tái)運(yùn)營(yíng)方”和“技術(shù)支持方”;而 《AIGC暫行辦法》《算法推薦管理規(guī)定》等相關(guān)法律法規(guī),均未對(duì)“生成式人工智能服務(wù)提供者”“算法推薦服務(wù)提供者”進(jìn)行進(jìn)一步區(qū)分。盡管如此,根據(jù)該等規(guī)定項(xiàng)下“人工智能服務(wù)提供者”“算法推薦服務(wù)提供者”責(zé)任和義務(wù)相關(guān)的具體規(guī)定,“平臺(tái)運(yùn)營(yíng)方”和“技術(shù)支持方”同樣需要依據(jù)其提供的服務(wù)內(nèi)容及類型承擔(dān)不同責(zé)任和義務(wù)。例如,負(fù)責(zé)模型訓(xùn)練的技術(shù)支持方,應(yīng)當(dāng)確保訓(xùn)練數(shù)據(jù)的來源合法合規(guī),而不參與模型訓(xùn)練、不涉及訓(xùn)練數(shù)據(jù)處理活動(dòng)的平臺(tái)運(yùn)營(yíng)方應(yīng)當(dāng)對(duì)技術(shù)支持方提供的模型進(jìn)行必要合規(guī)審查,要求技術(shù)支持方對(duì)訓(xùn)練數(shù)據(jù)來源的合法合規(guī)性進(jìn)行陳述保證等。
CFP
根據(jù)《AIGC 暫行辦法》,行業(yè)組織、企業(yè)、教育和科研機(jī)構(gòu)、公共文化機(jī)構(gòu)、有關(guān)專業(yè)機(jī)構(gòu)等研發(fā)、應(yīng)用生成式人工智能技術(shù),未向境內(nèi)公眾提供生成式人工智能服務(wù)的,不適用本辦法的規(guī)定(第二條)。需要遵守相關(guān)大模型合規(guī)義務(wù)的主體,指向境內(nèi)公眾提供服務(wù)的大模型服務(wù)提供者。若上述主體未向境內(nèi)公眾提供服務(wù)的,則不適用大模型相關(guān)合規(guī)規(guī)定。
基于前述規(guī)定,實(shí)踐中出現(xiàn)了僅面向企業(yè)端提供大模型應(yīng)用服務(wù)的大模型服務(wù)提供者是否可適用前述規(guī)定、豁免相關(guān)合規(guī)義務(wù)的討論。從該條款目的來看,加強(qiáng)大模型的合規(guī)與監(jiān)管要求旨在規(guī)范公共層面的數(shù)據(jù)流通、傳播,避免重要、敏感信息泄露以及防止違法、虛假信息和內(nèi)容在社會(huì)層面廣泛傳播。因此,如果大模型服務(wù)提供者僅面向特定企業(yè)提供服務(wù),且該企業(yè)僅在企業(yè)內(nèi)部使用大模型服務(wù),不會(huì)導(dǎo)致大模型服務(wù)成果向公眾流通,則有可能并不適用相關(guān)合規(guī)義務(wù)。
然而,若大模型服務(wù)提供者(“A 主體”)作為技術(shù)支持方自研大模型,向中國(guó)境內(nèi)的另一作為平臺(tái)運(yùn)營(yíng)方的大模型服務(wù)提供者(“B 主體”)提供大模型技術(shù)接口并收取技術(shù)服務(wù)費(fèi),接入大模型技術(shù)接口的B主體進(jìn)而面向中國(guó)境內(nèi)的消費(fèi)者提供大模型應(yīng)用服務(wù),對(duì)此,筆者傾向于認(rèn)為,A 主體與B 主體均需要履行相關(guān)合規(guī)義務(wù)。