摘" 要:隨著AI技術(shù)的迅猛發(fā)展,視頻生成大模型開始走入大眾視野。然而,其廣泛應(yīng)用也帶來了全新的問題,包括技術(shù)、倫理、法律等重大挑戰(zhàn)。為應(yīng)對其風(fēng)險,各相關(guān)方需持續(xù)改進(jìn)技術(shù)、推進(jìn)倫理與社會責(zé)任建設(shè)、強(qiáng)化法律與政策監(jiān)管、構(gòu)建行業(yè)生態(tài)和風(fēng)險預(yù)警體系。
關(guān)鍵詞:視頻生成大模型" " "人工智能" " "潛在風(fēng)險" " "發(fā)展策略
2024年7月,黨的二十屆三中全會審議通過的《決定》提出“完善生成式人工智能發(fā)展和管理機(jī)制”。2025年3月,李強(qiáng)總理在政府工作報告中強(qiáng)調(diào),持續(xù)推進(jìn)“人工智能+”行動,支持大模型廣泛應(yīng)用。當(dāng)前,生成式人工智能(Generative AI)的應(yīng)用邊界正在飛速拓寬。在生成文字、圖片的基礎(chǔ)上,視頻生成大模型也成為業(yè)內(nèi)外關(guān)注的熱點。該技術(shù)被認(rèn)為將顛覆視頻內(nèi)容制作的現(xiàn)有格局和創(chuàng)作方式。在影視制作、廣告、社交媒體、教育等行業(yè),視頻生成大模型正加速迭代,顯著提升了內(nèi)容創(chuàng)作的效率和質(zhì)量。
然而,視頻生成技術(shù)的應(yīng)用也伴隨潛在的社會風(fēng)險與倫理挑戰(zhàn),對社會信任體系、法律法規(guī)、倫理道德的沖擊絕對不容忽視。習(xí)近平總書記在2019年9月國家網(wǎng)絡(luò)安全宣傳周上做出重要指示:“要堅持促進(jìn)發(fā)展和依法管理相統(tǒng)一,既大力培育人工智能、物聯(lián)網(wǎng)、下一代通信網(wǎng)絡(luò)等新技術(shù)新應(yīng)用,又積極利用法律法規(guī)和標(biāo)準(zhǔn)規(guī)范引導(dǎo)新技術(shù)應(yīng)用?!鄙钊敕治鲆曨l生成大模型的發(fā)展現(xiàn)狀、潛在風(fēng)險及應(yīng)對策略,不僅具有現(xiàn)實意義,也蘊(yùn)含經(jīng)濟(jì)和社會價值。
一、視頻生成大模型的發(fā)展現(xiàn)狀
視頻生成大模型依托深度學(xué)習(xí)技術(shù),能夠?qū)崿F(xiàn)高質(zhì)量視頻內(nèi)容的自動化生成。這類模型通過對海量視頻數(shù)據(jù)的學(xué)習(xí)和分析,能夠根據(jù)用戶提供的文本、圖像或其他形式的輸入信息,輸出符合特定需求的視頻內(nèi)容。
近年來,視頻生成產(chǎn)業(yè)呈現(xiàn)出迅猛發(fā)展的態(tài)勢。2024年2月15日,OpenAI正式對外發(fā)布了Sora視頻生成模型。在演示案例中,Sora展示了對現(xiàn)實世界的高度仿真能力。憑借優(yōu)秀的演示效果,Sora迅速吸引了業(yè)內(nèi)外的廣泛關(guān)注。其他國際企業(yè)也紛紛推出了各自的產(chǎn)品,如Veo、Runway、Meta Movie Gen等。不可否認(rèn),國際企業(yè)在技術(shù)路徑和應(yīng)用場景上進(jìn)行了大量的有益探索。然而,由于文化背景、語境理解和用戶需求的差異,國外視頻模型尚難以滿足國內(nèi)用戶的多樣化需求。
在此背景下,眾多國內(nèi)企業(yè)迅速跟進(jìn),積極投身視頻生成大模型這一熱門賽道。2024年4月,生數(shù)科技與清華大學(xué)聯(lián)合發(fā)布Vidu模型,拉開了國產(chǎn)視頻大模型的序幕。字節(jié)跳動推出的“即夢AI”,在傳統(tǒng)視頻生成功能的基礎(chǔ)上,創(chuàng)新性地融入了故事模式,為用戶帶來了全新的體驗??焓滞瞥龅摹翱伸`”,主打?qū)ξ锢硎澜绲母呔饶M,進(jìn)一步提升了生成內(nèi)容的真實感。阿里的“尋光”、百度的UniVG及騰訊的混元模型也已經(jīng)成為業(yè)內(nèi)的重要力量。除了這些科技巨之外,國內(nèi)的創(chuàng)業(yè)公司也來勢洶洶。例如,智譜AI推出的CogVideoX,已向用戶開放了“清影”視頻生成功能。從聊天機(jī)器人到智能體再到視頻生成,智譜華章實現(xiàn)了與OpenAI產(chǎn)品群的全面對標(biāo)。
當(dāng)下,視頻生成大模型在商業(yè)領(lǐng)域及非商業(yè)領(lǐng)域均取得一定進(jìn)展。在商業(yè)端,視頻生成技術(shù)已然被廣泛應(yīng)用于綜藝、影視制作中。以綜藝節(jié)目《歌手2024》為例,片頭視頻借助AI視頻生成技術(shù),營造出了具有視覺沖擊力的呈現(xiàn)效果。在非商業(yè)端,視頻生成大模型極大地豐富了社交媒體及視頻平臺上的內(nèi)容生態(tài)。例如,AI生成的《甄嬛傳》二創(chuàng)視頻不僅具有較高的傳播度,還激發(fā)了更多網(wǎng)友的創(chuàng)作熱情。
AI視頻生成產(chǎn)業(yè)目前正處于快速發(fā)展的階段。國內(nèi)外企業(yè)在技術(shù)探索和應(yīng)用落地方面齊頭并進(jìn)。無論是商業(yè)變現(xiàn),還是非商業(yè)化的創(chuàng)意表達(dá),視頻生成技術(shù)都在不斷拓展邊界,逐步改變大眾的內(nèi)容創(chuàng)作方式。2025年3月,國家網(wǎng)信辦發(fā)布《人工智能生成合成內(nèi)容標(biāo)識辦法》,提出對AI生成內(nèi)容的詳細(xì)標(biāo)識要求。該辦法能更好地幫助用戶辨別AI生成的視頻。這為我國視頻生成技術(shù)健康發(fā)展奠定了堅實的政策基礎(chǔ)。
二、視頻生成大模型的風(fēng)險分析
(一)技術(shù)風(fēng)險
數(shù)據(jù)質(zhì)量會直接影響生成視頻內(nèi)容的準(zhǔn)確度與價值導(dǎo)向。此類模型都依賴巨量的訓(xùn)練數(shù)據(jù)。而這些數(shù)據(jù)并非是完美的、無偏的。例如,某些族群或文化的內(nèi)容占比過高或過低,均會導(dǎo)致生成結(jié)果帶有偏見。這種情況并非杞人憂天,而是已有現(xiàn)實案例加以印證。2016年3月,微軟公司推出的聊天機(jī)器人Tay就因訓(xùn)練數(shù)據(jù)中包含偏見內(nèi)容,在上線不到24小時內(nèi)便“發(fā)表”了具有種族主義傾向的言論,被迫下線。此事件警示我們:數(shù)據(jù)質(zhì)量不佳影響的不僅是使用體驗,還可能對社會公序良俗帶來沖擊。
資源消耗過大的問題也日益凸顯。以ChatGPT為例,每天運營需消耗超過50萬度電力,其用電量相當(dāng)于1.7萬個美國家庭一天的用電量。而視頻生成大模型在算力消耗上更是有過之而無不及。這不僅對生態(tài)環(huán)境構(gòu)成潛在威脅,還限制了中小企業(yè)和學(xué)術(shù)機(jī)構(gòu)的參與。視頻大模型開發(fā)可能導(dǎo)致巨量的碳排放。若缺乏節(jié)能型算法的加持,AI視頻生成技術(shù)的長期發(fā)展將難以解決資源有限與環(huán)境友好的矛盾。
(二)倫理與社會風(fēng)險
深度偽造技術(shù)濫用是最為突出的倫理風(fēng)險之一。視頻生成技術(shù)能以高度逼真的方式模擬人類的面部表情、聲音語調(diào)甚至說話習(xí)慣。這導(dǎo)致該技術(shù)可能被用于侵犯隱私、誹謗、欺詐等不良用途。例如,2024年9月發(fā)生的“三只羊錄音門”事件經(jīng)過警方調(diào)查發(fā)現(xiàn),廣泛流傳的音視頻其實是犯罪嫌疑人王某某通過AI技術(shù)偽造的。這一事件引發(fā)了公眾對個人隱私和信息安全的深度擔(dān)憂。
AI生成視頻衍生出的虛假信息問題則可能加劇社會的不穩(wěn)定。目前,視頻生成門檻正不斷降低。大量未經(jīng)驗證的內(nèi)容可能涌入社交或視頻平臺。公眾對影像真實性的判斷將變得愈發(fā)困難,甚至官方發(fā)布的權(quán)威信息也可能受到網(wǎng)民質(zhì)疑。例如,2025年3月5日,新疆阿克蘇地區(qū)發(fā)生4.5級地震。震后僅3小時,某短視頻平臺便出現(xiàn)了由AI技術(shù)拼接的房屋坍塌圖像,并配以方言配音的“災(zāi)民呼救”視頻。經(jīng)核實,該視頻為造謠者利用AI拼接網(wǎng)絡(luò)舊圖,并添加與此次地震無關(guān)的音視頻,發(fā)布虛假信息以誤導(dǎo)公眾。此類虛假信息的傳播不僅容易引發(fā)公眾恐慌,也給社會治理帶來巨大挑戰(zhàn)。
(三)法律與監(jiān)管風(fēng)險
在眾多法律問題中,版權(quán)與知識產(chǎn)權(quán)的爭議最為突出。AI根據(jù)用戶提示詞(Prompt)生成的視頻是否屬于原創(chuàng)作品?其訓(xùn)練階段是否侵犯了他人享有版權(quán)的素材?生成內(nèi)容中涉及現(xiàn)實人物時,肖像權(quán)該如何界定?這些問題至今仍缺乏統(tǒng)一明確的法律解釋。特別是當(dāng)相關(guān)內(nèi)容被用于商業(yè)時,收益歸屬的問題會變得更加尖銳,甚至可能引發(fā)大量法律糾紛。
隱私保護(hù)的問題也日益嚴(yán)峻。AI目前已能夠生成極具欺騙性的虛假影像。這可能誘發(fā)身份偽造、惡意造謠、勒索等犯罪行為,潛藏著巨大的社會隱患。2024年6月20日,北京互聯(lián)網(wǎng)法院一審宣判了北京市首例“AI換臉”軟件侵權(quán)案件。該案例說明這項技術(shù)很可能正演變?yōu)榍址鸽[私而牟利的工具。
監(jiān)管層面的挑戰(zhàn)同樣不容小覷。目前,AI技術(shù)發(fā)展的步伐已遠(yuǎn)超監(jiān)管體系的響應(yīng)速度。這使得傳統(tǒng)監(jiān)管難以及時應(yīng)對新的風(fēng)險。而AI視頻生成具有天然的跨境屬性,影響范圍可能突破國界。一個國家某個企業(yè)或個人生成的深度偽造視頻,可能在另一國家引發(fā)一系列負(fù)面影響??鐕鴤鞑サ奶卣髌仁垢鲊诒O(jiān)管合作上必須達(dá)成更高層次的協(xié)同。全球監(jiān)管合作的難度前所未有。
三、視頻生成大模型的風(fēng)險應(yīng)對與發(fā)展策略
(一)持續(xù)提升技術(shù)水平
企業(yè)在AI模型開發(fā)中應(yīng)格外重視數(shù)據(jù)采集的多樣性。數(shù)據(jù)集的多樣化程度會直接影響模型的公平性。具體來說,企業(yè)應(yīng)盡可能避免過度依賴單一或較小規(guī)模的數(shù)據(jù)源。以國內(nèi)AI數(shù)據(jù)提供商海天瑞聲為例,該公司已能實現(xiàn)在全球進(jìn)行多場景圖像、視頻采集,很大程度解決“數(shù)據(jù)孤島”難題。然而,僅擁有高質(zhì)量、多樣化的數(shù)據(jù)集尚不足以完全解決AI公平性問題。企業(yè)研發(fā)部門還需對數(shù)據(jù)實施嚴(yán)格的質(zhì)量把關(guān),剔除可能導(dǎo)致偏見的樣本,從而在源頭上減少生成內(nèi)容中的不公平問題。
開發(fā)節(jié)能型算法是另一個重要方向。隨著人工智能的爆發(fā)性增長,其對生態(tài)環(huán)境的壓力激增。“綠色AI”不是一句口號,而是未來的大趨勢。近期國產(chǎn)DeepSeek R1大模型的巨大成功,一定程度上就基于優(yōu)秀節(jié)能的算法設(shè)計。DeepSeek的算法優(yōu)化策略大大降低了訓(xùn)練成本和能耗。由此可見,持續(xù)優(yōu)化算法能效比,降低算力消耗,才是視頻生成產(chǎn)業(yè)行穩(wěn)致遠(yuǎn)、健康發(fā)展的重要保證。
(二)加強(qiáng)倫理與社會責(zé)任建設(shè)
強(qiáng)化開發(fā)者的倫理意識。在研發(fā)中,開發(fā)者不僅要在技術(shù)上考慮“能不能做”,也要從倫理角度思考“應(yīng)不應(yīng)該做”。技術(shù)團(tuán)隊需始終堅持“技術(shù)向善”的原則,將社會責(zé)任納入技術(shù)開發(fā)的全生命周期。通過制定嚴(yán)格的倫理準(zhǔn)則與行為守則,確保在技術(shù)創(chuàng)新的同時盡可能降低倫理風(fēng)險。
建立健全內(nèi)容生成與審核機(jī)制。為了防止AI視頻生成技術(shù)被濫用,企業(yè)必須在模型生成環(huán)節(jié)引入內(nèi)容審核機(jī)制。例如,開發(fā)者可通過嵌入式算法在視頻生成過程中實時監(jiān)測生成結(jié)果的合規(guī)性,并對可能引發(fā)爭議的內(nèi)容進(jìn)行自動過濾。然而,單純的機(jī)器算法仍不能完全識別視頻中的隱含內(nèi)容。視頻平臺還需建立多層次的人工審核體系,確保生成結(jié)果符合社會價值觀與道德準(zhǔn)則。
提升公眾對AI生成視頻的認(rèn)知。普通網(wǎng)民(特別是中老年、青少年群體)對生成視頻的辨別能力相對有限。這為虛假信息傳播、詐騙勒索等違法犯罪行為提供了可乘之機(jī)。主流媒體、平臺公司有責(zé)任將AI科普納入公共教育體系,以提升公眾對AI生成視頻的認(rèn)知。此舉既能降低新型違法犯罪的發(fā)生率,更能營造有利于視頻生成產(chǎn)業(yè)發(fā)展的輿論氛圍。
(三)強(qiáng)化法律、政策監(jiān)管
AI技術(shù)的發(fā)展速度已遠(yuǎn)超傳統(tǒng)法律法規(guī)的反應(yīng)速度。制定視頻生成的專門法和行業(yè)標(biāo)準(zhǔn)勢在必行。特別是在涉及隱私權(quán)、肖像權(quán)、知識產(chǎn)權(quán)等方面,傳統(tǒng)條款均已不再適用。對于AI生成視頻,應(yīng)實行強(qiáng)制標(biāo)識制度,確保用戶擁有人工智能時代的“知情權(quán)”。
加強(qiáng)國際合作,推動全球監(jiān)管體系的建立。由于視頻生成技術(shù)具有跨國界的特點,任何單一國家的監(jiān)管都無法應(yīng)對跨境生成內(nèi)容帶來的復(fù)雜風(fēng)險。我國需以更加開放的姿態(tài)參與國際合作,推動共建全球統(tǒng)一的監(jiān)管機(jī)制。這不僅關(guān)乎國家的技術(shù)主權(quán),也是全球數(shù)字治理的共同責(zé)任。我國在這一領(lǐng)域應(yīng)更加有為,既要參與規(guī)則制定,也要輸出“中國標(biāo)準(zhǔn)”和“中國模式”。
(四)完善行業(yè)生態(tài)系統(tǒng)
AI視頻生成產(chǎn)業(yè)的健康發(fā)展離不開一個開放、合作的行業(yè)生態(tài)共同體。在技術(shù)發(fā)展日新月異的今天,行業(yè)內(nèi)卷、惡性競爭不具備可持續(xù)性。推動建設(shè)AI視頻生態(tài)、實現(xiàn)共榮共贏已成為業(yè)內(nèi)共識。
著力推動開放合作與技術(shù)共享。AI視頻生成技術(shù)的研發(fā)成本高昂。單一企業(yè)或機(jī)構(gòu)都難以獨立承擔(dān)所有開發(fā)任務(wù)。只有通過建立開放的合作平臺,促進(jìn)企業(yè)、高校、研究機(jī)構(gòu)資源共享與技術(shù)交流,才能進(jìn)一步加速行業(yè)技術(shù)的整體進(jìn)步。龍頭企業(yè)應(yīng)發(fā)揮引領(lǐng)作用,可具體采用“大企業(yè)提需求,小企業(yè)揭榜”的模式。
支持更多中小企業(yè)參與行業(yè)生態(tài)建設(shè)。目前,AI視頻大模型的研發(fā)仍由少數(shù)科技巨頭主導(dǎo)。而中小企業(yè)由于資金、技術(shù)限制,往往容易處于弱勢地位。但深度求索、月之暗面、智譜華章等企業(yè)的成功恰恰說明中小微企業(yè)在AI領(lǐng)域完全具備單點突破、后來居上的可能。下一步,各級政府和行業(yè)協(xié)會可通過政策扶持、資金資助等方式,更大力度幫助中小企業(yè)參與構(gòu)建均衡的行業(yè)生態(tài)。
(五)建立風(fēng)險評估與預(yù)警體系
建立全面的風(fēng)險評估框架。相關(guān)監(jiān)管機(jī)構(gòu)應(yīng)深入評估視頻生成技術(shù)在新聞傳播、教育、娛樂、廣告等不同應(yīng)用場景中的潛在影響?;诓煌L(fēng)險,監(jiān)管方可出臺分級分類的應(yīng)對方案。
完善實時監(jiān)測與預(yù)警機(jī)制。監(jiān)管機(jī)構(gòu)及企業(yè)完全可以依托人工智能本身識別算法的優(yōu)勢,以AI監(jiān)測AI,實現(xiàn)自動化、全天候的管理。例如,視頻平臺可通過模式識別算法檢測生成內(nèi)容是否涉及敏感信息或違禁內(nèi)容。一旦發(fā)現(xiàn)異常,系統(tǒng)應(yīng)立即觸發(fā)預(yù)警機(jī)制,向平臺方、內(nèi)容上傳者及其他用戶發(fā)送警示信息,并視情況采取視頻下架、賬戶限制等措施。
參考文獻(xiàn):
[1]王紹源,楊東航.文生視頻大模型Sora賦能醫(yī)療衛(wèi)生的倫理探討[J].中國醫(yī)學(xué)倫理學(xué),2025(02):195-200.
[2]羅霄,趙伯祚.2024生成式AI圖像模型年報[J].藝術(shù)學(xué)研究,2025(01):145-156.
[3]黃玥,黃澤森.從Sora看生成式AI虛假信息引發(fā)的網(wǎng)絡(luò)輿情風(fēng)險及應(yīng)對治理策略[J].廣東公安科技,2024,32(04):12-14.
(作者單位:中共內(nèi)江市委黨校)
責(zé)任編輯:康偉