張宏羽
“Sora”演示視頻截圖
2023年,人工智能大語言模型“ChatGPT”憑借強大的自然語言處理能力和對上下文理解的深度“爆火”,給沉寂多年的人工智能行業(yè)撕開了一道口子。彼時,奇績論壇創(chuàng)始人陸奇就已預(yù)測,未來大模型無處不在,是技術(shù)世界中的“全新物種”。
時下,人工智能浪潮愈發(fā)涌動,“無處不在”的預(yù)言初見端倪:2024年2月,人工智能視頻生成類模型“Sora”將技術(shù)推到了一個全新的視覺維度,其可以根據(jù)用戶輸入的提示詞,生成長達一分鐘的高清視頻,堪稱“指上生花”。在官方公布的演示視頻中,一名時尚女性走在城市街頭,從主要人物到背景人物、從遠處的建筑到近處的地面,具有極強的真實感,連臉部細節(jié)都清晰可見。
當然,“Sora”并非完美,發(fā)布者對此并不避諱,模型在準確模擬復(fù)雜場景的物理特性方面可能會遇到困難,或是無法理解具體的因果關(guān)系實例,還可能會混淆提示的空間細節(jié),并且在處理隨時間發(fā)生事件的精確描述方面也可能存在困難……盡管如此,“Sora”的橫空出世仍被不少業(yè)內(nèi)人士視為人工智能模型領(lǐng)域的一大里程碑。在360創(chuàng)始人周鴻祎看來,“Sora”只是小試牛刀,它展現(xiàn)的不僅僅是視頻制作能力,而是大模型對真實世界有了“理解”和“模擬”之后,會帶來新的成果和突破。
相較于以往的視頻生成類模型,“Sora”甫一誕生,就展現(xiàn)出技術(shù)的新姿態(tài)。中國信息協(xié)會常務(wù)理事、國研新經(jīng)濟研究院創(chuàng)始院長朱克力在接受記者采訪時表示,傳統(tǒng)的生成式人工智能多依賴于預(yù)定義的規(guī)則和算法來生成內(nèi)容,“Sora”則引入更為先進的深度學(xué)習機制,特別是對抗網(wǎng)絡(luò)和自編碼器等技術(shù)。這使得“Sora”在生成內(nèi)容時能夠更好地模擬人類的創(chuàng)造性和直覺。
對于“Sora”的顯著優(yōu)勢和特點,物聯(lián)網(wǎng)產(chǎn)業(yè)專家袁帥從四個方面向記者進行了分析。一是多模態(tài)融合?!癝ora”能夠同時處理文本、圖像和音頻等多種模態(tài)的數(shù)據(jù),實現(xiàn)跨模態(tài)的生成。這種多模態(tài)融合的能力使得其具有全面地理解和表達信息的能力,從而生成更加豐富的視頻內(nèi)容。
二是高度定制化。“Sora”能夠根據(jù)用戶的個性化需求生成定制化的視頻內(nèi)容。用戶可以通過輸入文本描述自己的需求和意圖,“Sora”將這些想法迅速轉(zhuǎn)化為具體的視頻畫面,盡可能滿足用戶的個性化需求。
三是高效率與高質(zhì)量?!癝ora”采用了高效的生成算法和模型架構(gòu),能夠在短時間內(nèi)生成高質(zhì)量的視頻內(nèi)容。這使得其在處理大規(guī)模數(shù)據(jù)集或?qū)崟r生成任務(wù)時具有顯著的優(yōu)勢。
四是可擴展性與靈活性?!癝ora”的架構(gòu)設(shè)計使得它易于擴展和適應(yīng)不同的應(yīng)用場景。通過調(diào)整模型參數(shù)和引入新的功能模塊,其可以適應(yīng)不同的任務(wù)需求和數(shù)據(jù)類型,展現(xiàn)出強大的靈活性和可擴展性。
以“Sora”為代表的視頻生成類模型,展現(xiàn)出在多領(lǐng)域、多場景下的較大潛力和應(yīng)用價值。甚至有業(yè)內(nèi)人士預(yù)測,視頻生成類模型是今年人工智能賽道的主力熱點。
朱克力告訴記者,在娛樂領(lǐng)域,視頻生成類模型可用于自動生成電影預(yù)告片、游戲宣傳視頻等,大大節(jié)省了制作成本和時間。在廣告領(lǐng)域,該模型能夠根據(jù)產(chǎn)品特性和目標受眾快速生成定制化的廣告視頻。在教育領(lǐng)域,可用于制作生動有趣的教學(xué)視頻,幫助學(xué)生更好地理解和掌握知識。此外,在傳媒、體育等領(lǐng)域,視頻生成類模型也能實時生成高質(zhì)量的視頻內(nèi)容,滿足快速傳播的需求。
國內(nèi)一家人工智能企業(yè)產(chǎn)品經(jīng)理打趣道:“年初五迎財神,沒想到?jīng)]過多久迎來了‘Sora?!薄癝ora”的誕生直接拉升了視頻生成類模型的應(yīng)用效果,具體產(chǎn)品落地商業(yè)化的可行性愈發(fā)顯著,這將吸引更多的市場參與者入場。
記者在某投資者互動平臺檢索發(fā)現(xiàn),截至2月21日,圍繞“Sora”的相關(guān)提問已達83條,涉及傳媒、科技、健康、通信、教育、電商、文創(chuàng)等各類上市公司。除近兩成的上市公司回復(fù)稱“暫不涉及‘Sora或多模態(tài)AI業(yè)務(wù)”外,其余公司的回復(fù)中密集出現(xiàn)“加大技術(shù)創(chuàng)新”“適時研發(fā)并布局相關(guān)產(chǎn)品和服務(wù)”“密切關(guān)注發(fā)展機遇”“緊跟市場發(fā)展”等表述。
其中,芒果超媒2月19日回復(fù)投資者提問時表示,此前,公司已經(jīng)組建了AIGC創(chuàng)新應(yīng)用團隊,研發(fā)上線“AIGC HUB”等內(nèi)部應(yīng)用平臺,將AIGC技術(shù)廣泛應(yīng)用于媒資運營、廣告投放、會員互動、視頻剪輯、內(nèi)容生產(chǎn)等業(yè)務(wù)場景。后續(xù),公司將積極探索文生視頻等新興AI技術(shù)在傳媒領(lǐng)域的落地應(yīng)用與業(yè)態(tài)創(chuàng)新。
世紀天鴻2月20日回復(fù)稱,公司始終保持著對“ChatGPT”“Sora”等人工智能大模型發(fā)展與應(yīng)用的積極關(guān)注,目前公司已結(jié)合人工智能技術(shù)推出小鴻助教、筆神作文等相關(guān)教育產(chǎn)品。公司將持續(xù)利用在教育領(lǐng)域的內(nèi)容優(yōu)勢與資源優(yōu)勢,結(jié)合前沿技術(shù)探索人工智能在智慧教育場景的落地與應(yīng)用,實現(xiàn)教育內(nèi)容的人工智能升級,為中小學(xué)師生提供更好的產(chǎn)品與服務(wù)體驗。
浪潮已來,但非盲目跟風。對于行業(yè)上市公司,袁帥認為積極擁抱AI技術(shù)、創(chuàng)新業(yè)務(wù)模式和戰(zhàn)略的同時,還需要建立數(shù)據(jù)驅(qū)動的決策體系,收集和分析用戶數(shù)據(jù)、市場數(shù)據(jù)等,了解用戶需求和市場趨勢,從而制定更加精準和有效的業(yè)務(wù)策略。此外,應(yīng)培養(yǎng)和引進相關(guān)人才,建立專業(yè)團隊,推動人工智能技術(shù)在業(yè)務(wù)中的深入應(yīng)用和創(chuàng)新發(fā)展。隨著技術(shù)的快速發(fā)展和應(yīng)用場景的拓展,相關(guān)政策和法規(guī)也正不斷完善。上市公司需要密切關(guān)注政策和法規(guī)變化,確保業(yè)務(wù)合規(guī)與可持續(xù)發(fā)展。
“Sora”縱然令人感到震撼,也帶給我們更多的思考。
數(shù)據(jù)隱私、版權(quán)問題及生成內(nèi)容的真實性和可信度等問題,早在生成式模型誕生之初,就有所討論。對此,朱克力表示,其一,模型在訓(xùn)練和使用過程中可能會涉及大量用戶數(shù)據(jù),必須確保這些數(shù)據(jù)的安全和隱私不受侵犯。其二,生成的視頻內(nèi)容可能涉及版權(quán)問題,需要明確使用權(quán)限和來源合法性。其三,由于模型生成的內(nèi)容可能具有高度真實感,應(yīng)采取措施防止其被用于傳播虛假信息或誤導(dǎo)公眾。這需要堅持“科技向善”,在技術(shù)設(shè)計、法律法規(guī)和道德準則等多個層面進行綜合考慮和規(guī)范。
近年來,每每人工智能領(lǐng)域出現(xiàn)技術(shù)新突破,緊隨而至的往往是那些尖銳的問題——一批人要失業(yè)了嗎、一眾企業(yè)要被淘汰了嗎?人、機并非簡單的“零和博弈”。戰(zhàn)略定位專家詹軍豪認為,“Sora”的誕生可能會對某些行業(yè)的從業(yè)者產(chǎn)生一定的沖擊,但并不會直接導(dǎo)致他們失業(yè)?!癝ora”并不能完全取代人類制作人員的角色,因為人類制作人員在創(chuàng)意、情感表達等方面具有獨特的優(yōu)勢。此外,“Sora”的推出將催生新的職業(yè)和就業(yè)機會。隨著人工智能技術(shù)的不斷發(fā)展,需要更多的專業(yè)人才來從事相關(guān)的研究、開發(fā)和應(yīng)用工作??傮w來看,可能會對一些傳統(tǒng)職業(yè)的從業(yè)者產(chǎn)生影響,但也將為人類創(chuàng)造更多的就業(yè)機會和發(fā)展空間。
對于可能受到直接影響的廣告?zhèn)髅?、影視制作行業(yè)來說,盤古智庫高級研究員江瀚指出,大模型何嘗不能帶來更多的商業(yè)機會和創(chuàng)新空間呢?與其盲目地抗拒人工智能,不如積極地去理解和利用它。通過不斷學(xué)習和創(chuàng)新,人類可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動其與社會各個領(lǐng)域的深度融合,這才是人工智能時代真正的生存之道。
值得注意的是,人工智能時代,算力將成為關(guān)鍵生產(chǎn)要素。熱潮之下,我們不能忽略背后的“算力缺口”。不少海外企業(yè)和高管人士已經(jīng)將目光聚焦于AI算力上?!癈hatGPT之父”奧爾特曼執(zhí)著于巨額的芯片投資。更有一家名為“Groq”的初創(chuàng)公司試圖以自研芯片在運算速度上挑戰(zhàn)全球GPU巨頭。
在國內(nèi),數(shù)字經(jīng)濟強省浙江,正發(fā)力沖向“算力強省”。其中,作為數(shù)字經(jīng)濟重鎮(zhèn)的杭州,深刻洞察到數(shù)字經(jīng)濟加速發(fā)展時搶抓人工智能機遇的戰(zhàn)略意義,在降低算力成本上謀篇布局,亮出了以算力高質(zhì)量發(fā)展支撐數(shù)字經(jīng)濟高質(zhì)量發(fā)展的雄心。在杭州市新春第一會——“深化改革、強基固本”主題年推進大會上,浙江省委副書記、杭州市委書記劉捷兩次提到“Sora”大模型。按照杭州新春第一會的部署,從加快新型算力中心建設(shè),提供信創(chuàng)云和人工智能算力服務(wù),成為打造人工智能高地的關(guān)鍵基礎(chǔ)設(shè)施;到構(gòu)建通用算力、超算算力和邊緣算力協(xié)同發(fā)展的新型算力體系……一條綜合算力成本最低的改革路線躍然紙上。