夏曉暉
著名科幻電影《銀翼殺手2049》中,數(shù)字人喬伊每天陪男主吃飯聊天,仿佛就是他真實存在的女友?,F(xiàn)在,隨著AI技術(shù)的進步,曾經(jīng)虛無縹緲的喬伊,或許正從科幻電影走向現(xiàn)實世界。
2022年,在元宇宙概念的加持下,數(shù)字人曾是人氣最高的風(fēng)口之一。2023年ChatGPT橫空出世,資本的熱情一夜間轉(zhuǎn)移給了AIGC。
數(shù)字人看似過氣。然而4月以來,“AI孫燕姿”火遍全網(wǎng),多條視頻播放量破百萬,號稱《銀翼歌手2023》。盡管面臨版權(quán)方面的爭議,但其存在本身已證明了AI賦予數(shù)字人靈魂的廣闊潛力,新一輪的市場爆發(fā)就在眼前。
映宇宙集團是國內(nèi)互聯(lián)網(wǎng)平臺中率先擁抱元宇宙與數(shù)字人的平臺之一。2022年6月,以直播起家的映客互娛集團進行全面品牌升級,更名為“映宇宙集團”,并推出數(shù)字代言人“映映”。映映正式出道至今已近周年,在直播、短視頻平臺上擁有大量粉絲,也頻頻亮相各大媒體與行業(yè)活動,是業(yè)界數(shù)字人中發(fā)展較為全面和穩(wěn)定的代表IP。
大多數(shù)人認為,數(shù)字人是伴隨元宇宙概念而興起的。但事實上,其發(fā)軔至少可以上溯至幾十年前。醫(yī)學(xué)領(lǐng)域上早有數(shù)字人概念,主要是通過采集人體數(shù)據(jù),對數(shù)據(jù)做精細斷層處理,從而形成數(shù)字化人體結(jié)構(gòu),應(yīng)用于人體解剖等醫(yī)學(xué)范疇。
目前大眾所熟知的數(shù)字人,主要是基于網(wǎng)絡(luò)范疇,通過動作捕捉、三維建模、語音合成等互聯(lián)網(wǎng)技術(shù),呈現(xiàn)出虛擬立體的人,并被賦予智能化、情感化、思想化的特征。網(wǎng)絡(luò)數(shù)字人從上世紀80年代初到現(xiàn)在,已歷經(jīng)約四十年的發(fā)展,演進過程分為紙片人階段、真人驅(qū)動階段、AI驅(qū)動階段。同時,數(shù)字形象也經(jīng)歷了從有外形皮囊,到有人設(shè)靈魂,再到AI 內(nèi)核逐漸累加的過程。
在紙片人階段,以日本1982年的動漫《超時空要塞》女主林明美為例,受限于當(dāng)時的技術(shù),動畫形象主要通過手工繪制,網(wǎng)友是無法與其直接互動的。到了目前應(yīng)用最多的真人驅(qū)動階段,大多數(shù)IP則披著數(shù)字形象的外皮,以動作捕捉設(shè)備實時驅(qū)動背后的中之人,方能與用戶進行演繹互動。在AI賦能下,數(shù)字人的交互能力則可以體現(xiàn)出讓人驚艷的可靠性、高效性和邏輯性,更好地打造虛實共生空間,目前主要應(yīng)用于各種演唱會等線下活動,帶給人十足的沉浸感。
從2018年到2023年,數(shù)字人的市場規(guī)模強勢增長。據(jù)全球知名數(shù)據(jù)洞察與咨詢公司 Kantar 的一項調(diào)查顯示,過去一年,36%的用戶看過虛擬偶像表演;2023年,45%的廣告商有意愿邀請數(shù)字人表演或參加品牌活動。
數(shù)字人的商業(yè)價值還有龐大的開發(fā)空間。根據(jù)中國演出行業(yè)協(xié)會今年5月發(fā)布的《中國網(wǎng)絡(luò)表演(直播與短視頻)行業(yè)發(fā)展報告(2022-2023)》:2022 年度虛擬數(shù)字人行業(yè)發(fā)展迅速,我國現(xiàn)有虛擬數(shù)字人相關(guān)企業(yè)近60萬家,近半數(shù)企業(yè)成立于近一年。
當(dāng)前,關(guān)于數(shù)字人的市場應(yīng)用可分為以功能為主的“服務(wù)型數(shù)字人”和以表演為主的“偶像型數(shù)字人”?!胺?wù)型數(shù)字人”能替代重復(fù)性高的人工勞動,如智能客服、虛擬助手等。除了標準化和規(guī)范化之外,其價值體現(xiàn)在可以全天候?qū)崟r服務(wù),提高工作效率,為企業(yè)降本增效。例如,萬科的首位數(shù)字員工“崔筱盼”,上線后便開始負責(zé)催辦企業(yè)的預(yù)付應(yīng)收逾期單。
這類數(shù)字人可控性強,不會因為突發(fā)情況影響工作,且全年無休,24小時待崗。更重要的是,模型研發(fā)成功后,復(fù)制多個落地的邊際成本也降低。
“偶像型數(shù)字人”如洛天依、A-soul女團、柳夜熙等IP,活躍在游戲、社交、文娛演出、短視頻和直播等泛娛樂領(lǐng)域,話題度與熱度較高。這類數(shù)字人被賦予了人設(shè)靈魂,還有多項技能傍身。以映映為例,她在成為映宇宙數(shù)字代言人之前,曾出演過動漫《芯覺》中的女主角“念念”,積累起自己的粉絲群體。近一年來不斷活躍于社交媒體平臺和行業(yè)論壇的“履歷”,也讓這個高顏值數(shù)字人進一步擴大了自己的粉絲圈層和影響力。
未來隨著AI技術(shù)賦能,映宇宙希望她生長出更多可能性,比如嘗試品牌代言、直播帶貨、參演影視或音樂作品等等。映宇宙給映映的身份定位是多元的,她既能是品牌代言人,又是虛擬主播、虛擬藝人。
數(shù)字人具體的應(yīng)用場景和商業(yè)化手段也極為豐富。主要以品牌代言、視頻直播、數(shù)字資產(chǎn)和數(shù)字衍生品為主,并不斷滲透到文娛、金融、電商、醫(yī)療多個產(chǎn)業(yè)領(lǐng)域。對于大多數(shù)品牌方而言,數(shù)字人在口碑方面擁有更強的穩(wěn)定性,能夠有效避免真人明星突然人設(shè)崩塌帶來的品牌危機。
毋庸諱言,數(shù)字人行業(yè)曾面臨一段為時不短的瓶頸期。時至今日,數(shù)字人在技術(shù)成本、交互體驗、內(nèi)容生態(tài)等方面依然存在亟待解決的痛點。
首先,制作數(shù)字人的硬件與技術(shù)還遠遠達不到普及標準。一個優(yōu)質(zhì)數(shù)字人的誕生,往往要數(shù)家公司合力完成整個鏈路,環(huán)節(jié)相對割裂,時間也較為緩慢。越精致、越擬真的“皮囊”制作成本越高,動輒幾十萬、上百萬的成本只有頭部機構(gòu)和企業(yè)能承擔(dān)。對大多數(shù)的中小型企業(yè)及個人而言,精致的數(shù)字形象尚屬“奢侈品”。以至于市面上數(shù)字形象雖多,卻要么同質(zhì)化嚴重,要么精度質(zhì)量參差不齊。
其次,數(shù)字人與真人的交互體驗不夠順暢,和落地場景的融合不夠深入。目前雖然出現(xiàn)很多AI數(shù)字人帶貨的案例,但幾乎都是“冷酷無情的產(chǎn)品介紹機器”,流水線式的帶貨方式很難讓人產(chǎn)生信任感,更遑論真實的貨品體驗。數(shù)字人主播如何能把口紅涂在嘴上;把水果切開、吃到嘴里?整個數(shù)字人行業(yè)都在思考這些問題,因為一旦有了解決方案,將是打破虛實空間的劃時代之舉。
最后,圍繞數(shù)字人的內(nèi)容生態(tài)尚未形成。一些數(shù)字人亮相初期走過高舉高打的路線,確實驚艷了一大批粉絲,但涉及數(shù)字人的內(nèi)容,制作成本都很高,制作周期也偏長,優(yōu)質(zhì)內(nèi)容難以為繼。對這個行業(yè)來說,新一輪洗牌期朝夕可至,炒噱頭、炒流量的做法很容易被淘汰。只有探索出一條能讓數(shù)字人穩(wěn)定輸出優(yōu)質(zhì)內(nèi)容的路徑,其商業(yè)價值和社會影響力才能持續(xù)釋放。而AI技術(shù)的爆發(fā),讓數(shù)字人行業(yè)終于看到更光明的前景。
王小川這樣評價AI的到來:“地動山搖、天崩地裂、大時代的變化……我們走出了信息時代或者互聯(lián)網(wǎng)時代,進入到智能時代或者通用人工智能時代,人類進入新的一種文明了”。
所有人都在加緊與技術(shù)賽跑。映宇宙技術(shù)平臺已接入ChatGPT-3.5-Turbo。公司在AIGC領(lǐng)域的探索主要有五大方向:數(shù)字人直播、互動社交、AI音樂、AI劇本和AI運營。五大方向并非各自獨立,而是互相賦能、協(xié)同前進。
以數(shù)字人“映映”為例,目前映映采取中之人驅(qū)動的方式進行日常直播,在映客直播等平臺陪伴粉絲。但這一形式無法做到時時陪伴,直播內(nèi)容也大多取決于中之人的個人藝能水平。隨著未來映宇宙將在直播中接入人工智能,這一局面將顯著改善,數(shù)字人映映可以實現(xiàn)每天24小時全天候互動。
AI能為數(shù)字人做的不止于此。多模態(tài)AI技術(shù)將使數(shù)字人交互能力更上一個臺階,感知能力、思維決策、內(nèi)容輸出能力都得到顯著改善,在思想、語言、行為上和真人更加接近、更加智能化。一個以此為底層技術(shù)的數(shù)字人主播,完全可以對粉絲做到有問必答、有求必應(yīng),甚至真正做到千人千面的“個性化定制陪伴”。
此外,AI繪畫、AI聲音等技術(shù),也讓數(shù)字人產(chǎn)業(yè)看到了產(chǎn)品快速普及的希望。眾所周知,供給側(cè)的降本增效對于產(chǎn)業(yè)擴大化有著決定性影響。如果以AI技術(shù)覆蓋數(shù)字人的生產(chǎn)全流程,其意義將不亞于移動網(wǎng)絡(luò)時代智能終端的普及。
數(shù)字人的核心在于交互,這是整個行業(yè)的共識。隨著AI的發(fā)展,大規(guī)模語言模型可以解決數(shù)字人的實時交互和內(nèi)容生產(chǎn)問題,將功能性AI數(shù)字人和偶像型AI數(shù)字人進行有效結(jié)合,既可以實現(xiàn)全天實時輸出,又能夠保證個性化定制人設(shè)特性。這也是未來映宇宙集團數(shù)字人映映的主要發(fā)展路徑。
AI數(shù)字人的出現(xiàn),標志著虛擬數(shù)字人行業(yè)進入全新發(fā)展階段。隨著數(shù)字孿生技術(shù)的進步,技術(shù)和人力成本的降低,更多個體或許能很快擁有自己的數(shù)字孿生體,社會真正邁向虛實共生。
當(dāng)然,數(shù)字人結(jié)合AI技術(shù)應(yīng)用,也會帶來一些安全風(fēng)險。2018年圖靈獎得主Geoffrey Hinton曾表示,非常擔(dān)憂AI所帶來的虛假信息傳播。這并非空穴來風(fēng),網(wǎng)絡(luò)上曝出的以人臉、聲音合成技術(shù)為手段進行詐騙的活動也屢見不鮮。因此,在進一步規(guī)?;瘧?yīng)用之前,數(shù)字人技術(shù)的安全性保障、數(shù)字人運營團隊權(quán)限的可控性、相關(guān)部門的立法監(jiān)管等方面都有待完善。
整體來看,隨著AI技術(shù)的演進和應(yīng)用場景的擴大,數(shù)字人將會加快實現(xiàn)“智慧與美貌并存”,人類或許即將迎來真正的“智慧時代”。與此同時,如何利用AI建設(shè)好生態(tài)、如何建立行業(yè)規(guī)范標準、健全監(jiān)管制度,也將成為這個新生產(chǎn)業(yè)發(fā)展的關(guān)鍵所在。
作者系映宇宙集團高級副總裁、總編輯
【編輯:左志新】