夏曉暉
著名科幻電影《銀翼殺手2049》中,數(shù)字人喬伊每天陪男主吃飯聊天,仿佛就是他真實(shí)存在的女友?,F(xiàn)在,隨著AI技術(shù)的進(jìn)步,曾經(jīng)虛無(wú)縹緲的喬伊,或許正從科幻電影走向現(xiàn)實(shí)世界。
2022年,在元宇宙概念的加持下,數(shù)字人曾是人氣最高的風(fēng)口之一。2023年ChatGPT橫空出世,資本的熱情一夜間轉(zhuǎn)移給了AIGC。
數(shù)字人看似過(guò)氣。然而4月以來(lái),“AI孫燕姿”火遍全網(wǎng),多條視頻播放量破百萬(wàn),號(hào)稱《銀翼歌手2023》。盡管面臨版權(quán)方面的爭(zhēng)議,但其存在本身已證明了AI賦予數(shù)字人靈魂的廣闊潛力,新一輪的市場(chǎng)爆發(fā)就在眼前。
映宇宙集團(tuán)是國(guó)內(nèi)互聯(lián)網(wǎng)平臺(tái)中率先擁抱元宇宙與數(shù)字人的平臺(tái)之一。2022年6月,以直播起家的映客互娛集團(tuán)進(jìn)行全面品牌升級(jí),更名為“映宇宙集團(tuán)”,并推出數(shù)字代言人“映映”。映映正式出道至今已近周年,在直播、短視頻平臺(tái)上擁有大量粉絲,也頻頻亮相各大媒體與行業(yè)活動(dòng),是業(yè)界數(shù)字人中發(fā)展較為全面和穩(wěn)定的代表IP。
大多數(shù)人認(rèn)為,數(shù)字人是伴隨元宇宙概念而興起的。但事實(shí)上,其發(fā)軔至少可以上溯至幾十年前。醫(yī)學(xué)領(lǐng)域上早有數(shù)字人概念,主要是通過(guò)采集人體數(shù)據(jù),對(duì)數(shù)據(jù)做精細(xì)斷層處理,從而形成數(shù)字化人體結(jié)構(gòu),應(yīng)用于人體解剖等醫(yī)學(xué)范疇。
目前大眾所熟知的數(shù)字人,主要是基于網(wǎng)絡(luò)范疇,通過(guò)動(dòng)作捕捉、三維建模、語(yǔ)音合成等互聯(lián)網(wǎng)技術(shù),呈現(xiàn)出虛擬立體的人,并被賦予智能化、情感化、思想化的特征。網(wǎng)絡(luò)數(shù)字人從上世紀(jì)80年代初到現(xiàn)在,已歷經(jīng)約四十年的發(fā)展,演進(jìn)過(guò)程分為紙片人階段、真人驅(qū)動(dòng)階段、AI驅(qū)動(dòng)階段。同時(shí),數(shù)字形象也經(jīng)歷了從有外形皮囊,到有人設(shè)靈魂,再到AI 內(nèi)核逐漸累加的過(guò)程。
在紙片人階段,以日本1982年的動(dòng)漫《超時(shí)空要塞》女主林明美為例,受限于當(dāng)時(shí)的技術(shù),動(dòng)畫(huà)形象主要通過(guò)手工繪制,網(wǎng)友是無(wú)法與其直接互動(dòng)的。到了目前應(yīng)用最多的真人驅(qū)動(dòng)階段,大多數(shù)IP則披著數(shù)字形象的外皮,以動(dòng)作捕捉設(shè)備實(shí)時(shí)驅(qū)動(dòng)背后的中之人,方能與用戶進(jìn)行演繹互動(dòng)。在AI賦能下,數(shù)字人的交互能力則可以體現(xiàn)出讓人驚艷的可靠性、高效性和邏輯性,更好地打造虛實(shí)共生空間,目前主要應(yīng)用于各種演唱會(huì)等線下活動(dòng),帶給人十足的沉浸感。
從2018年到2023年,數(shù)字人的市場(chǎng)規(guī)模強(qiáng)勢(shì)增長(zhǎng)。據(jù)全球知名數(shù)據(jù)洞察與咨詢公司 Kantar 的一項(xiàng)調(diào)查顯示,過(guò)去一年,36%的用戶看過(guò)虛擬偶像表演;2023年,45%的廣告商有意愿邀請(qǐng)數(shù)字人表演或參加品牌活動(dòng)。
數(shù)字人的商業(yè)價(jià)值還有龐大的開(kāi)發(fā)空間。根據(jù)中國(guó)演出行業(yè)協(xié)會(huì)今年5月發(fā)布的《中國(guó)網(wǎng)絡(luò)表演(直播與短視頻)行業(yè)發(fā)展報(bào)告(2022-2023)》:2022 年度虛擬數(shù)字人行業(yè)發(fā)展迅速,我國(guó)現(xiàn)有虛擬數(shù)字人相關(guān)企業(yè)近60萬(wàn)家,近半數(shù)企業(yè)成立于近一年。
當(dāng)前,關(guān)于數(shù)字人的市場(chǎng)應(yīng)用可分為以功能為主的“服務(wù)型數(shù)字人”和以表演為主的“偶像型數(shù)字人”?!胺?wù)型數(shù)字人”能替代重復(fù)性高的人工勞動(dòng),如智能客服、虛擬助手等。除了標(biāo)準(zhǔn)化和規(guī)范化之外,其價(jià)值體現(xiàn)在可以全天候?qū)崟r(shí)服務(wù),提高工作效率,為企業(yè)降本增效。例如,萬(wàn)科的首位數(shù)字員工“崔筱盼”,上線后便開(kāi)始負(fù)責(zé)催辦企業(yè)的預(yù)付應(yīng)收逾期單。
這類數(shù)字人可控性強(qiáng),不會(huì)因?yàn)橥话l(fā)情況影響工作,且全年無(wú)休,24小時(shí)待崗。更重要的是,模型研發(fā)成功后,復(fù)制多個(gè)落地的邊際成本也降低。
“偶像型數(shù)字人”如洛天依、A-soul女團(tuán)、柳夜熙等IP,活躍在游戲、社交、文娛演出、短視頻和直播等泛娛樂(lè)領(lǐng)域,話題度與熱度較高。這類數(shù)字人被賦予了人設(shè)靈魂,還有多項(xiàng)技能傍身。以映映為例,她在成為映宇宙數(shù)字代言人之前,曾出演過(guò)動(dòng)漫《芯覺(jué)》中的女主角“念念”,積累起自己的粉絲群體。近一年來(lái)不斷活躍于社交媒體平臺(tái)和行業(yè)論壇的“履歷”,也讓這個(gè)高顏值數(shù)字人進(jìn)一步擴(kuò)大了自己的粉絲圈層和影響力。
未來(lái)隨著AI技術(shù)賦能,映宇宙希望她生長(zhǎng)出更多可能性,比如嘗試品牌代言、直播帶貨、參演影視或音樂(lè)作品等等。映宇宙給映映的身份定位是多元的,她既能是品牌代言人,又是虛擬主播、虛擬藝人。
數(shù)字人具體的應(yīng)用場(chǎng)景和商業(yè)化手段也極為豐富。主要以品牌代言、視頻直播、數(shù)字資產(chǎn)和數(shù)字衍生品為主,并不斷滲透到文娛、金融、電商、醫(yī)療多個(gè)產(chǎn)業(yè)領(lǐng)域。對(duì)于大多數(shù)品牌方而言,數(shù)字人在口碑方面擁有更強(qiáng)的穩(wěn)定性,能夠有效避免真人明星突然人設(shè)崩塌帶來(lái)的品牌危機(jī)。
毋庸諱言,數(shù)字人行業(yè)曾面臨一段為時(shí)不短的瓶頸期。時(shí)至今日,數(shù)字人在技術(shù)成本、交互體驗(yàn)、內(nèi)容生態(tài)等方面依然存在亟待解決的痛點(diǎn)。
首先,制作數(shù)字人的硬件與技術(shù)還遠(yuǎn)遠(yuǎn)達(dá)不到普及標(biāo)準(zhǔn)。一個(gè)優(yōu)質(zhì)數(shù)字人的誕生,往往要數(shù)家公司合力完成整個(gè)鏈路,環(huán)節(jié)相對(duì)割裂,時(shí)間也較為緩慢。越精致、越擬真的“皮囊”制作成本越高,動(dòng)輒幾十萬(wàn)、上百萬(wàn)的成本只有頭部機(jī)構(gòu)和企業(yè)能承擔(dān)。對(duì)大多數(shù)的中小型企業(yè)及個(gè)人而言,精致的數(shù)字形象尚屬“奢侈品”。以至于市面上數(shù)字形象雖多,卻要么同質(zhì)化嚴(yán)重,要么精度質(zhì)量參差不齊。
其次,數(shù)字人與真人的交互體驗(yàn)不夠順暢,和落地場(chǎng)景的融合不夠深入。目前雖然出現(xiàn)很多AI數(shù)字人帶貨的案例,但幾乎都是“冷酷無(wú)情的產(chǎn)品介紹機(jī)器”,流水線式的帶貨方式很難讓人產(chǎn)生信任感,更遑論真實(shí)的貨品體驗(yàn)。數(shù)字人主播如何能把口紅涂在嘴上;把水果切開(kāi)、吃到嘴里?整個(gè)數(shù)字人行業(yè)都在思考這些問(wèn)題,因?yàn)橐坏┯辛私鉀Q方案,將是打破虛實(shí)空間的劃時(shí)代之舉。
最后,圍繞數(shù)字人的內(nèi)容生態(tài)尚未形成。一些數(shù)字人亮相初期走過(guò)高舉高打的路線,確實(shí)驚艷了一大批粉絲,但涉及數(shù)字人的內(nèi)容,制作成本都很高,制作周期也偏長(zhǎng),優(yōu)質(zhì)內(nèi)容難以為繼。對(duì)這個(gè)行業(yè)來(lái)說(shuō),新一輪洗牌期朝夕可至,炒噱頭、炒流量的做法很容易被淘汰。只有探索出一條能讓數(shù)字人穩(wěn)定輸出優(yōu)質(zhì)內(nèi)容的路徑,其商業(yè)價(jià)值和社會(huì)影響力才能持續(xù)釋放。而AI技術(shù)的爆發(fā),讓數(shù)字人行業(yè)終于看到更光明的前景。
王小川這樣評(píng)價(jià)AI的到來(lái):“地動(dòng)山搖、天崩地裂、大時(shí)代的變化……我們走出了信息時(shí)代或者互聯(lián)網(wǎng)時(shí)代,進(jìn)入到智能時(shí)代或者通用人工智能時(shí)代,人類進(jìn)入新的一種文明了”。
所有人都在加緊與技術(shù)賽跑。映宇宙技術(shù)平臺(tái)已接入ChatGPT-3.5-Turbo。公司在AIGC領(lǐng)域的探索主要有五大方向:數(shù)字人直播、互動(dòng)社交、AI音樂(lè)、AI劇本和AI運(yùn)營(yíng)。五大方向并非各自獨(dú)立,而是互相賦能、協(xié)同前進(jìn)。
以數(shù)字人“映映”為例,目前映映采取中之人驅(qū)動(dòng)的方式進(jìn)行日常直播,在映客直播等平臺(tái)陪伴粉絲。但這一形式無(wú)法做到時(shí)時(shí)陪伴,直播內(nèi)容也大多取決于中之人的個(gè)人藝能水平。隨著未來(lái)映宇宙將在直播中接入人工智能,這一局面將顯著改善,數(shù)字人映映可以實(shí)現(xiàn)每天24小時(shí)全天候互動(dòng)。
AI能為數(shù)字人做的不止于此。多模態(tài)AI技術(shù)將使數(shù)字人交互能力更上一個(gè)臺(tái)階,感知能力、思維決策、內(nèi)容輸出能力都得到顯著改善,在思想、語(yǔ)言、行為上和真人更加接近、更加智能化。一個(gè)以此為底層技術(shù)的數(shù)字人主播,完全可以對(duì)粉絲做到有問(wèn)必答、有求必應(yīng),甚至真正做到千人千面的“個(gè)性化定制陪伴”。
此外,AI繪畫(huà)、AI聲音等技術(shù),也讓數(shù)字人產(chǎn)業(yè)看到了產(chǎn)品快速普及的希望。眾所周知,供給側(cè)的降本增效對(duì)于產(chǎn)業(yè)擴(kuò)大化有著決定性影響。如果以AI技術(shù)覆蓋數(shù)字人的生產(chǎn)全流程,其意義將不亞于移動(dòng)網(wǎng)絡(luò)時(shí)代智能終端的普及。
數(shù)字人的核心在于交互,這是整個(gè)行業(yè)的共識(shí)。隨著AI的發(fā)展,大規(guī)模語(yǔ)言模型可以解決數(shù)字人的實(shí)時(shí)交互和內(nèi)容生產(chǎn)問(wèn)題,將功能性AI數(shù)字人和偶像型AI數(shù)字人進(jìn)行有效結(jié)合,既可以實(shí)現(xiàn)全天實(shí)時(shí)輸出,又能夠保證個(gè)性化定制人設(shè)特性。這也是未來(lái)映宇宙集團(tuán)數(shù)字人映映的主要發(fā)展路徑。
AI數(shù)字人的出現(xiàn),標(biāo)志著虛擬數(shù)字人行業(yè)進(jìn)入全新發(fā)展階段。隨著數(shù)字孿生技術(shù)的進(jìn)步,技術(shù)和人力成本的降低,更多個(gè)體或許能很快擁有自己的數(shù)字孿生體,社會(huì)真正邁向虛實(shí)共生。
當(dāng)然,數(shù)字人結(jié)合AI技術(shù)應(yīng)用,也會(huì)帶來(lái)一些安全風(fēng)險(xiǎn)。2018年圖靈獎(jiǎng)得主Geoffrey Hinton曾表示,非常擔(dān)憂AI所帶來(lái)的虛假信息傳播。這并非空穴來(lái)風(fēng),網(wǎng)絡(luò)上曝出的以人臉、聲音合成技術(shù)為手段進(jìn)行詐騙的活動(dòng)也屢見(jiàn)不鮮。因此,在進(jìn)一步規(guī)模化應(yīng)用之前,數(shù)字人技術(shù)的安全性保障、數(shù)字人運(yùn)營(yíng)團(tuán)隊(duì)權(quán)限的可控性、相關(guān)部門的立法監(jiān)管等方面都有待完善。
整體來(lái)看,隨著AI技術(shù)的演進(jìn)和應(yīng)用場(chǎng)景的擴(kuò)大,數(shù)字人將會(huì)加快實(shí)現(xiàn)“智慧與美貌并存”,人類或許即將迎來(lái)真正的“智慧時(shí)代”。與此同時(shí),如何利用AI建設(shè)好生態(tài)、如何建立行業(yè)規(guī)范標(biāo)準(zhǔn)、健全監(jiān)管制度,也將成為這個(gè)新生產(chǎn)業(yè)發(fā)展的關(guān)鍵所在。
作者系映宇宙集團(tuán)高級(jí)副總裁、總編輯
【編輯:左志新】