前不久,知名社交平臺Facebook正式宣布改名為Meta,而這個詞取自Metaverse,翻譯為中文就是元宇宙、虛擬世界。有了巨頭介入,“元宇宙”這個早在1992年的科幻小說《雪崩》中就已經(jīng)誕生的詞語,在2021年又火了起來,成為一個現(xiàn)象級的話題。
從定義上看,元宇宙,是整合了數(shù)字、互聯(lián)網(wǎng)等新技術(shù)產(chǎn)生的新型虛擬現(xiàn)實應(yīng)用,并且允許用戶對這個虛擬世界進行編輯,提供視聽等多方面的沉浸式體驗。
不只是Facebook,全球的互聯(lián)網(wǎng)巨頭都在追捧元宇宙概念,在這個風(fēng)口之下,相關(guān)話題持續(xù)升溫。作為元宇宙與現(xiàn)實世界的“溝通者”——虛擬主播似乎已經(jīng)逐漸融入我們的生活,短視頻、電視節(jié)目甚至是演唱會上,都活躍著他們的身影。
在元宇宙元年,虛擬主播,以及虛擬人機交互技術(shù)已經(jīng)成為首批用戶真正能夠感受到的落地產(chǎn)品。
虛擬主播并不是什么新的概念,很多年前,初音未來、洛天依等主播就已經(jīng)在二次元圈子成為“頂流”。而在今年,在元宇宙概念下,虛擬主播/虛擬角色更是如雨后春筍般出現(xiàn):
柳夜熙,一個活躍在短視頻平臺的虛擬美妝博主,僅靠兩部作品,十余天就收獲500多萬粉絲;在B站,甚至有專門的虛擬主播分區(qū),活躍著嘉然、乃琳、七海、阿梓等大批人氣角色,偶像團體A-SOUL的向晚大魔王在生日直播中,2個多小時賺了125萬元;
虛擬學(xué)生華智冰正式亮相并進入清華大學(xué)計算機科學(xué)與技術(shù)系知識工程實驗室學(xué)習(xí),后續(xù),華智冰還將繼續(xù)在人工智能領(lǐng)域深造,成為一個知識豐富,并且可以和人類進行良好交互的智能“人類”;
上月,央視新聞AI手語主播正式亮相,她可以和人類正常交談,并且在2022年冬奧會上,她將全程進行手語直播。包括湖南衛(wèi)視的主持人小漾、濟南電視臺主持人小沫兒……越來越多的電視臺都開始起用虛擬主持人;
一直深耕人工智能技術(shù)的科大訊飛,早在2018年就與央視合作打造了第一個虛擬主播“康曉輝”。近幾年,小晴、小璇、一峰等多名具有獨立性格、聲線、肢體語言的虛擬主播相繼上線,并且可以根據(jù)需要切換身份、著裝、儀態(tài)動作等。與央視新聞聯(lián)手打造的記者通通、虛擬主播紀小萌,以及和人民日報聯(lián)合推出的虛擬主播果果,早已在各自的崗位參與了采訪、報道等工作。
這些虛擬主播不光有人類的聲音,還可以模仿真人肢體動作,甚至是眼神等儀態(tài)。而其背后的開發(fā)團隊,在建立角色后還要經(jīng)過大量的調(diào)試,以滿足不同場景的需求,讓虛擬人能夠更接近于真人。
比如科大訊飛的虛擬人愛加,她不光可以熟練使用30多種語言和人類進行正常交互,還可以變身新聞主播、智能客服、虛擬醫(yī)生等多種職業(yè),從穿著打扮、言談舉止等多種維度上都盡可能地接近普通人類,實現(xiàn)無感交互。
早期的虛擬主播一般都是通過新聞節(jié)目主持人的身份和大家見面,甚至一度被懷疑是采集人臉數(shù)據(jù)之后,再加上人類自己錄音,就成了“主播”。
隨著技術(shù)的升級,智能交互技術(shù)早已經(jīng)不是印象中的樣子了?,F(xiàn)在的AI虛擬主播一般都能夠自行學(xué)習(xí),并且可以通過語音、文字反饋等方式和用戶進行交互。
比如在上個月的2021中國網(wǎng)絡(luò)媒體論壇新技術(shù)新應(yīng)用新業(yè)態(tài)展示會上,總臺記者就在現(xiàn)場和AI手語主播進行了現(xiàn)場交流,溝通完全無障礙,AI主播可以流暢、準確地作出反饋。
在今年3月份的兩會期間,科大訊飛也聯(lián)合央視網(wǎng),讓虛擬人愛加陪民眾一起關(guān)注直播,隨時回答用戶的提問。值得一提的是,用戶可以通過文字、語音等方式進行提問,愛加都能聽懂并且正確回答,互動效果和真人幾乎無異。
而這樣的交互,顯然和電商平臺的“智能客服”有很大區(qū)別。智能客服一般是將用戶的文字消息和后臺數(shù)據(jù)庫中的關(guān)鍵詞進行匹配,進行一些簡單的訂單查詢和問題反饋,回答比較固定,而且也沒有“人情味”。
但是科大訊飛的虛擬人交互平臺,在提供海量“問答庫”的同時,創(chuàng)新性地加入了語義理解技術(shù),讓虛擬人可以結(jié)合對話語境,進行自然語言交流——就像和真人對話一樣,虛擬人能夠真正聽懂對話,并且給出精準答案。
為此,科大訊飛還利用這套技術(shù),打造了一套AI智能交互一體機,不光有傳統(tǒng)觸屏的操作體驗,她還能和用戶進行語言溝通,在商圈、機場、智慧社區(qū)、金融機構(gòu)等場合提供針對性的服務(wù)。
其實只要關(guān)鍵詞設(shè)置得夠多,電商平臺的“虛擬客服”也能夠滿足基本的溝通需求。類似的例子還有很多年前的QQ聊天機器人,雖然對話不是那么流暢,但已經(jīng)能夠進行最基本的溝通了。
經(jīng)過多年發(fā)展,虛擬人已經(jīng)具備了學(xué)習(xí)能力,具備各種相關(guān)知識的同時,還能做到得體、大方,使用自然語言和用戶溝通,而不是生硬的模板式回答。
光是能說會道,顯然還不能滿足“接近于真人”的需求,因為人類都是有情緒的,而情緒最好的表達就是表情。早期虛擬人的面部表情,一般只有嘴部的張合,再輔以大笑、眨眼等基本動作,和真人的區(qū)別還是挺大的。
但是近幾年虛擬人構(gòu)建技術(shù)越發(fā)成熟,不光是制作了漂亮的外觀,將表情等因素也都考慮在內(nèi),比如登上2021年春晚舞臺的虛擬歌姬洛天依、王者榮耀推出的虛擬男團無限王者團、央視AI主播小小撒等形象,加上表情以及一些習(xí)慣性動作之后,不再是冷冰冰的“機器”,而更像是一個富有情感的人類。
而在背后,工程師需要進行大量的調(diào)試。以科大訊飛的虛擬人交互平臺為例,從建立人物模型開始,就要經(jīng)過原畫設(shè)定、模型建模、骨骼表情綁定等諸多步驟。而一句語音反饋,不只是將文本“翻譯”為語音輸出,還要通過算法生成人物五官微表情,動態(tài)調(diào)整虛擬人的嘴型、眼部細節(jié)、面部肌肉等。
不僅如此,還會通過大量訓(xùn)練,讓AI更懂人物的“表情語言”,在說某句話時,根據(jù)場景自動預(yù)測表情,最終才能呈現(xiàn)出媲美真人的面部特征。
作為人類進入元宇宙的“引路者”,虛擬人在今年可以說迎來了突飛猛進的變革。在未來,虛擬和現(xiàn)實的邊界將會變得越來越模糊,虛擬人可以出現(xiàn)在手機、電視、VR等任何介質(zhì)中,甚至包括全息投影。
可以預(yù)想的是,虛擬人將會更加深入我們的生活,在未來,算力和網(wǎng)絡(luò)通信速度還會進一步提升,虛擬人將有無限可能。我們會在更多的地方看到虛擬人,而他們,也會將我們真正帶入元宇宙的世界。