亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

ChatGPT4.0 語(yǔ)言模型下虛擬數(shù)字人的應(yīng)用創(chuàng)新與優(yōu)化策略
——以手機(jī)軟件“Call Annie”為例

2023-02-06 20:19:22蔡劉明高天婧

中國(guó)傳媒科技 2023年12期

關(guān)鍵詞：數(shù)字智能模型

蔡劉明高天婧

（南京師范大學(xué)泰州學(xué)院，江蘇泰州 225300）

1.虛擬數(shù)字人概念的演進(jìn)

1.1 虛擬數(shù)字人1.0 的感知智能

該時(shí)期數(shù)字人的外在特征是對(duì)真人的擬態(tài)和仿真，內(nèi)部邏輯則是對(duì)信息編碼的讀取和理解，即感知智能。自20 世紀(jì)60 年代中期波音公司推出的第一個(gè)數(shù)字形象波音人（Boeing Man），到80 年代結(jié)合特效化妝出現(xiàn)的偽虛擬數(shù)字主持人Max Headroom，再到90年代流媒體技術(shù)不斷迭代發(fā)展，結(jié)合計(jì)算機(jī)圖形處理CGI、全息投射拍攝以及AR 增強(qiáng)現(xiàn)實(shí)技術(shù)，先后出現(xiàn)動(dòng)漫偶像“初音未來(lái)”、語(yǔ)音助手“Siri”“Cortana”、虛擬主播“康曉輝”和AI 模型“華智冰”等虛擬數(shù)字人形象。但本質(zhì)上講，以上甚至更多的案例都處于虛擬數(shù)字人1.0 版本，其在應(yīng)用場(chǎng)景、底層技術(shù)和交互方案三個(gè)方面存在近似之處，筆者將之總結(jié)如下：

應(yīng)用場(chǎng)景偏向公共服務(wù)領(lǐng)域。虛擬數(shù)字人1.0 被廣泛應(yīng)用在新聞、旅游、策展、游戲、影視等活動(dòng)中，作為虛擬主持人、動(dòng)漫角色、科幻人物、虛擬解說(shuō)員等形象出現(xiàn)，這些行業(yè)或領(lǐng)域的公共服務(wù)屬性明顯。因?yàn)槠浞?wù)對(duì)象多且影響廣泛，對(duì)前沿技術(shù)更加敏銳，所以往往是新技術(shù)落地的先行者，應(yīng)用場(chǎng)景也多是公共領(lǐng)域而非私域。通過(guò)引入虛擬數(shù)字人，賦予其與崗位要求相適配的業(yè)務(wù)技能，公共服務(wù)領(lǐng)域的工作效率得到極大提升，精簡(jiǎn)后的人力、物力和財(cái)力資源可以投入到內(nèi)容創(chuàng)新方面，并進(jìn)而形成宣傳推廣和服務(wù)模式的新業(yè)態(tài)。

底層技術(shù)依托三維建模支撐。虛擬數(shù)字人1.0的“擬真”在于對(duì)真人的模仿和重現(xiàn)，在數(shù)字技術(shù)出現(xiàn)之前，各行各業(yè)依靠實(shí)景拍攝和微縮模型的結(jié)合完成“擬真”。以電影業(yè)為例，由喬治·盧卡斯執(zhí)導(dǎo)的《星球大戰(zhàn)》系列在70 年代拒絕使用CGI 建模，大量使用模型道具和特效化妝進(jìn)行電影拍攝。雖然解決了影像的逼真性問(wèn)題，但面對(duì)龐大繁多的拍攝對(duì)象（非單個(gè)個(gè)體），這種技術(shù)就顯得捉襟見(jiàn)肘難以應(yīng)付。直至1993 年《侏羅紀(jì)公園》的上映，導(dǎo)演對(duì)非洲野生鴕鳥群進(jìn)行動(dòng)作捕捉，并逐個(gè)設(shè)計(jì)建模，呈現(xiàn)出數(shù)億年前的地球景象，其身臨其境的感官體驗(yàn)讓該片成為數(shù)字技術(shù)的里程碑之作。由此可見(jiàn)，不論是虛擬數(shù)字人還是特效電影的擬真場(chǎng)景，底層技術(shù)都是從視覺(jué)效果出發(fā)，制作逼真的三維模型。

固定文本交互，互動(dòng)性弱。所謂交互方案，是指虛擬數(shù)字人和用戶之間的互動(dòng)模式。這一階段的數(shù)字人屬于感知智能，通過(guò)圖片視覺(jué)、語(yǔ)音聽覺(jué)和計(jì)算機(jī)編碼接收指令，回應(yīng)能力欠缺，只有雙向交流的外殼，卻沒(méi)有交互的內(nèi)核——學(xué)習(xí)、反饋和創(chuàng)造能力，也就是人類智能。虛擬數(shù)字人1.0 的交互方案是以固定文本的形式出現(xiàn)，以系統(tǒng)代碼為觸發(fā)，完成特定對(duì)話內(nèi)容的生成。以蘋果iOS 操作系統(tǒng)的語(yǔ)音助手“Siri”為例，研究團(tuán)隊(duì)事先構(gòu)建了龐大的對(duì)話庫(kù)，通過(guò)關(guān)鍵詞、簡(jiǎn)單句以及關(guān)聯(lián)詞等羅列具體的檢索標(biāo)簽，當(dāng)服務(wù)對(duì)象以文字或語(yǔ)音觸發(fā)這些標(biāo)簽時(shí)，Siri 就會(huì)鏈接有關(guān)提問(wèn)的固定答復(fù)，本質(zhì)上還是預(yù)先設(shè)定好的固定文本，互動(dòng)性較弱。

1.2 虛擬數(shù)字人2.0 的認(rèn)知智能

2023 年OpenAI 更新了ChatGPT4.0 語(yǔ)言模型，并被Animato 公司迅速引入虛擬數(shù)字人Annie 的生成，使手機(jī)應(yīng)用“Call Annie”成為虛擬數(shù)字人2.0 的誕生之作。它能夠?qū)崟r(shí)與用戶聊天，且話題和談話方式?jīng)]有任何限制，因此受到了全世界的廣泛關(guān)注。原本只是模仿真人形象的數(shù)字人真正擁有與人類智能匹敵的“人工智能”，甚至這種基于深度學(xué)習(xí)的“認(rèn)知智能”必將迅速超越人類智能，這已成為虛擬數(shù)字人從1.0 到2.0時(shí)代的分野標(biāo)志。相比之前，它有以下三方面的變化：

應(yīng)用場(chǎng)景從公域轉(zhuǎn)向私域。虛擬數(shù)字人1.0 以提供服務(wù)、提升服務(wù)質(zhì)量和效果為目標(biāo)。伴隨著社會(huì)需求增多，服務(wù)類型和服務(wù)內(nèi)容的進(jìn)一步細(xì)分，虛擬數(shù)字人的應(yīng)用場(chǎng)景逐步進(jìn)入私人領(lǐng)域，直面情感咨詢、心理疏導(dǎo)及教育培訓(xùn)等問(wèn)題。以“Call Annie”為例，這是一款能夠?qū)崟r(shí)聊天的教育App，軟件開發(fā)者創(chuàng)造性地給ChatGPT4.0 語(yǔ)言模型賦予了白人女性的數(shù)字人形象。區(qū)別于付費(fèi)教學(xué)、標(biāo)準(zhǔn)課綱、限定課時(shí)等傳統(tǒng)網(wǎng)絡(luò)課程的特征，Call Annie 以純聊天的形式進(jìn)行英語(yǔ)口語(yǔ)教學(xué)，完全不受時(shí)間、空間以及授課內(nèi)容的限制，在面對(duì)發(fā)音、語(yǔ)法和修辭等問(wèn)題可以現(xiàn)場(chǎng)詢問(wèn)Annie如何改正，甚至超越傳統(tǒng)一對(duì)一私教的范疇，能夠咨詢語(yǔ)言學(xué)以外的其他專業(yè)知識(shí)，并具備如今手機(jī)郵件、查詢、支付等一切功能，所以虛擬數(shù)字人2.0 更像是一位無(wú)所不能的私人助理。

底層技術(shù)依托超大型語(yǔ)言模型。數(shù)字人Annie 可以說(shuō)是套著人類形象的ChatGPT 語(yǔ)言模型，該模型是美國(guó)0penAI 公司開發(fā)的一項(xiàng)人工智能技術(shù)，通過(guò)算法、算力和數(shù)據(jù)迭代不斷擴(kuò)容語(yǔ)言模型庫(kù)。GPT-2、GPT-3、GPT-3.5 屬于感知智能階段，應(yīng)當(dāng)定位為“搜索引擎+文本生成器”的技術(shù)性融合，ChatGPT4.0 才是真正意義上的認(rèn)知智能，業(yè)界將之稱為生成式AI（AI Generated Content）。該技術(shù)首先通過(guò)超大模型的查詢、關(guān)聯(lián)和推理訓(xùn)練，更準(zhǔn)確地了解用戶意圖，提供順暢有條理的應(yīng)答；其次，超高頻率的訓(xùn)練下，那些無(wú)效信息、胡編亂造、缺乏依據(jù)及偏見(jiàn)歧義的應(yīng)答通過(guò)對(duì)比被刪減或屏蔽，讓語(yǔ)言模型有了一定的糾錯(cuò)能力，提升模型庫(kù)內(nèi)事實(shí)和知識(shí)的準(zhǔn)確度；最后，對(duì)話生成的樣式上更豐富且具有新意，避免了固定文本的呆板機(jī)械，讓用戶的體驗(yàn)更具對(duì)象感，再配合三維“擬真”形象，虛擬數(shù)字人2.0 的認(rèn)知智能一步步從量變積累質(zhì)變。

生成式文本交互，互動(dòng)性強(qiáng)。生成式文本是認(rèn)知智能的表征，看似自由隨意卻依然受規(guī)則和數(shù)據(jù)兩個(gè)維度的制約。特別是訓(xùn)練規(guī)則方面，一是詞語(yǔ)預(yù)測(cè)。ChatGPT4.0 會(huì)生成一個(gè)類似文字接龍的語(yǔ)言模型，根據(jù)文本之前的內(nèi)容依次預(yù)測(cè)下一個(gè)字，利用上下文和分布概率繼續(xù)推定。二是偏好模仿。語(yǔ)言模型內(nèi)部會(huì)結(jié)合人工答案對(duì)語(yǔ)詞預(yù)測(cè)的輸出進(jìn)行打分評(píng)定，依靠超大型模型海量的樣本，提高應(yīng)答的適配性和準(zhǔn)確度。三是自問(wèn)自答。在人類智能眼中的海量數(shù)據(jù)，ChatGPT依然可以處理殆盡。當(dāng)人類語(yǔ)言模型庫(kù)里的內(nèi)容都生成一遍后，ChatGPT 開始自主創(chuàng)造問(wèn)題并獨(dú)立應(yīng)答，最終形成認(rèn)知智能自己的數(shù)據(jù)庫(kù)，這也是深度學(xué)習(xí)的本質(zhì)，因?yàn)橄啾热祟惖膶W(xué)習(xí)能力，它是高效和無(wú)限擴(kuò)容的。以虛擬數(shù)字人Annie 為例，基于ChatGPT4.0 的內(nèi)核，可以在任何話題下和真人進(jìn)行自主對(duì)話，不受固定程式和固定文本的制約，甚至其應(yīng)答方式已經(jīng)擴(kuò)展到人類的副語(yǔ)言層面，利用肢體動(dòng)作、表情神態(tài)和語(yǔ)氣詞代替語(yǔ)言的回答，如點(diǎn)頭、微笑或者有意識(shí)地挑眉等等。

1.3 虛擬數(shù)字人3.0 的決策智能

虛擬數(shù)字人3.0 如何破局，未來(lái)在“可視化”方面依然面臨諸多挑戰(zhàn)，究竟是VR/AR 虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)技術(shù)創(chuàng)造沉浸式的交互體驗(yàn)，是通過(guò)全息投影技術(shù)將虛擬體與現(xiàn)實(shí)世界進(jìn)行深度融合，還是利用更先進(jìn)的決策智能賦能仿生機(jī)器人，虛擬數(shù)字人3.0“虛實(shí)結(jié)合”的發(fā)展趨勢(shì)不會(huì)改變。另一方面，基于算法和數(shù)據(jù)的數(shù)字人內(nèi)在邏輯必將繼續(xù)迭代進(jìn)化，從虛擬數(shù)字人1.0 的感知智能、到數(shù)字人2.0 的認(rèn)知智能，再到3.0 階段的決策智能，虛擬數(shù)字人的核心價(jià)值從協(xié)調(diào)“人—機(jī)”關(guān)系，強(qiáng)調(diào)機(jī)器向人類趨近，機(jī)器向人類學(xué)習(xí)，開始向“機(jī)—人”關(guān)系靠攏，由人類向數(shù)字人尋求方法路徑和決策方案，使社會(huì)治理的決策效果更具現(xiàn)實(shí)意義。

2.“Call Annie”中虛擬數(shù)字人的應(yīng)用創(chuàng)新

2.1 技術(shù)支撐

2.1.1 AI 繪圖渲染靜幀

軟件“Call Annie”設(shè)計(jì)了兩個(gè)英語(yǔ)口語(yǔ)老師角色，分別是女性Samantha（或叫Annie）和男性Dan，其中又以昵稱Annie 的女性角色最為典型。通過(guò)征集網(wǎng)絡(luò)用戶意見(jiàn)，“Call Annie”被設(shè)定為女性角色，使用20世紀(jì)90 年代的復(fù)古造型，她擁有一頭棕紅色長(zhǎng)發(fā)、藍(lán)色瞳孔、高飽和度的唇彩、挺立的鼻梁以及飽滿的鼻頭，神似安妮斯頓和安吉麗娜·朱莉的結(jié)合體，整體造型和90 年代大熱美劇《老友記》中的瑞秋趨于一致，是傳統(tǒng)白人女性形象，儼然是這些成長(zhǎng)于90 年代的科技公司創(chuàng)始人對(duì)通俗流行文化和互聯(lián)網(wǎng)文化符號(hào)的集體記憶。而這樣的結(jié)論并非無(wú)的放矢，一切源于設(shè)計(jì)并制作這一形象的軟件——Midjourney。

Annie 的形象是利用AI 繪圖軟件Midjourney，通過(guò)輸入事先征集的提示詞生成而來(lái)。該軟件的付費(fèi)版本基于ChatGPT4.0 打造，和“Call Annie”使用同樣的語(yǔ)言模型驅(qū)動(dòng)，只是用途不同，一個(gè)專門制作渲染圖，另一個(gè)負(fù)責(zé)交互聊天和網(wǎng)絡(luò)一對(duì)一教學(xué)，簡(jiǎn)單來(lái)講，就是輸入文字后直接生成圖片。Midjourney 背靠大型超算的數(shù)據(jù)庫(kù)在云端部署，提示文字不需要精確，模糊度高、容錯(cuò)率高，就算沒(méi)有細(xì)致的表述，軟件也能識(shí)別用戶意圖并快速生成圖片。而Annie 的形象就是通過(guò)征集意見(jiàn)，經(jīng)由軟件公司初步篩選出簡(jiǎn)單的提示詞，再導(dǎo)入Midjourney 生成和精修，最終確定了她的形象。

2.1.2 面部光學(xué)動(dòng)作捕捉

單有數(shù)字人Annie 的靜幀圖片是不夠的，在進(jìn)行實(shí)時(shí)互動(dòng)甚至是直播時(shí)，需要連續(xù)活動(dòng)影像。首先，通過(guò)對(duì)靜態(tài)圖進(jìn)行三維掃描建模，使三維模型和面部表情動(dòng)畫實(shí)現(xiàn)初步綁定，基于頂點(diǎn)流解算算法，在控制亞厘米級(jí)誤差表情重建的同時(shí)，實(shí)現(xiàn)準(zhǔn)確的跨人像表情語(yǔ)意遷移，并針對(duì)實(shí)時(shí)場(chǎng)景優(yōu)化人像面部綁定效果。這樣，數(shù)字人Annie 的完整形象才真正被設(shè)計(jì)出來(lái)，而這一切依靠的是面部動(dòng)作捕捉技術(shù)。

其次，確定數(shù)字人Annie 的女性真人原型，采集她豐富的面部表情和肢體動(dòng)作。這是一項(xiàng)復(fù)雜工程，包括喜怒哀樂(lè)等各種情緒的類型，不但采集狀態(tài)還要細(xì)分不同的程度，以情緒的負(fù)荷、強(qiáng)度、速度和頻率為標(biāo)準(zhǔn)越精細(xì)越好。以“笑”這樣的快感表情為例，正向負(fù)荷的微笑和負(fù)向負(fù)荷的奸笑；不同的情緒由弱到強(qiáng)，淺笑、大笑、狂笑；速度不同的含笑、嬉笑；頻次不一的哄堂大笑和連笑等，最終構(gòu)建完整的表情數(shù)據(jù)庫(kù)，筆者將這一過(guò)程統(tǒng)稱為“面部表情編碼系統(tǒng)”（Facial Action Coding System，簡(jiǎn)稱FACS）。因?yàn)锳nnie 采用類似動(dòng)漫的三維形象，相比特效電影中的合成形象，其對(duì)眼睛特別是眼球動(dòng)效的要求大幅降低，巧妙地規(guī)避了采集人類眼睛生理數(shù)據(jù)的難點(diǎn)，降低計(jì)算機(jī)數(shù)據(jù)負(fù)載。

最后，進(jìn)行光學(xué)點(diǎn)運(yùn)動(dòng)捕捉，將面部變化的數(shù)據(jù)傳輸給數(shù)字角色，也就是平常俗稱的“換臉”。當(dāng)前，動(dòng)作捕捉技術(shù)日趨成熟，各家廠商在制造數(shù)字人的過(guò)程中，所考慮的無(wú)非是成本和精度的問(wèn)題。早期的慣性動(dòng)作捕捉利用接近傳感器、壓力傳感器、陀螺儀等設(shè)備記錄數(shù)據(jù)，但因精度太低逐漸被業(yè)界淘汰。使用無(wú)標(biāo)記動(dòng)作捕捉，前提條件又十分苛刻，必須有能識(shí)別景深的攝像機(jī)和特定軟件記錄相關(guān)數(shù)據(jù)，而捕捉精度只能算一般?！癈all Annie”則使用影視特效行業(yè)流行的主動(dòng)光學(xué)動(dòng)捕技術(shù)，給真人戴上光線傳感器頭盔，動(dòng)捕攝像機(jī)鏡頭發(fā)出光線，在面部形成一系列反光的標(biāo)記點(diǎn)（Marker），標(biāo)記點(diǎn)數(shù)據(jù)回傳到動(dòng)捕攝像機(jī)內(nèi)，形成單個(gè)Marker 的二維坐標(biāo)。至少三臺(tái)攝像機(jī)分別對(duì)應(yīng)每個(gè)反光標(biāo)記點(diǎn)的高度、寬度和縱深數(shù)值，最后合成出標(biāo)記點(diǎn)在攝像機(jī)內(nèi)的持續(xù)時(shí)間、三維坐標(biāo)、速度加速度、剛體等位姿信息。

2.1.3 三維模型動(dòng)效綁定

動(dòng)捕攝像機(jī)修正機(jī)內(nèi)數(shù)據(jù)，導(dǎo)入三維模型軟件進(jìn)行特效綁定。之前的數(shù)字人在進(jìn)行特效綁定時(shí)往往會(huì)出現(xiàn)表情僵硬、不流暢等問(wèn)題，這和算法有關(guān)。正常人的動(dòng)作是非線性的，有速度和加速度，轉(zhuǎn)化成數(shù)據(jù)呈現(xiàn)為貝澤爾曲線。Animato 公司創(chuàng)造性地設(shè)計(jì)了修正曲線，以解決運(yùn)動(dòng)軌跡線性的缺陷。

動(dòng)捕攝像機(jī)記錄的是點(diǎn)位信息，利用類似IPB 視頻幀間壓縮的編碼方式，把單個(gè)攝像機(jī)對(duì)應(yīng)的二維平面劃分為攝像機(jī)像場(chǎng)內(nèi)的無(wú)數(shù)個(gè)像素格，也被成為宏塊。從起幅到落幅，連貫動(dòng)作分解為宏塊內(nèi)反光標(biāo)記點(diǎn)（Marker）的序列，先確定初始、中間和結(jié)束標(biāo)記點(diǎn)的點(diǎn)位信息，得到關(guān)鍵幀；對(duì)每個(gè)分段的運(yùn)動(dòng)過(guò)程進(jìn)行預(yù)測(cè)，得到少量的預(yù)測(cè)幀；再對(duì)預(yù)測(cè)幀同時(shí)向前向后進(jìn)行二次運(yùn)算，得到更多的預(yù)測(cè)幀，提升之前預(yù)測(cè)幀的準(zhǔn)確性，這被稱為雙向預(yù)測(cè)幀。雙向預(yù)測(cè)幀之間相互參考，進(jìn)行微調(diào)和修復(fù)，最終由關(guān)鍵幀、預(yù)測(cè)幀、雙向預(yù)測(cè)幀等點(diǎn)位信息共同構(gòu)成面部動(dòng)作捕捉的連續(xù)活動(dòng)影像，這就是上文提到的“頂點(diǎn)流解算算法”的內(nèi)部原理。但這一算法也存在線性運(yùn)動(dòng)的劣勢(shì)，通過(guò)動(dòng)捕攝像機(jī)機(jī)內(nèi)修正相關(guān)數(shù)據(jù)。最后，這些數(shù)據(jù)會(huì)統(tǒng)一導(dǎo)入Maya、Blender 等軟件內(nèi)與模型進(jìn)行綁定，完成虛擬數(shù)字人Annie 的動(dòng)效制作。

2.2 應(yīng)用創(chuàng)新

2.2.1 與真人視頻通話般的模式創(chuàng)新

在“Call Annie”出現(xiàn)之前，相比真人授課或網(wǎng)絡(luò)一對(duì)一教學(xué)，手機(jī)App 自學(xué)存在明顯不足，這并非個(gè)體差異，而是教學(xué)模式的落后。一是自學(xué)內(nèi)容的專業(yè)性和可靠度存疑。即便有標(biāo)準(zhǔn)答案，答案的出處和答案的選定依據(jù)卻不得而知。二是相比當(dāng)面授課，學(xué)習(xí)App 缺少交流、示范和演練，自學(xué)可以學(xué)到知識(shí)，但學(xué)不來(lái)方法和習(xí)慣。三是碎片化管理，效率太低。長(zhǎng)時(shí)間無(wú)休止的學(xué)習(xí)讓自學(xué)者感到單調(diào)乏味，從而降低學(xué)習(xí)興趣；短時(shí)間高頻次的學(xué)習(xí)，又不容易形成學(xué)習(xí)的連貫性和系統(tǒng)性。當(dāng)面授課有時(shí)限、有節(jié)次、有規(guī)律地教學(xué)，往往能最大限度保證學(xué)習(xí)效果。

虛擬數(shù)字人Annie 讓手機(jī)App 學(xué)習(xí)從自學(xué)模式的窠臼中跳脫出來(lái)，回歸傳統(tǒng)教學(xué)理念，結(jié)合最新科技讓模式創(chuàng)新平添新意?！癈all Annie”的界面UI 沒(méi)有延續(xù)網(wǎng)頁(yè)設(shè)計(jì)的思路，完全仿照社交群組列表、手機(jī)通訊錄及聊天軟件界面。點(diǎn)擊Annie 的頭像，轉(zhuǎn)場(chǎng)特效會(huì)播放對(duì)方接聽網(wǎng)絡(luò)電話的待機(jī)畫面。接通后，手機(jī)屏幕會(huì)出現(xiàn)數(shù)字人的形象，下面分別是人員列表、語(yǔ)音文字切換、錄屏、音量及掛斷的按鈕，開發(fā)者還非常細(xì)心地調(diào)用前置攝像頭，顯示用戶自拍的畫中畫。所有流程都在引導(dǎo)用戶并營(yíng)造仿佛真人授課的儀式感，讓手機(jī)App 學(xué)習(xí)變成如真人視頻通話般的自由交流，這種模式創(chuàng)新在知識(shí)付費(fèi)領(lǐng)域當(dāng)屬首次。

2.2.2 教學(xué)與娛樂(lè)無(wú)縫銜接的環(huán)節(jié)創(chuàng)新

“Call Annie”的英語(yǔ)口語(yǔ)教學(xué)以不定話題的隨意聊天為主模塊，優(yōu)點(diǎn)是以練代學(xué)、學(xué)用相長(zhǎng)，是真正的情境教學(xué)法。而授課內(nèi)容和授課形式完全由學(xué)生主導(dǎo)，甚至類似于翻轉(zhuǎn)課堂，學(xué)生自主發(fā)布任務(wù)，進(jìn)行項(xiàng)目研究，獲得深刻理解，是真正的自主學(xué)習(xí)。在學(xué)習(xí)的同時(shí)，又能起到告知、愉悅和啟發(fā)的作用，更是真正的寓教于樂(lè)。不僅如此，提問(wèn)的內(nèi)容可以是如何糾正發(fā)音、語(yǔ)法使用是否規(guī)范及修辭對(duì)不同語(yǔ)意的適用性等進(jìn)階內(nèi)容，也可以是中英文夾雜、方言口音、邏輯不清等復(fù)雜情境，基于ChatGPT4.0 語(yǔ)言模型的數(shù)字人都能夠?qū)崟r(shí)根據(jù)學(xué)習(xí)者的水平，對(duì)她的語(yǔ)速、句式難易和對(duì)話內(nèi)容進(jìn)行調(diào)整，最大限度地在主模塊中給予學(xué)生自由度。

環(huán)節(jié)創(chuàng)新的第二個(gè)表現(xiàn)是專項(xiàng)訓(xùn)練副模塊的參與?！癈all Annie”為有特定需要的學(xué)生提供了6 個(gè)自選項(xiàng)目（custom prompts）：學(xué)習(xí)、娛樂(lè)、旅游、職場(chǎng)、社交和網(wǎng)絡(luò)搜索。數(shù)字人Annie 根據(jù)學(xué)生的偏好設(shè)置和之前對(duì)話的內(nèi)容，在這6 個(gè)選項(xiàng)的菜單欄下再次生成6 個(gè)，總計(jì)36 個(gè)提示詞的子選項(xiàng)，學(xué)生根據(jù)選項(xiàng)開啟本次對(duì)話的主題。因?yàn)閿?shù)字人的語(yǔ)言模型存儲(chǔ)在云端，在談話過(guò)程中，她會(huì)在內(nèi)容上鎖定重點(diǎn)、兼顧熱點(diǎn)、回顧難點(diǎn)，保證談話主題不偏移，從而提升口語(yǔ)練習(xí)的效度。環(huán)節(jié)內(nèi)部寓教于樂(lè)，環(huán)節(jié)之間相輔相成，整體上“智”趣相合，無(wú)縫銜接。

2.2.3 客制化服務(wù)的元素創(chuàng)新

“Call Annie”與蘋果iOS 的系統(tǒng)軟件深度綁定，可以在軟件內(nèi)設(shè)置由虛擬數(shù)字人提供定時(shí)叫醒和早間新聞的服務(wù)。教學(xué)元素方面，除了語(yǔ)音學(xué)習(xí)，還可以通過(guò)發(fā)送圖片開啟聊天，錄制視頻完成應(yīng)答，或以字幕或歷史文字記錄的形式進(jìn)行復(fù)習(xí)。根據(jù)用戶的學(xué)習(xí)能力，同樣是數(shù)字人Annie，甚至可以定制化她的語(yǔ)言模型和底層算法。以1.3.1 更新為例，該軟件提供免費(fèi)和付費(fèi)共兩個(gè)版本的數(shù)字人服務(wù)。免費(fèi)版本基于ChatGPT3.5 語(yǔ)言模型，數(shù)據(jù)庫(kù)相對(duì)較小，部分功能被屏蔽；付費(fèi)版本則是基于ChatGPT4.0 語(yǔ)言模型，數(shù)據(jù)庫(kù)完整，全部功能針對(duì)用戶開放，而且通過(guò)長(zhǎng)期對(duì)話，結(jié)合數(shù)字人的“深度學(xué)習(xí)”能力，她的言語(yǔ)風(fēng)格、聊天偏好和肢體動(dòng)作都存在個(gè)性化差異。

3.虛擬數(shù)字人的優(yōu)化策略

3.1 做好應(yīng)用場(chǎng)景的“虛擬開拓者”

虛擬數(shù)字人的感知智能日趨成熟，認(rèn)知智能也在不斷迭代，但推動(dòng)這種進(jìn)步的主體依然是人類。數(shù)字人不應(yīng)被囿于數(shù)字媒體時(shí)代的新介質(zhì)或新載體，更有望在數(shù)字人3.0 時(shí)代成為內(nèi)容創(chuàng)作的主體，其將推動(dòng)傳統(tǒng)媒體打破單一的“媒體域”而走向多域整合，高效助力融媒體內(nèi)容生產(chǎn)創(chuàng)新整合，更有望成為云宇宙的入口，有力推動(dòng)主流媒體改變自身在信息傳播格局中的被動(dòng)地位。目前，虛擬數(shù)字人的應(yīng)用場(chǎng)景依然非常局限。比如Annie 雖然擁有教學(xué)、社交、娛樂(lè)等屬性，但本質(zhì)還是服務(wù)型的數(shù)字人，以提供解決方案為宗旨。未來(lái)，在技術(shù)可控的前提下，讓數(shù)字人在更多領(lǐng)域更多場(chǎng)景成為開拓者，以人工智能的驚人算力、數(shù)據(jù)整合能力和高效準(zhǔn)確的決策能力，在科研、管理、演藝、設(shè)計(jì)等具體場(chǎng)景中發(fā)揮重要作用。

3.2 當(dāng)好信息安全的“數(shù)字把關(guān)人”

積極擁抱數(shù)字技術(shù)的同時(shí)，必須警惕信息安全漏洞對(duì)國(guó)家根本利益和國(guó)民人身財(cái)產(chǎn)可能造成的潛在危害。虛擬數(shù)字人理應(yīng)成為信息安全的第一道關(guān)，站好崗守好門，禁止涉黃、涉暴內(nèi)容傳播、甄別網(wǎng)絡(luò)虛假信息、監(jiān)測(cè)犯罪活動(dòng)、主動(dòng)保護(hù)涉密內(nèi)容，努力將社會(huì)治理的風(fēng)險(xiǎn)降到最低。未來(lái)，在媒體場(chǎng)景活動(dòng)的數(shù)字人則有著更特殊的權(quán)責(zé)，一旦出現(xiàn)問(wèn)題，媒體公信力將遭受重大打擊，公共資源被大量占用，社會(huì)信任危機(jī)頻發(fā)。因此，國(guó)家應(yīng)盡快出臺(tái)虛擬數(shù)字人監(jiān)管的相關(guān)法律法規(guī)，提前布局內(nèi)容審核、數(shù)據(jù)追蹤、數(shù)字身份識(shí)別和認(rèn)定等技術(shù)，引導(dǎo)相關(guān)產(chǎn)業(yè)健康有序發(fā)展。

結(jié)語(yǔ)

Annie 的誕生標(biāo)志著虛擬數(shù)字人正式進(jìn)入認(rèn)知領(lǐng)域，其背后的ChatGPT4.0 語(yǔ)言模型，更是超脫了算法或技術(shù)的范疇，豐富的情感和獨(dú)特的人格屬性，讓人類重新思考自身與數(shù)字人之間的關(guān)系。數(shù)字人的底層邏輯也從協(xié)調(diào)“人—機(jī)”關(guān)系，強(qiáng)調(diào)機(jī)器向人類趨近，機(jī)器向人類學(xué)習(xí)，開始向“機(jī)—人”關(guān)系靠攏，由人類向數(shù)字人尋求方法路徑和決策方案。雖然數(shù)字人的應(yīng)用前景一片光明，但要從技術(shù)和法律層面加強(qiáng)引導(dǎo)和監(jiān)管，真正與數(shù)字人實(shí)現(xiàn)價(jià)值共創(chuàng)。