王曉楊
近日,由中央電視臺(tái)和深圳市委宣傳部聯(lián)合出品,CCTV-9紀(jì)錄頻道和深圳廣播電影電視集團(tuán)聯(lián)合攝制的6集紀(jì)錄片《創(chuàng)新中國(guó)》首播收官。CSM媒介研究全國(guó)網(wǎng)數(shù)據(jù)顯示,該片播出期間,CCTV-9紀(jì)錄頻道收視率比去年同時(shí)段提高了17﹪,收視份額提高了10%。
《創(chuàng)新中國(guó)》共6集,內(nèi)容包括《信息》《能源》《制造》《生命》《空海》和《潮起》,展現(xiàn)了中國(guó)最新科技成就和創(chuàng)新精神,此外,該片也是世界首部利用人工智能模擬人聲完成配音的紀(jì)錄片,節(jié)目解說(shuō)部分全程運(yùn)用人工智能配音。
讓科學(xué)觸達(dá)觀眾
《創(chuàng)新中國(guó)》總導(dǎo)演史巖表示,“《創(chuàng)新中國(guó)》的策劃、產(chǎn)生是當(dāng)下中國(guó)社會(huì)發(fā)展的時(shí)代需求,是央視作為國(guó)家主流媒體自發(fā)自覺(jué)的社會(huì)責(zé)任擔(dān)當(dāng)。創(chuàng)新的范疇很大,包括制度創(chuàng)新、理論創(chuàng)新、文化創(chuàng)新等方面,但科學(xué)和技術(shù)的進(jìn)步是創(chuàng)新的核心力量所在,所以我們選擇科技創(chuàng)新成果作為主要切口,來(lái)呈現(xiàn)今天中國(guó)的創(chuàng)新故事?!薄秳?chuàng)新中國(guó)》不僅講述了科技知識(shí)本身,更重要的是講述了默默耕耘的科學(xué)家和創(chuàng)新者們?cè)趧?chuàng)新過(guò)程中發(fā)生的故事和展現(xiàn)的精神。在面臨新一輪產(chǎn)業(yè)革命和技術(shù)革命的時(shí)代背景下,該片呼吁全社會(huì)聚焦推動(dòng)中國(guó)科技發(fā)展的脊梁人物。
《創(chuàng)新中國(guó)》制片人劉穎表示,《創(chuàng)新中國(guó)》不僅要深入淺出地講解科學(xué)知識(shí),更重要的是將對(duì)科學(xué)的尊敬、對(duì)科學(xué)精神的尊敬和對(duì)創(chuàng)新者的尊敬觸達(dá)觀眾。
科技題材紀(jì)錄片拍攝難度大,對(duì)導(dǎo)演要求比較高,因此,國(guó)內(nèi)此類(lèi)題材的紀(jì)錄片也比較少?!氨热?,如何在有限的時(shí)間里,將量子、中微子等‘不明覺(jué)厲的科學(xué)名詞直觀地呈現(xiàn)給觀眾?”史巖認(rèn)為這是《創(chuàng)新中國(guó)》的制作難點(diǎn),也是看點(diǎn)。在主題選取上,6集內(nèi)容涵蓋了目前世界范圍內(nèi)普遍關(guān)注的科技前沿技術(shù)領(lǐng)域。節(jié)目中展現(xiàn)了我國(guó)自主研發(fā)的大飛機(jī)C919、第三代核電華龍一號(hào)、搜索宇宙信息的天眼等“大國(guó)重器”;還展示了無(wú)人機(jī)快遞、解決交通擁堵的城市大腦智慧管理系統(tǒng)、無(wú)人駕駛等與百姓生活密切相關(guān)的高科技;以及“給蚊子絕育”“返老還童”等黑科技。史巖介紹,《創(chuàng)新中國(guó)》拍攝了近80組人物故事,但考慮到篇幅和內(nèi)容結(jié)構(gòu)編排,最終只呈現(xiàn)了47個(gè)。
此外,片中運(yùn)用了大量的動(dòng)畫(huà)演示,并運(yùn)用微觀攝影等拍攝手法將復(fù)雜玄妙的科學(xué)世界可視化,讓觀眾更容易理解?!拔覀兇_立了希望抵達(dá)觀眾的目標(biāo)。但是這個(gè)過(guò)程中,沒(méi)有人知道捷徑。做《創(chuàng)新中國(guó)》就像科學(xué)家做科研工作一樣,我們做了無(wú)數(shù)次的‘實(shí)驗(yàn)。遇到難以呈現(xiàn)的科學(xué)現(xiàn)象,就轉(zhuǎn)換思路,嘗試多種表達(dá)方法。片子出來(lái)后大家一起提意見(jiàn),反復(fù)打磨,用心制作每一個(gè)故事,令其既要符合科學(xué)知識(shí),表達(dá)創(chuàng)新精神,也要生動(dòng)感人?!眲⒎f說(shuō)。
史巖表示,節(jié)目組非常關(guān)注觀眾反饋,網(wǎng)絡(luò)平臺(tái)上的彈幕是最直接的反饋,“我們?cè)贐站看到很多網(wǎng)友的彈幕留言,大家對(duì)于這部片子的喜愛(ài),對(duì)于先進(jìn)科技的好奇心讓我們深感欣慰?!?/p>
人工智能配音
史巖介紹,《創(chuàng)新中國(guó)》采用人工智能模擬人聲完成配音,是偶然也是必然。節(jié)目組找配音員試配過(guò),但是始終無(wú)法達(dá)到心目中大片的質(zhì)感。史巖想起了已逝的知名播音員、配音演員李易,2011年CCTV-9紀(jì)錄頻道成立時(shí),李易曾為第一部紀(jì)錄片《美麗中國(guó)》配音,他的聲音音質(zhì)純粹,語(yǔ)感穩(wěn)定,是央視紀(jì)錄頻道的標(biāo)志性聲音。史巖突然想到,如果可以用人工智能將李易的聲音復(fù)制出來(lái),不僅能為這部作品找到理想配音,同時(shí)也踐行了節(jié)目組科技創(chuàng)新的核心制作理念。
隨后,史巖聯(lián)系了一直為CCTV-9紀(jì)錄頻道做音頻工作的李易的徒弟王同,王同聽(tīng)后非常興奮。在得到李易家屬的支持后,史巖團(tuán)隊(duì)立即飛赴安徽合肥,開(kāi)始與科大訊飛接觸。
首次見(jiàn)面,科大訊飛AI研究院研發(fā)主管江源告訴史巖團(tuán)隊(duì),運(yùn)用他們擁有的頂級(jí)人工智能語(yǔ)音合成技術(shù),用標(biāo)準(zhǔn)的普通話(huà)合成出一段新聞稿,已經(jīng)不存在技術(shù)問(wèn)題。但是,情感是一種不容易量化和學(xué)習(xí)的復(fù)雜參數(shù)。運(yùn)用人工智能技術(shù)為紀(jì)錄片配音,這對(duì)他們來(lái)說(shuō)也是一次優(yōu)化算法、提升人工智能水準(zhǔn)的機(jī)會(huì)。于是,雙方順利達(dá)成合作意向。
回到北京,王同團(tuán)隊(duì)根據(jù)史巖對(duì)《創(chuàng)新中國(guó)》“平緩敘事”的聲音要求,從李易為紀(jì)錄頻道錄制的大量聲音中精心選出17個(gè)小時(shí)的素材交給科大訊飛AI研發(fā)團(tuán)隊(duì)(以下簡(jiǎn)稱(chēng)AI研發(fā)團(tuán)隊(duì))。AI研發(fā)團(tuán)隊(duì)從音色、韻律、內(nèi)容三個(gè)方面進(jìn)行量化分析。
AI研發(fā)團(tuán)隊(duì)是人工智能語(yǔ)音分析研究和計(jì)算機(jī)程序的專(zhuān)家團(tuán)隊(duì);王同團(tuán)隊(duì)則更了解紀(jì)錄片解說(shuō)詞的具體要求和紀(jì)錄片整體制作流程。兩個(gè)團(tuán)隊(duì)發(fā)揮各自?xún)?yōu)勢(shì),緊密配合,建立了一套順暢高效的合作流程。
首先,由導(dǎo)演組向AI研發(fā)團(tuán)隊(duì)提供解說(shuō)詞,AI研發(fā)團(tuán)隊(duì)進(jìn)行人工整理分析,標(biāo)注好需要計(jì)算機(jī)特別注意的點(diǎn),合成音頻文件。第二步,AI研發(fā)團(tuán)隊(duì)對(duì)音頻文件進(jìn)行初步判斷篩選,將優(yōu)化后的版本交給王同團(tuán)隊(duì)。同時(shí),還提供一個(gè)帶編號(hào)的解說(shuō)詞文本,每一句話(huà)一個(gè)編號(hào)。前兩個(gè)流程,AI研發(fā)團(tuán)隊(duì)一般需要5天左右的時(shí)間。第三步,王同團(tuán)隊(duì)將合成音頻文件擺放在片中的對(duì)應(yīng)位置,進(jìn)行第二輪篩選。找到不符合要求的音頻,就在帶編號(hào)的解說(shuō)詞文本上做好標(biāo)注,盡快反饋給AI研發(fā)團(tuán)隊(duì)進(jìn)行處理。音頻不滿(mǎn)足要求的原因包括連貫性不好、重音位置不對(duì)和斷句位置不對(duì)等。這個(gè)步驟,王同團(tuán)隊(duì)需要3天左右的時(shí)間。第四步,AI研發(fā)團(tuán)隊(duì)進(jìn)一步做音頻的焦點(diǎn)處理,同時(shí),王同團(tuán)隊(duì)開(kāi)始對(duì)聲音進(jìn)行精剪。這個(gè)工作需要3天左右的時(shí)間。第五步,將AI研發(fā)團(tuán)隊(duì)調(diào)整后的音頻替換進(jìn)片子里,王同團(tuán)隊(duì)繼續(xù)做剪輯。最終,執(zhí)行總導(dǎo)演查看配音是否還存在硬傷,并由執(zhí)行總導(dǎo)演當(dāng)場(chǎng)改詞,以嘗試其他可能的組合方式。
史巖回憶稱(chēng),第一次聽(tīng)到AI研發(fā)團(tuán)隊(duì)做的人工智能合成音頻,導(dǎo)演組還是很驚喜的,音頻相似度達(dá)到60%以上?!秳?chuàng)新中國(guó)》每集的音頻大概要進(jìn)行三個(gè)來(lái)回的反復(fù)修正,經(jīng)過(guò)不斷優(yōu)化,達(dá)到最終呈現(xiàn)效果。
劉穎表示,“人工智能語(yǔ)音合成技術(shù)這個(gè)創(chuàng)新的想法,點(diǎn)燃了我們整個(gè)團(tuán)隊(duì)的創(chuàng)作欲望。同時(shí),這項(xiàng)技術(shù)的運(yùn)用也引發(fā)了業(yè)界內(nèi)外關(guān)于人工智能、語(yǔ)音合成方面的思考?!秳?chuàng)新中國(guó)》采用人工智能語(yǔ)音配音的意義就在于我們走出了這一步,推動(dòng)了藝術(shù)與技術(shù)的結(jié)合?!眅ndprint