張 樂(lè),王 晨,李 良,潘昊天
(濟(jì)南日?qǐng)?bào)報(bào)業(yè)集團(tuán)愛(ài)濟(jì)南客戶端,山東濟(jì)南 250022)
隨著數(shù)字化時(shí)代的發(fā)展,AI(Artificial Intelligence)技術(shù)無(wú)論是從硬件架構(gòu)還是軟件算法,都取得了長(zhǎng)足的進(jìn)步。AI賦能的領(lǐng)域越來(lái)越廣泛,AI技術(shù)應(yīng)用于視頻制作也將很快成為現(xiàn)實(shí)。AI技術(shù)的應(yīng)用,將極大豐富視頻制作風(fēng)格,并提高視頻節(jié)目的產(chǎn)量,同時(shí)解放導(dǎo)播、攝像等相關(guān)人員的生產(chǎn)力,使這些專業(yè)人員轉(zhuǎn)向AI無(wú)法實(shí)現(xiàn)的更有創(chuàng)意的視頻內(nèi)容創(chuàng)作中。同時(shí),在新媒體爆發(fā)式的快速成長(zhǎng)、相關(guān)視頻人員配置增長(zhǎng)緩慢的大背景下,各類媒體對(duì)于AI導(dǎo)播有著更加迫切的需求。AI 技術(shù)目前在視頻作品中有如下一些實(shí)際應(yīng)用:
(1)視頻分析和標(biāo)注:AI可以分析視頻中的內(nèi)容,如人物、場(chǎng)景、動(dòng)作等,然后標(biāo)注并分類這些元素,以便于編輯和管理。
(2)自動(dòng)化編輯:AI可以根據(jù)特定的規(guī)則和算法,自動(dòng)編輯出優(yōu)美的鏡頭序列,包括顏色校正、特效添加、音效等。
(3)自動(dòng)化音效處理:AI 可以識(shí)別不同的音效類型,如爆炸聲、腳步聲、交通聲等,并根據(jù)需要自動(dòng)生成相應(yīng)的音效。
(4)語(yǔ)音識(shí)別和字幕生成:AI 可以將影片中的對(duì)話轉(zhuǎn)換成文字,并自動(dòng)生成字幕,以方便觀眾理解[1]。
由于現(xiàn)階段人工智能還不具備自我意識(shí)。所以審美、藝術(shù)創(chuàng)意、新型節(jié)目制作手段等,機(jī)器還無(wú)法完全替代人類。本文就是基于現(xiàn)階段,以及未來(lái)可預(yù)見(jiàn)的時(shí)期內(nèi),在現(xiàn)有的AI工作模式下,對(duì)AI導(dǎo)播功能進(jìn)行技術(shù)分析,結(jié)合AI 處理能力及處理方式,對(duì)不同類型的視頻節(jié)目特征進(jìn)行數(shù)字化提取,并進(jìn)行相應(yīng)的數(shù)字建模。
視頻節(jié)目按照節(jié)目形式,可以分為8大類[2]:
(1)電視新聞資訊節(jié)目:以新聞材料為基礎(chǔ),加工制作而成的電臺(tái)或電視節(jié)目,新聞節(jié)目可包括現(xiàn)場(chǎng)或預(yù)先錄制的訪問(wèn)、專家的分析、民意調(diào)查結(jié)果,偶爾會(huì)包含社論內(nèi)容。
(2)電視談話節(jié)目:以電視為傳播媒介,通過(guò)話語(yǔ)形式,營(yíng)造屏幕內(nèi)外面對(duì)面人際傳播的“場(chǎng)”氛圍,以語(yǔ)言符號(hào)和非語(yǔ)言符號(hào)雙渠道來(lái)傳遞信息,整合大眾傳播與人際傳播的電視節(jié)目類型。
(3)電視文藝節(jié)目:以文學(xué)、藝術(shù)和文藝演出作為創(chuàng)作原始素材和基本構(gòu)成元素,在保留原來(lái)藝術(shù)形式的基礎(chǔ)上,運(yùn)用電視視聽(tīng)語(yǔ)言進(jìn)行二度創(chuàng)作,具有較高藝術(shù)欣賞性和審美價(jià)值的電視節(jié)目類型。
(4)電視娛樂(lè)節(jié)目:通過(guò)電視這一特定的傳播媒體傳播的,大眾廣泛參與的,以審美性、娛樂(lè)性、觀賞性和趣味性為突出特點(diǎn)的電視節(jié)目。中國(guó)電視娛樂(lè)節(jié)目發(fā)展到今天,經(jīng)歷了晚會(huì)時(shí)期、娛樂(lè)時(shí)期、競(jìng)猜時(shí)期、真人秀時(shí)期四個(gè)時(shí)期。
(5)電視紀(jì)錄片:運(yùn)用電子采錄設(shè)備和手段,對(duì)政治、經(jīng)濟(jì)、文化等新聞?lì)}材,作比較系統(tǒng)完整的紀(jì)實(shí)報(bào)道。它運(yùn)用新聞鏡頭,客觀真實(shí)地記錄社會(huì)生活,客觀地反映生活中的真人、真事、真情、真景,著重展現(xiàn)生活原生形態(tài)的完整過(guò)程,排斥虛構(gòu)和扮演的新聞性電視節(jié)目形態(tài)。
(6)電視?。阂环N適應(yīng)熒屏、專為在電視或網(wǎng)絡(luò)視頻平臺(tái)上播映的戲劇樣態(tài)。隨著廣播事業(yè)和互聯(lián)網(wǎng)新媒體的誕生而發(fā)展興盛起來(lái)的,如今還創(chuàng)新產(chǎn)出了電影短劇、網(wǎng)絡(luò)豎屏劇和互動(dòng)劇等新型網(wǎng)絡(luò)劇。
(7)電視電影:專門為電視播放所拍攝的電影,通常用數(shù)字技術(shù)進(jìn)行拍攝,也可以用膠片拍攝,電視電影的制作一般規(guī)模不大,拍攝周期相對(duì)較短。
(8)電視特別節(jié)目談話類:根據(jù)內(nèi)容來(lái)分,有嚴(yán)肅、娛樂(lè)類等形式,也可以細(xì)分為人物性的、事件性的、話題性的、情感性的等幾類,有時(shí)界限也不明確。在傳播形式既定的基礎(chǔ)上,要在傳播內(nèi)容、傳播角度、節(jié)目流程等方面體現(xiàn)不同電視談話節(jié)目的個(gè)性的要求主要體現(xiàn)在策劃人員的策劃水平上。電視談話節(jié)目策劃是一種豐富、復(fù)雜、綜合性的活動(dòng)。
根據(jù)節(jié)目的不同分類,其錄制形式也各不相同,故需要采用不同的數(shù)字特征進(jìn)行智能的場(chǎng)景切換,從而實(shí)現(xiàn)AI導(dǎo)播的智能切換。為了解放更多的勞動(dòng)力,可以根據(jù)不同的錄制場(chǎng)景,進(jìn)行只有導(dǎo)播使用AI 技術(shù),攝像員、視頻技術(shù)、音頻技術(shù)等其他工種依然采用人類操作者進(jìn)行節(jié)目錄制;在場(chǎng)景比較單一、節(jié)目?jī)?nèi)容中人員較少的環(huán)境下,也可以采用AI 導(dǎo)播加AI 攝像的方式進(jìn)行節(jié)目的錄制。簡(jiǎn)要如圖1所示。
圖1 AI 導(dǎo)播應(yīng)用場(chǎng)景示意圖
下面,就根據(jù)不同的節(jié)目類型進(jìn)行分析,確定相應(yīng)的AI賦能方案。
此類節(jié)目場(chǎng)景較為單一,多為固定機(jī)位、固定背景,現(xiàn)場(chǎng)人物僅包含一位或兩位主持人,一位或幾位嘉賓。所有人物基本處于坐姿或者站姿的狀態(tài),基本不會(huì)出現(xiàn)大范圍移動(dòng)情況。錄制過(guò)程中,燈光舞臺(tái)不會(huì)出現(xiàn)較大變化。對(duì)于此類場(chǎng)景,可以采用全部AI制作的方式,導(dǎo)播、攝像、視頻技術(shù)、音頻技術(shù)全部實(shí)現(xiàn)“無(wú)人化”。
(1)導(dǎo)播方面:此類場(chǎng)景中,大部分情況下,由主持人進(jìn)行口播,然后轉(zhuǎn)入新聞視頻。在這種場(chǎng)景下,技術(shù)人員通過(guò)提前給AI 導(dǎo)播系統(tǒng)輸入串詞或者主持詞,導(dǎo)播系統(tǒng)就可以在節(jié)目錄制時(shí),根據(jù)串詞或者主持詞進(jìn)行相應(yīng)的切換工作,并自動(dòng)播出相應(yīng)視頻短片。某些新聞節(jié)目中會(huì)有嘉賓與主持人交流的環(huán)節(jié),AI導(dǎo)播可根據(jù)不同人物說(shuō)話時(shí)的話筒信號(hào),采用類似語(yǔ)音激勵(lì)的方式,進(jìn)行智能的機(jī)位切換。切換原則本著“全景”接“特寫”接“全景”……以此類推,“全景”“特寫”機(jī)位交替切換的方式進(jìn)行切換。如在交流過(guò)程中遇到需要插播其他視頻畫面時(shí),AI導(dǎo)播可以通過(guò)提取主持人講話的關(guān)鍵詞,如“下面讓我們看一下前方的情況”、“讓我們看看當(dāng)時(shí)的視頻”等等,進(jìn)行外來(lái)直播畫面或者視頻素材的切換工作。當(dāng)然,對(duì)于這些關(guān)鍵詞,需要AI 導(dǎo)播在實(shí)際使用前,進(jìn)行一定數(shù)量的機(jī)器訓(xùn)練,以達(dá)到較好的使用效果。
(2)攝像方面:由于畫面中人物位置多為固定,可以采用云臺(tái)攝像機(jī),替代人類攝像員。同時(shí),由于新聞?lì)惞?jié)目的嚴(yán)肅性,每個(gè)機(jī)位畫面的構(gòu)圖都有相應(yīng)的規(guī)范,AI 系統(tǒng)完全可以根據(jù)這些規(guī)范進(jìn)行自主構(gòu)圖。根據(jù)前文中AI導(dǎo)播系統(tǒng)錄入的串詞和主持詞,以及提前錄入的相應(yīng)主持人、嘉賓的人臉識(shí)別信息,進(jìn)行人物的識(shí)別、構(gòu)圖、拍攝工作。
(3)后臺(tái)技術(shù)方面:視頻技術(shù)和音頻技術(shù)根據(jù)相應(yīng)規(guī)范,交由AI 系統(tǒng)進(jìn)行統(tǒng)一調(diào)整,其響應(yīng)速度和調(diào)整精度應(yīng)該會(huì)優(yōu)于人類技術(shù)人員。
此類節(jié)目與新聞資訊類節(jié)目較為類似,畫面中人物較為固定,場(chǎng)景也較為固定,區(qū)別是:可能有多位嘉賓進(jìn)行交流,嘉賓之間可能會(huì)出現(xiàn)“壓話”“搶話”等問(wèn)題,此類問(wèn)題AI 導(dǎo)播可以采用切換全景機(jī)位(全景機(jī)位包含全部的人物關(guān)系)的方式進(jìn)行解決。此場(chǎng)景下,對(duì)AI攝像要求較高,因?yàn)槠洚嬅鏄?gòu)圖更為多樣,包含單人特寫、單人中景、多人中景等,這些可以通過(guò)大量的、本節(jié)目的早期視頻素材對(duì)AI 攝像進(jìn)行訓(xùn)練,使其提取更多的數(shù)字模型來(lái)解決。其他工種基本要求與新聞?lì)愃?,這里不再贅述。
此類節(jié)目由于更多的是需要用鏡頭的語(yǔ)言來(lái)表現(xiàn)文學(xué)、藝術(shù)等元素,而現(xiàn)階段的人工智能更多的是通過(guò)大量的訓(xùn)練素材,即大數(shù)據(jù)進(jìn)行機(jī)械的歸納,并模擬人類導(dǎo)播進(jìn)行視頻的切換工作,其切換的方式是根據(jù)訓(xùn)練模型機(jī)械的進(jìn)行模擬操作。同時(shí),豐富的拍攝手法和拍攝創(chuàng)意,需要更多創(chuàng)造性的發(fā)揮。而且節(jié)目中會(huì)運(yùn)用大量的有強(qiáng)烈視覺(jué)沖擊的光影效果以及音響效果,對(duì)于視音頻技術(shù)也是一個(gè)非常大的挑戰(zhàn)。所以就現(xiàn)階段的AI 工作模式來(lái)說(shuō),此類節(jié)目用AI 技術(shù)無(wú)法進(jìn)行有效的創(chuàng)作,所以現(xiàn)階段AI技術(shù)暫時(shí)無(wú)法應(yīng)用于該類節(jié)目,而是更多的需要依靠現(xiàn)實(shí)的人類來(lái)進(jìn)行創(chuàng)作。這也是人類勝過(guò)機(jī)器的倫理表現(xiàn)。
從娛樂(lè)節(jié)目的定義來(lái)看,此類節(jié)目需要的特殊創(chuàng)意并不是很多,大部分的創(chuàng)意工作在后期包裝階段,后期包裝更依賴人類進(jìn)行創(chuàng)意制作。就前期拍攝階段來(lái)說(shuō),大部分鏡頭以寫實(shí)反映為主。并且大部分的鏡頭切換都有相應(yīng)的規(guī)范套路,故此類節(jié)目可以由機(jī)器進(jìn)行現(xiàn)場(chǎng)制作,然后由人類進(jìn)行后期包裝。
(1)前期制作階段,對(duì)于AI導(dǎo)播部分:也是可以按照視頻畫面中的人物動(dòng)作,進(jìn)行數(shù)字圖像處理,將特寫鏡頭指向說(shuō)話的人物或者是動(dòng)作幅度較大的人物。這樣,一些活動(dòng)中觀眾或者嘉賓的真實(shí)反應(yīng)可以毫無(wú)遺漏的剪輯到視頻當(dāng)中。
(2)對(duì)于AI攝像部分:盡量架設(shè)較多的機(jī)位,以便照顧到每一位嘉賓。采取一位嘉賓配一個(gè)到兩個(gè)機(jī)位進(jìn)行特寫拍攝;如果現(xiàn)場(chǎng)嘉賓分組的話,成組的嘉賓額外配置一臺(tái)小全景攝像機(jī)。主持人每人單配一臺(tái)特寫機(jī)位。最后,一臺(tái)攝像機(jī)作為大全景機(jī)位進(jìn)行拍攝。特寫機(jī)位拍攝時(shí),可以訓(xùn)練AI對(duì)嘉賓面部的表情、夸張的肢體語(yǔ)言進(jìn)行特征提取,然后進(jìn)行抓拍,提高節(jié)目的娛樂(lè)效果。
(3)AI 視音頻技術(shù)部分:由于現(xiàn)場(chǎng)環(huán)境可能會(huì)有較大變化、嘉賓的動(dòng)作語(yǔ)言等隨時(shí)有預(yù)料之外的狀況發(fā)生,可以采用目前真人秀拍攝的方式,即視頻和音頻單人單采、后期混剪的方式進(jìn)行錄制。并且由人類工作人員進(jìn)行審核和調(diào)整。
受限于目前拍攝設(shè)備的能力,使用AI 機(jī)位拍攝,不能像人類攝像員可以進(jìn)行移動(dòng)拍攝,即AI拍攝僅能進(jìn)行固定機(jī)位的拍攝。所以AI 制作手段僅適用于固定舞臺(tái)或較小的場(chǎng)地的拍攝工作。大型的多場(chǎng)景真人秀,或者運(yùn)動(dòng)類的真人秀節(jié)目現(xiàn)階段暫時(shí)無(wú)法使用AI技術(shù)進(jìn)行拍攝。
此類節(jié)目更注重現(xiàn)實(shí)的真實(shí)反映,其視頻拍攝、素材整理、視頻剪輯等工作必須經(jīng)由人類工作人員進(jìn)行撰稿、剪輯、審核,所以前期制作階段不適宜使用AI系統(tǒng)。至于視音頻技術(shù),現(xiàn)在已經(jīng)實(shí)現(xiàn)了老舊視頻素材的高清化、超高清化變換,以及受損畫質(zhì)修復(fù),音頻的清晰化處理等。在這些方面,AI技術(shù)還是有一定的應(yīng)用場(chǎng)景[3,4]。
此類節(jié)目需要豐富的劇本,以及演員和劇組的深度配合,成片都是通過(guò)大量的后期制作產(chǎn)生的,AI 的應(yīng)用場(chǎng)景并不適合此類節(jié)目的實(shí)際需求。AI 僅能輔助檢查畫面指標(biāo)、音頻指標(biāo)等,并提供相應(yīng)的參考。
同電視劇一樣,電影是通過(guò)凝練的故事、豐富的鏡頭語(yǔ)言、創(chuàng)意的剪輯手法等,將故事濃縮于1至數(shù)小時(shí)的時(shí)間之中。同電視劇一樣,必須完全由人類工作人員完成作品的創(chuàng)作,AI 僅能輔助檢查畫面指標(biāo)、音頻指標(biāo)等,并提供相應(yīng)的參考。
此類節(jié)目從定義來(lái)看,形式豐富多樣,有簡(jiǎn)單有復(fù)雜,可以參考前文所述,根據(jù)鏡頭語(yǔ)言的復(fù)雜性和導(dǎo)播切換的創(chuàng)意要求,進(jìn)行有選擇的AI技術(shù)的應(yīng)用。
在AI技術(shù)的加持下,視頻節(jié)目制作將變得更為高效。常規(guī)的固定場(chǎng)景節(jié)目可以解放導(dǎo)播、攝像、視頻技術(shù)、音頻技術(shù)等多崗位人員,使他們擺脫重復(fù)、機(jī)械的勞動(dòng),大大降低了錄制工作中的人為失誤,簡(jiǎn)化了節(jié)目的錄制流程,從而大大提高了節(jié)目的錄制效率。同時(shí),這些人員可以投入到更具創(chuàng)造力的工作當(dāng)中,可以充分發(fā)揮人的主觀能動(dòng)性,以及創(chuàng)新創(chuàng)意,制作出更多更好的視頻節(jié)目。同時(shí),也可以不斷嘗試探索更易被觀眾接受的新型節(jié)目和攝制手法,將人的主觀能動(dòng)性充分利用,將電視節(jié)目制作不斷向縱深發(fā)展。
未來(lái),AI 技術(shù)將助力自媒體精簡(jiǎn)人員、提高工作效率,從而獲取更大的效益。而對(duì)于專業(yè)媒體來(lái)說(shuō),通過(guò)不斷對(duì)大數(shù)據(jù)模型的整理,AI視頻節(jié)目的制作將無(wú)限趨近于人類,通過(guò)不斷創(chuàng)新探索,更多更新穎的節(jié)目形式和節(jié)目?jī)?nèi)容也將慢慢交給AI來(lái)完成,大量更優(yōu)質(zhì)的視頻節(jié)目會(huì)不斷涌現(xiàn)。相較于采用傳統(tǒng)制作方式運(yùn)作的媒體,采用AI 加持的媒體會(huì)更有競(jìng)爭(zhēng)力,最終領(lǐng)跑業(yè)界。
由于現(xiàn)階段AI 技術(shù)在視頻制作的應(yīng)用中還較為單一和初級(jí),本文僅能從大面上進(jìn)行分析,以期待未來(lái)隨著AI 技術(shù)的不斷成熟,將AI 技術(shù)真正應(yīng)用到視頻節(jié)目的制作當(dāng)中來(lái)。同時(shí),由于新聞倫理等的要求,AI技術(shù)并不適用于由關(guān)鍵詞引發(fā)的新聞撰寫工作等一些較為客觀的內(nèi)容生產(chǎn)?,F(xiàn)階段,機(jī)器并沒(méi)有意識(shí)、審美,也無(wú)法將人類的價(jià)值觀應(yīng)用到創(chuàng)作的作品當(dāng)中。對(duì)于新聞宣傳來(lái)說(shuō),正確引導(dǎo)輿論、弘揚(yáng)正能量是非常重要的。現(xiàn)階段AI工作模式是通過(guò)大數(shù)據(jù),即大量的訓(xùn)練素材對(duì)機(jī)器進(jìn)行訓(xùn)練,使其提取其中的共同特點(diǎn),然后應(yīng)用到新的任務(wù)當(dāng)中去。所以該模式下,機(jī)器能做到的僅僅是模仿、提取關(guān)鍵字、關(guān)鍵詞,然后進(jìn)行反饋。而視頻節(jié)目的制作更多的是講究藝術(shù)、創(chuàng)意,以及正確價(jià)值觀的宣揚(yáng)。所以現(xiàn)階段,人工智能還不可能完全替代人類進(jìn)行工作。只能作為一種技術(shù)手段,將人們從繁雜、重復(fù)、機(jī)械的勞動(dòng)中解放出來(lái),去投入到更有藝術(shù)感的創(chuàng)作之中。但是相信,在越來(lái)越多相關(guān)的科技公司、傳媒機(jī)構(gòu)的不斷努力下,AI 技術(shù)終將不斷發(fā)展,最終參與到各種類型的視頻節(jié)目制作當(dāng)中,不斷解放和發(fā)展生產(chǎn)力。期待AI技術(shù)更美好的明天!