蔣曉宋
(湖南廣播電視網(wǎng)絡(luò)傳輸中心,湖南 長沙 410003)
隨著廣播電視技術(shù)的發(fā)展,傳統(tǒng)電視正在向媒體融合、終端移動、質(zhì)量高清等方向轉(zhuǎn)變,播出平臺、傳播路徑和接收方式已越來越多樣化。作為行業(yè)監(jiān)管部門,如何把控各個環(huán)節(jié)廣播電視的安全播出,確保正確的政治方向和輿論導向,堅決守好新聞宣傳主陣地,已成為行業(yè)都在思考和探索的問題。目前,廣播電視行業(yè)各級別的監(jiān)管系統(tǒng)都收錄了大量的節(jié)目數(shù)據(jù),但對電視節(jié)目內(nèi)容的監(jiān)聽監(jiān)看主要還是依靠人工進行,由于圖像數(shù)據(jù)量大(一個省級監(jiān)管平臺節(jié)目數(shù)據(jù)的大小都是PB級別以上),人工處理不僅效率低,有些任務(wù)還根本無法完成;有的監(jiān)管平臺雖然也利用了計算機輔助處理,但在海量、毫無規(guī)則的數(shù)據(jù)面前,根本沒有發(fā)揮太大的優(yōu)勢。而作為宣傳管理部門重點關(guān)注的電視新聞類節(jié)目,一般普通話質(zhì)量好,內(nèi)容精煉,圖像畫面特征明顯,有一定的規(guī)律可循,如能利用大數(shù)據(jù)、人工智能(Artificial Intelligence,AI)等技術(shù),將給計算機的自動處理提供可行性,從而大大提高廣播電視節(jié)目監(jiān)聽監(jiān)看的效率。
人工智能電視新聞節(jié)目監(jiān)管系統(tǒng)由節(jié)目存儲系統(tǒng)、業(yè)務(wù)支撐服務(wù)系統(tǒng)和業(yè)務(wù)應(yīng)用系統(tǒng)組成[1]。其處理的節(jié)目既可以是實時節(jié)目,也可以是錄制節(jié)目,還可以使用其他已建好的監(jiān)管平臺中的節(jié)目。系統(tǒng)功能組成如圖1所示。
圖1 人工智能電視新聞節(jié)目監(jiān)管系統(tǒng)功能框圖
存儲系統(tǒng)主要用來存儲節(jié)目信息、關(guān)鍵詞庫和應(yīng)用數(shù)據(jù)信息等,其中大部分用于系統(tǒng)處理后需長時間保存的節(jié)目信息[2]。業(yè)務(wù)支撐服務(wù)系統(tǒng)包括視頻拆條、圖像識別、文字識別、關(guān)鍵詞提取等功能,其主要作用是對節(jié)目存儲系統(tǒng)中需處理的新聞節(jié)目進行分段,基于電視節(jié)目的視頻特征、音頻特征、文本特征、壓縮域特征等,采用新聞標題板檢測、關(guān)鍵人物畫面檢測、節(jié)目場景變換檢測、語音識別、新聞標題板字幕識別等AI處理技術(shù),對新聞節(jié)目進行結(jié)構(gòu)化分析,有效識別新聞節(jié)目的轉(zhuǎn)場時間點,然后采用節(jié)目分割技術(shù)將連續(xù)的節(jié)目流分割為具有特定語義的多個小視頻,并自動將節(jié)目語音識別為文本,自動識別新聞標題板中的字幕等,實現(xiàn)新聞節(jié)目的碎片化處理,以便于后續(xù)的數(shù)據(jù)檢索與分析[3]。業(yè)務(wù)應(yīng)用系統(tǒng)由任務(wù)管理、系統(tǒng)管理、節(jié)目管理、專題管理、統(tǒng)計報表及人工檢驗等模塊組成,主要完成人機對話功能,實現(xiàn)人工對系統(tǒng)的規(guī)則設(shè)置。系統(tǒng)完成任務(wù)后輸出展示監(jiān)管結(jié)果,同時還可對監(jiān)管系統(tǒng)中產(chǎn)生的錯誤進行人工修正和關(guān)鍵詞增減等。
湖南省廣播電視監(jiān)管系統(tǒng)利用已有的監(jiān)管平臺的實時節(jié)目流作為信號源,系統(tǒng)按人工設(shè)定的監(jiān)測時間段,每天自動對35套節(jié)目中的當?shù)匦侣剝?nèi)容進行數(shù)據(jù)分析。用戶通過客戶端/服務(wù)器(Client/Server,C/S)端和瀏覽器/服務(wù)器(Browser/Server,B/S)端靈活操作,可以實現(xiàn)節(jié)目內(nèi)容快速定位、快捷監(jiān)看、智能識別提示、內(nèi)容標注、剪輯合成、內(nèi)容下載及錄像編目等功能[4]。具體應(yīng)用場景如圖2所示。
圖2 應(yīng)用場景案例
節(jié)目通過系統(tǒng)處理后,新聞節(jié)目將自動從片段層進行分段,自動提取新聞標題、自動將所有語音識別成文字,并根據(jù)識別的文字生成該段新聞的關(guān)鍵詞,同時還對該段新聞的進出點進行標識,以便于用戶快速定位監(jiān)看。系統(tǒng)提供人工審核功能,可以對機器自動生成的信息進行人工核對修正,如對關(guān)鍵詞、生成的文字錯誤的校正,分段錯誤時進行剪輯合成等。用戶使用系統(tǒng)時,可按時間、關(guān)鍵詞等搜索新聞條目進行內(nèi)容的監(jiān)聽監(jiān)看,可下載每條新聞識別出的文字信息,以便節(jié)目評議時使用[5]。系統(tǒng)具有多維度的統(tǒng)計功能,可按頻道統(tǒng)計一個時間周期里所有新聞的播放條數(shù),按關(guān)鍵詞統(tǒng)計播放次數(shù),按新聞類型(如領(lǐng)導動態(tài)、鄉(xiāng)村振興、疫情防控等)進行統(tǒng)計等,以便為監(jiān)評簡報的快速生成提供數(shù)據(jù)服務(wù)。系統(tǒng)還有重點人物識別功能,利用人臉識別技術(shù),可自動識別節(jié)目畫面中的重點人物,將該人物姓名作為新聞片段的關(guān)鍵詞之一,并對重點人物出現(xiàn)的時間、持續(xù)時長自動進行標注[6]。
人工智能電視新聞節(jié)目監(jiān)管系統(tǒng)要實現(xiàn)節(jié)目的檢索和統(tǒng)計功能,直接在音視頻流上處理顯然無法完成,這需要將音視頻流變成與文字關(guān)聯(lián)的信息,然后通過處理文字信息來實現(xiàn)目標。因此,就需要對新聞節(jié)目進行拆條,對語音進行文字轉(zhuǎn)換,對文字進行關(guān)鍵詞提取,然后將這些信息按對應(yīng)的關(guān)系分門別類保存,并與關(guān)鍵詞建立索引,以便統(tǒng)計查詢,所用到的關(guān)鍵技術(shù)主要有視頻拆條、新聞標題提取和關(guān)鍵詞生成技術(shù)。
視頻拆條技術(shù)主要是基于動態(tài)特征識別,如對視頻關(guān)鍵幀、場景、字幕、人臉等元素的分析,通過鏡頭變換檢測技術(shù)、字幕提取技術(shù)等進行自動拆分。在視頻中用同一攝像機進行連續(xù)不間斷拍攝的一段視頻內(nèi)容稱為一個境頭,同一鏡頭中的兩相鄰幀的運動、顏色和灰度級不會有太大變化[7]。鏡頭變換檢測技術(shù)就是通過對視頻境頭切換情況的分析,依據(jù)鏡頭組織和特征索引,采用視頻聚類等方法研究鏡頭邊界之間的關(guān)系。該技術(shù)的主要研究內(nèi)容包括關(guān)鍵幀的提取、圖像特征的描述、相似度計算、聚類算法的設(shè)計以及自適應(yīng)閾值的確定等。利用字幕提取技術(shù)拆條主要是根據(jù)字幕或標題的自動識別,當字幕和標題內(nèi)容出現(xiàn)變化時,判斷節(jié)目內(nèi)容變化,同樣利用人臉、場景等元素進行綜合分析判斷,從而實現(xiàn)精準視頻拆條。
新聞標題提取就是通過圖像和文字自動識別技術(shù),從新聞視頻流中提取新聞標題內(nèi)容,并支持對主標題和副標題進行區(qū)分。在電視新聞類節(jié)目中,標題字幕基本都有一些相似的特點,如標題字幕在畫面中顯示的位置、大小限定的范圍、排列方式、顯示時長、使用的字體、字幕背景等。利用這些特征進行分析,可有效地降低新聞標題提取的難度,提高識別的準確性。在新聞標題提取過程中,首先從動態(tài)的視頻流中提取關(guān)鍵幀確定為需要處理的靜態(tài)圖片,然后對靜態(tài)圖片進行邊緣檢測、字幕區(qū)域檢測等,確定只含有新聞標題字幕的圖片,最后將圖片進行OCR識別,從而得到可編輯的新聞標題文字。
關(guān)鍵詞的生成包括從新聞標題中生成和從該段新聞播報的內(nèi)容中生成,利用它可方便快速地檢索到目標數(shù)據(jù)。在實現(xiàn)過程中,首先要利用語音識別技術(shù),將新聞播報的內(nèi)容自動轉(zhuǎn)換成文字。目前該技術(shù)相對成熟,特別是對新聞節(jié)目而言,因播音質(zhì)量高,市場上主流產(chǎn)品的識別準確率基本都能達到90%以上。之后,從識別出來的文字中自動提取關(guān)鍵詞。
廣播電視監(jiān)管系統(tǒng)中數(shù)據(jù)量龐大,利用大數(shù)據(jù)和人工智能技術(shù)進行信息處理,既提高了監(jiān)管效能,又緊跟了科技時代的發(fā)展步伐,還符合智慧廣電、智慧監(jiān)管體系的行業(yè)政策要求,具有很強的現(xiàn)實意義。但在一些實際應(yīng)用中,由于涉及到數(shù)據(jù)挖掘、圖文處理、信息檢索等很多計算機前沿領(lǐng)域技術(shù),所以有些實現(xiàn)方法、算法還有待進一步優(yōu)化,監(jiān)測的準確性也有待進一步提高。行業(yè)在新業(yè)態(tài)和新應(yīng)用中,應(yīng)注意充分利用廣播電視產(chǎn)業(yè)鏈中不同環(huán)節(jié)功能特長的優(yōu)勢,以及互聯(lián)網(wǎng)中大數(shù)據(jù)處理的優(yōu)勢,取長補短,合理整合資源,真正形成智能、共享、可復制的廣播電視監(jiān)管體系。