王學(xué)博
山東廣播電視臺 山東 濟(jì)南 250014
在融媒體業(yè)務(wù)不斷發(fā)展、創(chuàng)新的背景下,面臨著待審內(nèi)容數(shù)量大、內(nèi)容來源類型多、時效性要求高等新要求,強調(diào)既要滿足傳統(tǒng)節(jié)目審核機(jī)制,又要嚴(yán)格把控審核尺度,避免出現(xiàn)審查遺漏。在此環(huán)境下,更需要具備更加權(quán)威、專業(yè)、智能化的審核工具,用于滿足廣電受眾的需求和社會形式。
為保證廣電行業(yè)健康、可持續(xù)性發(fā)展,新形勢下的專網(wǎng)及定向傳播視聽節(jié)目應(yīng)遵循《專網(wǎng)及定向傳播視聽節(jié)目服務(wù)管理規(guī)定》內(nèi)容,嚴(yán)禁出現(xiàn)違反相關(guān)規(guī)定、危害社會公德、破壞民族團(tuán)結(jié)等內(nèi)容,建立健全的審查制度、播出制度。人工智能審核系統(tǒng)的應(yīng)用需立足于審核內(nèi)容要求和規(guī)范開展相關(guān)工作,以IPTV集成播控平臺內(nèi)容審核流程為例,除了智能系統(tǒng)外,審核團(tuán)隊還包括負(fù)責(zé)人、主管、編輯及相關(guān)專審人員,注重各個環(huán)節(jié)審核的真實性、導(dǎo)向問題,避免造成版權(quán)侵害、突發(fā)事件以及敏感話題。在進(jìn)行內(nèi)容審核時需滿足“先審后播、重播重審、再播再審”的要求,切實做到嚴(yán)格把關(guān)。
以某省的媒資系統(tǒng)來看,內(nèi)容審核工作中專業(yè)人員每月詞條節(jié)目審核量在逐漸增加,以往人工審核已經(jīng)無法做到無紕漏審核,加之當(dāng)前廣電審核標(biāo)準(zhǔn)、維度均有所提高,審核人員數(shù)量、資歷有限,需要積極引入新技術(shù)進(jìn)行內(nèi)容審核工作。基于以上現(xiàn)狀,需要順應(yīng)時代發(fā)展需求,合理應(yīng)用政策,采用AI審核系統(tǒng)。目前常用的檢測方式包括人臉、語音、OCR、黃暴畫面識別等前沿技術(shù),能夠全方位、智能化的檢測,并根據(jù)情況給出違規(guī)告警信息,有效提升工作效率。
廣電行業(yè)人工智能內(nèi)容審核系統(tǒng)利用高性能X86通用服務(wù)器集群為平臺,利用CPU圖像處理、邏輯計算能力、AI智能識別技術(shù)、權(quán)威專業(yè)特征庫實現(xiàn)對審核業(yè)務(wù)流程的控制,實現(xiàn)信息交互與獨立展示,其系統(tǒng)框架如圖1所示。
圖1 系統(tǒng)架構(gòu)設(shè)計
在實際應(yīng)用中,人工智能審核系統(tǒng)能夠為廣電節(jié)目的發(fā)布起到良好的控制與服務(wù)作用,系統(tǒng)框架設(shè)計便于快速對接生產(chǎn)發(fā)布環(huán)節(jié)、各個系統(tǒng),設(shè)計通過請求調(diào)用以及緩存和調(diào)度策略后,能夠直接對接AI職能層進(jìn)行分析、審核、對比,完成后返回信息,并做出整合與定位,最終展現(xiàn)結(jié)果數(shù)據(jù)[1]。針對廣電領(lǐng)域所應(yīng)用的人工智能審核系統(tǒng)架構(gòu)的分析,詳細(xì)如下。
第一,基礎(chǔ)能力層,主要滿足日常審核工作,是極為必要的模塊,其職能包括:①系統(tǒng)配置管理,能夠根據(jù)資源分配規(guī)則將數(shù)據(jù)庫、數(shù)據(jù)字典、CPU資源、存儲空間資源等接入不同審核模板,支持備份與導(dǎo)入;②用戶及權(quán)限,用戶具有所屬存儲空間的文件創(chuàng)建、刪減等權(quán)利,便于周期性清理;③業(yè)務(wù)統(tǒng)計及結(jié)算模板,系統(tǒng)能夠根據(jù)第三方用戶所提供的服務(wù)能力生成業(yè)務(wù)結(jié)算單憑證,便于形成新的業(yè)務(wù)創(chuàng)收點,根據(jù)計費方式的不同提交核算業(yè)務(wù)結(jié)算單,例如視頻審核市場、抽幀等;④運維監(jiān)控報警,主要對內(nèi)存、硬盤空間、端口、網(wǎng)絡(luò)等狀態(tài)數(shù)據(jù)展開實時的監(jiān)控,并通過窗口展示,一旦發(fā)現(xiàn)異常情況會自動進(jìn)行分級告警,多方式傳送信息;⑤日志管理,包括能力調(diào)度處理、數(shù)據(jù)處理、常規(guī)操作、設(shè)備運行情況等,能夠?qū)崿F(xiàn)自主化篩選、清除。
第二,AI智能層,主要功能包括:①敏感人物識別,針對落馬官員、歷史問題人物、劣跡藝人、涉政敏感人物等被重點監(jiān)管的人,能夠精準(zhǔn)對其進(jìn)行近景、抬頭、側(cè)臉等多角度的識別,甚至存在遮擋的人臉畫面也能識別,并會實時更新特征庫;②人物標(biāo)簽識別,智能標(biāo)注任務(wù),便于直接按照標(biāo)注信息進(jìn)行查詢或精準(zhǔn)推薦;③色情識別,基于深度學(xué)習(xí)的圖像鑒別技術(shù);④OCR識別,對視頻、圖片中文字進(jìn)行識別;⑤ASR技術(shù),能夠識別音頻內(nèi)容,進(jìn)行違規(guī)語音鑒別;⑥文檔識別,利用NLP自然語言處理算法和關(guān)鍵詞庫識別;⑦廣告垃圾識別。
第三,能力控制調(diào)度引擎層,利用AI審核能力進(jìn)行調(diào)度監(jiān)控或配置管理,主要功能包括:①資源分配調(diào)度,利用系統(tǒng)計算單位對任務(wù)進(jìn)行計算與分配,支持共享或獨立運算配置;②優(yōu)先級調(diào)整,平臺會根據(jù)緊急情況、核算任務(wù)實際情況進(jìn)行優(yōu)先處理。
第四,業(yè)務(wù)流驅(qū)動引擎層,人工智能審核系統(tǒng)中業(yè)務(wù)流驅(qū)動引擎層能夠?qū)崿F(xiàn)對審核任務(wù)的優(yōu)先級調(diào)整、添加、重試等功能,詳細(xì)包括:①快速業(yè)務(wù)對接,支持廣播和電視播出、節(jié)目制作以及網(wǎng)站進(jìn)行松耦合且快捷的對接,并提供智能審核、標(biāo)注服務(wù);②自定義流程,支持靈活業(yè)務(wù)流程配置,滿足多樣化的審核流程;③任務(wù)優(yōu)化調(diào)度,功能在于多任務(wù)實例調(diào)度優(yōu)化,能夠根據(jù)優(yōu)先級、資源占用情況、審核維度等多種因素優(yōu)化業(yè)務(wù)[2]。
第五,管理與展示層,其功能包括:API調(diào)度、系統(tǒng)應(yīng)用管理、結(jié)果展示以及復(fù)審復(fù)查。
人工智能審核系統(tǒng)在廣電領(lǐng)域的應(yīng)用,第三方系統(tǒng)對接技術(shù)十分關(guān)鍵,會提供與各個領(lǐng)域的訪問與調(diào)用功能,并利用公網(wǎng)訪問接口實現(xiàn)公網(wǎng)訪問,從而實現(xiàn)內(nèi)容審核服務(wù),詳細(xì)如圖2所示。
圖2 第三方系統(tǒng)對接構(gòu)架
針對不同業(yè)務(wù)的接入方主動發(fā)起任務(wù)審核,在實際應(yīng)用中的系統(tǒng)對接方式主要包括以下幾項:①HTTP/JSON調(diào)用:應(yīng)用相關(guān)Webservice接口進(jìn)行文件名、素材名、路徑等參數(shù)傳遞;②XML+物理文件:指定存儲區(qū)ETP上傳,并對XML文件進(jìn)行解析與審核;③輪詢存儲區(qū):利用智能審核系統(tǒng)實現(xiàn)對指定存儲區(qū)的音頻內(nèi)容的定期輪詢;④B/S送審頁面:提供接口調(diào)用的同時可應(yīng)用B/S送審頁面進(jìn)行素材文件、名稱訪問,再上傳,實現(xiàn)自動審核,并直接查詢結(jié)果。
人工智能審核系統(tǒng)在廣電領(lǐng)域中應(yīng)用AI審核技術(shù),其關(guān)鍵部分在于采用卷積神經(jīng)網(wǎng)絡(luò),能夠響應(yīng)部分范圍內(nèi)的周圍單元。針對一些大型圖像處理能夠發(fā)揮較好的作用。其中卷積層具有輸入數(shù)據(jù)提取特征的功能,涵蓋多個卷積核,完成提取后會進(jìn)行選擇與信息過濾,確保審核科學(xué)性。
針對人工智能技術(shù)應(yīng)用的算法,主要包括以下內(nèi)容:
3.3.1 NLP算法模擬:能夠利用自然語言理解技術(shù)和數(shù)據(jù)庫實現(xiàn)對文本的分析,可通過上下文語境對一些辱罵性語言、色情性語言,以及涉及廣告、暴力等語言進(jìn)行識別。
3.3.2 人臉識別算法:根據(jù)臉部特征對視頻中所包含的人臉進(jìn)行識別,檢測位置、器官大小等內(nèi)容,實現(xiàn)快速身份識別,可對比人臉特征、分離背景以及信息保存,再利用卷積神經(jīng)網(wǎng)絡(luò)等算法提取、確認(rèn)、生成結(jié)果。
3.3.3 語音合成算法:將給定的文字信息利用計算機(jī)進(jìn)行處理,形成更為流暢、標(biāo)準(zhǔn)的語音,用于語音導(dǎo)航、虛擬主播、智能客服、后期配音等廣電業(yè)務(wù)中。從技術(shù)上可以將其分為波形拼接合成算法、參數(shù)合成算法以及規(guī)則合成算法這幾種。
3.3.4 OCR識別算法:可利用光學(xué)字符識別實現(xiàn)對報刊、數(shù)據(jù)、文稿等資料的掃描,并應(yīng)用計算機(jī)輸入技術(shù)將其轉(zhuǎn)化為圖像信息[3]。OCR識別需要采用深度學(xué)習(xí)、內(nèi)容識別技術(shù)進(jìn)行特征提取、加強以及邊緣化優(yōu)化,再進(jìn)行文字校正。
目前來看,人工智能審核系統(tǒng)在廣電行業(yè)中的應(yīng)用越來越廣泛,能夠基本滿足傳統(tǒng)節(jié)目審核機(jī)制,對各種音頻格式、視頻內(nèi)容、有元數(shù)據(jù)等進(jìn)行技術(shù)審核,確保生產(chǎn)制作符合規(guī)定,服務(wù)于大眾,還能根據(jù)不同業(yè)務(wù)場景需求和審核標(biāo)準(zhǔn)進(jìn)行自定級檢驗。同時,利用智能識別算法能夠代替90%的人工審核成本,有效提升管理效率。部分算法經(jīng)過改進(jìn)后識別精度更高,其優(yōu)勢還包括人臉識別率更高、功能實現(xiàn)全覆蓋、審核播放器更加專業(yè)、框架模塊化且便于接入,全鏈路內(nèi)容更加安全。
結(jié)合人工智能審核系統(tǒng)在廣電領(lǐng)域的應(yīng)用實況來看,智能審核系統(tǒng)中仍存在一定功能改進(jìn)與新功能開發(fā)的空間,例如劣跡藝人方面。目前針對藝人分類庫部分仍需擴(kuò)充和改進(jìn),可應(yīng)用人臉識別功能建立分類和排序,能夠自動實現(xiàn)分類關(guān)聯(lián),便于快速實現(xiàn)媒資庫信息分類,審核員也會第一時間下架相關(guān)影視節(jié)目,避免造成一定播出事故。近年來,部分廣電節(jié)目針對一些城市大屏展開嚴(yán)格審查,主要由于存在誤播的情況,由此可見,加強AI智能識別技術(shù)十分關(guān)鍵,目前來看智能審核在廣電領(lǐng)域的應(yīng)用屬于初步嘗試,未來可不斷落實應(yīng)用并進(jìn)一步發(fā)展,如AI內(nèi)容推薦、AI視頻修復(fù)等,實現(xiàn)技術(shù)、算法的再度創(chuàng)新。
綜合來看,人工智能審核系統(tǒng)在廣電領(lǐng)域的應(yīng)用與當(dāng)前行業(yè)形勢和市場需求相適配,能夠為廣電受眾提供更加精確、完美的服務(wù)。但在應(yīng)用過程中發(fā)現(xiàn),享受其便利的同時也存在一定的不足,需要積極優(yōu)化相關(guān)技術(shù),致力于加強媒體安全建設(shè),創(chuàng)造更加和諧、健康的媒體環(huán)境。因此,在廣電行業(yè)應(yīng)用人工智能審核系統(tǒng)時,需要根據(jù)實際情況重點強調(diào)技術(shù)優(yōu)化,配合相關(guān)審核機(jī)制,利用技術(shù)輔助,嚴(yán)格遵循“先審后播、重播重審、重播再審”的流程,全面維護(hù)廣電行業(yè)發(fā)出內(nèi)容的安全性、合規(guī)性。