龔 坤,趙 時
(1.成都索貝數(shù)碼科技股份有限公司,四川 成都 610000;2.湖北省新聞出版廣電監(jiān)管中心,湖北 武漢 430000)
2020年,中共中央宣傳部等九部委聯(lián)合印發(fā)《全國有線電視網(wǎng)絡(luò)整合發(fā)展實施方案》,明確指出要加快推動全國有線電視網(wǎng)絡(luò)整合,實現(xiàn)全國一網(wǎng)。廣電網(wǎng)絡(luò)生態(tài)在不斷升級的同時,其管理、工作方法也在受到互聯(lián)網(wǎng)的沖擊。例如,海量制作素材難以篩選,播出內(nèi)容大量增加,這都給制作人員和審核人員帶來了巨大的壓力[1]。人工智能(Artificial Intelligence,AI)作為新一代信息技術(shù),已被廣泛應(yīng)用到交通、能源、醫(yī)療及工業(yè)生產(chǎn)等多個領(lǐng)域,并取得了不錯的效果,能有效提升生產(chǎn)效率、減少人力成本。AI技術(shù)在廣電行業(yè)的發(fā)展趨勢,必將是以AI來代替大量繁雜的重復(fù)性人力勞動,研制出更為豐富的、針對廣電場景的專用AI模型,推動AI在廣電行業(yè)的專業(yè)化應(yīng)用。因此,研究AI適用于廣電領(lǐng)域的哪些具體應(yīng)用場景,如何與廣電業(yè)務(wù)系統(tǒng)對接實現(xiàn)應(yīng)用落地,具有重要的價值。
選題策劃的痛點在于如何搜集各渠道信息并確定熱點,快速策劃出滿足各類群體并能引導(dǎo)正能量內(nèi)容的節(jié)目、掌握輿論制高點。對此,利用AI和數(shù)字挖掘技術(shù),能夠?qū)ξ⒉?、抖音、快手等各渠道進行信息搜集,并就輿情熱點、用戶喜好等關(guān)鍵因素進行分析,通過人臉識別、OCR字符識別、語音識別、鏡頭聚類、模糊對齊等技術(shù)手段解讀新聞;根據(jù)分析結(jié)果推薦節(jié)目制作的話題和方向,自動撰寫策劃文稿,幫助節(jié)目制作人員快速策劃出滿足用戶需求的節(jié)目。
媒資管理的痛點在于大規(guī)模、多模態(tài)的數(shù)字媒體如何快速檢索、編目。利用語音識別、圖像識別、視頻識別等智能識別技術(shù),可對視音頻內(nèi)的內(nèi)容進行提??;通過自然語言理解、圖像語義分析、視頻語義分析等智能理解技術(shù),能將視音頻內(nèi)的人物、機構(gòu)等重要因素進行智能標簽,可實現(xiàn)智能化編目和智能化檢索,充分挖掘媒體資源的價值。
生產(chǎn)制作的痛點在于傳統(tǒng)媒體素材如何提升畫面質(zhì)量以及如何快速制作稿件。利用圖像、視頻超分辨率重建、去交錯等AI技術(shù),可將視頻清晰度增強、變換視頻采樣格式,并通過對抗學(xué)習(xí)對畫面進行修復(fù)。此外,利用圖像識別、OCR識別、視頻語義分析、自然語言理解等技術(shù),能根據(jù)輸入標簽精準提煉畫面、文字,形成專業(yè)多媒體稿,可有效提升生產(chǎn)效率,并且增強生產(chǎn)內(nèi)容的表現(xiàn)力與感染力。
分發(fā)傳輸?shù)耐袋c在于傳播渠道的格式多影響傳播速度以及如何將合適的內(nèi)容傳播給需要的觀眾。一方面,利用自然語言理解、語義分析、圖像識別、OCR識別等技術(shù),可實現(xiàn)智能格式修改,提升內(nèi)容傳播速度,掌握宣傳主動權(quán);另一方面,通過分析用戶行為特征和業(yè)務(wù)偏好,基于海量內(nèi)容和用戶數(shù)據(jù),建立流行度管理和預(yù)測方法,利用用戶畫像等技術(shù),可進行內(nèi)容推薦,提升內(nèi)容的傳播力和影響力。
廣播電視內(nèi)容安全關(guān)乎國家政治安全、文化信息安全以及意識形態(tài)安全。目前,內(nèi)容審核多采用人工方式進行,但是新聞類和訪談類節(jié)目中往往包含大量各級領(lǐng)導(dǎo)干部的影像、聲音、姓名等信息,審核人員難以辨識所有人物的身份和背景,同時,面對互聯(lián)網(wǎng)產(chǎn)出的大量內(nèi)容,人工的低審核效率、長時間工作導(dǎo)致的狀態(tài)下降等問題愈發(fā)突出,播出事故頻頻發(fā)生[2]。利用智能識別技術(shù),可對敏感內(nèi)容和人物進行標記,從而有效輔助人工對視頻中的內(nèi)容進行高效、全面的判斷,避免冗長的無效信息帶來的人力成本浪費。
從上述分析可知,選題策劃、媒資管理、生產(chǎn)制作、分發(fā)運輸以及內(nèi)容審核等廣電場景,都對AI有需求,且AI能夠有效地提升這些場景下的工作效率和效果。然而,這些場景通常要求多種AI原子能力組合應(yīng)用以解決問題,而AI原子能力由計算資源、訓(xùn)練數(shù)據(jù)、算法技術(shù)組合得到,因此,需要一個平臺來綜合提供這些底層資源和技術(shù),從而形成多個AI原子能力,進而面向廣電場景實現(xiàn)應(yīng)用。
面向廣電場景的AI平臺,應(yīng)該具有知識庫、大數(shù)據(jù)治理、AI管理等核心組件,同時需要規(guī)劃平臺的資源層、技術(shù)層、服務(wù)層等各層級模塊以及相互之間的關(guān)系,為未來進行平臺落地建設(shè)提供新的思路和指導(dǎo)方案。
以湖北省新聞出版廣電監(jiān)管中心的AI平臺實際建設(shè)方案為例,平臺的資源層、技術(shù)層、服務(wù)層等各層級模塊以及相互之間的關(guān)系如圖1所示。
圖1 湖北省新聞出版廣電監(jiān)管中心面向廣電場景的AI平臺
資源層由計算服務(wù)器、網(wǎng)絡(luò)設(shè)備、存儲設(shè)備以及廣電場景目前逐漸應(yīng)用較多的移動終端等設(shè)備組成??紤]到在全國一網(wǎng)的背景下,廣電領(lǐng)域有著海量的素材和復(fù)雜的應(yīng)用場景,對計算能力、精度及可擴展性等性能要求很高,因此,資源由云服務(wù)提供商提供,以應(yīng)對突發(fā)情況下資源不足的問題。同時,由于云服務(wù)具備彈性資源供給的特性,可以避免采購過多設(shè)備帶來的浪費問題。
平臺核心組件包括知識庫組件、大數(shù)據(jù)治理組件以及AI管理組件。知識庫組件根據(jù)多年從業(yè)人員的輸入存儲了大量業(yè)務(wù)經(jīng)驗和知識,能支撐場景化AI原子能力的訓(xùn)練。比如,在智能導(dǎo)播算法的設(shè)計中,需要導(dǎo)播提供鏡頭語言、鏡頭切換時機、運鏡方法等知識;在敏感內(nèi)容識別中,需要有監(jiān)管人員界定涉黃、涉暴等內(nèi)容的相關(guān)邊界。除了專家的業(yè)務(wù)經(jīng)驗之外,知識庫還可利用知識圖譜和數(shù)據(jù)治理相關(guān)技術(shù)對歷史生產(chǎn)數(shù)據(jù)進行抽取,有助于收集易被忽視的信息,同時可以分析知識間的關(guān)系,明確不同知識在業(yè)務(wù)場景中的重要性[3]。
大數(shù)據(jù)治理組件具有可對用戶使用數(shù)據(jù)和內(nèi)部生產(chǎn)數(shù)據(jù)進行采集的渠道,利用分布式數(shù)據(jù)庫、分布式計算引擎來構(gòu)成數(shù)據(jù)集成系統(tǒng)、數(shù)據(jù)資源池、數(shù)據(jù)服務(wù)系統(tǒng)以及數(shù)據(jù)共享系統(tǒng),并結(jié)合數(shù)據(jù)挖掘技術(shù)進行數(shù)據(jù)管理和數(shù)據(jù)治理[4]。利用大數(shù)據(jù)治理組件,可以對用戶數(shù)據(jù)和歷史生產(chǎn)數(shù)據(jù)進行有效管理和價值挖掘,并有助于知識庫進行知識抽取,還能提供大量數(shù)據(jù)訓(xùn)練具有高泛化性的AI原子能力。
AI管理組件由大數(shù)據(jù)治理組件提供存儲資源,計算服務(wù)器提供CPU、GPU等計算資源進行模型訓(xùn)練。通過分布式資源調(diào)度框架來調(diào)度各計算服務(wù)器的計算資源,以支持模型的分布式訓(xùn)練,并且可通過容器化的方式支撐多個AI框架,以保證AI原子能力之間互不沖突[5]。此外,還有能力庫可對各種訓(xùn)練好的AI原子能力進行管理。基于AI管理組件,能夠有效利用各平臺資源來訓(xùn)練基礎(chǔ)和場景化的AI原子能力,可方便、快捷、高效地形成面向廣電行業(yè)的各項智能服務(wù)。
統(tǒng)一的接口規(guī)范定義了與AI平臺其他系統(tǒng)進行數(shù)據(jù)交換的數(shù)據(jù)規(guī)范和報文規(guī)范。建立統(tǒng)一的接口規(guī)范,對各廠商AI能力進行封裝,平臺只需要關(guān)注AI算法本身,對于各種應(yīng)用場景,無需再重復(fù)開發(fā)接口,能夠節(jié)約人力、時間成本。
平臺的算法技術(shù)層分為基礎(chǔ)算法和面向廣電業(yè)務(wù)場景的算法?;A(chǔ)算法包括人臉識別、語音識別、自然語言處理、推薦算法以及知識圖譜構(gòu)建。在這些基礎(chǔ)算法上,通過融合推理,推出面向廣電業(yè)務(wù)場景的智能算法,包括鏡頭語言識別、智能剪輯技術(shù)以及視頻增強技術(shù)等。其中,視頻增強技術(shù)包括視頻超分、色彩變換及圖像修復(fù)等。
平臺的服務(wù)層主要是基于各項面向廣電業(yè)務(wù)場景的算法,為電視臺等廣電機構(gòu)提供智能編片、智能編目、智能拆條、智能審片、智能唱詞、智能抹標、智能配音、智能修復(fù)、內(nèi)容推薦以及數(shù)據(jù)分析等智能服務(wù)。
本文詳細闡述了湖北省新聞出版廣電監(jiān)管中心建設(shè)面向廣電場景AI平臺的實踐中,人工智能可應(yīng)用于廣播電視行業(yè)的多個具體應(yīng)用場景。針對面向廣電場景的AI平臺進行了探索和應(yīng)用,給出了平臺架構(gòu)和核心組件,有助于全國各級電視臺等廣電機構(gòu)建立自己的AI平臺,以推進智慧廣電服務(wù),滿足城市圈用戶多元化需求,全面增強媒體影響力。