萬振華,王吉鋒
(余姚市融媒體中心,浙江 余姚 315400)
余姚市融媒體平臺項目以媒體互聯網生產為全新理念,基于云原生技術架構,采用先進的云計算技術、大數據技術、人工智能(Artificial Intelligence,AI)技術以及視音頻技術,實現高效的策、采、編、審、發(fā)、饋、評融媒全業(yè)務流程。其中,智能媒資建設作為該項目的重點部分,采用多種AI技術實現傳統(tǒng)媒資業(yè)務。本文就余姚市融媒體平臺建設中的智能媒資部分進行詳細說明。
本次搭建的融媒體云平臺智能媒資子系統(tǒng)要求提供全臺素材歸檔、媒資編目、內容檢索、內容上傳、內容審核以及出庫下載等功能[1]。項目建設過程中,為確保安全,要求在辦公網環(huán)境下,媒資界面只允許進行相關瀏覽、檢索等操作,對上傳/下載進行相關權限管理、控制。
智能媒資的總體架構如圖1所示。本項目搭建的智能媒資系統(tǒng)基于余姚融媒體中心搭建的智能AI平臺。智能AI平臺是由云原生架構構建的智能服務二次開發(fā)平臺,為智能媒資的多種智能化媒體應用快速提供智能算法服務和場景化應用模板[2]。
圖1 智能媒資總體架構圖
為支持視音頻智能分析,智能AI平臺在基礎硬件方面,針對深度學習用到的主流硬件進行了支持,涵蓋了中央處理器(Central Processing Unit,CPU),圖 形 處 理 器(Graphics Processing Unit,GPU)等;在基礎軟件方面,支持深度學習的主流框架,如Tensorflow,Pytorch;在算法模型方面,圍繞著算法模型如何管好、用好的問題,平臺在Linux操作系統(tǒng)之上,采用了Docker及Nvidia-docker的容器化技術,對算法模型進行了隔離使用,避免了多種模型依賴不同版本程序包(如Python,CUDA)的沖突,并且建立算法模型資源消耗屬性及注冊機制,方便平臺針對模型進行統(tǒng)一調配管理;在媒體高效處理方面,對于經常出現的單個文件多種分析的情況,構建了高效的分布式內存共享技術,支持一次解碼多次分析,節(jié)省了CPU及IO資源,提高了平臺整體的吞吐量和分析效率[3]。
在智能AI平臺部署方面,智能AI平臺的底層是物理機、虛擬機及云端資源;通過Kubernetes和Ray調度,管理底層資源,由Ficus PI(數據管理模塊)進行數據驅動;集群和單機兩種部署模式對原子能力實現協同部署。同時,AI平臺擁有豐富的原子能力和智能場景模板,并支持AI能力及模板的插件化擴展,對外統(tǒng)一提供任務接口。
在智能AI平臺能力支持方面,考慮到在媒資管理等真實的業(yè)務場景應用中通常是多種AI原子能力組合協同完成的,原子能力雖本身可以在多類場景中進行復用,但處理流程以及數據融合處理的方法各不相同,需要智能場景模板既能夠復用現有的眾多AI原子能力,又要保證流程的靈活,且可方便自定義。
本項目打造的媒資系統(tǒng)軟件的核心業(yè)務功能全部采用瀏覽器/服務器(Browser/Server,B/S)結構實現,通過瀏覽器即可實現常規(guī)操作,為素材管理要求提供內容支撐,實現數字資源導入、編目、管理、檢索及導出等操作。以下將重點說明余姚市融媒體中心智能媒資系統(tǒng)的功能模塊。
智能媒資系統(tǒng)檢索門戶,是整個智能媒資系統(tǒng)的主要呈現頁面,作為用戶使用的主要業(yè)務功能入口,承擔數據查詢、數據展示及信息呈現等關鍵性的作用。作為與用戶交互的直接界面,本項目設計的媒資檢索門戶提供便捷的B/S檢索,隨處可用Chrome瀏覽器登錄訪問。利用AI智能平臺提供的原子能力,可將系統(tǒng)后臺智能分類、聚類的專輯或主題,自動呈現到檢索門戶中,同時也提供獨立的專輯和主題的檢索應用,更加有利于提高檢索效率,增加資料的利用率[4]。
媒體資產管理系統(tǒng)支持全文檢索、二次檢索、按字段高級檢索及條件過濾等多種檢索方式,且不同權限用戶在檢索結果頁面對素材的操作權限不同,支持檢索結果不同的排序方式和呈現形式。
智能編目模塊采用人工編目與智能編目結合的方式,通過編目工具完成媒資入庫過程中的人工標引、著錄等任務。智能編目功能可調用AI能力服務,將視音頻、音頻及圖片等內容數據通過適合的AI能力服務,形成適當的機器標簽。再通過數據篩選、分析等方式對標簽內容進行清洗和處理,最終生成面向檢索發(fā)布的業(yè)務標簽體系。智能編目的本質是在標簽體系的基礎上對媒資進行自動分類,但需注意,編目仍需要符合廣電4層級編目的基礎標準[5]。
智能編目的具體功能包括智能標簽、資源編目、內容表音及編目審校4部分。
智能標簽利用AI引擎,調用系統(tǒng)后臺的AI服務能力、數據服務能力,將匯聚的視音頻素材采用智能識別技術,對視頻、音頻內容進行標簽提取、語音文字轉寫及敏感人物識別等處理,最終生成結構化的標簽信息,同時過濾無用和重復標簽,為人工編目提供輔助信息。標簽包括人物、時間、地點、內容、自動摘要以及自動分類等內容。
資源編目支持對各專業(yè)分庫所有類型資源進行編目(包括視頻、音頻、圖片及新媒體稿件等),通過Web頁面實現編目工作,支持四層廣電標準編目、新媒體編目、素材編目以及其他編目結構等自定義編目字段。編目規(guī)范可自定義,同時符合融媒體中心內部編目規(guī)則。智能編目還支持根據業(yè)務需要自定義編目類、編目屬性、分類及編目界面,并支持編目流程自定義,可根據業(yè)務需要由媒資專業(yè)人員進行配置,實現一編多審的效果。
內容標引結合了自動化編目+人工校正的能力,可以對program層級、story層級進行編輯和修改,將program層級的整段節(jié)目自動拆分為片頭、開場白以及每一個story層級的主題故事部分。
編目審?;谥悄芙Y構化的結果,通過完善內容的相關信息,減少傳統(tǒng)編目的人力和時間花費。智能審校可直接在片段識別的基礎上進行片段的拆分或者合并,同時,編目審校具備編目審核流程,可根據用戶的業(yè)務審核要求配置審核流程。
智能媒資的基礎功能包括高標清內容上載、高標清音視頻質量審核以及近線歸檔下載分發(fā),與普通媒資管理系統(tǒng)類似。不同點在于視頻質量審核環(huán)節(jié)。除常規(guī)技術審核外,智能審核模塊可調用AI媒體智能平臺的處理能力,對視頻畫面或者圖片中的涉黃、涉暴、涉政等信息進行識別,可自動標注敏感人物并提醒審核人員。分析結果包含敏感信息的具體類型、出現在視頻中的片段信息、可信度及建議操作等信息。
該段素材攜帶的原始基本信息會進行展示,如標題、入庫者、入庫時間、首播時間、歸屬部門、所屬欄目及所屬頻道等。該段素材在入庫時,將調用AI大數據平臺的分析能力,通過相應的分析,實現對涉政、廣告、技審分析結果的展示,將有問題的時間段進行說明。
媒資管理部分負責對智能媒資系統(tǒng)的用戶、流程、策略、配置、數據、門戶、存儲、回收站以及第三方應用進行整體管理,保障智能媒資系統(tǒng)正常運行。其中,用戶管理主要包括角色管理、權限管理及部門管理等分支功能,流程管理主要包括流程配置、任務流程管理及調度管理等分支功能,策略管理可對媒資的下載策略、下載審核策略、刪除策略、生命周期及歸檔策略等進行配置;數據匯總支持對媒資業(yè)務進行多維度、實時的數據監(jiān)控和統(tǒng)計分析,用戶可根據業(yè)務需求自由組合統(tǒng)計表或統(tǒng)計條件,數據匯總模塊可面向上層應用提供技術服務支撐實現對資源、業(yè)務數據及人員工作量情況等信息的統(tǒng)計,提供無限用戶數的統(tǒng)計服務授權;門戶管理可對門戶展示模塊進行配置,支持對專業(yè)庫的配置管理,包括專業(yè)庫對應的門戶模塊、編目配置及歸檔策略等;存儲管理支持對存儲空間、存儲方式的配置管理,對媒資系統(tǒng)的存儲進行統(tǒng)一管理和邏輯劃分,并對劃分的存儲資源池進行管理;回收站管理支持用戶對自己權限范圍內的媒體資料進行刪除,通過媒資管理中心的回收站,可查看刪除媒體資料列表并確認對媒體資料是從回收站刪除還是恢復,防止誤操作;第三方應用管理支持對媒資系統(tǒng)中接入的第三方應用的配置,可進行啟停操作,并對創(chuàng)建的新應用進行授權信息設置、工具應用授權設置以及應用擴展性設置等。
智能媒資系統(tǒng)作為余姚市融媒體平臺的一部分,底層采用了2套新華三萬兆交換機+4套新華三千兆交換機搭建基礎網絡環(huán)境,采用3套HPE DL380 Gen10 19寸2U機架式服務器構建智能媒資平臺基礎功能集群,采用2臺HP Z4G4專業(yè)圖形工作站用于智能媒資系統(tǒng)的上載、審查、下載、超高清素材上下變換等功能,采用1臺HPE DL380 Gen10 19寸2U機架式服務器用于媒資歸檔服務,采用索尼L30M藍光盤庫搭配索尼PDW-U4專業(yè)藍光驅動器以及索尼PFD100TLA專業(yè)藍光盤驅動建設媒資存儲介質,采用2套HPE DL380 Gen10 19寸4U機架式服務器用于支持智能AI平臺的視頻智能分析服務。
本文以余姚市融媒體中心智能媒資實際建設為例,分析說明項目建設過程中對于智能媒資系統(tǒng)的打造,結合業(yè)務流程分析AI原子能力帶來的應用價值提升,對于我國融媒體建設過程中的場景化AI應用的普及推廣有著一定參考價值。