孟寶燦
(作者單位:國(guó)家新聞出版廣電總局五五三臺(tái))
?
語(yǔ)音自動(dòng)評(píng)估系統(tǒng)在廣播遙控監(jiān)測(cè)中的應(yīng)用
孟寶燦
(作者單位:國(guó)家新聞出版廣電總局五五三臺(tái))
摘 要:隨著我國(guó)廣播電視監(jiān)測(cè)事業(yè)的發(fā)展。監(jiān)測(cè)手段由傳統(tǒng)依靠人工手動(dòng)監(jiān)測(cè)逐漸發(fā)展到自動(dòng)化、網(wǎng)絡(luò)化的監(jiān)測(cè)模式。監(jiān)測(cè)業(yè)務(wù)向深度和廣度發(fā)展的同時(shí),對(duì)廣播效果評(píng)估自動(dòng)化的需求日益增加,本文重點(diǎn)探討語(yǔ)音自動(dòng)評(píng)估技術(shù)在廣播遙控監(jiān)測(cè)中的應(yīng)用。
關(guān)鍵詞:遙控監(jiān)測(cè);語(yǔ)音比對(duì);自動(dòng)評(píng)估
隨著音頻識(shí)別、圖像處理技術(shù)的發(fā)展,很多新技術(shù)都達(dá)到了在相應(yīng)條件下的應(yīng)用水平,如何適應(yīng)新時(shí)期遙控監(jiān)測(cè)站廣播效果評(píng)估的新要求和新業(yè)務(wù)模式,充分應(yīng)用計(jì)算機(jī)對(duì)于海量節(jié)目?jī)?nèi)容自動(dòng)處理,將眾多語(yǔ)音比對(duì)先進(jìn)技術(shù)與廣播效果評(píng)估監(jiān)測(cè)相結(jié)合,實(shí)現(xiàn)遙控站廣播效果評(píng)估的自動(dòng)化、智能化和標(biāo)準(zhǔn)化,是廣播監(jiān)測(cè)業(yè)務(wù)向深度和廣度發(fā)展所面臨的緊迫問(wèn)題。
遙控監(jiān)測(cè)站廣播效果語(yǔ)音自動(dòng)評(píng)估系統(tǒng)主要由以下3部分組成:數(shù)據(jù)采集單元、數(shù)據(jù)庫(kù)和數(shù)據(jù)存儲(chǔ)單元、引擎計(jì)算節(jié)點(diǎn)和客戶端顯示單元。
系統(tǒng)工作流程如下:根據(jù)監(jiān)測(cè)運(yùn)行圖及人工設(shè)置好的評(píng)分流程,按照V8接口標(biāo)準(zhǔn)遠(yuǎn)程控制遙控站設(shè)備,獲取遙控站回傳的流媒體音頻信號(hào)。
遙控監(jiān)測(cè)站廣播效果語(yǔ)音自動(dòng)評(píng)估系統(tǒng)主要包括以下4個(gè)功能模塊。
2.1 自動(dòng)打分引擎
自動(dòng)打分引擎基本組成部分包括任務(wù)調(diào)度器、計(jì)算節(jié)點(diǎn)和任務(wù)監(jiān)視器。其中,計(jì)算節(jié)點(diǎn)承擔(dān)了主要的音頻數(shù)據(jù)計(jì)算處理任務(wù)。具體的比對(duì)流程如下:1)檢查目標(biāo)音頻信號(hào)是否存在,是否滿足比對(duì)引擎要求(≥3秒),若不滿足則直接上報(bào)給人工處理,滿足條件則進(jìn)入下一步;2)對(duì)目標(biāo)音頻信號(hào)進(jìn)行分類,判斷為音樂(lè)、語(yǔ)音、白噪聲或靜音,若靜音則直接上報(bào)人工處理,若不是靜音則進(jìn)入下一步處理;3)判斷與音量是否達(dá)到門(mén)限,并判斷是否有參考信號(hào)存在,若不存在,則計(jì)算信噪比,進(jìn)行綜合質(zhì)量評(píng)估,最后得出分值及置信度并輸出,若存在,則進(jìn)入下一步;4)判斷參考源類型是否為目標(biāo)源,然后結(jié)合目標(biāo)音頻信號(hào)與參考音頻信號(hào)進(jìn)行匹配沒(méi)最后綜合質(zhì)量評(píng)估,得出分值及置信度。
2.2 音頻數(shù)據(jù)與音頻特征采集子系統(tǒng)
音頻數(shù)據(jù)與音頻特征采集子系統(tǒng)根據(jù)所采集的數(shù)據(jù)源類型分為2種:前端采集子系統(tǒng)與中心采集子系統(tǒng)。
2.2.1 前端采集子系統(tǒng)
用于遠(yuǎn)程控制遙控站接收機(jī)執(zhí)行頻點(diǎn)任務(wù),并采集從遙控站接收機(jī)傳回的目標(biāo)音頻數(shù)據(jù);同時(shí),提取目標(biāo)音頻數(shù)據(jù)中有用的音頻特征數(shù)據(jù),傳送給自動(dòng)打分引擎進(jìn)行計(jì)算。另外,由于系統(tǒng)必須提供廣播效果音頻回放功能,作為廣播效果人工校對(duì)的依據(jù)。因此,采集后廣播效果音頻以及音頻特征的歷史數(shù)據(jù)必須保存,在存儲(chǔ)介質(zhì)中存放。
前端采集子系統(tǒng)的工作流程如下:?jiǎn)?dòng)前端采集系統(tǒng)后,系統(tǒng)等待到達(dá)工作的時(shí)間段;獲取當(dāng)前時(shí)段運(yùn)行圖數(shù)據(jù);創(chuàng)建臨時(shí)存儲(chǔ)區(qū),將當(dāng)前時(shí)段運(yùn)行圖中的頻點(diǎn)任務(wù)以隊(duì)列的形式存儲(chǔ),根據(jù)人工配置文件對(duì)當(dāng)前時(shí)段運(yùn)行圖中的頻點(diǎn)任務(wù)進(jìn)行分析;將隊(duì)列中的頻點(diǎn)任務(wù)進(jìn)行優(yōu)先級(jí)排序;動(dòng)態(tài)規(guī)劃當(dāng)前時(shí)段頻點(diǎn)任務(wù)的執(zhí)行流程;開(kāi)始從隊(duì)列中取出頻點(diǎn)任務(wù)并執(zhí)行;自動(dòng)提取音頻中的音頻特征值數(shù)據(jù);數(shù)據(jù)入庫(kù),通知打分引擎任務(wù)準(zhǔn)備完畢,等待引擎處理;判斷隊(duì)列中是否有其他任務(wù),若有則繼續(xù)執(zhí)行任務(wù),若無(wú)則結(jié)束任務(wù)。
2.2.2 中心采集子系統(tǒng)
用于采集從衛(wèi)星接收機(jī)上傳來(lái)的模擬音頻信號(hào),并轉(zhuǎn)換為數(shù)字音頻信號(hào),同時(shí)完成運(yùn)行圖同步的工作。其工作流程如下:初始化系統(tǒng)后,啟動(dòng)運(yùn)行圖同步線程,判斷是否到達(dá)同步時(shí)間;初始化采集卡;多線程采集參考源信號(hào);達(dá)到采集時(shí)間后,存儲(chǔ)音頻文件。
2.3 Web服務(wù)
系統(tǒng)的Web服務(wù)框架采用Struts框架、Free Marker模板技術(shù)以及Web Service相結(jié)合的方式。
通過(guò)Struts框架與FreeMarker模板的結(jié)合,很好地均衡了客戶端與服務(wù)器端的工作負(fù)載,在很大程度上提高了頁(yè)面的瀏覽速度以及用戶與服務(wù)器的交互性,增強(qiáng)了用戶的體驗(yàn);同時(shí),采用了Web Service的相關(guān)技術(shù),由客戶端瀏覽器發(fā)起的Web Service請(qǐng)求,由Web Service服務(wù)器調(diào)用相關(guān)的服務(wù),由服務(wù)邏輯訪問(wèn)數(shù)據(jù)庫(kù),完成請(qǐng)求的處理,并返回處理結(jié)果。
2.4 評(píng)估結(jié)果自動(dòng)上報(bào)數(shù)據(jù)中心子系統(tǒng)
評(píng)估結(jié)果自動(dòng)上報(bào)數(shù)據(jù)中心子系統(tǒng)用于自動(dòng)上報(bào)符合標(biāo)準(zhǔn)(置信度大于某一門(mén)限)的自動(dòng)評(píng)估結(jié)果,不符合標(biāo)準(zhǔn)的自動(dòng)評(píng)估結(jié)果留待人工校對(duì)后再進(jìn)行上報(bào)。其工作流程如下:初始化系統(tǒng)后,開(kāi)始更新數(shù)據(jù)中心數(shù)據(jù)庫(kù);首先訪問(wèn)本系統(tǒng)的數(shù)據(jù)庫(kù),獲取最新的自動(dòng)評(píng)估結(jié)果,并判斷自動(dòng)評(píng)估結(jié)果是否滿足標(biāo)準(zhǔn),若不符合標(biāo)準(zhǔn),則過(guò)濾該自動(dòng)評(píng)估結(jié)果,并留待系統(tǒng)人工校對(duì)后再自動(dòng)上報(bào)數(shù)據(jù)中心。
通過(guò)語(yǔ)音自動(dòng)評(píng)估系統(tǒng)在廣播遙控監(jiān)測(cè)中的應(yīng)用,極大地減輕了值班人員的工作量,提高了廣播監(jiān)測(cè)智能化的水平。隨著音頻識(shí)別、圖像處理技術(shù)的繼續(xù)發(fā)展,相信在不久的將來(lái),通過(guò)技術(shù)優(yōu)化一定能夠進(jìn)一步提高語(yǔ)音自動(dòng)評(píng)估的準(zhǔn)確率,為廣播監(jiān)測(cè)智能化事業(yè)的發(fā)展添磚加瓦。