□ 覃國(guó)孫
據(jù)統(tǒng)計(jì),廣播電視對(duì)食品藥品安全事件的首次報(bào)道比例仍高于網(wǎng)絡(luò)媒體,但是,目前國(guó)內(nèi)有關(guān)食品藥品安全的輿情監(jiān)測(cè)大多針對(duì)網(wǎng)絡(luò)媒體,缺少基于廣播電視媒體的輿情監(jiān)測(cè)。本文就如何建立基于廣播電視媒體的食品藥品安全輿情監(jiān)測(cè)系統(tǒng)提供一些設(shè)計(jì)思路。
采用B/S架構(gòu),設(shè)計(jì)一個(gè)基于WEB門(mén)戶的食藥輿情監(jiān)測(cè)系統(tǒng),通過(guò)對(duì)中央及地方廣播電視臺(tái)主流頻道廣播電視欄目中可能涉及食品藥品輿情的內(nèi)容進(jìn)行實(shí)時(shí)采集和爬取,并實(shí)現(xiàn)對(duì)相關(guān)輿情的自動(dòng)發(fā)現(xiàn)、音視頻內(nèi)容翻譯、內(nèi)容審核、報(bào)表統(tǒng)計(jì)等功能,從而快速、及時(shí)地發(fā)現(xiàn)廣播電視媒體中有關(guān)食品藥品的輿情信息,為食品藥品監(jiān)管部門(mén)全面掌握各主流傳播渠道的安全輿情動(dòng)態(tài)以及做出科學(xué)監(jiān)管決策提供有效支撐。
圍繞系統(tǒng)的總體思路和目標(biāo),系統(tǒng)總體可分四層架構(gòu)設(shè)計(jì),分別是:支撐功能層、數(shù)據(jù)處理層、監(jiān)管功能層、對(duì)外服務(wù)層。系統(tǒng)總體架構(gòu)如圖1所示。
圖1 系統(tǒng)總體架構(gòu)示意圖
支撐功能層主要包含數(shù)據(jù)庫(kù)管理、分布式計(jì)算、系統(tǒng)維護(hù)。數(shù)據(jù)庫(kù)可選用成熟的數(shù)據(jù)庫(kù)管理系統(tǒng),如Oracle、SQL server等;分布式計(jì)算主要是完成各個(gè)子系統(tǒng)內(nèi)部和子系統(tǒng)之間不同節(jié)點(diǎn)上的對(duì)象調(diào)用,實(shí)現(xiàn)分布式處理;系統(tǒng)維護(hù)包括對(duì)各個(gè)子系統(tǒng)進(jìn)行參數(shù)配置,監(jiān)控系統(tǒng)各個(gè)組成部分的運(yùn)行情況,管理用戶及其權(quán)限。
數(shù)據(jù)處理層主要完成對(duì)數(shù)據(jù)的采集、存儲(chǔ)及管理。數(shù)據(jù)采集是指對(duì)與輿情相關(guān)的廣播電視節(jié)目進(jìn)行分布式實(shí)時(shí)采集;數(shù)據(jù)存儲(chǔ)包括管理外部存儲(chǔ)系統(tǒng),實(shí)現(xiàn)數(shù)據(jù)保存、遷移、備份和清洗;數(shù)據(jù)管理則是對(duì)輿情數(shù)據(jù)的基本信息進(jìn)行管理,如查詢、修改、添加、刪除等。
監(jiān)管功能層負(fù)責(zé)為系統(tǒng)提供承載監(jiān)管業(yè)務(wù)所需的內(nèi)容分析、信息檢索、信息統(tǒng)計(jì)等主要功能。內(nèi)容分析功能主要完成對(duì)采集到的廣播電視節(jié)目信息音視頻數(shù)據(jù)進(jìn)行分析,包括抽取特征、建立索引、內(nèi)容識(shí)別等,最終檢測(cè)識(shí)別出與食藥安全相關(guān)的重點(diǎn)輿情信息;信息檢索功能主要采用基于文本關(guān)鍵詞進(jìn)行輿情內(nèi)容檢索;信息統(tǒng)計(jì)功能完成對(duì)采集到的視音頻節(jié)目和重點(diǎn)輿情信息等進(jìn)行歸類和統(tǒng)計(jì)。
對(duì)外服務(wù)層主要包括系統(tǒng)人機(jī)界面和系統(tǒng)接口。系統(tǒng)采用B/S架構(gòu)搭建門(mén)戶系統(tǒng),WEB門(mén)戶人機(jī)界面提供系統(tǒng)各個(gè)功能友好的操作界面,能展示輿情信息檢索、信息統(tǒng)計(jì)、識(shí)別定位的結(jié)果,并能進(jìn)行數(shù)據(jù)審核、系統(tǒng)維護(hù)等;系統(tǒng)接口則是考慮提供與其他輿情監(jiān)管系統(tǒng)對(duì)接、數(shù)據(jù)共享的接口服務(wù),便于監(jiān)管數(shù)據(jù)之間的互連互通,信息共享。
根據(jù)系統(tǒng)架構(gòu)和業(yè)務(wù)功能需求,整個(gè)系統(tǒng)的構(gòu)建設(shè)計(jì)由數(shù)據(jù)采集、輿情發(fā)現(xiàn)及翻譯、輿情審核及展示、報(bào)表分析統(tǒng)計(jì)和系統(tǒng)配置與管理五個(gè)子系統(tǒng)組成。整個(gè)系統(tǒng)功能結(jié)構(gòu)如圖2所示。
圖2 系統(tǒng)功能結(jié)構(gòu)圖
(一)數(shù)據(jù)采集子系統(tǒng)。主要實(shí)現(xiàn)從廣播電視節(jié)目信號(hào)中實(shí)時(shí)定向采集可能涉及食品藥品安全方面的節(jié)目,生成相關(guān)的音視頻片段并進(jìn)行存儲(chǔ),為輿情監(jiān)測(cè)提供數(shù)據(jù)基礎(chǔ)。系統(tǒng)所需的音視頻文件需要實(shí)時(shí)從節(jié)目監(jiān)測(cè)前端服務(wù)器上按照指定長(zhǎng)度采集到指定的中心存儲(chǔ)上。系統(tǒng)對(duì)需要采集的音視頻節(jié)目采用實(shí)時(shí)增量采集方式,并將采集到的音視頻文件的相關(guān)信息錄入數(shù)據(jù)庫(kù)。另外,為了及時(shí)發(fā)現(xiàn)輿情,系統(tǒng)采取邊采集邊處理的工作模式,而采集的音視頻片段長(zhǎng)度也可以根據(jù)實(shí)際應(yīng)用效果進(jìn)行修改調(diào)整。該子系統(tǒng)設(shè)計(jì)包含以下主要功能:(1)音視頻數(shù)據(jù)采集:系統(tǒng)按照指定節(jié)目(如新聞?lì)?、法制類)和指定時(shí)長(zhǎng)實(shí)時(shí)定向地采集可能涉及食藥輿情的廣播電視音視頻數(shù)據(jù),數(shù)據(jù)采用多任務(wù)分布式采集和集中存儲(chǔ)方式;(2)采集控制和調(diào)度:對(duì)采集子系統(tǒng)中各個(gè)采集任務(wù)機(jī)進(jìn)行任務(wù)調(diào)度,合理分配資源;(3)采集監(jiān)聽(tīng):監(jiān)測(cè)各采集任務(wù)機(jī)的工作情況,出現(xiàn)問(wèn)題自動(dòng)恢復(fù);(4)特定數(shù)據(jù)采集:根據(jù)業(yè)務(wù)需要,可對(duì)非本系統(tǒng)中的其他音視頻文件進(jìn)行采集上傳和存儲(chǔ)。
(二)輿情發(fā)現(xiàn)及翻譯子系統(tǒng)。主要實(shí)現(xiàn)從廣播電視節(jié)目中發(fā)現(xiàn)識(shí)別出與食品藥品安全相關(guān)的音視頻片段,并將音視頻內(nèi)容翻譯轉(zhuǎn)換成文本信息,從而基于文本形式通過(guò)關(guān)鍵詞識(shí)別完成輿情內(nèi)容的定位和播放,最后生成相關(guān)輿情節(jié)目。該子系統(tǒng)運(yùn)用成熟先進(jìn)的音視頻處理技術(shù)和識(shí)別引擎來(lái)完成對(duì)所采集的音視頻數(shù)據(jù)進(jìn)行分析處理。該子系統(tǒng)設(shè)計(jì)包含以下主要功能:(1)數(shù)據(jù)預(yù)處理:對(duì)采集到的廣播電視節(jié)目音視頻數(shù)據(jù)統(tǒng)一做提取音頻、生成指紋特征的預(yù)處理操作,供進(jìn)一步檢索識(shí)別使用;(2)音視頻播放:對(duì)采集到的音視頻文件按照條件進(jìn)行查詢播放其中可能涉及輿情的音視頻片段,并可快進(jìn)播放該片段前后指定時(shí)長(zhǎng)(如前后10分鐘)的音視頻片段,以便全面瀏覽節(jié)目?jī)?nèi)容;(3)內(nèi)容識(shí)別翻譯:系統(tǒng)利用語(yǔ)音識(shí)別翻譯引擎自動(dòng)對(duì)音視頻節(jié)目數(shù)據(jù)進(jìn)行語(yǔ)音轉(zhuǎn)文本的內(nèi)容翻譯,并將識(shí)別結(jié)果入庫(kù);(4)關(guān)鍵詞識(shí)別:系統(tǒng)利用預(yù)先錄入的關(guān)鍵詞信息自動(dòng)對(duì)節(jié)目對(duì)應(yīng)的文本信息進(jìn)行比對(duì)識(shí)別,將匹配到關(guān)鍵詞的結(jié)果入庫(kù);(5)關(guān)鍵詞定位播放:對(duì)匹配關(guān)鍵詞的結(jié)果進(jìn)行定位播放,即點(diǎn)擊選擇關(guān)鍵詞即可同步播放相應(yīng)的音視頻內(nèi)容,以便快速定位和查找相關(guān)輿情內(nèi)容;(6)輿情片段截?。簲?shù)據(jù)處理人員根據(jù)節(jié)目瀏覽及查詢定位播放的情況,將與食品藥品輿情相關(guān)的音視頻文件按照指定時(shí)間范圍重新截取合并保存成一個(gè)新的節(jié)目文件,從而完成與輿情相關(guān)節(jié)目片段的完整截取,正式生成食品藥品安全輿情節(jié)目數(shù)據(jù)。
(三)輿情展示及審核子系統(tǒng)。主要實(shí)現(xiàn)以輿情門(mén)戶的方式將輿情節(jié)目音視頻內(nèi)容結(jié)合系統(tǒng)自動(dòng)對(duì)應(yīng)生成的字幕信息進(jìn)行集中展示播放,字幕根據(jù)音視頻播放進(jìn)度進(jìn)行滾動(dòng)跟進(jìn),從而完成對(duì)廣播電視輿情的展示和快速瀏覽,監(jiān)管部門(mén)相關(guān)工作人員可依據(jù)這些生成的輿情數(shù)據(jù)開(kāi)展對(duì)輿情節(jié)目進(jìn)行內(nèi)容審核和研判工作。該子系統(tǒng)設(shè)計(jì)包含以下主要功能:(1)輿情瀏覽:將所有食藥輿情相關(guān)且需重點(diǎn)關(guān)注的廣播電視節(jié)目以及系統(tǒng)截取和上傳的輿情節(jié)目與進(jìn)行展示和播放,方便集中瀏覽,可設(shè)定指定時(shí)間段、展示范圍或按照分類對(duì)輿情節(jié)目進(jìn)行瀏覽;(2)字幕聯(lián)動(dòng)播放:系統(tǒng)根據(jù)音視頻節(jié)目播放的進(jìn)度與系統(tǒng)翻譯出的文本字幕實(shí)現(xiàn)聯(lián)動(dòng)播放;(3)字幕定位播放:可點(diǎn)擊字幕來(lái)定位播放所選字幕所對(duì)應(yīng)的音視頻內(nèi)容;(4)節(jié)目查詢:可根據(jù)頻道名稱、欄目名稱、新聞標(biāo)題、關(guān)鍵詞等條件查詢輿情節(jié)目數(shù)據(jù);(5)輿情審核:提供審核頁(yè)面供工作人員對(duì)系統(tǒng)生成的各種輿情內(nèi)容進(jìn)行審核和信息分類,審核人員可記錄、編輯和上傳針對(duì)輿情節(jié)目的研判意見(jiàn)或報(bào)告;(6)輿情信息編輯:可修改節(jié)目數(shù)據(jù)的輿情信息,包括開(kāi)始和結(jié)束時(shí)間、輿情信息、關(guān)鍵詞、涉及地區(qū)、類型、相關(guān)報(bào)道等。
(四)報(bào)表分析統(tǒng)計(jì)子系統(tǒng)。主要實(shí)現(xiàn)對(duì)系統(tǒng)的各類輿情信息進(jìn)行查詢分類和分析統(tǒng)計(jì),并以報(bào)表的形式展現(xiàn)出來(lái)。系統(tǒng)要能根據(jù)不斷變化的業(yè)務(wù)需求,從不同角度和業(yè)務(wù)層面生成決策數(shù)據(jù)報(bào)表、宏觀分析報(bào)表、各種文件格式的統(tǒng)計(jì)圖表等,為食品藥品監(jiān)管部門(mén)提供決策依據(jù)。該子系統(tǒng)設(shè)計(jì)包含以下主要功能:(1)輿情信息查詢:針對(duì)全庫(kù)的輿情節(jié)目進(jìn)行集中查詢展示,展示列表包括頻道名稱、欄目名稱、關(guān)鍵詞、輿情信息、時(shí)長(zhǎng)、主要內(nèi)容、輿情信息字?jǐn)?shù)等;(2)頻道統(tǒng)計(jì)報(bào)表:按照頻道分類,可定制頻道統(tǒng)計(jì)報(bào)表模板并導(dǎo)出統(tǒng)計(jì)報(bào)表;(3)欄目統(tǒng)計(jì)報(bào)表:按照欄目類別分類,可定制節(jié)目統(tǒng)計(jì)報(bào)表模板并導(dǎo)出統(tǒng)計(jì)報(bào)表;(4)輿情動(dòng)態(tài)報(bào)表:按照輿情內(nèi)容分類,可定制輿情動(dòng)態(tài)統(tǒng)計(jì)報(bào)表模板并導(dǎo)出統(tǒng)計(jì)報(bào)表;(5)輿情報(bào)告上傳:支持將自定義的輿情分析報(bào)告上傳至服務(wù)器;(6)輿情報(bào)告查詢:對(duì)系統(tǒng)中生成的或上傳的輿情分析報(bào)告查詢。
(五)系統(tǒng)配置與管理子系統(tǒng)。主要完成對(duì)系統(tǒng)的運(yùn)行參數(shù)等進(jìn)行管理和配置。根據(jù)實(shí)際應(yīng)用系統(tǒng)運(yùn)行的需要,該子系統(tǒng)設(shè)計(jì)包含以下主要功能:(1)頻道配置:提供對(duì)頻道信息的配置界面,實(shí)現(xiàn)對(duì)頻道信息的增加、刪除、修改等配置和管理,系統(tǒng)可靈活配置頻道、欄目、關(guān)鍵詞等信息完成對(duì)相應(yīng)系統(tǒng)屬性的管理;(2)欄目配置:在頻道詳細(xì)頁(yè)可對(duì)頻道所屬欄目進(jìn)行配置,可以增加欄目、刪除欄目和設(shè)置無(wú)效等管理配置;(3)關(guān)鍵詞配置:系統(tǒng)支持動(dòng)態(tài)的對(duì)識(shí)別關(guān)鍵詞進(jìn)行配置,關(guān)鍵詞配置由關(guān)鍵詞列表和查詢框兩部分組成,包括新增、編輯、刪除和復(fù)合規(guī)則的配置。系統(tǒng)支持針對(duì)不同頻道使用不同的關(guān)鍵詞識(shí)別規(guī)則,可通過(guò)關(guān)鍵詞配置復(fù)合規(guī)則配置實(shí)現(xiàn)。復(fù)合規(guī)則配置可分別對(duì)不同的頻道設(shè)置不同的關(guān)鍵詞,優(yōu)化關(guān)鍵詞匹配搜索;(4)下載管理:對(duì)系統(tǒng)中新聞截取的節(jié)目和自上傳的節(jié)目進(jìn)行管理,包括信息展示、處理狀態(tài)跟進(jìn)、刪除等操作;(5)用戶及權(quán)限管理:可進(jìn)行添加、編輯、刪除系統(tǒng)用戶信息的配置操作,可以對(duì)不同的用戶分配功能和操作權(quán)限,方便對(duì)系統(tǒng)的使用和管理。
本研究將食品藥品安全輿情的監(jiān)測(cè)范圍從網(wǎng)絡(luò)、報(bào)紙和雜志等媒體延伸至廣播電視媒體,拓寬了食品藥品安全輿情監(jiān)測(cè)的廣度,對(duì)探索實(shí)現(xiàn)食品藥品安全輿情的全媒體監(jiān)測(cè)具有重要的現(xiàn)實(shí)意義。