摘要:為了深度挖掘直播衛(wèi)星多維關(guān)聯(lián)數(shù)據(jù)之間的隱藏關(guān)系,加強(qiáng)系統(tǒng)間數(shù)據(jù)交互的高效性、規(guī)范性、可擴(kuò)展性,提出搭建直播衛(wèi)星用戶數(shù)據(jù)分析平臺(tái)。通過(guò)建設(shè)全生命周期數(shù)據(jù)管理系統(tǒng)、用戶數(shù)據(jù)分析系統(tǒng)、業(yè)務(wù)與服務(wù)統(tǒng)一門戶系統(tǒng)及業(yè)務(wù)與服務(wù)總線系統(tǒng)等四個(gè)子系統(tǒng),建立海量異構(gòu)數(shù)據(jù)同步共享機(jī)制,完善直播衛(wèi)星數(shù)據(jù)治理規(guī)范,實(shí)現(xiàn)中心全部業(yè)務(wù)系統(tǒng)及外部相關(guān)渠道的數(shù)據(jù)整合、內(nèi)容整合和統(tǒng)一登錄,滿足不斷涌現(xiàn)的數(shù)據(jù)交互共享、綜合查詢、分析挖掘需求。
關(guān)鍵詞:數(shù)據(jù)共享;數(shù)據(jù)分析;廣播電視直播衛(wèi)星
一、引言
隨著“中星9號(hào)”及“中星9A”衛(wèi)星的成功發(fā)射,在黨中央的號(hào)召下國(guó)家廣電總局衛(wèi)星直播中心積極推行我國(guó)“戶戶通”工程,利用地球同步軌道衛(wèi)星將廣播、電視及其他數(shù)據(jù)業(yè)務(wù)直接發(fā)送至用戶接收設(shè)備,為近1.5億農(nóng)村家庭提供豐富優(yōu)質(zhì)的廣播電視節(jié)目。在此期間,為了對(duì)業(yè)務(wù)實(shí)施提供有效的保障和支持,中心陸續(xù)建設(shè)了一系列信息化系統(tǒng),包括戶戶通用戶管理系統(tǒng)、村村通用戶管理系統(tǒng)、加密卡管理系統(tǒng)、專營(yíng)點(diǎn)申報(bào)審核系統(tǒng)、服務(wù)區(qū)域管理系統(tǒng)等25個(gè)業(yè)務(wù)支撐系統(tǒng)。然而,由于各業(yè)務(wù)系統(tǒng)逐步開(kāi)發(fā)、分散設(shè)計(jì)、獨(dú)立運(yùn)行,直播衛(wèi)星平臺(tái)具有系統(tǒng)內(nèi)數(shù)據(jù)維度多、系統(tǒng)間數(shù)據(jù)耦合度高、信息資源難以共享的問(wèn)題。
綜上,有必要在對(duì)直播衛(wèi)星業(yè)務(wù)支撐系統(tǒng)做頂層梳理規(guī)劃的基礎(chǔ)上,建設(shè)直播衛(wèi)星用戶數(shù)據(jù)分析平臺(tái),建立海量異構(gòu)數(shù)據(jù)同步共享機(jī)制,完善直播衛(wèi)星數(shù)據(jù)治理規(guī)范,加強(qiáng)系統(tǒng)間數(shù)據(jù)交互的高效性、規(guī)范性、可擴(kuò)展性,打破“信息孤島”的壁壘,深度挖掘直播衛(wèi)星多維關(guān)聯(lián)數(shù)據(jù)之間的隱藏關(guān)系,滿足不斷涌現(xiàn)的數(shù)據(jù)交互共享、綜合查詢、分析挖掘需求。
二、總體技術(shù)架構(gòu)
直播衛(wèi)星用戶數(shù)據(jù)分析平臺(tái)主要由全生命周期數(shù)據(jù)管理系統(tǒng)、用戶數(shù)據(jù)分析系統(tǒng)、業(yè)務(wù)與服務(wù)統(tǒng)一門戶系統(tǒng)及業(yè)務(wù)與服務(wù)總線系統(tǒng)等四個(gè)子系統(tǒng)組成,實(shí)現(xiàn)中心全部業(yè)務(wù)系統(tǒng)及外部相關(guān)渠道的數(shù)據(jù)整合、內(nèi)容整合、接口規(guī)范和統(tǒng)一登錄。直播衛(wèi)星公共服務(wù)平臺(tái)用戶數(shù)據(jù)分析系統(tǒng)的總體技術(shù)架構(gòu)如圖1所示。
三、系統(tǒng)功能設(shè)計(jì)
(一)全生命周期數(shù)據(jù)管理系統(tǒng)
全生命周期數(shù)據(jù)管理系統(tǒng),通過(guò)統(tǒng)一的數(shù)據(jù)接口規(guī)范,對(duì)中心所有業(yè)務(wù)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)進(jìn)行采集和匯聚,形成數(shù)據(jù)共享平臺(tái),有效、靈活實(shí)現(xiàn)不同系統(tǒng)間的信息交換、數(shù)據(jù)共享與業(yè)務(wù)協(xié)同,進(jìn)一步發(fā)揮信息資源和應(yīng)用系統(tǒng)的效能。通過(guò)建立全局大集中數(shù)據(jù)庫(kù),實(shí)時(shí)捕獲多系統(tǒng)、多數(shù)據(jù)庫(kù)的數(shù)據(jù)變化,采用數(shù)據(jù)泵壓縮數(shù)據(jù)日志文件并加密的方式將數(shù)據(jù)同步至目的數(shù)據(jù)庫(kù),在不影響原業(yè)務(wù)系統(tǒng)業(yè)務(wù)的前提下,實(shí)現(xiàn)中心全部業(yè)務(wù)系統(tǒng)的數(shù)據(jù)同步[1-2]。此種同步方式不僅具有帶寬占用少、亞秒級(jí)同步延時(shí)、對(duì)源數(shù)據(jù)庫(kù)影響較小的優(yōu)點(diǎn),同時(shí)支持對(duì)多種數(shù)據(jù)庫(kù)實(shí)現(xiàn)一對(duì)一、一對(duì)多、多對(duì)一、雙向復(fù)制等功能。其次,為了給后續(xù)數(shù)據(jù)統(tǒng)計(jì)、分析挖掘提供數(shù)據(jù)基礎(chǔ),建設(shè)全生命周期實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù),將數(shù)據(jù)從全局大集中數(shù)據(jù)庫(kù)的緩沖區(qū)經(jīng)過(guò)清洗、轉(zhuǎn)換、映射等復(fù)雜的數(shù)據(jù)處理,進(jìn)入到實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù),實(shí)現(xiàn)數(shù)據(jù)的“一次采集、多系統(tǒng)共享”。此外,全生命周期數(shù)據(jù)管理系統(tǒng)具備靈活的可視化配置功能,能夠快速實(shí)現(xiàn)不同機(jī)構(gòu)、不同應(yīng)用系統(tǒng)、不同數(shù)據(jù)庫(kù)間基于不同傳輸協(xié)議的數(shù)據(jù)交換與信息共享,為各種應(yīng)用和決策支持提供良好的數(shù)據(jù)環(huán)境。
(二)用戶數(shù)據(jù)分析系統(tǒng)
用戶數(shù)據(jù)分析系統(tǒng),利用數(shù)據(jù)共享平臺(tái)采集的直播衛(wèi)星業(yè)務(wù)數(shù)據(jù)、從互聯(lián)網(wǎng)搜集的非結(jié)構(gòu)化數(shù)據(jù)及用戶回傳的收視行為數(shù)據(jù),通過(guò)數(shù)據(jù)預(yù)處理、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)分析與數(shù)據(jù)挖掘四個(gè)步驟,建立各種業(yè)務(wù)模型和分析模型,深度挖掘數(shù)據(jù)背后蘊(yùn)藏的價(jià)值,掌握直播衛(wèi)星用戶實(shí)際的收視習(xí)慣及內(nèi)容需求,有力地支撐中心進(jìn)一步精準(zhǔn)化、科學(xué)化管理,形成快速感知用戶、社會(huì)對(duì)于直播衛(wèi)星業(yè)務(wù)輿情態(tài)勢(shì)的能力,探索分析評(píng)價(jià)直播衛(wèi)星業(yè)務(wù)對(duì)于收視地域在政治層面、經(jīng)濟(jì)層面等公共服務(wù)視角下的影響力。用戶數(shù)據(jù)分析系統(tǒng)主要包括9大功能組件:
1.市場(chǎng)分析組件功能
主要面向衛(wèi)星直播業(yè)務(wù)的市場(chǎng)存量和發(fā)展空間進(jìn)行量化分析,包括農(nóng)戶市場(chǎng)總存量分析、當(dāng)前用戶數(shù)分析、零售省份市場(chǎng)空間分析、整省推進(jìn)省份市場(chǎng)空間分析等內(nèi)容。
2.渠道分析組件功能
主要針對(duì)衛(wèi)星直播業(yè)務(wù)推廣的合作渠道進(jìn)行量化分析,包括專營(yíng)點(diǎn)數(shù)量分析、專營(yíng)點(diǎn)發(fā)展規(guī)律分析、專營(yíng)點(diǎn)業(yè)務(wù)推廣情況分析、工號(hào)數(shù)量分析、工號(hào)業(yè)務(wù)辦理情況分析、僵尸工號(hào)分析、僵尸專營(yíng)點(diǎn)分析等內(nèi)容。
3.運(yùn)維分析組件功能
主要針對(duì)運(yùn)維相關(guān)的數(shù)據(jù)進(jìn)行量化分析,包括運(yùn)維人員分析、資產(chǎn)分析、設(shè)備分析、信息系統(tǒng)分析、日常運(yùn)維任務(wù)分析、運(yùn)維作業(yè)計(jì)劃分析、運(yùn)維故障分析等內(nèi)容。此外,還提供了基于在線流模式的事件分析應(yīng)用功能,包括疑似攻擊行為分析、異常事件識(shí)別與上報(bào)、事件管理中心等功能。
4.統(tǒng)計(jì)報(bào)表服務(wù)組件功能
主要從用戶發(fā)展、安全監(jiān)控、業(yè)務(wù)管理、客戶反饋等多角度進(jìn)行用戶及業(yè)務(wù)數(shù)據(jù)的統(tǒng)計(jì)報(bào)表服務(wù)。
5.營(yíng)銷分析組件功能
主要側(cè)重于分析業(yè)務(wù)發(fā)展規(guī)律和旺季規(guī)律,為專營(yíng)點(diǎn)開(kāi)展?fàn)I銷活動(dòng)提供科學(xué)指導(dǎo),包括節(jié)假日用戶增長(zhǎng)規(guī)律分析、淡旺季用戶增長(zhǎng)規(guī)律分析等內(nèi)容。
6.合作伙伴分析組件功能
主要針對(duì)衛(wèi)星直播中心的合作伙伴進(jìn)行量化分析,包括合作伙伴類型與數(shù)量分析、方案商授權(quán)情況分析、機(jī)頂盒廠商生產(chǎn)/銷售情況分析、機(jī)頂盒廠商故障分析等內(nèi)容。
7. 收視率分析組件功能
主要針對(duì)直播衛(wèi)星用戶的收視行為、興趣喜好等進(jìn)行挖掘分析,包括收視率、收視行為、節(jié)目熱度、內(nèi)容(節(jié)目/廣告)推薦等內(nèi)容。對(duì)于具備雙向信息傳輸能力的試點(diǎn),對(duì)收視情況進(jìn)行詳細(xì)分析,準(zhǔn)確了解不同時(shí)段下,各頻道、各節(jié)目的收視率情況。建立用戶收視行為模型,分析計(jì)算用戶的開(kāi)機(jī)、換臺(tái)、點(diǎn)播、頻道類型、節(jié)目類型等行為[3]。建立用戶興趣模型,根據(jù)用戶的收視行為構(gòu)建用戶畫像,并計(jì)算形成用戶聚類[4]。根據(jù)內(nèi)容的特點(diǎn),建立內(nèi)容的標(biāo)簽體系,構(gòu)建用戶-內(nèi)容的興趣矩陣。研究雙向精準(zhǔn)匹配的協(xié)同過(guò)濾個(gè)性化推薦算法,面向用戶和用戶聚類,輸出內(nèi)容的推薦結(jié)果,為未來(lái)增值業(yè)務(wù)運(yùn)營(yíng)推廣,提供科學(xué)的數(shù)據(jù)準(zhǔn)備和決策支撐。
8.客戶分析組件功能
主要針對(duì)衛(wèi)星直播業(yè)務(wù)的收看用戶進(jìn)行量化分析,包括當(dāng)前用戶總量分析、用戶地域分析、用戶在網(wǎng)時(shí)間分析、用戶退網(wǎng)情況分析、用戶變更業(yè)務(wù)分析等內(nèi)容。
9.管理分析組件功能
主要針對(duì)內(nèi)部管理情況進(jìn)行量化分析,包括人員數(shù)量分析、項(xiàng)目數(shù)量分析、人員承擔(dān)項(xiàng)目情況分析等內(nèi)容。
(三)業(yè)務(wù)與服務(wù)統(tǒng)一門戶系統(tǒng)
業(yè)務(wù)與服務(wù)統(tǒng)一門戶系統(tǒng),根據(jù)門戶用戶權(quán)限配置關(guān)系獲得相應(yīng)授權(quán)的整合信息,為各類門戶角色人員提供定制化的門戶界面,實(shí)現(xiàn)中心業(yè)務(wù)支撐域各業(yè)務(wù)系統(tǒng)的統(tǒng)一接入訪問(wèn),用戶登錄一次,即可實(shí)現(xiàn)在所有授權(quán)業(yè)務(wù)系統(tǒng)之間“全網(wǎng)漫游”。同時(shí),將內(nèi)容管理、綜合業(yè)務(wù)辦理、綜合數(shù)據(jù)查詢等服務(wù)進(jìn)行集成,靈活實(shí)現(xiàn)不同系統(tǒng)間的信息交換、共享與業(yè)務(wù)協(xié)同。此外,系統(tǒng)具備良好的擴(kuò)展能力,可以靈活接入中心業(yè)務(wù)支撐域新增業(yè)務(wù)系統(tǒng)或其他安全域業(yè)務(wù)系統(tǒng)。業(yè)務(wù)與服務(wù)統(tǒng)一門戶系統(tǒng)主要功能主要包括4大方面:
1.統(tǒng)一用戶管理功能
主要包括組織機(jī)構(gòu)、用戶管理、業(yè)務(wù)角色、權(quán)限管理、日志管理等五部分功能。
2.統(tǒng)一認(rèn)證管理功能
主要包括系統(tǒng)登錄認(rèn)證和單點(diǎn)登錄認(rèn)證兩大功能。
3.統(tǒng)一內(nèi)容管理功能
主要包括站點(diǎn)管理、欄目管理、內(nèi)容管理、模板管理、流程審批、系統(tǒng)管理等六部分內(nèi)容。
4.統(tǒng)一接口管理功能
主要包括界面信息同步、用戶信息同步、認(rèn)證信息同步、業(yè)務(wù)資源信息同步、短信信息同步等五部分功能。
(四)業(yè)務(wù)與服務(wù)總線系統(tǒng)
作為中心業(yè)務(wù)系統(tǒng)的通信樞紐和信息交換平臺(tái),高效、有序地實(shí)現(xiàn)各系統(tǒng)之間的互聯(lián)互通,為跨系統(tǒng)及數(shù)據(jù)庫(kù)間的同構(gòu)及異構(gòu)數(shù)據(jù)提供數(shù)據(jù)抽取、格式轉(zhuǎn)換、內(nèi)容過(guò)濾、內(nèi)容轉(zhuǎn)換、動(dòng)態(tài)部署、可視化管理監(jiān)控等靈活的數(shù)據(jù)交換服務(wù)[5]。實(shí)現(xiàn)系統(tǒng)間數(shù)據(jù)共享和接口調(diào)用,降低系統(tǒng)間的耦合度,提高信息系統(tǒng)總體架構(gòu)的靈活性,使中心獨(dú)立建設(shè)的多個(gè)信息系統(tǒng)平滑地向基于面向服務(wù)的應(yīng)用架構(gòu)(SOA)演進(jìn),逐步實(shí)現(xiàn)衛(wèi)星直播中心IT信息系統(tǒng)多層次、條線化、松耦合的整體應(yīng)用架構(gòu)目標(biāo)。
四、結(jié)束語(yǔ)
通過(guò)建設(shè)直播衛(wèi)星用戶數(shù)據(jù)分析平臺(tái),對(duì)中心現(xiàn)有全部業(yè)務(wù)系統(tǒng)的用戶數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)及外部互聯(lián)網(wǎng)輿情數(shù)據(jù)、用戶回傳收視行為數(shù)據(jù)等實(shí)現(xiàn)深度整合,突破“信息孤島”的壁壘,實(shí)現(xiàn)衛(wèi)星直播領(lǐng)域下全域、全集、全程數(shù)據(jù)高質(zhì)量治理。同時(shí),通過(guò)數(shù)理統(tǒng)計(jì)、聯(lián)機(jī)分析處理、語(yǔ)義分析等手段,對(duì)數(shù)據(jù)共享平臺(tái)整合的數(shù)據(jù)進(jìn)行挖掘、分析,提供直觀的報(bào)表和可視化數(shù)據(jù),為中心制度決策、科學(xué)管理、內(nèi)容供給、業(yè)務(wù)發(fā)展等提供數(shù)據(jù)支撐。通過(guò)將直播衛(wèi)星用戶數(shù)據(jù)和收視行為數(shù)據(jù)的結(jié)合,有效掌握了我國(guó)農(nóng)村地區(qū)直播衛(wèi)星節(jié)目覆蓋情況、用戶收視需求及效果反饋,為建立直播衛(wèi)星公共服務(wù)效果評(píng)估指標(biāo)體系,有效評(píng)估改進(jìn)直播衛(wèi)星公共服務(wù)效果和質(zhì)量提供了技術(shù)支撐。
作者單位:萬(wàn)敏? ? 國(guó)家廣播電視總局廣播電視衛(wèi)星直播管理中心
參? 考? 文? 獻(xiàn)
[1] 胡金龍. 異構(gòu)數(shù)據(jù)庫(kù)同步復(fù)制技術(shù)研究與實(shí)現(xiàn). 長(zhǎng)江科學(xué)院院報(bào)[J]. 2011, 28(6):71-75.
[2] 董永峰. 分布式異構(gòu)數(shù)據(jù)庫(kù)同步集成的研究與應(yīng)用.計(jì)算機(jī)應(yīng)用與軟件[J].2012,29(6):122-124.
[3] 萬(wàn)敏. 數(shù)據(jù)挖掘算法在衛(wèi)星直播廣播電視用戶收視行為分析中的應(yīng)用. 中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)2016年學(xué)術(shù)年會(huì)論文集[C]. 2016,95-99.
[4] 苑喆. 大數(shù)據(jù)分析平臺(tái)及用戶收視行為分析的技術(shù)研究. 有線電視技術(shù)[J]. 2018, 1:33-35.
[5] 郭廣軍. 基于ESB的Web服務(wù)集成技術(shù).計(jì)算機(jī)應(yīng)用與軟件[J].2008,25(11):283-285.