山西廣播電視無線管理中心 李曉光
大數(shù)據(jù)技術在廣播電視監(jiān)測中的應用方法
山西廣播電視無線管理中心 李曉光
豐富多樣的廣播電視播放形式不斷的推動了廣播電視監(jiān)測系統(tǒng)領域的發(fā)展,同時需要檢測的數(shù)據(jù)信息量也明顯的增加,而當前的廣播電視監(jiān)控的重中之重就是在龐大的檢測數(shù)據(jù)的體系中獲得有效的信息。文中對大數(shù)據(jù)的特點及將來的發(fā)展應用進行了講述,對分析監(jiān)測數(shù)據(jù)有很好的參考作用。
大數(shù)據(jù)技術;廣播電視監(jiān)測;應用
伴隨著高速發(fā)展的廣播電視業(yè)務,形成了多元化的監(jiān)測播出形式,同時涉及的領域和規(guī)模也不斷擴大,對于廣播電視監(jiān)測工作者而言,在大量的數(shù)據(jù)中得到有效的信息是當前行業(yè)面臨的最重要的問題,將信息量龐大的數(shù)據(jù)進行處理及應用被稱為大數(shù)據(jù)。當前的監(jiān)測工作雖不屬于大數(shù)據(jù)時期,但正在逐步趨向于大數(shù)據(jù)時代。
1.1 數(shù)據(jù)預處理技術
通常用到的數(shù)據(jù)預處理的方法是將數(shù)據(jù)進行抽取和清洗。數(shù)據(jù)的抽取過程即數(shù)據(jù)集成,是將結構化的數(shù)據(jù)或者形式復雜的非結構化數(shù)據(jù)進行同質化,對后期的數(shù)據(jù)分析起到了很好的作用。數(shù)據(jù)的清洗指的是將將那些可有可無的數(shù)據(jù)清除掉,將有用的數(shù)據(jù)留下。當前社會,行業(yè)中起到主導地位的是Datastage和Powercenter兩款,可以依照數(shù)據(jù)結構由易到難對大量數(shù)據(jù)進行收集、變換、分發(fā)等操作,從而做到有效的處理大數(shù)據(jù)。
1.2 數(shù)據(jù)存儲與數(shù)據(jù)管理
數(shù)據(jù)管理是指利用計算機的硬件和軟件將數(shù)據(jù)采集、儲存及處理的過程。數(shù)據(jù)管理可以很好的將數(shù)據(jù)的功能展現(xiàn)出來。而對數(shù)據(jù)進行嚴格管理的重要之處則是數(shù)據(jù)組織。時代的發(fā)展也在影響著數(shù)據(jù)管理的發(fā)展,由原來的人工管理到文件系統(tǒng),再到現(xiàn)在的數(shù)據(jù)庫系統(tǒng)共三個階段。數(shù)據(jù)庫系統(tǒng)中包含有數(shù)據(jù)結構,這樣不僅能很好的展現(xiàn)出數(shù)據(jù)之間的關聯(lián),還對數(shù)據(jù)的修復及引申更新有一定的好處,同時還具有保證數(shù)據(jù)獨立、安全、完整的優(yōu)點,使數(shù)據(jù)管理的效率得以提高。
1.3 數(shù)據(jù)挖據(jù)與智能分析
數(shù)據(jù)挖掘觸及到人工智能、模式識別、機器學習以及統(tǒng)計學等諸多方面。數(shù)據(jù)挖掘指的是在大量的數(shù)據(jù)信息中利用算法的方式將有用的信息搜索出來的過程。將計算機科學作為數(shù)據(jù)挖掘的主體,主要采用統(tǒng)計、在線分析處理、檢索、機器學習、專家系統(tǒng)和模式識別等方法,以此來達到搜索目標。且在商務管理、生產控制、市場分析和工程設計等眾多領域使用被檢索到的信息。
2.1 業(yè)務過于龐雜
目前廣播電視監(jiān)聽監(jiān)視系統(tǒng)、廣告監(jiān)管系統(tǒng)、安全播出系統(tǒng)、WAP監(jiān)管系統(tǒng)等大量系統(tǒng)投入到廣播電視監(jiān)管工作中,導致業(yè)務系統(tǒng)十分的繁雜。導致服務器數(shù)量過多,且每一種管理方法與同一類型或系統(tǒng)相互呼應,使得監(jiān)測監(jiān)管工作的在極大數(shù)量的服務器中有著非常龐大的任務,而且上層應用接口、流程非常繁雜,使廣播電視監(jiān)測監(jiān)管工作變得十分的困難且繁瑣。
2.2 備用系統(tǒng)不足
目前的廣播電視監(jiān)測監(jiān)管過程中,現(xiàn)有系統(tǒng)受到人們的重視而備用系統(tǒng)的重要程度卻被人們所忽視,當系統(tǒng)和設備突然出現(xiàn)問題時,需要經過長時間的且非常復雜的手段才能將系統(tǒng)環(huán)境修復,備用系統(tǒng)不充分導致廣播電視監(jiān)測監(jiān)管工作遇到問題時不得已而暫停,使工作效率與工作質量降低。
2.3 資源利用不均
主機資源不能有效的被利用是當前的廣播電視監(jiān)測監(jiān)管過程中普遍存在的現(xiàn)象。一般情況下,在部署的輕量級應用主機當中,計算和I/O資源在輕量級的主機中處于閑置狀態(tài),且固定的一個主機上會運行單一的業(yè)務,導致一部分主機被擱置,造成資源浪費,且重復投資的狀況頻繁出現(xiàn)。
2.4 平臺升級困難
硬件不斷更新,與之配套的操作系統(tǒng)和數(shù)據(jù)庫也隨著不斷變化,各業(yè)務系統(tǒng)不斷升級,導致業(yè)務系統(tǒng)運行穩(wěn)定性差,由于尚未統(tǒng)一規(guī)劃軟件版本和硬件配置沒有統(tǒng)一的標準,導致對后期的工作帶來較大的影響。
3.1 采集監(jiān)控信息
廣播電視監(jiān)測監(jiān)管分析系統(tǒng)依據(jù)大數(shù)據(jù)而建立,其中的采集監(jiān)控信息模塊,將大數(shù)據(jù)的分析技術、互聯(lián)網搜索及文本挖掘技術合理的利用后,對各種社交軟件中產生的信息開始全面的整理及應用。能夠主動對互聯(lián)網中產生的資源信息進行增量采集,不僅能有效的建立原始信息庫還能實時更新。并且,此模塊能將網站中的多種語言信息全部進行采集,更便于廣播電視行業(yè)加強對國內外敵對勢力的動態(tài)信息的采集。網頁、視頻、圖片等各種模式的信息及網頁與論壇中的均可以利用全媒體技術進行采集,且將信息保存到數(shù)據(jù)庫中。
3.2 處理監(jiān)控信息
文本和媒體在大數(shù)據(jù)中的挖掘技術經過過濾、排列、分類采集可以獲得原始信息資源,且能夠自動將內碼轉換成智能模式進行分析和處理監(jiān)控信息,因而形成了內容豐富的信息樹。人工記錄信息在大數(shù)據(jù)技術中心也同樣支持,可以依照現(xiàn)實對它進行一系列處理,如:加工、修改或刪除。最重要的是,大數(shù)據(jù)技術能夠幫助頁面完成有效元數(shù)據(jù)的自動提取,也就是自動分析功能,同時能將垃圾文件自動刪除,避免了各種資源浪費。
3.3 分析監(jiān)控信息
廣播媒體監(jiān)測監(jiān)管系統(tǒng)中的分析監(jiān)控信息模塊不僅能快速的對監(jiān)控信息分析處理,還能進行檢索工作,并且通過授權的方式對監(jiān)控信息完成檢索,按照不同情況來提供與之相符的信息服務。尤其是大數(shù)據(jù)技術當中的知識管理技術能夠將需要分析的數(shù)據(jù)整理成報告及統(tǒng)計圖表,便于工作人員更加簡潔明了的了解監(jiān)控情況。在監(jiān)控信息導航技術能夠將各種信息數(shù)據(jù)分類并對監(jiān)控報告進行管理;在其基礎之上,廣播電視行業(yè)可以對互聯(lián)網重點事件分析報告及監(jiān)控分析報告做出相應的預警信息,警示其他人及時對違法違規(guī)的信息進行阻止且刪除。管理電視廣播監(jiān)控監(jiān)管工作的人員也可以隨時對監(jiān)控信息導航樹定義和管理,方便對時間中的各種邏輯關系進行深入解析。
大數(shù)據(jù)作為一種資源、一種工具,雖然為廣播電視監(jiān)管工作帶來翻天覆地的變化,但大數(shù)據(jù)仍無法將所有的數(shù)據(jù)采集、加工處理,所以并不能提供絕對準確的答案,我們只能將它作為參考數(shù)據(jù),不能完全依賴。
[1]朱磊.廣播電視監(jiān)測信息管理平臺的建設[J].現(xiàn)代電視技術,2007(10).
[2]程石,劉志偉.探究廣播電視監(jiān)測中大數(shù)據(jù)技術的應用[J].通訊世界,2017(08).
[3]秦琨琨.廣播電視監(jiān)測中信息化應用及安全防護[J].數(shù)字傳媒研究,2016(04).
[4]趙杰,丁勇扎西.廣播電視監(jiān)測網安全管理平臺安全響應工單系統(tǒng)的設計與實現(xiàn)[J].廣播與電視技術,2007(11).
[5]王春雨,葉建超,關?。赩B的廣播電視監(jiān)測報表軟件的設計與應用[J].電子世界, 2016(01).
[6]蔡國賢.廣播電視監(jiān)測技術的研究[J].黑龍江科技信息,2015(31).
[7]趙國強.基于互聯(lián)網建立廣播電視監(jiān)測服務平臺的構想[J].廣播電視信息,2014(03).
[8]李碩.廣播電視監(jiān)測系統(tǒng)的應用與發(fā)展[J].電子制作,2013(16).
[9]李金根.廣播電視監(jiān)測網網絡安全研究[J].科技創(chuàng)新導報,2011(24).
李曉光(1982—),男,山西翼城人,學士,工程師,從事廣播電視技術工作。