□戴冬云
現(xiàn)階段,應(yīng)用大數(shù)據(jù)技術(shù)可以對(duì)海量數(shù)據(jù)和信息進(jìn)行高效分析和處理,獲取有價(jià)值的信息,減少人的工作量,有效緩解工作壓力。就目前的發(fā)展?fàn)顩r來看,監(jiān)測(cè)工作還沒有進(jìn)入到大數(shù)據(jù)時(shí)期。因而,現(xiàn)階段做好大數(shù)據(jù)技術(shù)的應(yīng)用對(duì)于提升廣播電視監(jiān)測(cè)工作具有重要意義。
大數(shù)據(jù)技術(shù)的應(yīng)用,需要借助各種各樣的網(wǎng)絡(luò)數(shù)據(jù)庫和引擎等工具,同時(shí)該技術(shù)可以實(shí)現(xiàn)搜索、分類功能,并且可以進(jìn)行數(shù)據(jù)的分析等。通過利用電子計(jì)算機(jī)所具有的高速運(yùn)算能力,可以對(duì)一些事件或者是與事件相關(guān)的事物進(jìn)行精確的研究與分析。這樣一來,就能夠在一定的范圍內(nèi)對(duì)未來發(fā)展的方向做出相應(yīng)的預(yù)測(cè)。通過大數(shù)據(jù)技術(shù)的應(yīng)用,還能實(shí)現(xiàn)海量數(shù)據(jù)的快速、自動(dòng)處理和分析,進(jìn)而可以減少人力勞動(dòng)。另外,大數(shù)據(jù)技術(shù)還能提供許多個(gè)性化的數(shù)據(jù)服務(wù)與應(yīng)用,圖1為大數(shù)據(jù)處理平臺(tái)基本框架。
圖1 大數(shù)據(jù)處理平臺(tái)基本框架
在進(jìn)行數(shù)據(jù)的預(yù)處理工作時(shí),需要做好數(shù)據(jù)的抽取和清洗工作,這樣一來能夠?qū)⒔Y(jié)構(gòu)化的數(shù)據(jù)進(jìn)行同質(zhì)化處理,并且這一過程可以對(duì)形式相對(duì)復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)做出同質(zhì)化的處理,這一技術(shù)通常被稱為數(shù)據(jù)的抽取環(huán)節(jié),也就是數(shù)據(jù)的集成。這一工作對(duì)于后續(xù)的數(shù)據(jù)分析有著重要的作用。通過抽取可以將一些無關(guān)緊要的數(shù)據(jù)排除在外,進(jìn)而能夠獲取到更有價(jià)值的數(shù)據(jù),這個(gè)過程就是數(shù)據(jù)的清洗環(huán)節(jié)?,F(xiàn)階段,Datastage以及Powercenter是行業(yè)內(nèi)部應(yīng)用較廣的兩款主流產(chǎn)品。清洗之后,可以按照數(shù)據(jù)結(jié)構(gòu)從簡(jiǎn)單到復(fù)雜的關(guān)系,進(jìn)行大量數(shù)據(jù)的深層次操作。比如進(jìn)行數(shù)據(jù)的收集、變換以及分發(fā)等,這對(duì)于大數(shù)據(jù)的高效處理有巨大的推動(dòng)作用,圖2為數(shù)據(jù)預(yù)處理技術(shù)示意圖。
圖2 數(shù)據(jù)預(yù)處理技術(shù)示意圖
數(shù)據(jù)的存儲(chǔ)與管理主要借助于計(jì)算機(jī)的硬件與軟件得以實(shí)現(xiàn),這一過程中可以實(shí)現(xiàn)數(shù)據(jù)的收集、存儲(chǔ)與處理、應(yīng)用。通過應(yīng)用數(shù)據(jù)管理技術(shù),可以有效體現(xiàn)數(shù)據(jù)功能。隨著時(shí)代的不斷發(fā)展,數(shù)據(jù)管理也經(jīng)歷了三個(gè)階段的變遷,早期的管理方式主要是以人工管理的方式為主,隨后而來的就是文件系統(tǒng)?,F(xiàn)階段,數(shù)據(jù)管理主要借助于數(shù)據(jù)庫系統(tǒng)來實(shí)現(xiàn)。通過將數(shù)據(jù)結(jié)構(gòu)建立在相應(yīng)的數(shù)據(jù)庫系統(tǒng)之中,可以實(shí)現(xiàn)數(shù)據(jù)間的聯(lián)系,同時(shí)可以進(jìn)行數(shù)據(jù)的修改以及擴(kuò)充、更新。通過應(yīng)用數(shù)據(jù)管理技術(shù),還能確保數(shù)據(jù)的獨(dú)立性、安全性與完整性,極大地提升數(shù)據(jù)管理工作的效率。
一般來說,數(shù)據(jù)挖掘涉及到的領(lǐng)域較為廣泛,比如現(xiàn)階段應(yīng)用較廣的人工智能技術(shù)以及模式識(shí)別技術(shù)等。對(duì)于數(shù)據(jù)的挖掘過程來說,主要是以算法的方式從海量的數(shù)據(jù)中找出相應(yīng)的有用數(shù)據(jù)。該技術(shù)將計(jì)算機(jī)科學(xué)作為載體,同時(shí)還應(yīng)用了統(tǒng)計(jì)、在線分析處理以及專家系統(tǒng)、檢索、模式識(shí)別、機(jī)器學(xué)習(xí)等方法。通過應(yīng)用該技術(shù),可以達(dá)到高效的搜索目的。另外,搜索到的相關(guān)信息也經(jīng)常被應(yīng)用到商務(wù)管理、市場(chǎng)分析以及生產(chǎn)控制等環(huán)節(jié),圖3為數(shù)據(jù)挖掘處理系統(tǒng)結(jié)構(gòu)圖。
圖3 數(shù)據(jù)挖掘處理系統(tǒng)結(jié)構(gòu)圖
目前,隨著現(xiàn)代化信息技術(shù)的不斷發(fā)展,廣播電視監(jiān)測(cè)技術(shù)逐漸朝著自動(dòng)化、網(wǎng)絡(luò)化、數(shù)字化的方向發(fā)展,該技術(shù)的應(yīng)用極大地保障了廣播電視節(jié)目的安全播出。但是,現(xiàn)階段廣播電視監(jiān)測(cè)監(jiān)管工作還存在著一些問題,需要引起重視。
對(duì)于廣播電視行業(yè)來說,其不同的監(jiān)測(cè)業(yè)務(wù)相對(duì)獨(dú)立,不同監(jiān)測(cè)業(yè)務(wù)單位之間缺乏必要的協(xié)調(diào)與溝通。這樣一來,就造成不同監(jiān)測(cè)系統(tǒng)之間很少進(jìn)行數(shù)據(jù)上的交互。同時(shí),由于同業(yè)務(wù)網(wǎng)內(nèi)部的一些監(jiān)測(cè)都是各自進(jìn)行建設(shè)的,所以就會(huì)導(dǎo)致資源數(shù)據(jù)的利用方面出現(xiàn)浪費(fèi)。因而,廣播電視監(jiān)測(cè)工作要跟著行業(yè)發(fā)展的趨勢(shì)走,還要注重監(jiān)測(cè)模式的融合以及合作、創(chuàng)新,最終形成一個(gè)智慧監(jiān)管的大網(wǎng)。
近幾年來,隨著監(jiān)測(cè)行業(yè)硬件升級(jí)速度的不斷加快,與之相匹配的硬件操作系統(tǒng)和數(shù)據(jù)庫環(huán)境也在不斷地進(jìn)行著更新。目前,各個(gè)業(yè)務(wù)系統(tǒng)經(jīng)常需要向新的平臺(tái)移植業(yè)務(wù)軟件并進(jìn)行實(shí)時(shí)的升級(jí),這在一定程度上對(duì)業(yè)務(wù)系統(tǒng)的穩(wěn)定運(yùn)行造成了一定的影響。由于軟件版本以及硬件配置沒有進(jìn)行統(tǒng)一規(guī)劃,因而導(dǎo)致后期階段的硬件性能升級(jí)工作出現(xiàn)較大的困難。
隨著廣播電視行業(yè)的不斷發(fā)展,行業(yè)內(nèi)監(jiān)測(cè)系統(tǒng)在技術(shù)等方面有了很大的進(jìn)步。但是,對(duì)于廣播電視的智能化程度來說,還有很大的改善與提升空間。一方面,因?yàn)榇髷?shù)據(jù)分析和新技術(shù)的應(yīng)用相對(duì)較少,同時(shí)在應(yīng)用方面質(zhì)量不高,所以造成了行業(yè)內(nèi)很多監(jiān)測(cè)工作需要人工來完成;另一方面,監(jiān)測(cè)數(shù)據(jù)的關(guān)聯(lián)分析效果較低,同時(shí)行業(yè)內(nèi)不同監(jiān)測(cè)模塊之間的關(guān)系較為獨(dú)立;此外,在進(jìn)行相關(guān)監(jiān)測(cè)數(shù)據(jù)的采集、分析工作時(shí),也存在著較大的局限性,這一局限性主要體現(xiàn)在本單位設(shè)備的測(cè)量以及相應(yīng)的監(jiān)測(cè)數(shù)據(jù)方面。因而,對(duì)于廣播電視來說,要做好數(shù)據(jù)的采集以及制作、傳輸?shù)裙ぷ?,必須不斷提升監(jiān)測(cè)的智能化程度,進(jìn)而有效提升監(jiān)管的效率與價(jià)值。
在應(yīng)用大數(shù)據(jù)技術(shù)的過程中,首先要做好信息的采集工作,并且要形成初始信息庫。在這一過程中,要把繁雜的監(jiān)測(cè)數(shù)據(jù)采集到相應(yīng)的數(shù)據(jù)庫中,同時(shí)還要做好數(shù)據(jù)的分類工作,進(jìn)而提升初始信息庫的利用價(jià)值。采集過程中,工作人員要適當(dāng)降低正常頻譜存儲(chǔ)的精度,同時(shí)還要做好一些異常頻譜的重點(diǎn)存儲(chǔ)工作。
對(duì)于目前的廣播電視監(jiān)測(cè)工作而言,從最初的數(shù)據(jù)采集工作到初始數(shù)據(jù)的處理,需要經(jīng)歷重新的過濾、排列以及分類等環(huán)節(jié),并且這一過程中要建立相應(yīng)的專業(yè)化模型。對(duì)于專業(yè)化模型而言,可以支持手動(dòng)記錄信息情報(bào)。在進(jìn)行信息的處理工作時(shí),如果發(fā)現(xiàn)相應(yīng)的重點(diǎn)或者是難點(diǎn)內(nèi)容,工作人員要結(jié)合實(shí)際情況做好相關(guān)數(shù)據(jù)的加工、處理、刪除等工作。
信息采集與處理工作結(jié)束后,工作人員要做好相關(guān)信息的分析工作。通過進(jìn)行數(shù)據(jù)分析,能夠充分應(yīng)用監(jiān)測(cè)體系的信息導(dǎo)航功能,這樣一來就可以提供一系列的信息服務(wù),同時(shí)還能對(duì)監(jiān)測(cè)報(bào)告以及信息統(tǒng)計(jì)圖表起到良好的規(guī)范作用。這一環(huán)節(jié)中,一旦發(fā)現(xiàn)與異態(tài)相吻合的信息,工作人員要及時(shí)通知用戶并進(jìn)行查看,同時(shí)還要適時(shí)地發(fā)出預(yù)警。另外通過做好監(jiān)測(cè)信息的分析工作,并結(jié)合實(shí)際的狀況,可以隨時(shí)進(jìn)行信息導(dǎo)航樹的定義、管理與監(jiān)測(cè),使之更加完善、合理。此外,在進(jìn)行大數(shù)據(jù)技術(shù)的應(yīng)用時(shí),還要注意對(duì)大數(shù)據(jù)潛在價(jià)值的挖掘工作。一項(xiàng)數(shù)據(jù)可能現(xiàn)在沒有價(jià)值,但是在未來可能存在相應(yīng)的價(jià)值,因此,我們要積極改變思維,用創(chuàng)新性的方式與思路進(jìn)行數(shù)據(jù)的整理。比如可以對(duì)有線電視單個(gè)頻道的EPG信息以時(shí)間為序進(jìn)行相應(yīng)的縱向分析,進(jìn)而幫助工作人員詳細(xì)掌握頻道節(jié)目的主要構(gòu)成;通過全國范圍內(nèi)的有線電視節(jié)目EPG信息的橫向分析工作,可以清晰地了解到節(jié)目的重播率,進(jìn)而分析出節(jié)目的受歡迎程度。
大數(shù)據(jù)技術(shù)雖然是一項(xiàng)具有預(yù)測(cè)分析、數(shù)據(jù)挖掘、數(shù)據(jù)存儲(chǔ)等多種功能的綜合技術(shù),但是不能過于迷信大數(shù)據(jù),也不能認(rèn)為數(shù)據(jù)分析能夠揭示出一切的問題。對(duì)于大數(shù)據(jù)分析而言,它的方法主要包括統(tǒng)計(jì)理論、數(shù)學(xué)理論、計(jì)算機(jī)科學(xué)理論等。大數(shù)據(jù)架構(gòu)并不是一種萬能的架構(gòu),傳統(tǒng)的數(shù)據(jù)結(jié)構(gòu)也具有相應(yīng)的優(yōu)勢(shì)與特點(diǎn)。在大數(shù)據(jù)時(shí)代,單位內(nèi)部的數(shù)據(jù)結(jié)構(gòu)主要表現(xiàn)出混合式的架構(gòu)。精確數(shù)據(jù)具備一定的優(yōu)勢(shì),每一條數(shù)據(jù)均有準(zhǔn)確的含義和確定的價(jià)值,同時(shí)還能夠表達(dá)出明確的信息。
進(jìn)入二十一世紀(jì)以來,伴隨著信息技術(shù)的快速發(fā)展,大數(shù)據(jù)技術(shù)在廣播電視行業(yè)的應(yīng)用越來越廣泛,并且這一技術(shù)已經(jīng)成為平臺(tái)構(gòu)建、海量數(shù)字信息分析以及數(shù)據(jù)存儲(chǔ)環(huán)節(jié)中的一項(xiàng)重要技術(shù)。因此,在新媒體時(shí)代,廣播電視行業(yè)要注重大數(shù)據(jù)技術(shù)的應(yīng)用,并且要進(jìn)行違法、違規(guī)信息的分析,防止不良信息的散布和傳播,凈化廣播電視大環(huán)境,促進(jìn)廣播電視行業(yè)的和諧穩(wěn)定發(fā)展。