肖啟偉,楊秀芝
(福州大學(xué) 物理與信息工程學(xué)院,福建 福州 350002)
基于NAR模型的電視頻道收視率預(yù)測
肖啟偉,楊秀芝
(福州大學(xué) 物理與信息工程學(xué)院,福建 福州 350002)
電視收視率作為電視行業(yè)中的重要指標(biāo)之一,同時也作為廣告投放和節(jié)目推送的重要依據(jù),在競爭日益激烈的視聽市場上,逐漸發(fā)揮其重要作用?;陔娨暿找暵时旧淼臅r間序列特點(diǎn),對動態(tài)神經(jīng)網(wǎng)絡(luò)算法進(jìn)行研究,提出了非參數(shù)自回歸(NAR)模型對電視頻道收視率進(jìn)行預(yù)測,取得了較好的效果。
神經(jīng)網(wǎng)絡(luò);時間序列;NAR模型;收視率;預(yù)測
電視收視率作為電視行業(yè)評價(jià)電視節(jié)目的標(biāo)準(zhǔn)之一,在廣告投放、節(jié)目推送等應(yīng)用中,起到了巨大的引導(dǎo)作用,因此,如何能夠較為準(zhǔn)確地預(yù)測下一時刻的收視率,對于電視臺、廣告商、企業(yè)用戶等都有很大的經(jīng)濟(jì)效益。
目前研究收視率的預(yù)測方法主要有三大類:決策樹、貝葉斯算法、神經(jīng)網(wǎng)絡(luò)算法等,這些算法對電視收視率進(jìn)行了科學(xué)的預(yù)測。但由于主客觀等因素,在預(yù)測上存在著局限性。文獻(xiàn)[1]中,通過對節(jié)目影響因素的分析,提出了決策樹算法,但在具體的收視率預(yù)測上不能給出確切的預(yù)測值,同時,數(shù)據(jù)量變大,決策樹又會隨之變化;文獻(xiàn)[2]中,基于分類規(guī)則和貝葉斯網(wǎng)絡(luò)進(jìn)行預(yù)測,同樣無法對具體的數(shù)值進(jìn)行預(yù)測;文獻(xiàn)[3]中,基于BP神經(jīng)網(wǎng)絡(luò)的收視率預(yù)測,雖然給出了預(yù)測值,但是在網(wǎng)絡(luò)訓(xùn)練時,采用了5分制對影響節(jié)目收視的因素進(jìn)行評分,因不同的人對不同因素的評分存在主觀性,為此該BP神經(jīng)網(wǎng)絡(luò)的收視率預(yù)測具有主觀局限性。
本文提出基于動態(tài)神經(jīng)網(wǎng)絡(luò)時間序列的收視率預(yù)測,利用收視率本身的時間序列特征,動態(tài)學(xué)習(xí)收視率在長期波動中的周期規(guī)律性,并通過神經(jīng)網(wǎng)絡(luò)對以往的收視率時間序列進(jìn)行學(xué)習(xí),搭建收視率預(yù)測模型,對未來的收視率進(jìn)行預(yù)測。此方案克服了上述文獻(xiàn)算法存在的主觀局限性等不足。
1.1 動態(tài)神經(jīng)網(wǎng)絡(luò)概述
動態(tài)神經(jīng)網(wǎng)絡(luò)區(qū)別于靜態(tài)神經(jīng)網(wǎng)絡(luò),判斷依據(jù)為存在反饋以及記憶功能與否。動態(tài)神經(jīng)網(wǎng)絡(luò)輸入輸出之間的變量關(guān)系并不僅僅是一種靜態(tài)方式的映射,每一時刻的輸出是基于當(dāng)前時刻以前系統(tǒng)的動態(tài)綜合結(jié)果而得,因此具有反饋和記憶的功能。其特點(diǎn)是系統(tǒng)有若干個穩(wěn)定的狀態(tài),開始于任何狀態(tài),最終都可進(jìn)入其中的某一個穩(wěn)定狀態(tài),并且通過對各個神經(jīng)元的連接權(quán)值的改變可以得到系統(tǒng)的穩(wěn)定狀態(tài)。
動態(tài)神經(jīng)網(wǎng)絡(luò)依據(jù)其實(shí)現(xiàn)動態(tài)的方法不同分為以下兩類:一類是回歸神經(jīng)網(wǎng)絡(luò),它由靜態(tài)神經(jīng)元與網(wǎng)絡(luò)的輸出反饋兩部分構(gòu)成,典型的網(wǎng)絡(luò)如NAR回歸神經(jīng)網(wǎng)絡(luò)。另一類是通過神經(jīng)元反饋形成的神經(jīng)網(wǎng)絡(luò),如PID神經(jīng)網(wǎng)絡(luò)等?;谑找暵实姆蔷€性及其本身的時間序列特征,本文將動態(tài)神經(jīng)網(wǎng)絡(luò)運(yùn)用到了收視率的時間序列預(yù)測中,提出了NAR動態(tài)神經(jīng)網(wǎng)絡(luò)對收視率的時間序列數(shù)據(jù)的建模仿真及其檢測。
1.2 時間序列
時間序列是把某種統(tǒng)計(jì)指標(biāo)的數(shù)值,根據(jù)時間順序進(jìn)行排列,得到的一組數(shù)字序列。編制和分析時間序列是時間序列預(yù)測法的基本方法。時間序列分析是根據(jù)時間序列所反映出來的發(fā)展過程、方向和趨勢,進(jìn)行曲線擬合以及參數(shù)的估計(jì),然后建立相應(yīng)的數(shù)學(xué)模型預(yù)測下一段時間可能達(dá)到的數(shù)值。一般應(yīng)用于以下兩種情況:1)決定預(yù)測變量因素的信息較少;2)具有用于構(gòu)成時間序列的足夠多的數(shù)據(jù)量。
時間序列分析是以定量預(yù)測方法為基礎(chǔ)的。應(yīng)用的原理是根據(jù)事物發(fā)展的延續(xù)性以及隨機(jī)性來擬合分析。延續(xù)性指的是根據(jù)過去的數(shù)據(jù),預(yù)測未來的發(fā)展趨勢;隨機(jī)性是指事物因?yàn)榕既灰蛩囟a(chǎn)生的不確定性,利用各種統(tǒng)計(jì)分析方法對歷史數(shù)據(jù)進(jìn)行分析處理。
非線性自回歸(Nolinear Auto-Regressive,NAR)模型是基于動態(tài)神經(jīng)網(wǎng)絡(luò)時間序列的預(yù)測模型。本文提出的預(yù)測模型是利用收視率非線性以及動態(tài)性特點(diǎn),結(jié)合神經(jīng)網(wǎng)絡(luò)所具有的“記憶”功能,因此基于動態(tài)神經(jīng)網(wǎng)時間序列分析可以很好地映射出收視率預(yù)測模型。
2.1 NAR模型的建立原理
本文設(shè)計(jì)的收視率預(yù)測模型采用基于動態(tài)神經(jīng)網(wǎng)絡(luò)時間序列原理的NAR模型。一個完整的NAR神經(jīng)網(wǎng)絡(luò)主要由輸入層、隱藏層與輸入延時層、輸出層構(gòu)成,在實(shí)際模型應(yīng)用前要設(shè)定好輸入與輸出層之間的延時數(shù),隱藏學(xué)習(xí)層的神經(jīng)元個數(shù)。其具體結(jié)構(gòu)示意圖如圖1所示。
圖1 NAR神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖1中,左邊的y(t)代表輸入數(shù)據(jù);右邊的y(t)代表輸出數(shù)據(jù);1∶7代表的是輸入與輸出的延時階數(shù);W代表連接權(quán);b代表閾值。NAR網(wǎng)絡(luò)有兩種輸出模式,一種是Parallel(Close-loop)模式,在該模式下,輸出的數(shù)據(jù)被反饋到輸入端,在隱藏層中繼續(xù)學(xué)習(xí);另一種是Series-Parallel(Open-loop)模式,該模式下,將期望輸出反饋到輸入端。NAR神經(jīng)網(wǎng)絡(luò)模型可以表示為
式中:d代表延時層的個數(shù)。由式(1)可以看出,下一個 y(t)值的大小取決為前d個y(t)的值。NAR神經(jīng)網(wǎng)絡(luò)詳細(xì)的結(jié)構(gòu)如圖2所示。
圖2 NAR神經(jīng)網(wǎng)絡(luò)詳細(xì)結(jié)構(gòu)圖
2.2 預(yù)測模型搭建流程
NAR模型對某電視頻道的收視率進(jìn)行預(yù)測中。其預(yù)測模型如圖3所示。
圖3 NAR模型預(yù)測流程圖
算法開始導(dǎo)入以往的歷史數(shù)據(jù),對網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)的訓(xùn)練集、驗(yàn)證集、測試集進(jìn)行設(shè)置,并設(shè)置好延時層與隱藏層的個數(shù)。接著進(jìn)行NAR網(wǎng)絡(luò)訓(xùn)練,該網(wǎng)絡(luò)采用LM(Leven?berg-Marquardt)訓(xùn)練算法進(jìn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),網(wǎng)絡(luò)性能選用誤差平方和MSE(Mean Squared Error),接著根據(jù)誤差自相關(guān)曲線,誤差曲線判定網(wǎng)絡(luò)的好壞與否,決定選擇哪個網(wǎng)絡(luò)進(jìn)行預(yù)測。最后進(jìn)行網(wǎng)絡(luò)的預(yù)測輸出及其檢測。
2.3 相關(guān)參數(shù)配置
網(wǎng)絡(luò)訓(xùn)練的數(shù)據(jù)可分為以下三類:訓(xùn)練集,即用來訓(xùn)練建立預(yù)測模型的數(shù)據(jù);驗(yàn)證集,即用來驗(yàn)證此網(wǎng)絡(luò)是否可行;測試集,即用來評估模型預(yù)測能力的數(shù)據(jù)。本文數(shù)據(jù)設(shè)置參數(shù)分別為:訓(xùn)練集70%;驗(yàn)證集15%;測試集15%。
本文采用Series-Parallel模式,由于頻道的收視率以一周為單位呈現(xiàn)著波動規(guī)律,因此延時層設(shè)置為7,隱藏層設(shè)置為5。
3.1 網(wǎng)絡(luò)可行性分析
本文研究的收視率預(yù)測采用MATLAB工具進(jìn)行預(yù)測網(wǎng)絡(luò)的模型搭建,結(jié)合動態(tài)神經(jīng)網(wǎng)絡(luò)GUI工具箱已有的時間序列工具,根據(jù)里面的建模工具搭建收視率預(yù)測模型。NAR網(wǎng)絡(luò)的預(yù)測模型效果主要通過誤差圖、誤差自相關(guān)圖進(jìn)行可視化分析。
圖4誤差圖中豎直方向較粗的線段表示測試目標(biāo)與預(yù)測輸出之間的差值,線段越少表示NAR神經(jīng)網(wǎng)絡(luò)預(yù)測的效果越好。同時結(jié)合圖5誤差自相關(guān)圖分析,誤差在lag為0的時候最大,其他情況下以不超過置信區(qū)間為佳。由圖可知,此模型誤差均在置信區(qū)間內(nèi),因此可以推測此NAR神經(jīng)網(wǎng)絡(luò)預(yù)測模型預(yù)測效果較好。
圖4 誤差圖
圖5 誤差自相關(guān)圖
3.2 預(yù)測輸出與檢測
為了驗(yàn)證此模型的預(yù)測效果,本文通過對2014年江蘇衛(wèi)視1—3月的全天收視率進(jìn)行NAR神經(jīng)網(wǎng)絡(luò)預(yù)測模型的建立,同時對其4月份的收視率進(jìn)行預(yù)測,并將預(yù)測的收視率與實(shí)際進(jìn)行比較,結(jié)果如圖6所示。由圖6可知,預(yù)測模型結(jié)果能夠較好地逼近實(shí)際收視率。
如圖7所示,收視率預(yù)測與實(shí)際差值基本都位于±0.05%之間,個別值除外,預(yù)測精度較高。證實(shí)了NAR神經(jīng)網(wǎng)絡(luò)能夠較好預(yù)測電視頻道未來的收視率。
圖6 預(yù)測與實(shí)際收視率比較圖
圖7 收視率預(yù)測與實(shí)際差值
本文采用NAR模型進(jìn)行收視率預(yù)測系統(tǒng)的建立,接著對模型進(jìn)行訓(xùn)練和測試分析,通過對未來一個月的電視頻道收視率進(jìn)行預(yù)測,預(yù)測結(jié)果與實(shí)際的收視率測試效果逼近,精度也高,證明了此預(yù)測模型的在預(yù)測中的應(yīng)用是有效的。它可為廣電、電視臺等工作人員在對電視頻道的廣告投放和節(jié)目推廣提供很大的參考價(jià)值,更好地提高了電視臺的經(jīng)濟(jì)效益。
[1]涂娟娟,劉同明.基于決策樹的電視節(jié)目收視率預(yù)測模型[J].微計(jì)算機(jī)信息,2007,23(9):227-231.
[2]張晶,白冰,蘇勇.基于貝葉斯網(wǎng)絡(luò)的電視節(jié)目收視率預(yù)測研究[J].科學(xué)技術(shù)與工程,2007,7(19):5099-5102
[3]鄔麗云,曲洲青.基于BP神經(jīng)網(wǎng)絡(luò)的收視率預(yù)測[J].中國傳媒大學(xué)學(xué)報(bào),2011,18(3):59-62
[4] YASSIN I,ZABIDI A,SALLEH M,et al.Malaysian tourism in?terest forecasting using nonlinear auto-regressive(NAR)model [C]//Proc.IEEE 3rd International Conference on System Engineer?ing and Technology.[S.l.]:IEEE Press,2013:32-36.
責(zé)任編輯:時 雯
Prediction of Audience Rating Based on Nolinear Auto-regressive(NAR)Model
XIAO Qiwei,YANG Xiuzhi
(College of Physics and Information Engineering,F(xiàn)uzhou University,F(xiàn)uzhou 350002,China)
Television rating is one of the important indicators in TV industry,and at the same time as the important basis of advertising and promoting programmes,gradually plays its important role in the increasingly competitive audio-visual market.This article based on the time series of TV audience ratings characteristics,the dynamic neural network algorithm is studied.The researcher applies the Nolinear Auto-Regressive(NAR) model to predict TV audience ratings and acquires better effect.
neuralnetwork;time series;NAR model;audience rating;prediction
TN948
A
10.16280/j.videoe.2015.04.021
2014-05-13
【本文獻(xiàn)信息】肖啟偉,楊秀芝.基于NAR模型的電視頻道收視率預(yù)測[J].電視技術(shù),2015,39(4).