連聰聰,杜儀,張輝
(中國傳媒大學(xué)理學(xué)院,北京 100024)
電影營銷因素是提升電影票房不可或缺的一個因素,積極的營銷因素對票房能夠有明顯的提升效果,為了控制發(fā)行所帶來的風(fēng)險,保證電影的投資能夠得到相應(yīng)的回報(bào),電影票房的收入預(yù)測成為一種必不可少的重要手段,對于投資方來說具有相當(dāng)實(shí)際的意義。電影是一種生命周期較短的產(chǎn)品,絕大部分票房也全是在短短上映期間產(chǎn)生,因此,通過對營銷因素的分析,做好票房的預(yù)測,才能對營銷的過程進(jìn)行調(diào)整,最終取得票房上的佳績。本文充分考慮票房特點(diǎn),基于clementine軟件建立BP神經(jīng)網(wǎng)絡(luò)模型,并對票房進(jìn)行了很好的預(yù)測。
本文樣本數(shù)據(jù)選取2011年1月初至2014年12月底公開上映的102部國產(chǎn)電影進(jìn)行分析并對票房進(jìn)行預(yù)測。
對于收集到的樣本數(shù)據(jù),本文首先對其進(jìn)行了簡單的數(shù)據(jù)分析,利用SPSS軟件對所有的類型變量做了一個頻率分析,得到結(jié)果如表1:
表1 電影類型一頻率分布表
本文所選的電影類型為:1喜劇片、2愛情片、3動作片、4驚悚片(懸疑片)、5動畫片、6魔幻片(科幻片)、7戰(zhàn)爭片、8劇情片、9傳記片(歷史片)、10家庭片。從表1可以發(fā)現(xiàn),電影的第一類型主要為愛情片,其次是劇情片、動作片、喜劇片,而魔幻片、動畫片、戰(zhàn)爭片基本沒有,這反映了在國內(nèi)愛情、喜劇、動作電影更占主流,較受歡迎,而像戰(zhàn)爭題材、動畫片則相對產(chǎn)片量較少,同時也可以看出國內(nèi)的魔幻片數(shù)量極度緊缺,與好萊塢的大制作相比相差甚遠(yuǎn)。
首先為了預(yù)防因素之間的互相干擾,探討因素之間的關(guān)系,本文利用SPSS軟件對各個因素變量之間做了一個相關(guān)分析,研究各個因素之間是否存在某種依存關(guān)系,結(jié)果如表2:
表2 各因素相關(guān)性
從表2可以看出,導(dǎo)演與視頻物料的支數(shù)相關(guān)性稍微較大,為0.409,但從實(shí)際來看,導(dǎo)演影響力與視頻物料支數(shù)關(guān)系甚小,從而基本可以忽略其關(guān)系;其次為導(dǎo)演影響力與電影得分的相關(guān)性,其他變量的相關(guān)性皆小于0.3。從表格可以看出整體各個連續(xù)型因素之間的相關(guān)性并不顯著,并不存在明顯的依存關(guān)系,對于之后的分析影響并不大,可進(jìn)行下一步。
人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)由眾多可調(diào)的神經(jīng)元連接權(quán)值連接而成,人工神經(jīng)網(wǎng)絡(luò)作為一種并行分散的處理模式,具備大規(guī)模并行處理、分布式的信息存儲以及良好的自組織自學(xué)習(xí)能力等特點(diǎn)。
BP算法作為人工神經(jīng)網(wǎng)絡(luò)的一種相對典型的學(xué)習(xí)算法,其拓?fù)浣Y(jié)構(gòu)組成主要包括一個輸入層、一個或多個隱含層、一個輸出層。
如下為基本的三層BP人工網(wǎng)絡(luò)結(jié)構(gòu):
圖1
4.2.1 數(shù)據(jù)指標(biāo)選取
本文總結(jié)選取出了8個對電影票房有影響的營銷因素,對于電影的廣告費(fèi)用等數(shù)據(jù)不可獲得的變量本文則不進(jìn)行選擇。具體選出的這八個變量為:電影類型、電影檔期、導(dǎo)演、第一主演微博粉絲數(shù)、第一主演所發(fā)電影相關(guān)微博的轉(zhuǎn)發(fā)量、視頻物料、IP電影、電影評分。
4.2.2 基于BP模型的電影票房預(yù)測
(1)確定網(wǎng)絡(luò)結(jié)構(gòu)
本文的輸入變量分別是電影第一類型、電影第二類型、電影檔期、電影得分、導(dǎo)演影響力、演員微博粉絲數(shù)、轉(zhuǎn)發(fā)量、IP電影以及視頻物料的支數(shù),對于類型變量,軟件對其進(jìn)行自動處理成二分變量,最后變成輸入節(jié)點(diǎn)數(shù)為28個。輸出變量為電影票房的值,僅有一個神經(jīng)元。神經(jīng)網(wǎng)絡(luò)的隱藏層介于輸入層與輸出層之間,本文選擇一個隱層。
(2)權(quán)值調(diào)整
對于輸出層的輸出值,如果不是預(yù)期中的期望值,則會反向的對網(wǎng)絡(luò)不斷地進(jìn)行修正,逐層修正各個連接的權(quán)值,并完成誤差的修正過程。通過不停的修正,最后準(zhǔn)確率也不斷提高,直到達(dá)到期望值所在范圍才終止學(xué)習(xí)。
(3)樣本數(shù)據(jù)分割
為了得到相對準(zhǔn)確的誤差估計(jì),建立Partition節(jié)點(diǎn),并連接到數(shù)據(jù)流上的超節(jié)點(diǎn)上,選取70%為訓(xùn)練樣本集,30%作為檢驗(yàn)樣本集。本文在神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)的Expert選項(xiàng)中選擇一個隱藏層,該層設(shè)置隱節(jié)點(diǎn)個數(shù)10個。
(4)預(yù)測結(jié)果
本文的輸出變量是數(shù)值型變量,預(yù)測精度的方法是:
其中,表示第i個樣本實(shí)際值與模型預(yù)測值的誤差絕對值;Ymax表示最大的輸出變量實(shí)際值,Ymin表示最小的輸出變量的實(shí)際值。本文估計(jì)的預(yù)測精度為99.926%,該數(shù)據(jù)是基于訓(xùn)練樣本計(jì)算的,結(jié)果比較樂觀。如表3所示,本文原本輸入節(jié)點(diǎn)為8個,對其中的分類變量進(jìn)行轉(zhuǎn)換為多個數(shù)值型變量,共有28個輸入節(jié)點(diǎn)。除此之外,有1個隱層、10個隱節(jié)點(diǎn)、1個輸出節(jié)點(diǎn)。
表3 分析結(jié)果輸出
變量的敏感程度如表4所示。
從表4的預(yù)測結(jié)果可以看出,導(dǎo)演影響力是對票房影響最大的因素,其次為電影類型2以及檔期,而視頻物料支數(shù)及微博的轉(zhuǎn)發(fā)量就顯得不那么顯著。
表4 各因素敏感度
摘取分析結(jié)果中的一部分預(yù)測結(jié)果如表5所示。其中$為預(yù)測值,預(yù)測值為標(biāo)準(zhǔn)化后的結(jié)果,通過(Ymax-Ymin)+Ymin還原。通過表5中可以看出,整體預(yù)測的準(zhǔn)確性較高,誤差較小。
表5 原始值與預(yù)測值對比
(5)模型調(diào)整
本文的精度達(dá)到99%以上,可能存在過度擬合的情況,為了克服過度擬合問題,本文在訓(xùn)練樣本集中再抽取50%的樣本訓(xùn)練模型。預(yù)測結(jié)果顯示預(yù)測精度為86.508%,相比之前的精度,更加符合實(shí)際,得到新的敏感度如表6所示。
此外為了研究隱層節(jié)點(diǎn)數(shù)對預(yù)測精度的影響,本文對隱節(jié)點(diǎn)的個數(shù)進(jìn)行調(diào)整,分別設(shè)置了5、10、15、20、25這5種,發(fā)現(xiàn)在多次試驗(yàn)中,當(dāng)節(jié)點(diǎn)數(shù)為15時,預(yù)測精度較高,達(dá)到89.741%,其敏感度如表7所示。
表6 各因素敏感度
表7 各因素敏感度
對比表4、表6、表7,可以發(fā)現(xiàn)導(dǎo)演影響力、電影類型2以及電影檔期這三種因素都位居前三,也就是說模型的調(diào)整對于該三個變量的敏感度影響都較小,意味著該三個變量對于票房的營銷效果確實(shí)顯著;而IP電影則在模型調(diào)整過程中都顯現(xiàn)了較低的敏感度,說明是否為IP電影其實(shí)對于電影票房影響不大;相比之下其他變量的敏感度都有較大變動,不夠顯著。
(6)預(yù)測評估
本文以相對誤差作為電影票房預(yù)測的一個衡量標(biāo)準(zhǔn),相對誤差的公式如下:
其中box為電影票房的實(shí)際值,Nbox為票房的預(yù)測值。選取的是訓(xùn)練樣本集中再抽取50%的樣本訓(xùn)練模型、隱層節(jié)點(diǎn)為15個時得出的預(yù)測值與實(shí)際值的對比。通過計(jì)算得到表8:
表8 相對誤差值
從以上結(jié)果可以看出,本文的平均相對誤差值在74.3%左右,對比參考閱讀的其他文獻(xiàn)的預(yù)測平均相對誤差值,本文擁有較好的預(yù)測精度。
綜上來說,BP神經(jīng)網(wǎng)絡(luò)模型對電影票房的預(yù)測精度還是相對較高的,具有一定的使用價值。通過本文的分析預(yù)測,可以知道導(dǎo)演的影響力對于電影票房來說起著至關(guān)重要的作用,明星的微博粉絲量其實(shí)不一定對于電影宣傳有多大作用,反而應(yīng)該是明星的互動性;本文預(yù)測的票房數(shù)據(jù)與實(shí)際值差別也較小,相對誤差74.3%,預(yù)測精度將近90%,整體來說,本文模型較為合理,對于電影的票房預(yù)測有著一定的實(shí)用性,有利于制片方、宣傳方等在進(jìn)行電影各階段工作的時候進(jìn)行合理的評估。
本文立足于當(dāng)前中國內(nèi)地的電影市場,結(jié)合當(dāng)下社會的熱門話題,提出一種基于BP神經(jīng)網(wǎng)絡(luò)的票房預(yù)測模型,將電影檔期、電影類型、導(dǎo)演影響力等營銷相關(guān)的因素進(jìn)行量化,對票房進(jìn)行預(yù)測。本文模型的預(yù)測結(jié)果精度相對較高,而相對誤差較小,預(yù)測效果較為理想。
通過這次的模型建立及實(shí)證研究,我們分析出對電影票房的各種影響因素,總結(jié)出以下幾點(diǎn)建議:
導(dǎo)演對票房的影響有著最為重要的作用,制片方在電影開拍前,選擇導(dǎo)演的時候應(yīng)當(dāng)選擇具有相對有票房號召力的導(dǎo)演,減小投資帶來的風(fēng)險。
對于視頻物料的支數(shù),本文的分析結(jié)果顯示,還是比較顯著的。這也就意味著足夠多的視頻物料會越發(fā)地吸引觀眾進(jìn)去影院觀影。
[1]王大勇,艾蘭.電影營銷實(shí)務(wù)[M].北京:中國民主法制出版社,2011.
[2]王錚,徐敏.電影票房的影響因素分析-基于Logit模型的研究[J].經(jīng)濟(jì)問題探索,2013(11):96-102.
[3]杜思源.電影票房的影響因素分析——基于中國大陸電影市場[J].中國商貿(mào),2013(10):184-187.
[4]鄭堅(jiān),周尚波.基于神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測建模[J].計(jì)算機(jī)應(yīng)用,2014(3):742-748.
[5]楊威.基于微博數(shù)據(jù)的電影票房預(yù)測模型研究[J].電子世界,2014(21):13 -16.
[6]尹一伊.影響中國電影經(jīng)濟(jì)成功的因素分析-從票房預(yù)測模型看中國電影新發(fā)展[J].當(dāng)代電影,2013(7):18 -22.
中國傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版)2015年4期