郭苗苗
摘要:電影行業(yè)是我國文化產(chǎn)業(yè)的核心,而電影票房收入影響著電影行業(yè)以及我國文化產(chǎn)業(yè)的持續(xù)發(fā)展,因此對電影票房的預測就顯得尤為重要。文章以2013年3月至2018年12月全國電影票房收入為數(shù)據(jù)基礎,建立了全國電影票房收入的自回歸移動平均(ARIMA)模型,并對2019年1月至2019年10月我國電影票房收入進行了預測。
Abstract: The film industry is the core of China's cultural industry, and the movie box office income affects the film industry and the sustainable development of China's cultural industry. Therefore, the prediction of the box office of the movie is particularly important. Based on the national box office receipts from March 2013 to December 2018, this paper establishes the autoregressive moving average (ARIMA) model of national box office receipts, and the box office receipts of Chinese movies from January 2019 to October 2019. A prediction was made.
關鍵詞:ARIMA模型;電影票房收入;預測
Key words: ARIMA model;movie box office income;forecast
中圖分類號:J943 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1006-4311(2019)20-0258-04
0 ?引言
隨著人民生活水平的不斷提高,電影已經(jīng)成為人們娛樂消費的一種新方式。與此同時作為我國文化產(chǎn)業(yè)的重要組成部分,電影行業(yè)在良好的政策支持下取得了飛速發(fā)展。2010年國務院提出要將文化產(chǎn)業(yè)發(fā)展為國民經(jīng)濟支柱產(chǎn)業(yè)。2017年《中華人民共和國電影產(chǎn)業(yè)促進法》的實施標志著我國電影行業(yè)立法的突破,也是我國文化體制改革的巨大進步。據(jù)統(tǒng)計2018年共上映400多部新電影,全國電影總票房收入超過593億元。電影行業(yè)的快速發(fā)展推動了投融資方式的不斷拓展,影片預售融資、版權質押、電影版權資產(chǎn)證券化等融資方式不斷出現(xiàn)[1]。但電影行業(yè)作為高風險的文化行業(yè),其投資的市場風險巨大。我國是全球第3大電影生產(chǎn)國,目前我國電影市場上只有少數(shù)電影投資能夠盈利,大部分的電影項目難以收回成本[2]。電影票房作為一部電影的經(jīng)濟收入,在一定程度上代表了該電影投資項目是否成功,因此電影票房收入的預測是確保電影發(fā)行投資回報、控制發(fā)行風險的重要手段,對于電影項目投資決策有著重要的實際意義。同時電影票房還影響著其衍生品產(chǎn)業(yè)的發(fā)展?jié)摿?,是電影產(chǎn)業(yè)持續(xù)發(fā)展的動力源泉;從文化效益來看,電影票房代表著文化傳播的社會效益,同時也決定著電影產(chǎn)業(yè)的經(jīng)濟效益和文化效益的綜合貢獻水平[3]。
關于電影票房的研究開始于20世紀80年代,其中巴瑞·李特曼提出的經(jīng)典的電影票房研究模型奠定了電影票房研究的基本模型和方法[4]。近年來,有學者基于網(wǎng)絡搜索引擎的數(shù)據(jù)研究了其對電影票房的影響。Kulkarni等人研究發(fā)現(xiàn)上映之前關于影片的網(wǎng)絡搜索存在一定的規(guī)律性,并且加入網(wǎng)絡搜索這一影響因素可以提高預測精度[5]。王煉建立了基于網(wǎng)絡探索的票房預測模型,證明了網(wǎng)絡搜索量以及增長趨勢都能預測到該影片的首映周票房[6]。大數(shù)據(jù)技術的發(fā)展解決了電影行業(yè)相關數(shù)據(jù)獲取方式少,獲取難度大和數(shù)據(jù)量小等問題,因此對電影票房預期的研究也越來越多。王文文選擇在大數(shù)據(jù)條件下使用社會化媒體中的電影資料數(shù)據(jù)來分析票房收取,結果顯示社會媒體的評論數(shù)據(jù)在電影上映一周后對票房有著正向的影響[7]。李雪研究了網(wǎng)絡視頻社會化分享對電影票房的影響,結果顯示消費者將預告片在社會化媒體上分享的次數(shù)越多,票房收入越高[8]。汪旭暉、王軍主要對我國電影“高票房低口碑”現(xiàn)象做出了解釋,其根本原因在于電影在追求視覺效果的同時忽視了內(nèi)容的鍛造,影片文化內(nèi)涵的缺失[9]。王錦慧主要對我國電影版權商業(yè)價值進行了研究。研究結果表明,在國內(nèi)電影高速發(fā)展階段,檔期的重要性,票房收入開始分散,這有利于我國電影產(chǎn)業(yè)的進一步發(fā)展[10]。王崢、許敏利用Logit模型驗證了明星名導效應在票房上呈現(xiàn)邊際遞減[11]。戴建華、鄭意凡基于2012至2016年上映的電影票房數(shù)據(jù)研究了電影票房的延續(xù)性問題,研究發(fā)現(xiàn)電影導演和主演曾經(jīng)的電影成績有著延續(xù)性,但系列電影的票房收入未表現(xiàn)出延續(xù)性[12]。鄭堅基于電影票房預測精度不高、缺乏實際應用價值等缺陷提出了基于神經(jīng)網(wǎng)絡的電影票房預測模型[13]。
上述研究大多都研究了影響電影票房收入的因素,并在此基礎上對電影票房收入進行了預測。但是由于影響電影票房的因素多種多樣,上述預測模型中的諸多影響因素在電影上映之前并不能獲取,并且很多影響因素難以量化,電影票房中存在不能用客觀因素解釋的影響因素,因此該類預測存在著預測精度不高的問題,這不僅會加劇投資者的投資風險,更會對我國電影行業(yè)的長期發(fā)展造成不利的影響。電影票房收入作為典型的時間序列,其自身包含著大量的信息,并且存在著一定的趨勢性和周期性,因此本文選取2013年3月至2018年12月的電影票房收入這一時間序列,建立電影票房收入的ARIMA模型,對電影票房收入進行預測。
1 ?ARIMA模型及建模步驟
ARIMA模型即自回歸移動平均模型,是一種著名的時間序列預測模型,該模型將預測對象的觀測值按照時間進行排序形成一個隨機序列,該序列隨著時間的變化而變化,其可以通過自回歸移動平均過程來生成,即該時間序列可以由其自身的過去值或滯后值和隨機干擾項來解釋。ARIMA模型可以表示為SARIMA(p,d,q)(P,D,Q)s,其中p為自回歸系數(shù),q為移動平均系數(shù),P為季節(jié)性自回歸系數(shù),Q為季節(jié)性移動平均階數(shù),d為非平穩(wěn)時間序列轉換為平穩(wěn)時間序列時所做的差分階數(shù),D為季節(jié)性差分階數(shù),s為季節(jié)周期[14]。
ARIMA模型的建模步驟主要包括:①平穩(wěn)性檢驗和模型識別。首先對所觀察的時間序列的平穩(wěn)性進行檢驗,若該時間序列為非平穩(wěn)時間序列,需要根據(jù)其序列特點進行平穩(wěn)化,最終對平穩(wěn)化后的時間序列根據(jù)其自相關圖(ACF)和偏自相關圖(PACF)識別出模型形式[15]。②參數(shù)估計。采用極大似然法對模型進行初步的參數(shù)估計,此時樣本容量最好在50以上。③診斷與檢驗。所得參數(shù)必須使用t檢驗來檢測其顯著性,同時殘差項必須通過Q檢驗,即殘差序列必須近似為一個白噪聲過程。④模型預測。將模型預測值與觀測到的實際值進行比較,檢驗模型的預測效果。
2 ?模型構建
首先本文采用2013年3月至2018年12月共70組全國電影票房收入的歷史數(shù)據(jù)作為實驗研究的基礎,建立全國電影票房收入模型。其次預測2013年3月至2018年12月全國電影票房收入的數(shù)據(jù),與2013年3月至2018年12月全國電影票房收入實際值進行比較,檢驗模型的擬合程度。最終使用此模型對2019年1月至10月票房收入進行預測。
2.1 平穩(wěn)性檢驗
將2013年3月至2018年12月的全國電影票房收入繪制時間序列圖,如圖1所示??梢钥闯鲈搱D具有一定的季節(jié)性,全國電影票房收入時間序列不平穩(wěn)。為了進一步檢驗平穩(wěn)性,對該時間序列進行ADF單位根檢驗,計算結果如表1所示,在1%、5%、10%的顯著性水平下,t值均大于單位根檢驗的臨界值,且p值為0.8989,大于顯著性水平0.05,因此進一步證明該序列為非平穩(wěn)時間序列。
2.2 序列平穩(wěn)化
對原始的全國電影票房收入時間序列進行一次差分和一階12步季節(jié)性差分,所得結果的時序圖如圖2所示,可以看出該時序圖無明顯趨勢性,并且在零附近上下波動,差分后的全國電影票房收入時間序列具有平穩(wěn)性。
2.3 模型初選
繪制差分后時間序列的自相關圖(ACF)和偏自相關圖(PACF),如圖3所示。自相關圖和偏自相關圖均呈現(xiàn)拖尾特征。自相關圖中,1、3、4階顯著地不為0,則q取值可為1、3或4。12階函數(shù)值顯著不為0,24階函數(shù)值在置信區(qū)間內(nèi),因此Q取值為1。在偏自相關圖中1階和3階顯著不為0,則p取1或者3。12階函數(shù)值在置信區(qū)間內(nèi),因此P取0,且d=1,D=1,s=12?;谝陨戏治觯梢缘玫饺缦?個備選模型,分別為ARIMA(1,1,1)(0,1,1)12、ARIMA(1,1,3)(0,1,1)12、ARIMA(1,1,4)(0,1,1)12、ARIMA(3,1,1)(0,1,1)12、ARIMA(3,1,3)(0,1,1)12、ARIMA(3,1,4)(0,1,1)12。
2.4 模型確定和參數(shù)估計
對備選模型進行參數(shù)估計,得到6個備選模型的AIC值和參數(shù)估計值,各個模型的AIC值如表2所示,根據(jù)赤遲信息量準則,最終選定模型為ARIMA(1,1,1)(0,1,1)12。該模型參數(shù)估計結果如表3所示。
2.5 模型檢驗和預測
對ARIMA(1,1,1)(0,1,1)12的殘差進行檢驗,結果如圖4所示,殘差序列的自相關函數(shù)值均在置信區(qū)間內(nèi),因此認為模型ARIMA(1,1,1)(0,1,1)12的殘差序列為白噪聲序列,ARIMA(1,1,1)(0,1,1)12模型通過檢驗。
基于ARIMA(1,1,1)(0,1,1)12模型,對2013年3月至2018年12月的數(shù)據(jù)采取靜態(tài)預測的方式滾動的進行向前一步預測,得到的結果如圖5所示,擬合值和觀測值之間存在一定差距,但差距較小,因此模型的擬合程度總體上較好。繼續(xù)使用該模型,采用動態(tài)預測的方式對2019年1月至10月全國電影收入進行預測,得到結果如圖6所示??梢钥闯?,我國電影票房收入在2019年2月左右會出現(xiàn)大幅上漲,2019年1月至10月整體的電影票房收入較2018年可能有所回落。
3 ?結論
電影票房收入是衡量一個電影項目投資成功與否的重要標志,它不僅僅影響著電影投資者,更是對我國電影行業(yè)甚至文化行業(yè)的持續(xù)發(fā)展有著重要的影響。本文基于2013年3月至2018年12月全國電影票房收入數(shù)據(jù),建立了全國電影票房收入的ARIMA模型,經(jīng)過模型檢驗和擬合,本文選取的最優(yōu)模型為ARIMA(1,1,1)(0,1,1)12,該模型的預測數(shù)據(jù)與全國電影票房收入的真實值相差較小,擬合程度好。綜上所述,該模型在預測全國電影票房收入方面效果較好,基于該模型對全國電影票房收入進行預測,可以為我國電影行業(yè)的投資和發(fā)展提供一定的理論依據(jù)。但是因為我國電影票房數(shù)據(jù)存在著數(shù)據(jù)量少,數(shù)據(jù)統(tǒng)計不完全的情況等問題,本文預測存在一定的局限性,在今后的研究中,可以在拓展數(shù)據(jù)量的基礎上建立更為合適的模型,來提高預測精度。
參考文獻:
[1]王錦慧,卜彥芳,李念.華萊塢電影票房預測模型的實證分析[J].新聞大學,2016(01):9-14,145.
[2]王艷,金天星.市場營銷與風險評估雙重視角下的電影票房預測——以中影集團推出電影票房量化分析系統(tǒng)為例[J].中國電影市場,2012(03):11-12.
[3]姚武華.中國內(nèi)地市場國產(chǎn)電影票房特征及其影響因素研究——基于PLS模型的實證分析[J].價格理論與實踐,2018(02): 83-86.
[4]Litman B, Kohl L. Predicting Success of Theatrical Movies: The 80s Experience[J]. Journal of Media Economics, 1989, 2: 35-50.
[5]Kulkarni G, Kannan P, Moe W. Using online search data to forecast new product sales[J]. Decision Support Systems, 2012, 52(3): 604-611.
[6]王煉,賈建民.基于網(wǎng)絡搜索的票房預測模型——來自中國電影市場的證據(jù)[J].系統(tǒng)工程理論與實踐,2014,34(12):3079-3090.
[7]王文文,周澍民.社會化媒體對電影票房的預測價值研究[J].新聞傳播,2013(12):254-255.
[8]李雪,伍晨.網(wǎng)絡視頻的社會化分享對國產(chǎn)電影票房影響的實證研究[J].技術經(jīng)濟,2016,35(01):103-109.
[9]汪旭暉,王軍.網(wǎng)絡口碑如何影響電影票房——中國電影“高票房低口碑”現(xiàn)象反思[J].湖南師范大學社會科學學報,2015, 44(02):152-160.
[10]王錦慧,晏思雨.中國電影版權商業(yè)價值評估模型研究[J]. 當代電影,2015(11):73-80.
[11]王錚,許敏.電影票房的影響因素分析——基于Logit模型的研究[J].經(jīng)濟問題探索,2013(11):96-102.
[12]戴建華,鄭意凡.電影票房表現(xiàn)的延續(xù)性研究[J].現(xiàn)代傳播(中國傳媒大學學報),2018,40(08):124-129.
[13]鄭堅,周尚波.基于神經(jīng)網(wǎng)絡的電影票房預測建模[J].計算機應用,2014,34(03):742-748.
[14]解建倉,王玥,雷社平,等.基于ARIMA模型的大壩安全監(jiān)測數(shù)據(jù)分析與預測[J].人民黃河,2018,40(10):131-134.
[15]賀簫楠,宋曉輝,朱鑫.基于ARIMA模型的洛陽市手足口病發(fā)病率預測[J].現(xiàn)代預防醫(yī)學,2019,46(03):403-406.