尹聰敏 竹翠 趙楓朝
摘 要:目前針對(duì)早期電影票房預(yù)測(cè)的研究較少,且預(yù)測(cè)精度不高。通過對(duì)中國(guó)電影票房市場(chǎng)的研究,發(fā)現(xiàn)隨著IP電影熱的興起,熱門小說IP改編成為電影票房的一大賣點(diǎn)。研究基于IP品質(zhì)的影響因子對(duì)電影票房預(yù)測(cè)的影響,選取電影票房預(yù)測(cè)中的3種經(jīng)典模型加以驗(yàn)證,分別是多元線性回歸模型、支持向量機(jī)模型、BP神經(jīng)網(wǎng)絡(luò)模型。通過對(duì)比實(shí)驗(yàn)得出增加IP品質(zhì)這一影響因子可使模型的R平方值得到提高。
關(guān)鍵詞:電影票房預(yù)測(cè);多元線性回歸;支持向量機(jī);BP神經(jīng)網(wǎng)絡(luò);IP品質(zhì)
DOIDOI:10.11907/rjdk.181174
中圖分類號(hào):TP301
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2018)010-0060-04
英文摘要Abstract:There are few studies on the prediction of the early movie box-office revenue,and the prediction accuracy is not high. Through the research of Chinese movie box-office market,we find that IP(Intellectual Property,IP) adaptation is a major selling point of movie box office.Therefore,we put forward the influence of IP quality factors on movie box-office prediction.Three classic models of movie box-office prediction are selected to be verified,which are multiple linear regression model,support vector machine model and BP neural network model.Through comparative experiments,it is concluded that the R square of the modelsare increased respectively by adding the influence factor of IP quality.
英文關(guān)鍵詞Key Words:movie box-office prediction;multiple linear regression ;support vector machine ;BP neural network ;IP quality
0 引言
不同國(guó)家和地區(qū)之間有著不同文化,而電影已成為文化交流的重要媒介。不僅如此,優(yōu)秀的電影能通過一則故事啟發(fā)人們對(duì)生活的思考,豐富人們的精神世界[1]。電影投資機(jī)構(gòu)迫切希望利用高票房為電影贏得口碑,并獲取可觀利潤(rùn)。然而,要評(píng)判一個(gè)電影是否具有高票房的潛質(zhì),則需要對(duì)電影進(jìn)行投資風(fēng)險(xiǎn)評(píng)估。因此,電影票房預(yù)測(cè)對(duì)于電影投資決策具有重要意義[2]。 在業(yè)界,根據(jù)所選自變量數(shù)據(jù)的性質(zhì),將電影票房預(yù)測(cè)方法分為兩類:早期預(yù)測(cè)與實(shí)時(shí)預(yù)測(cè)。早期預(yù)測(cè)所需數(shù)據(jù)來(lái)自于電影本身,實(shí)時(shí)預(yù)測(cè)所需數(shù)據(jù)則與電影無(wú)關(guān),而是來(lái)自網(wǎng)絡(luò)社交媒體對(duì)電影的評(píng)價(jià)[3]。本文主要研究早期電影票房預(yù)測(cè),由于針對(duì)早期電影票房預(yù)測(cè)的研究相對(duì)較少,且預(yù)測(cè)精度不高,本文通過對(duì)中國(guó)電影票房市場(chǎng)的調(diào)查,發(fā)現(xiàn)隨著IP(Intellectual Property)電影熱的興起,根據(jù)熱門小說IP改編的電影是高票房的重要保障之一,因此將IP品質(zhì)因子作為電影票房預(yù)測(cè)的一個(gè)新加變量進(jìn)行早期電影票房預(yù)測(cè)研究。
1 相關(guān)研究
上世紀(jì)80年代,西方學(xué)者開始進(jìn)行電影票房相關(guān)問題的研究,他們不斷進(jìn)行實(shí)驗(yàn),希望找出影響電影票房的因素,進(jìn)而指導(dǎo)電影投資與拍攝。此后,很多學(xué)者也進(jìn)行了電影票房預(yù)測(cè)研究,并取得了一些成果[4]。西方學(xué)者對(duì)電影票房的預(yù)測(cè)研究基本上形成了一套體系,但是精度不高,缺乏實(shí)際應(yīng)用價(jià)值[5]。
Barry Litman[6]的電影票房預(yù)測(cè)模型在引入新增因素 MAPP、奧斯卡獲獎(jiǎng)情況基礎(chǔ)上,利用回歸分析,經(jīng)過多次實(shí)驗(yàn)得到一個(gè)基于多元線性回歸的電影票房預(yù)測(cè)模型。然而,該模型有很大的局限性,Barry采用電影租金收入代替電影票房,雖然電影票房與租金收入有一定關(guān)系,但仍存在差距。此后,Barman等[7]提出基于BP神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測(cè)方法,但其僅把電影類型作為自變量輸入,并且使用簡(jiǎn)單的布爾型數(shù)值表示輸入輸出結(jié)果,這在實(shí)際應(yīng)用時(shí)存在很大問題,僅提供了理論指導(dǎo)。近年來(lái),很多學(xué)者也針對(duì)該領(lǐng)域進(jìn)行了大量研究,如趙偉[8]提出一種基于粗糙集與支持向量機(jī)(Support Vector Machine,SVM)的電影票房預(yù)測(cè)模型,通過集合粗糙集強(qiáng)大的數(shù)據(jù)處理能力與支持向量機(jī)的分類機(jī)理,設(shè)計(jì)出基于粗糙集的支持向量機(jī)。然而由于粗糙集理論尚存在缺陷,該方法在嚴(yán)格的數(shù)學(xué)證明方面仍有待進(jìn)一步研究。
通過調(diào)研發(fā)現(xiàn),國(guó)內(nèi)針對(duì)電影票房預(yù)測(cè)的研究起步較晚,相關(guān)文獻(xiàn)較少。由于電影票房的影響因子很多,且沒有統(tǒng)一的量化標(biāo)準(zhǔn),在獲取電影數(shù)據(jù)方面也有較大難度,從而使研究難度增大,導(dǎo)致電影票房預(yù)測(cè)研究進(jìn)展相對(duì)緩慢。本文通過對(duì)中國(guó)電影票房市場(chǎng)的研究,發(fā)現(xiàn)近幾年根據(jù)熱門小說IP改編的電影是電影票房的一大保障,因此增加IP品質(zhì)作為電影票房預(yù)測(cè)的新加因子,以提高早期電影票房預(yù)測(cè)精度。
2 模型選取
用于進(jìn)行電影票房預(yù)測(cè)的模型有多種,近年來(lái)隨著神經(jīng)網(wǎng)絡(luò)的興起,學(xué)術(shù)界多采用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行電影票房預(yù)測(cè)。本文選取3種最具代表性的預(yù)測(cè)模型,分別為線性回歸模型、支持向量機(jī)模型和BP神經(jīng)網(wǎng)絡(luò)模型。
通過觀察圖1可知,圖中有(d+l+1)q+l個(gè)參數(shù)需要確定:輸入層到隱藏層的d*q個(gè)權(quán)值、隱藏層到輸出層的q*l個(gè)權(quán)值與l個(gè)輸出層神經(jīng)元閾值。BP是一個(gè)迭代學(xué)習(xí)算法,在迭代的每一輪中采用廣義感知機(jī)學(xué)習(xí)規(guī)則對(duì)參數(shù)進(jìn)行更新估計(jì)。
BP算法是一種最有效的多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法。其基本思想為:在前饋網(wǎng)絡(luò)中,輸入信號(hào)經(jīng)輸入層輸入,通過隱層計(jì)算后由輸出層輸出,輸出值與標(biāo)記值進(jìn)行比較,若有誤差,將誤差由輸出層向輸入層反向傳播。在該過程中,利用梯度下降算法對(duì)神經(jīng)元權(quán)值進(jìn)行調(diào)整。
3 變量研究
西方學(xué)術(shù)界對(duì)電影票房影響因素的研究起步較早,研究結(jié)果表明,演員、導(dǎo)演、檔期、發(fā)行商、分級(jí)、獲獎(jiǎng)、制作成本等因素都會(huì)對(duì)電影票房造成影響。我國(guó)電影產(chǎn)業(yè)起步相對(duì)較晚,發(fā)展尚不成熟,在參考西方學(xué)術(shù)界的研究結(jié)果時(shí)要綜合考慮我國(guó)電影產(chǎn)業(yè)現(xiàn)狀。由于中西方文化差異以及不同的管理制度,在變量選取方面,要結(jié)合我國(guó)電影產(chǎn)業(yè)實(shí)際情況進(jìn)行取舍。
3.1 因變量選取
本文因變量為電影票房,電影票房是一部電影放映期間的累計(jì)總收入。電影票房相關(guān)數(shù)據(jù)來(lái)源于電影票房數(shù)據(jù)庫(kù),本文主要獲取年度票房中的電影數(shù)據(jù)。
3.2 自變量選取
本文選取以下幾個(gè)因素作為解釋變量。
(1) 主演和導(dǎo)演。由于對(duì)明星效應(yīng)的量化比較模糊,因此本文參考比較權(quán)威的量化標(biāo)準(zhǔn),如Litman[6]提出的根據(jù)主演和導(dǎo)演是否獲得奧斯卡等權(quán)威獎(jiǎng)項(xiàng),設(shè)定虛擬變量以衡量明星效應(yīng)。在不同國(guó)家有不同的獎(jiǎng)項(xiàng)劃分標(biāo)準(zhǔn),根據(jù)獲獎(jiǎng)重量級(jí)別將導(dǎo)演和主演劃分為3類。
(2) 電影類型。不同電影類型有不同的受眾人群,本文根據(jù)業(yè)內(nèi)通用標(biāo)準(zhǔn)對(duì)電影進(jìn)行分類。在進(jìn)行變量處理時(shí),電影類型中含有愛情、動(dòng)作、喜劇、科幻冒險(xiǎn)時(shí)變量設(shè)為1,否則為0[13]。
(3)上映檔期。上映檔期決定了人們是否有充裕的時(shí)間觀看。作為影響票房成敗的一個(gè)重要因素,目前國(guó)內(nèi)電影放映時(shí)間被分為賀歲檔、五一檔、暑期檔等多個(gè)檔期。在這些檔期內(nèi),影迷觀影活動(dòng)會(huì)相對(duì)集中。因此,在檔期處理方面,熱門檔期取值為1,否則取值為0[13]。
(4)出品地區(qū)。由于進(jìn)口電影在大陸市場(chǎng)受歡迎程度較高,出品地區(qū)對(duì)大眾選擇也產(chǎn)生一定影響。因此,在出品地區(qū)方面,國(guó)內(nèi)(包括港澳臺(tái))出品取0,其余取1[13]。
(5)IP改編。近年來(lái)IP改編熱潮持續(xù)不斷[14],優(yōu)質(zhì)IP為影視劇改編提供了高質(zhì)量?jī)?nèi)容,并且具有大量粉絲基礎(chǔ),所以根據(jù)IP改編的電影更容易產(chǎn)生高票房[15]。因此,根據(jù)暢銷小說改編的電影變量值取1,非改編電影即原創(chuàng)劇取0。
3.3 IP品質(zhì)
2015年,我國(guó)電影票房超過440億元,其中IP改編的電影票房為85.87億元,較2014年增長(zhǎng)了121%,占2015年國(guó)產(chǎn)片票房的36.1%,比2014年的24.04%高出12個(gè)百分點(diǎn)。在2015年票房前10名中,IP電影占7部,其中票房過10億的有4部,說明IP改編在很大程度上影響著票房收入[16]。但是如何定義一個(gè)IP的影響力呢?本文將其稱為IP品質(zhì)。考慮將IP品質(zhì)作為影響電影票房的一個(gè)新加因素,但由于條件限制,初步選取影響IP品質(zhì)的因素為:①熱門小說IP改編的知名度,用W表示;②相同IP系列電影的平均評(píng)分,用Avg表示。
4 實(shí)驗(yàn)驗(yàn)證
本文用于實(shí)驗(yàn)的電影數(shù)據(jù)來(lái)源于電影票房數(shù)據(jù)庫(kù)(http://58921.com/alltime)。電影票房數(shù)據(jù)庫(kù)可提供全國(guó)各院線包括電影票房在內(nèi)的多項(xiàng)權(quán)威數(shù)據(jù),本文選取2015-2017年間的546部電影在中國(guó)內(nèi)地上映的票房及電影數(shù)據(jù),作為本次實(shí)驗(yàn)數(shù)據(jù)。在實(shí)驗(yàn)?zāi)P瓦x擇方面,本文選取3種具有代表性的模型:多元線性回歸模型、支持向量機(jī)模型、BP神經(jīng)網(wǎng)絡(luò)模型,主要調(diào)用機(jī)器學(xué)習(xí)中的sklearn庫(kù)構(gòu)建不同模型進(jìn)行實(shí)驗(yàn),采用70%作為訓(xùn)練數(shù)據(jù)集,30%作為測(cè)試數(shù)據(jù)集。在回歸結(jié)果度量中,選用可解釋方差(R平方)的回歸評(píng)分函數(shù)作為評(píng)價(jià)指標(biāo)。
通過實(shí)驗(yàn)得到如圖2所示的回歸預(yù)測(cè)結(jié)果對(duì)比柱狀圖。分別是不加IP影響因子、新加IP改編因子、新加IP品質(zhì)3種情況下,回歸預(yù)測(cè)的R平方值。通過對(duì)比發(fā)現(xiàn),增加是否為IP改編這一因子能提高R平方值,但由于其變量處理機(jī)制比較粗糙,所以通過參考貝葉斯投票機(jī)制計(jì)算出IP品質(zhì),并在電影票房預(yù)測(cè)中新加IP品質(zhì)作為影響因子,將對(duì)電影票房的提高有較大影響。
5 結(jié)語(yǔ)
本文提出IP品質(zhì)因子,并采用3個(gè)有代表性的模型完成驗(yàn)證性實(shí)驗(yàn),從而驗(yàn)證了在早期電影票房預(yù)測(cè)中,通過新加IP品質(zhì)影響因子,可以使票房預(yù)測(cè)準(zhǔn)確度得到提升。后續(xù)研究重點(diǎn)是基于本文提出的IP品質(zhì)計(jì)算方法,對(duì)其它影響因子進(jìn)行合理量化,以進(jìn)一步完善早期電影票房預(yù)測(cè)方法,從而幫助電影投資人規(guī)避投資風(fēng)險(xiǎn),獲取最大利益,并對(duì)我國(guó)電影市場(chǎng)的發(fā)展起到一定推動(dòng)作用。
參考文獻(xiàn):
[1] GINSBURGH V A,THROSBY D.Handbook of the economics of art and culture[J].David Throsby,2006,32(1):79-81.
[2] JEHOSHUA E,ELBERSE A,LEENDERS M A. The motion picture industry:critical issues in practice,current research,and new research directions[J].Marketing Science,2006(6):638-661.
[3] 謝靜.基于微博數(shù)據(jù)的電影票房預(yù)測(cè)[D].保定:河北大學(xué),2016.
[4] MARSHALL P,DOCKENDORFF M,IBEN··EZ S.A forecasting system for movie attendance[J].Journal of Business Research,2013,66(13):1800-1806.
[5] SAWHNEYMS,ELIASHBERGJ.A parsimonious model for forecasting gross box-office revenues of motion picture[J].Marketing Science,1996,15(2):113-131.
[6] LITMAN B R,KOHL L S.Predicting financial success of motion pictures:The ′80s experience[J].Journal of Media Economics,1989,2(2):35-50.
[7] BARMAN D,CHOWDHURY N,SINGHA R K.To predict possible profit/loss of a movie to be launched using MLP with back-propagation learning[C].International Conference on Communications,Devices and Intelligent Systems,2013:322-325.
[8] 趙偉.基于粗糙集與支持向量機(jī)的票房預(yù)測(cè)研究[D].大連:大連理工大學(xué),2009.
[9] GUO Y,GOH H L."I Have AIDS":content analysis of postings in HIV/AIDS support group on a Chinese microblog[J].Computers in Human Behavior,2014,34(34):219-226.
[10] 代亮,許宏科,陳婷,等.基于MapReduce的多元線性回歸預(yù)測(cè)模型[J].計(jì)算機(jī)應(yīng)用,2014,34(7):1862-1866.
[11] 丁世飛,齊丙娟,譚紅艷.支持向量機(jī)理論與算法研究綜述[J].電子科技大學(xué)學(xué)報(bào),2011,40(1):2-10.
[12] 聞新,張興旺,朱亞萍,等.智能故障診斷技術(shù):MATLAB應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2015.
[13] 王一帆.我國(guó)電影票房影響因素分析[J].市場(chǎng)研究,2015(5):30-32.
[14] 徐霞.著作權(quán)視角下的IP改編與影視產(chǎn)業(yè)發(fā)展[J].現(xiàn)代視聽,2016(6):26-29.
[15] 熊芳.中國(guó)IP影視劇改編現(xiàn)狀研究[J].西安電子科技大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2017(2):136-140.
[16] 袁國(guó)寶.互聯(lián)網(wǎng)+IP如何深度挖掘IP價(jià)值[J].互聯(lián)網(wǎng)經(jīng)濟(jì),2016(8):12-15.
(責(zé)任編輯:黃 ?。?/p>