亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于微博數(shù)據(jù)的電影票房預(yù)測模型研究

        2014-04-29 00:44:03楊威李龍澍
        電子世界 2014年21期
        關(guān)鍵詞:電影票房預(yù)測模型神經(jīng)網(wǎng)絡(luò)

        楊威 李龍澍

        【摘要】以新浪微博中電影主演和導(dǎo)演的粉絲數(shù)、相關(guān)微博轉(zhuǎn)發(fā)量、評論量等微博數(shù)據(jù)為基礎(chǔ),利用神經(jīng)網(wǎng)絡(luò)建立電影票房的預(yù)測模型并利用微博數(shù)據(jù)進(jìn)行預(yù)測研究。研究表明,本文構(gòu)建的模型可以在一定程度上用于電影票房的預(yù)測,其準(zhǔn)確率為90%。

        【關(guān)鍵詞】微博數(shù)據(jù);神經(jīng)網(wǎng)絡(luò);電影票房;預(yù)測模型

        1.引言

        據(jù)2011年IDC的《Digital Universe Sduty》報告顯示,數(shù)據(jù)以每年超過50%的速度增長,全球信息總量每過兩年就會增長一倍。在眾多產(chǎn)生大數(shù)據(jù)的平臺中,Twitter、新浪和騰訊微博等使用簡單便捷、信息豐富、傳播速度快、更新迅速、影響范圍廣,新浪微博是中國微博產(chǎn)業(yè)的主導(dǎo)力量。

        電影作為一種生存期短的商品,對其票房的預(yù)測難度較大,當(dāng)前關(guān)于電影票房的研究較少。Kyung Jae Lee和Woojin Chang(1999)用貝葉斯網(wǎng)絡(luò)研究票房的影響因素,給出了預(yù)測模型[1]。Sharda R和Delen D(2006)利用影響電影票房的多個屬性,以多層神經(jīng)網(wǎng)絡(luò)算法為基礎(chǔ),提出一種電影票房分類模型[2]。Marshall P等(2013)提出使用電影歷史數(shù)據(jù)預(yù)測電影上映期間的累計觀眾數(shù)量,使用多元線性回歸算法預(yù)測第1周的觀眾人數(shù),再用其預(yù)測后幾周的觀眾總數(shù)[3]。王錚和許敏(2013)基于Logit 模型的研究電影票房的影響因素發(fā)現(xiàn)明星和導(dǎo)演存在顯著的票房效應(yīng)[4]。鄭堅和周尚波(2014)利用神經(jīng)網(wǎng)絡(luò)算法,提出一種基于反饋神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測模[5]。

        電影上映前,主創(chuàng)人員會對電影進(jìn)行微博宣傳,對電影有潛在消費欲望的網(wǎng)友會關(guān)注這些并評論和轉(zhuǎn)發(fā)。對粉絲數(shù)多的用戶,這是一種便宜、高效、傳播范圍廣且迅速的營銷方式。本文在此研究基礎(chǔ)上,嘗試?yán)蒙窠?jīng)網(wǎng)絡(luò)方法,基于微博數(shù)據(jù)對電影票房進(jìn)行預(yù)測性研究。

        2.相關(guān)數(shù)據(jù)收集和處理

        2.1 確定數(shù)據(jù)指標(biāo)

        本文采用新浪微博的相關(guān)數(shù)據(jù)來對電影票房預(yù)測研究,選取電影主創(chuàng)的粉絲數(shù),相關(guān)轉(zhuǎn)發(fā)量和評論量作為票房預(yù)測的指標(biāo)體系(見圖1)。

        因此,在對票房進(jìn)行相關(guān)分析時提取以電影名稱為關(guān)鍵詞的相關(guān)主創(chuàng)的微博,統(tǒng)一選取電影主演1、主演2、導(dǎo)演的粉絲數(shù)、相關(guān)微博評論量、轉(zhuǎn)發(fā)量作為研究指標(biāo)并收集數(shù)據(jù)。粉絲數(shù)、轉(zhuǎn)發(fā)量和評論量越大對票房的貢獻(xiàn)率越大。

        圖1 電影票房預(yù)測的數(shù)據(jù)指標(biāo)

        2.2 數(shù)據(jù)收集

        電影的微博營銷時間通常集中在上映之前和上映的幾周之內(nèi)。為了使本文的研究結(jié)果得到驗證,本文選擇的2013年上映的45部電影研究,電影名稱見表1。

        本文的數(shù)據(jù)收集流程見圖2:

        (1)搜索電影名稱確定其導(dǎo)演和主要演員;

        (2)查找主演和導(dǎo)演的個人認(rèn)證微博中以電影名為關(guān)鍵詞對其原創(chuàng)和轉(zhuǎn)發(fā)的所有微博,收集其粉絲數(shù)量;

        (3)收集有關(guān)電影所發(fā)微博的轉(zhuǎn)發(fā)數(shù)和評論數(shù)。

        2.3 數(shù)據(jù)處理

        在收集數(shù)據(jù)時會遇到幾個問題:

        (1)有的電影主演沒有個人認(rèn)證微博,其粉絲數(shù)和轉(zhuǎn)發(fā)數(shù)、評論數(shù)無法收集;

        (2)有的電影主演的微博評論對粉絲關(guān)閉,只有互粉者可以評論;

        (3)由于個人情感等原因,每部電影的相關(guān)轉(zhuǎn)發(fā)數(shù)和評論數(shù)差距較大。

        鑒于以上問題,需要對采集到的數(shù)據(jù)進(jìn)行預(yù)處理。

        (1)對于沒開通微博的主演和導(dǎo)演,以和其影響力相同的微博賬戶來代替。

        (2)對粉絲評論關(guān)閉的主演和導(dǎo)演,采用其發(fā)布的其他的微博轉(zhuǎn)發(fā)數(shù)和評論數(shù)來近似替代,并采取轉(zhuǎn)發(fā)數(shù)和評論數(shù)求均值來提高對比性。本文收集的電影的部分微博數(shù)據(jù)見表2、3。

        表1 2013年上映的45部電影

        序號 名稱 序號 名稱 序號 名稱 序號 名稱

        1 西游降魔篇 13 不二神探 25 毒戰(zhàn) 37 神奇

        2 致青春 14 廚子戲子痞子 26 非常幸運(yùn) 38 控制

        3 私人定制 15 無人區(qū) 27 逃出生天 39 在一起

        4 狄仁杰 16 掃毒 28 天臺愛情 40 白狐

        5 中國合伙人 17 盲探 29 激戰(zhàn) 41 我愛的是你愛我

        6 警察2013 18 101次求婚 30 我想和你好好的 42 越來越好之村晚

        7 北京遇上西雅圖 19 分手合約 31 等風(fēng)來 43 意外的戀愛時光

        8 小時代1 20 全民目擊 32 笑功震武林 44 一場風(fēng)花雪月的事

        9 風(fēng)暴 21 四大名捕2 33 摩登年代 45 超級經(jīng)紀(jì)人

        10 富春山居圖 22 一夜驚喜 34 忠烈楊家將

        11 小時代2 23 特殊身份 35 百星酒店

        12 一代宗師 24 被偷走的那五年 36 宮鎖沉香

        圖2 電影微博數(shù)據(jù)收集流程

        表2 部分電影的微博數(shù)據(jù)

        序號 名稱 主1粉絲(萬) 主1轉(zhuǎn)發(fā)量 主1評論量 主2粉絲(萬) 主2轉(zhuǎn)發(fā)量

        1 西游降魔篇 5334 753 1392 2455 1673

        2 致青春 515 4379 4539 4208 9436

        3 私人定制 412 1226 2055 1809 287

        4 狄仁杰 515 819 558 1484 1867

        5 中國合伙人 2118 8276 2817 1476 2772

        6 警察2013 2216 4461 4574 3759 3519

        7 北京遇上西雅圖 516 2740 2833 556 5726

        8 小時代1 2994 13201 12724 3335 7790

        9 風(fēng)暴 901 232 246 6687 2772

        10 富春山居圖 901 232 246 556 5726

        表3 電影的微博數(shù)據(jù)

        序號 名稱 主2評論量 導(dǎo)演粉絲(萬) 導(dǎo)演轉(zhuǎn)發(fā)量 導(dǎo)演評論 票房

        1 西游降魔篇 1979 1739 7060 5875 124603

        2 致青春 7796 5712 2401 2109 71888

        3 私人定制 173 1739 7060 5875 71210

        4 狄仁杰 908 1 386 254 60036

        5 中伙 1812 4 65 49 53857

        6 警察2013 14724 4 324 72 53266

        7 北京遇上西雅圖 1979 6 38 22 51967

        8 小時代1 5160 3168 22310 8069 48409

        9 風(fēng)暴 1812 1 400 100 31452

        10 富春山居圖 1979 1 400 100 30013

        3.構(gòu)建模型

        3.1 研究工具

        采用Spss Clementine12.0軟件的神經(jīng)網(wǎng)絡(luò)節(jié)點構(gòu)建模型。

        3.2 構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)測模型

        微博收集的相關(guān)數(shù)據(jù)采用神經(jīng)網(wǎng)絡(luò)來構(gòu)建電影票房的相關(guān)預(yù)測模型,需要確定其輸入層、隱藏層和輸出層的神經(jīng)元個數(shù)。神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)見圖3。神經(jīng)網(wǎng)絡(luò)模型的輸入輸出變量名和數(shù)據(jù)類型見表4。

        圖3 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)

        表4 神經(jīng)網(wǎng)絡(luò)模型的輸入輸出變量名

        圖4 完整的模型圖

        4.實證分析

        4.1 仿真實驗

        利用微博平臺收集的有關(guān)45部電影的微博數(shù)據(jù)進(jìn)行仿真實驗時,使用45個數(shù)據(jù)的66%作為訓(xùn)練數(shù)據(jù),34%作為測試數(shù)據(jù),測試集和訓(xùn)練集是采取隨機(jī)抽樣的方法得到的,這兩個部分的數(shù)據(jù)完全分離,沒有重復(fù)樣本。在實驗中,將訓(xùn)練數(shù)據(jù)作為訓(xùn)練集對模型進(jìn)行訓(xùn)練,使用測試集對模型進(jìn)行測試。

        將主1粉絲數(shù)、主1轉(zhuǎn)發(fā)數(shù)、主1評論量、主2粉絲數(shù)、主2評論量、主2轉(zhuǎn)發(fā)量、導(dǎo)演粉絲數(shù)、導(dǎo)演轉(zhuǎn)發(fā)量、導(dǎo)演評論量的方向設(shè)置為輸入,將票房設(shè)置為輸出。將神經(jīng)網(wǎng)絡(luò)節(jié)點加入到模型中,設(shè)置神經(jīng)網(wǎng)絡(luò)的隱藏層數(shù)和每層的神經(jīng)元數(shù)。在神經(jīng)網(wǎng)絡(luò)節(jié)點的專家選項中選擇兩個隱藏層,層1選擇6,層2選(下轉(zhuǎn)第16頁)(上接第13頁)擇2。基于神經(jīng)網(wǎng)絡(luò)的完整模型見圖4。

        4.2 結(jié)果分析

        利用微博數(shù)據(jù)進(jìn)行建模之后,得出變量重要性見表5?;跀?shù)據(jù)的分析,可知導(dǎo)演粉和主2粉對電影票房預(yù)測模型有著很高的貢獻(xiàn)率。如果某部電影導(dǎo)演的粉絲數(shù)、轉(zhuǎn)發(fā)量和評論量大大高于其他電影導(dǎo)演,那么導(dǎo)演的指標(biāo)的貢獻(xiàn)率比主演的指標(biāo)要高。在現(xiàn)實的電影票房中,小時代的導(dǎo)演郭敬明和致青春導(dǎo)演趙薇粉絲數(shù)、轉(zhuǎn)發(fā)量、評論量都遠(yuǎn)超其他導(dǎo)演,票房也遠(yuǎn)比其他電影高。

        表5 變量的重要性

        變量名 變量重要性 變量名 變量重要性 變量名 變量重要性

        主2粉絲數(shù) 0.24 導(dǎo)演評論量 0.124 導(dǎo)演轉(zhuǎn)發(fā)量 0.041

        導(dǎo)演粉絲數(shù) 0.183 主2轉(zhuǎn)發(fā)量 0.117 主1評論量 0.032

        主2評論量 0.181 主1粉絲數(shù) 0.058 主1轉(zhuǎn)發(fā)量 0.025

        經(jīng)過神經(jīng)網(wǎng)絡(luò)模型使用訓(xùn)練集數(shù)據(jù)建模得到的模型的估計準(zhǔn)確性為89.894%,即訓(xùn)練集數(shù)據(jù)的擬合優(yōu)度為90%,從模型預(yù)測的精準(zhǔn)性來看,數(shù)據(jù)量的增多會提高模型的預(yù)測結(jié)果。

        4.3 模型評估

        使用訓(xùn)練集數(shù)據(jù)建立基于神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測模型之后,要使用測試集數(shù)據(jù)對模型預(yù)測性能進(jìn)行評估。本文使用相同的測試集數(shù)據(jù)分別對電影票房的線性回歸模型和決策樹模型進(jìn)行測試,來比對神經(jīng)網(wǎng)絡(luò)的預(yù)測準(zhǔn)確性。三種模型對測試集數(shù)據(jù)進(jìn)行預(yù)測的平均相對誤差見表6,平均誤差見圖5。可知運(yùn)用神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有良好的預(yù)測精確度。

        表6 三種模型的平均相對誤差 ?%

        方法 平均相對誤差

        神經(jīng)網(wǎng)絡(luò) 82.42

        C&RT 94.07

        線性回歸 104.55

        圖5 三種模型的誤差對比圖

        5.結(jié)束語

        本文利用Spss Clementine中的神經(jīng)網(wǎng)絡(luò)節(jié)點構(gòu)建了電影票房的預(yù)測模型。通過結(jié)果分析得出電影票房與主演和導(dǎo)演粉、轉(zhuǎn)和評和電影票房的關(guān)系,并給出了具體的預(yù)測模型。其精確度為89.894%,平均誤差相對較小,具有一定的可信度。

        但是,本文建模所用的電影數(shù)目為45個,進(jìn)一步加大數(shù)據(jù)量可以提高模型的精確度,同時微博數(shù)據(jù)不局限于電影主創(chuàng)們的微博,還可以通過統(tǒng)計一定時間內(nèi)以某部電影為關(guān)鍵詞所發(fā)微博總量等數(shù)據(jù)來預(yù)測電影票房,增加輸入神經(jīng)元個數(shù)也能提高模型的準(zhǔn)確性。下一步的研究可以將微博作為平臺,將微博中關(guān)于某部電影的情感分析加入到電影票房的預(yù)測中,也可進(jìn)一步考慮微博轉(zhuǎn)發(fā)深度、評論活躍程度,以及相關(guān)微博數(shù)量隨電影上映日期臨近的變化趨勢等數(shù)據(jù),這些都可以被有效的提煉為特征并加入到模型中。

        參考文獻(xiàn)

        [1]Ramya Neelamegham,Pradeep Chintagunta.A Bayesian Model to Forecast New Product Performance in Domestic and International Markets[J].Marketing Science,1999,18(2)115-136.

        [2]Sharda R,Delen D.Predicting box-office success of motion pictures with neural networks[J].Expert Systems with Applications,2006,30(2):243-254.

        [3]MarshallP,Dockendorff M,Ibanez S.A forecasting system for movie attendance[J].Journal of Business Research,2013,66(13):1800-1806.

        [4]王錚,許敏.電影票房的影響因素分析——基于Logit模型的研究[J].經(jīng)濟(jì)問題探索,2013,11:96-102.

        [5]鄭堅,周尚波.基于神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測建模[J].計算機(jī)應(yīng)用,2014,03:742-748.

        猜你喜歡
        電影票房預(yù)測模型神經(jīng)網(wǎng)絡(luò)
        新年新氣象,元旦來帶頭 2021年1月電影票房排行榜
        打鐵還需自身硬 2020年10月電影票房排行榜
        意料之中,整體表現(xiàn)平淡 2020年9月電影票房排行榜
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        暑期檔繼續(xù)“遇冷”2019年7月電影票房排行榜
        基于神經(jīng)網(wǎng)絡(luò)的北京市房價預(yù)測研究
        商情(2016年43期)2016-12-23 14:23:13
        中國石化J分公司油氣開發(fā)投資分析與預(yù)測模型研究
        基于IOWHA法的物流需求組合改善與預(yù)測模型構(gòu)建
        基于預(yù)測模型加擾動控制的最大功率點跟蹤研究
        科技視界(2016年1期)2016-03-30 13:37:45
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        日产一区二区三区的精品| 国产一级大片免费看| 91精品欧美综合在线观看| 无码一区久久久久久久绯色AV| 韩国日本在线观看一区二区| 亚洲一区二区三区日本久久九| 欧美午夜刺激影院| 99国产精品视频无码免费| 日本一区二区三区的免费视频观看| 亚洲av免费看一区二区三区| 18禁止进入1000部高潮网站| 亚洲中文字幕无码爆乳| 中文AV怡红院| 亚洲av综合日韩精品久久 | 精品久久久久久久久午夜福利 | 国产日本精品一区二区| 色综合久久久久综合体桃花网| 亚洲男人的天堂在线播放| 精品久久亚洲一级α| 亚洲成av人片极品少妇| 麻豆婷婷狠狠色18禁久久| 欧美人与动牲交片免费| 精品久久日产国产一区| 国产在线播放一区二区不卡| 日本50岁丰满熟妇xxxx| 亚洲欧美日韩中文v在线| av一区二区三区综合网站| 久久精品女人天堂av免费观看| 中文字幕亚洲欧美日韩在线不卡| 视频一区二区三区中文字幕狠狠| 在线观看国产成人av天堂野外| 亚洲色在线v中文字幕| 国产目拍亚洲精品一区二区| 国产日产韩国级片网站| 亚洲精品无码久久久久去q| 久久精品国产亚洲av大全| 国产精品一区二区三区精品| 日韩av在线不卡一区二区| 久久精品中文字幕无码绿巨人 | 国产成年女人毛片80s网站| 色综合天天网|