亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用貝葉斯分類模型 實(shí)現(xiàn)對農(nóng)村電影訂購場次的預(yù)測

        2021-05-24 07:43:14
        現(xiàn)代電影技術(shù) 2021年5期
        關(guān)鍵詞:場次貝葉斯類別

        (中央宣傳部電影數(shù)字節(jié)目管理中心,北京 100866)

        1 引言

        農(nóng)村電影放映服務(wù)是我國公共文化體系建設(shè)的重要組成部分,近年來,農(nóng)村電影市場穩(wěn)定發(fā)展,“十三五”期間有超過240家版權(quán)方持續(xù)在農(nóng)村電影市場投放影片,實(shí)現(xiàn)累計(jì)影片訂購5044萬場。農(nóng)村電影市場以其影片檔期長、社會(huì)效益高、影響面廣不斷吸引版權(quán)方拍攝、制作、投放影片進(jìn)入農(nóng)村市場。

        城市影院票房收入是衡量一部商業(yè)片是否成功的重要指標(biāo),關(guān)于城市票房影響因素和票房預(yù)測模型的研究有很多。而對于農(nóng)村電影市場,訂購場次是衡量一部影片是否受歡迎的重要指標(biāo)。

        貝葉斯算法通過獨(dú)立性假設(shè),將高維問題轉(zhuǎn)換成多個(gè)一維問題,是目前公認(rèn)的一種簡單而有效的概率分類方法,其性能可與決策樹和神經(jīng)網(wǎng)絡(luò)等方法相媲美。本文通過分析影響農(nóng)村電影訂購場次的各項(xiàng)特征因素,構(gòu)建一種基于貝葉斯算法的農(nóng)村電影訂購場次預(yù)測模型,以期能快速、準(zhǔn)確地預(yù)測影片在農(nóng)村電影市場上的表現(xiàn),給投資者提供合理的收益參考。

        2 貝葉斯分類模型

        2.1 貝葉斯定理

        貝葉斯方法的思想是當(dāng)不能確定某一個(gè)事件發(fā)生的概率時(shí),可以依靠與該事件本質(zhì)屬性相關(guān)事件發(fā)生的概率去推測該事件發(fā)生的概率。在概率論中使用P (A)表示事件A 發(fā)生的概率,P (A∩B)表示事件A 和B同時(shí)發(fā)生的概率,P (B|A)表示事件A 已經(jīng)發(fā)生的前提下事件B 發(fā)生的概率。P(A)稱為先驗(yàn)概率,P (B|A)稱為條件概率,其計(jì)算公式如下:

        隨機(jī)試驗(yàn)E的所有可能結(jié)果組成的集合稱為E的樣本空間,A 為樣本空間E中發(fā)生的一個(gè)事件,B、B、…B為樣本空間的一個(gè)劃分,且任何子樣本空間的交集為空并集為E,假定B、B、…B的概率P (B)>0 (i=1,2…n),那么對于事件A的全概率公式如下:

        通常情況下,P (B|A)與P (A|B)的概率是不同的,但二者卻有一定的聯(lián)系。在概率論中,兩個(gè)隨機(jī)事件A、B存在P (A∩B)=P (B∩A),利用公式(1)和公式(2)可得到公式(3):

        2.2 貝葉斯分類

        貝葉斯分類是基于貝葉斯定理和假定給定樣本目標(biāo)值屬性之間相互條件獨(dú)立的分類方法。貝葉斯分類可分為兩步,第一步是分別計(jì)算所給定樣本實(shí)例在不同類別下的后驗(yàn)概率,第二步是比較各類別下后驗(yàn)概率的大小,判定后驗(yàn)概率最大的類別為該樣本實(shí)例的類別。

        假定B 為樣本屬性 (影片特征屬性)的集合,共計(jì)有n 個(gè)屬性,分別用B、B、…B代表,各類屬性相互條件獨(dú)立;樣本類別集合 (影片訂購場次分類)用C 表示,共分為k個(gè)類,即C={C、C、…C}。假設(shè)樣本實(shí)例X (某部電影)為一個(gè)n維向量,X={x、x、…x},其中x、x、…x表示實(shí)例的n個(gè)屬性值,x為屬性B的具體取值。則對于樣本X 屬于類別C的后驗(yàn)概率P (C|X)可表示為:

        為了降低計(jì)算復(fù)雜性,已經(jīng)假定了樣本各類屬性相互條件獨(dú)立,即:

        式中,x表示X 在第j個(gè)屬性上的取值。P(X)表示樣本X 發(fā)生的概率,是標(biāo)準(zhǔn)化常量,在所有類別下數(shù)值相同,在實(shí)際應(yīng)用中只需要計(jì)算式(6)的分子部分求取最大值。根據(jù)貝葉斯分類相關(guān)知識,樣本X 的類別會(huì)被判定為具有最大后驗(yàn)概率所對應(yīng)的類別,設(shè)c(X)為樣本X 的最終判定類別,則貝葉斯分類的表達(dá)式可以簡化為:

        通過式(7)可以計(jì)算影片在不同訂購場次類別下的后驗(yàn)概率來達(dá)到預(yù)測場次分類的目的。針對本文應(yīng)用場景,式(7)中各項(xiàng)概率的具體計(jì)算方式如下:

        (1)先驗(yàn)概率P (C)=S/S,其中S為訓(xùn)練樣本數(shù)據(jù)集總樣本數(shù)量,S為訓(xùn)練樣本中訂購場次類別標(biāo)簽為C的樣本數(shù)量;

        (2)影片各項(xiàng)特征屬性數(shù)據(jù)是離散型的,不是連續(xù)型的,則條件概率P (x│C)=S/ S,其中S表示在訂購場次類別為C的訓(xùn)練樣本中影片特征屬性B=x的樣本數(shù)量。如“影片訂購場次”為“高場次”的類別下共有100部影片樣本,其中“影片單價(jià)”的特征屬性“超過80元”的樣本數(shù)量有10部影片,那么條件概率P (影片單價(jià)=超過80元│訂購場次=高場次)=10/100。

        需要注意的是,如果出現(xiàn)x的樣本個(gè)數(shù)是0,即S=0的情況,根據(jù)式(7)不論其它特征屬性值如何,那么對于類別C的選擇概率值都會(huì)是0。還以“影片單價(jià)”為例,假定“影片單價(jià)”的特征屬性“超過80元”的“影片訂購場次”的類別“高場次”的樣本數(shù)是0,那不論該影片的國別、片長、類型等其它屬性如何,P (訂購場次=高場次|影片單價(jià)=超過80元,影片其它特征值)=0。為避免這種情況,可采用“拉普拉斯修正”進(jìn)行“平滑”處理,計(jì)算公式如下:

        灰色關(guān)聯(lián)法是屬于灰色系統(tǒng)理論中的一種動(dòng)態(tài)分析方法,其基本思想是通過比較各研究對象呈現(xiàn)的空間形態(tài)來判斷它們之間的關(guān)聯(lián)程度?;疑P(guān)聯(lián)法的優(yōu)點(diǎn)是可以通過有限的樣本數(shù)據(jù)推斷出模糊的相互關(guān)系,對數(shù)據(jù)庫的要求不高,計(jì)算過程清晰簡捷,也能通過Matlab軟件編程實(shí)現(xiàn)大數(shù)據(jù)分析。其計(jì)算步驟如下:

        式中,N表示影片特征屬性B=x下可能的取值個(gè)數(shù),如“影片單價(jià)”的特征屬性取值包括“10元以內(nèi)/10-30元/30-80元/80元以上”,那么此時(shí)的N=4。

        3 訂購場次預(yù)測的干擾變量

        (1)影片檔期

        不同影片的檔期時(shí)長不一樣,城市影院影片檔期一般為一個(gè)月左右,而農(nóng)村電影市場影片檔期基本按“年”計(jì),2020年新簽約影片超過400部,平均檔期時(shí)長約為5.5年。檔期結(jié)束后,有大量影片以續(xù)簽檔期方式繼續(xù)活躍在農(nóng)村電影市場。影片檔期的長短對影片訂購場次有較大影響,為保證預(yù)測條件的一致性,需要排除影片檔期時(shí)長不同的干擾。

        (2)主題放映活動(dòng)

        電影數(shù)字節(jié)目管理中心每年會(huì)組織開展多場不同主題的放映活動(dòng),活動(dòng)中會(huì)根據(jù)當(dāng)期主題內(nèi)容進(jìn)行影片推薦。主題放映活動(dòng)面向全國,影響力大,對影片訂購場次有極大推動(dòng)作用,如2019年舉辦的《“我和我的祖國”慶祝新中國成立70周年公益電影主題放映活動(dòng)》共推薦了10部影片,當(dāng)期累計(jì)訂購場次超過51萬場。鑒于主題放映活動(dòng)對于影片訂購場次的高推動(dòng)作用,所推薦影片不在本文研究范疇。

        (3)影片片種

        目前,“電影數(shù)字節(jié)目交易平臺(tái)”提供故事片、科教片、戲曲片、紀(jì)錄片及美術(shù)片五類片種。每類片種的影片特征屬性側(cè)重點(diǎn)不同,如科教片側(cè)重于內(nèi)容題材及宣傳要點(diǎn)、戲曲片要重點(diǎn)考慮戲曲曲種等因素。為簡化訂購場次預(yù)測模型,本文只討論對于故事片片種的場次預(yù)測。

        4 訂購場次預(yù)測模型

        基于貝葉斯分類模型的農(nóng)村電影訂購場次預(yù)測可分為準(zhǔn)備階段、訓(xùn)練階段、應(yīng)用階段三部分,其中準(zhǔn)備階段是指排除預(yù)測干擾因素獲得訓(xùn)練樣本并確定影響訂購場次的影片特征屬性,訓(xùn)練階段是指求解各類別、各特征屬性的先驗(yàn)概率及條件概率,應(yīng)用階段是指計(jì)算各訂購場次類別的后驗(yàn)概率獲得訂購場次預(yù)測,算法流程見圖1。

        圖1 算法流程圖

        4.1 影片特征屬性的確定

        電影本身的特征屬性較多,如導(dǎo)演、演員、口碑、制式、國別、題材等,本文根據(jù)農(nóng)村電影放映工作特點(diǎn),選取影響影片訂購場次的6個(gè)重要因素納入模型,具體說明見表1。

        表1 影片特征屬性說明

        4.2 訓(xùn)練樣本的確定

        根據(jù)本文第3節(jié)描述,對于訂購場次預(yù)測的干擾項(xiàng)包括影片檔期、主題放映活動(dòng)和影片片種,為保證預(yù)測準(zhǔn)確度,訓(xùn)練樣本的選擇需遵循以下原則:

        (1)對影片檔期歸一化處理。每部影片上映時(shí)間不同、影片檔期時(shí)長也不相同,針對每部影片選擇該影片首個(gè)檔期開始之日起一年內(nèi)的訂購場次進(jìn)行訓(xùn)練和測試,區(qū)間之外的訂購場次不予統(tǒng)計(jì);

        (2)避開主題放映推薦影片。選擇在檔期計(jì)算時(shí)間內(nèi)沒有被各類主題放映推薦過的影片,保證影片計(jì)算的一致性;

        (3)針對影片片種問題,本文僅對故事片片種進(jìn)行研究。

        5 結(jié)果分析

        5.1 實(shí)驗(yàn)數(shù)據(jù)集

        根據(jù)本文4.2節(jié),選用“電影數(shù)字節(jié)目交易平臺(tái)”2017-2020 年新供應(yīng)的故事片數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),此數(shù)據(jù)集包括500 個(gè)訓(xùn)練樣本和50 個(gè)測試樣本,數(shù)據(jù)集統(tǒng)計(jì)信息見表2。

        表2 實(shí)驗(yàn)數(shù)據(jù)集分析

        農(nóng)村電影訂購場次與城市院線票房相似,屬于金字塔結(jié)構(gòu),訂購場次很高的影片數(shù)量相對較少。本文根據(jù)訓(xùn)練數(shù)據(jù)集影片訂購場次實(shí)際情況,依照50%、30%、15%、5%的分割比例將影片訂購場次類別劃分為A、B、C、D 4類,分類統(tǒng)計(jì)信息見表3。

        表3 訂購場次類別劃分信息

        5.2 模型訓(xùn)練

        訓(xùn)練樣本數(shù)據(jù)統(tǒng)計(jì)如表4 所示,根據(jù)本文2.2節(jié),計(jì)算得到先驗(yàn)概率P(C) 和條件概率P (x│C)如表5所示。

        表4 訓(xùn)練樣本數(shù)據(jù)統(tǒng)計(jì)

        表5 訓(xùn)練樣本先驗(yàn)概率和條件概率

        5.3 模型評估

        圖2 模型預(yù)測結(jié)果

        將50個(gè)測試樣本數(shù)據(jù)按照訓(xùn)練得到的貝葉斯模型重新計(jì)算分析,實(shí)驗(yàn)結(jié)果如圖2所示??梢钥闯?有39個(gè)樣本數(shù)據(jù)的預(yù)測分類與真實(shí)分類一致,其中模型對于A 類樣本和D 類樣本的預(yù)測最為準(zhǔn)確,即影片是否能獲得較高及較低場次有較好的預(yù)測準(zhǔn)確率,B類樣本和C類樣本的預(yù)測結(jié)果與樣本實(shí)際分布相比存在一定的預(yù)測漂移。模型綜合預(yù)測準(zhǔn)確率為78%,預(yù)測模型有效。同時(shí)從訓(xùn)練模型先驗(yàn)概率和條件概率可以看到,定價(jià)不超過20元的國產(chǎn)新片訂購場次較高,片長適中的影片更適宜農(nóng)村觀眾和觀影環(huán)境,從影片題材上看,帶有動(dòng)作、喜劇、軍事、犯罪等情節(jié)的影片更受到農(nóng)村觀眾的歡迎。另外,從本文實(shí)驗(yàn)中也能看出貝葉斯分類模型的優(yōu)點(diǎn)比較明確,樣本訓(xùn)練計(jì)算復(fù)雜度低、分類效率較高;模型結(jié)構(gòu)簡單、便于理解,能很好地提供決策建議。

        6 結(jié)語

        文章通過分析影響農(nóng)村電影市場影片訂購場次的明顯特征因素,將機(jī)器學(xué)習(xí)相關(guān)理論應(yīng)用于農(nóng)村電影訂購場次的預(yù)測,構(gòu)建了一套適用于農(nóng)村電影市場的訂購場次預(yù)測模型,實(shí)驗(yàn)效果較為良好。下一步將繼續(xù)優(yōu)化算法,完善影片特征屬性集,實(shí)現(xiàn)對于影片訂購場次具體數(shù)量的預(yù)測。?

        猜你喜歡
        場次貝葉斯類別
        長江上游高洪水期泥沙輸移特性
        基于運(yùn)行場次用時(shí)誤差的載人設(shè)備故障預(yù)警可視化研究
        排考場次分配方法及其SQL實(shí)現(xiàn)
        貝葉斯公式及其應(yīng)用
        基于貝葉斯估計(jì)的軌道占用識別方法
        服務(wù)類別
        新校長(2016年8期)2016-01-10 06:43:59
        一種基于貝葉斯壓縮感知的說話人識別方法
        電子器件(2015年5期)2015-12-29 08:43:15
        地鐵觀影指南
        電影故事(2015年33期)2015-09-06 01:05:30
        論類別股東會(huì)
        商事法論集(2014年1期)2014-06-27 01:20:42
        中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
        亚洲av无码成人网站www| 免费网站内射红桃视频| 亚洲av最新在线网址| 国产欧美精品一区二区三区–老狼 | 蜜桃av中文字幕在线观看| 国产做无码视频在线观看| 久久久精品2019免费观看| 国产精品久久久久久久y| 国产精品自拍盗摄自拍| 久久久久久久久毛片精品| 日本黄页网站免费大全| 国产av91在线播放| 少妇被黑人嗷嗷大叫视频| 一本色道久久88综合日韩精品 | 国产午夜免费高清久久影院| 久久久精品人妻一区二区三区蜜桃| 亚洲av无码成人网站www| 日本人妖一区二区三区| 丁香婷婷激情视频在线播放| 中文字幕人妻无码一夲道| 99视频这里有精品| 中文字幕亚洲乱码熟女在线| 亚洲一区二区三区少妇| 国产又色又爽又刺激在线播放| 亚洲香蕉视频| 亚洲av精品一区二区三| 少妇人妻中文久久综合| 国产人妻精品无码av在线| 亚洲色欲在线播放一区| 国内精品人人妻少妇视频| 91色老久久偷偷精品蜜臀懂色| 免费无码高潮流白浆视频| 老头巨大挺进莹莹的体内免费视频| 亚洲无码视频一区:| 日本一区二区三区女优在线| 久久精品国产只有精品96 | 欧美日韩国产另类在线观看| 日韩精品资源在线观看免费| 在线视频国产91自拍| 无码少妇一区二区性色av| 久久精品国产亚洲vr|