裴智慧
隨著大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)、區(qū)塊鏈、人工智能以及元宇宙等數(shù)字技術(shù)的發(fā)展與應(yīng)用,中國電影在數(shù)字化及數(shù)字化轉(zhuǎn)型方面已經(jīng)取得了有目共睹的成績。從數(shù)字化轉(zhuǎn)型到數(shù)字化戰(zhàn)略,正在各界形成相對普遍的共識,國家也從政策層面對數(shù)字技術(shù)給予支持并不斷規(guī)范。從2016年開始,一系列相關(guān)法律法規(guī)頒布、施行,比如《網(wǎng)絡(luò)安全法》(2016)、《電子商務(wù)法》(2018)、《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》(2020)、《數(shù)據(jù)安全法》(2021)和《個人信息保護(hù)法》(2021)等,這些法律法規(guī)的出臺對數(shù)據(jù)的權(quán)屬、數(shù)據(jù)隱私、數(shù)據(jù)保護(hù)和數(shù)據(jù)安全做出更為明確的規(guī)定,填補(bǔ)了大數(shù)據(jù)時代個人信息、網(wǎng)絡(luò)平臺監(jiān)管、數(shù)據(jù)安全領(lǐng)域的空白。保護(hù)基礎(chǔ)信息網(wǎng)絡(luò)、重要信息系統(tǒng)和數(shù)據(jù)資源已經(jīng)成為了國家關(guān)鍵信息基礎(chǔ)設(shè)施,數(shù)字技術(shù)的發(fā)展在帶來巨大經(jīng)濟(jì)和社會效益的同時,也給信息安全和管理帶來了嚴(yán)峻的挑戰(zhàn),數(shù)字技術(shù)在電影領(lǐng)域的應(yīng)用也存在同樣的問題。
將大數(shù)據(jù)技術(shù)應(yīng)用于影視產(chǎn)業(yè),利用其強(qiáng)大的數(shù)據(jù)分析能力,可以為影視生產(chǎn)和銷售提供有力的數(shù)據(jù)參考。具體而言,就是通過對海量數(shù)據(jù)的分析和整理,得到觀眾對某部影視作品的具體評分以及該作品營銷業(yè)績等一系列客觀數(shù)據(jù)。這些數(shù)據(jù)對于影視制作非常重要,通過分析相同類型影視作品的數(shù)據(jù),能夠幫助決策者更好地進(jìn)行選擇、決策,從而對新作品的收視率和票房成績產(chǎn)生積極影響。毫無疑問,在影視產(chǎn)業(yè)的發(fā)展過程中,大數(shù)據(jù)正發(fā)揮著越來越關(guān)鍵的作用。
1.劇本優(yōu)化。劇本創(chuàng)作是創(chuàng)意性的工作,基于數(shù)據(jù)分析的劇本優(yōu)化會給自由創(chuàng)作架起框架,但許多有關(guān)劇本創(chuàng)作的理論卻以大量例證顛覆這一認(rèn)知。創(chuàng)作劇本要遵循一定的模式,一般會以一定的篇幅控制開頭、中段和結(jié)尾的寫作節(jié)奏,甚至劇中激烈的情節(jié)點(diǎn)都是有相對明確的參考位置,絕非是天馬行空的游走?;谶@樣的理論前設(shè),通過收集和分析相關(guān)數(shù)據(jù),將大數(shù)據(jù)應(yīng)用于劇本創(chuàng)作,可讓創(chuàng)作方向更加明確,有效地把握觀眾對題材的興趣度,也可實(shí)現(xiàn)劇本內(nèi)容(情節(jié)、橋段等)的評估。創(chuàng)作者甚至比觀眾還要了解他們自身的劇情喜好,依據(jù)這些分析結(jié)果對劇情進(jìn)行優(yōu)化,避免創(chuàng)作出現(xiàn)太多違背觀眾意愿的、個人化的內(nèi)容,從而實(shí)現(xiàn)商業(yè)意義上的劇本優(yōu)化,使影視作品獲得更高的市場認(rèn)可度。
2.演員選擇。演員的選擇對于電影的市場表現(xiàn)有巨大影響,例如:從對國產(chǎn)高票房青春電影的數(shù)據(jù)分析中可以發(fā)現(xiàn)時下年輕明星強(qiáng)大的市場號召力,相關(guān)機(jī)構(gòu)對這一類型影片觀眾群體做過數(shù)據(jù)分析:超過46%的觀眾是12至18歲的女生。這一數(shù)據(jù)足以證明,拋開劇情、檔期等因素,演員號召力所貢獻(xiàn)的電影票房不容小覷。因此,除了在劇本優(yōu)化方面可以利用大數(shù)據(jù)外,把數(shù)據(jù)分析的方法應(yīng)用于演員選擇也很重要。
3.營銷策略。通過對社交媒體上的海量用戶所產(chǎn)生的信息進(jìn)行大數(shù)據(jù)分析,可以得到某一地域觀眾的年齡、性別、職業(yè)等各種維度的信息。依據(jù)這些信息,制片方可以向不同地域或不同觀眾群提供個性化的宣傳策略,將宣傳信息最大限度地輻射至目標(biāo)觀眾,而不再是全國千篇一律的“首發(fā)視頻”。
4.票房預(yù)測。將傳統(tǒng)分析與大數(shù)據(jù)分析的進(jìn)行比較可以發(fā)現(xiàn),傳統(tǒng)分析關(guān)注的是整體特征,試圖挖掘的是某種現(xiàn)象出現(xiàn)的原因,并依此做出調(diào)整改進(jìn);大數(shù)據(jù)分析則更關(guān)注個體特征,其優(yōu)勢在于預(yù)測未來。幾年前,有互聯(lián)網(wǎng)公司在此方面有過成功應(yīng)用,他們根據(jù)用戶在互聯(lián)網(wǎng)上的搜索次數(shù)來進(jìn)行電影票房預(yù)測,據(jù)驗(yàn)證,此方法能提前一個月預(yù)測出電影的首周票房收入,且準(zhǔn)確度高達(dá)94%。而現(xiàn)在,我們更可以通過收集微博、微信上的話題量以及各大平臺所發(fā)布的相關(guān)新聞,甚至結(jié)合文本調(diào)查對各用戶進(jìn)行情感傾向分析,從而對電影票房做出更加精確的預(yù)測。
數(shù)據(jù)分析往往涉及不同信息系統(tǒng)中的數(shù)據(jù)融合,除了數(shù)據(jù)量增長外,數(shù)據(jù)來源的廣泛性、多樣性是以往單系統(tǒng)數(shù)據(jù)分析所無法企及的。數(shù)據(jù)來源的廣泛性也帶來了數(shù)據(jù)標(biāo)準(zhǔn)、含義不統(tǒng)一等諸多問題。為了解決上述問題,企業(yè)在開展大數(shù)據(jù)分析前應(yīng)該引入數(shù)據(jù)治理體系。電影企業(yè)數(shù)據(jù)治理體系的建設(shè)需要依據(jù)現(xiàn)有信息化水平分階段分步驟進(jìn)行,對數(shù)據(jù)治理的概念、治理要素和框架以及面臨的挑戰(zhàn)進(jìn)行探討,提出數(shù)據(jù)治理的框架,將數(shù)據(jù)治理體系分為協(xié)同籌劃、過程實(shí)施和監(jiān)控評估三大主要板塊,并對數(shù)據(jù)治理的核心功能進(jìn)行描述。
1.數(shù)據(jù)收集。在網(wǎng)絡(luò)上以調(diào)查問卷的方式,對觀眾信息進(jìn)行采集,包括觀眾年齡、所觀看的電影電視劇及其評價。這些數(shù)據(jù)比較零散,無法直接作為數(shù)據(jù)挖掘的對象,需要相應(yīng)的統(tǒng)計分類才能做進(jìn)一步分析。
2.數(shù)據(jù)挖掘分析。一是數(shù)據(jù)制表將相應(yīng)數(shù)據(jù)經(jīng)過合并排序制成事實(shí)表,并做出各維度表;二是處理結(jié)果可視化,把挖掘出的數(shù)據(jù)轉(zhuǎn)化為數(shù)據(jù)分布圖,方便進(jìn)一步研究及模型推導(dǎo);三是相關(guān)分析,對所制圖表進(jìn)行相關(guān)分析,從而找出影響票房或收視率的最相關(guān)因素;四是預(yù)測未來,通過數(shù)據(jù)挖掘結(jié)果所提出的數(shù)學(xué)模型對影響票房或收視率的因素進(jìn)行分析,以便于預(yù)測單日票房趨勢、單日收視率趨勢等。
3.數(shù)據(jù)整理利用。在收集數(shù)據(jù)之初會發(fā)現(xiàn)這些數(shù)據(jù)非常雜亂,且存在部分無用數(shù)據(jù)。為了使數(shù)據(jù)更為有效,需進(jìn)行預(yù)處理操作,使其變得更有條理,需要對所收集到的數(shù)據(jù)進(jìn)行制表。以電影數(shù)據(jù)為例就包括放映時間、排片占比、上座率、適應(yīng)人群幾個方面。在經(jīng)過制表環(huán)節(jié)后的數(shù)據(jù),需要將其制成各種可視化的分布圖以便于進(jìn)一步整理,最終實(shí)現(xiàn)數(shù)據(jù)服務(wù)于發(fā)布、為數(shù)據(jù)內(nèi)外部提供數(shù)據(jù)應(yīng)用和分析結(jié)果服務(wù),分析出影響票房或收視率的最相關(guān)因素。
1.臟數(shù)據(jù)問題。有些影視公司為增加其影視作品的大眾關(guān)注度,不惜花費(fèi)重金雇傭“網(wǎng)絡(luò)水軍”進(jìn)行炒作?!熬W(wǎng)絡(luò)水軍”采用一些技術(shù)手段將這些影視作品的搜索熱度、討論熱度等數(shù)據(jù)不斷刷高,臟數(shù)據(jù)隨即產(chǎn)生,使數(shù)據(jù)質(zhì)量低下,可信度不高。所以通過對數(shù)據(jù)質(zhì)量的管理,識別正常數(shù)據(jù)和異常數(shù)據(jù),制定數(shù)據(jù)質(zhì)量預(yù)警閾值,對數(shù)據(jù)質(zhì)量進(jìn)行多維度監(jiān)控,以提高其可用度和可信度。
2.行業(yè)內(nèi)數(shù)據(jù)維度不一致。根據(jù)不同數(shù)據(jù)維度進(jìn)行數(shù)據(jù)統(tǒng)計的影視作品,其數(shù)據(jù)庫無法直接進(jìn)行對比,難以得出分析結(jié)果。比如,采用七大用戶的數(shù)據(jù)維度進(jìn)行統(tǒng)計而得到的數(shù)據(jù),和采用六大影視作品內(nèi)容元素的數(shù)據(jù)維度進(jìn)行統(tǒng)計的數(shù)據(jù)庫,從技術(shù)角度來說根本無法進(jìn)行比對。因此要建立影視行業(yè)內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)體系,保障影視行業(yè)內(nèi)部數(shù)據(jù)使用和交換的一致性、準(zhǔn)確性和規(guī)范性約束,其中包括基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)和指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)?;A(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)包括對所有影視相關(guān)數(shù)據(jù)域的庫表級別的統(tǒng)一管理及映射,如字段屬性、長度精度、值域碼表等;建立元數(shù)據(jù)標(biāo)準(zhǔn),從技術(shù)元數(shù)據(jù)、業(yè)務(wù)元數(shù)據(jù)和管理元數(shù)據(jù)多個維度對元數(shù)據(jù)進(jìn)行管理,統(tǒng)一影視行業(yè)不同數(shù)據(jù)域的元數(shù)據(jù)標(biāo)準(zhǔn)。指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)包括對影視行業(yè)內(nèi)部的指標(biāo)統(tǒng)計口徑的一致性約束,包括指標(biāo)本身的業(yè)務(wù)含義,指標(biāo)的計算規(guī)則,指標(biāo)的計算維度,指標(biāo)的管控規(guī)則等,達(dá)到在影視行業(yè)重要指標(biāo)的統(tǒng)計口徑統(tǒng)一。
3.數(shù)據(jù)分析結(jié)果預(yù)測功能的局限性。雖然大數(shù)據(jù)的最強(qiáng)大功能是對未來趨勢進(jìn)行預(yù)測,但基礎(chǔ)數(shù)據(jù)質(zhì)量的高低,會導(dǎo)致未來的票房或收視率不一定與預(yù)測結(jié)果完全一致。數(shù)據(jù)質(zhì)量越高,預(yù)測的結(jié)果就越準(zhǔn)確。這也要求影視行業(yè)各企業(yè)加強(qiáng)對企業(yè)內(nèi)數(shù)據(jù)管理重要性的認(rèn)識。盤點(diǎn)數(shù)據(jù)資產(chǎn),分析數(shù)據(jù)管理存在的問題,明確未來數(shù)據(jù)管理的組織、流程、制度,制訂數(shù)據(jù)管理的咨詢方案。形成影視行業(yè)企業(yè)內(nèi)甚至在整個影視行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn),對重點(diǎn)數(shù)據(jù)域加強(qiáng)標(biāo)準(zhǔn)化管理,按照標(biāo)準(zhǔn)對既有數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,提高數(shù)據(jù)質(zhì)量,為預(yù)測結(jié)果的準(zhǔn)確性提供強(qiáng)有力的底層數(shù)據(jù)支撐。
4.數(shù)據(jù)安全問題。數(shù)據(jù)已成為國家戰(zhàn)略資源和關(guān)鍵生產(chǎn)要素,數(shù)據(jù)安全關(guān)乎國家安全、商業(yè)機(jī)密及個人隱私,需要處理好數(shù)據(jù)開放利用與隱私保護(hù)之間的關(guān)系。國家相繼出臺了《數(shù)據(jù)安全法》《個人隱私保護(hù)法》等法規(guī)政策,要求在加快培育數(shù)據(jù)要素市場的同時,還要對數(shù)據(jù)進(jìn)行分類分級的安全保護(hù),實(shí)現(xiàn)數(shù)據(jù)安全與數(shù)據(jù)開放利用并重。在對大數(shù)據(jù)進(jìn)行挖掘和指標(biāo)開發(fā)過程中,開發(fā)工程師對數(shù)據(jù)擁有絕對訪問權(quán),影視行業(yè)相關(guān)的基礎(chǔ)數(shù)據(jù)和重要指標(biāo)處于裸露狀態(tài)。在影視行業(yè)企業(yè)內(nèi)或企業(yè)間數(shù)據(jù)傳輸過程中,也存在數(shù)據(jù)泄露風(fēng)險。因此通過數(shù)據(jù)管理流程、數(shù)據(jù)管理職責(zé)分工、數(shù)據(jù)管理制度、數(shù)據(jù)管理考核評價、數(shù)據(jù)授權(quán)、數(shù)據(jù)流向、數(shù)據(jù)質(zhì)量、數(shù)據(jù)規(guī)范等內(nèi)容來加強(qiáng)數(shù)據(jù)安全管理,對原始數(shù)據(jù)進(jìn)行安全分類分級、不同等級的數(shù)據(jù)使用不同的加密方式和安全策略,在數(shù)據(jù)傳輸過程中的加密及集成安全也尤為重要。
黨的二十大報告中明確提出了加快建設(shè)“網(wǎng)絡(luò)強(qiáng)國”和“數(shù)字中國”的戰(zhàn)略目標(biāo)。今年年初,國務(wù)院印發(fā)了《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》,該規(guī)劃明確指出數(shù)字經(jīng)濟(jì)是繼農(nóng)業(yè)經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)之后的主要經(jīng)濟(jì)形態(tài)。5月,中辦、國辦印發(fā)《關(guān)于推進(jìn)實(shí)施國家文化數(shù)字化戰(zhàn)略的意見》,從目標(biāo)到重點(diǎn),從路徑到步驟都做出了戰(zhàn)略部署,成為推動實(shí)施國家文化數(shù)字化戰(zhàn)略、建設(shè)國家文化大數(shù)據(jù)體系的一個框架性、指導(dǎo)性文件。作為電影企業(yè),在響應(yīng)政策號召,加快推進(jìn)電影產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等同電影產(chǎn)業(yè)深度融合,實(shí)施“上云用數(shù)賦智”等方面要有所作為,根據(jù)企業(yè)管理要求和數(shù)據(jù)敏感性要求,在“整體統(tǒng)籌、循序漸進(jìn)、條件具備”的演進(jìn)策略中,對數(shù)據(jù)制定一套合理、科學(xué)的安全分類標(biāo)準(zhǔn)、流程和制度,最終實(shí)現(xiàn)“數(shù)據(jù)不動程序動”“數(shù)據(jù)可用不可見”“只分享價值不分享數(shù)據(jù)”“保留數(shù)據(jù)所有權(quán),釋放使用權(quán)”(見《網(wǎng)絡(luò)安全與數(shù)據(jù)治理》2022年12月第6期第41卷《破解數(shù)據(jù)要素流動與隱私保護(hù)相沖突的局》,作者方濱興。)的安全數(shù)據(jù)模型,將數(shù)據(jù)的價值更好地為企業(yè)賦能,提高經(jīng)濟(jì)質(zhì)量效益和核心競爭力。