張晗
【摘 要】目前,隨著大數據概念的普及,更多的視頻網站已經開始注重在網絡劇的創(chuàng)作過程中對網絡數據的應用。但是所謂“大數據”是否具有可用性,如何妥善使用大數據,還是亟待解決的難題,本文著重分析網絡數據的特征,剖析數據依賴下網絡劇創(chuàng)作誤區(qū)。
【關鍵詞】大數據;網絡??;網絡劇創(chuàng)作
中圖分類號:TP393 文獻標志碼:A 文章編號:1007-0125(2017)02-0135-02
在“互聯網+”的大環(huán)境下,“大數據”成為一種流行詞匯,由于數據提取變得更加及時、方便、可視,諸多視頻網站都越來越依賴于對數據的應用。許多視頻網站在進行生產之前,會根據數據判斷目前市場的稀缺題材、思想風潮、觀眾比例和觀劇傾向。但目前,大數據在中國發(fā)展還不是很成熟,大數據是否能給網絡劇創(chuàng)作提供指導性意見,還需要打一個問號。
IBM曾經將大數據特點總結為三個V:即大量化(Volume)、多樣化(Variety)和快速化(Velocity)。[1]這也意味著,對于網絡劇來說,大量的數據基礎可以擴大對潛在觀眾的研究面,從而達到“激活”觀眾的目的,而大數據的多樣化特征可以使分析更加全面,將不同的聲音囊括其中,使得最終意見形成過程更加民主。而快速化使數據更加直觀,更明確,這有利于生產者更迅速地把握市場風向。但同時,我們也需要看到大數據的復雜性。
首先,大數據的大量化同樣也意味著數據的體量不斷增大,但數據體量大也給數據分析、挖掘等多個方面造成了不小的困難。目前主要面臨的困難是數據具有復雜性,這體現于兩點:第一是數據抓取的復雜性。隨著社交網絡的興起,微信、微博、博客這些短小的文本在進行數據抓取的過程中,由于其短小,有時候會帶來情感缺失,語義不明,主題不明確的負面特征,這使得文本數據抓取的時候,出現“噪聲”。比如骨朵網絡劇數據機構在2016年針對《幻城》的網絡輿情評價時遇到了這樣的難題,在進行微博抓取的時候,某一條微博內容大意為:“《幻城》制作非常粗糙,邏輯生硬,演得莫名其妙,這劇唯一能看的就是馬天宇的臉,我堅持看下去了!”從語義上來判斷,該用戶的評價使數據分析無法將其歸類為正面評價或是負面評價,最后從觀眾由于某種原因最后選擇了追劇,該條微博被算成正面評價。
第二是數據結構具有復雜性,不僅僅只有文本和訪問量才能構成數據,同樣圖形、文檔、視頻都可以構成數據,這些數據被稱為“非結構化數據”。目前微博出現了許多影視網絡大V,他們會用視頻的方式對影視劇進行點評,由于其粉絲眾多,他們的影響力甚至遠超專業(yè)的影評人。但是他們的視頻內容無法通過文本讀取,進入數據分析系統(tǒng),這不能不說是數據分析的一大缺口,目前國內已經有相關科研單位開始對非結構化數據處理的基礎設施進行開發(fā),但非結構化數據處理還沒有深入到網絡劇行業(yè)。
其次,大數據的多樣化使數據可以被感知和提取,但是卻很難進行清洗和提煉,數據干擾大大增加,最后會導致數據匯總和處理出現困難,甚至導致一定的結論偏差。愛奇藝的網絡劇《余罪》第二季由于拍攝倉促,邏輯前后不一,轉折生硬,讓許多觀眾留下了負面評價,但同時這其中的部分觀眾卻一直追到了最后一集,甚至從免費觀眾轉為了付費觀眾。單單從評價數據來看,是無法預判這樣的結果的。所以我們可以認為大數據的多樣化方便于采集更多的意見,但是也給意見統(tǒng)一化造成了難度。
最后,大數據的快速化也反映在網絡劇上,如今大多數網絡劇頁面都有播放量、評分、評論量,大數據不僅可以快速獲取,而且可以快速被“可視化”。一些單獨的數據抓取網頁上,觀劇者的地域、年齡層、觀劇時段也可以被快速地反映出來,它是觀眾觀劇行為的一種集中體現,這對開發(fā)網絡劇續(xù)作的制作團隊無疑是一種有效反饋,但是對于正在開發(fā)新網絡劇的人來說,其它網絡劇數據的確是具有“效率”的,但是否具有“效能”,還無法判斷。人們每天在接收大量信息的同時,也很難注意力聚焦,思維變化極快。這就使得曾經一度在網絡劇中出現的“屌絲”風、快節(jié)奏風在短暫的成為網絡劇的流行性特征之后,迅速地消失了。
所以中國網絡劇盡管在運用“大數據”,但目前中國的數據處理技術,還不足以讓大數據來支撐網絡劇的生產。用戶的數據無論是分離處理還是聚合處理,都各有缺陷,雖然這些數據都富有極高的商業(yè)價值,但在技術暫時還無法完全做到去冗存真、去繁就簡的情況下,數據本身只能作為參考性意見,貿然依賴大數據反而是一種不科學的做法。
但目前中國網絡劇生產者對大數據產生了不正確的判斷,并且過度迷戀其表面含義,極力渲染“大數據”的作用,而拒絕深挖其內涵,這給網絡劇投資、生產、宣傳環(huán)境都帶來了極深的誤導。目前網絡劇對“大數據”的迷信體現于三點:第一,相信數據可以指導創(chuàng)作。一些資深的電視劇制作公司,如克頓傳媒甚至還打出了“一切依靠大數據”的旗號。一些網絡劇為了追趕網民的興趣潮流,去研究微博話題討論量較高的現象級話題以及流行網絡詞語,比如“冰桶挑戰(zhàn)”、“江南皮革廠”等等,這些都被應用在了網絡劇中,有的甚至已經失去了原有的語義,單單作為一個流行因素被強行夾雜在劇情之中,它并沒有起到搞笑的作用,反而增加了劇本的硬傷。
第二,對網絡點擊率的過分炒作。傳統(tǒng)電視劇需要警惕“收視率”是唯一標準,而網絡劇也需要謹防對網絡點擊率的過度追捧。但是由于網頁頁面上的點擊率可視化,獲取方式更簡便,直觀,所以網絡劇似乎從誕生之日起就與點擊率有著分割不開的關系?!度f萬沒想到》系列,用率先破億的網絡短劇來標榜自己的成功。之后號稱大制作的《盜墓筆記》也以全年27億播放量“榮登”年度點擊冠軍。2016年暑期,網絡劇市場連續(xù)推出幾部大劇《九州·天空城》、《老九門》等等,《老九門》自從上線之后,就不斷地炒作其點擊量成績傲人,十分鐘破億的數據成績被大肆渲染宣傳,最后其點擊量達到100億次,被稱為“完美收官”。點擊量不僅成了一種新型營銷手段,也成為了網絡劇互相攀比的硬指標。
第三,點擊率造假。由于對數據的過分依賴,再加上網頁頁面數據直觀,具有一定的消費引導性,點擊率造假已經成為了網絡劇業(yè)內的潛規(guī)則。2014年,前十名網絡劇的單部劇點擊量還在1億左右。但是到2015年,這個數字攀升到了10億左右。到2016年,熱播的網絡劇基本都可以達到40億,甚至破百億的點擊量。這個數字并不能說明網絡劇市場繁榮,而只是說明其注水的現象越來越猖獗。截至2016年6月,我國網民規(guī)模達到7.1億,網絡視頻用戶規(guī)模為5.1億的,網民使用率為72.4%。[2]那么一部50集的網絡劇,其點擊規(guī)模達到100億,核算每一集的點擊量就在2億左右,如果估算一下重復觀看的數據,其水分仍然很大。與此同時,視頻網站對一些網絡劇制作者自身刷點擊量,保持默許甚至是助推的態(tài)度,甚至淘寶網上也有公開刷數據的業(yè)務交易鏈接,并且可以評論、點贊、彈幕、點擊量同時刷,其造假態(tài)度之明目張膽,令人大開眼界。
如今我們看到,大數據盡管為網絡劇帶來了更科學和精確的參考性指標,但是數據污染如此嚴重并愈演愈烈的情況下,大數據變成了濫數據,數據淪為了營銷工具,而喪失了其基本作用。網絡劇的生產者并沒有被大數據的民主性所影響,反而助漲了單一的數據思維,只注重網絡劇是否能夠拉高點擊率和具有討論熱度,從而對內容和品質不再做要求。目前娛樂相關數據普遍水分較大,點擊率污染嚴重,脫水不易。水軍公司在背后助推,做假點擊率、假評論和假話題,使一條黑色的數據產業(yè)鏈正在形成。在這樣的情形下,大數據已經喪失了原有的價值,甚至成為網絡劇創(chuàng)作的阻礙,數據只能讓創(chuàng)作者被動地、甚至是錯誤地追逐觀眾,喪失了網絡劇故事的原動力。
參考文獻:
[1]王元卓,靳小龍,程學旗.網絡大數據:現狀與展望[J].計算機學報,2013,36(6):1125-1138.
[2]2016年7月第38次中國互聯網絡發(fā)展狀況統(tǒng)計報告[EB/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201608/P020160803367337470363.pdf