亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

中國(guó)電影線上評(píng)分系統(tǒng)的改進(jìn)

2018-06-20 06:17:32謝荻帆杜子芳

計(jì)算機(jī)應(yīng)用 2018年4期

謝荻帆,杜子芳

0 引言

目前,中國(guó)電影線上市場(chǎng)中的評(píng)價(jià)標(biāo)準(zhǔn)主要有三種,可以概括為官方認(rèn)可度、口碑影響力和受眾關(guān)注度。其中官方認(rèn)可度指電影作品在主流獎(jiǎng)項(xiàng)評(píng)選中的提名或者獲獎(jiǎng)情況；受眾關(guān)注指電影的網(wǎng)絡(luò)播放量、收視率以及話題討論熱度；而口碑影響力則直接表現(xiàn)為大眾觀影者對(duì)于電影的評(píng)價(jià),即電影線上評(píng)分。隨著國(guó)內(nèi)外電影線上評(píng)分系統(tǒng)的快速發(fā)展,電影評(píng)分已成為電影消費(fèi)者重要信息來(lái)源,商家可以通過(guò)挖掘評(píng)分?jǐn)?shù)據(jù)分析用戶差異從而尋找更多商機(jī),同時(shí)很多研究者都已經(jīng)基于電影線上評(píng)分系統(tǒng)進(jìn)行過(guò)相關(guān)研究[1-3],因此,研究中國(guó)電影線上評(píng)分系統(tǒng)具有一定理論價(jià)值和現(xiàn)實(shí)意義。

以豆瓣網(wǎng)電影評(píng)分系統(tǒng)為例,豆瓣網(wǎng)是中國(guó)一個(gè)較流行的針對(duì)電影、書籍、音樂(lè)等的社交型網(wǎng)站,而豆瓣電影是該網(wǎng)站提供的一個(gè)主要針對(duì)電影進(jìn)行評(píng)論及評(píng)分的功能模塊,其中,評(píng)分共分為五個(gè)檔次,采取十分制平均加權(quán)計(jì)算方法,數(shù)據(jù)會(huì)實(shí)時(shí)自動(dòng)更新。豆瓣電影的評(píng)分信息來(lái)自消費(fèi)者主觀體驗(yàn),符合口碑影響力的發(fā)布主體特征;評(píng)論不限定特定人群,參與用戶分布較廣,人群異質(zhì)性保證評(píng)分結(jié)果具有代表性;擁有大量活躍用戶使得建立起豐富的數(shù)據(jù)資料庫(kù)[2]?；诖?本文選取豆瓣電影網(wǎng)站中的電影評(píng)分信息作為樣本數(shù)據(jù)。

中國(guó)現(xiàn)有的電影線上評(píng)分系統(tǒng)主要使用加權(quán)平均法計(jì)算評(píng)分,即認(rèn)為參與評(píng)價(jià)的觀影者信息可以反映全體觀影者信息,它的原理是簡(jiǎn)單隨機(jī)抽樣中樣本信息可以反映總體信息。而實(shí)際上,雖然電影線上評(píng)分可以很好地量化觀影者對(duì)影片的評(píng)價(jià),可以被視為消費(fèi)者群體的自發(fā)反饋[2],但每個(gè)觀影者對(duì)于是否參與評(píng)價(jià)都擁有自主選擇權(quán),線上評(píng)分系統(tǒng)更像是非概率抽樣。因此,本文在原有的一般方法基礎(chǔ)上,加入評(píng)價(jià)參與率的信息,提出一種對(duì)電影線上評(píng)分系統(tǒng)進(jìn)行改進(jìn)的方法；同時(shí)借助斷點(diǎn)回歸設(shè)計(jì)方法,提出分歧點(diǎn)和分歧效應(yīng)的概念,并以此為標(biāo)準(zhǔn)對(duì)電影線上評(píng)分系統(tǒng)進(jìn)行比較。

1 理論基礎(chǔ)

1.1 分歧點(diǎn)與分歧效應(yīng)

針對(duì)線上電影評(píng)分系統(tǒng)的比較標(biāo)準(zhǔn),本文提出分歧點(diǎn)與分歧效應(yīng)的概念。分歧,即意愿不一致而產(chǎn)生的對(duì)峙。一般情況下,不同的人給同一部影片評(píng)分,其結(jié)果不盡相同;同樣,一個(gè)人并非愿意參與任何一部影片的評(píng)價(jià),由此便會(huì)產(chǎn)生“分歧”。

假設(shè)影片的真實(shí)評(píng)分與參與評(píng)價(jià)該影片的人數(shù)之間成正比,可以設(shè)計(jì)如上兩個(gè)情景。對(duì)于同一分?jǐn)?shù)段的影片,有的參與評(píng)價(jià)人數(shù)多,有的參與評(píng)價(jià)人數(shù)少,之間存在著一個(gè)跳躍(如圖1中的情景一);對(duì)于參與評(píng)價(jià)人數(shù)一致的影片,有的評(píng)分高,有的評(píng)分低,之間存在著一個(gè)跳躍(如圖1中的情景二)。以情景一為例,對(duì)于真實(shí)評(píng)分相同的兩部電影參與評(píng)分的人數(shù)存在差異,可以用式(1)進(jìn)行表示:

(1)

當(dāng)τ0的絕對(duì)值足夠大時(shí),可以認(rèn)可這個(gè)跳躍的確存在,即該評(píng)分系統(tǒng)中存在分歧。由此,X=X0記為一個(gè)分歧點(diǎn),τ0的絕對(duì)值反映該點(diǎn)上的分歧效應(yīng)大小,表示該點(diǎn)上參與評(píng)價(jià)人數(shù)跳躍的程度。情景二可以用同樣的方式進(jìn)行分析。

圖1 評(píng)分系統(tǒng)中產(chǎn)生分歧的兩種情景

對(duì)于任何評(píng)分系統(tǒng)而言,得到的評(píng)分結(jié)果都是對(duì)電影真實(shí)評(píng)分的估計(jì)值,一方面分歧點(diǎn)越少的評(píng)分系統(tǒng)意味著評(píng)分與參與評(píng)價(jià)人數(shù)接近于一一對(duì)應(yīng),評(píng)分系統(tǒng)中的得分不僅反映電影的口碑影響力,還在一定程度上反映該影片受眾關(guān)注度,該系統(tǒng)對(duì)于受眾選擇觀影影片更具有指導(dǎo)作用;另一方面分歧效應(yīng)越小意味著相同口碑影響力的電影具有更接近的受眾關(guān)注度,實(shí)際當(dāng)中分歧點(diǎn)個(gè)數(shù)為0的評(píng)分系統(tǒng)幾乎是不存在的,故分歧效應(yīng)越小越好。對(duì)此,分歧點(diǎn)個(gè)數(shù)與分歧效應(yīng)大小可以作為兩個(gè)評(píng)價(jià)評(píng)分系統(tǒng)優(yōu)劣的標(biāo)準(zhǔn),本文在這兩標(biāo)準(zhǔn)的基礎(chǔ)上對(duì)不同電影線上評(píng)分系統(tǒng)進(jìn)行比較。

1.2 改進(jìn)的評(píng)分方法

(2)

實(shí)際上,加權(quán)平均法的原理是簡(jiǎn)單隨機(jī)抽樣下樣本信息即可反映總體信息,但對(duì)于評(píng)分系統(tǒng)而言,這顯然是不夠合理的,因?yàn)橹鲃?dòng)權(quán)不再是調(diào)查者,而換成了被調(diào)查者,每一個(gè)觀影者都有權(quán)利選擇是否對(duì)觀看過(guò)的影片進(jìn)行評(píng)價(jià),因此電影線上評(píng)分系統(tǒng)需要在原來(lái)普通方法的基礎(chǔ)上進(jìn)行一定的調(diào)整。

在估計(jì)美國(guó)學(xué)術(shù)能力評(píng)估測(cè)驗(yàn)(Scholastic Assessment Test, SAT)平均分的過(guò)程中考慮到成績(jī)?cè)胶玫膶W(xué)生越有可能報(bào)名參加考試,因此實(shí)際的觀測(cè)結(jié)果與真實(shí)結(jié)果相比是有偏的[7]。受這樣的啟發(fā),本文設(shè)計(jì)了加入?yún)⑴c率的評(píng)分方法。假設(shè)一,參與評(píng)價(jià)的人均觀看過(guò)評(píng)分影片;假設(shè)二,影片的真實(shí)評(píng)分越高,一名觀看過(guò)該影片的人參與評(píng)價(jià)的可能性越高。令一部電影的評(píng)分為Xi,電影的真實(shí)評(píng)分由兩部分組成,一部分是可以觀測(cè)到的參與評(píng)價(jià)的觀影者給出的平均評(píng)分Xi1,另一部分是觀測(cè)不到的未參與評(píng)價(jià)的觀影者的平均評(píng)分Xi0,再設(shè)評(píng)價(jià)參與率(對(duì)于第i部電影的參與評(píng)價(jià)人數(shù)占總觀看人數(shù)的比重)為pi,則電影評(píng)分可以表示如下:

Xi=Xi1·pi+Xi0·(1-pi)

(3)

根據(jù)截?cái)嗾龖B(tài)選擇模型[7],在電影評(píng)分基本服從正態(tài)分布,同時(shí)參與評(píng)分的都是最愿意對(duì)電影進(jìn)行評(píng)價(jià)的觀影者的假設(shè)下,真實(shí)評(píng)分和觀測(cè)評(píng)分之間的關(guān)系可以表示如下:

Xi1=Xi+σi·z*(pi)

(4)

其中:σi是一個(gè)未知的電影評(píng)分分布的標(biāo)準(zhǔn)差；z*(pi)是指被上pi分位點(diǎn)Zpi左截尾的標(biāo)準(zhǔn)正態(tài)分布的平均值。z*(pi)的計(jì)算公式如下:

z*(pi)=φ(zpi)/pi

(5)

而σi與觀測(cè)到的評(píng)分標(biāo)準(zhǔn)差σi1之間又存在如下關(guān)系:

(6)

有些情況下,會(huì)假設(shè)不同電影評(píng)分的標(biāo)準(zhǔn)差一致,即σi=σ。

由于電影的評(píng)價(jià)參與率與電影的真實(shí)評(píng)分有關(guān),假設(shè)真實(shí)評(píng)分較高的電影往往比較易于評(píng)價(jià),而真實(shí)評(píng)分較低的電影,觀影者往往選擇不予評(píng)價(jià)。因此使評(píng)價(jià)參與率服從下面的這個(gè)函數(shù)形式:

r(x)=Φ((x-λ)/β); -∞

(7)

其中:Φ為標(biāo)準(zhǔn)正態(tài)分布函數(shù)；x是電影評(píng)分；λ與β是未知參數(shù)。由此可以估計(jì)出一部電影的評(píng)價(jià)參與率pi=r(Xi),并可以對(duì)觀測(cè)評(píng)分進(jìn)行修正。

1.3 增加輔助信息

以上方法均是基于評(píng)分指標(biāo)進(jìn)行計(jì)算,但觀影者的主觀評(píng)分與影片的口碑影響力之間仍存在差距,一些研究者選擇向評(píng)分系統(tǒng)中添加額外的輔助變量,從而使電影評(píng)分與其真實(shí)的口碑影響力更加接近。比如標(biāo)簽類網(wǎng)站Delicious的熱門書簽排行榜中使用過(guò)去一小時(shí)被收藏次數(shù)進(jìn)行排名,以計(jì)算機(jī)科學(xué)和創(chuàng)業(yè)為主題的社會(huì)新聞網(wǎng)站Hacker News在評(píng)分系統(tǒng)中加入重力因子的概念從而體現(xiàn)出新舊交替的作用,還有基于牛頓提出的冷卻定律公式設(shè)計(jì)出的排名更新規(guī)則[8]。

美國(guó)著名互聯(lián)網(wǎng)電影資料庫(kù)(Internet Movie Database, IMDb)在評(píng)選前250部影片時(shí)采取排名制度法的評(píng)價(jià)方法,在觀影者的主觀評(píng)分的基礎(chǔ)上增加了是否是經(jīng)常投票者的標(biāo)簽,從而計(jì)算出一部影片的評(píng)價(jià)者中經(jīng)常參與評(píng)價(jià)的人占全部參與評(píng)價(jià)人數(shù)的比重。具體計(jì)算公式如下:

(8)

其中:W_Xi表示第i部影片的加權(quán)分?jǐn)?shù)；vi表示經(jīng)常投票者的投票數(shù)；m表示進(jìn)入榜單需要的最少票數(shù)；Xi為普通方法計(jì)算出的平均分；C為目前所有電影的平均分。這種方法的好處是可以排除掉那些只有極少數(shù)投票者但評(píng)分極高的電影,同時(shí)保留投票數(shù)較少但評(píng)分較高的小眾電影,而經(jīng)常投票者的投票數(shù)v可以將“刷票行為”排除在最終分?jǐn)?shù)之外。具體來(lái)看,W_X是X的一個(gè)修正值,而修正幅度是由經(jīng)常參與評(píng)價(jià)者占全部參與評(píng)價(jià)者比重決定。以第i部電影為例,設(shè)ui=C/Xi,修正系數(shù)Δ,有Δ=W_Xi/Xi,同時(shí)設(shè)經(jīng)常參與評(píng)價(jià)者占全部參與評(píng)價(jià)者比重為αi,則vi=αi·Yi。由此式(8)可以轉(zhuǎn)化為:

(9)

2 研究方法

本文首先確定兩個(gè)評(píng)價(jià)評(píng)分系統(tǒng)優(yōu)劣的標(biāo)準(zhǔn),即分歧點(diǎn)個(gè)數(shù)與分歧效應(yīng)大小;其次,在該評(píng)價(jià)標(biāo)準(zhǔn)基礎(chǔ)上利用統(tǒng)計(jì)學(xué)中斷點(diǎn)回歸設(shè)計(jì)(Regression Discontinuity Design, RDD)的方法對(duì)不同的電影線上評(píng)分系統(tǒng)進(jìn)行比較。

斷點(diǎn)回歸的方法作為一種偽隨機(jī)實(shí)驗(yàn)方法在社會(huì)學(xué)、行為學(xué)和自然科學(xué)中已得到廣泛應(yīng)用,它最早由Campbell等[9]提出,后被分為清晰斷點(diǎn)回歸和模糊斷點(diǎn)回歸兩個(gè)類型[10]。一般情況下,電影評(píng)分越高其受眾關(guān)注度越高,相應(yīng)的參與評(píng)價(jià)人數(shù)越多,假設(shè)存在分歧點(diǎn),則將分歧點(diǎn)兩側(cè)評(píng)分與參與評(píng)價(jià)人數(shù)之間關(guān)系存在的跳躍視為存在分歧效應(yīng)的作用,因此本文使用清晰斷點(diǎn)回歸的方法,電影評(píng)分X是指派變量,將不同影片“分配”到臨界值左右兩側(cè);電影參與評(píng)價(jià)人數(shù)Y是結(jié)果變量,是重點(diǎn)關(guān)注的受分歧作用影響的變量。

斷點(diǎn)回歸的估計(jì)方法分為參數(shù)估計(jì)和非參數(shù)估計(jì),本文使用局部多項(xiàng)式估計(jì)的方法。該方法具有優(yōu)良的邊界性質(zhì),是斷點(diǎn)回歸研究中非參數(shù)估計(jì)的首選,使用R中的rdrobust程序包進(jìn)行算法實(shí)現(xiàn)[11],采用均方誤差最優(yōu)帶寬選擇方法確定τ0的一致漸近最優(yōu)點(diǎn)估計(jì),并給出顯著性檢驗(yàn)的p值。

3 實(shí)證分析

3.1 數(shù)據(jù)來(lái)源與研究步驟

本文的數(shù)據(jù)均來(lái)自豆瓣網(wǎng)(https://www.douban.com/ doulist/),觀測(cè)期為2014—2016年,樣本容量分別為323、365和396,總計(jì)1 084部電影。以2016年的數(shù)據(jù)為例,線上評(píng)分越高的電影,平均參與評(píng)價(jià)的人數(shù)越多,該分?jǐn)?shù)段參與評(píng)價(jià)人數(shù)的離散程度越高,評(píng)分與參與評(píng)價(jià)人數(shù)之間的皮爾遜相關(guān)系數(shù)為0.52,通過(guò)顯著性檢驗(yàn),由此可以推斷電影的線上評(píng)分與參與評(píng)價(jià)的人數(shù)之間存在正相關(guān)關(guān)系,且豆瓣電影網(wǎng)上的評(píng)分?jǐn)?shù)據(jù)可用正態(tài)分布進(jìn)行描述[1]。

圖2 2016年中國(guó)上映電影評(píng)分與參與評(píng)價(jià)人數(shù)比較箱線圖

為便于分析,本文只討論情景一。由于樣本數(shù)據(jù)的評(píng)分結(jié)果是根據(jù)平均加權(quán)法得到的,屬于10分制評(píng)分系統(tǒng),故通過(guò)調(diào)整參數(shù)利用樣本數(shù)據(jù)計(jì)算得到另外兩種方法的評(píng)分結(jié)果,評(píng)分范圍限制在0～10,考慮到評(píng)分極高或極低的影片數(shù)量非常少,則將分歧點(diǎn)的尋找范圍限制在3～8。通過(guò)尋找分歧點(diǎn)并計(jì)算分歧效應(yīng)來(lái)對(duì)三種評(píng)分系統(tǒng)進(jìn)行比較,具體步驟如下:首先,在區(qū)間[3,8]等間隔確定1 000個(gè)點(diǎn),每個(gè)點(diǎn)的坐標(biāo)可以表示為xs=3+0.005s(s=1,2,…,1 000),以點(diǎn)xs為臨界值,在95%置信水平下判斷X=xs是否為間斷點(diǎn),以此遍歷1 000個(gè)點(diǎn),其中通過(guò)統(tǒng)計(jì)學(xué)檢驗(yàn)的點(diǎn)記為分歧點(diǎn);其次,將通過(guò)統(tǒng)計(jì)學(xué)檢驗(yàn)的間斷點(diǎn)上的處置效應(yīng)τ0求絕對(duì)值,從而得到每個(gè)分歧點(diǎn)上的分歧效應(yīng);最后,統(tǒng)計(jì)分歧點(diǎn)個(gè)數(shù)并將分歧效應(yīng)進(jìn)行求和,從而對(duì)不同的評(píng)分系統(tǒng)進(jìn)行比較。

3.2 評(píng)分系統(tǒng)的比較分析

為了讓不同的評(píng)分系統(tǒng)具有可比性,以及通過(guò)評(píng)分更直觀地得到電影在全部影片中的排序位置,還可以將計(jì)算出的結(jié)果如式(10)進(jìn)行離差標(biāo)準(zhǔn)化,將標(biāo)準(zhǔn)化后的評(píng)分限定在[0,10]:

(10)

對(duì)評(píng)分系統(tǒng)中參數(shù)進(jìn)行設(shè)置:參與率法中,評(píng)價(jià)參與率分布中的未知參數(shù)λ決定評(píng)價(jià)參與率為0.5的電影對(duì)應(yīng)評(píng)分,故令參數(shù)λ為全部影片觀測(cè)評(píng)分的平均值,參數(shù)β決定評(píng)價(jià)參與率為100%的極端評(píng)分的范圍,β越小,評(píng)價(jià)參與率為100%的極端評(píng)分范圍越大,通過(guò)實(shí)驗(yàn)本文最終設(shè)定β=1,使前10%以內(nèi)的影片評(píng)價(jià)參與率接近100%;排名制度法中,在缺少經(jīng)常參與評(píng)價(jià)者信息情況下需要對(duì)經(jīng)常參與評(píng)價(jià)者占全部參與評(píng)價(jià)者比重αi進(jìn)行估計(jì),設(shè)αi=α=1,即該比重不會(huì)根據(jù)電影真實(shí)評(píng)分高低而產(chǎn)生差異,且全部參與評(píng)價(jià)的人均被認(rèn)為經(jīng)常參與評(píng)價(jià),最少評(píng)價(jià)人數(shù)m用參與評(píng)價(jià)人數(shù)最少的一部影片的數(shù)據(jù)進(jìn)行估計(jì);此外,箱體窗寬h的選擇由程序包中的帶寬選擇器實(shí)現(xiàn)。

如圖3所示,改進(jìn)后評(píng)分絕大多數(shù)超過(guò)原來(lái)的加權(quán)平均法評(píng)分,且在同方差假設(shè)下,即假設(shè)不同電影評(píng)分的標(biāo)準(zhǔn)差一致σ=E(σi),電影的評(píng)分排序不變,越靠近平均水平的電影其評(píng)分調(diào)整越多,但在異方差假設(shè)下,即假設(shè)不同電影評(píng)分的標(biāo)準(zhǔn)差不同,電影的評(píng)分排序發(fā)生變化,尤其是低分段電影,有些改進(jìn)后評(píng)分低于原始評(píng)分。如圖4所示，從電影評(píng)分的標(biāo)準(zhǔn)差隨評(píng)分變化的關(guān)系中可以看出,觀影者在評(píng)價(jià)高分段和低分段電影時(shí)存在差異較小,但在評(píng)價(jià)中間分?jǐn)?shù)段電影時(shí)可能存在差異較大,評(píng)分為5分左右的電影其標(biāo)準(zhǔn)差取到最大。

圖3 2016年電影改進(jìn)后評(píng)分與原評(píng)分的比較

圖4 2016年電影加權(quán)評(píng)分標(biāo)準(zhǔn)差隨評(píng)分的變化情況

以分歧點(diǎn)個(gè)數(shù)和分歧效應(yīng)大小為評(píng)價(jià)標(biāo)準(zhǔn),比較評(píng)分系統(tǒng)間的差異,結(jié)果如表1所示,可以得到下面三個(gè)結(jié)論。

第一,增加輔助信息后的評(píng)分系統(tǒng)一定程度上可能具有更多的分歧點(diǎn)和更大的分歧效應(yīng),尤其是對(duì)于加權(quán)平均法的評(píng)分系統(tǒng)而言。本文增加的一個(gè)輔助信息為是否經(jīng)常參與評(píng)價(jià),若評(píng)價(jià)人經(jīng)常參與評(píng)價(jià),則該人的評(píng)分在計(jì)算電影分?jǐn)?shù)時(shí)會(huì)被賦予更大的權(quán)重;另一個(gè)輔助信息為全部電影平均分,它使得原始評(píng)分較低或較高的電影分?jǐn)?shù)會(huì)向平均分方向進(jìn)行調(diào)整,這樣的評(píng)分系統(tǒng)改變了原有的評(píng)分與參與評(píng)價(jià)人數(shù)之間的關(guān)系。實(shí)際上,這種評(píng)分系統(tǒng)雖然避免了一些極端評(píng)分行為對(duì)電影分?jǐn)?shù)排名的影響,卻一定程度上削弱了評(píng)分系統(tǒng)對(duì)于電影口碑影響力與受眾關(guān)注度之間的正相關(guān)的結(jié)構(gòu)。

第二,對(duì)加權(quán)平均法計(jì)算出的評(píng)分進(jìn)行標(biāo)準(zhǔn)化后,分歧點(diǎn)個(gè)數(shù)和分歧效應(yīng)大小會(huì)相應(yīng)增加,但是參與率法計(jì)算出的評(píng)分在標(biāo)準(zhǔn)化前后,分歧點(diǎn)個(gè)數(shù)和分歧效應(yīng)大小變化不大。如圖5所示,以原始分?jǐn)?shù)為橫軸、以標(biāo)準(zhǔn)化后的分?jǐn)?shù)為縱軸繪制散點(diǎn)圖并進(jìn)行線性擬合,可以看出,加權(quán)平均法下直線斜率會(huì)超過(guò)1,電影的分?jǐn)?shù)分布更加分散,這一定程度上會(huì)增加分歧點(diǎn)個(gè)數(shù)和分歧效應(yīng)大小。

第三,對(duì)評(píng)分進(jìn)行標(biāo)準(zhǔn)化后,利用參與率法計(jì)算出的評(píng)分的分歧點(diǎn)個(gè)數(shù)和分歧效應(yīng)大小可能小于加權(quán)平均分的分歧點(diǎn)個(gè)數(shù)和分歧效應(yīng)大小。進(jìn)行標(biāo)準(zhǔn)化的目的是為了讓內(nèi)部構(gòu)成不同的評(píng)分系統(tǒng)具有可比性,在一個(gè)10分制系統(tǒng)中得2分的電影并不意味著它超過(guò)了20%的其他電影,經(jīng)過(guò)離差標(biāo)準(zhǔn)化后,數(shù)值范圍限定在[0,10],且消除了量綱和變異因素的影響,通過(guò)電影評(píng)分的大小可以大致判斷該電影在全部電影中的排名。故從產(chǎn)生分歧的角度來(lái)看,參與率法相對(duì)于加權(quán)平均法來(lái)說(shuō)有所改進(jìn)。

表1 2014—2016年電影線上評(píng)分系統(tǒng)基于分歧點(diǎn)個(gè)數(shù)和分歧效應(yīng)大小的比較

3.3 評(píng)價(jià)標(biāo)準(zhǔn)的合理性檢驗(yàn)

從理論角度來(lái)看,前提假設(shè)是分歧效應(yīng)可以有效區(qū)分評(píng)分系統(tǒng)的優(yōu)劣,分歧效應(yīng)的大小直接反映了參與評(píng)價(jià)同一分?jǐn)?shù)段(口碑影響力)影片的評(píng)價(jià)人數(shù)(受眾關(guān)注度)存在差異的程度。在分歧效應(yīng)越大的系統(tǒng)中,參與評(píng)價(jià)人數(shù)懸殊的兩部影片取得近似評(píng)分的可能性越大,說(shuō)明該系統(tǒng)存在缺陷;而在分歧效應(yīng)越小的系統(tǒng)中,評(píng)分大小更能反映影片在市場(chǎng)中口碑影響力的真實(shí)位置,說(shuō)明該系統(tǒng)比較完善。

從實(shí)際分析結(jié)果來(lái)看,圖6展示的是觀測(cè)期內(nèi)排名制度法下(加權(quán)平均法計(jì)算電影分?jǐn)?shù))分歧點(diǎn)與分歧效應(yīng)隨參數(shù)α改變而變化的情況,當(dāng)α較大時(shí),經(jīng)常參與評(píng)價(jià)者占全部參與評(píng)價(jià)者比重與分歧效應(yīng)大小基本成負(fù)相關(guān)關(guān)系,而觀測(cè)期內(nèi)分歧點(diǎn)個(gè)數(shù)與分歧效應(yīng)大小又成高度顯著的正相關(guān)關(guān)系,因此,經(jīng)常參與評(píng)價(jià)者占全部參與評(píng)價(jià)者比重越大,分歧點(diǎn)越少,分歧效應(yīng)越小。實(shí)際上,越是經(jīng)常參與評(píng)價(jià)的觀影者,其觀看過(guò)的影片可能越多,給出的評(píng)分應(yīng)該越客觀,類似于專家打分,因此,可以認(rèn)為α越大,電影的觀測(cè)評(píng)分與真實(shí)評(píng)分越接近,評(píng)分系統(tǒng)越好。

因此,本文評(píng)價(jià)標(biāo)準(zhǔn)的合理性得到檢驗(yàn),即分歧點(diǎn)越少、分歧效應(yīng)越小的評(píng)分系統(tǒng)越好。

圖5 2016年電影線上評(píng)分標(biāo)準(zhǔn)化前后對(duì)比

圖6 2014—2016年排名制度法產(chǎn)生的分歧效應(yīng)情況

4 結(jié)語(yǔ)

通過(guò)以上分析可以發(fā)現(xiàn),加入?yún)?shù)率后改進(jìn)的方法相對(duì)于加權(quán)平均法,一方面考慮到未參與評(píng)價(jià)的觀影者信息,得到的評(píng)分理論上更能反映影片真實(shí)的口碑影響力;另一方面消除量綱影響后可能具有更少的分歧效應(yīng),更能反映一部電影在全部影片中的排序位置。同時(shí),利用斷點(diǎn)回歸的方法,從分歧點(diǎn)和分歧效應(yīng)的角度分析不同評(píng)分系統(tǒng)間的差異,具有一定合理性和可操作性。

參考文獻(xiàn)(References)

[1] 由明陽(yáng), 黃飛虎.基于觀點(diǎn)動(dòng)力學(xué)的電影在線評(píng)分預(yù)測(cè)[J]. 現(xiàn)代計(jì)算機(jī), 2016(2): 7-11.(YOU M Y, HUANG F H. Online rating score prediction for movie based on opinion dynamics [J]. Modern Computer, 2016(2): 7-11.)

[2] 陳素白, 章怡成, 高詩(shī)劼.錨定效應(yīng)在網(wǎng)絡(luò)口碑領(lǐng)域中的考察: 以豆瓣電影在線評(píng)分為例[J]. 國(guó)際新聞界, 2016(3): 34-48.(CHEN S B, ZHANG Y C, GAO S J. An empirical study of anchoring effect in the field of online world-of-mouth: take Douban movies’ online rating system as an example [J]. Journal of International Communication, 2016(3): 34-48.)

[3] 王秦英, 閆強(qiáng).在線評(píng)分的交互效應(yīng)研究: 基于個(gè)體評(píng)分視角[J]. 中國(guó)管理科學(xué), 2013(S2): 440-446.(WANG Q Y, YAN Q. A research about the interactive effects of online scores: from the perspective of individual scores [J]. Chinese Journal of Management Science, 2013(S2): 440-446.)

[4] GILBERT E. Widespread underprovision on Reddit [C]// CSCW 2013: Proceedings of the 2013 Conference on Computer Supported Cooperative Work. New York: ACM, 2013: 803-808.

[5] HOGG T, LERMAN K. Disentangling the effects of social signals[EB/OL]. [2016- 12- 10]. https://arxiv.org/pdf/1410.6744.pdf.

[6] STODDARD G. Popularity and quality in social news aggregators: a study of Reddit and hacker news [C]// WWW 2015: Proceedings of the 24th International Conference on World Wide Web. New York: ACM, 2015: 815-818.

[7] HOLLAND P W, WAINER H. Sources of uncertainty often ignored in adjusting state mean SAT scores for differential participation rates: the rules of the game [J]. Applied Measurement in Education, 1990, 3(4): 369-377.

[8] MILLER E. Rank hotness with Newton’s law of cooling [EB/OL]. [2009- 02- 15]. http: //www.evanmiller.org/rank-hotness-with-newtons-law-of-cooling.html.

[9] CAMPBELL D T, STANLEY J C. Experimental and Quasi-Experimental Designs for Research [M]. Boston, MA: Houghton Miffin Company, 1963: 1-88.

[10] TROCHIM W M K. Research design for program evaluation: the regression discontinuity approach [J]. Journal of the American Statistical Association, 1984, 81(395): 272.

[11] CALONICO S, CATTANEO M D, TITIUNIK R. Rdrobust: anRpackage for robust nonparametric inference in regression-discontinuity designs [J]. R Journal, 2013, 7(1): 38-51.