丁 軍 高大啟 薛程元 陳小紅
1(華東理工大學(xué)信息科學(xué)與工程學(xué)院 上海 200237)2(盛大游戲數(shù)據(jù)中心 上海 201203)
?
基于社交網(wǎng)絡(luò)的MMORPG玩家流失分析與預(yù)測(cè)
丁軍1高大啟1薛程元1陳小紅2
1(華東理工大學(xué)信息科學(xué)與工程學(xué)院上海 200237)2(盛大游戲數(shù)據(jù)中心上海 201203)
針對(duì)大型多人在線角色扮演游戲MMORPG(MassiveMultiplayerOnlineRole-PlayingGame)的玩家流失分析與預(yù)測(cè)問(wèn)題,采用Cox比例風(fēng)險(xiǎn)模型建立玩家的流失模型,對(duì)玩家流失的因素進(jìn)行分析,并對(duì)流失進(jìn)行預(yù)測(cè)。分析玩家在游戲中的社交網(wǎng)絡(luò)的特征(玩家的好友關(guān)系、二度好友關(guān)系、好友間聊天情況)對(duì)玩家流失行為的影響。對(duì)盛大“星辰變”游戲數(shù)據(jù)的實(shí)驗(yàn)表明,游戲中玩家所處的社交網(wǎng)絡(luò)對(duì)玩家的流失行為具有顯著影響,并能夠提高預(yù)測(cè)效果。與支持向量機(jī)、Logistic回歸和樸素貝葉斯分類(lèi)進(jìn)行對(duì)比,表明Cox模型更加適用于該玩家流失預(yù)測(cè)問(wèn)題。
流失分析流失預(yù)測(cè)Cox回歸社交網(wǎng)絡(luò)在線角色扮演游戲
在保險(xiǎn)業(yè)、醫(yī)療保健行業(yè)、信用卡、互聯(lián)網(wǎng)服務(wù)行業(yè)、通信行業(yè)等擁有長(zhǎng)期穩(wěn)定客戶的行業(yè)中,客戶的保留對(duì)公司的利潤(rùn)有著驚人的影響[1]。因而,國(guó)內(nèi)外已有許多面向上述行業(yè)的客戶流失分析與預(yù)測(cè)的相關(guān)研究。
近年來(lái),大型多人在線角色扮演游戲MMORPG行業(yè)得到飛速發(fā)展。在MMORPG中,玩家扮演、控制某個(gè)角色,在虛擬世界中可以進(jìn)行殺野怪升級(jí)、購(gòu)買(mǎi)武器裝備等行為;玩家之間也可以進(jìn)行交互,如道具交易、組隊(duì)完成任務(wù)、互相攻擊等。游戲的運(yùn)營(yíng)商通過(guò)對(duì)玩家定期收費(fèi),或者對(duì)購(gòu)買(mǎi)虛擬道具進(jìn)行收費(fèi)。近幾年來(lái),MMORPG的玩家數(shù)量急劇增長(zhǎng),據(jù)統(tǒng)計(jì),2013年上半年中國(guó)國(guó)內(nèi)MMORPG游戲收入突破142億人民幣。因而,游戲行業(yè)中各個(gè)公司、產(chǎn)品之間的玩家資源競(jìng)爭(zhēng)日漸激烈。Kawale等[2]指出,吸引新的用戶加入游戲比挽留老用戶的代價(jià)大的多。所以,研究MMORPG中的玩家流失分析與預(yù)測(cè)具有重要意義。
Haenlain[3]、Ngonmang[4]、Nitzan[5]等相關(guān)研究均表明,在電話通信行業(yè)當(dāng)中,客戶所在的社交網(wǎng)絡(luò)的特征對(duì)客戶的流失行為有顯著影響。而在MMORPG中,玩家之間有存在許多交互行為,玩家與玩家之間可能會(huì)加為好友,然后進(jìn)行聊天互動(dòng)、交易等,這使玩家之間形成了虛擬世界中的社交網(wǎng)絡(luò),它與現(xiàn)實(shí)世界的社交網(wǎng)絡(luò)十分相似。
因此,本文針對(duì)MMORPG,在考慮玩家的個(gè)人屬性和行為特征的同時(shí),引入玩家在游戲中的虛擬社交網(wǎng)絡(luò)的特征,建立流失分析與預(yù)測(cè)模型,以分析這些社交網(wǎng)絡(luò)特征對(duì)玩家流失行為的影響,并對(duì)流失趨勢(shì)進(jìn)行預(yù)測(cè)。通過(guò)Cox比例風(fēng)險(xiǎn)模型,分別只使用個(gè)人屬性行為特征、社會(huì)網(wǎng)絡(luò)特征以及所有特征來(lái)建立流失分析模型。在盛大集團(tuán)“星辰變”游戲數(shù)據(jù)上的實(shí)驗(yàn)表明,玩家的社交網(wǎng)絡(luò)特征對(duì)玩家的流失行為具有顯著影響,并能夠明顯提高流失的預(yù)測(cè)效果;實(shí)驗(yàn)中還將上述模型與SVM、Logistic回歸、NaiveBayes等分類(lèi)方法進(jìn)行對(duì)比,對(duì)比采用準(zhǔn)確率、召回率、F值指標(biāo),結(jié)果表明,針對(duì)本文實(shí)驗(yàn)數(shù)據(jù)的玩家流失預(yù)測(cè),采用Cox回歸最為有效,預(yù)測(cè)效果較好。
數(shù)據(jù)挖掘方法在其他行業(yè)的客戶流失的研究中得到了廣泛應(yīng)用。例如Logistic回歸、支持向量機(jī)SVM等模式分類(lèi)方法[1,6-8],以及生存分析中的Cox比例風(fēng)險(xiǎn)模型[9,10]等。相對(duì)于模式分類(lèi)方法,采用Cox回歸分析和預(yù)測(cè)玩家流失,具有以下優(yōu)點(diǎn):(1) 玩家的行為特征通常會(huì)隨時(shí)間變化,而Cox回歸模型能夠基于縱向數(shù)據(jù)進(jìn)行建模,更加充分地利用這些依時(shí)間變化的協(xié)變量所包含的信息。(2) 能夠處理刪失數(shù)據(jù)(刪失數(shù)據(jù)是指在觀察或試驗(yàn)中,由于人力或其他原因未能觀察到所感興趣的事件發(fā)生,如個(gè)體死亡、玩家流失)。既能夠考慮到觀測(cè)截止時(shí)已經(jīng)流失的玩家,也能夠利用尚未流失的玩家信息,提高模型的有效性。因此,本文利用Cox比例風(fēng)險(xiǎn)模型對(duì)玩家的流失進(jìn)行建模。
1.1生存函數(shù)與風(fēng)險(xiǎn)函數(shù)
生存時(shí)間,或者某事件出現(xiàn)的時(shí)間,通常用生存函數(shù)、概率密度函數(shù)和風(fēng)險(xiǎn)函數(shù)這三種形式來(lái)描述[11].
生存函數(shù)即累計(jì)生存概率。設(shè)T表示生存時(shí)間,F(xiàn)(t)=P(T≤t)表示T的分布函數(shù)(即個(gè)體生存時(shí)間長(zhǎng)于t的概率)。則生存函數(shù)表示生存時(shí)間T超過(guò)給定值t的概率:
S(t)=1-F(t)=P(T>t)
(1)
概率密度函數(shù)的定義是:
(2)
風(fēng)險(xiǎn)函數(shù)λ(t)用于表示處于一定時(shí)刻t的個(gè)體是否容易死亡,它完全刻畫(huà)了t的分布,因而直接決定了概率密度函數(shù)和生存函數(shù),在生存數(shù)據(jù)分析中起著非常重要的作用。其定義為:
(3)
當(dāng)生存時(shí)間T的概率密度已知時(shí),λ(t)可以按如下形式來(lái)表示:
(4)
上述關(guān)系式表明,生存函數(shù)、概率密度函數(shù)和風(fēng)險(xiǎn)函數(shù)實(shí)際上是等價(jià)的,已知三者之一,即可導(dǎo)出另兩個(gè)。
1.2Cox比例風(fēng)險(xiǎn)模型
Cox回歸模型或Cox比例風(fēng)險(xiǎn)模型,在1972年由Cox提出[12]。起初主要應(yīng)用于臨床醫(yī)學(xué)及流行病學(xué),由于其適應(yīng)性極強(qiáng)等特點(diǎn),被應(yīng)用于許多研究領(lǐng)域。
不失一般性,當(dāng)協(xié)變量均隨時(shí)間變化時(shí),Cox模型的形式為:
h(t)=h0(t)exp(βTZ(t))
其中,Z(t)是依時(shí)間變化的協(xié)變量,β是回歸系數(shù)向量,h0(t)是未知的基準(zhǔn)風(fēng)險(xiǎn)函數(shù),只與時(shí)間有關(guān),它對(duì)應(yīng)于所有協(xié)變量為0時(shí)的流失風(fēng)險(xiǎn),與協(xié)變量無(wú)關(guān)。Cox模型不對(duì)h0(t)的分布形式做任何假設(shè),應(yīng)用范圍十分廣泛,它又被稱(chēng)為半?yún)?shù)模型[13]。
設(shè)S0(t)為t時(shí)刻的基準(zhǔn)生存函數(shù),則對(duì)應(yīng)的累計(jì)生存函數(shù)為:
S(t)=S0(t)exp(βTZ(t))
每一時(shí)刻的基準(zhǔn)風(fēng)險(xiǎn)通常用Kalbfleisch-Prentice[14]方法來(lái)估計(jì)。為了進(jìn)行預(yù)測(cè),我們需要在此基礎(chǔ)上估計(jì)基準(zhǔn)風(fēng)險(xiǎn)函數(shù)與時(shí)間的顯式的關(guān)系式。通常假設(shè)(流失)事件發(fā)生的時(shí)間服從Weibull分布,記累計(jì)基準(zhǔn)風(fēng)險(xiǎn)函數(shù)為:
那么累計(jì)基準(zhǔn)風(fēng)險(xiǎn)函數(shù)與時(shí)間的關(guān)系為[15]:
logH0(t)=a0+a1log(t)
利用最小二乘法可以上式進(jìn)行參數(shù)估計(jì),從而能夠得到之后一個(gè)月的生存概率。代入未來(lái)數(shù)據(jù),可以對(duì)玩家的流失概率進(jìn)行預(yù)測(cè)。
2.1實(shí)驗(yàn)數(shù)據(jù)
本文實(shí)驗(yàn)數(shù)據(jù)來(lái)自盛大集團(tuán)的“星辰變”游戲。該游戲于2011年9月29日開(kāi)始公開(kāi)測(cè)試,其新服務(wù)器不斷增開(kāi),版本持續(xù)更新,保持著較高的人氣。本文選取該游戲“華中電信一區(qū)”的“逆央境”組,自2012年4月至2012年10月的數(shù)據(jù)。該區(qū)組在這一時(shí)間段內(nèi)沒(méi)有區(qū)、組的合并操作,相對(duì)比較穩(wěn)定,玩家數(shù)目較多。我們限定玩家的注冊(cè)時(shí)間在2012年4月之前。本文認(rèn)為在某一月份當(dāng)中有登錄記錄的玩家即為“活躍玩家”,否則斷定其已經(jīng)流失。流失是指當(dāng)月沒(méi)有活躍行為的玩家。
2012年4月的數(shù)據(jù)共包含活躍玩家6215名。在這些玩家的基礎(chǔ)上,之后每月的活躍玩家剩余數(shù)量變化如圖1所示,到2012年10月這些玩家當(dāng)中有1653名尚未流失。
圖1 星辰變?nèi)A中電信一區(qū)逆央境4月起玩家留存數(shù)
2.2特征選取
2.2.1虛擬社交網(wǎng)絡(luò)特征
本文通過(guò)玩家的好友列表構(gòu)建社交網(wǎng)絡(luò)。即玩家為網(wǎng)絡(luò)中的節(jié)點(diǎn),玩家與玩家之間有邊相連,表示他們?cè)谟螒蛑谢ハ嗉訛楹糜?。基于這一網(wǎng)絡(luò),本實(shí)驗(yàn)采用下述特征,以分析玩家的社交網(wǎng)絡(luò)對(duì)玩家流失行為的影響:
1) 活躍/流失好友數(shù)
玩家的好友的流失行為可能會(huì)對(duì)玩家的流失風(fēng)險(xiǎn)產(chǎn)生影響,例如某幾個(gè)好友的流失可能使得玩家也不愿繼續(xù)游戲,所以首先考慮玩家的好友數(shù)的變化這一因素。在網(wǎng)絡(luò)中,活躍好友數(shù)即玩家對(duì)應(yīng)節(jié)點(diǎn)的鄰居節(jié)點(diǎn)數(shù)目,或節(jié)點(diǎn)的度。用ISNi,t表示玩家i在月份t的鄰居節(jié)點(diǎn)集合,即玩家的好友列表中的所有好友的集合,那么玩家i在月份t的活躍好友數(shù)active_neighbori,t可記為:
我們用x1表示這一變量。并且其中:
類(lèi)似地,每個(gè)月的已經(jīng)流失的好友數(shù)為:
2) 二度好友關(guān)系
IritNitzan[5]在其關(guān)于電信行業(yè)客戶流失的研究中表明,社交網(wǎng)絡(luò)中度更高的客戶在網(wǎng)絡(luò)中的影響力更大,對(duì)其鄰居的影響更強(qiáng)。依據(jù)這一結(jié)論,我們考慮二度好友關(guān)系,即分別統(tǒng)計(jì)流失和未流失好友的好友數(shù)目。
用active_second_neighbor表示活躍好友的活躍好友數(shù)目,則:
x3=active_second_neighbori,t
同理,每個(gè)月已經(jīng)流失好友的好友數(shù)為:
3) 聊天數(shù)目
好友之間的關(guān)系越密切,他們之間的相互影響也會(huì)越大。本文通過(guò)好友之間的聊天數(shù)目來(lái)表示好友之間的關(guān)系強(qiáng)度。好友之間發(fā)送/接收到一條消息,聊天數(shù)記為1,分別對(duì)玩家與當(dāng)月的活躍好友,以及與本月已經(jīng)流失的好友,前一個(gè)月的聊天記錄數(shù)分別為:
其中,chati,j,t表示玩家i與玩家j之間,在月份t當(dāng)中的聊天信息總數(shù)。
2.2.2個(gè)人屬性與行為特征
除了上述本文主要研究的虛擬社會(huì)網(wǎng)絡(luò)因素之外,我們還加入玩家的個(gè)人角色屬性以及在游戲中的行為特征,描述如下:
x13:玩家的游戲角色性別。
x8:角色等級(jí),從1級(jí)至70級(jí)。
x9:角色的職業(yè)。“星辰變”中共有6個(gè)角色。
x10:玩家角色當(dāng)月的登錄游戲次數(shù)。
x11:當(dāng)月殺死其他玩家角色次數(shù)。
x12:當(dāng)月殺死怪物、靈獸以及非玩家角色次數(shù)。
x13:當(dāng)月被玩家角色擊殺次數(shù)。
x14:被怪物、靈獸以及非玩家角色擊殺次數(shù)。
x15:角色當(dāng)月花費(fèi)金幣總量。
x16:角色當(dāng)月花費(fèi)金幣次數(shù)。
x17:角色當(dāng)月花費(fèi)星幣總量。
x18:角色當(dāng)月花費(fèi)星幣次數(shù)。
x19:角色當(dāng)月與其他玩家角色組隊(duì)次數(shù)。
上述屬性與行為特征能夠表示玩家角色的狀態(tài)、心態(tài)以及對(duì)游戲的參與程度,我們認(rèn)為它們可能成為玩家流失的影響因素。這樣,本文共考慮19個(gè)特征,包含6個(gè)社交網(wǎng)絡(luò)特征以及13個(gè)個(gè)人屬性與行為特征。
2.2.3特征篩選方法
前文所介紹的特征數(shù)目較多,其中有些特征可能與玩家流失的相關(guān)性較大,而另一些特征可能與玩家的流失并無(wú)明顯關(guān)聯(lián),所以需要對(duì)這些特征進(jìn)行篩選,去除冗余特征。本文使用Cox回歸中最常使用的Z檢驗(yàn),進(jìn)行一次篩選,來(lái)實(shí)現(xiàn)這一目的。
Z檢驗(yàn)的零假設(shè)和替換假設(shè)分別為:
H0:βk=0,其它參數(shù)βi(i≠k)固定
H1:βk≠0,其它參數(shù)βi(i≠k)固定
當(dāng)H0成立時(shí),Z統(tǒng)計(jì)量Z=βk/SE(βk)應(yīng)服從標(biāo)準(zhǔn)正態(tài)分布,其中SE(βk)為回歸系數(shù)βk的標(biāo)準(zhǔn)誤差。通過(guò)Z統(tǒng)計(jì)量對(duì)應(yīng)的概率值,可以推斷出變量與玩家流失關(guān)系的顯著性。
本文在R語(yǔ)言環(huán)境中,利用“coxph”包所實(shí)現(xiàn)的Cox回歸模型進(jìn)行實(shí)驗(yàn),當(dāng)中的“basehaz”函數(shù)實(shí)現(xiàn)了Kalbfleisch-Prentice估計(jì)。
3.1特征的相關(guān)性檢驗(yàn)及篩選
在數(shù)據(jù)預(yù)處理階段,我們將表中除性別之外的所有特征進(jìn)行標(biāo)準(zhǔn)化和中心化,以提高模型的擬合效果,以及便于對(duì)各個(gè)特征對(duì)流失的影響程度進(jìn)行比較。將處理后的數(shù)據(jù)代入Cox模型,訓(xùn)練結(jié)果的各個(gè)特征的系數(shù)及檢驗(yàn)結(jié)果見(jiàn)表1所示。其中,第二列為回歸系數(shù),第三列為系數(shù)以e為底的冪值,第四列為Z統(tǒng)計(jì)量對(duì)應(yīng)的概率值。
表1 所有特征的系數(shù)及Z檢驗(yàn)結(jié)果
我們?cè)O(shè)定顯著性水平為0.5,則篩選出的特征為:職業(yè)(x9)、登錄次數(shù)(x10)、被其他玩家擊殺次數(shù)(x13)、金幣消費(fèi)總數(shù)目(x15)、金幣消費(fèi)次數(shù)(x16)、組隊(duì)次數(shù)(x19)、活躍好友數(shù)(x1)、流失好友數(shù)(x2)、活躍好友二度好友數(shù)(x3)、流失好友二度好友數(shù)(x4)、流失好友上月聊天次數(shù)(x6)。在這一實(shí)驗(yàn)中,在6個(gè)社會(huì)網(wǎng)絡(luò)特征中,有5個(gè)對(duì)玩家流失具有顯著影響。特征篩選方法適合于其他的模型,都可以通過(guò)模型的特征系數(shù)的顯著性來(lái)進(jìn)行篩選。
3.2特征的相關(guān)性檢驗(yàn)及篩選
利用上述篩選出的特征,構(gòu)建Cox回歸模型:
模型1:
其中,f(x)=exp(βTx)。對(duì)模型1進(jìn)行擬合,得到擬合系數(shù)結(jié)果如表2所示,系數(shù)絕對(duì)值對(duì)比如圖2所示。在所有篩選出的特征當(dāng)中,系數(shù)的絕對(duì)值最大的是玩家當(dāng)月金幣的使用次數(shù),為-2.76,對(duì)流失的影響程度最大,花費(fèi)金幣次數(shù)越多,玩家的流失風(fēng)險(xiǎn)越低。其次是登錄次數(shù),也是登錄次數(shù)更多的玩家,流失風(fēng)險(xiǎn)更低。
表2 模型1擬合系數(shù)
圖2 模型1擬合系數(shù)絕對(duì)值柱狀圖
玩家在游戲中的社會(huì)網(wǎng)絡(luò)特征當(dāng)中,活躍好友數(shù)、流失好友的好友數(shù)、活躍好友的好友數(shù)以及流失好友數(shù)對(duì)玩家流失的影響都相對(duì)比較大。其中,活躍的好友數(shù)的系數(shù)(x1)為負(fù)(-1.503),流失好友總數(shù)的系數(shù)為正(x2, 0.720),說(shuō)明玩家的活躍好友對(duì)玩家的行為具有正面影響;反之,流失好友的增多也會(huì)使玩家容易隨之一起流失?;钴S和流失好友對(duì)應(yīng)的二度好友數(shù)這兩個(gè)特征的系數(shù)(x3和x4,分別為-0.779和0.915)則表明,一個(gè)玩家的好友數(shù)能夠?qū)ζ浜糜训男袨楫a(chǎn)生影響,它可以在一定程度上代表玩家在社會(huì)網(wǎng)絡(luò)中的影響力,這也印證了文獻(xiàn)中的觀點(diǎn)。除此以外,社會(huì)網(wǎng)絡(luò)特征中的玩家與流失好友在前一個(gè)月的聊天數(shù)目(x6, 系數(shù)為0.423)也對(duì)其流失行為有顯著影響,聊天數(shù)目越多,說(shuō)明玩家與好友之間的關(guān)系越密切,因此好友的流失對(duì)玩家的影響也會(huì)更大,擬合結(jié)果正印證了這一點(diǎn)。這些結(jié)果說(shuō)明,玩家在游戲中的社交網(wǎng)絡(luò)的特征對(duì)玩家的流失行為的影響是顯著的。
比較出乎意料的結(jié)果是被玩家擊殺次數(shù)的系數(shù)為負(fù)(x13, -0.474),我們可以解釋為,通常被其他玩家殺死次數(shù)多的玩家,游戲的參與度相對(duì)更高,更不容易流失。
3.3生存函數(shù)估計(jì)
通過(guò)Kalbfleisch-Prentice估計(jì)得到5~9月基準(zhǔn)生存函數(shù),如圖3所示。5月的生存函數(shù)值為0.959,而到9月,這一數(shù)值降到了0.607。用1.2節(jié)介紹的方法進(jìn)行擬合,擬合結(jié)果的修正R方為0.9991,F(xiàn)統(tǒng)計(jì)量對(duì)應(yīng)的概率為8.045×10-6,表明采用這一方法的擬合效果是十分滿意的。代入10月的數(shù)據(jù),并利1.2節(jié)介紹的方法,基準(zhǔn)生存函數(shù)值0.526。
圖3 基準(zhǔn)生存函數(shù)曲線圖
3.4玩家流失預(yù)測(cè)
為了作為對(duì)比,我們還分別只使用玩家的個(gè)人屬性與行為特征,以及只使用社會(huì)網(wǎng)絡(luò)特征來(lái)構(gòu)建模型。
模型2:只考慮玩家的個(gè)人屬性以及行為特征:
h/h0=f(x9,x10,x13,x15,x16,x19)
模型3:只考慮社會(huì)網(wǎng)絡(luò)特征:
h/h0=f(x1,x2,x3,x4,x6)
3.4.1評(píng)價(jià)指標(biāo)
如表3所示,有tp個(gè)類(lèi)別為流失的樣本被模型正確判定為流失,fn個(gè)類(lèi)別為流失的樣本被模型誤判定為類(lèi)別未流失,有fp個(gè)類(lèi)別為未流失的樣本被模型誤判斷定為流失,tn個(gè)類(lèi)別為未流失的樣本被模型正確判為未流失。
表3 準(zhǔn)確率和召回率
Precision=tp/(tp+fp),又稱(chēng)“精度”、“正確率”,反映了被模型判定的流失玩家中真正的流失玩家的比重。
Recall=tp/(tp+fn),又稱(chēng)“查全率”,指的是所有真實(shí)流失的玩家中被模型判定為流失的比重。
Precision和Recall都是評(píng)估流失模型的重要指標(biāo)。F值是Precision和Recall的加權(quán)調(diào)和平均,F(xiàn)= 2×召回率×準(zhǔn)確率/(召回率+準(zhǔn)確率),F(xiàn)值是模型的一個(gè)綜合評(píng)估指標(biāo)。
3.4.2模型評(píng)估
表4為使用三個(gè)Cox回歸模型以及SVM、Logistic回歸和樸素貝葉斯分類(lèi)器對(duì)玩家的流失做預(yù)測(cè)的評(píng)價(jià)結(jié)果,我們分別計(jì)算出準(zhǔn)確率、召回率和F值。
Cox回歸模型如前文所述,用4~8月的數(shù)據(jù)來(lái)進(jìn)行擬合,再用9月的數(shù)據(jù)來(lái)預(yù)測(cè)10月玩家的流失情況,我們?cè)O(shè)定概率閾值為基準(zhǔn)流失函數(shù)值;類(lèi)似的,在后三個(gè)分類(lèi)方法中,將表列出的特征,4~8月每個(gè)月的數(shù)據(jù)分別作為分類(lèi)器里的一個(gè)特征,進(jìn)行訓(xùn)練,預(yù)測(cè)時(shí),則采用5~9月的數(shù)據(jù),對(duì)10月進(jìn)行預(yù)測(cè),SVM采用Sigmoid核。
表4 10月份玩家流失預(yù)測(cè)對(duì)比
在Cox回歸的三個(gè)模型中,只采用玩家個(gè)人屬性與行為特征時(shí),召回率比較高(0.992),但是準(zhǔn)確率只有0.234;而引入了玩家的社交網(wǎng)絡(luò)特征的模型1,預(yù)測(cè)的準(zhǔn)確率達(dá)到0.753,召回率為0.824,其F值為0.393,綜合效果好于前者。而只采用社會(huì)網(wǎng)絡(luò)特征時(shí)(模型3),預(yù)測(cè)結(jié)果的準(zhǔn)確率和召回率均略低于0.5。通過(guò)對(duì)比可以看到,玩家的個(gè)人特征與社交網(wǎng)絡(luò)特征,對(duì)流失預(yù)測(cè)具有互補(bǔ)的作用,當(dāng)綜合使用兩方面的特征,預(yù)測(cè)結(jié)果顯著高于僅僅使用一類(lèi)特征時(shí)的結(jié)果。采用模式分類(lèi)方法的實(shí)驗(yàn)中,SVM與Logistic回歸的預(yù)測(cè)準(zhǔn)確率較Cox模型高,而召回率低;樸素貝葉斯分類(lèi)的結(jié)果則與前兩者相反。通過(guò)F值的對(duì)比,Cox回歸模型更加適用于本文的玩家的流失分析與預(yù)測(cè)。
MMORPG玩家的流失對(duì)游戲運(yùn)營(yíng)商的收益具有重要影響。本文采用Cox比例風(fēng)險(xiǎn)模型建立MMORPG游戲玩家流失分析模型,對(duì)“星辰變”游戲玩家的流失行為進(jìn)行分析,并具體分析了游戲中的社會(huì)網(wǎng)絡(luò)因素對(duì)玩家流失行為的影響。實(shí)驗(yàn)結(jié)果表明,玩家在游戲里社交網(wǎng)絡(luò)中的玩家特征和流失行為對(duì)玩家的流失行為有顯著影響。引入這些特征能夠顯著提高流失預(yù)測(cè)效果,并且Cox回歸模型更加適用與本文的MMORPG玩家流失預(yù)測(cè)問(wèn)題。
[1] 應(yīng)維云,覃正,趙宇.SVM方法及其在客戶流失預(yù)測(cè)中的應(yīng)用研究[J].系統(tǒng)工程理論與實(shí)踐,2007,27(7):105-110.
[2]KawaleJ,PalA,SrivastavaJ.ChurnpredictioninMMORPGs:Asocialinfluencebasedapproach[C]//ComputationalScienceandEngineering,2009.CSE’09.InternationalConferenceon.IEEE,2009,4:423-428.
[3]HaenleinM.Socialinteractionsincustomerchurndecisions:Theimpactofrelationshipdirectionality[J].InternationalJournalofResearchinMarketing,2013,30(3):236-248.
[4]NgonmangB,ViennetE,TchuenteM.Churnpredictioninarealonlinesocialnetworkusinglocalcommunityanalysis[C]//Proceedingsofthe2012InternationalConferenceonAdvancesinSocialNetworksAnalysisandMining(ASONAM2012).IEEEComputerSociety,2012:282-288.
[5]NitzanI,LibaiB.Socialeffectsoncustomerretention[J].JournalofMarketing,2011,75(6):24-38.
[6]HuangB,KechadiMT,BuckleyB.Customerchurnpredictionintelecommunications[J].ExpertSystemswithApplications,2012,39(1):1414-1425.
[7] 蔣國(guó)瑞,司學(xué)峰.基于代價(jià)敏感SVM的電信客戶流失預(yù)測(cè)研究[J].計(jì)算機(jī)應(yīng)用研究,2009,26(2):521-523.
[8]DasguptaK,SunghR,ViswanathanB,etal.Socialtiesandtheirrelevancetochurninmobiletelecomnetworks[C]//Proceedingsofthe11thinternationalconferenceonExtendingdatabasetechnology:Advancesindatabasetechnology.ACM,2008:668-677.
[9] 鄧森文,馬溪駿.基于Cox模型的移動(dòng)通信行業(yè)中低端客戶流失預(yù)測(cè)研究[J].合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2010,33(11):1698-1701.
[10] 鄭浩,趙翔.基于生存分析的顧客流失預(yù)測(cè)及挽救效果研究[J].生產(chǎn)力研究,2011(1):97-99.
[11]KalbfleischJD,PrenticeRL.Thestatisticalanalysisoffailuretimedata[M].JohnWiley&Sons,2011.
[12]CoxDR.Regressionmodelsandlifetables[J].JRstatsocB,1972,34(2):187-220.
[13] 王啟華.生存數(shù)據(jù)統(tǒng)計(jì)分析[M].北京:科學(xué)出版社,2007.
[14]WengYP,WongKF.Baselinesurvivalfunctionestimatorsunderproportionalhazardsassumption[D].InstituteofStatistics,nationalUniversityofKaohsiung,2007.
[15]RoystonP,ParmarMKB.Flexibleparametricproportional-hazardsandproportional-oddsmodelsforcensoredsurvivaldata,withapplicationtoprognosticmodelingandestimationoftreatmenteffects[J].Statisticsinmedicine,2002,21(15):2175-2197.
CHURNANALYSISANDPREDICTIONFORSOCIALNETWORK-BASEDMMORPGPLAYERS
DingJun1GaoDaqi1XueChengyuan1ChenXiaohong2
1(School of Information Science and Engineering,East China University of Science and Technology,Shanghai 200237,China)2(Data Centre,Shandagames,Shanghai 201203,China)
FortheproblemofanalysingandpredictingplayerschurninginMMORPG(MassiveMultiplayerOnlineRole-playingGame),webuiltachurnanalysismodelusingCoxproportionalhazardmodeltostudythefactorsofplayerschurning,andtopredictthechurningaswell.Specifically,weanalysedtheimpactsofsocialnetworksfeaturesofplayersinthegame(players’friendships,secondarydegreefriendshipsandchatsbetweenfriends)onplayers’churningbehaviours.Experimentsonthegameof“StarsVariation”ofSDOshowedthatthesocialnetworkstheplayerslocatedingamesignificantlyaffectedthechurningbehavioursofplayers,andcouldimprovetheeffectofprediction.Incomparisonwithsupportvectormachine,LogisticregressionandnaiveBayes,theCoxmodelisprovedmoresuitablefortheplayerschurnpredictiontask.
ChurnanalysisChurnpredictionCoxregressionSocialnetworksMMORPG
2014-08-27。丁軍,博士生,主研領(lǐng)域:數(shù)據(jù)挖掘。高大啟,教授。薛程元,碩士生。陳小紅,本科。
TP311
ADOI:10.3969/j.issn.1000-386x.2016.03.024