亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于決策樹(shù)的移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)意愿分析與預(yù)測(cè)

        2017-08-28 01:32:20張晨陽(yáng)張浩川
        無(wú)線互聯(lián)科技 2017年15期
        關(guān)鍵詞:決策樹(shù)意愿節(jié)點(diǎn)

        張晨陽(yáng),余 榮*,張浩川

        (廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院,廣東 廣州 510006)

        基于決策樹(shù)的移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)意愿分析與預(yù)測(cè)

        張晨陽(yáng),余 榮*,張浩川

        (廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院,廣東 廣州 510006)

        針對(duì)開(kāi)放移動(dòng)互聯(lián)網(wǎng)下難以識(shí)別和跟蹤潛在用戶,無(wú)法提供更具個(gè)性化服務(wù)的狀況,文章在傳統(tǒng)決策樹(shù)分類器的基礎(chǔ)上,提取用戶基礎(chǔ)數(shù)據(jù)特征,引入感知模型分析處理用戶行為數(shù)據(jù),提出一種基于決策樹(shù)的移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)分類預(yù)測(cè)方法。該方法強(qiáng)化用戶感知對(duì)付費(fèi)行為的影響,利用決策樹(shù)建模進(jìn)行分類并最終作出付費(fèi)預(yù)測(cè),根據(jù)模型結(jié)果探究付費(fèi)影響因素,從運(yùn)營(yíng)者角度思考如何提高用戶的付費(fèi)意愿。

        移動(dòng)互聯(lián)網(wǎng);感知理論;付費(fèi)預(yù)測(cè);決策樹(shù)

        1 互聯(lián)網(wǎng)產(chǎn)業(yè)現(xiàn)狀

        日前,廣州市地鐵“花生WiFi”一經(jīng)推出,即受到千萬(wàn)出行者的追捧。由此可見(jiàn),信息網(wǎng)絡(luò)全面深入地融合人與人、人與物以及物與物之間的現(xiàn)實(shí)物理空間與抽象信息空間,并向無(wú)所不在的泛在網(wǎng)絡(luò)(Ubiquitous Network, UN)方向演進(jìn)[1]。以此為契機(jī),移動(dòng)互聯(lián)網(wǎng)提供商給用戶提供免費(fèi)WiFi,當(dāng)獲得很大的訪問(wèn)量的同時(shí),WiFi即作為移動(dòng)互聯(lián)網(wǎng)系統(tǒng)的入口,能夠產(chǎn)生大規(guī)模的用戶流量。多數(shù)人受WiFi引流而來(lái),并非目的明確地搜尋具有某種功能的系統(tǒng)應(yīng)用,造成移動(dòng)互聯(lián)網(wǎng)借以推出的收費(fèi)模式難以被用戶所接受。

        上述問(wèn)題反映出當(dāng)下互聯(lián)網(wǎng)產(chǎn)業(yè)現(xiàn)狀,能夠借助互聯(lián)網(wǎng)的特性短時(shí)間集聚大量用戶,但流失率高、轉(zhuǎn)化率低使得行業(yè)迫切需要獲得每一位用戶的付費(fèi)可能性,進(jìn)而提供更具針對(duì)性、個(gè)性化的服務(wù)帶來(lái)更高效益。利用直觀明了的算法,幫助我們分析得出影響用戶付費(fèi)的因素,根據(jù)這些信息來(lái)指導(dǎo)我們的策略制定工作,讓網(wǎng)站功能直達(dá)用戶痛點(diǎn),或者采取其他能夠有效增加用戶付費(fèi)意愿的策略[2]。此處,運(yùn)營(yíng)商所構(gòu)建的移動(dòng)互聯(lián)網(wǎng)系統(tǒng),給予每位用戶試用機(jī)會(huì),并能隨時(shí)根據(jù)用戶意愿向付費(fèi)版或更高級(jí)系統(tǒng)升級(jí)?;ヂ?lián)網(wǎng)系統(tǒng)可以很方便的借助OAuth開(kāi)放授權(quán)方式,獲得用戶微信或其他賬號(hào)數(shù)據(jù)用以開(kāi)通使用權(quán)限,并將由此獲得的用戶信息收集、記錄,明確哪些用戶選擇成為付費(fèi)用戶,具有較高付費(fèi)意愿。

        通常,網(wǎng)站直接詢問(wèn)用戶個(gè)人信息的答卷鮮有問(wèn)津,為了避免這種情況并盡量減少用戶的工作量,我們決定從服務(wù)器的日志中收集這些信息,比如:用戶來(lái)源、用戶基本屬性以及瀏覽過(guò)的網(wǎng)頁(yè),等等。假設(shè)我們收集到了這些數(shù)據(jù),并且將其填入一張表格中,其結(jié)果如表1所示。

        表1 用戶基本信息及行為表(節(jié)選)

        2 移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)意愿分析與預(yù)測(cè)

        2.1 理論模型分析與構(gòu)建

        本文建立感知模型對(duì)移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)意愿的影響因素進(jìn)行深入研究,最后使用決策樹(shù)算法對(duì)影響因素與付費(fèi)意愿間的相關(guān)關(guān)系進(jìn)行挖掘及預(yù)測(cè),首先建立感知理論模型如下。

        2.1.1 感知有用性和感知易用性

        感知有用性與感知易用性因素是技術(shù)接受理論(Technology Acceptance Model,TAM)[3]中的基本因素,均可影響付費(fèi)意愿,感知易用性是指用戶在使用新系統(tǒng)時(shí)感知到的難易程度,感知有用性是指用戶感知到的使用移動(dòng)互聯(lián)網(wǎng)對(duì)自己的有利程度[4]。TAM模型認(rèn)為若用戶能夠使用較少的時(shí)間掌握新信息系統(tǒng)也就是用戶花費(fèi)的時(shí)間成本少而收益相對(duì)較高時(shí),用戶就更傾向于使用這種系統(tǒng)。針對(duì)本移動(dòng)互聯(lián)網(wǎng)系統(tǒng),此處我們以用戶首次進(jìn)入到網(wǎng)絡(luò)覆蓋環(huán)境到用戶關(guān)注的時(shí)間間隔作為有用性特征,同時(shí),以用戶關(guān)注到首次接入互聯(lián)網(wǎng)的時(shí)間間隔作為易用性特征。

        2.1.2 感知兼容性

        兼容性是Rogers教授提出的創(chuàng)新擴(kuò)散理論中的一個(gè)因素,它是指用戶使用新的信息系統(tǒng)與社會(huì)現(xiàn)有的價(jià)值觀念及當(dāng)前需求的一致性[5]。若某互聯(lián)網(wǎng)系統(tǒng)不能夠滿足用戶消費(fèi)需求或與其生活方式不匹配,那么該互聯(lián)網(wǎng)系統(tǒng)則無(wú)法滿足兼容性特征,從而影響用戶的付費(fèi)意愿。隨著便攜智能設(shè)備的滲透率在各年齡層的提高,用戶在移動(dòng)網(wǎng)絡(luò)的基礎(chǔ)上能夠使用移動(dòng)WiFi網(wǎng)絡(luò),增強(qiáng)了用戶對(duì)移動(dòng)互聯(lián)網(wǎng)的付費(fèi)傾向,帶來(lái)的流量消耗即作為影響用戶付費(fèi)意愿的感知兼容性特征。

        2.1.3 感知風(fēng)險(xiǎn)

        感知風(fēng)險(xiǎn)理論由哈佛大學(xué)學(xué)者Bauer首次提出并運(yùn)用在市場(chǎng)營(yíng)銷領(lǐng)域中[6]。之后國(guó)內(nèi)外的許多學(xué)者在對(duì)此理論進(jìn)行研究時(shí)發(fā)現(xiàn),感知風(fēng)險(xiǎn)理論可以被運(yùn)用在多個(gè)領(lǐng)域用來(lái)解決許多不同問(wèn)題;文鵬等[7]將感知風(fēng)險(xiǎn)因素與技術(shù)接受模型結(jié)合,探尋微信用戶使用意愿的影響因素,研究發(fā)現(xiàn)感知風(fēng)險(xiǎn)因素與用戶使用意愿呈負(fù)相關(guān)關(guān)系,即存在感知風(fēng)險(xiǎn)情況下,削弱用戶的購(gòu)買意愿。在移動(dòng)互聯(lián)網(wǎng)環(huán)境下,用戶可能感知到的財(cái)務(wù)、隱私、安全等方面的風(fēng)險(xiǎn)及威脅,因此以是否獲得用戶授權(quán)作為感知風(fēng)險(xiǎn)特征。

        2.1.4 人口統(tǒng)計(jì)特征

        人口統(tǒng)計(jì)變量包括被調(diào)查者的性別、地區(qū)、對(duì)移動(dòng)互聯(lián)網(wǎng)的認(rèn)識(shí)及等基本情況。李長(zhǎng)城等[8]在構(gòu)建移動(dòng)網(wǎng)絡(luò)用戶使用意愿影響因素模型時(shí)均將性別、地區(qū)等人口統(tǒng)計(jì)特征變量加入其中,通過(guò)實(shí)證分析證實(shí)個(gè)別人口統(tǒng)計(jì)特征的確與用戶付費(fèi)意愿有顯著相關(guān)性。

        圖1 移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)意愿模型

        除以上特征外,用戶在移動(dòng)互聯(lián)網(wǎng)環(huán)境下,獲取移動(dòng)互聯(lián)網(wǎng)運(yùn)營(yíng)商所提供的服務(wù)內(nèi)容及站點(diǎn)信息,留下大量蘊(yùn)藏用戶偏好的日志信息,經(jīng)過(guò)數(shù)據(jù)清洗及必要的整理,同時(shí)將系統(tǒng)采集到的各種環(huán)境信息進(jìn)行關(guān)聯(lián),能夠?yàn)楹罄m(xù)分類預(yù)測(cè)所用。

        因此,在本文所構(gòu)建的移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)意愿影響因素模型中,同時(shí)引入上文中提到的感知有用性、感知易用性、感知兼容性、感知風(fēng)險(xiǎn),包括人口統(tǒng)計(jì)因素,來(lái)對(duì)模型加以完善。

        2.2 決策樹(shù)建模

        2.2.1 決策樹(shù)的引入

        和大多數(shù)分類器不同,決策樹(shù)能夠給予我們直觀且易于理解的推導(dǎo)過(guò)程,甚至可以由if-then的語(yǔ)句來(lái)簡(jiǎn)單表示。

        在構(gòu)建理論模型后,代入提取到的數(shù)據(jù)設(shè)計(jì)用戶特征表,通過(guò)分類回歸樹(shù)(CART)[9]的算法,首先構(gòu)造出根節(jié)點(diǎn),通過(guò)表2中的所有觀測(cè)變量,從中選出最合適的變量對(duì)數(shù)據(jù)進(jìn)行拆分,并通過(guò)結(jié)果數(shù)據(jù)的分解來(lái)推測(cè)用戶意圖。

        對(duì)合適變量的選取,即需要一種衡量數(shù)據(jù)集合中各種因素的混合情況,根據(jù)經(jīng)驗(yàn),這里我們選擇以熵作為度量標(biāo)準(zhǔn)。為此,我們需要求出整個(gè)群組的熵,同時(shí)利用每個(gè)屬性的取值拆分出新群組,并繼續(xù)求出拆分所得到群組的熵。我們?nèi)‘?dāng)前熵與新群組經(jīng)過(guò)加權(quán)平均后的熵之間的差值,作為信息增益(Information gain),從中選出信息增益最大的屬性,作為每個(gè)新生節(jié)點(diǎn)的最佳拆分屬性,對(duì)分支的拆分及樹(shù)的構(gòu)造過(guò)程不斷持續(xù)下去,即以遞歸方式構(gòu)造樹(shù),而當(dāng)某節(jié)點(diǎn)拆分所得信息增益不大于0時(shí)則停止,最終構(gòu)造出整棵樹(shù)。

        表2 基于感知理論模型設(shè)計(jì)用戶特征表(節(jié)選)

        2.2.2 決策樹(shù)的剪枝與優(yōu)化

        通常上述訓(xùn)練過(guò)程會(huì)帶來(lái)過(guò)度擬合的問(wèn)題,也就是說(shuō)變得過(guò)于針對(duì)訓(xùn)練數(shù)據(jù)。并且在有些時(shí)候,一棵經(jīng)過(guò)訓(xùn)練的決策樹(shù)過(guò)于“繁茂”,知識(shí)過(guò)多,或者說(shuō)得到的規(guī)則集合過(guò)大。

        對(duì)其加以改進(jìn),如在前述構(gòu)造好的整棵樹(shù)上,對(duì)具有相同父節(jié)點(diǎn)的一組節(jié)點(diǎn)進(jìn)行檢查,消除多余的節(jié)點(diǎn)使得熵的增加量小于指定的閾值,則進(jìn)行剪枝操作,有效避免過(guò)度擬合的情況。剪枝后,可以得到一棵相對(duì)簡(jiǎn)潔的決策樹(shù),較少的規(guī)則使得在進(jìn)行分類預(yù)測(cè)時(shí),決策樹(shù)效率更高[10]。

        同時(shí),用戶并非使用系統(tǒng)全部功能的情況下,對(duì)于用戶行為數(shù)據(jù)缺失,可以通過(guò)為所在節(jié)點(diǎn)賦予權(quán)重的方法,對(duì)各分支對(duì)應(yīng)的結(jié)果值進(jìn)行加權(quán)統(tǒng)計(jì),計(jì)算觀察數(shù)據(jù)對(duì)于數(shù)據(jù)項(xiàng)是否屬于某個(gè)特定分類的概率。對(duì)缺失值的樣本賦予該屬性所有屬性值的概率分布,即將缺失值按照其所在屬性已知值的相對(duì)概率分布來(lái)創(chuàng)建決策樹(shù)[11]。

        2.2.3 決策樹(shù)的顯示

        決策樹(shù)能夠?qū)崿F(xiàn)分類時(shí)執(zhí)行推理過(guò)程的可視化表達(dá),使得我們能夠直觀地看到隱藏在推理過(guò)程背后的邏輯,是決策樹(shù)的一大優(yōu)勢(shì)。根據(jù)上述決策樹(shù)生成結(jié)果,從樹(shù)的根節(jié)點(diǎn)開(kāi)始,以遞歸的方式,繪制當(dāng)前節(jié)點(diǎn),并計(jì)算子節(jié)點(diǎn)的位置,然后以此循環(huán)。如圖2所示,Ture分支總是位于右側(cè),那么按圖索驥能夠很容易地追蹤推斷的過(guò)程。

        3 實(shí)驗(yàn)結(jié)果和分析

        本文選取的數(shù)據(jù)來(lái)源于廣東工業(yè)大學(xué)智能信息研究所項(xiàng)目實(shí)際采集數(shù)據(jù),經(jīng)過(guò)整理抽樣取出2 500條用戶樣本數(shù)據(jù),為了檢驗(yàn)決策樹(shù)模型的準(zhǔn)確程度,將其分為兩部分,前80%的樣本作為訓(xùn)練樣本數(shù)據(jù),用來(lái)進(jìn)行決策樹(shù)模型的構(gòu)建,剩下的20%樣本數(shù)據(jù)作為測(cè)試樣本數(shù)據(jù),用來(lái)檢驗(yàn)決策樹(shù)的準(zhǔn)確性。

        圖2 用于預(yù)測(cè)移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)的決策樹(shù)(局部)

        通過(guò)決策樹(shù)分類我們得到了移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)意愿的預(yù)測(cè)規(guī)則,現(xiàn)在對(duì)上述分類規(guī)則進(jìn)行檢驗(yàn)。通過(guò)樣本準(zhǔn)確性表(見(jiàn)表3)可看出,經(jīng)過(guò)訓(xùn)練后,決策樹(shù)的正確性為91%,即該模型可91%的正確率判斷用戶付費(fèi)的付費(fèi)意愿;對(duì)于測(cè)試數(shù)據(jù)集,該模型對(duì)于500份測(cè)試數(shù)據(jù)的預(yù)測(cè)準(zhǔn)確率為83.2%,錯(cuò)誤率為16.8%。分析可以看出,該決策樹(shù)模型的預(yù)測(cè)準(zhǔn)確率較高,可根據(jù)提取的感知模型對(duì)用戶付費(fèi)意愿進(jìn)行預(yù)測(cè)。

        表3 決策樹(shù)模型準(zhǔn)確性

        4 結(jié)語(yǔ)

        為了更好地提取用戶行為數(shù)據(jù)特征,以及用戶付費(fèi)意愿的預(yù)測(cè)規(guī)則,本文提出了一種感知理論分析模型,然后運(yùn)用決策樹(shù)分類方法進(jìn)行移動(dòng)互聯(lián)網(wǎng)用戶付費(fèi)預(yù)測(cè)的分析與研究。在實(shí)現(xiàn)用戶行為特征提取與模型建立中,通過(guò)感知理論建立用戶感知行為分類規(guī)則,增加了用戶感知重要因素作為決策樹(shù)模型的輸入變量,并將用戶付費(fèi)意愿作為輸出變量,引入到?jīng)Q策樹(shù)中得到移動(dòng)互聯(lián)網(wǎng)付費(fèi)意愿的預(yù)測(cè)規(guī)則,對(duì)提高分類預(yù)測(cè)的準(zhǔn)確度具有積極影響。

        通過(guò)上述規(guī)則,可以挖掘出各影響因素間更為具體、深入的關(guān)系,通過(guò)探索數(shù)據(jù)之間的關(guān)聯(lián)模式,挖掘大數(shù)據(jù)中所蘊(yùn)含的信息,借助相關(guān)關(guān)系取代因果關(guān)系,即只需知道“是什么”,而不需知道“為什么”,幫助企業(yè)尋找有用信息,進(jìn)而幫助企業(yè)制定更為詳盡的銷售計(jì)劃與營(yíng)銷策略,對(duì)于迅速占領(lǐng)市場(chǎng)、劃分目標(biāo)人群具有非常重要的現(xiàn)實(shí)意義[12],也是大數(shù)據(jù)分析的價(jià)值所在。

        [1]LEE C S, LEE G M, RHEE W S.Smart ubiquitous networks for future telecommunication environments[J].Computer Standards and Interfaces, 2014(2):412-422.

        [2]西格蘭.集體智慧編程[M].莫映,譯.北京:電子工業(yè)出版社,2015.

        [3]DAVIS F D.Perceived usefulness, perceived ease of use and user acceptance of information technology[J].Mis Quarterly, 1989(3):319-340.

        [4]謝曉文.移動(dòng)支付用戶使用意愿分析與預(yù)測(cè)研究[D].北京:北京交通大學(xué),2017.

        [5]羅杰斯.創(chuàng)新的擴(kuò)散[M].辛欣,譯.北京:電子工業(yè)出版社,2016.

        [6]BAUER R A.Consumer behavior as risk taking[J].Dynamic marketing for a changing world,1960(21):389-392.

        [7]文鵬,蔡瑞.微信用戶使用意愿影響因素研究[J].情報(bào)雜志,2014(6):156-161.

        [8]李長(zhǎng)城.第三方移動(dòng)支付用戶接受影響因素研究[D].北京:郵電大學(xué),2015.

        [9]BREIMAN L, FRIEDMAN J, OLSHEN R, et al.Classi fi cation and regression trees[J].Biometrics,1984(3):358.

        [10]李泓波.決策樹(shù)剪枝研究[J].計(jì)算機(jī)時(shí)代,2016(2):2-3.

        [11]鞏固.決策樹(shù)算法中屬性缺失值的研究[J].計(jì)算機(jī)應(yīng)用與軟件,2008(9):242-244.

        [12]何軍.大數(shù)據(jù)對(duì)企業(yè)管理決策影響分析[J].科技進(jìn)步與對(duì)策,2014(4):65-68.

        Analysis and prediction of willingness to pay for mobile networks users based on decision tree

        Zhang Chenyang, Yu Rong*, Zhang Haochuan
        (Automation School of Guangdong University of Technology, Guangzhou 510006, China)

        In view of the situation taht due to open mobile network is dif fi cult to identify and track potential users, which cannot provide more targeted services, based on traditional decision tree classi fi er, this paper extracts feature of user data and introduces the perception model to analyze users’ behavior data processing, a classi fi cation method for mobile Internet users’ pay classi fi cation based on decision tree is proposed.This method strengthens the in fl uence of user perception on cost behavior, and uses decision tree modeling to classify and makes fi nal payment prediction, to think how to improve the users’ willingness to pay from the operator point of view.

        mobile Internet; perception theory; payment forecast; decision tree

        張晨陽(yáng)(1993— ),男,安徽阜陽(yáng),碩士研究生;研究方向:物聯(lián)網(wǎng),智能交通,數(shù)據(jù)挖掘。

        *通信作者:余榮(1979— ),男,廣東潮州,教授;研究方向:車聯(lián)網(wǎng)。

        猜你喜歡
        決策樹(shù)意愿節(jié)點(diǎn)
        CM節(jié)點(diǎn)控制在船舶上的應(yīng)用
        Analysis of the characteristics of electronic equipment usage distance for common users
        基于AutoCAD的門窗節(jié)點(diǎn)圖快速構(gòu)建
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
        決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        充分尊重農(nóng)民意愿 支持基層創(chuàng)新創(chuàng)造
        基于決策樹(shù)的出租車乘客出行目的識(shí)別
        交際意愿研究回顧與展望
        抓住人才培養(yǎng)的關(guān)鍵節(jié)點(diǎn)
        基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
        国产av无码专区亚洲av果冻传媒| 91精品在线免费| 日本一区二区午夜视频| 亚洲最新国产av网站| 国产福利精品一区二区| 一级毛片60分钟在线播放| 久久熟女乱一区二区三区四区| 熟妇人妻精品一区二区视频免费的| 国产亚洲精品久久久闺蜜| 亚洲欧美精品伊人久久| 无码人妻少妇久久中文字幕| 久久精品亚洲国产av网站| 无码人妻精品一区二区三| 欧美国产日韩a在线视频| 91情侣在线精品国产免费| av新型国产在线资源| 国产精久久一区二区三区| 这里有精品可以观看| 日韩美女av二区三区四区| 极品一区二区在线视频| 国产人妻精品无码av在线 | 99久久人妻无码精品系列蜜桃 | 国产亚洲欧美精品永久| 毛片24种姿势无遮无拦| 亚洲日本在线va中文字幕| 亚洲av本道一本二本三区| 丝袜美腿一区二区三区| 在线观看免费a∨网站| 偷拍激情视频一区二区| 美腿丝袜在线一区二区| 蜜桃麻豆www久久囤产精品| 中文字幕乱偷乱码亚洲| 日韩精品人妻视频一区二区三区| 久久无码人妻一区二区三区午夜| 推油少妇久久99久久99久久| 日韩精品一区二区三区在线观看的| 一区二区亚洲精品在线| 中文亚洲欧美日韩无线码| 免费黄色福利| 漂亮人妻出轨中文字幕| 人妻体体内射精一区二区|