亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)驅動的酒店線上客戶群體流失預測模型應用研究

        2022-08-28 07:44:50張馭思于明亮
        現(xiàn)代信息科技 2022年10期
        關鍵詞:決策樹準確率建模

        張馭思,于明亮

        (上海理工大學,上海 200093)

        0 引 言

        目前我國網(wǎng)絡建設發(fā)展極為迅速,涉及到互聯(lián)網(wǎng)經(jīng)濟的產(chǎn)業(yè)均迎來快速發(fā)展,線上客戶數(shù)量的不斷提高使得企業(yè)的經(jīng)營重點逐漸從產(chǎn)品/服務本身向維持現(xiàn)有客戶資源偏移。以酒店服務業(yè)務為例,目前的綜合性酒店旅行服務企業(yè)大多通過線上APP 和網(wǎng)站以數(shù)字信息的形式為數(shù)量龐大的會員提供全方位的酒店旅行信息。通過對我國目前相關企業(yè)進行研究發(fā)現(xiàn),目前針對線上酒店預定平臺的服務調研主要聚焦在客戶的滿意度管理,有關交易行為和消費轉化率等信息在一定程度上被忽略。

        對于客戶數(shù)據(jù)進行分析,進而對其流失傾向進行分析總結,能夠企業(yè)的客戶關系維護和管理提供理論指導與數(shù)據(jù)支撐。研究者曾采用支持向量機、神經(jīng)網(wǎng)絡和貝葉斯模型分別客戶流失傾向進行分析和預測,通過與實際數(shù)據(jù)對比驗證了模型的有效性。隨后,有研究者開始在現(xiàn)有模型中添加插件模塊以優(yōu)化算法,提升預測精度,Xu等研究者將模糊語言和貝葉斯模型進行融合,將模糊信息以概率的形式精確呈現(xiàn),使信息缺失、模糊的流失客戶數(shù)據(jù)分析成為可能。近年來,模型間的耦合被證明在某些領域擁有比傳統(tǒng)單一模型更高的預測準確性。Aron等人將邏輯回歸模型和決策樹模型耦合,通過實驗及驗證分析,表明耦合模型在精度和可靠性、可解釋性方面均有著比各自獨立模型預測結果更好的表現(xiàn)。在數(shù)據(jù)處理過程中,Sebastiaan 團隊在數(shù)據(jù)前期處理中引入最大利潤度這一概念,并作為模型的評價和分析指標,以該標準進化算法并驅動決策樹模型,獲得了同時考慮企業(yè)成本和利潤的更合理且解釋性更強的模型。

        上述研究對在企業(yè)客戶管理和運營方面的提升和完善具有十分積極的推進作用,但針對酒店線上客戶流失的分析模型亟待構建。本文以線上綜合服務型酒店對現(xiàn)有客戶流失運營管理為主題,以高效預測客戶流失為目的,通過對諸多算法進行比較,將數(shù)據(jù)挖掘、統(tǒng)計學理論融入管理理論,實現(xiàn)學科的融合,為線上酒店解決用戶流失問題提供具有參考價值的理論模型和數(shù)據(jù)支持。

        1 數(shù)據(jù)選取及預處理

        本文實驗的原始數(shù)據(jù)來源于攜程用戶的脫敏訪問數(shù)據(jù),構建模型之前,需對原始數(shù)據(jù)進行數(shù)據(jù)清洗、整合與構建,最后按照既定標準進行格式化。

        1.1 數(shù)據(jù)讀取

        本次實驗樣本共有689 945 條數(shù)據(jù),變量總結歸納為三類相關指標:訂單、客戶行為和酒店相關指標,如圖1所示,除去標簽列和id 列共有49 項特征。

        圖1 變量分類

        1.2 數(shù)據(jù)預處理

        1.2.1 異常值處理

        在數(shù)據(jù)獲取過程中往往會出現(xiàn)某些數(shù)據(jù)點的異常,這在后期建模過程中會影響模型的準確性,因此應提前進行篩選處理。本文以customer_value_profit 和ctrip_profits 為例將處理前后的數(shù)據(jù)散點圖對比如圖2所示。

        圖2 異常值處理前后的數(shù)據(jù)散點圖變化

        1.2.2 相關性分析及PCA 降維

        在建模之前還需要對數(shù)據(jù)的相關性進行分析,進而降低建模過程的數(shù)據(jù)維度,根據(jù)圖1我們可以看到訂單相關指標只涉及四個小類且明顯彼此間相關性不高,因此本文僅注重用戶特征的相關性分析,相關性矩陣熱度圖如圖3所示。

        圖3 用戶特征的相關性矩陣熱度圖

        我們將數(shù)據(jù)維度從最開始的(689 945,49)降至(689 845,41),數(shù)據(jù)條數(shù)未改變,將建模input 的變量維度從49 降至41。隨后將數(shù)據(jù)標準化之后,開始建模計算。

        2 建模及評估分析

        2.1 邏輯回歸模型

        首先我們采用邏輯回歸模型對預處理后的數(shù)據(jù)集進行建模分析,得到模型的準確率為0.737 4,ROC 曲線如圖4所示,AUC 值為0.7,精確度、召回率等信息如表1所示。

        圖4 邏輯回歸模型的ROC 曲線

        表1 邏輯回歸模型相關信息

        2.2 樸素貝葉斯模型

        我們隨后采用樸素貝葉斯模型對預處理后的數(shù)據(jù)集進行建模分析,得到該模型的預測準確率為0.637 1,ROC 曲線如圖5所示,AUC 值為0.67,精確度、召回率等信息如表2所示。

        圖5 樸素貝葉斯模型的ROC 曲線

        表2 樸素貝葉斯模型相關信息

        2.3 支持向量機模型

        我們繼續(xù)采用支持向量機模型對預處理后的數(shù)據(jù)集進行建模分析,得到該模型的預測準確率為0.550 2,ROC 曲線如圖6所示,AUC 值為0.49,精確度、召回率等信息如表3所示。

        表3 支持向量機模型相關信息

        圖6 支持向量機模型的ROC 曲線

        2.4 決策樹模型

        我們繼續(xù)采用決策樹模型對預處理后的數(shù)據(jù)集進行建模分析,得到該模型的預測準確率為0.881 8,ROC 曲線如圖7所示,AUC 值為0.86,精確度、召回率等信息如表4所示。

        圖7 決策樹模型的ROC 曲線

        表4 決策樹模型相關信息

        2.5 隨機森林模型

        我們繼續(xù)采用隨機模型對預處理后的數(shù)據(jù)集進行建模分析,得到該模型的預測準確率為0.925 0,ROC 曲線如圖8所示,AUC 值為0.97,精確度、召回率等信息如表5所示。

        圖8 隨機森林模型的ROC 曲線

        表5 隨機森林模型相關信息

        2.6 極端梯度提升(XGBoost)模型

        最后,我們采用極端梯度提升模型對預處理后的數(shù)據(jù)集進行建模分析,最終得到該模型的預測準確率為0.925 0,ROC 曲線如圖9所示,AUC 值為0.97,精確度、召回率等信息如表6所示,可以看出極端梯度提升模型的ROC 曲線和隨機森林的ROC 曲線基本一致,具體比較將在下一節(jié)討論。

        圖9 極端梯度提升模型的ROC 曲線

        表6 極端梯度提升模型相關信息

        2.7 模型比較

        通過對模型預測準確率的比較可以看出,隨機森林和極端梯度提升模型的準確率最好,說明在本文客戶流失信息預測方面隨機森林模型和極端梯度模型具有更好的表現(xiàn),而支持向量機模型的準確率最低,為0.550 2,說明該模型相對而言并不適合客戶流失信息的預測研究。為了進一步比較,我們進將六類模型的ROC 曲線繪制于如圖10 所示。

        圖10 六種模型的ROC 曲線

        隨機森林以及XGBoost 的的ROC 曲線表現(xiàn)最佳,但在訓練過程中我們發(fā)現(xiàn),XGBoost 明顯更加耗時,且其準確率和AUC 值均低于隨機森林模型,因此我們認為隨機森林模型更適用于本文酒店線上客戶流失的情況的預測和分析。

        3 結 論

        本文以酒店服務類綜合性企業(yè)的現(xiàn)有客戶流失情況為研究對象,以線上綜合服務型酒店對現(xiàn)有客戶流失運營管理為主題,以高效預測客戶流失為目的,針對移動通信用戶流失問題進行了定量分析。通過對邏輯回歸、樸素貝葉斯、支持向量機、決策樹、隨機森林、極端梯度提升(XGBoost)等諸多算法進行比較,獲得更適合客戶管理的流失預測模型。通過不同模型運行結果對比分析,發(fā)現(xiàn)隨機森林、極端梯度提升(XGBoost)比傳統(tǒng)的邏輯回歸、樸素貝葉斯、支持向量機、決策樹模型在各項評價指標上均有較強的優(yōu)勢,為線上酒店解決用戶流失問題提供支持。

        猜你喜歡
        決策樹準確率建模
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
        2015—2017 年寧夏各天氣預報參考產(chǎn)品質量檢驗分析
        聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        基于PSS/E的風電場建模與動態(tài)分析
        電子制作(2018年17期)2018-09-28 01:56:44
        決策樹和隨機森林方法在管理決策中的應用
        電子制作(2018年16期)2018-09-26 03:27:06
        不對稱半橋變換器的建模與仿真
        高速公路車牌識別標識站準確率驗證法
        基于決策樹的出租車乘客出行目的識別
        日韩不卡无码三区| 亚洲精品92内射| 日本一区二区不卡视频| 91免费国产高清在线| 中文字幕av素人专区| а√天堂8资源中文在线| 日韩电影一区二区三区| 亚洲av乱码专区国产乱码| 在线观看中文字幕不卡二区| 国产精品成人观看视频国产奇米 | 久久国产色av免费观看| 抽插丰满内射高潮视频| 久久精品女人天堂AV一个| 亚洲伊人久久大香线蕉| 一边做一边喷17p亚洲乱妇50p | 摸丰满大乳奶水www免费| 亚洲av无码一区二区二三区| 精品无人区无码乱码大片国产| 国产女人av一级一区二区三区| 成人国成人国产suv| 九九视频在线观看视频6| 欧美人与动牲交片免费播放| 一道之本加勒比热东京| 在线天堂www中文| 一国产区在线观看| 亚洲视频一区二区蜜桃| 色大全全免费网站久久| 久久伊人亚洲精品视频| 人妻无码中文字幕| 亚洲欧美精品91| 日本在线播放不卡免费一区二区| 国产成人久久精品一区二区三区| 久久人与动人物a级毛片| 国产午夜激情视频自拍| 国产在线视频网友自拍| 免费观看18禁无遮挡真人网站| 色狠狠色狠狠综合一区| 亚洲视频中文字幕更新| 日日碰日日摸日日澡视频播放| 久久亚洲精品成人av| 99精品国产闺蜜国产在线闺蜜|