亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于回歸模型的公司營(yíng)銷活動(dòng)用戶群挖掘

        2018-11-30 01:47:40葉敏
        商情 2018年49期
        關(guān)鍵詞:R語言

        葉敏

        【摘要】某銷售公司想通過用戶的歷史數(shù)據(jù),預(yù)剛下次營(yíng)銷活動(dòng)最有可能參與營(yíng)銷活動(dòng)的人群。本文通過構(gòu)建Logistic模型,基于用戶的歷史購(gòu)買數(shù)據(jù)和用戶基本信息,使用R語言進(jìn)行計(jì)算,預(yù)瀏用戶是否會(huì)參與營(yíng)銷活動(dòng)。

        【關(guān)鍵詞】Logistic模型 營(yíng)銷活動(dòng) R語言

        一、引言

        某零售公司目前有約3000萬的活躍用戶,市場(chǎng)部門有30萬美元的預(yù)算,其希望挖掘出最有可能在30天內(nèi)購(gòu)買該公司產(chǎn)品的用戶群,本文討論用邏輯回歸建模對(duì)產(chǎn)品的購(gòu)買預(yù)測(cè),得到優(yōu)化模型,并進(jìn)行了模型評(píng)估。

        二、基于Logisstic回歸方法的營(yíng)銷用戶群的挖掘建模

        (一)Logistic回歸模型原理介紹

        Logistic回歸模型是研究因變量非連續(xù)型變量情況的分析模型。其中,解決這個(gè)問題的核心方法稱為極大似然估計(jì)法:

        (1)引入?yún)?shù)e。

        (2)引入Logisic函數(shù)的激活函數(shù),也叫做越階函數(shù),例如:sogfllod激活函數(shù)hθ(x)=g(θTx)=1/(1+e-θTx)

        (3)計(jì)算P(y=1|x:θ)和P(y=0|x:θ),一般來說激活函數(shù)計(jì)算得到p=1和。兩類,需要計(jì)算他們的聯(lián)合概率函數(shù)P(y|x:θ)。

        (4)最大似然函數(shù),求出合適的參數(shù)8。

        (5)計(jì)算hθ(X),根據(jù)該值對(duì)樣本進(jìn)行分類。

        (二)構(gòu)建Logistic模型

        (1)候選變量。候選變量包括用戶的基本情況和一些購(gòu)物信息。本項(xiàng)目一共包括如下26個(gè)自變量和1個(gè)因變量(是否有購(gòu)買行為)。如下圖1所示:

        (2)相關(guān)性分析。相關(guān)性分析包括自變量之間,和自變量和因變量之間的相關(guān)性分析。通常而言,自變量與因變量越強(qiáng),說明該自變量對(duì)因變量越重要,而自變量之間的相關(guān)性越強(qiáng),改善兩者之間的共線性強(qiáng),多重共線性會(huì)影響模型的準(zhǔn)確度,需要優(yōu)化模型的變量。

        (3)初步建模,變量篩選。該項(xiàng)目的特征值有26個(gè),根據(jù)前面的相關(guān)性分析和數(shù)據(jù)缺失情況,去掉11個(gè)特質(zhì)變量(變量與被解釋變量相關(guān)程度非常低和缺失率過高),然后用逐步回歸法自動(dòng)篩選剩下的變量,選出的特征變量先進(jìn)行顯著性檢驗(yàn),再使用VIF進(jìn)行多重共線性分析,一般來說VIF值小于2,另外計(jì)算R^2的值,如R^2<0.5,說明這些變量解釋模型不夠,需要引入更多變量。最終篩選的變量如下:

        (4)模型評(píng)估。該模型采用ROC Curce圖和AUC值進(jìn)行模型評(píng)估。下圖2是ROC Curce圖:

        從圖中可以看到該ROC曲線是往左上角凸的,而AUC值(ROC曲線下方的面積)為0.7613,說明該模型的預(yù)測(cè)結(jié)果的分類效果是不錯(cuò)的。

        三、結(jié)論及建議

        本文通過構(gòu)建Logistic模型,基于用戶的歷史購(gòu)買數(shù)據(jù)和用戶基本信息,使用R語言進(jìn)行計(jì)算分析,預(yù)測(cè)用戶是否會(huì)參與營(yíng)銷活動(dòng)。先進(jìn)行變量之間的相關(guān)性分析,然后初步建模,使用逐步回歸法,篩選變量,最終得到符合模型要求的變量,最后進(jìn)行模型評(píng)估。Logistic模型的優(yōu)點(diǎn)在于可解釋性強(qiáng),但是相對(duì)于其他機(jī)器學(xué)習(xí)模型來說,準(zhǔn)確率不是很高。該項(xiàng)目的主要是為了得到最有可能在30天內(nèi)購(gòu)買該公司產(chǎn)品的用戶群,我認(rèn)為分析完是否購(gòu)買該產(chǎn)生的用戶后,可以用其他預(yù)測(cè)模型判斷購(gòu)買用戶可能會(huì)消費(fèi)多少金額,這樣可以得到更加優(yōu)質(zhì)的用戶群。

        猜你喜歡
        R語言
        基于GPS軌跡數(shù)據(jù)進(jìn)行分析改善城市交通擁擠
        基于R語言的Moodle平臺(tái)數(shù)據(jù)挖掘技術(shù)的研究
        基于R語言的湖南產(chǎn)業(yè)結(jié)構(gòu)對(duì)其經(jīng)濟(jì)增長(zhǎng)貢獻(xiàn)分析
        商(2016年24期)2016-07-20 08:03:39
        注重統(tǒng)計(jì)思維培養(yǎng)與應(yīng)用為主導(dǎo)的生物統(tǒng)計(jì)學(xué)課程建設(shè)
        考試周刊(2016年15期)2016-03-25 04:09:43
        人民幣匯率的均值回復(fù)檢驗(yàn)及Hurst指數(shù)計(jì)算
        R語言及ggplot2在環(huán)境空氣監(jiān)測(cè)數(shù)據(jù)可視化中的應(yīng)用
        一本一本久久a久久精品综合麻豆 国产va免费精品观看 | 乱人伦视频中文字幕| 欧美 变态 另类 人妖| 美女自卫慰黄网站| 一本久道久久综合五月丁香| 美女污污网站| 国产成人精品一区二免费网站| 亚洲国产精品成人av| 国产老熟女伦老熟妇露脸| 亚洲桃色视频在线观看一区| 十八禁在线观看视频播放免费| 国内揄拍国内精品| 亚洲男人堂色偷偷一区| 久久精品有码中文字幕1| 日本女优爱爱中文字幕| 丝袜美腿国产一区二区| 亚洲2022国产成人精品无码区| 亚洲精品第一国产综合亚av| 亚洲暴爽av天天爽日日碰| 欧美xxxx新一区二区三区| 国产毛片三区二区一区| 在线观看一区二区蜜桃| 无套无码孕妇啪啪| 开心五月激情综合婷婷| 精品国产亚欧无码久久久| 国产人妖一区二区av| 二区三区日本高清视频| 欧美日韩亚洲中文字幕二区| 国产日产高清欧美一区| 国产精品一区二区三区精品| 亚洲国产一区二区,毛片| 91精品国产色综合久久| 亚洲国产成人精品无码区在线秒播| 成人h视频在线观看| 青草热久精品视频在线观看| 国产99久久精品一区| 美腿丝袜在线一区二区| 国产精品兄妹在线观看麻豆| 精品无码专区久久久水蜜桃| 无码人妻少妇久久中文字幕| 精品人妻av中文字幕乱|