亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于一種改進(jìn)的RFM 模型的廣電用戶細(xì)分

        2021-07-30 02:46:24趙黎明于金秀薛靖峰
        科學(xué)技術(shù)創(chuàng)新 2021年21期
        關(guān)鍵詞:示例關(guān)鍵聚類

        趙黎明 于金秀 薛靖峰

        (青島黃海學(xué)院 山東 青島 266427)

        1 概述

        在這個(gè)“三網(wǎng)融合”大背景下的新時(shí)代,廣播電視運(yùn)營商與各個(gè)家庭用戶之間信息實(shí)時(shí)交互的實(shí)現(xiàn),使得廣播電視運(yùn)營商利用大數(shù)據(jù)分析手段來為用戶提供智能化產(chǎn)品推薦成為可能,而“智能推薦”是廣播電視運(yùn)營商行業(yè)競爭的制勝法寶之一。本次建模以Python 為主、Excel 為輔的數(shù)據(jù)處理工具對(duì)用戶的觀看記錄信息進(jìn)行挖掘分析,且對(duì)觀眾的收視偏好進(jìn)行定義和分類,并給出合理的營銷推薦。針對(duì)給出的數(shù)據(jù),運(yùn)用K-means 聚類算法、基于RFM模型進(jìn)行改進(jìn)分析。

        2 LRFMC 模型

        2.1 RFM模型

        RFM模型是一種針對(duì)客戶價(jià)值分析的統(tǒng)計(jì)規(guī)劃方法,包括最近消費(fèi)時(shí)間R、消費(fèi)頻率F 和消費(fèi)金額M三個(gè)變量。

        為了了解各用戶的推薦價(jià)值,在用戶標(biāo)簽體系中增加了客戶忠誠度標(biāo)簽,通過客戶忠誠度標(biāo)簽進(jìn)行客戶分類,從而識(shí)別低價(jià)值客戶、高價(jià)值客戶等不同的用戶類型,企業(yè)決策層可以針對(duì)不同價(jià)值層的客戶制定優(yōu)化的個(gè)性化專屬服務(wù)方案,增強(qiáng)產(chǎn)品的針對(duì)性,采取適合各個(gè)客戶類別的不同的營銷策略。

        2.2 LRFMC 模型

        在RFM模型中,最近消費(fèi)時(shí)間R 隨機(jī)性較大,并且指標(biāo)F和指標(biāo)M之間存在共線性問題,忽略了客戶與企業(yè)間的互動(dòng)因素。為了更準(zhǔn)確地對(duì)廣電用戶進(jìn)行價(jià)值分析,提出一種改進(jìn)RFM模型。

        將收視用戶入網(wǎng)時(shí)間長度L,用戶觀看時(shí)間間隔R,用戶觀看頻率F,用戶花費(fèi)金額M和用戶觀看總時(shí)長C 作為廣電公司識(shí)別客戶價(jià)值的關(guān)鍵特征,記為LRFMC 模型,關(guān)鍵特征具體解釋如表1 所示。

        表1 LRFMC 模型關(guān)鍵特征

        3 數(shù)據(jù)預(yù)處理與可視化探索分析

        3.1 數(shù)據(jù)說明

        根據(jù)所研究的目標(biāo),從大量用戶觀看數(shù)據(jù)中抽取了2000 家收視用戶近三個(gè)月的基礎(chǔ)信息及觀看信息,原始數(shù)據(jù)中字段繁多,在數(shù)據(jù)分析開始之前已剔除對(duì)所分析問題影響不大的字段。

        3.2 數(shù)據(jù)預(yù)處理

        由于原始數(shù)據(jù)的無意義字樣、重復(fù)的數(shù)據(jù)、特殊線路與政企觀看的數(shù)據(jù)、存在極短時(shí)間和較長時(shí)間的收視數(shù)據(jù)不利于后續(xù)的分析,所以將其剔除。將隔夜數(shù)據(jù)拆分為兩個(gè)數(shù)據(jù),不規(guī)范的數(shù)據(jù)進(jìn)行剔除。

        3.3 指標(biāo)權(quán)重的確立

        改進(jìn)RFM的5 個(gè)指標(biāo)L、R、F、M、C 的權(quán)重確定過程如下,由i 個(gè)用戶指標(biāo)構(gòu)成的輸入矩陣模型的指標(biāo)Aixj中的列矩陣為:

        計(jì)算xj的協(xié)方差矩陣C 為

        其中

        表示特征值矩陣,將協(xié)方差矩陣C 進(jìn)行特征分解為

        是矩陣C 的特征值矩陣,U 為矩陣C 的特征向量,這樣得到的λ1,為指標(biāo)的權(quán)重。

        應(yīng)用上述方法對(duì)五個(gè)關(guān)鍵特征的計(jì)算以后,對(duì)每個(gè)關(guān)鍵特征數(shù)據(jù)的分布情況進(jìn)行分析,首先取出關(guān)鍵特征數(shù)據(jù)的最大值與最小值,其對(duì)應(yīng)數(shù)據(jù)的取值范圍如表2 所示。

        從表2 中的數(shù)據(jù)可以發(fā)現(xiàn),五個(gè)特征的取值范圍數(shù)據(jù)差異較大,最近一次觀看時(shí)間距離觀測窗口結(jié)束時(shí)長最小僅有0.03小時(shí),而最小觀看次數(shù)高達(dá)368 次;最近一次觀看時(shí)間距離觀測窗口結(jié)束時(shí)長最長僅有24.37 小時(shí),而最大觀看次數(shù)高達(dá)180717次。

        表2 特征取值范圍

        為了抵消數(shù)量級(jí)數(shù)據(jù)給分析過程以及分析結(jié)果帶來的影響,利用Python sklearn 庫中preprocessing 模塊的MinMaxScaler離差標(biāo)準(zhǔn)化函數(shù)對(duì)收集的原始關(guān)鍵特征數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,關(guān)鍵特征數(shù)據(jù)的最大值與最小值的標(biāo)準(zhǔn)化處理示例見表3。

        表3 特征標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化示例

        從表3 的特征標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化處理結(jié)果示例中可以看出,在進(jìn)行離差數(shù)據(jù)標(biāo)準(zhǔn)化之后,不同關(guān)鍵特征指標(biāo)之間有了一定的規(guī)則,數(shù)據(jù)按一定比例進(jìn)行放大或縮小,以適應(yīng)原本的比例,使多個(gè)不同單位的數(shù)據(jù)可以進(jìn)行相互計(jì)算。

        3.4 基于k-means 算法的客戶價(jià)值分析

        進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化之后,再利用Python sklearn 庫中cluster 模塊所提供的K-Means 函數(shù)構(gòu)建K-Means 用戶忠誠度聚類模型。從聚類結(jié)果中抽選出部分?jǐn)?shù)據(jù)示例見表4。

        表4 用戶忠誠度聚類結(jié)果示例

        圖1 聚類結(jié)果二維展示

        從表4 的聚類結(jié)果示例中可以看到,將結(jié)果表的表結(jié)構(gòu)設(shè)置為:用戶名、電視入網(wǎng)時(shí)長、電視消費(fèi)水平、家庭消費(fèi)水平、電視消費(fèi)趨勢,根據(jù)聚類函數(shù)推算出用戶忠誠度標(biāo)簽。

        為了能更清楚直觀地觀察聚類結(jié)果,利用t-SNE 方法對(duì)五維的聚類結(jié)果進(jìn)行降維操作。使三維的聚類結(jié)果降為二維數(shù)據(jù),并繪制出結(jié)果如圖1 的二維散點(diǎn)圖。

        在圖1 的聚類結(jié)果展示中,坐標(biāo)區(qū)間在[0:-20,-40:-60]之間的綠色菱形標(biāo)記記號(hào),這類用戶的五個(gè)關(guān)鍵屬性值皆為負(fù)值,可以理解為一般用戶;坐標(biāo)區(qū)間在[-20:-60,-40:20]之間的紅色五星形標(biāo)記記號(hào),這類用戶可以理解為低價(jià)值客戶;坐標(biāo)區(qū)間在[-20:20,-40:0]之間的黃色十字形標(biāo)記記號(hào),這類用戶可以理解為重要發(fā)展客戶;坐標(biāo)區(qū)間在[-20:20,0:40]之間的藍(lán)色圓形標(biāo)記記號(hào),這類用戶可以理解為重要保持客戶;而坐標(biāo)區(qū)間在[20:60,-20:40]之間的黑色圓形標(biāo)記記號(hào),可以理解為重要挽留客戶。

        4 結(jié)論與建議

        4.1 對(duì)于重要挽留客戶,這類收視用戶大多是剛?cè)刖W(wǎng)(3 年以下)的用戶,其消費(fèi)能力都較低,但其消費(fèi)量一直保持在2-3 級(jí),可以認(rèn)為此類用戶是消費(fèi)的主要人群,需要對(duì)此用戶群進(jìn)行挽留。

        4.2 對(duì)于重要保持客戶,這類收視用戶大多已經(jīng)有3-6 年的入網(wǎng)時(shí)長,其消費(fèi)能力屬于頂級(jí)水平,消費(fèi)量持續(xù)保持在5 級(jí),認(rèn)為此類用戶對(duì)電視消費(fèi)是保持的、是存在一定熱情和具體需求的,因此需要對(duì)此用戶群進(jìn)行保持。

        4.3 對(duì)于重要發(fā)展客戶,這類收視用戶大多入網(wǎng)有超過6 年的年限,雖然其家庭消費(fèi)能力較低,但對(duì)于電視產(chǎn)品消費(fèi)能力屬于中等,可以認(rèn)為此類用戶有較大的發(fā)展空間,所以需要吸引用戶再次消費(fèi)。

        4.4 對(duì)于低價(jià)值客戶,這類收視用戶是重要發(fā)展客戶的其中一個(gè)小分支,雖然大多此類收視用戶入網(wǎng)有超過6 年的年限,但其消費(fèi)水平一直都比較低,所以認(rèn)為該客戶群是屬于低價(jià)值的,可以減少投資成本。

        4.5 對(duì)于一般客戶,這類收視用戶是重要發(fā)展客戶中的另外一個(gè)小分支,此類用戶雖然大多也入網(wǎng)有超過6 年的年限,消費(fèi)水平一直較低,并且極少使用電視,因此針對(duì)這類用戶可以采用放任自由的態(tài)度。

        研究的觀眾用戶聚類以及基于改進(jìn)的RFM的模型針對(duì)不同用戶的數(shù)據(jù)進(jìn)行推薦,在作出電視產(chǎn)品推薦時(shí),模型的準(zhǔn)確率得分只有7 分,推薦的效果不是十分理想,還需要對(duì)電視產(chǎn)品的類別庫進(jìn)行完善,或是建立更加完善的用戶與物品的相似度矩陣。

        猜你喜歡
        示例關(guān)鍵聚類
        大還是小
        高考考好是關(guān)鍵
        2019年高考上海卷作文示例
        常見單位符號(hào)大小寫混淆示例
        山東冶金(2019年5期)2019-11-16 09:09:22
        “全等三角形”錯(cuò)解示例
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        獲勝關(guān)鍵
        NBA特刊(2014年7期)2014-04-29 00:44:03
        自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
        夜鲁很鲁在线视频| 久久亚洲网站中文字幕| 97成人精品国语自产拍| 国产免费av片无码永久免费| 日本夜爽爽一区二区三区| 天天澡天天揉揉AV无码人妻斩| 日韩字幕无线乱码免费| 婷婷色国产精品视频二区| 亚洲理论电影在线观看| 西西人体444www大胆无码视频| 香蕉久久夜色精品国产2020| 人妻系列无码专区久久五月天| 午夜婷婷国产麻豆精品| 国产自产二区三区精品| 久久国产加勒比精品无码| 亚洲 欧美 激情 小说 另类| 无码超乳爆乳中文字幕| 久久精品伊人久久精品伊人| 狠狠色噜噜狠狠狠8888米奇| v一区无码内射国产| 国产精品爆乳在线播放| 日本在线播放不卡免费一区二区| 蜜臀av毛片一区二区三区| 乱子伦在线观看| 在线看片无码永久免费aⅴ| 亚洲av福利天堂在线观看| 亚洲岛国一区二区三区| 国产午夜手机精彩视频| 2019最新国产不卡a| 欧洲国产成人精品91铁牛tv| 亚洲精品一区二在线观看| 日韩人妻少妇一区二区三区| 欧美黑人粗暴多交高潮水最多| 99久久精品一区二区三区蜜臀| 偷拍视频十八岁一区二区三区| 中文字幕有码无码人妻av蜜桃| 精产国品一二三产区m553麻豆| 国产精品情侣露脸av在线播放| 日韩一区二区中文天堂| 日本在线 | 中文| 国产色诱视频在线观看|