亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于云模型理論的群體用戶畫像模型①

        2018-06-14 08:48:38姚龍飛何利力
        計算機系統(tǒng)應(yīng)用 2018年6期
        關(guān)鍵詞:云滴畫像定性

        姚龍飛,何利力

        (浙江理工大學(xué) 信息學(xué)院,杭州 310018)

        隨著計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,各企業(yè)積累了用戶大量消費數(shù)據(jù),很多領(lǐng)域和行業(yè)開始意識到數(shù)據(jù)是貫穿整過營銷過程的始末,其對營銷的效果起著至關(guān)重要的作用,因此如何利用用戶的行為數(shù)據(jù)以及如何利用數(shù)據(jù)對用戶開展精細(xì)化營銷成為了企業(yè)在激烈的市場競爭環(huán)境下立于不敗之地的最強有力的后盾.用戶畫像伴隨著數(shù)據(jù)時代而來,旨在通過從海量用戶行為數(shù)據(jù)中練金挖銀,盡可能全面細(xì)致地抽出一個用戶的信息全貌,從而幫助解決如何把數(shù)據(jù)轉(zhuǎn)換為商業(yè)價值的問題.因此如何通過用戶的數(shù)據(jù)準(zhǔn)確的刻畫用戶行為并給用戶構(gòu)建畫像模型是突破當(dāng)前營銷瓶頸的重要途徑.

        已有學(xué)者對如何準(zhǔn)確刻畫用戶行為以及如何準(zhǔn)確的給用戶構(gòu)建畫像模型的問題開展了研究,如陳志明等[1]構(gòu)建了基于用戶基本屬性、社交屬性、興趣屬性和能力屬性四個維度的動態(tài)用戶畫像模型,并對“知乎”網(wǎng)站PM2.5話題下1303位用戶進行了實證分析;姜建武等人[2]在大數(shù)據(jù)理論基礎(chǔ)上提出構(gòu)建行為-主題、主題-詞匯及行為-詞匯三位一體的數(shù)學(xué)模型,來研究基于用戶畫像的信息本體提取方法.采用包含對象、時間、地點、內(nèi)容、行為和重返次數(shù)六方面內(nèi)容的事件描述法計算本體權(quán)重,以此構(gòu)建用戶畫像;Chen等[3]建立個體指紋與基因之間的關(guān)聯(lián),使用基于MapReduce框架的圖形處理單元嘗試從基因的角度精確的反映用戶信息全貌,建立人體健康信息檔案.王丹[4]提出了一種結(jié)合主題模型和點互信息的用戶畫像提取(TM-PMI)方法.從LDA模型的思想、原理以及LDA求解方法—吉布斯采樣等全面描述了用戶文本信息建模的方法.將用戶文本信息主題模型和點互信息結(jié)合建立用戶個性化主題詞,得到個性化用戶畫像.

        已有研究方法雖然取得了一定的成果,但現(xiàn)有方案和算法主要是通過定量的標(biāo)簽來給用戶畫像建立不同的模型,通過這些模型來判斷用戶的行為傾向,而對于用戶行為中出現(xiàn)的大量模糊性與隨機性的標(biāo)簽無法做到直接建模.鑒于此,本文將引入云模型理論,對用戶群體畫像中基于RFM模型的定性標(biāo)簽展開研究.

        1 云模型理論概述

        云模型理論是李德毅院士提出的定性與定量轉(zhuǎn)換模型,能夠?qū)崿F(xiàn)定性概念與其數(shù)值表示之間的不確定性轉(zhuǎn)換.其中正態(tài)云是云模型中最重要的模型,具有普適性[5],已經(jīng)在許多領(lǐng)域有很多成熟的應(yīng)用[6,7].

        1.1 云和云滴

        設(shè)U是用數(shù)值精確表示的一個定量論域,C是U上的一個定性概念,若定量值 χ∈U,χ是定性概念C的一次隨機實現(xiàn),χ對C的確定度μ (χ)∈ [0,1]是有穩(wěn)定傾向的隨機數(shù)滿足:

        則 在論域U上的分布稱為云,每一個 χ稱為一個云滴[8].

        1.2 云的數(shù)字特征

        概念的整體特性可以用云的數(shù)字特征來反映,這是定性概念整體性定量特征,對理解定性概念的內(nèi)涵和外延有重要的意義[9].

        云模型用期望Ex,熵En和超熵He,3個數(shù)字特征來整體表示一個定性概念.

        期望Ex:定性概念的基本確定性度量,是云滴在論域空間分布的均值(數(shù)學(xué)期望).通俗的說,就是最能夠代表定性概念的點.

        熵En:表示定性概念的不確定性度量,它是由概念的模糊性和隨機性共同決定.一方面,熵是定性概念隨機性的度量,反映了能夠代表這個定性概念的云滴離散程度;另一方面,又是隸屬于這個定性概念的度量,決定了論域空間中可被概念接受的云滴確定度.

        超熵He:表示熵的熵,指熵不確定的度量.對于一個定性概念,被普遍接受的程度越高,超熵越小,在云圖上云滴比較聚集;對于難以形成共識的概念,超熵則比較大,在云圖上云滴比較離散.

        1.3 云發(fā)生器

        云發(fā)生器分正向云發(fā)生器和逆向云發(fā)生器[10],它們是云模型核心算法.見算法1及算法2.

        輸入:表示定性概念C的3個數(shù)字特征(Ex,En,He),生成云滴的個數(shù)N.輸出:N個云滴的定量值,及其確定度μ.

        正向高斯云發(fā)生器的運行機理如圖1所示

        圖1 正向高斯云發(fā)生器

        算法步驟:xi1) 計算 的平均值Ex=1 n∑n i=1 xi(1)2) 計算樣本一階絕對中心矩1 n∑ni=1|xi-Ex| (2)3) 計算樣本二階中心矩S=1∑n n-1 i=1(xi-Ex)2 (3)4) 計算En=√π 2?1 n∑ni=1|xi-Ex|0

        逆向高斯云發(fā)生器的運行機理如圖2所示.

        圖2 逆向高斯云發(fā)生器

        2 研究與分析

        2.1 基于云模型用戶畫像設(shè)計方案

        為了給用戶制作全方位的精準(zhǔn)畫像,本文采用客戶關(guān)系管理分析中的RFM模型,RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段,該機械模型通過一個客戶的近期購買行為、購買頻率和每次購買消費的金額3個指標(biāo)來描述客戶的整體價值.本文從客戶的交易信息中提取RFM模型的3個指標(biāo)進行分析,綜合運用云模型的理論來得出客戶類型聚類的結(jié)果,其具體過程(如圖3)如下:

        1) 采集用戶畫像數(shù)據(jù)并進行數(shù)據(jù)預(yù)處理;

        2) 把用戶畫像數(shù)據(jù)劃分為客觀屬性和行為屬性.其中客觀屬性數(shù)據(jù)代表的是用戶固有屬性,在這里把這類固有數(shù)據(jù)處理為用戶的唯一標(biāo)識,在數(shù)據(jù)庫中作為token(ID)來存儲.行為屬性是用戶畫像建模的主要數(shù)據(jù)來源,這些屬性數(shù)據(jù)分別劃分為定量屬性與定性屬性;

        3) 為了消除數(shù)據(jù)帶來的影響,需要對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理;

        4) 將標(biāo)準(zhǔn)化處理后的定量數(shù)據(jù)通過逆向高斯云發(fā)生器,將定量屬性轉(zhuǎn)換為定性屬性.定性屬性作為建模的起點,分為時間間隔云模型、消費頻率云模型、消費金額云模型,如表1所示;

        表1 用戶畫像指標(biāo)

        5) 通過云模型聚類算法生成用戶畫像聚類云模型;

        6) 經(jīng)過正向高斯云發(fā)生器將用戶畫像聚類云模型轉(zhuǎn)換為量化的用戶畫像數(shù)值區(qū)間;

        7) 由量化的用戶畫像數(shù)值區(qū)間分析得出用戶群體聚類模型.

        圖3 基于云模型用戶畫像設(shè)計流程

        2.2 基于云模型的聚類算法

        云模型聚類算法是將傳統(tǒng)的K-means算法引入到定性概念聚類的領(lǐng)域,是對K-means算法應(yīng)用領(lǐng)域的一次拓展,該算法的核心是基于云模型理論,涉及云模型的相似度、綜合云等等.通過該算法可以對定性概念聚類分析.

        2.2.1 綜合云

        定義1.將兩個及以上具有相同屬性特征的云模型進行綜合,得到一個高層次的云模型,叫做綜合云[11].

        設(shè)在論域U中有b個同類型子云C1(Ex1,En1,He1),C2(Ex2,En2,He2),···,Cb(Exb,Enb,Heb)

        則綜合云表示為

        其中,E xk,E nk,H ek分別為各子云的數(shù)字特征.

        2.2.2 云模型相似度

        定義2.任意具有相同屬性特征的云模型的相似程度叫云模型相似度[12],采用余弦相似度來定量表示:

        設(shè)在論域U中任意2個同類屬性云為則有

        2.2.3 云模型聚類算法描述

        為了借助K-means算法來分析云模型,設(shè)計了算法3.

        算法3.基于云模型的聚類算法輸入:聚類的個數(shù)K,K個云模型聚類中心.輸出:K個聚類中心簇.1) 從用戶畫像云模型集合V={V1,…,Vm}中任意檢索出K個初始化云模型聚類中心,記作初始化聚類云模型集合U={U1,…,Uk};云模型指標(biāo)集合記為C={C1,…,Cj};云模型相似度集合記為S.2) 計算用戶云模型集合元素與云模型聚類中心元素的定性相似度(先遍歷U,然后遍歷V).for each Uiin Udo for each Vjin Vdo//計算集合U中每一個元素Uik與集合V中每一個元素Vjk的云模 ;in Sdo S中.3) 根據(jù)相似度的最大值取出云模型聚類元素,放入到對應(yīng)的Gi集合中(先遍歷V,然后遍歷U).for each Vjin Vdo for each Uiin Udoif //F大于聚類云模型集合Gi中最小值then 式(6),(7),(8)// 新的聚類中心4) 設(shè)定閾值F重復(fù)步驟2),3).end

        3 實驗分析

        本節(jié)的仿真實驗軟硬件以及編程平臺如下:Intel(R)Core(TM) i5 CPU,6 GB內(nèi)存,操作系統(tǒng)為Windows 10,在MATLAB環(huán)境下進行仿真實驗.

        本節(jié)將對前文提出的聚類云模型算法進行場景模擬仿真分析,以驗證該算法在實際場景中的應(yīng)用效果,從而達到指導(dǎo)商家開展相應(yīng)的個性化促銷目的.

        本仿真數(shù)據(jù)來自于浙江中煙CRM系統(tǒng)中客戶交易的記錄,從中抽取2000位客戶(2016.7-2017.6的數(shù)據(jù))作為此次抽取的樣本對象.每位客戶的交易信息包括姓名,每一個自然月(從上個月最后一個非完整周的周一到本月最后一個完整周的周日)購買時間區(qū)間(T)、每一個自然月內(nèi)距最近一次購買時間間隔(R)、每一個自然月內(nèi)購買次數(shù)(F)、每一個自然月內(nèi)消費總金額(C).

        3.1 數(shù)據(jù)處理與分析

        (1)數(shù)據(jù)預(yù)處理,即對2000位客戶的原始數(shù)據(jù)整理得到每一個客戶在2016.7-2017.6區(qū)間內(nèi)的交易記錄結(jié)果(局部)如表2所示.

        表2 某郭姓客戶2016.7-2017.6區(qū)間內(nèi)的交易記錄

        對表2的數(shù)據(jù)標(biāo)準(zhǔn)化處理,以消除數(shù)據(jù)之間的影響.

        (2)由公式(1)至(5)得到每一個客戶的3種云模型(局部),如表3所示.

        表3 用戶畫像云模型指標(biāo)值(局部)

        (3)由聚類云模型算法得到每一類畫像聚類數(shù)和聚類中心.結(jié)果如表4所示.

        (4)客戶價值分析,即云模型的3個數(shù)字特征參數(shù)中,期望(Ex)代表用戶畫像某種行為特征的最可能取值,熵(En)反映了用戶畫像某種行為特征所有的取值相對于期望(Ex)的離散度,熵越大代表該用戶畫像所代表的某種行為屬性的穩(wěn)定性低.通過期望(Ex)和熵(En)可以近似的將云圖轉(zhuǎn)換為一個區(qū)間的取值.超熵(He)反映了熵的離散程度,超熵越小云滴越聚集在云圖的輪廓線附近.

        一個云圖是由許許多多的具有3個數(shù)字特征的云滴組成,所有的云滴對某種定性概念的形成都有貢獻,不同的云滴群對概念的貢獻是不同的[13],根據(jù)李德毅院士證明的高斯云“3En規(guī)則”(如圖4所示),即可以忽略[Ex-3En,Ex+3En]區(qū)間外的云滴對定性概念的貢獻.

        表4 云模型聚類結(jié)果

        圖4 論域中的元素對定性概念的貢獻

        由表4中云模型聚類的結(jié)果,得到了每一類群體畫像的云模型指標(biāo),將云模型的指標(biāo)通過正向高斯云發(fā)生器得到每一個云模型的云圖,這里取云滴數(shù)為2000.云圖結(jié)果如圖5至圖8所示.通過云圖的分布,能夠比較清晰的看到各群體用戶基于RFM指標(biāo)的分布情況.

        根據(jù)高斯云“3En規(guī)則”,由期望(Ex)和熵(En)可以近似的將云圖轉(zhuǎn)換為一個量化的區(qū)間范圍,得到如表5結(jié)果,該區(qū)間取值的范圍大致描述了對應(yīng)的用戶畫像模型.

        為了從用戶畫像中分析得出各種類型畫像的映射群體及群體代表的用戶特征,取高斯云“3En規(guī)則”的區(qū)間中點代表該行為屬性的聚集點,得到客戶群特征圖,如圖9所示

        如上圖所示,通過縱向比較,消費頻率在畫像一所代表的群體中該特征比較明顯;消費金額在畫像一、畫像二、畫像三所代表的群體中該特征均表現(xiàn)明顯,在畫像四所代表的群體中該特征比較弱;時間間隔在畫像三、畫像四所代表的群體中特征比較明顯,在畫像一、畫像二所代表的群體中該特征比較弱.從圖中可以看出,每一類型的用戶畫像都具有顯著不同的特征,通過對不同類型的畫像和用戶行為特征的分析,將這四種畫像映射為四類群體:重要保持客戶、重要挽留客戶、重要發(fā)展客戶、低價值客戶[14].即如圖10所示.

        3.4 應(yīng)用

        根據(jù)本節(jié)的實驗分析結(jié)果,得到基于云模型的RFM指標(biāo)聚類的用戶畫像群體映射為重要保留客戶、重要發(fā)展客戶、重要挽留客戶、低價值客戶,針對這四類群體的特征來指導(dǎo)企業(yè)開展相應(yīng)的商業(yè)營銷活動.

        (1) 重要保留客戶:該類客戶的特征是消費頻率高、消費的金額高、最近一次消費的時間離統(tǒng)計的節(jié)點比較近.這類客戶具有很高的消費能力,同時他們對該企業(yè)的產(chǎn)品具有很高的忠誠度,是企業(yè)最理想的客戶,對他們進行差異化管理和一對一營銷,不斷提高該用戶的忠誠度與滿意度,盡可能延長其高消費的水平.

        (2) 重要發(fā)展客戶:該類客戶的特征是消費頻率低、消費的金額高、最近一次消費的時間離統(tǒng)計的節(jié)點比較近.他們是企業(yè)潛在客戶,既是容易流失的客戶類型也是容易發(fā)展為企業(yè)忠臣客戶的類型,企業(yè)需要針對該類型的客戶制定相應(yīng)的策略來提高該類客戶的滿意度,提高他們對企業(yè)產(chǎn)品消費的頻率,使他們逐漸成為企業(yè)的忠誠客戶.

        圖5 畫像一云模型

        圖6 畫像二云模型

        圖7 畫像三云模型

        圖8 畫像四云模型

        表5 用戶畫像區(qū)間取值范圍

        圖9 用戶畫像聚類特征圖

        圖10 客戶群體特征圖

        (3) 重要挽留客戶:該類客戶的特征是消費頻率低、消費金額高、最近一次消費的時間離統(tǒng)計的節(jié)點很久遠(yuǎn).該類客戶價值變化的模糊性和隨機性比較大,對這類客戶需要企業(yè)多方面掌握該客戶的信息,重點聯(lián)系,采取一定的營銷策略來延長該類客戶的生命周期.

        (4) 低價值客戶:該類的客戶的特征是消費頻率低、消費金額低、最近一次消費的時間離統(tǒng)計的節(jié)點很久遠(yuǎn).該類客戶可能只在企業(yè)做活動時才會消費.這類客戶是企業(yè)的邊緣客戶,在營銷上的成本比較大,但這類客戶在某種程度上是企業(yè)產(chǎn)品的宣傳大軍,是企業(yè)可以留意的的客戶群體.

        因此,通過云模型的聚類分析得到用戶畫像群體,有助于企業(yè)對客戶進行細(xì)分,根據(jù)客戶的不同特征,企業(yè)可以為每類群體制定個性化的營銷策略.提高企業(yè)在市場中的競爭力.

        4 結(jié)論與展望

        在大數(shù)據(jù)時代,如何利用海量的用戶數(shù)據(jù)來為企業(yè)創(chuàng)造價值是一個非常重要的課題,本文通過基于RFM模型的三個指標(biāo)對用戶行為進行分析,構(gòu)建了基于RFM模型的云模型,基于云模型的理論分析用戶不確定性與模糊性的行為,構(gòu)建用戶畫像模型.不僅為企業(yè)實施精準(zhǔn)營銷提供了借鑒,同時也為大數(shù)據(jù)時代研究精準(zhǔn)營銷提供了一點思路.

        雖然本文用戶畫像構(gòu)建不是很全面,有關(guān)模型的指標(biāo)也僅僅是局限在RFM模型,但后續(xù)研究者可以針對企業(yè)的自身情況從RFM指標(biāo)上拓展,使得該指標(biāo)更全面的反映客戶關(guān)系管理各種要素.同時基于云模型的聚類算法的復(fù)雜度需要進一步優(yōu)化,本文僅僅是對2000位客戶分析,如果數(shù)據(jù)量非常大的話該算法效率就非常低,后續(xù)研究可以考慮通過Hadoop平臺的MapReduce[15]運算框架來處理大量的客戶信息數(shù)據(jù).

        1 陳志明,胡震云.UGC網(wǎng)站用戶畫像研究.計算機系統(tǒng)應(yīng)用,2017,26(1):24-30.[doi:10.15888/j.cnki.csa.005543]

        2 姜建武,李景文,陸妍玲,等.基于用戶畫像的信息智能推送方法.微型機與應(yīng)用,2016,35(23):86-89,92.

        3 Chen GC,Zhao JY,Cohen T,et al.Using ontology fingerprints to disambiguate gene name entities in the biomedical literature.Database,2015,2015:bav034.[doi:10.1093/database/bav034]

        4 王丹.基于主題模型的用戶畫像提取算法研究[碩士學(xué)位論文].北京:北京工業(yè)大學(xué),2016.

        5 李德毅,劉常昱.論正態(tài)云模型的普適性.中國工程科學(xué),2004,6(8):28-34.

        6 Wu AY,Ma ZG,Zeng GP.Set pair fuzzy decision method based on cloud model.Chinese Journal of Electronics,2016,25(2):215-219.[doi:10.1049/cje.2016.03.004]

        7 Du RX,Rong H,Xian M,et al.A measurement method of threat for co-residency detection based on cloud model.Proceedings of 2016 International Conference on Computer,Mechatronics and Electronic Engineering (CMEE 2016).Beijing,China.2016.8.

        8 崔天寶.基于云模型的短期電價預(yù)測的研究[碩士學(xué)位論文].保定:華北電力大學(xué)(河北),2008.

        9 李德毅,杜鹢.不確定性人工智能.2版.北京:國防工業(yè)出版社,2014.40-56.

        10 劉常昱,李德毅,杜鹢,等.正態(tài)云模型的統(tǒng)計分析.信息與控制,2005,34(2):236-239,248.

        11 李克潮,凌霄娥.云模型與用戶聚類的個性化推薦.計算機應(yīng)用,2013,33(10):2804-2806,2826.

        12 陳平華,陳傳瑜.基于云模型的用戶雙重聚類推薦算法.計算機工程與科學(xué),2015,37(7):1245-1251.

        13 李德毅.知識表示中的不確定性.中國工程科學(xué),2000,2(10):73-79.[doi:10.3969/j.issn.1009-1742.2000.10.018]

        14 丁欣.東方航空公司機票營銷渠道優(yōu)化策略研究[碩士學(xué)位論文].上海:復(fù)旦大學(xué),2013.

        15 Wang JY,Yao Y,Mao Y,et al.OMO:Optimize MapReduce overlap with a good start (reduce) and a good finish (map).Proceedings of the 34th IEEE International Performance Computing and Communications Conference.Nanjing,China.2015.1-8.

        猜你喜歡
        云滴畫像定性
        威猛的畫像
        分裂平衡問題的Levitin-Polyak適定性
        福建九仙山一次佛光的云滴粒子尺度分析*
        “00后”畫像
        畫像
        你不知道的雷雨知識
        當(dāng)歸和歐當(dāng)歸的定性與定量鑒別
        中成藥(2018年12期)2018-12-29 12:25:44
        云微物理特性及云滴有效半徑參數(shù)化:一次降水層狀云的飛機觀測資料結(jié)果
        云滴譜離散度對氣溶膠間接效應(yīng)影響的研究進展
        共同認(rèn)識不明確的“碰瓷”行為的定性
        日韩高清在线观看永久| 风流老太婆大bbwbbwhd视频| 黑色丝袜秘书夹住巨龙摩擦 | 无码a级毛片免费视频内谢5j| 久人人爽人人爽人人片av| 性一交一乱一伦a片| 亚洲国产日韩在线人成蜜芽| 日韩字幕无线乱码免费| 一区二区三区中文字幕p站| 男女车车的车车网站w98免费| 色综合另类小说图片区| 91国语对白在线观看| 久久精品中文少妇内射| 麻豆久久久9性大片| 久久天天躁狠狠躁夜夜爽| 国产精品视频一区二区三区,| 成人做爰黄片视频蘑菇视频 | 香港aa三级久久三级| 欧美日韩中文国产一区| 日本一区二区三区中文字幕视频| 精品一区二区三区久久| 亚洲va久久久噜噜噜久久天堂| 亚洲欧洲∨国产一区二区三区| 中字亚洲国产精品一区二区| 看一区二区日本视频免费| 国产成人大片在线播放| 日韩视频在线观看| 亚洲av一宅男色影视| 韩国无码精品人妻一区二| 国产美腿丝袜一区二区| 无码人妻人妻经典| 另类亚洲欧美精品久久不卡 | 亚洲免费女女在线视频网站| 色婷婷亚洲精品综合影院| 亚洲va欧美va| 精品国产精品久久一区免费| 午夜精品久久久久久久| 香蕉久久久久久久av网站| 国产成人自拍小视频在线| 日本在线免费不卡一区二区三区| 亚洲日韩在线中文字幕综合|