黃峻泓 夏征宇
摘? 要? 文章介紹了傳統(tǒng)用戶分類方法,在傳統(tǒng)RFM模型基礎上提出了一種基于用戶收視和消費數(shù)據(jù)的RFM-CT的用戶分類模型,應用K-means聚類算法進行用戶分類工作,為廣告商、媒體運營商提供了一種決策思路。
關鍵詞? 用戶分類;RFM模型;收視行為;K-means
隨著互聯(lián)網(wǎng)的不斷發(fā)展,單一媒體正逐步向融媒體轉變,媒體形式的豐富使用戶的媒體行為趨于多樣化,跨屏傳播帶來全新的受眾收視模式。隨著視頻內(nèi)容通過數(shù)字有線網(wǎng)、寬帶、移動互聯(lián)網(wǎng)等多種形式在大、中、小屏等各種屏端播出,用戶可以通過各種終端收看喜愛的節(jié)目等媒體內(nèi)容的同時進行購物消費[1]。自廣告出現(xiàn)以來,廣告的效果問題就一直受到人們廣泛的研究,廣告的評估與其目標有著密切關系[2]。廣告商通過定位有價值的目標人群來實現(xiàn)廣告的精準投放,媒體運營商則根據(jù)目標人群的消費情況來分析內(nèi)容受眾的消費偏好等進而對合適的產(chǎn)品進行招商,幫助商家、品牌商等提升產(chǎn)品銷量。
1? 傳統(tǒng)的用戶分類方法
1.1? 基于用戶的靜態(tài)屬性劃分
用戶的靜態(tài)屬性是最早應用于用戶分類的屬性,用戶的靜態(tài)屬主要包括一些與用戶相關并且不經(jīng)常變化的數(shù)據(jù),例如用戶的性別、年齡、教育程度和收入等自然人口學屬性。靜態(tài)屬性容易理解和獲得,但隨著技術的不斷發(fā)展,僅通過簡單的靜態(tài)屬性來分析已經(jīng)不能很好地滿足市場的需要。
1.2? 基于生活形態(tài)屬性的劃分
在傳統(tǒng)的收視率調(diào)查中,曾使用過日記卡的調(diào)查方式。所謂日記卡,簡單說就是在樣本戶中留置日記,請樣本家庭中的每一位成員及時填寫一周內(nèi)自己收看的電視的情況[3]?;谏钚螒B(tài)的消費者群劃分的研究者通常會設計一些能體現(xiàn)用戶的生活心態(tài)屬性的問卷來讓用戶填寫,回收問卷數(shù)據(jù)后再對數(shù)據(jù)進行統(tǒng)計分析,問卷中的問題由問卷設計者主觀確定,而且大量的問題很可能導致用戶答題缺乏耐心,用戶不一定按照自身的真實情況填寫的同時樣本容量也十分有限?!吧钚螒B(tài)”最早于1927年由心理學家Alfred Adler提出,1963年William kazer首次將“生活形態(tài)”的概念運用到營銷理論中,成為制定營銷策略的依據(jù)之一[4]。它與基于用戶靜態(tài)屬性的方法不同,它認為僅通過一些人口統(tǒng)計學變量來劃分用戶無法體現(xiàn)用戶的生活習慣、價值觀、消費觀等一些非表面的心理屬性。1998年Kolter在研究中提出,生活形態(tài)是指個人的生活方式,具體表現(xiàn)在活動(Activities)、興趣愛好(Interest)、個人觀點(Opinion)等三個方面上[5]。
1.3? 基于用戶行為等動態(tài)屬性的劃分
動態(tài)屬性隨著時間會產(chǎn)生變化,通常為用戶產(chǎn)生的一些行為數(shù)據(jù),如消費行為數(shù)據(jù)、收視數(shù)據(jù)等。莊一嶸等通過對時間維度樣本矩陣及點播記錄特征參數(shù)進行關聯(lián)計算,對海量的IPTV用戶群進行分類,分析出各個用戶群的喜好、觀影時段、增值業(yè)務的偏好等信息,為IPTV數(shù)據(jù)運營提供了基于用戶群分類的數(shù)據(jù)支撐,指導IPTV具體的運營工作[6]。
2? 建立收視行為與消費數(shù)據(jù)的模型
2.1? RFM模型
美國數(shù)據(jù)庫營銷研究所的Arthur Hughes在研究中提出了RFM模型,RFM模型常用于分析用戶的消費行為,從而有效的衡量用戶對企業(yè)的價值。其中R、F、M分別代表了該模型的三個測量因子,R(Recency)代表最近一次消費距離分析點的時間,F(xiàn)(Frequency)表示固定時間段內(nèi)消費的總次數(shù),M(Monetary)表示固定時間段內(nèi)消費的金額。
用戶的R值越小代表該用戶最近消費的時間距離分析點的時間越接近,對企業(yè)的價值也就越高。用戶的F值是在一個固定的時間段內(nèi)用戶消費的累計次數(shù),如1個月、3個月、1年等,時間段內(nèi)消費次數(shù)越多的用戶價值越高。用戶的M值是一個固定時間段內(nèi)用戶消費的總金額,消費金額越高的用戶價值自然越高,但由于M值和F值的相關度較高,所以M值常采用平均值來計算。
2.2? 消費與收視的關聯(lián)性
傳統(tǒng)人們習慣把媒體研究和市場研究分為兩個不同的研究領域。但是,如果把媒體也作為一種商品,把網(wǎng)絡用戶的媒體行為作為一種消費行為來看待,那么兩者在本質(zhì)上應該是統(tǒng)一的。美國的Peter Steiner認為,人們對于節(jié)目的選擇與他們對消費品的選擇的標準是相類似的。消費者對某一商品的喜好,會反映到他們對某一類型的節(jié)目或欄目的喜好當中;反過來說,受眾對某一類型節(jié)目的喜好,也會在他們對某些商品的偏好程度中體現(xiàn)出來。怎么使廣告的投放更加精準,也一直是廣告商和媒體運營機構致力于解決的問題。在融媒體的大環(huán)境下,網(wǎng)絡用戶隨時隨地都能通過各種終端進行收視、消費等,本文嘗試將網(wǎng)絡用戶收視數(shù)據(jù)與消費數(shù)據(jù)結合分析劃分用戶群體,為商家、媒體運營商、廣告商等提供決策上的幫助。
本文通過某電子商務平臺的大數(shù)據(jù)競賽比賽獲取到部分脫敏的用戶消費數(shù)據(jù),將用戶的消費數(shù)據(jù)屬性整理為:用戶編號、商品編號、商品類別、下單時間。其中用戶編號、商品編號、商品類別都經(jīng)過了脫敏處理。本文通過整理目前市場上主流電子商務平臺的商品一級分類得到商品分類。
2.3? 建立基于網(wǎng)絡用戶的收視行為和消費數(shù)據(jù)來劃分用戶群體的RFM-CT模型
按照中華人民共和國廣播電影電視行業(yè)暫行技術文件,網(wǎng)絡用戶的收視行為可以發(fā)生在有線電視、IPTV、互聯(lián)網(wǎng)電視等不同設備上。文件規(guī)定每條收視數(shù)據(jù)記錄都必須包含一些基本參數(shù)數(shù)據(jù),包括終端設備編碼、終端區(qū)域編碼、操作時間等。其中直播收視數(shù)據(jù)包括頻道編號、頻道名稱等,點播收視數(shù)據(jù)包括節(jié)目編號、節(jié)目名稱、播放類型等。本文將收視基本數(shù)據(jù)整理為:收視內(nèi)容編號、開始時間、結束時間,并將傳統(tǒng)RFM模型應用到網(wǎng)絡用戶的收視數(shù)據(jù)上,將收視行為屬性整理為用戶編號、最近觀看時間距(R)、觀看頻度(F)、觀看總長度(M)、內(nèi)容編號。
RFM-CT模型如表1所示。其中R值代表用戶最近觀看時間距離分析點的時間長度,R值越小代表該用戶對其興趣度較高,F(xiàn)值代表在一段固定的時間段內(nèi)收視某內(nèi)容的總次數(shù),M值指在一段固定的時間段內(nèi)觀看某內(nèi)容的平均時長,可由總時長/F值得到,C值代表在一段固定的時間段內(nèi)消費的商品類別,T值指下單的時間段,本文將每天劃分為24個時間段,如00:00—00:59定義為“1”時間段,以此類推后面23個時間段。
3? 基于RFM-CT模型的K-means聚類
3.1? 數(shù)據(jù)清洗
首先將上述得到的基本收視數(shù)據(jù)和消費數(shù)據(jù)進行數(shù)據(jù)清洗后導入數(shù)據(jù)庫中,校驗數(shù)據(jù)的完整性并確保數(shù)據(jù)包含必選字段,去除或修改邏輯錯誤的數(shù)據(jù)。
3.2? 計算RFM-CT指標
本文數(shù)據(jù)規(guī)模為1 000個用戶的收視與消費數(shù)據(jù)。以用戶編號為主,計算每個用戶在給定時間段內(nèi)的發(fā)生收看行為的媒體內(nèi)容RFM值。如給定時間段為2018年2月5日0點、2018年2月6日0點,計算得到的部分RFM值如表2所示,其中R值單位為分鐘數(shù),F(xiàn)值為收看次數(shù)、M值為平均收看分鐘。為后續(xù)聚類需要,需要將計算結果進行歸一化。
3.3? 基于K-means聚類算法的聚類
K-means是一種無監(jiān)督的聚類算法。設給定n個d維數(shù)據(jù)向量的數(shù)據(jù)集,要將該數(shù)據(jù)集劃分為K類,記為:,其中。K-means即求解下式的最小值:最后將RFM-CT指標歸一化后作為聚類變量進行計算得到聚類結果,分析得到相應的用戶群體。
4? 結語
本文基于傳統(tǒng)的RFM模型,提出了一種基于網(wǎng)絡用戶收視和消費行為數(shù)據(jù)的RFM-CT模型,并應用K-means進行用戶分類。希望本文的研究工作能為媒體運營商、廣告商定位目標用戶群有所幫助。
5? 鳴謝
感謝我的導師中國傳媒大學傳媒科學研究所所長夏征宇老師的悉心教導。感謝我的實習公司北京北廣準星科技有限公司提供的實習機會和資源,感謝實習期為我提供幫助的司偉老師和畢艷紅老師。感謝實驗室的各個同學三年來的支持和幫助。
參考文獻
[1]劉燕南.跨屏時代的受眾測量與大數(shù)據(jù)應用[M].北京:中國傳媒大學出版社,2016.
[2]Xia,Zhengyu.[IEEE 2009 International Conference on Management and Service Science (MASS)-Beijing, China (2009.09.20-2009.09.22)]2009 International Conference on Management and Service Science - Measurement, Modeling and Systemic Implementation of Cross-Media Communication Effect[J].2009:1-5.
[3]劉燕南.電視收視率解析:調(diào)查、分析與應用[M].2版.北京:中國傳媒大學出版社,2010.
[4]王欣.基于生活形態(tài)的IPTV用戶使用行為研究[D].上海:華東師范大學,2011.
[5]方雪琴.IPTV受眾消費行為研究[D].武漢:華中科技大學,2008.
[6]莊一嶸,李江崴,劉東宇,等.IPTV用戶群分類模型設計與實現(xiàn)[J].廣東通信技術,2014(6):5-6,44.