亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的IPTV視頻用戶行為分析方法研究

        2019-06-17 09:29:16賈毓臻
        關(guān)鍵詞:深度用戶分析

        劉 超 賈毓臻 王 攀

        1(江蘇大學(xué)電氣信息工程學(xué)院 江蘇 鎮(zhèn)江 212013)2(南京郵電大學(xué)現(xiàn)代郵政研究院 江蘇 南京 210003)

        0 引 言

        隨著天翼高清業(yè)務(wù)的持續(xù)發(fā)展,業(yè)務(wù)的多樣性和復(fù)雜性十分明顯,業(yè)務(wù)質(zhì)量是確保用戶體驗(yàn)和業(yè)務(wù)發(fā)展的關(guān)鍵[1]。IPTV借助寬帶有線電視網(wǎng)的基礎(chǔ)配置,將家用電視機(jī)作為輸出設(shè)備,通過(guò)IP協(xié)議提供多種數(shù)字媒體服務(wù)[2]。IPTV主要用于連接用戶與終端、用戶與用戶、用戶與服務(wù),讓用戶能夠充分發(fā)現(xiàn)服務(wù)、體驗(yàn)服務(wù)、社交互動(dòng),使電視真正成為家庭媒體娛樂(lè)中心[3]。用戶行為是人與商家的關(guān)鍵紐帶,通過(guò)用戶行為分析,幫助IPTV服務(wù)提供商提升服務(wù)質(zhì)量同時(shí)為終端用戶提供精準(zhǔn)個(gè)性化服務(wù),具體體現(xiàn)在三個(gè)方面:(1) 改善系統(tǒng)設(shè)施,通過(guò)用戶數(shù)據(jù)分析,便于對(duì)系統(tǒng)結(jié)構(gòu)進(jìn)行設(shè)計(jì),減少服務(wù)器數(shù)量,節(jié)省開(kāi)支;(2) 改善視頻調(diào)度、存儲(chǔ)方案,通過(guò)視頻點(diǎn)播率、點(diǎn)播時(shí)長(zhǎng)等分析,可以改進(jìn)存儲(chǔ)算法,充分利用服務(wù)器的內(nèi)存與帶寬;(3) 改善服務(wù)質(zhì)量,拉近運(yùn)營(yíng)商與用戶之間的距離,為用戶提供高效優(yōu)質(zhì)的服務(wù)[4]。

        自從1999年開(kāi)始,全球大約有大大小小的50多家電信運(yùn)營(yíng)商進(jìn)入IPTV運(yùn)營(yíng)。隨著亞洲和北美地區(qū)IPTV市場(chǎng)的快速增長(zhǎng),有眾多學(xué)者對(duì)IPTV用戶行為開(kāi)展了許多有意義的分析與研究,并取得了大量極具影響力的研究成果。汪敏娟等[5]提出基于點(diǎn)播行為特征指數(shù)的分群算法對(duì)IPTV用戶進(jìn)行精準(zhǔn)分類,該算法無(wú)法清洗無(wú)意識(shí)的點(diǎn)播行為,不能充分描述用戶的實(shí)際偏好,分群準(zhǔn)確率低于90%。唐明等[6]提出基于關(guān)鍵詞的用戶興趣模型對(duì)用戶的興趣愛(ài)好進(jìn)行歸納總結(jié)。這種采用關(guān)鍵詞的表達(dá)方法雖易于理解,計(jì)算機(jī)難以對(duì)其準(zhǔn)確識(shí)別。Hei等[7]以有限范圍的節(jié)點(diǎn)信息為基礎(chǔ),采用被動(dòng)嗅探方法獲取數(shù)據(jù)包,對(duì)P2P IPTV系統(tǒng)進(jìn)行了測(cè)量與研究,由于無(wú)法獲取系統(tǒng)全局信息,研究結(jié)果局限性較大。

        由于目前對(duì)于IPTV用戶行為分析還沒(méi)有規(guī)范性模型,針對(duì)IPTV視頻業(yè)務(wù)的復(fù)雜性和多樣性,本文提出一種基于深度學(xué)習(xí)的IPTV視頻用戶行為分析方法。該方法采用DNN模型對(duì)用戶點(diǎn)播行為進(jìn)行分析,同時(shí)借助wireshark工具采集IPTV收視數(shù)據(jù),能夠避免無(wú)意識(shí)的點(diǎn)播行為,最終為用戶精準(zhǔn)個(gè)性化服務(wù)提供有效的數(shù)據(jù)支持。

        1 數(shù)據(jù)采集和預(yù)處理

        1.1 數(shù)據(jù)采集

        IPTV具有雙向性,用戶通過(guò)點(diǎn)播行為向服務(wù)器發(fā)送請(qǐng)求命令,服務(wù)器返回用戶需求,同時(shí)IPTV的播放數(shù)據(jù)是客觀且真實(shí)的,結(jié)合雙向性,根據(jù)數(shù)據(jù)采集系統(tǒng),對(duì)IPTV特有的收視數(shù)據(jù)進(jìn)行歸納分析,具有重要意義。

        數(shù)據(jù)采集就是從網(wǎng)絡(luò)收集原始數(shù)據(jù)流量[8],本系統(tǒng)數(shù)據(jù)流量的采集利用Wireshark[9],Wireshark是世界上流行的網(wǎng)絡(luò)分析工具,借助它能夠爬取到各種協(xié)議的網(wǎng)絡(luò)二進(jìn)制數(shù)據(jù)包,明顯提高了對(duì)網(wǎng)絡(luò)活動(dòng)的監(jiān)測(cè)分析效率。數(shù)據(jù)采集拓?fù)鋱D如圖1所示,通過(guò)在機(jī)頂盒和電視接口ONU之間增加一個(gè)鏡像路由器,借助Wireshark工具在PC機(jī)上采集流量數(shù)據(jù)。

        圖1 數(shù)據(jù)采集拓?fù)鋱D

        數(shù)據(jù)流量中反映IPTV視頻用戶行為的主要元素是遙控器點(diǎn)播視頻所對(duì)應(yīng)的URL、點(diǎn)播該視頻的時(shí)間戳、IPTV開(kāi)機(jī)關(guān)機(jī)時(shí)間戳。通過(guò)對(duì)URL進(jìn)行解析,得到點(diǎn)播視頻對(duì)應(yīng)名稱;根據(jù)點(diǎn)播視頻時(shí)間戳計(jì)算出視頻播放時(shí)長(zhǎng),定義點(diǎn)播當(dāng)前視頻時(shí)間為Tnow,切換至下個(gè)視頻時(shí)間為Tnext,則播放時(shí)長(zhǎng)T為:

        T=Tnext-Tnow

        (1)

        同時(shí)根據(jù)IPTV開(kāi)機(jī)關(guān)機(jī)時(shí)間戳計(jì)算在線時(shí)長(zhǎng)。將一天中各個(gè)開(kāi)關(guān)機(jī)時(shí)間段的關(guān)機(jī)時(shí)間Tclose減去開(kāi)機(jī)時(shí)間Topen的差相加求和得到一天IPTV在線時(shí)長(zhǎng)Ton:

        Ton=∑(Tclose-Topen)

        (2)

        1.2 數(shù)據(jù)預(yù)處理

        由于上述采集到的數(shù)據(jù)為文本類型,而深度學(xué)習(xí)算法中輸入類型只能是數(shù)值型[10],無(wú)法直接接受文本型數(shù)據(jù)。但若在數(shù)量很多的非數(shù)值型環(huán)境下使用深度神經(jīng)網(wǎng)絡(luò),就需要對(duì)輸入數(shù)據(jù)進(jìn)行預(yù)處理,將非數(shù)值型輸入轉(zhuǎn)化為數(shù)值類型數(shù)據(jù)。其中數(shù)據(jù)預(yù)處理分為量化與歸一化兩部分。

        1.2.1量 化

        針對(duì)所采集的原始數(shù)據(jù)集為非數(shù)值型數(shù)據(jù)并且行為特征不明顯,因此,在數(shù)據(jù)分析前,需要將數(shù)據(jù)按特征進(jìn)行分類,同時(shí)將分類后的數(shù)據(jù)量化為數(shù)值型數(shù)據(jù)[11]。將原始數(shù)據(jù)集分為三個(gè)特征:IPTV在線時(shí)長(zhǎng)、視頻播放時(shí)長(zhǎng)、點(diǎn)播視頻類型。在分析過(guò)程中,需要將原始數(shù)據(jù)集量化處理,從以上幾個(gè)特征對(duì)IPTV用戶點(diǎn)播視頻活躍度進(jìn)行分析。

        對(duì)于在線時(shí)長(zhǎng),為了簡(jiǎn)化模型,在測(cè)試過(guò)程中以等級(jí)形式對(duì)其進(jìn)行量化,其中在線時(shí)長(zhǎng)分為:0~1 h、1~2 h、2~3 h、3~4 h、4~5 h、5 h以上,分別用0、1、2、3、4、5表示。

        對(duì)于視頻播放時(shí)長(zhǎng),即點(diǎn)播一個(gè)視頻直到切換至其他視頻的連續(xù)時(shí)間Tcon(單位:h)。根據(jù)Tcon,將用戶行為分為兩類:設(shè)定Tcon小于等于5 min時(shí),記為瀏覽行為;Tcon大于5 min時(shí),認(rèn)為用戶在觀看視頻,則記為觀看行為。將瀏覽和觀看行為初始值X0分別設(shè)為0和1。

        對(duì)于點(diǎn)播視頻類型,將視頻名稱按類型劃分為電視劇、電影、綜藝、紀(jì)錄片、體育、游戲、動(dòng)畫(huà),從而得到用戶某一類視頻點(diǎn)播率P,P=N/S,其中N代表某一類被點(diǎn)播視頻,S表示當(dāng)天點(diǎn)播視頻類型總數(shù)。此處是觀看記錄,而不是瀏覽記錄。

        1.2.2歸一化

        為了后續(xù)數(shù)據(jù)處理的方便,使得梯度始終朝著最小值的方向前進(jìn),同時(shí)保證模型運(yùn)行時(shí)快速收斂[12],需要把量化后的數(shù)據(jù)經(jīng)過(guò)相關(guān)處理后限制在一定域值范圍內(nèi)。因此將上述量化后的數(shù)據(jù)集進(jìn)一步處理。

        對(duì)于在線時(shí)長(zhǎng),通過(guò)上述公式轉(zhuǎn)換后得到數(shù)據(jù)集[0,0.2,0.4,0.6,0.8,1]。

        對(duì)于點(diǎn)播視頻名稱而言,通過(guò)量化后已得到視頻點(diǎn)播率,屬于0-1之間,所以不對(duì)其進(jìn)行歸一化處理。

        2 基于深度學(xué)習(xí)的IPTV視頻用戶行為分析方法

        2.1 深度神經(jīng)網(wǎng)絡(luò)模型

        深度神經(jīng)網(wǎng)絡(luò)(DNN)按照不同層的位置劃分可以分為三類,輸入層、隱藏層和輸出層[13]。隱藏層可以包含多層,負(fù)責(zé)增強(qiáng)模型的表達(dá)能力,本文采用包含三層隱藏層的DNN模型,如圖2所示。輸出層可以包含多個(gè)輸出,從而更靈活有效地應(yīng)用于分類回歸。其中層與層之間是全連接的,同一層的神經(jīng)元之間無(wú)連接。

        圖2 深度神經(jīng)網(wǎng)絡(luò)圖

        由于DNN內(nèi)部網(wǎng)絡(luò)復(fù)雜,本文對(duì)局部模型進(jìn)行解析,其結(jié)構(gòu)如圖3所示。

        圖3 DNN局部結(jié)構(gòu)圖

        從第l-1到第l層可用一個(gè)線性關(guān)系表示:

        z=Wx+b

        (3)

        式中:W表示權(quán)值矩陣,x表示輸入向量,b表示偏倚向量,變換如下:

        (4)

        在式(4)基礎(chǔ)上加入一個(gè)激勵(lì)函數(shù)σ(z)以增加模型非線性和魯棒性。本文使用softmax函數(shù)作為模型的激勵(lì)函數(shù):

        (5)

        2.2 基于深度學(xué)習(xí)的IPTV視頻用戶行為分析

        由于IPTV機(jī)頂盒的業(yè)務(wù)流程主要利用遙控器向家庭寬帶網(wǎng)絡(luò)獲取視頻信號(hào),網(wǎng)絡(luò)將點(diǎn)播的視頻信號(hào)發(fā)送到機(jī)頂盒,經(jīng)過(guò)解碼后最終在電視上輸出。因?yàn)闄C(jī)頂盒具有唯一的用戶標(biāo)識(shí),所以機(jī)頂盒遙控器行為是分析用戶行為的關(guān)鍵屬性。IPTV可提供的業(yè)務(wù)有電視直播、視頻點(diǎn)播、互動(dòng)游戲等,通過(guò)遙控器行為可以得知用戶操作屬于直播還是點(diǎn)播等其他行為。本文主要針對(duì)IPTV用戶點(diǎn)播視頻活躍度行為進(jìn)行分類。

        將預(yù)處理后的數(shù)據(jù)輸入到CSV文檔中,完成數(shù)據(jù)集D的制作。本文使用留出法(hold-out)[14],該方法將數(shù)據(jù)集D劃分為兩個(gè)互斥的集合:訓(xùn)練集S和測(cè)試集T,即D=S∪T,S∩T=φ。利用S訓(xùn)練出理想模型后,再使用T來(lái)評(píng)估模型優(yōu)劣。

        將訓(xùn)練集S輸入到深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練模塊中,模型輸出預(yù)測(cè)結(jié)果,同時(shí)根據(jù)真實(shí)用戶標(biāo)簽,反饋到深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練模塊中對(duì)誤差進(jìn)行持續(xù)修正訓(xùn)練,訓(xùn)練過(guò)程中,利用損失函數(shù)來(lái)判斷模型預(yù)測(cè)的好壞,如下式所示:

        (6)

        本文設(shè)置7個(gè)樣本標(biāo)簽,分別表示用戶喜歡收看的種類電視劇、電影、綜藝、紀(jì)錄片、體育、游戲、動(dòng)畫(huà)。由于樣本標(biāo)簽是離散數(shù)據(jù),為了方便模型分類預(yù)測(cè),使用one-hot編碼處理樣本標(biāo)簽y,則:

        因此,將式(6)進(jìn)一步化簡(jiǎn),得到:

        (7)

        當(dāng)loss值足夠小時(shí),代表模型預(yù)測(cè)結(jié)果與真實(shí)結(jié)果近似接近,此時(shí)模型訓(xùn)練完畢。為了驗(yàn)證模型準(zhǔn)確率,向訓(xùn)練后的模型輸入測(cè)試集T,最終輸出用戶點(diǎn)播視頻活躍度分類。

        3 實(shí)驗(yàn)與結(jié)果分析

        實(shí)驗(yàn)環(huán)境:編譯工具Python 3.5.0,采集工具wireshark 2.2.1,操作系統(tǒng)Mac os 10.12.6,CPU i7-4850HQ四核處理器,主頻2.5 GHz,內(nèi)存16 GB,硬盤容量512 GB SSD。

        實(shí)驗(yàn)數(shù)據(jù):實(shí)驗(yàn)組織100個(gè)友好家庭用戶,在其觀看視頻后采取問(wèn)卷調(diào)查等方式,獲得用戶真實(shí)的點(diǎn)播數(shù)據(jù)及對(duì)視頻的點(diǎn)評(píng)數(shù)據(jù)。調(diào)查內(nèi)容主要有觀看視頻種類、觀后感,其等級(jí)分為喜歡、不喜歡,另外還包含開(kāi)機(jī)在線時(shí)長(zhǎng)、觀看視頻的連續(xù)時(shí)間等,完成對(duì)用戶活躍度的判斷,其結(jié)果將作為真實(shí)用戶標(biāo)簽。同時(shí)連續(xù)30天采集每個(gè)家庭的機(jī)頂盒數(shù)據(jù),對(duì)其進(jìn)行預(yù)處理得到符合模型標(biāo)準(zhǔn)要求的數(shù)據(jù)集D,則D=3 000。其中2 500條數(shù)據(jù)集為訓(xùn)練集S,剩余500條為測(cè)試集。

        本文利用深度學(xué)習(xí)對(duì)IPTV視頻點(diǎn)播用戶進(jìn)行分析。實(shí)驗(yàn)?zāi)P蜑槿龑与[藏層網(wǎng)絡(luò)結(jié)構(gòu),即l=3,輸入x0為15維特征集向量,包括在線時(shí)長(zhǎng),觀看7類視頻連續(xù)時(shí)間以及7類視頻點(diǎn)播率,設(shè)置網(wǎng)絡(luò)模型第一層為20維,第二層為16維,經(jīng)過(guò)第三層,下降成7維,最后輸出與對(duì)應(yīng)7維標(biāo)簽相比較,優(yōu)化差距,訓(xùn)練模型。

        實(shí)驗(yàn)設(shè)置模型訓(xùn)練次數(shù)為10 000次,當(dāng)loss值足夠小時(shí),模型訓(xùn)練完畢。圖4為訓(xùn)練loss變化圖。

        圖4 loss變化圖

        如圖4所示,經(jīng)過(guò)10 000次訓(xùn)練,loss值已經(jīng)降低到0.3左右并保持穩(wěn)定,模型訓(xùn)練完畢。訓(xùn)練過(guò)程中,為了判斷模型是否訓(xùn)練符合要求,實(shí)驗(yàn)設(shè)置每訓(xùn)練50次,輸入一次測(cè)試集驗(yàn)證準(zhǔn)確率,同時(shí)輸出測(cè)試結(jié)果,如圖5所示。

        圖5 測(cè)試集驗(yàn)證準(zhǔn)確率

        實(shí)驗(yàn)結(jié)果顯示,隨著訓(xùn)練次數(shù)的增加,測(cè)試準(zhǔn)確率不斷提高。當(dāng)訓(xùn)練次數(shù)為0~2 500次時(shí),即測(cè)試次數(shù)為0~50次時(shí),模型準(zhǔn)確率呈線性增長(zhǎng)趨勢(shì);訓(xùn)練到2 500次以后,準(zhǔn)確率逐漸平緩上升,訓(xùn)練到10 000次時(shí),準(zhǔn)確率已保持在93%左右。對(duì)比汪敏娟等提出的精準(zhǔn)分群算法,其分群準(zhǔn)確率低于90%,本研究分析效果較好,解決對(duì)離散數(shù)據(jù)分類的問(wèn)題,并且能夠避免無(wú)意識(shí)的點(diǎn)播行為,同時(shí)能夠捕獲到各種協(xié)議網(wǎng)絡(luò)數(shù)據(jù)流,縮小實(shí)驗(yàn)局限性,準(zhǔn)確度較高。

        4 結(jié) 語(yǔ)

        研究表明,利用深度學(xué)習(xí)技術(shù)能夠以較高的準(zhǔn)確率快速精準(zhǔn)地分析IPTV用戶點(diǎn)播視頻類型活躍度。盡管本文的研究已經(jīng)取得了一定階段性成果,但是由于模型還不夠完善,并且對(duì)用戶行為分析不夠全面。下一步工作將會(huì)對(duì)用戶行為進(jìn)行全方位分析,包括用戶點(diǎn)播視頻消費(fèi)指數(shù)、用戶觀看視頻體驗(yàn)質(zhì)量等,并對(duì)以上信息進(jìn)行行為建模、深度學(xué)習(xí)和知識(shí)發(fā)現(xiàn),具體分析IPTV用戶的觀看視頻行為習(xí)慣和興趣愛(ài)好,從整體上洞悉用戶的需求、強(qiáng)化客戶關(guān)懷,使得運(yùn)營(yíng)商可進(jìn)一步為用戶提供更有價(jià)值的、個(gè)性化的服務(wù)。

        猜你喜歡
        深度用戶分析
        隱蔽失效適航要求符合性驗(yàn)證分析
        深度理解一元一次方程
        深度觀察
        深度觀察
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        深度觀察
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        五月婷婷丁香视频在线观看| 97人人模人人爽人人喊网| 国产成人亚洲精品无码青| 18精品久久久无码午夜福利| 丰满岳乱妇久久久| 青青青伊人色综合久久亚洲综合| 日本成熟妇人高潮aⅴ| 国产av在线观看91| 久久精品色福利熟妇丰满人妻91| 在线视频国产91自拍| 丁香六月久久婷婷开心| 亚洲综合一区二区三区四区五区| 久久精品国产一区二区蜜芽| 亚洲一区二区成人在线视频| 熟妇人妻精品一区二区视频免费的| 久久久久久人妻无码| 国产美女自慰在线观看| 毛片免费在线播放| 久久精品国产亚洲精品色婷婷| 手机在线看片国产人妻| 影音先锋中文字幕无码资源站 | 蜜臀久久99精品久久久久久小说| 日韩国产一区| 国产最新一区二区三区| 91精品国产九色综合久久香蕉| 无码小电影在线观看网站免费| 夜夜揉揉日日人人| 亚洲夫妻性生活视频网站| 国产不卡av一区二区三区| 夜晚黄色福利国产精品| 欧美黑人性暴力猛交喷水| 富婆如狼似虎找黑人老外| 秀人网嫩模李梓熙大尺度| 国产变态av一区二区三区调教| 少妇饥渴偷公乱a级无码| 国产91对白在线观看| 国产二区中文字幕在线观看| 亚洲欧洲国产成人综合在线| 老熟女毛茸茸浓毛| 欧美洲精品亚洲精品中文字幕| 日韩在线不卡一区三区av|