亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        貝葉斯網(wǎng)絡(luò)在用戶興趣模型構(gòu)建中的研究

        2016-08-13 09:44:27王慶福
        無線互聯(lián)科技 2016年12期
        關(guān)鍵詞:畫像貝葉斯標簽

        王慶福

        (遼寧行政學院,遼寧 沈陽 110161)

        貝葉斯網(wǎng)絡(luò)在用戶興趣模型構(gòu)建中的研究

        王慶福

        (遼寧行政學院,遼寧 沈陽 110161)

        用戶興趣模型對于用戶畫像的刻畫至關(guān)重要。用戶畫像是用戶在互聯(lián)網(wǎng)中的身份證,完整地構(gòu)建用戶畫像能夠相對明確地知曉用戶需求,這對于互聯(lián)網(wǎng)時代提升用戶體驗非常重要。眾所周知,電商購物、新聞視頻推薦等眾多領(lǐng)域都需要清晰地刻畫用戶畫像,根據(jù)用戶的興趣定向推薦相關(guān)內(nèi)容。

        用戶畫像;興趣模型;內(nèi)容推薦

        互聯(lián)網(wǎng)時代對內(nèi)容信息的精細化已經(jīng)越來越明確,傳統(tǒng)的信息粗分類的組合方式已經(jīng)逐漸淡出人們的視野。信息粗分類方式目前以門戶網(wǎng)站(新浪、搜狐)和一些信息分類網(wǎng)站(58、趕集網(wǎng))為主要形態(tài)。在信息粗分類的基礎(chǔ)上衍生了大量的垂直內(nèi)容型平臺,今日頭條以咨詢內(nèi)容推薦為依托已經(jīng)在國內(nèi)擁有非常大的用戶群,今日頭條是區(qū)別于傳統(tǒng)的門戶新聞類網(wǎng)站,傳統(tǒng)的門戶新聞類網(wǎng)站需要承載太多的內(nèi)容,而且以熱門推薦為主要方式,今日頭條則以個性戶的推薦方式為主,根據(jù)用戶的興趣特點構(gòu)建內(nèi)容聚合流。不僅在新聞推薦這一領(lǐng)域,其它領(lǐng)域也不斷衍生出大量的垂直細分頻道。淘寶作為國內(nèi)最早從事互聯(lián)網(wǎng)電商的平臺,淘寶的分類非常廣,從服裝、虛擬充值到票務(wù),大量的分類信息在淘寶上都能夠找到對應的分類,隨后出現(xiàn)以京東為主的電子類產(chǎn)品購物平臺以及后來主打女性購物平臺的蘑菇街和美麗說??梢姡S著社會分工越來越精細化,在互聯(lián)網(wǎng)時代中也同樣需要各個領(lǐng)域作精細化分類。

        用戶畫像作為用戶在互聯(lián)網(wǎng)中的身份證就說明了用戶的一切。從傳統(tǒng)行業(yè)到互聯(lián)網(wǎng)行業(yè),無不希望能夠精準地構(gòu)建用戶畫像,這意味著清晰地掌握了用戶需求,就能夠精確地為用戶提供所需要的服務(wù)。用戶畫像中一個重要的組成部分是用戶興趣,用戶興趣處于實時變化中,用戶的一些靜態(tài)信息基本上處于不變或者長期穩(wěn)定的狀態(tài),用戶的性別和年齡信息、用戶的居住地信息以及用戶的學歷信息等都非常穩(wěn)定,因此用戶畫像的關(guān)鍵是構(gòu)建用戶的興趣模型。貝葉斯網(wǎng)絡(luò)作為用戶興趣模型構(gòu)建重要模型,本文主要針對貝葉斯網(wǎng)絡(luò)在用戶興趣構(gòu)建的應用展開研究。

        1 貝葉斯網(wǎng)絡(luò)

        貝葉斯網(wǎng)絡(luò)作為機器學習中重要算法,通過將事件中各個狀態(tài)構(gòu)建為網(wǎng)絡(luò)中各個節(jié)點,各個狀態(tài)之間的轉(zhuǎn)換概率則轉(zhuǎn)變?yōu)楣?jié)點之間的邊連接權(quán)值,對貝葉斯網(wǎng)絡(luò)中各個節(jié)點之間的邊連接權(quán)值進行訓練學習,這便構(gòu)成了貝葉斯網(wǎng)絡(luò)。

        1.1 貝葉斯定理

        貝葉斯定理就是概率論中的條件概率,如公式1所示:

        對公式1進行變化可得公式2。

        根據(jù)兩個變量的規(guī)則變化,推廣到多邊量上,可得公式3:

        1.2 貝葉斯推斷

        貝葉斯推斷是在貝葉斯定理的基礎(chǔ)上進行變形,P(A)就是先驗概率,是事件B發(fā)生之前A事件的概率。P(A|B)是后驗概率,是事件B發(fā)生以后發(fā)生事件A的概率。

        1.3 樸素貝葉斯法

        樸素貝葉斯方法是在貝葉斯定理和貝葉斯推斷的基礎(chǔ)上進行條件獨立性假設(shè),通常用來進行分類。為什么要進行獨立性假設(shè)呢,其實就是為了簡化計算。因為涉及兩個條件以上的條件概率時計算公式。在構(gòu)造樸素貝葉斯結(jié)構(gòu)圖時如果事件是條件獨立的P(A|B,C)=P(A),可以進行簡化。

        1.4 貝葉斯網(wǎng)絡(luò)

        樸素貝葉斯方法要求各個事件條件獨立,這個要求在實際場景中很難真實存在,于是就有了貝葉斯網(wǎng)絡(luò),貝葉斯網(wǎng)絡(luò)不像樸素貝葉斯要求那么高,各個事件之間不必是條件獨立的。貝葉斯網(wǎng)絡(luò)主要包含了條件概率表和網(wǎng)絡(luò)結(jié)構(gòu)圖。通常貝葉斯網(wǎng)絡(luò)的難點在于如何構(gòu)建貝葉斯網(wǎng)絡(luò),因此對于貝葉斯網(wǎng)絡(luò)的研究也包含了結(jié)構(gòu)學習和參數(shù)學習兩個方面。貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

        圖1 貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)

        2 用戶興趣模型構(gòu)建

        簡而言之,用戶畫像是根據(jù)用戶社會屬性、生活習慣和消費行為等信息而抽象出的一個標簽化的用戶模型。構(gòu)建用戶畫像的核心工作即是給用戶貼“標簽”,而標簽是通過對用戶信息分析而來的高度精煉的特征標識。除去“標簽化”,用戶畫像還具有的特點是“低交叉率”,當兩組畫像除了權(quán)重較小的標簽外其余標簽幾乎一致,那就可以將二者合并,弱化低權(quán)重標簽的差異。

        用戶的興趣一般都是基于一定的環(huán)境,所以既要考慮到不同的劃分角度,又要考慮到不同時間段內(nèi)用戶興趣的轉(zhuǎn)移。如現(xiàn)有的用戶短期興趣模型和長期興趣模型,以及混合興趣模型,將用戶的興趣劃分成相應的等級,根據(jù)權(quán)值進行度量。興趣的轉(zhuǎn)移可以通過對比不同時間窗口內(nèi)用戶瀏覽內(nèi)容的關(guān)鍵字聚類的結(jié)果得出。

        數(shù)據(jù)是構(gòu)建用戶興趣標簽的核心。用戶興趣標簽主要依賴3類數(shù)據(jù)。

        第一,用戶數(shù)據(jù)。靜態(tài)用戶數(shù)據(jù):用戶相對穩(wěn)定的信息,主要包括用戶的自然屬性,商業(yè)屬性等方面數(shù)據(jù)。這類信息,自成標簽,如果企業(yè)有真實信息則無需過多建模預測,更多的是數(shù)據(jù)清洗的工作。動態(tài)信息數(shù)據(jù):用戶不斷變化的行為信息,用戶搜索了什么商品,瀏覽了哪個頁面,贊了哪條微博消息,發(fā)布了積極或消極的評論,這些都是互聯(lián)網(wǎng)上的用戶行為,將成為用戶興趣標簽中偏好特征和消費特征的主要依據(jù)。

        第二,商品數(shù)據(jù)??陀^商品屬性:商品功能、顏色、尺寸等具體數(shù)據(jù)。主觀的商品數(shù)據(jù):包括商品的定位、風格的因素。商品的數(shù)據(jù)可認為是商品的標簽數(shù)據(jù),需要和用戶的標簽進行關(guān)聯(lián)。

        第三,平臺數(shù)據(jù)。平臺數(shù)據(jù)是指用戶和商品交互的平臺,用戶獲取信息的平臺,用戶購買商品的平臺,用戶發(fā)布評論的平臺等。不同的平臺對于用戶興趣的貢獻度各有不同,精準的定位平臺信息能夠幫助提升用戶興趣的準確度。

        有了上述3類數(shù)據(jù)之后,需要根據(jù)用戶行為構(gòu)建相應的數(shù)據(jù)模型產(chǎn)出標簽和權(quán)重。每一次用戶行為可以詳細描述為:什么用戶,在什么時間,什么地點,發(fā)生了什么事。

        從上述建模方法中,可以簡單勾畫出一個用戶行為的標簽權(quán)重公式:標簽權(quán)重=時間衰減(何時)×網(wǎng)址權(quán)重(何地)×行為權(quán)重(做什么)。

        通過數(shù)據(jù)建模,企業(yè)可以有效地為能覆蓋到的用戶打上標簽,之后結(jié)合渠道信息和商品信息,企業(yè)可根據(jù)需求定向地選擇數(shù)據(jù)挖掘的方法輸出結(jié)果,在營銷決策中,可能得到的結(jié)論例如“具有標簽a的人中購買了商品A”“購買商品B的用戶同樣會對商品A感興趣”“商品A的購買人群主要集中于渠道c”等等,這些信息將直接指導企業(yè)完成營銷決策。在這個過程中常用的算法包括聚類和關(guān)聯(lián)規(guī)則等,這些算法的核心邏輯可以認為是利用現(xiàn)有事實對未來進行預測的過程。構(gòu)建流程如圖2所示。

        圖2 用戶畫像構(gòu)建流程

        用戶畫像中主要任務(wù)是對用戶興趣標簽的刻畫,通過對用戶的行為進行建模,用戶的行為并未呈現(xiàn)單方面的有向性,并且用戶行為大多相互之間存在關(guān)聯(lián)性,這對于采用貝葉斯網(wǎng)絡(luò)進行分析非常合適,用戶各個行為之間構(gòu)建有向連接,邊連接上權(quán)值表示各個行為之間關(guān)聯(lián)性,通過訓練數(shù)據(jù)對整個模型進行迭代訓練。

        用戶畫像的分析刻畫非常重要。第一,精準營銷,分析產(chǎn)品潛在用戶,針對特定群體利用短信郵件等方式進行營銷;第二,用戶統(tǒng)計,比如中國大學購買書籍人數(shù)TOP10,全國分城市奶爸指數(shù);第三,數(shù)據(jù)挖掘,構(gòu)建智能推薦系統(tǒng),利用關(guān)聯(lián)規(guī)則計算,喜歡紅酒的人通常喜歡什么運動品牌,利用聚類算法分析,喜歡紅酒的人年齡段分布情況;第四,進行效果評估,完善產(chǎn)品運營,提升服務(wù)質(zhì)量,其實這也就相當于市場調(diào)研和用戶調(diào)研,迅速下定位服務(wù)群體,提供高水平的服務(wù);第五,對服務(wù)或產(chǎn)品進行私人定制,即個性化的服務(wù)某類群體甚至每一位用戶(個人認為這是目前的發(fā)展趨勢,未來的消費主流)。比如,某公司想推出一款面向5-10歲兒童的玩具,通過用戶畫像進行分析,發(fā)現(xiàn)形象=“喜羊羊”,價格區(qū)間=“中等”的偏好比重最大,那么就給新產(chǎn)品提供這類非常客觀有效的決策依據(jù);第六,業(yè)務(wù)經(jīng)營分析以及競爭分析,影響企業(yè)發(fā)展戰(zhàn)略。

        3 結(jié)語

        本文主要分析了用戶畫像在當前互聯(lián)網(wǎng)垂直頻道細分中重要性,結(jié)合貝葉斯網(wǎng)絡(luò)在用戶畫像中重要組成部分-用戶興趣標簽構(gòu)建中應用展開研究。貝葉斯網(wǎng)絡(luò)能夠?qū)崿F(xiàn)數(shù)據(jù)全局合理優(yōu)化的作用,貝葉斯網(wǎng)絡(luò)將用戶行為特征映射為網(wǎng)格中各個節(jié)點之間轉(zhuǎn)換權(quán)值,提取分析用戶興趣標簽。

        [1]張平,劉三陽,朱明敏.基于人工蜂群算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學習[J].智能系統(tǒng)學報,2014(3):325-329. [2]王巍.基于云參數(shù)貝葉斯網(wǎng)絡(luò)的威脅評估方法[J].計算機技術(shù)與發(fā)展,2016(6):1-5.

        [3]高曉光,陳海洋,史建國.變結(jié)構(gòu)動態(tài)貝葉斯網(wǎng)絡(luò)的機制研究[J].自動化學報,2011(12):1435-1444.

        [4]慕春棣,戴劍彬,葉俊.用于數(shù)據(jù)挖掘的貝葉斯網(wǎng)絡(luò)[J].軟件學報,2000(5):660-666.

        [5]王輝.用于預測的貝葉斯網(wǎng)絡(luò)[J].東北師大學報:自然科學版,2002(1):9-14.

        Research on User Interest Model Construction Based on Bayes Network

        Wang Qingfu
        (Liaoning Academy of Governance, Shenyang 110161, China)

        User interest model is essential for the user portrait depicts.User portrait is the Internet ID card of user, which completely builds user portrait to relatively clear awareness of the needs of users, and it is very important to improve the user experience in Internet age. As we all know, shopping, news video recommendation and other areas are required to clearly portray the user portrait, according to the user's interest oriented recommendation related content.

        user profile; interest model; content recommendation

        王慶福(1979— ),男,遼寧沈陽,本科,講師;研究方向:計算機網(wǎng)絡(luò)與數(shù)據(jù)庫技術(shù)。

        猜你喜歡
        畫像貝葉斯標簽
        威猛的畫像
        “00后”畫像
        畫像
        無懼標簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        不害怕撕掉標簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        貝葉斯公式及其應用
        基于貝葉斯估計的軌道占用識別方法
        標簽化傷害了誰
        一種基于貝葉斯壓縮感知的說話人識別方法
        電子器件(2015年5期)2015-12-29 08:43:15
        基于多進制查詢樹的多標簽識別方法
        計算機工程(2015年8期)2015-07-03 12:20:27
        国产亚洲无码1024| 国产人妻久久精品二区三区特黄| 少妇高潮惨叫久久久久久| 国产成人一区二区三区视频免费蜜 | 一区二区三区av资源网| 国产一区二区三区视频地址| 国产又爽又大又黄a片| 国内揄拍国内精品少妇国语| jk制服黑色丝袜喷水视频国产| 免费人成黄页网站在线一区二区| 中文字幕在线日亚州9| 牛鞭伸入女人下身的真视频| 99久久久69精品一区二区三区| 伊人婷婷综合缴情亚洲五月| 乱人伦中文视频在线| 国产成人av一区二区三区在线| 亚洲无码图| 野花视频在线观看免费| 日本高清视频永久网站www| 亚洲AV永久无码制服河南实里 | 国产大屁股白浆一区二区三区| 欧美白人战黑吊| 全部孕妇毛片| 国产成人丝袜网站在线看 | 久久无码潮喷a片无码高潮| 亚洲第一无码xxxxxx| 日韩精品欧美激情亚洲综合| 国产激情视频高清在线免费观看| 欧洲美女熟乱av| 精品人妻系列无码一区二区三区| yw193.can尤物国产在线网页| 中文字幕亚洲精品在线免费| 亚洲中文字幕成人无码| 亚洲AV一二三四区四色婷婷| 亚洲成在人网站天堂日本| 日本一区二区三区爆乳| 丰满五十六十老熟女hd| 日本女优在线观看一区二区三区| 免费在线观看av不卡网站 | 二区三区三区视频在线观看| 真人作爱免费视频|