亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        貝葉斯網(wǎng)絡(luò)在用戶興趣模型構(gòu)建中的研究

        2016-08-13 09:44:27王慶福
        無線互聯(lián)科技 2016年12期
        關(guān)鍵詞:用戶信息模型

        王慶福

        (遼寧行政學(xué)院,遼寧 沈陽 110161)

        貝葉斯網(wǎng)絡(luò)在用戶興趣模型構(gòu)建中的研究

        王慶福

        (遼寧行政學(xué)院,遼寧 沈陽 110161)

        用戶興趣模型對于用戶畫像的刻畫至關(guān)重要。用戶畫像是用戶在互聯(lián)網(wǎng)中的身份證,完整地構(gòu)建用戶畫像能夠相對明確地知曉用戶需求,這對于互聯(lián)網(wǎng)時代提升用戶體驗非常重要。眾所周知,電商購物、新聞視頻推薦等眾多領(lǐng)域都需要清晰地刻畫用戶畫像,根據(jù)用戶的興趣定向推薦相關(guān)內(nèi)容。

        用戶畫像;興趣模型;內(nèi)容推薦

        互聯(lián)網(wǎng)時代對內(nèi)容信息的精細化已經(jīng)越來越明確,傳統(tǒng)的信息粗分類的組合方式已經(jīng)逐漸淡出人們的視野。信息粗分類方式目前以門戶網(wǎng)站(新浪、搜狐)和一些信息分類網(wǎng)站(58、趕集網(wǎng))為主要形態(tài)。在信息粗分類的基礎(chǔ)上衍生了大量的垂直內(nèi)容型平臺,今日頭條以咨詢內(nèi)容推薦為依托已經(jīng)在國內(nèi)擁有非常大的用戶群,今日頭條是區(qū)別于傳統(tǒng)的門戶新聞類網(wǎng)站,傳統(tǒng)的門戶新聞類網(wǎng)站需要承載太多的內(nèi)容,而且以熱門推薦為主要方式,今日頭條則以個性戶的推薦方式為主,根據(jù)用戶的興趣特點構(gòu)建內(nèi)容聚合流。不僅在新聞推薦這一領(lǐng)域,其它領(lǐng)域也不斷衍生出大量的垂直細分頻道。淘寶作為國內(nèi)最早從事互聯(lián)網(wǎng)電商的平臺,淘寶的分類非常廣,從服裝、虛擬充值到票務(wù),大量的分類信息在淘寶上都能夠找到對應(yīng)的分類,隨后出現(xiàn)以京東為主的電子類產(chǎn)品購物平臺以及后來主打女性購物平臺的蘑菇街和美麗說??梢?,隨著社會分工越來越精細化,在互聯(lián)網(wǎng)時代中也同樣需要各個領(lǐng)域作精細化分類。

        用戶畫像作為用戶在互聯(lián)網(wǎng)中的身份證就說明了用戶的一切。從傳統(tǒng)行業(yè)到互聯(lián)網(wǎng)行業(yè),無不希望能夠精準(zhǔn)地構(gòu)建用戶畫像,這意味著清晰地掌握了用戶需求,就能夠精確地為用戶提供所需要的服務(wù)。用戶畫像中一個重要的組成部分是用戶興趣,用戶興趣處于實時變化中,用戶的一些靜態(tài)信息基本上處于不變或者長期穩(wěn)定的狀態(tài),用戶的性別和年齡信息、用戶的居住地信息以及用戶的學(xué)歷信息等都非常穩(wěn)定,因此用戶畫像的關(guān)鍵是構(gòu)建用戶的興趣模型。貝葉斯網(wǎng)絡(luò)作為用戶興趣模型構(gòu)建重要模型,本文主要針對貝葉斯網(wǎng)絡(luò)在用戶興趣構(gòu)建的應(yīng)用展開研究。

        1 貝葉斯網(wǎng)絡(luò)

        貝葉斯網(wǎng)絡(luò)作為機器學(xué)習(xí)中重要算法,通過將事件中各個狀態(tài)構(gòu)建為網(wǎng)絡(luò)中各個節(jié)點,各個狀態(tài)之間的轉(zhuǎn)換概率則轉(zhuǎn)變?yōu)楣?jié)點之間的邊連接權(quán)值,對貝葉斯網(wǎng)絡(luò)中各個節(jié)點之間的邊連接權(quán)值進行訓(xùn)練學(xué)習(xí),這便構(gòu)成了貝葉斯網(wǎng)絡(luò)。

        1.1 貝葉斯定理

        貝葉斯定理就是概率論中的條件概率,如公式1所示:

        對公式1進行變化可得公式2。

        根據(jù)兩個變量的規(guī)則變化,推廣到多邊量上,可得公式3:

        1.2 貝葉斯推斷

        貝葉斯推斷是在貝葉斯定理的基礎(chǔ)上進行變形,P(A)就是先驗概率,是事件B發(fā)生之前A事件的概率。P(A|B)是后驗概率,是事件B發(fā)生以后發(fā)生事件A的概率。

        1.3 樸素貝葉斯法

        樸素貝葉斯方法是在貝葉斯定理和貝葉斯推斷的基礎(chǔ)上進行條件獨立性假設(shè),通常用來進行分類。為什么要進行獨立性假設(shè)呢,其實就是為了簡化計算。因為涉及兩個條件以上的條件概率時計算公式。在構(gòu)造樸素貝葉斯結(jié)構(gòu)圖時如果事件是條件獨立的P(A|B,C)=P(A),可以進行簡化。

        1.4 貝葉斯網(wǎng)絡(luò)

        樸素貝葉斯方法要求各個事件條件獨立,這個要求在實際場景中很難真實存在,于是就有了貝葉斯網(wǎng)絡(luò),貝葉斯網(wǎng)絡(luò)不像樸素貝葉斯要求那么高,各個事件之間不必是條件獨立的。貝葉斯網(wǎng)絡(luò)主要包含了條件概率表和網(wǎng)絡(luò)結(jié)構(gòu)圖。通常貝葉斯網(wǎng)絡(luò)的難點在于如何構(gòu)建貝葉斯網(wǎng)絡(luò),因此對于貝葉斯網(wǎng)絡(luò)的研究也包含了結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)兩個方面。貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

        圖1 貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)

        2 用戶興趣模型構(gòu)建

        簡而言之,用戶畫像是根據(jù)用戶社會屬性、生活習(xí)慣和消費行為等信息而抽象出的一個標(biāo)簽化的用戶模型。構(gòu)建用戶畫像的核心工作即是給用戶貼“標(biāo)簽”,而標(biāo)簽是通過對用戶信息分析而來的高度精煉的特征標(biāo)識。除去“標(biāo)簽化”,用戶畫像還具有的特點是“低交叉率”,當(dāng)兩組畫像除了權(quán)重較小的標(biāo)簽外其余標(biāo)簽幾乎一致,那就可以將二者合并,弱化低權(quán)重標(biāo)簽的差異。

        用戶的興趣一般都是基于一定的環(huán)境,所以既要考慮到不同的劃分角度,又要考慮到不同時間段內(nèi)用戶興趣的轉(zhuǎn)移。如現(xiàn)有的用戶短期興趣模型和長期興趣模型,以及混合興趣模型,將用戶的興趣劃分成相應(yīng)的等級,根據(jù)權(quán)值進行度量。興趣的轉(zhuǎn)移可以通過對比不同時間窗口內(nèi)用戶瀏覽內(nèi)容的關(guān)鍵字聚類的結(jié)果得出。

        數(shù)據(jù)是構(gòu)建用戶興趣標(biāo)簽的核心。用戶興趣標(biāo)簽主要依賴3類數(shù)據(jù)。

        第一,用戶數(shù)據(jù)。靜態(tài)用戶數(shù)據(jù):用戶相對穩(wěn)定的信息,主要包括用戶的自然屬性,商業(yè)屬性等方面數(shù)據(jù)。這類信息,自成標(biāo)簽,如果企業(yè)有真實信息則無需過多建模預(yù)測,更多的是數(shù)據(jù)清洗的工作。動態(tài)信息數(shù)據(jù):用戶不斷變化的行為信息,用戶搜索了什么商品,瀏覽了哪個頁面,贊了哪條微博消息,發(fā)布了積極或消極的評論,這些都是互聯(lián)網(wǎng)上的用戶行為,將成為用戶興趣標(biāo)簽中偏好特征和消費特征的主要依據(jù)。

        第二,商品數(shù)據(jù)??陀^商品屬性:商品功能、顏色、尺寸等具體數(shù)據(jù)。主觀的商品數(shù)據(jù):包括商品的定位、風(fēng)格的因素。商品的數(shù)據(jù)可認為是商品的標(biāo)簽數(shù)據(jù),需要和用戶的標(biāo)簽進行關(guān)聯(lián)。

        第三,平臺數(shù)據(jù)。平臺數(shù)據(jù)是指用戶和商品交互的平臺,用戶獲取信息的平臺,用戶購買商品的平臺,用戶發(fā)布評論的平臺等。不同的平臺對于用戶興趣的貢獻度各有不同,精準(zhǔn)的定位平臺信息能夠幫助提升用戶興趣的準(zhǔn)確度。

        有了上述3類數(shù)據(jù)之后,需要根據(jù)用戶行為構(gòu)建相應(yīng)的數(shù)據(jù)模型產(chǎn)出標(biāo)簽和權(quán)重。每一次用戶行為可以詳細描述為:什么用戶,在什么時間,什么地點,發(fā)生了什么事。

        從上述建模方法中,可以簡單勾畫出一個用戶行為的標(biāo)簽權(quán)重公式:標(biāo)簽權(quán)重=時間衰減(何時)×網(wǎng)址權(quán)重(何地)×行為權(quán)重(做什么)。

        通過數(shù)據(jù)建模,企業(yè)可以有效地為能覆蓋到的用戶打上標(biāo)簽,之后結(jié)合渠道信息和商品信息,企業(yè)可根據(jù)需求定向地選擇數(shù)據(jù)挖掘的方法輸出結(jié)果,在營銷決策中,可能得到的結(jié)論例如“具有標(biāo)簽a的人中購買了商品A”“購買商品B的用戶同樣會對商品A感興趣”“商品A的購買人群主要集中于渠道c”等等,這些信息將直接指導(dǎo)企業(yè)完成營銷決策。在這個過程中常用的算法包括聚類和關(guān)聯(lián)規(guī)則等,這些算法的核心邏輯可以認為是利用現(xiàn)有事實對未來進行預(yù)測的過程。構(gòu)建流程如圖2所示。

        圖2 用戶畫像構(gòu)建流程

        用戶畫像中主要任務(wù)是對用戶興趣標(biāo)簽的刻畫,通過對用戶的行為進行建模,用戶的行為并未呈現(xiàn)單方面的有向性,并且用戶行為大多相互之間存在關(guān)聯(lián)性,這對于采用貝葉斯網(wǎng)絡(luò)進行分析非常合適,用戶各個行為之間構(gòu)建有向連接,邊連接上權(quán)值表示各個行為之間關(guān)聯(lián)性,通過訓(xùn)練數(shù)據(jù)對整個模型進行迭代訓(xùn)練。

        用戶畫像的分析刻畫非常重要。第一,精準(zhǔn)營銷,分析產(chǎn)品潛在用戶,針對特定群體利用短信郵件等方式進行營銷;第二,用戶統(tǒng)計,比如中國大學(xué)購買書籍人數(shù)TOP10,全國分城市奶爸指數(shù);第三,數(shù)據(jù)挖掘,構(gòu)建智能推薦系統(tǒng),利用關(guān)聯(lián)規(guī)則計算,喜歡紅酒的人通常喜歡什么運動品牌,利用聚類算法分析,喜歡紅酒的人年齡段分布情況;第四,進行效果評估,完善產(chǎn)品運營,提升服務(wù)質(zhì)量,其實這也就相當(dāng)于市場調(diào)研和用戶調(diào)研,迅速下定位服務(wù)群體,提供高水平的服務(wù);第五,對服務(wù)或產(chǎn)品進行私人定制,即個性化的服務(wù)某類群體甚至每一位用戶(個人認為這是目前的發(fā)展趨勢,未來的消費主流)。比如,某公司想推出一款面向5-10歲兒童的玩具,通過用戶畫像進行分析,發(fā)現(xiàn)形象=“喜羊羊”,價格區(qū)間=“中等”的偏好比重最大,那么就給新產(chǎn)品提供這類非常客觀有效的決策依據(jù);第六,業(yè)務(wù)經(jīng)營分析以及競爭分析,影響企業(yè)發(fā)展戰(zhàn)略。

        3 結(jié)語

        本文主要分析了用戶畫像在當(dāng)前互聯(lián)網(wǎng)垂直頻道細分中重要性,結(jié)合貝葉斯網(wǎng)絡(luò)在用戶畫像中重要組成部分-用戶興趣標(biāo)簽構(gòu)建中應(yīng)用展開研究。貝葉斯網(wǎng)絡(luò)能夠?qū)崿F(xiàn)數(shù)據(jù)全局合理優(yōu)化的作用,貝葉斯網(wǎng)絡(luò)將用戶行為特征映射為網(wǎng)格中各個節(jié)點之間轉(zhuǎn)換權(quán)值,提取分析用戶興趣標(biāo)簽。

        [1]張平,劉三陽,朱明敏.基于人工蜂群算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J].智能系統(tǒng)學(xué)報,2014(3):325-329. [2]王巍.基于云參數(shù)貝葉斯網(wǎng)絡(luò)的威脅評估方法[J].計算機技術(shù)與發(fā)展,2016(6):1-5.

        [3]高曉光,陳海洋,史建國.變結(jié)構(gòu)動態(tài)貝葉斯網(wǎng)絡(luò)的機制研究[J].自動化學(xué)報,2011(12):1435-1444.

        [4]慕春棣,戴劍彬,葉俊.用于數(shù)據(jù)挖掘的貝葉斯網(wǎng)絡(luò)[J].軟件學(xué)報,2000(5):660-666.

        [5]王輝.用于預(yù)測的貝葉斯網(wǎng)絡(luò)[J].東北師大學(xué)報:自然科學(xué)版,2002(1):9-14.

        Research on User Interest Model Construction Based on Bayes Network

        Wang Qingfu
        (Liaoning Academy of Governance, Shenyang 110161, China)

        User interest model is essential for the user portrait depicts.User portrait is the Internet ID card of user, which completely builds user portrait to relatively clear awareness of the needs of users, and it is very important to improve the user experience in Internet age. As we all know, shopping, news video recommendation and other areas are required to clearly portray the user portrait, according to the user's interest oriented recommendation related content.

        user profile; interest model; content recommendation

        王慶福(1979— ),男,遼寧沈陽,本科,講師;研究方向:計算機網(wǎng)絡(luò)與數(shù)據(jù)庫技術(shù)。

        猜你喜歡
        用戶信息模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        3D打印中的模型分割與打包
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        国产色欲av一区二区三区 | 国产成人免费a在线视频| 国产精品狼人久久久影院| 国产亚洲中文字幕一区| 久久久亚洲欧洲日产国码aⅴ| 国产专区国产av| 国产欧美日韩不卡一区二区三区| 中文字幕一区二区区免| 国产禁区一区二区三区| 亚洲第一页综合图片自拍| 欧洲熟妇色| 野花在线无码视频在线播放 | 国产亚洲精品综合99久久| 中文字幕高清不卡视频二区| 国产乱码卡二卡三卡老狼 | 无码人妻AⅤ一区 二区 三区| 精品蜜桃在线观看一区二区三区| 成人av片在线观看免费| 欧美日韩色另类综合| 国产精彩视频| 成年男女免费视频网站点播| 肉色丝袜足j视频国产| 国产在线精品一区二区| 久久久久久岛国免费网站| av黄色大片久久免费| 无码人妻一区二区三区兔费| 丝袜足控一区二区三区| 伊人久久大香线蕉免费视频 | 国产愉拍91九色国产愉拍| 国产va免费精品观看精品| 人妻av一区二区三区精品| 亚洲国产视频精品一区二区| 伊人加勒比在线观看视频| 99亚洲男女激情在线观看| 欧美视频九九一区二区 | 一个人免费观看在线视频播放| 国产成人综合久久大片| 久久精品国产亚洲av香蕉| 亚洲人成网站77777在线观看| 精品人妻中文字幕一区二区三区| 中文字幕成人精品久久不卡91|