亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于社交網絡的用戶行為分析

        2017-12-27 01:49:28王佳寧國際關系學院
        數(shù)碼世界 2017年9期
        關鍵詞:特征向量代表聚類

        王佳寧 國際關系學院

        基于社交網絡的用戶行為分析

        王佳寧 國際關系學院

        在線社交網絡的興起引出了一個有趣的問題:如何較好的鑒別不同的與用戶行為。一般來說,用戶行為的鑒別基于用戶的個人特征,但是這種方法不適用于在線社交網絡用戶。在這種情況下,用戶通過網站上傳或是瀏覽內容,選擇交友,訂閱喜歡的咨詢或是其他一些交流活動。不同的交流模式可以代表了不用的用戶群體。本文將提出一種分析鑒別在線社交網絡用戶行為的方法。分析鑒別不同的用戶行為具有巨大的商業(yè)價值,例如,可以用于改善在線廣告推薦系統(tǒng),從而獲得更大的收益。

        在線社交網絡 群體 用戶行為

        1 緒論

        目前對于互聯(lián)網來說,一件至關重要的事就是鼓勵用戶之間的交流。像微信、微博,他們允許用戶創(chuàng)建他們自己的日志,包括圖片、文字或是視頻。用戶通常喜歡從其他人那里搜索、交換信息或是瀏覽內容。鑒于人類的本性,用戶不愿意展現(xiàn)單一的行為。

        對在線社交網絡用戶行為的理解有助于服務提供者合理分配資源。為了建立一個模型來描述用戶行為的種類,研究者必須了解如何區(qū)分和鑒別不同期望的用戶。為了實現(xiàn)這個目標,我們設計了網頁抓取工具來收集youtube的數(shù)據(jù),收集了標題網絡、用戶關注、分享給他人的鏈接等。這些數(shù)據(jù)將用于構建每個用戶的特征向量。

        2 關于 youtube

        YouTube成立于2005年,是最大的視頻網站。同樣可以作為在線社交網站,通過用戶行為對用戶進行分組。例如,將用戶作為節(jié)點,如果一個用戶加了另一個用戶為好友、兩個用戶同時評論了一個視頻或是一個用戶評論了另一個用戶的視頻,我們都認為他們之間就有直接聯(lián)系。這個設想就構成了一個網絡,稱作訂閱網絡?;趶V度優(yōu)先搜索這個網絡,以一組用戶作為開始,不斷添加她的訂閱以及該訂閱的最后一個用戶。

        3 聚類算法

        我們通過標準化向量的值計算距離,基于用戶行為可以對來對用戶進行分組。將用戶表示為特征向量。我們將用戶特征向量定義為一維的長度為9的矢量,定義如下:useri=[f1,f2,f3,f4,f5,f6,f7,f8,f9].其中前五個位置代表每個用戶的屬性,后四個位置代表與用戶交往的相關用戶的屬性。這九個位置的具體意義如下:

        f1:代表用戶上傳視頻(或其他)的數(shù)量,這個數(shù)量能夠表示一個用戶作為生產者的潛力;

        f2:代表不同視頻被用戶瀏覽的次數(shù),這個數(shù)量能夠表明一個用戶作為內容消費者的潛力;

        f3:不同頻道被瀏覽次數(shù),這個數(shù)量能夠表示用戶在搜索時最有可能瀏覽的頻道;

        f4:用戶在Youtube建立賬號的時間;

        f5:用戶從創(chuàng)建賬號到最近一次登錄,在Youtube上花費的時間;

        f6:聚類系數(shù),用來衡量用戶與他的“鄰居”之間的聯(lián)系。

        f7:相互關注的概率。

        f8:代表用戶作為消費者的潛力;

        f9:代表用戶作為生產者的潛力。

        這九個特征代表了不同的單元和維度??紤]到聚類算法所使用的的距離是基于每一個特征的值,必須將數(shù)據(jù)標準化以確保距離是以同樣權重的特征計算的,否則最大規(guī)模的特征就會掩蓋其他的。通過特征向量最大話來規(guī)范化數(shù)據(jù),每個特征的范圍從0到1。

        為了對有相似行為的用戶進行聚合,使用K-means算法作為聚類算法,歐幾里得距離作為距離測量方法。簡言之,K-means就是選擇k個對象作為初始聚類中心,計算剩下的每個對象與這些中心對象的距離,重復計算的步驟直到滿足一定條件,如函數(shù)收斂時,則算法終止。

        那么K值是如何確定的?本文認為應該通過變異系數(shù)來解決這一問題,最小化顆粒間CV和最大化簇間CV。這兩個CV值得比率我們記作βcv,當βcv趨于穩(wěn)定時,K取得了最好的值。為了取得最好的K值,我們要采取以下算法:

        取兩個中心記作C1和C2,以d(C1,C2)=abs(∑Fi=1(C1[i]-C2[i])/F)來標記他們的距離,其中abs(x)是未知量X的絕對值,F(xiàn)是特征向量的長度或者特征向量的值。對K賦予初值2,執(zhí)行,然后不斷增加1.計算Ck,直到k,x|d(Ck,Cx)<T。

        4 結論

        當前形勢下,不同的用戶出于不同的目標,會聯(lián)合不同的用戶群體發(fā)生行為,如果能夠準確的識別主導用戶行為的因素,就能夠更準確的為用戶提供服務。本文將提出一種分析鑒別在線社交網絡用戶行為的方法。分析鑒別不同的用戶行為具有巨大的商業(yè)價值,例如,可以用于改善在線廣告推薦系統(tǒng),從而獲得更大的收益。

        [1]楊善林,王佳佳,代寶,李旭軍,姜元春,劉業(yè)政.在線社交網絡用戶行為研究現(xiàn)狀與展望[J].中國科學院院刊

        [2]吳信東,李毅,李磊.在線社交網絡影響力分析[J].計算機學報

        [3]陳克寒,韓盼盼,吳健.基于用戶聚類的異構社交網絡推薦算法[J].計算機學報

        [4]王千,王成,馮振元,葉金鳳.K-means聚類算法研究綜述[J].電子設計工程

        猜你喜歡
        特征向量代表聚類
        二年制職教本科線性代數(shù)課程的幾何化教學設計——以特征值和特征向量為例
        詮釋代表初心 踐行人大使命
        克羅內克積的特征向量
        四季的代表
        “代表通道”新觀察
        人大建設(2020年5期)2020-09-25 08:56:38
        這個代表咋這么拗
        人大建設(2020年5期)2020-09-25 08:56:24
        一類特殊矩陣特征向量的求法
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應用
        中華建設(2017年1期)2017-06-07 02:56:14
        基于改進的遺傳算法的模糊聚類算法
        国产成人午夜福利在线小电影| 国产精品人人做人人爽人人添| 男女高潮免费观看无遮挡| 国产一在线精品一区在线观看 | 2020亚洲国产| 偷拍偷窥在线精品视频| 国产亚洲精品久久久久久国模美| 少妇高潮潮喷到猛进猛出小说| 国产亚洲精品福利在线| 国产亚洲av一线观看| 日本韩国男男作爱gaywww| 午夜亚洲av永久无码精品| 一本大道在线一久道一区二区| 中文字幕日韩精品人妻久久久| 成 人片 黄 色 大 片| 少妇spa推油被扣高潮| 校花高潮一区日韩| 毛片在线播放亚洲免费中文网| 免费看又色又爽又黄的国产软件 | 亚欧国产女人天堂Av在线播放| 国产亚洲一区二区三区夜夜骚| 中文字幕av永久免费在线| 久久婷婷人人澡人人喊人人爽 | 欧美精品亚洲精品日韩专区| 国产精品jizz观看| 亚洲免费看三级黄网站| 亚洲中文久久精品字幕| 日韩高清在线观看永久| 蜜桃一区二区三区在线看| 久久久人妻一区二区三区蜜桃d| 少妇愉情理伦片| av鲁丝一区鲁丝二区| 色老板在线免费观看视频日麻批| 欧美大片va欧美在线播放| 久久人人妻人人做人人爽| 人妻无码一区二区19P| 亚洲中文字幕九色日本| 国产麻传媒精品国产av| 黑人巨大精品欧美在线观看| 国产成人精品一区二区三区av| 色诱视频在线观看|