亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶興趣的協(xié)同服務推送方法在知乎中的應用

        2018-08-14 10:00:24顧沖張駿
        現(xiàn)代商貿(mào)工業(yè) 2018年17期

        顧沖 張駿

        摘 要:針對知乎存在的用戶獲取答案周期長、答案質(zhì)量參差不齊、用戶體驗差等問題,根據(jù)用戶提問和回答標簽構建用戶興趣模型,將用戶興趣與基于用戶的協(xié)同過濾算法結(jié)合起來,提出基于用戶興趣的用戶協(xié)同服務推送方法,并將該方法應用到知乎中進行驗證,結(jié)果證明該方法可以有效地用于知乎用戶個性化服務推送,為知乎提高自身信息服務水平提供了一定的指導意義。

        關鍵詞:社會化標簽;用戶興趣;協(xié)同過濾;服務推送

        中圖分類號:F49 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2018.17.024

        1 引言

        隨著互聯(lián)網(wǎng)信息技術和社交媒體的迅猛發(fā)展,海量信息被提供給人們,在給人們的工作、生活、學習等帶來便利的同時,也使得人們對于分享和準確獲取信息與知識的需求更為迫切。知乎作為目前國內(nèi)最熱門的社會化問答網(wǎng)站之一,融合了問答與社交,形成了用戶對信息的互動交流模式,一定程度上較好地滿足了用戶分享或獲取信息的需求。雖然經(jīng)過多年的發(fā)展,知乎已經(jīng)積累了大量高質(zhì)量問答和參與度高的用戶群體,但是仍然存在用戶體驗差、答案質(zhì)量參差不齊、用戶獲取答案周期長等問題?;谟脩襞d趣進行服務推送時,可以將問題推送給具有相似興趣的用戶以縮短用戶提問和回答的時間,提升用戶體驗感。因此,基于用戶興趣對知乎進行服務推送的研究具有重要意義。

        目前常用的服務推送技術中,主要分為三種:協(xié)同過濾推送、基于內(nèi)容的推送和基于社會化標簽的推送。其中協(xié)同過濾推送技術是目前應用最為廣泛、成熟的技術,它通過計算用戶相似度,將相似用戶的偏好信息推送給目標用戶?;趦?nèi)容的推送是指根據(jù)用戶的歷史信息來為其推送其它相似的信息。社會化標簽是用戶對信息資源的描述,一定程度上代表了用戶的興趣和偏好?;谏鐣瘶撕灥耐扑徒Y(jié)合前兩者的優(yōu)勢,根據(jù)社會化標簽挖掘用戶興趣和信息資源特點進而為用戶實現(xiàn)推送。

        知乎自身擁有一套話題體系,用戶在提問、關注、發(fā)表文章等行為過程中都需要從話題體系中選擇相應話題,知乎“話題”具有社會化標簽的功能,知乎話題體系即知乎標簽庫。因此在研究知乎用戶興趣時,利用話題標簽表示用戶興趣,具有一定地規(guī)范性、通用性和可行性。本文將用戶興趣模型與基于用戶的協(xié)同過濾結(jié)合起來,提出了基于用戶興趣的用戶協(xié)同服務推送方法,該方法為知乎提高自身信息服務水平提供了一定的指導意義。

        2 基于用戶興趣的用戶協(xié)同服務推送方法

        2.1 用戶興趣提取

        本文對“知乎”用戶興趣的提取包含兩個方面,用戶提出問題的話題興趣標簽提取和用戶回答問題的話題興趣標簽提取,分為三個步驟進行。

        (1)獲取用戶提出問題的話題興趣標簽。

        知乎用戶可以提出多個問題,但每一個問題只屬于一個用戶。用戶每提出一個問題,就會使用一個或多個話題標簽。統(tǒng)計用戶提問題時使用的所有標簽,構建用戶-話題關系矩陣,記為RT。矩陣RT的每一個行向量表示一個用戶提出問題的話題興趣標簽及其權重。

        (2)獲取用戶回答問題的話題興趣標簽。

        在知乎中,用戶與問題、問題與話題都是多對多的關系,一個用戶可以回答多個問題,一個問題也可以被多個用戶回答,一個話題可以標注多個問題,一個問題也可以被多個話題標注。為了獲取用戶回答問題的話題興趣標簽,即要找到用戶與話題之間的關系。假設三個關系矩陣,分別為用戶-問題關系矩陣M,問題-話題關系矩陣N和用戶-話題關系矩陣RQ。用戶-問題關系矩陣M表示用戶與其所回答問題之間的關系;問題-話題關系矩陣N表示問題與其標注話題之間的關系;用戶-話題關系矩陣RQ則通過公式(1)計算得到。矩陣RQ的每一個行向量表示一個用戶回答問題的話題興趣標簽及其權重。

        (3)獲得用戶最終興趣標簽。

        將用戶提出問題的話題興趣標簽和用戶回答問題的話題興趣標簽進行對比合并,重新計算標簽權重,按照標簽權重降序排列選取排名靠前的標簽作為用戶的興趣標簽,以標簽和權重來表示用戶興趣。使用興趣向量來表示最終用戶興趣模型,如公式(2)所示。

        2.2 用戶興趣矩陣

        對多個用戶的興趣向量進行合并匯總,可以獲得用戶興趣矩陣,記為R,如公式(3)所示。

        2.3 最近鄰居用戶集合的構建

        在基于用戶的協(xié)同過濾算法中最重要的就是鄰居用戶的選取,構建鄰居用戶集合主要包括兩個步驟:用戶相似度的計算和鄰居用戶的選取。

        (1)計算用戶相似度。

        用戶相似度計算是指根據(jù)用戶-標簽關系,通過一定的相似性計算方法,來計算用戶興趣的相似程度。本文使用余弦相似性計算用戶相似度,如公式(4)所示。

        (2)選取最近鄰居用戶。

        閾值設置法是指提前設定一個相似度閾值e,然后直接將相似度大于該閾值的用戶歸屬到目標用戶的最近鄰居用戶集合中。本文使用閾值設置法進行鄰居用戶的選取,實驗過程中再根據(jù)實際情況調(diào)整得到合適的閾值e。

        2.4 個性化服務推送的產(chǎn)生

        傳統(tǒng)的基于用戶的協(xié)同過濾推送算法,個性化服務推送階段是指根據(jù)目標用戶的最近鄰居對資源的偏好,為目標用戶推送相應的資源。針對知乎特點,話題標簽所標注的用戶、問題等內(nèi)容與傳統(tǒng)推送算法中的資源不同,因此,本文的個性化服務推送從不同方面進行推送,主要包含兩點。

        (1)目標用戶好友推送。

        目標用戶與其最近鄰居之間具有相似或相同興趣,容易形成好友關系。因此,可以對目標用戶的最近鄰居用戶按照相似度降序排列,選取其中排名靠前的用戶作為好友推送給目標用戶。

        (2)標簽及其標注資源推送。

        由于目標用戶與其最近鄰居用戶興趣偏好比較相近,所以最近鄰居用戶感興趣的內(nèi)容也可以是目標用戶所感興趣的,因此可以向目標用戶推送最近鄰居用戶形成的標簽集合T,如公式(5)所示,Tui表示目標用戶的興趣標簽集合,TNui表示包含目標用戶在內(nèi)的最近鄰居用戶的興趣標簽集合。另一方面,知乎中每一個話題頁面都有“活躍回答者”、“精華問答”等內(nèi)容,也可以將這些資源推送給目標用戶。

        3 知乎中服務推送實驗分析

        3.1 數(shù)據(jù)準備

        本文研究所用數(shù)據(jù)主要來源于知乎用戶egrcc在其“知乎”回答頁面(https://www.zhihu.com/question/ 36132174/answer/88579592)中分享的數(shù)據(jù)集zhihu,該數(shù)據(jù)集可用于構建用戶關注網(wǎng)絡和獲取用戶回答興趣標簽。

        為了使得服務推送方法在知乎中取得更好的效果,首先需要對數(shù)據(jù)進行處理,清洗后得到241名用戶數(shù)據(jù);再由于具有相似興趣的用戶容易形成緊密社區(qū),所以對241名用戶構建用戶關注網(wǎng)絡并使用Gephi中的“模塊化”功能將用戶劃分為多個社區(qū);最后針對其中的一個成員數(shù)量為4的社區(qū)中的用戶進行服務推送,該社區(qū)4個用戶在知乎中的user_url分別為“bu-zhi-34-47”、“cdban-zhang-lian”、“hahahaxy”、“qqwers123”。

        3.2 知乎社區(qū)用戶興趣提取

        根據(jù)用戶興趣提取的步驟,首先分別對4個用戶提問時所使用的標簽和回答時的問題所屬話題標簽進行提取,結(jié)果如表1和表2所示,其中表1數(shù)據(jù)是從知乎網(wǎng)站中提取的,表2數(shù)據(jù)由數(shù)據(jù)集中數(shù)據(jù)統(tǒng)計得到。

        為了獲得最終的用戶興趣標簽,將用戶提問和回答的話題興趣標簽合并,對每個用戶的話題標簽權重都進行歸一化處理,最后得到四名用戶的興趣模型,結(jié)果如下。

        bu-zhi-34-47:

        {(調(diào)查類問題-0.0886),(生活-0.0253),(音樂-0.0253),(旅行攻略-0.019),(社會-0.019),(文化-0.019),(音樂推薦-0.019),(X 是種怎樣的體驗-0.0127),(兒童教育-0.0127),(教育-0.0127),(恐怖-0.0127),(人性-0.0127),(日本-0.0127),(攝影-0.0127),(生活經(jīng)歷-0.0127),(心理學-0.0127),(育兒-0.0127) };

        cdban-zhang-lian:

        {(日本-0.0596),(文化-0.0265),(科技-0.0199),(兩性關系-0.0199),(劉慈欣(作家)-0.0199),(三體(系列小說)-0.0199),(社會-0.0199),(物理學-0.0199),(動漫-0.0132),(歷史-0.0132),(你如何評價 X-0.0132),(人文生活-0.0132),(生活-0.0132),(物理科普-0.0132),(心理學-0.0132),(音樂-0.0132),(哲學-0.0132),(職場-0.0132)};

        hahahaxy:

        {(調(diào)查類問題-0.0714),(生活-0.05),(英語-0.0429),(生活經(jīng)歷-0.0357),(兩性關系-0.0286),(情感-0.0214),(英語詞匯-0.0214),(英語學習-0.0214),(閱讀-0.0214),(初戀-0.0143),(翻譯-0.0143),(口譯-0.0143),(戀愛-0.0143),(女性-0.0143),(人際交往-0.0143)};

        qqwers123:

        {(女性主義-0.0244),(社會-0.0176),(生活-0.0149),(心理學-0.0136),(法律-0.0129),(你如何評價 X-0.0122),(性別平等-0.0122),(教育-0.0115),(兩性關系-0.0108),(性生活-0.0102),(文化-0.0095),(人際交往-0.0088),(戀愛-0.0081),(大學-0.0075),(歷史-0.0075),(知乎-0.0075),(互聯(lián)網(wǎng)-0.0068),(戀愛心理-0.0068)};

        3.3 知乎社區(qū)用戶最近鄰獲取

        選擇用戶bu-zhi-34-47作為目標用戶,為其尋找所在社區(qū)的最近鄰居。

        bu-zhi-34-47與cdban-zhang-lian共同感興趣的標簽有“日本”、“社會”、“生活”、“文化”、“心理學”和“音樂”,它們在兩個用戶興趣模型中的權重分別為(0.0127,0.019,0.0253,0.019,0.0127,0.0253)和(0.0596,0.0199,0.0132,0.0265,0.0132,0.0132);

        bu-zhi-34-47與hahahaxy共同感興趣的標簽有“調(diào)查類問題”、“生活”和“生活經(jīng)歷”,它們在兩個用戶興趣模型中的權重分別為(0.0886,0.0253,0.0127)和(0.0714,0.05,0.0357);

        bu-zhi-34-47與qqwers123共同感興趣的標簽有“教育”、“社會”、“生活”、“文化”和“心理學”,它們在兩個用戶興趣模型中的權重分別為(0.0127,0.019,0.0253,0.019,0.0127)和(0.0115,0.0176,0.0149,0.0095,0.0136);

        根據(jù)公式(4)計算用戶之間的相似度,也就是求兩個向量的余弦相似度,為了快速計算,采用matlab進行向量計算,得出bu-zhi-34-47與其它三名用戶之間的相似度,結(jié)果如下:

        sim(u1,u2)=0.7134;sim(u1,u3)=0.9182;sim(u1,u4)=0.9624。

        根據(jù)用戶相似度計算的結(jié)果,可以發(fā)現(xiàn),bu-zhi-34-47與其它四名用戶之間的相似度都在0.7以上,說明用戶關系非常緊密。由于所選社區(qū)用戶比較少,在進行鄰居選擇時就不需要設定閾值了,可以直接根據(jù)實際需求按照相似度大小選擇1個、2個或3個鄰居。用戶qqwers123與bu-zhi-34-47的相似度最大,因此,選擇用戶qqwers123作為用戶bu-zhi-34-47的最近鄰居,便于后續(xù)對用戶進行服務推送。

        3.4 知乎社區(qū)用戶個性化服務推送

        在對“知乎”社區(qū)目標用戶進行個性化服務推送階段,不同于傳統(tǒng)基于用戶的協(xié)同過濾算法,本文主要根據(jù)具有相似興趣的用戶容易成為最近鄰,通過最近鄰的興趣來給目標用戶推送感興趣的服務。以目標用戶bu-zhi-34-47及其最近鄰qqwers123為例,為目標用戶bu-zhi-34-47推送個性化服務。

        一方面,用戶與其最近鄰居之間具有相似的興趣,容易形成友好關系,因此可以將用戶bu-zhi-34-47作為好友推送給目標用戶。

        另一方面,可為目標用戶推送其最近鄰用戶感興趣的標簽,根據(jù)公式(5)知,可推送給目標用戶的話題標簽集合為{女性主義,法律,你如何評價 X,性別平等,兩性關系,性生活,人際交往,戀愛,大學,歷史,知乎,互聯(lián)網(wǎng),戀愛心理}。在每個話題標簽下都有“精華問答”、“活躍回答者”、“熱門討論問答”、“最近討論問答”等內(nèi)容,這些都可以作為信息資源推送給目標用戶,以便于目標用戶更全面地掌握該話題的相關動態(tài)。

        4 結(jié)語

        本文首先根據(jù)用戶提問和回答時標注的話題標簽來構建用戶興趣模型,然后將用戶興趣模型與基于用戶的協(xié)同過濾算法結(jié)合起來提出了基于用戶興趣的用戶協(xié)同服務推送方法,最后使用真實知乎數(shù)據(jù)對該方法進行了驗證。實驗結(jié)果表明了本文構建的用戶興趣模型可以有效地對知乎用戶興趣進行識別,提出的服務推送方法可以很好地為知乎用戶提供個性化服務,進而提升其自身信息服務水平。

        參考文獻

        [1]鄧愛林,朱揚勇,施伯樂.基于項目評分預測的協(xié)同過濾推薦算法[J].軟件學報,2003(09):1621-1628.

        [2]李容,李明奇,郭文強.基于改進相似度的協(xié)同過濾算法研究[J].計算機科學,2016,43(12):206-208+240.

        [3]王成,朱志剛,張玉俠,蘇芳芳.基于用戶的協(xié)同過濾算法的推薦效率和個性化改進[J].小型微型計算機系統(tǒng),2016,37(03):428-432.

        [4]雷凱,劉樹波,李丹,李永凱.實時路況制約下基于內(nèi)容的興趣點推薦[J].計算機工程,2017,43(10):147-152.

        [5]閆東東,李紅強.一種改進的基于內(nèi)容的個性化推薦模型[J].軟件導刊,2016,15(04):11-13.

        [6]代晨旭,周熙晨.一種基于內(nèi)容的新聞推薦系統(tǒng)實例[J].電腦知識與技術,2015,11(25):36-38.

        [7]付凱麗.基于社會化標簽的圖書推薦系統(tǒng)模型研究[J].情報探索,2016(10):80-85.

        [8]蔡強,韓東梅,李海生,胡耀光,陳誼.基于標簽和協(xié)同過濾的個性化資源推薦[J].計算機科學,2014,41(01):69-71+110.

        [9]石林,徐飛,徐守坤.基于用戶興趣建模的個性化推薦[J].計算機應用與軟件,2013,30(12):211-214+264.

        [10]郭弘毅,劉功申,蘇波,孟魁.融合社區(qū)結(jié)構和興趣聚類的協(xié)同過濾推薦算法[J].計算機研究與發(fā)展,2016,53(08):1664-1672.

        国产精品女同学| 成片免费观看视频大全| 无码人妻一区二区三区免费n鬼沢 人禽无码视频在线观看 | 美女主播网红视频福利一区二区| av综合网男人的天堂| 国产精品亚洲综合一区在线观看 | 国产乱沈阳女人高潮乱叫老| 欧美亚洲国产丝袜在线| 国产免费人成视频在线观看| 大学生高潮无套内谢视频| 天天躁日日躁狠狠躁av中文| 国产视频不卡在线| 亚洲精品一区二区网站| 伊人久久精品无码二区麻豆| 久久精品国内一区二区三区| 无码视频一区二区三区在线播放| 大陆少妇一区二区三区| 国产精久久一区二区三区| 荡女精品导航| 成年人视频在线播放视频| 男女主共患难日久生情的古言 | 老外和中国女人毛片免费视频 | 中文字幕一区二区va| 文字幕精品一区二区三区老狼| 另类老妇奶性生bbwbbw| 免费国产黄线在线播放| 亚洲av色香蕉一区二区三区av| 亚洲av永久无码天堂网| 国产在线精品一区二区不卡| 国产在线白浆一区二区三区在线| 极品一区二区在线视频| 亚洲日韩国产精品乱-久| 中文字幕在线观看国产双飞高清 | 色综合中文字幕综合网| 国产麻豆精品精东影业av网站| 久久久久亚洲av无码专区桃色| bbbbbxxxxx欧美性| 日韩精品在线视频一二三| 男女啪啪无遮挡免费网站| 粗大挺进尤物人妻一区二区| 久久99精品综合国产女同|