亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        用戶(hù)—產(chǎn)品二部分網(wǎng)絡(luò)中用戶(hù)聲譽(yù)實(shí)證研究

        2020-05-07 12:32:36劉曉露賈書(shū)偉
        關(guān)鍵詞:記憶性聲譽(yù)度量

        劉曉露,賈書(shū)偉

        (1.山東財(cái)經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,濟(jì)南 250014;2.河南農(nóng)業(yè)大學(xué)信息與管理科學(xué)學(xué)院,鄭州 450002)

        0 引言

        在線評(píng)分系統(tǒng)中用戶(hù)聲譽(yù)的度量對(duì)產(chǎn)品質(zhì)量排名具有重要意義[1-3]。隨著現(xiàn)代科技的發(fā)展,許多網(wǎng)站都使用在線評(píng)分系統(tǒng),用戶(hù)在網(wǎng)上瀏覽、收藏或購(gòu)買(mǎi)產(chǎn)品后,可以根據(jù)對(duì)產(chǎn)品的體驗(yàn)對(duì)產(chǎn)品質(zhì)量給出一個(gè)打分[4-5],基于用戶(hù)的打分來(lái)度量產(chǎn)品的質(zhì)量可以為用戶(hù)找到高質(zhì)量的產(chǎn)品。然而,由于系統(tǒng)中用戶(hù)對(duì)產(chǎn)品不熟悉或不誠(chéng)實(shí)等原因,用戶(hù)對(duì)產(chǎn)品的打分不一定能準(zhǔn)確反映產(chǎn)品的質(zhì)量。有些商家為了提高自身的信譽(yù),雇傭一些水軍來(lái)給予自身高評(píng)價(jià)或?qū)Ω?jìng)爭(zhēng)對(duì)手虛假評(píng)價(jià)來(lái)迷惑其他消費(fèi)者,通過(guò)簡(jiǎn)單地對(duì)評(píng)分取平均的方法來(lái)對(duì)產(chǎn)品質(zhì)量進(jìn)行排名可能不那么準(zhǔn)確[6-7]。準(zhǔn)確的打分可以對(duì)產(chǎn)品質(zhì)量的度量起到積極的作用,同時(shí),不準(zhǔn)確的打分則會(huì)起到干擾的影響,損害用戶(hù)與商家的利益。因此,度量用戶(hù)的打分準(zhǔn)確程度(用戶(hù)聲譽(yù))對(duì)于準(zhǔn)確度量產(chǎn)品的質(zhì)量、保障社會(huì)經(jīng)濟(jì)和民生的健康發(fā)展起著重要的作用。對(duì)在線用戶(hù)聲譽(yù)的研究與分析成為眾多學(xué)術(shù)研究者感興趣的課題[8-10]。

        聲譽(yù)的概念一直沒(méi)有得到統(tǒng)一,社會(huì)學(xué)[11-12]、信息經(jīng)濟(jì)學(xué)[13-17]、科學(xué)計(jì)量學(xué)[18-19]以及計(jì)算機(jī)科學(xué)[20-21]的研究學(xué)者分別從不同角度研究聲譽(yù)。本文將在線評(píng)分系統(tǒng)建模成用戶(hù)—產(chǎn)品二部分網(wǎng)絡(luò),用戶(hù)的聲譽(yù)(reputation)是指在特定的時(shí)間段和上下文環(huán)境中,依據(jù)用戶(hù)對(duì)產(chǎn)品的歷史評(píng)分,對(duì)該用戶(hù)可以對(duì)相應(yīng)產(chǎn)品做出準(zhǔn)確評(píng)價(jià)(符合大眾認(rèn)知)的感知[22]?;谟脩?hù)對(duì)產(chǎn)品的評(píng)分對(duì)用戶(hù)聲譽(yù)的研究近幾年取得了非常顯著的成果。目前3種主要的用戶(hù)聲譽(yù)度量方法有:聲譽(yù)和質(zhì)量不斷迭代的方法[6,23-28]、分組方法[29-30]和貝葉斯方法[31]。1)聲譽(yù)和質(zhì)量不斷迭代的方法中用戶(hù)聲譽(yù)和產(chǎn)品質(zhì)量是相互影響、相互依賴(lài)的,基本思想是:假設(shè)產(chǎn)品有其內(nèi)在的質(zhì)量,通過(guò)用戶(hù)評(píng)分與產(chǎn)品質(zhì)量的關(guān)系度量用戶(hù)的聲譽(yù),再通過(guò)用戶(hù)聲譽(yù)和評(píng)分度量產(chǎn)品質(zhì)量,如此迭代直到用戶(hù)聲譽(yù)和產(chǎn)品質(zhì)量達(dá)到穩(wěn)定為止。優(yōu)點(diǎn)是計(jì)算用戶(hù)聲譽(yù)和產(chǎn)品質(zhì)量的準(zhǔn)確性高,不足之處在于迭代方法的時(shí)間比較長(zhǎng),且迭代方法在某些數(shù)據(jù)集上不一定收斂。2)在分組方法中,用戶(hù)聲譽(yù)的度量是通過(guò)評(píng)分計(jì)算得到,不依賴(lài)于產(chǎn)品質(zhì)量,從打分分組的角度度量用戶(hù)聲譽(yù)。分組方法突破了已有迭代方法中用戶(hù)聲譽(yù)與產(chǎn)品質(zhì)量相互依賴(lài)的思想,提出分組的方法度量用戶(hù)的聲譽(yù),計(jì)算時(shí)間較短。缺點(diǎn)是用給出相同評(píng)分的用戶(hù)個(gè)數(shù)所占的比例表示這一評(píng)分的可信度容易造成民主暴力,且該方法在度量用戶(hù)聲譽(yù)時(shí)只考慮了相同評(píng)分的用戶(hù)個(gè)數(shù),沒(méi)有考慮具體的評(píng)分。3)貝葉斯方法中用戶(hù)聲譽(yù)表示成一種概率,被評(píng)價(jià)者下次提供滿(mǎn)意服務(wù)的概率,貝葉斯方法的優(yōu)點(diǎn)是它提供了一種理論上的計(jì)算聲譽(yù)的基礎(chǔ),缺點(diǎn)是對(duì)于普通人來(lái)說(shuō),它過(guò)于復(fù)雜,不易理解。

        在線評(píng)分系統(tǒng)中用戶(hù)集群行為分析[32-33]近年來(lái)受到越來(lái)越多的關(guān)注,劉[34]發(fā)現(xiàn)一些產(chǎn)品被幾乎所有的用戶(hù)所收藏,而一些度很小的產(chǎn)品只被度比較大的用戶(hù)所收藏,表明用戶(hù)的品味可以分為兩類(lèi):流行的和獨(dú)特的。同時(shí),倪[35]發(fā)現(xiàn)系統(tǒng)中存在一些用戶(hù)在流行的產(chǎn)品剛開(kāi)始投放市場(chǎng),即早期還不流行的時(shí)候就發(fā)現(xiàn)并給出高的評(píng)價(jià),然后當(dāng)這些流行產(chǎn)品變得流行之后就有許多用戶(hù)去瀏覽、購(gòu)買(mǎi)或收藏。用戶(hù)集群行為的研究可以為用戶(hù)聲譽(yù)度量算法提供新的思路,文獻(xiàn)[25]和[28]引入用戶(hù)活躍度對(duì)傳統(tǒng)的聲譽(yù)和質(zhì)量不斷迭代的方法加以改進(jìn),提高了用戶(hù)聲譽(yù)和產(chǎn)品質(zhì)量度量的準(zhǔn)確性。

        由于不同活躍度的用戶(hù)的行為機(jī)制不同,用戶(hù)行為也隨時(shí)間而變化,本文從用戶(hù)活躍度與時(shí)間因素兩個(gè)角度研究用戶(hù)打分行為,進(jìn)行用戶(hù)聲譽(yù)的實(shí)證研究,為進(jìn)一步提出準(zhǔn)確的用戶(hù)聲譽(yù)度量算法提供研究基礎(chǔ)。所采用的數(shù)據(jù)集是電影網(wǎng)站MovieLens數(shù)據(jù),從以下兩個(gè)方面進(jìn)行分析:1)用戶(hù)聲譽(yù)與活躍度的關(guān)系。根據(jù)用戶(hù)的度分類(lèi),然后分別計(jì)算每一組用戶(hù)的聲譽(yù)及其對(duì)產(chǎn)品打分的平均度,研究?jī)烧叩年P(guān)系;將數(shù)據(jù)集按照時(shí)間分成季度片段,研究每個(gè)片段上用戶(hù)聲譽(yù)與活躍度的關(guān)系。2)用戶(hù)聲譽(yù)是否具有記憶性。將數(shù)據(jù)集按照時(shí)間分成年度片段,計(jì)算t年之后用戶(hù)的存在率;同時(shí),提出一種衡量用戶(hù)聲譽(yù)記憶性的度量指標(biāo),計(jì)算t年之后兩個(gè)年份之間用戶(hù)聲譽(yù)排名的肯德?tīng)栂禂?shù)與用戶(hù)活躍度排序的肯德?tīng)栂禂?shù)隨時(shí)間t的變化。最后,通過(guò)建立隨機(jī)模型與實(shí)證結(jié)果進(jìn)行比較。

        本文的結(jié)構(gòu)安排如下:第二部分介紹用戶(hù)—產(chǎn)品二部分網(wǎng)絡(luò)中一種聲譽(yù)度量算法(CR方法)計(jì)算用戶(hù)聲譽(yù);第三部分給出實(shí)證數(shù)據(jù)集中用戶(hù)聲譽(yù)研究結(jié)果;第四部分建立一個(gè)隨機(jī)模型來(lái)與實(shí)證結(jié)果進(jìn)行比較;最后總結(jié)全文。

        1 用戶(hù)聲譽(yù)度量

        在復(fù)雜網(wǎng)絡(luò)中,在線評(píng)分系統(tǒng)可以建模成加權(quán)的用戶(hù)—產(chǎn)品二部分網(wǎng)絡(luò),其結(jié)構(gòu)圖如圖1所示。圖1中有兩類(lèi)節(jié)點(diǎn),圓圈代表用戶(hù),方框代表產(chǎn)品,用戶(hù)和產(chǎn)品之間的連線表示用戶(hù)對(duì)產(chǎn)品的打分(權(quán)重)。

        圖1 用戶(hù)—產(chǎn)品二部分網(wǎng)絡(luò)的結(jié)構(gòu)圖Fig.1 The structure diagram of the user-object bipartite network

        下面以CR方法[6]為例介紹聲譽(yù)和質(zhì)量不斷迭代的方法。CR方法是目前復(fù)雜網(wǎng)絡(luò)領(lǐng)域度量用戶(hù)聲譽(yù)的一種比較經(jīng)典的迭代算法,后續(xù)多篇文章[25,28]都是在此基礎(chǔ)上提出用戶(hù)聲譽(yù)與產(chǎn)品質(zhì)量迭代算法,用戶(hù)對(duì)產(chǎn)品打分的數(shù)據(jù)集都適用CR方法。CR方法的核心思想是將用戶(hù)對(duì)產(chǎn)品的打分與相應(yīng)的產(chǎn)品質(zhì)量之間的皮爾森相關(guān)系數(shù)作為用戶(hù)的聲譽(yù)。產(chǎn)品質(zhì)量以打分的加權(quán)平均來(lái)計(jì)算,其中,權(quán)重是用戶(hù)的聲譽(yù)。根據(jù)用戶(hù)對(duì)產(chǎn)品的打分與產(chǎn)品質(zhì)量之間的相關(guān)系數(shù)來(lái)計(jì)算用戶(hù)的聲譽(yù),這樣迭代計(jì)算下去,直到兩步迭代之間的產(chǎn)品質(zhì)量的差值小于一個(gè)很小的數(shù)。具體操作如下:

        1)對(duì)于產(chǎn)品α,計(jì)算產(chǎn)品質(zhì)量Qα:

        (1)

        2)對(duì)于用戶(hù)i,計(jì)算每個(gè)用戶(hù)的打分和相應(yīng)的產(chǎn)品質(zhì)量的皮爾森相關(guān)系數(shù)TRi:

        (2)

        3)對(duì)于用戶(hù)i,計(jì)算用戶(hù)聲譽(yù)Ri:

        (3)

        用戶(hù)聲譽(yù)Ri∈[0,1],用戶(hù)聲譽(yù)越大,表明用戶(hù)對(duì)產(chǎn)品打分越準(zhǔn)確。根據(jù)計(jì)算得到的用戶(hù)聲譽(yù)和產(chǎn)品質(zhì)量的結(jié)果再依次進(jìn)行1)、2)、3)步的計(jì)算,循環(huán)迭代,直到兩步迭代之間的產(chǎn)品質(zhì)量的差值小于一個(gè)很小的數(shù),

        (4)

        這個(gè)很小的數(shù)δ取δ=10-5,其中|O|為產(chǎn)品的個(gè)數(shù)。

        2 實(shí)證結(jié)果分析

        2.1 數(shù)據(jù)集

        本文采用一個(gè)對(duì)電影評(píng)分的網(wǎng)站的數(shù)據(jù)集來(lái)進(jìn)行實(shí)證研究:MovieLens。MovieLens是一個(gè)對(duì)電影進(jìn)行在線評(píng)分的網(wǎng)站(http://www.grouplens.org),用戶(hù)可以對(duì)電影進(jìn)行打分,網(wǎng)站可以對(duì)用戶(hù)提供個(gè)性化推薦服務(wù)。用戶(hù)對(duì)自己瀏覽、收藏過(guò)的產(chǎn)品進(jìn)行打分,打分集合為{0.5,1,1.5,2,2.5,3,3.5,4,4.5,5},其中最低分0.5分表示最不喜歡,最高分5分表示最喜歡。如果用戶(hù)看了一部電影并且對(duì)它進(jìn)行了打分,用戶(hù)與電影之間就會(huì)建立一條連邊。本文選取的MovieLens數(shù)據(jù)集中共包含69 878個(gè)用戶(hù)、10 677個(gè)電影和10 000 054條打分信息,時(shí)間跨度為13年(1997年~2009年)。對(duì)用戶(hù)聲譽(yù)的實(shí)證研究,從以下兩個(gè)方面進(jìn)行分析:1)用戶(hù)聲譽(yù)與活躍度的關(guān)系;2)用戶(hù)聲譽(yù)的記憶性。

        2.2 用戶(hù)聲譽(yù)與度的關(guān)系

        用戶(hù)活躍度指用戶(hù)在系統(tǒng)中的活躍程度,本文采取用戶(hù)的度(用戶(hù)打分的個(gè)數(shù))來(lái)表示。由于不同活躍度的用戶(hù)的行為機(jī)制不同,所以研究將用戶(hù)分組的情況下用戶(hù)聲譽(yù)與活躍度的關(guān)系。要分析不同活躍度的用戶(hù)的聲譽(yù),即不同活躍度用戶(hù)對(duì)產(chǎn)品打分的準(zhǔn)確程度,本文在數(shù)據(jù)集中將用戶(hù)按照他們的活躍度分為21組,活躍度落在同一區(qū)間內(nèi)的用戶(hù)為一組,每組中用戶(hù)活躍度的區(qū)間上限和下限如表1所示。

        表1 MovieLens數(shù)據(jù)集中按用戶(hù)活躍度分組的區(qū)間上限和下限

        在MovieLens數(shù)據(jù)集中根據(jù)CR方法計(jì)算用戶(hù)聲譽(yù)得到數(shù)據(jù)集中用戶(hù)聲譽(yù)的結(jié)果R,將同一組中用戶(hù)聲譽(yù)R取平均,得到不同活躍度分組用戶(hù)的平均聲譽(yù)〈R〉如圖2a所示,其中Km表示每組用戶(hù)活躍度的區(qū)間范圍的上限和下限的均值。從圖2a可以看出,總體上用戶(hù)聲譽(yù)隨著用戶(hù)度的增加而增加,即度大的用戶(hù)有較高的聲譽(yù),打分越多的用戶(hù)打分越準(zhǔn)確。同時(shí),采用最小二乘法進(jìn)行線性擬合得到平均聲譽(yù)與用戶(hù)度的斜率為0.000 079。這在現(xiàn)實(shí)生活中是合理的,度大的用戶(hù)進(jìn)入系統(tǒng)的時(shí)間較長(zhǎng),對(duì)產(chǎn)品質(zhì)量的把握會(huì)比較強(qiáng)一些,對(duì)產(chǎn)品的評(píng)價(jià)相對(duì)于度小的用戶(hù)會(huì)更準(zhǔn)確。

        為了更加細(xì)致地研究用戶(hù)聲譽(yù)與度的關(guān)系,本文按照打分時(shí)間將數(shù)據(jù)集切分成季度的片段,計(jì)算每個(gè)片段上的用戶(hù)聲譽(yù)。由于本文中采用的數(shù)據(jù)集是電影的打分?jǐn)?shù)據(jù),每年電影的上映會(huì)受時(shí)間的影響,比如節(jié)假日會(huì)有比較多的電影上映,所以研究季度片段的數(shù)據(jù)中用戶(hù)聲譽(yù)與度的關(guān)系。1997年~1999年的數(shù)據(jù)中每年的打分?jǐn)?shù)量波動(dòng)很大,比如1996年有1 047 618條打分,而1998年有202 092條打分,接近1996年打分?jǐn)?shù)量的1/5。所以本文采用MovieLens數(shù)據(jù)集中2000到2008年打分?jǐn)?shù)據(jù)進(jìn)行季度層面的分析,為便于展示,年度數(shù)據(jù)的基本統(tǒng)計(jì)特性如表2所示。

        表2 MovieLens數(shù)據(jù)集中2000到2008年打分?jǐn)?shù)據(jù)的基本統(tǒng)計(jì)特性

        注:〈ku〉與〈ko〉分別表示用戶(hù)的平均度和電影的平均度。

        將MovieLens數(shù)據(jù)集中2000到2008年打分?jǐn)?shù)據(jù)切分成36個(gè)季度的片段(即2000年1月~3月、4月~6月、…、2008年10月~12月),計(jì)算每個(gè)片段上的用戶(hù)聲譽(yù)。按照季節(jié)的不同,得到4個(gè)季度中不同活躍度分組用戶(hù)的平均聲譽(yù)〈R〉如圖2b所示,可以看出,總體上隨著用戶(hù)度的增加,用戶(hù)聲譽(yù)出現(xiàn)上升的趨勢(shì),與圖2a的結(jié)果一致。在4個(gè)季度中,采用最小二乘法進(jìn)行線性擬合得到平均聲譽(yù)與用戶(hù)度的斜率分別為0.000 064、0.000 071、0.000 065、0.000 065,均大于0,表明用戶(hù)的活躍度越大,聲譽(yù)越高,對(duì)產(chǎn)品的打分越準(zhǔn)確。同時(shí),本文用簡(jiǎn)單平均法計(jì)算季節(jié)指數(shù):將每個(gè)季度中的用戶(hù)聲譽(yù)取均值,分別除以36個(gè)片段上用戶(hù)聲譽(yù)的均值,得到4個(gè)季度的季節(jié)指數(shù)分別為1.018 58,0.996 055,0.992 683,0.992 682 866??梢钥闯龅谝患径戎杏脩?hù)聲譽(yù)要高于第二、第三和第四季度。

        圖2 MovieLens數(shù)據(jù)集中用戶(hù)聲譽(yù)與度的關(guān)系實(shí)驗(yàn)結(jié)果Fig.2 The experimental results on the relationships between user′s reputation and degree for the Movie Lens data set

        2.3 用戶(hù)聲譽(yù)的記憶性

        本文提出用戶(hù)聲譽(yù)記憶性[36-37]的概念,即當(dāng)前時(shí)間段內(nèi)用戶(hù)的聲譽(yù)排序與之前某一個(gè)時(shí)間段的聲譽(yù)排序的一致程度。將MovieLens數(shù)據(jù)集中2000到2008年打分?jǐn)?shù)據(jù)切分成9個(gè)年度的片段(2000年、2001年、…、2008年),計(jì)算每個(gè)片段上的用戶(hù)聲譽(yù)。

        在計(jì)算用戶(hù)聲譽(yù)的記憶性之前,首先研究一下隨著時(shí)間的變化,用戶(hù)在系統(tǒng)中的存在情況。在2000年到2008年這9個(gè)年份的數(shù)據(jù)中,計(jì)算兩兩年份的數(shù)據(jù)片段之間用戶(hù)的平均持續(xù)存在率ρ(t):

        (5)

        其中,t1=2000,2001,…,2007,t=1,2,…,8,Ut1為第t1年系統(tǒng)中的用戶(hù)集合,ρ(t)為t年之后系統(tǒng)中仍然存在的用戶(hù)所占的平均比例。MovieLens數(shù)據(jù)集中t年之后用戶(hù)的持續(xù)存在率ρ(t)如圖3a所示,可以看出隨著t的增加,用戶(hù)的平均持續(xù)存在率降低,表明經(jīng)過(guò)時(shí)間越長(zhǎng),用戶(hù)中仍然存在的用戶(hù)越少。

        同時(shí),在MovieLens數(shù)據(jù)集中2000年到2008年的9個(gè)年份數(shù)據(jù)中,以?xún)蓛赡攴莸臄?shù)據(jù)片段之間用戶(hù)聲譽(yù)的肯德?tīng)栂禂?shù)[38]τR(t)來(lái)衡量用戶(hù)聲譽(yù)的記憶性:

        (6)

        其中,m=|Ut1∩Ut1+t|為第t1年與第t1+t年相同用戶(hù)的數(shù)量,t1=2000,2001,…,2007,t=1,2,…,8。Rμ(t1)為第t1年數(shù)據(jù)集中用戶(hù)μ的聲譽(yù),τR(t)為t年之后系統(tǒng)中存在的用戶(hù)聲譽(yù)的一致程度。τR(t)的值越大表明t年之后用戶(hù)聲譽(yù)的記憶性越高。

        為了與用戶(hù)聲譽(yù)的記憶性作比較,計(jì)算兩兩年份的數(shù)據(jù)片段之間用戶(hù)度的肯德?tīng)栂禂?shù)τK(t)作為用戶(hù)聲譽(yù)記憶性的衡量指標(biāo):

        (7)

        其中,Kμ(t1)為第t1年數(shù)據(jù)集中用戶(hù)μ的度,τK(t)為t年之后系統(tǒng)中存在的用戶(hù)活躍度的一致程度。τR(t)的值越大表明t年之后用戶(hù)活躍度的記憶性越高。

        MovieLens數(shù)據(jù)集中t年之后用戶(hù)聲譽(yù)的平均記憶性τR(t)與用戶(hù)活躍度的平均記憶性τK(t)如圖3b所示??梢钥闯?,隨著t的增加,用戶(hù)聲譽(yù)的平均記憶性τR(t)降低,表明經(jīng)過(guò)時(shí)間越長(zhǎng),用戶(hù)聲譽(yù)的一致程度在降低,這在現(xiàn)實(shí)生活中是合理的。隨著時(shí)間的增長(zhǎng),影響用戶(hù)打分的準(zhǔn)確程度的因素會(huì)越來(lái)越多,打分準(zhǔn)確程度與過(guò)去相比的變化會(huì)越來(lái)越大;同時(shí),用戶(hù)聲譽(yù)的平均記憶性τR(t)與用戶(hù)活躍度的平均記憶性τK(t)相比較,t≤5時(shí),τR(t)>τK(t),說(shuō)明5年之內(nèi)用戶(hù)聲譽(yù)的記憶性高于用戶(hù)活躍度的記憶性,表明用戶(hù)打分的準(zhǔn)確程度與用戶(hù)活躍度相比更具有記憶性,隨時(shí)間變化更小。這在現(xiàn)實(shí)生活中也是合理的。用戶(hù)度是用戶(hù)打分?jǐn)?shù)量多少的度量,反映用戶(hù)在打分系統(tǒng)中的活躍度,受影響的因素更多,隨時(shí)間變化更不穩(wěn)定。用戶(hù)聲譽(yù)反映用戶(hù)打分的準(zhǔn)確程度,與用戶(hù)活躍度相比,更能反映用戶(hù)打分行為的內(nèi)在特性,隨時(shí)間變化更小,更加穩(wěn)定。

        圖3 MovieLens數(shù)據(jù)集中用戶(hù)聲譽(yù)的記憶性實(shí)驗(yàn)結(jié)果Fig.3 The experimental results on the memory of user reputation for the MovieLens data set

        3 隨機(jī)模型

        本文通過(guò)建立一個(gè)隨機(jī)模型來(lái)與實(shí)證結(jié)果進(jìn)行比較。隨機(jī)模型是人工建立的與實(shí)證數(shù)據(jù)做對(duì)照的數(shù)據(jù)集,建立的目的是與實(shí)證數(shù)據(jù)中的結(jié)果進(jìn)行比較,分析實(shí)證數(shù)據(jù)中的結(jié)果是否由隨機(jī)行為產(chǎn)生。在隨機(jī)模型中,本文保證用戶(hù)和產(chǎn)品的數(shù)量、打分?jǐn)?shù)量、用戶(hù)的度與真實(shí)的MovieLens數(shù)據(jù)集保持一致,但是用戶(hù)選擇電影的行為完全隨機(jī),打分時(shí)間也是完全隨機(jī)。因此,本文建立了一個(gè)新的、完全隨機(jī)的用戶(hù)—產(chǎn)品二部分網(wǎng)絡(luò):69 878個(gè)用戶(hù)和10 677個(gè)電影的度與真實(shí)數(shù)據(jù)集保持一致,10 000 054條連邊(打分)的節(jié)點(diǎn)(用戶(hù)與產(chǎn)品)通過(guò)產(chǎn)生隨機(jī)數(shù)

        圖4 隨機(jī)模型中不同活躍度分組用戶(hù)的平均聲譽(yù)Fig.4 The average reputation of users in different groups divided by the activity for the Null model

        的方法從真實(shí)數(shù)據(jù)集的節(jié)點(diǎn)集合中選取,每條連邊從真實(shí)數(shù)據(jù)集的打分時(shí)間集合中隨機(jī)選取一個(gè)打分時(shí)間與之匹配,每條連邊的權(quán)重(打分)從集合{0.5,1,1.5,2,2.5,3,3.5,4,4.5,5}中隨機(jī)選取。在隨機(jī)模型中進(jìn)行用戶(hù)聲譽(yù)的實(shí)證研究:1)用戶(hù)聲譽(yù)與活躍度的關(guān)系;2)用戶(hù)聲譽(yù)的記憶性。

        根據(jù)CR方法計(jì)算隨機(jī)模型中用戶(hù)的聲譽(yù)R,將用戶(hù)按照活躍度分組,將同一組中用戶(hù)聲譽(yù)R取平均,得到隨機(jī)模型中不同活躍度分組用戶(hù)的平均聲譽(yù)〈R〉如圖4所示,可以看出,隨著用戶(hù)活躍度的增加,用戶(hù)聲譽(yù)并沒(méi)有明顯的變化,且用戶(hù)聲譽(yù)的值都比較小(小于0.1)。無(wú)論是用戶(hù)聲譽(yù)與活躍度的關(guān)系還是用戶(hù)聲譽(yù)的值,都與實(shí)證數(shù)據(jù)中的結(jié)果(圖2a)有明顯不同。與隨機(jī)模型的結(jié)果比較,表明真實(shí)數(shù)據(jù)中用戶(hù)聲譽(yù)并不是由隨機(jī)行為引起的,隨著用戶(hù)活躍度的增大用戶(hù)的打分越準(zhǔn)確。

        圖5 隨機(jī)模型中用戶(hù)聲譽(yù)的記憶性實(shí)驗(yàn)結(jié)果Fig.5 The experimental results on the memoryof user′s reputation for the Null model

        隨機(jī)模型中t年之后用戶(hù)的平均持續(xù)存在率ρ(t)如圖5a所示,可以看出,對(duì)于不同的t,ρ(t)的值都在0.96附近,遠(yuǎn)高于實(shí)證數(shù)據(jù)中的結(jié)果(圖3a中t=1時(shí)ρ(t)取最大值為0.34),表明隨機(jī)模型中t年之后,幾乎所有的用戶(hù)仍然存在。隨機(jī)模型中t年之后用戶(hù)聲譽(yù)的平均記憶性τR(t)與用戶(hù)活躍度的平均記憶性τK(t)如圖5b所示??梢钥闯觯瑢?duì)于不同的t,τR(t)的值都在0附近,表明隨機(jī)模型中t年之后用戶(hù)聲譽(yù)完全沒(méi)有記憶性。τK(t)的值也不隨t的變化而變化,都在0.63附近,遠(yuǎn)大于τR(t)的值,與實(shí)證數(shù)據(jù)中的結(jié)果(圖3a)有明顯差異。與隨機(jī)模型的結(jié)果比較,表明真實(shí)數(shù)據(jù)中用戶(hù)的打分行為并不是隨機(jī)產(chǎn)生的,t年之后用戶(hù)打分準(zhǔn)確性具有記憶性。

        4 總結(jié)

        本文在電影網(wǎng)站MovieLens數(shù)據(jù)上進(jìn)行用戶(hù)—產(chǎn)品二部分網(wǎng)絡(luò)中用戶(hù)聲譽(yù)的實(shí)證研究,從以下兩個(gè)方面進(jìn)行分析:1)用戶(hù)聲譽(yù)與活躍度的關(guān)系。根據(jù)用戶(hù)的度分類(lèi),發(fā)現(xiàn)用戶(hù)聲譽(yù)隨著用戶(hù)度的增加而增加;將數(shù)據(jù)集按照時(shí)間細(xì)分為36個(gè)季度的片段,同樣發(fā)現(xiàn)隨著用戶(hù)度的增加,用戶(hù)聲譽(yù)出現(xiàn)上升的趨勢(shì)。2)用戶(hù)聲譽(yù)是否具有記憶性。將數(shù)據(jù)集按照時(shí)間分成9個(gè)年度的片段,發(fā)現(xiàn)用戶(hù)的持續(xù)存在率隨著t的增加逐漸減??;同時(shí),計(jì)算t年之后兩個(gè)年份之間用戶(hù)聲譽(yù)排名的肯德?tīng)栂禂?shù)與用戶(hù)活躍度排序的肯德?tīng)栂禂?shù),發(fā)現(xiàn)t≤5時(shí),t年之后用戶(hù)聲譽(yù)排名的肯德?tīng)栂禂?shù)比用戶(hù)度的肯德?tīng)栂禂?shù)更高,表明5年之內(nèi)用戶(hù)聲譽(yù)比用戶(hù)的活躍度更具有記憶性。最后,通過(guò)建立隨機(jī)模型與實(shí)證結(jié)果進(jìn)行比較,表明真實(shí)數(shù)據(jù)中用戶(hù)聲譽(yù)并不是由隨機(jī)行為引起的,側(cè)面驗(yàn)證了實(shí)證數(shù)據(jù)中的實(shí)驗(yàn)結(jié)果。

        用戶(hù)集群行為的研究可以為用戶(hù)聲譽(yù)度量算法提供新的思路,本文從用戶(hù)活躍度與時(shí)間因素兩個(gè)角度進(jìn)行在線評(píng)分系統(tǒng)中用戶(hù)聲譽(yù)的實(shí)證研究,拓寬了用戶(hù)聲譽(yù)研究的廣度,為進(jìn)一步提出準(zhǔn)確的用戶(hù)聲譽(yù)度量算法以及用戶(hù)聲譽(yù)在個(gè)性化推薦中的應(yīng)用提供研究基礎(chǔ)。

        猜你喜歡
        記憶性聲譽(yù)度量
        有趣的度量
        模糊度量空間的強(qiáng)嵌入
        Top 5 World
        器官移植中記憶性T細(xì)胞的研究進(jìn)展
        迷向表示分為6個(gè)不可約直和的旗流形上不變愛(ài)因斯坦度量
        黏膜記憶性T 細(xì)胞功能
        記憶性B細(xì)胞體外擴(kuò)增影響因素的研究進(jìn)展①
        聲譽(yù)樹(shù)立品牌
        地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
        超聲修復(fù)有記憶性鉛蓄電池研究
        久久精品韩国日本国产| 人妻有码中文字幕| 国产亚洲视频在线观看网址| 亚洲精品美女自拍偷拍| 日本一区二区高清视频| 手机看片久久第一人妻| 中国丰满人妻videoshd| 少妇高潮喷水正在播放| 亚洲精品美女久久久久99| 亚洲福利二区三区四区| 中文字幕人妻熟女人妻| 男人边吻奶边挵进去视频| 亚洲a人片在线观看网址| 日本一二三区在线不卡| 久久不见久久见免费视频6| 国产丝袜视频一区二区三区| 麻豆国产巨作AV剧情老师| 白丝美女扒开内露出内裤视频 | 久久久精品人妻久久影视| 亚洲AV成人无码久久精品四虎| 伊人狼人激情综合影院| 脱了老师内裤猛烈进入| 日日碰狠狠躁久久躁9| 午夜爽毛片| 一区二区三区av在线| 野外亲子乱子伦视频丶| 国产手机在线αⅴ片无码| 日韩人妻有码中文字幕| 国产亚洲成性色av人片在线观| 日本熟妇色xxxxx欧美老妇| 亚洲一区二区高清精品| 蜜臀av在线一区二区尤物| 日日天干夜夜狠狠爱| 亚洲精品456| 日本精品啪啪一区二区| 蜜桃视频一区二区在线观看| 国产95在线 | 欧美| 麻豆av一区二区天堂| 日韩精品一区二区三区在线视频| 毛多水多www偷窥小便| 日韩av一区二区三区四区av|