亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合時(shí)間戳信息的改進(jìn)SVDPP 推薦算法及其分析

        2021-12-23 12:48:46丁勇
        微型電腦應(yīng)用 2021年12期
        關(guān)鍵詞:用戶信息模型

        丁勇

        (云南師范大學(xué) 文理學(xué)院,云南 昆明 650228)

        0 引言

        隨著各類網(wǎng)絡(luò)軟件的開發(fā),促進(jìn)了信息數(shù)量的大幅增加。為了在大量網(wǎng)絡(luò)信息中獲取自己所需的內(nèi)容,需要對(duì)這些信息進(jìn)行快速處理,從中提煉出滿足自身需求的信息數(shù)據(jù),這就要求開發(fā)更加高效的信息服務(wù)技術(shù)。如果因?yàn)樾畔⒘窟^大而導(dǎo)致信息收集困難時(shí),便會(huì)出現(xiàn)“信息過載”的問題,反而降低了信息利用率[1-3]。為了滿足人們的信息收集需求,通常會(huì)在智能設(shè)備上安裝搜索引擎進(jìn)行信息檢索,從而有效克服信息過載的情況,能夠?qū)崿F(xiàn)對(duì)互聯(lián)網(wǎng)信息的快速收集、分類,并將這些數(shù)據(jù)存入到網(wǎng)頁(yè)中,便于用戶進(jìn)行查詢,之后根據(jù)用戶的實(shí)際搜索請(qǐng)求將結(jié)果傳輸至終端界面[4-5]。由于搜索引擎可以對(duì)大量的數(shù)據(jù)信息先做好分類,此時(shí)用戶只需將搜索信息的關(guān)鍵字輸入后便可以從系統(tǒng)中檢索出精確匹配詞條的內(nèi)容,并根據(jù)匹配度的高低顯示搜索結(jié)果,確保用戶可以更加高效地查詢到所需的信息內(nèi)容。而進(jìn)行實(shí)際應(yīng)用的過程中,搜索引擎檢索信息量大,因此還需用戶花費(fèi)較多時(shí)間進(jìn)行信息篩選[6-7]。

        隨機(jī)離散馬爾可夫決策過程(MDP)是一種動(dòng)態(tài)規(guī)劃的方法,此方法類似于強(qiáng)化學(xué)習(xí)試錯(cuò)迭代過程,雖然只通過強(qiáng)化學(xué)習(xí)的方式對(duì)馬爾可夫決策過程進(jìn)行求解,仍然使其成為當(dāng)前強(qiáng)化學(xué)習(xí)理論的一個(gè)重要框架[8-11]。Yin設(shè)計(jì)了Q-learning,促進(jìn)了強(qiáng)化學(xué)習(xí)方式的進(jìn)一步推廣[12]。采用Q-learning可以實(shí)現(xiàn)在無回報(bào)函數(shù)與狀態(tài)轉(zhuǎn)換函數(shù)的條件下也能夠求解得到最佳的動(dòng)作策略[13]。本文在前人研究的基礎(chǔ)上,設(shè)計(jì)了一種包含了時(shí)間影響因素的SVDPP算法,并把該關(guān)系映射至馬爾可夫決策過程,再把時(shí)間影響添加至推薦算法SVDPP模型內(nèi),由此獲得包含了時(shí)間戳參數(shù)的RL-TSVDPP優(yōu)化模型。

        1 融合時(shí)間戳信息的改進(jìn)SVDPP推薦算法

        1.1 RL-TSVDPP算法

        從原始數(shù)據(jù)集中提取的部分?jǐn)?shù)據(jù)如表1所示。

        表1 原始數(shù)據(jù)集部分?jǐn)?shù)據(jù)

        其中,最后一列屬于時(shí)間戳,對(duì)其格式進(jìn)行適當(dāng)轉(zhuǎn)換可以獲得日期結(jié)果,例如可以將20101216182630轉(zhuǎn)變?yōu)?010-12-16,18:26:30的時(shí)間參數(shù),而以數(shù)字形式則更加便于對(duì)比。根據(jù)時(shí)間戳對(duì)用戶-電影-評(píng)分實(shí)施排序并對(duì)各用戶評(píng)價(jià)后的電影數(shù)量(count)進(jìn)行統(tǒng)計(jì)得到ActionTemp表。

        RL-TSVDPP算法包含了訓(xùn)練和預(yù)測(cè)2個(gè)部分。對(duì)于訓(xùn)練部分應(yīng)通過強(qiáng)化學(xué)習(xí)算法來訓(xùn)練經(jīng)過預(yù)處理的數(shù)據(jù)集,通過計(jì)算獎(jiǎng)懲函數(shù)獲得相應(yīng)的獎(jiǎng)懲表,實(shí)現(xiàn)對(duì)Q表內(nèi)容的更新得到Q-table。結(jié)合之前用戶對(duì)電影作出的評(píng)分從Q-table內(nèi)確定相應(yīng)的Q值,再利用Q值完成SVDPP模型的訓(xùn)練過程。

        進(jìn)行預(yù)測(cè)時(shí),利用包含時(shí)間信息參數(shù)的RL-TSVDPP算法模型計(jì)算出預(yù)測(cè)評(píng)分,由此得到的算法預(yù)測(cè)模型為式(1)。

        (1)

        式中,bu(t)、qT、bi(t)、p(t)都是考慮時(shí)間影響條件下的訓(xùn)練參數(shù)。

        1.2 訓(xùn)練過程

        先通過預(yù)處理得到的數(shù)據(jù)計(jì)算出獎(jiǎng)懲值,并將其表示成獎(jiǎng)懲表,之后對(duì)數(shù)據(jù)進(jìn)行更新,由此得到Q-table。同時(shí)結(jié)合用戶前兩次給出的電影評(píng)分從Q-table內(nèi)獲取相應(yīng)的Q值,再利用此Q值訓(xùn)練SVDPP模型。

        (2)

        按照和梯度反向的方式進(jìn)行移動(dòng),實(shí)現(xiàn)參數(shù)修正的過程為式(3)。

        bu←bu+γ·(eui-λ·bu)

        bi←bi+γ·(eui-λ·bi)

        pu←pu+γ·(eui·qi-λ·pu)

        qi←qi+γ·(eui·pu-λ·qi)

        (3)

        采用RL-TSVDPP算法進(jìn)行處理時(shí)把Q-table的Q值代入式(4)。

        (4)

        其中,Q(s,a)表示用戶u觀察電影i前t-1和t-2時(shí)的電影評(píng)分,在t=1和t=2的條件下,以Q表平均值作為st-2,at-2取值。同時(shí)利用時(shí)間影響對(duì)SVDPP算法進(jìn)行訓(xùn)練并優(yōu)化,由此獲得融合時(shí)間戳數(shù)據(jù)。

        1.3 預(yù)測(cè)過程

        利用之前訓(xùn)練獲得的bu(t)、bi(t)、qT對(duì)模型進(jìn)行預(yù)測(cè),由此獲得融合時(shí)間戳預(yù)測(cè)評(píng)分。

        實(shí)現(xiàn)RL-TSVDPP算法的偽代碼如下。

        輸入:用戶數(shù)量N;用戶評(píng)過分的電影數(shù)量M;學(xué)習(xí)率α;折扣因子γ。

        1.對(duì)Q-table進(jìn)行初始化,對(duì)任意s∈S,a∈A;

        2.從數(shù)據(jù)中獲取初始狀態(tài)s,動(dòng)作a;

        3.foreachepisodei=1:Ndo

        4.fork=1:Mido

        5.根據(jù)式(1)計(jì)算獎(jiǎng)懲函數(shù);

        6.將計(jì)算出的獎(jiǎng)賞值更新Q-table;

        7.endfor8.endfor

        9.將Q-table用于式(3)訓(xùn)練參數(shù);

        10.預(yù)測(cè)模型計(jì)算預(yù)測(cè)評(píng)分。

        2 結(jié)果與分析

        為驗(yàn)證本文設(shè)計(jì)的優(yōu)化算法有效性,進(jìn)行實(shí)驗(yàn)時(shí)除預(yù)測(cè)SVDPP模型獲得RL-TSVDPP模型之外,還設(shè)置了對(duì)照組實(shí)驗(yàn),同時(shí)訓(xùn)練了SVD模型并構(gòu)建RL-TSVD預(yù)測(cè)模型。考慮這2種模型都是按照用戶-電影-評(píng)分-時(shí)間的方式獲得Q-table,無需采用推薦算法,因此進(jìn)行計(jì)算時(shí)通過獎(jiǎng)懲函數(shù)得到的獎(jiǎng)懲表和更新得到的Q-table是相同的,獎(jiǎng)懲表和Q-table結(jié)果分別如表2、表3所示。

        表2 基于訓(xùn)練集得到的獎(jiǎng)懲表

        表3 基于訓(xùn)練集更新后的Q-table

        為了便于用戶更直觀進(jìn)行觀察,本文對(duì)表2中的數(shù)據(jù)進(jìn)行作圖形成三維結(jié)構(gòu),可以明顯看到Q-table數(shù)據(jù)在整個(gè)空間中保持基本恒定的狀態(tài),只發(fā)生了小幅的起伏變化,表明時(shí)間戳參數(shù)確實(shí)會(huì)影響到預(yù)測(cè)結(jié)果,如圖1所示。

        圖1 RL-TSVDPP算法Q-table三維圖

        接著,把Q-table數(shù)據(jù)引入SVDPP訓(xùn)練模型中計(jì)算出bu(t)、qT(t)、bi(t)、p,由此實(shí)現(xiàn)在預(yù)測(cè)模型中通過融合時(shí)間戳參數(shù)進(jìn)行用戶評(píng)分預(yù)測(cè)。對(duì)實(shí)驗(yàn)結(jié)果計(jì)算出評(píng)價(jià)指標(biāo)的均方根誤差,同時(shí)對(duì)比前期計(jì)算得到的RL-TSVD模型,獲得結(jié)果如表4所示。

        表4 RL-TSVDPP算法與已有SVDPP的RMSE對(duì)比

        對(duì)表4進(jìn)行分析可知,由于RL-TSVD與RL-TSVDPP 2個(gè)模型中包含了時(shí)間效應(yīng)參數(shù),與原模型相比,可以更加準(zhǔn)確預(yù)測(cè)出用戶的評(píng)分,依次提升0.017和0.022。采用SVDPP預(yù)測(cè)評(píng)分方法優(yōu)化馬爾科夫過程,相對(duì)于以Q-learning算法進(jìn)行優(yōu)化的RL-SVDPP算法,RL-SVDPP算法利用先處理數(shù)據(jù)集分析時(shí)間因素的影響,之后通過推薦模型訓(xùn)練參數(shù)對(duì)用戶電影評(píng)分進(jìn)行預(yù)測(cè)可以獲得更高的準(zhǔn)確率。

        3 基于大數(shù)據(jù)分布式系統(tǒng)的RL-TSVDPP

        在MovieLens1M數(shù)據(jù)集中總共存在6 050個(gè)用戶針對(duì)3 960個(gè)影片給出的約1億條評(píng)分,訓(xùn)練集占比達(dá)到80%,采用分布式方法處理訓(xùn)練集時(shí)應(yīng)先通過用戶ID進(jìn)行數(shù)據(jù)集排序,之后分割排序得到的數(shù)據(jù)集,各子節(jié)點(diǎn)按照用戶ID數(shù)據(jù)對(duì)分割得到的數(shù)據(jù)進(jìn)行處理,在本研究中根據(jù)用戶ID類型分割數(shù)據(jù)集,先根據(jù)用戶ID對(duì)數(shù)據(jù)實(shí)施排序,再以分段方式傳輸至各主機(jī),通過每個(gè)子節(jié)點(diǎn)對(duì)數(shù)據(jù)進(jìn)行時(shí)間戳排序,同時(shí)計(jì)算得到各用戶已經(jīng)作出評(píng)分的電影數(shù)量,之后對(duì)此類電影重新設(shè)置編號(hào),根據(jù)時(shí)間的先后順序構(gòu)建編號(hào)-評(píng)分索引,再匯總上述結(jié)果并進(jìn)行后續(xù)計(jì)算,具體的處理過程如圖2所示。

        圖2 數(shù)據(jù)預(yù)處理分布式框架

        Data表示原Movielens的數(shù)據(jù)集,D1、D2、D3是根據(jù)ID段號(hào)進(jìn)行分割得到的數(shù)據(jù)集,d1、d2、d3是根據(jù)時(shí)間戳進(jìn)行排序獲得的數(shù)據(jù)集,data是合并d1、d2、d3獲得的數(shù)據(jù)集。

        對(duì)分布式計(jì)算數(shù)據(jù)集先進(jìn)行預(yù)處理,獲得按照時(shí)間戳順序?qū)τ脩?、電影、評(píng)分進(jìn)行排序的結(jié)果,利用上述處理得到的數(shù)據(jù)作為后續(xù)計(jì)算過程的參數(shù),該過程需消耗18 h的時(shí)間,相對(duì)于未分布式處理前的情況,縮短了近2 h,可以節(jié)省近10%時(shí)間,由此表明可以通過分布式數(shù)據(jù)預(yù)處理的方法來顯著提高計(jì)算效率。對(duì)程序耗時(shí)進(jìn)行分析發(fā)現(xiàn),存在以多重for循環(huán)情況,其中,以雙重for循環(huán)所需的耗時(shí)為n平方,以三重for循環(huán)進(jìn)行處理時(shí)耗時(shí)為n三次方,隨著n的增大,形成了更長(zhǎng)的n平方耗時(shí)。

        4 總結(jié)

        本文設(shè)計(jì)了一種包含了時(shí)間影響因素的SVDPP算法,并把該關(guān)系映射至馬爾可夫決策過程,再把時(shí)間影響添加至推薦算法SVDPP模型內(nèi),由此獲得包含了時(shí)間戳參數(shù)的RL-TSVDPP優(yōu)化模型。通過測(cè)試發(fā)現(xiàn)。

        1)RL-SVDPP算法利用先處理數(shù)據(jù)集分析時(shí)間因素的影響,通過推薦模型訓(xùn)練參數(shù)對(duì)用戶電影評(píng)分進(jìn)行預(yù)測(cè)可以獲得更高的準(zhǔn)確率。

        2)通過分布式數(shù)據(jù)預(yù)處理的方法來顯著提高計(jì)算效率,為SVDPP模型添加時(shí)間影響因素是完全可行的,將此類影響因素加入用戶預(yù)測(cè)評(píng)分可以有效提升推薦準(zhǔn)確性。

        猜你喜歡
        用戶信息模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        3D打印中的模型分割與打包
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        展會(huì)信息
        无码精品国产午夜| 中文字幕无码日韩专区免费| 精品久久无码中文字幕| 91免费国产高清在线| 蜜桃av中文字幕在线观看| 美女mm131爽爽爽| 日日躁夜夜躁狠狠躁超碰97| 免费观看久久精品日本视频| 精品国产av一区二区三四区| 国产成人无码av一区二区在线观看| 亚洲综合欧美色五月俺也去| 国产免费av片在线观看| 在线观看视频亚洲| 四虎在线中文字幕一区| 国产在线高清理伦片a| 亚洲国产激情一区二区三区| 一个人免费观看在线视频播放| 亚洲高清国产拍精品熟女| 日韩精品极品免费视频观看| 国产农村妇女精品一二区| 在线欧美不卡| 午夜精品人妻中字字幕| 精品人妻少妇av中文字幕| 久久www免费人成人片| 在线视频中文字幕乱人伦| 国产一区二区白浆在线观看| 国产精品免费看久久久无码| 99久久国语露脸精品国产| 69搡老女人老妇女老熟妇| 日韩av一区二区观看| 免费人成视频xvideos入口| 欧美国产日本精品一区二区三区| 在线观看免费人成视频国产| 在线播放亚洲丝袜美腿| 米奇777四色精品人人爽| 亚洲欧洲日韩免费无码h| 字幕网中文字幕精品一区| 亚洲av成人片色在线观看高潮| 午夜丰满少妇性开放视频| 欧美日韩一区二区三区视频在线观看 | 国产欧美日韩在线观看 |