顧軍華 李新晨 張婭娟 河北工業(yè)大學
協(xié)同過濾CF預測未知評分以全局高精度,成為最流行的基于低維因子模型算法。近幾年在推薦系統(tǒng)中,提出了許多基于DL的模型。幾年來,可分為兩組:深度學習先驗估計模型(DLP)和單渠道推薦模型(SCR)。在DLP中,采用先對潛在因子進行先驗估計,然后根據(jù)觀察到的評分推斷用戶和項目的潛在因素。對于SCR,它從用戶的歷史行為中學習關鍵模型,然后使用這些關鍵模式預測未知的評分。SCR可概括為幾個主要模型:受限玻爾茲曼機(RBM)、自動編碼器(ae)等。
受特殊結構的限制,它是合并用戶和項目的側邊信息的挑戰(zhàn)構建高效的推薦框架,方便地將各種輔助信息合并到推薦框架中,提出了深矩陣分解(DMF)模型,DMF構造了兩個特征變換從所有輸入信息中產生潛在因素的功能直接訪問用戶和項目。DMF通過特征變換產生潛在因素直接從用戶和項目信息起作用根據(jù)觀測數(shù)據(jù)進行估算。此外,DMF采用雙通道結構,可合并側來自用戶和項目的信息。利用實際數(shù)據(jù)進行了實證研究。
在基于CF的推薦系統(tǒng)中,歷史評級行為的用戶通常表示為用戶項目分級矩陣。給定一個用戶集U和一個項目集I,用戶項目評級矩陣Z是一個矩陣,其中每個元素rij是與用戶i對j項的偏好成比例;和 表示用戶集和項目集的編號。基于CF的問題RS正在構造一個估計量以最小化預R中的錯誤,并生成每個未觀察到的預測Z元素。
深層矩陣分解可以歸結為兩個過程,即數(shù)據(jù)準備過程和DMF模型(圖1)。DMF模型能很好地滿足用戶的精度要求和項目信息,由數(shù)據(jù)準備提供過程。在第一個過程(數(shù)據(jù)準備過程)中,反饋由IFE編碼,側邊信息編碼通過一個熱編碼。結合這兩種信息,用戶可以生成項目信息池。在DMF模型中,預測評級可以通過三步走。首先,提取目標用戶和項目信息來自用戶和項目信息池。第二,潛在因素由用戶和項目特征轉換生成功能。第三,預測的評級可以通過潛在的因素。
由圖2可知,Iui、Ivj作為DMF的輸入,F(xiàn)u為用戶的特征轉換函數(shù),為Fu的參數(shù),Gui表示用戶u對物品i的評分是否存在(如圖1),存在則為1我們可以優(yōu)化DMF中的目標函數(shù):平方誤差函數(shù),通過小批量梯度下降(MBGD)算法對所有參數(shù)、Gui的更新規(guī)則。
實驗對所涉及的模型進行了movielens數(shù)據(jù)集上的驗證。對于PMF,我們在所有數(shù)據(jù)集中設置為=0.5,K=50,對于 PMF 的各項參數(shù),AutoRec中參數(shù)=1。Pmf的 rmse為 0.853,AutoRec的 rmse為 0.840,DMF 的 rmse為 0.833。
經過對比試驗得知,DMF的表現(xiàn)優(yōu)于其他的深度推薦算法,無論是在推薦算法預測精度和效率上。