摘要: 為了改善資源推薦算法的性能, 提出基于鯨魚優(yōu)化算法(WOA)改進(jìn)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的資源推薦算法; 首先提取資源和用戶特征, 構(gòu)建特征差異值加權(quán)函數(shù); 然后, 以資源-用戶特征作為輸入,建立基于LSTM的資源推薦算法,通過(guò)輸入門、 遺忘門、 輸出門及記憶節(jié)點(diǎn)對(duì)歷史資源推薦數(shù)據(jù)按權(quán)重進(jìn)行遺忘與篩選,有選擇性地挑選部分?jǐn)?shù)據(jù)進(jìn)行循環(huán)迭代訓(xùn)練;考慮到LSTM的門操作需要設(shè)置的參數(shù)較多,引入WOA進(jìn)行參數(shù)智能優(yōu)化求解,提出WOA-LSTM算法,以提高LSTM的參數(shù)優(yōu)化的精度及效率。結(jié)果表明,通過(guò)合理設(shè)置WOA參數(shù),可以有效改善LSTM的資源推薦性能,與常用資源推薦算法相比,所提出的WOA-LSTM算法具有更高的推薦精度及穩(wěn)定性。
關(guān)鍵詞: 資源推薦; 長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò); 鯨魚優(yōu)化算法; 特征差異值
中圖分類號(hào): TP391.2
文獻(xiàn)標(biāo)志碼: A
Abstract: To improve performances of resource recommendation algorithm, a resource recommendation algorithm based on long short term memory neural network (LSTM) improved by using whale optimization algorithm (WOA) was proposed.Firstly, resources and user features were extracted, and a feature difference value weighting function was constructed.Then, a resourcerecommendation algorithm based on LSTM was established, resource user features were input,and historical resourcerecommendation data were forgotten and filtered according to weights through the input gate, forgetting gate, outputgate, and memory node. Some data were selectively selected for cyclic iterative training. Considering that there were many parameters to be set for the gate operation of LSTM, WOA was introduced to solve the parameter intelligent optimization and WOA-LSTM algorithm was proposed, so as to improve accuracy and efficiency of parameter optimization of LSTM. The results show that by reasonably setting WOA parameters, the resource recommendation performances of LSTM were effectively improved. Compared with the common resource recommendation algorithms, the proposed WOA-LSTM algorithm has higher recommendation accuracy and stability.
Keywords: resource recommendation; long short term memory neural network; whale optimization algorithm; characteristic difference value
基金項(xiàng)目: 國(guó)家自然科學(xué)基金項(xiàng)目(61871204); 湖南省教育廳科學(xué)研究項(xiàng)目?jī)?yōu)秀青年項(xiàng)目(22B1028, 19B397); 福建省科技計(jì)劃項(xiàng)目
引導(dǎo)性項(xiàng)目(2018H0028); 湖南信息學(xué)院2022年度校級(jí)科研項(xiàng)目(XXY022QN04)
第一作者簡(jiǎn)介: 仇煥青(1984—),女,河南濮陽(yáng)人。高級(jí)工程師,碩士,研究方向?yàn)閳D像處理、深度學(xué)習(xí)、人工智能。Email: 895165985@qq.com。
網(wǎng)絡(luò)首發(fā)地址: https://kns.cnki.net/kcms/detail//37.1378.N.20230227.1618.002.html
隨著因特網(wǎng)數(shù)據(jù)量的增多, 用戶獲取資源的方式從以前的主動(dòng)檢索逐漸發(fā)生變化, 在電商服務(wù)平臺(tái)、 在線社交平臺(tái)、在線學(xué)習(xí)平臺(tái)等相繼推出了個(gè)性化推薦服務(wù)。 用戶被動(dòng)地接受服務(wù)端的資源推送正逐漸成為用戶獲取資源的重要方式之一, 這主要是由不對(duì)等的資源邊界決定的。 一方面,用戶的認(rèn)知范圍決定了其主動(dòng)搜索獲取資源的受限程度[1], 而服務(wù)端的資源推薦增強(qiáng)了用戶接收資源的實(shí)時(shí)性; 另一方面, 采用資源推薦有效節(jié)省了用戶主動(dòng)搜索的時(shí)間, 用戶打開(kāi)軟件就能夠直接獲取與自己習(xí)慣關(guān)聯(lián)度更高的資源。 資源推薦服務(wù)有效地提高了資源-用戶匹配度[2], 但是需要精準(zhǔn)、 高效的資源推薦算法來(lái)完成。
當(dāng)前,關(guān)于資源推薦服務(wù)的研究較多。東苗[3]采用知識(shí)圖譜對(duì)資源-用戶特征進(jìn)行特征對(duì)分析,以提高所選特征的有效性,并通過(guò)多目標(biāo)優(yōu)化來(lái)實(shí)現(xiàn)在線學(xué)習(xí)資源推薦,取得了較高的推薦準(zhǔn)確度。李浩君等[4]采用多目標(biāo)函數(shù)方法進(jìn)行資源-用戶特征對(duì)分析,并通過(guò)多角度差值匹配提高了資源推薦準(zhǔn)確度。
本文中將長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)用于資源-用戶特征訓(xùn)練, 找到兩者特征相關(guān)度高的個(gè)體, 從而實(shí)現(xiàn)資源推薦。 考慮到LSTM隱藏層循環(huán)迭代運(yùn)算的復(fù)雜度, 以及LSTM門結(jié)構(gòu)參數(shù)多的特點(diǎn), 引入鯨魚優(yōu)化算法(WOA)對(duì)門結(jié)構(gòu)參數(shù)進(jìn)行優(yōu)化求解, 以提高LSTM主要參數(shù)求解的精度及效率, 用實(shí)驗(yàn)驗(yàn)證WOA-LSTM算法有效改善資源推薦的綜合性能。
1 LSTM
LSTM作為循環(huán)神經(jīng)網(wǎng)絡(luò)的一種, 主要特點(diǎn)是在網(wǎng)絡(luò)訓(xùn)練過(guò)程中考慮了歷史時(shí)間序列的影響, 將當(dāng)前時(shí)刻之前的若干歷史時(shí)刻作為隱藏層進(jìn)行加權(quán)訓(xùn)練, 從而獲得當(dāng)前時(shí)刻的輸出。 對(duì)于歷史時(shí)刻的隱藏層輸出, LSTM采用記憶節(jié)點(diǎn)及遺忘門等方式來(lái)靈活選擇多個(gè)歷史時(shí)刻進(jìn)行循環(huán)訓(xùn)練。
在WOA-LSTM算法資源推薦過(guò)程中, 首先輸入資源-用戶推薦記錄, 然后進(jìn)行變量預(yù)處理后輸入LSTM網(wǎng)絡(luò)訓(xùn)練, 并通過(guò)WOA算法對(duì)LSTM網(wǎng)絡(luò)的輸入、 遺忘、 輸出門參數(shù)進(jìn)行優(yōu)化求解, 獲得適應(yīng)度值高的WOA個(gè)體, 輸出穩(wěn)定的門參數(shù), 最后采取經(jīng)過(guò)WOA優(yōu)化的門參數(shù)進(jìn)行LSTM網(wǎng)絡(luò)學(xué)習(xí)資源推薦訓(xùn)練, 獲得穩(wěn)定WOA-LSTM資源推薦, 具體流程見(jiàn)圖3。
3 實(shí)例仿真
為了驗(yàn)證WOA-LSTM算法在資源推薦中的性能,分別采用來(lái)自于電商、 在線音樂(lè)、 在線社交平臺(tái)、 在線美食平臺(tái)的4類不同數(shù)據(jù)集進(jìn)行資源推薦實(shí)例仿真,具體樣本集數(shù)量如表1所示。首先驗(yàn)證WOA對(duì)LSTM網(wǎng)絡(luò)算法的優(yōu)化性能,分別采用LSTM網(wǎng)絡(luò)算法和WOA-LSTM算法進(jìn)行推薦性能仿真;其次分別采用常用資源推薦算法和WOA-LSTM算法進(jìn)行推薦性能仿真。
3.1 不同樣本稀疏度的推薦性能
為了驗(yàn)證不同數(shù)量訓(xùn)練樣本的推薦性能,采用不同訓(xùn)練樣本比例進(jìn)行WOA-LSTM算法訓(xùn)練,驗(yàn)證其對(duì)測(cè)試樣本的準(zhǔn)確率和對(duì)應(yīng)的均方根誤差(RMSE)性能,結(jié)果如表2所示。從表中可知: 參與WOA-LSTM算法訓(xùn)練的樣本數(shù)量對(duì)資源推薦的準(zhǔn)確率影響明顯。 在4類樣本集中, 訓(xùn)練集樣本數(shù)量越大,資源推薦的準(zhǔn)確率均越高, 且RMSE越小。 當(dāng)訓(xùn)練集比例從20%提升至80%時(shí), Amazon樣本集推薦準(zhǔn)確率提升7.70%且RMSE減小1.343 6, Last.FM樣本集推薦準(zhǔn)確率提升8.81%且RMSE減小1.242 6,F(xiàn)oursquare樣本集推薦準(zhǔn)確率提升11.01%且RMSE減小1.335 8, Yelp樣本集推薦準(zhǔn)確率提升11.74%且RMSE減小1.428 1。 通過(guò)對(duì)比發(fā)現(xiàn), 樣本集按照樣本數(shù)量對(duì)推薦準(zhǔn)確率的影響程度由大到小的順序?yàn)閅elp樣本集、 Foursquare樣本集、 Last.FM樣本集、 Amazon樣本集, 樣本集按照樣本數(shù)量對(duì)推薦準(zhǔn)確率的穩(wěn)定性影響程度由大到小的順序?yàn)長(zhǎng)ast.FM樣本集、 Foursquare樣本集、 Amazon樣本集、 Yelp樣本集。
3.2 WOA對(duì)LSTM網(wǎng)絡(luò)算法的優(yōu)化性能
為了驗(yàn)證WOA對(duì)LSTM網(wǎng)絡(luò)算法的參數(shù)優(yōu)化性能及對(duì)資源推薦性能的影響,分別采用LSTM網(wǎng)絡(luò)算法和WOA-LSTM算法對(duì)4類樣本集進(jìn)行資源推薦性能仿真,結(jié)果見(jiàn)表3。從表中可知, 在4類樣本集的資源推薦準(zhǔn)確率方面,WOA-LSTM算法明顯優(yōu)于LSTM網(wǎng)絡(luò)算法,且WOA-LSTM算法的推薦準(zhǔn)確率最小值、平均值和最大值分布更集中,其原因主要是2種算法的網(wǎng)絡(luò)參數(shù)優(yōu)化求解方法不同。
上述2種算法的推薦準(zhǔn)確率RMSE仿真結(jié)果如表4所示。從表中數(shù)據(jù)可以看出,LSTM網(wǎng)絡(luò)算法與WOA-LSTM算法在RMSE的最小值、 最大值和平均值的分布集中度方面的差距并不大,表明引入WOA優(yōu)化之后,LSTM網(wǎng)絡(luò)算法對(duì)不同樣本集的資源推薦穩(wěn)定性變化較小。
3.3 不同算法的資源推薦性能
為了進(jìn)一步驗(yàn)證WOA-LSTM算法在資源推薦中的性能,分別采用WOA-LSTM算法以及3種常用推薦算法——協(xié)同過(guò)濾[14]、 Apriori關(guān)聯(lián)規(guī)則[15]、 深度神經(jīng)網(wǎng)絡(luò)[16]對(duì)表1中的4類樣本測(cè)試集進(jìn)行實(shí)例仿真,結(jié)果如圖4—6所示。由圖可見(jiàn):WOA-LSTM算法的推薦準(zhǔn)確率最高,數(shù)值均大于90%;深度神經(jīng)網(wǎng)絡(luò)算法次之,推薦準(zhǔn)確率在80%以上;協(xié)同過(guò)濾算法推薦準(zhǔn)確率最低,在Yelp樣本集中的準(zhǔn)確率為60%左右。從推薦算法執(zhí)行時(shí)間來(lái)看,4類樣本集略有差異,整體來(lái)看,協(xié)同過(guò)濾算法執(zhí)行時(shí)間最短,其他3種算法的執(zhí)行時(shí)間接近。
在4類樣本集的推薦召回率方面,當(dāng)算法穩(wěn)定時(shí),WOA-LSTM算法的召回率最大,表明該算法能夠找到更多適合于用戶的資源并推薦給用戶,這得益于LSTM網(wǎng)絡(luò)處理多維特征數(shù)據(jù)分析的能力,且通過(guò)WOA優(yōu)化后,能夠增強(qiáng)LSTM網(wǎng)絡(luò)算法全面搜索適應(yīng)度值最優(yōu)個(gè)體的能力,從而改善算法的資源推薦性能。
在4類樣本集的推薦RMSE方面,WOA-LSTM算法具有絕對(duì)優(yōu)勢(shì),在Amazon、 Last.FM和Foursquare樣本集中, 4種算法的RMSE分層明顯, 但WOA-LSTM算法在Yelp樣本集中的RMSE最小, 其他3種算法的RMSE非常接近。 綜合而言, WOA-LSTM算法在4類樣本集中的資源推薦穩(wěn)定性最好。
4 結(jié)語(yǔ)
本文中采用LSTM網(wǎng)絡(luò)用于資源推薦,通過(guò)LSTM的門操作及多隱藏層迭代循環(huán)實(shí)現(xiàn)資源及用戶特征的訓(xùn)練。此外,為了提高LSTM用于資源推薦的適用性,本文中采用WOA算法進(jìn)行LSTM參數(shù)優(yōu)化求解,通過(guò)與常用推薦算法進(jìn)行仿真比較,在4類不同領(lǐng)域的公開(kāi)數(shù)據(jù)集中,WOA-LSTM算法的推薦準(zhǔn)確率最高,RMSE最小。
參考文獻(xiàn):
[1] HAN L, LI H. Visualization analysis of online learning resource recommendation based on CiteSpace[J]. International Journal of Social Science and Education Research, 2021, 4(10): 73.
[2] 楊智強(qiáng), 殷釗, 王衡. 結(jié)合用戶交互行為和資源內(nèi)容的資源推薦[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2014, 26(5): 747.
[3] 東苗. 基于知識(shí)圖譜的多目標(biāo)學(xué)習(xí)資源推薦算法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2021, 30(4): 139.
[4] 李浩君, 楊琳, 張鵬威. 基于多目標(biāo)優(yōu)化策略的在線學(xué)習(xí)資源推薦方法[J]. 模式識(shí)別與人工智能, 2019, 32(4): 306.
[5] WANG J Y, LI J, WANG X, et al. Air quality prediction using CT-LSTM[J]. Neural Computing and Applications, 2021, 33(10): 4779.
[6] PARK K, CHOI Y, CHOI W J, et al. LSTMbased battery remaining useful life prediction with multichannel charging profiles[J]. IEEE Access, 2020, 8: 20786.
[7] BUKHARI A H, RAJA M A Z, SULAIMAN M, et al. Fractional neurosequential ARFIMA-LSTM for financial market forecasting[J]. IEEE Access, 2020, 8: 71326.
[8] ELSHEIKH A H, KATEKAR V P, MUSKENS O L, et al. Utilization of LSTM neural network for water production forecasting of a stepped solar still with a corrugated absorber plate[J]. Process Safety and Environmental Protection, 2021, 148: 279.
[9] HE K J, JI L, WU C W D, et al. Using SARIMA-CNN-LSTM approachto forecast daily tourism demand[J]. Journal of Hospitality and Tourism Management, 2021, 49: 28.
[10] QIU Y G, ZHOU J, KHANDELWAL M, et al. Performance evaluationof hybrid WOA-XGBoost, GWO-XGBoost and BO-XGBoost models to predict blastinduced ground vibration[J]. Engineering with Computers, 2022, 38: 4145.
[11] LI Z M, YAZDANI B, ASTERIS P G, et al. A hybrid GEP and WOA approach to estimate the optimal penetration rate of TBM in graniticrock mass[J]. Soft Computing, 2021, 25(17): 11880.
[12] NASROLLAHZADEHS,MAADANIM,POURMINAMA.Optimal motion sensor placement in smart homes and intelligent environments using a hybrid WOA-PSO algorithm[J]. Journal of Reliable Intelligent Environments, 2022, 8: 345.
[13] SAMANTARAY S, SAHOO A. Prediction of suspended sediment concentration using hybrid SVM-WOA approaches[J]. Geocarto International, 2022, 37(19): 5621.
[14] 覃忠臺(tái), 張明軍. 基于協(xié)同過(guò)濾算法的學(xué)習(xí)資源推薦模型研究[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2021, 31(9): 31.
[15] 趙春霞, 趙營(yíng)穎, 宋學(xué)坤. 基于頻繁項(xiàng)集的多源異構(gòu)數(shù)據(jù)并行聚類算法[J]. 濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022, 36(4): 440.
[16] 樊?,|, 史雙, 張博敏, 等. 基于MLP改進(jìn)型深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)資源推薦算法[J]. 計(jì)算機(jī)應(yīng)用研究, 2020, 37(9): 2629.
(責(zé)任編輯:劉 飚)