韋智勇 周立廣
【摘 要】隨著全球信息技術(shù)的迅猛發(fā)展,信息數(shù)據(jù)呈現(xiàn)出爆發(fā)式增長的趨勢,如何從海量的數(shù)據(jù)中找出有價值的信息,是一個迫切需要解決的問題。推薦系統(tǒng)是解決這一問題的有效途徑,而如何把深度學習這項技術(shù)融入推薦系統(tǒng),是目前的研究熱點。文章分析了傳統(tǒng)的推薦系統(tǒng)存在的問題,提出了相應的解決方法和對策,使系統(tǒng)模型與用戶的需求結(jié)合更加緊密,用戶的滿意度得到進一步提升,并對基于深度學習的推薦系統(tǒng)的未來發(fā)展趨勢進行了闡述。
【關(guān)鍵詞】推薦系統(tǒng);深度學習;神經(jīng)網(wǎng)絡;多源異構(gòu)數(shù)據(jù);上下文推薦
【中圖分類號】TP391.3 【文獻標識碼】A 【文章編號】1674-0688(2022)02-0034-03
隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,每天都有大量的信息數(shù)據(jù)展現(xiàn)在我們面前,想從這些海量的數(shù)據(jù)中提取自己需要的信息是非常困難的,而且耗費大量的時間和精力,因此開發(fā)一個能根據(jù)用戶需求自動推薦相關(guān)內(nèi)容的系統(tǒng),是目前人工智能技術(shù)研究的熱點。該系統(tǒng)能解決信息過載問題,并且可以在工作、生活、娛樂、網(wǎng)上購物、信息檢索等方面提供高效的服務。系統(tǒng)的推薦內(nèi)容都是根據(jù)每個人的喜好和特點推薦的,不同的人有不同的推薦需求,而系統(tǒng)具有智能化特點。
近年來,深度學習技術(shù)在研究領(lǐng)域中逐步受到重視,例如在人臉識別、智能語音等都得到了廣泛應用。該項技術(shù)可以使許多智能設備可以自適應各種環(huán)境,成為人工智能技術(shù)的研究熱點;可以融入推薦系統(tǒng)中,把各種異構(gòu)數(shù)據(jù)進行整合處理,這樣建立的需求模型更加貼近用戶的需求,使用戶的滿意度得以提升。因此,深度學習技術(shù)為推薦系統(tǒng)的發(fā)展提供新的研究思路[1]。
1 推薦系統(tǒng)概述
傳統(tǒng)的推薦系統(tǒng)就是把用戶的需求作為輸入,系統(tǒng)通過需要把搜索到的數(shù)據(jù)信息匯集后發(fā)給用戶的系統(tǒng)。隨著網(wǎng)絡技術(shù)的飛速發(fā)展,推薦系統(tǒng)已經(jīng)在原有的基礎上進行了擴充式的發(fā)展,系統(tǒng)把用戶的興趣愛好融入其中,更具人性化和個性化,推薦內(nèi)容涉及的范圍較廣,包括影視、廣告、購物和社交等,都在系統(tǒng)的服務范圍中。傳統(tǒng)的推薦系統(tǒng)按照推送方式分為協(xié)同過濾、內(nèi)容信息和綜合性推薦系統(tǒng)。
1.1 基于協(xié)同過濾的推薦系統(tǒng)
基于協(xié)同過濾的推薦系統(tǒng),該算法的指導思想主要根據(jù)用戶操作行為特征進行目標推測,把可能要搜索的相關(guān)內(nèi)容羅列出來[2]。該算法主要包括兩種類型,即基于用戶和基于物品。在具體的實踐中,基于物品的推薦比基于用戶的推薦算法較為切合實際。該系統(tǒng)的算法的優(yōu)點是在技術(shù)實現(xiàn)上較為簡單,系統(tǒng)的精準性高,缺點是數(shù)據(jù)量缺乏,實時性差,同時隨著運算的復雜度加大,系統(tǒng)效率低,推薦內(nèi)容欠缺。
1.2 基于內(nèi)容的推薦系統(tǒng)
基于內(nèi)容的推薦系統(tǒng),該系統(tǒng)的算法主要是根據(jù)用戶相關(guān)物品的特征進行數(shù)據(jù)提取,通過用戶的操作行為,把用戶的喜好與物品進行關(guān)聯(lián),在這個基礎上進行內(nèi)容推薦,類似的物品也能推薦。該系統(tǒng)的算法的優(yōu)點是系統(tǒng)運行效率高,缺點是特征提取過于單一,并且推薦內(nèi)容缺乏新鮮感。此外,系統(tǒng)推薦的內(nèi)容仍然需要之前的歷史操作痕跡確認,如果是新用戶則有時無法推薦。
1.3 綜合性(混合)推薦系統(tǒng)
上述兩種推薦系統(tǒng)都可以根據(jù)用戶的特性進行推薦,但每個系統(tǒng)都存在一定的局限性,綜合性推薦系統(tǒng)把單一化的推薦系統(tǒng)的優(yōu)點集合,對原有的系統(tǒng)進行改進,該系統(tǒng)的算法主要是把各自的算法進行整合后產(chǎn)生新的推薦算法[3]。對于混合算法的策略,目前大約有7種,相應的設計思路分為整體式算法、并行式算法和流水式算法3種。
2 基于深度學習技術(shù)的網(wǎng)絡模型
該技術(shù)解決了傳統(tǒng)機械式的方法構(gòu)造數(shù)據(jù)特征、運算能力差等問題,使系統(tǒng)具有智能化,深度學習技術(shù)能對數(shù)據(jù)進一步挖掘和分析,找出數(shù)據(jù)潛在的規(guī)律和特性?;谏疃葘W習技術(shù)的網(wǎng)絡模型主要包括深度神經(jīng)網(wǎng)絡模型、卷積神經(jīng)網(wǎng)絡模型和循環(huán)神經(jīng)網(wǎng)絡模型3種。
2.1 深度神經(jīng)網(wǎng)絡模型
深度神經(jīng)網(wǎng)絡模型是許多算法模型的基礎,該算法可以通過分層進行特征學習,可對無法線性分離的數(shù)據(jù)信息進行歸類。該模型主要通過反向傳播算法進行訓練,調(diào)整神經(jīng)網(wǎng)絡中的權(quán)值和閾值達到數(shù)據(jù)歸類的精準率。
2.2 卷積神經(jīng)網(wǎng)絡模型
卷積神經(jīng)網(wǎng)絡模型屬于一種前饋的網(wǎng)絡模型,包含兩個核心操作,即卷積和池化,其功能是把用戶和項目進行潛在特征的提取操作。系統(tǒng)除采用局部感知的提取策略外,還可用權(quán)值共享的策略進行特征提取。這些策略的優(yōu)點是減少網(wǎng)絡模型的參數(shù)和降低模型的復雜度,防止過度擬合問題的產(chǎn)生。
2.3 循環(huán)神經(jīng)網(wǎng)絡模型
循環(huán)神經(jīng)網(wǎng)絡模型是在建模的過程中融入時序,把時間順序與數(shù)據(jù)序列對應起來的網(wǎng)絡模型。該模型的神經(jīng)元節(jié)點含有元素的操作信息,這些節(jié)點通過隱藏單位的方式進行深度學習,顯示出當前網(wǎng)絡的狀態(tài)信息。該網(wǎng)絡模型解決了其他模型無法根據(jù)序列建立模型的問題,但該模型也存在梯度消失的問題。隨著后續(xù)其他模型相繼問世,例如長短時記憶網(wǎng)絡模型、門限循環(huán)單元模型等,解決了梯度消失的問題。
3 基于深度學習的推薦系統(tǒng)概述
目前,深度學習技術(shù)在推薦系統(tǒng)中具有超強的生命力和廣闊的發(fā)展空間。不少專業(yè)人士通過該技術(shù)模型解決了傳統(tǒng)推薦系統(tǒng)的遺留問題,使整個系統(tǒng)的活力得以提升。目前,推薦系統(tǒng)一般主要包括4個層次,即用戶層、算法層、推薦層和結(jié)果。推薦系統(tǒng)的主要技術(shù)架構(gòu)如圖1所示。
3.1 基于內(nèi)容的深度學習推薦系統(tǒng)
推薦系統(tǒng)可以通過深度學習技術(shù)學習數(shù)據(jù)的特征和規(guī)律,解決了人工構(gòu)造特征的不足之處。所以,深度學習技術(shù)在該系統(tǒng)的作用主要是用于特征表示的提取,同時用于解決冷啟動和信息缺少等問題。CDL方法是一種深度學習方法,該方法主要通過用戶喜愛圖片的對比進行推薦,利用兩個CNN把圖像分為正負兩類,即喜歡和不喜歡,分別計算用戶特征的差距,采用交叉熵損失數(shù)模型進行訓練,這樣系統(tǒng)可以區(qū)分類似的圖片,相比手工模型更具優(yōu)勢。除了CDL模型,還有DeePCoNN模型,該模型與之前模型不同的是,通過兩個耦合的CNN對物品評論和用戶特征進行深度學習,如果由于喊聲原因?qū)е赂蓴_過大,則用模擬的方式生成用戶提示[4]。經(jīng)過長時間的測試,在信息缺乏時,用戶評論中的有兩個因子對推薦性能具有關(guān)鍵性作用,即語義因子和情感因子,該模型解決了冷啟動和信息缺少的問題。
3.2 基于上下文的深度學習推薦系統(tǒng)
對于可以描述所有事物實體的數(shù)據(jù)信息,這種信息稱為上下文信息。用戶和應用程序之間的交互通過一種接口完成,該接口稱之為實體,實體一般包括用戶、地點和應用對象3種?;谏舷挛牡纳疃葘W習推薦系統(tǒng)主要根據(jù)用戶的描述信息(即上下文)進行推薦,利用環(huán)境場景的上下文特征進行推薦是目前該技術(shù)研究的主流方向。
基于上下文的深度學習推薦系統(tǒng)通過捕獲圖像的時間、位置、視覺和用戶上下文表示后,通過交叉熵損失函數(shù)將多標簽問題轉(zhuǎn)換為單標簽問題,該系統(tǒng)與舊版本的標簽推薦系統(tǒng)不同之處主要是根據(jù)時間、位置、視覺和用戶上下文關(guān)系,結(jié)合標簽特征進行標簽推薦處理。實踐結(jié)果顯示,用戶用何種方法標記圖像的關(guān)鍵因素是上下文信息,通過上下文內(nèi)容的整合后,可以使標簽預測效果得到進一步改善?;谏舷挛牡牧硪粋€應用是在基于會話的推薦系統(tǒng)中,用戶互動信息具有連續(xù)性特點,因此時間上下文因素對推薦系統(tǒng)是非常關(guān)鍵的。系統(tǒng)主要根據(jù)用戶的興趣愛好的動態(tài)性進行抓取,并且結(jié)合時序變化的數(shù)據(jù)預操作,兼顧了用戶興趣愛好的長期性和短期性。隨著系統(tǒng)的不斷改進,在后期的系統(tǒng)版本中,有一個PL-RNN模型,該模型不以用戶的興趣愛好為主,而是以用戶對物品的關(guān)注權(quán)重和操作時序相結(jié)合后,得出用戶的用意與上下文之間的關(guān)聯(lián)。該模型既解決項目的獨立操作問題,又解決多項目協(xié)同操作的影響問題。
在多層次上下文的系統(tǒng)應用方面,系統(tǒng)主要通過穿戴設備對人眼進行狀態(tài)預測,可檢測出人體的疲勞程度數(shù)據(jù),以此作為上下文內(nèi)容對用戶的興趣愛好進行評價和分析,使推薦準確率得以提升。此外,HCA-GRU模型在原有的基礎上進行了改進,該模型是在長期和短期的興趣愛好方面融入注意力機制,能更真實地體現(xiàn)用戶的興趣愛好。
3.3 基于深度學習的推薦系統(tǒng)的優(yōu)勢分析
基于深度學習的推薦系統(tǒng)具有明顯的優(yōu)勢,主要表現(xiàn)在以下幾個方面。
(1)數(shù)據(jù)特征學習。深層次的神經(jīng)網(wǎng)絡模型能夠建立各種數(shù)據(jù)信息的特征表示,減少了手工操作,并且可以整合大量的數(shù)據(jù)信息(包括各種類型結(jié)構(gòu)的數(shù)據(jù)),這樣可以有效解決信息缺乏和冷啟動的問題。
(2)非線性數(shù)據(jù)轉(zhuǎn)換。深度學習系統(tǒng)可以通過非線性函數(shù)對數(shù)據(jù)進行建模,數(shù)據(jù)中包括線性和非線性數(shù)據(jù),這樣系統(tǒng)可以處理一些復雜程度較高的交互模型。
(3)新型建模方式?;谏疃葘W習的推薦系統(tǒng)的建模方式是序列建模,該建模方式可以根據(jù)時間的變化和用戶的操作特征進行數(shù)據(jù)分析,這樣對長期或短期建模的用戶都是非常重要的。基于深度學習的推薦系統(tǒng)提高了工作效率。
4 基于深度學習的推薦系統(tǒng)的技術(shù)發(fā)展探討
根據(jù)近幾年的調(diào)查研究發(fā)現(xiàn),基于深度學習的推薦系統(tǒng)逐步受到學術(shù)界的高度重視,成為熱點研究的課題,但就目前而言,深度學習的推薦系統(tǒng)的研究依然在初期階段,遇到的問題和挑戰(zhàn)仍然較多,將來會逐步解決這些問題。
4.1 深度算法將融入新技術(shù)
舊版本的推薦系統(tǒng)在算法上無法深度進行特征學習算法,但它具有結(jié)構(gòu)簡單和解釋性強的優(yōu)點,把新的深度學習算法融入其中,可以取長補短,達到理想的效果。當前,新的推薦系統(tǒng)已問世,例如基于神經(jīng)網(wǎng)絡的協(xié)同過濾算法模型、稀疏數(shù)據(jù)預測算法模型和xDeepFM深度算法模型,這些算法模型解決了之前僅能單一模式交互的缺陷,同時解決了信息缺乏和冷啟動方面的問題,所以該研究方向仍是學術(shù)界的研究熱點[5]。
4.2 多重任務推薦算法優(yōu)化和改進
目前,推薦系統(tǒng)一般都要同時處理多項目標任務,因此可通過任務設置中表達的方式找到處理多個目標任務的途徑,主要根據(jù)任務之間的關(guān)聯(lián)因素處理多重任務。例如對抗序列的分解法和多任務學習框架法都有共同的特點,就是把多任務學習和深度學習有機融合,提供各方面的渠道信息,解決了信息缺乏的問題,通過輔助任務從另外一個方向反映推薦內(nèi)容,使整個系統(tǒng)的解釋性得以提高,可實現(xiàn)系統(tǒng)的跨區(qū)域性。
4.3 推薦系統(tǒng)可解釋性的功能擴展
“黑盒性”是制約推薦系統(tǒng)解釋性的關(guān)鍵因素,為了解決這一問題,引入一個注意力機制的概念。所謂注意力機制,就是推薦算法模型在運算時,把用戶的操作行為與推薦結(jié)果的影響效果聯(lián)系起來,觀察它們的對應關(guān)系。注意力機制可以提升用戶興趣愛好長期的可持續(xù)性和短期的過渡性,并且可以根據(jù)當前狀況提取最高價值的特征和最優(yōu)的推薦結(jié)果。
4.4 新場景和新領(lǐng)域的推廣及創(chuàng)新
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展和成熟,推薦系統(tǒng)不斷融入工作、學習、生活、娛樂、商業(yè)、服務業(yè)等。目前,推薦系統(tǒng)仍在其他新的領(lǐng)域不斷擴展。深度學習技術(shù)在數(shù)據(jù)表征方面,可以在原有推薦系統(tǒng)的基礎上,將數(shù)據(jù)融入模型構(gòu)建當中,這樣不僅解決了舊推薦系統(tǒng)遺留下來的問題,而且對新場景的應用和創(chuàng)新增添了新的活力[6]。隨著問題的深入研究,未來新的推薦場景還可根據(jù)各種環(huán)境的需要動態(tài)地轉(zhuǎn)化,對深度學習技術(shù)不斷進行更新和完善。
5 結(jié)語
基于深度學習的推薦系統(tǒng)具有高效、優(yōu)越的特點,提高了用戶的滿意度。深度學習技術(shù)的發(fā)展將為推薦系統(tǒng)領(lǐng)域帶來新的機遇,也產(chǎn)生新的挑戰(zhàn)。本研究對傳統(tǒng)的推薦系統(tǒng)進行了概述,在原有的基礎上引入深度學習技術(shù)的概念,對幾個典型的深度學習系統(tǒng)進行了分析,對深度學習推薦系統(tǒng)的技術(shù)發(fā)展進行了技術(shù)探討,這為后續(xù)的研究提供了參考文獻。今后的研究重點是將在原有系統(tǒng)的基礎上,融入人工智能和大數(shù)據(jù)技術(shù),系統(tǒng)將自動感應當前的情境,自動識別用戶的長期和短期興趣愛好,不斷提高系統(tǒng)的推薦效率,豐富推薦內(nèi)容,提升用戶的滿意度。
參 考 文 獻
[1]黃立威,江碧濤,呂守業(yè),等.基于深度學習的推薦系統(tǒng)研究綜述[J].計算機學報,2018,41(7):1619-1647.
[2]劉青文.基于協(xié)同過濾的推薦算法研究[D].合肥:中國科學技術(shù)大學,2019.
[3]楊文龍.基于動態(tài)集成方法的混合推薦系統(tǒng)研究[D].濟南:山東大學,2018.
[4]龍虎,李娜.基于深度學習的個性化學習資源推薦系統(tǒng)研究[J].電腦編程技巧與維護,2020,35(2):128-130.
[5]蔣偉.推薦系統(tǒng)若干關(guān)鍵技術(shù)研究[D].成都:電子科技大學,2018.
[6]孫志遠,魯成祥,史忠植,等.深度學習研究與進展[J].計算機科學,2019,43(2):1-8.