王 普,張朝霞,吳艷華,趙正陽
(1.中國鐵道科學研究院集團有限公司 研修學院,北京 100081;2.中國鐵路北京局集團有限公司 天津電務段,天津 300140;3.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
隨著互聯(lián)網(wǎng)、電子支付、大數(shù)據(jù)等技術的快速發(fā)展,各類電子商務平臺逐步增多。電子商務的發(fā)展主要包括3個階段:①基于電子數(shù)據(jù)交換EDI(Electronic Data Interchange)的電子商務階段:20世紀60年代,出現(xiàn)了應用于企業(yè)間的EDI技術和銀行間的電子資金轉(zhuǎn)賬EFT(Electronic Funds Transfer System,又稱電子支付)技術作為電子商務應用的系統(tǒng)雛形;②基于互聯(lián)網(wǎng)的電子商務階段:以全球的互聯(lián)網(wǎng)為架構,以交易雙方為主體,以網(wǎng)上支付和結算為手段,以客戶信息數(shù)據(jù)庫為依托的一種新的商務模式迅速發(fā)展,這也是今天所說的電子商務;③智慧電子商務階段:以主動、互動、用戶關懷等多角度與用戶進行深層次溝通的主動互聯(lián)網(wǎng)營銷模式出現(xiàn),進一步滿足了消費者的個性化需求。
電子商務平臺的分類有多種,常用的包括企業(yè)對消費者B2C(Business-to-Customer)、企業(yè)對企業(yè)B2B(Business-to-Business)、消費者對消費者C2C(Customer-to-Consumer)等[1-2]。面向消費者(B2C、C2C)類的電商平臺起步很早,如美國的亞馬遜、eBay,中國的京東、中糧我買網(wǎng)、淘寶網(wǎng)等,平臺架構和關鍵技術快速發(fā)展、逐步完善,已經(jīng)進入智慧電子商務階段,通過主動推送、實時更新、個性化推薦等方式提升消費者用戶體驗,提升用戶黏度,實現(xiàn)精準營銷。近年,以企業(yè)為背景的B2B類電商平臺也逐步發(fā)展,如阿里巴巴、慧聰網(wǎng)、找鋼網(wǎng)、易派客、國網(wǎng)商城等,這些平臺也在探索運用大數(shù)據(jù)關鍵技術提升企業(yè)用戶體驗。企業(yè)用戶的檢索、瀏覽和購買等行為特征與個人用戶差異較大,基于企業(yè)用戶的企業(yè)背景特征開展B2B類電商平臺智能推薦是其必然發(fā)展趨勢。
文獻[3]提出了推薦系統(tǒng)的定義,常用推薦算法主要包括協(xié)同過濾推薦、基于內(nèi)容的推薦、基于二部圖的推薦、基于關聯(lián)規(guī)則的推薦、基于社交網(wǎng)絡的推薦等[3-4]。由于算法原理和過程的側(cè)重各有不同,上述推薦算法各有優(yōu)劣,適用的典型應用場景也各不相同。總的來說,協(xié)同過濾推薦算法具有適用于個性化推薦、自動化程度高、處理復雜非結構化對象等優(yōu)點,是最適用電商網(wǎng)站的推薦算法之一,其應用最為廣泛[5-6]。
協(xié)同過濾算法可以分為三大類,分別為基于用戶、基于產(chǎn)品和基于模型的協(xié)同過濾推薦算法[7]。文獻[8-11]提出基于用戶的協(xié)同過濾算法,通過目標用戶的購買、瀏覽、評價等數(shù)據(jù),找到相似用戶群體并進行推薦的過程,也可以形象地描述為“人推人”。文獻[12-13]基于產(chǎn)品的協(xié)同過濾算法,通過用戶現(xiàn)有行為數(shù)據(jù),計算目標產(chǎn)品與用戶購買、瀏覽產(chǎn)品的相似度,從而將相似產(chǎn)品推薦給用戶的過程,也可以形象地描述為“物推物”。文獻[14-18]提出基于模型的協(xié)同過濾算法,其中包括了大量使用用戶群組信息的推薦算法以及為解決電商冷啟動問題而在文獻[19-20]提出的改進方法。
但是專門針對B2B電商平臺的推薦系統(tǒng),很少有學者展開深入的研究。與面向消費者的平臺不同,B2B電商平臺的商品和用戶,都具備獨特的企業(yè)特征,如平臺中的商品以企業(yè)特有和業(yè)務需求的商品為主,用戶的搜素、瀏覽和購買行為與所屬企業(yè)的經(jīng)營范圍相關等。鐵路B2B電商平臺(或招投標采購平臺)以鐵路企業(yè)的特殊需求商品為主,供貨商和采購用戶都具有典型的鐵路企業(yè)屬性,如某些企業(yè)只采購工務專業(yè)設備,因此其用戶的專屬業(yè)務領域特征明顯。針對B2B電商平臺的這些獨有特征,提出智能推薦的總體架構,并基于平臺數(shù)據(jù)構建具有企業(yè)屬性的雙偏好矩陣協(xié)同過濾算法,提高B2B電商平臺智能推薦系統(tǒng)的適用性和精度。
目前,大多數(shù)B2B電商平臺都是基于傳統(tǒng)的B/S架構進行設計和開發(fā)的。隨著平臺用戶、商品、成交量等的不斷增加,數(shù)據(jù)量和商品檢索、成交時間等都將受技術架構和軟硬件條件的限制。大數(shù)據(jù)技術的成熟應用,有效地解決了以上問題[8]。因此,提出B2B電商大數(shù)據(jù)分析平臺總體架構,如圖1所示。
圖1 電商大數(shù)據(jù)分析平臺總體架構
在電商平臺應用系統(tǒng)外搭建大數(shù)據(jù)分析平臺,用于提升智能推薦、用戶畫像等數(shù)據(jù)分析應用的處理效率。B2B電商大數(shù)據(jù)分析平臺,除存儲的數(shù)據(jù)和數(shù)據(jù)分析應用與B2C/C2C類的電商平臺略有差異,其原理和處理流程等均相同。電商大數(shù)據(jù)分析平臺實現(xiàn)數(shù)據(jù)采集、清洗、存儲、建模和分析等功能。基于硬件基礎設施,平臺中存儲了用戶信息、商品庫、用戶行為數(shù)據(jù)、商品交易數(shù)據(jù)、企業(yè)特征數(shù)據(jù)等。同時,為了提升數(shù)據(jù)的存儲和處理速度,滿足算法引擎的分析需求,不同類型特征的數(shù)據(jù)分別存儲于數(shù)據(jù)倉庫和分布式文件系統(tǒng),并按照數(shù)據(jù)分析主題進行數(shù)據(jù)建模。
一般的電商平臺應用系統(tǒng)主要包括三大類頁面,分別是首頁、搜索頁和詳情頁。電商大數(shù)據(jù)分析平臺,可為應用系統(tǒng)的不同頁面、不同模塊提供不同的推薦策略,或者是組合策略。以下簡要列舉某鐵路電商平臺網(wǎng)站各頁面不同模塊的推薦策略,見表1。
表1 不同板塊的推薦策略
電商大數(shù)據(jù)分析平臺中最核心的是智能推薦引擎。B2B電商大數(shù)據(jù)分析平臺與面向個人消費者類的B2C平臺間,在推薦引擎中存在局部差異,B2B電商推薦引擎中需要考慮供需雙方的企業(yè)特征信息,從而進一步提升推薦引擎的精準度。在智能推薦引擎基本架構中,增加了企業(yè)特征數(shù)據(jù)、特征提取、特征轉(zhuǎn)換,以及特征向量2(企業(yè)-類別特征向量)的構建過程,如圖2所示。
圖2 B2B智能推薦引擎基本流程
加入企業(yè)特征數(shù)據(jù)的智能推薦引擎,其中的協(xié)同過濾算法的向量矩陣,由原來的一個用戶-商品矩陣,變?yōu)橛脩?商品和企業(yè)-類別兩個矩陣,因此提出了雙偏好矩陣協(xié)同過濾推薦算法。
雙偏好矩陣協(xié)同過濾推薦算法是為了進一步滿足B2B電商平臺智能推薦的精準度而提出的,增加了平臺中供貨企業(yè)和采購企業(yè)的特征信息。接下來就雙偏好矩陣的構建,以及協(xié)同過濾推薦算法的求解流程進行詳細描述。
雙偏好矩陣由兩層構成,內(nèi)層為企業(yè)-類別矩陣,以數(shù)組的方式存儲了企業(yè)和商品類別的打分信息;外層為用戶-商品矩陣,分別存儲了用戶與企業(yè)的對應關系、類別與商品的對應關系。如圖3所示。
圖3 企業(yè)-類別&用戶-商品雙偏好矩陣
企業(yè)-類別矩陣的構建,實現(xiàn)以企業(yè)為單位與商品類別間建立打分矩陣。一方面,有針對性地提升了B2B電商平臺的推薦準確度,不僅可以為用戶推薦企業(yè)需要的產(chǎn)品,更能推薦適合當前用戶崗位需求的產(chǎn)品;同時也保證同一企業(yè)的不同用戶對企業(yè)整體購買歷史、企業(yè)最新需要等有更好的了解。
從矩陣存儲的角度來說,傳統(tǒng)的用戶-商品矩陣采用協(xié)同過濾算法求解的過程中,通常采用k近鄰算法對矩陣中的k個鄰居進行檢索,但因為用戶-商品矩陣中的用戶和商品數(shù)量都十分巨大,導致矩陣稀疏搜索時間成本高,同時可能存在算法在使用初期找不到相應的k個鄰居。企業(yè)-類別矩陣的構建可以壓縮原來存儲用戶-商品矩陣的空間,使得原本稀疏的矩陣變得密集,從而縮小搜索范圍,去除矩陣中的噪聲[6]。
雙矩陣協(xié)同過濾算法是協(xié)同過濾算法在實際應用中的一種改進。協(xié)同過濾算法基于物以類聚、人以群分的思想,對每個用戶建立用戶-商品矩陣,其表示如下。
若設用戶集合U共有n個用戶,使用集合{u1,u2,…,un}表示;商品集合I共有m個商品,使用集合{i1,i2,…,im}表示。若對用戶ui以購買次數(shù)、瀏覽次數(shù)為評分標準建立評分矩陣,則用戶ui對商品ik的評分為
S(ui,ik)=λB(ui,ik)+γL(ui,ik)
( 1 )
式中:B、L分別為購買、瀏覽的統(tǒng)計次數(shù);λ、γ為瀏覽購買在評分中的權重參數(shù)。通過統(tǒng)計次數(shù)加和乘以權重參數(shù)可得到用戶ui對商品ik的偏好評分S(ui,ik),即Sik。對所有用戶的所有偏好進行計算可得用戶商品偏好評分矩陣Sui,樣例數(shù)據(jù)見表2。
表2 用戶-商品評分矩陣
在用戶-評分矩陣當中,可能出現(xiàn)如表2中u3用戶所示的情況,即新用戶對所有商品都不存在任何評分偏好。故用戶-商品偏好矩陣無法對u3用戶進行相應的推薦。但在B2B電商場景中,由于用戶除自身屬性外,用戶所在企業(yè)的所有用戶也構成一個具有共同屬性特征的用戶集合,可用C表示。同理,如表2中i2商品所示,由于i2為新上架商品,故不存在用戶對i2商品具有偏好評分,但用戶對與i2所屬類別相同商品具有評分,故對于用類別商品可用集合K進行表示。結合式( 1 )所示評分計算方法、用戶所在企業(yè)集合C、商品所屬類別集合K,可計算企業(yè)-類別偏好評分矩陣,推導過程如下:
首先,設有企業(yè)Ci,商品分類Kj,那么對于企業(yè)Ci的用戶Cip對商品分類Kj的商品Kjq可使用式( 1 )計算出對應偏好評分向量為
S(Cip,Kjq)=λB(Cip,Kjq)+γL(Cip,Kjq)
( 2 )
則企業(yè)Ci對Kj的整體評分SCiKj為
( 3 )
使用式( 3 )對企業(yè)集合C、商品所屬類別集合K進行計算后可得企業(yè)-類別評分矩陣SCK,樣例見表3。
表3 企業(yè)-類別評分矩陣
經(jīng)過上述推導得到用戶-商品、企業(yè)-類別兩種偏好矩陣,但對于如何選擇矩陣進行具體推薦仍存在問題,為解決這一問題,進一步引入用戶活躍度、商品熱度兩種概念。用戶ui的活躍度即用戶ui對于所有商品的瀏覽、購買次數(shù),若用戶瀏覽、購買次數(shù)較多,則可評價為活躍用戶,用戶活躍度可表示為
( 4 )
在式( 4 )中可通過δ控制權重決定f(ui)的最終結果,并且通過式( 5 )判定用戶是否為活躍用戶。
( 5 )
在得到用戶-商品或企業(yè)-類別評分矩陣后可使用相似度計算方法去計算各個用戶或企業(yè)間的相似度。關于相似度的計算方法有很多種,如余弦相似度、歐幾里德距離度量、皮爾遜相關系數(shù)等。本文采用皮爾遜相關系數(shù),用式( 6 )來計算用戶&企業(yè)間的相似程度。
( 6 )
式中:X,Y分別為兩個用戶、兩個企業(yè)間的偏好向量。通過式( 6 )可以計算出兩個向量皮爾遜相關系數(shù),從而可獲得各個用戶間和企業(yè)間的偏好相似度。通過偏好相似度的值,找到與目標用戶、企業(yè)偏好相似度排名靠前的k名用戶、企業(yè),根據(jù)其用戶-商品和企業(yè)-類別評分矩陣的結果得到所推薦的商品序列。
以雙偏好矩陣為基礎構建的協(xié)同過濾算法基本流程如圖4所示。
雙偏好矩陣協(xié)同過濾算法中,最關鍵的3個步驟為收集用戶-商品和企業(yè)-類別偏好、類型/商品相似度計算、關聯(lián)類別的查找。
圖4 雙偏好矩陣協(xié)同過濾算法流程
3.3.1 收集用戶/企業(yè)偏好
用戶偏好獲取是推薦系統(tǒng)的關鍵,偏好獲取的準確性直接影響推薦系統(tǒng)的準確性。作為B2B電商大數(shù)據(jù)分析平臺的關鍵算法之一,偏好的獲取主要利用MapReduce中的Word-Count方法,對用戶瀏覽、訪問、購買商品的次數(shù)進行統(tǒng)計。同時,為防止過量瀏覽、訪問所造成數(shù)據(jù)分布偏移,對次數(shù)進行歸一化處理,并使用算法對數(shù)據(jù)進行過濾,去除次數(shù)較小的數(shù)據(jù)噪聲,防止偏好矩陣過于稀疏。
3.3.2 類型/商品相似度計算
根據(jù)用戶/企業(yè)的瀏覽、訪問、購買商品行為分析得到其偏好后,可構建用戶-商品和企業(yè)-類別評分矩陣。在對用戶-商品和企業(yè)-類別進行檢索的過程中,通過相似度計算方法判斷用戶間、企業(yè)間的相似程度,從而給用戶&企業(yè)推薦相似操作行為的用戶&企業(yè)所關注的商品&類別。
3.3.3 關聯(lián)類別的查找
B2B電商平臺中的商品通常歸屬于固定的類別。同時,類別的劃分可以包含多個層級,通常情況下類別劃分越詳細越容易推薦出偏好的商品。但同時由于某些商品很難歸于固定的類別,因此也為類別層級的劃分帶來困難。很多特定的類別或商品,與同一層級或上幾層級中的特定類別或商品存在一定的關聯(lián)關系,如成品與配件間的關系、產(chǎn)品與耗材間的關系。
雙偏好矩陣協(xié)同過濾算法,適用于帶有企業(yè)特征的B2B電商平臺。阿里巴巴、國網(wǎng)商城、慧聰網(wǎng)、找鋼網(wǎng)、易派客等電商平臺均為B2B類型的平臺;也有很多鐵路電商平臺以經(jīng)營鐵路物資為主,貨主方和采購方均為企業(yè),都屬于B2B類型的電商平臺。這類平臺均可采用雙偏好矩陣思想構建其評分矩陣,實現(xiàn)企業(yè)商品的精準推薦。本文以某鐵路電商平臺為例,對雙偏好矩陣協(xié)同過濾算法進行應用實踐。算法實踐的過程主要包括數(shù)據(jù)獲取、數(shù)據(jù)整合建模、算法應用和結果驗證等。
獲取某鐵路電商平臺的數(shù)據(jù),基礎數(shù)據(jù)表主要包括用戶表、企業(yè)表、商品表、類別表等,動態(tài)數(shù)據(jù)表主要包括用戶瀏覽記錄表、用戶購買記錄表等。以下僅以用戶表、商品表、用戶瀏覽記錄表、用戶購買記錄表為例。
(1)用戶表:主要記錄用戶自身相關信息,選取了用戶ID、企業(yè)ID等屬性。
(2)商品表:某鐵路電商平臺商品表包含約13萬條記錄,每條記錄包含商品ID、商品名稱、商品單價、商品折扣價、折扣率、所屬類別ID等屬性。
(3)用戶瀏覽記錄表:平臺中存儲的用戶瀏覽記錄表主要包括用戶ID、所屬企業(yè)ID、商品ID、商品名稱、瀏覽開始時間、瀏覽結束時間等屬性。
(4)用戶購買記錄表:平臺中存儲的用戶購買記錄表主要包括用戶ID、所屬企業(yè)ID、商品ID、商品名稱、商品數(shù)量、成交單價、成交總額、成交時間、運費、折扣等屬性。
交易系統(tǒng)數(shù)據(jù)導入大數(shù)據(jù)分析平臺過程中,需對導入的數(shù)據(jù)進行數(shù)據(jù)清洗,剔除或修改錯誤的字符、編碼,修復格式錯誤、數(shù)據(jù)不完整等。同時,需在平臺中構建新的數(shù)據(jù)分析計算模型。導入數(shù)據(jù)見表4。
表4 導入數(shù)據(jù)示例
注:商品名稱中“*”“**”為商標。
采用Word-Count方法對偏好矩陣進行初始化。根據(jù)用戶對商品的瀏覽、訪問、購買頻次等,對用戶-商品矩陣進行初始化,根據(jù)企業(yè)對類別的購買頻次等,對企業(yè)-類別矩陣進行初始化。初始化示例見表5、表6。
表5 用戶-商品評分矩陣示例
表6 企業(yè)-類別評分矩陣示例
偏好矩陣的存儲可通過數(shù)據(jù)字典的方式保存,其中key存儲用戶-商品或企業(yè)-類別,value為對應的偏好評分。由于用戶對商品、企業(yè)對類別的偏好差異性,評分矩陣數(shù)值差異較大,為了防止對推薦產(chǎn)生的偏差、推薦結果過于收斂等情況的出現(xiàn),算法計算過程中對評分進行歸一化處理。
算法實踐過程中,需建立相應的整合表,用來保存用戶ID-企業(yè)ID、商品ID-類別ID、商品ID-商品名稱、類別ID-類別名稱等不同映射,從而使得計算和推薦的返回結果更加直觀。
通過電商系統(tǒng)獲得訪問用戶ID,檢索得到用戶所在企業(yè)ID,以及相應的偏好矩陣等。讀取偏好矩陣皮爾遜相關系數(shù)進行運算,生成偏好相似度矩陣。根據(jù)用戶所在企業(yè)相似度推薦商品類別,再根據(jù)商品類別推薦商品。需要注意的是,類別當中不需要排除已經(jīng)瀏覽(購買)過的類別,而商品中需要去除掉已經(jīng)瀏覽(購買)過的商品,防止重復推薦。
與傳統(tǒng)的協(xié)同過濾算法、KNN算法相比,雙矩陣協(xié)同過濾算法在準確率、召回率、覆蓋率和新穎度[21]等方面具有明顯優(yōu)勢。以某鐵路電商平臺中相關數(shù)據(jù)為基礎,過濾掉沒有購買記錄的商品以及沒有企業(yè)信息的用戶,使用數(shù)據(jù)的80%作為訓練集,20%作為測試集進行測試,并分別就準確率、召回率、覆蓋率和新穎度進行對比。
4.4.1 準確率
準確率是推薦算法當中的最能體現(xiàn)算法性能的指標,計算公式為
( 7 )
式中:Lu為用戶u喜歡的商品序列;Bu為推薦返回的商品序列。
同理,整體評分為
( 8 )
對于準確率的評價,采用推薦序列長度為1、5、10的三種推薦序列,對比了三種算法的準確率。對比結果如圖5所示。
圖5 準確率測試
通過結果統(tǒng)計圖可知,雙矩陣協(xié)同過濾在整體準確率上遠高于協(xié)同過濾或KNN。為進一步對比對于新用戶推薦的效果,在測試集中,選取用戶活躍程度較低的用戶進行測試。測試結果如圖6所示。
圖6 不活躍用戶準確率測試
由圖6可見,對于無購買瀏覽行為的用戶,協(xié)同過濾或KNN很難對其進行推薦,TOP1準確率不足10%,TOP10準確率幾乎接近0%。但雙矩陣協(xié)調(diào)過濾算法,利用企業(yè)的特性,對于不活躍用戶TOP1準確率約為38.8%,TOP10準確率雖有所下降,但仍可大于10%,超過了普通的協(xié)同過濾算法。
4.4.2 召回率
與準確率相對的測試指標為召回率,召回率指在推薦列表中能推薦出多少用戶喜歡的商品,計算方法為
( 9 )
與準確率相同,Lu為用戶u喜歡的商品序列,Bu為推薦返回的商品序列。同樣可計算整體召回率結果為
(10)
對三種算法的測試結果如圖7所示。
圖7 召回率測試
如圖7可見,雙矩陣協(xié)同過濾算法與另外兩種算法的召回率指標并無明顯差異。說明,雙矩陣協(xié)同過濾算法在提升準確率的同時,并不會損失召回率的性能。
4.4.3 覆蓋率
覆蓋率指的推薦算法中推薦的所有商品在全部商品當中的比例,主要考慮到冷門商品的推薦。覆蓋率的計算公式為
(11)
式中:C為覆蓋率;n為商品種類;Lu為對用戶u的推薦列表。
測試結果如圖8所示。
圖8 覆蓋率測試
由于雙矩陣協(xié)同過濾算法加入了商品類別的計算,所以對于分類當中的冷門商品同樣有概率出現(xiàn)在用戶的推薦列表中??梢妼τ贙NN與協(xié)同過濾算法覆蓋率均不足60%,也就是有40%以上商品沒有出現(xiàn)在推薦列表中。但雙矩陣協(xié)同過濾算法將覆蓋率提升至79.2%,相比于另外兩種算法,優(yōu)勢明顯。
4.4.4 新穎度
新穎商品是指用戶沒有采購或瀏覽過的商品。通過推薦用戶可能喜歡的新分類中的商品,達到提升商品新穎度的目的。新穎度指標計算方法為
(12)
式中:Bu為算法為用戶u推薦的商品集合;Ku為用戶喜歡的商品分類集合;Lu為用戶u喜歡的商品集合。
同理,整體新穎度評分為
(13)
按式(13)對三種算法進行測試,結果如圖9所示。
圖9 新穎度測試
通過圖9可以看出,對于傳統(tǒng)協(xié)同過濾、KNN等算法,新穎度較低只有不到20%,而雙矩陣協(xié)同過濾,由于對于不活躍用戶同樣可推薦出用戶喜好類型的商品,所以對于整體新穎度相比另外兩種算法提升十分明顯。
雙矩陣協(xié)同過濾算法能夠有效地解決電商平臺冷啟動、數(shù)據(jù)量少等問題。現(xiàn)有的各種電商平臺都是基于用戶-物品的關系進行推薦,無法體現(xiàn)B2B電商平臺的企業(yè)特征。雙偏好矩陣協(xié)同過濾算法針對B2B電商平臺的特點,在某一企業(yè)可能存在多個用戶的情況下,研究電商個性化推薦系統(tǒng)的構建,該推薦系統(tǒng)既保證推薦了企業(yè)需要的商品,又加入了用戶個人的偏好。此外,對于點擊量較小且與其他用戶關聯(lián)較少的用戶,因為相似企業(yè)間有共同偏好存在,也可以推薦出對應類別,從而加強對長尾數(shù)據(jù)的適應性。同時,由于存在企業(yè)-類別偏好屬性,對于新用戶可直接進行推薦。對于新添加的商品,雖然沒有用戶對應的打分以及行為可獲得,但仍可以使用企業(yè)-類別矩陣進行推薦。
在電商平臺推薦系統(tǒng)上分別對協(xié)同過濾算法、KNN算法、雙矩陣協(xié)同過濾算法,在準確率、召回率、覆蓋率及新穎度4個推薦算法常用測試指標進行對比測試。雙矩陣協(xié)同過濾算法相比于其他算法在準確率方便有了很大提升的同時,并沒有降低召回率。此外對于覆蓋率、新穎度都有了質(zhì)的提升,對于推薦算法整體性能與用戶體驗都有較大的改進。在時間上,我們在單機單核為2.9 GHz的電腦上執(zhí)行,在數(shù)據(jù)量為56萬條的情況下,計算時間約為0.4 ms。
在算法實踐的過程中,如果能將商品類別的劃分更明確、更合理,則用戶體驗可進一步得到提升。在后續(xù)的其他模塊中,隨著數(shù)據(jù)量的增多,機器學習、深度學習相關的算法將更有助于提升計算速度。利用深度學習的算法,能夠?qū)崿F(xiàn)準確預測用戶想法,做到個性化、智能化。