李宏基
同濟(jì)大學(xué)軟件學(xué)院,上海 201804
物流企業(yè)用戶對物流服務(wù)平臺有著不同的功能需求,然而現(xiàn)有的物流管理平臺往往對用戶提供同樣的服務(wù)組合方案,用戶的需求往往混雜在一些他并不關(guān)切的服務(wù)中。本文設(shè)計(jì)物流服務(wù)平臺中的推薦系統(tǒng),該統(tǒng)采用基于用戶聚類的協(xié)同過濾推薦技術(shù),根據(jù)用戶在瀏覽、試用物流服務(wù)過程中所收集的物流服務(wù)評分,將評分相似的用戶聚類,在用戶目標(biāo)所在的聚類中查找其最近鄰居并根據(jù)鄰居用戶的評分產(chǎn)生推薦,使得物流服務(wù)平臺能為不同的用戶推薦符合其自身需求的物流服務(wù)組合方案。
協(xié)同過濾推薦是目前研究最多、應(yīng)用最成功的推薦技術(shù)。協(xié)同過濾推薦技術(shù)的優(yōu)點(diǎn)是能為用戶發(fā)現(xiàn)新的感興趣的信息,同時(shí)對推薦資源沒有特殊的要求。但基于用戶的協(xié)同過濾推薦需要在整個(gè)用戶空間上搜索目標(biāo)用戶的最近鄰居,隨著物流服務(wù)平臺的系統(tǒng)規(guī)模擴(kuò)大,用戶數(shù)量的不斷增多,在整個(gè)用戶空間上搜索目標(biāo)用戶的最近鄰居將非常耗時(shí),因此,極大影響了推薦系統(tǒng)的實(shí)時(shí)性[1]。
為了提高推薦系統(tǒng)的實(shí)時(shí)響應(yīng)速度,縮小目標(biāo)用戶最近鄰居的搜索范圍,研究者提出了各種不同的推薦系統(tǒng)算法?;谟脩艟垲惖膮f(xié)同過濾技術(shù)[2]是通過用戶評分的相似性對用戶聚類,然后根據(jù)聚類中的項(xiàng)目評價(jià)生成對應(yīng)的聚類中心,最后根據(jù)已有的用戶聚類尋找目標(biāo)用戶最近鄰居并產(chǎn)生推薦的方法。和傳統(tǒng)基于用戶的協(xié)同過濾算法不同的是,基于用戶聚類的協(xié)同過濾技術(shù)首先將對物流服務(wù)評分相似的用戶聚類,在目標(biāo)用戶所在的用戶聚類中查找最近鄰居。由于相似性用戶所在的聚類相對于整個(gè)用戶空間而言,其搜索范圍要小得多,因此能有效提高推薦系統(tǒng)的實(shí)時(shí)響應(yīng)速度,提高物流服務(wù)平臺的運(yùn)作效率。
推薦系統(tǒng)框架主要分為3個(gè)部分:信息輸入,數(shù)據(jù)管理和推薦生成。首先接受用戶在物流服務(wù)平臺頁面的瀏覽請求,服務(wù)器記錄下用戶的訪問記錄,包括用戶訪問的頁面、時(shí)間、用戶和物流服務(wù)信息等等。然后對Web日志進(jìn)行預(yù)處理,將其加載到元數(shù)據(jù)庫中成為規(guī)整數(shù)據(jù)。根據(jù)推薦系統(tǒng)所調(diào)用的推薦算法可以提取所需的數(shù)據(jù),如用戶評分?jǐn)?shù)據(jù)、用戶信息、服務(wù)信息等進(jìn)行推薦處理。物流服務(wù)平臺向推薦系統(tǒng)提供當(dāng)前用戶的信息,并請求產(chǎn)生推薦服務(wù)。推薦系統(tǒng)接受信息和請求后調(diào)用內(nèi)部推薦算法來產(chǎn)生推薦服務(wù)列表,并通過物流服務(wù)平臺的交互界面將組合后的物流服務(wù)推薦給用戶。推薦系統(tǒng)工作流程如下:
1)聚類分析:根據(jù)用戶對物流服務(wù)評價(jià)的相似度通過K-Means聚類算法[3]對用戶進(jìn)行聚類。聚類過程首先根據(jù)修正的余弦相似性度量方法計(jì)算用戶間的相似性,然后利用K-Means算法選取K個(gè)用戶初始聚類中心后將相似度高于某一閾值的用戶聚為一類。
2)查找最近鄰居:通過聚類分析得到該用戶所在的聚類,依次計(jì)算目標(biāo)用戶與聚類中其他用戶的相似度,將那些與目標(biāo)用戶之間相似系數(shù)超過設(shè)定閾值的用戶作為他的最近鄰居,形成最近鄰居集。
3)預(yù)測服務(wù)評分:得到用戶的最近鄰居集后,根據(jù)目標(biāo)用戶與鄰居用戶對已評價(jià)過的物流服務(wù)的評分來預(yù)測計(jì)算出目標(biāo)用戶沒有評價(jià)物流服務(wù)的評分。假設(shè)用戶n對項(xiàng)目I的預(yù)測評分為Xn,i,則預(yù)測評分公式[4]可表示為:
4)生成推薦結(jié)果:推薦系統(tǒng)調(diào)用評分?jǐn)?shù)據(jù)庫和用戶數(shù)據(jù)庫信息,根據(jù)用戶對物流服務(wù)評分相似度大小將用戶聚成K類,然后目標(biāo)用戶所在的用戶類別生成最近鄰居,最后通過對鄰居用戶的物流服務(wù)評分進(jìn)行加權(quán)平均來預(yù)測未被目標(biāo)用戶評價(jià)過的服務(wù)評分值從而選擇評分值最高的前N個(gè)服務(wù)組成推薦列表。推薦系統(tǒng)接收物流服務(wù)平臺發(fā)出的推薦請求以及用戶信息,經(jīng)過推薦處理后將生成的服務(wù)評分推薦列表發(fā)送給平臺交互界面,由物流服務(wù)平臺將組合后的物流服務(wù)方案推薦給用戶,通過服務(wù)功能可配置性為其訂制符合其自身需求的物流服務(wù)方案。
本文中的推薦系統(tǒng)在計(jì)算用戶對物流服務(wù)評分相似性的基礎(chǔ)上,對用戶進(jìn)行聚類,在用戶目標(biāo)所在的聚類中查找其最近鄰居并根據(jù)鄰居用戶的評分產(chǎn)生推薦。相對于整個(gè)用戶空間而言,相似性用戶所在聚類的搜索范圍要小得多,因此能有效提高推薦系統(tǒng)的實(shí)時(shí)響應(yīng)速度,從而提高物流服務(wù)平臺的運(yùn)作效率。
[1]王輝,高利軍,王聽忠.個(gè)性化服務(wù)中基于用戶聚類的協(xié)同過濾推薦[J].計(jì)算機(jī)應(yīng)用,2007,27(5):1001-9081.
[2]潘宇,林鴻飛,楊志豪.基于用戶聚類的電子商務(wù)推薦系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(4):25-26.
[3]毛國君,段立娟,王實(shí),等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005.
[4]何安.協(xié)同過濾技術(shù)在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D].浙江:浙江大學(xué)計(jì)算機(jī)學(xué)院,2007:15-16.