梁玉英,向志華
廣東理工學(xué)院 信息技術(shù)學(xué)院,廣東 肇慶 526100
推薦系統(tǒng)可以認為是一種程序,它試圖通過基于項目、用戶以及項目與用戶之間交互的相關(guān)信息來預(yù)測用戶對項目的興趣,從而向特定用戶(個人或企業(yè))推薦最合適的項目(產(chǎn)品或服務(wù))[1]。以推薦系統(tǒng)為代表的電子服務(wù)個性化技術(shù)在過去的20年中得到了廣泛的關(guān)注,但是這些推薦方法都存在不足,如CF具有稀疏性、可伸縮性和冷啟動問題,而CB具有過度專業(yè)化的推薦[2-3]。于是,研究人員設(shè)計了新的推薦方法,如基于社會網(wǎng)絡(luò)的推薦系統(tǒng)、模糊推薦系統(tǒng)等。事實上,推薦系統(tǒng)管理本質(zhì)上還要歸結(jié)于推薦系統(tǒng)的評估問題[4-5]。
由于人類社會活動的復(fù)雜性和自然環(huán)境的不確定性,如何處理不確定性信息成為解決多屬性決策問題的關(guān)鍵。Zadeh[6]提出模糊集來刻畫不確定信息。Atanassov[7]定義了直覺模糊集,之后學(xué)者們給出了不同類型的模糊集拓展形式[8-10]。此外,學(xué)者們引入了語言術(shù)語集來刻畫定性評價數(shù)據(jù)。文獻[11]提出以猶豫模糊語言元為基本元素的猶豫模糊語言術(shù)語集(hesitant fuzzy linguistic term set,HFLTS)。
為了對多個評價數(shù)據(jù)信息單元進行有效融合,文獻[12]提出正態(tài)隨機猶豫模糊語言Hamy平均算子。文獻[13]將有序加權(quán)距離算子推廣到HFLTS。文獻[14]設(shè)計了猶豫模糊語言阿基米德信息集成算子。文獻[15]提出了猶豫模糊語言混合平均(hesitant fuzzy linguistic hybrid average,HFLHA)算子和猶豫模糊語言加權(quán)平均(hesitant fuzzy linguistic weighted average,HFLWA)算子。文獻[16]提出猶豫模糊語言Heronian均值算子,可以考慮聚合參數(shù)之間的相互關(guān)系。文獻[17]構(gòu)建了基于范數(shù)的猶豫模糊愛因斯坦信息集成算子。文獻[18]建立了猶豫模糊語言Maclaurin對稱平均算子。文獻[19]構(gòu)建了基于廣義猶豫正態(tài)模糊有序加權(quán)平均算子的多屬性群決策模型。文獻[20]研究了用HFLTS表示輸入數(shù)據(jù)的情況,并引入一些準調(diào)和平均算子。
雖然現(xiàn)有研究成果中已經(jīng)提出了一些信息集成方法,但是面向定性評價信息且服從現(xiàn)實生活正態(tài)規(guī)律的信息表達均未考慮。因此,為了研究適用范圍更廣且符合決策者評價偏好的語言表達模型,本文首先給出了猶豫正態(tài)語言元(hesitant normal linguistic element,HNLE)的概念,然后給出了HNLE之間的運算法則和大小比較方法,進而設(shè)計了猶豫正態(tài)語言有序加權(quán)平均(hesitant normal linguistic ordered weighted average,HNLOWA)算子用于信息集成,最后構(gòu)建了基于HNLOWA算子的決策模型,并通過推薦系統(tǒng)產(chǎn)品評估進行驗證分析。
語義術(shù)語集[21]可以表示為S={s0,s1,…,s2τ},其中的元素個數(shù)為奇數(shù),si表示語義變量,τ是正整數(shù),并且滿足:(1)若α≥β,則sα≥sβ;(2)對偶運算neg(sα)=s2τ-α。
為了拓展語言評價信息,文獻[21]給出了連續(xù)型語言術(shù)語集~={sα|s0≤sα≤s2ρ,α∈[0,2ρ]},ρ表示充分大實數(shù)。為了方便計算,引入下標函數(shù)~→[0,1],有I(si)=i/2τ,同時I(·)的逆函數(shù)表示為I-1(·):[0,1]→~,使得I-1(α)=s2τα。
定義1[10]假設(shè)A是一個模糊數(shù),非空集合為X,若其隸屬函數(shù)表示為,則稱A為正態(tài) 模 糊 數(shù)(normal fuzzy value,NFV),簡 記 為A=(a,σ)。所有NFV組成的集合記為Ω。
定義2假設(shè)(a,σ)∈Ω,非空集合為X,那么猶豫正態(tài)語言元(HNLE)表示為~=(a,σ);hA~,這里hA~={γA~|γA~∈hA~}是猶豫語言元,其隸屬函數(shù)為:
由定義2可知,HNLE將NFV和語言術(shù)語集進行了巧妙的結(jié)合,使得HNLE不僅能夠運用語言變量來描述決策信息,還能傳遞出語言決策信息的分布情況。為了便于后續(xù)計算,所有HNFV組成的集合記為~。
顯然,上述定義的HNFV之間的運算滿足交換律、結(jié)合律以及數(shù)乘運算等性質(zhì)。接下來,將介紹HNFV之間大小比較的方法。
這里,#h表示h中語言變量個數(shù)。
則稱HNLOWA為猶豫正態(tài)語言有序加權(quán)平均算子,簡記為HNLOWA算子,這里的表示為第j大的HNLE,其對應(yīng)的權(quán)重向量為w=(w1,w2,…,wn)T,且=1,wj∈[0,1],j=1,2,…,n。
并且使用HNLOWA算子融合得到的結(jié)果也是HNLE。
當(dāng)n=2時,因為
于是有
那么根據(jù)定義的基本運算可得
令n=k時,展開式(5)成立,即
那么當(dāng)n=k+1時,根據(jù)定義的基本運算可得
這就表明當(dāng)n=k+1時,展開式(5)仍然成立。于是,證明了對于所有的正整數(shù)n,式(5)均成立。
然后根據(jù)定義的基本運算,可以得到
(2)證明使用HNLOWA算子融合得到的結(jié)果(即式(4))也是HNLE,其主要需驗證對于所有的γ1∈h1,…,γn∈hn,可以得到還是語言變量,即證明包含在[0,1]區(qū)間內(nèi)。
根據(jù)HNLE的定義可知,γ1,γ2,…,γn∈S,那么對于所有的j=1,2,…,n,可得到0≤I(γ(j))≤1。于是當(dāng)λ>0時,有0≤(I(γ(j)))λ≤1。同 時,權(quán)重wj∈[0,1],j=1,2,…,n,因此
從而有
于是,借助于逆函數(shù)表示為I-1(·):[0,1]→可知是一個包含于連續(xù)語言術(shù)語集~中的語言變量。從而驗證了定理1成立。
(2)單調(diào)性:如果A~j≤B~j,j=1,2,…,n,那么
證明 置換不變性可由定義6直接得到,故省略。
又 因 為 γj≤γ′j,所 以(I(γ(j)))λ≤(I(γ′(j)))λ,因 此(1 -(I(γ(j)))λ)wj≥(1 -(I(γ′(j)))λ)wj,從而
于是有
所以
結(jié)合定義4和定義5易得:
(3)結(jié)合冪等性和單調(diào)性,易得有界性。
HNLOWA算子的一些常用特殊形式可以通過對其中的w=(w1,w2,…,wn)T和參數(shù)λ分別給定固定的數(shù)值而得到。
常見算子1如果w=(1/n,1/n,…,1/n)T,此時的HNLOWA算子會轉(zhuǎn)化為猶豫正態(tài)語言算術(shù)平均算子,具體表達式如下:
常見算子2當(dāng)λ=1時,可以得到猶豫正態(tài)語言有序加權(quán)算術(shù)平均(HNLOWAA)算子:
常見算子3當(dāng)參數(shù)λ無線逼近于0時,即λ→0,此時可以得到猶豫正態(tài)語言有序加權(quán)幾何平均(HNLOWGA)算子:
引理1[15]假設(shè)xj>0,λj≥0,j=1,2,…,n,并且=1,則有。當(dāng)且僅當(dāng)x1=x2=…=xn時,等號成立。
定理3假設(shè)A~j=(aj,σj);hj(j=1,2,…,n)∈,其對應(yīng)的權(quán)重向量為w=(w1,w2,…,wn)T,且=1,wj∈[0,1],j=1,2,…,n,那么
證明首先假設(shè)如下:
于是
由文獻[15]可知,對于任意的非負實數(shù)xj,λj,j=1,2,…,n,有如下不等式成立:
另一方面,
因此
定理3得證。
本文首先在猶豫正態(tài)語言信息環(huán)境下,運用構(gòu)建的HNLOWA算子設(shè)計新的多屬性決策方法,然后利用新的決策方法來幫助企業(yè)篩選推薦系統(tǒng)。
考慮猶豫正態(tài)模糊多屬性群決策問題,假設(shè)有m個備選方案組成了一個方案集Φ={φ1,φ2,…,φm},對每個方案進行評價時需要n個指標Ψ={ψ1,ψ2,…,ψn}作為評價標準,其權(quán)重向量為w=(w1,w2,…,wn)T,=1,wj≥0(j=1,2,…,n)??紤]到客觀世界大多存在正態(tài)分布的特征規(guī)律,因此決策者在評價備選方案的過程中,將運用猶豫正態(tài)語言元=(aij,σij);hij來表示備選方案φi在屬性ψj下的評價信息。于是,將決策者給出的方案集Φ={φ1,φ2,…,φm}在指標集合Ψ={ψ1,ψ2,…,ψn}下的評價信息收集在一起,可以得到一個猶豫正態(tài)語言決策矩陣
下面將給出運用提出的HNLOWA集成算子處理猶豫正態(tài)語言多屬性決策問題的詳細步驟。
步驟1量綱歸一化。
(1)若ψj屬于效益型,則令,其中
(2)若ψj屬于成本型,則令,其中
于是,根據(jù)以上的兩個量綱統(tǒng)一化處理方法,能夠得到標準化猶豫正態(tài)語言決策矩陣B=(Bij)m×n。
步驟2運用HNLOWA集成算子融合評價信息。
以轉(zhuǎn)化得到的標準化猶豫正態(tài)語言決策矩陣B=(Bij)m×n為信息基礎(chǔ),運用HNLOWA算子將備選方案φi(i=1,2,…,m)在所有屬性指標下的HNLE融合為一個綜合的HNLE Bi(i=1,2,…,m):
步驟3確定綜合HNLE的期望得分值和標準差得分值。
運用定義4分別計算出所有綜合HNLE Bi(i=1,2,…,m)對應(yīng)的期望得分值E(Bi)(i=1,2,…,m)和標準差得分值Δ(Bi)(i=1,2,…,m),具體計算方法如下:
步驟4選擇綜合性能最佳的備選方案。
基于計算出的期望得分值E(Bi)(i=1,2,…,m)和標準差得分值Δ(Bi)(i=1,2,…,m),根據(jù)定義5的HNLE優(yōu)劣排序準則對綜合HNLE Bi(i=1,2,…,m)進行大小排序,并獲得備選方案的優(yōu)劣排序,進而得到綜合性能最佳的備選方案。
眾所周知,在網(wǎng)上找到用戶所需的適當(dāng)信息并不是一項簡單的任務(wù),并隨著互聯(lián)網(wǎng)使用的日益普遍,這個問題更加突出。例如,訂閱上市公司列表的企業(yè)用戶會浪費大量時間閱讀、查看或刪除不相關(guān)的電子郵件和廣告。為了提高公司企業(yè)的信息訪問能力,其需要借助相關(guān)的工具來過濾網(wǎng)上的大量可用信息。推薦系統(tǒng)可以通過將信息傳遞給需要的企業(yè)或個人來提供信息服務(wù),通過信息的連續(xù)檢索提供個性化的幫助,為區(qū)分相關(guān)信息和無關(guān)信息提供便利。
某網(wǎng)絡(luò)購物小程序運營企業(yè)為了提升用戶的購物體驗和商品的精確推薦,準備采購一套商品推薦系統(tǒng)嵌入到網(wǎng)絡(luò)購物小程序中。該企業(yè)的采購部門通過前期調(diào)研和篩選,在市場中初步遴選出4套推薦系統(tǒng)產(chǎn)品{φ1,φ2,φ3,φ4}以供選擇購買。隨后,該企業(yè)管理部門聘請相關(guān)領(lǐng)域的專家工程師在3個評價標準下對上述4套推薦系統(tǒng)進行評估,即推薦系統(tǒng)的準確度ψ1、推薦系統(tǒng)的多樣性和覆蓋率ψ2、推薦系統(tǒng)的售后服務(wù)ψ3,這3個評價指標的權(quán)重向量為w=(0.25,0.40,0.35)T。鑒于推薦系統(tǒng)評價過程的復(fù)雜性,在專家對備選推薦系統(tǒng)進行評估時將運用猶豫正態(tài)語言元=(aij,σij);hij來表示推薦系統(tǒng)φi在屬性ψj下的評價信息,hij是由S={s0,s1,s2,s3,s4}中的若干語言術(shù)語組成的集合,從而構(gòu)造出猶豫正態(tài)語言決策矩陣。接下來將運用上一小節(jié)建立的基于HNLOWA集成算子的多屬性決策方法篩選出綜合性能最佳的推薦系統(tǒng)產(chǎn)品。
步驟1量綱歸一化處理。
備選的4套推薦系統(tǒng)產(chǎn)品分別是在推薦系統(tǒng)的準確度ψ1、推薦系統(tǒng)的多樣性和覆蓋率ψ2、推薦系統(tǒng)的售后服務(wù)ψ3這3個效益型指標下進行評估,因此運用歸一化方法(1)將猶豫正態(tài)語言決策矩陣轉(zhuǎn)化為標準化猶豫正態(tài)語言決策矩陣B=(Bij)4×3。
步驟2推薦系統(tǒng)產(chǎn)品綜合評價信息的融合。
以標準化猶豫正態(tài)語言決策矩陣B=(Bij)4×3和權(quán)重向量w=(0.25,0.40,0.35)T為基礎(chǔ),分別運用HNLOWAA算子和HNLOWGA算子將備選推薦系統(tǒng)產(chǎn)品φi在3個屬性指標下的評價信息進行綜合集成,得到每套推薦系統(tǒng)產(chǎn)品的綜合HNLE,結(jié)果如表1所示。
表1四套推薦系統(tǒng)產(chǎn)品的綜合HNLETable 1 Comprehensive HNLEs of four recommender system products
步驟3利用式(18)計算出4套推薦系統(tǒng)產(chǎn)品{φ1,φ2,φ3,φ4}對應(yīng)的綜合HNLE的期望得分值E(Bi)(i=1,2,3,4),結(jié)果如表2所示。由表2中的期望得分值結(jié)果發(fā)現(xiàn),運用HNLOWAA算子進行融合得到的綜合HNLE不低于運用HNLOWGA算子進行融合得到的綜合HNLE,這與定理3的結(jié)論相匹配。
表2運用兩種算子得到的期望得分值Table 2 Expected score values with two operators
步驟4按照表2中的期望得分值的大小對4套推薦系統(tǒng)產(chǎn)品{φ1,φ2,φ3,φ4}進行綜合性能的優(yōu)劣排序,結(jié)果如表3所示。
表3運用兩種算子得到的推薦系統(tǒng)產(chǎn)品綜合排序Table 3 Ranking order among recommender system products with two operators
根據(jù)表3的決策結(jié)果發(fā)現(xiàn),運用本文HNLOWA集成算子中的兩類特殊集成方法得到的綜合評價結(jié)果相同,即綜合性能最佳的推薦系統(tǒng)產(chǎn)品都是φ4,因此建議該企業(yè)采購?fù)扑]系統(tǒng)φ4。這也表明本文建立的基于HNLOWA集成算子的多屬性決策方法在處理決策問題過程中具有內(nèi)在一致性,具有較好的決策穩(wěn)定性。
為了驗證本文決策方法的有效性,下面將運用文獻[20]構(gòu)建的猶豫模糊語言決策模型處理上述問題,其在決策模型構(gòu)建過程中提出了一種猶豫模糊語言信息集成算子來對評價信息進行綜合集成。
首先,將原始猶豫正態(tài)語言決策矩陣轉(zhuǎn)化為如下的猶豫模糊語言決策矩陣K=(κij)4×3:
然后,由于評價過程中的3個評價指標均為效益型指標,猶豫模糊語言決策矩陣K=(κij)4×3不需要進行規(guī)范化處理。
進一步,運用文獻[20]中的猶豫模糊語言廣義加權(quán)平均算子(即文獻[20]中的定義5)將矩陣K=(κij)4×3中的每一行進行融合,從而得到4套推薦系統(tǒng)產(chǎn)品的綜合猶豫模糊語言元結(jié)果如下:
最后,運用文獻[20]中的定義2計算出每個猶豫模糊語言元的得分函數(shù)值:
于是4套推薦系統(tǒng)產(chǎn)品的綜合性能優(yōu)劣排序為φ4?φ3?φ1?φ2,因此建議該企業(yè)采購?fù)扑]系統(tǒng)φ4。
將上述決策結(jié)果與本文方法得到的決策結(jié)果進行對比,發(fā)現(xiàn)綜合性能最佳的推薦系統(tǒng)產(chǎn)品均為φ4,這也說明本文的決策方法是有效的。然而,4套推薦系統(tǒng)產(chǎn)品綜合性能排序稍有區(qū)別,主要不同點在于推薦系統(tǒng)產(chǎn)品φ1和φ2的排序不同。事實上,由于文獻[20]中的決策方法在進行決策者評價信息的綜合集成過程中,沒有運用現(xiàn)實復(fù)雜社會通常存在的正態(tài)分布現(xiàn)象,而僅僅是考慮猶豫模糊語言信息來表達復(fù)雜評價信息,這可能會造成復(fù)雜評價信息表達得不全面、不精確。同時,根據(jù)計算出的標準化猶豫正態(tài)語言決策矩陣B=(Bij)4×3中的數(shù)據(jù)信息,能夠發(fā)現(xiàn)推薦系統(tǒng)產(chǎn)品φ1對應(yīng)的HNLE基本上不高于推薦系統(tǒng)產(chǎn)品φ2對應(yīng)的HNLE,因此有φ2?φ1,這與本文決策方法的決策結(jié)果相一致,其體現(xiàn)了本文決策方法的可靠性。
本文針對實際問題的復(fù)雜性和決策者的決策傾向偏好,提出了猶豫正態(tài)語言元的概念來對決策者的評價信息進行刻畫,以提升決策信息的概括能力;然后,根據(jù)猶豫正態(tài)語言元的特征,設(shè)計了HNLOWA算子以實現(xiàn)多個HNLE的綜合集成,并分析了兩類特殊算子之間的關(guān)系;最后,建立了基于HNLOWA算子的多屬性決策方法,并將其應(yīng)用于推薦系統(tǒng)產(chǎn)品的評估過程中,同時進行了對比分析實驗來說明本文模型的有效性。本文建立的多屬性決策方法雖然能夠?qū)Κq豫正態(tài)語言信息進行有效集成,但是沒有深入探究參數(shù)λ的變化對最終決策結(jié)果的影響。因此,在今后的研究中,將進一步探究參數(shù)λ對HNLOWA算子的影響機制,并對參數(shù)λ進行魯棒性分析;同時,將基于專家提供的猶豫正態(tài)語言元,設(shè)計信息熵計算模型來計算評價指標的客觀權(quán)重,從而進一步提升多屬性決策方法的可靠性。