李 雪,李 芳
(上海理工大學 管理學院,上海 220000009933)
隨著互聯(lián)網(wǎng)領(lǐng)域的不斷發(fā)展,電子商務、P2P、網(wǎng)格計算、云計算等應用越來越廣泛?;ヂ?lián)網(wǎng)環(huán)境下其交易具有虛擬性,存在欺詐、支付安全等問題。解決這一問題的關(guān)鍵在于信任,傳統(tǒng)的信任機制是一種客觀信任關(guān)系,建立在對雙方身份認證的基礎(chǔ)上,比如PKI證書、訪問控制中的ACL等。使用傳統(tǒng)的信任機制已不能解決現(xiàn)有的問題,因此另一種主觀信任機制相應而生。它是基于人的一種認知現(xiàn)象,能對主體的特定行為特征做出評價,具有主觀性、模糊性和隨機性。國內(nèi)外學者對信任評估進行了大量研究,Beth將信任分為直接信任和間接信任,用概率測量實體信任度[1],但是忽略了信任的模糊性;Josang提出了基于主觀邏輯的信任模型,引入證據(jù)空間和觀念空間的概念來描述和度量信任關(guān)系[2-3],隨機性和模糊性沒能區(qū)分出來,因此也沒反應出信任的模糊性特點;唐文等人使用模糊集理論中的隸屬度概念,對信任管理問題進行了建模,給出可信類型定義機制和信任評價機制[4],隸屬度函數(shù)如何構(gòu)造才能反映信任的內(nèi)涵,另外將模糊數(shù)給定精確的數(shù)值后,它已經(jīng)不再具有模糊數(shù)的特性。李德毅院士提出的云模型是基于模糊數(shù)學和概率統(tǒng)計的定性定量互換模型,能夠反映事物或人類認知的模糊性和隨機性[5]?;谠颇P偷目尚叛芯磕軌驈浹a以上研究中的不足,實現(xiàn)語言值表述的定性概念與其定量數(shù)值描述間的不確定性轉(zhuǎn)換。
20世紀90年代初李德毅院士提出了云模型,它是基于模糊數(shù)學和概率統(tǒng)計的定性定量互換模型,能夠反映事物或人類認知的模糊性和隨機性,實現(xiàn)語言值表述的定性概念與其定量數(shù)值描述間的不確定性轉(zhuǎn)換[5-6]。
定義1:云和云滴,設(shè)U是一個用數(shù)值表示的定量論域,C是U上的定性概念,若定量值x∈U是定性概念C的一次隨機實現(xiàn),x對C的確定度μ(x)∈[0,1]是有穩(wěn)定傾向的隨機數(shù)μ:U→[0,1], ?x∈Ux→μ(x)則x在論域U上的分布稱為云,記為云C(x),每一個x稱為一個云滴。
定義2[7]:設(shè)U 是一個精確數(shù)值表示的定量論域,C(Ex,En,He )是U 上的定性概念。若定量值x∈U,且x 是定性概念C的一次隨機實現(xiàn),x服從以Ex為期望、En'2方差的正態(tài)分布,即x~N(Ex ,En'2),其中En'又服從以En為期望、He2為方差的正態(tài)分布,即En'~N(En,He2);定量值x對定性概念C的確定度為y=e,則x在論域U上的分布稱為正態(tài)云。
期望Ex,熵En和超熵He用來表示云的三個數(shù)字特征,它們反映了定性概念在整體上的定量特征。期望Ex在論域空間中最能夠代表這個定性概念的點。熵En是定性概念的不確定性度量,由概念的隨機性和模糊性共同決定,反應了云滴的離散程度。超熵He是熵的不確定性的度量,它反映代表定性概念值的樣本出現(xiàn)的隨機性,揭示了模糊性和隨機性的關(guān)聯(lián)。
學者采用了不同方法進行了基于云模型的可信研究,主要集中在云逆向生成算法的改進和相似度算法的改進以及評估方式的改進,本節(jié)將對所涉及的各方法進行介紹,并對各方法進行對比與評述。
云模型三個數(shù)字特征期望Ex,熵En和超熵He,它對信任度的評價會產(chǎn)生至關(guān)重要的影響,采用怎么的逆向云生成算法也是眾多學者研究的熱點。逆向云生成算法主要是通過參數(shù)估計的方式從數(shù)據(jù)樣本中得到數(shù)字特征的估計值,包括有確定度的逆向云生成算法和無確定度的逆向云生成算法。
有確定度的逆向云算法先后由李德毅、呂輝軍[8-9]提出,有確定度的逆向云算法存在明顯的不足:(1)計算熵En和超熵He時需要使用確定度值,而在實際應用中確定度沒有或者難以獲得,利用確定度的逆向生成算法缺乏實用性;(2)將確定度大于0.999的點刪除,沒有對云滴完全利用,在某一程度上來說其算法缺乏準確性。
無確定度的逆向云算法首先由劉常昱等人提出,此算法充分利用了云滴,并且不需要確定度也能計算云的數(shù)字特征,算法簡單,且容易推廣到高維云模型。具體算法如下:
輸入:N個云滴Xi;
輸出:這N個云滴表示的定性概念的期望值Ex,熵En和熵He。
算法1[10]:
理論上已經(jīng)證明S2=En2+He2,但在實際運算中可能會出現(xiàn)S2-En2<0的情況。陳昊[11]等人通過增大樣本方差在此算法上進行了改進。許昌林[12-14]等人提出了多步式逆向云生成算法來解決此問題,該方法采用隨機抽樣,有些數(shù)據(jù)進行了多次抽樣計算,并且推到高維云模型時,復雜性增加。吳濤[15]等人提出的基于四階絕對中心矩和樣本方差的逆向云生成法,但也不能保證每次生成的超熵He為實數(shù)。
信任具有主觀性、模糊性及隨機性,為了將信任更加直觀的表達,通常采用信任等級對主體信任描述??尚旁颇P驮u價方法采取了信任等級劃分方式,通過相似度計算確定各主體所屬的信任等級。相似度算法是判斷主體所屬信任等級的關(guān)鍵步驟,學者們分別從期望、距離、面積、余弦值、重心偏離、改進逆向云生成算法等角度出發(fā),給出了不同的相似度算法。
(1)基于期望的相似度算法。王守信[16]等人引入時效模型,選擇期望Ex較大且超熵He較小的主體進行交易;陳建鈞[17]等人計算出綜合期望Ex,與給定等級云的期望進行差值比較,從而確定該主體所屬的信任等級。廖良才[18]等人也采取加權(quán)法計算出主體的綜合期望Ex,熵En和超熵He,通過計算相對分散度確定主體的信任等級。
上述算法只采用單一的期望進行比較,或者三個數(shù)字特征中的兩個,沒有充分地利用云的三個數(shù)字特征,沒能充分反映信任的主觀性、模糊性和隨機性的特點。
(2)基于距離的相似度算法。一種是計算云滴的距離,一種是采用歐式距離來度量。張勇、蔡紹濱、肖子涵等人[19-21]認為云之間的相似性可以通過其數(shù)字特征產(chǎn)生特定數(shù)量的云滴,通過計算云滴之間的距離來計算其相似性。此算法存在以下不足:①只考慮了云滴的橫坐標,沒有考慮云滴的縱坐標;②生多少個云滴數(shù),才是一個合適的數(shù);③云滴是一個隨機數(shù),需要重復多次實驗取平均值才能減小誤差,增加了算法的復雜度。廖列法[22]、張景安[23]等人將云的三個數(shù)字特征組成特征向量C(Ex ,En,He),映射到三維空間,計算兩點之間的歐式距離,通過判斷距離的大小來確定主體的信任等級。此方法較為簡單,充分利用了云的三個數(shù)字特征。
(3)基于余弦值的相似度算法。將云的三個數(shù)字特征看成是一個向量,通過夾角余弦值計算相似度。該方法簡單,計算較為容易,但容易出現(xiàn)期望Ex遠大于熵En和超熵He時,其計算忽略了熵En和超熵He的作用,并且余弦值的差異性也不明顯,無法對主體信任度進行準確的判斷。出ECM算法,其思想是將云模型看成是滿足x~N(Ex ,En2)正態(tài)分布的曲線,通過面積之比計算相似度。龔艷冰[25]等人將云模型看成模糊數(shù),通過模糊數(shù)的面積來計算相似度。
通過面積計算相似度較為復雜,因為計算兩個云相交面積時要考慮其交點的位置,不同相交方式對應不同的面積算法,增加了算法的復雜度。
(5)基于重心偏離的相似度算法。所謂重心偏離度算法即通過樣本點計算得到的云重心與等級云的云重心進行比較,衡量云重心的變換來確定該主體所屬的信任等級。謝立軍、劉延華等人[26]通過計算加權(quán)偏離度通確定主體的信任等級。該方法沒有考慮到超熵He對相似度的影響,忽略了云的模糊性。
(6)基于改進正向云生成算法的相似度算法。黃海生、張仕斌、范濤等人[27-28]通過對正向云生成算法的改進,將原先算法中的期望值Ex,熵En分別換成某一等級信任云中的期望Exj和滿足Enj~N(Enj,He2j)正態(tài)分布的Enj(其中T( Ex,En,He)為屬性評價云,TCj(Exj,Enj,Hej)為某一等級信任云),得到不同信任等級云的相似度,最大相似度所對應的信任等級云則為該主體的信任等級。該算法目前運用較多,得到大多數(shù)學者的認可。
在主體信任研究中,主體擁有多個屬性,因此需要建立信任評價指標體系來收集樣本數(shù)據(jù)。每個屬性對主體的影響能力不同,需要給每個屬性賦予權(quán)重進行計算。信任評價中有不實評價,為了保證信任評價的真實性,張仕斌[28]等人引入了信任懲罰機制。另外信任具有時效性,隨著時間的增加,以前的信任評價結(jié)果對現(xiàn)在的信任結(jié)果影響越來越小,因此張仕斌等人[28]在研究主體信任時加入了時間衰減函數(shù)??偟膩碚f目前計算主體信任云有兩步,首先計算主體的信任屬性評價云,再將主體各屬性云合成主體綜合信任云。其中計算屬性評價云時加入時間衰減函數(shù),再給每一個屬性評價云賦予權(quán)重,生成加權(quán)屬性綜合云。
基于云模型的可信研究,能夠很好地體現(xiàn)出信任的主觀性、模糊性和隨機性特點。通過對逆向云生成算法的改進和相似度算法的改進,同時加入時間衰減函數(shù)和信任懲罰函數(shù),使得基于云模型的可信研究具有更高的時效性和可信性。但從以上的分析可知,可信云模型的研究還存在明顯的不足,仍處于初級研究階段,基于此,本文對未來可信云模型的研究提出以下幾點設(shè)想。
可信云模型方法多樣性研究?,F(xiàn)有研究主要集中在構(gòu)建主體信任評價體系,設(shè)立信任等級,通過相似度計算判斷主體的信任度。建立怎樣的評價體系才能科學、全面地反映主體的信任特征;設(shè)立怎樣的信任等級才具有客觀性、合理性;如何體現(xiàn)信任的時效性和可信性;相似度算法的局限性與不足,這些問題都限制了可信云模型的深入研究。
基于多維度的可信云模型研究?,F(xiàn)有的主體信任研究中,將主體的各個屬性看成是一維云模型,通過數(shù)學運算將其合并成綜合屬性云。從某一程度上來說,這種計算方式缺乏理論意義。每個主體是由不同的屬性組成,每個屬性反映了主體的不同特征,所以在研究主體信任度時,應將模型推廣到多維云模型上。
不同應用領(lǐng)域的可信云模型方法研究??尚旁颇P椭饕獞糜趶碗s網(wǎng)絡環(huán)境下主體信任的評估,存在同一種評價方法對不同信任主體的信任評估效果不同,或者同一主體采用不同評價方法其信任存在明顯差異。解決這一問題的關(guān)鍵在于,找到不同應用領(lǐng)域中最適合的可信云模型方法。主體可以是實體(如電子商務中交易雙方)也可以是虛體(如系統(tǒng)、軟件),針對不同的主體應有相應的方法。
云模型能夠?qū)崿F(xiàn)語言值表述的定性概念與其定量數(shù)值描述間的不確定性轉(zhuǎn)換,從其提出到現(xiàn)在已經(jīng)逐漸形成一個成熟的理論,其應用領(lǐng)域也越來越廣泛。本文通過分析比較逆向云生成算法、可信云模型評價方法和可信云模型評估方式的改進方法,總結(jié)出現(xiàn)有可信云模型研究主要集中于通過相似度算法判斷主體的信任等級,研究方法單一,提出了以后可信云模型發(fā)展方向??偠灾?,可信云模型研究處于初級階段,需要大量深入的研究。