亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的改進(jìn)型物聯(lián)網(wǎng)服務(wù)信任模型

        2022-05-23 07:25:06何超勛彭偉鋒李燕飛陳海彪
        關(guān)鍵詞:特征方法模型

        何超勛,彭偉鋒,李燕飛,陳海彪,2

        (1.廣東電網(wǎng)有限責(zé)任公司汕尾供電局 信息中心,廣東 汕尾 516600; 2.華南理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,廣州 天河 510641)

        0 引 言

        在物聯(lián)網(wǎng)(IOT)基礎(chǔ)設(shè)施中,數(shù)以十億計(jì)的電子設(shè)備連接到互聯(lián)網(wǎng),它們可以觀察或監(jiān)測(cè)現(xiàn)實(shí)世界中人類(lèi)生活的各個(gè)方面,以支持更普遍和智能的服務(wù)[1-3]?,F(xiàn)代物聯(lián)網(wǎng)生態(tài)系統(tǒng)包括物理設(shè)備和網(wǎng)絡(luò)組件之間的聯(lián)網(wǎng)以及它們之間的社交互動(dòng)。這本質(zhì)上是從信息物理系統(tǒng)(CPS)到社會(huì)物理信息系統(tǒng)(CPSS)的飛躍[4]。然而,由于人與對(duì)象之間的異構(gòu)交互,這提出了對(duì)風(fēng)險(xiǎn)、隱私、安全在系統(tǒng)和社會(huì)層面上的新關(guān)注。未來(lái)物聯(lián)網(wǎng)服務(wù)的目標(biāo)是在沒(méi)有人為干預(yù)的情況下自主決策,所以信任被認(rèn)為是處理數(shù)據(jù)以及滿足服務(wù)、業(yè)務(wù)和客戶需求的關(guān)鍵。因此,ITU-T在發(fā)布了第一條建議之后,基于通信組的信任活動(dòng),一直在制定相關(guān)的信任提供標(biāo)準(zhǔn)[5-7]。但這些方案都存在著一些缺點(diǎn):如缺乏關(guān)于通用框架細(xì)節(jié)的信息,方案在應(yīng)用領(lǐng)域和目標(biāo)領(lǐng)域都缺乏通用性等。

        為了彌補(bǔ)這些不足,本文在文獻(xiàn)[6]的基礎(chǔ)上進(jìn)行了改進(jìn),對(duì)結(jié)構(gòu)設(shè)計(jì)模型、特征提取方法和智能算法等方面的擴(kuò)展,在不需要人為干預(yù)的情況下分析特征并自動(dòng)評(píng)估信任值。該方案的架構(gòu)主要是基于一個(gè)真實(shí)數(shù)據(jù)集的多個(gè)特征,提出了一個(gè)信任評(píng)估方案。同時(shí)在該方案中,為了使方案更加有效和健壯,在方案中還結(jié)合了機(jī)器學(xué)習(xí)相關(guān)知識(shí)。

        本文的主要的創(chuàng)新點(diǎn)是:①提出了一個(gè)完整的信任框架模型,該模型規(guī)定了從原始數(shù)據(jù)到最終信任值之間的信任關(guān)系;②提供了一種評(píng)估數(shù)據(jù)和評(píng)估每個(gè)信任特征的分析方法;③提出了一種聚類(lèi)算法來(lái)標(biāo)記提取的信任特征;④提出了一種基于多類(lèi)分類(lèi)算法的智能模型,結(jié)合測(cè)量的信任度量建立信任評(píng)估模型;⑤在仿真環(huán)境中對(duì)評(píng)估結(jié)果的有效性進(jìn)行了評(píng)估。

        1 通用信任管理框架

        信任影響了物聯(lián)網(wǎng)生態(tài)系統(tǒng)中一個(gè)對(duì)象與另一個(gè)對(duì)象進(jìn)行交易的決策,在該系統(tǒng)中,所有參與對(duì)象必須基于信任做出決策,以便向其他對(duì)象提供/接收服務(wù)。然而,在物聯(lián)網(wǎng)中建立信任要困難得多,因?yàn)闄C(jī)器對(duì)象無(wú)法產(chǎn)生對(duì)周?chē)渌麑?duì)象的感知。此外,很難精確地量化對(duì)象的確切可信賴度值。因此,必須建立一個(gè)通用框架,定義信任管理過(guò)程的方案,同時(shí)考慮到信任特征的多樣性,從而賦予對(duì)象選擇最佳和實(shí)際措施的靈活性。為了澄清信任的模糊性和定義,所以在網(wǎng)絡(luò)世界的背景下使用了以下定義[8]:

        定義1 信任:它是受托人的一種定性或定量的財(cái)產(chǎn),由委托人以主觀或客觀的方式,在特定的背景下,在特定的時(shí)間段內(nèi),對(duì)給定的任務(wù),作為一種可測(cè)量的信念進(jìn)行評(píng)估。

        定義2 信任模型:它包括3個(gè)方面:知識(shí)、經(jīng)驗(yàn)和聲譽(yù)。每個(gè)信任度量(trust metrics,TM)可以表示為包含多個(gè)信任屬性(trust attributes,TAs)的集合。每個(gè)TA代表受托人的可信特征。

        在信任模型中,信任的獲取、評(píng)估和表示的相關(guān)過(guò)程,如圖1所示。

        圖1 通用信任模型

        1.1 知識(shí)信任度量

        知識(shí)的信任度量涵蓋了直接信任評(píng)估的所有方面,在交互之前提供對(duì)受托人的感知。所以,必須向委托人提供多個(gè)屬性的多組相關(guān)數(shù)據(jù),供其評(píng)估。如果一個(gè)數(shù)據(jù)特征可以用定量測(cè)量來(lái)表示,那么結(jié)果就是一定范圍內(nèi)的數(shù)值。整個(gè)知識(shí)的構(gòu)成如圖2所示。

        圖2 知識(shí)構(gòu)成

        圖2中TAs的關(guān)系定義了委托人和受托人之間的相互關(guān)系。如果兩個(gè)對(duì)象之間關(guān)系是非常好的,那么可以期望它們之間有更高的可信度。另外,圖2中可信度下的合作表示從受托人到委托人的社會(huì)協(xié)作水平。協(xié)作性越高,意味著物聯(lián)網(wǎng)生態(tài)系統(tǒng)中的信任水平越高。此外,在物聯(lián)網(wǎng)生態(tài)系統(tǒng)中,服務(wù)的供應(yīng)是基于其社會(huì)關(guān)系,而不完全依賴于底層系統(tǒng)級(jí)信息。因此,識(shí)別TAs是至關(guān)重要的,它決定了協(xié)作對(duì)象的社會(huì)鄰近性。

        1.2 經(jīng)驗(yàn)和聲譽(yù)信任度量

        在通過(guò)知識(shí)TM獲得足夠的受托人證據(jù)后,委托人可以基于已經(jīng)獲得的感知與選定的受托人發(fā)起合作。然而,這些互動(dòng)的結(jié)果可能不同于感知,因此,記錄每個(gè)個(gè)體的經(jīng)驗(yàn),以便在未來(lái)的互動(dòng)中使用是至關(guān)重要的。通過(guò)在相應(yīng)的上下文、任務(wù)和時(shí)間中積累這些經(jīng)驗(yàn),與知識(shí)TM相比,委托人可以建立更多的智能。

        為進(jìn)一步提高對(duì)委托人的認(rèn)識(shí),其他對(duì)象可應(yīng)委托人的要求,分享其使用受托人的經(jīng)驗(yàn),在此將其認(rèn)定為聲譽(yù)或受托人的全局觀點(diǎn)。

        總而言之,經(jīng)驗(yàn)TM是個(gè)人觀察,只考慮了委托人與受托人之間的互動(dòng),而聲譽(yù)TM則反映了受托人的全局觀點(diǎn)。然而,知識(shí)TM是經(jīng)驗(yàn)和聲譽(yù)的基石,因此本研究的重點(diǎn)是基于ML技術(shù)產(chǎn)生知識(shí)TM的量化結(jié)果。

        2 計(jì)算模型

        盡管物聯(lián)網(wǎng)環(huán)境產(chǎn)生了大量數(shù)據(jù),但有多少數(shù)據(jù)可以直接用于可信的評(píng)估過(guò)程還是值得懷疑的。因此,通過(guò)掃描社交和系統(tǒng)級(jí)交互日志來(lái)提取信任特征并將其存儲(chǔ)在數(shù)據(jù)存儲(chǔ)庫(kù)(DR)中以供進(jìn)一步分析是至關(guān)重要的。因此,本文提出了一個(gè)能夠提取基本特征的數(shù)值模型。

        2.1 同地關(guān)系(CLR)

        物聯(lián)網(wǎng)生態(tài)系統(tǒng)允許用戶與附近的設(shè)備共享他們的資源、想法、情況和感興趣的服務(wù)。在這種情況下,如果委托人和受托人都很接近并且已經(jīng)在平臺(tái)中訂閱了DR,則委托人可以方便地從所選的受托人處獲取所需的信息,與遠(yuǎn)離場(chǎng)景的其他對(duì)象相比,所選的受托人在物理位置上是可信的。然而,在物聯(lián)網(wǎng)模型中,對(duì)象總是與其所有者相關(guān)(owner object relationship,OOR),因此OOR的靜態(tài)或動(dòng)態(tài)性質(zhì)總是影響CLR[9]。為了避免對(duì)象離開(kāi)物理位置,考慮基于與委托人的距離(如,基于GPS數(shù)據(jù))和在此決策邊界內(nèi)花費(fèi)的時(shí)間的決策邊界。然后,在該距離邊界內(nèi)且超過(guò)該區(qū)域內(nèi)的最小時(shí)間閾值的對(duì)象被選為受信者的潛在候選對(duì)象。一旦候選被過(guò)濾,它們與信任者的CL關(guān)系可以計(jì)算如下

        (1)

        2.2 合作關(guān)系(CWR)

        在公共物聯(lián)網(wǎng)應(yīng)用中協(xié)作的對(duì)象可以被描述為CWR。在這種情況下,更多的焦點(diǎn)將放在特定服務(wù)領(lǐng)域的工作關(guān)系上,而不是它們的物理鄰近性上。為了將CWR作為一個(gè)數(shù)值來(lái)衡量,這里比較了信任方和受信方之間的組播交互,計(jì)算如式(2)

        (2)

        2.3 合作性、頻率和持續(xù)時(shí)間(CFD)

        在協(xié)作環(huán)境中,每個(gè)對(duì)象都必須履行其承諾,以提高整個(gè)服務(wù)提供過(guò)程的結(jié)果水平。例如,考慮一個(gè)惡意代理,該代理為特定服務(wù)提供假評(píng)級(jí)。在這種情況下,很明顯,該代理故意試圖操縱服務(wù)信息的真實(shí)性,而無(wú)意使用該信息。因此,合作性TA對(duì)于保持上述內(nèi)容的穩(wěn)定性,從而根據(jù)委托人的要求為其提供可信的服務(wù)至關(guān)重要。此外,可以預(yù)期,對(duì)象之間的交互越頻繁、時(shí)間越長(zhǎng),各方的協(xié)作就越多。在此基礎(chǔ)上,推導(dǎo)了合作度、頻率和持續(xù)時(shí)間的數(shù)值模型。

        在此考慮一組相互作用,c1,c2,…,cn, 在委托人有利害關(guān)系的期間內(nèi),委托人i和受托人j之間的信任級(jí)別計(jì)算如下

        (3)

        式中:n是交互次數(shù),表示它們之間的交互頻率。對(duì)于m-th成功交互,cm是委托人和受托人之間交互的長(zhǎng)度,tm是受托人的總交互長(zhǎng)度。系數(shù)cm/tm評(píng)估受托人與委托人互動(dòng)的持續(xù)時(shí)間屬性,相對(duì)于受托人的總活動(dòng)時(shí)間。E(cm) 是二元熵函數(shù),用于測(cè)量交互作用或協(xié)作性中的平衡,其計(jì)算公式如式(4)所示[10]

        E(cm)=-plogp-(1-p)log(1-p)

        (4)

        其中,p是委托人和受托人之間交互作用的分?jǐn)?shù)。E(cm) 遵循文獻(xiàn)[11]中所述的二元分布。很明顯,只有當(dāng)p=0.5為各方貢獻(xiàn)的50%時(shí),才能達(dá)到最大熵(即E(cm)=1)。

        2.4 獎(jiǎng)勵(lì)制度(RS)

        任何服務(wù)提供系統(tǒng)的重要組成部分都需要有獎(jiǎng)懲機(jī)制或反饋模型,以評(píng)估委托人和受托人之間的歷史服務(wù)體驗(yàn)。將社會(huì)關(guān)系保持在最大可信水平總是至關(guān)重要的,因此使用式(5)中所示的指數(shù)降級(jí)公式來(lái)實(shí)現(xiàn)這一目的

        (5)

        這里,C是在t期間發(fā)生的交互的總數(shù),Cp是不成功或可疑的交互的總數(shù)。為了更嚴(yán)厲地懲罰不當(dāng)行為,與標(biāo)準(zhǔn)指數(shù)分布相比,分布的斜率增大。因此,惡意交互次數(shù)越多,獎(jiǎng)勵(lì)值越低。

        2.5 相互性和中心性(MC)

        在物聯(lián)網(wǎng)生態(tài)系統(tǒng)中,服務(wù)發(fā)現(xiàn)和提供很大程度上取決于參與對(duì)象之間的社會(huì)關(guān)系。在這方面,相互性和中心性TAs定義了社會(huì)世界中受托人相對(duì)于委托人的位置。另一方面,可以很直觀地假設(shè),更多的共同對(duì)象意味著他們的社會(huì)概況之間更高的相似性。但是,由于共同朋友的數(shù)量與每個(gè)對(duì)象的朋友數(shù)量成正比,因此不能將共同性單獨(dú)用作TA。也就是說(shuō),與最近加入網(wǎng)絡(luò)但可信度更高的對(duì)象相比,具有更多好友的對(duì)象會(huì)獲得額外的優(yōu)勢(shì)。為了避免這種情況,考慮了一個(gè)相對(duì)的共同關(guān)系的衡量標(biāo)準(zhǔn),與朋友總數(shù)相比。這本質(zhì)上是受托人的中心屬性,計(jì)算如式(6)

        (6)

        其中,Mij是i和j之間的一組普通朋友,Ni是受托人的一組朋友。

        2.6 利益共同體(CoI)

        (7)

        在使用式(1)~式(7)提取所有TAs后,下一步是計(jì)算受托人的最終信托價(jià)值。一種眾所周知的方法是通過(guò)一個(gè)線性方程將每個(gè)TA與權(quán)重因子結(jié)合起來(lái),如式(8)所示

        (8)

        然而,這種方法有許多缺點(diǎn),包括:①缺乏信息,在估計(jì)權(quán)重因子時(shí)有無(wú)限的可能性;②基于閾值的系統(tǒng)不適合檢測(cè)特定受托人的可信度;③無(wú)法確定在特定情況下哪個(gè)TA對(duì)信托的影響最大。因此,將在下一節(jié)中提出信任評(píng)估過(guò)程的新方法。

        3 基于機(jī)器學(xué)習(xí)的模型

        為了克服前面討論的TA組合的不足,在這里提出了一個(gè)基于ML的模型來(lái)分析之前提取的TA,并基于訓(xùn)練后的模型來(lái)預(yù)測(cè)預(yù)期交易的可信度。為了達(dá)到這一目的,首先使用無(wú)監(jiān)督學(xué)習(xí)算法來(lái)識(shí)別兩個(gè)不同的簇或標(biāo)簽,即可信和不可信。在有監(jiān)督方法上使用無(wú)監(jiān)督學(xué)習(xí)的主要原因是基于信任關(guān)系的標(biāo)記訓(xùn)練集不可用。

        然后利用支持向量機(jī)(SVM)等多類(lèi)分類(lèi)技術(shù)對(duì)ML模型進(jìn)行訓(xùn)練,以確定區(qū)分可信交互的最佳閾值水平。在這項(xiàng)研究中,主要目標(biāo)是以最大邊界分離和最小離群值來(lái)區(qū)分惡意交互和可信交互,而不是分類(lèi)本身。因此,不必使用其它算法,如隨機(jī)森林算法,特別是與本文中使用的樣本大小相比,使用低維數(shù)據(jù)集時(shí)。但是,根據(jù)數(shù)據(jù)集、維數(shù)、所需分類(lèi)數(shù)和樣本的噪聲水平,可以執(zhí)行模型比較,以找出針對(duì)每個(gè)單獨(dú)情況的最佳可能算法。像這樣訓(xùn)練有素的模型可以比線性加權(quán)方法[12,13]更有效地區(qū)分兩個(gè)或多個(gè)對(duì)象之間的傳入交互,并且在決策過(guò)程中更為有益。

        圖3 整個(gè)模型流程

        3.1 第一部分:聚類(lèi)和標(biāo)記

        在這一部分中,開(kāi)發(fā)了一個(gè)基于K-均值聚類(lèi)技術(shù)的算法,算法1中詳細(xì)說(shuō)明了該技術(shù),以便基于上述特征對(duì)交互進(jìn)行分組,從而將每個(gè)交互標(biāo)記為可信或不可信[14]。K-means算法需要定義兩個(gè)初始條件:簇?cái)?shù)(k)和每個(gè)相互作用被分配到的初始質(zhì)心位置(μ)。由于在算法開(kāi)始時(shí)無(wú)法找出這些值,因此隨機(jī)分配一系列簇大小的初始質(zhì)心位置,例如從k=1到k=5。 之后,重復(fù)步驟,直到聚類(lèi)點(diǎn)μ不再改變。然后,利用肘部法則求出K-平均代價(jià)函數(shù)J(c,μ) 的最小值,其中c是簇質(zhì)心的指數(shù),m是簇質(zhì)心的坐標(biāo),其維數(shù)為K[14]。

        算法1: 數(shù)據(jù)聚類(lèi)和標(biāo)記

        輸入: 征矩陣X

        輸出: 訓(xùn)練樣本的標(biāo)簽y

        fork=1 to 5do

        重復(fù)直到收斂: {

        fori=1 tomdo

        μk=分配給簇的點(diǎn)的均值位置k

        endfor

        }

        J(k)(c,μ)=argminkJ(c,μ)

        endfor

        優(yōu)化k←肘部法則←plotJ(k)vsk

        fori=1 tomdo

        ifc(i)接近(0,0)

        y(i)=0

        else

        y(i)=1

        endif

        注意,算法的初始輸入在[0,1]之間進(jìn)行了規(guī)范化,其中0表示不可信,1表示最可信。因此,在簇化步驟之后,將接近0的點(diǎn)標(biāo)記為不可信是合乎邏輯的,反之亦然。因此,在執(zhí)行完肘部法則后,靠近N維空間原點(diǎn)(即所有零點(diǎn))的簇被標(biāo)記為0或不可信,遠(yuǎn)離原點(diǎn)的簇被標(biāo)識(shí)為可信區(qū)域。為了同時(shí)檢查所有n個(gè)特征的影響,在應(yīng)用算法1之前,應(yīng)用基于奇異值分解(SVD)的主成分分析(PCA)算法將n個(gè)維度降為2個(gè)維度,以便可視化[15]。盡管可以用正則化擴(kuò)展算法1對(duì)n個(gè)特征,但可以觀察到PCA方法相對(duì)于正則化無(wú)監(jiān)督學(xué)習(xí)的計(jì)算復(fù)雜度更有效。

        PCA算法如算法2所示,其第一步是計(jì)算具有n×n維數(shù)的協(xié)方差矩陣∑。使用SVD函數(shù)計(jì)算兩個(gè)主分量U和V,每個(gè)主分量的維數(shù)與∑相同[15]。作為本研究的意圖,這里將主矩陣U的維數(shù)從5降為2,主矩陣U的維數(shù)設(shè)為2。最后,步驟4計(jì)算對(duì)應(yīng)于五維向量X的二維特征向量Z。

        算法2:PCA算法

        (1)計(jì)算點(diǎn)積矩陣: ∑=XTX

        (2)計(jì)算特征向量: [U,S,V]=SVD(XTX)

        (3)指定所需的維數(shù),d∶Ud=[u1,…,ud]

        3.2 第二部分:分類(lèi)模型

        在算法3中,使用了徑向基函數(shù)核(RBFK),這是因?yàn)榕c訓(xùn)練集樣本(m)相比,特征數(shù)(n)更少。此外,為了優(yōu)化計(jì)算資源,使用LIBSVM庫(kù)運(yùn)行RBFK核[14]。首先,對(duì)正則化參數(shù)和方差的多個(gè)實(shí)例運(yùn)行RBFK核,以便為算法3的步驟4~步驟7所示的學(xué)習(xí)算法找到最佳參數(shù)。作為一個(gè)例子,c和γ作為一個(gè)幾何級(jí)數(shù)而變化(例如,0.01,0.03,0.09…30)節(jié)省時(shí)間和計(jì)算資源。然后選取預(yù)測(cè)誤差最小的參數(shù)作為支持向量機(jī)模型的優(yōu)化因子。此外,必須提高最終ML模型的精度,并抑制由先前的聚類(lèi)算法產(chǎn)生的任何噪聲。因此,在算法3的訓(xùn)練過(guò)程中,使用正則化技術(shù)來(lái)避免這些問(wèn)題。

        然后,使用算法3對(duì)所有訓(xùn)練數(shù)據(jù)樣本進(jìn)行算法訓(xùn)練,并記錄模型參數(shù),根據(jù)輸入的特征統(tǒng)計(jì)量估計(jì)未來(lái)的信任值。在LIBSVM庫(kù)中定義函數(shù)svmtrain,根據(jù)支持向量機(jī)技術(shù)計(jì)算基于RBFK核的決策邊界。與算法1相似,首先考慮兩個(gè)信任特征,研究信任邊界。然后,利用PCA算法得到的特征,研究了這5個(gè)特征對(duì)信任邊界的影響。

        算法3:分類(lèi)模型

        輸入:X,y,Xval,yval

        輸出:權(quán)重和決策邊界

        (1)forc,γ=0.01(multiple of 3) 30do

        (2)model=svmtrain(y,X,RBFK,c,γ)

        (3) prediction=svmtrain(yval,Xval,model)

        (4)error[c,γ]=predictions≠yval

        (5)endfor

        (6)Choosec,γ←minimum[error]

        (7)[weight,accuracy,decisionvalues]=svmtrain(y,X,RBFK,c,γ)

        4 實(shí)驗(yàn)與評(píng)估

        4.1 實(shí)驗(yàn)設(shè)置

        本文實(shí)驗(yàn)是在一臺(tái)處理器為英特爾I7處理器,內(nèi)存為16 GB,顯卡為英偉達(dá)2080Ti的電腦上完成的。數(shù)據(jù)來(lái)源于CRAWDAD[16]在SIGCOMM-2009上采集的信息,這些信息包含有關(guān)設(shè)備接近度、活動(dòng)日志、友誼信息、感興趣的組、應(yīng)用程序級(jí)消息日志和數(shù)據(jù)層傳輸日志的信息。然后為了滿足本文實(shí)驗(yàn)要求,在這里將原始數(shù)據(jù)映射為一組與物聯(lián)網(wǎng)相關(guān)的特征:CWR、CFD、RS、MC和CoI。數(shù)據(jù)集中80%的數(shù)據(jù)為訓(xùn)練樣本,20%的數(shù)據(jù)為測(cè)試樣本。具體參數(shù)設(shè)置見(jiàn)表1。在76個(gè)節(jié)點(diǎn)中,每對(duì)節(jié)點(diǎn)之間至少有一個(gè)交互被稱為對(duì)象。社群即屬于相同的組別。信息即節(jié)點(diǎn)之間傳輸?shù)男畔ⅰ?/p>

        表1 實(shí)驗(yàn)參數(shù)設(shè)置

        4.2 結(jié)果與評(píng)估

        基于第2節(jié)中定義的數(shù)值模型的仿真結(jié)果如圖4和5所示。

        圖4 每個(gè)特征的可信度分布

        圖5 對(duì)象45號(hào)的可信度分布

        值得注意的是,如圖4所示,CLR特性中的可信度值的分布接近1,這是因?yàn)閿?shù)據(jù)是從速度非??斓脑O(shè)備收集的。注意,只有一小部分對(duì)象對(duì)在5776個(gè)對(duì)象之間有CLR關(guān)聯(lián),因?yàn)閿?shù)據(jù)點(diǎn)表示那些至少有一個(gè)事務(wù)的對(duì)象。此外,信任值被規(guī)范化為介于0和1之間。1表示100%可信的交互,零表示不可信的交互。

        另一方面,圖4中所示的CWR關(guān)聯(lián)的分布顯示出與CLR情況相比較弱的關(guān)聯(lián),即使它們緊密地協(xié)同工作。每個(gè)節(jié)點(diǎn)的不同意圖可能是導(dǎo)致這種行為的原因之一。此外,由于無(wú)線電頻率(RF)通信通常限于非對(duì)稱類(lèi)型的交互以及短時(shí)間的消息交換,可信賴度值相對(duì)于其協(xié)作性、交互的頻率和持續(xù)時(shí)間的變化被分布到圖的低端。然而,基于CoI和中心度的信任值在圖中的0.3到0.8范圍內(nèi)分布,顯示了節(jié)點(diǎn)之間的一些輪廓相似性。此外,每個(gè)互動(dòng)的獎(jiǎng)勵(lì)值都偏向于量表的低端。這主要是由于過(guò)去的交往中不成功或不良行為造成的。

        類(lèi)似地,圖5示出了每個(gè)對(duì)象(受托人)相對(duì)于一個(gè)特定對(duì)象(委托人)的可信度的分布。為了得到這些結(jié)果,隨機(jī)選擇了45號(hào)對(duì)象。此圖清楚地顯示了在前面章節(jié)討論的特性的其它相鄰對(duì)象上的委托人視圖的解釋。以委托對(duì)象34號(hào)為例,與其它特征相比,對(duì)象34號(hào)與委托人具有高度的同地關(guān)系,MC、CFD和獎(jiǎng)勵(lì)分別約為0.4、0.15和0.16。因此,由于MC和CFD值較低,委托人有可能在未來(lái)的交互中與受托人進(jìn)行基于位置的服務(wù),但會(huì)限制其與協(xié)作服務(wù)相關(guān)的交互。

        4.2.1 聚類(lèi)和標(biāo)記

        隨著信任特性的成功抽象,下一步是研究如何將它們結(jié)合起來(lái)生成最終的信任值。為了從不可信的交互中過(guò)濾出最可信的交互,應(yīng)用第3節(jié)中說(shuō)明的算法,得到的結(jié)果如圖6所示。

        圖6 基于不同特征的K-means聚類(lèi)

        為了確定最佳簇?cái)?shù),如圖7所示,使用肘部法則。在某些特征組合中,該算法能夠?qū)⒔换シ譃榭尚拧⒅辛⒑筒豢尚?類(lèi)。肘部法則給出k=3的實(shí)例代表了這種情況。結(jié)果清楚地顯示了與圖6所示的不可信交互作用分離的邊界。

        圖7 利用肘部法則確定最佳簇?cái)?shù)

        圖6(a)顯示了信任值相對(duì)于中心性和社區(qū)利益的分布。可以觀察到,就這兩個(gè)特征而言,MC=6和CoI=6以上的區(qū)域是值得信賴的區(qū)域。同樣,如圖6(b)到圖6(g)顯示了可信區(qū)域和不可信區(qū)域之間的清晰邊界。然而,圖6(h)和6(i)顯示的結(jié)果與其他人略有不同。在這兩個(gè)圖中,可信賴性的界限都有一個(gè)共同的特征:名譽(yù)。從圖6(h)和6(i)可知,當(dāng)名譽(yù)值較低時(shí),該算法的信任值較低,即使CFD或CWR的信任值較高。所以當(dāng)涉及到誠(chéng)信評(píng)估過(guò)程時(shí),名譽(yù)是一個(gè)關(guān)鍵因素。

        在這里首先運(yùn)行算法從而成對(duì)生成視覺(jué)結(jié)果,然后組合所有5個(gè)特征以找出如圖8所示的可信區(qū)域,其中PCA用于將特征維度從5D減少到2D以使結(jié)果可視化。為了使新的維數(shù)在0和1的范圍內(nèi),實(shí)現(xiàn)了特征規(guī)范化??梢郧宄赜^察到,在第一個(gè)維度上超過(guò)0.5的值和在第二個(gè)維度上超過(guò)0.7的值顯示了可信和不可信交互之間的邊界。

        圖8 利用PCA對(duì)結(jié)果進(jìn)行特征提取

        4.2.2 分類(lèi)模型

        在調(diào)查了哪些交互屬于值得信任的區(qū)域之后,使用這些信息來(lái)標(biāo)記數(shù)據(jù)集。例如,考慮圖6(a)中的相同情況。不可信區(qū)域的簇質(zhì)心周?chē)狞c(diǎn)在標(biāo)簽向量y中標(biāo)記為不可信或0,而不可信質(zhì)心外部的點(diǎn)則標(biāo)記為可信或1。

        然后,使用標(biāo)記的數(shù)據(jù),訓(xùn)練一個(gè)模型,該模型可以清楚地識(shí)別傳入的交互是否值得信任。為了估計(jì)最佳邊界,必須計(jì)算上述每種情況下的最佳正則化參數(shù)c和γ,以避免數(shù)據(jù)過(guò)度擬合。為此,使用部分訓(xùn)練樣本作為交叉驗(yàn)證集,通過(guò)訓(xùn)練模型獲得的結(jié)果如圖9所示,清楚地說(shuō)明了可信區(qū)域和不可信區(qū)域之間的決策邊界。

        此外,圖10示出了對(duì)所有5個(gè)特征應(yīng)用降維后的結(jié)果。現(xiàn)在需要將這個(gè)模型應(yīng)用到新的數(shù)據(jù)流中,以區(qū)分哪些交互屬于值得信任的區(qū)域,反之亦然,而無(wú)需任何權(quán)重或閾值計(jì)算。這不僅降低了計(jì)算復(fù)雜度和冗余工作,而且節(jié)省了處理時(shí)間。

        有了這些被驗(yàn)證的結(jié)果,現(xiàn)在很明顯,系統(tǒng)不需要依賴于傳統(tǒng)的加權(quán)因子和閾值來(lái)決定可信區(qū)域。然而,本研究的主要假設(shè)是信任計(jì)算平臺(tái)的集中性。特別地,假設(shè)考慮中的每個(gè)對(duì)象都訂閱了一個(gè)集中式DR來(lái)發(fā)布其數(shù)據(jù),這樣信任計(jì)算平臺(tái)就可以訪問(wèn)數(shù)據(jù)、訓(xùn)練模型并將信任值發(fā)布回DR中,供信任者使用。

        圖9 算法第二部分在不同特征上的應(yīng)用

        圖10 PCA對(duì)結(jié)果的特征提取

        為了驗(yàn)證提出的方法比最常用的方法(如TAs的線性聚合)的有效性,考慮了混淆矩陣方法。分類(lèi)精度通常會(huì)產(chǎn)生誤導(dǎo)性的結(jié)果,并且隱藏了診斷模型性能所需的細(xì)節(jié),特別是當(dāng)每個(gè)類(lèi)中的觀測(cè)值的數(shù)量與本文的數(shù)據(jù)集中的不同時(shí)。另一方面,混淆矩陣顯示了算法在哪一點(diǎn)產(chǎn)生錯(cuò)誤或混淆,重要的是所產(chǎn)生的錯(cuò)誤類(lèi)型,這對(duì)于研究算法在預(yù)期結(jié)果上的適用性是至關(guān)重要的。為了進(jìn)行比較,考慮了文獻(xiàn)[12,13]中描述的線性算法和文獻(xiàn)[17]中描述的非線性算法。所得結(jié)果見(jiàn)表2。

        表2 不同方法比較結(jié)果

        從表2可知,本文提出的方法在可信和不可信預(yù)測(cè)中,都有較好表現(xiàn),既沒(méi)有線性方法在不可信預(yù)測(cè)中出現(xiàn)可信結(jié)果,也沒(méi)有非線性方法在可信預(yù)測(cè)中出現(xiàn)大量不可信結(jié)果。綜合考慮,本文的方法比線性和非線性方法都要好。根據(jù)表2的結(jié)果,定義每個(gè)算法性能的參數(shù)見(jiàn)表3。

        表3 算法性能對(duì)比

        在分類(lèi)中,召回率對(duì)于與錯(cuò)誤預(yù)測(cè)數(shù)量相關(guān)的分類(lèi)性能提供了重要的見(jiàn)解。根據(jù)模擬結(jié)果,提出的算法顯示100%的召回率或真正例率(TPR),而線性方法顯示的是98.13%。由于數(shù)據(jù)集相對(duì)較小,因此在每秒發(fā)生數(shù)十億事務(wù)的實(shí)際應(yīng)用程序部署中,該算法的性能提高2%將非常關(guān)鍵。這再次被假負(fù)例率(FNR)所證實(shí),該算法顯示0%的假負(fù)例預(yù)測(cè),而線性方法顯示1.8%的假預(yù)測(cè)。請(qǐng)注意,TPR在所提出的方法和非線性方法中都是相似的,因?yàn)榉蔷€性方法僅取代了所提出算法的第二部分。但是,與邏輯回歸相比,該方法具有較低的負(fù)正例率(FPR)和較高的真負(fù)例率(TNR),因而優(yōu)于非線性方法,表明該方法對(duì)不可信對(duì)象具有很強(qiáng)的性能。

        此外,當(dāng)使用線性加權(quán)求和方法聚集多個(gè)TA時(shí),存在無(wú)限的可能性。然而,在這種比較中,在線性算法中使用了由聚類(lèi)算法給出的相同權(quán)重因子來(lái)計(jì)算最終得分。由于這個(gè)原因,提出的和邏輯回歸方法與線性方法相比得分相對(duì)較低。然而,在實(shí)際情況下,如果沒(méi)有一個(gè)合適的聚類(lèi)算法,很難估計(jì)這些權(quán)重因子,因此與提出的方法相比,精度將嚴(yán)重降低。另一方面,用于管理過(guò)擬合數(shù)據(jù)的正則化因子和用于尋找特征最佳參數(shù)的優(yōu)化算法可能會(huì)對(duì)這一原因產(chǎn)生重大影響。因此,通過(guò)觀察學(xué)習(xí)曲線,同時(shí)根據(jù)數(shù)據(jù)集調(diào)整該正則化因子,可以提高兩個(gè)模型的精度。

        此外,本文中描述的算法可以被聚類(lèi),以便終端設(shè)備可以執(zhí)行部分分析,并獲得與之前相同的結(jié)果。在類(lèi)似物聯(lián)網(wǎng)的環(huán)境中,這是非常有益的,可擴(kuò)展性和協(xié)作性是重要因素。為了建立一個(gè)分布式平臺(tái)并解決可伸縮性問(wèn)題,在未來(lái)的工作中,諸如地圖縮減和數(shù)據(jù)并行等方法將被視為強(qiáng)有力的候選技術(shù)。

        5 結(jié)束語(yǔ)

        本文針對(duì)傳統(tǒng)的加權(quán)求和方法,提出了一種基于物聯(lián)網(wǎng)環(huán)境下的信任特征來(lái)判斷輸入交互是否可信的算法。首先,提出了一個(gè)通用的信任計(jì)算模型和一種適用于物聯(lián)網(wǎng)中任何服務(wù)場(chǎng)景的特征提取方法。然后,基于無(wú)監(jiān)督學(xué)習(xí)技術(shù)實(shí)現(xiàn)了一種基于數(shù)據(jù)可信度的數(shù)據(jù)標(biāo)注方法,這是任何系統(tǒng)識(shí)別哪些交互是可信的重要第一步。在此標(biāo)記過(guò)程的基礎(chǔ)上,提出了一種基于支持向量機(jī)模型的信任預(yù)測(cè)模型,該模型能夠正確識(shí)別任何交互的信任邊界,并學(xué)習(xí)最佳參數(shù)組合每個(gè)TA以獲得最終的信任值。仿真結(jié)果表明,該算法在識(shí)別可信交互方面具有良好的性能和準(zhǔn)確性。

        猜你喜歡
        特征方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        亚洲日韩av无码一区二区三区人| 在线观看人成网站深夜免费| 中文字幕午夜精品一区二区三区 | 国产激情无码Av毛片久久| 国产精品丝袜美女久久| 18禁裸体动漫美女无遮挡网站| 男男受被攻做哭娇喘声视频| 久久久久欧洲AV成人无码国产| 亚洲av免费高清不卡| 人成综合视频在线播放| 久久人人爽人人爽人人片av东京热| 亚洲一级毛片免费在线观看| 亚洲日本在线中文字幕| 青青草小视频在线播放| 欧美成人精品午夜免费影视| 日韩中文网| 久久天堂精品一区专区av| 亚洲中文字幕国产视频| 亚洲一本到无码av中文字幕| 中文字幕久久久久久久系列| 在线观看亚洲视频一区二区| 久久精品国产亚洲av果冻传媒| 少妇人妻真实偷人精品视频| 国产午夜精品久久久久九九| 一区二区在线观看日本视频| 免费人成网站在线观看欧美| 香蕉色香蕉在线视频| av天堂一区二区三区精品| 精品国产午夜肉伦伦影院| 无套内射蜜桃小视频| 亚洲欧洲AV综合色无码| 亚洲岛国一区二区三区| 国产福利视频在线观看| 亚洲一区二区在线| 国产av精品一区二区三区不卡 | 亚洲国产精品激情综合色婷婷| 亚洲国产精品久久电影欧美| 9191在线亚洲精品| 亚洲成人免费久久av| 免费人成在线观看视频高潮| 国产精品va在线播放我和闺蜜|