亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電網(wǎng)數(shù)據(jù)可信性度量模型研究

        2017-04-21 01:49:23程曉榮李天琦
        關(guān)鍵詞:可信性數(shù)據(jù)源信任

        程曉榮,李天琦

        (1.華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院, 河北 保定 071003)

        電網(wǎng)數(shù)據(jù)可信性度量模型研究

        程曉榮,李天琦

        (1.華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院, 河北 保定 071003)

        針對(duì)電力系統(tǒng)中不可信數(shù)據(jù)將導(dǎo)致電力系統(tǒng)狀態(tài)估計(jì)結(jié)果的準(zhǔn)確性降低,分析了電網(wǎng)中數(shù)據(jù)的可信性需求,研究了電力系統(tǒng)不良數(shù)據(jù)的辨識(shí)和數(shù)據(jù)可信分析理論,構(gòu)建了層次化、動(dòng)態(tài)化的電網(wǎng)數(shù)據(jù)可信分析模型。該模型引入時(shí)間因子、懲罰因子等權(quán)重參數(shù),將電力數(shù)據(jù)的可信性分析問(wèn)題歸結(jié)為數(shù)據(jù)源、數(shù)據(jù)源之間及數(shù)據(jù)傳播網(wǎng)絡(luò)路徑的組合問(wèn)題,即通過(guò)計(jì)算數(shù)據(jù)源之間的可信度、數(shù)據(jù)源的可信度、數(shù)據(jù)的可信度,動(dòng)態(tài)地構(gòu)建了基于數(shù)據(jù)源依賴(lài)關(guān)系的可信虛擬網(wǎng)絡(luò),最后通過(guò)所構(gòu)建的可信虛擬網(wǎng)絡(luò)來(lái)評(píng)估出電力數(shù)據(jù)的可信度。仿真實(shí)驗(yàn)結(jié)果表明,該模型能較好地滿(mǎn)足電網(wǎng)數(shù)據(jù)的可信性評(píng)估需求,為可信性評(píng)估方法進(jìn)一步研究提供了解決思路。

        電網(wǎng)數(shù)據(jù);大數(shù)據(jù);可信度;動(dòng)態(tài)性;可信計(jì)算

        0 引 言

        目前,在智能電網(wǎng)系統(tǒng)中,大數(shù)據(jù)貫穿于發(fā)電、輸電、變電、配電、用電、調(diào)度等電力生產(chǎn)及管理的各個(gè)環(huán)節(jié)[1],與此同時(shí),電力系統(tǒng)發(fā)展速度越來(lái)越快,網(wǎng)絡(luò)的結(jié)構(gòu)、運(yùn)行模式也變得越來(lái)越復(fù)雜。電力大數(shù)據(jù)具有典型的“3V”和“3E”特征,即:體量大(Volume)、速度快(Velocity)、類(lèi)型多(Variety)和數(shù)據(jù)即能量(Energy)、數(shù)據(jù)即交互(Exchange)、數(shù)據(jù)即共情(Empathy),同時(shí)從特征中不難發(fā)現(xiàn)電力數(shù)據(jù)的典型“HDC”屬性,即數(shù)據(jù)的異構(gòu)性(Heterogeneous)、動(dòng)態(tài)的數(shù)據(jù)體系(Dynamic)、數(shù)據(jù)的復(fù)雜性(Complexity)。因此,在電力數(shù)據(jù)集合中必然充斥著大量不可信的數(shù)據(jù)[2],這些不可信數(shù)據(jù)的存在會(huì)造成電力系統(tǒng)狀態(tài)估計(jì)的失敗,影響調(diào)度員做出錯(cuò)誤的決策,進(jìn)而影響智能電網(wǎng)系統(tǒng)的正常運(yùn)行,甚至可能威脅整個(gè)電力系統(tǒng)的安全[3,4]。如果能及時(shí)對(duì)原始數(shù)據(jù)進(jìn)行可信度的評(píng)估,那么就會(huì)有效降低風(fēng)險(xiǎn),提高電力數(shù)據(jù)的可信性。

        電力系統(tǒng)不良數(shù)據(jù)辨識(shí)方法一般以加權(quán)最小二乘狀態(tài)估計(jì)方法為基礎(chǔ),包括非二次準(zhǔn)則法、殘差搜索法、零殘差法、估計(jì)辨識(shí)法等,這些方法首先假設(shè)測(cè)量誤差服從正態(tài)分布,然后基于假設(shè)檢驗(yàn)的方法依據(jù)殘差來(lái)辨識(shí)不良量測(cè)數(shù)據(jù)。文獻(xiàn)[5,6]提出的這些方法容易出現(xiàn)殘差污染和殘差掩沒(méi)現(xiàn)象,從而造成漏檢或誤檢,影響辨識(shí)的效果。文獻(xiàn)[7]運(yùn)用基于Spark的并行K-means聚類(lèi)算法提取出日負(fù)荷特征曲線(xiàn),分別對(duì)輸電網(wǎng)狀態(tài)估計(jì)中的不良數(shù)據(jù)進(jìn)行檢測(cè)和辨識(shí)。文獻(xiàn)[8]引入基于貝葉斯數(shù)據(jù)處理策略的擴(kuò)展卡爾曼濾波算法進(jìn)行不良數(shù)據(jù)動(dòng)態(tài)檢測(cè)。文獻(xiàn)[9]利用PMU采集的電壓、電流相量,與新息差向量配合使用,提出了使用基爾霍夫電壓定律辨識(shí)不良數(shù)據(jù)的方法?;谏窠?jīng)網(wǎng)絡(luò)的算法由于閾值選取帶有很大的主觀性和經(jīng)驗(yàn)性,使得實(shí)際應(yīng)用比較困難,基于模糊理論和聚類(lèi)分析的算法要求人為的確定隸屬度的大小,帶有一定的主觀性,基于GSA的算法由于算法本身比較復(fù)雜,而且要考慮參考分布,當(dāng)量測(cè)數(shù)據(jù)量比較大時(shí),計(jì)算量很大,計(jì)算速度會(huì)受到影響。若將可信度評(píng)估理論應(yīng)用到不良數(shù)據(jù)辨識(shí)中,進(jìn)行定量分析,這樣就會(huì)使得不良數(shù)據(jù)辨識(shí)更加準(zhǔn)確。

        目前,數(shù)據(jù)的可信度分析與評(píng)估方法主要分為兩大類(lèi),主觀信任分析和客觀信任分析,但均不太適應(yīng)具有“3V”特征的電力數(shù)據(jù)可信性研究。主觀信任分析是基于信念的,一種認(rèn)知現(xiàn)象,是對(duì)信任客體的特定特征或行為的特定級(jí)別的主觀判斷,這種判斷相對(duì)獨(dú)立于主體的特征和行為具有模糊性、不確定性,無(wú)法精確地描述、驗(yàn)證和推理,文獻(xiàn)[10-12]提出了基于概率論、模糊集合理論、云理論等不同的主觀信任評(píng)估方法??陀^信任分析主要是基于證據(jù)理論的,通過(guò)證據(jù)來(lái)定義兩者之間的信任關(guān)系,進(jìn)行描述、驗(yàn)證和推理,文獻(xiàn)[13-16]采用D-S證據(jù)理論進(jìn)行可信度計(jì)算。它比主觀信任分析更加合理,但并沒(méi)有考慮時(shí)效性及惡意推薦所帶來(lái)的影響,缺少靈活性。

        本文在研究電力系統(tǒng)不良數(shù)據(jù)的辨識(shí)和傳統(tǒng)數(shù)據(jù)可信分析理論基礎(chǔ)上,為滿(mǎn)足人們對(duì)智能電網(wǎng)中的數(shù)據(jù)可信性和系統(tǒng)運(yùn)行可靠性的要求,創(chuàng)新性提出了面向智能電網(wǎng)的數(shù)據(jù)可信性評(píng)估模型,給出了一種基于數(shù)據(jù)源依賴(lài)關(guān)系的動(dòng)態(tài)化、層次化可信虛擬網(wǎng)絡(luò)的構(gòu)建方法。

        1 電網(wǎng)數(shù)據(jù)的可信分析模型

        傳統(tǒng)的數(shù)據(jù)可信評(píng)估和不良數(shù)據(jù)辨識(shí)的方法雖然在處理小規(guī)模數(shù)據(jù)可信問(wèn)題時(shí)表現(xiàn)出了良好的性能,但是,這些算法均假設(shè)所有數(shù)據(jù)一次性裝入內(nèi)存中,顯然無(wú)法處理電力大數(shù)據(jù),這些方法可處理的數(shù)據(jù)規(guī)模和時(shí)效均受到硬件的嚴(yán)重制約。針對(duì)電力大數(shù)據(jù)典型特征和“HDC”屬性,本文給出了一種動(dòng)態(tài)構(gòu)建電網(wǎng)數(shù)據(jù)可信性度量的模型。本方法采用分布式處理方法,運(yùn)行在大數(shù)據(jù)平臺(tái)上,能有效利用軟硬件資源、處理海量增長(zhǎng)的電力數(shù)據(jù)。該模型主要分三部分:數(shù)據(jù)源之間的可信度量模型、數(shù)據(jù)源可信度量模型、數(shù)據(jù)可信度量模型。數(shù)據(jù)源之間的可信度受數(shù)據(jù)源的可信度制約,數(shù)據(jù)源的可信度受數(shù)據(jù)的可信度和數(shù)據(jù)源之間的可信度雙重制約,數(shù)據(jù)的可信度受數(shù)據(jù)源的可信度和數(shù)據(jù)源之間的可信度雙重制約,它們之間相互關(guān)聯(lián)、相互制約,構(gòu)成一個(gè)整體。其關(guān)聯(lián)關(guān)系如圖1所示。

        圖1 數(shù)據(jù)源間、數(shù)據(jù)、數(shù)據(jù)源的可信度模型關(guān)聯(lián)關(guān)系Fig.1 The correlation of the credibility model of between data sources, data, data source

        1.1 相關(guān)概念

        為便于理解,給出本文所提方法的相關(guān)定義,來(lái)闡述電網(wǎng)數(shù)據(jù)可信性分析方面的基本問(wèn)題。

        數(shù)據(jù)源:是指在電網(wǎng)大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的提供者。

        數(shù)據(jù):是指由多個(gè)屬性特征構(gòu)成。符號(hào)記作:data={d1,d2,d3,… ,dn},其中,di是指數(shù)據(jù)的第i個(gè)屬性。

        可信虛擬網(wǎng)絡(luò):是指通過(guò)計(jì)算數(shù)據(jù)源之間的可信度而建立的虛擬網(wǎng)絡(luò),網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)相當(dāng)于一個(gè)相應(yīng)的設(shè)備(數(shù)據(jù)源),網(wǎng)絡(luò)之間的鏈接是指數(shù)據(jù)源之間的可信度值超過(guò)一定的閾值而建立的,與具體互聯(lián)設(shè)備構(gòu)成的網(wǎng)絡(luò)有所區(qū)別。

        根據(jù)前述對(duì)電力數(shù)據(jù)可信性分析的相關(guān)描述,在對(duì)電力數(shù)據(jù)進(jìn)行可信度計(jì)算時(shí),本文給出一種動(dòng)態(tài)的可信性分析網(wǎng)絡(luò)模型,該模型由層次化的可信虛擬網(wǎng)絡(luò)結(jié)構(gòu)組成。在初始時(shí)刻,該虛擬網(wǎng)絡(luò)由分散的數(shù)據(jù)源或?qū)<医?jīng)驗(yàn)預(yù)先得到的數(shù)據(jù)源構(gòu)成,且網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)是動(dòng)態(tài)變化的;然后,在計(jì)算數(shù)據(jù)源之間的關(guān)聯(lián)可信度時(shí),構(gòu)建了該模型的可信性分析網(wǎng)絡(luò);最后,基于該可信性網(wǎng)絡(luò)分析模型,進(jìn)行數(shù)據(jù)的可信性度量,具體過(guò)程如下文所述。

        1.2 數(shù)據(jù)源之間的可信性度量模型

        在電網(wǎng)可信度計(jì)算過(guò)程中,當(dāng)兩個(gè)數(shù)據(jù)源之間有直接的上下文交互或者它們之間所提供的數(shù)據(jù)或行為的相似度超過(guò)一定的閾值時(shí),這時(shí)兩個(gè)數(shù)據(jù)源之間建立有向鏈路,隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大,可信虛擬網(wǎng)絡(luò)越來(lái)越趨于穩(wěn)定。如果發(fā)現(xiàn)某個(gè)數(shù)據(jù)源提供的數(shù)據(jù)不可信,該模型能很快的對(duì)其提供者(數(shù)據(jù)源)賦以懲罰系數(shù),使得其提供者在一段時(shí)間內(nèi)的可信度降低;但是隨著時(shí)間的推移,如果數(shù)據(jù)源能繼續(xù)提供可靠的數(shù)據(jù),那么它的可信度也將會(huì)緩慢恢復(fù)。在可信性分析網(wǎng)絡(luò)中,如果數(shù)據(jù)源之間在一個(gè)計(jì)算間隔內(nèi)沒(méi)有新的上下文直接交互,那么就對(duì)其施加一個(gè)時(shí)間懲罰。

        定義1 數(shù)據(jù)源間的可信度:設(shè)TrustA(B,t)表示在t時(shí)刻時(shí),本地?cái)?shù)據(jù)源A對(duì)目的數(shù)據(jù)源B的綜合可信度,由數(shù)據(jù)源之間的本地可信度與全局可信度組合而成,其計(jì)算公式為

        (1)

        式中:α1+β1=1。

        定義2 本地可信度:當(dāng)兩個(gè)數(shù)據(jù)源之間有直接的上下文交互或者兩個(gè)數(shù)據(jù)源之間所提供的數(shù)據(jù)或行為的相似度超過(guò)一定的閾值時(shí),稱(chēng)此時(shí)的數(shù)據(jù)源之間具有本地可信度。設(shè)LocalTrustA(B,t)表示在t時(shí)刻時(shí),本地?cái)?shù)據(jù)源A對(duì)目的數(shù)據(jù)源B的本地可信度,它是由數(shù)據(jù)源之間直接進(jìn)行上下文交互的可信度與兩個(gè)數(shù)據(jù)源之間的相似度(相似度也可以指相互的認(rèn)可度)組合而成,其計(jì)算公式為

        (2)

        式中:

        (a) 初始值為一個(gè)隨機(jī)數(shù)或0,表示數(shù)據(jù)源A對(duì)數(shù)據(jù)源B有一些信任或沒(méi)有信任。

        (c) ΔContext(A,B,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A和數(shù)據(jù)源B之間是否有新增的上下文直接交互。其中,ΔContext(A,B,t)=Context(A,B,t)-Context(A,B,t-1)。

        其中,Context(A,B,t)是指在t時(shí)刻,數(shù)據(jù)源A與數(shù)據(jù)源B之間直接交互數(shù)據(jù)。

        (d)DirTrust(A,B,Context(A,B,t),t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對(duì)數(shù)據(jù)源B在上下文交互條件Context(A,B,t)下的可信值。

        (e)Accept(A,B,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對(duì)數(shù)據(jù)源B的相似程度的認(rèn)可度。

        Data(A)∩Data(B)是指數(shù)據(jù)源A所提供的數(shù)據(jù)集合與數(shù)據(jù)源B所提供的數(shù)據(jù)集合有相同的主題的數(shù)據(jù)的個(gè)數(shù)。

        (f)λL(t)表示在t時(shí)刻時(shí),本模型對(duì)本地可信度的懲罰系數(shù)。

        其中, ΔLocalTrustA(B,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對(duì)目的數(shù)據(jù)源B本地可信度是否發(fā)生了變化。ΔLocalTrustA(B,t)=LocalTrustA(B,t)-LocalTrustA(B,t-1)。

        (g)α2+β2=1。

        定義3 全局可信度:設(shè)GlobalTrustA(B,t)表示在t時(shí)刻時(shí),本地?cái)?shù)據(jù)源A對(duì)目的數(shù)據(jù)源B的全局可信度,它的值是目的數(shù)據(jù)源在整個(gè)可信虛擬網(wǎng)絡(luò)中的可信度,即目的數(shù)據(jù)源的可信度,其計(jì)算公式為

        (3)

        1.3 數(shù)據(jù)源的可信性度量模型

        定義4 數(shù)據(jù)源的可信度:設(shè)Trust(A,t)表示在t時(shí)刻,數(shù)據(jù)源A的可信度,它是指數(shù)據(jù)源提供的所有歷史數(shù)據(jù)的可信度期望值與整個(gè)可信虛擬網(wǎng)絡(luò)中各層對(duì)數(shù)據(jù)源的推薦可信度的綜合可信度。其計(jì)算公式為

        (4)

        式中:

        (a) 初始值為一個(gè)隨機(jī)數(shù)或0,表示數(shù)據(jù)源A有一些信任或沒(méi)有信任。

        (d)Trust(dataa,t)表示在t時(shí)刻時(shí),對(duì)數(shù)據(jù)dataa的信任度。

        (e)Sum(Data(A))表示求數(shù)據(jù)源A提供數(shù)據(jù)的總數(shù)量。

        (f)γn表示在可信虛擬網(wǎng)絡(luò)中,以所求信任值的數(shù)據(jù)源為圓心,每一層對(duì)目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)信任權(quán)重。它是一個(gè)1×n維向量,第一個(gè)元素的值為第一層對(duì)圓心數(shù)據(jù)源的信任權(quán)重,以此類(lèi)推,每個(gè)向量元素為所對(duì)應(yīng)層次的信任權(quán)重,且權(quán)重值是個(gè)常數(shù),根據(jù)專(zhuān)家設(shè)定,由內(nèi)向外逐層遞減,取值范圍[0,1]之間。

        (g)α3+β3=1。

        定義5 推薦可信度:設(shè)Recommend(A,B,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對(duì)數(shù)據(jù)源B以最佳路徑得到推薦可信度,它是指本數(shù)據(jù)源通過(guò)最佳路徑到目的數(shù)據(jù)源,對(duì)目的數(shù)據(jù)源的可信度。

        設(shè)Recommendn(A,t)表示在t時(shí)刻時(shí),每層數(shù)據(jù)源對(duì)目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)A的推薦可信度,其中它是一個(gè)n×1維向量,第一個(gè)元素的值為第一層所有數(shù)據(jù)源對(duì)目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)A的推薦可信度期望值,以此類(lèi)推,每個(gè)向量元素為所對(duì)應(yīng)層次的推薦可信度期望值。一般層數(shù)是根據(jù)精確度和需求設(shè)置的,層數(shù)越大,計(jì)算量越大,相應(yīng)的得到的數(shù)據(jù)就越準(zhǔn)確。

        設(shè)Recommend(Xi,A,t)為第i層的某個(gè)數(shù)據(jù)源X對(duì)目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)A的推薦可信度,其計(jì)算公式為

        (5)

        其中,Neighbormax(Xi->A)表示朝向A的方向上,第i-1層上與Xi相鄰的可信度最大的數(shù)據(jù)源。

        設(shè)Recommend(A,t)(i)為第i層的所有數(shù)據(jù)源對(duì)目標(biāo)數(shù)據(jù)源(圓心數(shù)據(jù)源)A的推薦可信度期望值為

        (6)

        其中,Circlei(A)表示在可信虛擬網(wǎng)絡(luò)中,以A為圓心的第i層上的所有數(shù)據(jù)源,Sum(Circlei(A))表示第i層上的所有數(shù)據(jù)源的數(shù)量。

        1.4 數(shù)據(jù)的可信性度量模型

        定義6 數(shù)據(jù)的可信度:設(shè)Trust(data,t)表示在t時(shí)刻時(shí),數(shù)據(jù)data的可信度,它是指對(duì)于這條數(shù)據(jù),所有的直接提供這條數(shù)據(jù)的數(shù)據(jù)源或有直接關(guān)系的數(shù)據(jù)源在歷史記錄中都提供不可靠數(shù)據(jù)的對(duì)立事件的概率,其計(jì)算公式為

        (7)

        定義7 數(shù)據(jù)源所提供的某條數(shù)據(jù)的真實(shí)可信度:設(shè)Trust(A,data,t)表示在t時(shí)刻時(shí),數(shù)據(jù)源A對(duì)所提供的數(shù)據(jù)data的真實(shí)的可信度,它是指由數(shù)據(jù)源對(duì)所有提供數(shù)據(jù)的直接可信度與間接可信度的綜合得到的。其計(jì)算公式為

        (8)

        式中:α4+β4=1。

        定義8 某數(shù)據(jù)源所提供數(shù)據(jù)的直接可信度:設(shè)DirTrust(A,data,t)表示在t時(shí)刻,數(shù)據(jù)源A對(duì)所提供的數(shù)據(jù)data的真實(shí)直接可信度,它是指數(shù)據(jù)源在整個(gè)可信虛擬網(wǎng)絡(luò)中的可信度,其計(jì)算公式為

        (9)

        定義9 某數(shù)據(jù)源所提供數(shù)據(jù)的間接可信度:設(shè)InDirTrust(A,data,t)表示在t時(shí)刻,與數(shù)據(jù)源A鄰接的數(shù)據(jù)源對(duì)這條數(shù)據(jù)的真實(shí)推薦可信度,一般選出有限的n個(gè)鄰接可信度高的數(shù)據(jù)源組合成這條數(shù)據(jù)真實(shí)的推薦可信度,其計(jì)算公式為

        (10)

        式中:Neighborn(A)與A相鄰的可信度高的n個(gè)數(shù)據(jù)源。

        由上面的定義可得數(shù)據(jù)源間、數(shù)據(jù)源及數(shù)據(jù)的可信度定義之間關(guān)聯(lián)關(guān)系,如圖2所示。

        圖2 數(shù)據(jù)源間、數(shù)據(jù)源及數(shù)據(jù)的可信度關(guān)聯(lián)關(guān)系Fig.2 The correlation of the credibility definition of between data sources, data, data source

        2 案例分析及驗(yàn)證

        本文采用Hadoop平臺(tái)搭建了一個(gè)由16臺(tái)筆記本電腦組成的集群實(shí)驗(yàn)環(huán)境。為了驗(yàn)證論文所提的方法具有很好的實(shí)用性,仿真實(shí)驗(yàn)選取的對(duì)象是某電力公司調(diào)度通信中心實(shí)時(shí)運(yùn)行的數(shù)據(jù),其中包括3個(gè)發(fā)電廠(chǎng)、4個(gè)變電站的局部電網(wǎng)的運(yùn)行數(shù)據(jù)。本實(shí)驗(yàn)對(duì)采集設(shè)備進(jìn)行時(shí)鐘同步,每一時(shí)刻采集到的數(shù)據(jù)都帶有時(shí)標(biāo),這樣就避免了時(shí)間延遲會(huì)造成對(duì)數(shù)據(jù)的懲罰,便于分析。

        實(shí)驗(yàn)中靜態(tài)信息仍然存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)里。為模擬實(shí)際場(chǎng)景里的數(shù)據(jù)產(chǎn)生網(wǎng)絡(luò),實(shí)驗(yàn)中將一臺(tái)PC機(jī)當(dāng)作信息生成發(fā)送端。每條信息包括數(shù)據(jù)源編號(hào),主題類(lèi)型,時(shí)間,數(shù)據(jù)源可信度值,數(shù)據(jù)可信度值,風(fēng)速平均,有功功率平均,無(wú)功功率平均,風(fēng)向角平均,發(fā)電機(jī)轉(zhuǎn)速平均值,葉輪轉(zhuǎn)速平均值,葉尖壓力平均值,系統(tǒng)壓力平均值,偏航角度平均值,齒輪油溫度平均值,齒輪箱軸承溫度平均值,環(huán)境溫度平均值,發(fā)電機(jī)前軸溫度平均值,機(jī)艙溫度平均值,發(fā)電機(jī)后軸溫度平均值,大發(fā)電機(jī)溫度平均值,A、B相電流平均值,A、B相電壓平均值,頻率平均值,功率因數(shù)平均值,有功功率最大值,有功功率最小值,無(wú)功功率最大值,無(wú)功功率最小值等信息,各個(gè)信息之間用逗號(hào)隔開(kāi);信息存儲(chǔ)到以數(shù)據(jù)源編號(hào)和時(shí)間組成的文件里,如表1所示。

        表1 信息及文件名格式

        2.1 仿真實(shí)驗(yàn)設(shè)計(jì)

        在智能電網(wǎng)環(huán)境下,數(shù)據(jù)源是指可信虛擬網(wǎng)絡(luò)中提供數(shù)據(jù)的實(shí)體,即電力系統(tǒng)中提供數(shù)據(jù)的設(shè)備,記作entity;數(shù)據(jù)是指實(shí)體(數(shù)據(jù)源)關(guān)于某個(gè)主題提供的數(shù)據(jù);主題是指數(shù)據(jù)的附屬主體,記作theme。一個(gè)數(shù)據(jù)源的行為可以被認(rèn)為是在一定的時(shí)間內(nèi),針對(duì)一個(gè)主題提供的數(shù)據(jù),則存在這條數(shù)據(jù)屬于數(shù)據(jù)源,記作data∈entity,這條數(shù)據(jù)附屬于對(duì)應(yīng)的主題,記作data∈theme,這個(gè)主題屬于數(shù)據(jù)源,記作D(entity)={data|data∈entity}。一個(gè)數(shù)據(jù)源提供的所有的數(shù)據(jù)集合記作theme∈entity,一個(gè)數(shù)據(jù)源與所有有聯(lián)系的主題集合記作T(entity)={theme|theme∈entity},一個(gè)主題所包含的數(shù)據(jù)集合記作D(theme)={data|data∈theme}。

        本模型所涉及的參數(shù)個(gè)數(shù)比較多,其中,涉及數(shù)據(jù)源之間可信度的參數(shù)包括數(shù)據(jù)源的數(shù)量N、本地信任度權(quán)重系數(shù)α1、全局信任度權(quán)重系數(shù)β1、本地信任度直接可信度權(quán)重系數(shù)α2、本地信任度相似程度的認(rèn)可度權(quán)重系數(shù)β2、本地可信度的時(shí)間衰減系數(shù)μL(t)、本地可信度的懲罰系數(shù)λL(t)、數(shù)據(jù)或行為的相似度閾值η、兩次計(jì)算時(shí)間的差值Δt,涉及數(shù)據(jù)源可信度的參數(shù)包括歷史數(shù)據(jù)的可信度期望值權(quán)重系數(shù)α3、推薦可信度權(quán)重系數(shù)β3、數(shù)據(jù)源可信度的時(shí)間衰減系數(shù)μS(t)、數(shù)據(jù)源可信度的懲罰系數(shù)λS(t)、以數(shù)據(jù)源為圓心的層次n、多維層次的信任權(quán)重向量γn,涉及數(shù)據(jù)可信度的參數(shù)包括直接可信度權(quán)重系數(shù)α4、間接可信度權(quán)重系數(shù)β4。

        本實(shí)驗(yàn)把所采集的數(shù)據(jù)分成兩部分,其中一部分是作為前期的電力可信虛擬網(wǎng)絡(luò)的建立,對(duì)網(wǎng)絡(luò)進(jìn)行反復(fù)訓(xùn)練,同時(shí)調(diào)整更新參數(shù)的值以適應(yīng)環(huán)境的變化,另一部分?jǐn)?shù)據(jù)則是驗(yàn)證本模型的穩(wěn)定性、準(zhǔn)確性。實(shí)驗(yàn)參數(shù)值是基于主觀性和經(jīng)驗(yàn)性的選取的,但在后期的實(shí)驗(yàn)過(guò)程中是在不斷的修改參數(shù)值,以便選擇更合理的參數(shù)值,各參數(shù)的設(shè)置情況如下表。

        2.2 算法分析過(guò)程

        在Hadoop中運(yùn)行過(guò)程,首先收集數(shù)據(jù),將收集到數(shù)據(jù)進(jìn)行預(yù)處理,在map過(guò)程,輸入的key-value對(duì)是由采集到的數(shù)據(jù)源的標(biāo)示作為key值,對(duì)于value值則是對(duì)應(yīng)格式化的一行字符串,每位都有不同的含義,具體要看收集的數(shù)據(jù)源的特點(diǎn),在map過(guò)程中,通過(guò)對(duì)每一行字符串的解析,主要是對(duì)value的關(guān)鍵位(對(duì)描述數(shù)據(jù)關(guān)鍵信息的位)的取舍和對(duì)key值的修改,將數(shù)據(jù)源提供數(shù)據(jù)按主題類(lèi)型歸屬的進(jìn)行分類(lèi),作為新的key值,這樣就得到所需要的key-value對(duì)作為輸出;在reduce過(guò)程,將map過(guò)程中的輸出,按照相同的key值中將value放到同一個(gè)列表中作為reduce的輸入,這時(shí)就需要使用本文模型提出的算法進(jìn)行數(shù)據(jù)源間可信度、數(shù)據(jù)源可信度、數(shù)據(jù)可信度的并行計(jì)算及可信虛擬網(wǎng)絡(luò)的構(gòu)建。同時(shí)啟動(dòng)其他的輔助進(jìn)程用來(lái)修改已經(jīng)組建的可信虛擬網(wǎng)絡(luò),同時(shí)將程序進(jìn)入下一輪的迭代計(jì)算。

        表2 仿真實(shí)驗(yàn)中默認(rèn)值參數(shù)列表

        結(jié)合1.2、1.3、1.4小節(jié)內(nèi)容,首先從式(1)計(jì)算數(shù)據(jù)源間的可信度開(kāi)始,計(jì)算任意一個(gè)entity對(duì)其他entities的可信度,其中,需要根據(jù)式(2)和式(3)計(jì)算兩方面的內(nèi)容,一方面,需要對(duì)其它的entities計(jì)算本地可信度,如果數(shù)據(jù)源之間有上下文交互(條件1)或出現(xiàn)新的行為(條件2),那么需要更新本地可信度,如果沒(méi)有新的行為,那么就按時(shí)間懲罰因子對(duì)其進(jìn)行時(shí)間懲罰。其中,如果滿(mǎn)足上述條件1任意兩個(gè)數(shù)據(jù)源之間有聯(lián)系,或者滿(mǎn)足上述條件2在對(duì)數(shù)據(jù)源間本地可信度計(jì)算中,如果任意兩個(gè)數(shù)據(jù)源對(duì)于同一主題提供的數(shù)據(jù)相似度超過(guò)系統(tǒng)設(shè)定的閾值η,那么他們之間就建立了一條有向鏈路,其中鏈路上的權(quán)值就是數(shù)據(jù)源間可信度的值。另一方面,需要對(duì)這個(gè)entity計(jì)算全局可信度。

        再次,利用式(4)計(jì)算entity可信度,其中,如果entity提供的所有歷史數(shù)據(jù)的可信度期望值或在整個(gè)可信虛擬網(wǎng)絡(luò)中各層對(duì)entity的推薦可信度發(fā)生變化,那么就更新entity可信度,如果可信度沒(méi)有發(fā)生變化,同樣也要對(duì)其進(jìn)行時(shí)間懲罰。

        最后,根據(jù)式(7)利用對(duì)立事件概率來(lái)計(jì)算某個(gè)entity對(duì)一個(gè)theme提供data的可信度,其中,式(8)給出了entity對(duì)提供的data的真實(shí)的可信度,式(9)和式(10)分別給出entity對(duì)data的直接可信度和相鄰entities對(duì)data的間接可信度。在實(shí)驗(yàn)驗(yàn)證中,如果某個(gè)entity提供了某種惡意的、不真實(shí)的data時(shí),本模型會(huì)對(duì)其進(jìn)行嚴(yán)厲懲罰,使其在可信虛擬網(wǎng)絡(luò)中可信值瞬間變的很低,但如果在后期行為正常情況下,可信度也會(huì)隨著自己信用的提升而緩慢提升,可信評(píng)估計(jì)算過(guò)程本身就是不斷迭代更新的過(guò)程。整個(gè)算法的程序流程圖如圖3所示。

        圖3 電網(wǎng)大數(shù)據(jù)可信性度量方法的程序流程Fig.3 Program flow diagram of credibility evaluation method for Smart Grid Big Data

        2.3 實(shí)驗(yàn)結(jié)果及分析

        結(jié)合上述算法過(guò)程,將上面采集到的數(shù)據(jù)導(dǎo)入模型中進(jìn)行驗(yàn)證。在實(shí)驗(yàn)過(guò)程中,人為擬造一個(gè)電力設(shè)備來(lái)提供的數(shù)據(jù),主要是驗(yàn)證本模型對(duì)于錯(cuò)誤數(shù)據(jù)的檢測(cè)、處理能力。由于數(shù)據(jù)源之間可信度、數(shù)據(jù)源可信度、數(shù)據(jù)可信度是相互關(guān)聯(lián)的,是反復(fù)嵌套迭代計(jì)算得到的,利用式(1)、式(4)、式(7)迭代的計(jì)算模擬設(shè)備的可信值,觀察該擬造設(shè)備的可信度值隨時(shí)間變化情況,如圖4所示。

        圖4 人為擬造電力設(shè)備的可信值隨時(shí)間變化趨勢(shì)Fig.4 Artificial power equipment’s credibility value changing with time trend

        從圖4中可以看這一電力設(shè)備在T0-T30,電力設(shè)備的可信度呈現(xiàn)一種上升趨勢(shì),其中在T12-T18時(shí)間段內(nèi),電力設(shè)備的可信度呈緩慢下降趨勢(shì),這主要是由于沒(méi)有新的行為,其可信度要施加時(shí)間懲罰;在T31時(shí),通過(guò)人為修改采集的真實(shí)數(shù)據(jù),使得這一時(shí)刻提供的數(shù)據(jù)與真實(shí)數(shù)據(jù)差距很大,由于電力設(shè)備做出了一種不可信的行為或者數(shù)據(jù)錯(cuò)誤,本系統(tǒng)對(duì)其施加了懲罰,導(dǎo)致其可信度下降到0.1以下;在T32以后,由于電力設(shè)備的行為正常,隨著時(shí)間恢復(fù)原先上升的趨勢(shì),但趨勢(shì)比較緩慢。

        在某一時(shí)刻,分層數(shù)據(jù)源組成的可信虛擬網(wǎng)絡(luò)部分拓?fù)涫疽鈭D以及多層數(shù)據(jù)源對(duì)某條數(shù)據(jù)的可信傳遞模擬示意圖如圖5所示。

        圖5 某時(shí)刻可信虛擬網(wǎng)絡(luò)部分拓?fù)銯ig.5 The partial topological diagram of credibility network at a certain time

        某個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)備僅僅是整個(gè)可信虛擬網(wǎng)絡(luò)的一部分,不能單獨(dú)考慮,其單個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的可信度的作用是為計(jì)算數(shù)據(jù)源之間可信度提供數(shù)據(jù)。網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)備的可信度是受其提供的數(shù)據(jù)可信度制約,圖2描述了數(shù)據(jù)源之間的可信度、數(shù)據(jù)源的可信度、數(shù)據(jù)的可信度三者之間的依賴(lài)關(guān)系,通過(guò)反復(fù)迭代地計(jì)算三者的可信度,動(dòng)態(tài)地構(gòu)建大數(shù)據(jù)的可信性分析網(wǎng)絡(luò),然后通過(guò)所構(gòu)建的穩(wěn)定的可信性分析網(wǎng)絡(luò)來(lái)計(jì)算出數(shù)據(jù)的可信度。其中,由定義2可知,利用式(2)計(jì)算智能電網(wǎng)中數(shù)據(jù)源間的本地可信度時(shí),可構(gòu)建數(shù)據(jù)源間可信虛擬網(wǎng)絡(luò),如圖5(a)所示給出部分分層數(shù)據(jù)源網(wǎng)絡(luò)拓?fù)鋱D,箭頭方向是指某數(shù)據(jù)源對(duì)指向數(shù)據(jù)源的聯(lián)系,權(quán)重為數(shù)據(jù)源之間的可信度值,如圖5(b)所示則是給出針對(duì)某條數(shù)據(jù)的可信虛擬網(wǎng)絡(luò)示意圖,從中我們可以得出,任何一條數(shù)據(jù)不僅與其提供者有直接聯(lián)系,而且也有很多與之有直接或間接聯(lián)系的數(shù)據(jù)源包圍,形成了一個(gè)小型可信虛擬網(wǎng)絡(luò),這樣就能大大提高對(duì)一條數(shù)據(jù)可信性評(píng)價(jià)的準(zhǔn)確性。

        在仿真實(shí)驗(yàn)過(guò)程中,設(shè)置數(shù)據(jù)規(guī)模為30 GB,不斷的增加節(jié)點(diǎn)數(shù)量,本文分別設(shè)置了2、4、8、16節(jié)點(diǎn)數(shù),圖6反映的是對(duì)于處理同一數(shù)據(jù)量的數(shù)據(jù),使得可信虛擬網(wǎng)絡(luò)達(dá)到穩(wěn)定時(shí),計(jì)算的時(shí)間花費(fèi)隨節(jié)點(diǎn)個(gè)數(shù)的增加變化趨勢(shì),從實(shí)驗(yàn)結(jié)果可以得出其變化大致呈現(xiàn)一種線(xiàn)性趨勢(shì)。

        圖6 模型計(jì)算時(shí)間隨選取的節(jié)點(diǎn)個(gè)數(shù)變化趨勢(shì)Fig.6 Model calculation time changing with the number of selected nodes

        在實(shí)驗(yàn)過(guò)程中,對(duì)于數(shù)據(jù)源間的可信度度量公式考慮到本地和全局可信度;對(duì)于數(shù)據(jù)源的可信度度量公式考慮到其提供歷史數(shù)據(jù)的可信度與可信虛擬網(wǎng)絡(luò)中各層對(duì)其的推薦可信度;對(duì)于數(shù)據(jù)的可信度度量公式則考慮到其對(duì)立事件的概率。上述模型的可信度計(jì)算函數(shù),本文都考慮到時(shí)間是影響可信度計(jì)算的重要因素之一,除此之外,數(shù)據(jù)源的行為特征也是本文考慮的重要因素,同時(shí)添加了行為特征懲罰因素。

        3 結(jié) 論

        本文通過(guò)分析電網(wǎng)數(shù)據(jù)的典型特征和屬性,結(jié)合電力系統(tǒng)不良數(shù)據(jù)辨識(shí)模型和數(shù)據(jù)可信分析模型,給出了電網(wǎng)數(shù)據(jù)的可信度量的分析模型,提出了可信虛擬網(wǎng)絡(luò)構(gòu)建方法。選取電網(wǎng)數(shù)據(jù)實(shí)例,驗(yàn)證了模型可行性。實(shí)驗(yàn)結(jié)果表明該模型在數(shù)據(jù)源提供數(shù)據(jù)量越多的情況下,越能對(duì)所提供電網(wǎng)數(shù)據(jù)的可信度進(jìn)行準(zhǔn)確分析,很好地滿(mǎn)足了電網(wǎng)數(shù)據(jù)的可信需求。但本文的模型有些方面需要進(jìn)一步的研究,一方面,本文模型的參數(shù)值是基于主觀性和經(jīng)驗(yàn)性選取的,需要進(jìn)行多次調(diào)整以適應(yīng)不同的場(chǎng)景,另一方面,對(duì)于構(gòu)建電網(wǎng)可信性分析網(wǎng)絡(luò)的方法仍需要完善,這些都是今后的進(jìn)一步研究工作的重點(diǎn)。

        [1] 張東霞, 苗新, 劉麗平, 等. 智能電網(wǎng)大數(shù)據(jù)技術(shù)發(fā)展研究[J]. 中國(guó)電機(jī)工程學(xué)報(bào), 2015, 35(1): 2-12.

        [2] HAO Jinping, PIECHOCKI R J, KALESHI D, et al. Sparse malicious false data injection attacks and defense mechanisms in smart grids[J]. IEEE Transactions on Industrial Informatics, 2015, 11(5): 1198-1209.

        [3] 高昆侖, 辛耀中, 李釗, 等. 智能電網(wǎng)調(diào)度控制系統(tǒng)安全防護(hù)技術(shù)及發(fā)展[J]. 電力系統(tǒng)自動(dòng)化, 2015, 39(1): 48-52.

        [4] 李文武, 游文霞, 王先培. 電力系統(tǒng)信息安全研究綜述[J]. 電力系統(tǒng)保護(hù)與控制, 2011,39(10):140-147.

        [5] DURAN-PAZ J L, PEREZ-HIDALGO F, DURAN-MARTINE M J. Bad data detection of unequal magnitudes in state estimation of power systems[J]. IEEEPower Engineering Review, 2002, 121(5): 57-60.

        [6] HUANG SHYH-JIER, LIN JEU-MIN. Enhancement of anomalous data mining in power system predicting-aided state estimation[J]. IEEE Transactions on Power System, 2004, 19(1): 610-619.

        [7] 孟建良, 劉德超. 一種基于Spark和聚類(lèi)分析的辨識(shí)電力系統(tǒng)不良數(shù)據(jù)新方法[J]. 電力系統(tǒng)保護(hù)與控制, 2016, 44(3): 85-91.

        [8] 王興志, 嚴(yán)正, 沈沉, 等. 基于在線(xiàn)核學(xué)習(xí)的電網(wǎng)不良數(shù)據(jù)檢測(cè)與辨識(shí)方法[J]. 電力系統(tǒng)保護(hù)與控制, 2012,40(1): 50-55.

        [9] 張艷軍, 葛延峰, 高凱, 等. 基于廣域測(cè)量系統(tǒng)的新息圖辨識(shí)不良數(shù)據(jù)方法[J]. 電力系統(tǒng)自動(dòng)化, 2010, 34(23): 25-29.

        [10] 王守信, 張莉, 李鶴松. 一種基于云模型的主觀信任評(píng)價(jià)方法[J]. 軟件學(xué)報(bào), 2010, 21(6): 1341-1352.

        [11] 唐文, 陳鐘. 基于模糊集合理論的主觀信任管理模型研究[J]. 軟件學(xué)報(bào), 2003, 14(8): 1401-1408.

        [12] 李玲玲, 朱芬芬, 姚致清, 等. 基于可信度的可靠性度量云模型[J]. 電力系統(tǒng)保護(hù)與控制, 2012, 40(8): 90-94.

        [13] 張仕斌, 許春香. 基于云模型的信任評(píng)估方法研究[J]. 計(jì)算機(jī)學(xué)報(bào), 2013, 36(2):422-431.

        [14] 張琳, 劉婧文, 王汝傳, 等. 基于改進(jìn)D-S證據(jù)理論的信任評(píng)估模型[J]. 通信學(xué)報(bào), 2013, 34(7): 167-173.

        [15] 趙秋月, 左萬(wàn)利, 田中生, 等. 一種基于改進(jìn)D-S證據(jù)理論的信任關(guān)系強(qiáng)度評(píng)估方法研究[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37(4): 873-883.

        [16] 張巍, 朱艷春, 孫寶文, 等. 基于模糊認(rèn)知圖和證據(jù)理論的FCM-DS信任模型[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2016, 37(6): 1259-1262.

        Research on Credibility Measurement Model of Power Grid Data

        CHENG Xiaorong, LI Tianqi

        (1. School of Control and Computer Engineering, North China Electric Power University, Baoding 071003, China)

        The untrusted data in power system reduces the accuracy of the state estimation results. The credibility requirement of data in the power grid is analyzed and identification of bad data in the grid and the theories of credible data are studied. On the basis of these studies, a hierarchical and dynamic credibility analysis model for grid data was established which takes into account weight factors such as time factor and penalty factor. Credibility analysis of power data can be summarized as combinatorial problems including data source, relations between different data sources and network path of data dissemination. The virtual network of the credibility which was on the base of dependent relationship of data source was dynamically established by calculating the credibility between data sources, the credibility of data and the credibility of data source. And the overall credibility of data is normally evaluated by the virtual network. The simulation results show that the model can satisfy the requirement of the credibility estimation of grid data, and also provide ideas to solve the problem of the credibility measurement for further research.

        power grid data; big data; credibility; dynamism; trusted computing

        10.3969/j.ISSN.1007-2691.2017.02.12

        2016-07-19.

        TM711

        A

        1007-2691(2017)02-0083-08

        程曉榮(1963-),女,教授,主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)應(yīng)用、網(wǎng)絡(luò)信息安全;李天琦(1989-),男,碩士研究生,主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)應(yīng)用、網(wǎng)絡(luò)信息安全。

        猜你喜歡
        可信性數(shù)據(jù)源信任
        可變情報(bào)板發(fā)布內(nèi)容可信性檢測(cè)系統(tǒng)探究
        基于可信性的鍋爐安全質(zhì)量綜合評(píng)價(jià)研究
        在區(qū)間上取值的模糊變量的可信性分布
        表示信任
        Five golden rules for meeting management
        Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
        基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評(píng)價(jià)研究
        嚶嚶嚶,人與人的信任在哪里……
        桃之夭夭B(2017年2期)2017-02-24 17:32:43
        從生到死有多遠(yuǎn)
        基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評(píng)價(jià)算法
        国产sm调教视频在线观看| 亚洲综合小综合中文字幕| 久久精品国产亚洲综合av| 人人人妻人人人妻人人人| 日本做受120秒免费视频| 亚洲色欲色欲www在线播放| 亚洲一区二区自拍偷拍| 日本成人三级视频网站| 亚洲最大av在线精品国产| 精品亚洲成av人在线观看| 亚洲日产一线二线三线精华液 | 国产精品va在线播放我和闺蜜| 老熟女熟妇嗷嗷叫91| 日本视频一区二区三区三州| 色熟妇人妻久久中文字幕 | 精品无码久久久久久久动漫| 国产好片日本一区二区三区四区| 色男色女午夜福利影院| 亚洲av无码乱码国产麻豆| 超碰97资源站| 久久精品伊人无码二区| 亚洲精品一区二区三区国产 | av中文字幕性女高清在线| 人妻少妇偷人精品免费看| 少妇性饥渴无码a区免费| 日本www一道久久久免费榴莲| 国产精品自在在线午夜出白浆| 人妻蜜桃日产一本久道综合在线 | 国产免费午夜a无码v视频| 亚洲熟伦在线视频| 久久精见国产亚洲av高清热| 搡女人真爽免费视频大全| 四川老熟妇乱子xx性bbw| 国产成年无码久久久免费| 久久久噜噜噜噜久久熟女m| 久久精品国产亚洲夜色av网站| 高清破外女出血av毛片| 中文字幕亚洲无线码高清| 东京热日本道免费高清| 久草青青91在线播放| 天美传媒一区二区|