盛麗華,沈 暉
(南通大學(xué)信息化中心,江蘇 南通 226019)
多源異構(gòu)信息作為社會(huì)經(jīng)濟(jì)活動(dòng)中大量出現(xiàn)的非結(jié)構(gòu)化、非標(biāo)準(zhǔn)化數(shù)據(jù)資源,對(duì)監(jiān)測(cè)結(jié)果采集和分析有著至關(guān)重要的作用。由于計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的不斷進(jìn)步,各項(xiàng)系統(tǒng)的結(jié)構(gòu)日益復(fù)雜。系統(tǒng)內(nèi)部數(shù)據(jù)類型開始復(fù)雜化和多樣化,如何準(zhǔn)確監(jiān)測(cè)多源異構(gòu)數(shù)據(jù)是現(xiàn)階段研究的熱點(diǎn)話題[1-2]。
國(guó)內(nèi)相關(guān)專家針對(duì)上述內(nèi)容展開了大量研究,例如涂夢(mèng)昭等人[3]分析地下水存水量的變化趨勢(shì),構(gòu)建利用GRACE衛(wèi)星數(shù)據(jù)校準(zhǔn)水文模型,通過(guò)模型完成地下儲(chǔ)水量監(jiān)測(cè)。王周虹等人[4]將網(wǎng)分裝置采集的信息上調(diào)至調(diào)控主站,通過(guò)變電站內(nèi)各種類型的配置描述文件,構(gòu)建調(diào)控交互數(shù)據(jù)監(jiān)測(cè)模型,利用信息之間的關(guān)聯(lián)度將離散報(bào)文匹配分析處理,最終實(shí)現(xiàn)交互數(shù)據(jù)的監(jiān)測(cè)。王軍飛等人[5]主要通過(guò)PS點(diǎn)選取方法提取邊坡數(shù)據(jù)特征,通過(guò)相干系數(shù)初選PS點(diǎn),同時(shí)剔除極限誤差點(diǎn),最終獲取PS點(diǎn),實(shí)現(xiàn)數(shù)據(jù)監(jiān)測(cè)。
在上述幾種監(jiān)測(cè)方法的基礎(chǔ)上,提出一種基于邊緣計(jì)算的多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè)方法。實(shí)驗(yàn)結(jié)果表明,所提方法的實(shí)時(shí)性和監(jiān)測(cè)性能均得到明顯改善。
半?yún)?shù)回歸模型主要是由參數(shù)分量和非參數(shù)分量共同組成,具有比較強(qiáng)的解釋能力。多源異構(gòu)數(shù)據(jù)由于存在非線性誤差,所以可以將觀測(cè)模型表示為式(1)的形式:
s=Ha+s(t)+u
(1)
式中,s(t)代表和時(shí)間存在關(guān)聯(lián)的函數(shù),即非線性函數(shù);Ha代表半?yún)?shù)回歸模型;u代表多源異構(gòu)數(shù)據(jù)中的噪聲;s代表觀測(cè)模型。
通過(guò)獲取的多源異構(gòu)數(shù)據(jù),估計(jì)得到非線性函數(shù)對(duì)應(yīng)的值,利用觀測(cè)值減去全部線性值,進(jìn)而構(gòu)建觀測(cè)模型為:
(2)
為了獲取更加滿意的去噪效果,引入小波閾值收縮法去噪處理。由于小波變換中的正變換具有比較強(qiáng)的相關(guān)性,可以有效分解信號(hào)的能量,獲取信號(hào)在小波域集合中的小波系數(shù)。將半?yún)?shù)回歸模型引入到小波閾值收縮方法中,將其應(yīng)用于多源異構(gòu)數(shù)據(jù)預(yù)處理中[6-7],詳細(xì)的操作步驟如下所示:
1)對(duì)于全部的多源異構(gòu)數(shù),通過(guò)最小二乘多項(xiàng)式擬合處理,獲取對(duì)應(yīng)的擬合值集合D,如式(3)所示:
(3)
2)計(jì)算全部多源異構(gòu)數(shù)據(jù)對(duì)應(yīng)的殘差值,如式(4)所示:
τ(x,y)=D·sgn(ω)-β(x,y)*s(t)
(4)
式中,τ(x,y)代表多源異構(gòu)數(shù)據(jù)的殘差值;ω代表噪聲標(biāo)準(zhǔn)方差;β(x,y)代表半軟閾值。
3)檢驗(yàn)步驟2)獲取的殘差值是否為白噪聲序列,假設(shè)是,則直接跳轉(zhuǎn)至步驟5);反之,則繼續(xù)下一步。
4)選取Daubechies小波對(duì)多源異構(gòu)數(shù)據(jù)殘差序列分解處理,獲取小波系數(shù)。為了有效避免傳統(tǒng)閾值方法存在的不足,引入半軟閾值方法對(duì)多源異構(gòu)數(shù)據(jù)預(yù)處理,采用Daubechies小波對(duì)去噪后的小波系數(shù)重構(gòu)處理,進(jìn)而估計(jì)出對(duì)應(yīng)的非線性函數(shù),同時(shí)跳轉(zhuǎn)至步驟1)。
5)輸出擬合值,完成多源異構(gòu)數(shù)據(jù)預(yù)處理[8-9]。
分析邊緣計(jì)算的相關(guān)定義和技術(shù)特點(diǎn),可以有效解決多源異構(gòu)數(shù)據(jù)融合問(wèn)題。優(yōu)先給出多源異構(gòu)數(shù)據(jù)標(biāo)準(zhǔn)化處理的詳細(xì)操作步驟:
1)將采集到的多源異構(gòu)數(shù)據(jù)通過(guò)時(shí)序特征分解處理,將B作為標(biāo)準(zhǔn)轉(zhuǎn)換的輸入,設(shè)定B以矩形的形式存在,如式(5)所示:
(5)
2)對(duì)多源異構(gòu)數(shù)據(jù)的形成特點(diǎn)展開深入分析,融合全部類型的數(shù)據(jù),進(jìn)而完成數(shù)據(jù)變換處理,根據(jù)數(shù)據(jù)的類型制定對(duì)應(yīng)的廣義冪-標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)化變換方案,即:
①假設(shè)B是以向量的形式存在,則可以直接得到變換處理后的向量結(jié)果;
②假設(shè)B的存儲(chǔ)形式為矩陣,需要采用列向量計(jì)算全部數(shù)據(jù)的均值和標(biāo)準(zhǔn)差,對(duì)兩者標(biāo)準(zhǔn)化處理,即可獲取對(duì)應(yīng)的結(jié)果矩陣;
③假設(shè)B的表現(xiàn)形式為多維數(shù)組,則需要根據(jù)維度信息對(duì)數(shù)據(jù)求解,得到與之對(duì)應(yīng)的均值和標(biāo)準(zhǔn)差,對(duì)兩者標(biāo)準(zhǔn)化處理,即可獲取高維數(shù)據(jù)組。
3)將B采用廣義冪-標(biāo)準(zhǔn)分?jǐn)?shù)數(shù)據(jù)展開標(biāo)準(zhǔn)化處理B′,對(duì)應(yīng)的矩陣為:
(6)
4)通過(guò)選定的多源異構(gòu)數(shù)據(jù)處理方案對(duì)數(shù)據(jù)迭代處理,同時(shí)重復(fù)步驟2)和步驟3),完成迭代處理之后,將全部匯聚數(shù)據(jù)變換處理。
5)在完成多源異構(gòu)數(shù)據(jù)的量綱和量級(jí)處理處理后,全部數(shù)據(jù)的格式均為統(tǒng)一的,可以將其直接傳輸?shù)较到y(tǒng)內(nèi)存儲(chǔ),主要是為了簡(jiǎn)化后續(xù)多源異構(gòu)數(shù)據(jù)的融合步驟,當(dāng)全部數(shù)據(jù)完成標(biāo)準(zhǔn)化處理后,則停止計(jì)算。
在邊緣計(jì)算模式下,多源異構(gòu)數(shù)據(jù)的融合處理主要包含三個(gè)步驟,分別為:
1)信息融合處理;
2)狀態(tài)評(píng)估方法;
3)關(guān)聯(lián)決策。
(7)
式中,cm代表測(cè)試數(shù)據(jù)集;m代表測(cè)試數(shù)據(jù)集總數(shù);t代表數(shù)據(jù)采集時(shí)間;E(u)代表隨機(jī)兩個(gè)成分之間的沖突程度。
多源異構(gòu)數(shù)據(jù)融合的操作步驟如下所示:
1)對(duì)多源異構(gòu)數(shù)據(jù)屬性子集展開概率初始化處理,將R設(shè)定為多源異構(gòu)數(shù)據(jù)融合模型的框架,則函數(shù)u:2u→[0,1]需要滿足以下約束條件:
(8)
式中,u(A)代表多源異構(gòu)數(shù)據(jù)之間的信任程度。
2)根據(jù)步驟1)設(shè)定的約束條件可以獲取信任函數(shù)Bel(A),如式(9)所示:
(9)
式中,u(B)代表全部子集分配概率值之和;A和B代表不同的多源異構(gòu)數(shù)據(jù)融合集合。
3)設(shè)定多源異構(gòu)數(shù)據(jù)融合似然函數(shù),以此為依據(jù)確定全部數(shù)據(jù)特征屬性的信任程度值。其中,數(shù)據(jù)屬性成分對(duì)應(yīng)的可信度ρ(a)可以采用式(10)計(jì)算:
(10)
4)計(jì)算多源異構(gòu)數(shù)據(jù)融合的信任空間,進(jìn)而獲取信任函數(shù)和似然函數(shù)之間的關(guān)系表達(dá)式,如式(11)所示:
(11)
式中,τ(a)代表信任函數(shù);pl(a)代表多源異構(gòu)數(shù)據(jù)的特征度量結(jié)果;?(a)代表似然函數(shù)。
5)通過(guò)構(gòu)建的多源異構(gòu)數(shù)據(jù)融合框架確定數(shù)據(jù)合成規(guī)則,根據(jù)不同源中數(shù)據(jù)特征屬性索引完成特征級(jí)數(shù)據(jù)融合處理,最終完成數(shù)據(jù)融合處理[10-11]。
在完成多源異構(gòu)數(shù)據(jù)的預(yù)處理和融合處理之后,采用隱半馬爾可夫模型展開數(shù)據(jù)信息化監(jiān)測(cè)。隱半馬爾可夫模型是一種操作簡(jiǎn)單且效率高的隨機(jī)模型,在各個(gè)研究領(lǐng)域內(nèi)都得到了十分廣泛的應(yīng)用。
隱半馬爾可夫模型ψ是由一個(gè)三元組成的,對(duì)應(yīng)的表達(dá)式如式(12)所示:
ψ=(r,M,Z)
(12)
式中,r代表系統(tǒng)的初始狀態(tài)概率;Z代表狀態(tài)集合;M代表狀態(tài)空間的轉(zhuǎn)移概率矩陣,如式(13)所示:
(13)
在系統(tǒng)的調(diào)用序列中,可以將不同數(shù)據(jù)的排列組合看做是模型的不同狀態(tài)。在數(shù)據(jù)使用過(guò)程中,需要更好完成數(shù)據(jù)的轉(zhuǎn)換和銜接等操作,為后續(xù)的數(shù)據(jù)監(jiān)測(cè)提供一定的數(shù)據(jù)支撐[12-13]。
將提取的特征向量設(shè)定為隱半馬爾可夫模型的狀態(tài),則狀態(tài)和轉(zhuǎn)移可表示為圖1的形式:
圖1 隱半馬爾可夫模型狀態(tài)及轉(zhuǎn)移圖
隱半馬爾可夫模型中的狀態(tài)轉(zhuǎn)移矩陣和初始分布可以通過(guò)對(duì)歷史數(shù)據(jù)的觀察得到。在訓(xùn)練數(shù)據(jù)中,為了完成數(shù)據(jù)的拓展,則隱半馬爾可夫模型的狀態(tài)轉(zhuǎn)移概率為:
1)必要狀態(tài)下的狀態(tài)轉(zhuǎn)移概率?ij可以表示為式(14)的形式:
(14)
式中,Qij代表狀態(tài)i向狀態(tài)j轉(zhuǎn)移的概率;Nij代表狀態(tài)i向狀態(tài)j轉(zhuǎn)移的總次數(shù);ε代表必要狀態(tài)。
2)補(bǔ)充狀態(tài)下的狀態(tài)轉(zhuǎn)移概率如式(15)所示:
?i(u,v)={Qij-ε}·Nij
(15)
隨著多源異構(gòu)數(shù)據(jù)的長(zhǎng)度持續(xù)增加,經(jīng)過(guò)計(jì)算可以得到各個(gè)觀測(cè)序列的取值概率。但是在正常狀態(tài)下,概率值會(huì)越來(lái)越小,無(wú)法將概率取值作為判斷觀測(cè)序列是否正常的依據(jù)。所以,需要對(duì)長(zhǎng)度完全一致的觀測(cè)序列展開監(jiān)測(cè)更加有意義。
為了方便多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè),可使用以下的遞推公式L(s):
(16)
式中,tu,v代表滑動(dòng)窗口;對(duì)于滑動(dòng)窗口而言,需要滿足以下條件:
1)確定性:
對(duì)數(shù)據(jù)集訓(xùn)練處理,得到各個(gè)數(shù)據(jù)集對(duì)應(yīng)的狀態(tài)量,確保各個(gè)狀態(tài)量在訓(xùn)練數(shù)量增加的情況下不會(huì)發(fā)生任何變化。
2)隨機(jī)性:
將狀態(tài)設(shè)定為變量,通過(guò)一種隨機(jī)規(guī)則可以較好描述系統(tǒng)調(diào)用的隨機(jī)性。
通過(guò)對(duì)隱半馬爾可夫模型[14-15]的分析,建立和進(jìn)程對(duì)應(yīng)的隨機(jī)模型,將研究系統(tǒng)內(nèi)對(duì)應(yīng)的調(diào)用序列設(shè)定為一個(gè)隨機(jī)信號(hào),全部信號(hào)均來(lái)自設(shè)定的信號(hào)源,同時(shí)進(jìn)程具有特定的功能。由于大部分信號(hào)離散源是有記憶的,所以可以采用具有時(shí)間規(guī)律的條件熵展開衡量,同時(shí)設(shè)定隱半馬爾可夫模型的狀態(tài)序列長(zhǎng)度H(x,y),對(duì)應(yīng)的計(jì)算式為:
(17)
完成上述操作之后,將融合處理后的數(shù)據(jù)輸入到隱半馬爾可夫模型中,實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè)。
為了驗(yàn)證基于邊緣計(jì)算的多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè)(所提方法)的有效性,分別采取參考文獻(xiàn)[3]方法與參考文獻(xiàn)[4]方法做對(duì)比。實(shí)驗(yàn)選取Windows 2015作為實(shí)驗(yàn)平臺(tái),數(shù)據(jù)庫(kù)為SQL,對(duì)應(yīng)的組成架構(gòu)如圖2所示。
圖2 實(shí)驗(yàn)架構(gòu)示意圖
采用不同方法對(duì)數(shù)據(jù)監(jiān)測(cè)實(shí)時(shí)性展開測(cè)試處理,實(shí)驗(yàn)測(cè)試結(jié)果如圖3所示。
圖3 不同方法的數(shù)據(jù)監(jiān)測(cè)實(shí)時(shí)性測(cè)試結(jié)果對(duì)比
分析圖3中的實(shí)驗(yàn)數(shù)據(jù)可知,各個(gè)方法的數(shù)據(jù)監(jiān)測(cè)實(shí)時(shí)性會(huì)隨著時(shí)間的變化而變化。在三種方法,所提方法的多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè)實(shí)時(shí)性百分比均處于95%以上,而參考文獻(xiàn)[3]方法與參考文獻(xiàn)[4]方法的檢測(cè)實(shí)時(shí)百分比在75%~80%之間,所提方法的實(shí)時(shí)性明顯優(yōu)于其它兩種方法。
為了驗(yàn)證所提方法的監(jiān)測(cè)性能,在設(shè)定時(shí)間內(nèi)分析采用各個(gè)方法獲取的多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè)結(jié)果,實(shí)驗(yàn)結(jié)果如圖4所示。
圖4 不同方法的多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè)結(jié)果對(duì)比
由圖4中的實(shí)驗(yàn)數(shù)據(jù)可知,采用不同方法對(duì)多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè)處理,經(jīng)過(guò)對(duì)比分析證明,采用所提方法獲取監(jiān)測(cè)結(jié)果與實(shí)際值一致,而另外兩種方法獲取的監(jiān)測(cè)結(jié)果和真實(shí)值存在較大誤差。因此可以得出,所提方法的監(jiān)測(cè)結(jié)果更加精準(zhǔn)。
為了準(zhǔn)確監(jiān)測(cè)融合處理后的數(shù)據(jù)變化情況,提出一種基于邊緣計(jì)算的多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè)。采用小波閾值去噪方法對(duì)多源異構(gòu)數(shù)據(jù)預(yù)處理,消除其線性誤差。構(gòu)建多源異構(gòu)數(shù)據(jù)融合架構(gòu),完成數(shù)據(jù)融合處理,并將其輸入到隱半馬爾可夫模型中,實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)融合信息化監(jiān)測(cè)。經(jīng)過(guò)實(shí)驗(yàn)測(cè)試證明,所提方法可以獲取高精度的監(jiān)測(cè)結(jié)果,且監(jiān)測(cè)實(shí)時(shí)性明顯優(yōu)于其它方法。在后續(xù)研究過(guò)程中,對(duì)所提方法展開更加全面的優(yōu)化處理,可以進(jìn)一步增加多源異構(gòu)數(shù)據(jù)來(lái)源的廣度,例如監(jiān)測(cè)對(duì)象的聲音信號(hào)以及生產(chǎn)計(jì)劃等,充分利用多源異構(gòu)數(shù)據(jù)的優(yōu)勢(shì)。