, ,,,
(國(guó)網(wǎng)新疆電力公司電力科學(xué)研究院,烏魯木齊 830011)
物聯(lián)網(wǎng)環(huán)境下Web數(shù)據(jù)庫(kù)異常數(shù)據(jù)檢測(cè)方法研究
張清川,孫帆,王宇晨,李金良,王潔
(國(guó)網(wǎng)新疆電力公司電力科學(xué)研究院,烏魯木齊830011)
物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)網(wǎng)絡(luò)承載著不同的網(wǎng)絡(luò)載體和網(wǎng)絡(luò)信道,web數(shù)據(jù)庫(kù)通過云儲(chǔ)存的形式來(lái)實(shí)現(xiàn)資源共享,云儲(chǔ)存產(chǎn)生的異常數(shù)據(jù)會(huì)給網(wǎng)絡(luò)信息web數(shù)據(jù)庫(kù)空間帶來(lái)一種危機(jī)感和存儲(chǔ)數(shù)據(jù)容量空間的不足,所以對(duì)物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)異常數(shù)據(jù)的檢測(cè)要求更精準(zhǔn);傳統(tǒng)的異常數(shù)據(jù)檢測(cè)方法采用簡(jiǎn)化梯度方法進(jìn)行web數(shù)據(jù)庫(kù)異常數(shù)據(jù)檢測(cè),對(duì)含有干擾頻率成份的web異常數(shù)據(jù)不能準(zhǔn)確的去除,檢測(cè)性能低;為此,提出一種基于時(shí)空關(guān)聯(lián)的分布式的web數(shù)據(jù)庫(kù)異常數(shù)據(jù)檢測(cè)方法,通過與集中式算法的精度和消耗量進(jìn)行對(duì)比,仿真實(shí)驗(yàn)表明,所提方法進(jìn)行異常數(shù)據(jù)檢測(cè),減少了web數(shù)據(jù)的能量消耗,信號(hào)幅值大于干擾噪聲數(shù)據(jù)幅值,具有較好的抗干擾性能。
網(wǎng)絡(luò)信道;干擾頻率;時(shí)空關(guān)聯(lián)
隨著物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)網(wǎng)絡(luò)技術(shù)的發(fā)展,web數(shù)據(jù)庫(kù)中的數(shù)據(jù)挖掘已成為重點(diǎn)研究對(duì)象。目前的研究工作主要集中在web數(shù)據(jù)庫(kù)中的異常數(shù)據(jù)檢測(cè)[1],web中數(shù)據(jù)之間關(guān)聯(lián)分析上。由于物聯(lián)網(wǎng)的運(yùn)行依存的數(shù)據(jù)庫(kù)較為龐大且數(shù)據(jù)差異化明顯,一旦產(chǎn)生異常,將直接影響到物聯(lián)網(wǎng)的正常運(yùn)行,因此對(duì)物聯(lián)網(wǎng)環(huán)境下的數(shù)據(jù)庫(kù)異常數(shù)據(jù)的有效檢測(cè)已經(jīng)成為該領(lǐng)域研究的重點(diǎn)課題之一。
一個(gè)重要的實(shí)際應(yīng)用意義是實(shí)時(shí)檢測(cè)web數(shù)據(jù)庫(kù)異常數(shù)據(jù),例如,在物聯(lián)網(wǎng)環(huán)境下,檢測(cè)web數(shù)據(jù)庫(kù)網(wǎng)絡(luò)中的每個(gè)異常數(shù)據(jù)節(jié)點(diǎn)時(shí),都可以通過對(duì)web數(shù)據(jù)流進(jìn)行檢測(cè),從而可以確定是否存在異常數(shù)據(jù),便于及時(shí)對(duì)web數(shù)據(jù)庫(kù)中的異常數(shù)據(jù)進(jìn)行處理。另外,web數(shù)據(jù)庫(kù)的能量消耗主要用于數(shù)據(jù)傳輸,其中節(jié)省能量消耗的重要舉措之一是減少數(shù)據(jù)的傳輸,如果首先建立一個(gè)web數(shù)據(jù)流模型[2],并通過此模型檢測(cè)web數(shù)據(jù)庫(kù)中的異常數(shù)據(jù),用戶可以在規(guī)定的精確度范圍內(nèi)只發(fā)送不符合模型的異常數(shù)據(jù),而不發(fā)送符合模型的數(shù)據(jù),這會(huì)大大減少web數(shù)據(jù)傳輸量,重新建立近似異常數(shù)據(jù)的web數(shù)據(jù)庫(kù),從而使web數(shù)據(jù)庫(kù)異常數(shù)據(jù)的檢測(cè)更精準(zhǔn)。
在網(wǎng)絡(luò)入侵檢測(cè)[3]和傳統(tǒng)數(shù)據(jù)挖掘中,物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)異常數(shù)據(jù)的檢測(cè)應(yīng)用比較廣泛,但因web網(wǎng)絡(luò)中異常數(shù)據(jù)和物聯(lián)網(wǎng)的特定環(huán)境,web異常數(shù)據(jù)檢測(cè)研究面臨許多挑戰(zhàn)。很多知名人士試圖采用特定的方法,建立web數(shù)據(jù)庫(kù)異常數(shù)據(jù)流模型,來(lái)檢測(cè)web數(shù)據(jù)庫(kù)中異常數(shù)據(jù),文獻(xiàn)[4]提出基于高維隨機(jī)矩陣檢測(cè)web數(shù)據(jù)庫(kù)異常數(shù)據(jù)的大數(shù)據(jù)建模與分析方法。根據(jù)高維隨機(jī)矩陣?yán)碚?,進(jìn)行了WAMS量測(cè)web數(shù)據(jù)的高維隨機(jī)矩陣模型構(gòu)建,然后推導(dǎo)了web數(shù)據(jù)庫(kù)異常數(shù)據(jù)檢測(cè)理論和方法,最后模擬實(shí)測(cè)量web數(shù)據(jù)庫(kù)的異常數(shù)據(jù),通過對(duì)比不同異常數(shù)據(jù)驗(yàn)證web數(shù)據(jù)庫(kù)的問題,該方法實(shí)踐起來(lái)簡(jiǎn)單,但存在效率低的問題。文獻(xiàn)[5] 傳感器網(wǎng)絡(luò)的異常數(shù)據(jù)檢測(cè)對(duì)于物聯(lián)網(wǎng)環(huán)境下web異常數(shù)據(jù)檢測(cè)具有非常重要的意義?;趙eb數(shù)據(jù)庫(kù)異常數(shù)據(jù)的檢測(cè)問題,提出了web數(shù)據(jù)庫(kù)異常數(shù)據(jù)無(wú)線傳感器檢測(cè)方法。提出的方法可以預(yù)知下一時(shí)刻的數(shù)據(jù)網(wǎng)絡(luò)在每個(gè)時(shí)刻最近的歷史數(shù)據(jù)網(wǎng)絡(luò)。通過數(shù)據(jù)網(wǎng)絡(luò)的模型區(qū)間,確定web數(shù)據(jù)庫(kù)概率為p的異常數(shù)據(jù)置信區(qū)間。當(dāng)下時(shí)刻數(shù)據(jù)在置信區(qū)間內(nèi)時(shí),則該數(shù)據(jù)可視為正常;反之,則為異常。仿真實(shí)驗(yàn)表明,基于線性神經(jīng)網(wǎng)絡(luò)的web數(shù)據(jù)庫(kù)異常數(shù)據(jù)檢測(cè)方法的檢測(cè)率達(dá)到了98.2%,誤差率小于0.65%;基于web數(shù)據(jù)庫(kù)神經(jīng)網(wǎng)絡(luò)的異常數(shù)據(jù)檢測(cè)方法的檢測(cè)率為96.3%,誤差率不超過0.76%,這兩種方法在檢測(cè)web數(shù)據(jù)庫(kù)異常數(shù)據(jù)時(shí)誤差都很小,但采用這兩種方法的過程很繁瑣。文獻(xiàn)[6]提出一種基于蟻群方法來(lái)對(duì)web數(shù)據(jù)庫(kù)異常數(shù)據(jù)進(jìn)行檢測(cè),該方法是將蟻群方法和屬性相關(guān)分析相結(jié)合的屬性web異常點(diǎn)檢測(cè)方法。將蟻群行走過的路程作為異常路徑,計(jì)算異常路徑上各個(gè)節(jié)點(diǎn)數(shù)據(jù)值,并根據(jù)數(shù)據(jù)值確定web數(shù)據(jù)庫(kù)數(shù)據(jù)異常點(diǎn)。實(shí)驗(yàn)結(jié)果表明,該方法在準(zhǔn)確率上很達(dá)標(biāo),但容易產(chǎn)生錯(cuò)誤的判斷。
針對(duì)上述問題,本文提出一種基于時(shí)空關(guān)聯(lián)的分布式異常數(shù)據(jù)檢測(cè)方法,目的是為了使物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)異常數(shù)據(jù)的檢測(cè)準(zhǔn)確率更高,在web異常數(shù)據(jù)網(wǎng)絡(luò)節(jié)點(diǎn)轉(zhuǎn)入到的數(shù)據(jù)庫(kù)中,不同的數(shù)據(jù)屬性對(duì)應(yīng)了不同的權(quán)重[7]。實(shí)驗(yàn)結(jié)果表明,此方法減少了異常數(shù)據(jù)能量的消耗,提高了異常數(shù)據(jù)的檢測(cè)精確度。
物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)異常數(shù)據(jù)檢測(cè)在各個(gè)數(shù)據(jù)信道任務(wù)的異常數(shù)據(jù)模型的狀態(tài)空間為:
s={(k,n),0≤k≤K,0≤n≤N}
(1)
在物聯(lián)網(wǎng)環(huán)境下,通過數(shù)據(jù)云儲(chǔ)存[8]的形式實(shí)現(xiàn)資源共享,web數(shù)據(jù)在異常傳輸調(diào)度過程中產(chǎn)生異常數(shù)據(jù),此時(shí)web數(shù)據(jù)庫(kù)交叉信息鏈表示為:
(2)
式中,異常數(shù)據(jù)系統(tǒng)中的web數(shù)據(jù)庫(kù)異常數(shù)據(jù)的數(shù)量用CB表示,i表示web異常數(shù)據(jù)處理過程中的數(shù)量。對(duì)于一個(gè)大眾化的異常數(shù)據(jù)web接收點(diǎn),當(dāng)n=N時(shí),CPU進(jìn)行web數(shù)據(jù)庫(kù)異常處理;當(dāng)n=1,…,N-1時(shí),得到web異常數(shù)據(jù)信息狀態(tài)功率,假設(shè)k為web數(shù)據(jù)節(jié)點(diǎn)的信息范圍內(nèi)有n個(gè)網(wǎng)絡(luò)鄰居數(shù)據(jù)節(jié)點(diǎn),物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)的異常數(shù)據(jù)平均吞吐量[9]γ用公式可以表示成:
(3)
所有物聯(lián)網(wǎng)數(shù)據(jù)通道中web數(shù)據(jù)庫(kù)異常數(shù)據(jù)所占的比例為數(shù)據(jù)庫(kù)過程web數(shù)據(jù)消耗因子:
(4)
式中,第k個(gè)物聯(lián)網(wǎng)數(shù)據(jù)在目前web異常數(shù)據(jù)環(huán)境中所需的數(shù)據(jù)數(shù)量用ZK來(lái)表示。
根據(jù)時(shí)空關(guān)聯(lián)的分布式異常數(shù)據(jù)的檢測(cè)方法,與web數(shù)據(jù)庫(kù)異常數(shù)據(jù)信號(hào)相混合,實(shí)現(xiàn)在多個(gè)已知干擾頻率異常數(shù)據(jù)干擾下的檢測(cè),為了使web異常數(shù)據(jù)信號(hào)異常數(shù)據(jù)解析化,建立物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)異常數(shù)據(jù)檢測(cè)解析模型:
z(t)=x(t)+iy(t)=a(t)eig(t)
(5)
式中,z(t)表示為物聯(lián)網(wǎng)異常數(shù)據(jù)信號(hào),web異常數(shù)據(jù)信號(hào)動(dòng)態(tài)模型的一部分用x(t)來(lái)表示,y(t)代表web異常數(shù)據(jù)信號(hào)的動(dòng)態(tài)函數(shù)[10],采取物聯(lián)網(wǎng)的固有形態(tài)進(jìn)行解釋,把web異常數(shù)據(jù)信號(hào)解析模型用多個(gè)web信號(hào)分別表示,得到物聯(lián)網(wǎng)數(shù)據(jù)的異常特征為[11]:
(6)
其中:θ(t)表示異常數(shù)據(jù)高頻分量,a(t)和θ(t)分別是在物聯(lián)網(wǎng)環(huán)境下異常數(shù)據(jù)的干擾特征幅度和相位息[12]。Web數(shù)據(jù)庫(kù)中的異常數(shù)據(jù)干擾頻率特征表達(dá)式為:
(7)
上式描述了web物聯(lián)網(wǎng)數(shù)據(jù)節(jié)點(diǎn)中的異常數(shù)據(jù)高頻校驗(yàn)位,用來(lái)表示生成web數(shù)據(jù)的干擾信號(hào),其中在物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)中異常數(shù)據(jù)權(quán)重為:
?ij=β×?(epkq),βgt;1
(8)
根據(jù)上式,每個(gè)物聯(lián)網(wǎng)數(shù)據(jù)干擾信道分量信號(hào)都可以通過計(jì)算得到檢測(cè)目標(biāo)為:
r1=x(t)-c1
(9)
綜上所述,為了使物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)異常數(shù)據(jù)檢測(cè)的準(zhǔn)確性,由此建設(shè)了web異常數(shù)據(jù)的物聯(lián)網(wǎng)信息網(wǎng)絡(luò)模型。
基于時(shí)空關(guān)聯(lián)的分布式異常數(shù)據(jù)檢測(cè)方法采用滑動(dòng)窗口機(jī)制來(lái)檢測(cè)web數(shù)據(jù)庫(kù)的異常數(shù)據(jù),假設(shè)一個(gè)物聯(lián)網(wǎng)異常數(shù)據(jù)可動(dòng)窗口為B,每隔Δ時(shí)間,web數(shù)據(jù)庫(kù)收到一個(gè)異常網(wǎng)絡(luò)數(shù)據(jù),若在正常的運(yùn)行下,一個(gè)網(wǎng)絡(luò)滑動(dòng)窗口B的物聯(lián)網(wǎng)異常數(shù)據(jù)個(gè)數(shù)為a個(gè),即B=Δa,網(wǎng)絡(luò)異常數(shù)據(jù)對(duì)象xi和xp之間的網(wǎng)絡(luò)運(yùn)行加權(quán)距離[13]:
(10)
式中,?l表示物聯(lián)網(wǎng)異常數(shù)據(jù)目標(biāo)屬性值l的權(quán)重,xil表示異常數(shù)據(jù)目標(biāo)xi的屬性值,xpl表示web異常數(shù)據(jù)庫(kù)對(duì)象xp的屬性值。web異常數(shù)據(jù)目標(biāo)xi的數(shù)據(jù)密度:
(11)
其中:Nb(xi)為異常數(shù)據(jù)目標(biāo)xi的第k個(gè)鄰近區(qū)域。異常數(shù)據(jù)目標(biāo)xi利用k相鄰的平均可達(dá)距離的倒數(shù)來(lái)檢測(cè)異常數(shù)據(jù)密度目標(biāo),充分的表達(dá)了xi周圍的異常數(shù)據(jù)分布狀況。從公式可得,當(dāng)目標(biāo)xi的臨近數(shù)據(jù)分布離散時(shí),其局部可達(dá)密度會(huì)較小,Web數(shù)據(jù)庫(kù)異常數(shù)據(jù)局部數(shù)據(jù)因子[14]:
(12)
綜上所述,基于時(shí)空關(guān)聯(lián)的分布式異常數(shù)據(jù)檢測(cè)方法,檢測(cè)web數(shù)據(jù)庫(kù)中的異常數(shù)據(jù)。利用異常數(shù)據(jù)對(duì)象和數(shù)據(jù)距離鄰域的方法[17-19],使得異常數(shù)據(jù)檢測(cè)過程方便,也更好的體現(xiàn)了該方法的準(zhǔn)確性和可行性。
以20 s為一個(gè)數(shù)據(jù)窗口,設(shè)web網(wǎng)絡(luò)節(jié)點(diǎn)采集異常數(shù)據(jù)的速度為3個(gè)每秒,在一個(gè)單位異常數(shù)據(jù)窗口內(nèi),仿真實(shí)驗(yàn)中收到的web異常數(shù)據(jù)總量為150個(gè)。隨著模擬時(shí)間延長(zhǎng),分別采用分布式算法和集中算法,測(cè)定能量消耗情況,獲得對(duì)比結(jié)果如圖1所示。圖1給出了物聯(lián)網(wǎng)環(huán)境下本文算法與傳統(tǒng)集中式異常數(shù)據(jù)檢測(cè)方法的能量消耗進(jìn)行比較分析。集中式異常數(shù)據(jù)檢測(cè)是將沒有進(jìn)行分簇處理的數(shù)據(jù)作為定義的。
圖1 時(shí)空關(guān)聯(lián)集中式與分布式能耗對(duì)比
由圖1可以看出,集中式異常數(shù)據(jù)的數(shù)據(jù)傳感網(wǎng)絡(luò)比時(shí)空關(guān)聯(lián)的分布式異常檢測(cè)數(shù)據(jù)傳輸?shù)哪芰肯闹瞪晕⒖禳c(diǎn),這是因?yàn)樵谖锫?lián)網(wǎng)環(huán)境下要將許多異常數(shù)據(jù)從集中式異常數(shù)據(jù)直接傳輸給web節(jié)點(diǎn),則分布式異常數(shù)據(jù)檢測(cè)與集中式不同,它會(huì)將數(shù)據(jù)庫(kù)少數(shù)簇首節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行傳輸,最后將這些數(shù)據(jù)再傳輸給 web節(jié)點(diǎn)。因此,與本文方法對(duì)比,集中式異常數(shù)據(jù)消耗的能量過快。
為了檢測(cè)物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)異常數(shù)據(jù),采用本文方法、集中式檢測(cè)方法以及分布式方法的精度作比較,分別檢測(cè)這3種方法異常數(shù)據(jù)的精確度。以20秒為一個(gè)數(shù)據(jù)窗口,web數(shù)據(jù)庫(kù)節(jié)點(diǎn)采集到的異常數(shù)據(jù)的速度分別為1個(gè)/秒,3個(gè)/秒,5個(gè)/秒,7個(gè)/秒,9個(gè)/秒,在一個(gè)數(shù)據(jù)窗口內(nèi),web數(shù)據(jù)庫(kù)節(jié)點(diǎn)采集的異常數(shù)據(jù)總數(shù)分別為15個(gè)、45個(gè)、120個(gè)、240個(gè)、360個(gè),對(duì)這5組數(shù)據(jù)集進(jìn)行異常數(shù)據(jù)檢測(cè),異常數(shù)據(jù)檢測(cè)的精確度采用公式12的方法:
(13)
從圖2可知,當(dāng)采集的異常數(shù)據(jù)較少時(shí),集中式異常數(shù)據(jù)檢測(cè)方法與本文方法檢測(cè)精度相同;當(dāng)采集的異常數(shù)據(jù)較多時(shí),所提方法精確度高于傳統(tǒng)檢測(cè)方法精確度。主要原因是集中式異常數(shù)據(jù)檢測(cè)將大多數(shù)異常數(shù)據(jù)在檢測(cè)完后直接傳送給web點(diǎn),而所提方法是經(jīng)過異常數(shù)據(jù)簇首的層層選擇之后再傳送給web數(shù)據(jù)網(wǎng)絡(luò)節(jié)點(diǎn),這使得改進(jìn)方法具有更高的精確度和穩(wěn)定性。
圖2 分布式方法和集中式方法精確度比較 圖3 不同數(shù)據(jù)檢測(cè)方法精確度對(duì)比
圖3中,時(shí)空關(guān)聯(lián)的分布式異常數(shù)據(jù)檢測(cè)方法與只考慮空間的分布式異常數(shù)據(jù)檢測(cè)方法的檢測(cè)精度進(jìn)行比較。由于本文所提方法主要分析了web數(shù)據(jù)庫(kù)異常節(jié)點(diǎn)的時(shí)間因素和空間因素,而另一種方法則只考慮了空間因素,因此本文方法精確度高于只考慮空間的異常數(shù)據(jù)檢測(cè)方法的精確度。
通過以上實(shí)驗(yàn)結(jié)果證明,說明了基于時(shí)空關(guān)聯(lián)的異常數(shù)據(jù)檢測(cè)的效果好,對(duì)物聯(lián)網(wǎng)環(huán)境下web數(shù)據(jù)庫(kù)異常數(shù)據(jù)的檢測(cè)起到很大的作用。
本文提出了一種基于時(shí)空關(guān)聯(lián)分布式異常數(shù)據(jù)檢測(cè)方法。通過與傳統(tǒng)方法檢測(cè)過程的能耗、精確度進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果證明基于時(shí)空關(guān)聯(lián)的異常數(shù)據(jù)檢測(cè)方法減少了數(shù)據(jù)的傳輸量,具有較高的檢測(cè)正確率。
[1] 韓 巖,李 曉.加速大數(shù)據(jù)聚類K-means方法的改進(jìn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2015,36(5):1317-1320.
[2] 胡智丹,鄭 航,王忠靜,等.黃河干流水量分配的演變及多數(shù)據(jù)流模型分析[J].水力發(fā)電學(xué)報(bào),2015,34(8):35-43.
[3] 趙 森,仇婷婷.基于PCA的無(wú)線傳感器網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(14):88-91.
[4] 嚴(yán)英杰,盛戈皞,王 輝,等.基于高維隨機(jī)矩陣大數(shù)據(jù)分析模型的輸變電設(shè)備關(guān)鍵性能評(píng)估方法[J].中國(guó)電機(jī)工程學(xué)報(bào),2016,36(2):435-445.
[5] 劉小洋.非均勻環(huán)境下傳感器網(wǎng)絡(luò)節(jié)點(diǎn)精確定位方法[J].計(jì)算機(jī)科學(xué)與探索,2015,9(4):475-481.
[6] 李 松,姜 楠.人力資源調(diào)度的蟻群方法模型[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào),2014(5):679-682.
[7] 劉洪彬,常發(fā)亮.權(quán)重系數(shù)自適應(yīng)光流法運(yùn)動(dòng)目標(biāo)檢測(cè)[J].光學(xué)精密工程,2016,24(2):460-468.
[8] 楊 娜.云存儲(chǔ)技術(shù)及其應(yīng)用[J].電子技術(shù)與軟件工程,2014(21):220-220.
[9] 劉 洋,崔 穎,李 鷗.認(rèn)知無(wú)線電網(wǎng)絡(luò)中次用戶平均吞吐量的優(yōu)化[J].電子與信息學(xué)報(bào),2014,36(7):1680-1685.
[10] 肖東裕,胡立坤,呂智林,等.基于B/S結(jié)構(gòu)的分布式風(fēng)電監(jiān)控系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)測(cè)量與控制,2016,24(1):105-107.
[11] 鐘兆國(guó). 基于Web數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)挖掘技術(shù)[J]. 工業(yè), 2017,6(1):245-247.
[12] 王 樂, 王 芳. 數(shù)據(jù)庫(kù)異常數(shù)據(jù)的檢測(cè)仿真研究[J]. 計(jì)算機(jī)仿真, 2016, 33(1):430-433.
[13] 葉 云, 余 勇, 黃劉生,等. 一種基于top-m Dk-Outlier的隱私保護(hù)異常數(shù)據(jù)檢測(cè)算法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2016, 37(12):2638-2642.
[14] 張 玲. 基于Web數(shù)據(jù)庫(kù)在線考試系統(tǒng)的設(shè)計(jì)研究探討[J]. 自動(dòng)化與儀器儀表, 2016,10(5):120-121.
[15] 丁 華, 陳 輝. 基于WEB的上機(jī)考核系統(tǒng)中JQuery和Ajax技術(shù)的應(yīng)用[J]. 電子設(shè)計(jì)工程, 2016, 24(15):16-19.
[16] 熊小慶, 徐 立, 劉 賽. DCA在數(shù)據(jù)庫(kù)服務(wù)器異常檢測(cè)中的應(yīng)用[J]. 微電子學(xué)與計(jì)算機(jī), 2015,5(10):67-71.
[17] 楊曉秋, 李旭彥. 同行評(píng)議中的異常數(shù)據(jù)檢測(cè)方法研究——以科研項(xiàng)目評(píng)審為例[J]. 中國(guó)軟科學(xué), 2016(5):133-142.
[18] 葉 云, 余 勇, 黃劉生,等. 一種基于top-m Dk-Outlier的隱私保護(hù)異常數(shù)據(jù)檢測(cè)算法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2016, 37(12):2638-2642.
[19] 張 銳, 李留青. 大型多媒體網(wǎng)絡(luò)數(shù)據(jù)庫(kù)異常數(shù)據(jù)高效檢測(cè)方法[J]. 科技通報(bào), 2015, 31(10):163-165.
UnderEnvironmentofInternetWebDatabaseAbnormalDataDetectionMethodResearch
Zhang Qingchuan,Sun Fan,Wang Yuchen,Li Jinliang,Wang Jie
(State Grid XinJiang Electric Power Research Institute,Urumchi 830011,China)
Web database networking environment carrying network carrier and network channel is different, web database through the cloud storage form to realize the sharing of resources, abnormal data cloud storage to network information generated by the web database space to bring a sense of crisis and the data storage space is insufficient, so the network environment to detect abnormal data web the database requires more accurate to. The traditional outlier detection method uses the simplified gradient method to detect the abnormal data of Web database, which can not remove the abnormal web data with the interference frequency components, and has low detection performance. To this end, we propose a web distributed database abnormal data detection method based on spatial-temporal correlation, compared with the centralized algorithm accuracy and consumption, simulation results show that the proposed method of outlier detection, reduce the energy consumption of the web data, the amplitude of the signal is greater than the amplitude of noise data, has good anti-jamming performance.
network channel; interference frequency; spatial and temporal correlation
2017-03-09;
2017-04-13。
張清川(1993-),男,甘肅武威人,助理工程師,主要從事變壓器狀態(tài)檢修技術(shù)方向的研究。
1671-4598(2017)09-0170-04
10.16526/j.cnki.11-4762/tp.2017.09.044
TN393
A