亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        孤立點(diǎn)檢測(cè)及在煤礦安全預(yù)警系統(tǒng)中的應(yīng)用

        2011-03-17 01:43:46朱秀莉顧洪博楊冬黎
        關(guān)鍵詞:定義檢測(cè)

        朱秀莉,顧洪博,楊冬黎

        (東北石油大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江大慶163318)

        孤立點(diǎn)檢測(cè)是數(shù)據(jù)挖掘領(lǐng)域中一個(gè)重要的研究方向。其任務(wù)是發(fā)現(xiàn)數(shù)據(jù)集中明顯不同于其他數(shù)據(jù)的對(duì)象。孤立點(diǎn)的應(yīng)用主要有信用卡與保險(xiǎn)欺詐、入侵檢測(cè)、氣象預(yù)報(bào)、病例分析與診斷等[1]。孤立點(diǎn)檢測(cè)一般包括:孤立點(diǎn)的定義、尋找孤立點(diǎn)?,F(xiàn)有的孤立點(diǎn)算法根據(jù)孤立點(diǎn)定義的角度不同,分為基于統(tǒng)計(jì)的、基于距離的、基于密度的、基于深度的和基于偏離的算法[2]。煤礦安全預(yù)警系統(tǒng)需要從不完整的、模糊的、隨機(jī)的大量數(shù)據(jù)中,挖掘有用的信息和知識(shí),直觀(guān)表征采煤區(qū)域的總體狀況,為煤礦安全生產(chǎn)提供可靠依據(jù)[3]。本文采用孤立點(diǎn)檢測(cè)的方法對(duì)瓦斯?jié)舛鹊漠惓?shù)據(jù)進(jìn)行處理,保證預(yù)警的準(zhǔn)確性。

        1 孤立點(diǎn)檢測(cè)算法

        1.1 基于統(tǒng)計(jì)

        基于統(tǒng)計(jì)的孤立點(diǎn)檢測(cè)算法主要思想是假定數(shù)據(jù)集服從某種分布或概率模型,通過(guò)不一致檢驗(yàn)把那些嚴(yán)重偏離分布曲線(xiàn)的數(shù)據(jù)視為孤立點(diǎn)[4]。從已知值的分布找出統(tǒng)計(jì)參數(shù),如均值和方差,再根據(jù)統(tǒng)計(jì)參數(shù)和孤立點(diǎn)期望數(shù)目建立閾值。閾值之外的可能是孤立點(diǎn),如:閾值=均值± 2×標(biāo)準(zhǔn)差。

        若已知數(shù)據(jù)集的概率分布(如正態(tài)分布,均值)時(shí),用基于統(tǒng)計(jì)的方法。此方法主要局限在科研計(jì)算領(lǐng)域,它適用于數(shù)值型數(shù)據(jù),而不適用于高維、分類(lèi)數(shù)據(jù)的挖掘。

        1.2 基于距離

        1998年,Konr提出基于距離的孤立點(diǎn)檢測(cè)算法[5],2000年Ng進(jìn)行了更新[6],因此孤立點(diǎn)的定義是:數(shù)據(jù)集D中,至少有p部分對(duì)象與對(duì)象O的距離大于d,那么對(duì)象O就是一個(gè)帶參數(shù)p和d的基于距離的孤立點(diǎn),記為DB(p,d)。

        此方法使用全局閾值故不能處理具有不同密度的數(shù)據(jù)集。此外,算法需要事先確定參數(shù)pct和dmin,這是比較困難的。對(duì)于給定的不同參數(shù)dmin,檢測(cè)結(jié)果通常具有很大的波動(dòng)性。后來(lái)又提出基于距離和[7]、基于屬性距離和[8]的孤立點(diǎn)檢測(cè)算法。

        1.3 基于密度

        密度常用鄰近度是指任意一點(diǎn)和p點(diǎn)距離小于給定半徑r的鄰域空間內(nèi)的數(shù)據(jù)點(diǎn)的個(gè)數(shù)。一般定義是點(diǎn)到其 k近鄰的平均距離,平均距離小則密度小。基于密度的孤立點(diǎn)檢測(cè),就是探測(cè)局部密度,認(rèn)為孤立點(diǎn)是在低密度區(qū)域中的對(duì)象。經(jīng)典的基于密度的孤立點(diǎn)檢測(cè)算法是LOF算法[9]

        基于密度的方法,給出了對(duì)象是孤立點(diǎn)程度的定量度量,并且即使數(shù)據(jù)具有不同密度的區(qū)域也能很好地處理。但這些方法必然具有O(n2)的時(shí)間復(fù)雜度,其參數(shù)選擇也是困難的。最近又提出基于平均密度[10]的和基于K-距離[11]的孤立點(diǎn)檢測(cè)算法。

        總之,現(xiàn)有的孤立點(diǎn)檢測(cè)算法能夠檢測(cè)出孤立點(diǎn),但也存在局限性。主要是:高維數(shù)據(jù)孤立點(diǎn)檢測(cè)的算法效率的下降、最近鄰概念的失效、對(duì)背景知識(shí)的依賴(lài)較多。

        2 基于DS的孤立點(diǎn)檢測(cè)算法

        針對(duì)孤立點(diǎn)檢測(cè)算法的一些弊端,采用一個(gè)基于距離和(Distance Sum,DS)的孤立點(diǎn)檢測(cè)算法。首先計(jì)算數(shù)據(jù)集中對(duì)象兩兩間的距離,然后計(jì)算每個(gè)對(duì)象與其它對(duì)象的距離之和,計(jì)算所有對(duì)象的距離和均值H,則距離之和大于H的對(duì)象即為部分孤立點(diǎn)。

        2.1 基本概念

        從定義1可以看出,所有對(duì)象的距離和組成一個(gè)主對(duì)角線(xiàn)為0的對(duì)稱(chēng)矩陣。

        定義3孤立點(diǎn)數(shù)據(jù)集D中,若對(duì)象xi(維數(shù)為d)的偏離度D(i)>0,則稱(chēng)對(duì)象 xi就是一個(gè)帶參數(shù)si和d的基于距離的孤立點(diǎn),記為DB(si,d)。

        2.2 基于DS的孤立點(diǎn)檢測(cè)算法

        1)對(duì)原始數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化后,計(jì)算n個(gè)對(duì)象兩兩之間的距離,并計(jì)算出每個(gè)對(duì)象的偏離度。

        2)若對(duì)象xi滿(mǎn)足定義3,則稱(chēng)對(duì)象xi是孤立點(diǎn)。

        3)對(duì)檢測(cè)出的孤立點(diǎn)進(jìn)行分析。

        3 瓦斯?jié)舛犬惓z測(cè)

        瓦斯檢測(cè)對(duì)精度要求不高,但對(duì)其可靠性要求非常高。能夠連續(xù)檢測(cè),并在設(shè)定的百分比濃度點(diǎn)準(zhǔn)確報(bào)警。由于井下環(huán)境復(fù)雜,存在著各種干擾源,傳感器輸出的信號(hào)極易受到污染。因此,經(jīng)常會(huì)出現(xiàn)瓦斯異常數(shù),但實(shí)際值并不高。系統(tǒng)計(jì)算機(jī)根本無(wú)辦法識(shí)別這些干擾信號(hào),系統(tǒng)頻頻發(fā)生誤報(bào)警。一旦報(bào)警,井下電源就自動(dòng)切斷,生產(chǎn)停止。據(jù)統(tǒng)計(jì),誤報(bào)警高達(dá)70%,正常生產(chǎn)因?yàn)轭l繁的誤報(bào)警而受到很大影響,給企業(yè)造成很大的損失[12]。

        難以克服的“大數(shù)污染”問(wèn)題普遍存在于目前使用的各種系統(tǒng)中。采用孤立點(diǎn)檢測(cè)的方法對(duì)瓦斯?jié)舛鹊臄?shù)據(jù)進(jìn)行處理,防止誤報(bào)警,保證報(bào)警的準(zhǔn)確性。

        3.1 數(shù)據(jù)選取及標(biāo)準(zhǔn)化

        本實(shí)驗(yàn)所用數(shù)據(jù)為8個(gè)礦井某天瓦斯?jié)舛葦?shù)據(jù),其中包含瓦斯涌出以及異常數(shù)據(jù)。每個(gè)傳感器采集到400多個(gè)數(shù)據(jù),共搜集了3 000多個(gè)數(shù)據(jù)。瓦斯正常濃度在0~l%之間。為了便于實(shí)驗(yàn),將獲得的數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化處理(各乘100)得到一個(gè)樣本集。其中部分?jǐn)?shù)據(jù)如表1。

        依照定義1,可以計(jì)算出每個(gè)礦井的各個(gè)距離和數(shù)據(jù),如表2。

        表1 標(biāo)準(zhǔn)化后的部分?jǐn)?shù)據(jù)Tab.1 Partial database after standardization

        表2 各個(gè)礦井的距離和Tab.2 The distance sum of each mines

        依據(jù)定義2,得到每個(gè)對(duì)象的偏離度,如表3。

        表3 各個(gè)礦井的偏離度Tab.3 The distance deviation of each mines

        依據(jù)定義3,從表3中可以看出,井號(hào)A、D、H為孤立點(diǎn)。

        3.2 實(shí)驗(yàn)分析

        根據(jù)瓦斯檢測(cè)數(shù)據(jù),采用基于聚類(lèi)的孤立點(diǎn)分析,大致得到3類(lèi)孤立點(diǎn)。

        瓦斯?jié)舛冗h(yuǎn)遠(yuǎn)大于其它時(shí)段的濃度。這其實(shí)是一種噪聲數(shù)據(jù)。一般由于井下機(jī)電設(shè)備啟停時(shí)發(fā)出的電磁干擾造成的,或者井下監(jiān)控設(shè)備所接的電網(wǎng)的強(qiáng)烈電磁干擾。強(qiáng)干擾脈沖能在瞬間完全淹沒(méi)傳感器信號(hào),結(jié)果就造成了“大數(shù)”異?,F(xiàn)象。頻繁的電磁啟動(dòng)脈沖與信號(hào)疊加后更會(huì)造成嚴(yán)重的“大數(shù)”干擾。對(duì)這類(lèi)數(shù)據(jù)可以不予考慮。

        表4 噪聲數(shù)據(jù)Tab.4 The data of noisy

        瓦斯?jié)舛扔休^少次高于其它時(shí)段的濃度。且這類(lèi)數(shù)據(jù)變化幅度不大。這種數(shù)據(jù)的來(lái)源是因?yàn)楸O(jiān)控系統(tǒng)傳感器信號(hào)抗干擾能力很差,遇有線(xiàn)路接觸不良或電磁干擾就會(huì)造成假象信號(hào)。如傳感器插頭氧化、電纜接線(xiàn)盒松動(dòng)、信號(hào)接觸不良等造成隨機(jī)出現(xiàn)的異?,F(xiàn)象。

        表5 設(shè)備異常孤立點(diǎn)數(shù)據(jù)Tab.5 The outliers based in the abnormal equipment

        瓦斯?jié)舛扔休^多次高于其它時(shí)段的濃度。其高的次數(shù)越來(lái)越多,可以考慮這是瓦斯突出,應(yīng)報(bào)警斷電。

        表6 瓦斯突出孤立點(diǎn)數(shù)據(jù)Tab.6 The abnormity data of gas concentration

        瓦斯突出是指隨著煤礦開(kāi)采深度的增加、瓦斯含量的增加,在煤層中形成了在地應(yīng)力作用下,瓦斯釋放的引力作用下,使軟弱煤層突破抵抗線(xiàn),瞬間釋放大量瓦斯和煤而造成的一種地質(zhì)災(zāi)害。

        4 結(jié)語(yǔ)

        本文中采用的孤立點(diǎn)檢測(cè)方法對(duì)煤礦井瓦斯監(jiān)測(cè)數(shù)據(jù)處理,濾除大數(shù)干擾,保證正確的報(bào)警。將孤立點(diǎn)技術(shù)用在煤礦安全監(jiān)測(cè)中,提高了數(shù)據(jù)分析的效率,以有效地挖掘出事故的隱患,這在保證煤礦的安全生產(chǎn)上有一定的價(jià)值。

        [1]牛琨.聚類(lèi)分析中若干關(guān)鍵技術(shù)及其在電信領(lǐng)域的應(yīng)用研究[D].北京:北京郵電大學(xué),2007.

        [2]楊蘭倉(cāng).數(shù)據(jù)挖掘中聚類(lèi)和孤立點(diǎn)檢測(cè)算法的研究[D].濟(jì)南:山東大學(xué),2008.

        [3]蔡曉明.基于地理信息系統(tǒng)的煤礦瓦斯突出預(yù)測(cè)研究[D].昆明:昆明理工大學(xué),2006.

        [4]楊永銘,王吉吉.孤立點(diǎn)挖掘算法研究[J].計(jì)算機(jī)與數(shù)字工程,2008(1):11-15.

        [5]KNORR E,NG R.Algorithms for mining distance-based outliers in large datasets[C].Proc of the VLDB Conf,1998:392-403.

        [6]KNORR E M,NG R T,TUCAKOV V.Distance-based outliers:algorithms and applications[J].VLDB Journal:Very Large Databases,2000,8(3-4):237-253.

        [7]陸聲鏈,林士敏.基于距離的孤立點(diǎn)檢測(cè)研究[J].計(jì)算機(jī)工程與應(yīng)用,2004,40(33):73-75.

        [8]張忠平,宋少英,宋曉輝.ISAD:一種新的基于屬性距離和的孤立點(diǎn)檢測(cè)算法[J].計(jì)算機(jī)工程與科學(xué), 2009,31(3):83-85.

        [9]BREUNIG M M,KRIEGEL H P,NG R T,et al.LOF:identifying density-based local outliers[C].Proceedings of SIGMOD'00,Dallas,Texas,2000:427-438

        [10]施化吉,周書(shū)勇,李星毅.基于平均密度的孤立點(diǎn)檢測(cè)研究[J].電子科技大學(xué)學(xué)報(bào),2007,36(6):1286-1288.

        [11]賈晨科.基于K-距離的孤立點(diǎn)和聚類(lèi)算法研究[D].鄭州:鄭州大學(xué),2006.

        [12]肖仁鑫.煤礦安全預(yù)測(cè)的研究與集成[D].昆明:昆明理工大學(xué),2006.

        猜你喜歡
        定義檢測(cè)
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        “幾何圖形”檢測(cè)題
        “角”檢測(cè)題
        永遠(yuǎn)不要用“起點(diǎn)”定義自己
        海峽姐妹(2020年9期)2021-01-04 01:35:44
        定義“風(fēng)格”
        小波變換在PCB缺陷檢測(cè)中的應(yīng)用
        成功的定義
        山東青年(2016年1期)2016-02-28 14:25:25
        修辭學(xué)的重大定義
        一区二区三区国产精品| 国产精品无需播放器| 久久青草亚洲AV无码麻豆| 91羞射短视频在线观看| 亚洲av综合色区无码一区| 日韩亚洲欧美中文在线| 日韩我不卡| 日韩精品一区二区三区含羞含羞草 | 被驯服人妻中文字幕日本| 丰满少妇被啪啪到高潮迷轩| 51看片免费视频在观看| 男女真实有遮挡xx00动态图 | 无码国产激情在线观看| 精品国产91久久久久久久a| 亚洲熟妇一区二区蜜桃在线观看| 美女内射毛片在线看免费人动物| 国产精品白浆在线观看无码专区| 九一成人AV无码一区二区三区| 成人水蜜桃视频在线观看| 爱情岛论坛亚洲永久入口口| 在线永久看片免费的视频| 久久精品韩国日本国产| 亚洲av老熟女一区二区三区| 狼人青草久久网伊人| 久久精品国波多野结衣| 久久深夜中文字幕高清中文| 亚洲 小说区 图片区 都市| 人妻av中文字幕无码专区| 加勒比在线一区二区三区| 久草中文在线这里只有精品| 最新日本一道免费一区二区| 福利在线国产| av一区二区三区高清在线看| 丰满少妇被猛烈进入高清播放| 伊人蕉久中文字幕无码专区| 久久99老妇伦国产熟女高清| 在线观看国产激情视频| 欧美人妻日韩精品| 精品国产福利片在线观看| 日本不卡不二三区在线看 | 亚洲一区av在线观看|