亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自適應(yīng)DBSCAN算法的風(fēng)電機(jī)組異常數(shù)據(jù)識別研究

        2021-10-22 09:03:22劉博嵩
        動力工程學(xué)報(bào) 2021年10期
        關(guān)鍵詞:輪廓風(fēng)電區(qū)間

        雷 萌,郭 鵬,劉博嵩

        (華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,北京 102206)

        采用數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(SCADA)運(yùn)行數(shù)據(jù)進(jìn)行風(fēng)電機(jī)組和風(fēng)電場自動智能管理與監(jiān)測,能夠及時(shí)發(fā)現(xiàn)風(fēng)電機(jī)組的運(yùn)行異常情況及準(zhǔn)確評價(jià)其發(fā)電狀態(tài)和性能,提高風(fēng)電場的管理水平和經(jīng)濟(jì)效益。通過分析風(fēng)電機(jī)組運(yùn)行數(shù)據(jù),可以得到風(fēng)速-功率散點(diǎn)圖,進(jìn)而得到其風(fēng)速-功率特性和功率曲線,評估風(fēng)電機(jī)組的發(fā)電性能[1-2]。同時(shí),風(fēng)電機(jī)組功率曲線也是準(zhǔn)確預(yù)測風(fēng)功率的基礎(chǔ)。但由于風(fēng)電機(jī)組的工況隨風(fēng)速時(shí)變、戶外惡劣環(huán)境導(dǎo)致機(jī)組各部件故障率高及人為限電[3-4]等因素,原始風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)中異常數(shù)據(jù)比例高,異常類型復(fù)雜。對風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)進(jìn)行有效預(yù)處理,自動準(zhǔn)確標(biāo)識正常和異常數(shù)據(jù),才能應(yīng)用于功率曲線分析或狀態(tài)監(jiān)測等工作[5]。

        婁建樓等[6]提出最優(yōu)組內(nèi)方差算法(OIV),取風(fēng)速區(qū)間間隔為0.5 m/s,將風(fēng)速區(qū)間的風(fēng)速-功率散點(diǎn)按功率大小進(jìn)行排序并依次計(jì)算滑差值。該算法可以有效識別出功率曲線下方堆積型異常數(shù)據(jù),但無法有效識別曲線上方異常數(shù)據(jù)。沈小軍等[7]提出變點(diǎn)分組法和四分位法配合使用的風(fēng)電機(jī)組異常數(shù)據(jù)清洗方法,在每個(gè)風(fēng)速區(qū)間依次剔除各種異常數(shù)據(jù)。但從對風(fēng)電機(jī)組原始運(yùn)行數(shù)據(jù)清洗效果可以明顯看出,由于相鄰風(fēng)速區(qū)間異常數(shù)據(jù)上下邊界不同,得到的正常數(shù)據(jù)分布形狀會存在明顯鋸齒特征,丟棄了大量正常數(shù)據(jù)。趙永寧等[8]提出一種對異常數(shù)據(jù)處理的組合篩選模式,先采用2次四分位法去除分散型異常數(shù)據(jù),然后使用k-means方法剔除堆積型異常數(shù)據(jù)。該方法有過高的異常數(shù)據(jù)剔除率,會誤刪正常數(shù)據(jù)。Yue等[9]假設(shè)風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)特征呈現(xiàn)高斯正態(tài)分布,采用基于3σ(σ為正態(tài)分布中的標(biāo)準(zhǔn)差)法則的方法剔除異常數(shù)據(jù)。但在風(fēng)電機(jī)組實(shí)際運(yùn)行數(shù)據(jù)中,堆積型異常數(shù)據(jù)往往會使風(fēng)功率的概率密度呈現(xiàn)雙峰或多峰分布,處理起來遠(yuǎn)遠(yuǎn)比高斯正態(tài)分布情況復(fù)雜。Zheng等[10]采用基于密度的局部離群因子(LOF)算法檢測出風(fēng)速-功率散點(diǎn)圖中的高密度區(qū)域。該算法能有效識別分散型異常數(shù)據(jù),但無法有效識別分布密度較高的堆積型異常數(shù)據(jù)。Kusiak等[11]通過建立風(fēng)功率曲線的非線性模型來識別異常數(shù)據(jù),但該方法在訓(xùn)練時(shí)需要大量的正常數(shù)據(jù),否則訓(xùn)練誤差較大,實(shí)用性較差。

        筆者分析了安徽某風(fēng)電場1.5 MW雙饋式風(fēng)電機(jī)組風(fēng)速-功率散點(diǎn)圖中的典型異常數(shù)據(jù)分布特征,提出基于分功率區(qū)間的密度聚類識別算法。在該算法模型中,針對基于密度的噪聲應(yīng)用空間聚類(DBSCAN)中參數(shù)取值問題,引入輪廓系數(shù)作為聚類評價(jià)指標(biāo),采用交叉遍歷方法自動確定聚類參數(shù)。以實(shí)測數(shù)據(jù)為例對本文方法進(jìn)行有效性驗(yàn)證,并與文獻(xiàn)[5]中的OIV算法進(jìn)行了對比。

        1 風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)分布

        風(fēng)電機(jī)組在運(yùn)行過程中,由于停機(jī)、人為限負(fù)荷、通信噪聲和設(shè)備故障以及子部件工作異常等因素,運(yùn)行數(shù)據(jù)中通常包含大量異常數(shù)據(jù)。以安徽某風(fēng)電場1.5 MW雙饋式風(fēng)電機(jī)組為例,選取實(shí)驗(yàn)機(jī)組(E17)2019年實(shí)測數(shù)據(jù)進(jìn)行分析,機(jī)組SCADA系統(tǒng)以10 min為間隔記錄重要傳感器測量參數(shù),共計(jì)42 321組,其風(fēng)速-功率散點(diǎn)在坐標(biāo)系內(nèi)的分布如圖1所示。從圖1可以看出,不同原因產(chǎn)生的異常數(shù)據(jù)的分布特征也不相同。按照數(shù)據(jù)點(diǎn)分布特征,異常數(shù)據(jù)可以分為4類,包括曲線底部、中部、上部密集分布型異常數(shù)據(jù)和曲線周圍分散型異常數(shù)據(jù)。

        圖1 風(fēng)速-功率曲線Fig.1 Data distribution of wind speed-power curve

        第一類:曲線底部分布的異常數(shù)據(jù)。此類異常數(shù)據(jù)表現(xiàn)為一條橫向密集數(shù)據(jù)帶,其產(chǎn)生的原因包括機(jī)組停機(jī)檢修或者通信設(shè)備故障等情況。在這些情況下,風(fēng)電機(jī)組的理論輸出功率均為零。但內(nèi)部的測控系統(tǒng)仍需電力驅(qū)動,也會出現(xiàn)功率為負(fù)值的情況。因此,曲線底部異常數(shù)據(jù)會在功率零值附近波動,表現(xiàn)為數(shù)據(jù)密集分布。

        第二類:曲線中部分布的異常數(shù)據(jù)。此類異常數(shù)據(jù)表現(xiàn)為一條或多條位于功率曲線下界之外的橫向密集數(shù)據(jù)帶,其產(chǎn)生的主要原因是棄風(fēng)限電。棄風(fēng)限電時(shí)提前變槳,將實(shí)發(fā)功率限制在設(shè)定功率附近,限負(fù)荷異常功率散點(diǎn)位于功率主帶右側(cè),且呈現(xiàn)顯著的水平分布。

        第三類:曲線頂部分布的異常數(shù)據(jù)。曲線頂部的功率值明顯高于額定功率,表現(xiàn)為一條密集的橫向數(shù)據(jù)帶,這是因?yàn)轱L(fēng)電機(jī)組在某一段時(shí)間內(nèi)處于超發(fā)狀態(tài),長期處于這種狀態(tài)會影響機(jī)組的壽命,因此將這部分?jǐn)?shù)據(jù)作為異常數(shù)據(jù)的來源之一。

        第四類:曲線周圍分散分布的異常數(shù)據(jù)。此類異常數(shù)據(jù)表現(xiàn)為功率曲線附近分布密度較低的無規(guī)律散點(diǎn),是由啟停機(jī)過渡過程、信號噪聲、測量異常和極端天氣情況等多種隨機(jī)影響因素造成的。隨機(jī)因素造成的異常數(shù)據(jù)會在正常值附近隨機(jī)波動。因此,曲線周圍分散型異常數(shù)據(jù)會在正常數(shù)據(jù)之外隨機(jī)散布。

        根據(jù)上述4類異常數(shù)據(jù)的分布特征和產(chǎn)生原因可知,異常數(shù)據(jù)通常是由于無法瞬時(shí)恢復(fù)的機(jī)組故障或異常狀態(tài)產(chǎn)生的。由于這些故障或異常狀態(tài)難以在短時(shí)間內(nèi)恢復(fù),如棄風(fēng)限電或者葉片損壞等,因此前三類異常數(shù)據(jù)在集中時(shí)段內(nèi)連續(xù)產(chǎn)生,具有量多且分布密集的特征。而短時(shí)間內(nèi)可恢復(fù)的機(jī)組故障或異常狀態(tài)會產(chǎn)生分散型異常數(shù)據(jù),這些因素隨機(jī)且不斷變化,此類異常數(shù)據(jù)具有不確定性和隨機(jī)性,呈現(xiàn)分散分布的形態(tài)。

        2 自適應(yīng)DBSCAN模型與風(fēng)電機(jī)組異常數(shù)據(jù)識別

        2.1 固定參數(shù)DBSCAN

        DBSCAN算法是一種基于密度聚類的非監(jiān)督機(jī)器學(xué)習(xí)方法[12],無需提前設(shè)定聚類簇的個(gè)數(shù),通過半徑(ε)和鄰域密度閾值(Z)2個(gè)重要參數(shù)來反映數(shù)據(jù)分布的緊密程度,并找出形狀不規(guī)則的簇。該算法將密集堆積的散點(diǎn)標(biāo)記為一類,且可以將密度較低的散點(diǎn)識別為噪聲。為了對算法進(jìn)行準(zhǔn)確說明,現(xiàn)給出DBSACN中的主要定義:

        定義1(ε鄰域):給定對象p在半徑ε內(nèi)的鄰域稱為該對象的ε鄰域,即

        Nε(p)={q∈D|ρ(p,q)≤ε}

        (1)

        式中:D為數(shù)據(jù)集;ρ(p,q)為對象p與對象q之間的距離;Nε(p)包含了數(shù)據(jù)集D中與對象p距離不大于ε的所有對象。

        定義2(核心對象):如果對象p的ε鄰域至少包含最小數(shù)目為Z的對象,則稱該對象為核心對象,即

        |Nε(p)|≥Z

        (2)

        定義3(密度直達(dá)):在數(shù)據(jù)集D中,若對象q在對象p的ε鄰域內(nèi),且對象p滿足式(2),則稱對象q從對象p出發(fā)是密度直達(dá)的。

        定義4(密度可達(dá)):如果存在一個(gè)對象鏈p1,p2,…,pi,…,pn,滿足p1=p和pn=q,pi是從pi+1關(guān)于ε和Z是密度直達(dá)的,則對象p從對象q關(guān)于ε和Z是密度可達(dá)的。

        定義5(密度相連):如果存在對象O∈D,使對象O對對象p和對象q都是密度可達(dá)的,那么對象p和對象q密度相連。

        定義6(簇和噪聲):從數(shù)據(jù)集D中任取一對象p,從對象p開始在數(shù)據(jù)集D中搜索滿足ε和Z條件且密度可達(dá)的所有點(diǎn)構(gòu)成一個(gè)簇,不屬于任何簇的對象則被標(biāo)記為噪聲點(diǎn)。

        圖2中Z設(shè)置為6,正六邊形點(diǎn)代表核心點(diǎn),因?yàn)樵诎霃溅艃?nèi),其鄰域的點(diǎn)的個(gè)數(shù)為6;三角形點(diǎn)在核心點(diǎn)的鄰域內(nèi),且在其鄰域半徑ε內(nèi)點(diǎn)的個(gè)數(shù)不超過Z,故為邊界點(diǎn)。

        圖2 DBSCAN原理示意圖Fig.2 Schematic diagram of DBSCAN

        在使用DBSCAN算法時(shí),對ε和Z的取值有一定要求:(1)參數(shù)Z的取值要滿足以下要求,即Z>Ω+1,其中Ω是聚類數(shù)據(jù)空間的維度。對于二維數(shù)據(jù),理論上Z應(yīng)大于3。但由于Z代表了算法對噪聲的容忍程度,不宜過大。(2)參數(shù)ε控制半徑大小。如果其取值太小,大部分?jǐn)?shù)據(jù)并不會被聚類;如果其取值太大,可能會使相近的簇被合并一起,甚至?xí)拐麄€(gè)數(shù)據(jù)集被分到一個(gè)簇中。

        DBSCAN算法在確定簇時(shí)會對數(shù)據(jù)集中每個(gè)測試對象的鄰域進(jìn)行搜索,如果鄰域包含對象的數(shù)量超過最小值(Z),就會創(chuàng)建一個(gè)以該對象為核心的新簇。然后該算法從核心對象出發(fā),找到所有密度可達(dá)的對象,并將其合并為一個(gè)簇。直到數(shù)據(jù)集中的點(diǎn)不能再被添加到任何簇中,進(jìn)程將終止。不落在任何簇中的點(diǎn)被認(rèn)為是噪聲或異常值。

        DBSCAN算法雖然具有能夠自動確定聚類簇的個(gè)數(shù)、可以識別出任意形狀的簇以及分離噪聲等優(yōu)點(diǎn),但是缺點(diǎn)也非常明顯,即對參數(shù)ε和Z的設(shè)置非常敏感[13]。由上述2個(gè)參數(shù)取值分析可知,參數(shù)取值不同,聚類結(jié)果也不同,需要人工觀察聚類結(jié)果后手動調(diào)整參數(shù)值,無法實(shí)現(xiàn)真正的無監(jiān)督自主聚類和風(fēng)電機(jī)組異常數(shù)據(jù)識別。

        2.2 基于輪廓系數(shù)的參數(shù)ε和Z自適應(yīng)確定

        在使用聚類算法進(jìn)行聚類時(shí),為了得到更合理的聚類結(jié)果,需要對其聚類有效性進(jìn)行客觀準(zhǔn)確評價(jià)。聚類有效性是對聚類方法輸出結(jié)果的評估,通常從簇內(nèi)和簇間兩個(gè)方面進(jìn)行,當(dāng)簇內(nèi)距離最小和簇間距離最大時(shí),聚類效果最佳。Kaufman等提出的輪廓系數(shù)(Silhouette Coefficient)是在沒有真實(shí)簇標(biāo)簽的情況下,對模型和聚類結(jié)果本身進(jìn)行度量的參數(shù)。輪廓系數(shù)結(jié)合凝聚度和分離度,當(dāng)其得分較高時(shí),聚類模型更好[14]。

        (1)樣本個(gè)體的輪廓系數(shù)。

        針對數(shù)據(jù)集中樣本di,假設(shè)樣本di被聚類到簇A,其輪廓系數(shù)si定義為:

        (3)

        式中:ai為樣本di與同一類別中所有其他點(diǎn)之間的平均距離,體現(xiàn)了凝聚度;bi為樣本di與下一個(gè)距離最近的簇中的所有其他點(diǎn)之間的平均距離,體現(xiàn)了分離度。

        樣本di的輪廓系數(shù)si的取值范圍為[-1,1],據(jù)此可以判斷該樣本是否適合所在簇。若si接近1,此時(shí)ai遠(yuǎn)小于bi,表示樣本di適合所在簇;若si接近-1,此時(shí)ai遠(yuǎn)大于bi,表示樣本di被分到了錯誤的簇。

        (2)聚類輪廓系數(shù)。

        整個(gè)數(shù)據(jù)集的輪廓系數(shù)就是所有樣本輪廓系數(shù)的平均值。對于數(shù)據(jù)集D的某次聚類來說,其聚類輪廓系數(shù)sk定義為:

        (4)

        為克服DBSCAN算法參數(shù)選取困難、需要人為設(shè)定的缺陷,筆者引入聚類輪廓系數(shù)作為衡量聚類質(zhì)量的重要依據(jù)。聚類輪廓系數(shù)具有魯棒性,在不需要明確聚類中心的情況下就能計(jì)算出簇與簇之間的密集與分散程度,從而確定最優(yōu)的ε和Z,實(shí)現(xiàn)DBSCAN算法參數(shù)的自適應(yīng)確定。

        自適應(yīng)確定DBSCAN算法參數(shù)ε和Z的流程如下:對于所有可能的參數(shù)取值,只需給定DBSCAN算法的2個(gè)參數(shù)ε和Z的取值范圍,再通過尋找聚類輪廓系數(shù)最大值的方法,確定最佳的ε和Z,可得到最佳的聚類結(jié)果,此時(shí)的sk被稱為最佳聚類輪廓系數(shù)。

        2.3 DBSCAN算法對風(fēng)電機(jī)組異常數(shù)據(jù)的識別過程

        由于DBSCAN算法在風(fēng)速和功率2個(gè)方向的搜索半徑是相同的,故在識別異常數(shù)據(jù)之前需要先將風(fēng)電機(jī)組的風(fēng)速及功率數(shù)據(jù)進(jìn)行無量綱標(biāo)幺化處理。在對原始數(shù)據(jù)標(biāo)幺化之前,對第一類異常數(shù)據(jù)(即功率為零及負(fù)值的異常數(shù)據(jù))直接剔除即可。風(fēng)速和功率基準(zhǔn)值及其標(biāo)幺值如表1所示。標(biāo)幺化后的風(fēng)速-功率散點(diǎn)圖如圖3所示。

        表1 風(fēng)速和功率基準(zhǔn)值及標(biāo)幺值Tab.1 Wind speed and power reference values and their per unit values

        在第1節(jié)中,除了第四類分散型分布的異常點(diǎn)外,其余三類異常點(diǎn)均沿水平功率方向橫向密集分布。如圖3所示,風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)在水平功率方向的散布范圍顯著小于其在垂直風(fēng)速方向的散布范圍。為了達(dá)到更好的聚類數(shù)據(jù)和異常數(shù)據(jù)識別效果,將標(biāo)幺化后的數(shù)據(jù)在水平橫向功率維度以0.05為間隔等分為20個(gè)功率區(qū)間,在每一個(gè)功率區(qū)間分別應(yīng)用自適應(yīng)DBSCAN算法對該功率區(qū)間內(nèi)風(fēng)速-功率散點(diǎn)進(jìn)行聚類數(shù)據(jù)和異常數(shù)據(jù)識別。在實(shí)際運(yùn)行中,有時(shí)運(yùn)行人員為了追求更大的經(jīng)濟(jì)效益,人為增大發(fā)電機(jī)轉(zhuǎn)矩,使機(jī)組處于超發(fā)狀態(tài),在圖1中表現(xiàn)為第三類異常數(shù)據(jù),即圖3功率區(qū)間為0.95~1.00中的數(shù)據(jù)。針對第三類處于超發(fā)狀態(tài)的異常數(shù)據(jù),在實(shí)際工程中通常將其直接標(biāo)記為正常數(shù)據(jù)。對于其余的19個(gè)功率區(qū)間,在每一個(gè)功率區(qū)間內(nèi)采用自適應(yīng)DBSCAN算法識別數(shù)據(jù),算法流程如圖4所示。根據(jù)算法流程對每個(gè)功率區(qū)間進(jìn)行相同的處理,即可實(shí)現(xiàn)風(fēng)電機(jī)組異常數(shù)據(jù)識別。

        圖3 標(biāo)幺化的原始數(shù)據(jù)分布Fig.3 Per-unit original data distribution of power vs.wind speed

        圖4 基于分功率區(qū)間的自適應(yīng)DBSCAN算法對風(fēng)電機(jī)組異常數(shù)據(jù)的識別流程Fig.4 Abnormal data recognition process of adaptive DBSCAN algorithm based on sub-power interval

        圖3中標(biāo)出的2個(gè)功率段異常數(shù)據(jù)簇分布比較典型:0.65~0.70功率區(qū)間為人為限功率數(shù)據(jù)異常;0.75~0.80功率區(qū)間為周圍發(fā)散型數(shù)據(jù)異常。以這2個(gè)典型功率區(qū)間為例來說明基于輪廓系數(shù)的DBSCAN算法參數(shù)自適應(yīng)確定方法。

        根據(jù)2.2節(jié)設(shè)定合理的參數(shù)范圍:ε的范圍為[0,0.010],以0.000 1為步距等間隔取100個(gè)值。Z為[3,12]區(qū)間內(nèi)所有整數(shù),共計(jì)10個(gè)值。ε的100個(gè)取值和Z的10個(gè)取值交叉組合共生成1 000組DBSCAN算法參數(shù)對。

        在2個(gè)典型功率區(qū)間內(nèi),自適應(yīng)DBSCAN算法將交叉組合得到的1 000對參數(shù)組合依次應(yīng)用于功率區(qū)間內(nèi)數(shù)據(jù)點(diǎn)的聚類并計(jì)算每一組參數(shù)對的聚類輪廓系數(shù)。聚類輪廓系數(shù)最大的一組參數(shù)對即為最佳的ε和Z參數(shù)值。2個(gè)典型功率區(qū)間內(nèi)的自適應(yīng)DBSCAN算法最優(yōu)參數(shù)確定過程如圖5所示。在圖5中,2個(gè)功率區(qū)間的聚類輪廓系數(shù)sk得分曲面的形狀較為相似,其受ε的影響極大,隨著Z增加,聚類輪廓系數(shù)sk得分先增大后減小。當(dāng)兩參數(shù)取到特定范圍時(shí)(如ε接近取值范圍下限或上限),DBSACN算法會將所有樣本直接識別為噪聲或?qū)⑵淙烤蹫橐活?,此時(shí)聚類輪廓系數(shù)計(jì)算出錯,為了更直觀地在圖中表達(dá),此情況直接將聚類輪廓系數(shù)sk得分賦值為-1。圖5(a)為0.65~0.70功率區(qū)間中聚類輪廓系數(shù)sk得分,最大值為0.631,對應(yīng)的最佳參數(shù)對ε和Z取值為0.007 8和10。圖5(b)為0.75~0.80功率區(qū)間中聚類輪廓系數(shù)sk得分,最大值為0.802,對應(yīng)的最佳參數(shù)對ε和Z取值為0.005 6和10。需要說明的是,圖5(b)中當(dāng)ε取值較大時(shí),DBSCAN算法對兩參數(shù)的敏感程度降低,聚類結(jié)果隨兩參數(shù)變化較小,其聚類輪廓系數(shù)sk得分幾乎趨同。

        2個(gè)典型功率區(qū)間采用上述自適應(yīng)方法得到的聚類輪廓系數(shù)最大即最佳參數(shù)對的數(shù)據(jù)聚類效果如圖6和圖7所示,圖中也給出了固定參數(shù)ε為0.02、Z為4時(shí)的DBSCAN聚類效果。從圖6和圖7可以看出,所提出的自適應(yīng)DBSCAN算法對2個(gè)典型功率區(qū)間中水平分布異常數(shù)據(jù)及分散分布異常數(shù)據(jù)均有很好的識別效果。而固定參數(shù)DBSCAN算法不能有效分離異常數(shù)據(jù)與正常數(shù)據(jù)。相較于固定參數(shù)DBSCAN算法需要多次人工調(diào)參,自適應(yīng)DBSCAN算法能自動尋找理想聚類效果,有效識別異常數(shù)據(jù)。

        (a)0.65~0.70功率區(qū)間聚類輪廓系數(shù)

        (a)自適應(yīng)DBSCAN算法結(jié)果

        (a)自適應(yīng)DBSCAN算法結(jié)果

        3 案例分析

        3.1 效果驗(yàn)證

        3.1.1 案例1

        為驗(yàn)證所提出清洗算法的有效性,將實(shí)驗(yàn)機(jī)組E17的實(shí)測數(shù)據(jù)進(jìn)行標(biāo)幺化,然后水平劃分功率區(qū)間,在每個(gè)功率區(qū)間分別采用DBSCAN算法進(jìn)行異常數(shù)據(jù)識別,根據(jù)聚類輪廓系數(shù)優(yōu)化聚類效果,自適應(yīng)確定每個(gè)功率區(qū)間DBSCAN算法的2個(gè)參數(shù)ε和Z。識別結(jié)果如圖8所示。由圖8可知,實(shí)驗(yàn)機(jī)組E17功率-風(fēng)速數(shù)據(jù)中的異常數(shù)據(jù)能夠被有效識別。

        圖8 自適應(yīng)DBSCAN算法對實(shí)驗(yàn)機(jī)組異常數(shù)據(jù)的識別效果Fig.8 Recognition effect of abnormal data by adaptive DBSCAN algorithm for the experimental turbine

        3.1.2 案例2

        由于案例1取機(jī)組間隔10 min的運(yùn)行數(shù)據(jù),其數(shù)據(jù)量較大,正常數(shù)據(jù)組成的功率主帶分布較寬。為了驗(yàn)證該算法具有一定的通用性,對編號為LY16的機(jī)組2018年5月至6月4 908條10分鐘級(即間隔時(shí)間為10 min)運(yùn)行數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果如圖9所示。從圖9可以看出其數(shù)據(jù)量較少,功率主帶分布窄,本文算法對該機(jī)組的異常數(shù)據(jù)有很好的識別效果。

        圖9 自適應(yīng)DBSCAN算法對LY16機(jī)組異常數(shù)據(jù)的識別效果Fig.9 Recognition effect of abnormal data by adaptive DBSCAN algorithm for LY16 turbine

        3.2 算法對比分析

        作為對比,采用文獻(xiàn)[5]中的OIV算法對實(shí)驗(yàn)機(jī)組E17運(yùn)行數(shù)據(jù)進(jìn)行異常數(shù)據(jù)識別。OIV算法將每個(gè)風(fēng)速區(qū)間內(nèi)的功率值降序排列,并依次計(jì)算每個(gè)功率值對應(yīng)的滑差值(方差),之后通過與設(shè)定滑差閾值比較來實(shí)現(xiàn)數(shù)據(jù)清洗。OIV算法對實(shí)驗(yàn)機(jī)組原始數(shù)據(jù)的識別效果如圖10所示。

        圖10 OIV算法對實(shí)驗(yàn)機(jī)組異常數(shù)據(jù)的識別效果Fig.10 Recognition effect of abnormal data by OIV algorithm for the experimental turbine

        對比圖10與圖8可知,OIV算法不能有效識別部分第二類異常數(shù)據(jù)以及分布在正常數(shù)據(jù)上部的第三類異常數(shù)據(jù)。由OIV算法原理可知,OIV算法識別異常數(shù)據(jù)的依據(jù)為滑差曲線出現(xiàn)顯著變化,即在某風(fēng)速區(qū)間內(nèi)數(shù)據(jù)點(diǎn)由密集分布向稀疏分布轉(zhuǎn)換非常明顯。在圖10中如額定功率以上的某些風(fēng)速區(qū)間內(nèi)數(shù)據(jù)點(diǎn)分布較稀疏,由上至下沒有呈現(xiàn)出由密集分布到稀疏分布的顯著變化,導(dǎo)致某些異常數(shù)據(jù)未能被準(zhǔn)確識別。

        4 結(jié) 論

        (1)在水平功率方向等間隔劃分多個(gè)功率區(qū)間,并對每一個(gè)功率區(qū)間內(nèi)的運(yùn)行數(shù)據(jù)進(jìn)行分析,能夠得到更高的數(shù)據(jù)處理精度。

        (2)以聚類輪廓系數(shù)為聚類效果評價(jià)指標(biāo),采用參數(shù)交叉組合方式自適應(yīng)確定每個(gè)功率區(qū)間內(nèi)最佳的DBSCAN算法參數(shù),達(dá)到了較為滿意的聚類數(shù)據(jù)和異常數(shù)據(jù)識別結(jié)果。

        (3)采用自適應(yīng)DBSCAN算法可以有效識別出安徽某風(fēng)電場1.5 MW雙饋式風(fēng)電機(jī)組異常數(shù)據(jù),該算法具有較強(qiáng)的通用性。

        猜你喜歡
        輪廓風(fēng)電區(qū)間
        解兩類含參數(shù)的復(fù)合不等式有解與恒成立問題
        你學(xué)會“區(qū)間測速”了嗎
        OPENCV輪廓識別研究與實(shí)踐
        基于實(shí)時(shí)輪廓誤差估算的數(shù)控系統(tǒng)輪廓控制
        海上風(fēng)電躍進(jìn)隱憂
        能源(2018年6期)2018-08-01 03:42:00
        分散式風(fēng)電破“局”
        能源(2018年6期)2018-08-01 03:41:56
        風(fēng)電:棄風(fēng)限電明顯改善 海上風(fēng)電如火如荼
        能源(2018年8期)2018-01-15 19:18:24
        區(qū)間對象族的可鎮(zhèn)定性分析
        重齒風(fēng)電
        風(fēng)能(2016年12期)2016-02-25 08:46:38
        在線學(xué)習(xí)機(jī)制下的Snake輪廓跟蹤
        国产人在线成免费视频| 国产一区二区三区四色av| 一本色道久久88亚洲精品综合| 精品福利视频一区二区三区| 国产精品一区二区三区精品| 亚洲一区二区三区自拍麻豆| 真人做爰试看120秒| 明星性猛交ⅹxxx乱大交| 欧美综合区| 国产在线视频一区二区三| 伊人久久综合无码成人网| 亚洲男人第一无码av网站| 亚洲AV无码精品色午夜超碰| av在线资源一区二区| 久久久亚洲av波多野结衣| 午夜不卡久久精品无码免费| 97超级碰碰碰久久久观看| 亚洲精品在线一区二区| 国产在线精品一区二区三区直播| 人妻av一区二区三区精品| 国产午夜av一区二区三区| 亚洲乱码中文字幕综合久久| 亚洲欧美综合区自拍另类| 伊人久久大香线蕉在观看| 午夜宅男成人影院香蕉狠狠爱| 亚洲自偷自拍另类第1页| 国语少妇高潮对白在线| 国产人妖xxxx做受视频| 欧美人成在线播放网站免费| 看大陆男女真人草逼视频| 亚洲一区二区女搞男| 日本乱人伦在线观看| 大胸美女吃奶爽死视频| 日本免费一区二区三区在线播放| 国内精品卡一卡二卡三| 久久av高潮av喷水av无码| 我想看久久久一级黄片| 特黄熟妇丰满人妻无码| 国产黄三级三·级三级| 日本高清无卡一区二区三区| 天天躁日日躁aaaaxxxx|