亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Apriori關聯(lián)規(guī)則的電能表檢定質(zhì)量影響因素分析*

        2017-12-21 02:04:26王增平趙兵李澤坤孫毅李彬
        電測與儀表 2017年13期
        關鍵詞:關聯(lián)規(guī)則

        王增平,趙兵,李澤坤,孫毅,李彬

        (1.華北電力大學,北京102206;2.中國電力科學研究院,北京100192)

        0 引 言

        隨著電力事業(yè)的發(fā)展,我國正在建設覆蓋全部用戶、采集全部用電信息、支持全部電費控制的“全覆蓋、全采集”系統(tǒng),而電能表是電力信息采集系統(tǒng)中的基礎組成部分,需具備實時采樣、精確計量、可靠運作等技術要求。電能表的質(zhì)量好壞直接影響用戶側的供電可靠性和安全性,進而影響整個系統(tǒng)的安全、穩(wěn)定和經(jīng)濟運行。

        目前對電能表質(zhì)量的研究以基于層次分析法建立的評估體系居多,文獻[1]利用了層次分析和應用選型決策方法建立了對數(shù)學決策模型,討論了電能表質(zhì)量因素和相互作用機理,提出了全面判斷、分析電能表質(zhì)量的方法;文獻[2]結合層次分析法對各功能分類的測試項目進行分析,建立了電能表軟件質(zhì)量評估體系。也有利用FEMCA失效模式分析對電能表故障進行統(tǒng)計分析的研究,文獻[3]通過對單相電能表故障模式及影響分析,總結了各類故障類型并提出了增加可靠性、降低故障率的措施。這些針對電能表質(zhì)量的研究為本文提供了一部分參考,但是這些方法對電能表運行及故障信息的描述要求較高,在處理海量、描述單一的信息時適用性較差。而本文數(shù)據(jù)量較大,所以采用了大數(shù)據(jù)分析的思路,從海量數(shù)據(jù)中挖掘一部分實用信息進行分析。

        而關聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的一種重要方法,能從客觀的數(shù)據(jù)中發(fā)掘隱藏的內(nèi)部聯(lián)系,提供具有實用價值的信息。該方法在商業(yè)營銷[4-5]、醫(yī)學[6]、金融[7]、甚至教學管理[8-9]等領域獲得較多應用,但是用于研究電氣設備質(zhì)量影響因素方面較少。文獻[10]指出關聯(lián)規(guī)則挖掘在電力系統(tǒng)中的應用前景巨大;文獻[11]把關聯(lián)規(guī)則的數(shù)據(jù)挖掘技術用于電網(wǎng)故障診斷中;文獻[12]為電網(wǎng)系統(tǒng)火電機組運行找出了優(yōu)化目標;文獻[13]把關聯(lián)規(guī)則分析用于斷路器故障診斷中,找出了斷路器故障現(xiàn)象與故障類別之間的關系,為建立診斷系統(tǒng)提供依據(jù)。

        基于此,本文將嘗試著把關聯(lián)規(guī)則挖掘方法應用在電能表檢定質(zhì)量影響因素的分析中,并借助Clementine數(shù)據(jù)挖掘[14]軟件處理海量數(shù)據(jù),輸出關聯(lián)因素網(wǎng)絡圖。

        1 電能表數(shù)據(jù)的準備

        1.1 數(shù)據(jù)的清洗與整理

        本文數(shù)據(jù)取自“寧夏地區(qū)的電能表全檢綜合結論信息”,數(shù)據(jù)共有63 698條記錄,其中有63 450條合格電表數(shù)據(jù)和248條不合格電表數(shù)據(jù)。原始數(shù)據(jù)存在很多問題,諸如:空值、無效值、奇異值等。除此以外,數(shù)據(jù)中存在眾多無關項,譬如:檢定臺體編號、檢定人姓名等,這些對挖掘電能表質(zhì)量影響因素的關聯(lián)性沒有直接聯(lián)系,采用信息過濾的方式濾去這些無關項。在很多檢定項中,檢定結果為空值或者無效值nulls,對于這樣缺失比較嚴重的數(shù)據(jù)記錄,采取直接略去的方式,缺失相對較少的數(shù)據(jù)記錄暫時保留,再結合檢定結論加以判斷。數(shù)據(jù)中各個檢定項的記錄方式為:1—合格,2—不合格,但是存在很多3或03等奇異值,暫時無法判斷檢定項的檢定結果,這樣的數(shù)據(jù)暫時不考慮,無法對其準確地統(tǒng)計分析。

        1.2 數(shù)據(jù)及指標的篩選

        根據(jù)JJG 596-2012《電子式交流電能表》檢定規(guī)程,目前具有計時功能的電能表的檢定項目有:外觀標志及通電檢查、基本誤差試驗、常數(shù)試驗、起動試驗、潛動試驗、日計時誤差試驗、交流耐壓試驗,其中,外觀標志及通電檢查和交流耐壓試驗需滿足電能表的通用技術要求,而其他5項檢定試驗需滿足電能表計量性能要求。

        經(jīng)審核,原始數(shù)據(jù)中對這7個檢定項目的記錄完整,且只存在較少的nulls值和空值,基于完整度的前提下,將這7項檢定試驗的結果作為評價電能表檢定環(huán)節(jié)的質(zhì)量的指標。因需挖掘的對象為質(zhì)量影響因素,所以抽取的電能表數(shù)據(jù)記錄為不合格電表的數(shù)據(jù)。其他信息作為噪聲干擾信息被過濾掉,不參與建模統(tǒng)計,而把抽取的信息形成關聯(lián)信息表,對此進行關聯(lián)因素分析。

        1.3 數(shù)據(jù)離散化

        本文采用的Apriori算法屬于布爾型關聯(lián)規(guī)則算法,只能處理分類型變量,不能處理數(shù)值型變量,因此需要對清洗除噪后的數(shù)據(jù)再進行處理,數(shù)據(jù)類型改為離散型,離散化后的數(shù)據(jù)參考樣式如表1所示。

        表1 離散化后的內(nèi)容示意Tab.1 Schematic content after discretization

        表1中約定:1代表“合格”,2代表“不合格”,所有檢定項目合格與否都可以用此類布爾型方式描述。因研究對象為不合格因素,所以2為真值。

        2 Apriori算法在電表檢定項中的應用

        2.1 算法原理簡介

        關聯(lián)規(guī)則挖掘算法中最經(jīng)典的是Apriori算法,它是由R.Agrawal和R.Srikant提出的一種挖掘關聯(lián)規(guī)則頻集的算法。該算法采用的是逐層搜索迭代的方式,先產(chǎn)生候選集Ck,然后計算所有k項集的支持度,若支持度滿足大于最小支持度閾值要求,則成為頻繁k項集Lk,接著在Lk基礎上產(chǎn)生候選集Ck+1,然后通過判斷最小支持度來確定頻繁(k+1)項集Lk+1,以此類推,直到找不到下一個頻繁項集為止。由每個頻集中的項組成關聯(lián)規(guī)則,分別計算出規(guī)則的置信度,若置信度大于最小置信度度閾值,則生成關聯(lián)規(guī)則[15],同時滿足最小支持度和最小置信度要求的規(guī)則成為有效規(guī)則。因此,Apriori算法分為兩步,第一步產(chǎn)生頻集,第二步產(chǎn)生關聯(lián)規(guī)則,算法的原理概括如圖1所示。

        圖1 Apriori算法原理簡圖Fig.1 Schematic diagram of the Apriori theory

        2.2 頻集的生成

        根據(jù)以上流程,本文抽取了10條數(shù)據(jù)記錄來示意Apriori算法的應用過程,數(shù)據(jù)如表2所示。

        表2 隨機抽取的部分數(shù)據(jù)Tab.2 Part of a random sample of data

        表2中10條記錄即為10個事務,記為T1-T10,對7個檢定項目因素進行編號,如表3所示。

        表3 檢定項目編號一覽表Tab.3 Number list of verification items

        根據(jù)表2中的數(shù)據(jù),I={a、b、c…}是能導致電能表檢定不合格的因素集合,即項的集合,T={T1、T2、T3…}是不合格電表的集合,即事務集。每個事務Ti都是項的集合,即Ti?I。要生成頻集,需設定最小支持度閾值,項支持度的定義為包含某一項集A的所有項目在事務集T中所占的比例,即:

        設定最小支持度為40%,頻集生成過程如下:

        (1)掃描T,對每個候選計數(shù),生成1-項候選集C1,如表4所示。

        表4 1-項候選集C1Tab.4 1-item candidate set C1

        (2)滿足閾值條件的項集組成頻繁1-項集L1,如表5所示。

        表5 頻繁1-項集L1Tab.5 1-item frequency set L1

        (3)根據(jù)L1產(chǎn)生2-項候選集C2,如表6所示。

        表6 2-項候選集C2Tab.6 2-item candidate set C2

        (4)滿足閾值條件的項集組成頻繁2-項集L2,如表7所示。

        表7 頻繁2-項集L2Tab.7 2-item frequency set L2

        (5)根據(jù)L2產(chǎn)生3-項候選集C3,如表8所示。

        表8 3-項候選集C3Fig.8 3-item candidate set C3

        (6)滿足閾值條件的項集組成頻繁3-項集L3,如表9所示。

        表9 頻繁3-項集L3Tab.9 3-item frequency set L3

        由于L3不能繼續(xù)構成候選集C4,迭代結束。最終得到的頻繁項集為L1、L2、L3。

        2.3 關聯(lián)規(guī)則生成

        有效規(guī)則需同時滿足規(guī)則最小支持度和最小置信度閾值要求,規(guī)則A?B的支持度為事務T中包含A∪B的比例,而A?B的置信度為事務T中包含A也同時包含B的比例,即:

        式中A、B均為包含于T的項集,且A∩B=?。本文中的支持度指的是7項檢定試驗中若干項不通過導致電能表不合格的概率,而置信度表現(xiàn)為若干項試驗未通過導致電表不合格結論的可能性大小。

        傳統(tǒng)的Apriori算法從頻集中生成關聯(lián)規(guī)則,可以找出7個檢定項目之間的關系。而本文還可以利用數(shù)據(jù)中“檢定結論=2”這一項的特殊性,找出檢定結論與單個檢定項目之間的關聯(lián)程度。因此,將“檢定結論=2”編號為m,規(guī)定最小置信度為80%,生成的規(guī)則如表10和表11所示。

        表10 關聯(lián)規(guī)則挖掘結果1Tab.10 The first mining results of association rules

        以上規(guī)則全符合最小置信度閾值要求,全部輸出為有效關聯(lián)規(guī)則。

        表11 關聯(lián)規(guī)則挖掘結果2Tab.11 The second mining results of association rules

        表11中除了ID6、ID19不滿足最小置信度閾值要求,其他都滿足,可以輸出為有效關聯(lián)規(guī)則。

        3 結果與分析

        3.1 結果生成及優(yōu)化處理

        因數(shù)據(jù)量較大,借助Clementine數(shù)據(jù)挖掘[14]軟件輔助處理。綜合對比不同閾值下多次處理結果的差異,最終設定最小支持度為15%,最小置信度為80%,為了防止關聯(lián)規(guī)則過于復雜,設定前項最大項目數(shù)為3。將結果按照支持度大小排序呈現(xiàn),見表12。

        表12 電能表關聯(lián)規(guī)則挖掘結果Tab.12 Mining results of association rules of electric energy meters

        為了保證規(guī)則的有效性及實用性,需要對以上Clementine生成的規(guī)則加以判斷、整合、優(yōu)化。表中出現(xiàn)了很多實例數(shù)與支持度相同的規(guī)則,判斷原因是事務“檢定結論=2”包含的項目數(shù)超過了設定的最大項目數(shù),從而生成了多種冗余規(guī)則,因此對表12中內(nèi)容進行整合、優(yōu)化,結果如表13所示。

        表13 電能表檢定數(shù)據(jù)關聯(lián)規(guī)則挖掘整合結果Tab.13 Optimization to the mining results of association rules of electric energy meters

        結果分析:(1)規(guī)則 ID16、ID17顯示,基本誤差試驗不通過導致電表不合格的支持度最高(48.58%),其次是起動試驗不通過(31.58%),電能表檢定不合格由這兩項引起的案例最多,說明基本誤差試驗和起動試驗的結果很大程度上影響著電能表檢定結論;相比之下日計時誤差試驗(21.05%)、常數(shù)試驗(20.65%)、潛動試驗(17.41%)不合格影響較小,如規(guī)則 ID7、ID12、ID15所示;(2)在最小支持度15%的條件下,以上規(guī)則的置信度都是100%,這符合常理,只要檢定環(huán)節(jié)中其中一項出現(xiàn)不合格,那電能表的檢定結論就是不合格;(3)在不合格電表中,通常會出現(xiàn)幾項檢定試驗均未通過的情況,如規(guī)則 ID85、ID87、ID79所示。

        3.2 檢定質(zhì)量關聯(lián)因素分析

        為了進一步研究單一檢定試驗項對檢定結論的影響程度,我們適當調(diào)整最小支持度閾值,并從Apriori關聯(lián)規(guī)則表中篩選出了一部分典型規(guī)則,如表14所示。

        表14 檢定結論與檢定項目的關聯(lián)規(guī)則表Tab.14 Association rules between verification conclusion and items

        從表14中的關聯(lián)規(guī)則可以得到以下幾點:(1)各影響因素關聯(lián)度排序:基本誤差試驗、起動試驗、日計時誤差試驗、常數(shù)試驗、潛動試驗、交流電壓試驗、外觀標志及通電檢查;(2)基本誤差試驗和起動試驗的檢定結果對電能表檢定結論影響最大,因基本誤差試驗和起動試驗不合格導致電能表不合格的情況發(fā)生最頻繁;(3)外觀標志及通電檢查與檢定不合格支持度很低(4.05%),表明由外觀標志通電檢查不通過而導致電表不合格的情況很少。

        為了直觀地對比各影響因素的關聯(lián)度,通過Clementine輔助生成了檢定結論與檢定試驗影響因素關聯(lián)圖,如圖2所示。網(wǎng)狀圖線條粗細反應鏈接的強弱,強弱鏈接區(qū)間劃分如表15所示。

        表15 網(wǎng)狀圖鏈接強弱區(qū)間表Tab.15 Interval divisions of link strength on the network diagram

        圖2 檢定試驗影響關聯(lián)圖Fig.2 Associated factors diagram of verification test

        在圖2中,粗實線代表強鏈接,細實線代表中等鏈接,虛線代表弱連接,左下角突出部分表示的是檢定結論與影響因素之間的強弱關系。影響檢定結論的強鏈接因素有4個:日計時誤差試驗、常數(shù)試驗、起動試驗、基本誤差試驗;中等鏈接因素有兩個:交流電壓試驗、潛動試驗;外觀標志及通電檢查試驗屬于弱鏈接影響因素。該分析結果與表13中關聯(lián)規(guī)則基本一致。

        3.3 檢定項目連帶關聯(lián)分析

        由3.1節(jié)的關聯(lián)規(guī)則 ID79、ID85、ID87可知,當一個電表檢定不合格時,可能表現(xiàn)為多種試驗均不通過,為了找到檢定項目之間的隱含關系,將圖2的檢定結論這一項濾去,得到了檢定試驗之間的關聯(lián)圖,如圖3所示。

        圖3 檢定項目內(nèi)部關聯(lián)圖Fig.3 Inner association diagram between verification items

        在圖3所示的關聯(lián)網(wǎng)狀圖中,常數(shù)試驗、基本誤差試驗、日計時誤差試驗這3個因素之間呈現(xiàn)強鏈接,外觀標志及通電檢查試驗、交流電壓試驗、以及其余5項因素之間呈現(xiàn)弱鏈接,其他的鏈接呈現(xiàn)為中等鏈接。這說明,常數(shù)試驗、基本誤差試驗、日計時誤差試驗、起動試驗、潛動試驗這5項中,有若干項不合格同時出現(xiàn)的情況經(jīng)常發(fā)生,尤其是常數(shù)試驗、基本誤差試驗、日計時誤差試驗這3項不合格連帶出現(xiàn)的概率較高。

        根據(jù)對圖3的定性分析,從Apriori算法關聯(lián)規(guī)則挖掘結果中篩選了部分關聯(lián)規(guī)則做驗證,見表16。

        表16中置信度都為100%意為:前項一定會導致后項發(fā)生,則在此可以理解為前項后項同時發(fā)生。那么,在ID122的規(guī)則中,基本誤差試驗、常數(shù)試驗、日計時誤差試驗同時不合格的電表有50例,占總樣本的20.24%,與圖5中強鏈接吻合;在ID227的規(guī)則中,基本誤差試驗、常數(shù)試驗、日計時誤差試驗、起動試驗同時不合格的電表有43例,占總樣本的17.41%,對應于“起動試驗”與“常數(shù)試驗、基本誤差試驗、日計時誤差試驗”三者之間的中等鏈接。同理,規(guī)則ID134對應“潛動試驗”與“常數(shù)試驗、起動試驗、基本誤差試驗、日計時誤差試驗”四者之間的中等鏈接。以此類推,Apriori規(guī)則挖掘結果與關聯(lián)網(wǎng)絡圖具有一致性。

        表16 部分關聯(lián)規(guī)則挖掘結果Tab.16 Part of mining results of association rules

        4 結束語

        通過對不合格電表的檢定項目關聯(lián)分析,可知:(1)基本誤差試驗的結果對電能表檢定質(zhì)量影響最大,其次是起動試驗;(2)日計時誤差試驗、常數(shù)試驗、潛動試驗和交流耐壓試驗的結果對電能表檢定質(zhì)量影響程度一般,但不可忽視;(3)外觀標志及通電檢查試驗影響最小。在諸多檢定項中,基本誤差試驗、常數(shù)試驗、日計時誤差試驗這三種同時不通過的概率很高,究其原因是這三項試驗都屬于檢測計量誤差類試驗,說明計量性能是電表的薄弱環(huán)節(jié)。廠家應重點提高電表的計量模塊質(zhì)量,提高這三者檢定通過率。

        猜你喜歡
        關聯(lián)規(guī)則
        撐竿跳規(guī)則的制定
        不懼于新,不困于形——一道函數(shù)“關聯(lián)”題的剖析與拓展
        “苦”的關聯(lián)
        當代陜西(2021年17期)2021-11-06 03:21:36
        數(shù)獨的規(guī)則和演變
        “一帶一路”遞進,關聯(lián)民生更緊
        當代陜西(2019年15期)2019-09-02 01:52:00
        規(guī)則的正確打開方式
        幸福(2018年33期)2018-12-05 05:22:42
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        TPP反腐敗規(guī)則對我國的啟示
        久久国产精品超级碰碰热| 亚洲av成人无码网站大全| 白嫩少妇激情无码| 免费va国产高清不卡大片| 午夜视频在线观看日本| 精品国产粉嫩内射白浆内射双马尾| а√资源新版在线天堂| 欧美成人激情在线| 亚洲日本在线中文字幕| 国产实拍日韩精品av在线| 东北老女人高潮大喊舒服死了| 国产精品调教| 亚洲精品成人无码中文毛片 | 欧美成人精品a∨在线观看| 欧美巨大性爽| 免费视频成人 国产精品网站| 精品高清一区二区三区人妖| 狂野欧美性猛xxxx乱大交| 初尝黑人巨砲波多野结衣| 亚洲欧美日本人成在线观看| 国产天堂av在线播放资源 | 蜜桃视频羞羞在线观看| 国产乱人伦av在线a麻豆| 中文字幕av日韩精品一区二区| 无码精品国产va在线观看| 精品国产91久久综合| 亚洲国语对白在线观看| 大地资源高清在线视频播放| 男女野外做爰电影免费| 日本精品久久久久中文字幕1| 免费一区二区在线观看视频在线 | 国产性生交xxxxx免费| 亚洲中文久久久久无码| 国产一品二品三区在线观看| 亚洲国产成人久久三区| 91精品国产综合成人| 96精品免费视频大全| 成人一区二区三区激情视频| 日本肥老妇色xxxxx日本老妇| 久青草国产在线观看| 亚洲精品一区二区视频|