夏翔,吳臻,方建亮,王春蕓,鄭建鋒
(1.國(guó)網(wǎng)浙江省電力公司,杭州310007;2.國(guó)網(wǎng)衢州供電公司,浙江衢州324000)
◆營(yíng)銷與服務(wù)◆
居民用戶用電數(shù)據(jù)質(zhì)量管控技術(shù)研究
夏翔1,吳臻2,方建亮1,王春蕓2,鄭建鋒2
(1.國(guó)網(wǎng)浙江省電力公司,杭州310007;2.國(guó)網(wǎng)衢州供電公司,浙江衢州324000)
電力產(chǎn)業(yè)是我國(guó)的基礎(chǔ)產(chǎn)業(yè),提高電力用戶的滿意度、建設(shè)堅(jiān)強(qiáng)智能電網(wǎng)是電力企業(yè)的目標(biāo),而保證合格的電壓質(zhì)量是其重要工作之一。如果電壓過(guò)低,不僅會(huì)使得家用電器不能正常工作,降低變壓器等設(shè)備的使用壽命,同時(shí)也會(huì)加大設(shè)備和線路的損耗,給工農(nóng)業(yè)生產(chǎn)和人民生活帶來(lái)很大的困難和損失,嚴(yán)重降低了低電壓用戶對(duì)電網(wǎng)企業(yè)的滿意度。為解決低電壓給用戶帶來(lái)的問(wèn)題,從2015年起,國(guó)家電網(wǎng)公司就實(shí)施了針對(duì)于低電壓?jiǎn)栴}的舉措:在“十三五”期間僅電網(wǎng)建設(shè)和改造的投資已超過(guò)2萬(wàn)億元,解決用戶低電壓?jiǎn)栴}超過(guò)520萬(wàn)戶。預(yù)計(jì)2020年基本可以實(shí)現(xiàn)用戶無(wú)低電壓?jiǎn)栴},從而保證用戶的正常用電[1]。
低電壓治理的關(guān)鍵在于數(shù)據(jù)診斷。目前,國(guó)內(nèi)學(xué)者和電力從業(yè)人員對(duì)低電壓?jiǎn)栴}的成因以及特點(diǎn)的研究已經(jīng)有了一些經(jīng)驗(yàn)和成果,但僅僅是通過(guò)對(duì)少量數(shù)據(jù)以及簡(jiǎn)單的圖表進(jìn)行分析得出的結(jié)論,而缺乏對(duì)海量數(shù)據(jù)的分析。究其原因是農(nóng)村多采用窄帶載波I型集中器,由于帶寬有限,采集相對(duì)困難;城區(qū)多采用II型集中器,雖然采集相對(duì)方便,然而低電壓出現(xiàn)概率較小,造成采集效果不好。根據(jù)統(tǒng)計(jì),I型集中器采集成功率僅為13%左右,II型集中器為50%左右。低電壓數(shù)據(jù)不僅難以采集,而且通常由于設(shè)備老化落后等原因?qū)е略诓杉^(guò)程中伴隨著大量的數(shù)據(jù)丟失,使得電網(wǎng)企業(yè)難以對(duì)低電壓用戶數(shù)據(jù)進(jìn)行有效的分析。想要獲取全面準(zhǔn)確的數(shù)據(jù),最經(jīng)濟(jì)有效的途徑是采用數(shù)據(jù)質(zhì)量治理方法,改善數(shù)據(jù)可用性,提升診斷的精度。文獻(xiàn)[2]通過(guò)對(duì)大數(shù)據(jù)時(shí)代下電力行業(yè)的分析,提出采用預(yù)防和治理,自動(dòng)和手工相結(jié)合的方式來(lái)保證電網(wǎng)系統(tǒng)的數(shù)據(jù)質(zhì)量;文獻(xiàn)[3]指出了智能電網(wǎng)中數(shù)據(jù)質(zhì)量存在的多方面問(wèn)題,系統(tǒng)分析了常用的數(shù)據(jù)質(zhì)量的相關(guān)控制方法,并總結(jié)了智能電網(wǎng)數(shù)據(jù)質(zhì)量的控制過(guò)程,同時(shí)展望了未來(lái)智能電網(wǎng)數(shù)據(jù)質(zhì)量控制的發(fā)展方向。文獻(xiàn)[4]從廣東電網(wǎng)數(shù)據(jù)質(zhì)量的現(xiàn)狀和實(shí)際需求出發(fā),提出了一種高效的數(shù)據(jù)質(zhì)量管理方法,并分析了該方法的數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)質(zhì)量問(wèn)題控制和數(shù)據(jù)質(zhì)量問(wèn)題預(yù)防等方面的實(shí)施情況。以上研究雖然對(duì)電力行業(yè)中的數(shù)據(jù)質(zhì)量進(jìn)行了探討和展望,并取得了一定的成果,然而針對(duì)低壓用戶數(shù)據(jù)質(zhì)量的研究相對(duì)比較少。建立有效的電網(wǎng)低電壓數(shù)據(jù)質(zhì)量管控模型,是優(yōu)化低電壓電網(wǎng)投資方案、明確低電壓電網(wǎng)投資方向、提高電網(wǎng)低電壓治理的重要舉措。
為解決低電壓用戶數(shù)據(jù)質(zhì)量問(wèn)題,本文對(duì)低壓用戶數(shù)據(jù)質(zhì)量管控技術(shù)進(jìn)行了研究。低壓用戶數(shù)據(jù)質(zhì)量管控技術(shù)大致分為以下4個(gè)步驟:①進(jìn)行正確性、唯一性校驗(yàn)和完整性校驗(yàn),保證無(wú)重復(fù)錄入數(shù)據(jù)以及數(shù)據(jù)是完整正確的;②從準(zhǔn)確性校驗(yàn)方面選擇合適方法評(píng)估數(shù)據(jù);③若數(shù)據(jù)未通過(guò)評(píng)估,則采用不同的修正方法來(lái)修正治理數(shù)據(jù);④若評(píng)估通過(guò)后則進(jìn)行數(shù)據(jù)質(zhì)量管理效能分析。數(shù)據(jù)質(zhì)量管控技術(shù)流程圖如圖1所示。
圖1 數(shù)據(jù)質(zhì)量管控技術(shù)流程圖
1.1 數(shù)據(jù)質(zhì)量維度表
通常情況下,數(shù)據(jù)有三大固有屬性:自治性、真實(shí)性和完備性,即數(shù)據(jù)的絕對(duì)質(zhì)量。除此之外,在數(shù)據(jù)使用、存儲(chǔ)以及傳輸過(guò)程中產(chǎn)生的質(zhì)量為過(guò)程質(zhì)量。研究者和業(yè)內(nèi)人士采用若干組維度和屬性直觀的衡量數(shù)據(jù)質(zhì)量,以便進(jìn)行更深入的分析和評(píng)估[5]。本文基于數(shù)據(jù)的業(yè)務(wù)屬性和固有屬性,多維度的定義電網(wǎng)業(yè)務(wù)指標(biāo)數(shù)據(jù),作出的數(shù)據(jù)質(zhì)量維度表如表1所示。
表1 數(shù)據(jù)質(zhì)量維度表
1.2 數(shù)據(jù)質(zhì)量管控技術(shù)
數(shù)據(jù)質(zhì)量和業(yè)務(wù)過(guò)程這兩者在很大程度上決定了電網(wǎng)企業(yè)信息系統(tǒng)處理信息的質(zhì)量。由于目前數(shù)據(jù)采集現(xiàn)狀是“進(jìn)來(lái)的是垃圾,出去的也是垃圾”,所以加強(qiáng)數(shù)據(jù)采集的監(jiān)管刻不容緩,不然會(huì)嚴(yán)重影響整個(gè)系統(tǒng)的數(shù)據(jù)質(zhì)量。與此同時(shí),由于數(shù)據(jù)在使用的過(guò)程中用戶能夠和其直接交互,極易造成二次污染。因此數(shù)據(jù)質(zhì)量管控人員應(yīng)該嚴(yán)格控制數(shù)據(jù)源頭,將控制貫穿于整個(gè)過(guò)程。電網(wǎng)企業(yè)一般從正確性、唯一性、完整性以及準(zhǔn)確性這4方面嚴(yán)格管控?cái)?shù)據(jù)質(zhì)量。
1.2.1 數(shù)據(jù)的正確性校驗(yàn)
(1)數(shù)據(jù)類型:根據(jù)數(shù)據(jù)的使用習(xí)慣以及業(yè)務(wù)類型,合理設(shè)定數(shù)據(jù)單位、精度、類型等,并且對(duì)數(shù)據(jù)進(jìn)行合理的格式轉(zhuǎn)換。只有規(guī)范了數(shù)據(jù)類型,才可以區(qū)分出與所需類型不符合的數(shù)據(jù),進(jìn)而判斷指標(biāo)數(shù)據(jù)是否正確。
(2)數(shù)據(jù)值域:根據(jù)指標(biāo)數(shù)據(jù)的業(yè)務(wù)屬性以及固有屬性,定義數(shù)據(jù)的取值范圍,系統(tǒng)可以根據(jù)定義判斷指標(biāo)數(shù)據(jù)是否正確。需要說(shuō)明的是,數(shù)據(jù)值域和數(shù)據(jù)單位緊密關(guān)聯(lián),例如:在電流中A和kA之間相差1 000倍。
(3)數(shù)據(jù)變化率:指的是通過(guò)分析數(shù)據(jù)得出它的變化規(guī)律,然后根據(jù)得出的規(guī)律判斷數(shù)據(jù)是否正確。
(4)數(shù)據(jù)表達(dá)形式:指的是根據(jù)數(shù)據(jù)格式規(guī)范來(lái)判斷數(shù)據(jù)是否正確,例如:采集日期的格式應(yīng)該是“YYYY-MM-DD”。
1.2.2 數(shù)據(jù)的唯一性校驗(yàn)
數(shù)據(jù)的唯一性指的是在同一個(gè)數(shù)據(jù)表中不能存在2個(gè)相同的帶有某種標(biāo)識(shí)型的數(shù)據(jù),即數(shù)據(jù)庫(kù)的相關(guān)操作要保證數(shù)據(jù)的唯一性。具體做法是在采集數(shù)據(jù)存于數(shù)據(jù)庫(kù)之前,可以針對(duì)數(shù)據(jù)庫(kù)的某些字段設(shè)置唯一約束,從而在數(shù)據(jù)庫(kù)層保證數(shù)據(jù)的唯一性。
1.2.3 數(shù)據(jù)的完整性校驗(yàn)
采集到的數(shù)據(jù)極有可能存在數(shù)據(jù)項(xiàng)缺失或者人為造成的數(shù)據(jù)項(xiàng)漏填的現(xiàn)象,不完整的數(shù)據(jù)會(huì)造成后續(xù)數(shù)據(jù)傳輸和使用上的困難,因此需要從數(shù)據(jù)庫(kù)控制和人工補(bǔ)充2個(gè)方面來(lái)保證數(shù)據(jù)的完整性。
1.2.4 數(shù)據(jù)的準(zhǔn)確性校驗(yàn)
數(shù)據(jù)的準(zhǔn)確性指的是保證數(shù)據(jù)的實(shí)際值和準(zhǔn)確值一致,具體的方法主要有4種。
(1)閾值標(biāo)定法。閾值也叫做臨界值,代表數(shù)據(jù)的有效取值范圍。這個(gè)方法首先應(yīng)該給出數(shù)據(jù)的取值范圍,然后判斷數(shù)據(jù)是否處于取值范圍之間,從而判斷數(shù)據(jù)是否準(zhǔn)確。一般情況下,有2種方法確定數(shù)據(jù)的閾值:第一種是通過(guò)技術(shù)人員和業(yè)內(nèi)研究人員的專業(yè)確定;第二種是分析歷史數(shù)據(jù)和相關(guān)聯(lián)數(shù)據(jù),分析和總結(jié)數(shù)據(jù)值的分布情況,最后得到數(shù)據(jù)的閾值。
(2)線性回歸填充法。這個(gè)方法的使用需要基于大量的觀察數(shù)據(jù),利用線性回歸方程式,也就是數(shù)理統(tǒng)計(jì)方法建立因變量與自變量之間的線性回歸關(guān)系,從而建立出一個(gè)函數(shù)表達(dá)式。它的基本理念是通過(guò)自變量的回歸關(guān)系來(lái)預(yù)測(cè)Y的缺失數(shù)據(jù),根據(jù)這個(gè)理念可以得出第k個(gè)缺失項(xiàng)的填充值為
如果每個(gè)變量之間有明顯的回歸關(guān)系,就可以說(shuō)明利用回歸模型所得出的估計(jì)值和真實(shí)值很接近,但是搭建和分析一個(gè)回歸模型要花費(fèi)很多的時(shí)間,需要填充很多重要變量的缺失值才能夠更好的評(píng)價(jià)此模型。
(3)歷史數(shù)據(jù)估算法。電網(wǎng)業(yè)務(wù)數(shù)據(jù)具有縱向關(guān)聯(lián)的特性,所以在對(duì)數(shù)據(jù)估算時(shí)可以采用歷史數(shù)據(jù)估算法。不同的指標(biāo)數(shù)據(jù)因子可能在一段時(shí)間內(nèi)出現(xiàn)不同的變化趨勢(shì),例如:某個(gè)時(shí)間段電流值、某個(gè)時(shí)間段功率值等。然而這些指標(biāo)以幾天為測(cè)量時(shí)間單位則不會(huì)出現(xiàn)很大的波動(dòng),所以可以把某個(gè)時(shí)間段的平均值作為填充值。根據(jù)“本年本月止表底抄表電量”隨著時(shí)間的推移呈增加的趨勢(shì),計(jì)算出它的平均增幅,然后用平均增幅和最近一個(gè)月的數(shù)據(jù)來(lái)估算問(wèn)題數(shù)據(jù)。
(4)人工經(jīng)驗(yàn)值法。相關(guān)領(lǐng)域的技術(shù)人員有著豐富的經(jīng)驗(yàn)和專業(yè)的技術(shù)水平,他們很容易發(fā)現(xiàn)數(shù)據(jù)的問(wèn)題,然后對(duì)錯(cuò)誤數(shù)據(jù)進(jìn)行校正,但是采用此方法需要很多的專業(yè)人員,并且工作量大,耗時(shí)多,僅適合于關(guān)鍵數(shù)據(jù)的準(zhǔn)確性校驗(yàn)。
本文以居民用戶低電壓數(shù)據(jù)為例進(jìn)行仿真,實(shí)驗(yàn)數(shù)據(jù)來(lái)自智能電能表的實(shí)時(shí)采集,選取某地2016年5月16日到6月12日的數(shù)據(jù)作為低電壓分析的源數(shù)據(jù),結(jié)合前文中列舉的低電壓管控技術(shù),在采集回來(lái)的所有數(shù)據(jù)中選擇用戶的有功功率、A/B/C相電壓、A/B/C相電流,篩選得到當(dāng)日的低電壓數(shù)據(jù)。動(dòng)態(tài)實(shí)時(shí)的電氣功率數(shù)據(jù)采樣間隔為1 h,采集時(shí)間從8:00~20:00,包括用戶側(cè)電壓、電流、功率因數(shù)等。
2.1 數(shù)據(jù)預(yù)處理
首先從正確性、唯一性、完整性3個(gè)方面對(duì)數(shù)據(jù)進(jìn)行預(yù)處理使其符合相應(yīng)的業(yè)務(wù)需求。比如:對(duì)數(shù)據(jù)表中重復(fù)數(shù)據(jù)的處理、刪除不需要的影響因素、對(duì)科學(xué)計(jì)數(shù)法表示的數(shù)據(jù)轉(zhuǎn)換為文本表示等,以完成數(shù)據(jù)的初級(jí)處理。例如:5月份采集到的源數(shù)據(jù)中一共有134個(gè)用戶,總記錄是14 229條。經(jīng)過(guò)整理去重,有效數(shù)據(jù)是1 455條。6月份一共有179個(gè)用戶,總記錄是11 183條,整理去重后有效數(shù)據(jù)是2 529條。之后采用修正方法(閾值中值填充法、線性回歸填充法、歷史數(shù)據(jù)估算法)進(jìn)一步修正已有數(shù)據(jù),并從準(zhǔn)確性校驗(yàn)方面重新評(píng)估數(shù)據(jù)。最后對(duì)評(píng)估通過(guò)的數(shù)據(jù)做數(shù)據(jù)質(zhì)量管理效能分析,從而選擇最優(yōu)的數(shù)據(jù)修正方法。本文使用PL/SQL工具將查詢結(jié)果導(dǎo)出為CSV格式,使用Origin軟件作圖。
2.2 數(shù)據(jù)質(zhì)量管理效能分析
通過(guò)之前的分析可知,只是修正問(wèn)題數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,如果修正過(guò)后的數(shù)據(jù)有很多的偏差,那么會(huì)在一定程度上影響系統(tǒng)的精確度,因此同時(shí)也要保證修正方法的正確性。本文為了驗(yàn)證每個(gè)修正方法(閾值中值填充法、線性回歸填充法、歷史數(shù)據(jù)估算法)是否正確,從數(shù)據(jù)庫(kù)中隨機(jī)選擇了一組數(shù)據(jù)來(lái)驗(yàn)證。具體方法是:從數(shù)據(jù)庫(kù)中隨機(jī)找出一組確認(rèn)為正確的數(shù)據(jù),然后利用修正方法對(duì)其修正,接著對(duì)比準(zhǔn)確值和修正值,計(jì)算數(shù)據(jù)的偏差率,用D1~Dn表示指標(biāo)數(shù)據(jù)線,那么數(shù)據(jù)偏差率的計(jì)算公式為
在隨機(jī)選取的這組數(shù)據(jù)中,因?yàn)閿?shù)據(jù)量很大,不能全部展示出來(lái),因此這里僅僅展示部分?jǐn)?shù)據(jù),以下是利用不同的修正方法計(jì)算偏差率的結(jié)果值。
2.2.1 閾值中值填充法
采用閾值中值填充法得出的計(jì)算結(jié)果如表2所示。
表2 閾值中值填充法結(jié)果
得出的所有偏差率,其分布如圖2所示。
圖2 閾值中值偏差分布圖
2.2.2 線性回歸填充法
采用線性回歸填充法得出的計(jì)算結(jié)果如表3所示。
得出的所有偏差率,其分布如圖3所示。
2.2.3 歷史數(shù)據(jù)估算法
采用歷史數(shù)據(jù)估算法得出的計(jì)算結(jié)果如表4。得出的所有偏差率,其分布如圖4所示。
表3 線性回歸填充法結(jié)果
圖3 線性回歸填充偏差分布圖
表4 歷史數(shù)據(jù)估算法結(jié)果
圖4 歷史數(shù)據(jù)估算偏差分布圖
通過(guò)圖2-圖4形可以知道,閾值中值填充法的誤差率達(dá)到50%,效果很差;線性回歸填充和歷史數(shù)據(jù)估算方法填充效果較為理想,數(shù)據(jù)偏差率穩(wěn)定在20%之內(nèi),并且相對(duì)集中,所以采用這2種方法得出的修正值來(lái)代替臨時(shí)值,對(duì)整體的計(jì)算效果沒(méi)有多大影響。對(duì)此原因進(jìn)行深入分析,由于閾值是由技術(shù)人員和專業(yè)人士所制定,閾值范圍是所有合理數(shù)據(jù)的分布區(qū)間,所以在極端的情況下才適合采用閾值中值來(lái)替代計(jì)算,但這并不是最佳選擇。歷史數(shù)據(jù)估算法和線性回歸填充法這2種方法雖然有良好的問(wèn)題數(shù)據(jù)修復(fù)能力,但它要求具有很高的計(jì)算數(shù)據(jù)準(zhǔn)確性,如果參與的計(jì)算數(shù)據(jù)準(zhǔn)確性不能保證,那么它們?cè)诤艽蟪潭壬蠒?huì)影響計(jì)算結(jié)果的準(zhǔn)確性,同時(shí)即便這2種方法的準(zhǔn)確性很高,但是卻做不到完全精確。在短時(shí)間內(nèi)經(jīng)常填充數(shù)據(jù)不會(huì)造成有很大影響,但從長(zhǎng)期來(lái)看,一旦被填充的數(shù)據(jù)越來(lái)越多,就會(huì)嚴(yán)重影響低電壓用戶數(shù)據(jù)質(zhì)量,因此應(yīng)將數(shù)據(jù)修正方法和及時(shí)的數(shù)據(jù)更新相結(jié)合,才能使得低壓用戶數(shù)據(jù)質(zhì)量得到保證。
本文分析和研究了低壓用戶數(shù)據(jù)質(zhì)量管控技術(shù),提出了一些完善有效的數(shù)據(jù)質(zhì)量評(píng)估和校驗(yàn)的方法,同時(shí)設(shè)計(jì)和分析了數(shù)據(jù)質(zhì)量管控流程,最后通過(guò)案例仿真以及圖表展示,對(duì)閾值中值填充、線性回歸填充和歷史數(shù)據(jù)填充這3種方法下的數(shù)據(jù)質(zhì)量應(yīng)用效果進(jìn)行了分析。其中閾值填充效果相對(duì)較差,只能作為極端情況下的權(quán)宜之計(jì);歷史數(shù)據(jù)估算法和線性回歸填充法有較好的對(duì)問(wèn)題數(shù)據(jù)的修復(fù)能力,能把誤差穩(wěn)定在20%左右,在短期內(nèi)可以作為丟失數(shù)據(jù)的臨時(shí)值。雖然使用歷史數(shù)據(jù)估算法和線性回歸填充法填充的數(shù)據(jù)可以在一定時(shí)間內(nèi)作為丟失數(shù)據(jù)的替代值,但只有將數(shù)據(jù)修正和數(shù)據(jù)的及時(shí)更新相結(jié)合,才能保證低壓用戶的數(shù)據(jù)質(zhì)量。經(jīng)過(guò)測(cè)試,本文所提數(shù)據(jù)質(zhì)量管控技術(shù)具有較高的可用性和良好的準(zhǔn)確率,可以滿足電力企業(yè)對(duì)于低電壓數(shù)據(jù)質(zhì)量管控的需求。D
[1]本刊編輯部.國(guó)家能源局發(fā)布配電網(wǎng)建設(shè)改造行動(dòng)計(jì)劃[J].農(nóng)村電氣化,2015(11):11-13.
[2]江國(guó)富.基于Hadoop的電網(wǎng)資產(chǎn)系統(tǒng)數(shù)據(jù)質(zhì)量管理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D].廣州:華南理工大學(xué),2014.
[3]黃慧,朱齊亮.智能電網(wǎng)數(shù)據(jù)質(zhì)量控制的發(fā)展分析與展望[J].科技信息,2012(7):92-93.
[4]江疆,黃劍文,楊秋勇.基于廣東電網(wǎng)大數(shù)據(jù)的數(shù)據(jù)質(zhì)量管理方法[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2016(7):88-91.
[5]黨芳芳.電網(wǎng)企業(yè)業(yè)務(wù)數(shù)據(jù)質(zhì)量管控技術(shù)的研究[D].北京:華北電力大學(xué),2014.
[6]宗群龍.低壓電力線窄帶載波通信路由設(shè)計(jì)[D].長(zhǎng)沙:湖南大學(xué),2010.
[7]段成.電網(wǎng)投資效益后評(píng)價(jià)理論及決策支持系統(tǒng)的研究[D].北京:華北電力大學(xué),2012.
[8]林聽光.電信經(jīng)營(yíng)分析系統(tǒng)中的數(shù)據(jù)質(zhì)量管理[D].北京:北京郵電大學(xué),2007.
[9]曾鳴.電力企業(yè)計(jì)劃管理及其技術(shù)支持系統(tǒng)[M].北京:中國(guó)電力出版社,2001.
[10]胡紅曉.缺失值處理方法比較研究[J].商場(chǎng)現(xiàn)代化, 2007(12):34-36.
[11]劉孚智.佛山電網(wǎng)發(fā)展戰(zhàn)略研究[D].廣州:華南理工大學(xué),2003.
Research on quality management and control technology of electricity data for residents
XIA Xiang1,WU Zhen2,FANG Jian?liang1,WANG Chun?yun2,ZHENG Jian?feng2
(1.State Grid Zhejiang Electric Power Company,Hangzhou 310007,China; 2.State Grid Quzhou Power Supply Company,Quzhou 324000,China)
為了滿足低壓用戶對(duì)電能質(zhì)量的要求,電網(wǎng)企業(yè)必須對(duì)采集的相關(guān)電能數(shù)據(jù)分析診斷并據(jù)此做出決策。鑒于數(shù)據(jù)質(zhì)量管控技術(shù)在低壓用戶治理中的重大作用,首先提出了一套針對(duì)于電網(wǎng)企業(yè)的數(shù)據(jù)質(zhì)量管控流程,采用多種校驗(yàn)方法來(lái)保證數(shù)據(jù)的合理性,其中校驗(yàn)方法包括正確性校驗(yàn)、唯一性校驗(yàn)、完整性校驗(yàn)和準(zhǔn)確性校驗(yàn)。為了保證數(shù)據(jù)分析結(jié)果無(wú)誤,對(duì)問(wèn)題數(shù)據(jù)加以修正。最后,通過(guò)算例仿真驗(yàn)證了數(shù)據(jù)質(zhì)量管控技術(shù)的應(yīng)用效果。
低電壓;數(shù)據(jù)質(zhì)量;管控技術(shù);校驗(yàn)方法
In order to meet the requirements of low voltage users on the power quality,the grid enterprise must analyze and diagnose the relevant power data and make the decision accordingly.In view of the importance of techology for data quality control on low?voltage user management,this paper first proposes a set of data quality control pro?cedures for power grid enterprises,and uses several check?up algo?rithms to ensure rationality of data,including the correctness verifica?tion,uniqueness verification,integrity verification and accuracy verifi?cation.Problematic data has been amendeod in order to ensure the cor?rectness of data analysis results,.Finally,a simulated example is given toverifyapplicationeffectsofdataqualitycontroltechnology.
low voltage;data quality;control technique;veri?fication method
1009-1831(2017)02-0039-04
10.3969/j.issn.1009-1831.2017.02.010
F407.61;TP274
C
2017-01-15
夏翔(1974),男,河南永城人,碩士,高級(jí)工程師,研究方向?yàn)殡娋W(wǎng)信息化研究和管理。