(國網(wǎng)上海浦東供電公司,上海 200122)
近年來,信息技術(shù)日益發(fā)達(dá),配電網(wǎng)運(yùn)行過程中積累了大量的運(yùn)行維護(hù)數(shù)據(jù)。這些數(shù)據(jù)已廣泛應(yīng)用于電力系統(tǒng)規(guī)劃、運(yùn)行、資產(chǎn)管理、市場管理以及終端用戶服務(wù)等各個(gè)領(lǐng)域[1]。通過有效分析來自各種智能表計(jì)的大數(shù)據(jù),可以幫助決策部門更好地獲得電力用戶的相關(guān)信息[2]。目前,大數(shù)據(jù)分析在電力系統(tǒng)中的實(shí)際應(yīng)用處于快速發(fā)展階段,研究者從數(shù)據(jù)傳輸、存儲、實(shí)時(shí)處理、多數(shù)據(jù)源異構(gòu)和可視化等方面分析了電力大數(shù)據(jù)處理技術(shù)的發(fā)展現(xiàn)狀和面臨的挑戰(zhàn),提出了智能電網(wǎng)評估指標(biāo)體系及評價(jià)方法[3-4],并給出了配用電大數(shù)據(jù)分析架構(gòu)和應(yīng)用路線圖[5-8]。本文將大數(shù)據(jù)分析及數(shù)據(jù)關(guān)聯(lián)挖掘技術(shù)應(yīng)用于配電網(wǎng)的運(yùn)行維護(hù)中,提出了基于Apriori關(guān)聯(lián)算法的配電網(wǎng)運(yùn)行大數(shù)據(jù)關(guān)聯(lián)分析模型,以期為提高配電網(wǎng)運(yùn)行維護(hù)指標(biāo)提供決策建議。
配電網(wǎng)運(yùn)行維護(hù)是對配電網(wǎng)及其設(shè)施所采取的巡視檢查、保養(yǎng)、簡單修理等技術(shù)管理設(shè)施和手段的總稱,主要包括基礎(chǔ)數(shù)據(jù)管理、巡視檢查與防護(hù)、配電網(wǎng)維護(hù)、狀態(tài)評價(jià)、缺陷管理、用戶公用設(shè)備移交、保供電管理、電壓與無功管理,以及方案審查與設(shè)備驗(yàn)收投運(yùn)等工作。在目前的配電網(wǎng)運(yùn)行維護(hù)過程中,主要存在以下3個(gè)問題[9-13]。
(1) 配電網(wǎng)網(wǎng)架基礎(chǔ)薄弱,自動化水平低,檢測手段相對落后,且網(wǎng)點(diǎn)多、線長、面廣,使得配電網(wǎng)的運(yùn)行維護(hù)任務(wù)十分艱巨。與國外先進(jìn)國家相比,我國在發(fā)電、輸電、配電方面的投資比率差異較大。近年來,隨著資金的不斷投入,配電網(wǎng)的運(yùn)行狀況得到了很大改善,但與主網(wǎng)相比,基礎(chǔ)設(shè)施仍顯太差,網(wǎng)架結(jié)構(gòu)仍然十分薄弱,尤其是臺區(qū)低壓設(shè)備老舊問題日益突出,用電高峰時(shí)段低壓故障頻發(fā),供電搶修工作愈加繁重。
(2) 社會生產(chǎn)、生活用電激增,負(fù)荷增長屢創(chuàng)新高。區(qū)域性、季節(jié)性負(fù)荷需求對配電網(wǎng)的供電能力和運(yùn)行維護(hù)提出了更高的要求。社會電氣化程度越來越高,部分高新技術(shù)、高附加值產(chǎn)業(yè)用戶對電能質(zhì)量的要求也越來越高,使配電網(wǎng)安全穩(wěn)定運(yùn)行承受了巨大壓力。
(3) 配電網(wǎng)運(yùn)行維護(hù)管理模式相對滯后。在當(dāng)前的配電網(wǎng)管理模式下,只有當(dāng)線路發(fā)生跳閘時(shí),才能發(fā)現(xiàn)設(shè)備出了問題,在缺陷消除后,并沒有認(rèn)真分析原因,導(dǎo)致此類問題仍會發(fā)生,形成惡性循環(huán),造成了巨大的人力、物力的浪費(fèi)及供電量的損失。
國內(nèi)對電力大數(shù)據(jù)的研究主要集中在電力企業(yè)的生產(chǎn)、運(yùn)營、管理等方面,在輸變電設(shè)備故障識別與預(yù)測、配電設(shè)備負(fù)載估算及重過載預(yù)警、物資庫存物料需求影響因素分析、配電網(wǎng)低電壓實(shí)時(shí)監(jiān)測應(yīng)用、電網(wǎng)中長期負(fù)荷預(yù)測與用電量分析等方面已有實(shí)際應(yīng)用。但在配電網(wǎng)的用電量預(yù)測、空間負(fù)荷預(yù)測、多指標(biāo)關(guān)聯(lián)分析等領(lǐng)域,由于國內(nèi)難以支持智能配電系統(tǒng)和用戶側(cè)管理系統(tǒng)的有效集成,因此與國外的大數(shù)據(jù)應(yīng)用方面存在巨大差距。
隨著配電網(wǎng)業(yè)務(wù)覆蓋面的進(jìn)一步擴(kuò)大,逐漸積累了超過TB級的數(shù)據(jù),然而大多數(shù)電力企業(yè)的數(shù)據(jù)庫僅僅實(shí)現(xiàn)了數(shù)據(jù)存儲、查詢、統(tǒng)計(jì)等最基本層次的功能,無法深入挖掘出隱藏在海量數(shù)據(jù)背后的潛在價(jià)值。因此,大數(shù)據(jù)技術(shù)在配電網(wǎng)運(yùn)行維護(hù)管理中的應(yīng)用已經(jīng)勢在必行。它是電網(wǎng)運(yùn)行維護(hù)向更優(yōu)、更強(qiáng)發(fā)展的必要手段。
表1為上海電力公司目前投運(yùn)的配用電信息系統(tǒng)及其輸出數(shù)據(jù)類型。
對以上配電網(wǎng)生產(chǎn)系統(tǒng)信息進(jìn)行梳理,可用于中壓配電網(wǎng)指標(biāo)評價(jià)大數(shù)據(jù)關(guān)聯(lián)分析的數(shù)據(jù)如下:電網(wǎng)電氣拓?fù)鋽?shù)據(jù);用戶臺賬數(shù)據(jù)及關(guān)聯(lián)關(guān)系;線路、變壓器設(shè)備臺賬數(shù)據(jù);10 kV設(shè)備巡檢、缺陷記錄等;調(diào)度操作日志,設(shè)備操作日志;中壓饋線電流數(shù)據(jù);臺區(qū)凍結(jié)電量及負(fù)荷數(shù)據(jù);電壓監(jiān)測點(diǎn)數(shù)據(jù);故障事件數(shù)據(jù);停電事件數(shù)據(jù);搶修工單信息;電能質(zhì)量及事件數(shù)據(jù);日/月線損率;電壓合格率。
1993年,AGRAWAL等人首先提出了關(guān)聯(lián)規(guī)則的概念,同時(shí)給出了相應(yīng)的挖掘算法,但是性能較差。1994年,他們建立了項(xiàng)目集格空間理論,并提出了著名的Apriori算法,至今Apriori仍然作為關(guān)聯(lián)規(guī)則挖掘的經(jīng)典算法被廣泛討論,其后諸多的研究人員對關(guān)聯(lián)規(guī)則的挖掘問題進(jìn)行了大量的研究。
表1 上海電力公司配用電信息系統(tǒng)及其輸出數(shù)據(jù)
關(guān)聯(lián)規(guī)則挖掘的對象一般是事務(wù)數(shù)據(jù)集。關(guān)聯(lián)規(guī)則可定義為:設(shè)T={t1,t2,t3,…,tk,…,tm}為事務(wù)數(shù)據(jù)庫,tk為T的第k件事務(wù),I={i1,i2,i3,…,ik}是二元屬性的集合,其中的元素稱為項(xiàng),對任意k,tk?I;X與Y是I的子集,X∩Y=?,在事務(wù)數(shù)據(jù)集中尋找X與Y的關(guān)聯(lián)關(guān)系,關(guān)聯(lián)關(guān)系記為X?Y。關(guān)聯(lián)規(guī)則里有兩個(gè)重要概念:支持度和置信度。支持度表示X和Y這一事件組合在總事務(wù)記錄中出現(xiàn)的概率,置信度是指出現(xiàn)了項(xiàng)集X的事務(wù)中X和Y這一事件組合出現(xiàn)的概率。最小支持度Smin和最小置信度Cmin規(guī)定了支持度和置信度的閾值,只有達(dá)到這兩個(gè)閾值才算強(qiáng)關(guān)聯(lián)規(guī)則。
配電網(wǎng)運(yùn)行維護(hù)中的各個(gè)指標(biāo),與配電網(wǎng)的設(shè)備情況、運(yùn)行情況、人為因素、天氣情況等均有著復(fù)雜的因果或關(guān)聯(lián)關(guān)系。這些關(guān)系有些是明確或顯而易見的,有些還未被明確發(fā)現(xiàn),特別是一些關(guān)聯(lián)不是特別強(qiáng)但對實(shí)際生產(chǎn)運(yùn)行影響較大的關(guān)聯(lián)關(guān)系。如果能夠通過大數(shù)據(jù)分析方法尋找到這些關(guān)聯(lián)關(guān)系,將為提升配電網(wǎng)運(yùn)行維護(hù)指標(biāo)提供更多的依據(jù)和手段。本文采用Apriori關(guān)聯(lián)算法,將配電網(wǎng)運(yùn)行維護(hù)數(shù)據(jù)與配電網(wǎng)事件或指標(biāo)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,得到配電網(wǎng)運(yùn)行維護(hù)指標(biāo)與運(yùn)行狀態(tài)、事件變化之間的關(guān)聯(lián)關(guān)系及關(guān)聯(lián)強(qiáng)弱。
對于時(shí)間報(bào)表類數(shù)據(jù),如故障搶修事件報(bào)表、設(shè)備缺陷記錄等,在分析各項(xiàng)數(shù)據(jù)事件之間的關(guān)聯(lián)關(guān)系之前,需要對報(bào)表數(shù)據(jù)做以下處理。
(1) 數(shù)據(jù)歸一化 將含義相同但表述不同的項(xiàng)目統(tǒng)一成相同的描述語言,以提高算法的計(jì)算效率。例如,“電網(wǎng)故障”和“電網(wǎng)性故障”統(tǒng)一成“電網(wǎng)故障”,“過負(fù)荷”和“過載”統(tǒng)一成“過負(fù)荷”,“0.4 kV”和“380 V”統(tǒng)一成“0.4 kV”。
(2) 提取描述性語言的關(guān)鍵詞 現(xiàn)有的技術(shù)手段無法對描述性的語言進(jìn)行分析,所以對于“故障描述”等主觀性較強(qiáng)、規(guī)范性較低的項(xiàng)目,需要提取能夠表征該項(xiàng)目描述的關(guān)鍵詞,將關(guān)鍵詞作為事務(wù)數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析。如“欠費(fèi)停電,客戶已付”提取關(guān)鍵詞“欠費(fèi)停電”,“設(shè)備故障,客戶報(bào)修此處電表內(nèi)總閘跳閘,請?zhí)幚怼碧崛£P(guān)鍵詞“設(shè)備故障”“跳閘”,“電能質(zhì)量,客戶報(bào)修一戶電壓低,電器無法正常使用,請?zhí)幚怼碧崛£P(guān)鍵詞“電能質(zhì)量”“電壓問題”“電器無法使用”。
(3) 去除無用項(xiàng)和重復(fù)項(xiàng) 將重復(fù)的項(xiàng)目或?qū)τ谟涗洘o實(shí)際區(qū)分作用的項(xiàng)目刪除。如項(xiàng)目“故障類型”,實(shí)際一般填寫為“非外損因素”或空,可以去除該項(xiàng),以避免關(guān)聯(lián)計(jì)算時(shí)數(shù)據(jù)維度過高,影響計(jì)算效率。
(4) 形成事務(wù)數(shù)據(jù)集 按照上述原則,將每條記錄中的數(shù)據(jù)進(jìn)行整理后,每個(gè)數(shù)據(jù)項(xiàng)的集合形成事務(wù)全集I={i1,i2,i3,…,ik,…},其中ik為某項(xiàng)事務(wù)。對每條記錄即形成一個(gè)事務(wù)數(shù)據(jù)集Ik={i1,i2,i3,…,ik,…},每個(gè)Ik包含了若干個(gè)ik。將所有報(bào)表記錄作為事務(wù)數(shù)據(jù)集的集合T={I1,I2,I3,…,Ik,…},對T進(jìn)行關(guān)聯(lián)分析,即可得到T中各事務(wù)ik之間或事務(wù)集X(X是某些ik的集合)與事務(wù)集Y(Y是另一些ik的集合)之間的關(guān)聯(lián)關(guān)系,并得到這些關(guān)聯(lián)關(guān)系的支持度和置信度。
將饋線電流、電壓這些時(shí)序運(yùn)行數(shù)據(jù)進(jìn)行離散化處理,并在離散化的過程中保持事務(wù)的時(shí)序運(yùn)行特征和趨勢。
(1) 數(shù)據(jù)頻度設(shè)置 數(shù)據(jù)設(shè)置頻度需考慮時(shí)序數(shù)據(jù)頻度、事件指標(biāo)頻度及實(shí)際計(jì)算能力。每個(gè)時(shí)間斷面會生成一個(gè)事務(wù)數(shù)據(jù)集,如果分析的數(shù)據(jù)頻度過高,將會產(chǎn)生較多的事務(wù)數(shù)據(jù)集;如果分析的時(shí)序數(shù)據(jù)持續(xù)時(shí)間較長,將會產(chǎn)生高維數(shù)據(jù)矩陣,這對計(jì)算機(jī)的計(jì)算能力要求很高。建議設(shè)置15 min/斷面或1 h/斷面的頻度,最大程度地保留時(shí)序運(yùn)行數(shù)據(jù)特性。
(2) 連續(xù)時(shí)序數(shù)據(jù)事務(wù)離散化 將連續(xù)的時(shí)序數(shù)據(jù)離散化,如在t1時(shí)刻,饋線電流I滿足0≤I<1 A時(shí),設(shè)置為事務(wù)I0;1 A≤I<2 A時(shí),設(shè)置為事務(wù)I1;2 A≤I<3 A時(shí),設(shè)置為事務(wù)I2……以此類推,將連續(xù)的饋線時(shí)序電流離散化。離散化的區(qū)間長度可根據(jù)具體時(shí)序數(shù)據(jù)的數(shù)值范圍來確定。在初步計(jì)算時(shí),可將離散化區(qū)間設(shè)置為較長時(shí)段,減少對應(yīng)事務(wù)的數(shù)量,降低事務(wù)數(shù)據(jù)集維度,從而降低計(jì)算量。當(dāng)確定了關(guān)聯(lián)較強(qiáng)的事務(wù)后,再將該區(qū)間繼續(xù)分割離散化進(jìn)行關(guān)聯(lián)分析,從而確定更小的事務(wù)數(shù)據(jù)范圍,以提高精度。
(3) 時(shí)序數(shù)據(jù)特征離散化 時(shí)序數(shù)據(jù)的特征除了時(shí)序數(shù)據(jù)本身值外,主要包括時(shí)序數(shù)據(jù)的變化趨勢,如增加趨勢或減小趨勢。除了設(shè)置時(shí)序數(shù)據(jù)本身值作為事務(wù)外,還可以將時(shí)序數(shù)據(jù)的變化趨勢設(shè)置為事務(wù)。如在t2時(shí)刻,饋線電流I在2 A≤I<3 A范圍內(nèi)時(shí),設(shè)置時(shí)序值事務(wù)為I2,若饋線電流相對t1時(shí)刻是上升的,可設(shè)置時(shí)序特征事務(wù)為Iup;若饋線電流相對t1時(shí)刻是下降的,可設(shè)置時(shí)序特征事務(wù)為Idown;若饋線電流相對t1時(shí)刻是不變的,可設(shè)置時(shí)序特征事務(wù)為Iflat。即在每個(gè)時(shí)刻t,饋線電流將設(shè)置兩個(gè)事務(wù),其中Ik表征時(shí)序值本身,Iup或Idown或Iflat表示時(shí)序值的變化趨勢。通過上述事務(wù)設(shè)置,可在事務(wù)數(shù)據(jù)集中表征時(shí)序數(shù)據(jù)值本身和一次變化特征。若需要分析時(shí)序值的二次變化特征或其他變化特征時(shí),也可按照上述原則進(jìn)行設(shè)置。
(4) 事件事務(wù)設(shè)置 對于斷電、線路故障等這些突發(fā)性非時(shí)序事件,同樣需要設(shè)置事務(wù)項(xiàng)。如當(dāng)tk時(shí)刻發(fā)生線路故障時(shí),可設(shè)置線路故障為事務(wù)Break,并可在tk-1時(shí)刻設(shè)置事務(wù)Break(former),在tk+1時(shí)刻設(shè)置事務(wù)Break(after)。通過上述事務(wù)設(shè)置,可在事務(wù)數(shù)據(jù)集中表征線路故障等突發(fā)性非時(shí)序事件的發(fā)生趨勢,通過與時(shí)序數(shù)據(jù)的變化趨勢關(guān)聯(lián),可分析線路故障等突發(fā)性非時(shí)序事件發(fā)生時(shí)時(shí)序數(shù)據(jù)的變化趨勢。
(5) 形成事務(wù)數(shù)據(jù)集 對于時(shí)序事件數(shù)據(jù),將系統(tǒng)運(yùn)行數(shù)據(jù)與系統(tǒng)突發(fā)性非時(shí)序事件按照上述原則,在每個(gè)時(shí)刻tk,形成一個(gè)事務(wù)數(shù)據(jù)集tk={i1,i2,i3,…,ik,…},對事務(wù)數(shù)據(jù)集集合T進(jìn)行關(guān)聯(lián)分析,即可得到T中各事務(wù)ik之間或事務(wù)集X與事務(wù)集Y之間的關(guān)聯(lián)關(guān)系,進(jìn)而得到時(shí)序運(yùn)行數(shù)據(jù)與系統(tǒng)故障的突發(fā)性非時(shí)序事件之間的關(guān)聯(lián)。
3.3.1 關(guān)聯(lián)規(guī)則和頻繁項(xiàng)集
關(guān)聯(lián)規(guī)則的一般形式為:項(xiàng)集X和Y同時(shí)發(fā)生的概率稱為關(guān)聯(lián)規(guī)則的支持度,即S(X?Y)=P(X∪Y)。當(dāng)項(xiàng)集X發(fā)生時(shí),項(xiàng)集Y發(fā)生的概率即為關(guān)聯(lián)規(guī)則的置信度,C(X?Y)=P(X|Y)。
最小支持度是用戶或?qū)<叶x的衡量支持度的一個(gè)閾值,表示項(xiàng)目集在統(tǒng)計(jì)意義上的最低重要性;最小置信度是用戶或?qū)<叶x的衡量置信度的一個(gè)閾值,表示關(guān)聯(lián)規(guī)則的最低可靠性。同時(shí)滿足最小支持度閾值和最小置信度閾值的規(guī)則稱作強(qiáng)規(guī)則。
項(xiàng)集是項(xiàng)的集合,包含k個(gè)項(xiàng)的項(xiàng)集稱為k項(xiàng)集,如集合{牛奶,麥片,糖}是一個(gè)3項(xiàng)集。項(xiàng)集的出現(xiàn)頻率是所有包含項(xiàng)集的事務(wù)計(jì)數(shù),又稱絕對支持度或支持度計(jì)數(shù)。如果項(xiàng)集I的相對支持度滿足預(yù)定義的最小支持度閾值,則I是頻繁項(xiàng)集,記作Ik。
項(xiàng)集X的支持度計(jì)數(shù)是事務(wù)數(shù)據(jù)集中包含X的事務(wù)個(gè)數(shù),簡稱為項(xiàng)集的頻率或計(jì)數(shù)。已知項(xiàng)集的支持度計(jì)數(shù),則關(guān)聯(lián)規(guī)則X?Y的支持度和置信度很容易從所有事務(wù)計(jì)數(shù)、項(xiàng)集X和項(xiàng)集X∪Y的支持度計(jì)數(shù)中推出:
Confidence(X?Y)=P(X|Y)=
也就是說,一旦得到所有事務(wù)的個(gè)數(shù),項(xiàng)集X,項(xiàng)集Y和項(xiàng)集X∪Y的支持度計(jì)數(shù),就可以導(dǎo)出對應(yīng)的關(guān)聯(lián)規(guī)則X?Y和Y?X,并可以檢查該規(guī)則是否是強(qiáng)規(guī)則。
3.3.2 Apriori算法實(shí)現(xiàn)
Apriori算法的主要思想是找出存在于事務(wù)數(shù)據(jù)集中最大的頻繁項(xiàng)集,利用得到的最大頻繁項(xiàng)集與預(yù)先設(shè)定的最小置信度閾值生成強(qiáng)關(guān)聯(lián)規(guī)則。
根據(jù)頻繁項(xiàng)集的所有非空子集也必須是頻繁項(xiàng)集這一性質(zhì)可以得出:向不是頻繁項(xiàng)集的項(xiàng)集I中添加事務(wù)X,新的項(xiàng)集I∪X一定也不是頻繁項(xiàng)集。
Apriori算法實(shí)現(xiàn)的兩個(gè)步驟如下。
步驟1 找出所有的頻繁項(xiàng)集(支持度必須大于等于給定的最小支持度閾值)。在這個(gè)過程中,連接步和剪枝步互相融合,最終得到最大的頻繁項(xiàng)集Lk。
其中,連接步的目的是找到k項(xiàng)集。基于給定的最小支持度閾值,剔除1項(xiàng)候選集i1中小于該閾值的項(xiàng)集,得到1項(xiàng)頻繁項(xiàng)集L1;由L1自身連接產(chǎn)生2項(xiàng)候選集i2,保留i2中滿足約束條件的項(xiàng)集,得到2項(xiàng)頻繁項(xiàng)集,記為L2;由L2與L1連接產(chǎn)生3項(xiàng)候選集i3,保留i3中滿足約束條件的項(xiàng)集,得到3項(xiàng)頻繁項(xiàng)集,記為L3……這樣循環(huán)下去,得到最大頻繁項(xiàng)集Lk。
剪枝步緊接著連接步,在產(chǎn)生候選項(xiàng)ik的過程中起到減小搜索空間的作用。由于ik是Lk-1與L1連接產(chǎn)生的,根據(jù)Apriori的性質(zhì),頻繁項(xiàng)集的所有非空子集也必須是頻繁項(xiàng)集,因此不滿足該性質(zhì)的項(xiàng)集將不會存在于ik中,該過程就是剪枝。
步驟2 由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。由步驟1可知,未超過預(yù)定的最小支持度閾值的項(xiàng)集已被剔除,如果剩下這些規(guī)則滿足了預(yù)定的最小置信度閾值,那么就挖掘出了強(qiáng)關(guān)聯(lián)規(guī)則。根據(jù)這一強(qiáng)關(guān)聯(lián)規(guī)則,即可分析出配電網(wǎng)各時(shí)間、時(shí)序數(shù)據(jù)、運(yùn)行指標(biāo)之間的關(guān)聯(lián)關(guān)系,為優(yōu)化配電網(wǎng)運(yùn)行指標(biāo)提出指導(dǎo)。
基于Apriori關(guān)聯(lián)算法,對配電網(wǎng)運(yùn)行中所產(chǎn)生的報(bào)表數(shù)據(jù)、時(shí)序數(shù)據(jù)、指標(biāo)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,實(shí)現(xiàn)流程如圖1所示。
圖1 基于Apriori關(guān)聯(lián)算法的配電網(wǎng)運(yùn)行大數(shù)據(jù)關(guān)聯(lián)分析模型流程
通過基于Apriori關(guān)聯(lián)算法的配電網(wǎng)運(yùn)行大數(shù)據(jù)關(guān)聯(lián)分析模型,可以得到配電網(wǎng)運(yùn)行中各因素或指標(biāo)之間的相互關(guān)聯(lián)關(guān)系。關(guān)聯(lián)關(guān)系的強(qiáng)弱以支持度和置信度表示,支持度和置信度越高,表示關(guān)聯(lián)關(guān)系越強(qiáng),即表示兩個(gè)或多個(gè)配電網(wǎng)運(yùn)行因素或指標(biāo)同時(shí)發(fā)生的概率越高。對一些支持度和置信度較低的事件集,也可具體分析其關(guān)聯(lián)關(guān)系,挖掘不明顯的配電網(wǎng)運(yùn)行關(guān)聯(lián)關(guān)系。
利用所提出的基于Apriori關(guān)聯(lián)算法的配電網(wǎng)運(yùn)行大數(shù)據(jù)關(guān)聯(lián)分析模型,對上海電網(wǎng)故障搶修管理系統(tǒng)中上海某供電公司2014年故障搶修數(shù)據(jù)進(jìn)行分析,并尋找其中的數(shù)據(jù)關(guān)聯(lián)。
上海某供電公司2014年產(chǎn)生故障搶修數(shù)據(jù)共45 986條,關(guān)聯(lián)分析數(shù)據(jù)項(xiàng)包括電壓等級、故障描述、故障原因、設(shè)備分類、故障分類、搶修班組、設(shè)備名稱、停電時(shí)間等。在關(guān)聯(lián)分析之前,對故障搶修記錄數(shù)據(jù)進(jìn)行預(yù)處理:對搶修數(shù)據(jù)進(jìn)行歸一化處理,如“0.4 kV”“380 V”“220 V”統(tǒng)一成“低壓電網(wǎng)”,“電壓高”“電壓低”“電壓忽高忽低”等統(tǒng)一成“電壓問題”;對故障描述語句提取關(guān)鍵詞,將描述性語言轉(zhuǎn)換成描述特征并能夠分析,提取的關(guān)鍵詞包括“重合成功”“母線接地”“缺相”“著火”“一戶無電”等;將用戶停電時(shí)間進(jìn)行離散化處理,將停電30 min以內(nèi)設(shè)置為事件t00,停電30~60 min設(shè)置為事件t01,停電60~90 min設(shè)置為事件t10,停電90~120 min設(shè)置為事件t11,停電120~180 min設(shè)置為事件t20,以此類推;將每條故障搶修記錄形成一個(gè)事務(wù)數(shù)據(jù)集,共形成了包含45 986條事務(wù)數(shù)據(jù)集的事務(wù)集。
對事務(wù)集進(jìn)行大數(shù)據(jù)關(guān)聯(lián)分析,設(shè)置最小支持度為10%,最小置信度為50%,對關(guān)聯(lián)結(jié)果進(jìn)行整理,去除明顯的無用項(xiàng),得到關(guān)聯(lián)結(jié)果如表2所示。
由表2可以看出,關(guān)聯(lián)分析可以得到一些運(yùn)行維護(hù)人員已知并且顯而易見的結(jié)論,如“一戶無電”的搶修基本都是發(fā)生在低壓電網(wǎng)(置信度為97.80%)等。
同時(shí),通過關(guān)聯(lián)規(guī)則可以得到一些有助于進(jìn)行配電網(wǎng)運(yùn)行維護(hù)分析和提升供電質(zhì)量的事件之間的關(guān)聯(lián)關(guān)系。如在低壓電網(wǎng)事件中,55.91%的停電時(shí)間在30 min之內(nèi),而低壓電網(wǎng)發(fā)生熔斷故障時(shí),85.97%的停電時(shí)間可控制在30 min之內(nèi);客戶誤報(bào)中,欠費(fèi)停電原因達(dá)到52.40%,而客戶誤報(bào)的停電恢復(fù)時(shí)間有49.81%可以控制在30 min內(nèi);搶修班組“13東捷三林”有96.32%的搶修均在低壓電網(wǎng),而其他搶修班組卻沒有這樣的規(guī)律;低壓配電柜故障有72.23%的事件是熔斷器故障;而一戶無電且熔斷故障下,88.57%的可在30 min內(nèi)恢復(fù)供電等。
表2 上海某供電公司2014年故障搶修數(shù)據(jù)關(guān)聯(lián)分析規(guī)則結(jié)果 %
本文建立了基于Apriori關(guān)聯(lián)算法的配電網(wǎng)運(yùn)行大數(shù)據(jù)關(guān)聯(lián)分析模型,可以得到配電網(wǎng)運(yùn)行中各因素及指標(biāo)之間的相互關(guān)聯(lián)關(guān)系,除了可以驗(yàn)證已知的配電網(wǎng)關(guān)聯(lián)關(guān)系外,更大的意義在于可以挖掘之前未發(fā)現(xiàn)的配電網(wǎng)各運(yùn)行因素與指標(biāo)之間的隱性關(guān)聯(lián),使得配電網(wǎng)運(yùn)行、管理部門能夠更深刻地了解和掌握配電網(wǎng)的運(yùn)行情況與指標(biāo)情況,為提高配電網(wǎng)的運(yùn)行維護(hù)指標(biāo)提供決策建議。
參考文獻(xiàn):
[1] TAFT J,DE MARTINI P,PRELLWITZ L V.Utility data management & intelligence[R].San Jose:CISCO,2012.
[2] IBM Corporation.Managing big data for smart grids and smart meters[EB/OL].[2014-08-01].http://www.smartgridnews.com/artman/uploads/1/IBM_anaytics_paper.pdf.
[3] IBM Corporation.Smart grid method and model[R].Beijing:IBM Corporation,2010.
[4] U.S.Department of Energy.Smart grid system report[R].New York:U.S.Department of Energy,2009.
[5] 刁贏龍,盛萬興,劉科研,等.大規(guī)模配電網(wǎng)負(fù)荷數(shù)據(jù)在線清洗與修復(fù)方法研究[J].電網(wǎng)技術(shù),2015(11):3134-3140.
[6] 宋亞奇,周國亮,朱永利.智能電網(wǎng)大數(shù)據(jù)處理技術(shù)現(xiàn)狀與挑戰(zhàn)[J].電網(wǎng)技術(shù),2013(4):927-935.
[7] 王繼業(yè),季知祥,史夢潔,等.智能配用電大數(shù)據(jù)需求分析與應(yīng)用研究[J].中國電機(jī)工程學(xué)報(bào),2015(8):1829-1836.
[8] 劉道偉,張東霞,孫華東,等.時(shí)空大數(shù)據(jù)環(huán)境下的大電網(wǎng)穩(wěn)定態(tài)勢量化評估與自適應(yīng)防控體系構(gòu)建[J].中國電機(jī)工程學(xué)報(bào),2015(2):268-276.
[9] STEPHEN B,ISLEIFSSON F R,GALLOWAY S,et al.Online AMR domestic load profile characteristic change monitor to support ancillary demand services[J].IEEE Transactions on Smart Grid,2014,5(2):888-895.
[10] 陸如,范宏,周獻(xiàn)遠(yuǎn).基于大數(shù)據(jù)技術(shù)的配電網(wǎng)搶修駐點(diǎn)優(yōu)化方法[J].供用電,2015(8):31-36.
[11] 張銘澤,仇成,秦曠宇,等.上海超大型城市配電網(wǎng)安全可靠性提升策略研究[J].供用電,2016(5):16-21.
[12] RAHMAN M N,ESMAILPOUR A.An efficient electricity generation forecasting system using artificial neural network approach with big data[C]//IEEE First International Conference on Big Data Computing Service and Applications(Big Data Service).Redwood,CA:IEEE,2015:213-217.
[13] GUO K Y,JIN P,QI L,et al.A multi-fault rush repair strategy for distribution systems based on game theory of multi-agent[C]//Chinese Association of Automation.Wuhan:Chinese Automation Congress (CAC),2016:1293-1298.