陳柯++張興++朱韻攸
摘 要:信息通信調(diào)度系統(tǒng)在電力系統(tǒng)中占據(jù)了重要地位,調(diào)度系統(tǒng)產(chǎn)生的數(shù)據(jù)包含了信息通信網(wǎng)絡(luò)的運(yùn)營(yíng)狀態(tài)、設(shè)備管理、調(diào)度電話資源等重要信息,如果能夠結(jié)合數(shù)據(jù)挖掘技術(shù)對(duì)調(diào)度資料進(jìn)行分析,可以得出一些傳統(tǒng)手段不能發(fā)現(xiàn)的規(guī)律,從而為電力系統(tǒng)的調(diào)度和建設(shè)提供重要的參考依據(jù)。該文在現(xiàn)有的信息通信調(diào)度資料管理系統(tǒng)的基礎(chǔ)上設(shè)計(jì)支持調(diào)度資料分析的信息通信資料管理系統(tǒng)。
關(guān)鍵詞:數(shù)據(jù)挖掘 電力系統(tǒng) 信息通信調(diào)度
中圖分類號(hào):TM73 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2014)11(b)-0019-01
信息通信調(diào)度資料中包含了很多有價(jià)值的信息,如果能夠通過(guò)數(shù)據(jù)挖掘利用好這些信息,可以為信息通信調(diào)度增加很大的靈活性和主動(dòng)性,并優(yōu)化IT資源的分配。
1 信息通信調(diào)度資料管理系統(tǒng)的發(fā)展現(xiàn)狀
信息通信調(diào)度資料一直以來(lái)都是采用專人負(fù)責(zé),以紙質(zhì)文檔的方式加以管理。隨著信息通信調(diào)度越來(lái)越受重視,相應(yīng)的文檔特別是電子文檔也隨之大量增加,這就要求有一個(gè)類似但不同于文檔管理的系統(tǒng)來(lái)對(duì)所有調(diào)度資料、部分調(diào)度常用資源加以科學(xué)管理,為科學(xué)調(diào)度提供可靠的專業(yè)化支撐。
2 信息通信調(diào)度資料分析
數(shù)據(jù)挖掘技術(shù)是在計(jì)算設(shè)備的計(jì)算能力大幅度提升和數(shù)據(jù)量大規(guī)模增長(zhǎng)的背景下出現(xiàn)的一種信息資源利用技術(shù),通過(guò)對(duì)數(shù)據(jù)進(jìn)行建模分析從中提取出有價(jià)值的信息或者預(yù)測(cè)未知事件的方法,是一種以信息為資源的使用方式。信息通信調(diào)度過(guò)程中產(chǎn)生的大規(guī)模數(shù)據(jù)包含了信息網(wǎng)絡(luò)的各種數(shù)據(jù),如果能夠有效地利用這些數(shù)據(jù)中包含的信息,將可以為信息通信調(diào)度以及通信網(wǎng)絡(luò)的建設(shè)提供重要依據(jù)和指導(dǎo)。
2.1 數(shù)據(jù)挖掘的主要階段
跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程CRISP-DM從商業(yè)的角度給出對(duì)數(shù)據(jù)挖掘方法的理解,目前大部分的數(shù)據(jù)挖掘系統(tǒng)都是遵循CRISP-DM。該模型以數(shù)據(jù)挖掘技術(shù)的應(yīng)用為目標(biāo),將數(shù)據(jù)挖掘劃分為6個(gè)主要的階段。
(1)商業(yè)理解階段(Business Understan ding)。在這個(gè)階段,要深入分析企業(yè)的性質(zhì)和需求,根據(jù)不同的需求和性質(zhì)確定數(shù)據(jù)挖掘的目標(biāo)和要解決的問(wèn)題。
(2)數(shù)據(jù)理解(Data Understanding)。在這個(gè)階段,首先要根據(jù)所需數(shù)據(jù)的特征,從數(shù)據(jù)集中提取出數(shù)據(jù)挖掘所需的數(shù)據(jù),為后續(xù)階段的分析提供正確的數(shù)據(jù)。
(3)數(shù)據(jù)預(yù)處理(Data Preparation)。在該階段,要在上一階段中產(chǎn)生的數(shù)據(jù)集基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的預(yù)處理,包括一些干擾數(shù)據(jù)的清洗等。
(4)模型(Modeling)。該階段需要在數(shù)據(jù)理解階段和數(shù)據(jù)預(yù)處理階段中產(chǎn)生數(shù)據(jù)集的基礎(chǔ)上,以商業(yè)理解階段產(chǎn)生目標(biāo)和問(wèn)題為依據(jù),建立相關(guān)的模型對(duì)數(shù)據(jù)進(jìn)行分析。
(5)評(píng)估(Evaluation)。根據(jù)商業(yè)理解階段產(chǎn)生的目標(biāo)和問(wèn)題,對(duì)模型階段所建立的模型質(zhì)量進(jìn)行分析和評(píng)估,確認(rèn)是否考慮了所有重點(diǎn)問(wèn)題,以及模型是否能夠正確地解決問(wèn)題。
(6)實(shí)施(Deployment)。在實(shí)施階段,主要任務(wù)是產(chǎn)生可重復(fù)使用的技術(shù)文檔和操作流程,以及后期的維護(hù)計(jì)劃等。
3 支持?jǐn)?shù)據(jù)挖掘的信息通信調(diào)度資料管理系統(tǒng)的設(shè)計(jì)
3.1 數(shù)據(jù)挖掘模塊的主要實(shí)現(xiàn)
根據(jù)CRISP-DM所定義的數(shù)據(jù)挖掘的主要階段,可以將數(shù)據(jù)挖掘模塊的主要功能劃分為四個(gè)層次:數(shù)據(jù)采集層,數(shù)據(jù)預(yù)處理層,數(shù)據(jù)模型分析層,用戶界面層。
數(shù)據(jù)采集層主要用于實(shí)現(xiàn)數(shù)據(jù)理解階段,從數(shù)據(jù)庫(kù)中提取出符合所需數(shù)據(jù)特征的數(shù)據(jù),并且將數(shù)據(jù)復(fù)制到指定的數(shù)據(jù)集中。
數(shù)據(jù)預(yù)處理層主要用于實(shí)現(xiàn)數(shù)據(jù)預(yù)處理階段,將數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行預(yù)處理,使其能夠滿足數(shù)據(jù)挖掘過(guò)程中的需求。而電力調(diào)度資料中很多數(shù)據(jù)并不是所需要的數(shù)據(jù),或者一些數(shù)據(jù)存在不完整、不一致和冗余等問(wèn)題,因此在此階段要選擇適合電力調(diào)度資料的數(shù)據(jù)處理算法。
數(shù)據(jù)分析層,該部分是調(diào)度資料分析的核心部分,根據(jù)預(yù)先設(shè)計(jì)的模型對(duì)數(shù)據(jù)進(jìn)行分析,并將分析結(jié)果返回給用戶界面。根據(jù)電力系統(tǒng)的特殊需求和數(shù)據(jù)特征,需要分析和測(cè)試來(lái)選擇合適的模型和參數(shù),例如使用關(guān)聯(lián)模型提取數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)規(guī)則,該模型可以提取出傳統(tǒng)方法無(wú)法得到的關(guān)聯(lián)關(guān)系。例如,文獻(xiàn)論述了使用預(yù)測(cè)算法模型對(duì)電網(wǎng)用電量、某地區(qū)電力負(fù)荷變化趨勢(shì)、某節(jié)點(diǎn)可能發(fā)生故障的時(shí)間等進(jìn)行預(yù)測(cè)。
用戶界面層的主要功能是與用戶的交互,接受用戶的請(qǐng)求,并且根據(jù)不同的請(qǐng)求調(diào)用不同的模塊,與數(shù)據(jù)分析相關(guān)的請(qǐng)求將調(diào)用數(shù)據(jù)分析模塊,并且將數(shù)據(jù)分析的結(jié)果顯示給用戶。顯示結(jié)果可以以各種圖標(biāo)的形式動(dòng)態(tài)顯示,以形象的表現(xiàn)趨勢(shì)。
3.2 支持?jǐn)?shù)據(jù)挖掘分析的調(diào)度資料管理系統(tǒng)
在該方案中,采取將數(shù)據(jù)挖掘分析模塊單獨(dú)出來(lái)的方式,以實(shí)現(xiàn)對(duì)原系統(tǒng)最小的改變。對(duì)于數(shù)據(jù)分析相關(guān)的操作,只需要調(diào)用數(shù)據(jù)分析模塊。在計(jì)算中心和存儲(chǔ)中心方面,由于考慮到隨著電網(wǎng)的智能化可能面對(duì)海量的數(shù)據(jù)和智能化的數(shù)據(jù)處理,因此可以考慮使用云計(jì)算技術(shù)來(lái)提高服務(wù)器的利用效率,降低維護(hù)成本。通過(guò)使用云存儲(chǔ)技術(shù),來(lái)提供可靠的數(shù)據(jù)存儲(chǔ)。
其中,存儲(chǔ)中心中的數(shù)據(jù)來(lái)自各節(jié)點(diǎn)采集的數(shù)據(jù),又?jǐn)?shù)據(jù)采集模塊進(jìn)行處理后存儲(chǔ)在存儲(chǔ)中心,由于數(shù)據(jù)采集模塊在傳統(tǒng)的信息通信調(diào)度系統(tǒng)中已經(jīng)實(shí)現(xiàn),因此在該方案中使用原有的采集模塊。
Web服務(wù)器根據(jù)不同的請(qǐng)求調(diào)用不同的模塊來(lái)響應(yīng)用戶的請(qǐng)求,對(duì)于傳統(tǒng)應(yīng)用響應(yīng)模塊,可以使用現(xiàn)有的信息通信調(diào)度資料管理系統(tǒng)的實(shí)現(xiàn)。
4 結(jié)語(yǔ)
智能調(diào)度資料管理能夠有效的對(duì)調(diào)度資料進(jìn)行分析,可以在電力系統(tǒng)調(diào)度、維護(hù)和故障處理方面提高主動(dòng)性和靈活性。但是,目前數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)中的利用并不是很成熟,需要進(jìn)一步去探索針對(duì)復(fù)雜的、全面的調(diào)度資料數(shù)據(jù)的數(shù)據(jù)挖掘算法。
參考文獻(xiàn)
[1] 高智,徐政.數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)中的應(yīng)用[J].華東電力,2001,29(12):13-16.
[2] 史小梅.數(shù)據(jù)挖掘在電力決策支持系統(tǒng)中的應(yīng)用[J].上海電力學(xué)院學(xué)報(bào),2010,26(4):374-378.
[3] Azevedo, A. and Santos, M. F.KDD. SEMMA and CRISP-DM: a parallel overview[C].The IADIS European Conference on Data Mining,2008.endprint