曹鑫,邱靈赟,彭小慶,王云飛,李博
(國網(wǎng)四川省電力公司供電服務(wù)中心,四川 成都 610041)
隨著我國電力企業(yè)的快速發(fā)展,相關(guān)部門建立獨(dú)立的電力數(shù)據(jù)處理系統(tǒng),這些系統(tǒng)的構(gòu)建通過不同平臺(tái)、不同工具等進(jìn)行開發(fā),并應(yīng)用在不同領(lǐng)域[1]。這些電力企業(yè)數(shù)據(jù)管理系統(tǒng)往往依據(jù)自身需求構(gòu)建,與其他部門之間相互獨(dú)立存在,很難進(jìn)行訪問[2]。雖然越來越多平臺(tái)被研發(fā)和使用,人們獲取電力綜合數(shù)據(jù)也越來越輕松[3],然而,電力綜合數(shù)據(jù)并不能得到良好的利用,這些數(shù)據(jù)往往是以不同格式分散到數(shù)據(jù)庫之中,因而很難將其集成起來進(jìn)行分析,有效整理工作變得十分困難,處理數(shù)據(jù)需耗費(fèi)大量人力和時(shí)間,由此形成了信息孤島[4]。因此,在不同部門間建立統(tǒng)一規(guī)范的接口,實(shí)現(xiàn)不同系統(tǒng)間數(shù)據(jù)共享變得尤為重要[5]。
在電力綜合數(shù)據(jù)集成過程中,聚集了很多不同電力資源,并在應(yīng)用過程中累積了大量異構(gòu)數(shù)據(jù),這些數(shù)據(jù)結(jié)構(gòu)相對簡單,但隨著數(shù)據(jù)量快速增長,采用單一數(shù)據(jù)集成系統(tǒng)無法快速集成這些數(shù)據(jù)。傳統(tǒng)系統(tǒng)在進(jìn)行電力綜合數(shù)據(jù)的集成時(shí)存在集成速度較慢,且集成的數(shù)據(jù)內(nèi)容不能適應(yīng)當(dāng)前需求等。為了解決該問題,提出了基于分布式協(xié)調(diào)的電力綜合數(shù)據(jù)集成系統(tǒng)構(gòu)建。通過數(shù)據(jù)轉(zhuǎn)換,將電力數(shù)據(jù)定時(shí)集成到同一個(gè)數(shù)據(jù)庫內(nèi),以此滿足電力用戶工作需求。實(shí)驗(yàn)結(jié)果表明,文中系統(tǒng)可以快速實(shí)現(xiàn)電力綜合數(shù)據(jù)的集成,具有一定現(xiàn)實(shí)意義。
系統(tǒng)的構(gòu)建是采用分布式三層體系,分別為應(yīng)用層、中間層和數(shù)據(jù)層。應(yīng)用層包括管理員工作站、瀏覽器;中間層包括全局本體、局部本體和查詢組件;數(shù)據(jù)層包括客戶端和共享服務(wù)器[6-7]。系統(tǒng)總體框架如圖1所示。
圖1 系統(tǒng)總體框架
該系統(tǒng)中間層采用全局和局部相結(jié)合的模式,通過查詢組件實(shí)現(xiàn)數(shù)據(jù)源到局部和全局的映射,實(shí)現(xiàn)即插即用[8]。
依據(jù)電力系統(tǒng)實(shí)際應(yīng)用情況,該層次主要包括兩種用戶:一種是電力系統(tǒng)工作人員,其利用管理工作站實(shí)時(shí)監(jiān)控現(xiàn)場各個(gè)系統(tǒng)的數(shù)據(jù),以保證系統(tǒng)能夠正常運(yùn)行;另一種是供其他工作人員使用的查詢組件,即為瀏覽器,以適應(yīng)未來電力系統(tǒng)需求,用戶查詢組件的全局,無需關(guān)心系統(tǒng)底層數(shù)據(jù)源,實(shí)現(xiàn)透明訪問[9-10]。
中間層主要負(fù)責(zé)電力綜合數(shù)據(jù)集成與交換,采用中間組件方式,實(shí)現(xiàn)對分布式數(shù)據(jù)源的直接訪問。該層次查詢組件解析從本體映射到局部數(shù)據(jù)源,并將其從各個(gè)數(shù)據(jù)源中進(jìn)行信息整合,通過XSLT轉(zhuǎn)化,傳輸給應(yīng)用層[11]。
本體組件是該層的核心組件,在集成過程中,針對不同數(shù)據(jù)源通過模式映射構(gòu)建相應(yīng)局部本體,并以此為基礎(chǔ),建立整個(gè)系統(tǒng)上的全局本體[12]。映射組件是連接本體組件和查詢組件的關(guān)鍵樞紐,也是在本體組件構(gòu)建完成后進(jìn)行的映射組件,通過計(jì)算不同本體間的相似度,可搜索相似度最大的本體[13]。通過該組件能夠在最大程度上發(fā)現(xiàn)局部最優(yōu)映射,并以此制定映射規(guī)則。查詢組件通過查詢處理用戶指令,實(shí)現(xiàn)全局本體、局部本體和數(shù)據(jù)源之間的映射,將用戶全局查詢分解成多個(gè)對應(yīng)的單獨(dú)數(shù)據(jù)源。XML數(shù)據(jù)源查詢語言具有功能強(qiáng)大、方便、易于實(shí)現(xiàn)的特點(diǎn)[14]。
數(shù)據(jù)層位于系統(tǒng)框架最底層,該層次主要包括客戶端和共享服務(wù)器,實(shí)現(xiàn)不同數(shù)據(jù)的高效共享,并通過包裝器為應(yīng)用層和中間層提供數(shù)據(jù)支持[15]。
使用手機(jī)客戶端主要與服務(wù)器相對應(yīng),為客戶端提供本地服務(wù)程序。移動(dòng)客戶端以手機(jī)為主,能夠運(yùn)行在手機(jī)終端,通過無線互聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)傳輸。利用手機(jī)無線網(wǎng)絡(luò)上網(wǎng),首次登錄時(shí)需要手動(dòng)輸入網(wǎng)址,并保存標(biāo)簽,為后續(xù)訪問提供便利[16]。
包裝器實(shí)現(xiàn)對數(shù)據(jù)源的映射,不同數(shù)據(jù)源需采用相應(yīng)的包裝器,并從數(shù)據(jù)源中提取出XML Schema模式的數(shù)據(jù),并將查詢映射指定為特定數(shù)據(jù)源,以此識(shí)別物理查詢,并將底層抽取,轉(zhuǎn)化為XML文件格式。
在該系統(tǒng)硬件設(shè)計(jì)的基礎(chǔ)上,設(shè)計(jì)系統(tǒng)軟件部分以完成該系統(tǒng)集成電力綜合數(shù)據(jù)。在該系統(tǒng)中實(shí)現(xiàn)各類數(shù)據(jù)采集之前的無縫銜接、平滑過渡,能夠較好解決信息孤島問題,矢量數(shù)據(jù)集成流程如圖2所示。
將分布式協(xié)調(diào)后的數(shù)據(jù)進(jìn)行矢量集成化整理,并將矢量數(shù)據(jù)通過構(gòu)建WFS文件服務(wù),將數(shù)據(jù)庫中的數(shù)據(jù)加載到該文件中,進(jìn)而達(dá)到電力綜合數(shù)據(jù)與相關(guān)數(shù)據(jù)的集成。
圖2 矢量數(shù)據(jù)集成流程
數(shù)據(jù)集成系統(tǒng)實(shí)現(xiàn)了對海量數(shù)據(jù)不同作業(yè)的區(qū)別,具體作業(yè)流程如圖3所示。
圖3 數(shù)據(jù)集成流程
首先,客戶端發(fā)送集成請求到調(diào)度Agent中;從調(diào)度Agent中獲取作業(yè)元數(shù)據(jù)信息;判斷是否需要數(shù)據(jù)劃分,如果不需要,則可直接分配該作業(yè)到最強(qiáng)節(jié)點(diǎn)上,否則,需進(jìn)行下一步;然后,收集所有節(jié)點(diǎn)信息,按照負(fù)載信息設(shè)定具體劃分方案;依據(jù)劃分結(jié)果,選中節(jié)點(diǎn)發(fā)送執(zhí)行信息;再次,等待節(jié)點(diǎn)執(zhí)行的任務(wù),并返回作業(yè)完畢信息;最后,合并作業(yè)結(jié)果,實(shí)現(xiàn)電力數(shù)據(jù)綜合集成。
在調(diào)試試驗(yàn)環(huán)境下實(shí)現(xiàn)基于分布式協(xié)調(diào)的電力綜合數(shù)據(jù)集成系統(tǒng),為了驗(yàn)證該系統(tǒng)構(gòu)建的合理性,需進(jìn)行調(diào)試分析。
系統(tǒng)開發(fā)環(huán)境如表1所示。
表1 系統(tǒng)開發(fā)環(huán)境
系統(tǒng)實(shí)驗(yàn)的參數(shù)設(shè)置如表2所示。
表2 電力數(shù)據(jù)資源
系統(tǒng)查詢界面設(shè)置如圖4所示。
圖4 系統(tǒng)查詢界面設(shè)置
依據(jù)上述設(shè)置的查詢界面,進(jìn)行系統(tǒng)調(diào)試驗(yàn)證分析。
3.4.1 不同系統(tǒng)數(shù)據(jù)集成速度對比
為了驗(yàn)證文中系統(tǒng)的有效性,將傳統(tǒng)系統(tǒng)與文中系統(tǒng)的電力綜合數(shù)據(jù)集成速度進(jìn)行對比分析,實(shí)驗(yàn)結(jié)果如圖5所示。
圖5 不同系統(tǒng)集成速度對比
分析圖5可以看出,對在線數(shù)據(jù)和離線數(shù)據(jù)的集成速度,兩種系統(tǒng)差距較大。在線數(shù)據(jù)的集成:當(dāng)集成數(shù)據(jù)量為25 dB時(shí),采用文中系統(tǒng)集成速度為13 s,采用傳統(tǒng)系統(tǒng)集成速度為23 s;當(dāng)集成的數(shù)據(jù)量為75 dB時(shí),采用文中系統(tǒng)集成速度為12 s,采用傳統(tǒng)系統(tǒng)集成速度為24 s;當(dāng)數(shù)據(jù)量為150 dB時(shí),采用文中系統(tǒng)集成速度為7 s,采用傳統(tǒng)系統(tǒng)集成速度為22 s。針對離線數(shù)據(jù)的采集:當(dāng)數(shù)據(jù)量為50 dB時(shí),采用文中系統(tǒng)集成速度為5 s,采用傳統(tǒng)系統(tǒng)集成速度為22 s;當(dāng)數(shù)據(jù)量為75 dB時(shí),采用文中系統(tǒng)集成速度為7s,采用傳統(tǒng)系統(tǒng)集成速度為22 s;當(dāng)數(shù)據(jù)量為150 dB時(shí),采用文中系統(tǒng)集成速度為3 s,采用傳統(tǒng)系統(tǒng)集成速度為23 s。
根據(jù)上述研究結(jié)果可知,文中系統(tǒng)的對電力綜合數(shù)據(jù)的集成速度更快。
3.4.2 不同系統(tǒng)數(shù)據(jù)集成的準(zhǔn)確性分析
為了進(jìn)一步驗(yàn)證文中方法的可靠性,實(shí)驗(yàn)分析了傳統(tǒng)系統(tǒng)和文中系統(tǒng)對電力綜合數(shù)據(jù)集成的準(zhǔn)確性,實(shí)驗(yàn)結(jié)果如表3所示。
表3 不同系統(tǒng)數(shù)據(jù)集成準(zhǔn)確性對比
分析表3中數(shù)據(jù)可知,隨著集成的節(jié)點(diǎn)數(shù)據(jù)的增加,兩種系統(tǒng)的準(zhǔn)確率隨之改變。當(dāng)集成的節(jié)點(diǎn)數(shù)據(jù)為2 000個(gè)時(shí),文中系統(tǒng)集成的準(zhǔn)確率為96%,傳統(tǒng)系統(tǒng)的集成準(zhǔn)確率為85%;當(dāng)集成的節(jié)點(diǎn)數(shù)據(jù)為4 000個(gè)時(shí),文中系統(tǒng)集成的準(zhǔn)確率為95%,傳統(tǒng)系統(tǒng)的集成準(zhǔn)確率為80%;當(dāng)集成的節(jié)點(diǎn)數(shù)據(jù)為7 000個(gè)時(shí),文中系統(tǒng)集成的準(zhǔn)確率為92%,傳統(tǒng)系統(tǒng)的集成準(zhǔn)確率為72%。通過對比可以看出,文中系統(tǒng)對電子綜合數(shù)據(jù)的集成準(zhǔn)確率高于傳統(tǒng)系統(tǒng),且均高于92%,驗(yàn)證了文中系統(tǒng)的可行性。
文中提出基于分布式協(xié)調(diào)的電力綜合數(shù)據(jù)集成系統(tǒng)構(gòu)建。該系統(tǒng)的構(gòu)建解決了電力數(shù)據(jù)孤島問題,使電力信息可以及時(shí)、有效的共享。實(shí)驗(yàn)結(jié)果表明,文中系統(tǒng)可有效提高電力綜合數(shù)據(jù)的集成速度,且集成準(zhǔn)確率較高,證明了該系統(tǒng)對電力綜合數(shù)據(jù)集成具有一定優(yōu)勢。
雖然文中系統(tǒng)在現(xiàn)階段取得了一定成果,但還存在很多不足,在以后的工作中將從以下兩點(diǎn)進(jìn)行改進(jìn):
1)組件技術(shù)在電網(wǎng)中的應(yīng)用較為廣泛,因此,在后續(xù)研究進(jìn)程中,需將組件技術(shù)應(yīng)用到電網(wǎng)中繼續(xù)研究。
2)由于智能電網(wǎng)還在小規(guī)模范圍內(nèi)使用,文中系統(tǒng)對于應(yīng)用安全性考慮較少,未來將以此為重點(diǎn),進(jìn)行電力綜合數(shù)據(jù)安全性的探究。