薛峪峰,田光欣,馬占海
(國網(wǎng)青海省電力公司信息通信公司,青海西寧 810008)
近年來,信息技術高速發(fā)展,電網(wǎng)建設越來越完善,電力信息資源越來越豐富,電力信息檢索的難度也隨之增大。電力公共信息是電力信息資源重要的組成部分,公共信息包含了大量電力數(shù)據(jù),公共信息檢索在調(diào)度、調(diào)控和運行方面都面臨巨大的壓力,因此必須要研究有效的方法,完成電力信息資源信息化建設和運行。
文獻[1]提出了基于互信息的改進決策樹算法作為數(shù)據(jù)挖掘內(nèi)核,并提出適用于電力系統(tǒng)的并行處理架構,可實現(xiàn)多源數(shù)據(jù)的快速、有效的信息檢索,但是計算過程過于復雜,面對海量電力公共信息的可行性較低。文獻[2]設計了基于搜索引擎的供電信息資源多用戶調(diào)度管理平臺,該平臺能夠充分發(fā)揮數(shù)據(jù)信息的優(yōu)勢,根據(jù)用戶的需求設立搜索引擎,完成資源調(diào)度。數(shù)據(jù)平臺從門戶功能需求出發(fā),確定信息數(shù)據(jù)展示報表,建立三層架構,通過中間層完成查詢語言自定義,這種方法的檢索能力很強,但是需要有強大的數(shù)據(jù)庫資源。向量空間模型VSM(Vector Space Model)作為一種統(tǒng)計模型,通過分析權重加以簡化,使計算過程變得更加簡單,且更易實現(xiàn),從而提高統(tǒng)計效率。該文針對VSM 進行改進,設計了基于改進VSM 的電力公共信息快速檢索系統(tǒng),并通過實驗驗證了系統(tǒng)的可行性。
基于改進VSM 的電力公共信息快速檢索系統(tǒng)硬件結構如圖1 所示。
圖1 電力公共信息快速檢索系統(tǒng)硬件結構
觀察圖1 可知,該文設計的電力公共信息快速檢索系統(tǒng)硬件內(nèi)部安裝了主動控制器,內(nèi)部的冗余通信總線與DCS 冗余串口連接到一起,通信模塊與COM741 基座連接,確保通信信息的可靠性[3]。通信模塊連接四個接口,利用硬件跳線組成RS485 通信接口和RS232 通信接口,使不同的電動閥能夠順利連接控制[4-5]。常規(guī)信號與I/O 模塊順利連接,硬接線與通信點數(shù)之比為1∶15。
電力公共信息快速檢索終端如圖2 所示。
圖2 電力公共信息快速檢索終端
根據(jù)圖2 可知,電力檢索終端由CDMA Modem模塊、GPS 模塊、MCU 及電源四部分組成[6]。CDMA Modem 內(nèi)部的核心模塊使用的是Wavcom 公司生產(chǎn)的ME45,確保CDMA 模塊能夠順利通信,CDMA 模塊內(nèi)部的串口不僅能夠完成數(shù)據(jù)的控制和傳輸,同時也能完成信息傳輸。系統(tǒng)內(nèi)部的部分模擬電路能夠保證檢索系統(tǒng)完成通信,利用AT 命令對ME45 完成控制[7]。終端內(nèi)部的GPS 能夠接收外部的GPS 信號,并將計算得到的地理信息傳遞給MCU,通過C8051F020 八位微控制器完善終端,配合C 語言完成信息調(diào)試。
存儲器結構如圖3 所示。
圖3 存儲器結構圖
觀察圖3 可知,存儲器為分層結構,同時連接網(wǎng)絡接口、NAND 接口、RAM 接口、CAM,通過存儲接口和外接接口配合主機接口,完成各項邏輯的運行。主機接口能夠完成信息平移,并對錯誤的信息進行檢測和修正[8-9]。系統(tǒng)內(nèi)部具有壓縮和解壓縮功能,可以完成存儲器信息劃分管理。存儲器分別配備行解碼器和列解碼器,保證存儲器陣列得到順利運行。
在識別器內(nèi)部設計了兩個硬件串口,能夠獨立產(chǎn)生波特率,識別器內(nèi)部的定時器與串口運行不會產(chǎn)生沖突,因此使用過程更加靈活。GPS 和CDMA模塊通過固定的格式完成信息通信,并對數(shù)據(jù)進行解析,完成信息封裝,識別器電路圖如圖4 所示。
圖4 識別器電路圖
根據(jù)圖4 可知,識別器電路內(nèi)部有一個CAPI 服務器,識別器電路內(nèi)部的128 字節(jié)FLASH 能夠存放各種不同的信息參數(shù),完成數(shù)據(jù)識別,并根據(jù)建立IP地址,確保數(shù)據(jù)的傳輸要求;識別器電路內(nèi)部的SRAM 共有4 kB,能夠很好地滿足組幀和數(shù)據(jù)緩沖要求,同時確保大程序量也能夠順利進行。FLASH和SRAM 以組合的方式實現(xiàn)信息的加密和解密,使信息能夠在特定場合下完成使用。I/O 接口通過光電耦合器隔離拓展相應的功能,系統(tǒng)內(nèi)部的移動設備使用低功耗器件,工作過程消耗的電壓僅為3.3 V,滿足了系統(tǒng)的節(jié)能要求[10-11]。識別器電路內(nèi)部的芯片為C8051F020 MCU 芯片,不需要重新擴展串口,能夠很好地滿足信息的要求。
VSM 常用在記錄信息方面,具有良好的統(tǒng)計功能,通過向量的方法來表示文檔,表示公式為:
其中,w為系統(tǒng)內(nèi)部文檔,i表示特征項。通過各個不同的特征項占比分析各個方法的權重。VSM的統(tǒng)計效率高,能夠?qū)⑿畔⒓?,在存儲過程中不會造成信息丟失[12-13]。該文在傳統(tǒng)的VSM 基礎上進行了改進,改進原理如圖5 所示。
圖5 改進原理
觀察圖5 可知,確定數(shù)據(jù)采集單元出現(xiàn)的電力數(shù)據(jù)信息,將采集到的電力數(shù)據(jù)信息進行數(shù)據(jù)存儲和管理,通過數(shù)據(jù)挖掘、決策支持和OLAP 分析表示文檔,組成向量空間模型,完成VSM 改進[14]。
在軟件操作過程中,對電力信息進行預處理,提取關鍵信息,利用改進的VSM 對信息進行統(tǒng)計,判斷電力信息的初始權重,抽取公共電力信息,分析初始權重值,確定關鍵電力信息,將其組合并提取信息的特征項,分析不同特征項的權重,并對電力信息進行修改:
其中,wij表示特征W修改后的信息;fij表示信息出現(xiàn)的頻率;N表示信息的集成次數(shù);n表示信息數(shù)量;k表示組合權重;j表示修改次數(shù)。根據(jù)式(2)可知,如果電力信息出現(xiàn)的次數(shù)超過閾值,則為公共信息[15]。
將信息融合到一起,建立樣本集,以此為依據(jù)分析樣本數(shù)量,對樣本進行決策,判斷所采集的信息與樣本的相似度,計算公式如下所示:
其中,X表示最大樣本閾值;Ci表示待檢測電力信息;Sip表示樣本信息[16];m表示待檢測電力信息總數(shù)。在分類過程中將信息確定為向量,確定得到信息的所屬類型,從而完成分類過程,根據(jù)分類結果進行信息顯示,在顯示屏展示結果。
為了驗證該文提出的基于改進VSM 的電力公共信息快速檢索系統(tǒng)的有效性,設計對比實驗,選用的電力信息來自電力企業(yè)服務器2021 年12 月25 日8:00—12 月30 日16:50 的監(jiān)控記錄。同時配置硬件環(huán)境和軟件環(huán)境,具體配置條件:實驗硬件環(huán)境由服務器硬件和客戶端硬件組成,服務器硬件的內(nèi)存為8 T;VPU 為5.0 G;硬盤為2 T。客戶端硬件的內(nèi)存為4 T;VPU 為2.0 G;硬盤為1 T。軟件測試環(huán)境服務器語言環(huán)境為C++語言,客戶端通過M5瀏覽器瀏覽。
采集樣本點共有350 個,其中共有150 個公共信息點,有45 個公共信息點以分散的方式分布,其他公共信息點以連續(xù)的方式分布。對電力信息的時間序列模型進行預測,計算基線和閾值,確定基線置信度為95%。
考慮到基于搜索引擎的供電信息資源多用戶調(diào)度管理平臺僅側重于信息調(diào)度,因此在檢索性能方面僅采用該文提出的基于改進VSM 的電力公共信息快速檢索系統(tǒng)和基于改進決策樹的配電網(wǎng)多源數(shù)據(jù)快速檢索系統(tǒng)進行對比實驗,實驗結果如圖6 所示。
圖6 檢索實驗結果
根據(jù)圖6 可知,基于改進決策樹的配電網(wǎng)多源數(shù)據(jù)快速檢索系統(tǒng)得到的線條與觀測線基本吻合,能夠準確地檢索出觀測線中存在的電力公共信息,尤其在檢索分散的公共信息時,能夠?qū)崟r響應,具有很強的響應能力。但是在檢索過程中出現(xiàn)了誤報情況,將處于閾值范圍內(nèi)的電力信息誤判為公共信息,對于集中信息點,檢測能力較差,同時還出現(xiàn)了多次誤判的情況。雖然基于改進VSM 的電力公共信息快速檢索系統(tǒng)與正常的電力信息預測結果之間有一定的弱化,但基于改進VSM 的電力公共信息快速檢索系統(tǒng)與對比檢索系統(tǒng)相比更加平滑,表明該文設計系統(tǒng)可以降低CPU 負荷的波動。且基于改進VSM的電力公共信息快速檢索系統(tǒng)與對比檢索系統(tǒng)相比,與正常的電力信息預測結果更加接近。綜上可知,該文設計的檢索系統(tǒng)在檢測率方面能夠及時檢測出多個公共信息點,并沒有出現(xiàn)誤判,證明該文設計的檢索系統(tǒng)具有很強的魯棒性和可靠性,能夠降低檢測失誤概率。
分別選取基于改進決策樹的配電網(wǎng)多源數(shù)據(jù)快速檢索系統(tǒng)、基于搜索引擎的供電信息資源多用戶調(diào)度管理平臺以及該文系統(tǒng)進行響應時間測試,實驗結果如表1 所示。
表1 響應時間實驗結果
根據(jù)表1 可知,該文系統(tǒng)對于公共信息的響應時間僅在第4 次實驗時超過2 s,雖然受到環(huán)境的限制,但是整體響應時間滿足了實際需求。而對比的檢索系統(tǒng)在檢索過程中響應時間相對該文系統(tǒng)更長,導致電力系統(tǒng)運行過程等待時間過久,但是整體響應時間較平均,系統(tǒng)受環(huán)境限制影響較小。
綜上所述,該文提出的基于改進VSM 的電力公共信息快速檢索系統(tǒng)應用后,有助于各企業(yè)探索政企合作的多種模式,發(fā)揮互聯(lián)網(wǎng)在電力公共信息服務領域的優(yōu)勢,合理界定政企部門在電力公共信息服務領域的邊界,推動供電服務轉(zhuǎn)型。
為了更好地實現(xiàn)電力公共信息檢索,該文通過改進向量空間模型,設計電力公共信息快速檢索系統(tǒng),在設計過程中對硬件和軟件進行了優(yōu)化,同時更新檢索終端、存儲器和檢索器,利用改進的向量空間模型將電力信息轉(zhuǎn)換成分類信息文本,并與閾值對比,確定需要檢索的電力公共信息。實驗結果表明,該文設計的系統(tǒng)能夠很好地完成信息檢索。但是在進行信息分析時,只能通過相似度比較確定信息是否為公共信息,這樣的檢索方式局限性較強,因此未來需要進一步深入研究這一問題。