陳東海,王 猛,吳昱浩,楊 淇
(國網(wǎng)寧波供電公司,浙江寧波 315000)
tesseract 訓(xùn)練引擎碼源由C#、C++兩種語言混編而成,在編譯過程中,所有接口函數(shù)直接存儲于baseapi.h 文件中。一般來說,一個tesseract 訓(xùn)練引擎碼只能處理一類Image 信息,且隨著應(yīng)用時間的延長,已被讀取數(shù)據(jù)指標(biāo)會占據(jù)原信息文件的傳輸位置,不但會避免傳輸數(shù)據(jù)文件出現(xiàn)過量堆積情況,也可建立一個信息參量與另一個信息參量之間的函數(shù)連接,加強(qiáng)數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系緊密性[1-2]。在智能電網(wǎng)、電力體系等應(yīng)用環(huán)境中,電壓信號、電流信號等特征指標(biāo)可作為tesseract 訓(xùn)練引擎的傳輸對象,且隨著數(shù)據(jù)讀取指令的執(zhí)行,這些文件信息可直接存儲于既定數(shù)據(jù)庫主機(jī)中,以供其他編譯碼源的調(diào)取與利用。
電力告警信號是指能夠描述錯誤電信號傳輸行為的指標(biāo)參量,在智能配網(wǎng)環(huán)境中,電網(wǎng)主機(jī)對于告警信號特征的識別準(zhǔn)確性直接決定電網(wǎng)體系的應(yīng)用穩(wěn)定性。傳統(tǒng)多特征組合識別方法通過電力告警信號特征逐級分析的方式,建立核心信號標(biāo)記節(jié)點(diǎn)與下級信號標(biāo)記節(jié)點(diǎn)之間的物理連接關(guān)系,再借助已知編碼原則,確定特征信號參量的位數(shù)識別結(jié)果[3]。然而,與該方法匹配的電力告警信號峭度指標(biāo)極值差水平較高,不利于增強(qiáng)電網(wǎng)主機(jī)對于告警信號特征的識別準(zhǔn)確性。為解決上述問題,設(shè)計基于tesseract 訓(xùn)練的新型電力告警信號特征識別方法。
在tesseract 引擎支持下,電力告警信號的字符標(biāo)記主要由tesseract 訓(xùn)練環(huán)境布局、字符行區(qū)域識別、字符列區(qū)域識別三部分組成。
訓(xùn)練環(huán)境布局是tesseract 引擎碼源設(shè)計的關(guān)鍵環(huán)節(jié),可將既定電力告警信號特征聚集在同一數(shù)據(jù)信息存儲環(huán)節(jié)中,并可按照既定調(diào)用函數(shù),將信息參量分割為多個應(yīng)用模式,一部分可供電力主機(jī)體系直接調(diào)??;另一部分則能夠為行、列區(qū)域提供可識別的備選字符信息[4-5]。
規(guī)定第一個tesseract 引擎碼源的定義系數(shù)項為u1,第n個tesseract 引擎碼源的定義系數(shù)項為un,且標(biāo)記節(jié)點(diǎn)n的取值結(jié)果始終大于1。規(guī)定由式(1)決定的tesseract 引擎標(biāo)記行為恒成立,則認(rèn)為電力告警信號特征的訓(xùn)練環(huán)境布局原則始終滿足式(2):
式中,e表示tesseract 引擎碼源標(biāo)記系數(shù),β表示電力告警信號的訓(xùn)練特征值,w1表示第一個tesseract 引擎碼篩查系數(shù),wn表示第n個tesseract 引擎碼篩查系數(shù),p表示tesseract 引擎中的數(shù)據(jù)信息行為項。環(huán)境布局形式?jīng)Q定了tesseract 訓(xùn)練引擎的應(yīng)用能力,一般來說,待識別的電力告警信號特征量越多,tesseract 訓(xùn)練環(huán)境對于數(shù)據(jù)信息參量的容納能力也越強(qiáng)。
字符行區(qū)域是以行分布系數(shù)為基礎(chǔ)劃分的電力告警信號特征識別區(qū)域,在識別取樣過程中,行區(qū)域覆蓋面積越大,則表示tesseract 訓(xùn)練引擎的橫向布局能力越強(qiáng),反之則越弱[6]。字符行區(qū)域識別可以理解為對電力告警信號特征行區(qū)域環(huán)境的規(guī)劃,在配電網(wǎng)環(huán)境中,由于信號傳輸特征的不同,與之匹配的數(shù)據(jù)訓(xùn)練方式也有所不同,這也是導(dǎo)致電網(wǎng)主機(jī)對于告警信號特征識別結(jié)果出現(xiàn)明顯差異性的主要原因[7-8]。
設(shè)ΔS表示tesseract 訓(xùn)練環(huán)境的行區(qū)域跨度量,r表示電力告警信號特征的行區(qū)域跨度系數(shù),qr表示行區(qū)域跨度系數(shù)取值為r時的告警信號特征值,m、d表示兩個不同的行區(qū)域字符節(jié)點(diǎn)標(biāo)記系數(shù),聯(lián)立式(2),可將字符行區(qū)域識別結(jié)果SR表示為:
若以tesseract 訓(xùn)練布局環(huán)境為背景,則可認(rèn)為行區(qū)域識別結(jié)果直接決定了電力告警信號特征的橫向傳輸能力。
字符列區(qū)域是以列分布系數(shù)為基礎(chǔ)劃分的電力告警信號特征識別區(qū)域,在識別取樣過程中,列區(qū)域覆蓋面積越大,則表示tesseract 訓(xùn)練引擎的縱向布局能力越強(qiáng),反之則越弱。字符列區(qū)域識別可以理解為是對電力告警信號特征列區(qū)域環(huán)境的規(guī)劃,在配電網(wǎng)環(huán)境中,與每一列電力告警信號特征所匹配的實(shí)時傳輸行為有所不同,此時為充分激發(fā)tesseract訓(xùn)練引擎的應(yīng)用能力,應(yīng)對電力告警信號特征所屬的列區(qū)域環(huán)境進(jìn)行嚴(yán)格規(guī)劃與部署[9-10]。
設(shè)ΔD表示tesseract 訓(xùn)練環(huán)境的列區(qū)域跨度量,i表示電力告警信號特征的列區(qū)域跨度系數(shù),qi表示列區(qū)域跨度系數(shù)取值為i時的告警信號特征值,c表示列區(qū)域字符節(jié)點(diǎn)標(biāo)記系數(shù),可將字符列區(qū)域識別結(jié)果DR表示為:
若以tesseract 訓(xùn)練布局環(huán)境為背景,則可認(rèn)為列區(qū)域識別結(jié)果直接決定電力告警信號特征的縱向傳輸能力。
在tesseract 訓(xùn)練布局環(huán)境中,電力告警信號特征提取行為能夠決定特征參量識別結(jié)果準(zhǔn)確性,對不同數(shù)據(jù)信息指標(biāo),與之相關(guān)的信號特征提取結(jié)果也會有所不同[11-12]。在不考慮其他干擾條件的情況下,電力告警信號特征提取結(jié)果同時受到數(shù)據(jù)信息傳輸變化量、特征指標(biāo)判別條件兩項物理量的直接影響。
數(shù)據(jù)信息傳輸變化量可表示為ΔG,在單位判別時間內(nèi),該項物理指標(biāo)取值結(jié)果越大,電網(wǎng)主機(jī)能識別到告警信號特征值也就越多。特征指標(biāo)判別條件可表示為χ,若單純以tesseract 訓(xùn)練引擎作為干擾項影響條件,則可認(rèn)為該項物理指標(biāo)的取值結(jié)果將直接影響電網(wǎng)主機(jī)對于電力告警信號特征的識別與處理能力。在上述物理量的支持下,聯(lián)立式(4),可將信號特征提取表達(dá)式定義為:
其中,z表示電力告警信號特征的傳輸干擾項,λ表示tesseract 訓(xùn)練引擎對于電力告警信號的判別系數(shù)。假設(shè)tesseract 訓(xùn)練引擎的應(yīng)用穩(wěn)定性不會發(fā)生改變,則可認(rèn)為信號特征提取條件能夠直接影響電網(wǎng)主機(jī)對于告警信號特征指標(biāo)的識別。
識別閾值也稱為tesseract 訓(xùn)練引擎對電力告警信號特征所設(shè)置的識別判斷權(quán)限,在已知信號特征提取結(jié)果情況下,該門限指標(biāo)的取值結(jié)果越大,電網(wǎng)主機(jī)對于告警信號特征的準(zhǔn)確識別能力也就越強(qiáng),反之則越弱[13-14]。
設(shè)vmax表示電力告警信號特征在tesseract 訓(xùn)練引擎中傳輸速率的最大值,vmin表示傳輸速率的最小值,在實(shí)際應(yīng)用過程中,不等式(vmax-vmin)>1 恒成立。規(guī)定j表示一個既定的信號特征標(biāo)記條件,?j表示該條件下電力告警信號特征的預(yù)設(shè)實(shí)值結(jié)果,在上述物理量的支持下,聯(lián)立式(5),可將識別閾值表達(dá)式定義為:
式中,k表示已知的特征數(shù)據(jù)判別項指標(biāo)。通常情況下,在tesseract 訓(xùn)練引擎的支持下,指標(biāo)k的取值結(jié)果始終不會大于自然常數(shù)e。
暫態(tài)行為處理是電力告警信號特征識別方法設(shè)計的末尾執(zhí)行環(huán)節(jié),在tesseract 訓(xùn)練環(huán)境中,電網(wǎng)主機(jī)可以通過規(guī)劃電力告警信號特征存儲區(qū)間的方式,確定暫態(tài)識別行為的實(shí)際執(zhí)行能力[15-16]。
設(shè)xα表示電力告警信號暫態(tài)行為標(biāo)記系數(shù)為α?xí)r待識別特征指標(biāo)參量,xˉ表示待識別特征指標(biāo)參量的平均值,α表示信號特征參量的實(shí)際識別權(quán)限,b表示實(shí)時系數(shù)項,φ表示既定的信號數(shù)據(jù)識別特征值。在上述物理量的支持下,聯(lián)立式(6),可將暫態(tài)行為處理結(jié)果表示為:
為驗證基于tesseract 訓(xùn)練的電力告警信號特征識別方法實(shí)際應(yīng)用價值,設(shè)計如下對比實(shí)驗。通過人工干預(yù)方式模擬電力告警信號的傳輸行為,選取兩臺配置完全相同的電網(wǎng)主機(jī)作為實(shí)驗對象,其中實(shí)驗組主機(jī)配置基于tesseract 訓(xùn)練的特征識別方法,對照組主機(jī)配置多特征組合識別方法。具體的實(shí)驗環(huán)境配置流程如圖1 所示。
圖1 實(shí)驗環(huán)境配置流程圖
電力告警信號峭度指標(biāo)極值差能夠反映電網(wǎng)主機(jī)對告警信號特征識別準(zhǔn)確性,一般來說,極值差水平越低,表示電網(wǎng)主機(jī)對于告警信號特征的識別準(zhǔn)確性越強(qiáng),反之則越弱。表1 記錄電力告警信號峭度指標(biāo)極值差的理想數(shù)值水平。
表1 電力告警信號峭度極值差的理想數(shù)值
分析表1可知,隨著實(shí)驗時間的延長,峭度指標(biāo)極大值、極小值均表現(xiàn)出不斷波動的數(shù)值變化趨勢。當(dāng)時間取值為20 min時,峭度極值差的數(shù)值水平最大,達(dá)到了13.4°/V,當(dāng)時間取值為40 min時,峭度極值差的數(shù)值水平最小,達(dá)到了7.5°/V,二者差值為5.9°/V。
圖2 為實(shí)驗組、對照組電力告警信號峭度指標(biāo)極大值的實(shí)驗數(shù)值結(jié)果。
圖2 電力告警信號峭度指標(biāo)極大值
圖3 為實(shí)驗組、對照組電力告警信號峭度指標(biāo)極小值的實(shí)驗數(shù)值結(jié)果。
圖3 電力告警信號峭度指標(biāo)極小值
對照圖2、圖3,計算實(shí)驗組、對照組電力告警信號峭度指標(biāo)的實(shí)際極值差結(jié)果,具體數(shù)值如表2所示。
表2 電力告警信號峭度極值差的實(shí)際數(shù)值
對比表1、表2 可知,當(dāng)時間取值為50 min 時,實(shí)驗組電力告警信號峭度極值差達(dá)到最大值8.3 °/V,與理想最大值13.4°/V 相比,下降了5.1°/V。當(dāng)時間取值為40 min 時,對照組電力告警信號峭度極值差達(dá)到最大值21.8°/V,與理想最大值13.4°/V 相比,上升了8.4°/V。
與多特征組合識別方法相比,新型識別方法在tesseract 訓(xùn)練引擎作用下,分別對字符行區(qū)域與列區(qū)域進(jìn)行準(zhǔn)確識別,通過閾值判別方式完成暫態(tài)行為處理。從實(shí)用性角度來看,隨著這種新型識別方法應(yīng)用,電力告警信號峭度極值差的實(shí)際數(shù)值水平得到了較好控制,符合增強(qiáng)電網(wǎng)主機(jī)對于告警信號特征識別準(zhǔn)確性的實(shí)際應(yīng)用需求。