摘要:文章對(duì)基于深度學(xué)習(xí)的風(fēng)場(chǎng)關(guān)口計(jì)量表圖像識(shí)別系統(tǒng)進(jìn)行了研究,主要是識(shí)別關(guān)口計(jì)量表上參數(shù),無須對(duì)儀器進(jìn)行改造。文章以先進(jìn)的云計(jì)算和數(shù)據(jù)分析為輔助并結(jié)合關(guān)口計(jì)量表采集數(shù)據(jù),開發(fā)一套簡(jiǎn)單方便的微信小程序輕應(yīng)用系統(tǒng)。該系統(tǒng)識(shí)別目標(biāo)準(zhǔn)確率高,圖片處理時(shí)間快,且不直接與計(jì)量表計(jì)對(duì)接,具有完備的電力生產(chǎn)系統(tǒng)網(wǎng)絡(luò)安全性,且通過光學(xué)圖片采集信息,可屏蔽生產(chǎn)場(chǎng)所產(chǎn)生的電磁干擾,對(duì)發(fā)電企業(yè)起到挖掘數(shù)據(jù)能效、開發(fā)運(yùn)維潛力、提升管理質(zhì)量的效果。
關(guān)鍵詞:深度學(xué)習(xí);關(guān)口計(jì)量表;圖像識(shí)別系統(tǒng)
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)志碼:A文獻(xiàn)標(biāo)志碼
0 引言
關(guān)口電能計(jì)量表是電網(wǎng)公司和新能源發(fā)電企業(yè)之間最重要的一類計(jì)量表。對(duì)于電網(wǎng)公司,它是計(jì)量發(fā)電企業(yè)發(fā)電量,購(gòu)電核算的重要工具[1]。對(duì)于發(fā)電企業(yè),它用于計(jì)量該線路上的總供電量。是否可用該計(jì)量值參與考核線損等問題,是新能源發(fā)電企業(yè)關(guān)注的重點(diǎn)。
目前,國(guó)內(nèi)外針對(duì)關(guān)口計(jì)量表的監(jiān)測(cè)研究問題主要集中在以下2點(diǎn):(1)計(jì)量表數(shù)據(jù)的遠(yuǎn)程采集和遠(yuǎn)程校驗(yàn);(2)智能感知和數(shù)據(jù)挖掘?qū)崿F(xiàn)對(duì)電能表運(yùn)行狀況的實(shí)時(shí)監(jiān)測(cè)。由于計(jì)量表由電網(wǎng)安裝校正,通信接口已被實(shí)施鉛封,不允許其他電子設(shè)備接入。發(fā)電企業(yè)在運(yùn)維過程中,只能由人工定時(shí)讀表,手動(dòng)記錄。該方式工作效率低,數(shù)據(jù)時(shí)效性差,不易形成結(jié)構(gòu)化數(shù)據(jù),進(jìn)而進(jìn)行深度分析,在很大程度上阻礙了發(fā)電企業(yè)與電網(wǎng)之間的貿(mào)易結(jié)算,特別是在以新能源為主體的新型電力系統(tǒng)極具時(shí)效要求的現(xiàn)貨交易流程中。
隨著人工智能技術(shù)的發(fā)展,圖像識(shí)別技術(shù)早已被廣泛運(yùn)用到如物聯(lián)網(wǎng)二維碼中的字符識(shí)別等各個(gè)方面,其核心技術(shù)也愈加趨于成熟。利用圖像處理進(jìn)行遠(yuǎn)程采集儀表數(shù)據(jù)的技術(shù)也開始發(fā)展起來[2],這種遠(yuǎn)程圖像識(shí)別參數(shù)的方法相較于傳統(tǒng)的遠(yuǎn)程抄表技術(shù),具備不受電表本身硬件限制的優(yōu)點(diǎn),無須對(duì)電表進(jìn)行改裝或更換就能被大量應(yīng)用,減少了資金的消耗。目前已有很多關(guān)于圖像處理識(shí)別數(shù)字儀表的研究[3],表明該技術(shù)實(shí)現(xiàn)了數(shù)字提取、分割、識(shí)別,并能在各種約束條件下得到較理想的識(shí)別效果。
鑒于國(guó)家電網(wǎng)對(duì)關(guān)口計(jì)量表通信接口進(jìn)行鉛封,發(fā)電企業(yè)須要實(shí)時(shí)了解關(guān)口電量表數(shù)據(jù)以支撐現(xiàn)場(chǎng)和經(jīng)營(yíng)層面的決策,本文創(chuàng)新性地研發(fā)了智能的關(guān)口計(jì)量數(shù)據(jù)監(jiān)控系統(tǒng)。該系統(tǒng)具有廣闊的社會(huì)前景和經(jīng)濟(jì)效益。
1 研究?jī)?nèi)容
新能源發(fā)電行業(yè)均積極從傳統(tǒng)運(yùn)維向智能運(yùn)維模式轉(zhuǎn)變。傳統(tǒng)運(yùn)維依靠經(jīng)驗(yàn)和制度規(guī)章驅(qū)動(dòng),形成靜態(tài)模糊決策,再依規(guī)開票實(shí)施;智能運(yùn)維則依靠電力生產(chǎn)過程中產(chǎn)生的實(shí)時(shí)數(shù)據(jù)驅(qū)動(dòng),通過信息系統(tǒng)的強(qiáng)大數(shù)據(jù)分析能力精準(zhǔn)把握動(dòng)態(tài),從而快速?zèng)Q策。實(shí)現(xiàn)轉(zhuǎn)變的關(guān)鍵就是以新一代信息論、系統(tǒng)論為基石的人工智能技術(shù)的發(fā)展和應(yīng)用。電能關(guān)口計(jì)量表是電網(wǎng)公司和發(fā)電企業(yè)之間購(gòu)售電核算的主要工具,大部分國(guó)有企業(yè)類發(fā)電廠目前仍使用人工抄表、手動(dòng)收集數(shù)據(jù)的方式,讀數(shù)的實(shí)時(shí)性差,準(zhǔn)確性不可控,嚴(yán)重減弱了生產(chǎn)數(shù)據(jù)的分析效果,影響發(fā)電過程的整體決策。
針對(duì)當(dāng)前關(guān)口計(jì)量表存在的問題,企業(yè)應(yīng)運(yùn)用工業(yè)相機(jī)在關(guān)口計(jì)量表處采集液晶屏幕圖像,再應(yīng)用以Tensorflow/Keras為框架的YOLOv5網(wǎng)絡(luò)圖像分割和OCR圖像識(shí)別技術(shù)進(jìn)行處理,還原成文本并發(fā)送到數(shù)據(jù)中心,最后進(jìn)行結(jié)構(gòu)化存儲(chǔ)與分析。結(jié)果最終以微信小程序輕量化展示給用戶,以實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)讀取與分析,盤活數(shù)字資產(chǎn),達(dá)到提高決策效率的目的。
研究?jī)?nèi)容主要有:
(1)關(guān)口計(jì)量表圖像采集,以Linux為核心的SoC系統(tǒng)驅(qū)動(dòng)工業(yè)相機(jī)拍攝計(jì)量表液晶屏區(qū)域圖像信息,利用物聯(lián)感知網(wǎng)和升壓站信息承載網(wǎng)絡(luò)將圖片傳輸?shù)皆品?wù)器。
(2)圖像識(shí)別與數(shù)據(jù)存儲(chǔ),由云服務(wù)器對(duì)圖片采用深度學(xué)習(xí)聯(lián)系YOLOv5網(wǎng)絡(luò)圖像定位分割和OCR機(jī)器學(xué)習(xí)方式對(duì)圖片進(jìn)行識(shí)別,解析的字符串生成結(jié)構(gòu)化文本數(shù)據(jù),通過TCP/IP或RS-485等協(xié)議,傳輸?shù)郊刂行臄?shù)據(jù)庫(kù)。
(3)數(shù)據(jù)展示,采取直連數(shù)據(jù)庫(kù)的方式實(shí)時(shí)傳輸數(shù)據(jù),開發(fā)一套簡(jiǎn)單方便的微信小程序輕應(yīng)用系統(tǒng)實(shí)時(shí)傳輸風(fēng)場(chǎng)相關(guān)數(shù)據(jù)(上/下網(wǎng)電量和相關(guān)生產(chǎn)經(jīng)營(yíng)信息),為設(shè)備精細(xì)化運(yùn)行和維護(hù)人力資源調(diào)度提供科學(xué)可靠的決策支撐。
2 系統(tǒng)結(jié)構(gòu)
風(fēng)場(chǎng)關(guān)口計(jì)量表識(shí)別系統(tǒng)的結(jié)構(gòu)如圖1所示。
2.1 關(guān)口計(jì)量表圖像采集設(shè)備
圖像采集由工業(yè)相機(jī)對(duì)電表液晶屏幕進(jìn)行拍攝。將相機(jī)貼在屏柜玻璃外壁,在柜外對(duì)單個(gè)關(guān)口計(jì)量表進(jìn)行拍攝,采用照明方式提高亮度及清晰度。前置工控機(jī)采用以Linux為核心的SoC系統(tǒng),通過執(zhí)行定時(shí)程序驅(qū)動(dòng)照明電路和攝像頭拍攝圖片,配置開關(guān)電源為其供電,設(shè)置路徑存儲(chǔ)程序?qū)⑴臄z的照片存儲(chǔ)到相應(yīng)目錄中,驅(qū)動(dòng)socket通信將其傳到云服務(wù)器中,采用無連接的數(shù)據(jù)傳輸方式SOCK_DGRAM,保證計(jì)算機(jī)只傳輸數(shù)據(jù)不做數(shù)據(jù)局校驗(yàn),提升數(shù)據(jù)傳輸速度,將發(fā)送的數(shù)據(jù)存入接收緩存區(qū)。
2.2 圖像識(shí)別與數(shù)據(jù)存儲(chǔ)
本研究結(jié)合傳統(tǒng)圖像處理和深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)計(jì)量表智能讀數(shù)算法,如圖2所示。
首先,本文采用YOLOv5網(wǎng)絡(luò)圖像分割技術(shù)分割出計(jì)量表LCD液晶屏區(qū)域,根據(jù)先驗(yàn)知識(shí)在液晶屏區(qū)域中裁切出有效數(shù)字所在的大致區(qū)域,減少背景噪聲影響,提升讀取的準(zhǔn)確率,通過圖像特征采用SENet算法對(duì)圖像進(jìn)行分割。
采用LSTM+CTC+CNN架構(gòu)的OCR圖像識(shí)別技術(shù)結(jié)合深度學(xué)習(xí)技術(shù)識(shí)別出液晶屏中前述數(shù)字區(qū)域中的數(shù)字進(jìn)行識(shí)別解碼,將圖片解析成字符串,送入云端數(shù)據(jù)庫(kù),再在云端服務(wù)器上搭建Web服務(wù)器,將已存入數(shù)據(jù)庫(kù)的計(jì)量數(shù)據(jù)通過Web服務(wù)發(fā)布到頁(yè)面。外網(wǎng)可通過Web頁(yè)面獲取關(guān)口計(jì)量表的碼表數(shù)據(jù)。另外,在數(shù)據(jù)庫(kù)形成的結(jié)構(gòu)化數(shù)據(jù)可供系統(tǒng)隨時(shí)調(diào)用,為發(fā)電運(yùn)營(yíng)和風(fēng)場(chǎng)生產(chǎn)的相關(guān)決策提供支撐。
2.3 數(shù)據(jù)展示
本文通過微信公眾平臺(tái)申請(qǐng)小程序并對(duì)界面進(jìn)行設(shè)計(jì)開發(fā),經(jīng)過后臺(tái)程序計(jì)算后的生產(chǎn)相關(guān)數(shù)據(jù),直連數(shù)據(jù)庫(kù)的傳輸方式對(duì)數(shù)據(jù)實(shí)時(shí)顯示。
3 技術(shù)路線
本研究的實(shí)施技術(shù)路線與成果規(guī)劃如圖3所示。通過查閱文件、實(shí)地調(diào)研,首先設(shè)計(jì)關(guān)口計(jì)量表圖像采集設(shè)備,然后在TensorFlow/Keras平臺(tái)上采用YOLOv5網(wǎng)絡(luò)模型、SENet算法對(duì)圖像進(jìn)行分割,利用OCR圖像識(shí)別技術(shù)對(duì)圖片進(jìn)行識(shí)別解碼,對(duì)數(shù)字字符區(qū)域分割生成結(jié)構(gòu)化文本數(shù)據(jù),并傳輸至集控中心數(shù)據(jù)庫(kù),最后以微信小程序的形式展示。
3.1 YOLOv5網(wǎng)絡(luò)圖像分割技術(shù)
本文對(duì)LCD屏定位采用YOLOv5算法,利用整張圖片作為網(wǎng)絡(luò)的輸入,直接在輸出層回歸位置和所屬類別,對(duì)除去所需監(jiān)測(cè)數(shù)據(jù)圖片的其他噪聲進(jìn)行預(yù)處理,精準(zhǔn)定位到設(shè)備數(shù)據(jù)圖片位置。
本文對(duì)定位圖片中的數(shù)據(jù)進(jìn)行識(shí)別,采用SENet算法,在原圖像中找到符合閾值的部分,之后再對(duì)每一部分進(jìn)行2次投影分割,并篩選出符合讀數(shù)區(qū)域長(zhǎng)寬比的部分。該方法比較容易實(shí)現(xiàn),在處理電表圖像時(shí)能得到一個(gè)較為良好的結(jié)果。
YOLOv5通過形態(tài)學(xué)操作和減法可以實(shí)現(xiàn)獲取圖像的邊界,設(shè)置為8位單通道的二值圖像,將攝像頭所拍圖像處理為二值圖像后再將其作為image的參數(shù),最后返回當(dāng)前圖片中的輪廓層次關(guān)系。上述代碼對(duì)檢測(cè)到的輪廓建立等級(jí)關(guān)系,依次遍歷,然后壓縮水平、垂直對(duì)角線方向的元素,只保留該方向的終點(diǎn)坐標(biāo),通過該方式定位到圖片中的數(shù)字位置。接下來對(duì)定位到的矩形邊框中的信息進(jìn)行擬合,依次縮進(jìn)所取范圍直到鎖定所需數(shù)字輪廓。
SENet中的SE模塊如圖4所示,圖中的Ftr是傳統(tǒng)的卷積結(jié)構(gòu);X和U是Ftr的輸入(C’×H’×W’)和輸出(C×H×W),這些都是以往結(jié)構(gòu)中已存在的。SENet增加的部分是U后的結(jié)構(gòu):對(duì)U先做一個(gè)Global Average Pooling,輸出的1×1×C數(shù)據(jù)再經(jīng)過兩級(jí)全連接,最后用Sigmoid限制到[0,1]的范圍,把這個(gè)值作為scale乘到U的C個(gè)通道上,作為下一級(jí)的輸入數(shù)據(jù)。該方式控制scale的大小,把所需的數(shù)字特征增強(qiáng),不需要的其他特征減弱,讓鎖定輪廓中的數(shù)據(jù)信息指向性更強(qiáng)。
3.2 OCR圖像識(shí)別技術(shù)
對(duì)所識(shí)別數(shù)據(jù)進(jìn)行處理,首先利用OCR算法以字符形態(tài)為分析樣本,確定在圖像中字符特征邊緣區(qū)域的選擇,然后找出每個(gè)字符的特征特性,通過大量試驗(yàn)得出每個(gè)字符的特征規(guī)律,最后通過相似性概率統(tǒng)計(jì)方法實(shí)現(xiàn)字符的識(shí)別。
將圖片中的數(shù)字區(qū)域位置鎖定后,還須對(duì)區(qū)域內(nèi)的數(shù)字進(jìn)行識(shí)別。該項(xiàng)目使用LSTM+CTC+CNN架構(gòu),通過采用標(biāo)準(zhǔn)CNN模型(去除全連接層)中的卷積層和最大池化層來構(gòu)造卷積層的組件,用于從輸入圖像中提取序列特征表示。在進(jìn)入網(wǎng)絡(luò)之前,所有的圖像須要縮放到相同的高度,然后從卷積層組件產(chǎn)生的特征圖中提取特征向量序列,這些特征向量序列作為循環(huán)層的輸入。長(zhǎng)短時(shí)記憶(LSTM)存儲(chǔ)單元存儲(chǔ)過去的上下文,輸入和輸出門允許單元長(zhǎng)時(shí)間地存儲(chǔ)上下文,單元中的存儲(chǔ)可以被遺忘門清除,擴(kuò)大存儲(chǔ)的上下文范圍,給訓(xùn)練過程減負(fù),得到更加精確的結(jié)果。轉(zhuǎn)錄采用CTC算法,用于處理序列標(biāo)注問題中的輸入與輸出標(biāo)簽的對(duì)齊問題,CTC擴(kuò)展了標(biāo)簽集合,添加空元素,使用擴(kuò)展標(biāo)簽集合對(duì)序列進(jìn)行標(biāo)注后,所有可以通過映射函數(shù)轉(zhuǎn)換為真實(shí)序列的預(yù)測(cè)序列,都是正確的預(yù)測(cè)結(jié)果,也就是無需數(shù)據(jù)對(duì)齊處理即可得到預(yù)測(cè)序列。該方法檢索過程結(jié)合額外的信息,提高搜索的準(zhǔn)確度。
所有模型和算法均是基于TensorFlow/Keras平臺(tái)進(jìn)行有效性驗(yàn)證,在驗(yàn)證通過的基礎(chǔ)上基于Python語言架構(gòu)開發(fā)用于實(shí)際環(huán)境的應(yīng)用程序。
4 特色與創(chuàng)新
針對(duì)發(fā)電企業(yè)關(guān)口計(jì)量數(shù)據(jù)采用“非接觸”采集方案,確保網(wǎng)絡(luò)安全的同時(shí)屏蔽相關(guān)干擾,獲取準(zhǔn)確表計(jì)讀數(shù)。設(shè)計(jì)基于Linux內(nèi)核的前置終端作為物聯(lián)網(wǎng)感知節(jié)點(diǎn)采集圖片信號(hào),利用發(fā)電場(chǎng)站信息承載網(wǎng)將信息傳入位于云終端的深度學(xué)習(xí)模型進(jìn)行識(shí)別和處理。
在云端建立基于深度學(xué)習(xí)的字符識(shí)別模型,并針對(duì)關(guān)口計(jì)量表特定字符進(jìn)行訓(xùn)練,獲得結(jié)果形成結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)到相關(guān)的云數(shù)據(jù)庫(kù),發(fā)布到生產(chǎn)平臺(tái)和相關(guān)終端。貫通生產(chǎn)平臺(tái)數(shù)據(jù),深入挖掘關(guān)口計(jì)量表相關(guān)經(jīng)營(yíng)數(shù)據(jù),為實(shí)際生產(chǎn)提供決策支撐。
應(yīng)用移動(dòng)互聯(lián)網(wǎng)小程序輕應(yīng)用,采集和發(fā)布生產(chǎn)一線發(fā)電計(jì)量、設(shè)備運(yùn)維情況,形成扁平化管理體系,為生產(chǎn)事務(wù)安排和現(xiàn)貨電量交易提供決策支撐,開發(fā)運(yùn)維潛力,提升精細(xì)化管理水平。
5 應(yīng)用前景
本文研究的基于深度學(xué)習(xí)的風(fēng)場(chǎng)關(guān)口計(jì)量表圖像識(shí)別系統(tǒng),識(shí)別目標(biāo)準(zhǔn)確率高,對(duì)發(fā)電企業(yè)起到挖掘數(shù)據(jù)能效,開發(fā)運(yùn)維潛力,提升管理質(zhì)量效果具有顯著成效。此套系統(tǒng)也可運(yùn)用到輻射、極端溫度等危險(xiǎn)行業(yè)中所用到的儀表監(jiān)測(cè),對(duì)保障人員安全以及穩(wěn)定社會(huì)發(fā)展具有巨大作用。
參考文獻(xiàn)
[1]張鼎衢,楊路,宋強(qiáng),等.一種用于關(guān)口電能計(jì)量裝置遠(yuǎn)程校驗(yàn)的多路模擬采集器的研制[J].電測(cè)與儀表,2022(9):181-187.
[2]馬學(xué)文.基于圖像識(shí)別的指針式工業(yè)儀表遠(yuǎn)程抄錄技術(shù)研究[D].西安:西安電子科技大學(xué),2021.
[3]王麗芳.基于圖像處理的數(shù)字儀表字符自動(dòng)識(shí)別研究[J].電子世界,2020(15):60-61.
Research on image recognition system of wind pass meter based on deep learning
Abstract: This research mainly focuses on the image recognition system of wind field pass meter based on deep learning, which is mainly to identify parameters on the pass meter without the need to transform the instrument. Assisted by advanced cloud computing and data analysis, combined with the pass meter to collect data, a set of simple and convenient wechat mini program light application system is developed, with high target identification accuracy and fast image processing time. And does not directly docking with the metering meter, with a complete power production system network security, and through the optical picture collection of information, can shield the electromagnetic interference in the production site, the power generation enterprises to tap data energy efficiency, development of operation and maintenance potential, improve the quality of management effect.
Key words: deep learning gateway; metrology meter; image recognition system