陳開(kāi)峰, 俞偉聰, 唐雁文, 吳仲
(1.中國(guó)大唐集團(tuán)科學(xué)技術(shù)研究總院有限公司華東電力試驗(yàn)研究院, 合肥 230093; 2.安徽智寰科技有限公司, 合肥 230601; 3.大唐萬(wàn)寧天然氣發(fā)電有限責(zé)任公司, 萬(wàn)寧 571500)
當(dāng)前數(shù)字互聯(lián)網(wǎng)經(jīng)濟(jì)作為新興經(jīng)濟(jì)發(fā)展的排頭兵,得到了全社會(huì)的矚目。然而傳統(tǒng)工業(yè)項(xiàng)目向互聯(lián)網(wǎng)數(shù)字化轉(zhuǎn)型之路并不容易,仍有許多大型設(shè)備依賴于人力巡檢,工程師自身經(jīng)驗(yàn)判斷來(lái)決定設(shè)備的健康程度。如何將指標(biāo)數(shù)字化,用人工智能算法替代機(jī)械重復(fù)的勞動(dòng),一直是工業(yè)界研究的重點(diǎn)。
對(duì)工廠等環(huán)境下的數(shù)字式儀表進(jìn)行智能化監(jiān)測(cè)和管理能有效增強(qiáng)實(shí)時(shí)性,可以有效降低安全隱患[1]。儀表又分為指針式和數(shù)字顯示式兩種類型,本文的研究對(duì)象為數(shù)字顯示儀表。近年來(lái),相關(guān)研究人員提出了多種數(shù)字式儀表數(shù)據(jù)進(jìn)行實(shí)時(shí)讀取的方式,如采用穿線法、圖像分割、特征提取、支持向量機(jī)、深度學(xué)習(xí)等。祝長(zhǎng)生等[2]提出了一種基于不變矩信息融合的溫濕度計(jì)數(shù)字自動(dòng)識(shí)別算法,對(duì)數(shù)字識(shí)別問(wèn)題提出了新的理論思路,降低了模型的復(fù)雜度,提高了檢測(cè)效率,但是存在較大的局限性和針對(duì)性。陳家翔等[3]提出將儀表盤(pán)分為幾個(gè)區(qū)域?qū)?yīng)不同的數(shù)碼管,根據(jù)數(shù)碼管點(diǎn)亮或者熄滅設(shè)計(jì)不同的特征。但是存在區(qū)域劃分繁瑣,必須根據(jù)不同顯示類型分別設(shè)計(jì)不能復(fù)用。宋一言等[4]提出改進(jìn)穿線法與梯度直方圖(histogram of oriented gradient,HOG)與支持向量機(jī)(support vector machine,SVM)結(jié)合的方式,采用基于輪廓提取與輪廓排序的相結(jié)合的數(shù)碼管圖像分割方法。劉晶[5]提出采用一對(duì)一(one-against-one,OAO)分類法將最小二乘支持向量機(jī)算法(least squares support vector machine,LSSVM)拓展到多分類,并引入粒子群優(yōu)化算法(particle swarm optimization,PSO)對(duì)LSSVM參數(shù)進(jìn)行優(yōu)化。這兩種方法雖然精度較高但是實(shí)時(shí)性較差。最近幾年,隨著深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[6-7]技術(shù)的興起,將深度學(xué)習(xí)算法遷移到數(shù)字儀表識(shí)別已是大勢(shì)所趨。如趙輝等[8]基于改進(jìn)YOLO v3算法對(duì)變電站環(huán)境中的指標(biāo)儀表進(jìn)行了監(jiān)測(cè)與識(shí)別,能夠滿足變電站的實(shí)際需求,且識(shí)別結(jié)果相對(duì)于Faster R-CNN(faster region-convolutional neural network)和原始的YOLO v3網(wǎng)絡(luò),速度分別有了73.7%和45.8%的提升。湯鵬等[9]提出基于Mask-RCNN(mask-region convolutional neural network)海上升壓站數(shù)字式儀表讀數(shù)的自動(dòng)識(shí)別,將不同類型的數(shù)字儀表原始圖像制作成數(shù)據(jù)集,利用深度學(xué)習(xí)算法進(jìn)行訓(xùn)練,再進(jìn)行識(shí)別分析。但仍然存在過(guò)于依賴計(jì)算資源的問(wèn)題,不利于在邊緣平臺(tái)上實(shí)習(xí)部署的不足。
數(shù)字儀表識(shí)別是無(wú)人點(diǎn)巡檢系統(tǒng)的重要組成模塊,針對(duì)人員難以常態(tài)化巡檢的位置,通過(guò)架設(shè)高清攝像頭,實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)采集,異常數(shù)據(jù)指標(biāo)的精確報(bào)警。當(dāng)前數(shù)字儀表識(shí)別的研究在以下幾個(gè)方面存在困難:一是對(duì)表盤(pán)的定位問(wèn)題。有讀數(shù)的表盤(pán)區(qū)域在整個(gè)圖像中占比較低,存在難定位的問(wèn)題;二是目標(biāo)尺度分布不均衡。例如,對(duì)于數(shù)字8,在不同圖像上的大小不一致。算法識(shí)別數(shù)字后,還需要對(duì)識(shí)別后的數(shù)字排序,還原其本來(lái)的意思。
因此,現(xiàn)提出一種基于深度學(xué)習(xí)YOLOv5s的輕量化、易部署的改進(jìn)模型,在第一部分主干網(wǎng)絡(luò)進(jìn)行有目標(biāo)的ROI提取,并將提取的區(qū)域統(tǒng)一到相同的尺度;第二部分網(wǎng)絡(luò)在這些區(qū)域上將數(shù)字提取出來(lái),并進(jìn)行相應(yīng)的排序。在損失函數(shù)上,應(yīng)用一種新型的損失評(píng)價(jià)函數(shù)DIoU(distance intersection over union)。最終在NVIDIA Xavier NX邊緣計(jì)算板上實(shí)現(xiàn)部署,部署后在電廠無(wú)人點(diǎn)巡檢系統(tǒng)落地實(shí)現(xiàn),實(shí)現(xiàn)真實(shí)環(huán)境下的商用運(yùn)行。
常用的目標(biāo)檢測(cè)算法有一階段(如YOLO)[10]與二階段(如Faster-RCNN)[11]之分,二階段的方法利用區(qū)域建議網(wǎng)絡(luò)(region proposal network,RPN)首先產(chǎn)生提議框,然后對(duì)提議框的形狀進(jìn)行修正,以及對(duì)提議框內(nèi)的目標(biāo)類別進(jìn)行預(yù)測(cè)。二階段的方法由于運(yùn)行過(guò)程中需要產(chǎn)生的大量的提議框需要進(jìn)行分類和修正,因此運(yùn)行速度較慢,很難做到實(shí)時(shí)檢測(cè)。本文研究則選擇使用運(yùn)行速度較快的一階段方法YOLOv5目標(biāo)檢測(cè)框架作為基線(baseline),并針對(duì)本文任務(wù)進(jìn)行改進(jìn)。
YOLOv5通過(guò)一個(gè)全卷積網(wǎng)絡(luò)將輸出的特征圖劃分為S×S個(gè)網(wǎng)格,通過(guò)目標(biāo)物體中心所處的網(wǎng)格來(lái)負(fù)責(zé)單個(gè)實(shí)例的 檢測(cè)。通過(guò)將目標(biāo)信息編碼在輸出張量的不同通道上,來(lái)同時(shí)預(yù)測(cè)目標(biāo)的置信度,類別和目標(biāo)框相對(duì)于錨框的偏移量。因此相較于二階段的網(wǎng)絡(luò),YOLOv5在速度上有著較大的優(yōu)勢(shì)。
YOLOv5采用CSPDarknet53[12]作為主干網(wǎng)絡(luò),相較于原版的CSPDarknet53,YOLOv5刪除最后的池化層、全鏈接層和SoftMax層,并在網(wǎng)絡(luò)結(jié)構(gòu)中添加了跨層模塊。本文研究中采用YOLOv5s作為基線網(wǎng)絡(luò),YOLOv5s是YOLOv5的一個(gè)版本,區(qū)別在于模型深度和寬度和YOLOv5不一樣,在YOLOv5s的基礎(chǔ)上進(jìn)行改進(jìn)。
YOLOv5的損失函數(shù)[13]如式(1)所示,主體為3個(gè)部分的累加:
(1)
式(1)中:Gw、Gh為網(wǎng)格的長(zhǎng)、寬;n為目標(biāo)框的數(shù)量;qi,j為坐標(biāo)點(diǎn)(i,j)存在目標(biāo)的概率;lobj(i,j)用來(lái)計(jì)算當(dāng)前網(wǎng)格內(nèi)目標(biāo)的置信度;lbox(i,j)用于計(jì)算目標(biāo)的位置以及目標(biāo)框的長(zhǎng)寬相對(duì)于錨框的偏移;lcls(i,j)用來(lái)計(jì)算目標(biāo)的類別損失。
(2)
(3)
(4)
本文研究提出一種基于YOLOv5s的迭代檢測(cè)
網(wǎng)絡(luò),用于針對(duì)天然氣表的數(shù)字檢測(cè),網(wǎng)絡(luò)整體結(jié)構(gòu)圖如圖1所示。
圖1中大體分為兩部分,均為改進(jìn)后的YOLOv5s目標(biāo)檢測(cè)網(wǎng)絡(luò)其中主干網(wǎng)絡(luò)部分C3~C5為輸入特征金字塔的特征圖,特征金字塔部分對(duì)應(yīng)的P3~P5為檢測(cè)頭進(jìn)行檢測(cè)的特征圖。本文研究利用了多尺度信息進(jìn)行檢測(cè),按照大中小目標(biāo)共設(shè)計(jì)了3個(gè)檢測(cè)頭分別為{20×20,40×40,80×80},分別對(duì)應(yīng)大中小目標(biāo)。迭代檢測(cè)網(wǎng)絡(luò)的工作首先由一張圖像x∈RW×H×3開(kāi)始,將圖像輸入主干網(wǎng)絡(luò)1后,由主干網(wǎng)絡(luò)提取圖像特征并按照不同尺度輸入特征金字塔1中進(jìn)行多尺度信息的融合,隨后檢測(cè)頭1將對(duì)燃?xì)獗頂?shù)字區(qū)域ROI進(jìn)行識(shí)別,在提取到ROI后,將ROI送入網(wǎng)絡(luò)2,進(jìn)行迭代檢測(cè)。網(wǎng)絡(luò)2與網(wǎng)絡(luò)1共享權(quán)重,經(jīng)過(guò)相同的步驟之后,將ROI內(nèi)對(duì)應(yīng)的數(shù)字分別檢測(cè)出來(lái),并按照先后順序進(jìn)行排序。
數(shù)字尺寸分布的統(tǒng)計(jì)如圖2所示,由圖2(a)可以看見(jiàn),在將圖像輸入網(wǎng)絡(luò)前,數(shù)據(jù)標(biāo)注尺寸分布極為分散,網(wǎng)絡(luò)需要由多個(gè)尺度獲取信息,導(dǎo)致網(wǎng)絡(luò)較難收斂,檢測(cè)效果較差。因此首先利用網(wǎng)絡(luò)1檢測(cè)尺度范圍較為統(tǒng)一的ROI,隨后將ROI從原圖2中進(jìn)行截取,隨后再利用ROI對(duì)圖2中的數(shù)字進(jìn)行迭代檢測(cè),圖2(b)顯示了截取ROI之后數(shù)據(jù)標(biāo)簽的分布情況,可以看到,數(shù)據(jù)標(biāo)注尺寸分步變得較為集中,有利于網(wǎng)絡(luò)進(jìn)行檢測(cè),對(duì)于此部分的實(shí)驗(yàn),在第4節(jié)中進(jìn)行說(shuō)明。
圖1 迭代檢測(cè)網(wǎng)絡(luò)架構(gòu)Fig.1 Architecture of iterative detection network
圖2 不同數(shù)字的尺寸分布統(tǒng)計(jì)Fig.2 Size distribution statistics for different numbers
為了提升對(duì)多尺度語(yǔ)義信息的提取效果,將主干網(wǎng)絡(luò)中的殘差模塊進(jìn)行了替換,換為對(duì)多尺度信息提取更好的Res2Net[14]模塊,具體結(jié)構(gòu)如圖3所示,Res2Net結(jié)構(gòu)通過(guò)對(duì)特征圖中的部分通道進(jìn)行分別卷積后累加,從而達(dá)到了更強(qiáng)的多尺度特征提取能力,同時(shí)保持了相似的計(jì)算負(fù)載。
X1~X4為Res2Net結(jié)構(gòu)中維度值為4的特征組;Y1~Y4 表示X1~ X4分別經(jīng)過(guò)不同類型的卷積計(jì)算輸出的融合特征結(jié)果圖3 Res2Net模塊Fig.3 Res2Net structure
IoU為目標(biāo)檢測(cè)中的兩個(gè)目標(biāo)框的交并比,IoU Loss為定位損失函數(shù),用于計(jì)算預(yù)測(cè)目標(biāo)框與真實(shí)目標(biāo)框之間的差距。IoU計(jì)算的是“預(yù)測(cè)的邊框”和“真實(shí)的邊框”的交集和并集的比值,計(jì)算公式為
(5)
式中:A、B為預(yù)測(cè)的邊框、真實(shí)的邊框。在計(jì)算得到IoU后,可以進(jìn)一步計(jì)算出總體的損失函數(shù)loss=1-IoU,然而這種定位損失函數(shù)也存在著兩點(diǎn)不足。
(1)當(dāng)預(yù)測(cè)框和目標(biāo)框不相交時(shí)IoU(A,B)=0此時(shí)沒(méi)有梯度,不能進(jìn)行梯度回傳,梯度下降法失效。
(2)IoU在存在相交情況下的比例大小進(jìn)行評(píng)價(jià),通過(guò)反向傳播優(yōu)化損失,對(duì)于相交方式和不相交情況下的位置關(guān)系則無(wú)法評(píng)價(jià)。GIoU[15]是對(duì)原始IoU的改進(jìn),然而也存在兩個(gè)框?qū)儆诎P(guān)系時(shí),兩個(gè)框中心點(diǎn)位置關(guān)系無(wú)法評(píng)價(jià)的缺點(diǎn)。
如圖4所示,在同樣為IoU(A,B)=0的情況下,圖4(a)兩個(gè)預(yù)測(cè)框比圖4(b)兩個(gè)預(yù)測(cè)框位置關(guān)系更近。當(dāng)IoU(A,B)=0.14時(shí),圖4(c)相比圖4(d)兩框相交的更整齊,對(duì)于回歸效果的計(jì)算更好。如圖5所示,當(dāng)綠色的目標(biāo)框和紅色的預(yù)測(cè)框是包含的位置關(guān)系,GIoU退化成IoU,無(wú)法進(jìn)行指標(biāo)衡量。
考慮到IoU和GIoU的不足之處,本文研究采用一種新型的損失評(píng)價(jià)函數(shù)DIoU作為評(píng)價(jià)指標(biāo)。由于IoU損失在候選框和真實(shí)框沒(méi)有重疊時(shí)不提供任何移動(dòng)梯度,于是DIoU引入一個(gè)懲罰項(xiàng),由于懲罰項(xiàng)的引入,在不重疊的情況下,預(yù)測(cè)框會(huì)向目標(biāo)框移動(dòng),具體公式為
圖4 IoU=0和IoU=0.14情況下兩種位置關(guān)系Fig.4 Two positional relationships in the case of IoU=0 and IoU=0.14
圖5 DIoU函數(shù)在包含情況下的評(píng)價(jià)效果Fig.5 The evaluation effect of the DIoU function in the case of inclusion
(6)
式(6)中:b、bgt為錨點(diǎn)框、目標(biāo)框的中心點(diǎn);ρ為計(jì)算兩個(gè)中心點(diǎn)間的歐式距離;c為能夠同時(shí)覆蓋錨點(diǎn)框和目標(biāo)框的最小矩形的對(duì)角線距離。
DIoU不僅關(guān)注到存在重疊的情況,還關(guān)注到非重疊的目標(biāo)框。相比IoU在沒(méi)有相交的情況下,克服了IoU梯度為0無(wú)法優(yōu)化的情況,目標(biāo)框不重疊時(shí),仍然可以為邊界框提供移動(dòng)方向。DIoU可以直接最小化框與框之間的距離,收斂速度比GIoU更快。
采集265張數(shù)字燃?xì)獗韴D像,劃分為訓(xùn)練集200張,測(cè)試集65張,主干網(wǎng)絡(luò)使用ImageNet數(shù)據(jù)集[6]進(jìn)行預(yù)訓(xùn)練,隨后在MS-COCO(microsoft common objects in context)數(shù)據(jù)集[16]上進(jìn)行整體網(wǎng)絡(luò)的預(yù)訓(xùn)練,并將得到的權(quán)重進(jìn)行遷移學(xué)習(xí),作為的初始權(quán)重。框架依托在英偉達(dá)GTX1080Ti顯卡上進(jìn)行訓(xùn)練,網(wǎng)絡(luò)1共迭代500輪,網(wǎng)絡(luò)2利用網(wǎng)絡(luò)1的權(quán)重進(jìn)行微調(diào)(finetune),訓(xùn)練輪次為300輪,訓(xùn)練過(guò)程損失函數(shù)如圖6所示。
為衡量模型性能,本文研究采用通用的目標(biāo)檢測(cè)指標(biāo)來(lái)評(píng)價(jià)模型性能優(yōu)劣,包括精確度(Precision)、召回率(Recall)、置信度在0.5的各數(shù)字平均精確度[mAP(0.5)],置信度在0.5~0.95的各數(shù)字平均精確度[mAP(0.5~0.95)],每秒浮點(diǎn)運(yùn)算次數(shù)(giga floating-point operations per second,GFLOPs)。
圖6 損失函數(shù)的變化Fig.6 Change of model loss function
Precision是模型對(duì)某一類數(shù)字正確預(yù)測(cè)數(shù)量占所有被模型判定為該類型的比值,即
(7)
Recall是模型對(duì)某一類數(shù)字正確預(yù)測(cè)數(shù)量占真實(shí)情況正例數(shù)量的比值,即
(8)
式(7)中:TP表示真正例樣本的真實(shí)類別是正例,并且模型預(yù)測(cè)的結(jié)果也是正例;TN表示真反例樣本的真實(shí)類別是負(fù)例,并且模型將其預(yù)測(cè)成為負(fù)例;FP表示假正例樣本的真實(shí)類別是負(fù)例,但是模型將其預(yù)測(cè)成為正例;FN表示假反例樣本的真實(shí)類別是正例,但是模型將其預(yù)測(cè)成為負(fù)例。
設(shè)計(jì)了3組實(shí)驗(yàn)來(lái)驗(yàn)證,首先是僅使用YOLOv5s網(wǎng)絡(luò),而不使用迭代檢測(cè)網(wǎng)絡(luò),由表1可以看出,網(wǎng)絡(luò)在經(jīng)過(guò)訓(xùn)練之后僅僅達(dá)到了12%的準(zhǔn)確率與53%的查全率,原因是目標(biāo)尺度太過(guò)于分散,導(dǎo)致網(wǎng)絡(luò)不易收斂。在進(jìn)行迭代檢測(cè)之后,可以看見(jiàn),網(wǎng)絡(luò)的準(zhǔn)確率提升到了86.9%,召回率提升到了93.7%,相較于原始網(wǎng)絡(luò)有了極大的提升。在替換Res2Net模塊之后,可以看到,網(wǎng)絡(luò)最終達(dá)到了99.62%的準(zhǔn)確率和99.55%的查全率。對(duì)于平均準(zhǔn)確率(mAP)0.5的區(qū)間上達(dá)到99.52%的置信度,GFlOPs降至12.3,能夠?qū)崿F(xiàn)在邊緣設(shè)備平臺(tái)的實(shí)時(shí)性要求。
圖7展示了在邊緣設(shè)備平臺(tái)運(yùn)行數(shù)字儀表識(shí)別方法的效果,可見(jiàn)無(wú)論在燃?xì)獗砗谏珔^(qū)域的數(shù)字還是在紅色區(qū)域的數(shù)字,包括最后一位在轉(zhuǎn)動(dòng)數(shù)字,都能準(zhǔn)確的識(shí)別出來(lái),說(shuō)明該算法在數(shù)字識(shí)別性能上具有較好的魯棒性和適用性。
圖7 燃?xì)獗碜x數(shù)識(shí)別效果圖Fig.7 Effect drawing of gas meter reading recognition
表1 三組模型網(wǎng)絡(luò)的對(duì)比實(shí)驗(yàn)Table 1 The result of three algorithms were used to detect
邊緣智能計(jì)算的想法來(lái)源于將數(shù)據(jù)在接近于數(shù)據(jù)源頭的地方進(jìn)行處理,不同于云計(jì)算將計(jì)算發(fā)生在云平臺(tái)利用超大型計(jì)算機(jī)實(shí)現(xiàn)運(yùn)算,邊緣計(jì)算在整個(gè)網(wǎng)絡(luò)的邊緣節(jié)點(diǎn)以分布式部署的硬件作為平臺(tái),實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)和處理。邊緣計(jì)算解決了對(duì)云計(jì)算過(guò)度依賴,有效解決了海量數(shù)據(jù)傳輸對(duì)網(wǎng)絡(luò)資源占用的問(wèn)題。然而邊緣計(jì)算并不能取代云計(jì)算,而是作為云計(jì)算在網(wǎng)絡(luò)終端的延伸和拓展。邊緣計(jì)算主要用在對(duì)實(shí)時(shí)性要求較高的行業(yè),云計(jì)算主要用在對(duì)可靠性準(zhǔn)確性要求較高的行業(yè),將二者結(jié)合,邊緣平臺(tái)為云平臺(tái)提供了數(shù)據(jù)采集,數(shù)據(jù)預(yù)處理等便利,同時(shí)也是硬件部署的平臺(tái),云平臺(tái)為邊緣平臺(tái)提供了大數(shù)據(jù)處理和相應(yīng)規(guī)則的建立,也可以將訓(xùn)練好的模型在邊緣平臺(tái)上部署,提高邊緣平臺(tái)的業(yè)務(wù)處理性能。如圖8所示,邊緣平臺(tái)與云平臺(tái)協(xié)作成為云邊協(xié)作平臺(tái)的組織結(jié)構(gòu)。
為進(jìn)一步在邊緣設(shè)備上進(jìn)行比照分析實(shí)驗(yàn),將在服務(wù)器上訓(xùn)練好的模型部署在邊緣計(jì)算設(shè)備NVIDIA Xavier NX上,檢測(cè)模型在邊緣平臺(tái)上的業(yè)務(wù)處理能力。Xavier NX是英偉達(dá)公司開(kāi)發(fā)的專門為人工智能平臺(tái)打造的邊緣計(jì)算設(shè)備,在10 W功率下可提供14TOPS,而在15 W功率下可提供21TOPS,非常適合在大小和功率方面受限的系統(tǒng)。Xavier NX只有一張信用卡大小,可以采用直接集成的方式,通過(guò)樹(shù)莓派與監(jiān)控?cái)z像頭建立聯(lián)系,Xavier NX系統(tǒng)結(jié)構(gòu)示意圖如圖8所示。
將算法植入邊緣計(jì)算平臺(tái)后,各算法識(shí)別準(zhǔn)確度和速度如表2所示。本文改進(jìn)的YOLOv5s算法在邊緣計(jì)算平臺(tái)上檢測(cè)速度比YOLOV4提升了52%,檢測(cè)精度略有降低,但是仍然高于YOLOv3的識(shí)別準(zhǔn)確度。YOLOv5s在參數(shù)數(shù)量上的優(yōu)勢(shì)體現(xiàn)在模型需要的內(nèi)存遠(yuǎn)小于YOLOv4和YOLOv3,下降了接近90%,相比后兩者,YOLOv5s在邊緣計(jì)算平臺(tái)上具有明顯的不占內(nèi)存容量、易部署的特點(diǎn)??偠灾?,改進(jìn)后的YOLOv5s進(jìn)一步降低了模型的參數(shù)量,在不過(guò)分犧牲精度的前提下,可以滿足工業(yè)互聯(lián)網(wǎng)對(duì)于數(shù)字顯示儀表實(shí)時(shí)性、準(zhǔn)確性的識(shí)別要求,符合商業(yè)應(yīng)用標(biāo)準(zhǔn)。接近90%,相比后兩者,YOLOv5s在邊緣計(jì)算平臺(tái)上具有明顯的不占內(nèi)存容量、易部署的特點(diǎn)。總而言之,改進(jìn)后的YOLOv5s進(jìn)一步降低了模型的參數(shù)量,在不過(guò)分犧牲精度的前提下,可以滿足工業(yè)互聯(lián)網(wǎng)對(duì)于數(shù)字顯示儀表實(shí)時(shí)性、準(zhǔn)確性的識(shí)別要求,符合商業(yè)應(yīng)用標(biāo)準(zhǔn)。
圖8 云邊協(xié)作平臺(tái)的結(jié)構(gòu)Fig.8 Structure of cloud-edge platform collaboration platform
將應(yīng)用改進(jìn)后YOLOv5s模型部署到實(shí)際的電廠無(wú)人點(diǎn)巡檢系統(tǒng)上,系統(tǒng)集合了攝像頭、樹(shù)莓派、NVIDIA Xavier NX等設(shè)備,圖9是運(yùn)行后系統(tǒng)的軟件界面。
表2 算法在邊緣平臺(tái)上的性能指標(biāo)對(duì)比Table 2 Comparison of performance indicators of algorithms on edge platforms
圖9 后臺(tái)管理平臺(tái)系統(tǒng)畫(huà)面Fig.9 System screen of background management platform
針對(duì)傳統(tǒng)巡檢依靠人力記錄儀器顯示數(shù)字的問(wèn)題,提出了一種基于YOLOv5s輕量化的目標(biāo)檢測(cè)網(wǎng)絡(luò),得出如下結(jié)論。
(1)算法改進(jìn)了CSPDarknet53網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)兩層迭代檢測(cè)網(wǎng)絡(luò),解決原圖像數(shù)據(jù)上感興趣區(qū)域占原圖比例不一樣的問(wèn)題和感興趣區(qū)域內(nèi)相同數(shù)字統(tǒng)一到相同的尺度的問(wèn)題。
(2)改進(jìn)了YOLOv5殘差模塊,用對(duì)多尺度語(yǔ)義信息提取更好的Res2Net網(wǎng)絡(luò)結(jié)構(gòu)。在燃?xì)鈨x表數(shù)據(jù)集上達(dá)到了mAP為99.52%的優(yōu)秀結(jié)果。
(3)通過(guò)在邊緣計(jì)算平臺(tái)NVIDIA Xavier NX上實(shí)際部署,實(shí)現(xiàn)了在生產(chǎn)環(huán)境中的儀表數(shù)字讀數(shù)。
本文算法改進(jìn)了傳統(tǒng)儀表盤(pán)識(shí)別算法準(zhǔn)確率較低的問(wèn)題,提高了工業(yè)現(xiàn)場(chǎng)的巡檢效率,對(duì)傳統(tǒng)行業(yè)到數(shù)字化轉(zhuǎn)型具有一定的貢獻(xiàn),并且本文算法已經(jīng)在邊緣計(jì)算平臺(tái)上的終端進(jìn)行部署,實(shí)現(xiàn)了穩(wěn)定的商業(yè)化運(yùn)行,取得了較好的實(shí)際檢測(cè)成果和經(jīng)濟(jì)效益。