張凌浩,潘文分,龐 博,吳凱軍,張 頡
(1.國(guó)網(wǎng)四川省電力公司電力科學(xué)研究院,四川 成都 610041;2.國(guó)網(wǎng)四川省電力公司涼山供電公司,四川 涼山 615000)
隨著人工智能技術(shù)的飛速發(fā)展,越來(lái)越多的行業(yè)引進(jìn)人工智能技術(shù)以解決行業(yè)中繁雜、耗時(shí)、強(qiáng)度大的工作,電力行業(yè)也不例外[1]。在電力系統(tǒng)中,輸電、變電環(huán)節(jié)發(fā)揮著重要作用。變電站巡檢、輸電線路巡檢有很多繁雜、重復(fù)的工作,線路、設(shè)備運(yùn)行維護(hù)檢修工作量大。一個(gè)基層線路班組每日的巡檢工作會(huì)產(chǎn)生上千張巡檢圖片,而在上線了通道可視化系統(tǒng)之后,國(guó)網(wǎng)四川省電力公司平均每小時(shí)就會(huì)采集到5萬(wàn)余張現(xiàn)場(chǎng)照片。這些照片如果通過(guò)人工判別將會(huì)消耗大量時(shí)間精力。因此,國(guó)網(wǎng)四川省電力公司近年來(lái)利用人工智能算法對(duì)采集數(shù)據(jù)圖像進(jìn)行設(shè)備缺陷異常智能檢測(cè),逐步實(shí)現(xiàn)輸變電的智能巡檢運(yùn)行維護(hù)。
人工智能在電力行業(yè)的應(yīng)用包括計(jì)算機(jī)視覺(jué)、語(yǔ)音處理、光學(xué)字符識(shí)別(optical character recognition,OCR)、自然語(yǔ)言處理及知識(shí)圖譜等方向。其中計(jì)算機(jī)視覺(jué)應(yīng)用主要用以實(shí)現(xiàn)圖像識(shí)別、目標(biāo)檢測(cè)和實(shí)例分割等目標(biāo)。以目標(biāo)檢測(cè)算法YOLOv3[2]為例,其核心思想是將圖像劃分成多個(gè)網(wǎng)格,若某個(gè)待檢測(cè)物體的中心落在圖像中所劃分的一個(gè)網(wǎng)格內(nèi),該網(wǎng)格負(fù)責(zé)預(yù)測(cè)該目標(biāo)位置和類(lèi)別,每個(gè)網(wǎng)格要預(yù)測(cè)多個(gè)邊界框并給出相應(yīng)概率;最后,根據(jù)概率判斷哪個(gè)邊框是物體所在完整邊框。
基于深度學(xué)習(xí)技術(shù),越來(lái)越多的智能模型應(yīng)用到電力行業(yè)實(shí)現(xiàn)基層減負(fù)、工作效率提升。文獻(xiàn)[3]采用主動(dòng)學(xué)習(xí)和半監(jiān)督自訓(xùn)練交替迭代訓(xùn)練的方式,有效提升了圖像標(biāo)注效率。文獻(xiàn)[4]基于遷移學(xué)習(xí)的思想,利用模型微調(diào)法對(duì)預(yù)訓(xùn)練模型VGG_CNN_M_1024和Faster R-CNN進(jìn)行訓(xùn)練,實(shí)現(xiàn)推土機(jī)和挖掘機(jī)造成的輸電線路外力破壞檢測(cè)。文獻(xiàn)[5]提出基于遷移學(xué)習(xí)的預(yù)訓(xùn)練方法,訓(xùn)練YOLOv3模型,實(shí)現(xiàn)在少量數(shù)據(jù)下,對(duì)防震錘與線夾檢測(cè)識(shí)別,降低模型訓(xùn)練成本,提高模型準(zhǔn)確性。文獻(xiàn)[6]提出云-端協(xié)同的變電站機(jī)器人智能巡檢新模式,以人工智能為核心技術(shù),實(shí)現(xiàn)變電站巡檢機(jī)器人實(shí)時(shí)巡檢分析。文獻(xiàn)[7]基于深度神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)變電站儀表類(lèi)型識(shí)別及表計(jì)自動(dòng)讀數(shù)。文獻(xiàn)[8]基于圖像識(shí)別技術(shù)和移動(dòng)邊緣計(jì)算技術(shù),將視頻圖像分析能力分散在邊端,快速定位輸電線路設(shè)備故障,提高運(yùn)檢效率。
近年來(lái),人工智能中臺(tái)技術(shù)被廣泛提出,提供云化人工智能平臺(tái)級(jí)解決方案。文獻(xiàn)[9]提出了一種適用于調(diào)控領(lǐng)域的人工智能平臺(tái),主要用于支撐知識(shí)圖譜和調(diào)度分析計(jì)算方面的人工智能應(yīng)用。文獻(xiàn)[10]主要解決傳統(tǒng)人工智能平臺(tái)人機(jī)交互之間的問(wèn)題。文獻(xiàn)[11]重點(diǎn)提出了一種資源調(diào)度方法。
上述技術(shù)在電力特定場(chǎng)景中的應(yīng)用具有一定成效,但仍存在以下問(wèn)題:
1)模型開(kāi)發(fā)通常和業(yè)務(wù)系統(tǒng)具有緊耦合關(guān)系,部署效率低,資源浪費(fèi)較大,且很難實(shí)現(xiàn)共建共享;
2)人工智能算法普遍需要大量樣本進(jìn)行模型訓(xùn)練,且需要大量人工進(jìn)行標(biāo)注,各單位樣本少且分散,樣本收集不方便,數(shù)據(jù)標(biāo)注困難;
3)由于模型訓(xùn)練框架與推理框架不同,不同架構(gòu)下,模型不能直接使用,需要在新框架下再開(kāi)發(fā),導(dǎo)致模型遷移不方便,造成成本浪費(fèi);
4)在實(shí)時(shí)性要求較高場(chǎng)景下,需要模型部署到邊端設(shè)備,由于邊端設(shè)備分布廣,與云端架構(gòu)差異大,將模型遷移到邊端設(shè)備上運(yùn)行時(shí),需針對(duì)每臺(tái)設(shè)備架構(gòu)進(jìn)行單獨(dú)適配,模型部署困難,導(dǎo)致模型遷移成本高。
為解決上述問(wèn)題,下面提出一套適用于電力場(chǎng)景的人工智能中臺(tái)技術(shù)架構(gòu),以容器和容器編排引擎kubernetes(K8s)為底層架構(gòu)實(shí)現(xiàn)資源靈活調(diào)度,同時(shí)包括數(shù)據(jù)回流、圖像智能標(biāo)注、模型預(yù)訓(xùn)練、模型轉(zhuǎn)換等關(guān)鍵技術(shù),提升了電力人工智能技術(shù)的易用性。首先,通過(guò)數(shù)據(jù)回流實(shí)現(xiàn)在調(diào)用模型服務(wù)預(yù)測(cè)時(shí)同步收集樣本,同時(shí)通過(guò)主動(dòng)學(xué)習(xí)方法,實(shí)現(xiàn)樣本自動(dòng)標(biāo)注;然后,考慮到電力場(chǎng)景的相似性,引入遷移學(xué)習(xí)技術(shù),對(duì)預(yù)訓(xùn)練模型進(jìn)行網(wǎng)絡(luò)參數(shù)二次優(yōu)化實(shí)現(xiàn)知識(shí)遷移;最后,通過(guò)模型轉(zhuǎn)換,實(shí)現(xiàn)云端架構(gòu)模型自動(dòng)轉(zhuǎn)換,部署至邊端設(shè)備。通過(guò)人工智能中臺(tái)技術(shù),可以降低人工智能模型開(kāi)發(fā)和適配難度,其易用性顯著提升。
人工智能應(yīng)用全流程包括樣本收集、樣本標(biāo)注、模型生產(chǎn)和推理應(yīng)用,針對(duì)引言中提到的幾個(gè)問(wèn)題,給出相應(yīng)解決辦法,總體設(shè)計(jì)框圖如圖1所示。
圖1 電力人工智能中臺(tái)技術(shù)架構(gòu)
在該架構(gòu)下,模型的開(kāi)發(fā)、訓(xùn)練、推理環(huán)境全部采用應(yīng)用容器引擎(Docker)的方式獨(dú)立運(yùn)行,其中需要圖形處理器(graphics processing unit,GPU)的環(huán)境采用Nvidia-Docker方式,使得容器內(nèi)部可以直接訪問(wèn)到底層物理GPU資源。通過(guò)虛擬化技術(shù),可以將GPU分成邏輯上的多個(gè)分片,進(jìn)一步提升了資源利用率。存儲(chǔ)資源統(tǒng)一采用GlusterFS架構(gòu)管理,GlusterFS是一種分布式文件系統(tǒng),具有強(qiáng)大的橫向擴(kuò)展能力,通常采用3副本的方式,提供數(shù)據(jù)可靠性保障。而中臺(tái)整個(gè)容器調(diào)度采用K8s架構(gòu),可以實(shí)現(xiàn)負(fù)載均衡、彈性擴(kuò)容等靈活調(diào)度和擴(kuò)展功能,使得整個(gè)人工智能中臺(tái)更加高效可靠。
樣本收集方面,通常都是在線下從不同渠道進(jìn)行收集,再上傳至人工智能中臺(tái),現(xiàn)引入數(shù)據(jù)回流的思想,實(shí)現(xiàn)樣本自動(dòng)收集。電力人工智能應(yīng)用通常以容器服務(wù)的形式部署在中臺(tái),客戶(hù)端(業(yè)務(wù)系統(tǒng)端)與云端服務(wù)之間的通信通過(guò)應(yīng)用程序接口(application programming interface,API)調(diào)用實(shí)現(xiàn)。以圖像目標(biāo)檢測(cè)為例,客戶(hù)端通過(guò)服務(wù)接口傳輸待識(shí)別的圖片和相關(guān)請(qǐng)求參數(shù),云端模型識(shí)別后輸出目標(biāo)位置、類(lèi)別、置信度等信息。考慮到樣本自動(dòng)收集,采用樣本回流的方式,模型輸出常規(guī)信息的同時(shí)輸出圖片至樣本庫(kù)中,并根據(jù)模型返回的類(lèi)別和可信度值進(jìn)行分類(lèi)保存,實(shí)現(xiàn)數(shù)據(jù)篩選、收集自動(dòng)化。
數(shù)據(jù)標(biāo)注方面,基于已標(biāo)注信息,可以通過(guò)人工智能(artificial intelligence,AI)模型對(duì)數(shù)據(jù)進(jìn)行智能標(biāo)注,標(biāo)注人員在此基礎(chǔ)上進(jìn)行審核糾正。采用目標(biāo)檢測(cè)模型對(duì)圖像進(jìn)行物體檢測(cè),并將結(jié)果輸出為標(biāo)注文件,實(shí)現(xiàn)樣本自動(dòng)標(biāo)注;同時(shí),引入主動(dòng)學(xué)習(xí)方法,優(yōu)先挑選出標(biāo)注較難或比較有代表性的圖像進(jìn)行標(biāo)注展示,若不符合預(yù)期,則將無(wú)法識(shí)別的圖片進(jìn)行人工修正,繼續(xù)訓(xùn)練標(biāo)注模型,直到標(biāo)注達(dá)到預(yù)期,再將模型用于全局化標(biāo)注。
模型訓(xùn)練方面,針對(duì)某些實(shí)際場(chǎng)景樣本數(shù)據(jù)較少、模型訓(xùn)練效果不好的情況,引入遷移學(xué)習(xí)的思想,將其他相近任務(wù)的已有模型作為預(yù)訓(xùn)練模型,使用預(yù)訓(xùn)練模型權(quán)重參數(shù)并使用微調(diào)法進(jìn)行訓(xùn)練,在目標(biāo)數(shù)據(jù)量少的情況下也能得到很好的效果。
模型推理方面,對(duì)于硬件架構(gòu)、模型框架不同導(dǎo)致模型無(wú)法運(yùn)行的情況,基于開(kāi)放神經(jīng)網(wǎng)絡(luò)交換(open neural network exchange,ONNX)格式將模型轉(zhuǎn)換為適配邊端設(shè)備的模型再進(jìn)行下發(fā),提高模型部署智能化水平,減少模型部署時(shí)間,提升模型的適配性。
樣本質(zhì)量往往影響訓(xùn)練模型的效果,選取一部分最有價(jià)值的樣本數(shù)據(jù)進(jìn)行標(biāo)注、訓(xùn)練,得到同樣效果甚至更好的模型是熱點(diǎn)方法。其核心任務(wù)是篩選出最具有代表性的樣本,主動(dòng)學(xué)習(xí)正好可以實(shí)現(xiàn)這一任務(wù)。主動(dòng)學(xué)習(xí)[12]是機(jī)器學(xué)習(xí)的一個(gè)分支,其思想是從未標(biāo)注樣本中選擇對(duì)模型有價(jià)值的數(shù)據(jù)從而提高模型效果?;跀?shù)據(jù)池的主動(dòng)學(xué)習(xí)可以通過(guò)使用盡可能少的標(biāo)注樣本,訓(xùn)練出較好的分類(lèi)器模型,實(shí)現(xiàn)大量未標(biāo)注樣本的自動(dòng)標(biāo)注。
基于數(shù)據(jù)池的主動(dòng)學(xué)習(xí)循環(huán)如圖2所示,其過(guò)程大致是:標(biāo)注少量數(shù)據(jù)進(jìn)行模型訓(xùn)練;再?gòu)拇罅课礃?biāo)注樣本池中篩選出關(guān)鍵圖片數(shù)據(jù),提交標(biāo)注請(qǐng)求,由標(biāo)注人員進(jìn)行人工標(biāo)注;再將新標(biāo)注的樣本加入訓(xùn)練集,重新訓(xùn)練模型;依次迭代循環(huán)。
圖2 基于池的主動(dòng)學(xué)習(xí)循環(huán)
主動(dòng)學(xué)習(xí)是通過(guò)查詢(xún)函數(shù)選擇出最有用的樣本,查詢(xún)函數(shù)常用策略是不確定性準(zhǔn)則和差異性準(zhǔn)則[13]。不確定性策略就是找出不確定性高的樣本。不確定性越高的樣本,包含的信息量越豐富,對(duì)模型訓(xùn)練越有用。差異性指的是選擇樣本之間應(yīng)有差異,避免選擇樣本信息重復(fù),有效避免數(shù)據(jù)冗余。部分主動(dòng)學(xué)習(xí)查詢(xún)函數(shù)是基于信息熵進(jìn)行設(shè)計(jì)。
數(shù)據(jù)標(biāo)注是對(duì)原始數(shù)據(jù)打標(biāo)簽,輸送到人工智能模型進(jìn)行訓(xùn)練學(xué)習(xí)。而模型訓(xùn)練數(shù)據(jù)越多,模型準(zhǔn)確率越高,由此,大量訓(xùn)練數(shù)據(jù)使數(shù)據(jù)標(biāo)注的工作量變大。數(shù)據(jù)標(biāo)注通常是專(zhuān)業(yè)標(biāo)注人員借助標(biāo)注工具進(jìn)行手工標(biāo)注,重復(fù)地拉框、標(biāo)點(diǎn),標(biāo)注強(qiáng)度大,整體標(biāo)注效率底下。隨著人工智能技術(shù)的發(fā)展,數(shù)據(jù)標(biāo)注朝著自動(dòng)標(biāo)注方向發(fā)展,目前數(shù)據(jù)標(biāo)注還不能實(shí)現(xiàn)完全自動(dòng)化,但可以在機(jī)器標(biāo)注+人工標(biāo)注的前提下,盡量減少人工,將機(jī)器標(biāo)注比例逐步提升。這里采用一種基于主動(dòng)學(xué)習(xí)的智能標(biāo)注方法,實(shí)現(xiàn)數(shù)據(jù)標(biāo)注半自動(dòng)化,提升標(biāo)注速率和標(biāo)注質(zhì)量。
下面主要研究目標(biāo)檢測(cè)中的圖像標(biāo)注,結(jié)合主動(dòng)學(xué)習(xí)的思想,實(shí)現(xiàn)圖像智能標(biāo)注,實(shí)現(xiàn)流程如圖3所示。該方法中,工作人員不再需要從頭開(kāi)始標(biāo)注,只需要判斷標(biāo)注是否正確并進(jìn)行調(diào)整,極大地降低人力成本并使標(biāo)注速度大幅提升。智能標(biāo)注算法步驟如下:
圖3 基于主動(dòng)學(xué)習(xí)的智能標(biāo)注流程
1)數(shù)據(jù)準(zhǔn)備:從待標(biāo)注樣本中隨機(jī)挑選不低于50張照片進(jìn)行手動(dòng)標(biāo)注。
2)模型訓(xùn)練:采用基于電力場(chǎng)景下預(yù)訓(xùn)練目標(biāo)檢測(cè)模型YOLOv3作為預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練。
3)難例篩選:基于主動(dòng)學(xué)習(xí),從未標(biāo)注樣本中篩選出最具價(jià)值性的難例樣本進(jìn)行標(biāo)注,將標(biāo)注結(jié)果輸出成標(biāo)注文件。
4)難例確認(rèn):人工審核模型標(biāo)注照片,若不滿足標(biāo)注要求,人工修正標(biāo)注,將新標(biāo)注數(shù)據(jù)加入到訓(xùn)練數(shù)據(jù),重復(fù)循環(huán)步驟2至步驟4,直到滿足要求;若滿足標(biāo)注要求,即啟動(dòng)模型標(biāo)注剩余所有照片。
遷移學(xué)習(xí)是將一任務(wù)中獲得的知識(shí)應(yīng)用到另一目標(biāo)任務(wù)中[14],其定義如下:
域(Domain):D={χ,P(X)},式中χ為特征空間,P(X)為邊緣概率分布。
任務(wù)(Task):T={y,f(·)},式中y為標(biāo)簽空間,f(·)為目標(biāo)函數(shù)。
遷移學(xué)習(xí)(transfer learning):給定一個(gè)源域DS和學(xué)習(xí)任務(wù)TS,一個(gè)目標(biāo)域DT和學(xué)習(xí)任務(wù)TT,遷移學(xué)習(xí)利用DS和TS中的知識(shí)來(lái)幫助學(xué)習(xí)在目標(biāo)域DT的目標(biāo)函數(shù)fT(·),其中DS不等于DT,TS不等于TT。
傳統(tǒng)的機(jī)器學(xué)習(xí)通常是從零開(kāi)始學(xué)習(xí)每一個(gè)任務(wù),從遷移學(xué)習(xí)流程(見(jiàn)圖4)可以看出,遷移學(xué)習(xí)是在以前任務(wù)的基礎(chǔ)上,將以前的一些任務(wù)中的知識(shí)轉(zhuǎn)移到目標(biāo)任務(wù)中。
圖4 遷移學(xué)習(xí)流程
以圖像識(shí)別中卷積神經(jīng)網(wǎng)絡(luò)為例,深度神經(jīng)網(wǎng)絡(luò)前幾層是提取線條、輪廓等通用特征,對(duì)該網(wǎng)絡(luò)的前幾層進(jìn)行遷移,可以減少深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間。遷移學(xué)習(xí)在深度學(xué)習(xí)中通常有2類(lèi)用法:1)凍結(jié)與訓(xùn)練,將相近任務(wù)模型的大部分參數(shù)直接應(yīng)用到新任務(wù)訓(xùn)練中,重新訓(xùn)練部分網(wǎng)絡(luò)層。以神經(jīng)網(wǎng)絡(luò)為例,凍結(jié)提取特征的卷積層網(wǎng)絡(luò),僅對(duì)全連接層進(jìn)行訓(xùn)練。2)微調(diào),將原始訓(xùn)練模型的權(quán)重參數(shù)作為初始值,在目標(biāo)數(shù)據(jù)集中訓(xùn)練所有層,通過(guò)固定N-1層的參數(shù),對(duì)剩下一層進(jìn)行訓(xùn)練,實(shí)現(xiàn)參數(shù)微調(diào)[15-16]。
在機(jī)器學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)量較少時(shí),訓(xùn)練模型效果不好,且訓(xùn)練過(guò)程需要大量時(shí)間完成模型參數(shù)調(diào)整選出最優(yōu)參數(shù),訓(xùn)練時(shí)間長(zhǎng)。當(dāng)無(wú)法收集到大量高質(zhì)量數(shù)據(jù)時(shí),可以結(jié)合遷移學(xué)習(xí)的思想,采用微調(diào)法進(jìn)行預(yù)置模型訓(xùn)練,進(jìn)一步地可以通過(guò)域?qū)咕W(wǎng)絡(luò)(domain-adversarial neural network,DANN)[17],提升遷移學(xué)習(xí)效果。如圖5所示,基于DANN的遷移學(xué)習(xí)訓(xùn)練將網(wǎng)絡(luò)模型分為特診提取、領(lǐng)域分類(lèi)和標(biāo)簽分類(lèi)3個(gè)部分,共同訓(xùn)練,優(yōu)化遷移學(xué)習(xí)的效果。
圖5 基于DANN的遷移學(xué)習(xí)訓(xùn)練
由于在電力應(yīng)用中,部分場(chǎng)景具有一定的相似性,可將遷移學(xué)習(xí)技術(shù)應(yīng)用于輸電線路的輸電通道可視化模型,應(yīng)用于變電站隔離開(kāi)關(guān)、儀表等設(shè)備狀態(tài)識(shí)別的變電站儀表開(kāi)關(guān)識(shí)別模型,以及應(yīng)用于生產(chǎn)環(huán)境人員穿戴、行為的安全生產(chǎn)監(jiān)控模型。基于輸電、變電、安監(jiān)三大典型電力場(chǎng)景,所開(kāi)發(fā)的人工智能訓(xùn)練和推理平臺(tái)已實(shí)現(xiàn)了三大場(chǎng)景10類(lèi)預(yù)訓(xùn)練模型,采用了SSD-MobileNetV1、YOLOv3-MobileNetV1、YOLOv3-DarkNet、Faster R-CNN-ResNet50vd-FPN等網(wǎng)絡(luò)模型,將不同單位收集到的缺陷樣本進(jìn)行二次調(diào)優(yōu)訓(xùn)練,得到針對(duì)不同生產(chǎn)環(huán)境下的輸變電設(shè)備缺陷異常檢測(cè)和現(xiàn)場(chǎng)作業(yè)安全行為分析模型,基準(zhǔn)模型識(shí)別率在70%~90%之間。
對(duì)于實(shí)時(shí)性要求較高的業(yè)務(wù)場(chǎng)景,通常優(yōu)先選擇邊緣計(jì)算的方式,在邊端側(cè)安裝智能終端設(shè)備,部署人工智能模型進(jìn)行就地及時(shí)處理。盡管目前在云端訓(xùn)練模型、部署服務(wù)、運(yùn)行已經(jīng)比較成熟,但云端的X86架構(gòu)和邊端以ARM為主的各類(lèi)異構(gòu)芯片架構(gòu)的差異,使得模型遷移仍然需要考慮硬件兼容、能耗與性能等問(wèn)題,仍有很多困難。
由于模型訓(xùn)練過(guò)程和推理服務(wù)側(cè)重點(diǎn)不同,大部分主流訓(xùn)練框架和推理框架也有所不同,為此,實(shí)現(xiàn)模型在不同框架之間的轉(zhuǎn)換,是避免模型重復(fù)開(kāi)發(fā)、浪費(fèi)資源較好的辦法。目前主流模型轉(zhuǎn)換技術(shù)是ONNX技術(shù),是針對(duì)深度學(xué)習(xí)設(shè)計(jì)的一種開(kāi)放式的文件規(guī)范,主流深度學(xué)習(xí)框架都支持這種規(guī)范標(biāo)準(zhǔn)。而ONNX是一種針對(duì)機(jī)器學(xué)習(xí)所設(shè)計(jì)的開(kāi)放式的文件格式,用于存儲(chǔ)訓(xùn)練好的模型,ONNX使得不同的人工智能框架可以采用相同格式存儲(chǔ)模型數(shù)據(jù)并交互,使模型在不同框架之間進(jìn)行轉(zhuǎn)換。
模型轉(zhuǎn)換實(shí)現(xiàn)過(guò)程如下:
1)計(jì)算圖生成:在模型推理過(guò)程中,框架會(huì)記錄執(zhí)行算子的類(lèi)型、輸入輸出、超參數(shù)、參數(shù)等算子信息;最后,把算子節(jié)點(diǎn)信息和模型信息結(jié)合得到符合ONNX 標(biāo)準(zhǔn)的靜態(tài)計(jì)算圖。
2) 計(jì)算圖轉(zhuǎn)換:解析靜態(tài)計(jì)算圖,根據(jù)計(jì)算圖和目標(biāo)格式的定義,轉(zhuǎn)換出目標(biāo)框架模型。
結(jié)合云邊協(xié)同的理念,在邊緣側(cè)部署AI模型,實(shí)現(xiàn)人工智能在電力場(chǎng)景中的邊緣智能應(yīng)用。邊緣計(jì)算需要在邊緣端部署邊緣物理代理及模型。由于邊端設(shè)備各式各樣,這里采用容器化、模塊化的方式,部署邊緣本地運(yùn)行包,賦能邊緣計(jì)算節(jié)點(diǎn),讓本地設(shè)備具備本地計(jì)算、AI推斷等能力。同時(shí),采用ONNX技術(shù),生成適配邊端設(shè)備的計(jì)算模型,已支持X86、ARM等多種硬件以及Linux、MacOS和Windows等各類(lèi)操作系統(tǒng)。智能邊緣實(shí)現(xiàn)流程如圖6所示,圖6(a)是云端模型與邊端設(shè)備架構(gòu)相同時(shí)的流程;圖6(b)是與云端模型不適配的邊端設(shè)備,需要先進(jìn)行模型轉(zhuǎn)換的流程。
圖6 智能邊緣實(shí)現(xiàn)流程
傳統(tǒng)云邊協(xié)同下發(fā)模型推理到邊緣設(shè)備,以容器形式下發(fā),占用帶寬,且不同處理器架構(gòu)下容器不能通用。對(duì)此,使用ONNX進(jìn)行模型轉(zhuǎn)換,將模型轉(zhuǎn)換為適配邊端設(shè)備的模型,再將模型文件下發(fā)至邊端設(shè)備,在邊端采用Docker+K3s的方式部署模型,提升模型資源管控能力。
基于以上提出的技術(shù),開(kāi)發(fā)了統(tǒng)一開(kāi)放的四川電力人工智能中臺(tái),中臺(tái)架構(gòu)如圖7所示,包括兩庫(kù)(“樣本庫(kù)”和“模型庫(kù)”)、一平臺(tái)(人工智能訓(xùn)練和推理平臺(tái))。中臺(tái)在硬件上由13臺(tái)服務(wù)器組成,配置56張Nvidia T4 GPU加速卡,采用Docker+K8s的方式實(shí)現(xiàn)資源調(diào)度,內(nèi)置深度學(xué)習(xí)和機(jī)器學(xué)習(xí)預(yù)訓(xùn)練模型,為模型生產(chǎn)提供便利。中臺(tái)上人工智能模型以容器方式提供在線服務(wù),通過(guò)規(guī)范化的服務(wù)接口,可以方便各業(yè)務(wù)系統(tǒng)直接進(jìn)行集成調(diào)用,且通過(guò)數(shù)據(jù)回流技術(shù)實(shí)現(xiàn)了在進(jìn)行預(yù)測(cè)服務(wù)的同時(shí),在線收集到各類(lèi)樣本。中臺(tái)搭建了服務(wù)門(mén)戶(hù)頁(yè)面,對(duì)目前已上線AI算法模型的調(diào)用接口、功能描述進(jìn)行展示和試用。
圖7 人工智能中臺(tái)應(yīng)用架構(gòu)
目前,人工智能中臺(tái)已收集典型電力缺陷樣本6.5萬(wàn)張;基于智能標(biāo)注算法,完成4萬(wàn)張樣本標(biāo)注;采用預(yù)訓(xùn)練模型,開(kāi)發(fā)部署輸、變電場(chǎng)景中設(shè)備異常缺陷識(shí)別、現(xiàn)場(chǎng)作業(yè)安全行為分析、文字識(shí)別算法模型共119個(gè),并投入生產(chǎn)一線使用。截至2021年年底算法模型累積服務(wù)次數(shù)超過(guò)100萬(wàn)次,主要應(yīng)用成效如下:
1)助力現(xiàn)場(chǎng)安全作業(yè)管控。開(kāi)發(fā)現(xiàn)場(chǎng)作業(yè)60余種違章算法模型,在140個(gè)基層班組進(jìn)行試運(yùn)行,識(shí)別正確率達(dá)到 90% ,截至2021年年底,累計(jì)輔助完成管控各類(lèi)作業(yè)場(chǎng)所共計(jì)3806場(chǎng),涉及作業(yè)人員17 593人次,分析視頻共計(jì)214 000 h,成功發(fā)現(xiàn)違章2797次,作業(yè)現(xiàn)場(chǎng)違章率下降91.58%。
2)實(shí)現(xiàn)森林火災(zāi)監(jiān)測(cè)預(yù)警。輸電線路森林防火面臨點(diǎn)多線長(zhǎng)面廣特點(diǎn),一線班組人員巡視壓力巨大,國(guó)網(wǎng)四川省電力公司在220 kV周格一線、永理二線、山越二線等13條森林火災(zāi)易發(fā)線路部署887個(gè)攝像頭,開(kāi)發(fā)山火、煙霧檢測(cè)模型,對(duì)采集圖像進(jìn)行山火智能識(shí)別,算法模型已提供算法服務(wù)413 965次,成功預(yù)警山火137次,有效提升森林草原防山火工作效率。
3)實(shí)現(xiàn)了對(duì)智能運(yùn)檢管控平臺(tái)(無(wú)人機(jī)管控平臺(tái))的全面智能服務(wù)。國(guó)網(wǎng)四川省電力公司絕大部分輸電線路處于山區(qū)、無(wú)人區(qū),一線班組人員巡線壓力巨大。依據(jù)預(yù)訓(xùn)練模型開(kāi)發(fā)部署鳥(niǎo)巢、異物、絕緣子、均壓環(huán)異常檢測(cè)等75個(gè)算法模型,采用云邊協(xié)同方式和模型轉(zhuǎn)換技術(shù),將模型下發(fā)至邊緣物聯(lián)代理,提高圖像識(shí)別實(shí)時(shí)性,累計(jì)收集輸電線路缺陷樣本11 838張,算法模型累計(jì)服務(wù)超過(guò)12 275次,巡檢效率提升超過(guò)2倍。
4)提升變電站巡檢質(zhì)效。國(guó)網(wǎng)四川省電力公司在110 kV峨山變電站開(kāi)展變電站智能巡檢試點(diǎn),開(kāi)發(fā)部署表計(jì)讀數(shù)、油溫油位、壓板投退、絕緣子、呼吸器等90類(lèi)圖像識(shí)別算法模型,對(duì)變電站內(nèi)各類(lèi)設(shè)備的狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)控,及時(shí)預(yù)警,缺陷診斷預(yù)警準(zhǔn)確率達(dá)到90%,減少人工巡視的80%工作量。
5)提升智能審計(jì)效率。國(guó)網(wǎng)四川省電力公司利用電力人工智能平臺(tái)開(kāi)發(fā)部署的OCR模型,將傳統(tǒng)人工費(fèi)結(jié)算紙質(zhì)材料快速轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)條目,對(duì)人員的出勤記錄和結(jié)算數(shù)據(jù)進(jìn)行智能識(shí)別與比對(duì)。截至目前,已實(shí)現(xiàn)對(duì)208個(gè)勞務(wù)分包項(xiàng)目、2 248.79萬(wàn)元民工費(fèi)的稽核,共挽回經(jīng)濟(jì)損失20余萬(wàn)元,審計(jì)覆蓋面由之前的20%提升至50%,抽樣比例由之前的30%提升至90%,現(xiàn)場(chǎng)審計(jì)時(shí)間壓縮近50%。
上面主要針對(duì)人工智能在電力企業(yè)所面臨的樣本收集、標(biāo)注困難、訓(xùn)練樣本少、模型邊緣部署困難等問(wèn)題,建設(shè)了集樣本收集和標(biāo)注、模型訓(xùn)練、模型轉(zhuǎn)換、云邊協(xié)同等為一體的統(tǒng)一開(kāi)放平臺(tái),清掃電力行業(yè)中人工智能應(yīng)用的阻礙,助力人工智能在電力行業(yè)廣泛化、自動(dòng)化應(yīng)用。