國網(wǎng)江蘇省電力有限公司南通供電分公司 仲 偉 邵建新
隨著自動化技術(shù)和智能化技術(shù)的快速發(fā)展和廣泛應(yīng)用,變電站的數(shù)量以及規(guī)模日益增多,同時變電站機(jī)器人巡檢的任務(wù)測點(diǎn)量更是數(shù)以萬計(jì)。傳統(tǒng)的變電站在導(dǎo)入機(jī)器人操作票任務(wù)時,需工作人員在上千個測點(diǎn)任務(wù)中逐個選擇,這樣不僅要求工作人員擁有很高的操作熟練度且耗時嚴(yán)重,很易出現(xiàn)錯導(dǎo)入和誤導(dǎo)入情況,因此研究操作票復(fù)核系統(tǒng)很有必要。
在電網(wǎng)系統(tǒng)操作票自動生成方面,大多研究集中在利用電網(wǎng)調(diào)控中心提供的電網(wǎng)公共信息模型(CIM),分析CIM 中的設(shè)備模型和拓?fù)溥B接關(guān)系,按照一定的布局、布線算法自動生成一次設(shè)備接線圖。文獻(xiàn)[1]研究了基于CIM 數(shù)據(jù)和可伸縮矢量圖形格式的配電單線圖自動構(gòu)圖;文獻(xiàn)[2]介紹了節(jié)點(diǎn)布局問題的數(shù)學(xué)模型并應(yīng)用罰函數(shù)法進(jìn)行求解;文獻(xiàn)[3]采用蟻群算法,實(shí)現(xiàn)了電網(wǎng)自動布局。目前大多數(shù)研究的重點(diǎn)偏向于電網(wǎng)操作票的自動生成,此類研究的前提是調(diào)控中心提供的CIM 包含了應(yīng)用所需的元件模型和連接關(guān)系,針對操作票的多樣性和易變性略顯不足。
目前在變電站操作票識別和任務(wù)導(dǎo)入領(lǐng)域的研究少之又少,另外變電站機(jī)器人巡檢對操作票的正確性要求尤為嚴(yán)格,本文設(shè)計(jì)了一種新型的變電站操作票復(fù)核系統(tǒng),服務(wù)器平臺采用圖像識別技術(shù)對高拍儀采集的操作票實(shí)時視頻進(jìn)行文字識別、內(nèi)容分析和關(guān)鍵字提取,并將提取后的文字進(jìn)行生成巡檢任務(wù)列表,并導(dǎo)入機(jī)器人巡檢任務(wù)中。整個過程工作人員只需將操作票放置高拍儀下,在服務(wù)器平臺側(cè)點(diǎn)擊圖像識別、生成列表、任務(wù)執(zhí)行即可,避免了操作票誤導(dǎo)入和錯導(dǎo)入的情況,為變電站機(jī)器人測點(diǎn)巡檢節(jié)約了大量時間。
近年來人工智能識別技術(shù)已取得較大進(jìn)展,尤其是在圖像識別和分析技術(shù)上更是明顯。巡檢變電站操作票復(fù)核系統(tǒng)由應(yīng)用層、服務(wù)器、物理層組成,其中所有算法流程都是在服務(wù)器平臺操作。物理層采集模塊由高拍儀和網(wǎng)線組成,負(fù)責(zé)實(shí)時拍攝操作票視頻,并通過網(wǎng)線將實(shí)時視頻上傳到服務(wù)器。服務(wù)器模塊包括圖像識別與分析、關(guān)鍵字提取、生成任務(wù)列表、執(zhí)行任務(wù),主要負(fù)責(zé)對上傳視頻進(jìn)行分析和處理,處理后的數(shù)據(jù)會導(dǎo)入到機(jī)器人巡檢任務(wù)中,工作人員只需在服務(wù)器平臺側(cè)點(diǎn)擊執(zhí)行任務(wù)即可控制機(jī)器人進(jìn)行巡檢任務(wù)。物理層主要是采集模塊。
圖1 巡檢變電站操作票復(fù)核系統(tǒng)框圖
圖像特征包括顏色特征、紋理特征、形狀特征以及局部特征點(diǎn)等。圖像特征提取是圖像分析與圖像識別的前提,是將高維的圖像數(shù)據(jù)進(jìn)行簡化表達(dá)最有效的方式。2004年Lowe 提出高效的尺度不變特征變換算法(SIFT),利用原始圖像與高斯核的卷積來建立尺度空間,并在高斯差分空間金字塔上提取出尺度不變性的特征點(diǎn)[4]。該算法具有一定的仿射不變性、視角不變性、旋轉(zhuǎn)不變性和光照不變性,所以在圖像特征提高方面得到了最廣泛的應(yīng)用。服務(wù)器可根據(jù)SIFT 和操作票顏色特征,將操作票實(shí)時視頻中的文字全部提取出來,并生成操作票文本。
圖像識別與分析算法為關(guān)鍵字提取提供操作票文本,其步驟依次為:初始化網(wǎng)絡(luò),為網(wǎng)線傳輸操作票實(shí)時視頻提供可用接口;打開實(shí)時視頻錄像;判斷視頻縮放尺寸是否等于原始操作票縮放尺寸,若相等則輸出操作票固有特征尺寸;判斷操作票字體顏色特征是否為黑色,若為黑色則輸出操作票模板;操作票模板識別并輸出操作票上的文字;生成操作票文本;判斷文本的字體并更新文本。
無論是對于長文本還是短文本,往往可通過幾個關(guān)鍵詞窺探整個文本的主題思想。關(guān)鍵詞提取的準(zhǔn)確程度直接關(guān)系到推薦系統(tǒng)或者搜索系統(tǒng)的最終效果。基于統(tǒng)計(jì)特征的關(guān)鍵詞抽取算法[5]的思想是利用文檔中詞語的統(tǒng)計(jì)信息抽取文檔的關(guān)鍵詞。通常將文本經(jīng)過預(yù)處理得到候選詞語的集合,然后采用特征值量化算法的方式從候選集合中得到關(guān)鍵詞。詞權(quán)重的特征量化主要包括詞性、詞頻、逆向文檔頻率、相對詞頻、詞長等。關(guān)鍵字提取流程為:操作票文本(預(yù)處理)-候選詞(算法)-候選詞權(quán)重計(jì)算(抽取)-關(guān)鍵字。
特征值量化算法為生成列表提供關(guān)鍵字,其提取關(guān)鍵字的具體實(shí)現(xiàn)為:識別文本;根據(jù)詞性、位置、頻率、詞長對文本預(yù)處理,并生成候選詞;根據(jù)詞權(quán)重的特征量化的特點(diǎn)從候選詞集合抽取所需關(guān)鍵字;生成關(guān)鍵字列表。
LDA 主題模型采用了詞袋模型的方法簡化了問題的復(fù)雜性。在LDA 主題模型中,每一篇文檔是一些主題的構(gòu)成的概率分布,而每一個主題又是很多單詞構(gòu)成的一個概率分布。同時,無論是主題構(gòu)成的概率分布還是單詞構(gòu)成的概率分布也不是一定的,這些分布也服從狄利克雷先驗(yàn)分布(Dirichlet)。操作票復(fù)核系統(tǒng)的關(guān)鍵在于巡檢任務(wù)列表的生成,任務(wù)列表中的關(guān)鍵字也服從狄利克雷先驗(yàn)分布。巡檢任務(wù)列表為機(jī)器人執(zhí)行任務(wù)提供指令依據(jù),其生成的具體實(shí)現(xiàn)為:初始化任務(wù)列表;設(shè)定狄利克雷分布規(guī)則,對關(guān)鍵字進(jìn)行分類和排序等操作;生成新的巡檢任務(wù)列表;導(dǎo)入列表指令到機(jī)器人巡檢任務(wù)中。
根據(jù)上述算法生成的巡檢任務(wù)指令會導(dǎo)入到機(jī)器人巡檢任務(wù)中,工作人員只需將要操作票放置于高拍儀下,在服務(wù)器平臺側(cè)點(diǎn)擊圖像識別與分析、提取關(guān)鍵字、生成列表和執(zhí)行任務(wù)即可,巡檢機(jī)器人便會按照任務(wù)列表上的內(nèi)容進(jìn)行巡檢作業(yè)。
基于尺度不變特征變換算法、統(tǒng)計(jì)特征的關(guān)鍵詞抽取算法和LDA 主題模型思想,采用Eclipse、Oracle9i 和Python 數(shù)據(jù)開發(fā)和處理實(shí)現(xiàn)了變電站操作票復(fù)核系統(tǒng)。下面通過實(shí)驗(yàn)來驗(yàn)證此系統(tǒng)。
為評估操作票復(fù)核系統(tǒng)的性能,采用8臺服務(wù)器,安裝QUnit 軟件模擬真實(shí)運(yùn)行環(huán)境,同時使用了均方根誤差(RMSE)作為評估指標(biāo),其定義如下:
其中fi為算法實(shí)際運(yùn)行次數(shù),為實(shí)際成功次數(shù),根據(jù)公式可知,計(jì)算的RMSE 值越小性能越優(yōu)。1~8服務(wù)器性能評估測試的實(shí)測次數(shù)、成功次數(shù)、均方根誤差為:1000/996/0.065%、2000/1996/0.063%、3000/2994/0.061%、5000/4992/0.059%、8000/7988/0.057%、10000/9988/0.053%、15000/14956/0.052%、20000/19920/0.051%。隨著實(shí)測次數(shù)的遞增成功次數(shù)遞增,同時成功次數(shù)所占比也遞增,其均方根誤差也趨向于穩(wěn)定,性能越優(yōu)。
一個大型的變電站具有上千個任務(wù)測點(diǎn),在人工導(dǎo)入操作票時經(jīng)常會遇到難以尋找對應(yīng)測點(diǎn)、錯導(dǎo)入和誤導(dǎo)入的問題,而操作票復(fù)核系統(tǒng)可通過服務(wù)器的多種算法對應(yīng)巡檢測點(diǎn),在時間和準(zhǔn)確性上具有明顯優(yōu)勢。該系統(tǒng)在某變電站實(shí)際運(yùn)用中的操作票任務(wù)數(shù)量(個)、人工耗時(秒)、系統(tǒng)耗時(秒)分別為:5/100/32、10/300/36、15/600/39、20/900/41、25/1100/42、30/1500/42、35/1900/45、40/2400/45。隨著操作票任務(wù)數(shù)量的增加,人工耗時的明顯增加,系統(tǒng)耗時較為穩(wěn)定。人工耗時與系統(tǒng)耗時的差距更是明顯。
綜上,隨著人工智能與現(xiàn)代生活的關(guān)聯(lián)愈加密切,人工智能在生活中的應(yīng)用將會愈加廣泛。導(dǎo)入操作票損耗的時間對變電站來說十分寶貴,損耗的時間越多,變電站巡檢的時間便越少,許多電廠出現(xiàn)意外都是缺乏足夠的巡檢時間而導(dǎo)致的,本文提出了一種變電站操作票復(fù)核系統(tǒng),服務(wù)器平臺采用圖像識別技術(shù)對高拍儀采集的操作票實(shí)時視頻進(jìn)行文字識別、內(nèi)容分析和關(guān)鍵字提取,服務(wù)器將提取后的文字進(jìn)行生成巡檢任務(wù)列表,并導(dǎo)入機(jī)器人巡檢任務(wù)中。整個過程工作人員只需將操作票放置于高拍儀下,在服務(wù)器平臺側(cè)點(diǎn)擊圖像識別與任務(wù)執(zhí)行即可,為變電站巡檢機(jī)器人測點(diǎn)任務(wù)導(dǎo)入節(jié)約了大量時間。