李 驍,趙 曦,王者龍,任大為
(國網(wǎng)山東省電力公司電力科學(xué)研究院,山東濟(jì)南 250002)
電能在多種行業(yè)中發(fā)揮著至關(guān)重要的作用,這使得電能計(jì)量器具的需求量與日俱增[1]。由于電能計(jì)量器具種類繁多、規(guī)格多樣、型號不一,如何對各種電能器具信息進(jìn)行管理,成為當(dāng)前熱議的話題[2-3]。在現(xiàn)有技術(shù)中,庫房管理大多采用人工管理,自動(dòng)化程度較差,需要的人工勞動(dòng)較多。隨著電能計(jì)量技術(shù)的飛速發(fā)展,電能計(jì)量庫房管理系統(tǒng)逐步向自動(dòng)化、智能化的方向發(fā)展,電能計(jì)量數(shù)據(jù)的管理也逐步脫離人工作業(yè),電能計(jì)量器具檢定流水線逐步形成規(guī)模,而面向電能計(jì)量器具檢定流水線的庫房管理能力滯后。
文獻(xiàn)[4]設(shè)計(jì)了試驗(yàn)器材庫房管理系統(tǒng),該技術(shù)通過C#語言和SQL Server 開發(fā)了Windows 平臺,通過C/S 架構(gòu)實(shí)現(xiàn)了試驗(yàn)器材庫房管理系統(tǒng),但缺乏底層設(shè)備數(shù)據(jù)的自動(dòng)化采集和傳輸,在大量數(shù)據(jù)面前顯得無能為力。文獻(xiàn)[5]設(shè)計(jì)了新型的智能化倉儲系統(tǒng),該系統(tǒng)在國網(wǎng)湖南計(jì)量中心得到較好的應(yīng)用,但是該方法僅僅對智能化倉儲系統(tǒng)布局方式進(jìn)行簡單的介紹,對于大量電能計(jì)量數(shù)據(jù)資產(chǎn)的智能化、高效管理仍顯得滯后。
針對上述技術(shù)的不足,文中通過計(jì)算機(jī)管理系統(tǒng)將電氣控制系統(tǒng)、物流倉儲設(shè)備智能地結(jié)合在一起,實(shí)現(xiàn)物流管理高效化、貨物存取自動(dòng)化的倉儲系統(tǒng),采用先進(jìn)的大數(shù)據(jù)管理平臺,實(shí)現(xiàn)數(shù)據(jù)的快速處理。文中還結(jié)合RFID 射頻識別技術(shù)、工業(yè)條碼識別技術(shù),實(shí)現(xiàn)了電能計(jì)量器具庫房管理過程中的可靠信息識別與數(shù)據(jù)交換。倉儲系統(tǒng)通過與其他物聯(lián)網(wǎng)設(shè)備直接連接,實(shí)現(xiàn)物聯(lián)網(wǎng)數(shù)據(jù)通信。物聯(lián)網(wǎng)設(shè)備至少包含設(shè)置有RFID 標(biāo)簽的伸縮鏈板機(jī)、閱讀器、射頻門、激光制導(dǎo)的LGV 叉車、物聯(lián)網(wǎng)識別的輸送線、圖像采集單元、數(shù)據(jù)傳輸單元、升降機(jī)、碼垛機(jī)等設(shè)備。通過與上述設(shè)備接駁,能夠?qū)崿F(xiàn)電能計(jì)量資產(chǎn)信息的自動(dòng)化、智能化傳輸[5],系統(tǒng)架構(gòu)如圖1所示。
圖1 庫房管理系統(tǒng)架構(gòu)示意圖
圖1 中的電能計(jì)量資產(chǎn)自動(dòng)化資產(chǎn)庫房管理系統(tǒng)包括設(shè)備層、數(shù)據(jù)傳遞層、中央控制層和上層系統(tǒng)。在設(shè)備層中,伸縮鏈板機(jī)能夠?qū)崿F(xiàn)電能計(jì)量資產(chǎn)器具的自動(dòng)化承載,自動(dòng)輸送線用于實(shí)現(xiàn)電能計(jì)量資產(chǎn)器具的自動(dòng)化運(yùn)輸,RFID 射頻識別裝置能夠?qū)崿F(xiàn)設(shè)備的條碼識別,使得識別后的信息直接傳遞到信息管理系統(tǒng)。在運(yùn)輸過程中,借助于諸如CCD攝像機(jī)的監(jiān)控設(shè)備實(shí)現(xiàn)監(jiān)視、管理電能計(jì)量器具在運(yùn)輸過程中的狀況[11]。通過提升機(jī)使得電能計(jì)量器具在運(yùn)輸過程中能夠上升或下降到用戶需要的位置;碼垛機(jī)具有堆垛、碼垛的功能,使得電能計(jì)量器具被堆疊在一起,或者使堆疊在一起的計(jì)量器具攤開。通過上述過程,能夠自動(dòng)化、智能化運(yùn)輸計(jì)量器具,并在該過程中對數(shù)據(jù)進(jìn)行管理、計(jì)算、處理[6]。
在設(shè)計(jì)中,自動(dòng)化智能庫房管理系統(tǒng)大體上由以下部件組成:RFID 標(biāo)簽的伸縮鏈板機(jī)、閱讀器、射頻門、激光制導(dǎo)的LGV 叉車、物聯(lián)網(wǎng)識別的輸送線、圖像采集單元、數(shù)據(jù)傳輸單元、升降機(jī)、碼垛機(jī)等設(shè)備,還包括分揀系統(tǒng)(主要分揀合格表、不合格表)、監(jiān)控裝置、DPS 處理系統(tǒng)、底層設(shè)備信息采集系統(tǒng)及各種不同的傳感器等。自動(dòng)化電能計(jì)量設(shè)備智能庫房管理系統(tǒng)在電能計(jì)量管理中具有重要的作用,其能夠通過一體化計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)進(jìn)庫、出庫的數(shù)據(jù)資產(chǎn)信息管理,其硬件結(jié)構(gòu)布局合理,占地空間較小、信息存儲量巨大,全程實(shí)現(xiàn)自動(dòng)化管理,具有出庫及入庫效率高、錯(cuò)誤率低等特點(diǎn)[12]。為了保證電能計(jì)量設(shè)備智能庫房管理系統(tǒng)較高的可靠性,還采用無線通訊等傳輸方式,實(shí)現(xiàn)數(shù)據(jù)的快速傳遞[7]。
系統(tǒng)工作時(shí),通過接收上層設(shè)備發(fā)出的檢定任務(wù),經(jīng)由生產(chǎn)調(diào)度平臺進(jìn)行協(xié)調(diào),從而接收由倉儲系統(tǒng)送出的待檢周轉(zhuǎn)箱(其承載電能計(jì)量器具),通過碼垛機(jī)逐層拆箱,將分散的周轉(zhuǎn)箱依次輸送到用戶指定的相應(yīng)電能計(jì)量器具上料模塊,上料機(jī)械手在PLC 控制系統(tǒng)的作用下開始取表,將取出的表放入電能計(jì)量器具,用于檢定輸送線,在檢定線上的各個(gè)工位上完成不同的功能檢測,比如耐壓試驗(yàn)、功耗測試、外觀檢測(其包括標(biāo)志檢查、編程與參數(shù)確等)、準(zhǔn)確度檢測、通訊檢測以及多功能檢定試驗(yàn)。根據(jù)檢定結(jié)論,再進(jìn)行下一步的處理,比如分揀、輸送、異常表復(fù)檢、處理等[8]。
在上述管理系統(tǒng)結(jié)構(gòu)中,設(shè)計(jì)了新型的大數(shù)據(jù)管理平臺,該數(shù)據(jù)管理平臺包括數(shù)據(jù)庫層、數(shù)據(jù)計(jì)算層和數(shù)據(jù)接口層,其架構(gòu)如圖2 所示。該大數(shù)據(jù)管理平臺能夠支持各種行業(yè)中物聯(lián)網(wǎng)設(shè)備最初采集到的數(shù)據(jù),實(shí)現(xiàn)各種不同數(shù)據(jù)的整體采集、存儲、追溯、分類、管理等,進(jìn)一步提供各種情況下的數(shù)據(jù)查詢、數(shù)據(jù)分類、數(shù)據(jù)溯源、安全訪問等,并且能夠提供各種數(shù)據(jù)開放式采集和輸入/輸出接口,最終實(shí)現(xiàn)各種智能物聯(lián)網(wǎng)設(shè)備的遠(yuǎn)程控制、監(jiān)控等[9]。
圖2 庫房數(shù)據(jù)管理平臺
在設(shè)計(jì)中,數(shù)據(jù)層包括數(shù)據(jù)管理接口、數(shù)據(jù)交互接口、數(shù)據(jù)采集接口以及電能計(jì)量器具檢定輸送線整個(gè)流程過程中不同階段輸出的數(shù)據(jù)信息。在數(shù)據(jù)計(jì)算層,設(shè)置了多種數(shù)據(jù)算法模型,以根據(jù)用戶的不同需求,選擇性地處理各種數(shù)據(jù)信息。大數(shù)據(jù)模型可以采用分類模型、關(guān)聯(lián)模型、融合算法模型、數(shù)據(jù)優(yōu)化模型、故障診斷模型和聯(lián)機(jī)分析算法模型等,這需要根據(jù)用戶的不同需求進(jìn)行選擇,最終實(shí)現(xiàn)庫房數(shù)據(jù)庫中各種電能表計(jì)量資產(chǎn)信息的計(jì)算、存儲、傳遞和共享,大大提高數(shù)據(jù)的管理能力[10]。在研究的庫房管理數(shù)據(jù)庫中,包含了智能RFID 射頻識別數(shù)據(jù)信息、機(jī)器人碼垛機(jī)、AGV 自動(dòng)激光傳導(dǎo)數(shù)據(jù)新型、圖像采集數(shù)據(jù)信息、監(jiān)控信息、物流傳遞數(shù)據(jù)等多種信息。在進(jìn)行庫房數(shù)據(jù)管理中,使用最多的就是分類算法。文中采用了CART算法模型和BP神經(jīng)網(wǎng)絡(luò)算法模型,實(shí)現(xiàn)了電能表大數(shù)據(jù)的處理和分類[11]。
在進(jìn)行大數(shù)據(jù)管理之前,需對接收到的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)融合,其中數(shù)據(jù)融合的模型為:
其中:
然后,啟動(dòng)CART 算法模型對接收的電能計(jì)量資產(chǎn)數(shù)據(jù)信息進(jìn)行分類、管理。該方法通過決策樹實(shí)現(xiàn)數(shù)據(jù)的分類。在應(yīng)用該算法時(shí),首先選定電能計(jì)量資產(chǎn)數(shù)據(jù)樣本,令其為D,假設(shè)在數(shù)據(jù)樣本中選擇K個(gè)類別[12],樣本點(diǎn)屬于第k類的概率設(shè)定為pk,則概率分布的基尼指數(shù)定義為:
對于數(shù)據(jù)樣本D,有:
其中,Ck是數(shù)據(jù)樣本D中第k類的數(shù)據(jù)樣本,在特征為A的情況下,數(shù)據(jù)樣本D的基尼指數(shù)為:
其中,D1和D2是在數(shù)據(jù)集合D中被特征A分割的部分,然后選擇基尼指數(shù)最小的特征及其對應(yīng)的切分點(diǎn)作為最優(yōu)特征與最優(yōu)切分點(diǎn)[13]。在計(jì)算決策樹的根節(jié)點(diǎn)時(shí),啟動(dòng)式(5),計(jì)算出基尼指數(shù),然后比較計(jì)算出的基尼指數(shù)的大小,將基尼指數(shù)較大的屬性選作為根節(jié)點(diǎn)。然后反復(fù)啟動(dòng)式(5),再次計(jì)算基尼指數(shù),將基尼指數(shù)較小的屬性選作為葉節(jié)點(diǎn)[14]。通過上述步驟,反復(fù)地應(yīng)用式(5),梳理其計(jì)算值。當(dāng)根節(jié)點(diǎn)的樣本個(gè)數(shù)小于設(shè)置的閾值時(shí),或樣本集的基尼指數(shù)小于預(yù)定閾值時(shí),停止計(jì)算,不再計(jì)算分類屬性。根據(jù)上述方法可以確定構(gòu)建決策樹模型的根節(jié)點(diǎn)和葉節(jié)點(diǎn),實(shí)現(xiàn)數(shù)據(jù)模型的構(gòu)建[15]。
數(shù)據(jù)模型構(gòu)建好后,為了提高分類的精度,需對構(gòu)建出的決策樹進(jìn)行剪枝,通過最小化決策樹整體的損失函數(shù)來實(shí)現(xiàn),其中損失函數(shù)為:
其中,T為任意子樹,C(T)是對訓(xùn)練數(shù)據(jù)的預(yù)測誤差,|T|為子樹的葉結(jié)點(diǎn)個(gè)數(shù),其中α≥0,Cα(T)為參數(shù)是α?xí)r的子樹T的整體損失,其中α值越大,Cα(T)越小,α值越小,Cα(T)越大。
通過上述方法完成不同類型、不同屬性電能計(jì)資產(chǎn)信息的分類。為了提高其精度,通過BP 神經(jīng)網(wǎng)絡(luò)算法模型對構(gòu)建的數(shù)學(xué)模型輸出數(shù)據(jù)進(jìn)行誤差診斷。
在應(yīng)用BP 神經(jīng)網(wǎng)絡(luò)算法模型進(jìn)行誤差診斷時(shí),首先輸入電能計(jì)量資產(chǎn)各種數(shù)據(jù)樣本的輸入向量和期望輸出值,并設(shè)置BP 神經(jīng)網(wǎng)絡(luò)算法模型中輸入層、隱含層和輸出層中的參數(shù)值,在應(yīng)用過程中,通過以下公式調(diào)整輸出層權(quán)系數(shù)[16]:
采用以下公式調(diào)整隱含層權(quán)系數(shù):
然后求出輸出層輸出與期望輸出的誤差,計(jì)算公式為:
判斷誤差是否滿足要求,當(dāng)滿足要求時(shí),計(jì)算隱含層誤差,當(dāng)不滿足要求時(shí),繼續(xù)應(yīng)用式(8)調(diào)整隱含層權(quán)系數(shù)。
通過上述論述,使用CART 算法能夠?qū)崿F(xiàn)電能計(jì)量大數(shù)據(jù)分布式層次模型的構(gòu)建,簡化了電能計(jì)量數(shù)據(jù)識別能力[17-19]。
在試驗(yàn)時(shí),應(yīng)用的硬件計(jì)算機(jī)操作系統(tǒng)為Microsoft Windows 2015,64 位,主要開發(fā)工具為Visual Studio 2015,OpenCV 3.0。運(yùn)行環(huán)境硬件參數(shù)為CPU:Inter(R)Core(TM)i7;主頻為2.59 GHz;內(nèi)存16G。在Visual Studio 2015 的環(huán)境下利用C++實(shí)現(xiàn)對庫房管理數(shù)據(jù)的保存[20-23]。其中數(shù)據(jù)庫中包含103 503 201 多條電能計(jì)量資產(chǎn)大數(shù)據(jù)。
圖3 庫房管理系統(tǒng)軟件界面示意圖
文中采用文獻(xiàn)[1]和文獻(xiàn)[2]進(jìn)行對比分析,文獻(xiàn)[1]采用改進(jìn)K-means 算法進(jìn)行電能計(jì)量資產(chǎn)大數(shù)據(jù)挖掘,文獻(xiàn)[2]采用隨機(jī)矩陣?yán)碚撨M(jìn)行電能計(jì)量資產(chǎn)大數(shù)據(jù)挖掘,分別在3個(gè)小時(shí)內(nèi)進(jìn)行試驗(yàn),通過運(yùn)用3種方法來對比分析大數(shù)據(jù)挖掘準(zhǔn)確率,對比曲線圖如圖4 所示。
圖4 大數(shù)據(jù)挖掘準(zhǔn)確率對比結(jié)果
通過圖4 的曲線圖可以看出,隨著測試數(shù)據(jù)集的增多,文獻(xiàn)[1]基于改進(jìn)K-means 算法的大數(shù)據(jù)挖掘準(zhǔn)確率在逐漸提高,當(dāng)測試數(shù)據(jù)集為70×103時(shí),數(shù)據(jù)挖掘準(zhǔn)確率接近60%,隨后準(zhǔn)確率逐步減少。文獻(xiàn)[2]基于隨機(jī)矩陣?yán)碚摰拇髷?shù)據(jù)挖掘技術(shù)準(zhǔn)確率高于文獻(xiàn)[1]的準(zhǔn)確率,但是僅提高了10%;而文中算法雖然在電能計(jì)量資產(chǎn)大數(shù)據(jù)測試數(shù)據(jù)集為10×103時(shí)的準(zhǔn)確率只有24%,但是當(dāng)電能計(jì)量資產(chǎn)大數(shù)據(jù)測試數(shù)據(jù)集為40×103時(shí),其數(shù)據(jù)挖掘準(zhǔn)確率就超過了文獻(xiàn)[1]和文獻(xiàn)[2]的準(zhǔn)確率。當(dāng)電能計(jì)量資產(chǎn)大數(shù)據(jù)測試數(shù)據(jù)集為100×103時(shí),文中算法挖掘準(zhǔn)確率高達(dá)93%。因此,文中算法具有最高的準(zhǔn)確性[24-25]。
在預(yù)處理電能計(jì)量資產(chǎn)信息大數(shù)據(jù)之后,在電能計(jì)量資產(chǎn)大數(shù)據(jù)訓(xùn)練集中,對分類精度進(jìn)行對比分析,對比精度曲線如圖5 所示。
通過圖5 的曲線圖可以看出,當(dāng)電能計(jì)量資產(chǎn)大數(shù)據(jù)訓(xùn)練集為30×103時(shí),文獻(xiàn)[1]的訓(xùn)練集分類準(zhǔn)確率為58%,文獻(xiàn)[2]的訓(xùn)練集分類準(zhǔn)確率為37%,而文中方法的訓(xùn)練集分類準(zhǔn)確率為77%;當(dāng)電能計(jì)量資產(chǎn)大數(shù)據(jù)訓(xùn)練集為100×103時(shí),文獻(xiàn)[1]的訓(xùn)練集分類準(zhǔn)確率為64%,文獻(xiàn)[2]的訓(xùn)練集分類準(zhǔn)確率為60%,而文中方法的訓(xùn)練集分類準(zhǔn)確率高達(dá)92%。由此可知,文中方法大數(shù)據(jù)訓(xùn)練集分類精度較高[26-27]。
圖5 大數(shù)據(jù)訓(xùn)練集分類精度對比結(jié)果
針對大數(shù)據(jù)挖掘效率進(jìn)行試驗(yàn),假設(shè)在相同的時(shí)間范圍內(nèi)進(jìn)行試驗(yàn),比如100 s 內(nèi),結(jié)果曲線如圖6所示。
圖6 電能計(jì)量資產(chǎn)大數(shù)據(jù)挖掘效率對比結(jié)果
通過圖6 的曲線圖可以看出,當(dāng)電能計(jì)量資產(chǎn)大數(shù)據(jù)訓(xùn)練集為50×103時(shí),文獻(xiàn)[1]的訓(xùn)練集處理時(shí)間為43 s,文獻(xiàn)[2]的訓(xùn)練集處理時(shí)間為61 s,而文中方法的訓(xùn)練集處理時(shí)間為25 s;當(dāng)電能計(jì)量資產(chǎn)大數(shù)據(jù)訓(xùn)練集為100×103時(shí),文獻(xiàn)[1]的訓(xùn)練集處理時(shí)間為60 s,文獻(xiàn)[2]訓(xùn)練集處理時(shí)間為85 s,而文中方法的訓(xùn)練集處理時(shí)間為30 s。由此可知,文中方法的訓(xùn)練集處理時(shí)間較短,說明處理效率較高。
通過上述試驗(yàn),文中方法的數(shù)據(jù)挖掘準(zhǔn)確率、訓(xùn)練集分類精度和數(shù)據(jù)挖掘效率均最高。
文中基于物聯(lián)網(wǎng)技術(shù)、自動(dòng)化技術(shù)、傳感器技術(shù)和大數(shù)據(jù)處理技術(shù)構(gòu)建出新型的電能計(jì)量資產(chǎn)庫房管理系統(tǒng),實(shí)現(xiàn)各種電能計(jì)量資產(chǎn)不同數(shù)據(jù)信息的采集、存儲、追溯、分類、管理等,進(jìn)一步提供各種情況下的數(shù)據(jù)查詢、數(shù)據(jù)分類、數(shù)據(jù)溯源、安全訪問,實(shí)現(xiàn)了電能計(jì)量資產(chǎn)數(shù)據(jù)信息的進(jìn)庫、出庫的等管理。隨著電能技術(shù)的發(fā)展、電力計(jì)量器具的廣泛使用、應(yīng)用,在面對計(jì)量資產(chǎn)器具智能庫房管理時(shí),智能化庫房管理已經(jīng)成為電力行業(yè)廣大用戶的急需,也是計(jì)量資產(chǎn)管理、運(yùn)營的發(fā)展趨勢。