溫昌凱 謝 斌 李若晨 宋正河 韓建剛 劉江輝
(1.中國(guó)農(nóng)業(yè)大學(xué)工學(xué)院, 北京 100083; 2.中國(guó)農(nóng)業(yè)大學(xué)現(xiàn)代農(nóng)業(yè)裝備優(yōu)化設(shè)計(jì)北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100083;3.洛陽(yáng)西苑車輛與動(dòng)力檢驗(yàn)所有限公司, 洛陽(yáng) 471000)
農(nóng)業(yè)與大數(shù)據(jù)良好結(jié)合是未來(lái)農(nóng)業(yè)發(fā)展的必然趨勢(shì)。農(nóng)業(yè)大數(shù)據(jù)涉及地區(qū)范圍廣、地形差別大、作物品種多、作業(yè)工況多,并且受限于各地區(qū)農(nóng)業(yè)結(jié)構(gòu)復(fù)雜、農(nóng)耕環(huán)境以及氣候多樣等因素,因此,農(nóng)業(yè)領(lǐng)域大數(shù)據(jù)具有高實(shí)時(shí)、多維度、離散化、難綜合分析等特點(diǎn)[1-3]。
隨著全球農(nóng)業(yè)現(xiàn)代化、智能化、信息化的不斷推進(jìn),畜牧業(yè)、漁業(yè)、農(nóng)產(chǎn)品加工、氣象等農(nóng)業(yè)相關(guān)領(lǐng)域數(shù)據(jù)呈指數(shù)規(guī)律不斷積累[4-8]。但在農(nóng)業(yè)機(jī)械領(lǐng)域,由于農(nóng)業(yè)機(jī)械載荷復(fù)雜、測(cè)試成本較高以及數(shù)據(jù)平臺(tái)架構(gòu)不易統(tǒng)一等問(wèn)題,數(shù)據(jù)系統(tǒng)性積累與平臺(tái)規(guī)范化構(gòu)建難以實(shí)現(xiàn),農(nóng)業(yè)數(shù)據(jù)測(cè)試以及積累研究相對(duì)滯后,基于大數(shù)據(jù)的農(nóng)業(yè)機(jī)械數(shù)據(jù)融合與分析預(yù)測(cè)相對(duì)缺乏。
本文研究拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)系統(tǒng)構(gòu)建和基于大數(shù)據(jù)的拖拉機(jī)田間旋耕作業(yè)質(zhì)量評(píng)價(jià)與預(yù)測(cè)。探索拖拉機(jī)多傳感器車載測(cè)試終端分布格局、作業(yè)參數(shù)與結(jié)構(gòu)體系;研究基于全國(guó)范圍田間作業(yè)試驗(yàn)的拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)系統(tǒng),并構(gòu)建相應(yīng)的數(shù)據(jù)庫(kù)結(jié)構(gòu);基于農(nóng)機(jī)農(nóng)藝要求,采用遺傳算法與BP神經(jīng)網(wǎng)絡(luò)相融合的方法對(duì)數(shù)據(jù)平臺(tái)基礎(chǔ)作業(yè)載荷進(jìn)行分類融合處理,預(yù)測(cè)評(píng)價(jià)拖拉機(jī)田間旋耕作業(yè)質(zhì)量,以驗(yàn)證平臺(tái)系統(tǒng)的可行性。
此次全國(guó)范圍的測(cè)試樣機(jī)布置以涵蓋水稻、小麥、玉米等優(yōu)勢(shì)作物的全國(guó)農(nóng)業(yè)戰(zhàn)略格局為出發(fā)點(diǎn),主要考慮優(yōu)勢(shì)主產(chǎn)區(qū)的作物差異性、地理環(huán)境差異性以及作業(yè)載荷差異性,在一定程度上兼顧其他具有代表性的地塊地域[9-11]。
因此,綜合考慮測(cè)試終端地區(qū)分配合理,兼顧各地區(qū)作物、地理、氣候等多個(gè)因素,測(cè)試樣機(jī)車載終端布置選擇主要集中在東北平原、黃淮海平原、長(zhǎng)江流域、汾渭平原以及新疆地區(qū),總計(jì)6輛測(cè)試樣機(jī)。
測(cè)試樣機(jī)車載終端硬件以基于 ARM335x 微處理器的 ARM 硬件開(kāi)發(fā)平臺(tái)作為主控制器,使用分布式布置的傳感器,對(duì)拖拉機(jī)多地區(qū)、多工況、多載荷進(jìn)行數(shù)據(jù)采集。田間作業(yè)載荷采集測(cè)試終端采用OK3355xD工業(yè)級(jí)開(kāi)發(fā)板和FET335xD工業(yè)級(jí)核心板,配置LCD觸摸液晶屏、WiFi模塊、SD卡、USB鍵盤鼠標(biāo)接口、多接口模塊,測(cè)試終端硬件結(jié)構(gòu)設(shè)計(jì)如圖1所示。
圖1 測(cè)試終端硬件結(jié)構(gòu)框圖Fig.1 Hardware structure design of test terminal
測(cè)試樣機(jī)車載終端的測(cè)試工況包括拖拉機(jī)犁耕作業(yè)、旋耕作業(yè)、深松作業(yè)以及聯(lián)合耕整作業(yè),待測(cè)關(guān)鍵零部件包括發(fā)動(dòng)機(jī)、實(shí)時(shí)地理位置、電液懸掛下拉桿、動(dòng)力輸出軸、前萬(wàn)向傳動(dòng)軸、前轉(zhuǎn)向驅(qū)動(dòng)橋、變速箱、后驅(qū)動(dòng)橋、駕駛室等,測(cè)試參數(shù)以及配套傳感器如表1所示,傳感器布置位置如圖2所示。
表1 測(cè)試終端測(cè)試參數(shù)與傳感器Tab.1 Testing terminal test parameters and sensors
圖2 測(cè)試終端傳感器布置圖Fig.2 Sensor layout of test terminal
各測(cè)試樣機(jī)正常田間作業(yè),測(cè)試終端開(kāi)啟后可自動(dòng)采集作業(yè)載荷,按照拖拉機(jī)作業(yè)載荷傳輸協(xié)議實(shí)時(shí)或分段工作數(shù)據(jù)打包等多種形式發(fā)送傳輸至作業(yè)載荷數(shù)據(jù)庫(kù),實(shí)現(xiàn)拖拉機(jī)多樣工況、惡劣環(huán)境條件下的田間作業(yè)載荷數(shù)據(jù)的自動(dòng)采集與傳輸。
參考國(guó)內(nèi)外現(xiàn)有機(jī)械行業(yè)數(shù)據(jù)平臺(tái),結(jié)合農(nóng)業(yè)機(jī)械田間作業(yè)多工況、變環(huán)境、高載荷的特點(diǎn),設(shè)計(jì)基于B/S網(wǎng)絡(luò)結(jié)構(gòu)模式的拖拉機(jī)作業(yè)載荷數(shù)據(jù)庫(kù)系統(tǒng)。本系統(tǒng)包括系統(tǒng)管理機(jī)制、載荷數(shù)據(jù)庫(kù)基礎(chǔ)平臺(tái)、載荷數(shù)據(jù)實(shí)時(shí)采集系統(tǒng)以及拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量評(píng)價(jià)與預(yù)測(cè)模塊等部分,在此基礎(chǔ)上,形成的系統(tǒng)總體方案如圖3所示。
圖3 作業(yè)載荷數(shù)據(jù)平臺(tái)總體結(jié)構(gòu)與方案Fig.3 Overall structure and scheme of work load data platform
系統(tǒng)管理機(jī)制包括用戶權(quán)限管理、試驗(yàn)地信息管理、拖拉機(jī)信息管理、測(cè)試終端信息管理、作業(yè)信息管理以及平臺(tái)信息管理等功能。用戶權(quán)限管理包括對(duì)用戶的基本信息、登錄密碼、訪問(wèn)權(quán)限級(jí)別進(jìn)行管理。試驗(yàn)地信息管理包括對(duì)作業(yè)試驗(yàn)田的所屬地區(qū)、基本環(huán)境的管理。拖拉機(jī)信息管理包括對(duì)拖拉機(jī)基本參數(shù)、配套作業(yè)機(jī)具的管理。測(cè)試終端信息管理包括對(duì)采集設(shè)備以及工作狀態(tài)的管理。系統(tǒng)管理機(jī)制的有效運(yùn)行可保證拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)的正常運(yùn)行。
該數(shù)據(jù)平臺(tái)作業(yè)載荷實(shí)時(shí)采集系統(tǒng)主要由全國(guó)范圍內(nèi)各主產(chǎn)區(qū)負(fù)責(zé)單位統(tǒng)籌管理,由主產(chǎn)區(qū)各試驗(yàn)測(cè)試站分別負(fù)責(zé)執(zhí)行試驗(yàn)田以及測(cè)試樣機(jī)的管理以及作業(yè)運(yùn)行,考慮到我國(guó)農(nóng)業(yè)主產(chǎn)區(qū)地域差別大、農(nóng)業(yè)機(jī)械作業(yè)載荷復(fù)雜,有必要全面監(jiān)控從試驗(yàn)地到測(cè)試終端的內(nèi)在聯(lián)系,以獲得全國(guó)范圍內(nèi)拖拉機(jī)田間作業(yè)載荷的全面基礎(chǔ)數(shù)據(jù)[12-15]。
作業(yè)載荷實(shí)時(shí)采集系統(tǒng)由各農(nóng)業(yè)主產(chǎn)區(qū)管理單位、分布的各級(jí)試驗(yàn)站(省、市、縣/區(qū))和測(cè)試環(huán)節(jié)的基層測(cè)試站點(diǎn)構(gòu)成。具體分層結(jié)構(gòu)如圖4所示。
圖4 作業(yè)載荷實(shí)時(shí)采集系統(tǒng)分層結(jié)構(gòu)Fig.4 Hierarchical structure of real-time load acquisition system
圖5 作業(yè)載荷數(shù)據(jù)庫(kù)系統(tǒng)功能結(jié)構(gòu)Fig.5 Functional structure of work load database system
基于用戶群體需求導(dǎo)向,進(jìn)一步完善拖拉機(jī)作業(yè)載荷數(shù)據(jù)庫(kù)系統(tǒng)結(jié)構(gòu),明確數(shù)據(jù)庫(kù)系統(tǒng)各模塊部分的功能以及結(jié)構(gòu),如圖5所示。平臺(tái)系統(tǒng)管理包括測(cè)試樣機(jī)管理、用戶權(quán)限管理以及作業(yè)資料管理?;A(chǔ)載荷數(shù)據(jù)管理包括地區(qū)信息、環(huán)境信息、機(jī)具信息、試驗(yàn)標(biāo)準(zhǔn)、測(cè)試方法、采集步驟、測(cè)試對(duì)象以及測(cè)試種類。實(shí)時(shí)載荷數(shù)據(jù)采集包括試驗(yàn)地設(shè)置、樣機(jī)設(shè)置、實(shí)時(shí)載荷采集、載荷數(shù)據(jù)打包、載荷數(shù)據(jù)校驗(yàn)以及載荷數(shù)據(jù)上傳。作業(yè)農(nóng)藝預(yù)測(cè)評(píng)價(jià)包括所在地區(qū)檢索、作業(yè)種類檢索、工作狀態(tài)檢索以及牽引預(yù)測(cè)檢索。
基于數(shù)據(jù)平臺(tái)多樣性、包容性、全面性以及系統(tǒng)性特點(diǎn)需求,結(jié)合E-R概念設(shè)計(jì)的實(shí)體、屬性和聯(lián)系三要素,構(gòu)建全國(guó)范圍拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)的概念模型。該數(shù)據(jù)庫(kù)包括4個(gè)實(shí)體、若干屬性以及各項(xiàng)必要的聯(lián)系。各實(shí)體環(huán)環(huán)相扣,構(gòu)建了數(shù)據(jù)平臺(tái)的基本框架,各實(shí)體屬性以及聯(lián)系建立數(shù)據(jù)平臺(tái)潛在邏輯,進(jìn)一步豐富數(shù)據(jù)平臺(tái)功能、提高可用性。E-R結(jié)構(gòu)框圖如圖6所示。
根據(jù)作業(yè)載荷數(shù)據(jù)平臺(tái)系統(tǒng)需求,剖析拖拉機(jī)田間作業(yè)載荷測(cè)試、采集、傳輸以及入網(wǎng)的全過(guò)程?;谧鳂I(yè)載荷數(shù)據(jù)庫(kù)E-R概念結(jié)構(gòu)設(shè)計(jì)的數(shù)據(jù)字典,進(jìn)行數(shù)據(jù)庫(kù)邏輯架構(gòu)設(shè)計(jì),數(shù)據(jù)庫(kù)系統(tǒng)主要由終端表、農(nóng)機(jī)表、傳感器表、作業(yè)表、數(shù)據(jù)表等11個(gè)數(shù)據(jù)組成,其中主數(shù)據(jù)表與基礎(chǔ)數(shù)據(jù)表相關(guān)聯(lián),以測(cè)試終端為主鍵,實(shí)時(shí)采集、傳輸、存儲(chǔ)測(cè)試基礎(chǔ)數(shù)據(jù)以及結(jié)果。形成的數(shù)據(jù)表關(guān)系如圖7所示。
圖6 作業(yè)載荷數(shù)據(jù)庫(kù)E-R概念結(jié)構(gòu)框圖Fig.6 Design of E-R conceptual structure of work load database
基于作業(yè)載荷數(shù)據(jù)庫(kù)概念結(jié)構(gòu)與邏輯結(jié)構(gòu),結(jié)合使用人員多樣性、操作級(jí)別多層次、終端節(jié)點(diǎn)分布廣以及作業(yè)環(huán)境復(fù)雜性等系統(tǒng)特點(diǎn),進(jìn)行數(shù)據(jù)平臺(tái)基本框架設(shè)計(jì)以及服務(wù)器軟件系統(tǒng)開(kāi)發(fā)。
作業(yè)載荷數(shù)據(jù)庫(kù)系統(tǒng)基于Web2.0架構(gòu),采用微服務(wù)技術(shù)結(jié)構(gòu)體系開(kāi)發(fā),前端部分采用HTML5/CSS3/JavaScript等技術(shù)開(kāi)發(fā),數(shù)據(jù)庫(kù)采用MY SQL 5.7.27.0版本,并且采用RESTful API架構(gòu)作為方便前、后端通信的統(tǒng)一機(jī)制。
數(shù)據(jù)采集服務(wù)基于C#.NET技術(shù)開(kāi)發(fā),測(cè)試樣機(jī)車載終端與平臺(tái)服務(wù)器之間基于TCP傳輸方式,采用私有二進(jìn)制協(xié)議即拖拉機(jī)機(jī)組作業(yè)載荷傳輸協(xié)議進(jìn)行數(shù)據(jù)傳輸,關(guān)鍵數(shù)據(jù)采用RSA加密驗(yàn)證機(jī)制保護(hù),可確保高吞吐量和高安全性。
關(guān)聯(lián)數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)采用基礎(chǔ)數(shù)據(jù)與不易變化數(shù)據(jù)結(jié)構(gòu)化處理、易變化數(shù)據(jù)非結(jié)構(gòu)化處理相結(jié)合的方式,可確保數(shù)據(jù)庫(kù)的穩(wěn)定性、靈活性以及兼容性;針對(duì)系統(tǒng)傳感器多、數(shù)據(jù)量大以及采樣頻率范圍廣的特點(diǎn)采用分庫(kù)分表方式處理數(shù)據(jù),即按照需求業(yè)務(wù)不同將數(shù)據(jù)分庫(kù)儲(chǔ)存,按照時(shí)間維度不同將低頻、高頻數(shù)據(jù)分表儲(chǔ)存。此外,通過(guò)數(shù)據(jù)庫(kù)約束機(jī)制保證數(shù)據(jù)完整性,通過(guò)數(shù)據(jù)校驗(yàn)機(jī)制確保邏輯正確性,通過(guò)數(shù)據(jù)庫(kù)備份確保數(shù)據(jù)高可用性。
基于以上內(nèi)容,完成拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)的設(shè)計(jì)與構(gòu)建,田間試驗(yàn)以及試驗(yàn)數(shù)據(jù)等部分界面效果如圖8所示。
基于拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)以及農(nóng)業(yè)大數(shù)據(jù)融合技術(shù),結(jié)合農(nóng)機(jī)農(nóng)藝要求,篩選部分實(shí)測(cè)數(shù)據(jù)研究拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量評(píng)價(jià)與預(yù)測(cè)的智能算法,并驗(yàn)證其可行性。
針對(duì)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型連接權(quán)重隨機(jī)賦值導(dǎo)致收斂速度過(guò)慢和結(jié)構(gòu)模式不確定導(dǎo)致訓(xùn)練過(guò)擬合及學(xué)習(xí)能力不足的問(wèn)題,本文提出基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)算法,利用遺傳算法全局搜索最優(yōu)特性對(duì) BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,降低神經(jīng)網(wǎng)絡(luò)陷入局部最優(yōu)解而無(wú)法穩(wěn)定準(zhǔn)確預(yù)測(cè)的風(fēng)險(xiǎn),提升網(wǎng)絡(luò)的收斂速度和系統(tǒng)預(yù)測(cè)精度,進(jìn)一步提高BP神經(jīng)網(wǎng)絡(luò)的可行性[16-19]。遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)方法主要由BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定、遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)權(quán)閾值權(quán)重矩陣、 BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)3部分組成[20-22]。其核心是采用遺傳算法將神經(jīng)網(wǎng)絡(luò)函數(shù)計(jì)算的損失誤差作為個(gè)體適應(yīng)度,對(duì)權(quán)值、閾值進(jìn)行選擇、交叉和變異操作,使個(gè)體適應(yīng)度盡可能地小,從而得到最佳的神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值權(quán)重矩陣?;谶z傳算法的BP神經(jīng)網(wǎng)絡(luò)算法流程如圖9所示。
圖7 作業(yè)載荷數(shù)據(jù)庫(kù)主要數(shù)據(jù)表關(guān)系Fig.7 Maindata table relations of job load database
圖8 拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)界面Fig.8 Interfaces of tractor working load data platform
圖9 基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)算法流程圖Fig.9 Flow chart of BP neural network algorithm based on genetic algorithm
4.2.1BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)即誤差反向傳播神經(jīng)網(wǎng)絡(luò),一般由輸入層、隱含層和輸出層構(gòu)成,可以有效地解決各個(gè)輸入指標(biāo)之間的非線性關(guān)系,步驟如下:
(1)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)選擇
拖拉機(jī)工作在土壤-機(jī)器-植物復(fù)雜系統(tǒng),考慮其田間旋耕工況作業(yè)質(zhì)量受到多因素耦合作用以及3層神經(jīng)網(wǎng)絡(luò)可以完成任意n維到m維的映射,本文選擇3層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
(2)輸入、輸出層參數(shù)確定
為了建立簡(jiǎn)潔有效的BP神經(jīng)網(wǎng)絡(luò)模型,基于農(nóng)機(jī)農(nóng)藝要求,本文所采用的BP神經(jīng)網(wǎng)絡(luò)輸入層參數(shù)為拖拉機(jī)電液懸掛左、右下拉桿銷軸力,電液懸掛左、右下拉桿角度,動(dòng)力輸出軸扭矩以及行駛速度,輸出層參數(shù)為優(yōu)、中、差3種拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量水平。
本文神經(jīng)網(wǎng)絡(luò)模型的輸入層參數(shù)存在量綱難以統(tǒng)一的問(wèn)題,為減少拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量評(píng)價(jià)與預(yù)測(cè)的誤判概率,對(duì)輸入輸出層參數(shù)進(jìn)行歸一化處理,即
(1)
pi——第i個(gè)原始特征值數(shù)據(jù)
pmax——原始特征值數(shù)據(jù)的最大值
pmin——原始特征值數(shù)據(jù)的最小值
(3)隱含層節(jié)點(diǎn)數(shù)確定
隱含層節(jié)點(diǎn)數(shù)作為BP神經(jīng)網(wǎng)絡(luò)的重要組成部分,直接影響網(wǎng)絡(luò)的非線性映射能力。隱含層節(jié)點(diǎn)數(shù)計(jì)算公式為
(2)
式中n——輸入層節(jié)點(diǎn)數(shù)
m——輸出層節(jié)點(diǎn)數(shù)
計(jì)算可得該神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)范圍為[3,13],對(duì)比多次試驗(yàn)以及神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差,當(dāng)隱含層節(jié)點(diǎn)數(shù)為10時(shí),神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)性能最佳。
構(gòu)建具有1個(gè)隱含層的3層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),隱含層節(jié)點(diǎn)數(shù)為10,具體BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型結(jié)構(gòu)如圖10所示。
圖10 拖拉機(jī)旋耕作業(yè)性能預(yù)測(cè)的BP神經(jīng)網(wǎng)絡(luò)模型Fig.10 BP neural network model for performance prediction of tractor rotary tillage
(4)網(wǎng)絡(luò)函數(shù)選擇
考慮到預(yù)測(cè)模型非線性特征明顯以及預(yù)測(cè)收斂快、誤差小等要求,BP神經(jīng)網(wǎng)絡(luò)的隱含層傳遞函數(shù)選擇sigmoid函數(shù),訓(xùn)練函數(shù)選擇trainlm函數(shù),學(xué)習(xí)函數(shù)選擇learngdm函數(shù),網(wǎng)絡(luò)性能函數(shù)選擇mse函數(shù),仿真函數(shù)選擇sim函數(shù)。
(5)權(quán)值閾值更新確定
權(quán)值閾值更新確定是BP神經(jīng)網(wǎng)絡(luò)采用的誤差反向傳播算法的核心部分,其主要工作是依次計(jì)算隱含層輸出和輸出層輸出,進(jìn)一步求得神經(jīng)網(wǎng)絡(luò)輸出值與實(shí)際作業(yè)真實(shí)值之間的預(yù)測(cè)誤差,最后根據(jù)公式實(shí)時(shí)更新神經(jīng)網(wǎng)絡(luò)隱含層與輸出層的權(quán)值閾值。神經(jīng)網(wǎng)絡(luò)權(quán)值閾值更新確定過(guò)程包括隱含層輸出、輸出層輸出、誤差計(jì)算以及權(quán)閾值更新4個(gè)步驟,計(jì)算公式為
(3)
式中f(x)——隱含層激勵(lì)傳遞函數(shù)
x——輸入變量
Hj——隱含層輸出變量
wij——隱含層權(quán)值
aj——隱含層閾值
Ok——輸出層輸出變量,即預(yù)測(cè)值
bk——輸出層閾值
i——輸入層節(jié)點(diǎn)數(shù)
j——隱含層節(jié)點(diǎn)數(shù)
k——輸出層節(jié)點(diǎn)數(shù)
Yk——實(shí)際值
ek——神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)誤差
η——神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率
wjk——輸出層權(quán)值
4.2.2預(yù)測(cè)網(wǎng)絡(luò)模型的遺傳算法優(yōu)化
基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模思想是:通過(guò)遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值閾值,對(duì)初始值進(jìn)行編碼和選擇、交叉和變異等操作,獲取最優(yōu)參數(shù)并對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行賦值與訓(xùn)練,使優(yōu)化后的神經(jīng)網(wǎng)絡(luò)能提高網(wǎng)絡(luò)收斂速度以及預(yù)測(cè)準(zhǔn)確性。基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)過(guò)程主要包括種群初始化,適應(yīng)度函數(shù)選擇以及選擇、交叉、變異操作[23-25]。
種群初始化主要采用浮點(diǎn)數(shù)編碼方式,編碼長(zhǎng)度為神經(jīng)網(wǎng)絡(luò)所有權(quán)值個(gè)數(shù)(nm+lm)和閾值個(gè)數(shù)(l+m)之和,計(jì)算可得此種群初始化編碼長(zhǎng)度為61。
適應(yīng)度函數(shù)選擇與計(jì)算是遺傳算法的核心部分,將BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)輸出值與真實(shí)作業(yè)值之間的誤差平方和作為個(gè)體適應(yīng)度,因此適應(yīng)度函數(shù)為
(4)
式中n0——訓(xùn)練樣本總數(shù)
yi——作業(yè)真實(shí)值
f(xi)——神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值
選擇操作采用最優(yōu)個(gè)體最優(yōu)保存和其余個(gè)體輪盤賭法選擇的并存策略。交叉操作采用實(shí)數(shù)交叉法,變異操作采用實(shí)值變異法。其中因?yàn)樯婕吧窠?jīng)網(wǎng)絡(luò)收斂速度,基于適應(yīng)度需求選取交叉概率與變異概率遺傳算子,計(jì)算公式為
(5)
(6)
式中pc——遺傳算法交叉概率
pch——遺傳算法交叉概率上限
pcl——遺傳算法交叉概率下限
pm——遺傳算法變異概率
pmh——遺傳算法變異概率上限
pml——遺傳算法變異概率下限
f′——交叉染色體較大適應(yīng)度
favg——染色體平均適應(yīng)度
fbest——染色體最佳適應(yīng)度
因此,本文構(gòu)建了基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,計(jì)算并設(shè)置遺傳算法參數(shù):進(jìn)化代數(shù)為200,種群規(guī)模為20,交叉概率為0.5,變異概率為0.1。并選取均方根誤差(RMSE)作為模型評(píng)價(jià)與預(yù)測(cè)性能的評(píng)價(jià)標(biāo)準(zhǔn)。
4.3.1田間作業(yè)試驗(yàn)數(shù)據(jù)
作業(yè)載荷數(shù)據(jù)平臺(tái)可實(shí)時(shí)獲取多拖拉機(jī)、多工況、多地區(qū)的作業(yè)數(shù)據(jù),但若考慮整個(gè)時(shí)間段、整個(gè)覆蓋范圍,數(shù)據(jù)總量會(huì)過(guò)大、不利于建模與分析。因此,基于2019年3月東北某區(qū)域某拖拉機(jī)某時(shí)間段內(nèi)數(shù)據(jù)平臺(tái)的田間作業(yè)數(shù)據(jù),平均隨機(jī)選取旋耕工況作業(yè)質(zhì)量?jī)?yōu)、中、差3種情況,每種情況3 000組數(shù)據(jù),總計(jì)9 000組數(shù)據(jù)作為訓(xùn)練集,其他任意一段時(shí)間總計(jì)4 000組旋耕工況作業(yè)數(shù)據(jù)作為測(cè)試集。根據(jù)訓(xùn)練集與測(cè)試集數(shù)據(jù),對(duì)拖拉機(jī)旋耕工況作業(yè)質(zhì)量性能進(jìn)行評(píng)價(jià)與預(yù)測(cè)。
4.3.2評(píng)價(jià)預(yù)測(cè)結(jié)果分析
應(yīng)用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值閾值,其中適應(yīng)度函數(shù)變化曲線如圖11所示。由圖11可知,當(dāng)?shù)螖?shù)不足20次時(shí),即迭代前期平均適應(yīng)度和最佳適應(yīng)度均呈快速下降趨勢(shì),隨著迭代次數(shù)的不斷增加至60次時(shí),迭代后期整體趨于平緩,其中雖然略有波動(dòng),但整體起伏不大。表明遺傳算法迭代次數(shù)選擇合理,遺傳算法可以快速準(zhǔn)確有效地優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)值閾值。
圖11 遺傳算法適應(yīng)度曲線Fig.11 Fitness curves of genetic algorithm
均方根誤差(RMSE)是衡量神經(jīng)網(wǎng)絡(luò)性能的最常用參考標(biāo)準(zhǔn),RMSE越小,表示此神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)性能越好。由圖12可知,隨著樣本訓(xùn)練次數(shù)的不斷增加,均方根誤差由初始值0.6不斷減少,在樣本訓(xùn)練次數(shù)達(dá)到10次時(shí),均方根誤差已減至0.01,表明基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型能夠準(zhǔn)確快速擬合輸入數(shù)據(jù),預(yù)測(cè)結(jié)果接近真實(shí)情況。
圖12 基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差曲線Fig.12 BP neural network training error curve based on genetic algorithms
利用9 000組數(shù)據(jù)訓(xùn)練的基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)4 000組測(cè)試數(shù)據(jù)時(shí),正確組數(shù)為3 871,正確率為96.77%。由此可見(jiàn),基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果與實(shí)際作業(yè)情況基本一致,錯(cuò)誤率為3.23%,可準(zhǔn)確有效評(píng)價(jià)拖拉機(jī)田間旋耕工況作業(yè)質(zhì)量。
(1)基于我國(guó)“七區(qū)二十三帶”農(nóng)業(yè)戰(zhàn)略格局,建立了全國(guó)范圍的拖拉機(jī)測(cè)試終端布局,完成了測(cè)試終端硬件、測(cè)試工況以及測(cè)試系統(tǒng)功能架構(gòu)。
(2)分析了拖拉機(jī)作業(yè)載荷數(shù)據(jù)庫(kù)系統(tǒng)需求、管理機(jī)制、網(wǎng)絡(luò)架構(gòu)以及功能結(jié)構(gòu),設(shè)計(jì)并搭建了拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)系統(tǒng),可實(shí)時(shí)獲取、存儲(chǔ)拖拉機(jī)各關(guān)鍵零部件的田間作業(yè)載荷數(shù)據(jù)。
(3)研究了神經(jīng)網(wǎng)絡(luò)與遺傳算法的融合算法,并基于拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)對(duì)拖拉機(jī)田間旋耕作業(yè)質(zhì)量進(jìn)行實(shí)時(shí)預(yù)測(cè)與評(píng)價(jià),預(yù)測(cè)精度達(dá)96.77%,均方根誤差(RMSE)小于0.01,說(shuō)明采用基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)算法的拖拉機(jī)作業(yè)載荷數(shù)據(jù)平臺(tái)預(yù)測(cè)評(píng)價(jià)拖拉機(jī)田間旋耕作業(yè)質(zhì)量可行。