李湘文,周輔杰,崔 崴,鄧琴秀,張輝雨
(成都理工大學(xué) 工程技術(shù)學(xué)院,四川 樂(lè)山 614000)
地下煤礦的惡劣的和狹窄的工作條件,導(dǎo)致采礦業(yè)被列為最危險(xiǎn)的行業(yè)。中國(guó)是產(chǎn)煤大國(guó),存在煤層儲(chǔ)藏條件差,地下礦井安全監(jiān)測(cè)設(shè)施不足和安全技術(shù)落后等問(wèn)題[1],因此,對(duì)地下煤礦環(huán)境進(jìn)行持續(xù)、準(zhǔn)確的監(jiān)測(cè)顯得非常重要。
近年來(lái),無(wú)線傳感器網(wǎng)絡(luò)(WSNs),射頻識(shí)別(RFID)和云計(jì)算等領(lǐng)域的發(fā)展,引領(lǐng)了物聯(lián)網(wǎng)(IoT)在智能電網(wǎng)、電子健康服務(wù)、家庭自動(dòng)化、環(huán)境監(jiān)測(cè)等領(lǐng)域的發(fā)展?;贗oT的實(shí)時(shí)監(jiān)測(cè)能夠?qū)崿F(xiàn)準(zhǔn)確、經(jīng)濟(jì)和可靠的環(huán)境監(jiān)測(cè)。Jo和Khan[2]在地下煤礦中引入了一個(gè)基于STM32的開(kāi)源、經(jīng)濟(jì)高效的物聯(lián)網(wǎng)系統(tǒng),用于早期預(yù)警和事件報(bào)告。Dixon等[3]將神經(jīng)網(wǎng)絡(luò)應(yīng)用于瓦斯監(jiān)測(cè)數(shù)據(jù)中,預(yù)測(cè)礦井環(huán)境中甲烷氣體的濃度。這些文獻(xiàn)側(cè)重于煤礦環(huán)境監(jiān)測(cè)的無(wú)線傳感器的實(shí)施。
礦井空氣質(zhì)量評(píng)價(jià)與預(yù)測(cè)對(duì)提高礦井安全起著至關(guān)重要的作用。這不僅可以減少礦工與惡劣空氣的接觸,還可以有效控制礦井通風(fēng)。然而,空氣質(zhì)量變量的復(fù)雜和非線性行為超出了簡(jiǎn)單的數(shù)學(xué)預(yù)測(cè)公式的能力。在這方面,各種統(tǒng)計(jì)工具,如ARIMA、多重線性回歸(MLR)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、模糊時(shí)間序列和主成分分析(PCA),在準(zhǔn)確評(píng)價(jià)空氣質(zhì)量和預(yù)測(cè)污染物濃度方面都取得了令人滿(mǎn)意的結(jié)果。有毒氣體濃度是影響空氣質(zhì)量的主要因素,因此,確定特定環(huán)境中存在的污染物的類(lèi)型和數(shù)量是非常重要的。在這方面,統(tǒng)計(jì)工具主成分分析顯示了識(shí)別影響污染物的高能力,而人工神經(jīng)網(wǎng)絡(luò)使預(yù)測(cè)更加準(zhǔn)確。因此,在地下煤礦的惡劣環(huán)境中,主成分分析和人工神經(jīng)網(wǎng)絡(luò)的混合方法可以有效地識(shí)別污染物,并給出準(zhǔn)確的預(yù)測(cè)。
近幾十年來(lái),各種科學(xué)研究使用多變量統(tǒng)計(jì)方法,如聚類(lèi)分析(CA)、主成分分析、因子分析(FA)、判別分析等來(lái)解決環(huán)境和空氣質(zhì)量問(wèn)題。然而,基于特征值求解的主成分分析法是最常用和最簡(jiǎn)單的方法。具體來(lái)說(shuō),在空氣質(zhì)量問(wèn)題上,它已被單獨(dú)使用或與其他方法結(jié)合使用。在目前的研究中,采用主成分分析對(duì)礦井環(huán)境中存在的主要污染源進(jìn)行識(shí)別。
近年來(lái),神經(jīng)網(wǎng)絡(luò)在工程、工業(yè)過(guò)程控制、醫(yī)藥、計(jì)算機(jī)、風(fēng)險(xiǎn)管理和營(yíng)銷(xiāo)等領(lǐng)域顯示出巨大的潛力,循環(huán)神經(jīng)網(wǎng)絡(luò)在復(fù)雜環(huán)境下顯示了高精度預(yù)測(cè)能力[4]。文中旨在開(kāi)發(fā)一個(gè)可靠、具成本效益及高效的物聯(lián)網(wǎng)系統(tǒng),利用機(jī)器學(xué)習(xí)進(jìn)行空氣質(zhì)量預(yù)測(cè)。
該系統(tǒng)專(zhuān)為地下礦井空氣質(zhì)量監(jiān)測(cè)和評(píng)估而設(shè)計(jì)。系統(tǒng)基本架構(gòu)如圖1所示。主要框架包括數(shù)據(jù)采集、數(shù)據(jù)傳輸、空氣質(zhì)量評(píng)價(jià)與預(yù)測(cè)的數(shù)據(jù)處理。傳感節(jié)點(diǎn)單元連接到基于STM32處理器的傳感器模塊,傳感器節(jié)點(diǎn)捕獲空氣質(zhì)量數(shù)據(jù),并通過(guò)LoRa無(wú)線技術(shù)將數(shù)據(jù)通過(guò)基站傳輸?shù)椒?wù)器分析處理數(shù)據(jù),Tensorflow作為神經(jīng)網(wǎng)絡(luò)平臺(tái)進(jìn)行礦井空氣質(zhì)量預(yù)測(cè)。
圖1 系統(tǒng)硬件架構(gòu)
傳感器節(jié)點(diǎn):傳感器的基本功能是測(cè)量礦井環(huán)境中的空氣參數(shù)。傳感器節(jié)點(diǎn)由傳感器模塊、微控制器和無(wú)線發(fā)射機(jī)組成。選擇合適的傳感器來(lái)監(jiān)測(cè)礦井環(huán)境是一個(gè)相對(duì)復(fù)雜的問(wèn)題,它需要綜合考慮測(cè)量范圍、精度和靈敏度等因素。DHT11是一款有已校準(zhǔn)數(shù)字信號(hào)輸出的溫濕度傳感器。其精度濕度+-5%RH,溫度+-2℃,量程濕度20%~90%RH,溫度0℃~50℃。通常情況下,煤礦的工作溫度在15℃到45℃之間變化,濕度在DTH11的特定范圍內(nèi)。這些電位使得DTH11非常適合在地下煤礦中使用。地下煤礦中常見(jiàn)的氣體有CH4,CO2,CO,NO2,H2S和SO2。文中利用MQ-4、MQ-9、MQ-811、MQ-136和MiCS-2714傳感器模塊來(lái)監(jiān)測(cè)各種氣體的濃度。其中,大部分傳感器模塊為金屬氧化物(SnO2),對(duì)揮發(fā)性氣體分子反應(yīng)良好;因此,它們對(duì)于氣體監(jiān)測(cè)更加可靠和有效。此外,傳感器模塊,無(wú)論是用于氣體監(jiān)測(cè)還是用于溫度測(cè)量,都是經(jīng)濟(jì)有效、低功耗、穩(wěn)定的。文中以?xún)?nèi)嵌LoRaWAN的STM32單片機(jī)為基礎(chǔ),用MQ-4、MQ-9、MQ-811、MQ-136、MiCS-2714和DHT11傳感器模塊來(lái)監(jiān)測(cè)煤礦中常見(jiàn)的氣體CH4,CO2,CO,NO2,H2S和SO2以及溫濕度。
通信協(xié)議:LoRa無(wú)線通信協(xié)議已被證明在礦井中具有高透射率、穩(wěn)定性、超低功耗和高通信性能。LoRaWAN是為L(zhǎng)oRa遠(yuǎn)距離通信網(wǎng)絡(luò)設(shè)計(jì)的一套通訊協(xié)議和系統(tǒng)架構(gòu)。一個(gè)LoRaWAN網(wǎng)絡(luò)架構(gòu)中包含了終端、基站、NS(網(wǎng)絡(luò)服務(wù)器)、應(yīng)用服務(wù)器這四個(gè)部分。由若干終端end nodes采集底層數(shù)據(jù),通過(guò)(RF射頻技術(shù)/LoRaWAN技術(shù))把數(shù)據(jù)發(fā)送到網(wǎng)關(guān)(Gateway)基站,再通過(guò)(4G/5G/以太網(wǎng)通信技術(shù))發(fā)送到NS(網(wǎng)絡(luò)服務(wù)器),網(wǎng)絡(luò)服務(wù)器(NS)[5]再把數(shù)據(jù)發(fā)給應(yīng)用程序端(APP)?;緞t對(duì)NS和終端之間的LoRaWAN協(xié)議數(shù)據(jù)做轉(zhuǎn)發(fā)處理,將LoRaWAN數(shù)據(jù)分別承載在了LoRa射頻傳輸和Tcp/IP上。網(wǎng)絡(luò)服務(wù)器再把數(shù)據(jù)發(fā)給應(yīng)用程序端APP。
文中將Tensorflow應(yīng)用于礦井空氣質(zhì)量循環(huán)神經(jīng)網(wǎng)絡(luò)模型的開(kāi)發(fā)、訓(xùn)練和測(cè)試上[6]。Tensorflow是用于數(shù)值計(jì)算的開(kāi)源軟件庫(kù),可以在創(chuàng)建深度學(xué)習(xí)網(wǎng)絡(luò)時(shí)對(duì)數(shù)據(jù)進(jìn)行數(shù)值和圖形計(jì)算。用Tensorflow建立循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型[7],煤礦環(huán)境指數(shù)(MEI)的多層感知循環(huán)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)架構(gòu)[8]如圖2所示。
圖2 煤礦環(huán)境指數(shù)(MEI)的多層感知循環(huán)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)架構(gòu)
由于開(kāi)采過(guò)程中煤層中排放的CH4,CO2,CO,NO2,H2S和SO2等氣體的存在[9],地下煤礦的環(huán)境相對(duì)惡劣。露天或室內(nèi)空氣質(zhì)量指標(biāo)不足以完全代表井下空氣質(zhì)量。應(yīng)該有一個(gè)能真實(shí)反映礦井環(huán)境并能輕易評(píng)估礦井空氣質(zhì)量的可用指標(biāo)。為了快速評(píng)估和簡(jiǎn)化礦井空氣質(zhì)量的解釋?zhuān)闹幸肓说V井環(huán)境指數(shù)(mine environmental index,MEI)。
MEIP=(MEIHi-MEILo)×CP
(1)
其中,MEIP為污染物p的指標(biāo)值,MEI值分為五類(lèi):非常好,良好,中等,差和非常差;CP為給定污染物p的輸入濃度。
各種氣體對(duì)礦山空氣質(zhì)量指數(shù)(MEI)如表1所示。
表1 各種氣體對(duì)礦山空氣質(zhì)量指數(shù)(MEI)(氣體濃度(ppm))
在實(shí)施任何統(tǒng)計(jì)方法之前,有必要對(duì)收集到的數(shù)據(jù)進(jìn)行預(yù)處理,以便提取傳感器響應(yīng)的實(shí)質(zhì)特征,從而產(chǎn)生用于進(jìn)一步處理的特征。文中將轉(zhuǎn)換作為預(yù)處理的一個(gè)初始步驟,使用平均值為0,標(biāo)準(zhǔn)差為1的Z變換進(jìn)行,Z變換計(jì)算公式為:
Zij=(Xij-μ)×σ
(2)
其中,Zij為變量i的第j個(gè)值,Xij為變量i的第j個(gè)觀測(cè)值,μ為平均值,σ為標(biāo)準(zhǔn)差。
Z尺度變換確保任何統(tǒng)計(jì)過(guò)程中變量的權(quán)重相等。這種轉(zhuǎn)換均勻了分布方差,降低了由于數(shù)據(jù)集大小不同而產(chǎn)生任何錯(cuò)誤的概率。
主成分分析(principal component analysis,PCA)[10],是最有價(jià)值的統(tǒng)計(jì)方法之一,它將N維數(shù)據(jù)壓縮并轉(zhuǎn)換成一個(gè)新的N維數(shù)據(jù)集。PCA通過(guò)線性變換將原始數(shù)據(jù)變換為一組各維度線性無(wú)關(guān)的表示,可用于提取數(shù)據(jù)的主要特征分量,用于高維數(shù)據(jù)的降維[11]。這項(xiàng)研究使用主成分分析方法來(lái)確定礦井環(huán)境中最重要的污染物。
人工神經(jīng)網(wǎng)絡(luò)是人工智能中應(yīng)用最廣泛的信息處理系統(tǒng),神經(jīng)網(wǎng)絡(luò)由幾個(gè)相互連接的神經(jīng)元組成,能夠根據(jù)內(nèi)部或外部數(shù)據(jù)改變其結(jié)構(gòu)。循環(huán)神經(jīng)網(wǎng)絡(luò)可以訓(xùn)練非線性和復(fù)雜數(shù)據(jù)[12],可以在時(shí)間序列上有延拓,便于分析連續(xù)的數(shù)據(jù),主成分分析的輸出被用作循環(huán)神經(jīng)網(wǎng)絡(luò)模型的輸入[13],以準(zhǔn)確地預(yù)測(cè)空氣質(zhì)量。將主成分分析結(jié)果與人工神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)相結(jié)合,識(shí)別出對(duì)環(huán)境影響顯著的污染源。在循環(huán)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)中,第一層是輸入層,負(fù)責(zé)信息的收集、誤差的消除,并將數(shù)據(jù)傳輸?shù)窖h(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[14-15]。第二層是隱藏層,有任意數(shù)量的神經(jīng)元和若干層。神經(jīng)元在前饋和后向傳播的過(guò)程中被激活,從而提供各層之間的連接。隱藏層在輸入層和輸出層之間接收和傳輸數(shù)據(jù)[16]。圖2顯示了使用主成分分析輸入來(lái)確定MEI的循環(huán)神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)。
循環(huán)神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性和訓(xùn)練能力高度依賴(lài)于最佳神經(jīng)元數(shù)量的選擇。在本例中,RNN是用Tensorflow設(shè)計(jì)的,其權(quán)重由隨機(jī)化函數(shù)決定。模型使用80%的整個(gè)數(shù)據(jù)集,剩余20%的數(shù)據(jù)集用于測(cè)試。
課題組實(shí)驗(yàn)場(chǎng)所在山西石泉煤業(yè)某礦井正在運(yùn)營(yíng)地下煤礦的主要巷道內(nèi),拱形直巷道的尺寸為1.8米×2.2米,傳感器模塊單元安裝到礦井隧道洞口的屋頂中心,所有傳感器模塊都通過(guò)LoRa協(xié)議連接到基站,巷道共安裝32個(gè)傳感器,數(shù)據(jù)采集率設(shè)定為5分鐘。每個(gè)傳感器每天有288組數(shù)據(jù),15天收集了138 240組樣本,在這些數(shù)據(jù)集中,110 592組數(shù)據(jù)被用來(lái)訓(xùn)練模型,并且對(duì)27 548組數(shù)據(jù)進(jìn)行測(cè)試。在完成訓(xùn)練后,對(duì)超過(guò)一個(gè)月的MEI數(shù)據(jù)集進(jìn)行了預(yù)測(cè)。
主成分分析的輸入是8個(gè)不同變量的傳感器讀數(shù)。主成分分析提取給出了主要成分。
文中將絕對(duì)值大于0.85的變量因子(表示相對(duì)較強(qiáng)的荷載)設(shè)定為閾值限制值。主成分分析提取給出的主要成分分別為:濕度:-0.746;CH4:0.912;CO2:0.835;CO:0.059;NO2:0.768;SO2:0.872;H2S:0.926。這表明了滿(mǎn)足0.85閾值限制條件的成分。這些成分CH4、CO2、SO2和CO以及溫度是該礦空氣中的主要污染因子。在這些污染物中,對(duì)溫度,CH4、CO2、CO和SO2的負(fù)荷因子貢獻(xiàn)率為65.16%。這些影響因素主要與地下煤礦礦井環(huán)境中常見(jiàn)的氣體有關(guān)。在這些氣體中,CH4和SO2通常以氣穴的形式被煤層所限制。在煤炭開(kāi)采過(guò)程中,這些礦坑爆裂,并向礦井空氣中釋放氣體。礦井環(huán)境中CO2的主要原因可能是工人的呼吸活動(dòng),以及任何柴油機(jī)械的排氣。
為了建立循環(huán)神經(jīng)網(wǎng)絡(luò)模型,以原始成分和主成分分析提取成分為輸入,測(cè)試了不同數(shù)量神經(jīng)元的網(wǎng)絡(luò)結(jié)構(gòu)。在這些循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,神經(jīng)元的最佳數(shù)目是根據(jù)MAE(平均絕對(duì)誤差)、RMSE(均方根誤差)、RSE(殘差的標(biāo)準(zhǔn)誤差)和R2(確定系數(shù))來(lái)確定的。神經(jīng)元的數(shù)量逐漸增加,用主成分分析的情況下,原始和主成分分析提取成分作為輸入的神經(jīng)元數(shù)量不同的驗(yàn)證模型如表2所示。對(duì)于原始數(shù)據(jù)集,給出最小誤差的最佳神經(jīng)元的數(shù)目為20,而對(duì)于主成分分析提取的數(shù)據(jù)集,神經(jīng)元的最佳數(shù)目為8。
表2 原始數(shù)據(jù)集為輸入,主成分分析提取成
將該模型與多元線性回歸(MLR)、主成分分析、循環(huán)神經(jīng)網(wǎng)絡(luò)定義的模型進(jìn)行了性能比較。對(duì)于所有這些模型,MAE、RMSE、RAE和RSE都進(jìn)行了比較,因?yàn)榻咏愕腻e(cuò)誤值表示一個(gè)更好的模型。另一方面,通過(guò)計(jì)算確定系數(shù)(R2)來(lái)檢驗(yàn)?zāi)P偷臏?zhǔn)確性。在這些試驗(yàn)中,模型的高精度值接近1。因此,模型的精度可能因預(yù)測(cè)所需的時(shí)間間隔而異。對(duì)于地下礦井,存在一些局限性;因此有必要預(yù)測(cè)瓦斯?jié)舛?。最佳預(yù)測(cè)模型為主成分分析-循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),MAE、RMSE和RSE分別為0.085 2、0.120 4和0.510 8。此外,測(cè)定系數(shù)R2為0.489 0;MEI預(yù)測(cè)模型的性能指標(biāo)如表3所示。
表3 MEI預(yù)測(cè)模型的性能指標(biāo)
主成分分析將線性回歸模型的準(zhǔn)確度提高了約2.23%,在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的情況下提高了17.8%。結(jié)果表明,主成分分析與RNN相結(jié)合,提高了礦井大氣污染物的預(yù)測(cè)精度。因此,主成分分析的應(yīng)用有助于與空氣質(zhì)量有關(guān)的預(yù)測(cè)研究。
近年來(lái),人工智能計(jì)算能力徹底改變了復(fù)雜和非線性數(shù)據(jù)問(wèn)題的解決方案。地下煤礦中存在的空氣污染物總是呈現(xiàn)非線性,最終導(dǎo)致預(yù)測(cè)不確定,預(yù)警可靠性降低。因此,提出的基于物聯(lián)網(wǎng)的礦井空氣質(zhì)量監(jiān)測(cè)、評(píng)估和預(yù)報(bào)系統(tǒng),利用Tensorflow預(yù)測(cè)空氣質(zhì)量,并有可能通過(guò)預(yù)警廣泛提高地下礦井安全性。該系統(tǒng)安裝在一個(gè)運(yùn)行中的煤礦井下,并提出空氣質(zhì)量評(píng)估模型來(lái)確定MEI,提高地下礦井安全性。IoT監(jiān)測(cè)煤礦環(huán)境參數(shù),主成分分析結(jié)果表明,四種礦井氣體(CH4、SO2、CO和H2S)對(duì)礦井空氣質(zhì)量影響最大。與單線性回歸和RNN模型相比,所提出的RNN+主成分分析模型預(yù)測(cè)MEI更準(zhǔn)確。該研究表明,經(jīng)過(guò)適當(dāng)訓(xùn)練的RNN模型可以有效地預(yù)測(cè)MEI。
該系統(tǒng)通過(guò)預(yù)處理傳感器,有效緩解了礦井環(huán)境變量的非線性行為,如溫度、濕度、CO2、CH4、CO、SO2和H2S數(shù)據(jù)。數(shù)據(jù)作為人工神經(jīng)網(wǎng)絡(luò)模型的輸入數(shù)據(jù)集上傳到Tensorflow計(jì)算。主成分分析結(jié)果表明,四種礦井氣體(CH4、SO2、CO和H2S)對(duì)礦井空氣質(zhì)量影響最大。神經(jīng)網(wǎng)絡(luò)的多層感知器能準(zhǔn)確地預(yù)測(cè)MEI。由于人工神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性和有效性與輸入?yún)?shù)和隱藏層神經(jīng)元數(shù)目高度相關(guān),因此可以通過(guò)觀測(cè)最小誤差來(lái)確定隱藏層神經(jīng)元的最佳數(shù)目。
盡管實(shí)驗(yàn)結(jié)果表明預(yù)測(cè)準(zhǔn)確,但仍存在一些局限性。這些限制包括地下煤礦的惡劣環(huán)境、數(shù)據(jù)隱私以及多傳感器輸出的集成。此外,文中只考慮了八個(gè)空氣質(zhì)量參數(shù),忽略了可能對(duì)礦山環(huán)境造成更嚴(yán)重影響的參數(shù)。文中依賴(lài)于隨時(shí)間變化的空氣污染物濃度,而其他與預(yù)測(cè)效果相關(guān)的因素則被忽略。未來(lái)還需要在以下方向繼續(xù)探究:首先,確定污染物的復(fù)雜非線性行為;濃度需要一個(gè)更精確的混合模型,以增強(qiáng)早期預(yù)警。其次,高污染物濃度是影響空氣質(zhì)量的主要因素,因此,需要建立一個(gè)預(yù)測(cè)大氣污染物峰值濃度的模型。