肖雙雙,馬亞潔,李衛(wèi)炎,劉 錦
(1.西安科技大學(xué) 能源學(xué)院,陜西 西安 710054;2.浙江交通資源投資集團(tuán)有限公司,浙江 杭州 310020)
露天礦產(chǎn)塵點(diǎn)多、粉塵量大、擴(kuò)散范圍廣,影響職工健康,加速設(shè)備磨損,影響生產(chǎn)效率和生產(chǎn)安全,污染周邊生態(tài)環(huán)境。露天礦粉塵職業(yè)危害已成為礦山領(lǐng)域最重要的職業(yè)健康問題,并產(chǎn)生較大的社會(huì)影響。在國家加快推進(jìn)生態(tài)文明建設(shè)、大力推進(jìn)綠色礦山建設(shè)的背景下,露天礦粉塵防控已成為亟待解決的重大行業(yè)問題[1]。為更精準(zhǔn)高效的開展粉塵防治工作,需要對(duì)各產(chǎn)塵點(diǎn)的粉塵濃度進(jìn)行精準(zhǔn)預(yù)測(cè),粉塵濃度預(yù)測(cè)是實(shí)施粉塵污染防治的前提,是指導(dǎo)各類防治措施的實(shí)施準(zhǔn)則。如何從產(chǎn)塵環(huán)節(jié)中挖掘關(guān)鍵的特征因素,建立有效的粉塵濃度預(yù)測(cè)模型,近年來已經(jīng)成為國內(nèi)外的研究共識(shí)和熱點(diǎn)。
國內(nèi)外學(xué)者通過理論分析、現(xiàn)場(chǎng)監(jiān)測(cè)等研究了溫度、濕度、風(fēng)速、風(fēng)力、風(fēng)向、剝離量、采煤量等因素對(duì)粉塵濃度的影響,選取風(fēng)速、風(fēng)向、溫度、濕度、產(chǎn)煤量、剝離量等指標(biāo)建立粉塵濃度預(yù)測(cè)指標(biāo)體系,采用時(shí)間序列、線性回歸、灰色理論、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、求和自回歸移動(dòng)平均-廣義神經(jīng)網(wǎng)絡(luò)回歸(ARIMA-GRNN)組合算法、灰色-廣義回歸神經(jīng)網(wǎng)絡(luò)(GM-GRNN)組合算法等構(gòu)建了多種粉塵濃度預(yù)測(cè)模型,能夠?qū)Ψ蹓m濃度的發(fā)展趨勢(shì)做出大致預(yù)測(cè)。為提高粉塵濃度預(yù)測(cè)的準(zhǔn)確率,一些學(xué)者在模型預(yù)測(cè)方法的研究中不局限于單一傳統(tǒng)的數(shù)學(xué)算法預(yù)測(cè),而是逐漸引入機(jī)器學(xué)習(xí),采用生物智能優(yōu)化算法結(jié)合機(jī)器學(xué)習(xí)建立粉塵濃度預(yù)測(cè)模型,如粒子群-BP神經(jīng)網(wǎng)絡(luò)(PSO-BP)組合預(yù)測(cè)模型[2]。但是隨著各種方法模型的不斷涌現(xiàn),在粉塵濃度預(yù)測(cè)模型的研究現(xiàn)狀與發(fā)展趨勢(shì)方面的評(píng)述較少,預(yù)測(cè)方法的現(xiàn)狀和演進(jìn)趨勢(shì)仍然不清楚。近年來文獻(xiàn)計(jì)量分析已在多個(gè)學(xué)科中應(yīng)用,發(fā)文量呈逐年遞增的趨勢(shì),基于文獻(xiàn)計(jì)量學(xué)分析露天礦粉塵濃度預(yù)測(cè)研究現(xiàn)狀與展望,檢索并梳理國內(nèi)外相關(guān)研究進(jìn)展,有利于充分了解露天礦粉塵濃度預(yù)測(cè)的研究現(xiàn)狀,分析粉塵濃度與各類影響因素之間的關(guān)系,正確、有效的開展粉塵預(yù)測(cè)研究工作,幫助露天礦更好的制定粉塵防治策略。
因此,基于CNKI和Web of Science收錄的526篇粉塵濃度預(yù)測(cè)相關(guān)文獻(xiàn),采用CiteSpace與VOSviewer知識(shí)圖譜可視化軟件進(jìn)行統(tǒng)計(jì)分析及數(shù)據(jù)挖掘,揭示粉塵濃度預(yù)測(cè)的研究熱點(diǎn)、研究方法和發(fā)展過程,系統(tǒng)歸納了露天礦粉塵濃度影響因素、指標(biāo)體系的研究現(xiàn)狀,梳理了粉塵濃度預(yù)測(cè)方法隨時(shí)間的演進(jìn)趨勢(shì),提煉出預(yù)測(cè)方法的4大類型,并分類展開詳述,提出露天礦粉塵濃度預(yù)測(cè)研究展望,以期為露天礦粉塵濃度預(yù)測(cè)的深入研究提供參考。
為對(duì)粉塵濃度預(yù)測(cè)的研究現(xiàn)狀和發(fā)展趨勢(shì)進(jìn)行詳細(xì)分析,通過對(duì)近40 a國內(nèi)外粉塵濃度預(yù)測(cè)相關(guān)的文獻(xiàn)進(jìn)行檢索,檢索方法如下。
數(shù)據(jù)來源:中國知網(wǎng)(CNKI)、Web of Science(WOS)。
檢索區(qū)間:1981年1月1日—2022年12月31日。
檢索主題:SU=“粉塵濃度預(yù)測(cè)”+“PM2.5濃度預(yù)測(cè)”+“濃度預(yù)測(cè)模型”。
研究方法:計(jì)量學(xué)、可視化分析。
運(yùn)行環(huán)境:VOSviewer、CiteSpace。
共檢索到文獻(xiàn)526篇(CNKI 389篇、WOS 137篇),研究“礦山粉塵預(yù)測(cè)”的相關(guān)文獻(xiàn)共220篇(CNKI 40篇、WOS 180篇),研究“露天礦粉塵預(yù)測(cè)”的相關(guān)文獻(xiàn)共48篇(CNKI 9篇、WOS 39篇),由于不同領(lǐng)域的粉塵濃度預(yù)測(cè)方法類似、指標(biāo)體系不同,為全面歸納粉塵濃度預(yù)測(cè)方法發(fā)展動(dòng)態(tài),基于526篇文獻(xiàn),運(yùn)用CiteSpace、VOSviewer軟件從文獻(xiàn)計(jì)量學(xué)的角度生成研究?jī)?nèi)容的高頻關(guān)鍵詞的聚類圖譜和演化趨勢(shì)圖譜,對(duì)1981年—2022年的粉塵濃度預(yù)測(cè)相關(guān)研究熱點(diǎn)進(jìn)行可視化分析。
國內(nèi)外關(guān)于粉塵濃度預(yù)測(cè)的研究領(lǐng)域發(fā)表成果及發(fā)展趨勢(shì),如圖1所示,2013年以前該領(lǐng)域研究論文數(shù)量較少,PM 2.5、粉塵濃度預(yù)測(cè)論文發(fā)表數(shù)量每年基本保持在1~2篇,2014—2018年該領(lǐng)域發(fā)文量開始增加,中英文文獻(xiàn)數(shù)量分別維持在每年25篇左右,總體上論文數(shù)量呈上升趨勢(shì),隨著計(jì)算機(jī)科學(xué)技術(shù)的迅速發(fā)展,人工智能、機(jī)器學(xué)習(xí)、大數(shù)據(jù)技術(shù)等的興起,與計(jì)算機(jī)技術(shù)進(jìn)行學(xué)科交叉的方法技術(shù)不斷應(yīng)用于各行業(yè)領(lǐng)域,自2019年起發(fā)文量顯著增加,文獻(xiàn)數(shù)量增長(zhǎng)主要體現(xiàn)在基于機(jī)器學(xué)習(xí)的智能預(yù)測(cè)方法。
1.3.1 高頻熱點(diǎn)關(guān)鍵詞
關(guān)鍵詞代表著文獻(xiàn)研究主題,利用VOSviewer對(duì)關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析,如圖2、圖3所示。圖中不同顏色代表不同的研究主題,節(jié)點(diǎn)的大小代表該研究?jī)?nèi)容共現(xiàn)頻率的高低,線條的粗細(xì)代表研究?jī)?nèi)容的關(guān)聯(lián)強(qiáng)度。從圖2、圖3可以看出,在粉塵濃度預(yù)測(cè)方面,PM 2.5、預(yù)測(cè)模型、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、粒子群優(yōu)化、組合預(yù)測(cè)等關(guān)鍵詞出現(xiàn)頻率較高,這些關(guān)鍵詞體現(xiàn)了研究的熱點(diǎn)主題。
圖2 中文文獻(xiàn)高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)Fig.2 Network of high-frequency keyword co-occurrence in Chinese literature
1.3.2 聚類主體分析
基于CiteSpace軟件的K值聚類分析,設(shè)定參數(shù)K=10,提取10個(gè)聚類團(tuán),生成粉塵濃度預(yù)測(cè)研究關(guān)鍵詞聚類圖譜,如圖4所示。
圖4 粉塵濃度預(yù)測(cè)研究關(guān)鍵詞聚類Fig.4 Keyword cluster in dust concentration prediction study
粉塵濃度預(yù)測(cè)研究大致可分為:環(huán)境影響因素、預(yù)測(cè)模型(時(shí)間序列、神經(jīng)網(wǎng)絡(luò)、灰色模型),模型優(yōu)化(機(jī)器學(xué)習(xí))、預(yù)測(cè)控制、結(jié)果影響(塵肺病)10大聚類團(tuán),基于機(jī)器學(xué)習(xí)的模型優(yōu)化預(yù)測(cè)是該領(lǐng)域研究的主流。
1.3.3 關(guān)鍵詞聚類的時(shí)區(qū)演化
運(yùn)用CiteSpace可視化分析軟件提取1~7個(gè)高頻關(guān)鍵詞,該時(shí)間軸主要針對(duì)該領(lǐng)域研究熱點(diǎn)與發(fā)展趨勢(shì)進(jìn)行分析,從時(shí)間軸可看出,早期的研究方法主要為壽命表法、灰色理論、線性預(yù)測(cè)等傳統(tǒng)方法。隨著大數(shù)據(jù)、人工智能的發(fā)展,自1995年后,運(yùn)用神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等機(jī)器學(xué)習(xí)算法預(yù)測(cè)粉塵濃度逐漸成為新的研究熱點(diǎn),從2005年起,基于粒子群算法、遺傳算法、蟻群算法等優(yōu)化算法的組合預(yù)測(cè)模型逐漸取代BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等單一的預(yù)測(cè)模型,如圖5所示。
圖5 粉塵濃度預(yù)測(cè)研究熱點(diǎn)時(shí)間軸Fig.5 Spot timeline for dust concentration prediction
粉塵濃度預(yù)測(cè)過程主要是通過對(duì)現(xiàn)場(chǎng)監(jiān)測(cè)到的數(shù)據(jù)進(jìn)行收集和預(yù)處理,根據(jù)數(shù)據(jù)特征采用合適的預(yù)測(cè)算法建立粉塵濃度預(yù)測(cè)模型,確定其模型參數(shù),分析影響粉塵濃度的關(guān)鍵因素,通過優(yōu)化算法調(diào)整優(yōu)化其參數(shù),對(duì)結(jié)果進(jìn)行修正,提高預(yù)測(cè)結(jié)果的準(zhǔn)確率,如圖6所示。粉塵濃度預(yù)測(cè)的核心包括選取粉塵濃度影響因素,構(gòu)建粉塵濃度預(yù)測(cè)指標(biāo)體系,建立粉塵濃度預(yù)測(cè)模型[2]。
圖6 粉塵濃度預(yù)測(cè)過程描述Fig.6 Description of the dust concentration prediction process
露天礦作業(yè)的每個(gè)環(huán)節(jié)都伴隨著粉塵的產(chǎn)生,露天礦作業(yè)環(huán)境敞露于地表,鉆孔、爆破、采裝、運(yùn)輸、排卸各環(huán)節(jié)都會(huì)產(chǎn)生大量粉塵,由此帶來的粉塵污染更為嚴(yán)重。產(chǎn)塵量與所用機(jī)械設(shè)備類型、生產(chǎn)強(qiáng)度、巖石性質(zhì)、開采方法以及自然條件等眾多因素有關(guān)。目前,國內(nèi)外學(xué)者通過理論分析、現(xiàn)場(chǎng)監(jiān)測(cè)等研究了溫度、濕度、風(fēng)速、風(fēng)力、風(fēng)向、剝離量、采煤量等因素對(duì)粉塵濃度的影響。如WANG等對(duì)西北哈爾烏素露天煤礦的粉塵污染進(jìn)行了分析,得出影響粉塵濃度的因素順序?yàn)椋寒a(chǎn)煤量>邊界層高度>風(fēng)速>溫差>溫度>濕度[3]。QI等在對(duì)影響PM濃度的重要性分析時(shí),除當(dāng)前PM濃度受前5 min PM濃度的影響外,其他影響因素順序?yàn)椋簼穸?溫度>噪聲級(jí)>風(fēng)速>風(fēng)向[1]。LI等對(duì)TSP濃度預(yù)測(cè)時(shí)根據(jù)影響因素的重要程度分配權(quán)重,結(jié)果顯示TSP在08∶00~09∶00期間最高,在15∶00~16∶00期間最低。分析其原因主要影響因素為:氣象參數(shù)、正常作業(yè)以及逆溫層[4]?;粑牡确治鎏卣髯兞恐匾?認(rèn)為環(huán)境影響因素中,濕度對(duì)粉塵濃度影響最大,其次是溫度、噪聲,風(fēng)速、風(fēng)力及風(fēng)向影響較小,如圖7所示[4]。CHINTHALA等通過結(jié)合風(fēng)穿透效應(yīng),研究了風(fēng)侵角和擴(kuò)散系數(shù)對(duì)PM10濃度的影響,研究表明風(fēng)侵角隨露天礦深度的變化對(duì)PM 10截留有顯著影響[5]。
圖7 粉塵濃度影響因素重要性[6]Fig.7 Importance of factors affecting dust concentration
露天礦的生產(chǎn)塵源主要來自鉆孔、爆破、采裝、運(yùn)輸、排卸等作業(yè)環(huán)節(jié)。在鉆孔作業(yè)下,粉塵顆粒由孔底高速噴出孔口而產(chǎn)生高濃度粉塵;爆破環(huán)節(jié)礦巖爆破瞬間會(huì)在爆區(qū)周圍產(chǎn)生濃度極高的粉塵顆粒,污染周邊環(huán)境。采裝、運(yùn)輸、排卸等環(huán)節(jié)因礦巖間摩擦碰撞和道路運(yùn)輸產(chǎn)生大量的揚(yáng)塵。一般認(rèn)為剝離量和采煤量越大,即生產(chǎn)強(qiáng)度越大,產(chǎn)塵量就越大。
溫度對(duì)粉塵濃度的影響主要由逆溫現(xiàn)象導(dǎo)致空氣流動(dòng)性受阻,溫度較低時(shí),粉塵無法擴(kuò)散,造成嚴(yán)重的空氣污染。一般濕度越大空氣中水分子含量越多,空氣相對(duì)濕度對(duì)粉塵濃度預(yù)測(cè)結(jié)果有顯著影響。風(fēng)速、風(fēng)力是粉塵擴(kuò)散速度的直接影響因素,在露天礦采場(chǎng)內(nèi)部,較小的風(fēng)速也可能產(chǎn)生揚(yáng)塵,增加空氣中粉塵濃度。風(fēng)向影響粉塵擴(kuò)散方向,具有隨機(jī)性和不確定性。
因此,生產(chǎn)強(qiáng)度大小決定了產(chǎn)塵量的多少,氣象因素決定粉塵的聚集與擴(kuò)散。根據(jù)影響因素選擇預(yù)測(cè)指標(biāo),建立粉塵濃度預(yù)測(cè)指標(biāo)體系是粉塵濃度精準(zhǔn)預(yù)測(cè)的關(guān)鍵。目前,該指標(biāo)體系主要分為氣象類指標(biāo)和生產(chǎn)類指標(biāo)2大類。氣象類指標(biāo)包括風(fēng)速、風(fēng)向、溫度、濕度等;生產(chǎn)類指標(biāo)包括產(chǎn)煤量、剝離量、生產(chǎn)噪聲等[7],如圖8所示。
計(jì)量學(xué)可視化分析得出粉塵濃度預(yù)測(cè)方法主要是沿著早期的壽命表、宏觀測(cè)算、經(jīng)驗(yàn)類比法等傳統(tǒng)方法發(fā)展為時(shí)間序列、線性回歸、灰色理論等方法,再延伸至近年的人工神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、支持向量機(jī)以及生物智能算法優(yōu)化機(jī)器學(xué)習(xí)等組合方法的研究脈絡(luò)發(fā)展的?;诳梢暬治鼋Y(jié)果,將粉塵濃度預(yù)測(cè)相關(guān)方法進(jìn)行歸類,系統(tǒng)的分析對(duì)比各方法的特點(diǎn)和適用范圍,將應(yīng)用次數(shù)較高的預(yù)測(cè)方法和模型進(jìn)行匯總,見表1。目前的粉塵濃度預(yù)測(cè)方法分為定性和半定量預(yù)測(cè)、線性回歸預(yù)測(cè)、機(jī)器學(xué)習(xí)預(yù)測(cè)以及組合預(yù)測(cè)4大類。
2.2.1 定性和半定量預(yù)測(cè)
壽命表、宏觀測(cè)算、經(jīng)驗(yàn)類比法為傳統(tǒng)預(yù)測(cè)方法。傳統(tǒng)預(yù)測(cè)方法大致可分為定性預(yù)測(cè)和半定量預(yù)測(cè)2種,在定性預(yù)測(cè)方法的應(yīng)用中,王美霞等采用職業(yè)衛(wèi)生調(diào)查、類比法、經(jīng)驗(yàn)法預(yù)測(cè)了擬建項(xiàng)目的噪聲與粉塵職業(yè)病危害因素預(yù)期接觸水平,根據(jù)預(yù)測(cè)結(jié)果采取相應(yīng)防護(hù)控制措施[8]。韓磊等通過分析煤礦污染變化趨勢(shì)、煤工塵肺患者發(fā)病特征、暴露水平與發(fā)病的關(guān)系,掌握煤工塵肺病發(fā)病規(guī)律,對(duì)煤工塵肺未來發(fā)病情況做出預(yù)警預(yù)測(cè)[9]。
在半定量預(yù)測(cè)方法的研究中,陳春生等在壽命表法的基礎(chǔ)上增加了肺內(nèi)石英粉塵負(fù)荷量估算法對(duì)鐵路隧道工現(xiàn)場(chǎng)粉塵容許濃度進(jìn)行了估算,并對(duì)該方法的數(shù)據(jù)處理部分稍加改進(jìn),將累積發(fā)病率取了逆正態(tài)分布函數(shù)后再建立的方程,使得結(jié)果更加符合實(shí)際應(yīng)用[10]。沈陽等運(yùn)用貝葉斯決策分析技術(shù)評(píng)估某高速公路隧道掘進(jìn)工粉塵累計(jì)暴露情況,并估計(jì)決策分析最小樣本數(shù)。得出該高速隧道掘進(jìn)工暴露矽塵濃度超標(biāo)嚴(yán)重,基于粉塵測(cè)定的貝葉斯決策分析技術(shù)可實(shí)現(xiàn)累計(jì)暴露預(yù)測(cè)及最少檢測(cè)樣本估算[11]。GHOSE等針對(duì)粉塵排放源展開研究,使用排放因子或預(yù)測(cè)方程對(duì)不同采礦活動(dòng)粉塵排放進(jìn)行量化,重點(diǎn)介紹了本研究在環(huán)境保護(hù)領(lǐng)域的重要性以及該研究可能產(chǎn)生的影響,得出結(jié)論:得以估計(jì)的產(chǎn)塵量可以適當(dāng)評(píng)估對(duì)空氣質(zhì)量的影響,并制定適當(dāng)?shù)目諝馕廴究刂撇呗訹12]。BALAGA等提出并開發(fā)一種基于冪函數(shù)的粉塵濃度預(yù)測(cè)算法功能模型,可針對(duì)不具經(jīng)驗(yàn)數(shù)據(jù)的粉塵分布狀態(tài)進(jìn)行預(yù)測(cè),建立PM10、PM4和PM2.5粉塵顆粒的分布特征,該模型適用范圍廣,不受粉塵粒徑大小以及粉塵源距離限制,為礦山工作者提供更安全高效的粉塵防治策略[13]。TRIPATHY等重點(diǎn)介紹礦井不同作業(yè)區(qū)域的粉塵水平監(jiān)測(cè)、不同來源收集的粉塵表征、粉塵的個(gè)人暴露情況,采用AERMOD軟件對(duì)礦井不同位置和附近區(qū)域的粉塵濃度進(jìn)行了預(yù)測(cè)[14]。傳統(tǒng)方法如粉塵健康風(fēng)險(xiǎn)評(píng)估大多基于定性或者半定量的方法,缺少粉塵暴露的連續(xù)性監(jiān)測(cè),不能在風(fēng)險(xiǎn)概率的基礎(chǔ)上進(jìn)行定量評(píng)估,使得粉塵長(zhǎng)期累積暴露評(píng)估客觀性下降。以上宏觀預(yù)測(cè)模型僅僅能夠反映出預(yù)測(cè)對(duì)象的主要變動(dòng)趨勢(shì),因此傳統(tǒng)的預(yù)測(cè)方法在需求數(shù)據(jù)波動(dòng)較大的復(fù)雜環(huán)境下逐漸被其他更好的方法取代。
2.2.2 線性回歸預(yù)測(cè)模型
粉塵預(yù)報(bào)早期常用理論方法,包括函數(shù)解算法和圖像查找法。隨后有學(xué)者開始采用統(tǒng)計(jì)模型來預(yù)測(cè)預(yù)報(bào),如張志偉等采用灰色理論的預(yù)測(cè)方法,建立了降塵含量的GM生成函數(shù)預(yù)測(cè)模型,對(duì)邯鄲市工業(yè)居民混合區(qū)降塵含量歷年的變化規(guī)律進(jìn)行預(yù)測(cè)研究[15]。陳日輝等用粉塵濃度統(tǒng)計(jì)值建立GM模型,對(duì)原始數(shù)據(jù)進(jìn)行了滑動(dòng)平均處理,該模型預(yù)測(cè)結(jié)果相對(duì)誤差較小[16]。曹玉珍等結(jié)合灰色預(yù)測(cè)模型以及模型的預(yù)測(cè)結(jié)果檢驗(yàn)評(píng)估,以MATLAB語言編寫為開源程序,對(duì)廣州市降塵量進(jìn)行預(yù)測(cè)分析,結(jié)果與實(shí)際情況相符,該程序可應(yīng)用于不同指標(biāo)或同一指標(biāo)不同時(shí)段的建模和模型檢驗(yàn)過程,為灰色模型在各個(gè)領(lǐng)域的廣泛應(yīng)用提供了幫助[27]。
GM灰色理論、直線回歸等方法一般適用于線性趨勢(shì)預(yù)測(cè),因此,不適合對(duì)波動(dòng)較大的數(shù)據(jù)進(jìn)行預(yù)測(cè);對(duì)于非線性和不穩(wěn)定的數(shù)據(jù),還需要預(yù)測(cè)模型具有較強(qiáng)的非線性映射能力。如王月紅等以某礦粉塵濃度時(shí)間序列為基礎(chǔ),提出了差分自回歸移動(dòng)平均預(yù)測(cè)模型,建立ARIMA粉塵濃度預(yù)測(cè)模型,該模型適用于非平穩(wěn)數(shù)據(jù)的處理。得到初步模型后,根據(jù)貝葉斯信息準(zhǔn)則對(duì)比模型的優(yōu)劣,選擇最優(yōu)模型提高預(yù)測(cè)精度[18]。毛煒嶧等通過對(duì)常規(guī)的回歸分析方法加以改進(jìn),綜合滑動(dòng)相關(guān)理論以及集合回歸方法建立超級(jí)集合模型,利用反推法逐級(jí)尋找與沙塵日數(shù)序列有顯著統(tǒng)計(jì)關(guān)系的前期環(huán)流因子,得出它們之間的關(guān)系,為塔里木盆地多發(fā)季節(jié)沙塵日數(shù)的預(yù)測(cè)提供依據(jù)[19]。礦井產(chǎn)量與粉塵排放量之間的線性關(guān)系較弱,采用非線性方法建立模型可以提高結(jié)果的準(zhǔn)確率。
2.2.3 機(jī)器學(xué)習(xí)預(yù)測(cè)模型
在機(jī)器學(xué)習(xí)算法的應(yīng)用中,任屹罡等建立了BP神經(jīng)網(wǎng)絡(luò)模型對(duì)鄭州環(huán)境空氣中粉塵濃度PM10進(jìn)行預(yù)測(cè),以平均氣壓、平均氣溫、平均相對(duì)濕度和平均風(fēng)速這4類氣象因子來預(yù)測(cè),得到預(yù)測(cè)結(jié)果的準(zhǔn)確率可達(dá)86.85%[20]。王布川采用LMBP神經(jīng)網(wǎng)絡(luò)對(duì)煤巷綜掘工作面的粉塵濃度進(jìn)行了預(yù)測(cè),結(jié)果顯示預(yù)測(cè)值誤差在±10%以內(nèi),預(yù)測(cè)結(jié)果可靠[21]。李德根等通過分析各產(chǎn)塵因素對(duì)截割粉塵濃度的影響,建立基于熵權(quán)法的RBF神經(jīng)網(wǎng)絡(luò)模型,分析掘進(jìn)工作面截割粉塵濃度的變化規(guī)律。結(jié)果表明:熵權(quán)法RBF神經(jīng)網(wǎng)絡(luò)可以準(zhǔn)確預(yù)測(cè)掘進(jìn)工作面粉塵濃度[22]。李明等在對(duì)粉塵影響因素分析的基礎(chǔ)上,建立了粉塵SiO2含量、粉塵濃度、接塵時(shí)間與塵肺發(fā)病率之間的關(guān)系,運(yùn)用人工神經(jīng)網(wǎng)絡(luò)技術(shù)來實(shí)現(xiàn)粉塵危害三因素與塵肺病發(fā)病率之間的劑量-反應(yīng)關(guān)系,對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),參數(shù)進(jìn)行選擇調(diào)整,建立了粉塵模擬和預(yù)測(cè)模型[23]。單純用線性模型或非線性模型會(huì)導(dǎo)致信息源不廣泛?jiǎn)栴},合適的組合模型可更好地發(fā)掘數(shù)據(jù)的潛在關(guān)系,提高模型的預(yù)測(cè)精度和穩(wěn)定性,如圖9所示。
2.2.4 組合預(yù)測(cè)模型
人工神經(jīng)網(wǎng)絡(luò)算法雖然能夠處理非線性、非平穩(wěn)數(shù)據(jù),但易陷入局部最優(yōu),且易導(dǎo)致過擬合現(xiàn)象。隨著數(shù)據(jù)增加,冗余性問題也將制約預(yù)測(cè)精度和計(jì)算效率(圖10)。在多種方法綜合預(yù)測(cè)模型的研究中,王永斌等分別建立GM(灰色系統(tǒng))模型、BPNN(反向傳播網(wǎng)絡(luò))模型、GM-GRNN(灰色-廣義回歸神經(jīng)網(wǎng)絡(luò))組合模型對(duì)我國塵肺病發(fā)病人數(shù)進(jìn)行預(yù)測(cè),并根據(jù)誤差分析對(duì)比3種模型的預(yù)測(cè)效果,結(jié)果表明,GM(1,1)-GRNN組合模型的擬合及預(yù)測(cè)效果優(yōu)于GM(1,1)模型和BPNN模型[25],也是首次將多種智能算法相結(jié)合使用。
卞子龍等基于求和自回歸移動(dòng)平均模型(ARIMA)與灰色模型GM(1,1)、廣義神經(jīng)回歸網(wǎng)絡(luò)模型(GRNN)的分別組合,構(gòu)建適合江蘇省塵肺病預(yù)測(cè)的組合模型。通過對(duì)比擬合分析ARIMA預(yù)測(cè)模型、ARIMA-GM組合模型、ARIMA-GRNN組合模型的誤差值得出,在江蘇省塵肺病新病例預(yù)測(cè)中ARIMA-GRNN模型誤差最小,擬合效果最好[26]。周旭等采用時(shí)間序列和神經(jīng)網(wǎng)絡(luò)相結(jié)合的外因輸入非線性自回歸模型(NARX模型)來預(yù)測(cè)粉塵濃度和時(shí)間的關(guān)系,該模型適用于時(shí)序型數(shù)據(jù),可以給不同時(shí)段的輸入之間建立聯(lián)系[27]。劉杰等提出了一種結(jié)合弱化緩沖算子優(yōu)化的分?jǐn)?shù)階累加灰色(FGM)預(yù)測(cè)模型,對(duì)廢氣中煙(粉)塵排放濃度的變化進(jìn)行預(yù)測(cè)和擬合,并對(duì)比分析GAWBO和AWBO以及WAWBO 3種弱化緩沖算子處理后得到的預(yù)測(cè)結(jié)果,發(fā)現(xiàn)運(yùn)用WAWBO算法優(yōu)化過的FGM模型預(yù)測(cè)的數(shù)據(jù)精度高、誤差低,結(jié)果與實(shí)際煙(粉)塵排放情況更符[28],如圖11所示。張易容通過建立傳統(tǒng)回歸、隨機(jī)森林、LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,選取時(shí)間因子、氣象因子及采裝強(qiáng)度作為輸入變量,預(yù)測(cè)哈爾烏素露天煤礦PM2.5濃度值,結(jié)果表明LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型效果較好[29]。王雅寧采用決策樹、馬爾科夫等算法知識(shí),構(gòu)建了屬于露天礦的隨機(jī)森林-馬爾科夫粉塵濃度預(yù)測(cè)模型,通過馬爾科夫修正后的預(yù)測(cè)結(jié)果精度較高[30]。
圖11 弱化后擬合值對(duì)比Fig.11 Comparison of the weakened fitting values
國內(nèi)外學(xué)者對(duì)露天礦粉塵預(yù)測(cè)進(jìn)行了大量的研究,取得了豐富的成果,為后續(xù)研究提供重要的參考。綜合考慮露天礦粉塵產(chǎn)塵機(jī)理、物化特征、影響因素等,構(gòu)建完善露天礦粉塵濃度預(yù)測(cè)研究體系,如圖12所示,尚有以下問題需深入研究。
圖12 露天礦粉塵濃度預(yù)測(cè)研究體系Fig.12 Research system of open-pit mine dust concentration prediction
1)礦山尤其是露天礦礦山產(chǎn)塵點(diǎn)多、產(chǎn)塵量大、粉塵濃度大、擴(kuò)散范圍廣,影響粉塵濃度的因素眾多,了解掌握影響粉塵濃度的主要因素是粉塵濃度精準(zhǔn)預(yù)測(cè)的關(guān)鍵。根據(jù)氣象理論、粉塵擴(kuò)散機(jī)理,運(yùn)用人工智能、大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)的方法對(duì)粉塵濃度影響因素進(jìn)行深入挖掘分析,揭示影響粉塵濃度的關(guān)鍵因素,構(gòu)建科學(xué)的粉塵濃度預(yù)測(cè)指標(biāo)體系。
2)影響粉塵濃度的因素眾多,且數(shù)據(jù)波動(dòng)較大,粉塵環(huán)境具有不確定性、時(shí)變性、非線性,僅使用現(xiàn)行的、單一的模型對(duì)粉塵濃度進(jìn)行預(yù)測(cè),難以獲得最優(yōu)解。將多種智能預(yù)測(cè)算法與優(yōu)化算法相結(jié)合,構(gòu)建粉塵濃度預(yù)測(cè)智能模型,并根據(jù)預(yù)測(cè)場(chǎng)景、數(shù)據(jù)特征進(jìn)行參數(shù)優(yōu)化,提高預(yù)測(cè)精度。
3)采用各種非線性的預(yù)測(cè)方法結(jié)合智能優(yōu)化算法對(duì)模型的參數(shù)進(jìn)行優(yōu)化調(diào)整,檢驗(yàn)?zāi)P皖A(yù)測(cè)效果,提高結(jié)果的可靠性,并增強(qiáng)模型的魯棒性,以期獲得更好的預(yù)測(cè)效果。
4)推廣應(yīng)用各類粉塵預(yù)測(cè)模型并評(píng)估其預(yù)測(cè)精度、優(yōu)勢(shì)及不足,為預(yù)測(cè)模型優(yōu)化提供參考。
1)PM2.5、預(yù)測(cè)模型、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、粒子群優(yōu)化、組合預(yù)測(cè)為粉塵濃度預(yù)測(cè)方面的研究熱點(diǎn),基于機(jī)器學(xué)習(xí)的模型優(yōu)化預(yù)測(cè)是該領(lǐng)域研究的主流,基于優(yōu)化算法的組合預(yù)測(cè)模型逐漸取代單一預(yù)測(cè)模型。
2)在粉塵濃度影響因素及預(yù)測(cè)指標(biāo)體系方面,生產(chǎn)強(qiáng)度大小決定了產(chǎn)塵量的多少,氣象因素決定粉塵的聚集與擴(kuò)散。粉塵濃度預(yù)測(cè)指標(biāo)主要包括氣象類指標(biāo)和生產(chǎn)類指標(biāo)2大類。氣象類指標(biāo)包括溫度、濕度、風(fēng)速、風(fēng)向等,生產(chǎn)類指標(biāo)包括剝離量、采煤量等。
3)在粉塵濃度預(yù)測(cè)方法方面,基于可視化分析結(jié)果,將目前的粉塵濃度預(yù)測(cè)方法分為定性和半定量預(yù)測(cè)、線性回歸預(yù)測(cè)、機(jī)器學(xué)習(xí)預(yù)測(cè)以及組合預(yù)測(cè)4大類,系統(tǒng)分析對(duì)比了各類方法的特點(diǎn)和適用范圍。當(dāng)下主流的預(yù)測(cè)方法為基于機(jī)器學(xué)習(xí)、生物智能算法優(yōu)化的組合預(yù)測(cè)模型。
4)國內(nèi)外在露天礦粉塵預(yù)測(cè)研究方面取得了豐碩的成果,相關(guān)理論方法不斷革新,但仍存在粉塵濃度影響因素缺乏深度挖掘、粉塵濃度預(yù)測(cè)指標(biāo)主觀選取、預(yù)測(cè)方法單一不變等問題。應(yīng)積極引入大數(shù)據(jù)、人工智能等新方法新技術(shù),不斷提升粉塵濃度預(yù)測(cè)的科學(xué)性和準(zhǔn)確性。