李祥芹
(山東省臨沂生態(tài)環(huán)境監(jiān)測中心,山東 臨沂 276000)
大氣環(huán)境監(jiān)測涉及的內(nèi)容復(fù)雜且數(shù)量眾多,人類活動行為、空氣污染和氣象條件等因素的變化,會給大氣環(huán)境數(shù)據(jù)造成一定的影響。因此,為了深入地了解大氣現(xiàn)狀,加快實現(xiàn)大氣環(huán)境檢測目標,必須利用大數(shù)據(jù)解析技術(shù)對原有的監(jiān)測技術(shù)進行優(yōu)化,進而通過數(shù)據(jù)分析研究目標的變化規(guī)律,為環(huán)境保護提供更加全面且嚴謹?shù)臄?shù)據(jù)。
我國大氣環(huán)境監(jiān)測工作起步較晚,使用的手段與設(shè)備存在一定的滯后性,最常應(yīng)用的方法有光化學(xué)分析法、化學(xué)計量法以及電化學(xué)測量法等方法。隨著大氣環(huán)境中成分復(fù)雜、處理困難的污染物質(zhì)數(shù)量的增多,傳統(tǒng)的監(jiān)測方法與手段已經(jīng)無法準確地反映出環(huán)境質(zhì)量與變化趨勢。環(huán)境部門獲得的污染源排放數(shù)據(jù)、調(diào)研信息、科研資料與氣象、水利、海洋、交通、衛(wèi)生等部門的工作息息相關(guān)。由于不同類型的數(shù)據(jù)間呈現(xiàn)多元、非線性的關(guān)系,在大氣環(huán)境監(jiān)測中具有復(fù)雜性、多樣性等特點,對研究人員認識、分析、研究環(huán)境污染問題帶來了一定的困難。因此,為了能夠?qū)M2.5、PM10和粉塵等進行有效監(jiān)控,需要利用大數(shù)據(jù)解析技術(shù)來找出各參數(shù)之間的非線性關(guān)系,并借助這種非線性關(guān)系建立起的模型,為大氣環(huán)境監(jiān)測從業(yè)人員提供能夠掌握變化規(guī)律的方法,進而實現(xiàn)數(shù)據(jù)處理精度、速度的全面提升,充分發(fā)揮出大數(shù)據(jù)解析技術(shù)在儲存、運算、處理數(shù)據(jù)過程中的作用與功能。
近年來,中國各地區(qū)、各省市頻繁地出現(xiàn)PM2.5污染問題,引起了國家、社會與人民的高度關(guān)注,并且已經(jīng)成為大氣環(huán)境監(jiān)測工作中的重點內(nèi)容與突出問題。為了進一步解決PM2.5污染問題以及其他污染物排放超標問題,需要從根本上把握污染物質(zhì)的變化規(guī)律,明確所在地污染物質(zhì)的濃度。面對數(shù)量巨大、類型豐富的大氣環(huán)境污染數(shù)據(jù),運用大數(shù)據(jù)解析技術(shù)能夠找出數(shù)據(jù)類與類之間的關(guān)系,結(jié)合統(tǒng)計計算、神經(jīng)網(wǎng)絡(luò)分析和隨機過程分析等算法,能夠?qū)Χ嗑S度的數(shù)據(jù)進行更深層次的研究,進而分析出研究目標函數(shù)的變化規(guī)律,對大氣環(huán)境監(jiān)測從業(yè)人員環(huán)境管理、環(huán)境決策發(fā)揮了至關(guān)重要的作用。因此,在大氣環(huán)境監(jiān)測實際應(yīng)用大數(shù)據(jù)解析技術(shù)的過程中,應(yīng)該注意選擇適宜數(shù)據(jù)分析方法,應(yīng)用單位也要根據(jù)大氣環(huán)境自動監(jiān)測站工作開展需求,制定相關(guān)的檢測標準,以此提升大數(shù)據(jù)解析技術(shù)的應(yīng)用效果,提高數(shù)據(jù)分析的準確性與效率。由于大氣環(huán)境自動監(jiān)測站耗資巨大,會在很大程度上消耗1個城市的人力資源與物力資源,并且1個大氣環(huán)境自動監(jiān)測站無法滿足監(jiān)測需求,亟需大數(shù)據(jù)解析技術(shù)對相關(guān)數(shù)據(jù)與資料進行補充。在北京市,大約100 km2建設(shè)1個大氣環(huán)境自動監(jiān)測站,監(jiān)測站獲得的數(shù)據(jù)可以作為評估PM2.5濃度的依據(jù),并且不同的自動監(jiān)測站能夠代表某局部點的污染物質(zhì)濃度。因此,研究并計算局部地區(qū)的PM2.5以及其他污染物質(zhì)濃度,對解決環(huán)境污染問題具有十分重要的現(xiàn)實意義。
大氣環(huán)境監(jiān)測中應(yīng)用的大數(shù)據(jù)解析技術(shù)包括了十分復(fù)雜的數(shù)據(jù),應(yīng)在遵循數(shù)據(jù)分析原理的前提下,靈活選擇有利于解決不同問題的監(jiān)測數(shù)據(jù)。因此,研究內(nèi)容與研究對象的確定需要結(jié)合解決問題的實際需求,例如,將城市局部地區(qū)作為大氣環(huán)境監(jiān)測對象,面向該區(qū)域?qū)嶋H污染情況應(yīng)用大數(shù)據(jù)解析技術(shù)。按照規(guī)范標準將研究對象劃分為若干個研究單元,每個單元對應(yīng)1個研究內(nèi)容,進而深入挖掘大氣環(huán)境污染數(shù)據(jù)。從數(shù)學(xué)角度來看,大數(shù)據(jù)解析技術(shù)運用中的研究內(nèi)容可以看作是目標函數(shù),并且該研究內(nèi)容中未設(shè)置自動監(jiān)測網(wǎng)區(qū)域內(nèi)的未知數(shù)據(jù),是需要解析的主要目標。
為了進一步提高分析未知數(shù)據(jù)的精準性,需要選擇更多與未知數(shù)據(jù)相關(guān)的城市大氣環(huán)境監(jiān)測數(shù)據(jù)進行解析。在選擇大量監(jiān)測數(shù)據(jù)的過程中,需要對選擇的數(shù)據(jù)類進行相關(guān)性分析,以此增強監(jiān)測數(shù)據(jù)可分析性。相關(guān)性的強弱與目標函數(shù)關(guān)系在大氣環(huán)境研究領(lǐng)域中,大多呈現(xiàn)非線性的復(fù)雜關(guān)系,需要依據(jù)環(huán)境科學(xué)專業(yè)知識來優(yōu)化數(shù)據(jù)解析基本條件。以分析城市局部區(qū)域PM2.5濃度為例,為了解決大氣環(huán)境污染問題,選擇的數(shù)據(jù)包括氣象條件數(shù)據(jù)、自動監(jiān)測網(wǎng)格內(nèi)PM2.5濃度、網(wǎng)格道路狀況數(shù)據(jù)、人類活動行為數(shù)據(jù)、網(wǎng)格坐標等各類數(shù)據(jù)特征量確定情況如下:1) 選取自動監(jiān)測網(wǎng)區(qū)域內(nèi)歷史上的PM2.5小時平均濃度作為特征量。2) 取研究區(qū)域內(nèi)的風速、氣溫、相對濕度等作為特征量。3) 取研究區(qū)域內(nèi)交通情況、車輛數(shù)、平均車速等作為特征量。4) 將研究區(qū)域內(nèi)人員活動情況作為特征量。5) 將自動監(jiān)測網(wǎng)格內(nèi)工廠、餐飲業(yè)、車站等場所產(chǎn)生的空氣污染數(shù)據(jù)作為特征量。利用歸一化處理方式計算各特征量對目標函數(shù)的影響情況。具體公式如公式(1)所示[1]。
式中:xik為規(guī)劃處理前的特征量數(shù)據(jù);為第k各特征量的平均值;為第k個特征量的歸一化處理后的第i個數(shù)據(jù);Sk為第k個特征量的標準差;n為第k個特征量的數(shù)據(jù)個數(shù);i為第k個特征量的第i個數(shù)值。
2.3.1 空間分類器(SC)
應(yīng)用大數(shù)據(jù)解析技術(shù)的大氣環(huán)境監(jiān)測區(qū)域,其包括的特征量會隨著時間變化而呈現(xiàn)出不同趨勢。研究目標受到數(shù)據(jù)集包括的特征量的影響,會呈現(xiàn)出多層多節(jié)點傳遞現(xiàn)象,傳遞中節(jié)點的輸出可以是線性,也可以是非線性,但是傳遞路線呈現(xiàn)線性變化趨勢。由于數(shù)據(jù)集的變化過程是1個靜態(tài)過程,可以選用神經(jīng)網(wǎng)絡(luò)法作為解析大數(shù)據(jù)的工具,大數(shù)據(jù)解析方法運用部分主要為輸入部分、人造神經(jīng)網(wǎng)絡(luò)部分、數(shù)據(jù)集模擬預(yù)測部分。其中,輸入部分是構(gòu)建各數(shù)據(jù)空間特征量的關(guān)鍵,也是人造神經(jīng)網(wǎng)絡(luò)部分數(shù)據(jù)輸入的重要保障。首先,在大氣環(huán)境自動監(jiān)測網(wǎng)格中選取與局部區(qū)域地理位置坐標網(wǎng)對應(yīng)的特征量、污染物濃度值。其次,選擇能夠代表局部區(qū)域坐標的特征量與污染物濃度值,由此來表示需要預(yù)測的網(wǎng)格。最后,運用預(yù)測網(wǎng)格中的特征量與需要估計的污染物濃度,進行大數(shù)據(jù)分析。由于人造神經(jīng)網(wǎng)絡(luò)內(nèi)輸入的數(shù)據(jù)能夠通過神經(jīng)向目標值傳遞。在此基礎(chǔ)上,采用反演法解決神經(jīng)網(wǎng)絡(luò)中感應(yīng)層、節(jié)點權(quán)重以及非線性函數(shù)變換等問題。主要是將輸入特征量各權(quán)重運用最小二乘法對模擬模型參數(shù)進行推演,然后在模型上加1個比例系數(shù),再將大氣環(huán)境污染自動監(jiān)測網(wǎng)格中的數(shù)據(jù)進行反復(fù)訓(xùn)練與學(xué)習,使殘差值設(shè)定值無限接近。
2.3.2 時間分類器(TC)
在利用大數(shù)據(jù)解析技術(shù)的過程中,主要是根據(jù)大氣污染度分析以及預(yù)測情況,對隨時間變化的特征量進行解析,需要解析的數(shù)據(jù)包括氣象條件數(shù)據(jù)以及交通狀況數(shù)據(jù)、人員活動情況等,每一網(wǎng)格中數(shù)據(jù)產(chǎn)生的特征量可運用X={x1,x2,…,xn}集合來表示。將局部地區(qū)內(nèi)隨時間變化的污染物濃度對應(yīng)的特征量記錄在網(wǎng)格內(nèi),由此代表某一時刻大氣環(huán)境污染物濃度的變化情況,在給定特征量序列之后,估計預(yù)測值會被定義為正態(tài)分布函數(shù),根據(jù)概率理論可知,不同事件相交產(chǎn)生的概率相乘,則估計值出現(xiàn)的概率也呈現(xiàn)正態(tài)分布[2]。由于大數(shù)據(jù)集中的特征值需要進行進一步的解析與推演,還應(yīng)對空間分類器與時間分類器的研究內(nèi)容進行優(yōu)化,從而得到與大氣環(huán)境監(jiān)測問題解決需求相符的空間分類器、時間分類器。
大數(shù)據(jù)解析技術(shù)在客戶端層面的應(yīng)用,主要是面向大氣環(huán)境監(jiān)測客戶進行程序設(shè)計,以此保證大氣環(huán)境監(jiān)測數(shù)據(jù)能夠?qū)崟r展示在用戶面前,幫助大氣環(huán)境監(jiān)測人員做出科學(xué)合理的決策。大數(shù)據(jù)解析技術(shù)在客戶端最大的應(yīng)用特點就是能夠滿足用戶的個性化需求,具體分為數(shù)據(jù)傳輸、用戶控制與數(shù)據(jù)處理3個模塊。其中,數(shù)據(jù)傳輸具體分為數(shù)據(jù)請求與數(shù)據(jù)接收2個部分,用于收集大氣環(huán)境監(jiān)測數(shù)據(jù);用戶控制則是根據(jù)用戶需求,響應(yīng)數(shù)據(jù)接收或請求功能;數(shù)據(jù)處理則是對采集到的數(shù)據(jù)進行分析與處理,并使用圖形或數(shù)值將結(jié)果直觀地展示在用戶面前,對提高大氣環(huán)境監(jiān)測的科學(xué)性與真實性具有十分重要的現(xiàn)實意義。大數(shù)據(jù)解析技術(shù)在客戶端模塊應(yīng)用結(jié)構(gòu)如圖1所示。
根據(jù)大數(shù)據(jù)解析技術(shù)在客戶端模塊中的應(yīng)用可知,用戶需求是系統(tǒng)功能相應(yīng)的關(guān)鍵,在發(fā)出數(shù)據(jù)請求之后,會以此開展數(shù)據(jù)分析、結(jié)果顯示和數(shù)據(jù)傳輸?shù)热蝿?wù),實施監(jiān)測體系在快速響應(yīng)之后,會對SO2、CO、PM2.5、PM10等污染物展開實時監(jiān)測工作,同時結(jié)合大數(shù)據(jù)解析技術(shù),了解污染物的來源,對提高大氣環(huán)境污染治理方案的科學(xué)性具有重要的意義。應(yīng)用大數(shù)據(jù)解析技術(shù)的客戶端模塊包括數(shù)據(jù)傳輸、用戶控制與數(shù)據(jù)處理3個部分。其中,數(shù)據(jù)傳輸分為提出請求、接收數(shù)據(jù);數(shù)據(jù)處理分為數(shù)據(jù)分析、結(jié)果顯示、給出提示3個部分。應(yīng)用大數(shù)據(jù)解析技術(shù)后的客戶端模塊結(jié)構(gòu)如圖1所示。
圖1 客戶端模塊結(jié)構(gòu)
在應(yīng)用大數(shù)據(jù)解析技術(shù)對大氣環(huán)境監(jiān)測數(shù)據(jù)進行分析的過程中,不僅可以收集到實時的大氣環(huán)境變化數(shù)據(jù),對城市某地區(qū)內(nèi)一段時間范圍內(nèi)大氣環(huán)境質(zhì)量變化趨勢進行有效分析,還可利用大數(shù)據(jù)技術(shù)以及其他先進技術(shù),建立空氣質(zhì)量預(yù)警系統(tǒng),從而實現(xiàn)大氣環(huán)境污染情況的實時預(yù)警?;诖髷?shù)據(jù)解析技術(shù)的預(yù)判結(jié)果,空氣質(zhì)量預(yù)警系統(tǒng)可對此結(jié)果進行加工,然后將信息發(fā)布在開放性平臺上,不僅能夠提高數(shù)據(jù)信息采集、記錄、挖掘的針對性,還可以動員社會成員參與到保護生態(tài)環(huán)境的工作中[3]。大氣環(huán)境監(jiān)測數(shù)據(jù)的內(nèi)部變化情況與外部因素有十分密切的聯(lián)系,利用大數(shù)據(jù)解析技術(shù)還可以為用戶提供解讀結(jié)果的一系列可視化功能,充分發(fā)揮出空氣質(zhì)量預(yù)警的功能,對提高信息利用效率具有十分重要的現(xiàn)實意義。
采集、記錄大氣環(huán)境監(jiān)測數(shù)據(jù)屬于大氣環(huán)境監(jiān)測管理中的基礎(chǔ)性工作,需要針對不同的污染問題建立完善的環(huán)境檢測檔案,以此保證后續(xù)大氣環(huán)境監(jiān)測與管理工作的順利開展。因此,在將大數(shù)據(jù)解析技術(shù)應(yīng)用于大氣環(huán)境監(jiān)測的過程中,應(yīng)面向環(huán)境學(xué)專家、氣象學(xué)專家建立起完善的數(shù)據(jù)資源庫,從而為對比環(huán)境監(jiān)測數(shù)據(jù)提供有力保障,更加全面地了解大氣環(huán)境污染現(xiàn)狀與未來環(huán)境質(zhì)量變化趨勢。此外,社會活動產(chǎn)生的污染物十分復(fù)雜,且數(shù)量眾多,充分發(fā)揮出大數(shù)據(jù)解析技術(shù)的優(yōu)勢與功能,可以有效降低環(huán)境監(jiān)測工業(yè)人員收集信息的難度,保證工作效率、服務(wù)質(zhì)量的提升,使數(shù)據(jù)在傳遞過程中實現(xiàn)信息共享,促使大氣環(huán)境監(jiān)測工作能夠更好地結(jié)合區(qū)域地理環(huán)境、氣象條件以及經(jīng)濟社會活動特征進行科學(xué)有效的數(shù)據(jù)分析。
不同區(qū)域、不同地段、不同時間段的大氣環(huán)境污染程度存在一定差異,為有效分析各時段大氣環(huán)境發(fā)展情況,摸索污染變化規(guī)律,保證大氣環(huán)境污染治理方案的科學(xué)合理性,需要利用大數(shù)據(jù)解析技術(shù)深層次挖掘大氣環(huán)境監(jiān)測數(shù)據(jù),從而提高數(shù)據(jù)的真實性與代表性。利用大數(shù)據(jù)解析技術(shù)能夠建立起共享交流的環(huán)境監(jiān)測信息,構(gòu)建出的大數(shù)據(jù)模型能夠向從業(yè)人員直觀的展示出污染變化情況,并利用大數(shù)據(jù)解析技術(shù)分析結(jié)果來提高環(huán)境治理的可行性,人們通過網(wǎng)上平臺、手機App等就可隨時了解到大氣環(huán)境污染治理的實時情況,充分調(diào)動社會成員參與大氣環(huán)境保護的積極性與主動性,實現(xiàn)大氣環(huán)境監(jiān)測數(shù)據(jù)利用效率提升的目標。
3.3.1 空氣質(zhì)量指數(shù)
空氣質(zhì)量指數(shù)是反映大氣環(huán)境污染情況的重要指數(shù),空氣質(zhì)量指數(shù)越大,說明大氣污染情況越嚴重。大氣環(huán)境中的污染物濃度決定了空氣質(zhì)量指數(shù)的變化情況,并且變化形象呈現(xiàn)較大的復(fù)雜性,與監(jiān)測實踐、地點等有十分密切的聯(lián)系,其中固定與移動2種類型的污染物對空氣質(zhì)量指數(shù)的影響最大,包括垃圾焚燒、工業(yè)污染和汽車尾氣排放等多種類型的污染物。隨著城市規(guī)劃密度的逐漸增大,SO2、CO、PM2.5、PM10等成為主要監(jiān)測的空氣污染物,根據(jù)這幾種指標濃度,利用大數(shù)據(jù)解析技術(shù)對其變化趨勢進行分析與預(yù)測,并將最大的子指標值作為某地區(qū)污染大氣環(huán)境的主要污染物。空氣質(zhì)量指數(shù)共分為0~50、51~100、101~150、151~200、201~300、>3006項,空氣質(zhì)量指數(shù)級別、類別以及對健康影響情況也相應(yīng)地分為六級,空氣質(zhì)量指數(shù)與相關(guān)的具體信息見表1。
表1 空氣質(zhì)量指數(shù)與相關(guān)信息
3.3.2 空氣質(zhì)量分布趨勢
根據(jù)某地區(qū)一段時間內(nèi)大氣環(huán)境監(jiān)測數(shù)據(jù),對其時空序列以及空氣質(zhì)量數(shù)據(jù)進行分析,能夠總結(jié)出空氣質(zhì)量分布趨勢。利用大數(shù)據(jù)解析技術(shù)對趨勢分布結(jié)果進行深層次的數(shù)據(jù)挖掘與分析,可知天氣變化會對監(jiān)測地區(qū)一定時間范圍的空氣質(zhì)量產(chǎn)生一定影響,并且空氣質(zhì)量指數(shù)會隨著氣溫的降低而出現(xiàn)下降的趨勢,PM2.5、SO2、NO2等污染物的濃度也會有所下降,說明大氣環(huán)境有所改善[4]。為了充分發(fā)揮大數(shù)據(jù)解析技術(shù)的優(yōu)勢,提高空氣質(zhì)量指數(shù)的利用效率,還應(yīng)充分考慮我國各領(lǐng)域生態(tài)環(huán)境與國民健康之間的關(guān)系,利用大數(shù)據(jù)技術(shù)評價人體健康風險,從而更加深入地了解影響大氣環(huán)境的有害因素,真正將人體健康與大氣環(huán)境治理有機地結(jié)合在一起,從而為經(jīng)濟社會發(fā)展奠定堅實基礎(chǔ)。
綜上所述,將大數(shù)據(jù)解析技術(shù)應(yīng)用于大氣環(huán)境監(jiān)測中,可以有效提高環(huán)境監(jiān)測工作效率與質(zhì)量。在大數(shù)據(jù)解析技術(shù)的應(yīng)用,能夠獲得全國各地區(qū)、各區(qū)域、各時間段內(nèi)大氣環(huán)境的變化情況,系統(tǒng)在算法的作用下,采集、整理、分析大氣環(huán)境監(jiān)測數(shù)據(jù),并將精準的結(jié)果直觀地展示在相關(guān)人員面前,對滿足社會發(fā)展需求具有重要意義。