丁培林,張光紅,曾 昶,朱 晶,張 坤
(遵義市環(huán)境保護監(jiān)測中心站, 貴州 遵義 563000)
根據(jù)環(huán)境空氣質(zhì)量標準[1],目前評價環(huán)境空氣質(zhì)量指標的參數(shù)主要是可吸入顆粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)??諝赓|(zhì)量預報也就是對未來某一區(qū)域內(nèi)此3項污染物濃度值的預測,它以區(qū)域內(nèi)環(huán)境空氣質(zhì)量現(xiàn)狀監(jiān)測和未來該區(qū)域內(nèi)污染物排放預測為基礎。環(huán)境空氣質(zhì)量預報有多種方法,限于條件,監(jiān)測站系統(tǒng)一般采用歷史數(shù)據(jù)回歸法,通常認為未來時段的污染物濃度與氣象因子有關(guān),基本忽略了地形條件、源強變化等對污染物分布的影響[2-3]。遵義市確定采集的氣象因子是風速、氣溫、溫差(今日氣溫與昨日氣溫之差)、氣壓、壓差(今日大氣壓與昨日大氣壓之差)、濕度6項,這與我站氣象系統(tǒng)提供的參數(shù)相吻合。
回歸的過程是把污染物濃度當作因變量,各氣象因子當作自變量,所要參與回歸計算的歷史數(shù)據(jù)(樣本)在統(tǒng)計學上叫作“序列”,可以簡單地理解為在實驗室內(nèi)作標線時所要準備的濃度點。這實際上是一個因變量對多個自變量的多元回歸形式,并假設它們是多元線性的[4-5]。關(guān)于“序列”,我們的經(jīng)驗是樣本量不宜取太多,在保證統(tǒng)計精度和計算速度的前提下,我們選取了最近三十天的歷史數(shù)據(jù),并隨著日期延續(xù)不斷更新,例如,今天(8月30日)選取的“序列”是8月1日至8月30日三十天的歷史數(shù)據(jù),明天(8月31日)選取的序列將是8月2日至8月31日的歷史數(shù)據(jù)。編制預報的多元回歸“序列”是預報的前提。
在光盤“預報詳解”目錄下所附的“序列示例”表就是我們所作一個“序列”情況,這個表實際上是為后續(xù)統(tǒng)計計算而設計,稍后會詳細介紹?!靶蛄小弊鐾旰螅O碌木褪怯嬎?,即根據(jù)“序列”分別求出各污染物濃度對氣象因子的多元回歸方程。比較理想的狀況是,通過氣象臺得到未來一天的氣象因子變化情況,并能修正為監(jiān)測點位的氣象因子變化,然后將預報氣象因子數(shù)值代入多元線性回歸方程,得到不同監(jiān)測點位不同污染物的預報濃度[6]。
由于多元回歸方程的推演計算非常繁瑣,單靠手工操作效率很低。目前,有很多的計算機程序可供利用和選擇,能夠大大地提高工作效率和水平。遵義市采用的統(tǒng)計程序是第四軍醫(yī)大學開發(fā)的DPS2000數(shù)據(jù)處理系統(tǒng),該數(shù)據(jù)處理系統(tǒng)界面友好,功能強大。
以下將詳述遵義市環(huán)境空氣質(zhì)量預報的整個過程。
“序列示例”表中列有十三個字段,分別為:ws(風速)、humid(濕度)、temp(氣溫)、press(氣壓)、溫差、壓差、SO21、NO21、PM1、SO22、NO22、PM2、date(監(jiān)測日期),其中SO21指第一個點位SO2監(jiān)測值,SO22指第二個點位SO2監(jiān)測值,以此類推,PM代表PM10。
每日中午收取各子站數(shù)據(jù)(遵義市的環(huán)境監(jiān)測統(tǒng)計日為昨日12:00至今日12:00),在序列表中新增當日記錄,同時刪除最上方的一條舊記錄,始終保持30條記錄,存盤退出,今日預報序列表便制作完成。
“序列示例.xls”為今日制作完成的預報序列表(圖1),首先打開DPS2000數(shù)據(jù)處理系統(tǒng)(圖示為DPS3.01專業(yè)版),然后選取多元回歸計算數(shù)據(jù)區(qū),在執(zhí)行操作之前選中操作區(qū),DPS2000數(shù)據(jù)處理系統(tǒng)自動將選中的數(shù)據(jù)區(qū)最右邊一列視為因變量區(qū),其余各列視為自變量區(qū)。數(shù)據(jù)區(qū)圈選時不包括第一行字段名。以下操作以計算SO21與各氣象因子之間的回歸方程為例,點擊 A2單元格,然后按住“shift”鍵,利用垂直滾動條再點擊G31單元格,這樣便選中了第一個回歸方程的計算區(qū)。
圖1 序列示例
點擊菜單欄的“多元分析”下的“回歸分析”,選擇“逐步回歸”,彈出“confirm”對話框,要求引入尚未引入的回歸方程的變量,點擊“yes”,變量被不斷地引入,直至“confirm”對話框中“尚未進入回歸方程的變量及F值”一欄下不再發(fā)生變化,同時“當前方程”一欄下“上次R調(diào)整=×”值亦不再發(fā)生變化,點擊“OK”。至此多元回歸的各種統(tǒng)計量將在數(shù)據(jù)區(qū)后全部被計算出來(圖2)。
圖2 統(tǒng)計量計算
向下拉動垂直滾動條,找到并復制SO21對氣象因子的多元回歸方程,新建一個文本文件,取名為DPS2000.txt,將得到的多元回歸方程粘貼上去(圖3)。重新回到原始數(shù)據(jù)區(qū),選中G列,點擊“擦除”快捷按鈕,刪除G列數(shù)據(jù)(圖4)。選中H列,將其拖曳至原SO21所在的G列,按照此前操作方式選中A 2∶G31數(shù)據(jù)區(qū),計算出NO21與各氣象因子的多元回歸方程。
圖3 獲得SO21多元回歸方程
圖4 刪除SO21數(shù)列
重復以上工作,不斷將G列更新為其他污染物監(jiān)測值所在列,完成A2∶G31之間數(shù)據(jù)區(qū)圈選,逐步回歸出各污染物與各氣象因子的多元回歸方程,并將方程式粘貼到DPS2000.txt文件中(圖5)。
圖5 各污染物與各氣象因子的多元回歸方程
為便于DPS2000.txt準確導入預報模板,還應對該文件按統(tǒng)一數(shù)據(jù)位格式進行規(guī)范,即將常數(shù)項和系數(shù)項手工規(guī)范為統(tǒng)一長度(遵義市是保留7位有效數(shù)字),常數(shù)項前留一空格是保留符號位,規(guī)定缺失的自變量系數(shù)為0,也應補回回歸方程(圖6)。
圖6 補回缺失自變量系數(shù)
遵義市在計算預測濃度時編制了一個excel模板,模板內(nèi)容及各表之間的相互關(guān)系見光盤“預報詳解”目錄下的“預測模板.xls”文件(圖7)。
首先,手工填寫參與計算的氣象資料(下圖中黑框部分),今日(9月26日)資料可從有氣象設備的子站處獲得,明日(9月27日)氣象資料可通過氣象臺獲得,必要時對氣象臺的預報資料參考預報站點的地理位置作一些修正。
圖7 預測模板
然后切換到回歸方程表,點擊菜單欄上“數(shù)據(jù)”下的“獲取外部數(shù)據(jù)”,選擇“導入文本文件”,找到DPS2000.txt文件,點擊“導入”按鈕,彈出文本導入向?qū)υ捒?圖8);單擊“下一步”,重新編排回歸方程序列的分布線,分別將常數(shù)項定為一列,帶符號的系數(shù)項定為一列,自變量項定為一列,單擊“下一步”(圖9)。最后單擊“完成”,將回歸方程導入到現(xiàn)有數(shù)據(jù)表的A1單元格中(圖10)。
圖8 文本導入向?qū)А谝徊?/p>
圖9 文本導入向?qū)А诙?/p>
圖10 文本導入向?qū)А谌?/p>
回歸方程導入后,預算結(jié)果將在“預報成果”表中自動算出(圖11)。
圖11 預報成果
采用逐步回歸法建立的空氣質(zhì)量預報方法,在城市空氣污染物排放源源強及其時空分布無太大變化的情況下取得了較好的預報效果??諝赓|(zhì)量的預報方程都通過了效果檢驗,結(jié)果較為滿意(表1)。
表1 預報值與實測值對比結(jié)果
以上介紹了遵義市環(huán)境空氣質(zhì)量預報數(shù)據(jù)的制作方法,當然仍有許多不完善和需要改進的地方,特別是手工向模板導入回歸方程的步驟還比較繁瑣,相信以后會有更好的解決方案。
[1]國家環(huán)保部.環(huán)境空氣質(zhì)量標準(GB 3095—1996)[S].北京:中國環(huán)境科學出版社,1996.
[2]國家環(huán)保部.環(huán)境影響評價技術(shù)導則(HJ/T 2.2—2008)[S].北京:中國環(huán)境科學出版社,2009.
[3]李本綱.北京市城區(qū)主要交通干線的噪聲測量與分析[J].城市環(huán)境與城市生態(tài),2000,13(2):11 -13.
[4]吳偉,李葉飛.回歸分析法在工程項目利潤預測中的應用[J].合肥工業(yè)大學學報:自然科學版,1999(S1):102-106.
[5]鄭曉雨,賀仁睦,馬進.逐步多元回歸法在負荷模型擴展中的應用[J].中國電機工程學報,2011,31(4):72-77.
[6]熊德琪,陳守煜.城市大氣污染物濃度預測模糊識別理論與模型[J].環(huán)境科學學報,1993,13(4):482-490.