高金賀, 鄭寶珠, 周偉昊, 李 鵬
(東華理工大學 土木與建筑工程學院,江西 南昌 330013)
目前,在研究城市交通運輸領域的碳排放問題時,通常關注影響因素分析和節(jié)能減排預測兩大類。如在影響因素方面,陳亮等(2017)對STIRPAT模型進行改進,針對其中的主要影響因素開展全面的分析且進行整體排序;Lin等(2009)基于IPAT模型增加了能源與城市化率2個影響因素指標,而且還利用STIRPAT模型來深入探討各個指標所帶來的影響;武翠芳等(2015)則是以STIRPAT模型為基礎來探討了從1999年到2011年吉林省的碳排放數據,對交通能源利用過程開展全面的分析,并且根據所得的結果提出了相應的建議。多數研究人員主要針對影響因素和碳排放二者之間的關聯性,構建IPAT、Kaya等式或者GM(1,1)模型,從而對交通運輸碳排放總量進行準確預測(聶銳等,2010;Waggoner et al.,2002;Shahbaz et al.,2015;胡茂峰等,2022)。
然而,傳統(tǒng)的預測方法存在回歸不穩(wěn)定、影響因素不確定等一些問題,從而會降低預測的科學性和準確性。對于復雜的非線性預測系統(tǒng)來說,如果訓練和測試的樣本不足,將會產生誤差,并且煩瑣的計算過程也會使得最終計算精度降低(陳亮等,2018)。
綜上所述,筆者通過分析STIRPAT模型中各個因素,選擇了7項城市發(fā)展的重要指標數據作為基礎因素;同時,為了減少傳統(tǒng)預測誤差,通過構建遺GA-SVR模型來預測北京市交運領域的碳排放量,并進行深入討論。
STIRPAT模型是York等(2003)基于回歸方法考察各類因素對城市環(huán)境和交通碳排放的隨機影響模型,并且其模型指標的選取可以根據地區(qū)實時狀況進行拓展改進。根據現有規(guī)范和前人研究的成果可知,城市交通運輸行業(yè)碳排放主要影響因素包括內部發(fā)展模式方向、對外交流發(fā)展水平和城市環(huán)境變化3個方面(陳亮等,2017;宋杰鯤,2012),因此選擇人口總量、人均GDP、機動車保有量、旅客周轉量、貨物周轉量、城鎮(zhèn)化率和碳排放強度作為影響因素指標。其中人口與人均GDP能夠反映出城市發(fā)展方向,機動車保有量、旅客周轉量和貨物周轉量代表了城市對外交流的發(fā)展水平,城鎮(zhèn)化率和碳排放強度則代表了城區(qū)的環(huán)境變化等因素。
碳排放強度是反映經濟增長速度的指標之一,其公式為:
(1)
式中,I為碳排放強度(t/萬元),Pt為交通行業(yè)碳排放量(t),Gt代表地區(qū)生產總值(萬元)。
1.2.1 遺傳算法基本原理
河南尉氏縣及商丘、周口一帶流傳的一則關于臘八粥的傳說,把臘八節(jié)食粥習俗與我國古代思想家、教育家孔子結合起來,由此把臘八食粥俗的起源推至春秋時代,與史書記載相差甚遠。傳說孔子帶領72門徒周游列國。這天,他們來到陳蔡坡被困到弦歌臺,師徒疲憊不堪,人無食充饑,馬無草喂養(yǎng)。孔子思慮再三,囑子路和冉求到西山找范丹老祖借點糧草。二人走了幾天,在一座山神廟里,見到一位老人。老人蓬頭垢面,破衣爛衫,腳踏藤條捆綁的爛鞋,廟內空空蕩蕩。兩人上前詢問,果然是范丹老祖。老祖看過孔子的信,上下打量子路和冉求,冷冷地說道:“看你老夫子的臉面,我出道題,若答得出,就借給你們糧草,若答不出,就啥也別想。”
遺傳算法主要被用來模擬在自然選擇以及遺傳過程中所存在的各類生物現象,如基因突變、染色體交叉以及繁殖等(劉志強等,2013),它們會在遺傳進化之后形成新種群個體來作為相應的候選解,再按照適應度函數即選擇指標從這些候選解中選取適應度較優(yōu)的個體,根據遺傳算子在選擇、交叉或突變后再次產生新的候選解群,重復上述過程最終得到收斂指標。遺傳算法可以在眾多解決方案中搜尋出最佳方案,并且可以減少陷入局部最優(yōu)解的風險,可有效保證全局最優(yōu)解的選取。
1.2.2 支持向量機基本原理
支持向量機最先由Vapnik團隊提出,它主要基于線性可分最優(yōu)超平面而逐步發(fā)展而成(鄧乃揚等,2009),其核心思想是使用核函數為高維原始樣本的映像構造一個最優(yōu)超平面(秦耀祖等,2021),如圖1所示。圖中不同形狀的點(圓圈和方框)分別代表不同的樣本集,H為兩類不同點的分界線,H1和H2分別為經過兩類不同樣本且到分界線距離最近的兩條不同直線;在支持向量機中,將使得H1到H2之間的距離為最小的距離時稱之為分類間隔,使得間隔最大時的超平面稱為最優(yōu)超平面H。二維線性分類中,H、H1、H2的方程可表示為:
(2)
式中,w為H方程的斜率,x為因變量,b為常數。
(3)
采用Lagrange函數按乘子求解法轉為對偶函數得到最優(yōu)超平面分類函數:
(4)
f(x)=sgn{w*·x+b*}
(5)
當訓練集線性不可分時,引入懲罰因子C和松弛變量ξi≥0,i=0,…,l,再引入非線性映射函數φ,使目標函數變?yōu)樽钚。?/p>
(6)
訓練算法使用特征空間中的內積φ(xi)φ(xj),并引入核函數K(xi,xj)=φ(xi)φ(xj),使其實現非線性到線性分類的轉換。本次主要研究徑向基核函數K(xi,xj)=exp(-g‖xi-xj‖2),其中g為核函數參數。
1.2.3 算法實現
目前,支持向量機已經被大量地應用于多分類領域中(Smola et al.,2004;Kennedy et al.,1997),但影響城市交通運輸碳排放的因素較多,且各影響因素之間有一定的重疊性和相關性,僅用原始的支持向量機進行預測會對結果產生不利影響(解少博等,2013;盧建中等,2015;李松等,2012)。而基于遺傳算法優(yōu)化支持向量機模型可通過先測試懲罰參數C、核函數參數g等參數的最優(yōu)解,解決被檢測事件的錯誤率;再利用該方式訓練支持向量機,訓練和測試結果的相關系數和均方誤差較單獨使用支持向量機的結果更加精確。因此,將遺傳算法與支持向量機相結合,建立用于預測城市交通碳排放的GA-SVR模型。具體步驟如圖2,取模型預測準確率作為遺傳算法(GA)中的適應度函數值。
以北京市的基礎數據進行實例分析,數據均來自歷年《北京市統(tǒng)計年鑒》,樣本時間為1995—2019年,收集了人口數、城鎮(zhèn)化率、貨物周轉量和碳排放強度等7項影響因素,如表1所示。
表1 交通運輸碳排放及其影響因素數據
依據GA-SVR預測模型的基本流程,采用前十二年的相關數據來構建訓練集,再以此后的十三年數據作為該模型所需的測試集。在本研究中,最大的種群數量為默認值20,而最大進化代數的值則為200,參數C的變化范圍取默認范圍(0,100),參數g的變化范圍取默認范圍(0,100),經過GA算法優(yōu)化計算后,得到的最優(yōu)懲罰參數C和g分別為94.946 5和0.005 340 6,均方誤差(MSE)為0.032 756,圖3為GA優(yōu)化的適應度曲線變化圖。
按預測過程處理分析訓練集和測試集數據,得到回歸值與真實值對比,如圖4所示。其中,訓練回歸方程為Q=1.030 3M-10.905 7,相關系數為0.982 81,MSE為 0.007 162; 測試回歸方程為Q=1.037 4M-46.043 4,相關系數為0.962 42,MSE為0.007 470。變量M為原始碳排放量(萬t),變量Q為預測碳排放量(萬t)。
在圖5中,詳細列出了預測值和真實值之間的比較結果,此時該算法對訓練集和測試集的平均回歸精度達到了95%以上,可為城市交通碳排放數據進行較為準確的預測。
2.3.1 影響因素預測分析
根據北京市各項統(tǒng)計數據及歷史年鑒,深入探討從2020年到2023年該領域碳排放指標的主要影響因素,根據樣本數據可確定各影響因素年平均增長率,預測2020—2023年間北京市各影響因素值如表2所示。
表2 2020—2023年間各影響因素預測值
2.3.2 碳排放預測分析
將2020—2023年交通運輸碳排放7項影響因素預測值歸一化后帶入模型中,得到北京市的交通運輸碳排放預測值。由表3預測結果可知,碳排放量仍將逐年提高,說明隨著時間的推移,減少碳排放量依舊刻不容緩。因此,北京市應控制人口和機動車保有量等指標的增長;此外,還應當大力普及清潔燃料,研究新型的節(jié)能減排工藝技術,并逐漸實現實用化,適當增加對新能源車輛的使用;與此同時,合理安排綠色出行結構,積極向低碳化方面發(fā)展,提高交通運輸的科技水平。
表3 交通運輸碳排放預測值
(1)利用遺傳算法對支持向量機進行優(yōu)化,建立城市交通碳排放的GA-SVR預測模型。運用模型得到的GA-SVR均方誤差為0.032 756,訓練集擬合的相關系數和均方誤差分別為0.982 81和0.007 162,測試集擬合的相關系數和均方誤差分別為0.962 42和0.007 470,訓練集和測試集的平均精度達到了95%以上。
(2)通過預測結果可知,城市交通運輸碳排放量依舊呈上升趨勢,到2022年既有可能突破2 500萬t,人口和機動車保有量等指標的增長將會進一步引起城市交通運輸碳排放量的增長。城市交通仍面臨較大環(huán)境壓力,故北京市不僅應該加大綠色公共交通數量投入,還需要進一步推廣節(jié)能減排與清潔燃料等方面的技術成果。