亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Lasso回歸和ARIMA模型的城市生活垃圾產(chǎn)生量預測
        ——以寶雞市為例

        2022-03-26 01:14:52俱國鵬惠姣姣
        河南科學 2022年1期
        關鍵詞:生活模型

        房 妮, 俱國鵬, 惠姣姣, 雷 霽

        (1.寶雞文理學院陜西省災害監(jiān)測與機理模擬重點實驗室,陜西 寶雞 721016;2.寶雞文理學院數(shù)學與信息科學學院,陜西 寶雞 721016)

        近年來,我國經(jīng)濟高速發(fā)展,城市化進程加快,但同時,城市生活垃圾產(chǎn)生量也迅速增長.國家統(tǒng)計局數(shù)據(jù)顯示,2019年我國城市生活垃圾清運量已達24 206.2萬t,約為1999年城市生活垃圾清運量的2.11倍[1-2].大量生活垃圾的產(chǎn)生不僅造成了“垃圾圍城”和環(huán)境污染,也給城市衛(wèi)生管理工作帶來了嚴峻的挑戰(zhàn).精確的城市垃圾產(chǎn)生量預測是研究城市垃圾管理和資源化利用方案的前提.近些年,我國學者將數(shù)理統(tǒng)計模型引入垃圾產(chǎn)生量預測中,開展了一系列理論與實踐研究:有學者采用灰色理論GM(1,1)模型對建筑垃圾[3]和餐廚垃圾[4]進行了預測,但灰色模型只適用于限制條件少、通用性強的情況,不能模擬未來社會經(jīng)濟、人口和政策突變情況下生活垃圾的產(chǎn)生情況,計算也相對復雜[5];也有學者運用ARIMA(p,d,q)模型預測了垃圾產(chǎn)量發(fā)展趨勢[6],但ARIMA(p,d,q)模型只考慮了時間因素對垃圾產(chǎn)生量的影響,不能反映垃圾產(chǎn)生量的諸多影響因素之間的內(nèi)在聯(lián)系;還有較多學者采用多元線性回歸法進行垃圾產(chǎn)量預測[7-10],但常由于影響因素之間的多重共線性問題而導致模型精度不高或由于對影響因素的定量化分析不夠精確而影響了預測結果的準確性.

        基于以上原因,本研究提出采用一種處理具有多重共線性數(shù)據(jù)的高級算法——Lasso回歸來進行城市生活垃圾產(chǎn)生量的預測.通過在回歸模型中增加懲罰項,Lasso回歸可將過小的回歸系數(shù)壓縮到0進而剔除,以此實現(xiàn)自變量的自動篩選,從而在保證模型穩(wěn)定性的同時實現(xiàn)模型的精簡.另外,在應用研究中可直接使用R 語言軟件進行Lasso回歸建模,大大減少了計算量,提升了計算速度.目前,經(jīng)濟學、醫(yī)學等領域已有不少研究者成功采用Lasso 方法進行預測[11-13],但在國內(nèi)外城市垃圾產(chǎn)生量預測中,未見其應用.本研究以寶雞市生活垃圾產(chǎn)生量為研究對象,分析Lasso 回歸對于城市生活垃圾產(chǎn)生量預測的可行性,探索預測的新方法.考慮到垃圾產(chǎn)生量的影響因素中,社會經(jīng)濟、消費及基礎設施建設等因素均符合時間序列模型的要求,因而進一步采用時間序列ARIMA模型對城市生活垃圾產(chǎn)生量的主要影響因素分別進行預測,在得到各影響因素的預測值后再利用Lasso模型對寶雞市城市生活垃圾產(chǎn)生量進行預測.

        1 材料與方法

        1.1 研究數(shù)據(jù)來源

        由于生活垃圾產(chǎn)生量難以統(tǒng)計,故以生活垃圾清運量代替生活垃圾產(chǎn)生量作為因變量(Y),在城市生活垃圾產(chǎn)生量的四大類影響因素——人口、經(jīng)濟發(fā)展水平、居民生活水平及基礎設施建設水平中,選取統(tǒng)計數(shù)據(jù)連續(xù)、詳實的8個常見因素作為自變量(X1~8)進行寶雞市生活垃圾產(chǎn)量的預測建模.所用數(shù)據(jù)來源于《寶雞市統(tǒng)計年鑒》(2009—2019).變量的具體解釋見表1.

        表1 2009—2019年寶雞市生活垃圾產(chǎn)生量及影響因素統(tǒng)計Tab.1 The basic data of MSW production and its influencing factors in Baoji from 2009 to 2019

        1.2 研究方法

        首先,利用條件指數(shù)法(κ值)和方差膨脹因子(VIF)對數(shù)據(jù)進行影響因素共線性判斷;其次,利用Lasso回歸模型篩選出主要影響因素,構建生活垃圾產(chǎn)量預測模型,并進行精度檢驗,然后引入ARIMA(p,d,q)模型,對各主要因素2020—2025年的數(shù)據(jù)進行預測;最后,應用Lasso回歸模型,對寶雞市2020—2025年生活垃圾產(chǎn)量進行預測.

        1.2.1 影響因子共線性判斷 在多元回歸中,較多的自變量之間容易出現(xiàn)多重共線性問題.多重共線性是指線性回歸模型中的自變量之間由于存在精確相關關系或高度相關關系,而使模型估計失真或者難以估計準確[14].用來進行共線性診斷的方法有特征值法、條件指數(shù)法(κ值)、方差比例法、方差膨脹因子法(VIF)以及逐步回歸法等.本文利用κ值和VIF 值進行多重共線性檢驗,明確各影響因素的相關性.一般認為,當VIF>10或κ>100 時,存在嚴重的多重共線性[15].

        1.2.2 Lasso回歸模型

        1)方法原理.Lasso回歸是一種壓縮估計,通過構造一個懲罰函數(shù)得到較為精煉的模型,壓縮一些回歸系數(shù),具有子集收縮的優(yōu)點,是一種處理具有多重共線性數(shù)據(jù)的有偏估計[16].

        式中:α為截距項;βj為第j個變量對應的系數(shù).

        在Lasso回歸中,通常采用Cp值最小原則來篩選自變量.Cp統(tǒng)計量是選擇最優(yōu)子集的一種方法,Cp值越小表示所選子集個數(shù)最優(yōu),具體定義為:

        式中:p為參與回歸的自變量個數(shù);n表示樣本的數(shù)量;SSEp表示p對因變量進行回歸后的殘差平方和;δ2表示所有自變量對因變量進行回歸時,方差均值的預測[16].

        通過Cp值最小原則,將回歸系數(shù)非常接近于0 的變量剔除,即可獲得最優(yōu)子集,同時得到最佳的回歸方程.

        2)模型性能評估.采用平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)和決定系數(shù)(R2)3個指標對Lasso模型的預測效果進行評估.計算公式為:

        式中:Yi表示生活垃圾產(chǎn)生量的原始值;Y?i表示生活垃圾產(chǎn)生量擬合值;n=11;ESS 表示回歸平方和;TSS 表示總離差平方和.RMSE 和MAPE 越接近于0,預測精度越高;決定系數(shù)(R2)又稱擬合優(yōu)度,其值越接近于1,說明擬和程度越好.

        1.2.3 ARIMA(p,d,q)模型

        1)ARIMA(p,d,q)模型(自回歸差分滑動平均模型).該模型是一種常用的時間序列預測分析方法,可認為是AR(p)(自回歸)模型與MA(q)(滑動平均)模型的差分組合[17].ARIMA(p,d,q)的模型表達式如下:

        式中:B為延遲算子;Bnxt=xt-n;Φ(B)表示自回歸延遲算子;Θ(B)表示移動平均延遲算子;p為自回歸階數(shù);d為差分次數(shù);q為移動平均階數(shù);xt表示當前t時刻的值,且xt由過去的p個歷史值xt-1,xt-2,…,xt-p加權組成,?1,?2,…,?p表示其權重;εt,εt-1,εt-2,…,εt-q表示高斯白噪聲,θ1,θ2,…,θq表示其權重[18].研究中各影響因素的ARIMA(p,d,q)模型預測過程如圖1所示.

        圖1 ARIMA(p,d,q)模型預測流程圖Fig.1 The prediction flow chart of ARIMA(p,d,q)model

        2)ARIMA(p,d,q)的建模步驟如下:

        數(shù)據(jù)平穩(wěn)性檢驗:根據(jù)時間序列的自相關系數(shù)圖來判斷時間序列是否平穩(wěn).如果序列被驗證為不平穩(wěn),則需要通過差分變換或者對數(shù)差分變換使其滿足平穩(wěn)性條件;如果d階差分后序列滿足平穩(wěn)條件,則可確定d.

        模型定階:根據(jù)自相關圖(ACF)和偏自相關圖(PACF)來確定自相關階數(shù)p和移動平均階數(shù)q,確定模型ARIMA(p,d,q).

        參數(shù)估計與診斷:對ARIMA(p,d,q)模型進行參數(shù)估計,并判斷其殘差序列是否為白噪聲序列,若殘差序列為白噪聲序列,則通過檢驗[18];若擬合的模型無法通過檢驗,則重新確定參數(shù)p和q,重新選擇模型進行擬合.

        最后,利用ARIMA(p,d,q)模型進行預測.

        1.2.4 統(tǒng)計學方法 研究中Lasso 模型以及ARIMA(p,d,q)模型的構建、數(shù)據(jù)分析均使用R 語言中的lars 包實現(xiàn).

        2 結果與討論

        2.1 共線性判斷

        利用κ值和VIF值對各自變量進行多重共線性檢驗,結果如表2.

        表2 多重共線性判斷Tab.2 Multi-collinearity judgment

        表2顯示,κ值遠大于100,各變量的VIF值均超過10.無論κ值還是VIF值都說明8個自變量之間存在明顯的多重共線性.因此,若利用普通線性回歸模型分析8個自變量和因變量之間的關系,并采用最小二乘法求解線性回歸系數(shù),則各系數(shù)必然會出現(xiàn)較大偏差,且無法得到各系數(shù)的無偏估計.因此,采用Lasso回歸將冗余預測變量的回歸系數(shù)壓縮到0,進而獲得更簡潔的模型,同時可處理共線性問題,防止過度擬合,提高預測精度[14].

        2.2 Lasso回歸模型構建

        根據(jù)Cp值最小的原則,使用Lasso回歸模型,從8個影響因素中篩選了6個具有非0系數(shù)的影響因素,分別為:人均生產(chǎn)總值(X2)、社會消費品零售總額(X3)、常住人口數(shù)(X5)、道路清掃面積(X6)、機械清掃面積(X7)和市容環(huán)衛(wèi)專用車輛(X8),所對應的非0系數(shù)分別為0.000 4、0.023 2、-6.458 8、0.033 4、-0.094 3、0.471 7,故得到生活垃圾年產(chǎn)生量的Lasso預測模型為:

        式中所有變量解釋同表1.

        2.3 Lasso回歸模型檢驗

        經(jīng)計算,模型(7)的RMSE 為0.014 9,MAPE 為0.798 2%,均接近于0;擬合優(yōu)度R2為0.998,接近于1.這些指標都證明了模型(7)可達到高精準度的預測效果,可以用來預測未來幾年生活垃圾的產(chǎn)生量.另外,將Lasso回歸模型得到的生活垃圾產(chǎn)生量預測值與實際值進行對比,預測值與實際值貼合程度較高,整體趨勢基本相同,再次證明了模型的有效性(圖2).

        圖2 生活垃圾產(chǎn)生量Lasso回歸預測值與實際值對比Fig.2 Comparison of Lasso regression predicted value and actual value of MSW production

        2.4 影響因素的預測

        對Lasso回歸篩選出的6個影響因素均采用圖2所示的ARIMA(p,d,q)進行預測,選定的模型參數(shù)和殘差序列的檢驗結果如表3,得到的6個影響因素的預測數(shù)據(jù)如表4.通過檢驗,p值均小于0.05,即殘差序列均為白噪聲序列,由此說明研究中關于6個影響因素建立的ARIMA(p,d,q)模型是合理的.因此,可以在這6個影響因素(自變量)預測數(shù)據(jù)的基礎上繼續(xù)進行Lasso回歸,從而進行生活垃圾產(chǎn)生量(因變量)的預測.

        表3 影響因素的ARIMA(p,d,q)預測模型Tab.3 ARIMA(p,d,q)prediction model of influence factors

        表4 寶雞城市生活垃圾產(chǎn)生量影響因素預測Tab.4 Prediction of influencing factors of MSW production in Baoji

        2.5 Lasso回歸預測結果與分析

        結合表4 各影響因素的預測數(shù)據(jù),根據(jù)回歸模型(7),得到寶雞2020—2025 年的城市生活垃圾年產(chǎn)生量和人均垃圾日產(chǎn)生量預測值(表5).

        表5 2020—2025年寶雞城市垃圾產(chǎn)生量預測值Tab.5 Prediction value of MSW production in Baoji from 2020 to 2025

        對比我國西北地區(qū)兩個省會城市西安和西寧,寶雞城市生活垃圾年產(chǎn)生量和人均日產(chǎn)生量均較低,但其生活垃圾產(chǎn)生量年增長率卻較高.西寧2020—2035 年的城市垃圾平均年增長率僅為3.71%[7],西安2020 年城市垃圾產(chǎn)生量增長率為6%[9],而寶雞2020—2025年城市垃圾平均年增長率高達15%.由此可見,“十四五”期間寶雞市將面臨嚴峻的由生活垃圾產(chǎn)量持續(xù)增加所帶來的城市衛(wèi)生管理壓力.寶雞市應全面推進生活垃圾源頭分類,同時應確保垃圾收集、收運、處理、處置的其他環(huán)節(jié)全程分類,不斷提升資源化利用水平,盡早探索“無廢城市”的建設之路.

        3 結論

        1)通過Lasso回歸對自變量間存在多重共線性進行處理,將自變量地區(qū)生產(chǎn)總值和城市居民人均可支配收入剔除在模型外,對城市生活垃圾產(chǎn)生量建立了Lasso回歸模型.通過檢驗該模型擬合度R2為0.998,模型的RMSE 為0.014 9,MAPE 為0.798 2%,說明Lasso 回歸預測精度高,在城市生活垃圾產(chǎn)生量預測方面具有推廣價值.

        2)通過時間序列ARIMA(p,d,q)模型,對人均生產(chǎn)總值、社會消費品零售總額、常住人口數(shù)、道路清掃面積、機械清掃面積和市容環(huán)衛(wèi)專用車輛6個自變量進行了預測.在此基礎上,通過Lasso回歸模型預測了寶雞市生活垃圾產(chǎn)生量.預測得出,2020—2025年寶雞城市生活垃圾產(chǎn)生量將分別達到25.76×104、38.44×104、35.89×104、41.59×104、48.39×104、52.71×104t,生活垃圾產(chǎn)生量平均年增長率為15%,增速過快.因此,寶雞市應盡快完善生活垃圾投放、收集、運輸和處理的全程分類系統(tǒng),不斷提升監(jiān)管能力,強化分類處理與資源化利用水平,通過資源的最大化利用實現(xiàn)垃圾減量.

        猜你喜歡
        生活模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        漫生活?閱快樂
        3D打印中的模型分割與打包
        生活感悟
        特別文摘(2016年19期)2016-10-24 18:38:15
        無厘頭生活
        37°女人(2016年5期)2016-05-06 19:44:06
        水煮生活樂趣十足
        FLUKA幾何模型到CAD幾何模型轉換方法初步研究
        瘋狂讓你的生活更出彩
        免费一级欧美大片久久网| 亚洲专区路线一路线二网| 亚洲国产一区二区三区| 亚洲妇女自偷自偷图片 | 无套内内射视频网站| 亚洲婷婷五月综合狠狠爱 | 国产精品无码久久综合网| 特级av毛片免费观看| 精品丝袜人妻久久久久久| 无码天堂亚洲国产av麻豆| 国产内射视频在线播放| av资源在线免费观看| 国产精品一区二区三区在线蜜桃 | 国产最新网站| 一区二区久久精品66国产精品| 亚洲最大在线视频一区二区| 欧洲熟妇色xxxx欧美老妇软件| 国产一线二线三线女| 国产在线欧美日韩精品一区二区| 日本免费影片一区二区| 日日噜噜夜夜狠狠va视频v| 久久婷婷香蕉热狠狠综合| 国产美女a做受大片免费| 日本一区二区三区不卡在线| 欧美日韩精品久久久免费观看| 国产精品开放小视频| 国产精品一区二区三区黄片视频| 久久久亚洲av午夜精品| 中文字幕日韩三级片| 国产日韩成人内射视频| 综合激情中文字幕一区二区| 日韩女优精品一区二区三区| 日本爽快片18禁免费看| 午夜影院91| 天堂精品人妻一卡二卡| 无码人妻精品一区二区三区蜜桃| 亚洲av日韩av不卡在线观看| 人妻少妇精品一区二区三区| 久久在一区二区三区视频免费观看| 人人摸人人搞人人透| 国产极品久久久久极品|