亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于支持向量機算法的道路結冰預測模型研究

        2020-09-23 08:20:54楊鵬飛孫先波
        關鍵詞:分類優(yōu)化模型

        楊鵬飛,孫先波

        (湖北民族大學 信息工程學院,湖北 恩施 445000)

        道路結冰預測系統(tǒng)對預防或減少道路交通事故的發(fā)生具有重要的作用,可以為交通、路政等部門提供技術支持.例如,交通部門可以根據預測系統(tǒng)提供的技術參數對交通進行合理的調度;路政部門也可以根據道路、氣象參數確定路面的養(yǎng)護時間和除冰劑的用量,避免除冰劑的浪費和對環(huán)境的污染.道路結冰預測系統(tǒng)也能為大眾的交通出行提供路況信息,降低交通事故發(fā)生率和改善道路交通通行狀況等[1].

        在道路的結冰預測問題上,國內外學者做了大量的研究.一方面是基于視頻照片信息分析建模,該方法存在一些不足,即如果采集路面有汽車等遮擋物會造成識別的準確率不高,另外如果系統(tǒng)圖像處理不及時,會導致路況信息更新延誤和信息采集不充分等問題.在采用最小波去噪提取路面特征向量的基礎上,李頎等[2]利用支持向量機算法搭建基于圖像處理的路面結冰預測模型,解決了傳統(tǒng)的圖像識別提取路面信息不充分的問題.但是,由于該預測模型對圖像信息的處理時間過長,導致道路信息上傳不及時的問題.

        另一方面是基于氣象數據和數據處理算法,搭建數據處理分析模型.史達偉等[3]采用C4.5決策樹算法構建道路結冰預報模型,將數據抽象處理成規(guī)則集,利用構建的結冰規(guī)則判斷路面情況.但是,決策樹算法最大的問題是前級規(guī)則的誤差會直接影響到結果的準確度,造成模型分類的經驗性太高,預測結果準確度誤差過大.白永清等[4]利用溫度傳感器和回歸算法搭建了高速橋(路)面的結冰預警系統(tǒng),但單一的選用溫度參數,忽視了其他氣象因子對道路結冰情況的影響,使模型的誤差較大.董天翔等[5]通過分析道路結冰規(guī)律,利用支持向量機、多元線性回歸和樸素貝葉斯算法搭建路面低溫預測模型,通過對江蘇南部路網的數據分析,發(fā)現相比較其他算法,支持向量機的預測效果最佳.邱欣等[6]利用支持向量機算法構建以降水量、氣溫和地表溫度為變量的路面結冰預測模型,發(fā)現模型具有較高的準確率,展示了支持向量機算法在預測模型方面的優(yōu)越性.雷建軍等[7]利用遺傳微粒群算法優(yōu)化了支向量機的參數和引進其他氣象因子綜合考慮,搭建了一種用遺傳算法優(yōu)化的支持向量機預測模型,該系統(tǒng)改進了支持向量機算法造成的參數選擇誤差,提高了模型的準確度.實際道路結冰情況是受多個氣象因子綜合結果的結果,單一的利用某一個或兩個氣象因子進行建模會造成模型的通用性和魯棒性較差.

        支持向量機就是構建分類條件將正分類和負分類樣本區(qū)分開,因此在二分類問題上,支持向量機算法具有獨特的優(yōu)勢.但因為其參數選擇經驗性太強,因此在支持向量機算法搭建的道路結冰預測模型中,不同的經驗參數得到的結果會出現較大的誤差波動.利用交叉驗證算法、遺傳算法和粒子群算法對預測模型的經驗參數進行尋優(yōu)優(yōu)化,可以有效提高預測模型的準確性和魯棒性.只需要比較不同優(yōu)化算法下的準確率,就可以得到優(yōu)化效果最好的預測模型,預測模型的準確率越高,對更好的預防道路交通事故發(fā)生的意義越大.

        1 道路結冰預測模型

        1.1 數據來源

        本文氣象數據來源于某氣象數據中心地面氣象站2019-12-07日的逐小時觀測資料,從地理上選取貴陽、南昌、長沙、武漢、合肥、鄭州、長春、邯鄲、濟南、石家莊、天津、北京、沈陽、資陽等地氣象站的數據資料,數據中心總共有25種特征值,本文選取其中7種作為道路結冰模型的特征值,為保證數據集的科學性,首先對數據集進行錯誤數據和不良數據的篩選和剔除操作.

        1.2 預測模型理論基礎

        支持向量機(support vector machine,SVM)是建立在機器學習上的結構風險最小化的理論,它是Vapnik和Cortest在1995年提出來的,主要用來解決非線性回歸和分類問題[8].支持向量機原理圖如圖1所示,其解決問題的主要思想是通過分類條件,在空間中構造一個決策面將正分類和負分類分離開來并使得正例和負例之間的間隔最大化[9-11].

        圖1 支持向量機原理圖Fig.1 Support vector machine schematic

        通過設置分類條件,在數據集空間中構造分類超平面,使得條件不同的正例和負例之間的間隔λ最大化,其中λ可表示為:

        (1)

        通過間隔最大化原則,在數據集空間中尋找分類超平面,滿足支撐向量到分類超平面的間隔最大.

        (2)

        通過構造拉格朗日函數和對偶原理解決帶約束的分類超平面優(yōu)化問題,分類間隔最大化問題可簡化為:

        (3)

        引入軟間隔原理可以減少由于分類條件不充分引起的錯分現象,模型可等價為:

        (4)

        利用訓練集數據得到合適的道路結冰分類超平面,完成對道路結冰預測模型的搭建.通過式(5)可以實現對分類超平面的檢測,同時,利用測試集數據對已建立的預測模型進行仿真測試,可得到道路結冰預測模型的準確率[12].

        (5)

        通過分析影響道路結冰的氣象條件和收集到的氣象數據,確定影響道路結冰的主要影響因素.基于收集的氣象數據集和道路結冰預測模型,將復雜的道路結冰問題簡化為通過監(jiān)測道路實時氣象數據的數據處理分析問題.支持向量機算法主要是處理二分類問題,因此可以將影響道路結冰的氣象因素構成支持向量機的分類條件,構建基于氣象數據條件的道路結冰預測模型.

        在運用支持向量機算法處理多分類問題上,核心思想主要有兩種:一種是通過構造多分類函數,將所有維度的數據歸合成一個最優(yōu)函數,直接實現對多分類問題的求解.另外一種方法是通過分析數據集的共性,將多個二分類函數組合起來,通過逐級分析求解多分類問題[13].

        1.3 模型建立

        影響道路結冰的氣象因子很多,其中最重要的是路面的溫度和濕度條件,其他氣象因子通過影響這兩個氣象因子來作用于道路結冰狀態(tài)的發(fā)生[14].氣象站總共有25種參數,考慮到所建模型的魯棒性,本文選取傳統(tǒng)的7個氣象要素(溫度、濕度、氣壓、風速、風向、降雨量、水汽壓)和支持向量機算法對道路結冰條件進行建模研究.模型搭建采用林智仁教授項目組開發(fā)的LIBSVM工具箱.LIBSVM工具箱提供了支持向量機算法的源代碼,在參數選擇上,LIBSVM工具箱提供的默認參數極大的簡化了支持向量機算法的使用,模型的整體流程圖如圖2所示.

        圖2 模型整體流程Fig.2 Model overall process

        第1步:選定特征值.本模型選取7個氣象要素作為自變量,因變量則為道路結冰狀態(tài),根據函數:

        (6)

        設道路結冰狀態(tài)為+1類,反之為-1類.

        數據組總共有數據300組,每組樣本含有7個特征分量,每一組數據的標簽已給出,每一小時測一組,訓練集數據訓練出來的預測模型,需要用測試集進行檢測,得到分類器的性能指標,即準確率.

        第2步:數據的篩選與剔除.由于氣象站儀器的誤差,造成收集的氣象數據存在個別的異常和缺失,因此在得到數據后,需要對其中的異常數據進行篩選和剔除.300組數據中剔除異常數據后剩余278組.

        篩選完數據后對所使用的數據集進行可視化操作,可以得到數據集的箱式圖.由于氣壓數據和其他數據的幅值相差過大,為了減小誤差,需要對數據集進行歸一化操作.

        第3步:選定訓練集和測試集.訓練集用來訓練預測模型,測試集用來測量預測模型的準確程度.預測模型選用前154組數據作為訓練集,后124組數據作為測試集.

        第4步:得到訓練模型.根據訓練集數據的分布特征,在數據集空間中尋找一個決策分類超平面,將道路結冰情況不同的數據組分開.構建支持向量機預測模型的本質就是尋找對訓練集數據進行分類的決策超平面.

        第5步:檢測訓練模型.在訓練模型搭建好之后,為了得到訓練模型的準確程度,需要使用測試集對已經訓練好的模型進行測試,測試結果用準確度表示.準確度越高,證明訓練模型的分類效果越好,對現實道路結冰情況的預測效果越強.

        2 預測模型仿真分析

        2.1 仿真模型數據分析

        構建道路結冰預測模型,降雨量、溫度和濕度是影響道路結冰氣象因素中首先要考慮的3個因素,同時,大氣壓、風速和風向對預測模型的準確率也有較大的影響.箱式圖可以直觀的表現出數據的異常情況和平均情況.由于本例選擇的特征值較多,因此采用箱式圖表示數據特征.數據集的箱式圖如圖3所示.

        圖3 數據集的box可視化圖像Fig.3 Box visualization of the dataset

        從圖3可以看出氣壓的中位數線比較高,主要集中在920~1 000百帕之間,這與所選地點的氣象站位置有關.在數據選擇的時間里,全國大多數地方的天氣較好,降雨量為0.濕度分布較為均勻,風向是統(tǒng)一以某一參考方向為基準方向的測量值,其分布相差較大,其最大值和最小值相差近350度.

        2.2 仿真結果分析

        在搭建好的支持向量機模型中,選用懲罰因子參數c為5,核函數參數g為0.5.進行仿真,結果準確率為81.6%.得出原始算法下模型預測分類值與實際分類值的比較圖如圖4所示.

        圖4 原始算法下模型預測分類值與實際分類值的比較圖Fig.4 Comparison of model predicted classification value and actual classification value under the original algorithmm

        從圖4可知原始預測模型下的預測錯分值較大,對道路結冰的預測結果不準確.

        3 優(yōu)化預測模型仿真分析

        3.1 粒子群優(yōu)化算法下的模型仿真分析

        將粒子群算法引入本模型可以實現對道路結冰模型最優(yōu)參數的無限逼近,空間中的每一個粒子代表一組參數,通過空間中粒子的運動,使得粒子不斷向最優(yōu)解逼近,通過對粒子的個體極值和群體極值的追蹤計算,使得參數組不斷向最優(yōu)參數組靠攏,最終找到預測模型的最優(yōu)參數.粒子群算法的主要參數有粒子群規(guī)模、個體認知和群體認知.個體認知和群體認知直接決定算法的迭代次數和收斂速度[15-16].為避免過學習和欠學習狀態(tài)的出現,這里取個體認知參數c1為2.8,群體認知參數為1.3,粒子規(guī)模取20[17].經過仿真分析,得到的結果準確度可達 93.600 0%,其適應度曲線如圖5所示.

        圖5 粒子群算法優(yōu)化下的適應度曲線Fig.5 Fitness curve under particle swarm optimization

        由圖5可知,在種群的迭代中,當最優(yōu)的懲罰因子參數為1.002 1,最優(yōu)的核函數參數為0.010 0時,得出的預測模型準確度可達95.454 0%.測試集124組數據中只有8組被錯分,優(yōu)化后的預測模型準確度可達93.600 0%,與原始不經優(yōu)化的預測模型相比,粒子群算法的優(yōu)化作用較為明顯.

        3.2 交叉驗證優(yōu)化算法下的模型仿真分析

        在尋優(yōu)優(yōu)化方法中,交叉驗證法是一種常用適用于數據量不大的數據集、能有效避免過學習和欠學習狀態(tài)出現的優(yōu)化算法.將交叉驗證法引入本模型進行優(yōu)化主要是防止測試集測試分類模型時出現過大的誤差,使得模型的魯棒性更高、預測模型的分類作用更明顯[18-19].決定交叉驗證算法優(yōu)化模型收斂速度和收斂的精度的主要參數是懲罰因子和核函數參數的步進大小.經過仿真實驗,優(yōu)化后模型的準確度可達94.400 0%,仿真結果如圖6、圖7所示.

        圖6 交叉驗證算法下的支持向量機算法參數優(yōu)化等高線圖Fig.6 Contour map of SVM algorithm parameter optimization under cross-validation algorithm

        圖7 交叉驗證法下的支持向量機算法參數優(yōu)化結果圖Fig.7 Parameter optimization results of SVM algorithm under cross-validation

        由圖6、7可以看出,當交叉驗證法優(yōu)化后的預測模型懲罰因子參數選為0.757 8,核函數參數選為0.015 6時,模型的預測準確度可達95.454 5%.測試集124組數據中只有7組數據被錯分,測試集的分類精度可達94.400 0%.與初始預測模型相比,準確率有了較高的提升.

        3.3 遺傳優(yōu)化算法下的模型仿真分析

        原始算法下的結果誤差較大,原因是懲罰因子c和核函數參數g選用的不合適[20-21].遺傳算法從生物學角度實現對支持向量機模型參數的尋優(yōu)迭代,由初始族群選擇參數,再通過變異、交換、選擇3個步驟實現對參數的最優(yōu)化選擇,通過對初始族群數量、交叉概率,變異概率和迭代代數的設定,得出最佳的道路結冰模型參數.利用遺傳算法對支持向量機算法進行參數最佳的搜索優(yōu)化.遺傳算法對參數的優(yōu)化程度取決于種群的最大數量、進化代數、交叉概率和變異概率,種群的最大數量代表潛在解在可解空間的分布,進化代數決定潛在解對空間最優(yōu)解的收斂程度,交叉概率和變異概率都與收斂速度有關[22-23].在本模型中,遺傳優(yōu)化算法的種群最大參數選為20,進化代數參數選為200,懲罰因子參數的取值范圍選定為[0,100],核函數參數的變化范圍選定為[0,100],交叉概率和變異概率參數都為默認值.通過仿真實驗,得到的仿真結果準確度為 95.200 0%,訓練集的的仿真準確度最大可達96.103 9%.適應度曲線如圖8所示.

        圖8 遺傳優(yōu)化算法下的適應度曲線Fig.8 Fitness curve under genetic optimization algorithm

        由圖8可知,在遺傳優(yōu)化算法的進化迭代中,當懲罰因子取51.586 2、核函數參數取0.071 4時,訓練集的最大準確度可達96.103 9%.當種群進化到第近20代時,最佳適應度已達到96.000 0%左右.測試集中124組數據僅有6組數據被錯分,預測模型的準確度達到95.200 0%.通過比較原始預測模型和遺傳優(yōu)化算法優(yōu)化的預測模型的準確度,遺傳優(yōu)化算法對原始模型核函數和懲罰因子參數的優(yōu)化作用明顯.

        4 結論

        基于氣象數據,分析得到影響道路結冰情況的氣象因素分類條件,利用支持向量機算法搭建道路結冰預測模型,分別使用交叉驗證算法、粒子群算法和遺傳算法對預測模型進行參數優(yōu)化.通過比較原始模型和優(yōu)化后模型的預測精度,得出由遺傳算法優(yōu)化的預測模型的通用性和準確度更強,更能適用于現實情況中復雜的道路交通安全預測預防情況.優(yōu)化算法對模型的準確度提升作用明顯,提高了交通部門對道路結冰情況的掌握程度,達到了預防和減少道路交通事故發(fā)生的效果.

        優(yōu)化算法優(yōu)化預測模型的本質是通過迭代算法對預測模型核函數和懲罰因子參數進行迭代計算,通過比較迭代結果,得出優(yōu)化效果最好的模型參數.而使用的遺傳算法、粒子群算法和交叉驗證法算法的原始參數是根據經驗選擇,在此基礎上下一步的工作可以繼續(xù)對優(yōu)化算法進行疊加優(yōu)化以期達到更高的準確率.

        猜你喜歡
        分類優(yōu)化模型
        一半模型
        超限高層建筑結構設計與優(yōu)化思考
        房地產導刊(2022年5期)2022-06-01 06:20:14
        民用建筑防煙排煙設計優(yōu)化探討
        關于優(yōu)化消防安全告知承諾的一些思考
        分類算一算
        一道優(yōu)化題的幾何解法
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        分類討論求坐標
        數據分析中的分類討論
        亚洲欧美日韩一区二区在线观看| 国产精品美女一区二区视频| 久久久亚洲精品无码| 国产精品爽爽va在线观看无码| 音影先锋色天堂av电影妓女久久 | 国产亚洲av夜间福利在线观看| 精品熟人妻一区二区三区四区不卡| 久久久久亚洲精品中文字幕| 欧美日韩色| 日韩精品av在线一区二区| 麻豆视频在线播放观看| 亚洲av鲁丝一区二区三区黄| 色窝窝在线无码中文| 亚洲av天堂久久精品| 精品露脸熟女区一粉嫩av| 亚洲国产成人片在线观看| 三级网址在线| 日韩av中文字幕亚洲天| 国产精品成人亚洲一区| 国产精品欧美福利久久| 久久av高潮av喷水av无码| 看大陆男女真人草逼视频| 国产精品无码翘臀在线观看| 亚洲欧美成人一区二区在线电影| 国产精彩视频| 91人妻一区二区三区蜜臀| 丁香婷婷激情综合俺也去| 午夜福利视频合集1000| 久久久久综合一本久道| 亚洲精品一区二区三区四区久久| 牛牛在线视频| 一级免费毛片| 精品国产麻豆一区二区三区| 国产亚洲精品一区二区无| 国产精品jizz视频| 久久99精品波多结衣一区| 日本不卡视频一区二区| 久久久久亚洲av成人网人人网站| 亚洲红怡院| 国产一区二区美女主播| 人妻丰满av无码中文字幕 |