黃益紹,韓 磊
(1. 長沙理工大學(xué) 道路災(zāi)變防治及交通安全教育部工程研究中心,湖南 長沙 410114;2. 長沙理工大學(xué) 交通運(yùn)輸工程學(xué)院,湖南 長沙 410114; 3. 同濟(jì)大學(xué) 道路與交通工程教育部實(shí)驗(yàn)室,上海 201804)
公交客流量可為運(yùn)營者實(shí)現(xiàn)公交智能調(diào)度、科學(xué)規(guī)劃公交線網(wǎng)提供直接有效的基礎(chǔ)數(shù)據(jù)支持,精確、實(shí)時(shí)的公交客流預(yù)測是實(shí)現(xiàn)智能公交信息服務(wù)、提高企業(yè)服務(wù)質(zhì)量和經(jīng)濟(jì)收益的重要科學(xué)依據(jù)[1-3]。公交客流預(yù)測作為國內(nèi)外智能交通系統(tǒng)的研究熱點(diǎn),20多年來已經(jīng)取得了較多的研究成果。一般來說,短時(shí)客流預(yù)測可以分為參數(shù)預(yù)測、非參數(shù)預(yù)測和混合預(yù)測3種方法:
1)在參數(shù)預(yù)測方法方面,自回歸移動(dòng)平均模型(ARMA)和自回歸積分移動(dòng)平均模型(ARIMA)是一種傳統(tǒng)且有效的客流預(yù)測方法[4-5]。但是,這些回歸模型均存在一定的線性局限性。為了研究客流的非線性部分,研究人員引入和改進(jìn)了各種非參數(shù)預(yù)測方法[6-11]。
2)在非參數(shù)預(yù)測方法方面,研究主要集中于人工神經(jīng)網(wǎng)絡(luò)[8]、支持向量機(jī)[9-10]和KNN算法[11]等智能預(yù)測模型。高為等[8]基于交通流特性的深入挖掘,構(gòu)造了一種基于RBF神經(jīng)網(wǎng)絡(luò)的短時(shí)交通流預(yù)測模型,該模型能夠有效預(yù)測動(dòng)態(tài)交通流量,但并沒有考慮外界影響因素;M. CASTRO-NETO等[9]提出了一種基于監(jiān)督統(tǒng)計(jì)學(xué)習(xí)的支持向量回歸(OL-SVR)模型,用于預(yù)測典型和非典型條件下高速公路的短時(shí)交通流量,該模型魯棒性較強(qiáng),但模型較為復(fù)雜,預(yù)測時(shí)間較長;劉曉玲等[10]將城市道路短期交通狀態(tài)的多個(gè)影響因素作為支持向量機(jī)的輸入變量,構(gòu)造了基于SVM的不同維數(shù)的道路短期交通狀態(tài)預(yù)測模型,結(jié)果表明,SVM-TF能夠?qū)崿F(xiàn)對道路交通流進(jìn)行實(shí)時(shí)、準(zhǔn)確的預(yù)測,但是多個(gè)影響因素之間存在一定的數(shù)據(jù)冗余;于濱等[11]充分考慮了城市道路的時(shí)空特性,并將其作為K近鄰算法的時(shí)間和空間參數(shù),最后將4種狀態(tài)向量融合進(jìn)一個(gè)K近鄰模型內(nèi),該模型預(yù)測精度較只考慮時(shí)間維度的模型有了大幅提升,如對該模型繼續(xù)進(jìn)行SVM參數(shù)優(yōu)化,則預(yù)測效果更好。相較于參數(shù)預(yù)測方法,非參數(shù)預(yù)測方法的主要過程是在沒有先驗(yàn)知識的情況下構(gòu)造輸入和輸出變量之間的非線性關(guān)系。因此,它們在特征回歸中更加靈活,更被廣泛使用。
3)在混合預(yù)測方法方面,W. Z. ZHENG等[12]利用貝葉斯定理分配兩個(gè)單一神經(jīng)網(wǎng)絡(luò)的權(quán)值,提出一種新的貝葉斯組合預(yù)測模型,并對短時(shí)交通流量進(jìn)行了預(yù)測,取得較好的效果,但模型魯棒性較差,適用范圍較小;W. C. HONG等[13]提出了一種基于支持向量回歸模型和連續(xù)蟻群優(yōu)化算法(SVRCACO)相結(jié)合的短期交通預(yù)測模型,并基于實(shí)際交通流數(shù)值驗(yàn)證了SVRCACO模型的預(yù)測性能,結(jié)果表明,其具有較高的預(yù)測性能,但沒有考慮到實(shí)際交通流數(shù)據(jù)的復(fù)雜性。
交通流預(yù)測問題已經(jīng)得到了深入的研究,但預(yù)測方法仍存在一些局限性。參數(shù)預(yù)測方法計(jì)算簡單,數(shù)據(jù)要求低,但在復(fù)雜環(huán)境下無法保證預(yù)測精度;非參數(shù)預(yù)測方法擁有較強(qiáng)數(shù)據(jù)擬合能力,預(yù)測精度相對較高,但是傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度較慢,且容易陷入局部最優(yōu)解,而SVM只有在小樣本條件下效率較高,且參數(shù)選擇困難。公交客流復(fù)雜性和不確定性較強(qiáng),影響因子眾多,且各個(gè)影響因子間存在冗余性,如何科學(xué)篩選核心因子、剔除冗余信息制約著模型的預(yù)測效率和精度。
綜上所述,筆者首先根據(jù)公交IC卡數(shù)據(jù)挖掘公交客流的影響因子,通過粗糙集對公交客流的多個(gè)影響因子進(jìn)行屬性約簡,確定關(guān)鍵屬性,然后通過改進(jìn)的IPSO算法找到全局最優(yōu)SVM參數(shù),構(gòu)造基于RS-IPSOSVM的公交客流預(yù)測模型,并與傳統(tǒng)SVM方法進(jìn)行對比分析。
屬性約簡就是在保持信息系統(tǒng)的分類或決策能力不變的前提下,刪除不重要或不相關(guān)的冗余屬性,推導(dǎo)出待解問題的分類或決策。在粗糙集中,一個(gè)信息系統(tǒng)為:
S=(U,A,V,f)
(1)
式中:U為論域;A=C∪D={a1,a2,…,an}為非空屬性的有限集合,其中,C為條件屬性集(客流量影響因子),D為決策屬性集(客流預(yù)測);V=UVa為屬性值的集合,Va為a∈A的值域;f為映射函數(shù),賦予了U中每個(gè)成分的屬性值,其中,U×A→V,f(xi,a)∈V。具有條件屬性和決策屬性的知識表達(dá)系統(tǒng)統(tǒng)稱為決策表。決策表中行代表對象的一條記錄,列代表對象的屬性。
定義條件屬性C對決策屬性D的支持度為:
(2)
式中:POSC(D)為D的C正域,具體指根據(jù)C的知識能確切劃入U(xiǎn)|D類的元素集合;γC(D)為條件屬性對決策屬性的支持程度。通過條件屬性對決策屬性的貢獻(xiàn)程度來判斷該屬性的重要性大小。在量化由屬性集得出的分類屬性子集B′?B的重要性時(shí),依據(jù)雙方依賴程度的差來度量,如式(3):
Δk=rB(D)-rB(D)
(3)
式中:Δk表示當(dāng)從集合B中去掉某些屬性子集B′后進(jìn)行分類時(shí),分類U|D的正域受到的影響大小。其值的大小表明了對應(yīng)屬性的重要性。冗余屬性的支持度為零,可以將其剔除。另外,在一個(gè)決策表中,不可或缺的屬性稱為核屬性。
假設(shè)給定的訓(xùn)練集樣本為S={(xi,yi),xi∈Rd,yi∈R}(i=1,2,…,l)。其中:xi為第i個(gè)輸入變量(屬性約簡后得到的核心影響因子);yi為對應(yīng)的目標(biāo)輸出向量(客流量預(yù)測值);l為樣本容量。通過非線性映射?(x)把輸入變量映射到高維特征空間,在高維特征空間中構(gòu)造函數(shù):
f(x)=ω?(x)+b
(4)
式中:?(x)是將樣本點(diǎn)映射到高維空間的非線性變換;ω為權(quán)值矢量;b為閾值。
采用ε線性不敏感損失函數(shù),如式(5):
(5)
式中:ε為線性不敏感損失函數(shù);f(x)為預(yù)測值;y為與之對應(yīng)的真實(shí)值。
(6)
式中:C為常數(shù),表示誤差大于ε的樣本個(gè)數(shù)。
為了求解式(6)的優(yōu)化問題,引入拉格朗日函數(shù),將問題轉(zhuǎn)化到其對偶空間中:
(7)
(8)
為了提高可靠性,一般先分別計(jì)算所有標(biāo)準(zhǔn)支持向量b的值,再求平均值,即:
(9)
式中:Nn,SV為支持向量的數(shù)量;SV為支持向量。
構(gòu)造回歸函數(shù)如式(10):
(10)
支持向量機(jī)中核函數(shù)的選取極其重要,直接影響著模型的預(yù)測性能。文獻(xiàn)[14]表明,RBF核函數(shù)具有較高的預(yù)測準(zhǔn)確率,泛化能力好,故筆者選取RBF函數(shù)為核函數(shù)。
徑向基(radial basis function,RBF)核函數(shù),如式(11):
K(x,xi)=exp(-‖x-xi‖2/2σ2)
(11)
粒子群算法是一種基于種群進(jìn)化的智能優(yōu)化算法[15]。傳統(tǒng)的PSO算法全局搜索能力較弱,容易陷入局部最優(yōu),很難逃出[16-18]。筆者提出一種改進(jìn)的PSO算法,引入一種自適應(yīng)調(diào)整的慣性權(quán)重的方法,將其設(shè)為隨迭代次數(shù)線性改變的變量,實(shí)現(xiàn)對PSO算法的改進(jìn)。再利用IPSO算法來尋找SVM全局最優(yōu)參數(shù)。迭代公式為:
(12)
(13)
式中:ωmin、ωmax分別為ω的最小值和最大值;f為當(dāng)前個(gè)體適應(yīng)度;fmin、favg分別為最小適應(yīng)值和平均適應(yīng)值。
此外,為了提高算法的收斂速度和精度,筆者采用異步變化的學(xué)習(xí)因子:
(14)
式中:c1ini、c2ini分別為c1、c2的初始值;t、Tmax分別為當(dāng)前和最大迭代次數(shù);c1fin、c2fin分別為c1、c2的終值。
IPSO優(yōu)化SVM參數(shù)的具體步驟如下:
步驟1:初始化。隨機(jī)產(chǎn)生一組粒子的初始位置和速度。
步驟3:按式(12)更新每個(gè)粒子的速度和位置,按式(13)和式(14)更新ω、c1和c2。
步驟4:檢查結(jié)束條件,若尋優(yōu)達(dá)到最大迭代次數(shù)Tmax,或者評價(jià)值小于設(shè)定精度值,則尋優(yōu)結(jié)束;否則轉(zhuǎn)至步驟2,繼續(xù)尋優(yōu)。
步驟5:將搜索到的粒子最優(yōu)位置,即最優(yōu)參數(shù)向量C和σ賦給SVM。
步驟6:應(yīng)用樣本數(shù)據(jù)對SVM進(jìn)行訓(xùn)練。
所用實(shí)驗(yàn)數(shù)據(jù)源自于廣州市公交公司提供的公交線路IC卡數(shù)據(jù)和廣州市氣象局統(tǒng)計(jì)的天氣數(shù)據(jù)。筆者采集使用2017年8月1日至2017年12月31日的4條具有代表性的干線公交線路(3、6、9、10路)IC卡刷卡數(shù)據(jù)和天氣數(shù)據(jù)。IC刷卡記錄收集量達(dá)900多萬條,公交線路覆蓋城市多數(shù)重要站點(diǎn),其中IC刷卡記錄主要包括使用地、線路名稱、刷卡終端、交易時(shí)間、IC卡類型等,公交線路信息主要包括線路號、??空军c(diǎn)數(shù)量、線路類型。天氣數(shù)據(jù)包括日期、天氣情況、溫度、風(fēng)速/風(fēng)向、風(fēng)力。筆者通過使用文獻(xiàn)[19]中方法,利用IC卡刷卡數(shù)據(jù)確定了公交線路客流量,從而便于對影響公交客流因素進(jìn)行分析以及客流量的預(yù)測。
公交客流受到眾多因素的影響,深入挖掘客流變化規(guī)律是客流預(yù)測的重要前提。
1)不同人群擁有不同的出行習(xí)慣。隨機(jī)選取某日6:00—20:00的樣本線路IC卡數(shù)據(jù)進(jìn)行各類人群統(tǒng)計(jì),如圖1。由圖1可知,樣本線路中普通乘客、老人和學(xué)生占乘客總數(shù)量的99.51%,故在分析人群出行習(xí)慣時(shí),選擇普通乘客、老人和學(xué)生這3種人群作為研究對象。選擇廣州市6路公交在2017年9月4日(周一)從早上6點(diǎn)到晚上20點(diǎn)的IC刷卡數(shù)據(jù)作為研究對象,在這期間普通乘客、老人、學(xué)生及客流總量在每小時(shí)的客流量變化如圖2。由圖2可知,各類人群在出行上具有自己的規(guī)律性,但是客流變化趨勢基本一致。在對客流量的預(yù)測中,為了不增加模型的復(fù)雜度,可以拋棄分人群建模的思想,采用整體建模的方式依然可以反映出客流量的總體趨勢。
2)公交客流規(guī)律受公交線路影響較為明顯。隨機(jī)選擇樣本線路某日的6點(diǎn)到20點(diǎn)客流量進(jìn)行橫向?qū)Ρ确治?,如圖3。由圖3可知,不同線路每小時(shí)客流的總量和變化趨勢存在很大差別。因此,在對客流量的預(yù)測中,應(yīng)充分考慮線路的自身特性。
3)公交客流規(guī)律受節(jié)假日影響明顯。以6路公交43個(gè)工作日和110個(gè)節(jié)假日早上8點(diǎn)客流量為例,對不同日類型進(jìn)行縱向?qū)Ρ?,如圖4。從圖4中可以看出,工作日和節(jié)假日出行的客流量整體特征差距明顯,屬于重要影響因素。因此在對客流量預(yù)測時(shí),需要充分考慮節(jié)假日因素的影響,在SVM回歸預(yù)測時(shí)應(yīng)將此因素量化作為訓(xùn)練的輸入數(shù)據(jù)。
4)公交客流規(guī)律受天氣影響明顯。選擇廣州市6號公交的客流數(shù)據(jù)作為研究對象,日期則選擇天氣特征明顯的3天(晴天、陰天、大暴雨),在這3種天氣情況下一天內(nèi)客流量數(shù)據(jù)變化如圖5。從圖5中可以看出,天氣的變化影響了客流量的數(shù)值,晴天陰天的客流量總量發(fā)生變化,但是客流變化不明顯。而在大暴雨當(dāng)日,公交客流量相比晴天時(shí)明顯減少。因此在遇到極端天氣時(shí),對客流的影響會相對較明顯。
綜上所述,公交線路不同、時(shí)間、節(jié)假日安排和天氣狀況是公交客流量的4個(gè)主要影響因素。天氣狀況包含眾多方面,筆者為了簡便,僅將預(yù)測場景劃分為工作日和節(jié)假日。
圖6是采用RS-IPSOSVM模型進(jìn)行公交客流量預(yù)測的流程,具體步驟如下:
1)影響因子的選取。根據(jù)2.2節(jié)分析,選取影響公交客流變化的線路、時(shí)間、節(jié)假日和天氣狀況初始影響因子。
2)數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理主要是進(jìn)行客流噪聲數(shù)據(jù)的清洗、數(shù)據(jù)歸一化、數(shù)據(jù)整合以及天氣狀況數(shù)據(jù)的量化。
3)利用粗糙集對影響公交客流變化相關(guān)的屬性進(jìn)行約減,去掉冗余或者干擾因子,得到最小條件因子集和核。
4)將約簡后的核因子集分為訓(xùn)練樣本集和檢驗(yàn)樣本集,取訓(xùn)練樣本集作為SVM預(yù)測的輸入,利用IPSO算法尋找SVM全局最優(yōu)參數(shù),選取RBF函數(shù)為核函數(shù),構(gòu)造公交客流量與影響因子的SVM預(yù)測模型。
5)將模型輸出的預(yù)測結(jié)果進(jìn)行反歸一化處理,選取評價(jià)指標(biāo),完成模型的性能評價(jià)。
1)線路因子。通過2.2節(jié)分析可知,不同公交線路的客流量變化存在差異。因此,選取線路號(A1)、站點(diǎn)數(shù)量(A2)、線路類型(A3)作為初始因子。
2)時(shí)間因子。不同時(shí)間、時(shí)刻下客流量存在不同,故選取季節(jié)(A4)、月份(A5)、日期(A6)、時(shí)刻(A7)作為初始因子。
3)節(jié)假日因子。節(jié)假日與工作日客流量差距明顯,故選取節(jié)假日情況(A8)作為初始因子。
4)天氣狀況因子。天氣情況的波動(dòng)會影響居民對出行交通方式的選擇,進(jìn)而影響公交客流量,故選取天氣狀況(A9)、最高溫度(A10)、最低溫度(A11)、風(fēng)力(A12)、風(fēng)向(A13)作為初始因子。
5)初始影響因子相關(guān)性計(jì)算。利用Pearson相關(guān)系數(shù)得出13個(gè)影響因子的相關(guān)性如表1。由表1可知,各影響因子間存在一定程度的關(guān)聯(lián)耦合和冗余性,若直接以初始因子集作為輸入集進(jìn)行預(yù)測會造成預(yù)測結(jié)果出現(xiàn)較大的誤差。
表1 影響因子相關(guān)系數(shù)
1)處理殘缺數(shù)據(jù)。由于傳輸設(shè)備的不穩(wěn)定性,所獲得IC卡刷卡數(shù)據(jù)會出現(xiàn)殘缺數(shù)據(jù)。通過對殘缺數(shù)據(jù)的篩選發(fā)現(xiàn),此部分?jǐn)?shù)據(jù)占總體數(shù)據(jù)比例極小,故直接將其刪除處理。
2)處理無效數(shù)據(jù)。線路停運(yùn)、道路管制等一些突發(fā)情況會造成客流量與平常相差巨大,此時(shí)的數(shù)據(jù)毫無代表性和可靠性,故應(yīng)將其刪除放棄。
3)數(shù)據(jù)整合及量化。其一,為了縮減整體數(shù)據(jù)的規(guī)模,將松散的刷卡數(shù)據(jù)分線路轉(zhuǎn)化為每日每小時(shí)的刷卡記錄總和。其二,原始天氣屬性數(shù)據(jù)均為非量化數(shù)據(jù),故需進(jìn)行量化處理。
4)為了消除評價(jià)因子不同量綱造成的影響,按其屬性將其歸一化到[0,100]間。
限于粗糙集輸入的屬性數(shù)據(jù)均為離散型變量的要求,筆者選取的13個(gè)影響因子均為連續(xù)型變量。因此,需要先進(jìn)行影響因子離散化處理。筆者對數(shù)據(jù)離散化處理采用等寬間隔法,如式(15)~式(16):
(15)
(16)
(17)
式中:a0、a1分別為兩個(gè)分隔點(diǎn)的數(shù)值;Ai為第i個(gè)影響因子;Aimax、Aimin分別為Ai的最大值和最小值。
運(yùn)用基于Pawlak的屬性重要度的決策表屬性約簡算法進(jìn)行屬性約簡[20],最終得到屬性約簡后的部分決策表結(jié)構(gòu)如表2,決策屬性集代表著指定時(shí)刻客流量的數(shù)值。由表2可知,核因子集為{A1,A6,A7,A8,A9,A10,A11,A13}。
表2 屬性約簡后的預(yù)測決策表
SVM參數(shù)C和σ的取值范圍分別為[0,100]、[0,10]。設(shè)置IPSO算法參數(shù)的初始值,粒子群規(guī)模為30,最大迭代次數(shù)為200,學(xué)習(xí)因子c1=c2=2,ωmin=0.3,ωmax=0.9。通過計(jì)算每個(gè)粒子的適應(yīng)度,根據(jù)適應(yīng)度值的大小更新pi和pg,并更新粒子的位置、速度、學(xué)習(xí)因子以及慣性權(quán)重ω,從而形成新的粒子群。然后搜索得到支持向量機(jī)的最優(yōu)參數(shù)C=4,σ=2.1。利用獲得的最佳模型參數(shù)對樣本數(shù)據(jù)進(jìn)行學(xué)習(xí),建立公交客流量預(yù)測模型。通過構(gòu)造的模型對樣本線路客流量進(jìn)行預(yù)測,檢驗(yàn)?zāi)P偷念A(yù)測性能。
筆者應(yīng)用構(gòu)造的基于RS-IPSOSVM模型分別對廣州市6路公交在工作日(2017年12月25日—2017年12月29日)和元旦節(jié)假日(2017年12月30日—2017年12月31日)的客流量進(jìn)行預(yù)測,預(yù)測結(jié)果如圖7。傳統(tǒng)SVM回歸模型預(yù)測結(jié)果如圖8。從圖7、圖8中可以看出,RS-IPSOSVM模型預(yù)測值及其變化趨勢基本符合真實(shí)值,擬合度更好。
為了進(jìn)一步驗(yàn)證筆者提出的RS-IPSOSVM預(yù)測方法的有效性和優(yōu)越性,再選取ARIMA和BP這兩種經(jīng)典方法,利用均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)3個(gè)評價(jià)指標(biāo)對這4種模型性能進(jìn)行分析,如式(18)~式(20):
(18)
(19)
(20)
式中:N為樣本數(shù)。
利用式(18)~式(20)分別計(jì)算4種模型的RMSE、MAE和MAPE值,得出表3。由表3可以定量地看出,RS-IPSOSVM預(yù)測方法在不同預(yù)測場景下的預(yù)測誤差均保持了較低的值,相鄰工作日、相鄰節(jié)假日之間RMSE、MAE和MAPE值變化幅度不大,模型預(yù)測效果具有一定的穩(wěn)定性。在綜合測試集上,相較于ARIMA、BP和SVM模型,RMSE分別減小了69.86%、67.83%、60.51%,MAE分別減小了75.01%、73.34%、67.27%,MAPE分別減小了63.98%、41.70%、38.45%。
表3 不同模型預(yù)測誤差
綜合4種模型的預(yù)測結(jié)果表現(xiàn),得到4種模型在12月1日客流預(yù)測中的絕對誤差對比,如圖9。由圖9可知,RS-IPSOSVM預(yù)測模型在各個(gè)時(shí)段的預(yù)測精度均高于ARIMA、BP和SVM模型。綜上所述,組合預(yù)測模型準(zhǔn)確度更高,預(yù)測曲線的擬合度更好。同時(shí)通過運(yùn)用粗糙集的屬性約簡算法可以簡化訓(xùn)練樣本的輸入,減少模型的運(yùn)算,也是該組合模型的一大優(yōu)點(diǎn)。
1)公交客流具有不確定性和復(fù)雜性,受多重因素影響,粗糙集理論具有較強(qiáng)的數(shù)據(jù)挖掘能力。通過對建立的公交客流預(yù)測決策表進(jìn)行屬性約簡,刪除冗余信息,獲得影響客流變化的主控因素,為選取正確的客流預(yù)測評價(jià)因子提供依據(jù)。
2)支持向量機(jī)模型的懲罰參數(shù)和核函數(shù)參數(shù)對預(yù)測分類結(jié)果的準(zhǔn)確性影響較大,采用改進(jìn)粒子群算法對參數(shù)和進(jìn)行優(yōu)化,減少了人為選取參數(shù)的隨意性,提高了分類準(zhǔn)確性。
3)根據(jù)RS-IPSOSVM公交客流預(yù)測模型,將公交客流變化的影響因素通過核函數(shù)映射到高維空間,建立與客流的映射關(guān)系,通過對樣本線路的預(yù)測,發(fā)現(xiàn)預(yù)測值與實(shí)際值基本一致,證明RS-IPSOSVM預(yù)測模型具有較強(qiáng)的有效性。
4)通過對比ARIMA、BP和SVM預(yù)測模型,證明筆者方法在滿足預(yù)測精度的前提下?lián)碛懈煊?xùn)練速度與可靠性。
綜上所述,筆者所提出的RS-IPSOSVM算法可以為公交公司實(shí)現(xiàn)公交實(shí)時(shí)調(diào)度提供科學(xué)依據(jù),合理配置有限的資源,降低公交運(yùn)營成本,進(jìn)一步推動(dòng)城市公交系統(tǒng)的發(fā)展;同時(shí)也可為居民智能公交出行提供信息便捷服務(wù),及時(shí)掌握到公交運(yùn)營線路客流量情況,具有一定的實(shí)用價(jià)值。在本研究中,運(yùn)用粗糙集對影響因子進(jìn)約簡,在未來的研究中,可以對比多種算法,選擇其中最優(yōu)一個(gè)與IPSOSVM相結(jié)合。