亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        決策樹優(yōu)化選擇下城市交通出行特征研究

        2024-09-12 00:00:00李文
        現(xiàn)代電子技術(shù) 2024年5期
        關(guān)鍵詞:城市交通決策樹交通

        摘" 要: 文中對基于決策樹優(yōu)化選擇下城市交通出行特征進(jìn)行研究,通過研究城市交通出行方式,緩解城市交通出行壓力?;跊Q策樹算法基本理論,構(gòu)建決策樹模型,選取城市交通出行特征作為分類依據(jù),運(yùn)用C4.5決策樹算法對城市交通出行數(shù)據(jù)進(jìn)行分類,根據(jù)分類后各個不同特征葉子節(jié)點(diǎn)對上層子節(jié)點(diǎn)的總占比進(jìn)行城市交通出行特征優(yōu)化選擇分析,并在“Occam′s razor”的基礎(chǔ)上,利用重新引入法提出優(yōu)化方法,解決C4.5決策樹算法存在的過度擬合問題,提升城市交通出行方式分析效果。實(shí)驗(yàn)結(jié)果表明,該方法可有效分析城市交通現(xiàn)有出行特征,指導(dǎo)城市交通規(guī)劃,依據(jù)該方法的分析結(jié)果對早高峰線路進(jìn)行優(yōu)化后,有效減少了長距離擁堵路段,同時避免了嚴(yán)重阻塞路段的產(chǎn)生。

        關(guān)鍵詞: 城市交通; 出行特征; 決策樹; 優(yōu)化選擇; 特征分類; C4.5決策樹算法; 奧卡姆剃刀理論; 過度擬合

        中圖分類號: TN911.1?34; U491" " " " " " " " 文獻(xiàn)標(biāo)識碼: A" " " " " " " " " " " " 文章編號: 1004?373X(2024)05?0182?05

        Research on urban traffic travel characteristics

        based on decision tree optimization selection

        LI Wen1, 2

        (1. Hope College of Southwest Jiaotong University, Chengdu 610400, China;

        2. Chengdu Transportation + Tourism Big Data Application Technology Research Base, Chengdu 610400, China)

        Abstract: A study on urban transportation travel characteristics based on decision tree optimization selection is carried out. This study alleviates urban transportation travel pressure by studying urban transportation travel modes. On the basis of the basic theory of the decision tree algorithm, a decision tree model is constructed, and urban traffic travel characteristics are selected as the classification basis. The C4.5 decision tree algorithm is used to classify urban traffic travel data, and the urban traffic travel characteristics are optimized and selected according to the total proportion of each leaf node with different characteristics to the upper sub node after classification. On the basis of ″Occam′s razor″, the reintroduction method is used to propose optimization methods to solve the overfitting problem of C4.5 decision tree algorithm and improve the analysis effect of urban transportation modes. The experimental results show that the method can effectively analyze the existing travel characteristics of urban traffic and guide urban transportation planning. After optimizing the morning peak line according to the analysis results of this method, it can effectively reduce the long?distance congested roads and avoid the generation of serious congested roads.

        Keywords: urban transportation; travel characteristic; decision tree; optimization selection; characteristic classification; C4.5 decision tree algorithm; Occam′s razor theory; overfitting

        0" 引" 言

        交通出行調(diào)查是了解城市交通狀況、獲取人流、車流及貨流日常出行特征和規(guī)律的基礎(chǔ)調(diào)查之一[1],該調(diào)查通過收集數(shù)據(jù)和分析結(jié)果,為城市交通規(guī)劃和優(yōu)化提供了重要的參考依據(jù)。同時,交通出行調(diào)查也是掌握交通供給和需求之間關(guān)系的基本手段之一[2]。交通出行方式的選擇是出行調(diào)查中的重要一環(huán)[3]。不同交通出行方式對于滿足居民的日常出行需求及交通結(jié)構(gòu)的合理性改變起著舉足輕重的作用。例如,在城市交通擁堵的情況下,廣泛推廣公共交通可以有效地緩解交通壓力[4?5]。因此,了解居民的出行方式選擇及其行為特征,有助于制定出更加科學(xué)的城市交通規(guī)劃和管理政策。

        當(dāng)前,我國主要的大城市都已經(jīng)對我國的交通狀況進(jìn)行了調(diào)研,并對調(diào)研結(jié)果進(jìn)行了一些分析和研究。文獻(xiàn)[6]以西寧市為例,基于大樣本居民出行調(diào)研數(shù)據(jù),構(gòu)建支持向量機(jī)(SVM)與二元邏輯(BL)兩種方法,實(shí)現(xiàn)對不同城市交通出行方式的預(yù)測。文獻(xiàn)[7]采用CFSFDP和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,對交通特性進(jìn)行個性化選擇,構(gòu)建交通特性群識別模型,通過對私家車、出租車中存在的特征組進(jìn)行分析,識別出其不同的交通方式,從而完成對交通特性組的識別并對其進(jìn)行評估和分析。但上述兩種方法中均存在實(shí)驗(yàn)樣本數(shù)據(jù)不夠多的問題,這樣會使分析結(jié)果存在一定的誤差性。

        為優(yōu)化選擇城市交通出行方式,本文運(yùn)用C4.5決策樹算法對不同特征的城市交通出行方式進(jìn)行研究,并運(yùn)用奧卡姆剃刀理論(Occam′s razor)優(yōu)化C4.5決策樹算法存在的過度擬合問題。

        1" 城市交通出行特征的決策樹優(yōu)化選擇研究

        1.1" 決策樹城市交通出行特征選取

        建立決策樹是一個自上而下的遞歸過程,決策樹根節(jié)點(diǎn)是取一個城市交通出行特征,將其視為所有訓(xùn)練特征與該根節(jié)點(diǎn)有關(guān)聯(lián)的一類標(biāo)號。對根節(jié)點(diǎn)的特征進(jìn)行測試,并對其進(jìn)行切割,由此可以得到與其相對應(yīng)的各種子集,之后將這一類子集看作是擁有新特征的非葉節(jié)點(diǎn),對其進(jìn)行測試并將其分割,得到新的特征子集[8]。如此反復(fù),直到?jīng)]有新的葉子節(jié)點(diǎn)出現(xiàn)時,就可以獲得完整的決策樹。

        在決策樹算法中,城市交通出行數(shù)據(jù)類別特征的選取是一個非常重要的環(huán)節(jié)。在這種新的分類算法中,根據(jù)信息增益的大小和信息熵值的大小,選取一個分類的城市交通出行特征作為分類的依據(jù)。

        信息增加準(zhǔn)則包括三個重要的概念:信息熵、期望熵、信息增加。信息熵或者期望熵是指每個采樣集合所具備的純凈程度。假設(shè)在城市交通出行集合[Q]中包括[q]個城市交通出行數(shù)據(jù)采樣,類別標(biāo)記城市交通出行特性[A],包括[a]個不同的取值,將采樣集合[Q]分為[a]個不同的類別[Aii=0,1,2,…,a];在每一種類別中的樣品數(shù)目被指示為[q],因而城市交通出行集合[Q]被分成預(yù)期信息的[a]種不同種類:

        [EQ=-i=1apilog2 pi] (1)

        在所述樣本集合中,不同種類特征的可能性為:

        [pi=qiq] (2)

        信息是用二進(jìn)制來編碼的,而編碼的長短是用熵中二進(jìn)制比特的數(shù)目來衡量的,因此使用了一個具有2個基點(diǎn)的對數(shù)函數(shù)。

        每個城市交通出行特征都有一定的信息量,即根據(jù)特征對城市交通出行數(shù)據(jù)采樣結(jié)果進(jìn)行劃分,從而使其對熵值的期望有所下降。在[Q]的城市交通出行樣本集中,可以將多個不同的城市交通出行特征分開,假定[T]的特征含有不同的值,那么相應(yīng)的一組數(shù)字被記錄為[ValuesT],[Qb]是[Q]的一組特征的[T]值為[t]的一組數(shù)據(jù),其表示為:

        [Qt=q∈QTq=t] (3)

        在[T]的不同分枝節(jié)點(diǎn)上,這類節(jié)點(diǎn)樣本集合[Qt]的類別熵值可以用[EQt]表示。相對應(yīng)于特征[T]的預(yù)期熵為:

        [EQ,T=-t∈ValuesTQtEQtQ] (4)

        式中:[EQt]代表狀態(tài)[Q]在特定時間[t]下的期望值,并對整個時間段內(nèi)的每一個狀態(tài)進(jìn)行加權(quán)平均以得到[EQ,T]的值。

        從城市交通出行特征[T]中可以得到其信息量為:

        [GainQ,T=EQ-EQ,T] (5)

        當(dāng)[GainQ,T]的數(shù)值較大時,對[T]的類別所能給出的資訊也較多。

        采集到不同類別的城市交通出行數(shù)據(jù)特征后,需要對不同類別的城市交通出行數(shù)據(jù)進(jìn)行相應(yīng)分類。

        1.2" 決策樹城市交通出行特征分類算法

        將城市交通出行數(shù)據(jù)抽樣集合[Q]分為[q]個抽樣子集合,用[Q1,Q2,…,Qq]表示。劃分的原則是以離散城市交通出行特征[T]的[m]個不同的取值為基礎(chǔ),因此,在采樣集[Q]中,使用離散城市交通出行特征[T]進(jìn)行劃分得到的信息增益率為:

        [GRQ,T=log2QiQGainQ,T-i=1qQiQ] (6)

        決策樹分類方法的中心思想就是把城市交通出行特征為連續(xù)值的值域分割成一個離散的區(qū)間集[9?10]。C4.5算法既可以對離散特征進(jìn)行有效的分類,又可以對連續(xù)類型的特征進(jìn)行有效的分類,具體步驟如下所示:

        1) 根據(jù)連續(xù)城市交通出行特征[T]的不同取值,對樣品集中[Q]的樣品進(jìn)行了數(shù)值計(jì)算,并根據(jù)從小到大的快速排序方法對城市交通出行數(shù)據(jù)樣品集中[Q]的城市交通出行數(shù)據(jù)進(jìn)行排序,其中城市交通出行數(shù)據(jù)樣品集中[T]被每個不同的取值劃分為[s]個子集[Q1,Q2,…,Qs]。

        2) 2個相鄰取值的平均值按照一定的順序進(jìn)行分割,該平均值被當(dāng)作是分割點(diǎn),城市交通出行數(shù)據(jù)樣本集被分割點(diǎn)分割成兩個子集,兩個子集的范圍以平均值為界限,一個子集全小于平均值,另外一個子集則全大于平均值,一共含有[s-1]個分割點(diǎn),分別對每一個分割點(diǎn)對應(yīng)的信息增益進(jìn)行計(jì)算。

        3) 在此基礎(chǔ)上,以連續(xù)型城市交通出行特征[T]對城市交通出行數(shù)據(jù)集[Q]信息增益率的劃分為基礎(chǔ),從各種取值中找到一個值作為城市交通出行特征[T]的分裂值,所找到的這個值一定要非常接近局部閾值,卻又不能超出局部閾值。

        4) 反復(fù)進(jìn)行以上操作,最終得出在該城市交通出行特征集中每個特征所對應(yīng)的信息增益率,將其取值最高的特征作為測試特征,并將該城市交通出行數(shù)據(jù)樣本集劃分為幾個城市交通出行數(shù)據(jù)樣本子集。

        5) 對所得到的城市交通出行數(shù)據(jù)樣本子集根據(jù)以上劃分方法進(jìn)行劃分,直至無法進(jìn)行進(jìn)一步劃分。C4.5決策樹形算法[11?12]不僅對連續(xù)類型的特征有很強(qiáng)的適應(yīng)能力,而且對缺失類型的特征也有很好的處理能力,可以產(chǎn)生更多的分枝。

        C4.5算法分類流程如圖1所示。

        對各個不同城市交通出行特征節(jié)點(diǎn)分類后,分析各個不同特征葉子節(jié)點(diǎn)對上層子節(jié)點(diǎn)的總占比,通過分析總占比,針對不同情況進(jìn)行不同優(yōu)化選擇。但C4.5方法在提高判別準(zhǔn)確率的同時,也存在著“擬合過度”的問題。為此,本文提出一種新的“Occam′s razor”方法,以提高其在數(shù)據(jù)處理中的準(zhǔn)確率,從而避免了決策樹在處理城市交通出行數(shù)據(jù)時存在的過度擬合問題。

        1.3" 解決C4.5算法過度擬合問題

        為了克服C4.5在求解過程中易出現(xiàn)的過擬合現(xiàn)象[13],本文在“Occam′s razor”的基礎(chǔ)上,利用重新引入的方法,提出了一種新的優(yōu)化方法。該算法的優(yōu)化思路是:根據(jù)奧卡姆剃刀理論,當(dāng)兩個模型的推廣精度完全一致時,將其推廣到一個更簡單的模型中。

        假設(shè)由城市交通出行數(shù)據(jù)組建的訓(xùn)練集[Q]存在[V]種記錄和[h]種類別。用此訓(xùn)練集形成的決策樹存在[t]個葉子節(jié)點(diǎn),葉子節(jié)點(diǎn)的集合設(shè)為[U1,U2,…,Ut],第[k]個葉子節(jié)點(diǎn)中的類分別設(shè)為[Uk1,Uk2,…,Ukh],設(shè)[Ck]為第[k]個節(jié)點(diǎn)中類的總數(shù),對應(yīng)第[k]個節(jié)點(diǎn)中各個類的數(shù)量表示為[Uki1≤i≤h],[maxUki] [1≤i≤h]設(shè)為[Uki]中最大的值,那么泛化誤差公式可表示為:

        [e=k=1ti=1sCk-maxUkiV] (7)

        從奧卡姆剃刀理論可以看出,在泛化誤差相等的情況下,采用更簡單的數(shù)學(xué)模型更為合適。因而,在不過度追求精度的前提下,可采用再代入估計(jì)法進(jìn)行估算。下面詳細(xì)說明了再代入估計(jì)法的具體方法。

        決策樹每進(jìn)行一次分裂,就會進(jìn)行一次訓(xùn)練誤差(訓(xùn)練誤差是指訓(xùn)練集的誤差,計(jì)算公式見式(7))的計(jì)算,將訓(xùn)練誤差看成是一種通用誤差,當(dāng)通用誤差小于某一特定值[?]時,就會停止決策樹的成長。[?]因資料集合的差異而異,須以真實(shí)的需要為基礎(chǔ)進(jìn)行反復(fù)的實(shí)驗(yàn)才能決定。

        2" 實(shí)驗(yàn)分析

        本文數(shù)據(jù)是以某市城市交通出行調(diào)查的數(shù)據(jù)為基礎(chǔ),對其進(jìn)行研究,主要研究的是在主城區(qū)及周邊輻射區(qū)影響范圍內(nèi)的常、暫住人口及流動人口的交通出行狀況。常住人口和流動人口是以家庭為單位抽取的,在主城區(qū)的樣本比例是5%,周邊地區(qū)的樣本比例為3%。根據(jù)4%的樣本統(tǒng)計(jì),農(nóng)民工人數(shù)占總?cè)藬?shù)的4%。問卷采用的是以家庭為單位進(jìn)行的家庭問卷,問卷包括個人情況、家庭情況和旅行情況。通過對所收集到的資料進(jìn)行歸類,得到了1 000份可供使用的資料,所涉及到的運(yùn)輸形式大致可以分為:步行、非機(jī)動車、公交和私人機(jī)動車等,部分輸入變量定義如表1所示。

        該決策樹模型以對不同交通方式的選擇為因變量,由于影響交通方式的選擇因素很多,本文主要考慮出行者的個人屬性及家庭屬性信息,選取出行時間、出行目的、出行日期(工作日、節(jié)假日)、出行者的年齡、性別、職業(yè)、是否有公交卡、是否用公共自行車、家庭規(guī)模、兒童數(shù)、是否有購車意愿作為自變量。

        以該市采集資料為實(shí)驗(yàn)樣本,運(yùn)用本文方法對該市交通出行特征進(jìn)行分析,對該市交通出行方式做出優(yōu)化分析選擇,選取出行方式與職業(yè)作為實(shí)驗(yàn)自變量,具體實(shí)驗(yàn)?zāi)P驮O(shè)置如表2所示。

        運(yùn)用本文方法對該市交通出行方式按表2中的因變量與自變量構(gòu)建決策樹,具體實(shí)驗(yàn)結(jié)果如圖2所示。

        由圖2可看出,運(yùn)用本文方法構(gòu)建的決策樹中,在“出行方式”模式中是根據(jù)私人機(jī)動車擁有量的數(shù)量而分割的,可以看到,在擁有私人機(jī)動車的數(shù)量為零時,居民主要會選擇以步行及公共交通方式進(jìn)行出行,而在這之中,選擇公交出行的比例約為64%。當(dāng)私人機(jī)動車擁有量超過零時,居民們就會以私人機(jī)動車和公交出行為主,在這兩種交通方式之中,選擇汽車出行平均占到了50%左右,而選擇公共交通出行平均占到了31%。同時,公務(wù)員、工人多選擇以私人機(jī)動車與公共交通作為主要出行方式;農(nóng)民和學(xué)生多以公共交通與步行作為主要出行方式。研究結(jié)果表明,從結(jié)合本文方法構(gòu)建的決策樹可看出,對于未擁有私人機(jī)動車的人員來說,大部分會選擇公共交通這種出行方式;對于具有私人機(jī)動車的家庭來說,其私人機(jī)動車并不是唯一的交通工具,選擇公共交通工具的比例也很高,同時各個職業(yè)選擇公共交通方式出行的占比均較大。運(yùn)用本文方法可有效分析出城市交通出行特征,指導(dǎo)城市進(jìn)行交通規(guī)劃,可通過適當(dāng)增加公共交通出行工具,確保滿足該市出行需求。

        實(shí)驗(yàn)以該市某區(qū)交通線路圖作為實(shí)驗(yàn)對象,以早高峰期為實(shí)驗(yàn)時間,以原有早高峰交通擁堵情況作為實(shí)驗(yàn)對比對象,運(yùn)用本文方法得出的分析結(jié)果對交通出行方式進(jìn)行相應(yīng)調(diào)整,測試運(yùn)用本文方法后交通擁堵優(yōu)化情況,具體實(shí)驗(yàn)如圖3所示。

        由圖3可看出,優(yōu)化前該區(qū)早高峰有5條長距離擁堵路段與4條嚴(yán)重阻塞路段,結(jié)合本文方法進(jìn)行優(yōu)化后,可看出擁堵路段距離明顯縮短,同時減少了2處嚴(yán)重阻塞路段,說明運(yùn)用本文方法對交通出行進(jìn)行優(yōu)化選擇后,該區(qū)早高峰路段嚴(yán)重阻塞情況明顯得到改善,同時避免了大段汽車擁堵的情況。

        3" 結(jié)" 論

        本文利用C4.5決策樹算法對城市交通出行做出優(yōu)化選擇,并以奧卡姆剃刀理論為基礎(chǔ),在減少決策樹計(jì)算復(fù)雜性的同時,還可以克服過擬合問題。在大數(shù)據(jù)環(huán)境下,如何實(shí)現(xiàn)決策樹的并行性,提高其分類精度,將成為未來進(jìn)一步深入研究的熱點(diǎn)。

        參考文獻(xiàn)

        [1] 崔敘,喻冰潔,楊林川,等.城市軌道交通出行的時空特征及影響因素非線性機(jī)制:基于梯度提升決策樹的成都實(shí)證[J].經(jīng)濟(jì)地理,2021,41(7):61?72.

        [2] 歐冬秀,張馨尹,趙源,等.基于梯度提升決策樹級聯(lián)分類方法的城市軌道交通列車突發(fā)事件延誤時間預(yù)測[J].城市軌道交通研究,2022,25(10):65?70.

        [3] 孫曉黎,朱才華,李美妮,等.時間序列聚類下的城市軌道交通客流預(yù)測研究[J].鐵道運(yùn)輸與經(jīng)濟(jì),2023,45(3):149?157.

        [4] 唐亮,李飛.基于決策樹的車聯(lián)網(wǎng)安全態(tài)勢預(yù)測模型研究[J].計(jì)算機(jī)科學(xué),2021,48(z1):514?517.

        [5] 王超發(fā),王文隆,蔡鑫.基于新老司機(jī)道路選擇行為的交通流均衡研究[J].運(yùn)籌與管理,2021,30(6):12?18.

        [6] 彭輝,王劍坡,張娜.基于SVM的高原川道型城市通勤者出行方式選擇研究[J].重慶交通大學(xué)學(xué)報(自然科學(xué)版),2021,40(11):18?23.

        [7] 蔡曉禹,呂亮,杜蕊.基于組合模型的車輛出行特征模式劃分[J].公路交通科技,2021,38(6):129?140.

        [8] 段力偉,冉松民,陳瑞雪,等.基于梯度提升決策樹的城市軌道交通網(wǎng)絡(luò)運(yùn)營態(tài)勢綜合評估方法[J].城市軌道交通研究,2022,25(8):32?35.

        [9] 王磊,劉雨,劉志中,等.基于屬性離散和特征度量的決策樹構(gòu)建算法[J].河南理工大學(xué)學(xué)報(自然科學(xué)版),2021,40(3):127?133.

        [10] 鄭貞,鄒俊穎.基于混沌關(guān)聯(lián)維與決策樹的運(yùn)動數(shù)據(jù)分類研究[J].計(jì)算機(jī)仿真,2022,39(10):327?330.

        [11] 宋汶秦,王海亮,趙春娟,等.基于改進(jìn)C4.5算法的退役動力電池等級篩選研究[J].電源技術(shù),2022,46(11):1318?1321.

        [12] 吳濤,王占海,陳奇,等.基于C4.5決策樹的航空器機(jī)翼積冰風(fēng)險監(jiān)測仿真[J].計(jì)算機(jī)仿真,2023,40(7):44?48.

        [13] 謝鑫,張賢勇,王旋曄,等.變精度鄰域等價粒的鄰域決策樹構(gòu)造算法[J].計(jì)算機(jī)應(yīng)用,2022,42(2):382?388.

        猜你喜歡
        城市交通決策樹交通
        新形勢下我國城市交通發(fā)展戰(zhàn)略思考
        繁忙的交通
        童話世界(2020年32期)2020-12-25 02:59:14
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        小小交通勸導(dǎo)員
        上海城市交通大數(shù)據(jù)研究與實(shí)踐
        上海公路(2018年1期)2018-06-26 08:37:40
        基于決策樹的出租車乘客出行目的識別
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        契合城市交通需求 推進(jìn)單軌交通發(fā)展
        基于GIS的城市交通流模擬與決策分析
        河南科技(2014年19期)2014-02-27 14:15:46
        日本妇女高清一区二区三区| 蜜桃一区二区三区视频| 女人的精水喷出来视频| 亚洲av无码av男人的天堂| 久久国产偷| 国产在线精品亚洲视频在线| 国产交换精品一区二区三区| 久久久久亚洲av片无码| av无码久久久久久不卡网站| 91精品国产91久久综合桃花| 自拍偷区亚洲综合第一页| 一本色道久久88加勒比—综合| 亚洲精品欧美精品日韩精品| 欧妇女乱妇女乱视频| 乱伦一区二| 国产精品美女自在线观看| 久久久99精品免费视频| 亚洲一区二区三区四区五区黄| 久久精品国产亚洲av无码娇色 | 久久久av波多野一区二区| 国模无码人体一区二区| 欧美手机在线视频| 国产极品大秀在线性色| 偷看农村妇女牲交| a国产一区二区免费入口| 无码无在线观看| 亚洲av少妇高潮喷水在线| 免费操逼视频| 久久久久欧洲AV成人无码国产| 亚洲最新中文字幕一区| 一区二区三区在线观看视频免费 | 公和我做好爽添厨房| 韩国无码av片在线观看网站| 国产综合精品久久亚洲| 色综合久久精品中文字幕| 成 人片 黄 色 大 片| 亚洲日韩精品国产一区二区三区| 日韩欧美在线观看成人| 亚洲精品熟女av影院| 国产av一区二区三区天堂综合网| 亚洲成av人片在线观看无码|