亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于IDWPSO-K-means聚類(lèi)的網(wǎng)約車(chē)需求量時(shí)變特征分析

        2022-08-24 12:35:56付文華王世鐸
        交通運(yùn)輸研究 2022年3期
        關(guān)鍵詞:平方和工作日需求量

        付文華,白 竹,張 蕾,王世鐸

        (沈陽(yáng)建筑大學(xué) 交通與測(cè)繪工程學(xué)院,遼寧 沈陽(yáng) 110168)

        0 引言

        近年來(lái),網(wǎng)約車(chē)行業(yè)發(fā)展較快,相比于傳統(tǒng)出租車(chē),網(wǎng)約車(chē)服務(wù)更方便、快捷,但同樣存在供需不均衡問(wèn)題。對(duì)網(wǎng)約車(chē)需求聚類(lèi)可以觸發(fā)供給方的前瞻性調(diào)度行為,選擇恰當(dāng)?shù)木垲?lèi)算法提取和深入挖掘網(wǎng)約車(chē)訂單數(shù)據(jù)的特征,將隱藏的時(shí)間需求分布交互性特征顯性表達(dá)出來(lái),有助于平衡供需關(guān)系,合理調(diào)度區(qū)域運(yùn)力資源,更好地為乘客服務(wù)。

        針對(duì)網(wǎng)約車(chē)需求,國(guó)內(nèi)外學(xué)者多從數(shù)據(jù)挖掘角度研究其特征。張政等以網(wǎng)約車(chē)數(shù)據(jù)集為依據(jù),提出了基于主題模型的出行需求識(shí)別方法,可較好地識(shí)別不同時(shí)間窗口下區(qū)域出行需求特征[1]。龍雪琴等以成都市網(wǎng)約車(chē)訂單為基礎(chǔ),分析了工作日與非工作日網(wǎng)約車(chē)上下客的空間分布,證實(shí)網(wǎng)約車(chē)上下客熱點(diǎn)具有明顯的區(qū)域分布特性,且下客熱點(diǎn)更為集中[2]。周夢(mèng)杰等基于訂單數(shù)據(jù)將居民出行的時(shí)間序列分解為空間模態(tài)和時(shí)間系數(shù)兩部分,以挖掘乘客的出行特征[3]。Tang 等基于GPS 軌跡數(shù)據(jù)對(duì)出租車(chē)OD 點(diǎn)進(jìn)行聚類(lèi)分析,可有效識(shí)別出行熱點(diǎn)區(qū)域[4]。He 通過(guò)網(wǎng)約車(chē)運(yùn)營(yíng)數(shù)據(jù)識(shí)別網(wǎng)約車(chē)的時(shí)空變化特征,證實(shí)網(wǎng)約車(chē)需求在不同時(shí)段內(nèi)具有較強(qiáng)的規(guī)律性[5]。況東鈺基于網(wǎng)約車(chē)數(shù)據(jù)對(duì)網(wǎng)約車(chē)需求進(jìn)行時(shí)序分析,并識(shí)別了不同日期屬性下需求量的變化規(guī)律[6]。

        針對(duì)網(wǎng)約車(chē)時(shí)空聚類(lèi)算法,現(xiàn)有研究多集中于聚類(lèi)算法改進(jìn)上。黎新華等提出一種將改進(jìn)動(dòng)態(tài)時(shí)間彎曲距離作為凝聚層次聚類(lèi)相似性度量的聚類(lèi)方法,相對(duì)于歐氏距離凝聚層次聚類(lèi)而言,該算法能更好地識(shí)別網(wǎng)約車(chē)的時(shí)間需求變化特征[7]。林基艷等采用基于密度的聚類(lèi)算法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)挖掘車(chē)輛行駛軌跡數(shù)據(jù)[8],但該算法的參數(shù)選擇對(duì)軌跡影響較大?;诖?,孫立山等引入K-距離曲線(xiàn)對(duì)該算法進(jìn)行改進(jìn)并挖掘載客熱點(diǎn),提高了聚類(lèi)精度[9]。Chen 等以網(wǎng)約車(chē)訂單的初始經(jīng)緯度作為特征值進(jìn)行K-均值聚類(lèi),并以此進(jìn)行區(qū)域劃分[10]。崔宇超等采用K-均值(K-means)聚類(lèi)方法對(duì)兩類(lèi)網(wǎng)約車(chē)訂單數(shù)據(jù)進(jìn)行聚類(lèi)分析,發(fā)現(xiàn)兩類(lèi)乘客的出行需求呈相似特征[11]。但K-means 的聚類(lèi)中心是隨機(jī)選擇的,易選到孤立點(diǎn)或選擇的初始聚類(lèi)中心距離較小,且K值較難確定,易導(dǎo)致聚類(lèi)結(jié)果不穩(wěn)定。Jian 等針對(duì)K-means 算法的缺陷進(jìn)行改進(jìn),發(fā)現(xiàn)改進(jìn)算法在出租車(chē)熱需求方面具有更好的聚類(lèi)效果[12]。除上述網(wǎng)約車(chē)聚類(lèi)領(lǐng)域外,K-means 算法亦廣泛應(yīng)用在公交客流預(yù)測(cè)[13]、交通流時(shí)間序列預(yù)測(cè)[14]等其他交通預(yù)測(cè)領(lǐng)域中。

        綜上,現(xiàn)有網(wǎng)約車(chē)數(shù)據(jù)挖掘研究多集中在空間聚類(lèi)領(lǐng)域,對(duì)網(wǎng)約車(chē)需求進(jìn)行時(shí)間聚類(lèi)分析的文獻(xiàn)較少,且以往研究?jī)H對(duì)一種數(shù)據(jù)模式的網(wǎng)約車(chē)需求變化特征進(jìn)行分析,并未對(duì)不同數(shù)據(jù)模式的需求量變化規(guī)律的相似性和差異性進(jìn)行挖掘。在聚類(lèi)方法領(lǐng)域,研究重點(diǎn)主要集中在算法改進(jìn)上,其中K-means 算法因其良好的聚類(lèi)性能已被廣泛應(yīng)用,但該算法的聚類(lèi)中心是隨機(jī)選取的,且K值較難確定,易導(dǎo)致聚類(lèi)結(jié)果不穩(wěn)定。因此,本文將通過(guò)改進(jìn)粒子群算法優(yōu)化K-means 的初始聚類(lèi)中心,并從時(shí)段特征和日特征兩個(gè)角度對(duì)網(wǎng)約車(chē)需求數(shù)據(jù)進(jìn)行聚類(lèi)分析,以挖掘不同數(shù)據(jù)模式下網(wǎng)約車(chē)需求的變化規(guī)律,為網(wǎng)約車(chē)運(yùn)營(yíng)調(diào)度提供參考依據(jù)。

        1 網(wǎng)約車(chē)需求分布特征

        獲取蓋亞數(shù)據(jù)開(kāi)放計(jì)劃[15]中??谑?017 年5月22 日—6 月4 日共兩周的網(wǎng)約車(chē)訂單數(shù)據(jù),分析網(wǎng)約車(chē)需求在一周內(nèi)的分布特征,如圖1所示。選取2017 年5 月22 日—5 月28 日一周的網(wǎng)約車(chē)數(shù)據(jù),并將24h以10min為間隔,均勻劃分為144個(gè)時(shí)間序列,分析工作日和非工作日的網(wǎng)約車(chē)需求分布特征,如圖2 所示。由于多數(shù)樣本的需求變化特征具有高度相似性,因此隨機(jī)選取兩周的樣本數(shù)據(jù),以分析網(wǎng)約車(chē)需求整體分布特征。

        圖2 網(wǎng)約車(chē)需求時(shí)段分布

        由圖1 可看出,網(wǎng)約車(chē)需求與星期屬性有較大關(guān)系。網(wǎng)約車(chē)需求在一周的變化趨勢(shì)為:周一至周三(5月22日—5月24日、5月29日—5月31日)網(wǎng)約車(chē)需求量較平穩(wěn),變化不明顯;周四至周六(5 月25 日—5 月27 日、6 月1 日—6 月3 日)需求開(kāi)始增加;周日開(kāi)始下降。在一周中,非工作日的網(wǎng)約車(chē)需求顯著高于工作日;在工作日中,周二(5 月23 日、5 月30 日)需求量較低,周四和周五(5 月25 日—5 月26 日和6 月1 日—6月2日)的需求量較高。在非工作日中,周六(5月27日、6月3日)的需求量略高于周日(5月28日、6月4日)的需求量。

        由圖2 可看出,工作日與非工作日的網(wǎng)約車(chē)需求時(shí)間分布存在較大差異,其中,工作日的時(shí)間序列分布具有較高相似性,且網(wǎng)約車(chē)需求變化幅度較大。工作日網(wǎng)約車(chē)需求一天內(nèi)有4 個(gè)峰值,分別出現(xiàn)在早高峰時(shí)段8:20—8:30、午高峰時(shí)段11:50—12:00 和14:20—14:30、晚高峰時(shí)段17:20—18:00;非工作日網(wǎng)約車(chē)需求一天內(nèi)有2 個(gè)峰值:一個(gè)較小的峰值和一個(gè)較大的峰值,這2 個(gè)峰值分別出現(xiàn)在18: 10 左右和21:30左右。

        因此,如何識(shí)別不同數(shù)據(jù)模式下網(wǎng)約車(chē)需求時(shí)間序列變化的相似性與差異性,對(duì)挖掘網(wǎng)約車(chē)時(shí)間需求特征具有重要意義。

        2 IDWPSO-K-means算法

        K-means 是一種無(wú)監(jiān)督聚類(lèi),可根據(jù)樣本點(diǎn)的特征劃分?jǐn)?shù)據(jù)集,使得樣本的多維分量在同組內(nèi)相似,而在不同組之間相異,因此可以較好地識(shí)別不同時(shí)段和日期內(nèi)網(wǎng)約車(chē)需求量時(shí)間序列變化的相似性和差異性。但由于K-means 聚類(lèi)中心是隨機(jī)選擇的,易選到孤立點(diǎn)或選擇的初始聚類(lèi)中心距離較小,因此本文采用粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法優(yōu)化K-means 的初始聚類(lèi)中心??紤]到傳統(tǒng)的PSO 算法存在早熟收斂等缺陷,不少學(xué)者對(duì)其進(jìn)行了改進(jìn)。其中,胡堂清等提出的動(dòng)態(tài)調(diào)整慣性權(quán)重的改進(jìn)粒子群算法(Hybrid Particle Swarm Optimization with Dynamic Adjustment of Inertial Weigh,IDWPSO)[16],改進(jìn)策略相對(duì)簡(jiǎn)單、收斂速度更快,具有較好的尋優(yōu)性能。因此,本文采用該算法優(yōu)化K-means的初始聚類(lèi)中心。

        2.1 K-means算法

        MacQueen 于1967 年提出了K-means 聚類(lèi)算法,用于處理數(shù)據(jù)挖掘中聚類(lèi)相關(guān)問(wèn)題[17],其可將含有n個(gè)樣本的集合x(chóng)={x1,x2,…,xn},劃分成k個(gè)類(lèi)簇ω1,ω2,…,ωk。算法的聚類(lèi)步驟如下:

        (1)確定需要生成的簇?cái)?shù)k:從樣本中抽取k個(gè)樣本點(diǎn)作為k個(gè)原始聚類(lèi)簇中心c1,c2,…,ck,即將x={x1,x2,…,xn}劃分為k個(gè)類(lèi)簇:ω1,ω2,…,ωk,其中

        (2)計(jì)算非簇中心點(diǎn)xi與簇中心ci間的歐氏距離d[18];

        (3)根據(jù)歐氏距離矩陣,分配非初始簇中心樣本點(diǎn)至距離最近的簇中心樣本點(diǎn)所在的類(lèi);

        (4)根據(jù)式(2)計(jì)算各類(lèi)簇內(nèi)樣本的均值,并將該值作為新聚類(lèi)中心[18];

        式(2)中:mi是簇i的中心;Ci是簇i的樣本數(shù)目。

        (5)重復(fù)步驟(2)~步驟(4),直至各類(lèi)簇的樣本點(diǎn)不再變化,迭代結(jié)束。此時(shí)輸出的結(jié)果即為K-means聚類(lèi)的最終結(jié)果。

        2.2 IDWPSO算法

        IDWPSO 主要在慣性權(quán)重和更新粒子位置兩方面進(jìn)行改進(jìn),具體如下。

        (1)改進(jìn)慣性權(quán)重

        慣性權(quán)重ω通過(guò)指數(shù)函數(shù)控制,當(dāng)?shù)螖?shù)增加時(shí),非線(xiàn)性減小,利用Matlab 中的betarnd 函數(shù)生成符合貝塔分布的隨機(jī)數(shù),以增強(qiáng)算法后期的全局搜索能力,其表達(dá)式為[16]:

        式(3)中:t為當(dāng)前迭代次數(shù);tmax是最大迭代次數(shù);ωmax,ωmin分別為慣性權(quán)重的初值和終值;σ為慣性調(diào)整因子,取0.1;B(p,q)為貝塔函數(shù)。等號(hào)右側(cè)第1 項(xiàng)與第2 項(xiàng)通過(guò)指數(shù)函數(shù)改變,算法前期慣性權(quán)重較大,隨著迭代次數(shù)增加非線(xiàn)性遞減。第3 項(xiàng)利用貝塔分布對(duì)ω的整體取值分布進(jìn)行調(diào)整。

        (2)粒子位置更新

        引入差分進(jìn)化操作更新粒子位置,以避免迭代后期種群多樣性下降。其具體步驟為:初始化、變異、交叉和選擇,通過(guò)變異與交叉操作更新粒子位置。位置更新計(jì)算式[16]為:

        該算法的具體步驟如下:

        ①初始化種群參數(shù);

        ②計(jì)算各粒子的適應(yīng)度值;

        ③比較粒子個(gè)體適應(yīng)度與群體最優(yōu)值,選擇更優(yōu)者作為群體最優(yōu)值;

        ④按式(3)計(jì)算慣性權(quán)重ω,并更新粒子速度;

        ⑤若rand <CR,采用交叉算子更新粒子位置,否則用PSO算法進(jìn)行更新;

        ⑥當(dāng)達(dá)到終止條件時(shí),輸出最優(yōu)解,否則轉(zhuǎn)至步驟②。

        2.3 IDWPSO-K-means算法

        據(jù)此,本文通過(guò)IDWPSO 算法優(yōu)化K-means初始聚類(lèi)中心的步驟如下。

        (1)種群初始化,主要包含以下初始設(shè)置。

        ①設(shè)定粒子位置的最小值向量Zmin和最大值向量Zmax(其中Zmin和Zmax是依據(jù)所有樣本點(diǎn)的各維分量的最小值和最大值所構(gòu)成的向量而定),并設(shè)定粒子速度最大值Vmax。

        ②將數(shù)據(jù)集x中的n個(gè)樣本點(diǎn)在k個(gè)簇中隨機(jī)分配,按K-means 算法,根據(jù)式(2)計(jì)算k簇內(nèi)的樣本均值,將這k個(gè)均值作為聚類(lèi)中心并以此構(gòu)成一個(gè)粒子,不斷重復(fù)該過(guò)程,直至生成m個(gè)粒子。設(shè)這m個(gè)粒子為,其中為粒子i的位置,是第i個(gè)粒子的第j個(gè)聚類(lèi)中心(i=1,2,…,m;j=1,2,…,k)。

        ③原始m個(gè)粒子的適應(yīng)度函數(shù)fitness[19]為:

        式(5)中:fitness(Xi)為第i個(gè)粒子的適應(yīng)度函數(shù),其值越小,聚類(lèi)質(zhì)量越好。

        ④將粒子i的最優(yōu)適應(yīng)度Pbestfitness(i)的初值設(shè)為fitness(Xi(0)),最優(yōu)位置Pxbesti的初值設(shè)為,i=1,2,…,m。

        ⑤將所有粒子中Pbestfitness(i)的最小者賦值在全局最優(yōu)適應(yīng)度Gbestfitness(i)上,將下標(biāo)記為I,此時(shí)該粒子的對(duì)應(yīng)位置PxbestI為全局最優(yōu)位置Gxbest。

        (2)生成下一代粒子群,根據(jù)式(6)~式(7)更新粒子i(i=1,2,…,m)的速度與位置,速度值在[-Vmax,Vmax]內(nèi),當(dāng)rand <CR時(shí),粒子位置更新算法采用式(4)中的交叉算子法,否則采用式(7)標(biāo)準(zhǔn)粒子群進(jìn)行位置更新。

        式(6)~式(7)中:ω為改進(jìn)慣性權(quán)重,其計(jì)算方法如式(3)所示,可以權(quán)衡局部和全局最優(yōu)能力;r1和r2為獨(dú)立的隨機(jī)變量,取值在(0,1)區(qū)間;c1和c2為加速系數(shù),用來(lái)控制迭代步長(zhǎng),一般取值2.0[20]。

        (5)找到所有粒子中最優(yōu)適應(yīng)度Pbestfitness(i)最小的值,作為全局最優(yōu)適應(yīng)度Gbestfitness(i)的值,并將該粒子的最優(yōu)位置賦為全局最優(yōu)位置Gxbest。

        (6)若全局最優(yōu)位置Gxbest在多次迭代后仍未變化,則退出迭代,轉(zhuǎn)到(9);否則繼續(xù)運(yùn)算。

        (7)按式(8)降低慣性權(quán)重ω值[20],式中參數(shù)含義同前。

        (8)重復(fù)步驟(2)~步驟(7),直至迭代終止,轉(zhuǎn)到步驟(9)。

        (9)將粒子群全局最優(yōu)位置Gxbest作為Kmeans 的聚類(lèi)中心進(jìn)行聚類(lèi),即重復(fù)執(zhí)行以下幾個(gè)步驟。

        ①將數(shù)據(jù)集x中樣本點(diǎn)分配到離k個(gè)聚類(lèi)中心Gxbest1,Gxbest2,…,Gxbestk最近的簇。

        ②重新計(jì)算k個(gè)簇中心。

        ③重復(fù)以上兩步,直到k個(gè)簇中心無(wú)變化,或樣本點(diǎn)未被重新分配,則迭代結(jié)束,轉(zhuǎn)到步驟(10)。

        (10)輸出k個(gè)聚類(lèi)中心,以及x的劃分。

        由于K-means 算法的難點(diǎn)在于事先確定類(lèi)數(shù)k,因此本文預(yù)先設(shè)置多個(gè)k值,選取戴維森堡丁指數(shù)(Davies Bouldin Index,DBI)和標(biāo)準(zhǔn)偏差指數(shù)(Standard Deviation Based Index,STDI)[21]檢驗(yàn)各k值下的聚類(lèi)有效性,計(jì)算公式見(jiàn)式(9)和式(10),從而確定本文算法的聚類(lèi)數(shù)目。

        式(9)中:Sp和Sq為第p類(lèi)和第q類(lèi)內(nèi)的元素與質(zhì)心的標(biāo)準(zhǔn)差;Dpq為第p類(lèi)和第q類(lèi)質(zhì)心間的歐氏距離;其他參數(shù)含義同前。式中括號(hào)內(nèi)分子越小則類(lèi)內(nèi)元素相似度越大,分母越大則各聚類(lèi)間相似度越小。因此,DBI值越小,聚類(lèi)結(jié)果越有效。

        式(10)中:cp是類(lèi)p的質(zhì)心;是所有樣本的質(zhì)心;xμ是類(lèi)p的第μ個(gè)樣本;np是類(lèi)p的樣本數(shù),k為類(lèi)簇?cái)?shù)。式中的分子表示各類(lèi)之間的方差,分子越大,則各聚類(lèi)間相似度越??;分母表示各類(lèi)內(nèi)的方差之和,分母越小,則類(lèi)內(nèi)元素相似度越大。因此,STDI值越大,聚類(lèi)結(jié)果越有效。

        3 實(shí)例分析

        本文選取蓋亞數(shù)據(jù)開(kāi)放計(jì)劃中??谑?017年5 月22 日(周一)至7 月21 日(周五)兩個(gè)月的網(wǎng)約車(chē)訂單數(shù)據(jù)進(jìn)行分析,由于網(wǎng)約車(chē)需求變化特征不僅與一日內(nèi)的時(shí)段有關(guān),也與星期的變化有關(guān),因此本文分別從時(shí)段和星期兩個(gè)不同角度對(duì)網(wǎng)約車(chē)訂單數(shù)據(jù)進(jìn)行聚類(lèi)分析,借助Matlab R2019a,基于IDWPSO-K-means 算法聚類(lèi)分析網(wǎng)約車(chē)需求總量的時(shí)段特征和日特征。

        3.1 基于時(shí)段特征的網(wǎng)約車(chē)需求聚類(lèi)分析

        本文將單個(gè)調(diào)查日按10min間隔共劃分為144個(gè)時(shí)間序列,調(diào)查日總計(jì)61d,因此本文聚類(lèi)算法的數(shù)據(jù)處理對(duì)象共144(個(gè)/d)×61(d)=8784(個(gè))。當(dāng)聚類(lèi)數(shù)目為2~10時(shí),其DBI和STDI見(jiàn)表1。

        表1 基于時(shí)段特征的IDWPSO-K-means聚類(lèi)檢驗(yàn)系數(shù)

        由表1 可看出,當(dāng)聚類(lèi)數(shù)目為2 時(shí),DBI=0.4167,STDI=3.1291,同時(shí)達(dá)到最優(yōu),因此基于時(shí)段特征合適的聚類(lèi)數(shù)目為2,聚類(lèi)結(jié)果如表2所示。

        表2 基于時(shí)段特征的IDWPSO-K-means聚類(lèi)結(jié)果

        由表2可看出,IDWPSO-K-means算法將144個(gè)時(shí)段的需求量分為2 類(lèi),0:00—7:20 和23:20—23:50 均處于網(wǎng)約車(chē)需求較低的時(shí)段,7:30—23:10 網(wǎng)約車(chē)需求較高,與日常經(jīng)驗(yàn)相似,分類(lèi)較為合理。

        3.2 基于日特征的網(wǎng)約車(chē)需求聚類(lèi)分析

        基于日特征聚類(lèi)的數(shù)據(jù)模式與基于時(shí)段特征聚類(lèi)相反,是對(duì)144 個(gè)時(shí)段中每個(gè)時(shí)段61d 的需求量進(jìn)行聚類(lèi),觀(guān)察同一時(shí)段每天需求量的變化情況。此處采用9:00—9:10的時(shí)段數(shù)據(jù)進(jìn)行日特征聚類(lèi),聚類(lèi)數(shù)目同樣取2~10時(shí),DBI和STDI如表3所示。

        表3 基于日特征的IDWPSO-K-means聚類(lèi)檢驗(yàn)系數(shù)

        由表3 可看出,當(dāng)聚類(lèi)數(shù)目為4 時(shí),DBI 和STDI同時(shí)達(dá)到最優(yōu),因此基于日特征合適的聚類(lèi)數(shù)目為4。當(dāng)k=4時(shí),聚類(lèi)結(jié)果如表4所示。

        表4 基于日特征的IDWPSO-K-means聚類(lèi)結(jié)果

        由表4 可知,IDWPSO-K-means 算法能較好地區(qū)分需求量不同的日期,同一時(shí)段中大部分周一至周三的需求量聚為穩(wěn)定的一類(lèi)、周五至周六大致聚為穩(wěn)定的一類(lèi),與日常經(jīng)驗(yàn)較為相似,工作日的出行需求略低于非工作日的出行需求,分類(lèi)較為合理。個(gè)類(lèi)別中將工作日和非工作日分為一類(lèi)的原因是,個(gè)別工作日的網(wǎng)約車(chē)需求過(guò)高,與非工作日需求接近;或非工作日的需求量較低,與工作日的需求量接近,被看作異常的工作日或非工作日。

        3.3 對(duì)比分析

        為驗(yàn)證本文算法聚類(lèi)效果的有效性,選用聚類(lèi)誤差平方和和迭代次數(shù)作為聚類(lèi)評(píng)價(jià)指標(biāo),并與K-means 算法和PSO-K-means 算法進(jìn)行對(duì)比。誤差平方和s的計(jì)算公式[18]為

        式(11)中:xi為樣本點(diǎn);ci為聚類(lèi)中心;ωi為第i個(gè)樣本集合;k為類(lèi)簇?cái)?shù)。

        3.3.1 基于時(shí)段特征聚類(lèi)的對(duì)比分析

        根據(jù)式(11)計(jì)算當(dāng)聚類(lèi)數(shù)目為2~10時(shí),基于時(shí)段特征聚類(lèi)的3 種算法的誤差平方和,結(jié)果如表5所示,迭代次數(shù)如表6所示。

        表5 基于時(shí)段特征聚類(lèi)的3種算法的誤差平方和

        表6 基于時(shí)段特征聚類(lèi)的3種算法的迭代次數(shù)

        由表5 可看出,PSO-K-means 算法和IDWPSO-K-means 算法聚類(lèi)結(jié)果的誤差平方和在任意聚類(lèi)數(shù)目下,均小于K-means 算法。當(dāng)k=2 時(shí),IDWPSO-K-means 算法和PSO-K-means 算法得到了相同的聚類(lèi)中心和聚類(lèi)數(shù)目,因此,誤差平方和相等。僅當(dāng)k=3 時(shí),IDWPSO-K-means 誤差平方和略大于PSO-K-means 算法。當(dāng)k=4~10 時(shí),IDWPSO-K-means 算法的誤差平方和小于PSOK-means算法。

        由表6 可看出,IDWPSO-K-means 算法和PSO-K-means 算法在聚類(lèi)數(shù)目為8 時(shí),迭代次數(shù)略高于K-means 算法;在聚類(lèi)數(shù)目為6 時(shí),IDWPSO-K-means 算法迭代次數(shù)略高于PSO-K-means算法,但低于K-means 算法;當(dāng)聚類(lèi)數(shù)目為2~5、7、9~10 時(shí),IDWPSO-K-means 算法均有最小的迭代次數(shù)。

        3.3.2 基于日特征聚類(lèi)的對(duì)比分析

        比較基于日特征聚類(lèi)的3 種算法聚類(lèi)結(jié)果的誤差平方和及迭代次數(shù),如表7和表8所示。

        表7 基于日特征聚類(lèi)的3種算法的誤差平方和

        表8 基于日特征聚類(lèi)的3種算法的迭代次數(shù)

        由表7 可看出,PSO-K-means 算法和IDWPSO-K-means 算法的誤差平方和均小于K-means算法。當(dāng)k=8~10時(shí),IDWPSO-K-means 算法的誤差平方和略大于PSO-K-means 算法;當(dāng)k=2~7時(shí),IDWPSO-K-means 算法誤差平方和小于PSO-K-means算法。

        由表8 可看出,IDWPSO-K-means 算法按日特征聚類(lèi)時(shí),當(dāng)聚類(lèi)數(shù)目為9 時(shí),其迭代次數(shù)略高于PSO-K-means 算法,但當(dāng)聚類(lèi)數(shù)目為2~8 和10 時(shí),IDWPSO-K-means 算法的迭代次數(shù)低于或等于PSO-K-means算法。

        由此可看出,無(wú)論是基于時(shí)段特征還是日特征對(duì)網(wǎng)約車(chē)需求進(jìn)行聚類(lèi),本文提出的IDWPSOK-means 算法的聚類(lèi)效果均最優(yōu),驗(yàn)證了本文算法的有效性。

        3.4 基于聚類(lèi)結(jié)果的對(duì)策建議

        基于時(shí)段特征考慮,IDWPSO-K-means 算法將144 個(gè)時(shí)間序列聚為2 類(lèi),較好地識(shí)別出了不同時(shí)段內(nèi)網(wǎng)約車(chē)需求的規(guī)律性;聚類(lèi)結(jié)果較好區(qū)分了網(wǎng)約車(chē)需求量的時(shí)間變化階段,網(wǎng)約車(chē)運(yùn)營(yíng)商可基于此優(yōu)化資源配置,實(shí)現(xiàn)運(yùn)力的合理調(diào)度。當(dāng)網(wǎng)約車(chē)需求量處于高峰時(shí)段時(shí),運(yùn)營(yíng)商需增加車(chē)輛供給,以滿(mǎn)足乘客的出行需求;當(dāng)處于需求量低峰階段時(shí),運(yùn)營(yíng)商可適當(dāng)降低車(chē)輛供給,以壓縮成本支出,避免運(yùn)力浪費(fèi),實(shí)現(xiàn)供需均衡。

        基于日特征考慮,IDWPSO-K-means 算法將不同日期的需求量聚為4 類(lèi),其中,同一時(shí)段內(nèi)大部分周一至周三被聚為穩(wěn)定的一類(lèi)(標(biāo)簽1),周五至周六被聚為穩(wěn)定的一類(lèi)(標(biāo)簽3),周日被聚為一類(lèi)(標(biāo)簽4)。相同類(lèi)別的網(wǎng)約車(chē)需求變化趨勢(shì)具有較高相似性,網(wǎng)約車(chē)運(yùn)行商可依據(jù)不同類(lèi)別下的交通需求,合理規(guī)劃網(wǎng)約車(chē)運(yùn)營(yíng)調(diào)度方案,實(shí)現(xiàn)合理的資源配置。針對(duì)個(gè)別星期屬性在多類(lèi)標(biāo)簽出現(xiàn)的情況,將其歸為異常類(lèi)別,如周四均勻出現(xiàn)在標(biāo)簽1與標(biāo)簽2中、周五出現(xiàn)在多類(lèi)標(biāo)簽中等,運(yùn)營(yíng)商需探查網(wǎng)約車(chē)需求量在該日突變的主要原因,確定是由于調(diào)度決策失誤、供需不均衡等內(nèi)在因素造成,還是由于天氣、大型活動(dòng)等外在因素導(dǎo)致,以提升對(duì)異常需求量的處理水平。

        4 結(jié)語(yǔ)

        本文首先對(duì)網(wǎng)約車(chē)訂單數(shù)據(jù)進(jìn)行了預(yù)處理,分析了網(wǎng)約車(chē)需求量的時(shí)段和日分布特征。然后針對(duì)K-means 算法的不足,提出了一種動(dòng)態(tài)調(diào)整慣性權(quán)重的粒子群優(yōu)化(IDWPSO-K-means)聚類(lèi)算法來(lái)優(yōu)化K-means 的初始聚類(lèi)中心。最后基于該算法考慮兩種不同的數(shù)據(jù)模式(時(shí)段特征和日特征)對(duì)海口市的網(wǎng)約車(chē)需求數(shù)據(jù)進(jìn)行聚類(lèi)分析。結(jié)果表明,基于時(shí)段特征的網(wǎng)約車(chē)需求量聚為2 類(lèi),基于日特征的網(wǎng)約車(chē)需求量聚為4 類(lèi),相同類(lèi)別的網(wǎng)約車(chē)需求變化趨勢(shì)具有較高的相似性。與K-means 算法和PSO-K-means 算法相比,IDWPSO-K-means 算法的誤差平方和和迭代次數(shù)2 個(gè)指標(biāo)的值均更優(yōu),能更好地識(shí)別出需求量時(shí)變特征,為網(wǎng)約車(chē)實(shí)時(shí)調(diào)度和規(guī)劃提供依據(jù)。但本文僅針對(duì)網(wǎng)約車(chē)時(shí)間序列進(jìn)行了聚類(lèi)研究,尚未對(duì)城市傳統(tǒng)出租車(chē)需求展開(kāi)研究,未來(lái)可綜合挖掘不同時(shí)段和日期內(nèi)網(wǎng)約車(chē)與傳統(tǒng)出租車(chē)的需求變化規(guī)律,有助于更好地提升城市運(yùn)輸服務(wù)水平。

        猜你喜歡
        平方和工作日需求量
        從數(shù)學(xué)角度看“彈性”
        費(fèi)馬—?dú)W拉兩平方和定理
        利用平方和方法證明不等式賽題
        勾股定理的擴(kuò)展
        關(guān)于四奇數(shù)平方和問(wèn)題
        2017年我國(guó)汽車(chē)軟管需求量將達(dá)6.4億m
        橡膠科技(2015年3期)2015-02-26 14:45:02
        基于BP神經(jīng)網(wǎng)絡(luò)人均豬肉需求量預(yù)測(cè)
        2013年日本國(guó)內(nèi)紙與紙板市場(chǎng)需求量預(yù)計(jì)減少1.5%
        對(duì)《資本論》中工作日問(wèn)題的哲學(xué)思考
        商(2012年14期)2013-01-07 07:46:16
        鄭州局辦理業(yè)務(wù)全程提速
        日日摸夜夜添夜夜添一区二区| 2021国产最新无码视频| 久久久久亚洲精品美女| 午夜亚洲国产精品福利| 精品亚洲av一区二区| 丝袜美腿福利视频在线| 一个少妇的淫片免费看 | 精品欧洲av无码一区二区三区 | 国产精品很黄很色很爽的网站| 国产一区二区视频在线看| 麻豆精品导航| 欧美大屁股xxxxhd黑色| 国产思思99re99在线观看| 欧美 亚洲 国产 日韩 综AⅤ| 国产精品亚洲婷婷99久久精品| 精品国产污黄网站在线观看| 在线观看午夜视频一区二区| 18女下面流水不遮图| 久久久久亚洲AV成人网毛片 | 激情综合丁香五月| 久久99久久99精品免观看| 一区二区三区日本大片| 日韩最新av一区二区| 麻豆最新国产av原创| 少妇人妻大乳在线视频不卡| 一级二级中文字幕在线视频| 国产桃色精品网站| 中文字幕亚洲精品在线免费| 人人妻人人狠人人爽天天综合网| 国产精品亚洲综合久久婷婷| 黄片午夜免费观看视频国产| 日韩午夜免费视频精品一区| 国精品午夜福利视频不卡| 亚洲永久精品ww47| AV无码专区亚洲AVL在线观看| 加勒比婷婷色综合久久| 丰满少妇被粗大的猛烈进出视频| 美女在线国产| 亚洲一区亚洲二区中文字幕 | 中文字幕亚洲欧美在线不卡| 久久久久亚洲av无码a片软件|