許一洲
摘? 要:近年來,隨著交通運(yùn)輸?shù)牟粩喟l(fā)展,乘坐飛機(jī)人數(shù)越來越多,而出租車成為乘客們離開機(jī)場的主要交通工具之一。為研究機(jī)場出租車的流量情況,通過尋找分析指標(biāo)來建立出租車司機(jī)在機(jī)場的決策模型,幫助機(jī)場對打車乘客和機(jī)場出租車進(jìn)行合理規(guī)劃,文章通過收集某日機(jī)場的一天中各時間到達(dá)航班乘客數(shù)據(jù)和機(jī)場蓄車池中出租車數(shù)量的實(shí)時數(shù)據(jù),運(yùn)用SPSS軟件的K-means聚類算法對機(jī)場到達(dá)航班乘客進(jìn)行時間上的分類,比較不同時間段下對機(jī)場出租車的數(shù)量變化。
關(guān)鍵詞:機(jī)場客流量;機(jī)場出租車數(shù)量; K-means聚類
中圖分類號:TP18? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號:2095-2945(2020)16-0022-03
Abstract: In recent years, with the continuous development of transportation, more and more people take planes, and taxi has become one of the main means of transportation for passengers to leave the airport. In order to study the flow of airport taxis, the decision-making model of taxi drivers at the airport is established by looking for analysis indicators to help the airport make reasonable plans for taxi passengers and airport taxis. In this paper, by collecting the data of passengers arriving at different times of the day at the airport and the real-time data of the number of taxis in the airport car storage pool, the K-means clustering algorithm of SPSS software is used to classify the passengers arriving at the airport in time, and the changes of the number of airport taxis in different time periods are compared.
Keywords: airport passenger flow; number of airport taxis; K-means clustering
1 概述
K-means聚類算法[1]是由Steinhuas 1955年、Lloyd 1957年、Ball&Hall 1965年、McQueen 1967年分別在不同的科學(xué)研究領(lǐng)域獨(dú)立提出來的一種算法,K-means聚類算法被提出來之后,被廣泛研究和應(yīng)用于不同的學(xué)科領(lǐng)域,并且發(fā)展出了大量的不同的改進(jìn)算法。目前它依舊是應(yīng)用最廣泛的劃分聚類算法之一。通過K-means聚類算法,可以有效分析機(jī)場客流量的變化對機(jī)場出租車數(shù)量影響情況。
2 模型的建立與求解
2.1 機(jī)場客流量數(shù)據(jù)的收集與分析
首先通過選取了某日鄭州新鄭機(jī)場的當(dāng)日航班的客流量信息,篩選出了當(dāng)日機(jī)場的到達(dá)航班,得出了某日全天不同時間的到達(dá)航班乘客人數(shù),并用SPSS軟件生成當(dāng)日到達(dá)航班乘客數(shù)量散點(diǎn)圖(如圖1所示)。
通過以1小時為單位,整理出某日0:00至24:00各小時乘車總?cè)藬?shù)與時間的關(guān)系線形圖(如圖2所示)。
2.2 利用K-means聚類算法分析機(jī)場客流量變化
由以上散點(diǎn)圖和折線圖分析,可初步將所有時間段分為5類:0:00點(diǎn)至2:00點(diǎn),5:00點(diǎn)至8:00點(diǎn),8:00至14:00,14:00至18:00和18:00至24:00這幾個時間段,具有一定的分類效果。因此可通過K-means聚類算法對該數(shù)據(jù)進(jìn)行進(jìn)一步分析。
K-means算法首先需要的是選取初始聚類中心,然后對相關(guān)的所有數(shù)據(jù)進(jìn)行分類,最后計算出每一個聚類的平均值調(diào)整聚類中心,再進(jìn)行不斷地迭代循環(huán)。最終使得類內(nèi)對象相似性最小[2]。K-means聚類算法流程圖如圖3所示。
設(shè)置最大迭代次數(shù)為20,聚類個數(shù)為5,得到最終聚類中心,每個聚類中的個案數(shù)目,聚類成員和與聚類中心位置(如表1和表2所示)。
通過本次聚類分析可以得到0:00至2:00,5:00至10:00,10:05至13:40,13:45至18:20和18:25至23:50五組分類,與上述初步分類接近??梢哉J(rèn)定機(jī)場的客流量在不同時間段具有不同的影響效果。
2.3 機(jī)場客流量與蓄車池候車量之間關(guān)系比較
通過提取鄭州新鄭機(jī)場某日從11:30至22:30在機(jī)場內(nèi)蓄車池等待的車輛數(shù)量數(shù)據(jù),利用Excel數(shù)據(jù)分析,可以得到場內(nèi)待運(yùn)車輛數(shù)與機(jī)場乘客人數(shù)隨時間變化的線形圖(如圖4所示)。
由該表的曲線趨勢可以看出,在17:00之前機(jī)場乘客人數(shù)與場內(nèi)車輛數(shù)量大致呈正相關(guān)關(guān)系,而在17:00之后,機(jī)場場內(nèi)車輛數(shù)量大致與后一小時的機(jī)場乘客人數(shù)呈正向關(guān)系。但在17:00到19:00之間,機(jī)場人數(shù)和場內(nèi)車輛數(shù)關(guān)系有差異。結(jié)合現(xiàn)實(shí)生活我們可以得知,在17:00至19:00這一時間區(qū)間,市區(qū)正值下班高峰期,市區(qū)交通擁堵狀況較為嚴(yán)重,而在上下班高峰期時,市區(qū)交通擁堵程度過高,使得市區(qū)交通擁堵程度成為了主要因素迫使出租車司機(jī)選擇在機(jī)場蓄車池排隊。
3 結(jié)束語
K-means聚類算法對數(shù)據(jù)的劃分聚類具有一定的優(yōu)點(diǎn)。通過收集機(jī)場一天中乘客人數(shù)變化和機(jī)場蓄車池出租車數(shù)量變化情況,利用K-means聚類算法進(jìn)行分類,可以有效直觀得出不同時間段下機(jī)場出租車的變化因素,合理建立機(jī)場出租車司機(jī)的決策模型,對機(jī)場乘客打車和機(jī)場出租車的規(guī)劃有一定積極作用。
參考文獻(xiàn):
[1]Anil K J. Data clustering: 50 years beyond K-Means[J]. Pattern Recognition Letters,2010,31(8):651-666.
[2]朱明.數(shù)據(jù)挖掘[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2002.
[3]司守奎,孫堯亮.數(shù)學(xué)建模算法與應(yīng)用(2版)[M].北京:國防工業(yè)出版社,2019.