李 莉
(內(nèi)蒙古烏蘭察布市運(yùn)輸管理處)
公路汽運(yùn)是一個國家的基礎(chǔ)性和服務(wù)性產(chǎn)業(yè)。在2013年6月20日,我國交通運(yùn)輸部總規(guī)劃師戴東昌在新聞發(fā)布會上表示,我國公路交通承擔(dān)78.2%的貨運(yùn)量和93.5%的客運(yùn)量。與改革開放初期相比,我國汽車客運(yùn)量和貨運(yùn)量都增長了百倍之多,但我國公路汽運(yùn)依然存在著基礎(chǔ)設(shè)施差、路網(wǎng)密度低、運(yùn)輸車輛不合理以及各地區(qū)發(fā)展不均衡等問題。
通過應(yīng)用數(shù)據(jù)挖掘技術(shù),我們通過分析可以為管理者們提供一個科學(xué)的管理方法,這對公路汽運(yùn)是相當(dāng)重要的,這就可以在同等條件下把公路汽運(yùn)的安全性、快速性等提高一個水平。
數(shù)據(jù)挖掘技術(shù)指的是從統(tǒng)計過的大量相關(guān)數(shù)據(jù)中搜索出隱藏的有用信息,它通常和計算機(jī)技術(shù)、統(tǒng)計學(xué)、在線分析處理技術(shù)、情報檢索以及專家系統(tǒng)相結(jié)合來實(shí)現(xiàn)目標(biāo)。
整個工作可分為三個階段:1.數(shù)據(jù)準(zhǔn)備;2.數(shù)據(jù)挖掘;3.結(jié)果表達(dá)和解釋(下圖1 為數(shù)據(jù)挖掘結(jié)構(gòu)圖)。
圖1 典型的數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)圖
目前我們賦予數(shù)據(jù)挖掘的任務(wù)包括:關(guān)聯(lián)分析、聚類分析、分類分析、特異群組分析和演變分析等。這項(xiàng)技術(shù)已經(jīng)被廣泛應(yīng)用于商務(wù)管理、生產(chǎn)控制、市場分析以及科學(xué)探索等領(lǐng)域。下面的這個例子為我們生動的詮釋了數(shù)據(jù)挖掘技術(shù)的獨(dú)到之處。
在美國一家沃爾瑪連鎖超市中,貨架員將尿布和啤酒擺在一起出售,雖然讓人不可思議,但結(jié)果卻是尿布和啤酒銷量都增加了。究其原因,主要是數(shù)據(jù)處理技術(shù)的功勞。原來,沃爾瑪擁有龐大的數(shù)據(jù)倉庫系統(tǒng),為了能夠準(zhǔn)確了解顧客的購買習(xí)慣,沃爾瑪對每個顧客的購物籃進(jìn)行了分析,結(jié)果發(fā)現(xiàn)跟尿布一起購買最多的商品竟然是啤酒。分析師最終找到了出現(xiàn)這種奇怪現(xiàn)象的原因:原來美國的很多年輕父親下班后經(jīng)常要去超市給自己的孩子買尿布,順帶著把喜歡的啤酒也買了。超市將尿布和啤酒擺在距離不遠(yuǎn)的貨架后,成功將那些對啤酒需求欲望不是太高的顧客俘獲。
從上述事例中我們可以看出數(shù)據(jù)挖掘系統(tǒng)可將人們不會想到的事情聯(lián)系到一起,所取得的效果也是出乎意料的。
此前的數(shù)據(jù)挖掘技術(shù)已經(jīng)在交通管理中得到了廣泛的應(yīng)用,并且挖掘出了很多因素潛在的關(guān)聯(lián)性和規(guī)則性。公路汽運(yùn)作為交通中的主要組成,相應(yīng)的數(shù)據(jù)挖掘技術(shù)建立也會較為簡單,而且很多數(shù)據(jù)還可以和交通管理實(shí)現(xiàn)數(shù)據(jù)共享。此項(xiàng)技術(shù)必將能夠帶動我國公路汽運(yùn)的安全性、合理性更進(jìn)一步的發(fā)展。
公路汽運(yùn)線路優(yōu)化可充分利用現(xiàn)有的時間、財務(wù)和資源,以最佳的運(yùn)輸方式、運(yùn)輸線路、最低的運(yùn)輸成本、最高的質(zhì)量和最快的速度來完成最終的運(yùn)輸目的。目前,我國公路汽運(yùn)中存在很多不合理之處。
(1)對流運(yùn)輸:指同類或相互代替的貨物相向運(yùn)輸,它是最為突出和普遍的一種不合理的運(yùn)輸形式。其實(shí)質(zhì)是出現(xiàn)了額外的車輛行走里程,增加了不必要的運(yùn)費(fèi)。
(2)迂回運(yùn)輸:由于路徑選擇不當(dāng)導(dǎo)致沒走最短的路徑。
(3)重復(fù)運(yùn)輸:將可以直線運(yùn)輸?shù)呢浳锝?jīng)不必要的中轉(zhuǎn),這種現(xiàn)象浪費(fèi)裝卸勞力,增加作業(yè)負(fù)擔(dān),而且增加了運(yùn)送時間和出入手續(xù),這些都增加了運(yùn)輸成本。這種不合理的運(yùn)輸形式在當(dāng)前快遞中最為常見。
(4)回程為空車:運(yùn)輸目的達(dá)到后回程時空車行駛。這種也會浪費(fèi)很多運(yùn)力。
下面我們說一下公路汽運(yùn)線路方案中數(shù)據(jù)挖掘技術(shù)應(yīng)用的大致流程。
①相關(guān)數(shù)據(jù)的采集。
首先,要進(jìn)行數(shù)據(jù)的采集工作,主要包括:汽車運(yùn)輸?shù)某杀?、耗時、耗油量、行程量、貨運(yùn)量(客運(yùn)量)、行車環(huán)境、貨物種類等。在采集數(shù)據(jù)時應(yīng)符合幾個原則:a 直觀性。即所有的參數(shù)應(yīng)易于理解,記錄時也按照一定順序進(jìn)行;b 便利性。數(shù)據(jù)的采集工作應(yīng)該在動員人數(shù)、設(shè)備最少的條件下進(jìn)行,最好是在常規(guī)交通數(shù)據(jù)采集下就可完成的;c 經(jīng)濟(jì)性。數(shù)據(jù)的采集量是很大的,其費(fèi)用開銷也不能過大;d 可靠性。數(shù)據(jù)采集時應(yīng)避免在特殊天氣或背景下進(jìn)行,保證數(shù)據(jù)的普遍性、可靠性。
②數(shù)據(jù)的挖掘和分析。
通過應(yīng)用數(shù)據(jù)挖掘技術(shù),我們可以挖掘出汽車運(yùn)輸?shù)某杀?、耗時、耗油量等因素之間的關(guān)系,繪制出它們的擬合曲線,找出各個量之間的關(guān)系。
③結(jié)果的表達(dá)
通過進(jìn)行數(shù)據(jù)挖掘,可以更加全面直觀的了解各個因素之間的相互影響關(guān)系,為決策者提供有效的技術(shù)支持,這樣就可以有效減少公路汽運(yùn)中線路安排不合理現(xiàn)象的存在。
交通安全始終是人們和各級政府時刻關(guān)注的話題,根據(jù)權(quán)威部門統(tǒng)計:多年以來我國每年的交通事故死亡人數(shù)均超過10 萬人,造成的財產(chǎn)損失超過400 億,高居世界第一。安全性也事關(guān)公路汽運(yùn)產(chǎn)業(yè)的興亡,而通過使用數(shù)據(jù)挖掘技術(shù),決策者調(diào)整相關(guān)政策,可以使公路汽運(yùn)安全性有所提高。
(1)數(shù)據(jù)采集。
影響公路汽運(yùn)安全的因素包括很多,其中各個因素中又包含很多小的因素,例如:人為因素(人為因素又包括年齡、性別、學(xué)歷等)、車輛因素(包括車齡、車型、電氣設(shè)備情況等)和環(huán)境因素(包括道路等級、天氣影響、地形地貌等)等等。在數(shù)據(jù)采集時應(yīng)注意分類清楚,便于以后的處理。
(2)數(shù)據(jù)挖掘。
在對公路汽運(yùn)安全性因素上進(jìn)行數(shù)據(jù)挖掘時,我們采用的是關(guān)聯(lián)法則中的經(jīng)典算法—Aprior 算法,其核心思想是基于兩階段頻繁集思想的遞推算法。Aprior 算法將發(fā)現(xiàn)關(guān)聯(lián)規(guī)則分兩步進(jìn)行:①通過迭代,檢索出數(shù)據(jù)庫中的所有頻繁項(xiàng)集(不包括用戶為選擇的范圍);②利用檢索出的頻繁項(xiàng)集構(gòu)造出用戶最小信任度的規(guī)則。其步驟可簡化為:創(chuàng)建數(shù)據(jù)庫→頻繁項(xiàng)集表→交通事故關(guān)聯(lián)規(guī)則→關(guān)聯(lián)規(guī)則結(jié)果。
(3)結(jié)果的表達(dá)。
通過數(shù)據(jù)挖掘,我們可以找出影響公路汽運(yùn)安全性的最大因素,以及這些因素之間的關(guān)聯(lián),其結(jié)果很可能是意想不到的,例如:我們的主觀意念都是覺得駕齡越少,其事故率越高,然而交通管理部門對事故數(shù)據(jù)庫經(jīng)過進(jìn)行數(shù)據(jù)挖掘,發(fā)現(xiàn)駕齡在6 ~10年的老司機(jī)才是名副其實(shí)的“馬路殺手”。所以,得到分析結(jié)果后相關(guān)領(lǐng)導(dǎo)應(yīng)及時采取改進(jìn)措施。
汽運(yùn)站點(diǎn)的合理與否將會大大影響客運(yùn)量情況,更加人性化的站點(diǎn)布局也會使“提倡綠色出行,發(fā)展公共交通”的政策實(shí)施起來更加容易。在平時我們布局公路汽運(yùn)站點(diǎn)時,一般是等距離平分這段線路,這就存在很多不合理的地方,例如:在居民較為稠密的地方?jīng)]站點(diǎn),還得步行一段距離,這必然導(dǎo)致很多人選擇其他的交通方式;而有的站點(diǎn)周圍根本沒有對汽車需求很強(qiáng)烈的群體。這樣公路汽運(yùn)的作用就會大打折扣,所以對此問題應(yīng)用數(shù)據(jù)挖掘技術(shù)較為緊迫。
對公路汽運(yùn)的站點(diǎn)布置應(yīng)該由乘客的實(shí)際需求度決定。我們可以對乘客(包括身份、年齡、性別等)、周邊居民區(qū)和公共場所(學(xué)校、醫(yī)院等)等相關(guān)數(shù)據(jù)進(jìn)行采集,建立數(shù)據(jù)庫。然后建立相關(guān)算法,對數(shù)據(jù)庫進(jìn)行數(shù)據(jù)挖掘。
目前,我國各大城市對公交站點(diǎn)、汽車站的位置進(jìn)行了適當(dāng)調(diào)整,很多城市實(shí)現(xiàn)了交通工具之間的“無縫對接”以及“百米距離內(nèi)換乘”。只有站點(diǎn)布局更為合理了,才可以使得公路汽運(yùn)在國家提倡“節(jié)能減排”的時候大顯身手。
隨著我國經(jīng)濟(jì)的不斷發(fā)展和人們生活品質(zhì)的不斷提高,公路汽運(yùn)必將會越來越貼近我們的日常生活。八零后、九零后的網(wǎng)購習(xí)慣、旅游愛好等無一不是和公路汽運(yùn)密切相關(guān)的,而隨著更多的年輕人消費(fèi)能力的提升,公路汽運(yùn)的發(fā)展前景也會越來越廣闊。數(shù)據(jù)挖掘技術(shù)能夠幫助公路汽運(yùn)公司的領(lǐng)導(dǎo)者做出更為明智、正確的決策,完全可以作為一種保障企業(yè)科學(xué)管理的有效手段。我們應(yīng)積極接受這門先進(jìn)的管理方法,還要相應(yīng)的引進(jìn)這方面的人才,為公路汽運(yùn)事業(yè)的順利發(fā)展保駕護(hù)航。
[1]張小利,陳莉.數(shù)據(jù)挖掘在智能交通系統(tǒng)中的應(yīng)用(自然科學(xué)版)[J].西北大學(xué)學(xué)報,2005,(11):26-28.
[2]黃解軍,潘和平,萬幼川.數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究[J].計算機(jī)工程與應(yīng)用,2003,(2):45-48.
[3]鄒力鵑,王麗珍.空間數(shù)據(jù)挖掘發(fā)展研究[J].計算機(jī)工程與應(yīng)用,2003,(11):186-188.
[4]黃曉霞,蕭蘊(yùn)詩.數(shù)據(jù)挖掘集成技術(shù)研究[J].計算機(jī)應(yīng)用研究,2003,(4):37-39.