馬宗普, 王 婷
(中遠(yuǎn)海運(yùn)科技股份有限公司,上海 200135)
聯(lián)網(wǎng)收費(fèi)是高速公路運(yùn)營中的一項(xiàng)基本業(yè)務(wù),征收的費(fèi)用主要用來償還修路貸款和改善公路路網(wǎng)條件,是高速公路賴以生存和發(fā)展的基礎(chǔ)。隨著高速公路收費(fèi)業(yè)務(wù)的信息化程度不斷提高,特別是路網(wǎng)的規(guī)模越來越大,車輛的單次通行費(fèi)用越來越高。部分車輛受利益驅(qū)使,往往會(huì)采用多種方式偷逃通行費(fèi)并從中獲益,如利用加裝的假軸來減少通行費(fèi),而采用傳統(tǒng)的稽查方法已較難發(fā)現(xiàn)這種隱性逃費(fèi)行為,不能滿足高速公路收費(fèi)工作的管理要求。因此,利用高速公路收費(fèi)數(shù)據(jù)甄別疑似假軸車輛成為一項(xiàng)重要且具有實(shí)際意義的課題。
假軸車輛一般是指在車輛原軸型的基礎(chǔ)上自行加裝車軸(一般為1組)的車輛。通常假軸車輛在行駛到收費(fèi)站時(shí),司機(jī)會(huì)將事先安裝好的帶有液壓裝置的假軸放下,以增加車輛的軸數(shù)和提高限載質(zhì)量上限,從而通過稱重設(shè)備的檢測。這種行為會(huì)對高速公路的路基造成嚴(yán)重?fù)p害,增加高速公路運(yùn)營及養(yǎng)護(hù)成本,且甄別難度很大,采用人工的方式甄別不僅費(fèi)時(shí)費(fèi)力,而且無法實(shí)現(xiàn)實(shí)時(shí)甄別。因此,對假軸車輛進(jìn)行自動(dòng)判別是收費(fèi)稽查工作的重點(diǎn)和難點(diǎn)。
目前,稽查假軸車輛主要有以下2種方式:
1) 依靠數(shù)據(jù)員人工進(jìn)行軸型和車型比對,根據(jù)車輛標(biāo)準(zhǔn)軸型進(jìn)行判斷。這種方法對數(shù)據(jù)員的經(jīng)驗(yàn)和技能要求較高,工作效率較低。
2) 由監(jiān)控員現(xiàn)場查看車輛軸型的情況,查驗(yàn)車輛的行駛證,通過對比行駛證圖片對軸數(shù)進(jìn)行認(rèn)定[8]。
這2種人工判別方式均依靠經(jīng)驗(yàn)和技巧進(jìn)行辨別,依賴監(jiān)控員的經(jīng)驗(yàn)和責(zé)任感,容易出現(xiàn)人為失誤,甚至是舞弊行為。
根據(jù)力學(xué)原理,當(dāng)相同軸型的貨車所裝載貨物的總重在一定范圍內(nèi)時(shí),其各軸重占總重的百分比符合一定的規(guī)律。當(dāng)車輛通過收費(fèi)站的車道時(shí),收費(fèi)系統(tǒng)的計(jì)重設(shè)備會(huì)記錄其軸型和軸重信息。通過對收費(fèi)數(shù)據(jù)庫中的海量數(shù)據(jù)進(jìn)行軸型和超限比例分析,運(yùn)用機(jī)器學(xué)習(xí)算法計(jì)算各組軸重分布的均值,得到貨車載荷數(shù)據(jù)分布的隱含規(guī)律和不同類型貨車對應(yīng)軸型的分布情況。以此為依據(jù),對通行記錄進(jìn)行分析和判別,找出異常記錄,從而識(shí)別出假軸車輛,有效避免車輛通行費(fèi)流失。
本文采用聚類分析方法對不同載荷分布比例的車輛進(jìn)行區(qū)分,聚類后同類數(shù)據(jù)盡可能地聚集到一起,不同類的數(shù)據(jù)盡量分離,以找到隱含的規(guī)律。聚類算法的選擇取決于數(shù)據(jù)的類型和聚類的目的。K-均值(K-Means)是劃分方法中比較經(jīng)典的聚類算法,效率較高,廣泛應(yīng)用于大規(guī)模數(shù)據(jù)的聚類。
根據(jù)某省高速公路的計(jì)重收費(fèi)數(shù)據(jù),采用K-Means聚類算法設(shè)定常見軸型和不常見軸型2個(gè)簇;從常見超重軸型中選定某種軸型進(jìn)行分析。通過對選定的車輛在不同超重區(qū)間內(nèi)的軸載譜數(shù)據(jù)進(jìn)行分析,求取每個(gè)軸重占總軸重的比例,從而得到該軸型車輛的軸載分布情況,由此對該軸型車輛在不同超重區(qū)間內(nèi)的軸載比例關(guān)系進(jìn)行分析。采用聚類算法找出軸重占比的中心點(diǎn)(即在該超重區(qū)間內(nèi)的軸載比例),依次計(jì)算出其他軸重的軸載比例,最終得到該軸型車輛的軸載比例系數(shù)關(guān)系。
懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis,WEKA)是一個(gè)開源數(shù)據(jù)挖掘工作平臺(tái),集合有大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,能實(shí)現(xiàn)交互式界面的可視化。本文的數(shù)據(jù)分析主要采用WEKA3.8.1及其提供的聚類分析算法SimpleKMeans。
根據(jù)經(jīng)驗(yàn),高速公路上的很多假軸貨車都有貨物超載問題,因此本文主要針對超載貨車,按照軸型和軸重范圍進(jìn)行貨車載荷分布情況分析。根據(jù)文獻(xiàn)[11]對貴州省2013年和2014年的高速公路收費(fèi)數(shù)據(jù)進(jìn)行分析,得到各軸型的平均運(yùn)距,其中平均運(yùn)距>200 km的軸型是1127軸型(2013年的平均運(yùn)距為334.83 km,2014年的平均運(yùn)距為310.44 km)和157軸型(2013年的平均運(yùn)距為300.48 km,2014年的平均運(yùn)距為274.67 km)。根據(jù)規(guī)定,汽車運(yùn)輸距離≤50 km為短途運(yùn)輸,運(yùn)輸距離≤200 km為中途運(yùn)輸,而>200 km為長途運(yùn)輸。由以上數(shù)據(jù)可知,掛車一般用于中長途運(yùn)輸,是中長途運(yùn)輸?shù)闹髁?。長途運(yùn)輸貨車的通行費(fèi)用較高,容易出現(xiàn)偷逃費(fèi)行為,因此本文以1127軸型貨車為例進(jìn)行分析。該軸型貨車共有6個(gè)軸組,收費(fèi)系統(tǒng)以軸組為單位記錄貨車軸重?cái)?shù)據(jù),該軸型組合見圖1。
圖1 1127軸型組合
根據(jù)各軸重占總重的比例,可直接推導(dǎo)出各軸重之間的比例關(guān)系。由于車輛的第一個(gè)軸不可能為假軸,因此以第一個(gè)軸的軸重為基準(zhǔn),對其余各軸進(jìn)行等值轉(zhuǎn)換,得到各軸之間的比例關(guān)系。采用WEKA數(shù)據(jù)分析工具對各軸的軸重及其比例值進(jìn)行聚類運(yùn)算,得到不同超限范圍內(nèi)的軸重比例關(guān)系,進(jìn)而得到1127軸型貨車各軸重在不同超限范圍內(nèi)的載荷分布情況,簡化后得到1127軸型貨車載荷分布比例數(shù)據(jù)見表1。
表1 1127軸型貨車載荷分布比例數(shù)據(jù)
圖2 1127軸型超限0%~10%貨車載荷比例
對表1中的數(shù)據(jù)進(jìn)行可視化處理,可得到軸重荷載比例關(guān)系的直觀展示效果見圖2,該曲線可作為對應(yīng)超限0%~10%范圍內(nèi)的載荷分布參考曲線,其他超限范圍與此類似。
現(xiàn)有技術(shù)在假軸車輛判別方面存在一定的不足,假軸車輛的通行記錄中沒有明顯標(biāo)明該車輛肯定是假軸車輛,因此缺少驗(yàn)證集數(shù)據(jù),很難對試驗(yàn)結(jié)果進(jìn)行直接驗(yàn)證。為驗(yàn)證試驗(yàn)方法的合理性,采用間接方法對試驗(yàn)結(jié)果進(jìn)行驗(yàn)證:以1127軸型的第2個(gè)軸組數(shù)據(jù)為分析對象,結(jié)合離群點(diǎn)數(shù)據(jù),從某省高速公路歷史通行記錄中獲取不同車牌貨車的通行記錄數(shù)據(jù),選擇相關(guān)字段進(jìn)行匯總(見表2)。根據(jù)總重?cái)?shù)據(jù)分布情況,選擇20 000 kg作為載重狀態(tài)(輕載/重載)的分界參考點(diǎn)。根據(jù)各軸型規(guī)定的限重情況,1型軸限重8 t,2型軸限重10 t,7型軸限重22 t,可計(jì)算出車輛在真實(shí)軸型下的總重和超重情況。
表2 1127軸型疑似假軸貨車通行記錄數(shù)據(jù)
采用同樣的辦法獲取正常軸型車輛的通行記錄,并按總重進(jìn)行升序排列,結(jié)果見表3。由表3可知,該車輛在3—5月份的通行記錄均為1127軸型車輛,由其總重可判斷,不論是20 000 kg以下的輕載情況,還是20 000 kg以上的重載情況,該車輛的軸型均為1127。因此,可判定車牌為PF5168的車輛為真實(shí)的1127軸型車輛,而車牌為CR2721的車輛為疑似假軸車輛。
表3 1127軸型正常貨車通行記錄數(shù)據(jù)
分別對2輛貨車在1127軸型下的通行記錄進(jìn)行整理并作可視化處理,可得到對比曲線見圖3。由圖3可知:正常軸型貨車(車牌為PF5168)的軸重載荷曲線與參考曲線基本上一致;當(dāng)疑似假軸貨車(車牌為CR2721)被判定為1127軸型車輛時(shí),其軸重載荷曲線與參考曲線差別較大,很容易判別出該貨車與正常的1127軸型貨車不同,稽查人員可以此為參考,對該貨車進(jìn)行攔截和查驗(yàn),核實(shí)后依法進(jìn)行處理。由此可證明,將軸重載荷曲線作為疑似假軸車輛的判別曲線具有一定的參考價(jià)值。
圖3 1127軸型正常貨車與疑似假軸車輛對比
該試驗(yàn)數(shù)據(jù)不僅可用于甄別假軸貨車,而且可用來對車輛超限情況進(jìn)行判別,以表2和表3的數(shù)據(jù)為例,車牌為CR2721的車輛的真實(shí)軸型為127型,該軸型的總限重為40 t,而1127軸型的限重為48 t,當(dāng)該車輛載重45.6 t行駛時(shí),放下假軸,限重上升為48 t,車輛為未超限狀態(tài),但若收費(fèi)系統(tǒng)以真實(shí)的127型軸型判斷,該車輛已超限5.6 t,可追回因超限而逃避的通行費(fèi)。利用數(shù)據(jù)分析方式甄別假軸車輛不僅能減少人工成本、提高甄別效率,而且可利用歷史記錄提高甄別的準(zhǔn)確性。
由于車輛各軸軸重間的比例關(guān)系是采用無監(jiān)督的聚類方式獲得的,不利于對假軸車輛進(jìn)行精準(zhǔn)判斷,因此還需在采用上述方法判斷出正常軸型的車輛之后對其通行記錄進(jìn)行標(biāo)記,積累正常軸型車輛在不同超限范圍內(nèi)各軸重間的比例關(guān)系,從而更加真實(shí)準(zhǔn)確地反映出各軸重間的比例關(guān)系,使正常軸型與假軸之間的界限更加明顯,提高判別的準(zhǔn)確度。采用同樣的方法得到其他軸型的軸重載荷曲線數(shù)據(jù),并以此為依據(jù)對更多軸型的車輛進(jìn)行判別,擴(kuò)大假軸車輛的甄別范圍。
目前尚無簡便高效的假軸車輛查驗(yàn)方法,收費(fèi)系統(tǒng)也尚未對前后通行費(fèi)用的對比情況進(jìn)行記錄。根據(jù)本文研究的方法,下一步將考慮與高速公路運(yùn)營管理單位合作,對假軸車輛的甄別和查處進(jìn)行試點(diǎn),在實(shí)踐中提高算法的準(zhǔn)確性和適用范圍。
本文提出通過采用K-Means聚類統(tǒng)計(jì)結(jié)合其他均值計(jì)算、等值換算等數(shù)據(jù)分析方法計(jì)算貨車軸重載荷分布情況,尋找載荷分布規(guī)律,并繪制不同超限范圍內(nèi)的軸重載荷分布參考曲線。
根據(jù)業(yè)務(wù)經(jīng)驗(yàn),從通行記錄中找出指定軸型的正常車輛的通行記錄和疑似假軸車輛的通行記錄,計(jì)算出各自對應(yīng)的軸重載荷分布曲線,將其與參考曲線相比對和可視化展示之后,可看到3種曲線的一致性情況,從而證明本文采用的以軸重載荷分布曲線作為判別依據(jù)的方法具有一定的參考價(jià)值。以此為參考,對訓(xùn)練集(日常通行記錄或歷史通行記錄)中的數(shù)據(jù)進(jìn)行比較,標(biāo)記偏離參考曲線的通行車輛(疑似假軸車輛),為高速公路收費(fèi)稽查提供有力的數(shù)據(jù)支撐,對提高收費(fèi)稽查工作的效率和準(zhǔn)確度、打擊偷逃費(fèi)行為及增加通行費(fèi)收益等都有一定的價(jià)值。