徐東彬, 張孝銘
(1.北京交科公路勘察設計研究院有限公司,北京 100191; 2.交通運輸部公路科學研究院,北京 100088 3.帝國理工大學, 英國 倫敦 SW72AZ)
2020年1月1日零時起,全國29個聯(lián)網(wǎng)省份的487個高速公路省界收費站全部取消,開啟了新ETC時代。交通運輸部下發(fā)的《取消高速公路省界收費站總體技術方案》中提出了實現(xiàn)電子不停車快捷收費(ETC)、車牌圖像識別、多種支付手段融合應用的技術路徑。取消省界收費站以后,全國高速公路形成一張網(wǎng),收費方式和通行規(guī)則發(fā)生了較大變化,車輛的逃費行為也與之前有所差異,如何利用數(shù)據(jù)資源打擊偷逃費行為,挽回高速公路通行費損失是高速公路管理者需要面臨的課題。
在取消高速公路省界收費站前,盡管有省界收費站作為省際間路網(wǎng)的物理分割,但隨著各省聯(lián)網(wǎng)收費距離不斷增加,車輛單次通行費金額不斷增大,逃費的誘惑力也越來越大,一些不法司機或運輸企業(yè)為了達到逃費目的采用多種作弊手段[1-2]。這些作弊手段包括闖關、換卡、改寫卡、倒卡以及假冒綠通、軍警等免費車輛等。
面對日益猖獗的逃費行為,高速公路管理部門采取了多種管理措施和技術手段。在管理方面,一方面加強內(nèi)部人員的管理,增加對內(nèi)部人員的檢查力度,打擊收費人員與外部人員串通作弊逃費;另一方面,與交警等進行專項治理,聯(lián)合打擊偷逃費行為。在技術方面,利用高速公路聯(lián)網(wǎng)收費系統(tǒng)積累的大量通行數(shù)據(jù),及時發(fā)現(xiàn)、打擊偷逃費行為。
換卡、改寫卡等逃費車輛的作弊行為,在數(shù)據(jù)上必然表現(xiàn)為某種異常,如車輛行駛時間過短、超時,出入口站點不合理、車型不一致,同一輛車同時出現(xiàn)在不同地點、路徑明顯存在異常等。借助大數(shù)據(jù)可以發(fā)現(xiàn)數(shù)據(jù)之間的聯(lián)系和異常,通過對異常數(shù)據(jù)進一步分析,得出異常車輛數(shù)據(jù)記錄的數(shù)據(jù)特征,從而判斷車輛是否存在逃費行為,為打擊逃費提供有力證據(jù)。
新ETC時代,在數(shù)據(jù)資源、通行規(guī)則和收費模式、逃費行為方面都發(fā)生了重要變化。
取消高速公路省界收費站后,數(shù)據(jù)資源變得更加豐富,數(shù)據(jù)類型更加多樣,數(shù)據(jù)量激增,主要表現(xiàn)為:
1) 數(shù)據(jù)種類增多。數(shù)據(jù)類型上,除了結構化數(shù)據(jù),還有視頻等非結構化數(shù)據(jù);除了收費數(shù)據(jù),還有運營的其他數(shù)據(jù)等;除了收費車道數(shù)據(jù),還新增了ETC門架數(shù)據(jù)。其中ETC門架數(shù)據(jù)包括ETC流水、牌照識別流水、設備狀態(tài)監(jiān)測數(shù)據(jù)、車輛圖像記錄流水、車輛抓拍圖片、CPC卡通行記錄、視頻結構化數(shù)據(jù)等內(nèi)容。
2) 數(shù)據(jù)量激增。取消高速公路省界收費站前,收費數(shù)據(jù)主要是出入口的交易流水。取消高速公路省界收費站后,根據(jù)統(tǒng)計每輛車平均經(jīng)過10個ETC門架,以一個中部省份為例,ETC門架每天相應的數(shù)據(jù)量約1.2 TB,其出入口交易量約2 GB,該數(shù)據(jù)量尚不包括ETC門架產(chǎn)生的抓拍圖片。
3) 數(shù)據(jù)關聯(lián)性更高。同一個ETC門架產(chǎn)生的OBU交易數(shù)據(jù)、車牌識別數(shù)據(jù)等存在關聯(lián)性,往往對應的是同一車輛數(shù)據(jù)。相鄰ETC門架所產(chǎn)生數(shù)據(jù),在時空關系上具有更強的關聯(lián)性,即一輛車與相鄰門架的關系既可以用來彌補漏交易,又能反映出車輛的行駛軌跡。
4) 數(shù)據(jù)價值更為豐富。新ETC時代,ETC車輛占比日益增大,同時貨車也開始大量使用ETC。ETC用戶的注冊信息與通行信息結合,能更好地實現(xiàn)用戶畫像,為ETC的應用與拓展、稽核和信用體系的建立提供了可能。
取消高速公路省界收費站以后,用戶類型和收費方式變化主要表現(xiàn)為:
1) 用戶類型變化。我國在2015年實現(xiàn)ETC全國聯(lián)網(wǎng),ETC用戶數(shù)量穩(wěn)步上升,截至2018年底已突破7 000萬,但ETC車道及用戶數(shù)量、電子不停車收費金額占比仍相對偏低。交通運輸部取消高速公路省界收費站工作的實施,極大地促進了ETC的發(fā)展。截至到2020年7月,ETC用戶數(shù)量突破2.15億。同時,《收費公路車輛通行費車型分類》(JT/T 489—2019)將摩托車歸為1類客車,為摩托車上高速公路奠定了基礎。
2) 收費方式變化。高速公路用戶將逐步轉變?yōu)橐訣TC用戶為主;通行費收取方式也逐步從人工半自動停車收費轉變?yōu)橐噪娮硬煌\囀召M為主;支付方式從以現(xiàn)金為主逐步調(diào)整為非現(xiàn)金(ETC用戶卡、手機移動支付等)為主的支付方式。
取消高速公路省界收費站以后,車輛偷逃費行為變化主要表現(xiàn)為:
1) 從MTC車輛為主向ETC車輛逃費為主轉變。撤站后ETC用戶占比和通行占比較大,截至到2020年7月,ETC車輛通行比例超66%,作弊車輛可能利用技術存在的不足進行逃費,如拔出ETC卡、屏蔽CPC卡等。
2) 逃費金額較撤站前更大。撤站前,按省域收費的模式將偷逃通行費行為限制在省域范圍內(nèi);撤站后,由于沒有省界主線站的限制,逃費范圍將變得更大。因此,單次逃費金額更高,跨省逃費成為可能。
3) 逃費方式發(fā)生變化。撤站后,貨車由計重收費調(diào)整為車型收費,因此“走S行”和“跳秤”的行為將不復存在,但同時可能產(chǎn)生屏蔽通行卡和OBU進行逃費的行為。
基于Storm流處理的在線逃費稽核技術采用流處理技術,系統(tǒng)架構包括數(shù)據(jù)層、大數(shù)據(jù)分析支撐層和應用層[3]。計算逃費車輛所需的基礎數(shù)據(jù)存儲在數(shù)據(jù)層,包括站點閾值表、車牌數(shù)據(jù),計算結果數(shù)據(jù)也存在數(shù)據(jù)庫中,并發(fā)射收費數(shù)據(jù)形成實時數(shù)據(jù)流;大數(shù)據(jù)分析支撐層包括假冒軍警牌、倒卡逃費、套牌車識別計算等3個在線計算模塊,通過這些模塊并發(fā)判斷車輛是否存在逃費行為,并進行日志登記和任務監(jiān)控。在該數(shù)據(jù)層,收費基礎數(shù)據(jù)形成實時數(shù)據(jù)流,傳輸給3種在線計算模塊,計算模塊同時對實時數(shù)據(jù)流進行實時監(jiān)測;最后,分析應用層面向用戶給出稽核結果,完成逃費車輛的在線稽核。
倒卡、假冒軍警牌、套牌換卡等3種逃費方式在時間特征、空間特征上存在著顯著的區(qū)別,文獻[3]利用時空特征差異提出了基于Storm環(huán)境下的假冒軍警牌、倒卡、套牌車逃費判別方法。通過對站點閾值、軍警牌數(shù)據(jù)和實時收費數(shù)據(jù)的預處理,應用Strom流處理技術實現(xiàn)在線實時稽核偷逃費車輛。由于3種逃費稽核方法共享同一份收費數(shù)據(jù),可以高效排查不同逃費手段的可疑車輛,達到了低延時、高識別率的稽核逃費車輛。
在逃費行為中,套牌車輛逃費具有隱蔽性高、普遍存在且不易發(fā)現(xiàn)的特點,將Strom流處理技術應用于套牌車輛稽核,應用效果顯著。套牌車輛,如果僅從聯(lián)網(wǎng)收費數(shù)據(jù)的時空特征上進行分析,對一部分套牌車輛難以進行區(qū)分,還需要借助于其他特征加以判斷。套牌車輛除車牌以外還可能存在其它區(qū)別,如車標就是一個顯著特征。取消高速公路省界站后,一方面,前端攝像機具備了車輛特征識別功能,另一方面聯(lián)網(wǎng)收費數(shù)據(jù)變得更加豐富,不僅有車牌識別結果,還有車輛的高清圖片。這些信息為識別套牌車輛提供了依據(jù)。為此,在原有Strom流處理技術的在線識別算法基礎上增加車輛的車標作為特征,可以進一步提高算法的識別準確率。
為了識別車輛車標,需要建立車輛的車標特征庫,因圖像的HU不變距具有旋轉、平移和縮放不變特性,因此文獻[4]提出了基于圖像的HU不變距作為一個顯著的形狀特征,用于車標特征識別。其中圖像的HU不變距定義如下:現(xiàn)假設有1幅圖像f(x,y),它的(p+q)階原點距定義為:
(1)
中心距為:
q,p=0,1,2,L(2)
標準化中心距定義為:
文獻[4]還通過基于灰狼算法尋優(yōu)來進一步提升車標識別率。
應用Strom流處理技術,對收費數(shù)據(jù)進行時空分析可以得到疑似換卡的套牌車輛。套牌車輛盡管車牌相同,但可能存在其他如車型、車品牌不一致情況,車品牌不一致最明顯表現(xiàn)為車標不一致,因此將車標作為區(qū)別車輛的重要特征,能夠進一步甄別可疑車輛。通過試驗發(fā)現(xiàn),融入車標特征的套牌車輛識別算法能夠進一步提高套牌車輛的識別率,可將識別率提高到99%以上。然而,部分套牌車輛尤其是經(jīng)常逃費的套牌車輛,往往車型、品牌與被套牌車輛均完全一致,這給甄別帶來困難。
對于套牌車輛與被套車型、車品牌完全相同的情況,可以借助于車輛的其他特征及軌跡特征來進行識別。
除了車牌和車標,其他特征也是區(qū)分不同車輛的重要證據(jù)。這些特征包括安全帶、年檢標、車內(nèi)掛件、車內(nèi)擺件、車頂天窗、車臉位置等,如圖1所示。
圖1 車輛特征示意圖
即使采用同車型、同車牌、同品牌和同型號車輛在上述特征上也可能會存在差異,這種差異可以用于建立車輛特征信息庫,用來區(qū)分套牌車輛。
車輛身份信息的認定可以通過基礎信息比對來實現(xiàn),包括:車牌號碼比對、車牌顏色比對、車標比對、車身顏色比對、車輛品牌比對、子系品牌比對、車輛類型比對、車輛年款比對、路段信息比對、點位信息比對、時間信息比對等方面。
甄別車輛行駛軌跡是確定車輛是否有偷逃通行費的主要技術特征,可充分利用ETC門架獲取的收費數(shù)據(jù)、車牌數(shù)據(jù)、車臉圖像、車輛圖像等進行逃費車輛的偵測、取證、鎖定等。
逃費車輛通過屏蔽CPC卡和OBU致使系統(tǒng)無法產(chǎn)生相應的通行信息,按照現(xiàn)有的規(guī)則車輛以最短路徑繳納通行費,即可達到逃費的目的。對此,通過收費車道和ETC門架的抓拍數(shù)據(jù)相結合,形成車輛的軌跡,并根據(jù)車輛是否存在行駛時間過長或過短情況,或存在不合理的繞行、折返來判斷車輛是否逃費或套牌。對于無上、下高速圖片的車輛,其軌跡又存在異常,可將其列為逃費嫌疑車輛。
取消高速公路省界收費站后,系統(tǒng)運行過程中小客車投訴咨詢的現(xiàn)象比較少,但大型車輛投訴較多。如果大型車輛屬于“兩客一危”車輛,則可接入“兩客一危”的車輛數(shù)據(jù),獲得車輛的實際路徑,以核實車輛通行情況,從而達到識別車輛逃費行為。
面對新ETC時代逃費稽核形勢變化,需運用數(shù)據(jù)挖掘技術對數(shù)據(jù)進行分析處理,建立數(shù)據(jù)分析模型,并形成完整證據(jù)鏈,為稽核工作找到突破口和著力點。同時,逐步建立完善的信用體系,形成車輛黑白名單數(shù)據(jù)庫,將偷逃通行費的車輛納入失信名單,通過對應的懲罰機制,真正實現(xiàn)誠信者受益、失信者受罰,保障聯(lián)網(wǎng)收費的公平秩序。