■羅永煜 王陽生 賴樹坤 朱慧先
(福建省高速公路信息科技有限公司,福州 350018)
高速公路作為我國交通運輸基礎(chǔ)設(shè)施建設(shè)的重要組成部分,截至2020 年底,我國高速公路里程已突破16 萬km,居世界首位[1]。在取消收費站后,29 個聯(lián)網(wǎng)收費省份的24 588 套ETC 門架系統(tǒng)、48 211 條ETC 收費車道全部完成工程建設(shè)和改造[1]。截至2021 年,ETC 累積用戶已經(jīng)超過2.2 億,車主使用率為78%,日均交易數(shù)據(jù)高達(dá)10 億,ETC 交易系統(tǒng)快速普及積累了海量的交易數(shù)據(jù)。ETC 門架系統(tǒng)基礎(chǔ)設(shè)施逐步升級,管理制度日益完善,為我國的高速公路快速精準(zhǔn)收費提供了重要支撐。但是,ETC 門架系統(tǒng)由于設(shè)備鋪設(shè)位置造成的鄰道干擾、跟車干擾,以及設(shè)備故障、天氣原因、無線串?dāng)_造成的檢測失敗等原因,高速公路ETC 交易系統(tǒng)不可避免地存在重復(fù)交易、漏交易與誤交易事件[2-9]。因此,針對ETC 交易流水?dāng)?shù)據(jù)進(jìn)行挖掘分析,識別出漏檢測、誤檢測及重復(fù)檢測現(xiàn)象,對異常數(shù)據(jù)進(jìn)行修復(fù)還原,以實現(xiàn)ETC 收費系統(tǒng)的穩(wěn)定運行及精準(zhǔn)計費。
ETC 門架產(chǎn)生鄰道干擾現(xiàn)象是ETC 系統(tǒng)中常發(fā)性問題,主要表現(xiàn)為ETC 門架上的RSU 設(shè)備和相鄰車道上的車輛中的車載OBU 設(shè)備進(jìn)行通信,導(dǎo)致ETC 門架收費系統(tǒng)識別到對向車道的車輛信息,發(fā)生誤檢測交易特情,或ETC 門架上相鄰的兩RSU 設(shè)備同時識別到同一車輛而出現(xiàn)的重復(fù)檢測交易特情。ETC 門架產(chǎn)生鄰道干擾的原因主要有以下幾點:(1)設(shè)備安裝問題。在施工過程中,RSU 設(shè)備未正對車道正中央,造成信號覆蓋區(qū)域偏左偏右的情況;設(shè)備安裝仰角大小不同也影響著信號覆蓋區(qū)域的面積;(2)車道設(shè)計問題。相鄰車道之間需要設(shè)置一定寬度的隔離帶,若未設(shè)置隔離帶或隔離帶寬度不夠?qū)a(chǎn)生鄰道干擾現(xiàn)象;(3)RSU 設(shè)備配置問題。天線方向圖設(shè)計時未設(shè)置好主瓣波束的覆蓋寬度;相鄰車道RSU 工作信道相同將出現(xiàn)同頻干擾問題;發(fā)射功率過大同樣將導(dǎo)致覆蓋區(qū)域超出車道范圍。
現(xiàn)階段RSU 設(shè)備與OBU 設(shè)備間多采用單向通信,驗證車輛行駛信息的準(zhǔn)確性存在較大的難度,因此鄰道干擾產(chǎn)生的特情制約著ETC 交易系統(tǒng)的精準(zhǔn)計費能力。ETC 門架鄰道干擾會出現(xiàn)以下2 種情況:(1)對向門架誤交易特情。車輛在最右側(cè)快車道行駛時,先后被對向車道和行車方向RSU 設(shè)備檢測到,并產(chǎn)生交易流水?dāng)?shù)據(jù);(2)同向車道重復(fù)交易特情。車輛在某一車道行駛時車身相對偏向另一車道,同時由于各種原因鄰道的RSU 設(shè)備信號覆蓋區(qū)域較大且超過了車道寬度,此時將發(fā)生重復(fù)交易特情。
ETC 門架作為路網(wǎng)車輛精準(zhǔn)路徑識別的重要設(shè)備是在線實時路徑識別、還原以及計費處理的底層支撐,但由于天氣、設(shè)備故障以及網(wǎng)絡(luò)傳輸失敗等原因造成門架上的RSU 設(shè)備未識別到車輛經(jīng)過的情況,導(dǎo)致出現(xiàn)門架漏交易特情。具體為車輛在經(jīng)過門架時,車載OBU 設(shè)備與ETC 門架RSU 設(shè)備通訊失敗,未生成交易流水信息導(dǎo)致出現(xiàn)門架漏交易特情。
門架交易異常特情發(fā)生時,門架設(shè)備與OBU設(shè)備無法相互交互,門架是無法得知是否存在交易異常行為。本研究設(shè)計門架交易異常修復(fù)方法先對門架交易軌跡異常情況進(jìn)行說明;再針對各種異常情況進(jìn)行針對性的修復(fù)方法說明;最后設(shè)計門架交易異常修復(fù)算法對門架交易軌跡異常進(jìn)行修復(fù)還原,提高在線計費及門架路徑擬合的精準(zhǔn)性。
門架交易特情發(fā)生時,在ETC 交易流水?dāng)?shù)據(jù)中是無法直接反映出來的,因此對原始ETC 交易流水?dāng)?shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,使其按照車輛行程軌跡化進(jìn)行異常數(shù)據(jù)識別分析是重要步驟。通過對車輛行程軌跡化后,可以利用高速公路門架拓?fù)潢P(guān)系提取出異常交易特情。
門架交易特情主要為3 類:漏交易、誤交易以及重復(fù)交易,這3 類交易特情在行程軌跡中相互組合可能出現(xiàn)幾種錯誤軌跡。為保證ETC 收費系統(tǒng)實現(xiàn)精準(zhǔn)計費,需要針對不同的異常交易軌跡進(jìn)行修復(fù)以還原出車輛實際行駛路徑并進(jìn)行計費。異常交易軌跡類型見表1,其中單一異常交易情況見序號1、2、3,處理這3 種情況相對容易,簡單進(jìn)行拓?fù)浔葘茨艿贸觥U`交易和漏交易組合出現(xiàn)的錯誤軌跡見序號4、5、6,具體異常類型難以定位并難以進(jìn)行門架軌跡修復(fù)。
表1 異常交易軌跡類型
對車輛交易軌跡存在多種異常交易特情的情況進(jìn)行梳理,設(shè)計算法進(jìn)行識別修復(fù)是實現(xiàn)精準(zhǔn)計費的內(nèi)在需求。針對本研究梳理出的6 種異常交易情況進(jìn)行修復(fù),主要是補全漏交易、刪除重復(fù)交易、修正誤交易,修復(fù)方法說明見表2。
表2 異常交易軌跡修復(fù)方法說明
根據(jù)異常交易軌跡修復(fù)方法說明的思路,提出門架軌跡異常識別及修復(fù)方法,充分利用ETC 門架交易流水?dāng)?shù)據(jù)、高速公路路網(wǎng)拓?fù)鋽?shù)據(jù)實現(xiàn)對各異常交易情況識別并修復(fù),為后續(xù)的收費系統(tǒng)提供數(shù)據(jù)支撐。為此作出如下定義:
定義1 (節(jié)點Node):高速公路上收費站與ETC 門架和收費站統(tǒng)稱為節(jié)點Node,其表示形式見公式(1):
其中NodeID 為門架或收費站編碼;NodeType作為區(qū)分門架和收費站的標(biāo)識;OPP 表示當(dāng)前節(jié)點的對向節(jié)點編碼。
定義2(通行節(jié)點PNode):車輛在行駛過程中與門架設(shè)備進(jìn)行交互形成的交易信息、牌識信息以及車輛特征信息統(tǒng)稱通行信息。通行節(jié)點有車輛標(biāo)識、通行時間、節(jié)點組成,其表示形式見公式(2):
其中VehSign 為車輛標(biāo)識,即車牌號;Node 為通過的節(jié)點信息;PTime 為通行時間。
定義3(行程門架軌跡PNodePath):車輛在一次高速旅程中,所有的PNode 按Source 進(jìn)行分類,以PTime 排序生成的一條有序軌跡鏈。其表現(xiàn)形式見公式(3):
其中PNode1、PNoden為當(dāng)前車輛高速旅程的起止點。需要說明的是由于漏交易、誤交易、重復(fù)交易等異常情況,故車輛通行門架軌跡并非一定連續(xù)。將未出現(xiàn)交易特情的行程門架軌跡稱為PNodePathR;出現(xiàn)交易特情導(dǎo)致門架軌跡不連續(xù)的稱為PNodePathW。
定義4(門架拓?fù)潢P(guān)系,TP):門架拓?fù)潢P(guān)系是由Node 之間的路網(wǎng)連接關(guān)系組成的,高速公路屬于分向行駛的全封閉道路,故拓?fù)潢P(guān)系是具有方向性的。其表示形式見公式(4):
其中Nodei為當(dāng)前拓?fù)潢P(guān)系起點門架,Nodej為Nodei直接相連的后續(xù)門架。同時,Node 中保存著OPPNode 信息,由此可得反向門架拓?fù)潢P(guān)系TP′,見公式(5):
定義5(門架連通關(guān)系,C):門架連通關(guān)系指的是兩門架之間的最短門架路徑小于?(最大漏檢測門架數(shù)量閾值),即認(rèn)為當(dāng)前兩門架連通,其表示形式見公式(6):
其中Pm=<Nodej,…,Nodem>為Nodei和Nodem之間的最短門架路徑;γ 為Pm 的長度。
根據(jù)前人的研究[2],絕大部分的車輛交易門架軌跡不會超過20 個門架,故選取15 個門架作為最大漏交易門架數(shù)量閾值,即?=15。
門架交易軌跡異常修復(fù)方法包括門架交易軌跡異常識別和異常交易軌跡修復(fù)2 個部分。先將ETC 交易流水軌跡提取生成PNodePath,遍歷PNodePath;再根據(jù)TP,TP′比對車輛前后的PNode信息,若出現(xiàn)重復(fù)交易特情,則刪除;若出現(xiàn)誤交易特情,則根據(jù)TP′的信息將誤交易節(jié)點PNoden修正成PNoden[OPP];若出現(xiàn)漏交易特情則使用Pm 進(jìn)行漏交易門架補全;最終修復(fù)完成生成ReNodePath,若無法處理的軌跡提交人工審核,結(jié)束修復(fù)流程(圖1)。
圖1 門架交易異常識別及修復(fù)方法流程
現(xiàn)階段,針對高速公路ETC 交易系統(tǒng)對異常交易數(shù)據(jù)清理修復(fù)的研究較少,缺乏有效的管理和科學(xué)的修復(fù)方法。如何利用ETC 交易流水?dāng)?shù)據(jù)和高速公路門架拓?fù)湫畔TC 交易系統(tǒng)產(chǎn)生的異常進(jìn)行修復(fù)還原成為當(dāng)前高速公路收費系統(tǒng)的一大挑戰(zhàn)。異常交易特情的出現(xiàn)往往導(dǎo)致車輛的門架通行軌跡不完整、軌跡異常、軌跡錯誤等。本研究針對漏交易、誤交易以及重復(fù)交易3 種異常交易特情組合生成的交易軌跡錯誤情況進(jìn)行修復(fù)方法設(shè)計,從而實現(xiàn)ETC 交易流水?dāng)?shù)據(jù)的異常修復(fù)。試驗依托于福建省高速公路信息科技有限公司的福建省高速公路運行監(jiān)測平臺,選取了2022 年6 月22 日全天的ETC 交易流水?dāng)?shù)據(jù)進(jìn)行分析,主要開發(fā)工具與開發(fā)語言為Clickhouse 和Python。
使用本研究提出的異常交易識別算法對2022年6 月22 日的ETC 交易流水?dāng)?shù)據(jù)進(jìn)行分析,其中異常數(shù)據(jù)概況見圖2。ETC 流水?dāng)?shù)據(jù)異常是指出現(xiàn)漏交易、誤交易與重復(fù)交易的數(shù)據(jù);行程指當(dāng)日的所有行程門架軌跡數(shù),包括還未駛出高速的車輛;完整行程為當(dāng)日進(jìn)入收費站并完成整個高速公路旅程出收費站完成收費的PNodePath 總數(shù)。從ETC 流水?dāng)?shù)據(jù)的異常情況看異常率較少,為1.69%,但是極小部分的異常流水?dāng)?shù)據(jù)造成了15.29%的PNodePath出現(xiàn)異常,這也說明了ETC 交易流水?dāng)?shù)據(jù)的異常識別和修復(fù)對收費路徑的精準(zhǔn)擬合具有重要的研究意義。
圖2 2022 年6 月22 日ETC 交易流水異常數(shù)據(jù)
按行程錯誤情況進(jìn)行統(tǒng)計,未出現(xiàn)交易特情的PNodePathR中,平均通行門架數(shù)為7.57 個;出現(xiàn)交易特情的PNodePathW中,平均通行門架數(shù)為10.99 個。通過對PNodePath 所包含的PNode 數(shù)與PNodePath 錯誤率的關(guān)聯(lián)分析(圖3),得出如下結(jié)論:(1)PNodePath 中的PNode 數(shù)集中在5~10 個,且大部分的PNodePath 中通行門架數(shù)小于20 個;(2)行程中PNode 異常交易率整體趨勢隨PNodePath 中的PNode 數(shù)量的增大而上升;(3)當(dāng)PNode 數(shù)小于32 個時為正確率高于異常率,一旦超過32 個PNode 和50%的PNodePath 會出現(xiàn)異常交易特情,當(dāng)PNodePath 達(dá)到72 個PNode 以上時,行程異常率接近1;(4)需要注意的是當(dāng)PNodePath 的PNode 數(shù)為2 時,異常率與正常率接近1∶1,此類數(shù)據(jù)值得重點關(guān)注,有可能是利用屏蔽通行介質(zhì)的方法,系統(tǒng)自動計算最短路徑進(jìn)行收費從而達(dá)到“買短跑長”目的。
圖3 行程節(jié)點數(shù)與行程錯誤率關(guān)聯(lián)分析
使用本研究提出的異常軌跡修復(fù)算法對出現(xiàn)異常的93 067 條PNodePathw進(jìn)行修復(fù),修復(fù)結(jié)果見圖4,本算法共修復(fù)87 486 條,仍有5 581 條屬于其他異常情況無法修復(fù),修復(fù)成功率達(dá)到94%。針對已修復(fù)的PNodePath 進(jìn)行分析漏檢測出現(xiàn)的交易異常情況最多共86 913 次占總門架交易次數(shù)的7.6%;門架重復(fù)檢測出現(xiàn)的情況最少,占總門架交易次數(shù)的0.76%(圖5)。
圖4 完整行程修復(fù)情況
圖5 異常交易特情分析
隨著取消省界收費站后聯(lián)網(wǎng)收費里程激增,為維護(hù)高速公路正常的繳費秩序,對門架交易狀況的識別和異常特情的還原修復(fù)成為高速公路運營的重要工作之一。本研究針對漏交易、誤交易、重復(fù)交易3 種交易特情所產(chǎn)生的異常交易軌跡進(jìn)行分析,提取出了6 種典型的異常交易軌跡,并根據(jù)高速公路門架拓?fù)湓O(shè)計異常軌跡修復(fù)算法,補充還原漏交易數(shù)據(jù),修正誤交易數(shù)據(jù),刪除重復(fù)交易數(shù)據(jù);進(jìn)而選取了福建省高速公路運行監(jiān)測平臺2022 年6 月22 日全天的ETC 交易流水?dāng)?shù)據(jù)進(jìn)行實例分析驗證,確定了該方法的有效性,提高了收費擬合的準(zhǔn)確性。