李 斌,梁軼濤
(廣東聯(lián)合電子服務(wù)股份有限公司,廣州 510000)
在廣東省委省政府的統(tǒng)一規(guī)劃下,廣東省的高速公路路網(wǎng)建設(shè),實現(xiàn)了“鎮(zhèn)鎮(zhèn)通高速”的目標(biāo),為廣大車主的出行和物流業(yè)的發(fā)展提供了堅實的交通基礎(chǔ)設(shè)施保障. 2020年,廣東省根據(jù)交通部的統(tǒng)一部署,實施取消省界收費站工程,為全省高速公路架設(shè)了大量的感知設(shè)備,快速提升了路面的數(shù)據(jù)采集和信息感知能力. 高速公路的數(shù)字化水平得到了大幅度提升. 如何充分利用好高速公路通行數(shù)據(jù),成為目前行業(yè)內(nèi)的1個熱點問題.
廣東省聯(lián)網(wǎng)中心在2019年開展取消省界收費站工程項目建設(shè)之初,就已為有效開展高速公路通行大數(shù)據(jù)應(yīng)用做了系統(tǒng)化的準(zhǔn)備,于2020年取消省界收費站系統(tǒng)切換的同時,上線了廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺. 基于數(shù)據(jù)中臺,廣東省聯(lián)網(wǎng)中心進行了多項跨行業(yè)的通行大數(shù)據(jù)應(yīng)用,并取得了一定成效. 本文主要對廣東省聯(lián)網(wǎng)中心面向非收費領(lǐng)域的應(yīng)用進行了介紹.
隨著國家大數(shù)據(jù)戰(zhàn)略的推進,以及“交通強國”項目逐步實施,高速公路通行大數(shù)據(jù)應(yīng)用逐漸引起了行業(yè)內(nèi)、外各單位的重視. 2019年底,國家《交通強國建設(shè)綱要》,明確了“大力發(fā)展智慧交通. 推動大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能、區(qū)塊鏈、超級計算等新技術(shù)與交通行業(yè)深度融合”的要求. 2020年4月,國家發(fā)展改革委明確了“新基建”中“融合基礎(chǔ)設(shè)施”是指深度應(yīng)用互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù),支撐傳統(tǒng)基礎(chǔ)設(shè)施轉(zhuǎn)型升級,進而形成的融合基礎(chǔ)設(shè)施,而“智能交通基礎(chǔ)設(shè)施”是其中重要的一項. 上述政策都表明,交通大數(shù)據(jù)與人工智能應(yīng)用正處于快速發(fā)展階段.
過去,高速公路的通行數(shù)據(jù)主要應(yīng)用于聯(lián)網(wǎng)收費場景. 但隨著近年來國民經(jīng)濟的發(fā)展和人民生活水平的提高,高速公路客、貨運輸量逐年穩(wěn)步提升;私家車普及率的提升,加大了自駕游的普及,重大節(jié)假日客運車流量急劇增長. 這些現(xiàn)象既要求各級主管部門實時掌握高速公路出行狀況,提升管理水平,也為各種商業(yè)化的出行服務(wù)平臺提供了極好的商機. 而基于高速公路行業(yè)的大數(shù)據(jù)應(yīng)用,為這些應(yīng)用場景提供了高效、精準(zhǔn)、客觀的解決方案. 因此,高速大數(shù)據(jù)應(yīng)用需求越來越迫切,其重要性不言而喻.
過去,高速公路的通行數(shù)據(jù)維度較為單一,主要是車輛的出口信息,滿足的是出口收費的需要. 2020年取消省界收費站后,由于在路上架設(shè)了較多的ETC門架,其數(shù)據(jù)維度極大豐富,數(shù)據(jù)量也快速增加. 在數(shù)據(jù)維度上,除了結(jié)構(gòu)化數(shù)據(jù)外,還增加了通行車輛的圖像數(shù)據(jù)和視頻數(shù)據(jù). 對于結(jié)構(gòu)化數(shù)據(jù),也在原來出口信息的基礎(chǔ)上,增加了入口信息、通行的ETC門架信息、貨車入口稱重信息和出口查驗信息等.
除了數(shù)據(jù)本身,對于數(shù)據(jù)的處理技術(shù),近年來也有了很大進步. 人工智能和大數(shù)據(jù)處理技術(shù)已在交通行業(yè)有大量的落地應(yīng)用. 大數(shù)據(jù)條件下的交通系統(tǒng)分析不是將大數(shù)據(jù)技術(shù)簡單套用或者移植到交通領(lǐng)域,而是將大數(shù)據(jù)技術(shù)融入到交通系統(tǒng)分析體系中,是將數(shù)據(jù)組織成為信息,從信息提煉特征,從特征變化中發(fā)現(xiàn)規(guī)律,并就對策進行追蹤評估的信息處理過程[1]. 進一步,楊超等[2]將交通大數(shù)據(jù)分為道路定點檢測器、出租車GPS、公交IC卡、車牌識別、手機數(shù)據(jù)等,具有一定的預(yù)見性. 就目前而言,高速公路通行數(shù)據(jù)屬于道路定點檢測器產(chǎn)生的數(shù)據(jù)和車牌識別數(shù)據(jù)2大類. 這些信息和技術(shù)在高速公路的融合,能較完整地呈現(xiàn)每一輛車的高速通行路徑,為各種應(yīng)用場景提供了基礎(chǔ)支撐.
高速公路通行數(shù)據(jù)當(dāng)前有多個應(yīng)用研究領(lǐng)域,包括車輛逃費稽核、實時交通分析和車路協(xié)同等.
1.3.1 車輛漏逃費稽核
該領(lǐng)域是高速公路通行數(shù)據(jù)服務(wù)于本行業(yè)的典型場景. 在我國,高速公路的車輛通行費收費標(biāo)準(zhǔn)主要涉及收費車型、行駛里程2個因素,而漏逃費行為的本質(zhì),是對這2個因素的主觀隱瞞或客觀誤識別. 通過對收費車輛的真實收費車型和實際通行里程進行大數(shù)據(jù)分析,則能對車輛的漏逃費行為進行稽核. 目前,在國家交通運輸部應(yīng)急處置中心的統(tǒng)籌下,已建立起1套由“國家- 省(直轄市)”組成的兩級稽核體系,“大數(shù)據(jù)稽核”已寫入高速公路聯(lián)網(wǎng)收費的國家級總體建設(shè)方案中.
1.3.2 實時交通分析
該領(lǐng)域是高速公路通行數(shù)據(jù)在數(shù)據(jù)維度豐富后衍生的新應(yīng)用領(lǐng)域. 過去該領(lǐng)域主要由導(dǎo)航軟件提供商所壟斷,其基于用戶數(shù)據(jù)進行的實時交通分析,是1種基于樣本的分析方法,能較好地反應(yīng)出實時路程況. 國內(nèi)的百度地圖、高德地圖、騰訊地圖,國外的谷歌地圖等均是典型的例子. 現(xiàn)在,由于高速公路通行數(shù)據(jù)維度越來越豐富,數(shù)據(jù)的實時性越來越高,基于此類數(shù)據(jù)進行的實時交通分析突顯出“全量數(shù)據(jù)”的獨特價值. 例如,利用此類數(shù)據(jù),不僅能分析實時路況,還能統(tǒng)計實時的車流量,從而判斷高速公路當(dāng)前的通行飽和度,為各級路段管理單位提供數(shù)據(jù)支持. 目前,廣東、江蘇、浙江等高速公路車流量大省均開展這方面的應(yīng)用,取得成效.
經(jīng)過近10 a的快速發(fā)展,廣東省高速公路路網(wǎng)發(fā)達,車流量大,聯(lián)網(wǎng)路段數(shù)量、通車?yán)锍?、車流量均居全國首?
截止至2021年6月30日,廣東省聯(lián)網(wǎng)收費高速公路超過160條,通車?yán)锍虜?shù)超過1萬km,占全國的5.7%,每百平方公里里程密度超過5.5 km,是全國的3倍. 廣東省近10 a聯(lián)網(wǎng)里程發(fā)展趨勢如圖1所示.
圖1 廣東省近10 a聯(lián)網(wǎng)里程發(fā)展趨勢
在車流量方面,廣東省高速公路日均出口車流量超過650萬車次,占全國超20%,日均車流密度超過600車次/km,是全國的3.7倍. 在取消省界收費站項目實施后的1 a多時間里,廣東省整體車流量基本穩(wěn)定在全國20%左右,比排在第2、3、4位的省份的車流量之和還大.
圖2 廣東省高速公路原生數(shù)據(jù)維度和數(shù)據(jù)量示意圖
隨著全國取消省界收費站工程的實施,高速公路通行數(shù)據(jù)采集的維度快速增加. 通過推廣ETC發(fā)行,在高速公路大量架設(shè)ETC門架,布設(shè)RSU天線和圖像抓拍設(shè)備,高速公路通行數(shù)據(jù)已從過去的單一維度的結(jié)構(gòu)化數(shù)據(jù),擴展到車牌識別數(shù)據(jù)、車輛抓拍圖片數(shù)據(jù)、視頻監(jiān)控數(shù)據(jù)等維度. 同時,隨著各路段對橋梁、隧道的智能化管理水平的提升,各類橋隧傳感器的數(shù)據(jù)也在快速增加,成為除通行數(shù)據(jù)以外的有益補充. 以廣東省為例,高速公路的原生數(shù)據(jù)維度和數(shù)據(jù)量如圖2所示. 從圖中可看出,全國取消省界收費站工程實施后,短短1 a內(nèi)積累的數(shù)據(jù)量,就已經(jīng)超過了廣東省聯(lián)網(wǎng)收費工作開展以來的全部數(shù)據(jù)的總和.
全國取消省界收費站工程實施后,交通部對通行數(shù)據(jù)的上傳時間給出了明確規(guī)定,要求通行流水產(chǎn)生后的30 min內(nèi)必須上傳至省聯(lián)網(wǎng)中心. 廣東省經(jīng)過“省站直傳”等項目的改造后,通行數(shù)據(jù)上傳時效性進一步提升,平均上傳時間小于120 s. 時間性的加強,為許多準(zhǔn)實時的數(shù)據(jù)應(yīng)用場景提供了基礎(chǔ)保障.
廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺采用云平臺的架構(gòu)進行建設(shè). 數(shù)據(jù)中臺的核心是1個高性能的行業(yè)大數(shù)據(jù)存儲和計算引擎,現(xiàn)已實現(xiàn)數(shù)據(jù)的集中存儲和元數(shù)據(jù)的標(biāo)準(zhǔn)化;集成了多種主流的數(shù)據(jù)處理引擎和人工智能算法框架,能支撐離線計算、實時計算、圖計算等業(yè)務(wù)場景;建立了多項面向大數(shù)據(jù)和人工智能應(yīng)用的平臺層服務(wù),大幅度提升數(shù)據(jù)應(yīng)用開發(fā)的效率;依托聯(lián)網(wǎng)收費的安全體系,構(gòu)建了較完善的數(shù)據(jù)安全保障體系,有效保證數(shù)據(jù)開發(fā)應(yīng)用方面的安全性. 數(shù)據(jù)中臺的應(yīng)用系統(tǒng)架構(gòu)如圖3所示.
3.1.1 行業(yè)大數(shù)據(jù)應(yīng)用的系統(tǒng)架構(gòu)存在問題分析
圖3 廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺架構(gòu)示意圖
高速公路通行數(shù)據(jù)的數(shù)據(jù)量急劇增加,僅1 a的數(shù)據(jù)量,已遠超過去十幾年的總和. 過往,大數(shù)據(jù)應(yīng)用一般被整合于聯(lián)網(wǎng)收費業(yè)務(wù)系統(tǒng)中,為其子模塊之一. 由于聯(lián)網(wǎng)收費系統(tǒng)是典型的聯(lián)機事務(wù)處理(OLTP)系統(tǒng),均采用基于關(guān)系數(shù)據(jù)庫系統(tǒng)(RDBMS)的數(shù)據(jù)應(yīng)用技術(shù),在面對數(shù)據(jù)量劇增的情況下,其數(shù)據(jù)處理性能已無法支撐實際需要. 基于聯(lián)機分析處理(OLAP)的數(shù)據(jù)倉庫技術(shù),在數(shù)據(jù)存儲和查詢上能表現(xiàn)得比OLTP系統(tǒng)更好,但是,其數(shù)據(jù)處理環(huán)節(jié)基本上仍基于RDBMS,不能為大數(shù)據(jù)應(yīng)用場景提供完整的解決方案. 因此,本行業(yè)的大數(shù)據(jù)應(yīng)用亟需采用更為合理的數(shù)據(jù)架構(gòu).
3.1.2 行業(yè)大數(shù)據(jù)應(yīng)用的系統(tǒng)架構(gòu)選型分析
從系統(tǒng)架構(gòu)上講,Eric Brewer于2000年提出并被后續(xù)證明的CPA定律認為,在一個系統(tǒng)中,數(shù)據(jù)一致性(Consistency,C)、服務(wù)可用性(Availability,A)和分區(qū)容忍性(Partition Tolerance,P)這3個要素中只能同時滿足2個[3]. RDBMS通過弱化分區(qū)容忍性(即P)來保證ACID準(zhǔn)則,屬于“CA”系統(tǒng). 因此,在面對海量數(shù)據(jù)時,將難以快速提升性能(數(shù)據(jù)量的增加要求有更高的分區(qū)容忍性,因數(shù)據(jù)一般以分區(qū)的形式存儲于DBMS中). 而大數(shù)據(jù)應(yīng)用的特點是查詢操作占絕大部分,可弱化數(shù)據(jù)一致性(即C)來提升性能,因此,“PA”系統(tǒng)更適合該類應(yīng)用場景. CPA定理盡管提出于多年以前,但經(jīng)歷過12 a的軟、硬件技術(shù)發(fā)展,Eric Brewer于2012年重新審視該定律時,認為其依然成立[4].
圖4 谷歌大數(shù)據(jù)架構(gòu)與Hadoop大數(shù)據(jù)架構(gòu)的聯(lián)系
互聯(lián)網(wǎng)行業(yè)廣泛采用大數(shù)據(jù)平臺架構(gòu)來解決大數(shù)據(jù)量環(huán)境下的數(shù)據(jù)計算問題. 2003年,谷歌發(fā)布了Google File System(GFS)的系統(tǒng)架構(gòu),提出了大數(shù)據(jù)和云計算環(huán)境下的高效數(shù)據(jù)存儲解決方案[5];2004年,谷歌發(fā)布了MapReduce編程模型,提出了分布式計算環(huán)境下的編程框架[6];2006年,谷歌發(fā)布了BigTable系統(tǒng),提出1種處理大數(shù)據(jù)的非關(guān)系型數(shù)據(jù)庫[7]. 這3個系統(tǒng)及對應(yīng)的3篇論文的發(fā)表,基本確定了現(xiàn)代大數(shù)據(jù)處理系統(tǒng)的基礎(chǔ)架構(gòu). 與谷歌公司的系統(tǒng)相對應(yīng),開源組織Apache 的Hadoop也提供了其開源解決方案. 二者對應(yīng)關(guān)系如圖4所示. 從近20 a的實際應(yīng)用效果來看,非常好地滿足了大數(shù)據(jù)環(huán)境下數(shù)據(jù)處理對性能、穩(wěn)定性和易用性的要求.
3.1.3 廣東省聯(lián)網(wǎng)中心大數(shù)據(jù)應(yīng)用的系統(tǒng)架構(gòu)介紹
廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺的大數(shù)據(jù)存儲和計算引擎是基于Apache Hadoop大數(shù)據(jù)框架系統(tǒng)構(gòu)建. 在基礎(chǔ)設(shè)施服務(wù)層(Infrastructure as a Service,IaaS),由超過100臺PC服務(wù)器,逾600核計算單元和2.4 TB內(nèi)存構(gòu)成,保證計算資源充足可用,成本可控. 在計算模型方面,支持MR、DAG、SQL和ML,既能滿足一般業(yè)務(wù)人員,以及熟悉SQL的工程師的需求,又能滿足新一代技術(shù)人員對DAG和ML的需求,保證技術(shù)友好性. 在集群類型方面,既支持基于分析集群的離線計算,又支持流式集群的實時計算,且能和聯(lián)網(wǎng)收費系統(tǒng)的數(shù)據(jù)傳輸通道無縫對接,保證了數(shù)據(jù)的實時性和完整性.
徐子沛[8]認為從Data.gov開展,面向數(shù)據(jù)領(lǐng)域的服務(wù)平臺逐漸成為大數(shù)據(jù)應(yīng)用行業(yè)的主流,這在一定程度上,是被近10 a證實了的預(yù)見. 國家《新一代人工智能發(fā)展規(guī)劃》中明確了重點工作是“圍繞增加人工智能創(chuàng)新的源頭供給,從前沿基礎(chǔ)理論、關(guān)鍵共性技術(shù)、基礎(chǔ)平臺、人才隊伍等方面強化部署……”[9],其實質(zhì),是把平臺作為理論、技術(shù)和人才隊伍的載體. 可見,一個良好的人工智能服務(wù)平臺是開展行業(yè)大數(shù)據(jù)應(yīng)用的支撐. 這里所說的人工智能服務(wù)平臺,是指集成了多種人工智能關(guān)鍵共性技術(shù)的操作系統(tǒng),各種人工智能計算能力通過服務(wù)的形式在平臺上提供,是“平臺即服務(wù)(Platform as a Service,PaaS)”的云計算服務(wù)模式在大數(shù)據(jù)與人工智能領(lǐng)域的具體實現(xiàn).
廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺基于互聯(lián)網(wǎng)行業(yè)成熟的大數(shù)據(jù)云平臺解決方案,構(gòu)建了涵蓋備數(shù)據(jù)匯聚、數(shù)據(jù)處理、基礎(chǔ)支撐、平臺管理、人工智能和大數(shù)據(jù)開發(fā)等支撐能力的服務(wù)平臺. 數(shù)據(jù)匯聚具備實時或離線從各種數(shù)據(jù)源采集數(shù)據(jù)的能力;數(shù)據(jù)處理具備實時計算和離線分析等數(shù)據(jù)加工能力;基礎(chǔ)支撐和平臺管理具備對各種數(shù)據(jù)業(yè)務(wù)的統(tǒng)一管理能力;人工智能和大數(shù)據(jù)開發(fā)提供對平臺匯聚的數(shù)據(jù)資源進行各類人工智能應(yīng)用研發(fā)的能力.
在大數(shù)據(jù)時代,數(shù)據(jù)的分析和整合才是最大的挑戰(zhàn). 在國家政策層面,交通運輸部于2019年發(fā)布的《推進綜合交通運輸大數(shù)據(jù)發(fā)展行動綱要(2020—2025年)》中,明確提出夯實大數(shù)據(jù)發(fā)展基礎(chǔ)的主要任務(wù)之一,是“完善信息資源目錄編制、采集、傳輸、交換共享等標(biāo)準(zhǔn)規(guī)范”. 信息資源目錄作為組織開展數(shù)據(jù)的分析和整合的基礎(chǔ)工作之一,可被視為工作的起點. 在行業(yè)技術(shù)層面,要讓計算機完成該項工作,就要讓其能理解數(shù)據(jù). 目前,行業(yè)普遍利用知識圖譜完成該項工作. 從狹義上理解,知識圖譜就是大規(guī)模的語義網(wǎng)絡(luò)(Semantic Web)[10]. 所謂“語義”,是指遵循1個統(tǒng)一的標(biāo)準(zhǔn),給每1片信息賦予1個計算機都能理解的“意義”則是“元數(shù)據(jù)”[8]. 對于語義網(wǎng)絡(luò),構(gòu)建實體(Entity)、概念(Concept)及其之間的各種語義關(guān)系,是一件關(guān)鍵、基礎(chǔ)且重要的工作.
廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺的建設(shè)團隊,從數(shù)據(jù)中臺技術(shù)建設(shè)開始,就同步開展數(shù)據(jù)資源目錄和元數(shù)據(jù)標(biāo)準(zhǔn)體系的編制工作. 到2020年6月,陸續(xù)發(fā)布了《廣東省聯(lián)網(wǎng)中心元數(shù)據(jù)標(biāo)準(zhǔn)》《廣東省聯(lián)網(wǎng)中心元數(shù)據(jù)目錄》《廣東省聯(lián)網(wǎng)中心元數(shù)據(jù)管理制度》,并初步構(gòu)建了元數(shù)據(jù)目錄管理系統(tǒng),實現(xiàn)元數(shù)據(jù)的查詢和維護. 事實證明,此項工作是后續(xù)開展數(shù)據(jù)治理、數(shù)據(jù)研發(fā)利用和數(shù)據(jù)安全管理的基礎(chǔ),所以,可被稱為廣東省聯(lián)網(wǎng)中心開展行業(yè)大數(shù)據(jù)應(yīng)用的起點.
2020年3月30日中共中央、國務(wù)院《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》中,明確將數(shù)據(jù)作為一種新型生產(chǎn)要素. 為保證新型生產(chǎn)要素能充分釋放其價值,全國人大于2021年6月10日通過《中華人民共和國數(shù)據(jù)安全法》,將于2021年9月1日起施行,于2021年8月20日通過《中華人民共和國個人信息保護法》,將于2021年11月1日是起施行. 上述法律的陸續(xù)出臺,對行業(yè)大數(shù)據(jù)應(yīng)用在安全方面提出了更嚴(yán)格的要求.
廣東省聯(lián)網(wǎng)中心在開展大數(shù)據(jù)應(yīng)用時,充分考慮到數(shù)據(jù)安全對整個開發(fā)應(yīng)用鏈條的重要性. 從一開始,廣東省聯(lián)網(wǎng)中心就為數(shù)據(jù)的開發(fā)利用,在組織內(nèi)部發(fā)布了一系列的制度規(guī)范,包括《數(shù)據(jù)分類分級保護制度》《數(shù)據(jù)資源開發(fā)利用管理制度》《數(shù)據(jù)安全服務(wù)與運營制度》等,對數(shù)據(jù)的收集、存儲、使用、加工、傳輸、提供等工作中的人與行為進行了規(guī)范,為大數(shù)據(jù)應(yīng)用提供了重要保障.
為提高廣東省防疫抗疫工作的科學(xué)性、精準(zhǔn)性和實時性,廣東省聯(lián)網(wǎng)中心基于數(shù)據(jù)中臺,充分發(fā)揮大數(shù)據(jù)優(yōu)勢,為廣東省應(yīng)急廳、公安廳、交通運輸廳、各地市交通局提供了多項“云戰(zhàn)疫”交通大數(shù)據(jù)服務(wù),建立起集防控圍欄標(biāo)定、數(shù)據(jù)融合處理、信息精準(zhǔn)推送等全流程功能為一體的精準(zhǔn)防疫數(shù)據(jù)服務(wù),實現(xiàn)廣東省高速公路防疫工作的信息化和系統(tǒng)化,實現(xiàn)全天候監(jiān)測分析離(入)粵涉疫車輛,為疫情流調(diào)溯源工作提供了精準(zhǔn)的高速公路通行數(shù)據(jù)支撐,為科學(xué)精準(zhǔn)防疫發(fā)揮了重要作用.
該服務(wù)基于廣東省聯(lián)網(wǎng)中心數(shù)據(jù)中臺的流式集群構(gòu)建,通過對目標(biāo)車輛在高速公路的通行流水進行實時流式處理,實現(xiàn)對符合監(jiān)控要求的車輛通行信息進行甄別、轉(zhuǎn)換、業(yè)務(wù)處理和按需推送等操作,從而實現(xiàn)向有關(guān)部門的監(jiān)控系統(tǒng)提供實時數(shù)據(jù)服務(wù). 系統(tǒng)的框架如圖5所示.
圖5 廣東省聯(lián)網(wǎng)中心防疫數(shù)據(jù)服務(wù)系統(tǒng)架構(gòu)示意圖
從2020年初,廣東省聯(lián)網(wǎng)中心就持續(xù)向相關(guān)部門提供該數(shù)據(jù)服務(wù). 如,武漢疫情期間,我們克服“點亮費顯”工程正在如火如荼開展的困難,提供了鄂車入粵、經(jīng)鄂入粵、粵車往鄂返粵、鄂籍車主返程等多項防疫數(shù)據(jù)服務(wù). 香港疫情期間,我們針對港牌車進入服務(wù)區(qū)的情況提供數(shù)據(jù)預(yù)警,支撐服務(wù)區(qū)管理人員引導(dǎo)港牌車輛進入專門的隔離區(qū)域停放和休整. 廣州疫情期間,我們實現(xiàn)從廣州市和佛山市的高速公路入口進入高速公路的車輛信息在其行駛至省界前3個門架時實時向檢查站推送車輛相關(guān)信息,為檢查站精準(zhǔn)甄別疫區(qū)出省車輛提供數(shù)據(jù)支撐,同時,還實現(xiàn)了車輛離開廣州區(qū)域時向車主發(fā)送“出省需有48 h內(nèi)核酸陰性證明”的提示短信,提高了相關(guān)防疫政策的精準(zhǔn)觸達率.
為提高高速公路管理水平,發(fā)揮現(xiàn)有交通資源的優(yōu)勢,在一定程度上緩解高速公路擁堵狀況,廣東省聯(lián)網(wǎng)中心基于數(shù)據(jù)中臺,充分發(fā)揮大數(shù)據(jù)的優(yōu)勢,建立了全省各路段的車流量預(yù)測模型,為路段業(yè)主緩解交通擁堵提供了1種除道路改擴建外的有效途徑.
該預(yù)測模型通過建立一套包括長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)和生成對抗網(wǎng)絡(luò)(GAN),對實時輸入的全省車流量信息未來2 h內(nèi)每5、15、30 min等時間粒度車流量數(shù)據(jù)進行滾動預(yù)測,其加權(quán)平均準(zhǔn)確率達到95%.
圖6和圖7顯示了廣東省某一收費單元車流量預(yù)測值和實際值的回歸驗證結(jié)果. 可看到,圖中的虛線(即預(yù)測值)與實線(即實際值)具有很高的吻合程度. 同時,可留意到,在實線框框出的一組數(shù)據(jù)中,實際值出現(xiàn)了之前從未有過的車流量態(tài)勢,而預(yù)測值也能很好地預(yù)測出這一態(tài)勢.
圖6 廣東省聯(lián)網(wǎng)中心某收費單元車流量回歸驗證示意圖(1)
圖7 廣東省聯(lián)網(wǎng)中心某收費單位車流量回歸驗證示意圖(2)
為提高對非法運營車輛和運營行為的打擊效率,提升執(zhí)法人員的精準(zhǔn)布控水平,廣東省聯(lián)網(wǎng)中心基于數(shù)據(jù)中臺,充分分揮大數(shù)據(jù)的優(yōu)勢,為廣東省交通運輸廳執(zhí)法部門建立了高速公路非法運營車輛通行特征識別系統(tǒng).
該系統(tǒng)利用決策樹算法建立起非法營運車輛通行行為的特征規(guī)則,并利用歷史執(zhí)法樣本建立起基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的識別算法. 這樣做的目的,一是建立起一套可解釋的執(zhí)法規(guī)則解釋機制,二是建立起符合此規(guī)則的更高效的行為識別系統(tǒng),實現(xiàn)了執(zhí)法知識與經(jīng)驗到系統(tǒng)能力的轉(zhuǎn)變.
在2021年下半年的實際應(yīng)用中,此算法共識別出了1 500多輛非法營運車輛,后續(xù)通過執(zhí)法結(jié)果驗證,識別準(zhǔn)確率達到85%. 從2021年10月起,廣東省相關(guān)執(zhí)法部門開展的高速公路出入口秩序集中整治行動中,根據(jù)系統(tǒng)產(chǎn)生的執(zhí)法線索進行精準(zhǔn)執(zhí)法,僅一天晚上就成功查處超過30臺違法車輛,相關(guān)成效將在應(yīng)用過程中逐步展現(xiàn).
從國家一系列政策和法律法規(guī)的出臺,到各地的實踐性應(yīng)用情況都表明,交通大數(shù)據(jù)與人工智能應(yīng)用正處于快速發(fā)展階段. 廣東省聯(lián)網(wǎng)中心的研究與實踐結(jié)果表明,利用合理的大數(shù)據(jù)系統(tǒng)架構(gòu),通過將高速公路聯(lián)網(wǎng)收費行業(yè)的數(shù)據(jù)資源與大數(shù)據(jù)和人工智能算法技術(shù)進行跨界融合,能賦能各級主管部門,在精準(zhǔn)防疫、實時車流分析與預(yù)測、高速精準(zhǔn)執(zhí)法等方面發(fā)揮實際作用,能助力高速公路營運機構(gòu)落實創(chuàng)新驅(qū)動、提升管理水平. 在大數(shù)據(jù)與人工智能發(fā)展的熱潮中,高速公路行業(yè)的數(shù)字化轉(zhuǎn)型一定能發(fā)揮更大的增值應(yīng)用價值.