方旭 朱敏 王保琴 肖春霞
摘要:有效使用車聯(lián)網(wǎng)和數(shù)據(jù)挖掘技術(shù),可以使軍隊車輛在日常行駛時更加規(guī)范、安全。本文從車聯(lián)網(wǎng)與數(shù)據(jù)挖掘技術(shù)、技術(shù)應(yīng)用的指導(dǎo)意義、數(shù)據(jù)挖掘技術(shù)在軍車使用情況判定中的應(yīng)用等方面進行分析,對軍隊正規(guī)化管理和使用軍車具有借鑒作用。
關(guān)鍵詞:車聯(lián)網(wǎng);數(shù)據(jù)挖掘;軍隊車輛
0引言
當(dāng)前,隨著經(jīng)濟的發(fā)展和汽車保有量的迅速增加,隨之而來的道路安全和擁堵問題日益突出。為此許多國家和地區(qū)都在大力發(fā)展智能交通系統(tǒng)和智能汽車技術(shù)應(yīng)對上述問題。在遵循軍隊相關(guān)車輛規(guī)定的基礎(chǔ)上,通過車聯(lián)網(wǎng)和數(shù)據(jù)挖掘技術(shù)的應(yīng)用,對駕駛員的習(xí)慣進行規(guī)范,從而使軍隊車輛在執(zhí)行部隊公務(wù)和重大演習(xí)活動時更加安全地行駛,最終圓滿完成保障任務(wù),對相關(guān)職能部門來說具有很強的指導(dǎo)和借鑒作用。
1車聯(lián)網(wǎng)與數(shù)據(jù)挖掘技術(shù)
1.1車聯(lián)網(wǎng)
車聯(lián)網(wǎng)是指利用通信、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等技術(shù)將各種車輛進行聯(lián)網(wǎng)進而展開各種綜合廣泛應(yīng)用,包括智能交通、汽車互聯(lián)網(wǎng)及其應(yīng)用、汽車通信網(wǎng)及其應(yīng)用等。采用各種技術(shù)手段將車與車、車與人進行連接是其技術(shù)存在形式,在此基礎(chǔ)上發(fā)展形成的各種產(chǎn)品與服務(wù)是車聯(lián)網(wǎng)的核心。
歐美等汽車工業(yè)比較發(fā)達的國家,無論是在整體規(guī)劃還是在技術(shù)開發(fā)和應(yīng)用方面,都引領(lǐng)著全球車聯(lián)網(wǎng)技術(shù)的發(fā)展,并取得了顯著的成績。2009年12月,美國交通部發(fā)布了《職能交通系統(tǒng)戰(zhàn)略研究計劃:2010-2014》,首次提出了車聯(lián)網(wǎng)的構(gòu)想;2014年美國國家高速公路安全管理局發(fā)布兩份文件,就車隊車技術(shù)標(biāo)準(zhǔn)對外征求意見,并促請立法。我國車聯(lián)網(wǎng)已被列入重大專項,稱為十二五期間的重點項目,獲百億元支持,而國家對車聯(lián)網(wǎng)行業(yè)規(guī)范也逐漸重視起來,政府在產(chǎn)業(yè)規(guī)劃、技術(shù)標(biāo)準(zhǔn)等多方面的支持將大大推進汽車物聯(lián)網(wǎng)長夜全面鋪開和提速。
車聯(lián)網(wǎng)系統(tǒng)有三個要素,第一個要素是“端”,即車載終端上的RFID、雷達、攝像頭等傳感器,其作用是采集車輛信息和感知當(dāng)前車輛行駛狀態(tài),并能與人和車進行交互,提供最直接的用戶體驗。第二個要素是“管”,即實現(xiàn)融合通信和接入互聯(lián)網(wǎng)的能力,主要是把“端”采集和感知的人與車、車與車、車與路等信息接入網(wǎng)絡(luò)和互聯(lián)互通。第三個要素是“云”,即負(fù)責(zé)監(jiān)聽“端”和“管”發(fā)來的連接請求,提供高效、穩(wěn)定的數(shù)據(jù)存儲、處理、分析,最終為交通參與者提供服務(wù)。
1.2數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程,其定義是從海量數(shù)據(jù)中找到有意義的模式或知識,作為計算機科學(xué)的一個學(xué)術(shù)領(lǐng)域,基于數(shù)據(jù)庫理論,機器學(xué)習(xí),人工智能,現(xiàn)代統(tǒng)計學(xué)的迅速發(fā)展的交叉學(xué)科,在很多領(lǐng)域中都有應(yīng)用。涉及到很多的算法,源于機器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),決策樹,也有基于統(tǒng)計學(xué)習(xí)理論的支持向量機,分類回歸樹,和關(guān)聯(lián)分析的諸多算法。
CRISP-DM(cross-industry standard process for data mining),即為”跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程”,提供了一個數(shù)據(jù)挖掘生命周期的全面評述,包括項目的相應(yīng)周期,它們的各自任務(wù)和這些任務(wù)的關(guān)系。所有數(shù)據(jù)挖掘任務(wù)之間關(guān)系的存在是依賴用戶的目的、背景和興趣,最重要的還有數(shù)據(jù)。它為一個KDD工程提供了一個完整的過程描述。該模型將一個KDD工程分為6個不同的,但順序并非完全不變的階段,所示如圖1。
(1)商業(yè)理解、數(shù)據(jù)理解和數(shù)據(jù)準(zhǔn)備是數(shù)據(jù)挖掘的第一個大的步驟,其中商業(yè)理解要求在理解項目目標(biāo)和從業(yè)務(wù)的角度理解需求,同時將這個知識轉(zhuǎn)化為數(shù)據(jù)挖掘問題的定義和完成目標(biāo)的初步計劃。數(shù)據(jù)理解階段從初始的數(shù)據(jù)收集開始,通過一些活動的處理,熟悉數(shù)據(jù),識別數(shù)據(jù)的質(zhì)量問題,首次發(fā)現(xiàn)數(shù)據(jù)的內(nèi)部屬性,或是探測引起興趣的子集去形成隱含信息的假設(shè)。數(shù)據(jù)準(zhǔn)備是數(shù)據(jù)挖掘前期一個非常重要的步驟,數(shù)據(jù)準(zhǔn)備的好壞直接影響了數(shù)據(jù)挖掘的效率和準(zhǔn)確度以及最終模型的有效性。數(shù)據(jù)準(zhǔn)備階段包括從未處理數(shù)據(jù)中構(gòu)造最終數(shù)據(jù)集的所有活動。這些數(shù)據(jù)將是模型工具的輸入值。
(2)建模是數(shù)據(jù)挖掘最為核心的步驟,在這個階段,可以選擇不同的模型技術(shù),模型參數(shù)被調(diào)整到最佳的數(shù)值。一般,有些技術(shù)可以解決一類相同的數(shù)據(jù)挖掘問題。目前常用的技術(shù)有:關(guān)聯(lián)規(guī)則、決策樹、分類、聚類、粗糙集、神經(jīng)網(wǎng)絡(luò)、遺傳算法等。
(3)評價階段是在開始最后部署之前,檢查構(gòu)造模型的步驟,確保模型可以完成業(yè)務(wù)目標(biāo)。這個階段的關(guān)鍵目的是確定是否有重要業(yè)務(wù)問題沒有被充分的考慮。在這個階段結(jié)束后,一個數(shù)據(jù)挖掘結(jié)果使用的決定必須達成。
(4)最后是部署階段。通常,模型的創(chuàng)建不是項目的結(jié)束。模型的作用是從數(shù)據(jù)中找到知識,獲得的知識需要便于用戶使用的方式重新組織和展現(xiàn)。根據(jù)需求,這個階段可以產(chǎn)生簡單的報告,或是實現(xiàn)一個比較復(fù)雜的、可重復(fù)的數(shù)據(jù)挖掘過程。在很多案例中,這個階段是由客戶而不是數(shù)據(jù)分析人員承擔(dān)部署的工作。
2技術(shù)應(yīng)用的指導(dǎo)意義
隨著北斗系統(tǒng)的裝配和相關(guān)用車規(guī)章制度的不斷健全,軍隊特種車輛和軍隊公務(wù)用車的車輛派遣、調(diào)度、行駛路線、車輛狀況、道路實時路況和對駕駛員能力的考核等日趨規(guī)范。但從實際來看,車輛行駛過程中還會遇到很多復(fù)雜情況,比如我院(文中出現(xiàn)的“我院”、“學(xué)院”等均指中國人民解放軍重慶通信學(xué)院)位于歌樂山腹地,山路窄、陡坡多、坡度大、人流量復(fù)雜,加之重慶地區(qū)城市道路較為擁堵,部分私家車、出租車、大貨車、行人不遵守交通規(guī)則等等,駕駛員即使駕駛水平再高,如果駕駛行為習(xí)慣和心態(tài)不好,極有可能在執(zhí)行駕駛?cè)蝿?wù)時出現(xiàn)行車危險并大幅縮短軍車使用壽命。
數(shù)據(jù)挖掘技術(shù)可以通過挖掘研究對象的個體特征,發(fā)現(xiàn)研究群體的發(fā)展變化趨勢,發(fā)現(xiàn)具有不同特征的數(shù)據(jù)子集之間的關(guān)聯(lián),最終實現(xiàn)科學(xué)預(yù)測未來某種事件發(fā)生的概率?;谲嚶?lián)網(wǎng)進行科學(xué)采集和分析數(shù)據(jù)是提供數(shù)據(jù)和預(yù)測依據(jù)、改進駕駛員日常駕駛習(xí)慣的堅實基礎(chǔ),而改進駕駛習(xí)慣首先要找出問題所在。通過深入分析挖掘駕駛習(xí)慣信息,有針對性地設(shè)計“軍車使用情況評定”是駕駛員改正不良駕駛習(xí)慣的重要途徑,是保證軍隊車輛安全使用、安全出行的有效辦法。
3數(shù)據(jù)挖掘技術(shù)在軍車使用情況判定中的應(yīng)用
目前,基于駕駛行為的車險(UBI)正在逐步取代傳統(tǒng)車險。美國、歐洲、日本等國的多家保險公司通過駕駛員的智能手機中的傳感器或者車載設(shè)備(如OBD)上傳的數(shù)據(jù)來評測駕駛員的駕駛行為,進行風(fēng)險評估,以此來判定保險費用。對駕駛習(xí)慣良好的車主給予一定的保費優(yōu)惠或折扣,而另一部分經(jīng)常違章、暴力駕駛等駕駛行為不良的車主,其潛在行車風(fēng)險大,理賠成本高,需繳納的保費高。車輛行駛過程中,車載設(shè)備時時刻刻采集車輛的位置信息、車況和行車信息并上傳到云端,產(chǎn)生的數(shù)據(jù)量相當(dāng)龐大,且數(shù)據(jù)類型復(fù)雜。云平臺接收客戶端發(fā)來的數(shù)據(jù)請求,展開數(shù)據(jù)挖掘。通過對這些大數(shù)據(jù)進行挖掘和分析,準(zhǔn)確地獲取評估車輛狀況、駕駛行為,劃分車主的風(fēng)險類別,從而給決策者提供有價值的信息。
本文借鑒UBI的成功經(jīng)驗,以模擬學(xué)院軍隊車輛日常使用產(chǎn)生的數(shù)據(jù)為樣本,利用數(shù)據(jù)挖掘技術(shù)中的決策樹算法來挖掘軍車日常使用情況(文中出現(xiàn)的車牌、駕駛員姓名等一切數(shù)據(jù)信息均僅為測試使用)。根據(jù)車輛行駛時駕駛員容易出現(xiàn)的不良駕駛行為,重點對超速、激烈駕駛(急加速、急轉(zhuǎn)彎、急剎車)、闖黃燈、壓實線、變道轉(zhuǎn)彎不打轉(zhuǎn)向燈、不合理使用遠(yuǎn)光燈等情況進行權(quán)重預(yù)處理,然后建立合適的數(shù)據(jù)模型進行決策樹算法分析。決策樹模型如圖2所示。
大部分專業(yè)駕駛員的素質(zhì)和駕駛技術(shù)都是過硬的,主要是找出行車過程中幾類不太重視或習(xí)以為常的危險不良習(xí)慣,進行有針對性的改進,從而提高行車安全性。本算法主要目的是區(qū)分出駕駛員某些習(xí)慣的好壞及嚴(yán)重程度。根據(jù)預(yù)處理好的樣本數(shù)據(jù)進行計算,結(jié)果如圖3所示。我們把分析好的結(jié)果以表格形式展示,以便管理者直觀地參考、使用。
4總結(jié)
將數(shù)據(jù)挖掘技術(shù)應(yīng)用到軍車使用情況評定中,對車聯(lián)網(wǎng)捕捉和記錄的海量數(shù)據(jù)進行處理、分析;結(jié)合軍隊實際情況,運用了決策樹算法,尋找和發(fā)現(xiàn)出可能造成行車危險和大幅縮短軍車使用壽命的不良駕駛習(xí)慣,做出價值判斷和決策,從而達到規(guī)范行車習(xí)慣、保障出行安全、愛護公務(wù)用車的目的。endprint