隨著汽車(chē)朝著智能化的方向進(jìn)行發(fā)展,大數(shù)據(jù)分析技術(shù)在汽車(chē)領(lǐng)域的應(yīng)用也越來(lái)越普遍。本文介紹幾種大數(shù)據(jù)在汽車(chē)相關(guān)方面的應(yīng)用。
通過(guò)無(wú)線連接的汽車(chē)數(shù)據(jù)傳輸通信技術(shù),能夠支持車(chē)載遠(yuǎn)程信息技術(shù)服務(wù)。該項(xiàng)技術(shù)能夠在合理的時(shí)間范圍內(nèi)有效處理大量的控制器區(qū)域網(wǎng)絡(luò)(CAN)總線數(shù)據(jù)。這些數(shù)據(jù)對(duì)于很多聯(lián)網(wǎng)汽車(chē)的應(yīng)用程序來(lái)說(shuō)是必不可少的,因此通過(guò)Hadoop框架查詢和提取有用信息將有助于提高安全性和駕駛性能體驗(yàn)。通過(guò)實(shí)施分布式計(jì)算系統(tǒng)模式分析CAN總線數(shù)據(jù),產(chǎn)生托管在云里的有效數(shù)據(jù)。此外,利用一個(gè)移動(dòng)應(yīng)用服務(wù)程序?qū)偩€數(shù)據(jù)進(jìn)行收集和傳輸,并將數(shù)據(jù)傳輸?shù)竭h(yuǎn)程數(shù)據(jù)中心。目前遠(yuǎn)程數(shù)據(jù)中心包括應(yīng)用服務(wù)器和Hadoop生態(tài)系統(tǒng)蜂窩數(shù)據(jù)倉(cāng)庫(kù)。通過(guò)實(shí)驗(yàn)進(jìn)一步表明,相對(duì)于統(tǒng)計(jì)分析系統(tǒng)(SAS)框架和HiveQL聲明性語(yǔ)言,MapReduce連接算法是高度可伸縮的,并針對(duì)分布式模式進(jìn)行了優(yōu)化計(jì)算。
車(chē)輛數(shù)據(jù)的收集與分析可以讓對(duì)汽車(chē)生態(tài)系統(tǒng)感興趣的汽車(chē)制造商、汽車(chē)維修商、道路和運(yùn)輸部們對(duì)服務(wù)機(jī)構(gòu)進(jìn)行支持。這些都會(huì)提高汽車(chē)的安全駕駛性能,但車(chē)主訂閱了這項(xiàng)服務(wù),也許將產(chǎn)生一定的費(fèi)用。
Figure 4.Processing vehicle’s engine data using Hadoop and MapReduce based on the proposed Monitoring and Analytics framework.
隨著Hadoop平臺(tái)項(xiàng)目的開(kāi)發(fā),使用Hadoop集成的開(kāi)源軟件,構(gòu)建大數(shù)據(jù)解決方案是目前來(lái)看是可以實(shí)現(xiàn)的。在這篇文章中,基于大數(shù)據(jù)技術(shù),作者創(chuàng)建了一個(gè)監(jiān)視和分析框架,通過(guò)Hadoop處理汽車(chē)相關(guān)數(shù)據(jù),例如處理發(fā)動(dòng)機(jī)數(shù)據(jù)(見(jiàn)文中Figure 4),實(shí)現(xiàn)處理結(jié)果有效。對(duì)汽車(chē)制造商、運(yùn)輸、緊急服務(wù)等第三方服務(wù),允許通過(guò)網(wǎng)絡(luò)訪問(wèn)有用的信息。使用MapRe?duce編程模型和Apache蜂巢與SAS程序。未來(lái)的研究重點(diǎn)將集中在評(píng)價(jià)遠(yuǎn)程車(chē)輛的性能,診斷遠(yuǎn)程車(chē)輛以及特定的聯(lián)網(wǎng)汽車(chē)應(yīng)用程序等方面。
互聯(lián)智能汽車(chē)的連通性可以概括為車(chē)輛到車(chē)輛(V2V)、車(chē)輛到基礎(chǔ)設(shè)施(V2I)和車(chē)輛到一切(V2X)三個(gè)方面提供。V2X的整體概念是在車(chē)輛和所有其他實(shí)體之間進(jìn)行通信,包括行人和移動(dòng)設(shè)備等,V2X涵蓋了智能汽車(chē)連通性的廣泛方面,由于IEEE 802.11p和DSRC的短距離連接的限制性,促使研究人員探索新的通信技術(shù)。據(jù)作者經(jīng)驗(yàn),最快的無(wú)線網(wǎng)絡(luò)是LTEAdvanced(LTE-A),5G網(wǎng)絡(luò)是一個(gè)全球正在進(jìn)行的研究領(lǐng)域。此外,預(yù)計(jì)5G技術(shù)將為車(chē)輛智能連接帶來(lái)新的功能寬帶,包括超低延遲和無(wú)限連接。作者提出了互聯(lián)系統(tǒng)架構(gòu)和設(shè)計(jì)方案(文中Figure 4),這為大數(shù)據(jù)分析提供了基礎(chǔ)。通過(guò)eNB實(shí)現(xiàn)V2V和V2I,再經(jīng)過(guò)LTE EPC與另一eNB連通實(shí)現(xiàn)V2X,包括V2P、V2D、V2H。其中演進(jìn)分組核心(EPC)是一種向4G LTE網(wǎng)絡(luò)提供數(shù)據(jù)和融合語(yǔ)音的框架,eNB是實(shí)現(xiàn)與移動(dòng)設(shè)備通訊的基站,RSU是實(shí)現(xiàn)與車(chē)連通的路邊裝置。
NREL的研究人員使用一組8個(gè)指標(biāo)來(lái)描述每一個(gè)驅(qū)動(dòng)循環(huán),通過(guò)聚類分析,主要成分分析(PCA)和交叉相關(guān)分析,用來(lái)確定其中的哪8個(gè)指標(biāo)提供了最多的信息支持細(xì)分車(chē)輛驅(qū)動(dòng)模式。集群分析被用來(lái)確定車(chē)輛行駛的最優(yōu)分組周期指標(biāo)。最后,重新抽樣方案是研究了樣本偏差對(duì)其可能產(chǎn)生的影響,車(chē)隊(duì)DNA數(shù)據(jù)建立在結(jié)果分割的基礎(chǔ)上。在這個(gè)分析中,NREL每天使用從913輛車(chē)中的16,250個(gè)驅(qū)動(dòng)循環(huán)。在這些車(chē)輛中,108(5 071個(gè)周期)是有臥鋪的長(zhǎng)途卡車(chē),754(10 765)如文中FIGURE 1所示的職業(yè)車(chē)輛。也包含了在數(shù)據(jù)庫(kù)中有51輛車(chē)(414個(gè)周期)被分類為未知職業(yè),但擁有驅(qū)動(dòng)循環(huán)數(shù)據(jù)。
FIGURE 1 Sample composition
在這項(xiàng)研究中,車(chē)隊(duì)DNA數(shù)據(jù)庫(kù)繼續(xù)進(jìn)行生長(zhǎng)。執(zhí)行分析,為了支持未來(lái)的分析,已經(jīng)開(kāi)始開(kāi)發(fā)在車(chē)隊(duì)DNA大數(shù)據(jù)應(yīng)用程序編程接口中,它提供了簡(jiǎn)化的存儲(chǔ)、聚合和分析,使用行業(yè)標(biāo)準(zhǔn)大數(shù)據(jù)框架的函數(shù),利用分布式處理庫(kù)Spark和Hadoop分布flesystem。研究展示了一種新的分析方法驅(qū)動(dòng)循環(huán)動(dòng)力學(xué)的結(jié)構(gòu)和模式。因此,利用了一個(gè)可擴(kuò)展的數(shù)據(jù)框架和一個(gè)大的以及不同的數(shù)據(jù)集,913個(gè)獨(dú)特的商業(yè)車(chē)輛的驅(qū)動(dòng)循環(huán)數(shù)據(jù),包括16,250天的操作。作者的方法利用聚合特征提取、k-medoid聚類、以及NREL驅(qū)動(dòng)工具來(lái)實(shí)現(xiàn)基本模式在這個(gè)群體的駕駛特性中車(chē)輛。結(jié)果描述了代表性的驅(qū)動(dòng)周期在兩個(gè)(或三個(gè))的職業(yè)車(chē)輛中。
考慮到有效的動(dòng)力系統(tǒng)控制和實(shí)施駕駛輔助功能,司機(jī)的駕駛行為及駕駛特性的影響起著越來(lái)越大的作用。面對(duì)一個(gè)廣泛的駕駛特性,現(xiàn)代智能汽車(chē)必須能夠在各種情況下做出正確回應(yīng),駕駛模式不僅依賴于司機(jī)的駕駛行為,同時(shí)和道路特征、環(huán)境邊界條件和其他方面有很強(qiáng)的關(guān)系。駕駛模式主要受交通信號(hào)燈控制的樞紐密度、速度限制、街道功能和類型等控制。因此,為了全面分析某駕駛員的駕駛模式,盡可能的考慮駕駛情況是非常必要的。現(xiàn)如今,在考慮駕駛情況和環(huán)境邊界條件下,有效的大數(shù)據(jù)技術(shù)可以用來(lái)支撐駕駛模式的調(diào)查研究。
在考慮驅(qū)動(dòng)模式相關(guān)參數(shù)如加速度等額外因素的驅(qū)動(dòng)模式下,提出了一種用于集群和評(píng)估的方法。在所引入的計(jì)算方法的第一步驟中,對(duì)所涉及的車(chē)輛的訪問(wèn)數(shù)據(jù)進(jìn)行收集,并對(duì)每隔一公里的驅(qū)動(dòng)段進(jìn)行分段。這些信息包括車(chē)輛行駛路程、行駛速度、加速度以及汽車(chē)所處的經(jīng)緯度。第二步,基于駕駛段,建立反應(yīng)駕駛環(huán)境的初始特征矩陣。隨后,為了減少計(jì)算的復(fù)雜度,在這個(gè)初始特征矩陣上進(jìn)行主要成分分析,從而減少矩陣的維數(shù)。第三步,通過(guò)K值平均算法將駕駛環(huán)境分成三個(gè)類別,分別是山地路形、曲折路形、以及平坦路形。最后,將加速度、減速度的標(biāo)準(zhǔn)偏差對(duì)當(dāng)前汽車(chē)所處的駕駛模式進(jìn)行區(qū)分。標(biāo)準(zhǔn)偏差用于將集群驅(qū)動(dòng)模式分為三個(gè)集群(例如,平靜、標(biāo)準(zhǔn)和侵略性等三個(gè)模式)。
研究結(jié)果表明,駕駛環(huán)境受到許多變量的影響。描述司機(jī)和車(chē)輛的周邊環(huán)境包括道路等級(jí)、交通狀況和司機(jī)的行為本身。根據(jù)駕駛環(huán)境的不同類型和特點(diǎn),駕駛模式“數(shù)值解”也非常多樣化。駕駛情況信息以及駕駛驅(qū)動(dòng)模式有助于動(dòng)力總成優(yōu)化和控制策略的制定,并能夠向高級(jí)驅(qū)動(dòng)程序控制輔助系統(tǒng)提供更多的更準(zhǔn)確的反饋信息。此外,這些信息還可以支持車(chē)輛的安全處理和控制。通過(guò)這種引入的方法提供一組精確的識(shí)別駕駛的客觀標(biāo)簽?zāi)J?,支持未?lái)智能汽車(chē)的發(fā)展和控制。
把汽車(chē)周?chē)h(huán)境中可用的各種數(shù)據(jù)源作為輸入,以預(yù)測(cè)駕駛員的意圖和行為。作為調(diào)查這些潛在的數(shù)據(jù)源的一部分,作者進(jìn)行了大量的電子日歷上的實(shí)驗(yàn),并回顧了一些可用的地理參考系統(tǒng)。通過(guò)統(tǒng)計(jì)分析,計(jì)算位置識(shí)別精度結(jié)果,探討了日歷位置數(shù)據(jù)的潛在利用率來(lái)檢測(cè)駕駛員意圖。為了利用在現(xiàn)代車(chē)輛中可用的多種多樣的數(shù)據(jù)輸入,提出了一種新的模糊計(jì)算建模方法。因?yàn)榇髷?shù)據(jù)和物聯(lián)網(wǎng)的優(yōu)勢(shì),開(kāi)發(fā)利用智能系統(tǒng)和計(jì)算技術(shù)的需求越來(lái)越大,這可以降低復(fù)雜性以及在獲取和處理大量的信息方面的認(rèn)知負(fù)擔(dān)。研究結(jié)構(gòu)如下:
第一步,識(shí)別各種信號(hào)和輸入,這些信號(hào)和輸入可以被計(jì)算機(jī)系統(tǒng)利用,以便自動(dòng)識(shí)別駕駛員的意圖和行為。
第二步,詳細(xì)地研究了這些數(shù)據(jù)源中的一個(gè)。使用多個(gè)統(tǒng)計(jì)度量,借助于分類性能分析,研究利用電子日歷和地理位置信息來(lái)識(shí)別駕駛員的位置的潛力。通過(guò)這一分析,以揭示司機(jī)的意圖旅行到某些目的地。
第三步,提出了一種新的模糊計(jì)算建模方法,應(yīng)對(duì)和處理來(lái)自多個(gè)和多種數(shù)據(jù)源的大量數(shù)據(jù)。研究了在新興的大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)革命的范圍內(nèi)預(yù)測(cè)駕駛員意圖和行為。
這項(xiàng)研究可以通過(guò)技術(shù)增強(qiáng)和相互關(guān)聯(lián)的環(huán)境來(lái)實(shí)現(xiàn),無(wú)論是在現(xiàn)代車(chē)輛內(nèi)部還是外部,都提供了包含大量信息的多個(gè)數(shù)據(jù)源。確定并突出數(shù)據(jù)源,重點(diǎn)在預(yù)測(cè)駕駛員的預(yù)期目的地、行為、情感/認(rèn)知狀態(tài)和偏好的領(lǐng)域。其中的研究范圍之一是探索不同輸入源的利用潛力。
為了實(shí)現(xiàn)這一目標(biāo),詳細(xì)調(diào)查了其中一個(gè)來(lái)源,即電子日歷,電子日歷作為數(shù)據(jù)源來(lái)探索,這有助于預(yù)測(cè)駕駛員的下一個(gè)目的地。為了實(shí)現(xiàn)這一目標(biāo),分析了來(lái)自美洲虎路虎員工使用的群件日歷的數(shù)據(jù),這些數(shù)據(jù)提供了關(guān)于一般電子日歷使用的一些有趣的統(tǒng)計(jì)事實(shí)。還研究了準(zhǔn)確地識(shí)別地理位置的潛力,借助于詞匯來(lái)描述從電子日歷條目中獲取的事件的位置??偨Y(jié)這些結(jié)果,可以得出結(jié)論,利用電子日歷信息可以提高預(yù)測(cè)駕駛員下一個(gè)目的地的準(zhǔn)確性,實(shí)驗(yàn)的數(shù)據(jù)融合成功率保持在92%以上。
為增強(qiáng)預(yù)測(cè)駕駛員意圖和偏好的能力,提出了一個(gè)最先進(jìn)的模糊計(jì)算模型。其目的是整合多個(gè)數(shù)據(jù)源,如電子日歷數(shù)據(jù),并利用現(xiàn)代連通性增加的優(yōu)點(diǎn),使車(chē)輛能夠訪問(wèn)豐富的信息源,如社交網(wǎng)絡(luò)、其他智能車(chē)等。所提出的框架有可能導(dǎo)致對(duì)社會(huì)、經(jīng)濟(jì)和個(gè)體駕駛員產(chǎn)生重大影響。這可以通過(guò)開(kāi)發(fā)應(yīng)用程序來(lái)實(shí)現(xiàn),該應(yīng)用程序(流程圖見(jiàn)文中Fig.2)利用預(yù)測(cè)的駕駛員意圖、特征,現(xiàn)代車(chē)輛的性能和汽車(chē)的能力與其他外部、數(shù)字實(shí)體通信。這些應(yīng)用有望改變駕駛員與車(chē)輛交互的方式,優(yōu)化車(chē)輛的整體性能,甚至有助于改善交通管理和智能城市內(nèi)的能源資源。這些功能可以通過(guò)先發(fā)制人的衛(wèi)星導(dǎo)航系統(tǒng)來(lái)實(shí)現(xiàn)?;旌蟿?dòng)力車(chē)輛電動(dòng)列車(chē)運(yùn)行的優(yōu)化配置、降低CO2排放量、超前車(chē)輛預(yù)處理(加熱/冷卻/除冰)、電動(dòng)車(chē)輛充電優(yōu)化和有效的電網(wǎng)管理,駕駛員識(shí)別和車(chē)輛個(gè)性化。
Fig.2.Predicting destination based on user and activity data[43].