陜西省經(jīng)開一中 郭 旭
人工智能視角下的無(wú)人駕駛技術(shù)分析與展望
陜西省經(jīng)開一中 郭 旭
無(wú)人駕駛技術(shù)是當(dāng)前汽車產(chǎn)業(yè)發(fā)展的新方向,其目標(biāo)是解決人們對(duì)駕駛安全、舒適性和可靠性的更高需求。隨著人工智能廣泛應(yīng)用于計(jì)算機(jī)視覺、自然語(yǔ)言處理、傳感器融合、語(yǔ)音識(shí)別等各個(gè)領(lǐng)域,無(wú)人駕駛技術(shù)取得了一定的突破性進(jìn)展。自動(dòng)駕駛初創(chuàng)企業(yè)、互聯(lián)網(wǎng)公司以及各大汽車廠商,都在積極探索利用人工智能技術(shù)實(shí)現(xiàn)最終的無(wú)人駕駛。本文就在此背景下,對(duì)無(wú)人駕駛中的人工智能技術(shù)進(jìn)行了相應(yīng)的闡述與分析,并指出了未來(lái)無(wú)人駕駛所面臨的問(wèn)題與對(duì)該領(lǐng)域的未來(lái)展望。
無(wú)人駕駛;深度學(xué)習(xí);人工智能
目前的自動(dòng)駕駛可分為兩類:一類是目前非?;鸨臒o(wú)人駕駛,屬于自動(dòng)駕駛類別中的L4階段[1]。無(wú)人駕駛更強(qiáng)調(diào)的是車的自主駕駛以實(shí)現(xiàn)舒適的駕駛體驗(yàn)和人力成本的節(jié)省,典型的例子為百度和谷歌的無(wú)人車;一類是高級(jí)輔助駕駛系統(tǒng)ADAS(全稱為Advanced Driver Assistance System),發(fā)展歷史已久,早在上世紀(jì)70年代就已進(jìn)入車廠布局中。不過(guò),高級(jí)輔助駕駛系統(tǒng)可以視作無(wú)人駕駛汽車的前提,隨著ADAS實(shí)現(xiàn)的功能越來(lái)越多,漸進(jìn)式可實(shí)現(xiàn)無(wú)人駕駛。如表1所示,根據(jù)美國(guó)高速路安全管理局(NTHSA)的定義,汽車的自動(dòng)駕駛可分為四個(gè)階段,目前發(fā)展技術(shù)處于汽車自動(dòng)化程度的第二階段。
表1 汽車自動(dòng)駕駛階段劃分
谷歌是參與自動(dòng)駕駛研究的先驅(qū),也是完全自動(dòng)駕駛的倡導(dǎo)者,代表了目前無(wú)人駕駛的最高水平。谷歌自2009年起推進(jìn)無(wú)人駕駛的開發(fā),2015年有史以來(lái)第一輛全無(wú)人駕駛汽車開上公共道路。而百度于2013年開始涉及無(wú)人駕駛領(lǐng)域的研究,2016年11月與車廠合作打造的自動(dòng)駕駛車已體驗(yàn)運(yùn)營(yíng),體驗(yàn)全程3.16km, 使用L4自動(dòng)駕駛技術(shù)實(shí)現(xiàn)紅綠燈識(shí)別、行人避讓以及超車并線等功能并且也獲得了加州無(wú)人駕駛牌照??傊壳白詣?dòng)駕駛領(lǐng)域的先驅(qū)主要集中在互聯(lián)網(wǎng)企業(yè),其中一個(gè)重要的原因就在于互聯(lián)網(wǎng)企業(yè)掌握了核心的技術(shù),包括語(yǔ)音識(shí)別、圖像處理、語(yǔ)音識(shí)別等。
自動(dòng)駕駛智能汽車作為一個(gè)機(jī)器人系統(tǒng),所涉及到的技術(shù)主要有感知、路徑規(guī)劃和控制決策三大塊內(nèi)容。其中智能感知技術(shù)是前提,而路徑規(guī)劃和控制決策有賴于人工智能相關(guān)技術(shù)的研究與應(yīng)用。
(一)智能感知:傳感器技術(shù)和模式識(shí)別技術(shù)
汽車的環(huán)境感知通過(guò)集成視覺、激光雷達(dá)、超聲傳感器、微波雷達(dá)、GPS、等多種車載傳感器來(lái)收集數(shù)據(jù),并根據(jù)所獲得的道路信息、交通信號(hào)的信息、車輛位置和障礙物信息做出分析和判斷。雷達(dá)和攝像頭是自動(dòng)駕駛的標(biāo)配,而更高級(jí)的無(wú)人駕駛的實(shí)現(xiàn)需要多種傳感器的融合:激光雷達(dá)分辨率高,是構(gòu)建精確的汽車周邊3D環(huán)境的基礎(chǔ),但成本高,且尚未實(shí)現(xiàn)規(guī)模化生產(chǎn);毫米波雷達(dá)康干擾能力強(qiáng),穩(wěn)定性高,成本較激光雷達(dá)低,看好其在低端車型的普及;攝像頭可以很好的識(shí)別人物和交通標(biāo)識(shí),以用來(lái)識(shí)別評(píng)估危險(xiǎn),是自動(dòng)駕駛不可或缺的一部分。
通過(guò)傳感器進(jìn)行數(shù)據(jù)收集后就要進(jìn)行模式識(shí)別,其主要有兩個(gè)方面:光學(xué)信息識(shí)別和聲學(xué)信息識(shí)別。對(duì)應(yīng)到自動(dòng)駕駛中,光學(xué)信息識(shí)別包括對(duì)路況、行人等做出的判斷;聲學(xué)信息識(shí)別能夠?qū)崿F(xiàn)車與車,人與車之間的智能溝通。例如:在駕車過(guò)程中,駕駛員通過(guò)觀察前方就能輕易分辨出車道線的信息,若智能汽車獲取車道線信息,首先需要通過(guò)攝像頭獲取道路影像,但其本身并不具備映射到真實(shí)環(huán)境的物理含義。只有通過(guò)適當(dāng)?shù)乃惴◤挠跋褓Y料中提取能反映車道線的影像部分,并進(jìn)行映射。不同的傳感器由于環(huán)境感知原理的差異,識(shí)別算法上也存在著不同。
(二)人工智能:通過(guò)學(xué)習(xí)與優(yōu)化作出決策
目前,通過(guò)深度學(xué)習(xí)的方式讓無(wú)人駕駛汽車不斷地優(yōu)化自己的駕駛行為,是目前最有效的解決方案。每一輛無(wú)人車行駛過(guò)程中遇到各式各樣的交通情景和突發(fā)狀況將產(chǎn)生大量的數(shù)據(jù),這些大數(shù)據(jù)被傳回云平臺(tái)用作深度學(xué)習(xí)的訓(xùn)練樣本,經(jīng)過(guò)大量樣本訓(xùn)練學(xué)習(xí)的“駕駛腦”,不僅僅獲得了自身行駛的駕駛經(jīng)驗(yàn),同時(shí)也獲得了其他車輛的“學(xué)習(xí)、訓(xùn)練成果”,隨著樣本訓(xùn)練的不斷增加,“駕駛腦”的駕駛技術(shù)將呈現(xiàn)指數(shù)式的增長(zhǎng),將大幅度提升無(wú)人駕駛技術(shù)的進(jìn)步,同時(shí)提高無(wú)人駕駛汽車的安全性[2]。尤其是隨著芯片巨頭NVIDIA于2017年推出了新一代針對(duì)自動(dòng)駕駛開發(fā)的深度學(xué)習(xí)的車載超級(jí)電腦——XAVIER,其可以用作自動(dòng)駕駛汽車的超級(jí)大腦,以深度學(xué)習(xí)算法來(lái)加強(qiáng)車輛的感知能力,識(shí)別出車輛行駛環(huán)境周圍的其他所有物體,包括行人、車輛、路標(biāo)、車道線、建筑設(shè)施等等,對(duì)車輛各類傳感器收集到的數(shù)據(jù)進(jìn)行處理與分析,進(jìn)而進(jìn)行判斷,再做出決策。
隨著深度學(xué)習(xí)在圖像識(shí)別領(lǐng)域取得較大的突破,深度學(xué)習(xí)算法通過(guò)多層迭代對(duì)特征抽象進(jìn)行模式識(shí)別的學(xué)習(xí),從而能夠以較高的精度實(shí)現(xiàn)對(duì)路況、物體的識(shí)別。在大數(shù)據(jù)和云計(jì)算時(shí)代,智能控制技術(shù)需依托深度學(xué)習(xí),才能實(shí)現(xiàn)自動(dòng)駕駛所要求的安全性和精確度。深度學(xué)習(xí)是人工智能的一門學(xué)科,是通過(guò)計(jì)算機(jī)算法在機(jī)器上模擬神經(jīng)網(wǎng)絡(luò),讓機(jī)器具備學(xué)習(xí)的能力。例如,卷積神經(jīng)網(wǎng)絡(luò)CNN在圖像識(shí)別領(lǐng)域具有了相當(dāng)高的精度被廣泛應(yīng)用在自動(dòng)駕駛領(lǐng)域。由于CNN在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)上針對(duì)視覺輸入本身特點(diǎn)做的特定設(shè)計(jì),所以它是計(jì)算機(jī)視覺領(lǐng)域使用深度神經(jīng)網(wǎng)絡(luò)的不二選擇。無(wú)人駕駛的感知部分作為計(jì)算機(jī)視覺的領(lǐng)域范圍,也不可避免地成為CNN發(fā)揮作用的舞臺(tái)。而隨著各種改進(jìn)CNN的出現(xiàn),其被廣泛應(yīng)用在物體檢測(cè)與3D感知技術(shù)中。
目前,無(wú)人駕駛在業(yè)界獲得了廣泛的關(guān)注,但是也面臨著許多亟待解決的問(wèn)題,才能進(jìn)入最終的實(shí)用階段。
在技術(shù)方面,傳感器和算法模型是自動(dòng)駕駛技術(shù)的核心構(gòu)成,其技術(shù)先進(jìn)度、工業(yè)成熟度直接決定著無(wú)人駕駛的發(fā)展階段。傳感器:目前性價(jià)比較高的搭配方案為毫米波+雷達(dá),但激光雷達(dá)+攝像頭的方式在傳感器精度方面表現(xiàn)更佳。未來(lái)如果實(shí)現(xiàn)無(wú)人駕駛,激光雷達(dá)將是必不可缺的傳感器之一。算法與決策:自動(dòng)駕駛的算法技術(shù)壁壘較高,涉及到定位技術(shù)、物體和場(chǎng)景識(shí)別、智能決策等。隨著人工智能技術(shù)的不斷發(fā)展與突破,該領(lǐng)域?qū)⒂性絹?lái)越多的研究成果出現(xiàn),并極大的推動(dòng)無(wú)人駕駛的快速發(fā)展。
在道德和合法性問(wèn)題上,無(wú)人駕駛汽車也面臨著相當(dāng)大的挑戰(zhàn)。無(wú)人駕駛汽車是一個(gè)決策機(jī)構(gòu),在行人避讓、超車決策等問(wèn)題上存在一定的道德問(wèn)題。另外,無(wú)人駕駛汽車上路的標(biāo)準(zhǔn)、交通事故的認(rèn)定、交通賠償?shù)呐袥Q等一系列問(wèn)題都有待于法律法規(guī)的完善,這些不是技術(shù)問(wèn)題所能解決的,也不是一朝一日通過(guò)法律能夠制定的,需要不斷的探索與完善。
無(wú)人駕駛面臨的另外一個(gè)比較重要的問(wèn)題是安全性問(wèn)題。無(wú)人駕駛在技術(shù)上存在著控制權(quán)被黑客攻擊并非法利用的可能,在這種情況下無(wú)人駕駛汽車甚至?xí)蔀椴环ǚ肿游:袢松戆踩墓ぞ遊3]。另外,技術(shù)的可靠性和安全性也是無(wú)人駕駛技術(shù)能否保證持續(xù)安全的重要問(wèn)題,系統(tǒng)的崩潰、反應(yīng)的延遲都有可能會(huì)造成重大的安全隱患。
無(wú)人駕駛汽車作為新事物,提高了人們當(dāng)前在出行中面臨的諸如駕駛舒適性、決策高效性、控制智能化等各個(gè)方面。它帶給我們的便利和產(chǎn)生的問(wèn)題在一定時(shí)間內(nèi)是并存的,并存在著某些難以解決的矛盾。但是隨著人工智能技術(shù)的不斷發(fā)展與完善,以及對(duì)無(wú)人駕駛技術(shù)的高投入與重視,無(wú)人駕駛技術(shù)將會(huì)變得越來(lái)越成熟。另外,在解決諸如道德、法律、安全等問(wèn)題上,隨著制度的完善和人們對(duì)無(wú)人駕駛技術(shù)的不斷接受與認(rèn)可,無(wú)人駕駛技術(shù)必將對(duì)人類的出行方式產(chǎn)生重大的影響與變革。
[1]余阿東,陳睿煒.汽車自動(dòng)駕駛技術(shù)研究[J].汽車實(shí)用技術(shù),2017.
[2]楊震.自動(dòng)駕駛技術(shù)進(jìn)展與運(yùn)營(yíng)商未來(lái)信息服務(wù)架構(gòu)演進(jìn)[J].電信科學(xué),2016.
[3]李付?。疁\談汽車自動(dòng)駕駛技術(shù)的發(fā)展與未來(lái)[J].科技論壇,2016.
郭旭(1999—),男,陜西西安人,現(xiàn)就讀于陜西省經(jīng)開一中高中二年級(jí),研究方向:人工智能。