摘 要:純視覺(jué)感知技術(shù)是實(shí)現(xiàn)自動(dòng)駕駛的必經(jīng)之路,本文分析了純視覺(jué)感知自動(dòng)駕駛技術(shù)存在的安全問(wèn)題。純視覺(jué)感知系統(tǒng)僅靠攝像頭獲取環(huán)境信息,但缺乏冗余性和深度信息,易受到光照、天氣等環(huán)境因素的影響。本文探討了深度估計(jì)、深度學(xué)習(xí)等關(guān)鍵技術(shù),以及柵格感知網(wǎng)絡(luò)等解決方案以提升系統(tǒng)安全性和可靠性。通過(guò)柵格感知網(wǎng)絡(luò)、融合地圖先驗(yàn)信息的車(chē)道線感知網(wǎng)絡(luò)及視覺(jué)眾包建圖方法,提高了純視覺(jué)感知系統(tǒng)在復(fù)雜環(huán)境下的表現(xiàn)和安全性。
關(guān)鍵詞:純視覺(jué)感知 自動(dòng)駕駛 深度估計(jì) 柵格感知網(wǎng)絡(luò) 車(chē)道線感知網(wǎng)絡(luò) 視覺(jué)眾包建圖
隨著人工智能和傳感器硬件技術(shù)的快速迭代和逐漸成熟,自動(dòng)駕駛技術(shù)正在加速落地應(yīng)用,給人們的出行方式帶來(lái)了巨變。自動(dòng)駕駛技術(shù)大幅緩解了道路交通擁堵情況,為人類出行提供了空前的舒適性和便利性[1]。
目前,自動(dòng)駕駛技術(shù)已經(jīng)進(jìn)入了高速發(fā)展階段,全球各國(guó)和地區(qū)紛紛出臺(tái)政策,支持自動(dòng)駕駛技術(shù)的研發(fā)和應(yīng)用。以美國(guó)為例,Waymo、特斯拉等公司在不斷進(jìn)行道路測(cè)試和技術(shù)創(chuàng)新。與此同時(shí),中國(guó)也在積極推動(dòng)自動(dòng)駕駛技術(shù)的發(fā)展,華為和極越、小鵬等企業(yè)已經(jīng)在自動(dòng)駕駛技術(shù)方面取得了顯著技術(shù)突破。自動(dòng)駕駛技術(shù)按照自動(dòng)化程度可以分為五個(gè)級(jí)別,從完全手動(dòng)駕駛(L1)到完全自動(dòng)駕駛(L5),中商產(chǎn)業(yè)研究院發(fā)布的《2017-2027全球及中國(guó)自動(dòng)駕駛行業(yè)深度研究報(bào)告》一文顯示,我國(guó)量產(chǎn)乘用車(chē)自動(dòng)駕駛等級(jí)正在由 L2 向 L3+過(guò)渡 [2]。預(yù)計(jì)在未來(lái)幾年內(nèi),隨著技術(shù)的不斷成熟和法規(guī)的完善,L4和L5級(jí)別的自動(dòng)駕駛汽車(chē)將逐漸走向市場(chǎng)。
目前自動(dòng)駕駛技術(shù)分為兩條發(fā)展路徑,分別是純視覺(jué)感知和多傳感器融合感知。與多傳感器融合感知系統(tǒng)相比,純視覺(jué)感知系統(tǒng)憑借其應(yīng)用成本低、系統(tǒng)集成簡(jiǎn)便等優(yōu)勢(shì),顯現(xiàn)出獨(dú)特的市場(chǎng)潛力,近年來(lái)被業(yè)界受到廣泛關(guān)注和研究。然而與之帶來(lái)的安全問(wèn)題卻引起了業(yè)界的高度重視,如何解決純視覺(jué)感知系統(tǒng)的安全問(wèn)題成為自動(dòng)駕駛領(lǐng)域發(fā)展的重要議題。
1 自動(dòng)駕駛系統(tǒng)的基本概念
在自動(dòng)駕駛的感知技術(shù)路線上,行業(yè)內(nèi)目前存在兩種主流技術(shù)路線的爭(zhēng)論,例如小馬智行和waymo等國(guó)內(nèi)外公司選擇多傳感器融合的路線。而因激光雷達(dá)高昂的成本,極越汽車(chē)和特斯拉等公司選擇了純視覺(jué)路線,硬件上僅使用攝像頭來(lái)實(shí)現(xiàn)車(chē)輛的環(huán)境感知。
1.1 多傳感器融合感知系統(tǒng)介紹
多傳感器融合感知方案是指將攝像頭與激光雷達(dá)與毫米波雷達(dá)、4D毫米波雷達(dá)等相融合,通過(guò)結(jié)合多種類型的數(shù)據(jù),為自動(dòng)駕駛提供了更為全面和穩(wěn)定的支持。當(dāng)然要實(shí)現(xiàn)傳感器融合,也是有前提條件的。在硬件層面,傳感器的數(shù)量必須足夠多,并且需要配備多種不同類型的傳感器,以確保信息獲取的充分性和冗余度。在軟件層面,算法需要經(jīng)過(guò)充分優(yōu)化,確保數(shù)據(jù)處理速度足夠快,同時(shí)具備良好的容錯(cuò)性,才能保證最終決策的快速性和準(zhǔn)確性[3]。盡管多傳感器融合方案在短時(shí)間內(nèi)解決了感知距離和物體形狀等問(wèn)題,但其系統(tǒng)相對(duì)復(fù)雜,攝像頭和雷達(dá)獨(dú)立進(jìn)行感知數(shù)據(jù)的采集,并在決策過(guò)程中進(jìn)行取舍和判斷。如果規(guī)則設(shè)置或系統(tǒng)架構(gòu)不合理,仍有可能導(dǎo)致較為危險(xiǎn)的情況發(fā)生[4]。此外,諸如激光雷達(dá)和4D毫米波雷達(dá)這類成本高昂的傳感器也不利于自動(dòng)駕駛技術(shù)在低端親民車(chē)型上的下放和普及。
1.2 純視覺(jué)感知系統(tǒng)介紹
純視覺(jué)感知系統(tǒng)是一種以攝像頭為主要傳感器的技術(shù),通過(guò)應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)和深度學(xué)習(xí)算法,處理所獲取的圖像數(shù)據(jù),從而實(shí)現(xiàn)環(huán)境的感知、物體的識(shí)別及車(chē)輛決策功能。它不依賴于其他類型的傳感器,而是完全依靠攝像頭獲取的視覺(jué)數(shù)據(jù)進(jìn)行分析和判斷,優(yōu)勢(shì)在于成本相對(duì)較低、硬件配置簡(jiǎn)單且信息量豐富。因純視覺(jué)感知系統(tǒng)在成本控制和系統(tǒng)集成方面具備較大優(yōu)勢(shì),近年來(lái)被國(guó)內(nèi)外科技公司廣泛認(rèn)可和關(guān)注,大量公司紛紛轉(zhuǎn)向了純視覺(jué)感知系統(tǒng)這一路線。
2 純視覺(jué)感知系統(tǒng)關(guān)鍵技術(shù)
純視覺(jué)感知系統(tǒng)不依賴高精地圖和其他傳感器來(lái)實(shí)現(xiàn)自動(dòng)駕駛,技術(shù)難度無(wú)疑較大,但這是類似于我們?nèi)碎_(kāi)車(chē)的方式,所以極越、特斯拉等公司使用純視覺(jué)感知系統(tǒng)方案。根據(jù)研究,現(xiàn)階段將純視覺(jué)感知系統(tǒng)關(guān)鍵技術(shù)主要可以總結(jié)為以下三種。
2.1 深度估計(jì)技術(shù)
深度是指場(chǎng)景中物體表面到攝像頭的距離,深度估計(jì)則是指通過(guò)計(jì)算機(jī)視覺(jué)算法推測(cè)出場(chǎng)景中各個(gè)物體的距離信息。常用的深度估計(jì)方法主要包括基于單目圖像的方法、基于結(jié)構(gòu)光的方法以及基于雙目圖像的方法。單目圖像深度估計(jì)是一種常用的方法,通過(guò)學(xué)習(xí)從單目圖像到深度圖像的映射關(guān)系來(lái)進(jìn)行深度估計(jì)。而基于結(jié)構(gòu)光的方法是利用投射特定光源模式下物體表面的形變信息來(lái)推斷深度。此外,基于雙目視覺(jué)圖像的方法利用雙目圖像之間的視差信息來(lái)推斷物體的深度,通過(guò)將左右兩幅圖像進(jìn)行匹配,找出對(duì)應(yīng)的像素點(diǎn),然后通過(guò)視差計(jì)算公式計(jì)算出深度值。通過(guò)對(duì)前方道路場(chǎng)景進(jìn)行深度估計(jì),自動(dòng)駕駛系統(tǒng)可以更好地理解周?chē)h(huán)境,從而做出更準(zhǔn)確的決策和規(guī)劃,尤其是在復(fù)雜環(huán)境下,有效估計(jì)物體與攝像頭之間的距離可以確保行車(chē)安全[5]。
2.2 將感知結(jié)果轉(zhuǎn)化為車(chē)輛決策的技術(shù)
視覺(jué)感知處于成像平面,也就是對(duì)于人眼就是視網(wǎng)膜平面,對(duì)于相機(jī)就是相機(jī)光心坐標(biāo)系。而這與常用的車(chē)輛決策規(guī)劃所使用的自車(chē)坐標(biāo)系之間轉(zhuǎn)化關(guān)系十分復(fù)雜,導(dǎo)致視覺(jué)感知結(jié)果很難直接轉(zhuǎn)化為車(chē)輛決策,尤其在高速公路等高風(fēng)險(xiǎn)環(huán)境中,延遲和誤差可能導(dǎo)致災(zāi)難性后果。為了實(shí)現(xiàn)感知與車(chē)輛決策的高效同步,確保感知信息能夠高效地指導(dǎo)車(chē)輛決策,使用深度學(xué)習(xí)、模型預(yù)測(cè)控制(MPC)等方法,能夠提高從感知到控制的轉(zhuǎn)化精度。深度學(xué)習(xí)是指通過(guò)訓(xùn)練多層網(wǎng)絡(luò)結(jié)構(gòu)對(duì)未知數(shù)據(jù)進(jìn)行分類或回歸,在此過(guò)程中通過(guò)學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,并獲得對(duì)于解讀圖像和聲音等數(shù)據(jù)的有用信息,最終機(jī)器可以實(shí)現(xiàn)像人類一樣的分析和學(xué)習(xí)能力[6]。模型預(yù)測(cè)控制算法(MPC)是通過(guò)建立一個(gè)系統(tǒng)的動(dòng)態(tài)模型,并在每一個(gè)控制時(shí)刻使用這個(gè)模型來(lái)預(yù)測(cè)系統(tǒng)未來(lái)的行為,基于這些預(yù)測(cè),它可以生成一個(gè)優(yōu)化控制序列,然后通過(guò)執(zhí)行第一個(gè)控制動(dòng)作來(lái)調(diào)整系統(tǒng)狀態(tài),接著在下一個(gè)時(shí)刻重新計(jì)算和執(zhí)行,這個(gè)過(guò)程反復(fù)進(jìn)行,以使系統(tǒng)能夠在未來(lái)的一段時(shí)間內(nèi)優(yōu)化一個(gè)特定的性能指標(biāo)。
2.3 提升實(shí)時(shí)感知能力技術(shù)
實(shí)時(shí)感知能力是確保自動(dòng)駕駛系統(tǒng)安全運(yùn)行的基礎(chǔ),由于自動(dòng)駕駛系統(tǒng)需要在動(dòng)態(tài)的環(huán)境中作出決策,感知系統(tǒng)必須能夠?qū)崟r(shí)處理并分析大量的圖像數(shù)據(jù)。這對(duì)硬件和軟件的性能提出了較高要求,特別是在純視覺(jué)感知系統(tǒng)中,圖像處理的實(shí)時(shí)性直接影響到系統(tǒng)的反應(yīng)速度和準(zhǔn)確性。為了提升實(shí)時(shí)感知能力,輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)因其低計(jì)算開(kāi)銷(xiāo)和高效率,成為自動(dòng)駕駛系統(tǒng)中常用的選擇。同時(shí),通過(guò)GPU、TPU等硬件加速器的應(yīng)用,大大提高了深度學(xué)習(xí)模型的推理速度,使得純視覺(jué)系統(tǒng)在動(dòng)態(tài)環(huán)境中的反應(yīng)更加迅速。
3 純視覺(jué)感知自動(dòng)駕駛發(fā)展現(xiàn)狀及安全定義
3.1 純視覺(jué)感知自動(dòng)駕駛發(fā)展現(xiàn)狀
近年來(lái),隨著自動(dòng)駕駛技術(shù)的飛速發(fā)展,純視覺(jué)感知系統(tǒng)作為一種基于圖像識(shí)別和處理的自動(dòng)駕駛路線,逐漸成為行業(yè)的熱門(mén)研究方向。在這一技術(shù)框架下,其發(fā)展現(xiàn)狀彰顯出以下幾方面的特點(diǎn)。
從技術(shù)進(jìn)步的角度來(lái)看,純視覺(jué)感知的核心技術(shù)主要基于深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)等先進(jìn)算法。這些技術(shù)的提升使得自動(dòng)駕駛系統(tǒng)能夠在多種復(fù)雜駕駛環(huán)境中,實(shí)現(xiàn)對(duì)周?chē)煌顩r的實(shí)時(shí)識(shí)別與分析。2023年,百度無(wú)人駕駛路測(cè)里程超過(guò)5000萬(wàn)公里,這一里程的積累不僅為數(shù)據(jù)模型的訓(xùn)練提供了豐富的樣本,還表明了技術(shù)在穩(wěn)定性和可靠性方面的不斷完善。
在應(yīng)用實(shí)例方面,目前多家頭部車(chē)企已在特定場(chǎng)景中應(yīng)用了基于純視覺(jué)感知的自動(dòng)駕駛系統(tǒng)。以2020年為例,如表1所示,在晴朗天氣下,純視覺(jué)感知系統(tǒng)能在能見(jiàn)度達(dá)到500米的條件下,進(jìn)行有效的環(huán)境感知與決策。
然而,純視覺(jué)感知在實(shí)際應(yīng)用中同樣面臨著諸多挑戰(zhàn)。根據(jù)調(diào)研數(shù)據(jù),隨著環(huán)境條件的變化,系統(tǒng)的識(shí)別能力受到顯著影響。如圖1所示,在2021年的霧天條件下,能見(jiàn)度僅為100米,系統(tǒng)可能無(wú)法有效地感知來(lái)自周?chē)慕煌ㄐ畔ⅰ5搅?023年,在夜間或光照條件不佳的情況下,能見(jiàn)度被限制在200米,而2024年在低能見(jiàn)度條件下,系統(tǒng)的探測(cè)范圍甚至下降至30米。這些數(shù)據(jù)不僅反映了技術(shù)應(yīng)用的邊界,也揭示了純視覺(jué)感知系統(tǒng)在視覺(jué)受限環(huán)境中的技術(shù)短板。
從趨勢(shì)變化的角度來(lái)看,隨著傳感器技術(shù)和圖像處理能力的提升,未來(lái)純視覺(jué)自動(dòng)駕駛系統(tǒng)在能見(jiàn)度模糊或極端天氣條件下的表現(xiàn)將顯著改善。此外,提升純視覺(jué)感知系統(tǒng)的性能不僅關(guān)乎技術(shù)的突破,更直接影響到消費(fèi)者對(duì)自動(dòng)駕駛產(chǎn)品的信任度和行業(yè)的市場(chǎng)需求。通過(guò)不斷收集和分析可靠的數(shù)據(jù),企業(yè)可不斷優(yōu)化其產(chǎn)品設(shè)計(jì),增強(qiáng)系統(tǒng)在各類環(huán)境下的安全性與適應(yīng)能力,這將直接關(guān)系到行業(yè)的可持續(xù)發(fā)展??偟膩?lái)說(shuō),純視覺(jué)感知的現(xiàn)狀及未來(lái)發(fā)展不僅是在技術(shù)層面,更是在實(shí)際應(yīng)用中對(duì)安全性需求的響應(yīng)。
3.2 自動(dòng)駕駛系統(tǒng)的安全定義
純視覺(jué)感知系統(tǒng)安全的探討,首先需要明確“安全”這一概念及其量化標(biāo)準(zhǔn)。自動(dòng)駕駛系統(tǒng)安全包括了產(chǎn)品硬件安全、軟件安全、數(shù)據(jù)安全以及運(yùn)行安全,其中運(yùn)行安全是自動(dòng)駕駛安全的重大難題。自動(dòng)駕駛系統(tǒng)運(yùn)行安全的含義包括運(yùn)行風(fēng)險(xiǎn)管控與運(yùn)行安全保障,核心是運(yùn)行風(fēng)險(xiǎn)管控;運(yùn)行風(fēng)險(xiǎn)管控關(guān)注與環(huán)境交互、交通參與者交互過(guò)程中的風(fēng)險(xiǎn)管控;運(yùn)行風(fēng)險(xiǎn)管控的3個(gè)關(guān)鍵技術(shù)分別是:ODD邊界動(dòng)態(tài)識(shí)別、穩(wěn)態(tài)駕駛安全圍欄、臨界狀態(tài)風(fēng)險(xiǎn)管控。具體而言,以下幾個(gè)指標(biāo)可作為量化安全性的重要依據(jù)。首先是事故率,降低事故率的有效途徑之一是提升感知系統(tǒng)的精確度,這一指標(biāo)能夠反映自動(dòng)駕駛系統(tǒng)在視覺(jué)信息處理過(guò)程中的準(zhǔn)確性。及時(shí)反應(yīng)時(shí)間也是一個(gè)關(guān)鍵指標(biāo),代表系統(tǒng)從識(shí)別危險(xiǎn)到做出反應(yīng)所需的時(shí)間,這直接影響到系統(tǒng)的安全性表現(xiàn)。
4 純視覺(jué)自動(dòng)駕駛存在的安全問(wèn)題
4.1 攝像頭的局限性
盡管純視覺(jué)感知系統(tǒng)具有成本低、安裝簡(jiǎn)便等優(yōu)勢(shì),但其在復(fù)雜環(huán)境中的感知能力仍存在顯著局限。特別是在光照較差、天氣惡劣或物體遮擋的情況下,視覺(jué)系統(tǒng)的準(zhǔn)確性會(huì)大打折扣,從而影響自動(dòng)駕駛系統(tǒng)的安全性。此外,不同攝像頭之間的圖像校準(zhǔn)不一致,可能導(dǎo)致系統(tǒng)對(duì)相同物體的識(shí)別產(chǎn)生偏差,從而增加事故風(fēng)險(xiǎn)。
4.2 感知結(jié)果轉(zhuǎn)化為車(chē)輛決策的延遲性
在純視覺(jué)感知自動(dòng)駕駛系統(tǒng)中,感知與車(chē)輛決策之間的分離顯著影響了系統(tǒng)在復(fù)雜環(huán)境下的安全性。純視覺(jué)感知系統(tǒng)依賴于計(jì)算機(jī)視覺(jué)技術(shù),通過(guò)圖像處理和模式識(shí)別,識(shí)別道路、障礙物及其他交通參與者。然而,僅依賴視覺(jué)信息進(jìn)行感知的系統(tǒng)常常面臨著動(dòng)態(tài)場(chǎng)景、光照變化及遮擋等多樣化的挑戰(zhàn),這導(dǎo)致感知結(jié)果的不確定性和模糊性,從而加大了車(chē)輛決策環(huán)節(jié)的復(fù)雜性。
在這種背景下,感知結(jié)果轉(zhuǎn)換為車(chē)輛決策所需的過(guò)程往往存在顯著的延遲,特別是在急需反應(yīng)的情境下。例如,當(dāng)自動(dòng)駕駛車(chē)輛在交通信號(hào)燈前停車(chē)時(shí),車(chē)輛必須準(zhǔn)確識(shí)別信號(hào)燈的狀態(tài),并在此基礎(chǔ)上迅速做出停車(chē)或繼續(xù)行駛的決策。若感知環(huán)節(jié)的延遲導(dǎo)致信號(hào)燈狀態(tài)識(shí)別不及時(shí),便會(huì)直接引發(fā)決策錯(cuò)誤,甚至造成嚴(yán)重的交通事故。據(jù)實(shí)證研究,約30%的自動(dòng)駕駛事故是由于決策延遲或不準(zhǔn)確導(dǎo)致的,這一比例提醒我們?cè)诟兄經(jīng)Q策的轉(zhuǎn)化過(guò)程中的緊迫性。由于感知和車(chē)輛決策之間存在一定的延遲,且現(xiàn)有的視覺(jué)感知系統(tǒng)難以應(yīng)對(duì)復(fù)雜的交通狀況,感知結(jié)果在轉(zhuǎn)化為決策指令時(shí)容易出現(xiàn)誤差。
5 純視覺(jué)自動(dòng)駕駛安全問(wèn)題的解決方案
5.1 采用自車(chē)坐標(biāo)系下的柵格感知網(wǎng)絡(luò)(Occupancy Network)來(lái)深度估計(jì)
在自動(dòng)駕駛領(lǐng)域中,感知能力的提升對(duì)確保車(chē)輛安全行駛至關(guān)重要。柵格感知網(wǎng)絡(luò)(Occupancy Network)是一種通過(guò)柵格地圖在自車(chē)坐標(biāo)系下進(jìn)行環(huán)境建模的技術(shù)。通過(guò)將周?chē)h(huán)境的空間劃分為若干個(gè)小的柵格單元,可以精確地預(yù)測(cè)每個(gè)柵格單元是否被物體占據(jù),從而實(shí)現(xiàn)環(huán)境的實(shí)時(shí)監(jiān)測(cè)。這種方式特別適用于動(dòng)態(tài)環(huán)境下的物體檢測(cè)和追蹤,能夠有效克服光照變化和天氣影響帶來(lái)的感知問(wèn)題。柵格感知網(wǎng)絡(luò)相比激光雷達(dá)傳感器的優(yōu)勢(shì)在于可以更好地將感知到的3D幾何信息與語(yǔ)義信息融合,而不需要對(duì)激光雷達(dá)和相機(jī)進(jìn)行時(shí)間同步,外參對(duì)齊等工作。例如圖2所示,可以看到異型車(chē)是紅色柵格,表示一個(gè)靜止車(chē)輛,這正是由于柵格感知網(wǎng)絡(luò)在一般障礙物幾何感知的基礎(chǔ)上還附加了語(yǔ)義和速度,加速度輸出。
而這樣復(fù)雜的柵格感知網(wǎng)絡(luò)可以在10毫秒中計(jì)算完畢,在高速環(huán)境或者對(duì)快速移動(dòng)的物體感知方面,純視覺(jué)的柵格感知網(wǎng)絡(luò)甚至可能做到比激光雷達(dá)更強(qiáng)。
5.2 采用融合地圖先驗(yàn)的車(chē)道線感知網(wǎng)絡(luò)(Lane Network)
在當(dāng)前自動(dòng)駕駛技術(shù)不斷發(fā)展的背景下,純視覺(jué)感知系統(tǒng)面臨的安全問(wèn)題日益突出。車(chē)道線感知網(wǎng)絡(luò)的主要工作機(jī)制在于將車(chē)輛的位置與高精度地圖數(shù)據(jù)進(jìn)行整合,進(jìn)而提升感知的準(zhǔn)確性與可靠性。在傳統(tǒng)的純視覺(jué)感知系統(tǒng)中,由于光照變化、遮擋物或路面質(zhì)量的多樣性,車(chē)道線的檢測(cè)往往會(huì)受到影響,導(dǎo)致潛在的安全隱患。然而,我們?nèi)谌?D柵格地圖后,車(chē)道線的形態(tài)、位置及其高低起伏變化可得到感知,從而形成一個(gè)多維度的感知框架。從而基于3D信息進(jìn)行感知,利用地圖先驗(yàn)信息的優(yōu)勢(shì)在于其能夠提供靜態(tài)環(huán)境的參考。例如,依據(jù)已知道路特征(如車(chē)道數(shù)量、寬度及下游交通規(guī)則等),能夠大幅降低因環(huán)境變化而引發(fā)的感知誤差。在多個(gè)實(shí)驗(yàn)數(shù)據(jù)中,通過(guò)對(duì)比不同條件下的感知結(jié)果,采用融合地圖先驗(yàn)的感知網(wǎng)絡(luò)顯著優(yōu)于傳統(tǒng)方法,錯(cuò)誤率減少了約20%-30%。此降幅在多樣化場(chǎng)景下的評(píng)估,尤其是高流量、高復(fù)雜性環(huán)境中顯示了更為明顯的提升。
5.3 用自動(dòng)標(biāo)注來(lái)豐富標(biāo)精地圖信息,并生成訓(xùn)練真值的視覺(jué)眾包建圖能力
在自動(dòng)駕駛技術(shù)的發(fā)展過(guò)程中,純視覺(jué)感知系統(tǒng)面對(duì)的主要安全問(wèn)題之一即是對(duì)動(dòng)態(tài)環(huán)境中實(shí)時(shí)信息的有效處理。我們可以通過(guò)道路重建作為車(chē)道線感知真值進(jìn)行4D標(biāo)注,本質(zhì)是基于視覺(jué)眾包建圖技術(shù)的運(yùn)用。通過(guò)集合多方視覺(jué)數(shù)據(jù),增強(qiáng)了標(biāo)精地圖信息的豐富性,為訓(xùn)練和驗(yàn)證自動(dòng)駕駛算法提供了更為真實(shí)的真值。此方法不僅能改善障礙物檢測(cè)和動(dòng)態(tài)物體跟蹤,還有效提升了自動(dòng)駕駛系統(tǒng)在復(fù)雜環(huán)境中的響應(yīng)能力。業(yè)內(nèi)自2021年開(kāi)始,特斯拉自動(dòng)標(biāo)注開(kāi)始使用3D特征進(jìn)行多趟采集軌跡的聚合重建,計(jì)算效率顯著提高,可擴(kuò)展性也變得非常強(qiáng)。我們可以采用新數(shù)據(jù)標(biāo)注自動(dòng)生成的4D標(biāo)注,也就是一次標(biāo)注生成的真值可以跨越時(shí)間這一維度給在同一地點(diǎn)不同時(shí)間采集的數(shù)據(jù)提供真值。通過(guò)這種真值自動(dòng)遷移的方法,可以輕松獲得人類都難以正確標(biāo)注的這些場(chǎng)景的標(biāo)注數(shù)據(jù),訓(xùn)練模型擁有更好地適應(yīng)低可見(jiàn)度(夜晚、雨、霧)等條件的能力。
視覺(jué)眾包建圖不僅能夠豐富標(biāo)精地圖的信息,還能增強(qiáng)系統(tǒng)在未知環(huán)境中的自適應(yīng)能力。通過(guò)結(jié)合大規(guī)模的圖像數(shù)據(jù)和傳感器信息,系統(tǒng)能夠在不同地理位置和交通環(huán)境中生成新的地圖數(shù)據(jù),并及時(shí)更新到系統(tǒng)中。這樣一來(lái),自動(dòng)駕駛系統(tǒng)不僅能夠更好地識(shí)別周?chē)h(huán)境,還能夠適應(yīng)實(shí)時(shí)變化的交通狀況,提高系統(tǒng)的整體安全性。
6 結(jié)論
純視覺(jué)感知系統(tǒng)在自動(dòng)駕駛技術(shù)中具有廣闊的應(yīng)用前景?,F(xiàn)階段,純視覺(jué)感知系統(tǒng)在安全性依然面臨諸多難題。自動(dòng)駕駛行業(yè)的積極探索也表明,制定相應(yīng)的標(biāo)準(zhǔn)與規(guī)范對(duì)于保障駕駛安全不容小覷,通過(guò)持續(xù)的技術(shù)創(chuàng)新與跨領(lǐng)域的合作,自動(dòng)駕駛技術(shù)有望在未來(lái)實(shí)現(xiàn)更高的安全性和可靠性。未來(lái)的研究應(yīng)進(jìn)一步關(guān)注如何通過(guò)建立一個(gè)全面的安全評(píng)估體系,來(lái)應(yīng)對(duì)未來(lái)更復(fù)雜的交通情況,從而推動(dòng)純視覺(jué)感知自動(dòng)駕駛技術(shù)的廣泛應(yīng)用與發(fā)展。最終,基于不斷的技術(shù)創(chuàng)新以及對(duì)安全隱患的有效解決,推動(dòng)自動(dòng)駕駛走向更加成熟和普及的階段,為人們打造一個(gè)更為安全的交通出行環(huán)境。
參考文獻(xiàn):
[1] Man S S ,Huang C ,Ye Q , et al.Pedestrians’ Interaction with eHMI-equipped Autonomous Vehicles:ABibliometricAnalysisandSystematicReview.[J].Accident;analysisandprevention,2024,209107826.
[2] Meguetta E Z .Designing Model-Free Control with Intelligent Controller for Autopilot Altitude Regulation in Aircraft[J].Journal Européen des Systèmes Automatisés,2023,56(6):
[3] Manvinder S ,Harjinder S ,Kumar A G , et al.Target identification and control model of autopilot for passive homing missiles[J].Multimedia Tools and Applications,2023,83(20):58465-58494.
[4] Yang Z .A race for autopilot dominance is giving China the edge in autonomous driving[J].MIT Technology Review,2023,126(6):10-11.
[5] Helmi A ,Samir N .Autopilot Design for an Unmanned Surface Vehicle Based on Backstepping Integral Technique with Experimental Results[J].Journal of Marine Science and Application,2023,22(3):614-623.
[6] Claudia S ,Heribert S ,Eva M , et al.Autopilot functionality and self-destructive behavior in patients with complex dissociative disorders-A qualitative study.[J].Psychological trauma : theory, research, practice and policy,2023.