邱 彬,李廣友
(1.清華大學汽車安全與節(jié)能國家重點實驗室,北京 100084;2.工業(yè)和信息化部裝備工業(yè)發(fā)展中心,北京 100846;3.中國汽車技術研究中心有限公司,天津 300300)
智能網聯汽車作為新一輪科技革命和產業(yè)融合創(chuàng)新的重要載體,已成為全球汽車產業(yè)發(fā)展的重要戰(zhàn)略方向,正在全面重構交通出行模式和社會運行方式。由于搭載先進傳感器,融合網絡通訊技術,具備智能決策和控制等特點,智能網聯汽車在運行過程中將會產生大量的基礎數據,其與人工智能、大數據等新一代信息技術的深度融合,不僅可以讓汽車向高等級自動駕駛演進,幫助政府部門做好安全監(jiān)管和事故預警,還能在新車改進研發(fā)、個性化服務等多方面發(fā)揮重要作用。
然而,在有效挖掘和利用智能網聯汽車數據的潛在價值,推動產業(yè)生態(tài)蓬勃發(fā)展的同時,不可避免地帶來了車輛運行安全、用戶隱私泄露等一系列數據安全問題。2016年,來自挪威安全公司Promon的專家在入侵用戶手機后,竊取了某車主app的用戶名和密碼等數據,然后登錄該品牌車聯網服務平臺,進而可以隨時對車輛定位、追蹤,并可解鎖、啟動車輛。
我國高度重視數據安全監(jiān)督管理,2020年,國家發(fā)改委等11部門聯合發(fā)布的《智能汽車創(chuàng)新發(fā)展戰(zhàn)略》中提出:建立覆蓋智能汽車數據全生命周期的安全管理機制,明確相關主體的數據安全保護責任和具體要求。實行重要數據分類分級管理,確保用戶信息、車輛信息、測繪地理信息等數據安全可控。
如何在保障公共安全和個人隱私的基礎上,充分促進數據潛在價值的挖掘利用,是發(fā)展智能網聯汽車新技術、新業(yè)態(tài)必須要面對和解決的問題。因此,有必要深入研究智能網聯汽車數據權屬特點及安全機制等關鍵問題,在國家關于隱私保護和數據安全管理要求的框架下,提出行業(yè)和企業(yè)規(guī)范數據采集處理、強化數據挖掘應用的策略建議,以提升車聯網大數據綜合應用和數據安全水平。
與傳統(tǒng)汽車僅能提供簡單的信息服務及執(zhí)行駕駛員的駕駛操作不同,智能網聯汽車能夠提供強大豐富的娛樂交互功能,且當處于自動駕駛或輔助駕駛模式時,需要采集大量的外部環(huán)境數據,接收高精地圖、路測單元關于道路信息的數據,并通過感知、決策、控制等復雜算法進行分析運算,從而達到智能控制車輛的目的。因此,智能網聯汽車數據除具有一般大數據的4V特點(海量、多樣、高速、價值)外,還具有以下3個方面的顯著特點。
智能網聯汽車具有融合了攝像頭、激光雷達、毫米波雷達等一種或多種方案組成的感知系統(tǒng),強大的數據采集能力,長時間在公共道路上行駛,使其可以獲得海量、高精度的關于車輛周邊行人、車輛和建筑物等目標物的詳細信息。
一方面,自動駕駛系統(tǒng)依靠采集和接收的外部環(huán)境數據進行分析運算,產生驅動車輛運行狀態(tài)改變的控制數據,鑒于目前自動駕駛軟硬件系統(tǒng)的復雜性和精密性,這其中任何一部分數據被篡改、破壞或丟失都可能對駕駛決策產生影響,進而造成交通事故。另一方面,車輛在道路上行駛,實時連續(xù)采集環(huán)境數據時,如果沒有對這些數據進行規(guī)范采集和有效監(jiān)管,當匯聚處理大量智能網聯汽車連續(xù)行駛的數據時,將會帶來難以預估的信息安全問題。特別是會涉及軍事管理區(qū)等敏感地理信息,非法采集或泄露后將對社會安全乃至國家安全帶來巨大風險。
智能網聯汽車作為下一代移動智能終端,在實現用戶便捷登錄的過程中,需要采集賬戶密碼、臉部特征、指紋聲紋等信息,在用戶與車機交互的過程中,會涉及操作習慣、應用記錄、語音和圖像等信息,在車輛行駛過程中,記錄行程軌跡、地理位置、駕乘習慣等信息。這些數據一旦泄露、非法提供或濫用將嚴重危害駕乘人員的身心健康和財產安全。
隨著大數據產業(yè)的快速發(fā)展和應用落地,其巨大價值和潛能逐漸被全社會所普遍認知,數據作為基礎性戰(zhàn)略資源的地位日益凸顯。然而關于數據權屬問題一直沒有形成統(tǒng)一的看法,這在一定程度上阻礙了數據的交互共享和挖掘應用。一方面,為避免數據被非法應用及交易帶來個人隱私的極大傷害,并產生難以預計的信息安全問題,應認為這部分數據的權屬為數據產生主體。另一方面,為促進數據融合應用推動產業(yè)轉型升級,同時考慮企業(yè)對于數據的采集存儲等投入了大量成本,且只有經過分析挖掘之后的數據才有價值等因素,應認為這部分數據的權屬為企業(yè)。智能網聯汽車數據也是如此。
為了便于進行權屬分析,將智能網聯汽車在運行過程中產生的大量數據分為5類,見表1。對于基礎屬性數據,一般可以通過汽車公告信息和企業(yè)公開發(fā)布的信息來獲取,可認為屬于公開數據。對于環(huán)境感知數據,裝載了攝像頭、雷達等先進感知設備的車輛在自動駕駛過程中,需要實時采集分析車外行人、車輛、建筑物等目標物,以及道路狀況等數據,這部分數據應當按照我國測繪相關法律要求執(zhí)行。對于運行控制數據,雖然從直觀上不能識別出自然人,但其是駕駛員在使用車輛過程中產生的信息,且表征了自然人的駕駛習慣和性格愛好等信息,根據《中華人民共和國個人信息保護法》第4條“個人信息是以電子或者其他方式記錄的與已識別或者可識別的自然人有關的各種信息,不包括匿名化處理后的信息”,可認為也屬于個人信息。特別地,當車輛的自動化等級達到L3以上級別時,雖然駕駛員不參與車輛運行決策,但運行控制數據能夠表征車輛的運行狀態(tài)信息,而車輛屬于駕駛員的常用設備,所以為了防止?jié)撛诘膫€人信息安全風險,仍然應當將這部分數據看做個人信息。對于應用服務數據,同樣包含著“可識別的自然人有關的各種信息”,通過收集、匯聚和分析可以進行特征建?;蛐袨轭A測,在開展數據應用時不應與特定自然人關聯。對于用戶的個人數據,一旦泄露或者被非法使用,可能導致個人受到歧視,或者人身、財產安全受到嚴重危害,屬于敏感個人信息。
表1 智能網聯汽車數據分類及描述
因此,除基礎屬性信息外,其余數據全部屬于個人信息或敏感個人信息,企業(yè)應在個人知情并同意的基礎上進行采集和應用,且數據主體對這些數據有使用、交易、刪除等權利。需要明確的是,當這些數據經過差分隱私算法、匿名算法等處理,使個人信息主體無法被識別且不能被復原之后,根據《中華人民共和國個人信息保護法》第4條,這部分數據便不再屬于個人信息,企業(yè)可以在能夠充分保證數據安全的基礎上,對數據進行挖掘應用及交易共享,促進智能網聯汽車技術的進步及產業(yè)生態(tài)的發(fā)展,更好地服務和提升交通便捷及出行安全。
作為產業(yè)轉型升級的基礎性戰(zhàn)略資源,智能網聯汽車數據既能推動自動駕駛技術的迭代更新,又能促進產業(yè)生態(tài)和商業(yè)模式的創(chuàng)新發(fā)展,但蘊含其中的個人隱私和關鍵地理信息泄露等數據安全問題同樣讓人擔憂。隨著智能網聯汽車量產化進程的不斷加快,其具備的數據采集分析能力大幅增強,企業(yè)對于數據挖掘應用的重視和投入程度也顯著提高,引起了國家政府部門和民眾對于數據規(guī)范管理的重視。為此,各主要汽車生產國家正在研究探索數據管理要求,并且相繼出臺了一些標準法規(guī),用以約束整車企業(yè)及第三方服務商合理進行數據的采集應用,在數據安全可控的前提下促進產業(yè)的健康發(fā)展。
2017年9月,美國眾議院通過了HR3388號《自動駕駛法案》,該法案要求開發(fā)者制定需要的數據隱私保護計劃,遵循選擇同意、最小必要、公開透明、主體參與等信息處理原則,同時說明如果個人信息經過匿名化處理或無法與個人關聯,則無需采取前述保護措施。2020年4月,《確保美國在自動駕駛汽車技術中的領導地位:自動駕駛汽車4.0》發(fā)布,其確定的十大技術原則之一便是:確保隱私和數據安全,強調美國政府將在自動駕駛汽車技術開發(fā)和集成的過程中整體考慮保護數據安全和公眾隱私。
歐盟《通用數據保護條例》(GDPR)可以說是目前最嚴苛的數據保護法,詳細制定了歐盟企業(yè)和非政府組織等機構收集、儲存、處理和轉移個人數據的相關規(guī)則。2021年3月,歐盟在GDPR框架下發(fā)布了《車聯網個人數據保護指南》,該指南從數據保護、本地化處理、匿名化和假名化、數據主體權利的保障等方面提出了處理原則,如指紋等生物識別數據應當存儲在車內,并以基于駕駛行為的保險、自動緊急呼叫等5個場景為示例,給出了個人數據采集存儲、數據主體權利等數據處理參考建議。
日本早在2005年就實施了《個人信息保護法案》,為防范大數據時代個人信息保護中的各類風險,于2015年開始進行了大幅修正,并在2017年開始實施修訂版。新版法案中將個人信息定義為能夠識別特定個人或者含有個人識別符號的信息,從總則、有關機構職責、個人信息保護的規(guī)則、個人信息處理業(yè)者的義務、個人信息保護委員會、附則、罰則等7個方面進行了規(guī)定。
作為致力于推動互聯網和智能網聯汽車產業(yè)快速發(fā)展的國家,我國也在逐步加快相關領域的立法和規(guī)范管理,《數據安全法》、《個人信息保護法》已正式發(fā)布執(zhí)行,對企業(yè)進行數據處理活動和個人信息權益保護等作出了詳細要求。聚焦汽車領域,工業(yè)和信息化部于2021年4月發(fā)布的《智能網聯汽車生產企業(yè)及產品準入管理指南(征求意見稿)》,提出了數據安全的管理要求,指出企業(yè)應建立數據安全保障機制和管理制度,在合法合規(guī)的前提下進行采集、存儲和應用,同時應對部分關鍵行車數據進行采集分析,以便進行場景還原和事故判責。7月份發(fā)布的《關于加強智能網聯汽車生產企業(yè)及產品準入管理的意見》,更加明確了強化數據安全管理能力的具體要求,比如,企業(yè)應當建立健全汽車數據安全管理制度,實施數據分類分級管理,建設數據安全保護技術措施等。此外,地方政府也積極結合區(qū)域特點研究出臺智能網聯汽車管理條例等文件,均將數據安全問題擺在突出位置。如《深圳經濟特區(qū)智能網聯汽車管理條例(征求意見稿)》明確提出:車輛應具有行車數據記錄、車輛位置等設備,并將相關數據接入市政府監(jiān)管平臺,同時應保障網絡安全、數據安全等,禁止非法收集利用個人信息及涉及國家安全的數據。
智能網聯汽車數據在推動產業(yè)發(fā)展進步方面的巨大作用,使相關企業(yè)對于數據采集應用的投入也越來越大,工業(yè)和信息化部印發(fā)的《車聯網(智能網聯汽車)產業(yè)發(fā)展行動計劃》提出:通過車聯網實現對車輛運行數據的采集、分析與運用,形成運行安全保障、個性化保險、透明化維修等多樣化的應用服務。國內外各大整車企業(yè)正在致力于建設車聯網平臺,用以采集、存儲和分析智能網聯汽車數據,社會各方也在積極探索釋放數據的潛在價值,截至目前,產業(yè)化應用場景主要圍繞以下幾個方面。
當連續(xù)實時記錄智能網聯汽車的大量數據后,便可以有效監(jiān)測和統(tǒng)計車輛真實的運行工況、運行狀態(tài)等信息,同時對自動駕駛系統(tǒng)等關鍵部件的性能等進行分析評價。在已經開放了公開道路測試的城市,如北京、廣東等地都要求車輛具備數據采集和存儲的能力,同時將相關數據上傳至統(tǒng)一的平臺,從而對自動駕駛模式下車輛運行的安全性進行監(jiān)管和評估。這些數據可以用作事故調查與分析,關于數據記錄的國家強制性標準《智能網聯汽車自動駕駛數據記錄系統(tǒng)》和《汽車事件數據記錄系統(tǒng)》正在起草過程中。
通過匯聚、分析與決策控制及感知、運行等相關的數據,可以對駕駛員的駕車行為、車輛的健康狀態(tài)、使用壽命等方面進行分析或預測。比如,通過分析用戶操控數據(駕駛技巧相關)、環(huán)境感知數據(行駛工況相關)、車輛運行數據(車輛綜合性能相關)等數據,可以提供基于使用量確定保費的保險,同時面向用戶提供維保提醒、遠程診斷等多種服務。需要注意的是,在采集處理用戶相關數據時必須事先征得用戶的同意,并提供暫停收集及刪除數據等功能,在向企業(yè)數據中心進行數據傳輸時應為脫敏數據,以保證用戶基本權益。
智能網聯汽車自動駕駛功能的實現依賴于高性能的計算芯片和決策控制算法,由于駕駛場景不可能完全通過抽象窮舉,因此,穩(wěn)定、安全、智能的決策控制算法依靠大量真實的場景數據、駕駛數據作為輸入,一方面是進行調整優(yōu)化策略、訓練算法,另一方面則是對其進行仿真驗證和性能評估。
智慧城市是未來城市建設的重要方向,智能網聯汽車作為智慧城市的參與者,也將為其規(guī)劃設計提供大量的有價值的數據。比如,通過分析車輛在一個城市的流動,結合車速等數據,可以分析評估道路的擁堵情況,從而有針對性地對交通路網進行改造升級。智能網聯汽車數據還可以同城市交通、公安等數據進行融合應用,衍生出智能交通信號燈、高危駕駛場景分析等多種功能。
隨著各國對于數據安全管理工作的重視,以及智能網聯汽車大數據融合應用在推動產業(yè)升級方面的作用逐漸顯現,整車企業(yè)都在積極推進相關研究工作,并且在車內預制了TBOX數據記錄設備以收集整車數據,但是由于數據資源分散,數據類型不統(tǒng)一,以及隱私保護等眾多客觀原因,目前數據分析應用產生的實際價值較少,更多停留在了統(tǒng)計分析的層面。為此,提出以下建議:
在我國《網絡安全法》《數據安全法》等法律法規(guī)的框架下,緊密結合智能網聯汽車產業(yè)數據采集與分析應用實際,研究建立適用于產業(yè)數據發(fā)展的數據安全管理辦法,規(guī)范行業(yè)數據采集及處理活動,指導相關企業(yè)加強個人信息和重要數據保護,進一步明確重要數據范圍,給出企業(yè)采集、處理、交互數據的基本原則,尤其是匿名化和脫敏處理的要求,提高數據安全保護水平,促進行業(yè)健康發(fā)展。
研究建立統(tǒng)一的數據分類、分級及采集標準規(guī)范,共同進行數據匿名化及加密技術研究攻關,對采集數據類型、格式要求、傳輸協議、加密機制等進行規(guī)范,同時建立數據交互與綜合應用公共平臺,將不同企業(yè)采集的數據匯聚成行業(yè)海量數據資源池,解決僅靠單一車企采集足夠體量數據需要付出巨大的財力和時間成本等問題,以支撐智能網聯汽車企業(yè)及第三方應用服務商進行合規(guī)、高效的數據共享,并進行大規(guī)模商業(yè)化應用。
圖1 智能網聯汽車數據交互與綜合應用公共服務平臺架構
由法務部門負責根據國家有關規(guī)定,對企業(yè)采集處理數據的合規(guī)性進行審核把關。同時成立專門的大數據部門,建立規(guī)范的數據采集、傳輸、處理、分析流程及要求,按照要求對數據進行分級分類管理,加強數據安全審計管理,建立企業(yè)數據綜合平臺,統(tǒng)一存儲和管理企業(yè)內各品牌車輛采集的數據,并且基于脫敏數據進行分析挖掘,向技術研發(fā)、售后維保等部門開放數據應用接口,根據業(yè)務需要,協作開展研發(fā)改進、性能分析、金融保險等融合應用。
綜上所述,智能網聯汽車大數據擁有廣闊的應用場景,比如在車輛運行監(jiān)測、研發(fā)改進、測試評價、個性化服務等方面,但同時也面臨著隱私保護、數據安全等國家及消費者高度重視的問題,企業(yè)和行業(yè)應當協同發(fā)力,統(tǒng)一數據交互標準規(guī)范,共建數據綜合應用平臺,合作探索數據多場景綜合應用,最終實現數據驅動技術進步、數據促進產業(yè)發(fā)展的格局。