摘要 該文提出了一種基于聯(lián)邦學習的高速監(jiān)控圖像智能分析技術(shù),旨在通過集成多個主體的數(shù)據(jù)資源來提高圖像數(shù)據(jù)處理的效率和準確性,同時確保數(shù)據(jù)的隱私和安全。引入了一個專為高速圖像數(shù)據(jù)設(shè)計的新型聯(lián)邦學習框架,各參與主體在本地通過數(shù)據(jù)訓練深度學習模型,最終交由數(shù)據(jù)中心完成全局模型參數(shù)的集中更新,能避免數(shù)據(jù)和模型的直接交互,有效保護了數(shù)據(jù)隱私。試驗結(jié)果顯示:該技術(shù)在不犧牲隱私的情況下,能實現(xiàn)高效的深度學習,并能達到與中心化處理相當?shù)膶W習性能。
關(guān)鍵詞 聯(lián)邦學習;高速監(jiān)控圖像智能分析;人工智能
中圖分類號 U495 文獻標識碼 A 文章編號 2096-8949(2025)04-0007-03
0 引言
在當今社會,高速公路運行狀態(tài)的有效監(jiān)控對于確保交通安全、流暢以及及時響應(yīng)緊急情況至關(guān)重要。隨著監(jiān)控設(shè)備的普及和技術(shù)的進步,產(chǎn)生的圖像數(shù)據(jù)量呈爆炸式增長,傳統(tǒng)的人工圖像分析方法已經(jīng)無法滿足快速、準確處理大規(guī)模數(shù)據(jù)的需求。因此,智能圖像分析技術(shù)[1]成為研究的熱點,并以其自動化處理和深入分析的能力,顯著提高了監(jiān)控系統(tǒng)的效率和反應(yīng)速度。
隨著圖像分割、識別、分類等技術(shù)的發(fā)展,越來越多的領(lǐng)域都開始采用計算機視覺的方案代替原有的人工圖片識別與標注,例如交通擁堵識別[2]、交通圖像檢測[3]。但針對某一具體問題訓練圖像識別模型卻往往需要消耗大量的算力與物質(zhì)資源,這為缺乏計算力資源的傳統(tǒng)工業(yè)領(lǐng)域帶來了相當大的困擾。因此McMahan等[4]研究者提出了聯(lián)邦學習——一種新的分布式算力共享的學習方法,旨在讓多個參與者協(xié)同訓練一個共享模型。在聯(lián)邦學習中,每個參與者(可以是設(shè)備、邊緣節(jié)點、組織等)都維護其本地數(shù)據(jù),并在本地對模型進行訓練。然后,本地訓練的模型參數(shù)被匯總到中心服務(wù)器上,以更新全局共享模型,再次分發(fā)給各個參與者。這個過程周期性地重復,以逐步提升全局模型的性能。
現(xiàn)有高速公路監(jiān)控數(shù)據(jù)存在數(shù)據(jù)來源主體多、各主體間互不從屬、各主體訓練資源有限等眾多問題,這導致能在實際應(yīng)用中發(fā)揮作用的高速監(jiān)控圖像數(shù)據(jù)量較小。通過聯(lián)邦學習將各主體數(shù)據(jù)進行整合訓練,能達成較好的高速公路監(jiān)控圖像識別與分析的效果。
該文主要研究成果有:(1)提出了一種基于聯(lián)邦學習的高速公路監(jiān)控圖像智能分析技術(shù),旨在提高圖像數(shù)據(jù)處理的效率和準確性,同時確保交通數(shù)據(jù)的隱私和安全;(2)介紹了一種聯(lián)邦學習框架,專為高速圖像數(shù)據(jù)設(shè)計,能夠有效處理大規(guī)模圖像數(shù)據(jù),并在多點間實現(xiàn)協(xié)同學習而無須共享原始圖像數(shù)據(jù);(3)通過試驗,驗證了該方法在保護數(shù)據(jù)隱私的同時,實現(xiàn)了與傳統(tǒng)中心化方法相當?shù)男阅堋?/p>
1 研究現(xiàn)狀
高速監(jiān)控圖像智能分析一直是交通領(lǐng)域的研究重點之一,很多學者都曾提出過相應(yīng)解決方案。曹科[5]提出一種結(jié)合云計算和深度學習的高速公路圖像監(jiān)控智能分析系統(tǒng),旨在解決現(xiàn)有系統(tǒng)壓力和差異,實現(xiàn)全國統(tǒng)一的智能圖像監(jiān)控;萬敏達等[6]在其研究中介紹了一種基于深度學習的廣深高速公路圖像智能分析系統(tǒng),該系統(tǒng)能夠自主學習并智能識別多種異常事件,實現(xiàn)自動報警,同時構(gòu)建高速公路大數(shù)據(jù)平臺,提供準確的數(shù)據(jù)分析;朱國剛等[7]探討了使用深度學習等AI技術(shù)解決高速公路圖像監(jiān)控中存儲、監(jiān)看誤差及資源利用不足問題,建立基于大數(shù)據(jù)的圖像智能分析平臺,以提升高速公路運營管理和服務(wù)的科學性和效率。在現(xiàn)有文獻中,已證明通過深度學習能有效完成交通事件、圖像、視頻分析的問題,但并未解決在隱私保護與安全數(shù)據(jù)共享環(huán)境下,由各交通分支機構(gòu)在數(shù)據(jù)與模型不出域的條件下,完成深度學習模型訓練的問題。聯(lián)邦學習作為一種新的分布式學習方法,在諸多領(lǐng)域廣受好評。McMahan等[4]研究者首次提出一種基于迭代模型平均的聯(lián)邦學習方法,用于在分布式數(shù)據(jù)上高效地學習深度網(wǎng)絡(luò),該方法能有效地利用多平臺的深度學習算力,實現(xiàn)安全、高效、可靠的深度學習?;诖?,該文提出通過聯(lián)邦學習解決交通領(lǐng)域內(nèi)的分布式深度學習問題。
2 針對高速公路監(jiān)控圖像的聯(lián)邦學習架構(gòu)
通過采用橫向聯(lián)邦學習的框架,能解決算力分散、數(shù)據(jù)利用率不高的問題。在高速公路數(shù)據(jù)中心的應(yīng)用場景下,通過該框架,整合各主體的數(shù)據(jù)資源,進行統(tǒng)一的訓練,以期實現(xiàn)更高效的高速監(jiān)控圖像識別與分析功能。
聯(lián)邦學習的基本架構(gòu)如圖1所示。
(1)數(shù)據(jù)采集:在該架構(gòu)中,各路段分中心作為核心參與者,負責高速公路監(jiān)控圖像基礎(chǔ)數(shù)據(jù)的生產(chǎn),并保證其數(shù)據(jù)質(zhì)量滿足總數(shù)據(jù)中心平臺訓練要求。
(2)數(shù)據(jù)融合:在該架構(gòu)中,總數(shù)據(jù)中心負責整合各路段提供的訓練數(shù)據(jù),完成數(shù)據(jù)驗證與數(shù)據(jù)對齊等工作,最后將對齊后數(shù)據(jù)標簽返還給參與者。
(3)模型訓練與參數(shù)上傳:在該架構(gòu)中,各級路段分中心利用本地數(shù)據(jù)在中央服務(wù)器的指引下完成模型訓練,并向中心服務(wù)器同步模型參數(shù)。
(4)交通圖像識別:在該架構(gòu)中,各級路段分中心既可以通過本地算力與訓練模型完成交通圖像的本地識別與分析,亦可以申請由中心服務(wù)器完成算力分配與圖像分析。
聯(lián)邦學習的本質(zhì)是為數(shù)據(jù)共享、模型可信的多方深度學習提供條件。通過構(gòu)建聯(lián)邦學習模型,能夠有效地解決在數(shù)據(jù)不出域,數(shù)據(jù)可用不可見要求下的實現(xiàn)深度學習模型的訓練。
3 高速監(jiān)控圖像智能分析
基于深度學習模型與聯(lián)邦學習技術(shù),構(gòu)建高速監(jiān)控圖像智能分析方案,能在參與訓練的各主體間數(shù)據(jù)相互獨立的情況下,實現(xiàn)協(xié)同的深度學習模型訓練。該文采用橫向聯(lián)邦學習框架構(gòu)建了一個實現(xiàn)數(shù)據(jù)與算力資源整合,完成高速監(jiān)控圖像學習的框架。目前針對高速監(jiān)控圖像,需要進行的識別主要有車輛信息識別,車輛狀態(tài)識別兩類。該文選擇ResNet18模型進行圖像智能分析,驗證前文構(gòu)建的聯(lián)邦學習框架的有效性。
ResNet18[8]模型是一個經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)模型,具有18層卷積神經(jīng)網(wǎng)絡(luò),主要用于圖像識別、分類和目標檢測等任務(wù)。其主要特點在于引入了殘差連接,旨在解決傳統(tǒng)CNN網(wǎng)絡(luò)中的梯度消失和梯度爆炸問題。具體的聯(lián)邦深度學習模型如圖2所示,在聯(lián)邦學習模型部分,該文采用了ResNet18的深度學習算法模型。
在監(jiān)控圖像識別任務(wù)中,ResNet18模型需要進行數(shù)據(jù)預處理,包括圖像的縮放、歸一化和數(shù)據(jù)增強等步驟,以提高模型的訓練效果和泛化能力。將標注數(shù)據(jù)輸入到ResNet18模型中進行訓練,增強其識別車輛圖像特征能力和車流類別判別能力。
4 試驗設(shè)計、結(jié)果與分析
該文為驗證通過平臺進行圖像識別的技術(shù)的準確性,評估試驗結(jié)果與討論平臺表現(xiàn),主平臺部署在云服務(wù)器上,其云服務(wù)器擁有一張A100顯卡,1TB的內(nèi)存,分別采用了六臺擁有兩張4090顯卡的電腦,模擬參與平臺訓練的服務(wù)器,深度學習相關(guān)代碼用python語言編寫。
(1)聯(lián)邦學習效率評估。
聯(lián)邦學習的效率問題,一直是學術(shù)界關(guān)注的重點,該文評估了聯(lián)邦學習各個流程的時間花費。聯(lián)邦學習框架完成數(shù)據(jù)入庫、數(shù)據(jù)融合、模型訓練、參數(shù)上傳、識別結(jié)果反饋五個主流程的流程平均時間為3.09 s,可見該技術(shù)的時間花費是可接受的。
(2)聯(lián)邦學習結(jié)果驗證。
該文部署了多個深度學習模型,驗證不同模型的學習效果。所有模型的訓練輪次均設(shè)定在100輪,批量大小為16,初始學習率為0.001,在模型無提升后,訓練終止。為便于驗證模型識別的準確性,選擇高速公路監(jiān)控視頻圖像數(shù)據(jù)集進行驗證,將數(shù)據(jù)集中70%的數(shù)據(jù)選作訓練集,20%作為驗證集,10%作為測試集。
為了衡量平臺進行聯(lián)邦學習的效果,除方法性驗證的ResNet18模型之外,亦選擇了ResNet101,EfficientNet與MobileNet-V2等其他三個基準模型完成圖像識別任務(wù)。并采用識別準確度作為衡量模型預測的準確性,識別準確度越高,說明模型識別與訓練效果越好。如圖3所示,采用該平臺部署不同模型進行聯(lián)邦學習,其精確度在交通圖像數(shù)據(jù)集上均能達到90%以上的識別精確度,其訓練效果與單節(jié)點深度學習精度相近,不受訓練平臺影響。
5 總結(jié)
該文針對高速公路監(jiān)控系統(tǒng)中圖像數(shù)據(jù)處理的效率和隱私保護問題,成功應(yīng)用聯(lián)邦學習技術(shù)。通過橫向聯(lián)邦學習框架的實施,不僅解決了數(shù)據(jù)孤島問題,還在保護個體數(shù)據(jù)隱私的前提下,實現(xiàn)了數(shù)據(jù)和算力的有效共享。通過使用深度學習模型如ResNet18,該研究展示了聯(lián)邦學習在處理大規(guī)模分散數(shù)據(jù)時的有效性和可行性,最終,該系統(tǒng)展示了優(yōu)秀的圖像識別精度和處理效率,驗證了聯(lián)邦學習在智能交通系統(tǒng)中的應(yīng)用潛力。
參考文獻
[1]王慶.基于人工智能的圖像識別與分類技術(shù)分析[J].集成電路用, 2024(2):164-165.
[2]余暢,蘇躍江,韋清波.基于門架數(shù)據(jù)的高速公路擁堵識別研究[J].科技和產(chǎn)業(yè), 2023(22):113-118.
[3]張河山,譚鑫,范夢偉,等.無人機高空航拍視角下小尺度車輛精確檢測方法[J/OL].交通運輸系統(tǒng)工程與信息, 1-12[2024-05-06]
[4]McMahan Brendan, Moore Eider et al.Proceedings of the 20th International Conference on Artificial Intelligence and Statistics, PMLR 54:1273-1282, 2017.
[5]曹科.基于云平臺的高速公路視頻監(jiān)控智能分析系統(tǒng)研究與實現(xiàn)[D].成都:西南交通大學, 2021.
[6]萬敏達,王昌偉,喬建軍,等.廣深高速智能監(jiān)控分析系統(tǒng)[J].中國交通信息化, 2020(11):102-106.
[7]朱國剛,楊壯,王忠旗,等.基于Al的高速監(jiān)控視頻智能化研究及應(yīng)用實踐[J].中國交通信息化, 2019(S1):192-196.
[8]K. He, X. Zhang, S. Ren and J. Sun, \"Deep Residual Learning for Image Recognition,\" 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, NV, USA, 2016, pp. 770-778.
收稿日期:2024-08-06
作者簡介:李曉春(1974—),女,本科,高級工程師,研究方向:交通工程。