齊美旭 施文 盛志恒 李明東
摘 要:基于計算機視覺的被動檢測采用攝像頭作為采集工具,通過采集到的圖像信息進行人類行為的檢測,通常應用于室外行人檢測以及人識別等領域。而基于射頻指紋信號的被動檢測采用射頻信號作為感知主體(常用藍牙、WiFi等射頻信號),通常應用于室內(nèi)等需要保證隱私場景中的人類行為檢測。本文針對室外和室內(nèi)兩類場景,分別使用基于計算機視覺的方法以及基于WiFi信號的方法實現(xiàn)人類行為檢測的任務目標。本文所提出的修改后YOLOv5s算法在行人檢測方面明顯優(yōu)于同類算法,具有88.65%的mAP性能,并且經(jīng)過輕量化以后,占用內(nèi)存僅為原模型的八分之一,顯著降低了內(nèi)存占用率,
關(guān)鍵詞:機器學習;計算機視覺;YOLOv5s
一、引言
本文以室內(nèi)場景下也可以作為一種新型的人機交互來執(zhí)行智能醫(yī)療監(jiān)控諸如智慧家居或者老年人跌倒檢測,或者可以通過識別人類行為來應用于交互式體感游戲等。而隨著深度學習的興起和廣泛應用,人類行為檢測的實時性和準確性也都有了大幅度的提高。大多數(shù)傳統(tǒng)的人類行為檢測系統(tǒng)使用佩戴式傳感器進行檢測和識別。盡管隨著技術(shù)的發(fā)展,傳感器的尺寸變得更小,數(shù)據(jù)收集變得更有效,但基于傳感器的檢測系統(tǒng)仍然面臨著部署的限制。特別是隨著傳感范圍和規(guī)模的不斷增加,部署和維護大規(guī)模傳感系統(tǒng)的成本也會急劇增加。
二、不同場景下基于計算機視覺的行為檢測分類研究
隨著現(xiàn)如今無線通信的迅猛發(fā)展,無線電環(huán)境的分布十分廣泛,人類在這些無線電環(huán)境當中的各項活動會引起環(huán)境中信號傳輸?shù)淖兓虼送ㄟ^檢測和分析這些信號的變化則可以判斷出環(huán)境中的人類行為。傳統(tǒng)的感知方法為接收信號強度指示,RSSI廣泛應用于室內(nèi)定位和運動物體被動跟蹤等場景當中。RSSI的采集十分方便,但是在實際的傳播環(huán)境當中,無線信號會受到多個障礙物的影響,從而產(chǎn)生多徑效應,因此RSSI的穩(wěn)定性較差,很難滿足現(xiàn)如今日益復雜的傳感任務的需求。為了解決這個問題,信道狀態(tài)信息這一指標逐漸成為分析的主流,并且逐漸取代了RSSI的應用場景。
外場景下的計算機視覺領域,人類行為檢測作為目標檢測的一個分支,主要的檢測思路與傳統(tǒng)的目標檢測方法相一致,主要分為了三個階段。第一階段首先在目標區(qū)域生成目標區(qū)域提案,第二階段則分別提取各個提案當中的特征信息,最后的階段則是根據(jù)提取到的特征進行分類。然而,考慮到預測精度與預測速度,傳統(tǒng)的檢測方法已經(jīng)不能滿足當今社會上的各項需求。而深度學習具備精度高、訓練速度快、以及計算量較低等優(yōu)勢,逐漸成為檢測方法中的主流。
三、場內(nèi)外環(huán)境的輕量化邊緣設備設置方法研究
邊緣設備的優(yōu)勢在于成本低、便于大范圍應用,但是劣勢則在于其設備的局限性,往往不適合大型算法的部署。上一章節(jié)當中我們所使用的YOLOv5算法最終的占用內(nèi)存大小約為190MB,即使是優(yōu)化后的YOLOv5s算法內(nèi)存占用也達到了55MB左右,過大的模型占用內(nèi)存不利于現(xiàn)代環(huán)境實時通信、檢測的需求,因此針對模型進行輕量化操作非常有必要。
(一)輕量化網(wǎng)絡剪枝流程
神經(jīng)網(wǎng)絡的輕量化近些年逐漸興起,主要的想法就是在不顯著降低模型性能的前提下,針對DNN進行算法模型的壓縮或者計算加速。在一般情況下,輕量化網(wǎng)絡的方法主要有四種,分別為DNN網(wǎng)絡參數(shù)的剪枝以及量化、低秩因子分解、轉(zhuǎn)移/緊湊卷積濾波器以及知識蒸餾等。
在使用轉(zhuǎn)移/緊湊卷積濾波器時,CNN的參數(shù)能有效保證針對輸入圖像的平移不變性,能成功保證訓練深度模型的時候不會導致嚴重的過擬合。雖然理論目前尚未得到證明,針對CNN的平移不變性以及網(wǎng)絡參數(shù)卷積權(quán)值共享這兩點至關(guān)重要。
采用了輕量化網(wǎng)絡剪枝的方法,對YOLOv5s網(wǎng)絡進行剪枝優(yōu)化,具體的流程如圖1所示。首先將初始化的YOLOv5s網(wǎng)絡進行稀疏化,即信道稀疏正則化訓練,稀疏化過后則通過小比例因子對不同通道進行修剪,之后將修剪后的網(wǎng)絡進行微調(diào),反復循環(huán)這三項操作最終就可以得到一個緊湊型的網(wǎng)絡。
BN層網(wǎng)絡剪枝優(yōu)化,以卷積層為例,由于比例因子存在明顯差異,部分輸入層的通道比例因子可能無限接近于0,即這些層對于輸出層的影響十分有限,因此我們可以將這些層進行剪枝和修剪。通過迭代這個過程,最終可以得到一個非常緊湊的模型。
(二)基于WiFi信號的感知人類行為檢測方法
Wi-Fi環(huán)境中,人類進行不同的行為,會導致環(huán)境中分布的信號產(chǎn)生不同程度反射和衍射,同時改變信號的傳輸路徑和分布。針對這些Wi-Fi信號路徑所產(chǎn)生的變化,我們可以進行算法研究,從而識別不同的行為動作。人的運動行為導致了場景中Wi-Fi信號的傳播發(fā)生了不同程度的變化。信號接收器則可以收集變化前后各個傳播路徑的信號,將這些信號匯總最后生成并輸出CSI。
由于靜態(tài)路徑信號不受目標行為變化的影響,可以假定它是一個常數(shù)復值。假設A點和E點之間的距離很短,反射信號的幅度變化不大,因此也可以認為反射信號在該時間段內(nèi)為常數(shù)。從而得到最終的簡化CSI模型:
CSI數(shù)據(jù)預處理 由于環(huán)境噪聲和各種干擾的存在,采集到的CSI流無法直接訓練。因此,輸出CSI流需要經(jīng)過兩步預處理來提取特征,提取的特征將更有利于算法訓練,最終達到Wi-Fi感知的任務目標。預處理部分主要包括兩個部分,即CSI信號的去噪和轉(zhuǎn)換,以及特征提取。
信號去噪主要用于CSI振幅和相位噪聲的去除。相位方面,在實際Wi-Fi系統(tǒng)中,由于硬件不完善等原因,原始CSI測量值中存在相位偏移,如采樣時間偏移和采樣頻率偏移。具體如圖2所示。
四、總結(jié)
本章中主要探討了針對這類算法網(wǎng)絡的輕量化方法,首先進行了輕量化方法總結(jié),考慮到目前常用的輕量化網(wǎng)絡方法可能并不適用于本文的研究目標,因此以行人檢測算法為例,討論其神經(jīng)網(wǎng)絡剪枝的可能性。本章針對YOLOv5s網(wǎng)絡的BN層進行了剪枝可行性分析,首先針對網(wǎng)絡進行稀疏化工作,其次采用L1正則化將網(wǎng)絡比例因子進行調(diào)整,使原先正太分布的因子在逼近0時存在有效的可剪枝網(wǎng)絡層,通過剪枝去除等于0或者無限逼近0處60%的網(wǎng)絡層,最后對整體的網(wǎng)絡進行微調(diào),重復操作得到最終的緊密型網(wǎng)絡模型。
參考文獻:
[1]張大慶,張扶桑,吳丹,等.基于CSI的通信感知一體化設計:問題、挑戰(zhàn)和展望[J].移動通信,2022,46(05):9-16.
[2]桂冠,王潔,楊潔,等.基于深度學習的頻分復用大規(guī)模多輸入多輸出下行信道狀態(tài)信息獲取技術(shù)[J].數(shù)據(jù)采集與處理,2022,37(03):502-511.
基金項目:安徽省教育廳重點科研項目(項目號:2023AH052240),教育部高等教育司產(chǎn)學合作協(xié)同育人項目(項目號:202102223021),教育部高等教育司產(chǎn)學合作協(xié)同育人項目(編號:220904723130951),教育部高等教育司產(chǎn)學合作協(xié)同育人項目(項目號:202102049012)。