王 馳,曹 鵬,黃 慶,王 超,盛才良
(1.上海大學(xué) 精密機(jī)械工程系,上海 200444;2.中國航空工業(yè)集團(tuán)公司洛陽電光設(shè)備研究所,河南 洛陽 471023;3.江蘇永康機(jī)械有限公司,江蘇 無錫 214203)
柔性淺埋物是指聲順性相對于土壤、巖石等剛性物體較大、掩埋于1 米以內(nèi)的淺層地下目標(biāo)[1]。隨著對地下空間探索的不斷深入,關(guān)于淺層地下目標(biāo)探測技術(shù)的研究價(jià)值也愈發(fā)凸顯。淺層地下目標(biāo)包括管道管線、空洞、地下考古、地雷、未爆彈和地下軍事設(shè)施等。根據(jù)探測原理和手段的不同,常見的地下目標(biāo)快速探測技術(shù)有電磁探測[2]、光學(xué)成像探測[3]、原子核物理探測[4]和生物探測[5]等。這些探測技術(shù)各有特點(diǎn),其中電磁探測技術(shù)依據(jù)電磁波特性,適用于金屬掩埋物,但對于非金屬或者金屬含量極低的掩埋物卻無能為力。此外,利用傳感器捕獲的信號通常為原始信號,如何快速識別信號中蘊(yùn)含的淺埋物信息,是當(dāng)前地下目標(biāo)探測面臨的難題。
近年來,基于聲-地震耦合技術(shù)的柔性淺埋物探測方法取得一定的研究進(jìn)展[6-7]。在聲波激勵下,一部分能量通過動量作用及其空氣與土壤粒子的黏滯摩擦作用,以地震波的形式耦合到土壤中。從土壤與柔性淺埋物的特性阻抗差來分析,淺埋物因空腔結(jié)構(gòu)特點(diǎn),大部分慢縱波傳到淺埋物表面會發(fā)生強(qiáng)烈的反射和散射,引起淺埋物上方地表土壤發(fā)生有別于周圍土壤的振動。激光剪切散斑干涉技術(shù)能夠?qū)Σ煌裨O(shè)條件下柔性物體的振動形態(tài)清晰成像[8],獲得信息豐富的干涉條紋圖,為基于目標(biāo)檢測算法的柔性淺埋物的聲-振智能探測奠定基礎(chǔ)。
目標(biāo)檢測算法大致分為兩類,一類是以RCNN 系列為代表的基于候選區(qū)域的Two-stage算法[9-10],另一類是以YOLO 系列為代表的按回歸問題解決的One-stage 算法[11]。目標(biāo)檢測算法從誕生之日起就備受矚目,隨著計(jì)算機(jī)算力的日益強(qiáng)大,將算法部署于實(shí)際應(yīng)用的優(yōu)越性已經(jīng)在各行各業(yè)中得到體現(xiàn)。因此,為多種柔性淺埋物建立豐富的干涉條紋圖數(shù)據(jù)庫,利用目標(biāo)檢測算法對干涉條紋圖進(jìn)行快速識別,對于柔性淺埋物的大面積快速檢測具有重要意義。考慮柔性淺埋物智能化探測的實(shí)際需要,本文選用應(yīng)用廣泛、檢測快速的YOLO 系列算法,用于激光散斑干涉條紋圖的智能識別。利用基于目標(biāo)檢測算法的聲-光融合智能探測系統(tǒng),對給定實(shí)驗(yàn)環(huán)境下多種柔性淺埋物進(jìn)行激光散斑干涉條紋圖智能識別研究,分析多種柔性淺埋物的激光散斑干涉條紋圖的變化規(guī)律,構(gòu)建柔性淺埋物智能探測網(wǎng)絡(luò)模型,為柔性淺埋物的聲-振智能探測方法的研究提供一定的理論和技術(shù)基礎(chǔ)。
圖1 為激光剪切散斑干涉儀成像原理。當(dāng)激光照射到被測物體后發(fā)生漫反射,反射光進(jìn)入剪切元件中的分束鏡后進(jìn)行分束,一束光進(jìn)入平面鏡1,另一束光進(jìn)入平面鏡2,兩束光經(jīng)反射后再次進(jìn)入分束鏡并最終進(jìn)入CCD 相機(jī)。其中,經(jīng)平面鏡1 反射的像為原像,經(jīng)平面鏡2 反射的像為剪切像,二者因平面鏡2 的傾斜產(chǎn)生錯位,并在成像平面上相互干涉,形成干涉條紋圖。干涉條紋圖即是相位分布圖,代表相位等值線,包含光的相位信息。相鄰兩條紋之間有相同的相位差,而相位差又是光程差的反映,光程差中記錄了振動物體的位移信息。
YOLO 系列目標(biāo)檢測算法結(jié)構(gòu)簡潔,在工業(yè)[12]、醫(yī)療[13]和農(nóng)業(yè)[14]等諸多行業(yè)具有非常廣泛的應(yīng)用前景。YOLOv5 綜合了YOLOv3-SPP 和YOLOv4 的特性,適用于實(shí)時檢測。在綜合考慮模型的大小和精度后,選取YOLOv5s 模型構(gòu)建柔性淺埋物智能探測網(wǎng)絡(luò)模型。如圖2 所示,YOLOv5s 網(wǎng)絡(luò)結(jié)構(gòu)主要由輸入端、主干網(wǎng)絡(luò)、頸部及輸出端4 個部分組成[15]。
圖2 YOLOv5s 網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Network structure of YOLOv5s
輸入端由Mosaic 數(shù)據(jù)增強(qiáng)、自適應(yīng)錨框計(jì)算和自適應(yīng)圖片縮放三部分組成。Mosaic 數(shù)據(jù)增強(qiáng)方法的核心原理是將原始圖像經(jīng)過隨機(jī)裁剪、隨機(jī)縮放和隨機(jī)排列的方式拼接成一張新的圖像,再將新圖像輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。自適應(yīng)錨框計(jì)算將初始錨框的計(jì)算功能嵌入到模型訓(xùn)練過程中,使模型能自動計(jì)算不同數(shù)據(jù)集的最佳錨框。自適應(yīng)圖片縮放能夠在圖像縮放時填充最少的像素,從而保留更多的原始圖像信息,有利于提高推理速度。
主干網(wǎng)絡(luò)包含F(xiàn)ocus 結(jié)構(gòu)和CSP(Cross Stage Partial)結(jié)構(gòu)。Focus 結(jié)構(gòu)是YOLOv5 算法在之前版本基礎(chǔ)上的重要升級,其關(guān)鍵環(huán)節(jié)是切片操作,如圖3 所示。在YOLOv5s 網(wǎng)絡(luò)結(jié)構(gòu)中,輸入端輸入原始尺寸為608×608×3 的圖像,經(jīng)過Focus 結(jié)構(gòu)進(jìn)行切片操作后,原始圖像首先變成304×304×32 的特征圖,生成的特征圖經(jīng)過一次卷積運(yùn)算(卷積核數(shù)量為32 個)后最終變成304×304×32 的特征圖。圖4 為CSP 結(jié)構(gòu)示意圖,將輸入的特征圖拆分為兩部分,其中一部分使用卷積計(jì)算方法,另一部分使用帶有殘差結(jié)構(gòu)的方式進(jìn)行計(jì)算,最后將這兩部分合并得到新的特征圖[16]。
圖4 CSP 結(jié)構(gòu)示意圖Fig.4 Structure diagram of CSP
頸部采用FPN(Feature Pyramid Network)結(jié)構(gòu)和PAN(Path Aggregation Network)結(jié)構(gòu)相結(jié)合的方式。FPN 利用上采樣的方式對信息進(jìn)行傳遞融合,獲得預(yù)測的特征圖,是自頂而下的結(jié)構(gòu);PAN 是自底向上傳遞目標(biāo)的位置信息。通過自頂向下和自底向上的特征信息融合有利于模型更好地學(xué)習(xí)特征,增強(qiáng)模型對目標(biāo)的敏感度。
輸出端采用Bounding box 損失函數(shù)和非極大值抑制(Non-Maximum Suppression,NMS)。非極大值抑制主要應(yīng)用于目標(biāo)檢測的后處理階段,可以利用NMS 非極大抑制方法從多個檢測框中通過排序并比較設(shè)定閾值的方式篩選出最高得分即最佳結(jié)果,與此同時刪除重復(fù)的檢測框。
建立柔性淺埋物數(shù)據(jù)集,采集不同種類、不同埋設(shè)深度的干涉條紋圖共900 張,為獲取性能良好的柔性淺埋物智能探測網(wǎng)絡(luò)模型提供基礎(chǔ)。VOC2007 數(shù)據(jù)集中對應(yīng)目標(biāo)檢測的文件夾有3個:(1)JPEGImages 文件夾:包含所有原始圖像,如訓(xùn)練圖片和測試圖片;(2)Annotations 文件夾:存放.xml 格式的文件,每個.xml 文件對應(yīng)JPEGImages 文件夾中的一張照片,包含圖像尺寸、檢測目標(biāo)的類別、像素坐標(biāo)等信息;(3)ImageSets 文件夾,其中的主文件全部為.txt 文件,對應(yīng)訓(xùn)練、驗(yàn)證和測試圖片的名稱作為索引[17]。
用labelImg 程序在原始圖像上對干涉條紋圖進(jìn)行標(biāo)記,將原圖和生成的.xml 文件分別存入PASCAL VOC2007 對應(yīng)的文件夾,將.xml 文件修改為YOLO 算法采用的.txt 格式,按照訓(xùn)練、驗(yàn)證、測試比例為8∶1∶1 隨機(jī)生成圖像索引文件。準(zhǔn)備工作結(jié)束后,將上述數(shù)據(jù)集導(dǎo)入YOLOv5 算法模型進(jìn)行訓(xùn)練。
目標(biāo)檢測通用評價(jià)標(biāo)準(zhǔn)主要有精確率(P)、召回率(R)和平均精確率(PA)等[18-19]。精確率是指在一組預(yù)測結(jié)果中,被正確預(yù)測為教練雷雷殼的樣本數(shù)與所有被預(yù)測為教練雷雷殼的樣本數(shù)之比;召回率是指在一組預(yù)測結(jié)果中,被正確預(yù)測為教練雷雷殼的樣本數(shù)與實(shí)際上教練雷雷殼的樣本數(shù)之比;平均精確率是指對于每個目標(biāo),算法檢測出的所有目標(biāo)的平均精度。
3 個評價(jià)指標(biāo)分別表示為:
式中:TP 表示正確檢測目標(biāo)數(shù),F(xiàn)P 表示錯誤檢測目標(biāo)數(shù),F(xiàn)N 表示漏檢目標(biāo)數(shù);PA表示R在[0,1]內(nèi)P的平均值,PmA表示所有類別PA的平均值,是P和R的統(tǒng)籌考慮。
柔性淺埋物聲-光融合智能探測實(shí)驗(yàn)系統(tǒng)如圖5 所示,該系統(tǒng)主要由聲發(fā)射單元和地表振動信號檢測單元組成。聲發(fā)生單元由Tektronix(泰克科技)公司生產(chǎn)的AFG3022C 型信號發(fā)生器、東莞東雅音響有限公司生產(chǎn)的PA(Power Amplifier)系列功率放大器和惠威(HIVI)公司生產(chǎn)的HQ3 大功率低音炮組成。地表振動信號檢測單元包括激光散斑干涉無損檢測系統(tǒng)SE Systems 和移動圖形工作站兩部分。SE Systems 的采集頭用來采集柔性物體的振動信號,移動圖形工作站進(jìn)行數(shù)據(jù)處理,利用貝塞爾函數(shù)調(diào)制形成干涉條紋圖像視頻。將柔性淺埋物智能檢測模型也部署在移動圖形工作站中,采集、訓(xùn)練和測試結(jié)果在工作站中進(jìn)行展示。
圖5 柔性淺埋物聲-光融合智能探測實(shí)驗(yàn)系統(tǒng)Fig.5 Sound-light fusion intelligent detection system of flexible shallow buried object
實(shí)驗(yàn)選取3 種彈性腔體模型的教練雷雷殼作為柔性淺埋物樣品,3 種教練雷雷殼具有不同的材質(zhì)和結(jié)構(gòu),分別是69 式防坦克塑料教練雷雷殼、72 式防坦克金屬教練雷雷殼和58 式防工兵橡膠教練雷雷殼,磚塊作為對照物掩埋于教練雷雷殼附近。柔性淺埋物相關(guān)特性參數(shù)如表1所示。
表1 典型柔性淺埋物相關(guān)特征參數(shù)Tab.1 Characteristic parameters of typical flexible shields
實(shí)驗(yàn)所用土壤類型選擇細(xì)沙。剪切量設(shè)置為最大允許缺陷尺寸的50%~100%,通常在5~15 mm 之間。埋深設(shè)置為10,30,50 mm。聲壓級設(shè)置為120 dB。3 種教練雷雷殼不同埋設(shè)深度的實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)參數(shù)設(shè)置如表2 所示,按照表中實(shí)驗(yàn)參數(shù)采集干涉條紋圖,作為智能識別算法的數(shù)據(jù)集。
表2 教練雷雷殼不同埋深時實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)參數(shù)Tab.2 Experimental environment and parameters for different buried depths of coach shell
圖6 表示埋設(shè)深度為10 mm 時,3 種教練雷殼及磚塊的干涉條紋圖。3 種教練雷雷殼的表面均呈現(xiàn)對稱分布的蝴蝶斑圖案,有明暗相間的條紋,不同的雷殼,條紋階數(shù)也不同,但掩埋物為磚塊時則無明顯條紋。表明該系統(tǒng)對空腔結(jié)構(gòu)體的柔性物體檢測敏感,而對實(shí)體如磚塊檢測不敏感。因此,為了驗(yàn)證YOLOv5 算法用于干涉條紋圖識別的可行性,這里設(shè)計(jì)兩個實(shí)驗(yàn):一是捕獲干涉條紋圖檢測教練雷雷殼的實(shí)驗(yàn);二是根據(jù)不同埋設(shè)深度干涉條紋圖的變化規(guī)律判斷教練雷雷殼類別的檢測實(shí)驗(yàn)。
YOLOv5 網(wǎng)絡(luò)模型的訓(xùn)練基于Linux 系統(tǒng)。表3 為移動圖形工作站的軟硬件配置參數(shù),表4為YOLOv5 算法訓(xùn)練參數(shù)設(shè)置。
表3 Linux 系統(tǒng)軟硬件配置Tab.3 Linux software and hardware configuration
表4 訓(xùn)練參數(shù)設(shè)置Tab.4 Training parameters setting
訓(xùn)練結(jié)束后,加載訓(xùn)練完成后的最佳權(quán)重,將數(shù)據(jù)集中的測試集和采集頭捕獲的視頻數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行測試,以驗(yàn)證本算法的實(shí)際檢測效果。3 種教練雷雷殼干涉條紋圖的部分檢測效果如圖7 所示。
圖7 教練雷雷殼檢測效果Fig.7 Detection effect to judge thunder shell
從實(shí)驗(yàn)結(jié)果來看,教練雷雷殼干涉條紋圖的檢測效果比較明顯,由于輸入數(shù)據(jù)為視頻數(shù)據(jù),可以通過調(diào)節(jié)采集頭的采集幀率來實(shí)現(xiàn)高密度獲取實(shí)時圖像的任務(wù),因此將YOLOv5 應(yīng)用于檢測干涉條紋圖可以提高檢測速度。評價(jià)指標(biāo)如圖8 所示,精確率可達(dá)98.39%,召回率為84.72%,平均精度為99.66%。
圖8 評價(jià)指標(biāo)Fig.8 Evaluation index
上述實(shí)驗(yàn)結(jié)果表明,利用YOLOv5 算法能快速從激光散斑干涉無損檢測系統(tǒng)的采集頭所采集的視頻中檢測出不同教練雷雷殼在不同掩埋深度下的干涉條紋圖??紤]到柔性淺埋物種類的多樣性,因此有必要對其進(jìn)行分類識別。
細(xì)沙環(huán)境下3 種教練雷雷殼的類別檢測部分效果如圖9 所示。如圖10 所示,F(xiàn)1 曲線表示F1分?jǐn)?shù)與置信度閾值之間的關(guān)系。F1 分?jǐn)?shù)是分類的一個衡量標(biāo)準(zhǔn),是精確率和召回率的調(diào)和平均數(shù)。由圖9 和圖10 可知,細(xì)沙環(huán)境金屬教練雷雷殼的檢測效果欠佳,原因可能在于采集的干涉條紋圖大多集中在視頻中央,現(xiàn)有采集頭所獲取的圖像大多布滿整個畫面,使得在最初打標(biāo)簽環(huán)節(jié)數(shù)據(jù)類型過于單一。盡管YOLOv5 自帶的數(shù)據(jù)增強(qiáng)起到一定的作用,但對于采集頭的視場范圍仍然提出了較高的要求,打標(biāo)簽環(huán)節(jié)數(shù)據(jù)特征的單一性致使測試過程中出現(xiàn)了該問題。
圖9 教練雷雷殼類別檢測效果Fig.9 Detection effect for type determination of thunder
圖10 柔性淺埋物類別檢測的F1 曲線Fig.10 F1 curve of flexible shallow buried objects category detection
針對當(dāng)前柔性淺埋物探測技術(shù)中廣泛存在的探測效率低下問題,本文提出一種基于聲-地震耦合技術(shù)的智能探測方法。搭建聲-光融合智能探測系統(tǒng),構(gòu)建柔性淺埋物干涉條紋圖數(shù)據(jù)集,利用YOLOv5 算法開展柔性淺埋物和柔性淺埋物類別的檢測實(shí)驗(yàn)。在給定條件下,經(jīng)訓(xùn)練后智能探測網(wǎng)絡(luò)模型的精確率為98.39%,召回率為84.72%,平均識別精度為99.66%。實(shí)驗(yàn)結(jié)果表明,YOLOV5 算法可用于激光散斑測振干涉條紋圖的智能識別,初步驗(yàn)證了基于聲-地震耦合技術(shù)的智能探測方法的可行性。