DOI:10.16652/j.issn.1004-373x.2025.16.026
中圖分類號(hào):TN919-34;TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-373X(2025)16-0161-06
Dynamicself-adaptiveelevatorsteelbelttypical faultdetectionalgorithm
ZHOUZecheng1,LIChen1,XUFeng2,ZHANGCai3,HUANGKanfei2 (1.CollegeofEnergy,Environmentand Safety Engineering,ChinaJiliangUniversity,Hangzhou 31o8,China; 2.ZhejiangAcademyofSpecialEquipment Science,Hangzhou 31ooo9,China; 3.Wenzhou Special Equipment Inspectionamp; Science Research Institute,Wenzhou 325oo1,China)
Abstract:Inalusion totheproblems ofpoorreal-timedetection,lowaccuracyandcomplex processintraditional elevator stlbeltypicalfaults,nlevatorstelbelttypcalfaultetetionalgoribsedonamicself-adapation,DOis proposed.ThedeformableconvolutionDCNv2isusedtoreplacetraditionalconvolutionlayers,soastobeteradapttovariations inshapesand structuresoffaults.Themulti-scalelarge kernel separable (MLKS)moduleisconstructedtoenhancethe model's adaptabilitytodiferentfeaturescalesandspatialvariations.Adual-pathchannelatention(DPCA)mechanismisproposedto strengthenthemodel'scapabilityinfeatureperception,extraction,andfusiononthechaneldimension.Adynamicshared alignment(DSA)detection headisdesigned tooptimizethe independence,irelevance,and featureconflictisuesduring localizationandclassificationtasks.Theexperimentalresultsshowthat,ontheelevatorsteelbelttypicalfaultdatasets,DSMAYOLO can increase mAP@0.5and mAP@0.5~0.95by4.4%and10.1%respectively compared with the baselinealgorithm YOLOv8n,whichisbeterthanothercomparativeobjectdetectionalgorithm,andcanmet thereal-timerequirementsfor elevatorsteel belt typical fault detection,providing references for elevator fault diagnosis methods and applications.
Keywords:elevatorsteelbelt;faultdetection;dynamicself-adaption;YOLOv8n;deformableconvolution;dual-chael attention mechanism; feature sharing
0 引言
隨著社會(huì)經(jīng)濟(jì)水平和城市化進(jìn)程的迅速發(fā)展,電梯已成為人們必不可少的垂直交通工具,同時(shí)人們對(duì)于電梯的安全性和舒適性的要求日益增加,因此新材料、新工藝、新技術(shù)也逐漸在電梯制造、設(shè)計(jì)、運(yùn)維中開(kāi)展應(yīng)用。其中,鋼帶作為電梯的核心零部件,承擔(dān)著電梯關(guān)鍵的承重和驅(qū)動(dòng)任務(wù)。鋼帶雖然相較于傳統(tǒng)的鋼絲繩具有諸多顯著優(yōu)勢(shì),但是在長(zhǎng)時(shí)間服役過(guò)程中仍存在一些不足,包括電梯鋼帶磨損裸露、鼠嚙破損和橫向裂紋等問(wèn)題,會(huì)對(duì)電梯使用安全造成巨大威脅。目前,電梯鋼帶典型故障的檢測(cè)方法主要以人工自測(cè)法為主,但是該方法存在較多不足,如嚴(yán)重耗費(fèi)人力、無(wú)法實(shí)時(shí)檢測(cè)以及有較高檢測(cè)誤差等。而在工業(yè)領(lǐng)域所應(yīng)用的電梯鋼帶無(wú)損檢測(cè)技術(shù),如基于金屬材料的電磁檢測(cè)技術(shù)、壽命預(yù)測(cè)值法、電阻檢測(cè)法等[2],都普遍存在操作復(fù)雜和檢測(cè)實(shí)時(shí)性低等問(wèn)題。
近年來(lái),基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)在相關(guān)領(lǐng)域取得了顯著進(jìn)展。文獻(xiàn)[4]提出了一種改進(jìn)的YOLOv8-t模型,通過(guò)使用FasterNetBlock和Slim-Neck結(jié)構(gòu)進(jìn)行相關(guān)結(jié)構(gòu)優(yōu)化,并使用自研檢測(cè)頭Detect-G和基于跨空間多尺度的注意力機(jī)制,顯著提升了PCB小目標(biāo)缺陷檢測(cè)的精度和效率,同時(shí)實(shí)現(xiàn)了模型輕量化。文獻(xiàn)[5]為解決絕緣子小目標(biāo)特征不足導(dǎo)致的檢測(cè)精度低和模型體積大的問(wèn)題,提出了MPH-YOLO算法,通過(guò)多尺度檢測(cè)、SIoU損失函數(shù)和Ghost卷積技術(shù)實(shí)現(xiàn)了檢測(cè)精度和模型輕量化的雙重提升。文獻(xiàn)[6]針對(duì)工廠中行人檢測(cè)算法精度不足和存在誤檢、漏檢等問(wèn)題,提出了一種基于改進(jìn)YOLOv8的工廠行人檢測(cè)算法,通過(guò)在YOLOv8中集成CBAM和CoordConv模塊,并采用Inner-IoU損失函數(shù),實(shí)現(xiàn)了對(duì)遮擋和小目標(biāo)更好的檢測(cè)及更高的定位精度。文獻(xiàn)[7]提出了一種結(jié)合雙向特征金字塔網(wǎng)絡(luò)、Ghostblockv2結(jié)構(gòu)、WiseIoU損失函數(shù)以及動(dòng)態(tài)非單調(diào)聚焦機(jī)制的算法,有效解決了無(wú)人機(jī)多目標(biāo)探測(cè)中的小目標(biāo)誤檢、漏檢和長(zhǎng)距離特征傳輸信息丟失的問(wèn)題。文獻(xiàn)[8]通過(guò)引人C3Ghost卷積模塊、全局關(guān)注機(jī)制模塊、DCNv2、特征上采樣算子以及多注意檢測(cè)頭,提出了一種基于多關(guān)注機(jī)制YOLOv8的軸承表面缺陷檢測(cè)方法,解決了傳統(tǒng)方法漏檢率高、特征融合不足和模型過(guò)大的問(wèn)題。
為應(yīng)對(duì)電梯鋼帶典型故障檢測(cè)時(shí)所面臨的形狀結(jié)構(gòu)復(fù)雜性、多尺度表征和特征提取能力不足,以及目標(biāo)任務(wù)定位與分類任務(wù)的特征沖突等問(wèn)題,本文提出一種針對(duì)電梯鋼帶典型故障的實(shí)時(shí)檢測(cè)算法DSMA-YOLO,主要的貢獻(xiàn)有:
1)采用可變形卷積DCNv2,解決電梯鋼帶典型故障特征圖形狀結(jié)構(gòu)復(fù)雜的問(wèn)題;2)構(gòu)造多尺度大核分離(Multi-ScaleLargeKernelSeparable,MLKS)模塊,解決原模型多尺度表征能力不足的問(wèn)題;3)提出雙通道注意力(DualPathChannelAttention,DPCA)機(jī)制,解決模型在通道維度上的感知能力和特征提取能力不足的問(wèn)題;4)設(shè)計(jì)動(dòng)態(tài)共享對(duì)齊(Dynamic ShareAlignment,DSA)檢測(cè)頭,解決電梯鋼帶典型故障特征在定位和分類任務(wù)中存在的獨(dú)立性、無(wú)關(guān)性以及特征沖突問(wèn)題。
1 YOLOv8算法
YOLOv8算法是YOLO系列中的最新改進(jìn)算法,相較于目前使用較為普遍的YOLOv5算法[],在檢測(cè)精度和速度方面都提升顯著。YOLOv8算法采用C2f模塊結(jié)合高級(jí)特征與上下文信息,增強(qiáng)梯度流;同時(shí),使用主流解耦頭結(jié)構(gòu)減少參數(shù)和計(jì)算復(fù)雜度,并采用無(wú)錨框檢測(cè)提升模型的泛化性和魯棒性。此外,正樣本選擇基于分類和回歸分?jǐn)?shù)加權(quán),分類分支利用二元交叉熵?fù)p失,回歸分支結(jié)合焦點(diǎn)損失和完全交并比損失,提高邊界框預(yù)測(cè)的準(zhǔn)確性。
2 DSMA-YOLO算法
為了保證電梯鋼帶典型故障檢測(cè)算法的實(shí)時(shí)性和模型大小的可控性,本文選取YOLOv8n算法作為基準(zhǔn)模型,提出了電梯鋼帶典型故障檢測(cè)算法DSMA-YOLO,其整體網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。
圖1DSMA-YOLO網(wǎng)絡(luò)模型結(jié)構(gòu)圖
2.1可變形卷積DNCv2模塊傳統(tǒng)卷積在電梯鋼帶典型故障特征提取過(guò)程中,其采樣位置受限于固定的矩形框架,使得感受野無(wú)法充分覆蓋電梯鋼帶失效特征圖中的不規(guī)則幾何形狀區(qū)域,導(dǎo)致這些區(qū)域的特征無(wú)法被充分提取,從而降低了模型的檢測(cè)能力。本文采用可變形卷積 DCNv2 ,引入了一種更靈活的卷積核,通過(guò)在卷積操作中引人偏移量,使卷積核在空間上進(jìn)行自適應(yīng)的動(dòng)態(tài)調(diào)整,捕捉不同目標(biāo)的幾何變化,進(jìn)而更好地適應(yīng)電梯鋼帶典型故障的形變和復(fù)雜結(jié)構(gòu)。C2f-DCNv2結(jié)構(gòu)示意圖如圖2所示。
圖2C2f-DCNv2結(jié)構(gòu)示意圖
2.2 多尺度大核分離模塊
傳統(tǒng)的注意力機(jī)制,如自注意力(SelfAttention)以及大核卷積核注意力(LargeKernelAttention)機(jī)制[12均存在一定不足。其中,自注意力機(jī)制雖具有長(zhǎng)程依賴性,但忽略了圖像二維結(jié)構(gòu),可能導(dǎo)致信息失真;而大核卷積核注意力機(jī)制雖考慮了二維結(jié)構(gòu),但其計(jì)算復(fù)雜度高會(huì)影響模型效率。因此,本文基于空間金字塔池化(SpatialPyramidPooling)模塊,引人大型可分離核注意力(LargeSeparableKernelAttention,LSKA)機(jī)制[3]構(gòu)造MLKS模塊,在特征融合過(guò)程中更加強(qiáng)調(diào)跨尺度特征,能夠聚焦于更多有效的電梯鋼帶典型故障特征信息,并加強(qiáng)特征融合效果,提升檢測(cè)精度。MLKS模塊網(wǎng)絡(luò)結(jié)構(gòu)圖如圖3所示。
圖3MLKS模塊網(wǎng)絡(luò)結(jié)構(gòu)圖
2.3雙通道注意力機(jī)制
傳統(tǒng)的通道注意力機(jī)制在提升網(wǎng)絡(luò)性能和參數(shù)效率方面表現(xiàn)優(yōu)異,但仍存在計(jì)算復(fù)雜度高、特征信息不完整以及適應(yīng)性不足等問(wèn)題。針對(duì)上述缺點(diǎn),本文基于雙注意力網(wǎng)絡(luò)的思想14提出了一種DPCA機(jī)制,結(jié)構(gòu)如圖4所示。
圖4DPCA機(jī)制結(jié)構(gòu)示意圖
DPCA機(jī)制的主要流程如下。
1)雙路特征提取。輸入電梯鋼帶故障特征圖X∈RH×W×C ,通過(guò)兩個(gè)獨(dú)立通道處理:第一通道進(jìn)行 3× 3常規(guī)卷積,第二通道采用 5×5 分組卷積(GroupedConvolution)。然后,分別進(jìn)行批量歸一化和高斯誤差線性單元處理,以增強(qiáng)模型的穩(wěn)健性和特征稀疏表示能力。最后,將所有輸出特征圖拼接為最終特征圖Y。
2)雙路卷積拼接和分離操作。將兩個(gè)通道的輸出特征圖拼接后,進(jìn)行 3×3 卷積;然后,采用Split策略沿通道維度將融合特征圖拆分為 X1 和 X2 ,保留整體特征結(jié)構(gòu)以便于后續(xù)處理;最后,將 Xi 與 X2 再次拼接融合,形成更豐富且多層次的特征圖。
2.4動(dòng)態(tài)共享對(duì)齊檢測(cè)頭
為了解決電梯鋼帶典型故障檢測(cè)在分類和定位時(shí)存在的特征沖突問(wèn)題,并進(jìn)一步提升模型的關(guān)鍵性能,本文在YOLOv8n算法的頭部網(wǎng)絡(luò)結(jié)構(gòu)中引入DSA檢測(cè)頭,結(jié)構(gòu)如圖5所示。
圖5DSA檢測(cè)頭結(jié)構(gòu)示意圖
DSA檢測(cè)頭運(yùn)行的主要流程如下。
1)輸入特征圖經(jīng)過(guò)兩次遞歸門控卷積(RecursiveGateConvolution)和組歸一化處理,形成電梯鋼帶故障特征映射,并進(jìn)行拼接。
2)對(duì)合并特征圖進(jìn)行分割:一部分生成掩碼和偏移量,作為DCNv2模塊動(dòng)態(tài)過(guò)濾的基礎(chǔ);另一部分通過(guò)兩個(gè)任務(wù)分解(TaskDecomposition)模塊[15],生成多個(gè)子任務(wù)特征,一部分由DCNv2處理,另一部分經(jīng)過(guò)ReLU和Sigmoid激活后與其他特征圖相乘,實(shí)現(xiàn)信息融合并提升辨別力。
3)DCNv2自適應(yīng)調(diào)整濾波器位置,捕捉復(fù)雜特征變化,處理后的特征送入獨(dú)立卷積層進(jìn)行回歸預(yù)測(cè),生成3個(gè)回歸輸出。同時(shí),通過(guò)將ReLU和Sigmoid激活后的特征圖與TD模塊產(chǎn)生的特征圖相乘,生成3個(gè)分類結(jié)果。
3 實(shí)驗(yàn)與結(jié)果分析
3.1實(shí)驗(yàn)環(huán)境和數(shù)據(jù)集
實(shí)驗(yàn)環(huán)境使用LinuxUbuntu操作系統(tǒng),顯卡型號(hào)為NVIDIAGeForceRTX4090D,24GB顯存,處理器為AMDEPYC9754128-CoreProcessor,18核,深度學(xué)習(xí)框架為PyTorch2.0.0,GPU加速庫(kù)為CUDA11.8,編程語(yǔ)言為Python3.8.19,開(kāi)發(fā)者使用的集成開(kāi)發(fā)環(huán)境(IDE)是VisualStudioCode。訓(xùn)練時(shí),輸入圖像尺寸為 640× 640,每個(gè)模型訓(xùn)練周期為150輪,Batch-size為32,工作線程數(shù)為16,使用SGD優(yōu)化器,學(xué)習(xí)率設(shè)定為0.001。
本研究實(shí)驗(yàn)數(shù)據(jù)集采用省某特種設(shè)備檢測(cè)機(jī)構(gòu)詳細(xì)記錄的3類電梯鋼帶典型故障:磨損裸露、鼠嚙破損以及橫向裂紋,共有5357張圖像,并按7:1:2的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。
3.2 評(píng)價(jià)指標(biāo)
為了評(píng)估本文所提算法的有效性,選取精確率 P /召回率 R ,以及平均精度均值mAP中的 mAP@0.5 和nAP@0.5~0.95 作為模型對(duì)多個(gè)目標(biāo)類別綜合檢測(cè)性能評(píng)價(jià)的指標(biāo)。同時(shí),為了衡量本文算法模型的復(fù)雜程度和檢測(cè)速度,加人每秒的推理速度FPS(FramesPerSecond)、每秒10億次的浮點(diǎn)運(yùn)算次數(shù)(GFLOPs)、模型大小(Modelsize)和參數(shù)量(Parameter)作為評(píng)價(jià)指標(biāo)。
3.3 消融實(shí)驗(yàn)
為驗(yàn)證本文算法中各項(xiàng)改進(jìn)模塊的有效性,以原YOLOv8n為基準(zhǔn)模型,采用 /FPS、GFLOPs、模型大小以及模型參數(shù)量作為評(píng)價(jià)指標(biāo),對(duì)多個(gè)改進(jìn)模塊的不同組合進(jìn)行消融實(shí)驗(yàn),結(jié)果如表1所示。根據(jù)消融實(shí)驗(yàn)結(jié)果可知:本文改進(jìn)后的DSMA-YOLO相比較于原YOLOv8n基準(zhǔn)模型,雖然在模型大小、參數(shù)量、FPS以及GFLOPs上有一定程度的削弱,但平均精度均值 mAP@0.5 和 mAP@0.5~0.95 分別提高了4.4% 和 10.1% ,充分表明了DSMA-YOLO的有效性。
表1消融實(shí)驗(yàn)結(jié)果
3.4對(duì)比實(shí)驗(yàn)
為進(jìn)一步驗(yàn)證本文算法的優(yōu)越性,在相同的條件下,將DSMA-YOLO與當(dāng)前熱門的檢測(cè)模型進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果如表2所示。
根據(jù)對(duì)比實(shí)驗(yàn)結(jié)果可知:本文提出的DSMA-YOLO模型與現(xiàn)有的其他主流模型相比,多個(gè)指標(biāo)都具有優(yōu)越性。同時(shí),DSMA-YOLO與同類的YOLOv8s和YOLOv10s算法相比,在模型大小、參數(shù)量和GFLOPs上都有略微提升,但沒(méi)有高于YOLOv8s算法;其 mAP@0.5 和 mAP(a) 0.5~0.95明顯高于YOL0系列算法。
表2對(duì)比實(shí)驗(yàn)結(jié)果
3.5 檢測(cè)結(jié)果可視化分析
根據(jù)消融實(shí)驗(yàn)和對(duì)比實(shí)驗(yàn)的結(jié)果,本文選取基準(zhǔn)模型 ΥOLOv8n 和DSMA-YOLO進(jìn)行電梯鋼帶3種典型故障檢測(cè)結(jié)果的可視化對(duì)比,包括磨損裸露、鼠嚙破損和橫向裂紋,如圖6所示。根據(jù)檢測(cè)的可視化結(jié)果可知:DSMA-YOLO算法的檢測(cè)置信度在磨損裸露檢測(cè)中由0.82提高至0.94,增幅 14.6% ;在鼠嚙破損檢測(cè)中雖然增幅不顯著,但是成功消除了漏檢問(wèn)題;在橫向裂紋檢測(cè)中,第一條裂紋從0.66提升至0.77,第二條裂紋從0.69提升至0.81,增幅分別為 16.7% 和 17.4% 。
圖6檢測(cè)結(jié)果可視化對(duì)比圖
綜上所述,DSMA-YOLO算法不僅提升了檢測(cè)效率,還有效降低了誤檢與漏檢現(xiàn)象,其檢測(cè)置信度的提升與故障判斷的準(zhǔn)確性均優(yōu)于對(duì)比實(shí)驗(yàn)中的YOLOv8n算法。
4結(jié)語(yǔ)
針對(duì)傳統(tǒng)電梯鋼帶典型故障檢測(cè)實(shí)時(shí)性差、精度低和流程復(fù)雜的問(wèn)題,本文基于YOLOv8n模型,提出了一種基于動(dòng)態(tài)自適應(yīng)的電梯鋼帶典型故障檢測(cè)算法DSMA-YOLO。首先,采用可變形卷積DCNv2替換傳統(tǒng)卷積層,更好地適應(yīng)故障的形狀和結(jié)構(gòu)變化;其次,構(gòu)造多尺度大核分離(MLKS)模塊,增強(qiáng)模型對(duì)不同特征尺度和空間變化的自適應(yīng)能力;然后,提出一種雙通道注意力(DPCA)機(jī)制,強(qiáng)化模型在通道維度上的特征感知、提取和融合能力;最后,設(shè)計(jì)動(dòng)態(tài)共享對(duì)齊(DSA)檢測(cè)頭,優(yōu)化定位和分類任務(wù)中的特征獨(dú)立性、特征無(wú)關(guān)性及特征間沖突問(wèn)題。實(shí)驗(yàn)結(jié)果證明:改進(jìn)后的算法平均精度均值達(dá)到了 90.2% ,并保證了檢測(cè)實(shí)時(shí)性;同時(shí),在各方面均優(yōu)于當(dāng)前主流 ΥOLOv8n 目標(biāo)檢測(cè)模型,為電梯故障檢測(cè)方法及應(yīng)用提供了參考。
未來(lái)的研究重點(diǎn)除了豐富電梯鋼帶典型故障的數(shù)據(jù)集之外,還需要優(yōu)化模型體積,以輕量化為目標(biāo),將模型部署在資源受限的邊緣端設(shè)備中。
注:本文通訊作者為李琛。
參考文獻(xiàn)
[1]王金釗.電梯電引鋼帶的檢驗(yàn)分析[J].中國(guó)設(shè)備工程,2023 (4):147-149.
[2]鄭瑞.基于機(jī)器視覺(jué)的電梯鋼帶表面損傷檢測(cè)研究[D].徐州: 中國(guó)礦業(yè)大學(xué),2022.
[3]曹家樂(lè),李亞利,孫漢卿,等.基于深度學(xué)習(xí)的視覺(jué)目標(biāo)檢測(cè)技 術(shù)綜述[J].中國(guó)圖象圖形學(xué)報(bào),2022(6):27.
[4]張淑卿,孟昊,葛超.改進(jìn)YOLOv8n的輕量級(jí)PCB缺陷檢測(cè)算 法[J].現(xiàn)代電子技術(shù),2024,47(15):115-121.
[5]文思予,張上,張朝陽(yáng),等.基于改進(jìn)YOLOv8s的多尺度檢測(cè) 算法[J].現(xiàn)代電子技術(shù),2024,47(15):133-138.
[6]陳思涵,劉勇,何祥.基于改進(jìn)YOLOv8的工廠行人檢測(cè)算法 [J].現(xiàn)代電子技術(shù),2024,47(24):160-166.
[7]LIYT,F(xiàn)ANQS,HUANGHS,etal.AmodifiedYOLOv8 detection network for UAV aerial image recognition [J].Drones, 2023,7(5):1-26.
[8]DINGPC,ZHANHF,YUJH,etal.Abearingsurfacedefect detection method based on multi-attention mechanism Yolov8 [J].Measurement science and technology,2024,35(8):75402- 75410.
[9] ZHU X,HUH,LINS,et al.Deformable ConvNets V2:more deformable,better results [C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition.[S.l.]:IEEE,2020: 9300-9308.
[10]JOCHERG,NISHIMURA K,MINEEVA T,et al.YOLOv8 [EB/OL].[2023-05-04]. https://github.com/ultralytics/ultralytics/ tags.
[11]JOCHERG,NISHIMURA K,MINEEVA T,etal.YOLOv5 (minor version6.2)[EB/OL].[2023-05-04]. https://github.com/ ultralytics/yolov5/releases/tag/v6.2.
[12]GUO MH,LUCZ,LIUZN,etal.Visual attention network [J].Computational visual media,2023,9(4):733-752.
[13]LAU K W,PO L M,REHMAN Y.Large separable kernel attention:rethinking the large kernel attention design in CNN [J].Expert systems with applications,2024,14(8):1-16.
[14]FUJ,LIUJ,TIANH,etal.Dual attentionnetwork for scene segmentation [C]//2O19 IEEE/CVF Conference on Computer Visionand Pattern Recognition.LongBeach,CA,USA:IEEE, 2020:3141-3149.
[15]FENGCJ,ZHONGYJ,GAOY,etal.TOOD:task-aligned one- stage object detection [J]. IEEE transactions on pattern analysis and machine intelligence,2021(2):3490-3499.
作者簡(jiǎn)介:周澤丞(1997—),男,紹興人,碩士研究生,研究方向?yàn)樯疃葘W(xué)習(xí)、目標(biāo)檢測(cè)。李?。?984—),男,寧夏銀川人,博士研究生,博士后,副教授,研究方向?yàn)樯疃葘W(xué)習(xí)、大尺寸晶體基片自適應(yīng)超精密加工方法。