亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多尺度特征融合SSDLite的光伏組件缺陷檢測

        2025-02-17 00:00:00項新建湯卉肖家樂王世乾張穎超王磊
        太陽能學(xué)報 2025年1期
        關(guān)鍵詞:深度學(xué)習(xí)

        摘 要:為了應(yīng)對光伏組件缺陷檢測中人工檢測速度緩慢以及使用YOLO等深度學(xué)習(xí)模型時速度較慢且硬件成本高的問題,提出一種基于SSDLite的多層特征融合輕量化目標(biāo)檢測方法。該方法采用MobileNetV2作為SSDLite模型的骨干網(wǎng)絡(luò),并從中提取3個不同層次的特征層進(jìn)行特征融合。針對不同缺陷的尺寸特點,對模型中的先驗框的大小也進(jìn)行了重新設(shè)計。在MobileNetV2的瓶頸結(jié)構(gòu)中引入CBAM注意力機制,以提高模型的檢測精度。相比傳統(tǒng)的SSDLite模型,該文模型平均精度從65.8%提高至72.4%,雖然速度略微下降,但已基本滿足實際應(yīng)用的需求。

        關(guān)鍵詞:光伏組件;目標(biāo)檢測;深度學(xué)習(xí);SSDLite;多層特征融合;MobileNetV2

        中圖分類號:TK514 """"""""""""""""文獻(xiàn)標(biāo)志碼:A

        0 引 言

        光伏組件的表面可能會因生產(chǎn)環(huán)境、工藝水平、原材料等因素出現(xiàn)各種類型的缺陷,如凹陷、斑點、劃痕等。近年來,深度學(xué)習(xí)技術(shù)的發(fā)展和成熟極大地推動了目標(biāo)檢測任務(wù)的進(jìn)步。在目標(biāo)檢測中,主要分為一階段目標(biāo)檢測和二階段目標(biāo)檢測。一階段目標(biāo)檢測主要分為YOLO(you only look once)系列(如YOLOv1[1]、YOLOv2[2]、YOLOv4[3]等)和SSD(single shot multibox detector)系列(如SSD[4]、DSSD[5]、RSSD[6])。二階段目標(biāo)檢測主要分為Fast R-CNN[7]和Faster-R-CNN[8]。王道累等[9]提出改進(jìn)SSD模型,通過改進(jìn)注意力網(wǎng)絡(luò)、替換骨干網(wǎng)絡(luò)和對數(shù)據(jù)增強等方式提高了模型準(zhǔn)確度,但檢測速率卻大幅下降;孫建波等[10]提出基于改進(jìn)YOLO v5s算法的光伏組件故障檢測使用特征增強和EIOU(enhanced intersection over union)損失函數(shù)提高了檢測準(zhǔn)確度;郭嵐等[11]提出的基于改進(jìn)YOLOv5的光伏組件缺陷檢測雖然準(zhǔn)確率較高,但檢測速率較慢、參數(shù)量較大且對硬件要求較高。模型只使用SE(squeeze and excitation)注意力模塊,只關(guān)注了通道信息,沒有關(guān)注空間信息。

        綜上大部分模型都有模型體積較大、模型較為復(fù)雜的問題。本文采用SSDLite為基礎(chǔ)模型,在此基礎(chǔ)上結(jié)合模型輕量化、多尺度特征融合、優(yōu)化先驗框以及在MobilenetV2中嵌入CBAM(convolution block attention module)注意力模塊得到改進(jìn)模型。

        1 相關(guān)工作

        1.1 SSD網(wǎng)絡(luò)結(jié)構(gòu)

        文獻(xiàn)[4]提出一種SSD網(wǎng)絡(luò),其主干網(wǎng)絡(luò)使用VGG16(visual geometry group 16),并將VGG16中后半部分的全連接層換成了標(biāo)準(zhǔn)卷積層,對圖像特征有較好的提取能力。如圖1所示,SSD輸入圖像大?。?00,300,3),從Conv4、Conv7、Conv8、Conv9、Conv10和Conv11中提取6個不同尺度的特征圖。在Conv6-11使用特征金字塔,它允許網(wǎng)絡(luò)在不同尺度上捕獲和處理信息,從而檢測不同尺度目標(biāo)。

        在進(jìn)行目標(biāo)檢測時,網(wǎng)絡(luò)會生成大量的先驗框,根據(jù)其大小、位置和預(yù)測類別進(jìn)行篩選,非極大值抑制(non-maximum suppression,NMS)會按照得分對這些先驗框進(jìn)行排序,保留得分最高的候選框。然而,VGG16的參數(shù)量較大,SSD使用的是標(biāo)準(zhǔn)卷積運算,其參數(shù)總量和所需計算量相對較大。使得SSD不適合在計算能力有限的移動設(shè)備和嵌入式設(shè)備上進(jìn)行部署。

        1.2 MobileNetV2網(wǎng)絡(luò)

        不同于VGG16等傳統(tǒng)使用標(biāo)準(zhǔn)卷積,MobileNetV2[12]使用深度可分離卷積、瓶頸結(jié)構(gòu)和反向殘差連接。

        深度可分離卷積是一種優(yōu)化的卷積操作,它比標(biāo)準(zhǔn)卷積更加高效,能夠減少約2/3的參數(shù)量,并相應(yīng)地降低計算量,在Xception[13]和MobilenetV1[14]中廣泛使用。深度可分離卷積實現(xiàn)輕量化的方式是將標(biāo)準(zhǔn)卷積操作分解為深度卷積和逐點卷積。

        反向殘差連接有助于緩解深度神經(jīng)網(wǎng)絡(luò)中的梯度消失問題,并且網(wǎng)絡(luò)前部的特征可被網(wǎng)絡(luò)后部重用,提高模型性能。瓶頸結(jié)構(gòu)先使用1×1卷積進(jìn)行降維,然后應(yīng)用深度可分離卷積。這種設(shè)計能夠進(jìn)一步減少計算負(fù)擔(dān),同時保持了網(wǎng)絡(luò)的表征能力。

        圖2為MobileNetV2使用的瓶頸結(jié)構(gòu)(bottleneck),相比MobileNetV1在模塊的首部添加了一個逐點卷積使其做升維處理。通過升維操作,拓展出的冗余維度有利于使用ReLU激活函數(shù)時造成的信息丟失,發(fā)揮出ReLU非線性特點。然后進(jìn)行Depthwise 3×3卷積,步長設(shè)為1或2。之后進(jìn)行逐點卷積做降維處理。最后如果步長為"則添加殘差連接;如果步長為"則進(jìn)行下采樣但不添加殘差連接。

        MobileNetV2除了第一層使用標(biāo)準(zhǔn)卷積,其他所有層都使用瓶頸結(jié)構(gòu)卷積,擴張率設(shè)為6,如表1所示。表1中,步長為2時,只有第一個bottleneck模塊沒有殘差連接,且其depthwise 卷積步長為"其余的bottleneck模塊的卷積步長均為1。具體結(jié)構(gòu)如表1所示。

        1.3 SSDLite

        SSDLite是將 SSD 模型中所有傳統(tǒng)卷積替換為深度可分離卷積,這使得 SSDLite 成為輕量化的網(wǎng)絡(luò)。SSDLite 特別適合在計算資源有限的移動端和嵌入式設(shè)備上運行。在這些場景中,計算能力、存儲空間和能源效率都是關(guān)鍵考慮因素。與標(biāo)準(zhǔn)的 SSD 模型相比,其檢測速度有較大提升。

        2 改進(jìn)網(wǎng)絡(luò)

        改進(jìn)后的SSDLite模型如圖3所示。

        2.1 多尺度特征融合

        SSD模型利用多卷積層進(jìn)行目標(biāo)檢測,具有較好的魯棒性,但缺點是容易漏檢小目標(biāo)。為了解決這一不足,特征融合將低分辨率、包含豐富語義信息、有較大感受野的特征圖與高分辨率、捕獲細(xì)節(jié)的小感受野的特征圖結(jié)合起來,從而增強淺層特征對小目標(biāo)的表達(dá)能力,提高整體模型性能。

        在改進(jìn)后的模型中,SSDLite網(wǎng)絡(luò)的主干網(wǎng)絡(luò)MobileNetV2提取了3個特征層的信息,分辨率從高到低包括Conv4、Conv6、Conv8。如圖4所示,Conv4、Conv6和Conv8先進(jìn)行深度可分離卷積操作(DS-Conv),然后通過上采樣將特征圖的長和寬擴展到(40,40)。選擇雙線性插值進(jìn)行上采樣可提高計算效率,這與使用反卷積(DeConv)的方法相比更為高效。與最近鄰插值法相比,雙線性插值的計算量更大,但其優(yōu)點在于不會產(chǎn)生灰度不連續(xù)的問題。這一過程不需要額外學(xué)習(xí)新的參數(shù)。

        前一層的卷積層參數(shù)更新會導(dǎo)致下一層的數(shù)據(jù)分布發(fā)生變化,通過層層卷積積累放大,導(dǎo)致模型收斂緩慢。因此在每個特征層增加一個批歸一化(BN)層加速模型訓(xùn)練速度。使用激活函數(shù)層(ReLU6)后串聯(lián)(Concat)成(40,40,256)。之后增加一個深度可分離卷積層或者標(biāo)準(zhǔn)卷積以及一次歸一化運算,提高模型收斂速度。無論是深度可分離卷積還是標(biāo)準(zhǔn)卷積都能提高模型的檢測精度。

        2.2 改進(jìn)MobileNetV2

        深度可分離卷積通過獨立處理空間信息和通道信息,雖然降低了計算復(fù)雜性,但可能導(dǎo)致信息表達(dá)能力的削弱。為彌補這一點,引入CBAM[15]注意力模塊,如圖5所示,其包括通道注意力模塊和空間注意力模塊。與只使用通道注意力的SE模塊[16]相比,CBAM提供了更全面的注意力機制,進(jìn)一步提升了網(wǎng)絡(luò)的表達(dá)能力。通道注意力使用最大池化層和平均池化層關(guān)注特征圖的通道維度,為每個通道分配一個權(quán)重,以突出顯示某些通道,某些通道對于學(xué)習(xí)任務(wù)來說更為重要,從而提高模型在特定任務(wù)上的性能??臻g注意力主要關(guān)注特征圖的空間維度,經(jīng)過Sigmoid函數(shù)生成一個掩碼,模型能夠在圖像的不同區(qū)域中識別和關(guān)注重要的特征,從而提高后續(xù)卷積層的輸入質(zhì)量和模型的性能。最終形成一個細(xì)化特征圖。

        在MobileNetV2使用的瓶頸結(jié)構(gòu)中,除去有shortcut連接的瓶頸結(jié)構(gòu),其余結(jié)構(gòu)加入CBAM模塊。圖6為添加CBAM的瓶頸結(jié)構(gòu)。

        雖然增加了10個CBAM模塊,但其計算復(fù)雜度和參數(shù)數(shù)量僅略微增加。計算復(fù)雜度增加了0.2%,參數(shù)量提高了0.7%。與原先的MobileNetV2在相同學(xué)習(xí)率下相比,新的模型有更快的收斂速度,且精度更高,但檢測速率明顯下降。

        MobileNetV2中倒數(shù)第三層Conv2d卷積核數(shù)量為1280的卷積層刪除。該層的參數(shù)量較大,約占總模型參數(shù)量的23%。由于前層通道數(shù)量為320,從320升維到1280,擴增數(shù)較多,且檢測的缺陷種類較少,不利于網(wǎng)絡(luò)訓(xùn)練。相比未刪除的SSDLite-MobileNetV"平均精度均值mAP只下降0.3%,具體數(shù)據(jù)將在后續(xù)消融實驗中展示。

        2.3 優(yōu)化先驗框

        SSD使用先驗框的方式可以更快速地預(yù)測目標(biāo)。先驗框是一組固定大小和形狀的矩形框,它們被設(shè)計用來預(yù)測真實對象的邊界框。這些先驗框為目標(biāo)檢測提供了一組初始的、規(guī)范的矩形框,算法通過調(diào)整這些框的尺寸和位置來匹配真實的對象。SSD在每個特征圖的位置都產(chǎn)生了多個先驗框,每個框具有不同的尺寸和寬高比。在訓(xùn)練階段,每個先驗框都會與真實的邊界框進(jìn)行匹配,以確定其與哪個真實對象最為接近。如果一個先驗框與某個真實對象的邊界框重合面積超過了一個預(yù)定的閾值,那么這個先驗框就被認(rèn)為與該對象匹配。最終輸出類別得分和其位置。根據(jù)不同任務(wù)和目標(biāo)一般需要重新設(shè)計先驗框大小,才能使SSD發(fā)揮出最佳性能。先驗框的高寬比記作[ar],設(shè)為[ar∈1,2,3,1/2,1/3]。

        先驗框尺度的計算式:

        [Sk=Smin+Smax-Sminm-1(k-1), "k∈[1,m]] (1)

        式中:[Sk]——先驗框大小相對于圖片的比例;[Smin]——[Sk]的最小值;[Smax]——[Sk]的最大值;[m]——特征圖的數(shù)量;[k]——第[k]個特征圖。

        標(biāo)準(zhǔn)的SSD模型中[Smin]和[Smax]分別取0.2和0.9。

        先驗框的寬高分別為:

        [W=Skar] (2)

        [H=Skar] (3)

        當(dāng)[ar]=1時,[W=H=SkSk+1]。

        考慮光伏組件表面缺陷較小且輸入圖像較大,為獲得更高的準(zhǔn)確率重新設(shè)計先驗框。經(jīng)實驗發(fā)現(xiàn),在[Smin]和[Smax]分別取0.2和0.9時精度較低,分別取0.05和0.7能夠較好地匹配目標(biāo),可達(dá)到最佳檢測效果。

        3 數(shù)據(jù)集

        模型訓(xùn)練及評估使用數(shù)據(jù)集為CCD相機在光伏組件生產(chǎn)線上采集的約4000張圖像,數(shù)據(jù)集包含瑕疵(flaw)、斑點(macula)、劃痕(crack)3個類別。瑕疵主要是在光伏面板中因為材料不均勻造成的各種異常的部分,在數(shù)據(jù)集一般呈現(xiàn)小且較為集中的黑點。斑點因為材料污染、腐蝕、沉積物等原因與周圍區(qū)域相比有不同的顏色、紋理或透明度。裂縫是光伏面板表面或內(nèi)部出現(xiàn)的裂紋或斷裂區(qū)域,這主要是由于溫度變化、機械等因素引起的。

        部分?jǐn)?shù)據(jù)集及較難檢測圖片示例如圖7所示,其中方框框出部分為漏檢缺陷。

        4 實 驗

        4.1 軟硬件參數(shù)

        為訓(xùn)練和評估本文提出的輕量化模型,將在如下設(shè)備上運行。系統(tǒng)Windows10,CPU:i5 9400F,GPU:RTX3060(12 GB),內(nèi)存:16 GB,CUDA版本11.3,CUDNN版本8."編程語言:Python3.6,深度學(xué)習(xí)框架Tensorflow2.6。

        4.2 模型訓(xùn)練

        在實驗中使用Adam優(yōu)化器進(jìn)行迭代。將模型batchsize設(shè)置為3"初始學(xué)習(xí)率設(shè)為0.00"訓(xùn)練迭代次數(shù),使用余弦退火(cosine annealing)下降學(xué)習(xí)率,epoch設(shè)為400,所有模型從零開始訓(xùn)練,不使用預(yù)訓(xùn)練權(quán)重。

        4.3 評價指標(biāo)

        為驗證所用模型的性能,引入FLOPs、平均精度均值mAP、模型體積、FPS、參數(shù)量5個指標(biāo)作為實驗的性能評判指標(biāo)。

        FLOPs:指模型進(jìn)行一次前向傳播所需的浮點運算數(shù)量,可用來衡量模型復(fù)雜度。在沒有硬件加速的GPU設(shè)備上FLOPs和FPS呈現(xiàn)負(fù)相關(guān),即FLOPs越高,F(xiàn)PS越低。

        平均精度均值:對于每個類別,首先計算平均精度,然后對所有類別的平均精度取平均值,得到平均精度均值mAP。

        模型體積:是機器學(xué)習(xí)模型參數(shù)量存儲大?。▎挝唬篗B)。對于深度學(xué)習(xí)模型,其體積受到模型的參數(shù)數(shù)量和參數(shù)類型的影響。

        FPS(frames per second):即模型或系統(tǒng)每秒可以處理的圖像幀數(shù)。FPS越高,每秒處理的照片量越高。

        參數(shù)量:指模型中所有可調(diào)參數(shù)的總數(shù),表示模型可從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到的內(nèi)容(單位:M)。

        4.4 實驗結(jié)果

        實驗結(jié)果如表2所示,使用YOLOV4、SSDLite320-MobileNetV2和標(biāo)準(zhǔn)的SSD模型進(jìn)行對比。其中SSD模型先驗框都已優(yōu)化。改進(jìn)SSDLite320使用了特征融合、改進(jìn)后的先驗框和CBAM注意力模塊。其中改進(jìn)SSDLite320-a在特征融合中最后的卷積部分使用了深度可分離卷積,而改進(jìn)SSDLite320-b最后的卷積部分使用了標(biāo)準(zhǔn)卷積。相較于SSD300-VGG16模型體積, SSDLite320的模型體積更小,F(xiàn)LOPs極低,F(xiàn)PS更高。這主要得益于深度可分離卷積比標(biāo)準(zhǔn)卷積參數(shù)量更少。而其mAP提高1.9%,主要是MobileNetV2結(jié)構(gòu)與VGG16結(jié)構(gòu)不同,瓶頸結(jié)構(gòu)相比單個標(biāo)準(zhǔn)卷積層數(shù)更多,且獲取信息更多。并且SSDLite提取特征層和SSD不同,SSDLite首個提取特征層為(20,20,96)而SSD首個提取特征層為(38,38,512)。相比SSD,SSDLite能夠從特征層中提取更多信息。由于改進(jìn)SSDLite320使用了特征融合和注意力模塊,首個提取的特征層擁有更多有效信息,mAP至少提高4.3%,但FLOPs有不同程度的提高,且FPS也有所下降。改進(jìn)SSDLite320-b和改進(jìn)SSDLite320-a相比,F(xiàn)LOPs提高了很多,但FPS卻更高。這主要得益于GPU中的Tensor Core單元對標(biāo)準(zhǔn)卷積的硬件加速。由于深度可分離卷積的本質(zhì),即將一層標(biāo)準(zhǔn)卷積變?yōu)閮蓪泳矸e(深度卷積+逐點卷積)以及GPU在內(nèi)存訪問成本問題,深度可分離卷積在GPU上較標(biāo)準(zhǔn)卷積偏慢。改進(jìn)后的模型在CPU中FPS比SSD、YOLOv4等非輕量化模型表現(xiàn)都要好。在沒有GPU的小型設(shè)備上使用改進(jìn)SSDLite320效果會更好。

        改進(jìn)SSDLite320-b缺陷檢測效果如圖8所示,其中紅色框為瑕疵(flaw),青色框為斑點(macula)、綠色框為劃痕(crack)。

        4.5 消融實驗

        本文實驗設(shè)置了特征融合、注意力模塊、1280卷積層和優(yōu)化先驗框?qū)SDLite的影響。

        表3中所有實驗都使用Adam優(yōu)化器進(jìn)行迭代。將模型batchsize設(shè)置為3nbsp;初始學(xué)習(xí)率設(shè)為0.00"訓(xùn)練迭代使用余弦退火下降學(xué)習(xí)率,epoch設(shè)為300。表3中“√”表示相應(yīng)模型中采用了此改進(jìn)方法。

        在SSDLite-MobileNetV2的基礎(chǔ)上優(yōu)化先驗框,mAP提高了2.3%。這說明優(yōu)化先驗框使得網(wǎng)絡(luò)更能關(guān)注微小缺陷,而大尺寸的缺陷較少且占據(jù)圖片面積(框選面積)較小。優(yōu)化后的先驗框更易抓取特征,整體性能得到提升。

        考慮缺陷種類較少,使用通道1280卷積層造成提取信息冗余,且在接下來的特征融合中從1280降維,必然導(dǎo)致網(wǎng)絡(luò)更加復(fù)雜。刪除1280卷積層使得mAP僅下降0.3%,根據(jù)模型參數(shù)量分布,該層的參數(shù)量占整個模型的23%。在嵌入式或者資源受限的設(shè)備中,刪除1280卷積層,F(xiàn)LOPs下降,總體上更有利于設(shè)備的高效運行。

        在瓶頸結(jié)構(gòu)中加入CBAM模塊,mAP提高1.7%,從而進(jìn)一步增強了MobileNetV2的表達(dá)能力。FLOPs未明顯增加,但CBAM模塊包含額外的卷積和池化操作,這些操作會增加網(wǎng)絡(luò)的計算負(fù)擔(dān),使得FPS下降。

        特征融合的加入使得網(wǎng)絡(luò)更易獲取淺層信息和深層信息。淺層信息(如卷積層(40,40,32))更關(guān)注局部圖像和更小缺陷。而深層信息(如卷積層(10,10,320))更關(guān)注全局信息和較大缺陷,如圖8中的劃痕。通過實驗發(fā)現(xiàn)在特征融合最后使用標(biāo)準(zhǔn)卷積效果更佳,主要得益于標(biāo)準(zhǔn)卷積在信息表達(dá)能力上優(yōu)于深度可分離卷積,能夠同時考慮空間和通道信息,捕捉特征間復(fù)雜的相關(guān)性。在特征融合中使用單次標(biāo)準(zhǔn)卷積可在保證輕量化的同時,最大程度上提高mAP。深度可分離卷積和標(biāo)準(zhǔn)卷積的特征融合在FPS方面并無明顯的變化。

        5 結(jié) 論

        針對光伏組件缺陷檢測,本文提出一種改進(jìn)的輕量化SSDLite-MobileNetV2。實驗表明,改進(jìn)模型相比原模型mAP最多提高6.6%,模型體積和參數(shù)量無明顯變化,但檢測速度要略慢。與YOLOv4相比,該模型準(zhǔn)確率更高,模型體積更小,檢測速度更塊,更適合在嵌入式等成本較低或算力較低、無GPU硬件加速的小型設(shè)備上使用。

        [參考文獻(xiàn)]

        [1] REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, NV, USA, 2016: 779-788.

        [2] REDMON J, FARHADI A. YOLO9000: better, faster, stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA, 2017: 6517-6525.

        [3] BOCHKOVSKIY A, WANG C Y, LIAO H M. YOLOv4: optimal speed and accuracy of object detection[EB/OL]. 2020: 2004. 10934. https://arxiv.org/abs/2004.10934v1.

        [4] LIU W, ANGUELOV D, ERHAN D, et al. SSD: single shot MultiBox detector[M]//Lecture Notes in Computer Science. Cham: Springer International Publishing, 2016: 21-37.

        [5] FU C Y, LIU W, RANGA A, et al. DSSD: deconvolutional ""single ""shot ""detector[EB/OL]. ""2017: 1701.06659. https://arxiv.org/abs/1701.06659v1.

        [6] JEONG J, PARK H, KWAK N. Enhancement of SSD by concatenating feature maps for object detection[EB/OL]. 2017: 1705.09587. https://arxiv.org/abs/1705.09587v1.

        [7] GIRSHICK R. Fast R-CNN[C]//2015 IEEE International Conference on Computer Vision (ICCV). Santiago, Chile, 2015: 1440-1448.

        [8] REN S Q, HE K M, GIRSHICK R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(6): 1137-1149.

        [9] 王道累, 李明山, 姚勇, 等. 改進(jìn)SSD的光伏組件熱斑缺陷檢測方法[J]. 太陽能學(xué)報, 2023, 44(4): 420-425.

        WANG D L, LI M S, YAO Y, et al. Method of hotspot detection of photovoltaic panels modules on improved ssd[J]. Acta energiae solaris sinica, 2023, 44(4): 420-425.

        [10] 孫建波, 王麗杰, 麻吉輝, 等. 基于改進(jìn)YOLOv5s算法的光伏組件故障檢測[J]. 紅外技術(shù), 2023, 45(2): 202-208.

        SUN J B, WANG L J, MA J H, et al. Photovoltaic module fault detection based on improved YOLOv5s algorithm[J]. Infrared technology, 2023, 45(2): 202-208.

        [11] 郭嵐,劉正新.基于改進(jìn)YOLOv5的光伏組件缺陷檢測[J]. 激光與光電子學(xué)進(jìn)展, 2023, 60(20): 148-156.

        GUO L, LIU Z X. Detection of defects in photovoltaic modules """"by """"improved """"YOLOv5[J]. """Laser """"amp; Optoelectronics Progress, 2023, 60(20): 148-156.

        [12] SANDLER M, HOWARD A, ZHU M L, et al. MobileNetV2: inverted residuals and linear bottlenecks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USA, 2018: 4510-4520.

        [13] CHOLLET F. Xception: deep learning with depthwise separable "convolutions[C]//2017 "IEEE "Conference "on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA, 2017: 1800-1807.

        [14] HOWARD A G, ZHU M L, CHEN B, et al. MobileNets: efficient convolutional neural networks for mobile vision applications[EB/OL]. 2017: 1704.04861. https://arxiv.org/abs/1704.04861v1

        [15] WOO S, PARK J, LEE J Y, et al. CBAM: convolutional block attention module[M]. Lecture Notes in Computer Science. Cham: Springer International Publishing, 2018: 3-19.

        [16] HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USA, 2018: 7132-7141.

        DEFECT DETECTION OF PHOTOVOLTAIC MODULES BASED ON

        MULTI-SCALE FEATURE FUSION SSDLite

        Xiang Xinjian"Tang Hui"Xiao Jiale"Wang Shiqian"Zhang Yingchao"Wang Lei2

        (1. School of Automation and Electrical Engineering, Zhejiang University of Science and Technology, Hangzhou 310023, China;

        2. Hangzhou Shenhao Technology Co., Ltd., Hangzhou 31112""China)

        Abstract:To address the issues of slow manual inspection and the high hardware costs and slower speeds associated with using deep learning models like YOLO in photovoltaic module defect detection, a lightweight object detection method based on SSDLite with multi-level feature fusion is proposed. This method employs MobileNetV2 as the backbone network of the SSDLite model and extracts three different feature layers for feature fusion. The sizes of the anchor boxes in the model are redesigned based on the size characteristics of different defects. Additionally, the CBAM attention mechanism is introduced into the bottleneck structure of MobileNetV2 to enhance the detection accuracy of the model. Compared to the traditional SSDLite model, the proposed model improves the mean average precision (mAP) from 65.8% to 72.4%. Although the speed slightly decreases, it still largely meets the requirements of practical applications.

        Keywords:photovoltaic modules; object detection; deep learning; SSDLite; multi-layer feature fusion; MobileNetV2

        猜你喜歡
        深度學(xué)習(xí)
        從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
        面向大數(shù)據(jù)遠(yuǎn)程開放實驗平臺構(gòu)建研究
        基于自動智能分類器的圖書館亂架圖書檢測
        搭建深度學(xué)習(xí)的三級階梯
        有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
        電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
        利用網(wǎng)絡(luò)技術(shù)促進(jìn)學(xué)生深度學(xué)習(xí)的幾大策略
        考試周刊(2016年94期)2016-12-12 12:15:04
        MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        欧洲乱码伦视频免费| 伊人影院在线观看不卡| 日本高清成人一区二区三区| 一区二区精品国产亚洲| 人人妻人人澡人人爽欧美一区九九 | 黄片亚洲精品在线观看| 久久99热国产精品综合| 未发育成型小奶头毛片av| 人妻丝袜无码国产一区| 久久国产热精品波多野结衣av | 日本中文字幕有码在线播放| 亚洲国产性夜夜综合另类| 无码va在线观看| 奇米狠狠色| 亚洲中国美女精品久久久| 九一精品少妇一区二区三区| 国产一区二区三区内射| 亚洲精品国精品久久99热| 精品国产av 无码一区二区三区| 国产成人精品日本亚洲直播| 国产精品日韩亚洲一区二区| 中国无码人妻丰满熟妇啪啪软件 | 在线a亚洲视频播放在线观看| 久久精品一区二区三区夜夜| 成人影院在线视频免费观看| 国产人妻久久精品二区三区特黄| av无码精品一区二区乱子| 亚洲人妻御姐中文字幕| 大地资源在线影视播放| 窝窝影院午夜看片| 亚洲欧美另类精品久久久| 亚洲av色香蕉一区二区三区软件 | 韩国女主播一区二区三区在线观看 | 国产高清在线精品一区αpp| 国产精品久久国产精品久久| 日本女优在线一区二区三区| 国产精品无码成人午夜电影| 狠干狠爱无码区| 亚洲精品一区二区视频| 人妻少妇偷人精品免费看| 欧美最猛黑人xxxx黑人表情|