吳 濤,賴 菲
?
基于LeNet-5模型的太陽能電池板缺陷識別分類
吳 濤,賴 菲
(西安熱工研究院有限公司,陜西 西安 710054)
太陽能電池板是光伏發(fā)電組件的核心部件,其質(zhì)量的優(yōu)劣直接關(guān)系安全發(fā)電和發(fā)電效率。因此,對太陽能電池板進行缺陷檢測具有重要的實際價值??紤]到人工檢測的低效性和高成本,本文提出利用在深度學(xué)習(xí)領(lǐng)域圖像分類性能良好的卷積神經(jīng)網(wǎng)絡(luò)對太陽能電池板圖像進行自動識別分類。利用Tensorflow平臺Tensorboard的可視化性能,對經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)LeNet-5模型進行結(jié)構(gòu)改善和超參數(shù)的調(diào)整,并將改進LeNet-5模型與經(jīng)典LeNet-5模型和支持向量機的分類結(jié)果互相對比,結(jié)果表明改進LeNet-5模型的分類效果最優(yōu)。
太陽能電池板;LeNet-5模型;圖像分類;卷積神經(jīng)網(wǎng)絡(luò);超參數(shù);Tensorboard
我國太陽能資源十分豐富且分布廣泛,其發(fā)電形式具有安全可靠、維護簡單、安裝方便、持續(xù)投資小、規(guī)模靈活等特點,隨著技術(shù)壁壘的不斷突破,近年來利用太陽能發(fā)電的產(chǎn)業(yè)發(fā)展迅猛。目前光伏發(fā)電是人類利用太陽能的主要途徑。據(jù)統(tǒng)計,截至2016年底,我國光伏電站累計裝機容量67.10 GW,分布式累計裝機容量為10.32 GW,全年光伏發(fā)電量為662億kW·h,占我國全年總發(fā)電量的1%,其中2016年光伏發(fā)電新增裝機容量34.54 GW,新增和累計裝機容量均為全球第一[1]。
太陽能電池板作為光伏電站將太陽能轉(zhuǎn)化為電能的核心設(shè)備,其質(zhì)量好壞直接影響光能轉(zhuǎn)化效率及其可用壽命。雖然電池板在出廠時已經(jīng)進行過質(zhì)量檢測,但由于太陽能光伏電站一般處于環(huán)境比較惡劣的地區(qū),如戈壁、半固定沙漠、鹽堿地等地,而且光伏組件長期暴露在室外,受風(fēng)、雨、雪、覆冰等不良天氣影響,熱斑、隱裂、斷柵、線路松動及導(dǎo)帶松動等故障時有發(fā)生[2-3]。這對光伏電站的發(fā)電效率造成很大影響,甚至引發(fā)安全事故。太陽能電池板表面缺陷很可能造成使用中的電氣故障,但由于電池表面缺陷的細微性和隱秘性,人眼難以分辨這種表面缺陷。所以專家和學(xué)者們提出了很多檢測電池板表面缺陷的方法,目前常用檢測方法有電致發(fā)光成像、光致發(fā)光成像、鎖相熱、光傳輸、電子散斑干涉技術(shù)和聲學(xué)顯微鏡掃描技術(shù)等。
也有學(xué)者提出了一些采用計算機圖像分類的方法。如趙慧陽[4]采用機器視覺理論對太陽能電池板的表面缺陷問題做了相關(guān)的研究工作,人為選取特征參數(shù)分類檢測具體缺陷,對缺角和裂紋的識別率均達到90%以上,對斷柵的識別率達75%。但是識別過程較為繁瑣,如獲取圖像時需要先布置好均勻的環(huán)形光源,而且人為選取的特征參數(shù)如果不完整或有差錯,將會嚴重影響分類結(jié)果[5];馮博[6]根據(jù)滲透算法和張量投票算法,充分利用裂紋本身的性質(zhì),采用一種局部并行的探測手段檢測圖像中的細微裂紋,該方法誤檢漏檢率小,算法參數(shù)少,但需要布置相應(yīng)的檢測設(shè)備,這在海上光伏或者地形較為復(fù)雜的地區(qū)很難實施,且運行時間方差較大,最長時間為20 s。
近些年深度學(xué)習(xí)在圖像處理中發(fā)展起來的卷積神經(jīng)網(wǎng)絡(luò)引起專家學(xué)者們的廣泛關(guān)注,由于其具有顯著的識別效果,無需對圖像做前期復(fù)雜的預(yù)處理,現(xiàn)已成功應(yīng)用于手寫字符識別[7]、人臉識別[8]、車牌號識別[9]、人眼檢測[10]、行人檢測[11]等領(lǐng)域,如Pierre Sermanet等將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于街牌號識別,準確率達到95.10%[12]。鑒于電致發(fā)光(EL)檢測技術(shù)不斷發(fā)展,并已經(jīng)在光伏組件的產(chǎn)品檢測、戶外實證、長期可靠性、電站檢測等方面得到廣泛應(yīng)用[13-14],本文利用卷積神經(jīng)網(wǎng)絡(luò)對電致發(fā)光成像的光伏電池板進行識別分類。由于光伏電池圖像較難獲取,如果所分類別較多,每個類別圖像數(shù)量就會減少,這樣網(wǎng)絡(luò)將得不到充分學(xué)習(xí),會顯著影響分類效果[15],所以本文僅針對最常出現(xiàn)的缺陷——裂紋進行識別分類。
LeNet-5模型是Yann LeCun[16]提出的一種經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò),最初用于手寫體數(shù)字識別,非常適合進行圖像特征提取。本文將LeNet-5模型應(yīng)用于太陽能電池板缺陷識別,識別輸出只有兩類:有裂紋的電池板和無裂紋的電池板。LeNet-5模型網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,除去輸入層,LeNet-5模型共有7層,包含卷積、下采樣(池化)和全連接3種類型,輸入層為像素32×32(將原始圖像壓縮)的圖像。
圖1 LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)
卷積運算主要利用3個思想來幫助改進機器學(xué)習(xí)系統(tǒng):稀疏交互、參數(shù)共享、等變表示。稀疏交互通過設(shè)置核的大小遠小于輸入的大小來實現(xiàn),如此不僅可以減少模型的存儲需求,還能提高統(tǒng)計效率;參數(shù)共享是指在一個模型的多個函數(shù)中使用相同的參數(shù),這樣可以明顯降低模型的存儲需求;等變表示是指一旦某個函數(shù)輸入改變,輸出也將以同樣的方式改變,這樣可以在處理時間序列或圖像時方便很多。卷積層得到的特征圖為每個卷積核通過“滑動窗口”的方式提取出輸入數(shù)據(jù)不同位置的特征[17]。也可以理解為輸入圖像與卷積核卷積運算之后再加一個偏置,然后通過激活函數(shù)激活得到卷積層的特征圖。卷積公式為
下采樣使用某一位置的相鄰輸出的總體統(tǒng)計特征來代替網(wǎng)絡(luò)在該位置的輸出,最常用的下采樣方法為最大池化(max-pooling)和平均池化(mean-pooling),可以對上一層網(wǎng)絡(luò)取相鄰區(qū)域的最大值或平均值,下采樣公式為
以下采樣層S2為例,S2包含6個特征圖,每個特征圖的每個神經(jīng)元以C1層中2×2的局部鄰域為輸入,采樣步長為2,因此S2層每個特征圖的大小都是C1層中的1/4,下采樣過程如圖3所示。
圖3 下采樣過程示意
S2層特征圖的尺寸為14×14,總共需要訓(xùn)練的參數(shù)有(1+1)×6=12個,連接參數(shù)有6×((2×2)+1)× (14×14)=5 880個。
單個光伏電池板圖像像素較大(120×120),即每個圖像包含的信息量很大,而光伏電池板缺陷本身的特征信息不明顯,且分類數(shù)目較少,如果繼續(xù)用經(jīng)典LeNet-5模型,會導(dǎo)致網(wǎng)絡(luò)的學(xué)習(xí)能力不足而產(chǎn)生欠擬合,分類效果差。故改進時首先增加了網(wǎng)絡(luò)容量,增強網(wǎng)絡(luò)的學(xué)習(xí)能力,將原來的7層增加為10層,增加了1層卷積層、1層最大池化層和 1層全連接層,且在卷積層和池化層的特征圖及全連接層的節(jié)點數(shù)目作了相應(yīng)的改變,結(jié)構(gòu)參數(shù)對比見表1和表2。除此之外,網(wǎng)絡(luò)的超參數(shù)也做了相應(yīng)的改變,并在全連接層加入了dropout,有效減小了由于圖像數(shù)目較少造成的過擬合程度。該網(wǎng)絡(luò)最大迭代步數(shù)設(shè)為350,批次樣本大小設(shè)為14,正則化系數(shù)設(shè)置為0.002,學(xué)習(xí)率設(shè)為0.000 8,dropout設(shè)為0.7。
當(dāng)設(shè)計的網(wǎng)絡(luò)較復(fù)雜,為了方便調(diào)試參數(shù)以及調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),需要將計算圖可視化,以便改善網(wǎng)絡(luò)結(jié)構(gòu)、調(diào)整超參數(shù)等來提升網(wǎng)絡(luò)的滿意度。Tensorboard是Tensorflow提供的一個可視化工具,能夠有效地展示Tensorflow在運行過程中計算圖和各種指標隨運行時間或迭代步數(shù)變化的趨勢和分布。
表1 經(jīng)典LeNet-5模型連接參數(shù)
Tab.1 The connection parameters of the classical Lenet-5 model
表2 改進LeNet-5模型連接參數(shù)
Tab.2 The connection parameters of the improved LeNet-5 model
Tensorboard通過讀取Tensorflow的時間文件運行,利用其可視化性能,可得到改進LeNet-5模型結(jié)構(gòu)及其細節(jié)。打開Tenorboard后,可以讀取程序運行信息,并以圖表的方式展現(xiàn)出來。如標量圖(Scalars)可以展示需要展示的信息(準確率、交叉熵損失、學(xué)習(xí)率、每一層權(quán)重和偏置的最大最小值及方差和平均值隨著迭代步數(shù)的變化),從重要參數(shù)的變化趨勢可以得到每一層網(wǎng)絡(luò)的訓(xùn)練情況,并對相應(yīng)的參數(shù)做出調(diào)整。圖4為網(wǎng)絡(luò)中部分節(jié)點值隨迭代步數(shù)變化的標量圖,圖中陰影為Smoothing(平滑)之前的曲線。圖4a)為準確率隨著迭代步數(shù)的變化曲線,可以直接找出網(wǎng)絡(luò)開始收斂的步數(shù);圖4b)為第1層網(wǎng)絡(luò)中權(quán)重最大值隨迭代步數(shù)的變化曲線,可以發(fā)現(xiàn)權(quán)重最大值隨迭代步數(shù)的增加而增大;圖4c)為第1層權(quán)重最小值隨迭代步數(shù)變化,可以看出權(quán)重最小值隨迭代步數(shù)逐漸減?。粓D4d)為第1層權(quán)重方差隨迭代步數(shù)變化,權(quán)重方差隨迭代步數(shù)逐漸增大;神經(jīng)元之間的參數(shù)差異越來越大,說明在該層網(wǎng)絡(luò)運行良好,因為理想情況下每個神經(jīng)元都應(yīng)該去關(guān)注不同的特征,每個參數(shù)也應(yīng)有所不同。
圖4 部分節(jié)點值隨迭代步數(shù)變化的標量圖
本次實驗軟件平臺為python,圖像樣本由萊克斯公司提供,共有220張,其中缺陷樣本有140張,打亂順序后隨機抽出20張作為測試集。部分實驗圖像樣本如圖5所示。
圖5 部分實驗數(shù)據(jù)
圖5中a)、b)、c)為有隱裂的光伏電池板圖像,d)為完好的光伏電池板圖像。采用經(jīng)典LeNet-5模型、改進LeNet-5模型和徑向基核函數(shù)(RBF)的支持向量機(SVM)進行光伏電池板缺陷分類。
圖6為經(jīng)典LeNet-5模型和改進LeNet-5模型進行光伏電池板缺陷分類時準確率與交叉熵損失對比。為防止過擬合,在2個深度網(wǎng)絡(luò)中均加入l2正則化,并在改進LeNet-5模型的全連接層加入了dropout,雖然波動更頻繁,但過擬合現(xiàn)象有所減小。
圖6 LeNet-5模型改進前后準確率與交叉熵損失對比
由圖6可見:采用經(jīng)典LeNet-5模型分類時,在迭代步數(shù)約為180時開始收斂,訓(xùn)練集準確率趨 于1,交叉熵損失趨于0.06,而測試集準確率趨于0.80,交叉熵損失趨于0.59,說明存在過擬合現(xiàn)象;采用改進LeNet-5模型分類時,迭代步數(shù)也在約為180時開始收斂,訓(xùn)練集準確率趨于0.99,交叉熵損失趨于0.04,而測試集準確率趨于0.90,交叉熵損失趨于0.49,分類效果明顯優(yōu)于經(jīng)典LeNet-5模型;采用RBF的SVM進行光伏電池板缺陷分類時,發(fā)現(xiàn)該算法將所有測試集歸為一類,分類準確率僅為58.3%,分類效果遠不如經(jīng)典LeNet-5模型。
本文將經(jīng)典LeNet-5模型用于光伏電池板缺陷識別,由于光伏電池板圖像數(shù)據(jù)有限,單張圖像包含的像素較多且分類數(shù)目少,經(jīng)典LeNet-5模型的網(wǎng)絡(luò)容量和超參數(shù)并不適于電池板缺陷識別。借助Tensorboard可視化性能,調(diào)試網(wǎng)絡(luò)結(jié)構(gòu)和超參數(shù)后得到改進LeNet-5模型,并將其用于光伏電池板缺陷識別,得到的分類效果與經(jīng)典LeNet-5模型和SVM的識別效果進行比較,發(fā)現(xiàn)改進LeNet-5模型準確率和交叉熵損失均最優(yōu)。
本次光伏電池板圖像樣本數(shù)量較少,分類類別也較少。如果能得到更多的圖像樣本,可以設(shè)置更多的分類類別,如隱裂、斷柵、黑心和熱斑等,而且準確率也將能得到進一步的提升。
[1]人民日報. 我國光伏裝機容量世界第一[J]. 創(chuàng)新時代, 2017(3): 99. DOI:10.3969/j.issn.1674-6538.2017.03.042. People’s Daily. China’s PV installed capacity is the biggest in the world[J]. Innovation Time, 2017(3): 99. DOI:10.3969/j.issn.1674-6538.2017.03.042.
[2] 王晗. 多晶硅表面缺陷識別及軟件檢測系統(tǒng)設(shè)計與開發(fā)[D]. 上海: 上海交通大學(xué), 2014: 3-11.
WANG Han. Polysilicon solar wafer surface defect detection and the design and development of software inspection system[D]. Shanghai: Shanghai Jiao Tong University, 2014: 3-11.
[3] 王楠. 基于視覺的硅太陽能電池檢測方法的研究[D]. 保定: 河北農(nóng)業(yè)大學(xué), 2014: 11-18.
WANG Nan. Research of silicon solar cell based on visual detection method[D]. Baoding: Agricultural University of Hebei, 2014: 11-18.
[4] 趙慧陽. 基于機器視覺的太陽能電池片表面缺陷檢測的研究[D]. 秦皇島: 燕山大學(xué), 2011: 11-57.
ZHAO Huiyang. Research on surface defect inspection of solar cell based on machine vision[D]. Qinhuangdao: Yanshan University, 2011: 11-57.
[5] 李夢園. 深度學(xué)習(xí)算法在表面缺陷識別中的應(yīng)用研究[D]. 杭州: 浙江工業(yè)大學(xué), 2015: 1-2.
LI Mengyuan. Research and application of deep learning algorithm in suface defect recognition[D]. Hangzhou: Zhejiang University of Technology, 2015: 1-2.
[6] 馮博. 太陽能電池片表面裂紋檢測算法的研究與實現(xiàn)[D]. 長春: 吉林大學(xué), 2014: 32-50.
FENG Bo. Research and implementation of crack detection algorithm on the surface of solar cell[D]. Changchun: Jilin University, 2014: 32-50.
[7] LAUER F, SUEN C Y, BLOCH G. A trainable feature extractor for handwritten digit recognition[J]. Pattern Recognition, 2007, 40(6): 1816-1824.
[8] LAWRENCE S, GILES C L, TSOI A C, et al. Face recognition: a convolutional neural-network approach[J]. IEEE Transactions on Neural Networks, 1997, 8(1): 98-113.
[9] 趙志宏, 楊紹普, 馬增強. 基于卷積神經(jīng)網(wǎng)絡(luò)LeNet-5的車牌字符識別研究[J]. 系統(tǒng)仿真學(xué)報, 2010, 22(3): 638-641.
ZHAO Zhihong, YANG Shaopu, MA Zengqiang. License plate character recognition based on convolutional neural network LeNet-5[J]. Journal of System Simulation, 2010, 22(3): 638-641.
[10] TIVIVE F H C, BOUZERDOWN A. An eye feature detector based on convolutional neural network[C]// Eighth International Symposium on Signal Processing and ITS Applications. [S. l.]: IEEE, 2006: 90-93.
[11] SZARVAS M, YOSHIZAWA A, YAMAMOTO M, et al. Pedestrian detection with convolutional neural networks[C]//Intelligent Vehicles Symposium, 2005 Proceedings. [S. l.]: IEEE, 2005: 224-229.
[12] SERMANET P, CHINTALA S, LECUN Y. Convo- lutional neural networks applied to house numbers digit classification[C]//Pattern Recognition (ICPR), 21st International Conference on IEEE. [S. l.]: IEEE, 2012: 3288-3291.
[13] 林劍春, 楊愛軍, 沈熠輝. 電致發(fā)光缺陷檢測儀的成像性能評估[J]. 光學(xué)精密工程, 2017, 25(6): 1418-1424.
LIN Jianchun, YANG Aijun, SHEN Yihui. Evaluation of imaging performance for electroluminescence defect detector[J]. Optics and Precision Engineering, 2017, 25(6): 1418-1424.
[14] 施光輝, 崔亞楠, 劉小嬌, 等. 電致發(fā)光(EL)在光伏電池組件缺陷檢測中的應(yīng)用[J]. 云南師范大學(xué)學(xué)報(自然科學(xué)版), 2016, 36(2): 17-21.
SHI Guanghui, CUI Yanan, LIU Xiaojiao, et al. Electrolumninscent application in defects detection of photovoltaic-module[J]. Journal of Yunnan Normal University (Natural Sciences Edition), 2016, 36(2): 17-21.
[15] LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553): 436.
[16] LéCUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
[17] 楊振杰. 基于CNN的交通標志識別方法研究[D]. 天津: 天津工業(yè)大學(xué), 2017: 13-15.
YANG Zhenjie. Research on traffic sign recognition method based on CNN[D]. Tianjin: Tianjin Polytechnic University, 2017: 13-15.
Identification and classification of defects in solar cells based on LeNet-5 model
WU Tao, LAI Fei
(Xi’an Thermal Power Research Institute Co., Ltd., Xi’an 710054, China)
The solar cell, as the core component of photovoltaic power generation module, its quality directly relates to security and efficiency of power generation. So the defect detection of solar cells plays a very important significant role. Taking into account the inefficiencies and high costs of manual detection, this paper proposes to use the convolutional neural network with good image classification performance in the deep learning field to automatically identify and classify the cell. Based on the visualization performance of Tensorboard on Tensorflow platform, the structure of the classical LeNet-5 model is improved and the hyper parameters are adjusted. Moreover, the classification results of the improved LeNet-5 model are compared with that of the classical LeNet-5 model and support vector machine. The results show that the classification effect of the improved LeNet-5 model is the optimal.
solar panel, LeNet-5 model, image classification, convolutional neural network, hyper parameter, Tensorboard
TP391.4
A
10.19666/j.rlfd.201807147
吳濤, 賴菲. 基于LeNet-5模型的太陽能電池板缺陷識別分類[J]. 熱力發(fā)電, 2019, 48(3): 120-125. WU Tao, LAI Fei. Identification and classification of defects in solar cells based on LeNet-5 model[J]. Thermal Power Generation, 2019, 48(3): 120-125.
:10.3969/j.issn.1674-6538.2017.03.042.
2018-07-30
吳濤(1993—),男,碩士研究生,主要研究方向為深度學(xué)習(xí)在發(fā)電領(lǐng)域中的應(yīng)用,249942815@qq.com。
(責(zé)任編輯 杜亞勤)