□ 凌旭峰 □ 周麗婕 □ 祝 毓 □ 楊紅衛(wèi) □ 楊 杰
1.上海師范大學(xué)天華學(xué)院 上海 201815 2.上海圖書館(上??茖W(xué)技術(shù)情報研究所) 上海 200031 3.上海志良電子科技有限公司 上海 200072 4.上海交通大學(xué)圖像處理與模式識別研究所 上海 200240
隨著光伏發(fā)電技術(shù)的日益成熟,我國逐步采用太陽能這種安全清潔的能源。光伏發(fā)電已經(jīng)成為我國新能源發(fā)展的重要領(lǐng)域,并可以戰(zhàn)略性地解決潛在能源危機(jī)和環(huán)境污染問題。光伏發(fā)電應(yīng)用的核心部件是太陽能電池板,生產(chǎn)工藝復(fù)雜,容易產(chǎn)生缺陷。在生產(chǎn)和使用過程中,檢測并替換有缺陷的太陽能電池板,能夠顯著提高發(fā)電效率,延長太陽能電站的使用壽命。
目前,太陽能電池板缺陷檢測方法主要分為人工目視檢測、物理檢測、機(jī)器視覺檢測三種。
人工目視檢測方法由專業(yè)人員通過可見光相機(jī)或紅外相機(jī)拍攝的太陽能電池板圖像來判斷是否存在缺陷,需耗費大量人力資源,且檢測效率低,對于不同的缺陷存在嚴(yán)重的主觀意向,已處于逐漸淘汰階段。
物理檢測方法指使用聲波、紅外、激光掃描、共振超聲振動等方法檢測太陽能電池板的缺陷。王亞麗等[1]設(shè)計了一種基于紅外熱像技術(shù)進(jìn)行太陽能電池板缺陷檢測和分類的方法,可以根據(jù)常見的黑片、斷柵、隱裂、碎片等缺陷,提取紅外圖像平均灰度值差、長寬比、邊緣曲率等特征,進(jìn)行缺陷檢測。試驗表明這一方法能夠檢測定位缺陷,并對缺陷進(jìn)行正確分類。白愷等[2]根據(jù)晶硅光伏組件缺陷形成機(jī)理,提出了一種適用于現(xiàn)場應(yīng)用的缺陷光伏組件檢測方案,包括紅外熱成像排查、絕緣電阻測試、電致發(fā)光測試、光伏組件特性測試,鑒別光伏組件缺陷的產(chǎn)生原因及對發(fā)電性能的影響。施光輝等[3]提出通過電致發(fā)光測試技術(shù)發(fā)現(xiàn)電池組件的黑心、黑斑、隱裂、斷柵等缺陷,結(jié)合光伏組件電壓電流特性曲線,確定電池組件是否存在缺陷。楊瑞珍等[4]提出了電磁感應(yīng)主動激勵下晶體硅光伏電池紅外熱成像缺陷檢測方法,具有檢測靈敏度高、可發(fā)現(xiàn)內(nèi)部缺陷、檢測缺陷種類多等優(yōu)勢,在脈沖式和鎖相式兩種激勵模式下獲得并處理硅電池?zé)岢上裥蛄?實現(xiàn)晶體硅光伏電池中熱斑、裂紋、斷柵、重?fù)诫s等缺陷的可視化檢測。石磊等[5]基于太陽能電池電致發(fā)光原理,設(shè)計了電致發(fā)光缺陷檢測單元,通過機(jī)器視覺系統(tǒng)采集數(shù)據(jù),生成光伏組件電致發(fā)光圖像,輔助人工完成光伏組件的缺陷檢測,減輕疲勞等人為因素對檢測結(jié)果的影響。
相比物理檢測方法,機(jī)器視覺檢測作為一種新的檢測方法,具有髙效、精確、實時、靈活、非接觸、遠(yuǎn)距離測量等特點。隨著信息處理軟硬件技術(shù)的不斷發(fā)展,機(jī)器視覺檢測方法優(yōu)勢日益顯著。機(jī)器視覺檢測方法主要具有三方面優(yōu)勢。第一,檢測速度快,僅需幾百毫秒。第二,應(yīng)用部署靈活,可以根據(jù)不同的環(huán)境進(jìn)行配置,以滿足用戶要求,實現(xiàn)遠(yuǎn)程檢測操作。第三,檢測精度高,檢測標(biāo)準(zhǔn)化、一致性不斷完善。孫海蓉等[6]提出了一種深度卷積自編碼網(wǎng)絡(luò)模型,用于小樣本光伏熱斑的識別與定位,自動學(xué)習(xí)并提取小樣本圖像中的有效特征。試驗結(jié)果表明,針對小樣本光伏熱斑圖像數(shù)據(jù)集,這一方法相比傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)識別準(zhǔn)確率提升7.98%,并具有更強(qiáng)的泛化能力和穩(wěn)定性。都胡平等[7]提出了一種在生產(chǎn)過程中檢測電池片破損的方法,采用Sobel算子檢測圖像邊緣,計算電池片偏轉(zhuǎn)角度,基于角點檢測法檢測電池片是否已破損。試驗結(jié)果顯示,這一方法的精度較高,能夠檢測出電池片串焊過程中的位置偏轉(zhuǎn)、破損等問題。陳鳳妹等[8]設(shè)計了一種基于深度學(xué)習(xí)的太陽能電池板缺陷檢測模型,在SegNet網(wǎng)絡(luò)框架基礎(chǔ)上使用空洞卷積代替池化層,增大感受野,并保留圖像邊緣信息。這一模型可以明顯提高檢測的準(zhǔn)確率。鄧堡元等[9]提出了一種基于光流法處理光伏電池?zé)崃鲌龅臒釄D像序列分析方法,可以準(zhǔn)確找到異常發(fā)熱源,并與短波紅外成像找到的異常發(fā)光源融合,通過深度卷積神經(jīng)網(wǎng)絡(luò),實現(xiàn)對光伏電池內(nèi)部缺陷與劃痕、覆蓋、裂紋、缺損等人工缺陷的有效識別。試驗結(jié)果表明,這一方法在卷積網(wǎng)絡(luò)訓(xùn)練中能更快收斂。周得永等[10]采用YOLOv3算法對太陽能電池板電致發(fā)光圖片進(jìn)行缺陷檢測,在測試集中精度均值達(dá)到81.81%。試驗結(jié)果表明,YOLOv3算法對于含有斷柵、隱裂缺陷的太陽能電池板能夠?qū)崿F(xiàn)比較準(zhǔn)確的檢測。劉懷廣等[11]建立了一種特征增強(qiáng)型輕量化卷積神經(jīng)網(wǎng)絡(luò)模型,設(shè)計特征增強(qiáng)提取模塊,提高弱邊界的提取能力,同時根據(jù)多尺度識別原理增加小目標(biāo)預(yù)測層,實現(xiàn)多尺度特征預(yù)測。試驗測試中,這一模型的精度均值達(dá)到87.55%,相比傳統(tǒng)模型高近7個百分點,并且滿足精準(zhǔn)性與實時性的檢測要求。
現(xiàn)有基于監(jiān)督學(xué)習(xí)的機(jī)器視覺檢測方法有三個缺點。一是需要對缺陷位置進(jìn)行精確定位,才能實現(xiàn)缺陷識別,而缺陷定位難度較大。因為缺陷是開放性的,局部缺陷和全局缺陷屬于同一類缺陷,如一條長裂紋中有間斷,是定位為一條長裂紋還是兩段短裂紋,由此產(chǎn)生缺陷檢測定位兩難問題。二是需要數(shù)據(jù)人工標(biāo)注數(shù)據(jù)集支持,并在數(shù)據(jù)集中進(jìn)行大量訓(xùn)練,才能獲得訓(xùn)練收斂的模型。數(shù)據(jù)集需要人工標(biāo)注,既耗時又昂貴,在特殊領(lǐng)域,如醫(yī)療領(lǐng)域樣本標(biāo)注極其昂貴,由此成為人工智能發(fā)展的瓶頸。三是數(shù)據(jù)標(biāo)注會導(dǎo)致信息損失。一幅圖像所包含的信息非常豐富,除被標(biāo)注對象之外,還有背景信息、次要目標(biāo)信息等,而單一的訓(xùn)練任務(wù)僅提取圖像中的標(biāo)注信息,忽略其它有用信息。由于信息損失,導(dǎo)致監(jiān)督學(xué)習(xí)模型的特征提取能力扭曲,泛化能力較差。
自監(jiān)督學(xué)習(xí)方法可以克服監(jiān)督學(xué)習(xí)方法的缺點。自監(jiān)督學(xué)習(xí)分為判別式自監(jiān)督學(xué)習(xí)和生成式自監(jiān)督學(xué)習(xí)兩種類型[12]。典型的判別式自監(jiān)督學(xué)習(xí)方法是對比學(xué)習(xí),主要思想是通過自動構(gòu)造相似實例和不相似實例,獲得一個特征表征的學(xué)習(xí)模型,使相似實例在投影空間聚集,使不相似實例在投影空間分離[13-14]。采用生成式自監(jiān)督學(xué)習(xí)方法,訓(xùn)練一個深度學(xué)習(xí)模型,以重建被遮蓋的部分圖像。訓(xùn)練收斂的重建模型類似于一個圖像編碼器,具有圖像特征提取能力。筆者提出一種基于生成式自監(jiān)督學(xué)習(xí)的太陽能電池板缺陷檢測方法,能夠避免像素級復(fù)原,在顯著減小運算量的同時提取圖像全局和細(xì)節(jié)特征,實現(xiàn)較好的缺陷分類識別效果,并且穩(wěn)健性佳,具有較強(qiáng)的泛化能力。
生成式自監(jiān)督學(xué)習(xí)方法可以提取工業(yè)產(chǎn)品的表面缺陷,應(yīng)用于缺陷檢測領(lǐng)域,有四方面顯著作用。
(1) 相比傳統(tǒng)方法,生成式自監(jiān)督學(xué)習(xí)方法通過自注意力模糊定位缺陷所在位置,避免缺陷精確定位的難題,不需要顯性判別缺陷位置即可檢測缺陷,適合檢測開放性缺陷。
(2) 生成式自監(jiān)督學(xué)習(xí)方法可以對未標(biāo)注數(shù)據(jù)集構(gòu)造自監(jiān)督任務(wù)進(jìn)行訓(xùn)練,生成特征提取模型,不需要使用人工標(biāo)注的大樣本數(shù)據(jù)集,可以極大減小人工標(biāo)注工作量,降本增效。
(3) 使用生成式自監(jiān)督學(xué)習(xí)方法,在完成特征提取模型訓(xùn)練后,與有監(jiān)督模型相比,可以捕捉數(shù)據(jù)集特征局部細(xì)節(jié)特征和全局語義特征,模型具有很強(qiáng)的特征提取能力,并且只需要使用對少量標(biāo)注典型缺陷樣本訓(xùn)練的一個分類器,就可以達(dá)到不錯的分類效果。
(4) 生成式自監(jiān)督學(xué)習(xí)方法采用雙通道方式訓(xùn)練模型,避免從像素層面恢復(fù)原始圖像,減小運算量,可以應(yīng)用于實際工業(yè)生產(chǎn)。語義生成式自監(jiān)督學(xué)習(xí)方法具有普適性,可以應(yīng)用于大范圍工業(yè)表面檢測,有非常廣泛的應(yīng)用前景。
生成式自監(jiān)督學(xué)習(xí)方法采用雙通道方式來訓(xùn)練模型[15]。第一個通道使用離散變分編碼器對輸入圖像進(jìn)行編碼[16],形成輸入圖像的第一種表征方法,即圖像編碼表征。第二個通道將圖像輸入一個視覺變換器的主干網(wǎng),并采用遮蓋模型,要求模型具有獲得復(fù)原被遮蓋圖像塊的能力,進(jìn)而形成自注意力表征[17]。為了避免像素級復(fù)原而導(dǎo)致的大運算量,使用一個全連接分類網(wǎng)絡(luò),將自注意力表征映射為編碼表征,進(jìn)而將像素級遮蓋復(fù)原任務(wù)轉(zhuǎn)換為遮蓋編碼復(fù)原任務(wù)。這一方法在實現(xiàn)良好圖像特征表達(dá)的同時,減小像素級表達(dá)的運算量。模型的預(yù)訓(xùn)練過程是不斷訓(xùn)練視覺變換器和全連接網(wǎng)絡(luò)參數(shù)的過程,使遮蓋復(fù)原編碼與原始圖像編碼之間的誤差盡可能小。
模型架構(gòu)如圖1所示。
▲圖1 模型架構(gòu)
將高為H,寬為W,通道數(shù)為C的數(shù)字化輸入圖像標(biāo)記為X,X∈RH×W×C。R是一個高維張量,每個分量對應(yīng)不同位置像素在不同通道的值。將圖像X分割為多個圖像塊,設(shè)圖像塊的高和寬均為P,則圖像X可以分割為HW/P2個圖像塊。舉例而言,輸入圖像的高和寬均為224,將P設(shè)為16,則圖像可以分割為196個圖像塊。將這196個圖像塊堆疊起來,由此形成長度為196的圖像塊張量。
模型使用離散變分編碼器和解碼器對圖像進(jìn)行編碼和解碼。編碼器和解碼器都由深度殘差網(wǎng)絡(luò)組成,需要通過訓(xùn)練得到。為圖像建立一個詞匯表,詞匯表詞典長度為8 192個詞,詞典均勻離散分布。使用離散變分編碼器對圖像中的每個圖像塊進(jìn)行編碼,將圖像中的每個圖像塊均映射至長度為8 192個詞的詞匯表詞典中的碼字。輸入圖像X分割為196個圖像塊,輸入編碼器,得到196個離散編碼,每個編碼的取值在0~8 191之間,于是輸入圖像轉(zhuǎn)換為長度為196,取值為0~8 191的數(shù)組。離散變分編碼器可以極大壓縮圖像,提取圖像特征。解碼器使用196個碼字重建原始圖像,重建圖像的優(yōu)劣標(biāo)志著編碼器特征提取能力和生成能力的強(qiáng)弱。
在196個圖像塊的最前方,疊加一個附加的可以學(xué)習(xí)的類別標(biāo)志,用于綜合整個序列的語義信息。整幅圖像看作由196個單詞構(gòu)成的一段話,圖像識別可以看作是對這段話的語義識別,隨后連接嵌入映射層。將包含類別標(biāo)志的序列通過預(yù)歸一化層輸出至12個串接的視覺變換器模塊序列,每個視覺變換器模塊由注意力層、前饋層、跳接并聯(lián)、Dropout層等組成。通過一個全連接層,實現(xiàn)分類功能,作為下游任務(wù)。生成式自監(jiān)督學(xué)習(xí)方法通過遮蓋圖像建模任務(wù)來對網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,隨機(jī)遮蓋輸入圖像塊序列的40%,如輸入16個圖像塊,遮蓋5個圖像塊,在遮蓋后的序列疊加位置嵌入編碼,經(jīng)過嵌入層嵌入后,輸入視覺變換器,由復(fù)原法重建被遮蓋的40%圖像塊。圖1中,全黑的方塊是被遮蓋的圖像塊,輸入視覺變換器后,被遮蓋圖像塊的輸出預(yù)測嵌入向量值h2、h4、h7、h10、h14,接入后續(xù)全連接層。
視覺變換器主干網(wǎng)輸出完整的196個圖像塊嵌入向量值,只需取出被遮蓋的預(yù)測嵌入向量值h2、h4、h7、h10、h14,沒有被遮蓋的可以丟棄。隨后再訓(xùn)練全連接網(wǎng)絡(luò),網(wǎng)絡(luò)輸入為h2、h4、h7、h10、h14,輸出被遮蓋圖像塊的編碼。網(wǎng)絡(luò)訓(xùn)練目標(biāo)要求輸入重建圖像塊編碼與對應(yīng)原始圖像塊編碼之間的誤差盡可能小,通過梯度下降法不斷迭代訓(xùn)練,直致模型收斂。模型訓(xùn)練完畢后,只需要保留視覺變換器主干網(wǎng),丟棄之后的全連接網(wǎng)絡(luò),即可得到圖像的編碼網(wǎng)絡(luò),完成圖像特征提取網(wǎng)絡(luò)的訓(xùn)練。
為了測試基于生成式自監(jiān)督學(xué)習(xí)的太陽能電池板缺陷檢測方法的實際效果,進(jìn)行了試驗。試驗在Linux操作系統(tǒng)中完成,操作系統(tǒng)版本為Ubuntu 20.04,服務(wù)器具有128 GiByte內(nèi)存,配備四塊RTX 2080Ti GPU顯卡。試驗時選擇主流深度學(xué)習(xí)平臺PyTorch 1.7.1,應(yīng)用Python編程語言,采用Miniconda3創(chuàng)建獨立試驗環(huán)境,試驗過程如圖2所示。
▲圖2 試驗過程
太陽能電池板缺陷數(shù)據(jù)集包含2 624幅8位灰度圖像,分辨率為300像素×300像素。缺陷太陽能電池板樣本的性能都存在不同程度的退化,從44個不同的太陽能電池板模塊中提取。
對所有圖像根據(jù)大小和透視圖進(jìn)行標(biāo)準(zhǔn)化,并消除由用于捕獲電致發(fā)光圖像的相機(jī)鏡頭引起的失真。采用缺陷概率,即0~1之間的浮點值描述圖像,并對太陽能電池板組件類型進(jìn)行標(biāo)注。
將2 624幅圖像按照7∶2∶1分為訓(xùn)練集、驗證集、測試集,樣本分布見表1。由表1可以看出,圖像樣本數(shù)不均衡,缺陷概率為0與缺陷概率為100%的樣本數(shù)較多,缺陷概率為33%與缺陷概率為66%的樣本數(shù)較少,單晶缺陷概率為66%的樣本數(shù)僅為56,多晶缺陷概率為66%的樣本數(shù)僅為50,給模型訓(xùn)練和泛化帶來一定困難。
表1 太陽能電池板缺陷數(shù)據(jù)集樣本分布
數(shù)據(jù)集中,多晶缺陷概率為100%的圖像如圖3所示,多晶不同缺陷概率的圖像如圖4所示,單晶缺陷概率為100%的圖像如圖5所示,單晶不同缺陷概率的圖像如圖6所示。
▲圖3 多晶缺陷概率100%圖像▲圖4 多晶不同缺陷概率圖像▲圖5 單晶缺陷概率100%圖像▲圖6 單晶不同缺陷概率圖像
由圖3可以看出,缺陷1與缺陷4圖像缺陷顯著,缺陷2與缺陷3圖像缺陷不顯著,多晶缺陷概率均為100%的圖像類內(nèi)差別很大。由圖4可以看出,缺陷概率為0的圖像比缺陷概率為66%的圖像缺陷更為顯著,顯示很強(qiáng)的非線性特征。由圖5可以看出,缺陷1圖像缺陷顯著,缺陷3圖像缺陷不顯著,缺陷2與缺陷4圖像介于缺陷1與缺陷3圖像之間,單晶缺陷概率均為100%的圖像類內(nèi)差別同樣很大。由圖6可以看出,缺陷概率為0的第一幅圖像與缺陷概率為66%的圖像相似,缺陷概率為0的第二幅圖像與缺陷概率為33%的圖像顯示了更多的缺陷,同樣顯示出很強(qiáng)的非線性特征。
對比圖3、圖4、圖5、圖6,存在圖像類內(nèi)樣本差異大、圖像類間樣本差異小、非線性強(qiáng)等特點。如多晶缺陷概率為100%的圖像呈現(xiàn)出豐富的多樣性,單晶缺陷概率為100%的圖像也呈現(xiàn)出豐富的多樣性。從圖像表面看,存在多晶缺陷概率為100%的圖像比單晶缺陷概率為33%的圖像紋理更加干凈的情況,也存在單晶缺陷概率為0的圖像比單晶缺陷概率為66%的圖像紋理更復(fù)雜的情況。數(shù)據(jù)集類內(nèi)存在差異很大的樣本,類間存在差異較小的樣本,這給缺陷分類帶來很大困難,提高了預(yù)測模型的泛化難度。
現(xiàn)有的預(yù)訓(xùn)練模型已有廣譜二維圖像特征提取能力,尤其是提取自然界圖像特征的能力,已得到充分訓(xùn)練。太陽能電池板是工業(yè)產(chǎn)品,缺陷視覺特征顯著不同,不能直接使用預(yù)訓(xùn)練模型。筆者導(dǎo)入預(yù)訓(xùn)練模型,在太陽能電池板數(shù)據(jù)集中進(jìn)行調(diào)優(yōu),使調(diào)優(yōu)后的模型可以有針對性地提取缺陷特征。
預(yù)訓(xùn)練模型調(diào)優(yōu)訓(xùn)練時,參數(shù)設(shè)定非常重要,合適的參數(shù)可以達(dá)到收斂快、準(zhǔn)確度高的效果。經(jīng)過反復(fù)試驗,選定效果較好的參數(shù)。參數(shù)中,批次為32,優(yōu)化器選擇ADM,學(xué)習(xí)率為余弦優(yōu)化方案,熱身周期為5,層衰減為0.75,下降路徑為0.2,權(quán)重衰減為0.05,訓(xùn)練周期為200次。訓(xùn)練結(jié)果如圖7、圖8所示。
▲圖7 訓(xùn)練誤差與驗證誤差對比▲圖8 訓(xùn)練準(zhǔn)確率與驗證準(zhǔn)確率對比
使用訓(xùn)練集調(diào)優(yōu)時,由圖7可以看出,隨著訓(xùn)練次數(shù)的增加,訓(xùn)練誤差降低,驗證誤差降低。訓(xùn)練次數(shù)達(dá)到80次左右時,驗證誤差達(dá)到最低,訓(xùn)練誤差繼續(xù)降低。訓(xùn)練次數(shù)達(dá)到150次時,訓(xùn)練誤差收斂到0.75左右,此時已經(jīng)基本收斂。從經(jīng)驗來說,訓(xùn)練誤差與驗證誤差的交匯點就是模型訓(xùn)練的最優(yōu)訓(xùn)練點。再往后訓(xùn)練,雖然訓(xùn)練誤差可能繼續(xù)降低,但是驗證誤差卻會提高,模型有過擬合的危險。由圖8可以看出,隨著訓(xùn)練次數(shù)的增加,訓(xùn)練準(zhǔn)確率與驗證準(zhǔn)確率提高,訓(xùn)練次數(shù)達(dá)到114次時,驗證準(zhǔn)確率達(dá)到81.74%,之后驗證準(zhǔn)確率基本穩(wěn)定。
進(jìn)行一系列對比試驗,對比對象包括采用監(jiān)督學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)基線模型ResNet、2021年最佳模型Swin Transformer、基于對比學(xué)習(xí)的自監(jiān)督學(xué)習(xí)模型,對比試驗結(jié)果見表2。
表2 不同模型對比試驗結(jié)果
表2顯示,如果不進(jìn)行缺陷區(qū)域檢測等工作,直接使用監(jiān)督學(xué)習(xí)的ResNet、Swin Transformer來分類,模型訓(xùn)練識別準(zhǔn)確率都低于75%。原因是太陽能電池板的缺陷是開放式的,沒有固定模式,在這種情況下,缺陷區(qū)域定位難度大。在無法定位缺陷區(qū)域的情況下,傳統(tǒng)有監(jiān)督學(xué)習(xí)方法難以準(zhǔn)確提取特征,也就難以實現(xiàn)準(zhǔn)確識別。
Dino是基于對比學(xué)習(xí)的自監(jiān)督學(xué)習(xí),主干網(wǎng)絡(luò)為視覺變換器,效果較好。自監(jiān)督學(xué)習(xí)注意力模型可以依托注意力機(jī)制,非顯性提升缺陷區(qū)域的自注意力,從而達(dá)到較好的特征提取效果。表2顯示,Dino KNN的識別準(zhǔn)確率達(dá)到76.67%,Dino Linear的識別準(zhǔn)確率達(dá)到78.15%,生成式自監(jiān)督學(xué)習(xí)的識別準(zhǔn)確率則達(dá)到81.74%。Dino的對比學(xué)習(xí)屬于判別式自監(jiān)督學(xué)習(xí),特征提取能力不如生成式自監(jiān)督學(xué)習(xí),因而識別準(zhǔn)確率低于生成式自監(jiān)督學(xué)習(xí)。
針對太陽能電池板檢測這一難度較大的工業(yè)產(chǎn)品質(zhì)量控制問題,使用生成式自監(jiān)督學(xué)習(xí)提取特征,結(jié)合有監(jiān)督學(xué)習(xí)進(jìn)行調(diào)優(yōu)分類,檢測太陽能電池板的缺陷。在太陽能電池板缺陷數(shù)據(jù)集中進(jìn)行測試,并進(jìn)行對比試驗,生成式自監(jiān)督學(xué)習(xí)在200次訓(xùn)練的情況下獲得81.74%的識別準(zhǔn)確率,高于對比學(xué)習(xí)和有監(jiān)督學(xué)習(xí)。試驗結(jié)果表明,生成式自監(jiān)督學(xué)習(xí)在特征提取方面有獨特優(yōu)勢。生成式自監(jiān)督學(xué)習(xí)能夠很好地解決開放性缺陷問題,省略缺陷定位環(huán)節(jié),提高穩(wěn)定性。相比判別式自監(jiān)督學(xué)習(xí),生成式自監(jiān)督學(xué)習(xí)更能抓住細(xì)節(jié)信息,特征提取能力更強(qiáng)。生成式自監(jiān)督學(xué)習(xí)具有很強(qiáng)的圖像分割功能,特征提取能力普適性較強(qiáng),有良好的泛化能力。通過研究確認(rèn),生成式自監(jiān)督學(xué)習(xí)在特征提取方面具有局部細(xì)節(jié)豐富、捕捉全局語義特征等優(yōu)良屬性,具有良好的靈活性,在工業(yè)產(chǎn)品質(zhì)量檢測及工業(yè)圖像領(lǐng)域具有應(yīng)用推廣價值。