■ 封小云邱龍剛
陜西眾森電能科技有限公司
基于高斯混合模型的太陽(yáng)電池片顏色分類(lèi)設(shè)想與驗(yàn)證
■ 封小云*邱龍剛
陜西眾森電能科技有限公司
詳細(xì)介紹了高斯模型思想以及相關(guān)算法,將不同顏色的太陽(yáng)電池片分選到不同檔位中,方便將同類(lèi)電池片進(jìn)行歸類(lèi)。
太陽(yáng)電池;高斯混合模型;RGB、HSI顏色分量;樣本訓(xùn)練;分塊模型
眾所周知,太陽(yáng)電池片的生產(chǎn)工藝過(guò)程復(fù)雜,生產(chǎn)出來(lái)的電池片顏色各異,導(dǎo)致光電轉(zhuǎn)換效率不一,輸出電流能力存在差異。不同顏色的太陽(yáng)電池片串聯(lián)使用時(shí),最大輸出電流由該串聯(lián)電路中輸出電流能力最小的電池片決定,從而降低了整體轉(zhuǎn)換效率。由此可知,將不同顏色的電池片分選到不同檔位顯得非常重要。
長(zhǎng)期以來(lái),關(guān)于太陽(yáng)電池片的顏色分選主要靠人的眼睛,但是由于人眼存在很強(qiáng)的主觀意識(shí),并且長(zhǎng)時(shí)間的人眼分選勢(shì)必會(huì)造成人眼的疲勞,進(jìn)而導(dǎo)致工作效率下降或誤檢率增加。使用機(jī)器視覺(jué)的方法對(duì)太陽(yáng)電池片進(jìn)行分選,不僅重復(fù)精度高,而且增加檢測(cè)的客觀性和標(biāo)準(zhǔn)性。文中通過(guò)創(chuàng)建高斯混合模型,將采集的樣本(事先知道樣本的歸類(lèi))特征加入高斯混合模型中進(jìn)行訓(xùn)練,然后根據(jù)訓(xùn)練好的分類(lèi)器進(jìn)行待測(cè)太陽(yáng)電池片的分類(lèi),從而實(shí)現(xiàn)顏色分類(lèi)的自動(dòng)化。
實(shí)驗(yàn)中主要用的知識(shí)有顏色模型、圖像特征的提取和高斯混合模型對(duì)特征的訓(xùn)練,其中顏色模型的選擇和圖像特征的選擇直接影響高斯混合模型的訓(xùn)練結(jié)果。本節(jié)主要描述實(shí)驗(yàn)中選擇的顏色模型和高斯混合模型的思想。
1.1顏色模型
通常采集到的彩色圖像都是以RGB顏色空間呈現(xiàn)的[1],主要原因是該顏色模型是與設(shè)備相關(guān)的顏色模型,采用三維直角坐標(biāo)系。紅、綠、藍(lán)原色是加性原色,各個(gè)原色混合在一起可以產(chǎn)生復(fù)合色,如圖1所示。RGB顏色模型通常采用圖1所示的單位立方體來(lái)表示。在正方體的主對(duì)角線上,各原色的強(qiáng)度相等,產(chǎn)生由暗到明的白色,即不同的灰度值,(0,0,0)為黑色,(1,1,1)為白色。正方體的其他6個(gè)角點(diǎn)分別為紅、黃、綠、青、藍(lán)和品紅。
圖1 RGB顏色空間模型
由于RGB顏色空間并不接近人眼的顏色空間,因此有必要將顏色空間從RGB轉(zhuǎn)換到其他顏色空間。
HSI色彩空間[2]是從人的視覺(jué)系統(tǒng)出發(fā),用色調(diào)(Hue)、飽和度(Saturation或Chroma)和亮度(Intensity或Brightness)來(lái)描述色彩。HSI色彩空間可以用一個(gè)圓錐空間模型來(lái)描述,雖然這種圓錐模型相當(dāng)復(fù)雜,但能把色調(diào)、亮度和飽和度的變化情形表現(xiàn)得很清楚。通常把色調(diào)和飽和度統(tǒng)稱(chēng)為色度,用來(lái)表示顏色的類(lèi)別與深淺程度。由于人的視覺(jué)對(duì)亮度的敏感程度遠(yuǎn)強(qiáng)于對(duì)顏色濃淡的敏感程度,為了便于色彩處理和識(shí)別[3],人的視覺(jué)系統(tǒng)經(jīng)常采用HSI色彩空間,比RGB色彩空間更符合人的視覺(jué)特性,故而將顏色空間從RGB轉(zhuǎn)換到HSI,如圖2所示。在圖像處理和計(jì)算機(jī)視覺(jué)中,大量算法都可在HSI色彩空間中方便地使用,它們可分開(kāi)處理且相互獨(dú)立。因此,HSI色彩空間可大幅簡(jiǎn)化圖像分析和處理的工作量。
圖2 HSI顏色空間模型
HSI色彩空間和RGB色彩空間只是同一物理量的不同表示方法,因而它們之間存在轉(zhuǎn)換關(guān)系。RGB轉(zhuǎn)換到HSI的相關(guān)公式如下:
其中,
1.2高斯混合模型
高斯混合模型(Gaussian Mixture Model)的本質(zhì)是聚類(lèi)算法[4],該方法有很多種,k-means是最簡(jiǎn)單的一種聚類(lèi)方法[5]。其大致思想就是把數(shù)據(jù)分為多個(gè)堆,每個(gè)堆為一類(lèi),且都有一個(gè)聚類(lèi)中心(學(xué)習(xí)的結(jié)果就是獲得這k個(gè)聚類(lèi)中心),這個(gè)中心就是這個(gè)類(lèi)中所有數(shù)據(jù)的均值,而這個(gè)堆中所有的點(diǎn)到該類(lèi)的聚類(lèi)中心都小于到其他類(lèi)的聚類(lèi)中心(分類(lèi)的過(guò)程就是將未知數(shù)據(jù)對(duì)這k個(gè)聚類(lèi)中心進(jìn)行比較的過(guò)程,離哪個(gè)聚類(lèi)中心近就將其歸為哪一類(lèi))。k-means是最直觀、最方便理解的一種聚類(lèi)方式,原則就是把最像的數(shù)據(jù)分在一起,而“像”可自定義,比如說(shuō)歐式距離的最小等。
GMM和k-means十分相似,區(qū)別僅是GMM將概率引入了分類(lèi)過(guò)程中。統(tǒng)計(jì)學(xué)習(xí)的模型有兩種,一種是概率模型,一種是非概率模型。概率模型是指要學(xué)習(xí)的模型的形式是P(Y |X ),在分類(lèi)的過(guò)程中,通過(guò)未知數(shù)據(jù)X可以獲得Y取值的一個(gè)概率分布;也就是訓(xùn)練后模型得到的輸出不是一個(gè)具體的值,而是一系列值的概率(對(duì)應(yīng)于分類(lèi)問(wèn)題來(lái)說(shuō),就是對(duì)應(yīng)于各個(gè)不同的類(lèi)的概率),然后可以選取概率最大的那個(gè)類(lèi)作為判決對(duì)象(軟分類(lèi),soft assignment)。而非概率模型是指學(xué)習(xí)的模型是一個(gè)決策函數(shù)Y=f(X),輸入數(shù)據(jù)X就可以投影得到唯一的一個(gè)Y,是判決結(jié)果(硬分類(lèi),hard assignment)。在GMM中,學(xué)習(xí)的過(guò)程就是訓(xùn)練出幾個(gè)概率分布。
所謂高斯混合模型就是指對(duì)樣本的概率密度分布進(jìn)行估計(jì),而估計(jì)的模型是幾個(gè)高斯模型加權(quán)之和(具體個(gè)數(shù)要在模型訓(xùn)練前建立好);每個(gè)高斯模型代表一個(gè)類(lèi)(一個(gè)Cluster);對(duì)樣本中的數(shù)據(jù)分別在幾個(gè)高斯模型上投影,會(huì)分別得到在各個(gè)類(lèi)上的概率;最后可以選取概率最大的類(lèi)做為判決結(jié)果。
從中心極限定理的角度上看,把混合模型假設(shè)為高斯混合模型較為合理,當(dāng)然也可以根據(jù)實(shí)際數(shù)據(jù)定義成任何分布的混合模型,不過(guò)定義為高斯混合模型在計(jì)算上有一些方便之處。另外,理論上可以通過(guò)增加模型的個(gè)數(shù),用GMM近似任何概率分布。
高斯混合模型的定義為:
式中,K為模型的個(gè)數(shù);πk為第k個(gè)高斯的概率密度函數(shù),其均值為μk,方差為σk。對(duì)此概率密度的估計(jì)即求πk、μk和σk各個(gè)變量,當(dāng)求出這些變量的值后,求和式的各項(xiàng)結(jié)果就分別代表樣本x屬于各個(gè)類(lèi)的概率。
為了實(shí)現(xiàn)太陽(yáng)電池片顏色的分選,文中主要使用的算法有顏色空間轉(zhuǎn)換、特征提取和高斯混合模型訓(xùn)練。以下主要分析通過(guò)提取不同的特征,將這些特征通過(guò)高斯混合模型訓(xùn)練進(jìn)行分類(lèi)。
2.1特征提取
太陽(yáng)電池片特征提取主要有兩種實(shí)驗(yàn)方式,根據(jù)提取的兩種特征派生出太陽(yáng)電池片檢測(cè)的兩種方法。
2.1.1第一種特征提取方式
1)將原始圖像進(jìn)行RGB顏色空間分解。
2)在B空間的圖像上根據(jù)圖像的寬度和高度選取16個(gè)圓,并確保16個(gè)圓在前景太陽(yáng)電池片上,如圖3所示。根據(jù)圖像的大小進(jìn)行設(shè)定,文中實(shí)驗(yàn)圖像像素大小為204×204,圓數(shù)量越多可能代表性越強(qiáng),但隨著圓個(gè)數(shù)的增加,算法的執(zhí)行時(shí)間變長(zhǎng)。為提高算法的執(zhí)行效率,當(dāng)圖像很大時(shí),可將圖像進(jìn)行分塊處理。
3)計(jì)算該圓上像素值的中值作為特征。之所以選擇中值,目的是在一定程度上避免太陽(yáng)電池片圖像上柵線對(duì)特征的影響。實(shí)驗(yàn)證明,在光照條件相對(duì)穩(wěn)定的情況下,204×204像素大小的圖像選擇16個(gè)圓可以滿足太陽(yáng)電池片分選的要求。
圖3 16個(gè)圓的選擇
2.1.2第二種特征提取方式
1)將原始圖像進(jìn)行不同類(lèi)別分類(lèi)后,將其組合為一幅大圖,大圖中包含不同的種類(lèi),如圖4所示。
圖4 不同顏色太陽(yáng)電池片圖像
2)將組合的大圖進(jìn)行RGB顏色空間分解。
3)將圖像由RGB顏色空間轉(zhuǎn)換到HSI顏色空間。
4)由于太陽(yáng)電池片基本都是藍(lán)色,如果將色調(diào)H作為特征,其可區(qū)分性太差,不能作為太陽(yáng)電池片的代表,所以將HSI三通道圖像轉(zhuǎn)換SI二通道圖像,將SI作為圖像唯一性的表征。
2.2算法流程
首先對(duì)類(lèi)別已知的樣本進(jìn)行訓(xùn)練,然后根據(jù)訓(xùn)練好的分類(lèi)器對(duì)待檢測(cè)圖像進(jìn)行歸類(lèi)。其中,訓(xùn)練過(guò)程如圖5所示,可以將訓(xùn)練過(guò)程理解為一種在輸入X和輸出Y均已知的情況下確定函數(shù)Y=f(X)具體形式的函數(shù)擬合過(guò)程。識(shí)別過(guò)程如圖6所示,可以將其理解為將類(lèi)別未知的模式X作為函數(shù)f的輸入,從而計(jì)算出Y值的過(guò)程。
圖6 識(shí)別過(guò)程
本文從兩個(gè)不同的方向給出特征提取的方式,特征提取應(yīng)遵循類(lèi)內(nèi)相似性和類(lèi)間可區(qū)分性;然后將提取到的樣本特征加入到創(chuàng)建的高斯混合模型中進(jìn)行訓(xùn)練;通過(guò)對(duì)大量已知樣本的訓(xùn)練,便可生成具有針對(duì)該類(lèi)事物的分類(lèi)器。可利用訓(xùn)練好的分類(lèi)器將待檢測(cè)太陽(yáng)電池片歸到合適的分類(lèi)中。
3.1實(shí)驗(yàn)驗(yàn)證
3.1.1實(shí)驗(yàn)一
將不同類(lèi)別的圖像分為7類(lèi),將原始空間轉(zhuǎn)換到SI空間,然后對(duì)圖像進(jìn)行訓(xùn)練,最后對(duì)待檢測(cè)圖像進(jìn)行分類(lèi)。
由表1可知,有些分類(lèi)結(jié)果很接近。主要原因?yàn)椋?)雖然圖像的大小一致,但圖像中太陽(yáng)電池片的大小不一致,如圖7所示,太陽(yáng)電池片自身大小的不同導(dǎo)致最終面積的匹配大小可能存在偏差;2)采集到的圖像打光方案不是很理想,導(dǎo)致圖像自身都比較接近。注意:面積從左到右為39059、37601、37006、37990、38411、38939、37600,單位為像素。
圖7 圖像中太陽(yáng)電池片的定位
3.1.2實(shí)驗(yàn)二
該方法是將拍攝到的圖像進(jìn)行RGB顏色分解,在B通道中,在前景圖像(太陽(yáng)電池片圖像)上根據(jù)圖像的高度和寬度畫(huà)指定半徑的圓,然后計(jì)算圓上像素點(diǎn)的中值作為特征進(jìn)行高斯混合模型訓(xùn)練,選擇中值的原因是防止太陽(yáng)電池片柵線對(duì)顏色的影響。
實(shí)驗(yàn)中使用的圖像大小為204×204像素,圓的選擇如圖3所示。每次從16個(gè)圓中將8個(gè)圓作為一組,如圖8所示。其中,粉色部分是第一組的8個(gè)圓,黃色部分是第二組的8個(gè)圓,白色部分是第三組的8個(gè)圓。這里圓組的選擇方式是橫向選擇,當(dāng)然也可以縱向選擇三組8個(gè)圓。
圖8 16個(gè)圓中8個(gè)圓的選擇方式
根據(jù)不同的組合,模擬不同的樣本進(jìn)行訓(xùn)練。檢測(cè)階段,選擇16個(gè)圓中8個(gè)圓不同組成,選擇方式如上所述。為了進(jìn)一步確保分類(lèi)的準(zhǔn)確性,對(duì)3組(4行3組)8個(gè)圓使用少數(shù)服從多數(shù)的原則進(jìn)行顏色歸類(lèi),即保證3組中有兩組以上分類(lèi)成功。
實(shí)驗(yàn)結(jié)果表明,如果單純使用一組8個(gè)圓可能會(huì)導(dǎo)致分類(lèi)結(jié)果出錯(cuò)。但加上對(duì)3組8個(gè)圓使用少數(shù)服從多數(shù)的原則,誤檢率明顯降低。
在圖像增大時(shí),需要選擇更多的圓進(jìn)行訓(xùn)練,或?qū)D像分割為不同的小塊,在不同的小塊中使用上述方法,并增加進(jìn)行識(shí)別的組進(jìn)行檢測(cè)。
3.2實(shí)驗(yàn)環(huán)境要求
實(shí)驗(yàn)中對(duì)檢測(cè)圖像在同一環(huán)境中進(jìn)行拍攝,位置要求:
1)檢測(cè)過(guò)程中需要將太陽(yáng)電池片的圖像相對(duì)固定,不能存在較大角度,如圖9所示,其中圖像以白色作為背景,太陽(yáng)電池片為藍(lán)色區(qū)域。
圖9 太陽(yáng)電池片在圖像中的位置
2)由于分類(lèi)器是事先訓(xùn)練好的,對(duì)環(huán)境的要求比較嚴(yán)格,最好是在暗室中,光照條件基本穩(wěn)定。如果環(huán)境不穩(wěn)定的話就要重新訓(xùn)練分類(lèi)器。
3.3實(shí)驗(yàn)結(jié)論
通過(guò)實(shí)驗(yàn)一和實(shí)驗(yàn)二,并對(duì)其檢測(cè)結(jié)果進(jìn)行分析,同一相機(jī)下拍攝到的像素大小為204×204不同顏色的太陽(yáng)電池片圖像,兩個(gè)實(shí)驗(yàn)都是通過(guò)對(duì)大量樣本進(jìn)行學(xué)習(xí)、訓(xùn)練,可將太陽(yáng)電池片很好的歸類(lèi),與預(yù)期分類(lèi)結(jié)果一致。如圖10所示,將下面的圖像準(zhǔn)確的分類(lèi)為淺淺藍(lán)、淺藍(lán)、藍(lán)、深藍(lán)、深深藍(lán)、亮片和跳色。
圖10 太陽(yáng)電池片分類(lèi)結(jié)果
實(shí)驗(yàn)中給出太陽(yáng)電池片分選的指導(dǎo)思想和方向,暫時(shí)將太陽(yáng)電池片顏色分為7檔,可以根據(jù)要求訓(xùn)練已知類(lèi)別的樣本,實(shí)現(xiàn)更多不同檔位太陽(yáng)電池片的分選。即針對(duì)不同大小的圖像,在實(shí)驗(yàn)二的方法中可以選擇不同個(gè)數(shù)的圓,選擇不同個(gè)數(shù)的組進(jìn)行分類(lèi),具體的個(gè)數(shù)可以對(duì)已知樣本的大量訓(xùn)練和分類(lèi)得到。另外,實(shí)驗(yàn)中選擇HSI顏色空間和圓上像素值的中值作為特征進(jìn)行分類(lèi)器的訓(xùn)練,只有能夠很好地區(qū)分不同顏色的太陽(yáng)電池片,可以選擇其他太陽(yáng)電池片的特征作為高斯混合模型的訓(xùn)練特征。
[1]顧明, 鄭林濤, 尤鄭. 基于顏色空間轉(zhuǎn)換的交通圖像增強(qiáng)算法[J]. 儀器儀表學(xué)報(bào), 2015, (8): 1901-1902.
[2]邢岳,陳華秀,李偉越,等. 基于HSI顏色空間的交通標(biāo)志圖像分割算法研究[J]. 中國(guó)高新技術(shù)企業(yè), 2014, (8): 93-94.
[3] 鄭小東, 高潔, 張曉煜. 基于顏色空間轉(zhuǎn)換的混合豆類(lèi)分類(lèi)識(shí)別[J]. 中國(guó)糧油學(xué)報(bào), 2015, (4): 103-104.
[4]朱峰, 羅立民, 宋余慶, 等. 基于自適應(yīng)空間鄰域信息高斯混合模型的圖像分割[J]. 計(jì)算機(jī)研究與發(fā)展, 2011, (11): 2001-2003.
[5]宋余慶, 謝月華, 朱玉全, 等. 基于近似密度函數(shù)的醫(yī)學(xué)圖像聚類(lèi)分析研究[J]. 計(jì)算機(jī)研究與發(fā)展, 2006, (11): 1947-1952.
2016-01-13
封小云(1987—),男,碩士、軟件工程師,主要從事圖像處理和機(jī)器視覺(jué)方面的研究。fxy@gsola.cn