收稿日期:2022-07-24
基金項(xiàng)目:國家自然科學(xué)基金青年項(xiàng)目(62006120)
通信作者:朱婷婷(1989—),女,博士、副教授,主要從事數(shù)據(jù)建模與預(yù)測方面的研究。tingtingzhu@njfu.edu.cn
DOI:10.19912/j.0254-0096.tynxb.2022-1099 文章編號(hào):0254-0096(2023)11-0189-07
摘 要:在當(dāng)前地基云圖分類任務(wù)中,存在識(shí)別準(zhǔn)確率低等問題。為了提高云分類的精度,有效融合深度可分離卷積、注意力機(jī)制和殘差結(jié)構(gòu)的特點(diǎn),構(gòu)建DAR-CapsNet地基云圖分類模型。首先,收集整理美國國家新能源實(shí)驗(yàn)室公開數(shù)據(jù)庫中的地基云圖,構(gòu)建云分類數(shù)據(jù)庫;然后,對所提出的DAR-CapsNet分類模型進(jìn)行訓(xùn)練優(yōu)化;最后,在不同數(shù)據(jù)集上驗(yàn)證所提出的分類模型性能。實(shí)驗(yàn)結(jié)果表明所提出的DAR-CapsNet分類模型,分類準(zhǔn)確率高達(dá)95.50%,優(yōu)于現(xiàn)有公開分類方法,且在不同數(shù)據(jù)集上具有較好的泛化性能。
關(guān)鍵詞:光伏發(fā)電;氣象云;圖像分類;卷積神經(jīng)網(wǎng)絡(luò);機(jī)器學(xué)習(xí)
中圖分類號(hào):TP391""""""""""" """" """""""""""""文獻(xiàn)標(biāo)志碼:A
0 引 言
作為一種清潔的新能源,太陽能發(fā)電的優(yōu)勢在于可就地直接開發(fā)利用,無須開采和運(yùn)輸;其次,太陽能具有蘊(yùn)含能量大、無污染、分布廣等特點(diǎn)[1]。光伏發(fā)電應(yīng)用靈活且對環(huán)境影響小,是太陽能重要的利用途徑之一,在眾多新能源發(fā)電方式中具有廣闊的市場前景和強(qiáng)大的競爭力[2]。然而,在光伏發(fā)電的大規(guī)模并網(wǎng)進(jìn)程中,光伏發(fā)電波動(dòng)對電網(wǎng)的影響是不容忽視的。影響光伏發(fā)電的諸多因素中,最重要的因素是地表太陽輻射,而云的運(yùn)動(dòng)與遮擋會(huì)影響太陽輻照度。
目前,大多數(shù)氣象站對云的識(shí)別依賴于氣象觀測員人工目測,云類效果會(huì)因觀測人員經(jīng)驗(yàn)不同而不同。為此,研究人員利用經(jīng)典圖像特征,建立地基云圖傳統(tǒng)機(jī)器學(xué)習(xí)識(shí)別或分類模型,但云識(shí)別效果并不理想,尤其是復(fù)雜背景下云的識(shí)別度難以保障[3-7]。這主要是人為設(shè)計(jì)提取的各類云圖特征并不能準(zhǔn)確描述各類云的特性,導(dǎo)致部分云類型識(shí)別較為準(zhǔn)確,但部分類型云(如卷云、層云)難以識(shí)別[8-10]。
近年來,隨著計(jì)算性能的提升和類機(jī)器學(xué)習(xí)算法的發(fā)展,利用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)處理具體問題的技術(shù)越來越受到關(guān)注。同時(shí),深度學(xué)習(xí)也被運(yùn)用于云圖的分類,且取得了優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)分類方法的分類效果[11-14]。但現(xiàn)有的基于CNN云分類方法著力于檢測圖像像素中的重要特征,所提出的網(wǎng)絡(luò)模型均是基于普通卷積和池化操作來自動(dòng)學(xué)習(xí)云圖中的關(guān)鍵特征,但由于最大池化層的存在,雖然可以使神經(jīng)網(wǎng)絡(luò)在下采樣輸出時(shí)保證圖像的平移不變性,但卻丟失了特征之間的相對空間關(guān)系[15-16]。
針對上述云分類問題,本文以膠囊網(wǎng)絡(luò)CapsNet[15]為基本模型,綜合深度可分離卷積、注意力機(jī)制和殘差結(jié)構(gòu)的優(yōu)勢,構(gòu)建DAR-CapsNet地基云圖分類模型,以向量替代傳統(tǒng)標(biāo)量表征云圖特征,關(guān)注特征之間的相對位置信息,實(shí)現(xiàn)對地基云圖的準(zhǔn)確分類,有助于光伏發(fā)電的預(yù)測和新能源發(fā)電的推廣。
1 地基云圖數(shù)據(jù)集
1.1 地基云圖的收集與分類
收集整理美國國家新能源實(shí)驗(yàn)室公開數(shù)據(jù)庫[17]中的2013—2014年地基云圖。該地基云圖為288×352×3的RGB圖像,由Yankee公司生產(chǎn)的全天空成像儀TSI-880拍攝獲取。TSI-880是一款全自動(dòng)天空成像系統(tǒng),可在白天全天候?qū)μ炜者M(jìn)行實(shí)時(shí)觀測,拍攝頻率為30 s/幅。
根據(jù)云的紋理特性和物理特性,在忽略云底高的情況下,將地基云圖分為卷云、晴空、積云、雨層云、積雨云和層云。卷云(Ci),薄而透光性較好,潔白而亮澤,云體呈絲縷結(jié)構(gòu),似馬尾;積云(Cu),具有圓拱形向上凸起的頂部,云團(tuán)大小與拳頭類似,邊緣清晰;雨層云(Ni),云體低而漫無定型,常布滿天空,云層蓬松,呈暗灰色;積雨云(Cb),云體濃厚,呈花椰菜狀,邊緣輪廓模糊。由于地基云圖無法獲知云底高度,雨層云和積雨云的圖像極為相似,故將兩類合并為一類,稱為雨云。最后,層云(St),云體均勻成層,覆蓋面積大,幾乎布滿天空,多呈灰色。各類云典型圖像如圖1所示。
對收集到的兩年中地基云圖進(jìn)行篩選和分類,最終共選取1000張地基云圖,分為5類:卷云、層云、積云、雨云和晴空(無云)。每類圖像各200張,訓(xùn)練集和測試集按8∶2劃分。
1.2 地基云圖的預(yù)處理
為了最大限度地包含有效信息,將圖1中地基云圖進(jìn)行預(yù)處理,裁剪四周無效區(qū)域。將所有原始圖片的四周用黑色填補(bǔ),只保留鏡頭內(nèi)有效信息,同時(shí)將原始尺寸288×352×3裁剪至276×276×3,進(jìn)一步縮放為224×224×3。
此外,為提高后續(xù)分類模型泛化能力,對預(yù)處理后訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng),測試集保持不變。在同一類云圖中,云團(tuán)出現(xiàn)的位置不同不應(yīng)影響云的類別判別。因此,在訓(xùn)練過程中,每次輸入分類模型的云圖,有50%的云圖會(huì)被隨機(jī)左右翻轉(zhuǎn)和上下翻轉(zhuǎn),在一定程度上擴(kuò)充訓(xùn)練集數(shù)量,增加模型的魯棒性。
2 DAR-CapsNet地基云圖分類模型
膠囊網(wǎng)絡(luò)在獲取圖像內(nèi)各部分空間信息方面具有較大優(yōu)勢,考慮云團(tuán)的類別取決于其內(nèi)部結(jié)構(gòu)和紋理特征,而云團(tuán)在地基云圖中的位置應(yīng)不影響其所屬類別,因此有效利用膠囊網(wǎng)絡(luò)對于空間信息的敏感性有助于提升云圖的分類效果。本文通過對原始膠囊網(wǎng)絡(luò)CapsNet進(jìn)行改進(jìn),融合深度可分離卷積、注意力機(jī)制和殘差結(jié)構(gòu),構(gòu)建DAR-CapsNet模型,實(shí)現(xiàn)對地基云圖的有效分類。
2.1 DAR-CapsNet模型結(jié)構(gòu)
所構(gòu)建的DAR-CapsNet模型如圖2所示,在傳統(tǒng)的膠囊模型(CapsNet)上增加帶注意力機(jī)制的SEblock(squeeze and excitation block)模塊和帶殘差結(jié)構(gòu)的Resblock。同時(shí),在SEblock-1與SEblock-2之間和SEblock-3與Resblock-1之間使用的1×1卷積用于融合通道信息并進(jìn)行通道升維,加入Dropout層用于減少過擬合,DigitCaps層輸出的向量特征,經(jīng)過[L2]范數(shù)得到每個(gè)樣本的預(yù)測值,將預(yù)測值最大的類別作為輸入樣本的標(biāo)簽,實(shí)現(xiàn)對地基云圖的分類。
DAR-CapsNet模型中每層的卷積核尺寸、步長以及輸出尺寸如表1所示。在進(jìn)入CapsNet前,圖像尺寸以2的倍數(shù)減半,網(wǎng)絡(luò)最終輸出的尺寸為分類數(shù)×1的二維矩陣。
2.1.1 SEblock模塊
所提出的DAR-CapsNet模型中的SEblock模塊為帶有注意力機(jī)制的SE模塊,利用深度可分離卷積和通道注意力機(jī)制來提高提取特征的性能,其網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
SEblock的第1層為輸入層;第2層是1×1的逐點(diǎn)卷積,用于進(jìn)行通道間的信息融合以及通道的擴(kuò)張;第3層是3×3的逐通道卷積,將特征提取與特征組合分開進(jìn)行,可大大減少模型的參數(shù);第3層和第4層之間使用通道注意力機(jī)制,用于調(diào)整每個(gè)通道的權(quán)重,具體為先將特征圖的每個(gè)通道都進(jìn)行平均池化,然后進(jìn)行2個(gè)全連接層得到1個(gè)輸出,并與第3層特征圖進(jìn)行相乘,得到新的特征圖,其中第1個(gè)全連接層的輸出設(shè)置為原來通道數(shù)的1/4,第2個(gè)全連接層輸出設(shè)置為通道數(shù);第5層為第4層做1×1逐點(diǎn)卷積的輸出與第1層相加,形成線性瓶頸的逆殘差結(jié)構(gòu)。
在進(jìn)行地基云圖分類時(shí),SEblock模塊充分利用了深度可分離卷積分的逐通道卷積和逐點(diǎn)卷積兩種方式的優(yōu)勢,運(yùn)用少量模型參數(shù),從在擴(kuò)展特征圖和深度兩個(gè)方面提取云層信息,保證了對云圖具有較大的感受野,觀察到圖像的大部分區(qū)域。深度可分離卷積實(shí)現(xiàn)了空間和通道之間的解耦,在基本不影響準(zhǔn)確率的前提下大大減少參數(shù)量和計(jì)算量。深度可分離卷積的參數(shù)量和計(jì)算量分別如式(1)和式(2)所示:
[P1=Dk×Dk×MP2=M×NP=P1+P2] (1)
式中:[Dk]——卷積核的尺寸;[M]——通道數(shù)量;[N]——卷積核數(shù)量;[P]——深度可分離卷積的總參數(shù)量;[P1]——逐通道卷積參數(shù)量;[P2]——逐點(diǎn)卷積參數(shù)量。
[C1=Dk×Dk×M×Df×DfC2=M×N×Df×DfC=C1+C2]""""" (2)
式中:[C1]——逐通道卷積計(jì)算量;[Df]——特征圖的尺寸;[Df×Df]——每個(gè)卷積核對[Df×Df]的特征圖進(jìn)行的運(yùn)算次數(shù);[C2]——逐點(diǎn)卷積計(jì)算量;[C]——深度可分離卷積的總計(jì)算量。
而普通卷積的參數(shù)量和計(jì)算量分別為:
[Pa=Dk×Dk×M×N]"" (3)
[Ca=Dk×Dk×M×N×Df×Df]" (4)
則普通卷積與深度可分離卷積的參數(shù)量比值[RP]和計(jì)算量比值[RC]為:
[RP=Dk×Dk×M+M×NDk×Dk×M×N=1N+1D2k]"""" (5)
[RC=Dk×Dk×M×Df×Df+M×N×Df×DfDk×Dk×M×N×Df×Df=1N+1D2k]""" (6)
深度可分離卷積中逐通道卷積的核尺寸為3×3,逐點(diǎn)卷積的核尺寸為1×1。一般[N]取值較大,則[1/N]可忽略不計(jì)。當(dāng)[Dk]為3時(shí),深度可分離卷積的參數(shù)量與計(jì)算量約為作用相同的普通3×3卷積的1/9。
由于云體的層次結(jié)構(gòu)極為豐富,有些類別的云邊緣較模糊,且差異很小,在同一類云中,有時(shí)形狀變化也較大,這對于傳統(tǒng)CNN來說增加了提取特征的難度。因此,為使網(wǎng)絡(luò)更適用于提取云的特征,所設(shè)計(jì)的網(wǎng)絡(luò)模型需充分利用特征圖中的信息,實(shí)現(xiàn)對云體特征的全方面、精確地提取。如本文數(shù)據(jù)集中的卷云類,云層稀薄,且顏色較淡,能提取到的信息較少,注意力機(jī)制能充分關(guān)注不同通道的有效特征,這是云圖分類的重要依據(jù),且能自動(dòng)調(diào)整每個(gè)特征通道的重要性,通過建模通道之間的相互依賴關(guān)系來自適應(yīng)地重新校準(zhǔn)通道方面的特征響應(yīng),使神經(jīng)網(wǎng)絡(luò)重點(diǎn)關(guān)注某些權(quán)重值大的通道。因此,在地基云圖分類中,注意力機(jī)制的加入使得分類效果具有一定程度的提升。
2.1.2 Resblock模塊
殘差模塊Resblock的結(jié)構(gòu)如圖4所示,其中卷積核大小為3×3。相比于學(xué)習(xí)原始的信號(hào),殘差結(jié)構(gòu)學(xué)習(xí)的是信號(hào)的差值,這簡化了學(xué)習(xí)過程,增強(qiáng)了梯度傳播,提高了網(wǎng)絡(luò)的泛化能力。殘差結(jié)構(gòu)中導(dǎo)數(shù)包含了恒等項(xiàng),所以能有效地進(jìn)行反向傳播。殘差結(jié)構(gòu)在一定程度上加深了網(wǎng)絡(luò)結(jié)構(gòu),能更深層次地提取云圖特征。
2.1.3 CapsNet模塊
CapsNet模塊主要包括卷積層、主膠囊層和數(shù)字膠囊層,其結(jié)構(gòu)如圖5所示。卷積層的作用是縮小特征圖尺寸、提升通道數(shù),主膠囊層的作用是將特征輸出成特征向量而不是標(biāo)量,數(shù)字膠囊層的作用是通過動(dòng)態(tài)路由算法獲得更深層次的空間特征。由于CapsNet結(jié)合了對象之間的相對關(guān)系,在數(shù)值上表示為四維位姿矩陣,這對于正確分類和辨識(shí)對象來說很重要。膠囊網(wǎng)絡(luò)具有普通卷積神經(jīng)網(wǎng)絡(luò)不具有的旋轉(zhuǎn)不變性。由于前文在數(shù)據(jù)增強(qiáng)中做了旋轉(zhuǎn)變換,膠囊網(wǎng)絡(luò)能有效克服CNN不具備旋轉(zhuǎn)不變性的缺陷。
2.2 模型參數(shù)優(yōu)化與評價(jià)指標(biāo)
對于使用CapsNet結(jié)構(gòu)的模型設(shè)置優(yōu)化器為Nadam。Nadam在Adam基礎(chǔ)上加入了一階動(dòng)量的累積??紤]到模型可能會(huì)陷入局部最小值,設(shè)置余弦退火學(xué)習(xí)率調(diào)整策略,余弦退火曲線半周期為20代。使用損失函數(shù)為:
[Lk=Tkmax0,m+-vk2+λ1-Tkmax0,vk-m-2]"""""" (7)
式中:[Lk]——第[k]類類別的損失值;[m+]——假陽性懲罰系數(shù);[vk]——第[k]類膠囊向量長度;[λ]——不存在類別損失的向下加權(quán)系數(shù);[m-]——假陰性懲罰系數(shù);[Tk]——第[k]類是否存在,具體定義為:
[Tk=1,第k類類別存在0,第k類類別不存在]""" (8)
參考Sabour等[15]研究結(jié)果中損失函數(shù)的參數(shù)取值,本文[m+]取0.9,[m-]取0.1,[λ]取0.5。
評價(jià)指標(biāo)為準(zhǔn)確率[A],即分類正確數(shù)與測試集總樣本數(shù)的比例,即:
[A=ncorrectntotal]" (9)
式中:[ncorrect]——分類正確的樣本數(shù)量;[ntotal]——測試集所有樣本數(shù)量。
3 實(shí)驗(yàn)設(shè)置與結(jié)果分析
3.1 實(shí)驗(yàn)設(shè)置
本文使用Pytorch框架對DAR-CapsNet進(jìn)行搭建,軟硬件的實(shí)驗(yàn)環(huán)境如表2所示。
3.2 基于CapsNet模型的性能分析
設(shè)計(jì)對比實(shí)驗(yàn),將DAR-CapsNet模型與CapsNet+SEblock、CapsNet+Resblock和原始CapsNet進(jìn)行地基云圖分類效果對比。設(shè)置迭代次數(shù)為120次,初始學(xué)習(xí)率為0.003。在對比實(shí)驗(yàn)中,根據(jù)Sabour等[15]提出的囊間動(dòng)態(tài)路由算法,同時(shí)對比超參數(shù)routing(r)設(shè)置為3和5的情況,膠囊網(wǎng)絡(luò)均不進(jìn)行重建,實(shí)驗(yàn)結(jié)果如表3所示??梢姡珻apsNet由于層數(shù)較淺,不適合大尺寸圖片輸入,準(zhǔn)確率較低。結(jié)合Resblock后,模型參數(shù)量和訓(xùn)練時(shí)間明顯上升,得益于加深網(wǎng)絡(luò)提取到更多有效信息,測試精度有所提升,但仍略低于CapsNet+SEblock模型。結(jié)合SEblock后,CapsNet+SEblock準(zhǔn)確率達(dá)到了93.00%,表明注意力機(jī)制對分類性能的影響之大。在結(jié)合SEblock和Resblock后,DAR-CapsNet模型參數(shù)量適中,且易于訓(xùn)練,比前3種模型具有更好的分類效果。對比超參數(shù)routing調(diào)整的情況,[r=3]時(shí)的分類準(zhǔn)確率均高于[r=5]時(shí)。[r=5]會(huì)導(dǎo)致模型過擬合且降低運(yùn)行效率,因此將[r=3]作為最優(yōu)超參數(shù)設(shè)置。
表3中最優(yōu)模型DAR-CapsNet([r=3])的訓(xùn)練集、測試集準(zhǔn)確率和訓(xùn)練集、測試集損失值對比如圖6所示??梢姡ㄟ^設(shè)置余弦退火學(xué)習(xí)率調(diào)整策略,訓(xùn)練集的準(zhǔn)確率和損失值有較大幅度震蕩,利用此特性可跳出局部最小值,防止模型提前收斂。在100代左右時(shí),模型收斂,準(zhǔn)確率最高達(dá)到95.50%。
DAR-CapsNet([r=3])模型測試集分類結(jié)果混淆矩陣如圖7所示。DAR-CapsNet模型將部分卷云樣本誤分為層云(10%誤識(shí)別),觀察數(shù)據(jù)集中的卷云和層云,發(fā)現(xiàn)兩種云的特征較為相似,誤判概率較高。此外,模型也將極個(gè)別層云樣本誤判為卷云和雨云??梢姡珼AR-CapsNet模型對于卷云和層云的分類效果還有待提高,后續(xù)可改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)加強(qiáng)對卷云和層云特征的關(guān)注或在輸入中增加相關(guān)表征卷云和層云的特征參數(shù),進(jìn)而提高卷云和層云的識(shí)別率。
3.3 基于經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)的性能分析
設(shè)計(jì)第2組對比實(shí)驗(yàn),將DAR-CapsNet([r=3])模型與經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)分類模型(AlexNet、VGG16、GooLeNet、ResNet18)進(jìn)行對比。經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)分類模型的損失函數(shù)使用交叉熵,具體為AlexNet的優(yōu)化器選擇SGD,其余模型與DAR-CapsNet([r=3])模型設(shè)置一樣,使用Nadam,實(shí)驗(yàn)結(jié)果如表4所示。
表4中VGG16模型參數(shù)量最大,但分類準(zhǔn)確率只有89.00%,可見對于地基云圖分類任務(wù),參數(shù)量大并不一定能準(zhǔn)確地將不同類別的云區(qū)分開。4種經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)中,表現(xiàn)最好的ResNet18參數(shù)量和訓(xùn)練時(shí)間略優(yōu)于所提出的DAR-CapsNet ([r=3])模型,但準(zhǔn)確率相差3.5%。綜上,所提出的DAR-CapsNet模型在測試準(zhǔn)確率上取得了最好的效果,在準(zhǔn)確率、參數(shù)量和訓(xùn)練時(shí)間方面達(dá)到了平衡,表明該模型參數(shù)量適中,且易于訓(xùn)練。
3.4 基于SWIMCAT數(shù)據(jù)集的模型性能分析
為了進(jìn)一步驗(yàn)證所提出的DAR-CapsNet模型的泛化能力和可遷移性,在公開新加坡全天空影像分類數(shù)據(jù)集(Singapore whole-sky imaging categories, SWIMCAT)[18]上進(jìn)行訓(xùn)練與測試。在SWIMCAT數(shù)據(jù)集中對每類云圖隨機(jī)抽取40張圖像作為測試集,其余作為訓(xùn)練集,實(shí)驗(yàn)結(jié)果如圖8所示。所提出的DAR-CapsNet模型對厚烏云和薄云兩個(gè)類別的分類準(zhǔn)確率比原論Soumyabrata Dev方法效果好,尤其是薄云。整體上DAR-CapsNet模型分類精度高達(dá)99.50%,相比Soumyabrata Dev分類方法高出4.50%,表明所提模型具有較好的可遷移性和一定的泛化能力。
4 結(jié) 論
為了提高云分類精度,利用美國國家新能源實(shí)驗(yàn)室公開數(shù)據(jù)庫中的2013—2014年地基云圖監(jiān)測數(shù)據(jù),以CapsNet為基本模型,融合SEblock和Resblock,提出DAR-CapsNet分類模型,對5類地基云圖進(jìn)行分類,并與多個(gè)經(jīng)典深度學(xué)習(xí)分類模型進(jìn)行多組對比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)分類模型的分類準(zhǔn)確率最高為92.00%,而本文構(gòu)建的模型分類準(zhǔn)確率可高達(dá)95.50%,且參數(shù)量適中,易于訓(xùn)練。同時(shí),在不同公開數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),證明本文提出的模型具有較好的泛化性能。本研究豐富了氣象云分類的方法,提供精度更高的云分類方法。同時(shí),對新能源發(fā)電的推廣具有重要意義。
雖然所提出的DAR-CapsNet模型在地基云圖分類中具有較好的表現(xiàn),但目前的數(shù)據(jù)集中依然存在著易混淆的云圖圖像。在后續(xù)研究中,繼續(xù)關(guān)注如何提高模型在卷云和層云上的分類,進(jìn)一步優(yōu)化膠囊網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu),如采用動(dòng)態(tài)路由算法,提升其運(yùn)行效率,提高模型整體性能。
此外,本文所討論的云圖樣本均是在空氣質(zhì)量較好的情況下拍攝獲得,對存在嚴(yán)重空氣污染情況的天空云分類還有待進(jìn)一步研究。如通過增加云底高、氣溶膠含量等氣象環(huán)境參數(shù),設(shè)計(jì)“數(shù)值-圖像”融合分類模型結(jié)構(gòu),實(shí)現(xiàn)對重污染條件下的云準(zhǔn)確分類。
[參考文獻(xiàn)]
[1]"""" 過奕任, 張夢葉, 朱婷婷, 等. 基于網(wǎng)絡(luò)集成的太陽全輻射超短期混合預(yù)測方法[J]. 工業(yè)控制計(jì)算機(jī), 2020, 33(9): 35-36, 39.
GUO Y R, ZHANG M Y, ZHU T T, et al. A hybrid model for very short-term forecast of global horizontal irradiance based on network ensemble[J]. Industrial control computer, 2020, 33(9): 35-36, 39.
[2]"""" 倪超, 王聰, 朱婷婷, 等. 基于CNN-Bi-LSTM的太陽輻照度超短期預(yù)測[J]. 太陽能學(xué)報(bào), 2022, 43(3): 197-202.
NI C, WANG C, ZHU T T, et al. Super-short-term forecast of solar irradiance based on CNN-Bi-LSTM[J]. Acta energiae solaris sinica, 2022, 43(3): 197-202.
[3]"""" 張之正, 馮徑, 徐志康, 等. 基于Android平臺(tái)的地基云狀識(shí)別系統(tǒng)[J]. 自動(dòng)化技術(shù)與應(yīng)用, 2019, 38(11): 127-131, 146.
ZHANG Z Z, FENG J, XU Z K, et al. Ground nephogram recognition system based on android platform[J]. Techniques of automation and applications, 2019, 38(11): 127-131, 146.
[4]"""" 楊秋良, 王鈺, 楊杏麗, 等. 基于互信息F統(tǒng)計(jì)量特征選擇技術(shù)的地基氣象云圖分類[J]. 計(jì)算機(jī)與現(xiàn)代化, 2021(2): 18-23,29.
YANG Q L, WANG Y, YANG X L, et al. Classification of ground-based meteorological cloud images based on feature selection technique of mutual information F-statistics[J]. Computer and modernization, 2021(2): 18-23, 29.
[5]nbsp;""" 李林, 劉青山, 夏旻. 基于極限學(xué)習(xí)機(jī)的地基可見光云圖的云分類[J]. 大氣科學(xué)學(xué)報(bào), 2015, 38(5): 678-685.
LI L, LIU Q S, XIA M. Cloud classification based on ground-based vision cloud image using extreme learning machine [J]. Transactions of atmospheric sciences, 2015, 38(5): 678-685.
[6]"""" 朱彪, 楊俊, 呂偉濤, 等. 基于KNN的地基可見光云圖分類方法[J]. 應(yīng)用氣象學(xué)報(bào), 2012, 23(6): 721-728.
ZHU B, YANG J, LYU W T, et al. Ground-based visible cloud image classification method based on KNN algorithm [J]. Journal of applied meteorological science, 2012, 23(6): 721-728.
[7]"""" HEINLE A, MACKE A, SRIVASTAV A. Automatic cloud classification"" of"" whole"" sky""" images[J]."" Atmospheric measurement techniques, 2010, 3(3): 557-567.
[8]"""" KLIANGSUWAN T, HEEDNACRAM A. Feature extraction"" techniques"" for"" ground-based"" cloud"" type classification[J]. Expert systems with applications, 2015, 42(21): 8294-8303.
[9]"""" KAZANTZIDIS A, TZOUMANIKAS P, BAIS A F, et al. Cloud detection and classification with the use of whole-sky ground-based images[J]. Atmospheric research, 2012, 113: 80-88.
[10]""" 王敏, 莊志豪, 王康, 等. 地基云圖卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)分類的訓(xùn)練過程[J]. 信息技術(shù), 2021, 45(10): 26-30.
WANG M, ZHUANG Z H, WANG K, et al. Training process of convolution neural network in automatic classification of ground-based cloud image[J]. Information technology, 2021,45(10): 26-30.
[11]""" ZHANG J L, LIU P, ZHANG F, et al. CloudNet: ground-based cloud classification with deep convolutional neural network[J]."" Geophysical"" research"" letters,"" 2018," 45(16): 8665-8672.
[12]""" 賈克斌, 張亮, 劉鵬宇, 等. 基于輕量級(jí)神經(jīng)網(wǎng)絡(luò)的地基云圖識(shí)別[J]. 北京工業(yè)大學(xué)學(xué)報(bào), 2021, 47(5): 489-499.
JIA K B, ZHANG L, LIU P Y, et al. Ground-based cloud recognition"" basednbsp;" on"" lightweight"" neural"" network[J]. Journal of Beijing University of Technology, 2021, 47(5): 489-499.
[13]""" 崔順, 許允飛, 蘇麗穎, 等. 基于卷積神經(jīng)網(wǎng)絡(luò)的全天空地基云圖分類研究[J]. 天文研究與技術(shù), 2019, 16(2): 225-235.
CUI S, XU Y F, SU L Y, et al. Classification of all-sky camera" data" based" on" convolutional" neural" network[J]. Astronomical research amp; technology, 2019, 16(2): 225-235.
[14]""" 段向軍, 王敏. 遷移深度學(xué)習(xí)地基云圖自動(dòng)識(shí)別的網(wǎng)絡(luò)微調(diào)學(xué)習(xí)過程[J]. 電子器件, 2020, 43(6): 1257-1261.
DUAN X J, WANG M. An ground cloud image recognition method"" using"" AlexNet"" convolution" neural" network[J]. Chinese journal of electron devices, 2020, 43(6): 1257-1261.
[15]""" SABOUR S, FROSST N, HINTON G E. Dynamic routing between" Capsules[J]." Advances" in" neural" information processing systems, 30: 3859-3869, 2017.
[16]""" MAZZIA V, SALVETTI F, CHIABERGE M. Efficient-CapsNet: capsule network with self-attention routing[J]. Scientific reports, 2021, 11: 14634.
[17]""" STOFFEL T, ANDREAS A. NREL solar radiation research laboratory (SRRL): baseline measurement system (BMS); golden, Colorado (data)[R]. No. NREL/DA-5500-56488, 1981.
[18]""" DEV S, LEE Y H, WINKLER S. Categorization of cloud image patches using an improved texton-based approach[C]//2015 IEEE International Conference on Image Processing (ICIP). Quebec City, Canada: IEEE, 2015: 422-426.
CLOUD CLASSIFICATION OF GROUND-BASED CLOUD IMAGES
BASED ON DAR-CapsNet
Wei Liang,Zhu Tingting,Guo Yiren,Ni Chao,Teng Guang,Li Yan
(College of Mechanical and Electronic Engineering, Nanjing Forestry University, Nanjing 210037, China)
Abstract:In the current ground-based cloud image classification task, there are problems such as low recognition accuracy. In order to improve the accuracy of cloud classification, the DAR-CapsNet classification model for ground-based cloud images has been constructed by effectively integrating the features of depthwise separable convolution, attention mechanism and residual structure. Firstly, the ground-based cloud images were collected from the public database of the National New Energy Laboratory of the United States to build a cloud classification database; then, the proposed DAR-CapsNet classification model was trained and optimized; finally, experiments were conducted on different datasets to verify the performance of the proposed classification model. The experimental results show that the classification accuracy of the DAR-CapsNet model is as high as 95.50%, which is better than some published classification models, and the DAR-CapsNet model has better generalization performance on different datasets.
Keywords:photovoltaic power generation; clouds; image classification; convolutional neural networks; machine learning