亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于殘差Swin Transformer的天氣圖像識別技術研究

        2023-11-17 03:01:08張卓然
        成都信息工程大學學報 2023年6期
        關鍵詞:優(yōu)化實驗模型

        張卓然,張 倩,宋 智,何 嘉

        (1.成都信息工程大學計算機學院,四川成都 610225;2.活躍網(wǎng)絡(成都)有限公司,四川成都 610000;3.四川省氣象探測數(shù)據(jù)中心,四川成都 610072)

        0 引言

        從戶外活動到工業(yè)生產(chǎn),天氣在人類活動中起著十分重要的作用。如在霧、雪、暴雨、沙塵暴等極端天氣條件下,會出現(xiàn)模糊、光滑、濕潤的道路情況,導致交通堵塞甚至造成交通事故。通過對天氣現(xiàn)象的實時監(jiān)控并結合交通信息,可以有效地避免這些情況的產(chǎn)生。此外,不同的天氣現(xiàn)象也極大地影響著農業(yè)生產(chǎn),準確地對天氣現(xiàn)象進行識別,有助于保障農作物的生長。

        在傳統(tǒng)的天氣識別中,主要是依靠各種傳感器和人工采集結果來測量溫度、濕度和天氣狀況。由于傳感器成本普遍較高,又需要定期進行人工維護,導致不能大范圍地布置傳感器,從而使部分區(qū)域的天氣預報不準確。

        隨著深度學習的發(fā)展和攝像頭的普及,通過獲得天氣圖像來進行天氣識別將成為計算機視覺一個重要的應用。近年來,Lu 等[1]采集并創(chuàng)建了一個基于晴天和陰天的天氣數(shù)據(jù)集,通過分別提取天空、陰影、反射、對比度和模糊5 個天氣特征,提出協(xié)作學習框架進行天氣分類。Song 等[2]通過提取圖片本身的特征并結合K-NN 算法實現(xiàn)了對晴天、雨天、霧天和雪天的識別。上述方法均是采用機器學習,未能準確地學習天氣圖像的特征,對天氣現(xiàn)象的識別效果不夠理想。

        自2012年AlexNet[3]在ImageNet 大規(guī)模視覺識別挑戰(zhàn)賽取得成功以來,卷積神經(jīng)網(wǎng)絡(CNN)被廣泛應用到天氣現(xiàn)象識別領域。Lin 等[4]提出一種面向多類別天氣識別的區(qū)域選擇和并發(fā)模型的深度學習框架,但該方法性能開銷過大、時效性差且平均準確率低。Zhao 等[5]提出一種基于CNN-RNN 的多類別天氣識別方法,但該方法需要大規(guī)模的數(shù)據(jù)集作為支持,且只能在高端GPU 上進行訓練,計算代價非常昂貴。Wang等[6]提出一種基于輕量級卷積神經(jīng)網(wǎng)絡的天氣識別方案,該方案雖然節(jié)省模型的內存開銷,但降低了天氣識別的準確度。Tan 等[7]通過一種三通道卷積神經(jīng)網(wǎng)絡對常見的6 種天氣現(xiàn)象進行有效識別,但只考慮了少數(shù)的天氣類別。此外,Xiao 等[8]在VGG16 的基礎上提出一種針對11 種天氣現(xiàn)象的網(wǎng)絡MeteCNN,然而在個別類別識別率較低,沒有達到很好的效果。

        上述方法雖然運用了不同的CNN 模型,但都忽視了圖像的全局信息,隨著網(wǎng)絡的加深會產(chǎn)生梯度消失的問題,同時感受野在一定程度上受局限。2021年研究人員提出一個適用于圖像分類的Transformer 模型ViT[9],并在ImageNet 數(shù)據(jù)集獲得了出色的結果。相比于CNN 模型的平移不變性、局部敏感性和特征之間依賴關系差,Transformer 模型的自注意力(self-attention,SA)不受局部相互作用的限制,可以根據(jù)不同的任務目標學習最合適的歸納偏置[10]。

        針對以上問題,本文嘗試將視覺Transformer 應用到天氣現(xiàn)象識別領域,選取一種利用滑動窗口操作、具有層級設計的Swin Transformer 網(wǎng)絡結構[11]作為基礎網(wǎng)絡,并在其基礎上加入殘差結構和先進的優(yōu)化器來增強模型的學習能力。實驗結果表明,本文方法與其他識別方法相比具有更高的識別精度。

        1 網(wǎng)絡結構

        本文提出一種基于殘差結構的Swin-Transformer網(wǎng)絡模型用于天氣圖像的識別,該模型由圖像塊分割層、線性嵌入層、圖像塊合并層、殘差窗口自注意力塊(residual swin transformer block,RSTB)、歸一化層(layer norm,LN)、自適應平均池化層、全連接層組成。網(wǎng)絡結構圖如圖1(a)所示。

        圖1 基于殘差Swin Transformer的天氣圖像識別網(wǎng)絡結構

        模型首先通過圖像塊分割層將輸入的RGB 天氣圖片劃分為多個不重疊的patch,每個patch 的大小為4×4,特征維度為4×4×3=48,經(jīng)過4 個階段構建不同大小的特征圖。其中只有第1 階段通過線性嵌入層將特征投影到任意維度C,后3 個階段通過圖像塊合并層進行下采樣,使特征圖的寬和高縮小一半,通道數(shù)擴大1 倍。接著,使用RSTB 模塊進行特征變換,這個模塊由一個殘差結構連接不同數(shù)目的窗口自注意力塊(swin transformer block,STB)模塊構成。最后,經(jīng)過一個歸一化層、一個自適應平均池化層和一個全連接層后輸出天氣圖像的類別。

        1.1 窗口自注意力塊

        窗口自注意力塊由1 個多頭自注意力機制(multihead self-attention,MSA)和1 層多層感知機(multi-layer perceptron,MLP)組成,在MSA 和MLP 之間需要應用一個LN 層,之后應用一個殘差連接。MSA 擁有兩種不同的結構:窗口多頭自注意力機制(windows multihead self-attention,W-MSA);移動窗口多頭自注意力機制(shifted windows multi-head self-attention,SW-MSA)。

        如圖2(a)所示,MSA 在計算過程中需要對特征圖中的每個像素進行運算,這種操作增加了整個模型的計算量。W-MSA 模塊將特征圖按照大小為M×M將大小為H×W的圖像劃分成多個窗口,然后單獨對每個窗口進行自注意力計算,從而減少模型的計算量。MSA 和W-MSA 的計算復雜度如下:

        圖2 移動窗口重組示意圖

        Ω(MSA)=4HWC2+2(HW)2C

        Ω(W-MSA)=4HWC2+2M2HWC

        由于單一使用W-MSA 會出現(xiàn)不同窗口之間缺乏信息交互,這限制了模型的能力。因此,需要在W-MSA之后引入SW-MSA 進行跨窗口連接,同時可以保持非重疊窗口的高效計算,SW-MSA 的跨窗口連接重組如圖2所示。首先,將W-MSA 的4 個窗口通過滑動窗口變?yōu)镾W-MSA 的9 個窗口,且這9 個窗口大小不一致。為方便后續(xù)計算需要將SW-MSA 的9 個窗口重新整合成與原W-MSA 窗口大小一致的4 個窗口,再使用掩膜Mask隔絕不同區(qū)域的信息,最后將窗口還原。

        故STB 模塊必須成對使用,第1 個模塊使用WMSA,第2 個模塊使用SW-MSA,2 個連續(xù)的STB 模塊如圖2(b)所示。

        1.2 殘差窗口自注意力塊

        在天氣識別任務中,為使網(wǎng)絡獲取更多有用信息,就需要對特征進行充分的提取和利用。在之前的研究中,天氣識別任務通常使用卷積神經(jīng)網(wǎng)絡進行識別,而卷積神經(jīng)網(wǎng)絡通常使用殘差連接[12]和稠密連接[13]提高網(wǎng)絡性能,減少因模塊堆疊、網(wǎng)絡過深而造成的模型退化問題。由式(1)可知,W-MSA 計算復雜度與通道數(shù)成正比關系,而稠密連接使用過多會極大地增加通道數(shù)。故本文將在STB 模塊堆疊之間引入殘差連接,并將改進后的堆疊STB 模塊稱為RSTB,其結構如圖1(b)所示。

        根據(jù)上述數(shù)據(jù)可知,路面竣工后空隙率、穩(wěn)定度和流值均滿足規(guī)范要求,面層結構為灌入式半柔性面層,且與基層結合很好。說明該半柔性路面施工技術的應用,能有效保證路面施工質量要求。

        2 損失函數(shù)和優(yōu)化器

        2.1 交叉熵損失函數(shù)

        模型訓練中需要使用損失函數(shù)來衡量模型的效果,進而改進模型參數(shù)的質量。本文使用的損失函數(shù)是交叉熵(CrossEntropy),主要用于度量兩個概率分布之間的差異性,值總是大于等于0。其值越接近于0,就代表兩個分布越相似。其數(shù)學公式:

        式中:N代表樣本總數(shù),M代表類別的數(shù)量;yic代表符號函數(shù)(0 或1),如果樣本i的真實類別等于c則取1,否則取0;pic代表樣本i屬于類別c的預測概率。

        2.2 Ranger 優(yōu)化器

        Ranger 優(yōu)化器[14]結合了RAdam[15]和Lookahead[16]兩種優(yōu)化器。RAdam 為優(yōu)化器的初期訓練提供最好的基礎,用一個動態(tài)整流器調整Adam 的自適應動量,并有效地提供一種基于當前數(shù)據(jù)集的自動訓練預熱機制,以確保訓練邁出扎實的第一步。Lookahead 的靈感來自對深度神經(jīng)網(wǎng)絡損失曲面的理解,并為在整個訓練過程中進行健壯和穩(wěn)定的探索提供突破。本文選擇的Ranger 優(yōu)化器將兩者結合起來,這樣可以獲得更高的精度。

        3 實驗數(shù)據(jù)集

        3.1 數(shù)據(jù)集介紹

        模型訓練和測試所使用的數(shù)據(jù)集來自文獻[8]所開源的天氣現(xiàn)象數(shù)據(jù)集。該數(shù)據(jù)集包含6877 張具有代表性和獨特的天氣現(xiàn)象圖像,每張圖像的大小不定,被分為11 種常見的天氣現(xiàn)象,如圖3所示。其中,數(shù)據(jù)集由露水(700 張)、霧/霾(855 張)、霜(475 張)、雨凇(639 張)、冰雹(592 張)、閃電(378 張)、雨(527張)、彩虹(238 張)、霧凇(1160 張)、沙塵暴(692 張)和雪(621 張)組成。

        圖3 數(shù)據(jù)集展示

        為方便算法的訓練和驗證,在訓練前先把圖像順序打亂,然后按8 ∶1 ∶1 的比例分為訓練集、驗證集和測試集,它們之間不會出現(xiàn)重復的圖像。

        3.2 數(shù)據(jù)增強

        由于視覺Transformer 網(wǎng)絡十分依賴數(shù)據(jù)量,為抑制模型學習過程中因數(shù)據(jù)量過少而造成的過擬合問題,本文算法在模型訓練過程中對訓練圖像進行一系列的數(shù)據(jù)增強處理。包括:將天氣圖片調整為256×256后對圖像進行隨機裁剪到224×224、水平翻轉、水平移動和Cutout 方法,原始圖像經(jīng)過數(shù)據(jù)增強后的效果如圖4所示。采用這種方法圖像會在形態(tài)上發(fā)生變化,模型在學習過程中不會使用任意兩張相同的圖像,這有利于抑制過擬合,提高模型的魯棒性和泛化能力。

        圖4 數(shù)據(jù)增強展示

        4 實驗

        4.1 實驗環(huán)境

        實驗在DELL Precision 7920 塔式工作站開展,配置為:CPU:Intel(R)Xeon(R)Silver 4210,125 GB內存,GPU:NVIDIA TITAN RTX,24 GB 顯存,Ubuntu 16.04 LTS 64 位操作系統(tǒng),Python3.8,PyTorch1.10.2。

        4.2 實驗細節(jié)

        使用加入殘差結構的Swin Transformer 網(wǎng)絡進行訓練,采用遷移學習的方法,將Swin Transformer 網(wǎng)絡在ImageNet 數(shù)據(jù)集上預訓練的權重遷移到改進模型。為能正確識別出數(shù)據(jù)集中的所有類別,將模型最后的FC 層改為11 個輸出,預訓練模型的所有層均設置為可訓練。訓練過程使用Ranger 優(yōu)化器,初始學習率為3×10-5,將單次訓練所取樣本數(shù)設為64 張圖片,共訓練的迭代次數(shù)為300 個。最終,選擇驗證集上正確率最高的模型進行測試實驗,并重復實驗10 次,將10 次的平均值作為模型最終結果。

        4.3 模型評價指標

        對于一個多分類任務,可以將每一種類別樣本預測結果分為4 種:TN(True Negative),表示把負樣本正確地預測為負樣本;FN(False Negative),表示把正樣本錯誤地預測為負樣本;TP(True Positive),表示把正樣本正確地預測為正樣本;FP(False Positive),表示把負樣本錯誤地預測為負樣本。針對模型效果的評價,本文采用以下評價指標。

        準確率P(Precision)指在被判定為正的樣本中,實際上為正樣本所占的比例。公式如下:

        召回率R(Recall)指原本為正的樣本中被判定為正的樣本所占的比例。公式如下:

        F1分數(shù)(F1-measure)指準確率P 和召回率R 的調和平均值。公式如下:

        正確率Acc(Accuracy)指所有樣本中分類結果正確的樣本所占的比例。公式如下:

        宏觀準確率ma_P(macro-average of Precision)指各類別準確率的平均值,公式如下:

        宏觀召回率ma_R(macro-average of Recall),指各類別召回率的平均值,公式如下:

        宏觀F1分數(shù)ma_F1(macro-average of F1score)指各類別F1分數(shù)的平均值,公式如下:

        上述評價指標的值都在0~1。準確率、正確率、召回率和它們的宏觀平均值越高,代表模型的分類性能越好。

        4.4 實驗結果分析

        4.4.1 Swin Transformer 選擇實驗

        由于Swin Transformer 提出4 個網(wǎng)絡模型,即Swin-T、Swin-S、Swin-B、Swin-L,為更好地建立適合本文數(shù)據(jù)集的分類模型并從模型部署和性能方面考慮,本文分別使用Swin-T、Swin-S、Swin-B 來構建天氣識別模型,并從中選出一個正確率最高的模型來做實驗的基礎模型。實驗結果如表1所示,從表1 可以看出Swin-B 具有更好的精度優(yōu)勢。

        表1 Swin Transformer 模型選擇實驗

        4.4.2 殘差模塊嵌入實驗

        為驗證在堆疊STB 模塊之間加入殘差結構的有效性,對原Swin-B 模型和加入殘差結構的Swin-B 模型進行對比實驗,實驗結果如表2所示。從表2 可以看出,加入殘差結構的Swin-B 模型相對原模型的正確率顯著提高。

        表2 殘差模塊的消融實驗

        4.4.3 優(yōu)化器對比實驗

        由于優(yōu)化器在深度學習過程中扮演著重要的角色,本文設計了基于殘差Swin-B 模型的5 個優(yōu)化器對比實驗,使用的優(yōu)化器分別為SGD、RMSprop、Radam、AdamW、Ranger,結果如表3所示。由表3 可知,在殘差Swin-B 模型的基礎上使用Ranger 優(yōu)化器可以使識別結果達到0.936的正確率,同時,進一步證明了該優(yōu)化器的優(yōu)點。

        表3 優(yōu)化器對比實驗

        4.4.4 本文方法與其他模型對比實驗

        表4 顯示了本文方法與一些主流模型的性能對比。在WEAPD 數(shù)據(jù)集上,總體分類最佳結構是本文方法,正確率為93.64%。同時,該模型的宏觀準確率、宏觀召回率和宏觀F1分數(shù)為94%左右,均超過其他模型。

        表4 本文方法與其他模型結果對比

        4.4.5 方法結果

        本文方法的評價指標結果如表5所示,實現(xiàn)了對11 種天氣現(xiàn)象的有效分類,特別是對冰雹、雷暴、沙塵暴、雪這些極端天氣能夠準確識別。

        表5 本文方法的分類性能展示

        為進一步證明殘差Swin Transformer 模型對天氣現(xiàn)象分類的性能,使用混淆矩陣來說明分類精度,如圖5所示。

        圖5 本文模型的混淆矩陣

        5 結束語

        本文嘗試將視覺Transformer 應用到天氣圖像識別領域,并提出一個基于殘差結構的Swin Transformer模型,該模型可以很好地學習天氣現(xiàn)象的特征。實驗結果表明,本文所提出的模型對天氣現(xiàn)象識別是有效的,且能避免因主觀誤差造成的錯誤,優(yōu)于多數(shù)深度學習方法。雖然天氣圖像存在相似性、復雜性等問題,但總體來說,殘差Swin Transformer 模型的識別正確率達93.6%,能夠滿足日常生活的需要。因此,本文所提出的模型可以廣泛應用于天氣現(xiàn)象的日常觀測,也可為環(huán)境監(jiān)測、農業(yè)和交通運輸提供天氣指導,特別在天氣變化和預報方面。

        由于本文是在Swin-B 模型的基礎上加入殘差結構,Swin-B 網(wǎng)絡模型參數(shù)較多,對計算機的性能要求較高,這對天氣識別模型的時效性提出了挑戰(zhàn)。后期研究中將考慮使用知識蒸餾、網(wǎng)絡剪枝等思想對模型進行優(yōu)化,在保證網(wǎng)絡性能不變的情況下,提高時效性,實現(xiàn)一個輕量級天氣識別模型。

        猜你喜歡
        優(yōu)化實驗模型
        一半模型
        記一次有趣的實驗
        超限高層建筑結構設計與優(yōu)化思考
        民用建筑防煙排煙設計優(yōu)化探討
        關于優(yōu)化消防安全告知承諾的一些思考
        一道優(yōu)化題的幾何解法
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        做個怪怪長實驗
        3D打印中的模型分割與打包
        日本a级免费大片网站| 69av在线视频| 亚洲中文字幕人妻诱惑| 野花视频在线观看免费| 国产精品 亚洲 无码 在线| 亚洲av伊人久久综合密臀性色| 无码在线观看123| 精品人妻一区二区三区不卡毛片| 欧美日韩在线视频| 免费国产黄网站在线观看| 青青青爽在线视频观看| 丰满人妻无奈张开双腿av| 久久99久久99精品免观看女同| 中文字幕亚洲一区视频| 亚洲女av中文字幕一区二区| 在线播放免费人成毛片乱码| 久久久久亚洲av无码观看| 99日本亚洲黄色三级高清网站| 国产午夜精品视频在线观看| 亚洲精品~无码抽插| 国产偷国产偷亚洲清高| 果冻蜜桃传媒在线观看| 国产女主播一区二区久久| 亚洲国产精品一区二区www| 日韩www视频| 欧美成人高清手机在线视频| 国产三级韩三级日产三级| 在线播放五十路熟妇| 大地资源中文在线观看官网第二页 | 免费视频成人片在线观看| 欧美日韩亚洲精品瑜伽裤| 久久精品国产亚洲精品色婷婷| 一区二区三区国产高清视频| 国产如狼似虎富婆找强壮黑人| 老熟妇Av| 色噜噜亚洲精品中文字幕| 日日摸天天摸97狠狠婷婷| 狠狠色狠狠色综合久久第一次| 亚洲成av人片在线天堂无| 亚洲中文字幕舔尻av网站| 国产一区二区三区在线电影|