亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于小樣本學習的植物葉病分類研究*

        2021-03-12 02:02:44
        智慧農(nóng)業(yè)導刊 2021年10期
        關鍵詞:類別準確率卷積

        吳 蔚

        (泰山學院 信息科學技術學院,山東 泰安 271000)

        植物葉病是影響植物正常生長的重要因素之一。在現(xiàn)代農(nóng)業(yè)中,及時準確地對農(nóng)作物葉部病害種類進行識別并采取針對性防治措施,對于保證農(nóng)作物的產(chǎn)量和質(zhì)量穩(wěn)定增長具有重要的意義。傳統(tǒng)的植物葉病種類識別主要通過請教專家或者咨詢有經(jīng)驗的農(nóng)民。然而這類知識的獲取存在成本高、時效低、準確率不穩(wěn)定等缺點。因此采用機器的方式對植物病害種類進行自動化識別在現(xiàn)代農(nóng)業(yè)管理中獲得越來越多的青睞。

        前幾年主要通過諸如支持向量機(Support Vector Machines,SVM)、K-means、貝葉斯等傳統(tǒng)機器學習方法進行葉病分類識別。隨著設備計算能力的迅速提升和大數(shù)據(jù)技術的不斷發(fā)展,越來越多的研究者將目光轉(zhuǎn)向深度學習領域。例如Ferentinos[1]使用深度卷積神經(jīng)網(wǎng)絡進行植物葉病的檢測和診斷,可以達到99.53%的識別成功率。模型訓練數(shù)據(jù)來源于公開數(shù)據(jù)庫,包含87848張圖片。Waheed[2]使用密集卷積神經(jīng)網(wǎng)絡結構進行玉米葉病種類識別,通過手動收集的方式獲取了12332張圖片進行模型訓練,最高準確率達到了98.06%。

        深度學習是機器學習領域重要的分支之一,其深層網(wǎng)絡結構對應著龐大的網(wǎng)絡模型參數(shù),通常需要大量的樣本數(shù)據(jù)進行訓練才能獲取較好的效果。如果訓練數(shù)據(jù)過少,網(wǎng)絡模型很容易出現(xiàn)過擬合的現(xiàn)象。然而,很多現(xiàn)實應用中數(shù)據(jù)獲取非常困難,有些是因為數(shù)據(jù)獲取的人力、物力成本較高,而有些則是小概率發(fā)生的事件,無法在短時期內(nèi)大量獲取。反觀人類的學習方式,并不需要很多數(shù)據(jù)就能夠?qū)崿F(xiàn)較好的學習效果。比如教給嬰幼兒認識一種新的動物,常常一張訓練圖片就能讓他們學會識別。為了讓計算機也能像人類一樣學習,深度學習的一個新分支——小樣本學習,逐漸引發(fā)越來越多研究者的興趣。

        使用小樣本學習解決分類問題是指模型使用少量訓練數(shù)據(jù)就能獲取對于新類別的識別能力,目前主要有三類方法:數(shù)據(jù)增強、遷移學習和元學習。數(shù)據(jù)增強方法主要通過圖片的翻轉(zhuǎn)、裁剪、尺度變化、色彩抖動等數(shù)據(jù)生成技術擴充樣本,解決小樣本的問題。比如Hu等人[3]提出了一種條件式深度卷積生成對抗網(wǎng)絡進行茶葉葉病種類的識別。該方法可以生成與源域數(shù)據(jù)分布一致的訓練樣本實現(xiàn)數(shù)據(jù)增強,解決小樣本學習的問題。遷移學習指在源域和目標域中實現(xiàn)知識的遷移。源域通常包含與目標域數(shù)據(jù)相關或類似的大量數(shù)據(jù)樣本,通過對源域數(shù)據(jù)進行訓練,獲取對目標域數(shù)據(jù)底層特征的識別能力,然后通過目標域數(shù)據(jù)對網(wǎng)絡模型進行微調(diào),從而獲取對目標域數(shù)據(jù)的識別能力。通常只對模型的最后幾層模型參數(shù)進行微調(diào),而前面層次的參數(shù)保持固定,防止造成過擬合。比如Chen等人[4]使用深度遷移學習方法進行植物葉病分類識別,該方法設計了一種改進的VGGNet網(wǎng)絡結構INC-VGGN,并使用大型公開數(shù)據(jù)庫ImageNet進行網(wǎng)絡模型的預訓練,最終達到了91.83%的準確率。元學習是一種學習如何學習的方法,而不是直接學習知識本身。當模型具備了學習的能力后,即使只有少量的訓練樣本也能快速掌握分類的能力。因此元學習是一種更接近人類學習方式的方法。

        本研究提出一種基于小樣本學習的植物葉病分類方法,采用元學習的方式對植物公開數(shù)據(jù)集中的葉病樣本數(shù)據(jù)進行分類研究。實驗結果驗證了小樣本學習方法在植物葉病分類應用中的有效性,值得在農(nóng)業(yè)領域進一步推廣研究。

        1 相關理論介紹

        1.1 卷積神經(jīng)網(wǎng)絡

        卷積神經(jīng)網(wǎng)絡(convolutional neural networks,CNN)是深度學習典型的網(wǎng)絡模型之一,包含卷積運算且具有深層的網(wǎng)絡結構,近幾年在計算機視覺、自然語言處理等領域獲得了突破性進展。傳統(tǒng)機器學習主要通過手工方式設計特征,而基于CNN的網(wǎng)絡模型則能夠?qū)崿F(xiàn)端到端的特征自動提取。CNN網(wǎng)絡模型主要由卷積層、池化層和全連接層構成。

        1.1.1 卷積層

        卷積層的功能是通過卷積核對輸入數(shù)據(jù)進行卷積運算,并加上一個偏差值得到特征提取結果。卷積層的模型參數(shù)由卷積核和偏差值部分構成??梢詫Χ鄠€卷積層進行疊加從而設計出不同復雜程度的卷積網(wǎng)絡。第i層卷積網(wǎng)絡的特征輸出Zi可表示為:Zi=f(Zi-1Wi+b)i,其中Zi-1表示卷積層的特征輸入(Z0表示輸入圖像),Wi表示第i層卷積核的權重,bi表示第i層卷積核的偏差值,f表示激活函數(shù)。

        1.1.2 池化層

        經(jīng)過卷積層的特征提取后,輸出的特征輸入到池化層進行特征的選擇和過濾。池化層可以減輕輸出特征對位置的敏感度,因此同一種物體即使所處位置略有差異,也可以被模型很好的識別。常用的池化方法有極大池化和均值池化,分別計算池化窗口內(nèi)的極大值和平均值。第i層池化層的第j塊池化區(qū)域的特征輸出xij可表示為:xij=Poo(lxi-1,)j,其中xi-1,j表示上一層的特征輸出,Pool表示池化函數(shù)。

        1.1.3 全連接層

        深度網(wǎng)絡模型的最后幾層通常連接一層或多層全連接層用于圖像分類任務。特征經(jīng)過全連接層后得到分類預測結果,接著使用softmax回歸函數(shù)將結果值變?yōu)橹禐檎液蜑?的概率分布。全連接層中第i個輸出結果Pi可表示為:,其中 K 表示最后一個連接層的神經(jīng)元個數(shù),z代表最后一個連接層的輸出向量。

        1.2 元學習

        傳統(tǒng)的深度學習將所需要的數(shù)據(jù)劃分為訓練集、驗證集和測試集。訓練集用于對網(wǎng)絡模型進行調(diào)參;從訓練集中可提前選取一小部分樣本數(shù)據(jù)作為驗證集,用于模型訓練時對模型的泛化能力進行評估,通常作為模型是否停止訓練的依據(jù);測試集用于對模型的泛化能力進行最終測試,但不能用于模型訓練階段的調(diào)參。與傳統(tǒng)深度學習劃分數(shù)據(jù)集的方式不同,元學習將所需數(shù)據(jù)劃分為元訓練集和元測試集,以及必要時設置的元驗證集。元訓練集的基本訓練單位是任務,其進行模型訓練是依靠任務驅(qū)動而非數(shù)據(jù)驅(qū)動。每個任務包含支持集和查詢集,前者通常只提供少量的數(shù)據(jù)用于模型調(diào)參,這也是小樣本的由來,后者用于驗證模型在該任務上的泛化能力。通過大量不同任務的訓練,模型會找到一組敏感參數(shù)能夠快速適應新任務的學習。元測試集也包含多個任務,每個任務被劃分為支持集和查詢集,前者提供少量數(shù)據(jù)讓模型迅速適應新的任務,而查詢集則用于測試這種適應性的效果。

        2 研究方法

        本研究提出一種基于小樣本學習的農(nóng)作物病害種類分類方法,以下分別從數(shù)據(jù)集、特征提取、元學習方法幾方面加以介紹。

        2.1 數(shù)據(jù)集

        本研究使用公開數(shù)據(jù)集PlantVillage[5]進行植物病害分類研究。該數(shù)據(jù)集包含54303張植物葉子圖像,其中涵蓋14種植物和26種葉病類型,根據(jù)植物和葉病類型(包含健康類型)的組合形成了38種類別。隨機選取26種類別樣本作為元訓練數(shù)據(jù)集,6種類別樣本作為元驗證數(shù)據(jù)集,剩余6種樣本作為元測試數(shù)據(jù)集。不同數(shù)據(jù)集合之間的類別沒有交叉。

        2.2 特征提取模塊

        本研究使用Inception V3網(wǎng)絡[6]中全連接層之前的層次進行輸入圖像的特征提取。該模型將傳統(tǒng)網(wǎng)絡層次中較大的卷積核進行分解,從而減少參數(shù)數(shù)量。比如3×3卷積核被分解為不對稱的3×1和1×3兩種。同時它使用了批量歸一化方法,減輕了深度網(wǎng)絡層次中梯度消失的問題。該模型使用的Inception模塊組對網(wǎng)絡層次的深度和寬度進行了均衡設計,提升了模型進行特征表達的能力。

        2.3 元學習方法

        采用元學習方法進行植物葉病分類主要包含以下兩個步驟:

        2.3.1 元訓練階段

        本階段使用元訓練數(shù)據(jù)集進行模型訓練。如前所述,訓練階段采用任務驅(qū)動方式進行。每個任務中隨機采樣N個類別的樣本,每個類別包含T個數(shù)據(jù)。所有類別中的前K(K<T)個數(shù)據(jù)構成支持集,表示為,其中xi表示輸入的支持集中第i個圖像數(shù)據(jù),yi表示對應的分類標簽。此即為小樣本學習中的N-way K-shot方法。K值通常較小,比如可取為1,3,10等值。每個類別剩余的T-K個數(shù)據(jù)構成查詢集,表示為

        每個任務中的支持集用于使模型建立一種分類模式,而查詢集則用于對這種分類模式的優(yōu)劣進行驗證并調(diào)優(yōu)。本研究使用原型方法[7]用于支持集分類模式的建立。對于一個N-way K-shot任務,其中的類別k對應的原型特征ck可表示為:

        其中xi表示類別為k的第i個樣本數(shù)據(jù),f?表示參數(shù)為?的函數(shù)映射,通過神經(jīng)網(wǎng)絡自動學習。接著查詢集中的樣本使用同樣的特征提取模塊獲取對應的特征,并度量與每個原型特征的距離。本研究使用歐幾里得距離進行度量。給定兩個n維矢量X={x1x2…xn}和Y={y1y2…yn},其歐幾里得距離可表示為:

        對于查詢集中某個標簽為k的樣本x,計算出其與每個原型特征之間的歐幾里得距離后,再經(jīng)由softmax函數(shù)便可進一步計算出對該樣本分類預測的概率分布。其被預測為類別k的概率可表示為:

        元訓練階段的目的是讓原型特征能夠盡可能準確地描述對應類別的特征屬性,并使得預測分類結果為k的概率最大。因此定義模型最終損失函數(shù)如下:

        2.3.2 元測試階段

        經(jīng)過元訓練階段后的網(wǎng)絡模型便具備了小樣本預測的能力。元測試數(shù)據(jù)集中的支持集經(jīng)由特征提取模塊獲得對應的特征,計算出每個類別的原型;然后對查詢集中的每個樣本進行類別預測,用于測試模型訓練的效果。

        3 實驗結果及分析

        為了對本研究算法進行驗證,進行了相關實驗。所有輸入圖片的分辨率被處理為84×84,并采用小批量隨機梯度下降算法進行模型損失函數(shù)的優(yōu)化。實驗中元訓練數(shù)據(jù)集中的支持集根據(jù)設定的N-way K-shot參數(shù)進行采樣,查詢集與支持集的采樣類別數(shù)N相同,每類樣本數(shù)固定為15。元測試集中固定生成500個任務,每個任務采樣方式同元訓練集,計算所有任務的分類準確率的平均值,用于評估對應參數(shù)設定下的分類效果。

        表1對使用遷移學習方法和本研究小樣本學習方法的植物葉病分類準確率進行了對比。其中遷移學習方法中使用通過ImageNet數(shù)據(jù)集進行預訓練的Inception V3網(wǎng)絡結構用于分類,本研究小樣本學習方法設定參數(shù)N=5,K=10??梢钥闯?,使用遷移學習方法用于小樣本農(nóng)作物病害分類研究中的準確率較低,只有42.6%,而本研究方法獲得了相對較高的準確率,達到了81.2%。

        表1 基于交叉熵損失函數(shù)和焦點損失函數(shù)的分類準確率對比

        圖1展示了不同參數(shù)配置的N-way K-shot進行植物葉病分類的準確率對比??梢钥闯霎擪相同時,N=3的分類準確率均高于N=5時。這是因為需要分類的類別數(shù)越多,意味著相對更難的分類任務,準確率也會降低。當N值固定時,隨著K值增大,分類準確率呈現(xiàn)線性增長的趨勢。這可以解釋為描述每個類別的信息越多,計算出的原型特征越能準確的代表對應類別,因此越能得到較高的分類準確率。

        圖1 不同參數(shù)下的分類準確率

        4 結束語

        本文基于小樣本學習方法進行植物葉病分類研究,通過元學習方法構建N-way K-shot任務進行模型的訓練,并構建每個類別的原型用于度量待預測樣本所屬類別。通過與傳統(tǒng)深度學習的對比驗證了元學習方法在處理小樣本應用問題上的有效性。同時通過改變小樣本學習過程的參數(shù)配置揭示了影響分類準確率的一些關鍵特性。未來的研究中將繼續(xù)探索小樣本學習方法在農(nóng)業(yè)領域的應用。

        猜你喜歡
        類別準確率卷積
        基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
        2015—2017 年寧夏各天氣預報參考產(chǎn)品質(zhì)量檢驗分析
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        高速公路車牌識別標識站準確率驗證法
        基于傅里葉域卷積表示的目標跟蹤算法
        服務類別
        新校長(2016年8期)2016-01-10 06:43:59
        論類別股東會
        商事法論集(2014年1期)2014-06-27 01:20:42
        一種基于卷積神經(jīng)網(wǎng)絡的性別識別方法
        電視技術(2014年19期)2014-03-11 15:38:20
        麻豆av一区二区三区| 亚洲在中文字幕乱码熟女| 东风日产车是不是国产的| 国产又大又硬又粗| 久久久久亚洲精品天堂| 国产成社区在线视频观看| 青青草在线免费观看视频| 国内精品久久久久影院优| 亚洲av无码专区国产乱码不卡| 456亚洲人成在线播放网站| 亚洲一区二区三区在线高清中文 | 手机看片自拍偷拍福利| 色 综合 欧美 亚洲 国产| 亚洲日韩一区二区一无码| 久久久99精品国产片| 五月色丁香婷婷网蜜臀av| 亚洲熟女综合一区二区三区| 久久天天躁狠狠躁夜夜中文字幕| 日本免费影片一区二区| 国产a√无码专区亚洲av| 人人做人人妻人人精| 少妇一级aa一区二区三区片| 美女扒开腿露内裤免费看| 人妻久久久一区二区三区| 女性自慰网站免费看ww| 美利坚亚洲天堂日韩精品| 男女18禁啪啪无遮挡激烈网站| 制服丝袜人妻中文字幕在线| 国内精品久久久久影院蜜芽| 亚洲女同av在线观看| 久久婷婷人人澡人人喊人人爽| 久久精品国产丝袜| 天天综合色中文字幕在线视频| 大尺度无遮挡激烈床震网站| 乱人伦视频中文字幕| 久久精品免视看国产成人| JIZZJIZZ国产| 亚洲肥婆一区二区三区| 狠狠躁日日躁夜夜躁2020| 国产欧美日韩专区| 琪琪av一区二区三区|