李亞召,云利軍,葉志霞,王 坤,翟乃琦
(云南師范大學(xué)信息學(xué)院,云南 昆明 650500)
煙葉生產(chǎn)過程一般需要經(jīng)過初烤、分級(jí)、收購、包裝、醇化和在線精選等一系列過程,而醇化又直接影響煙葉的品質(zhì),所以煙葉醇化是卷煙生產(chǎn)過程中至關(guān)重要的環(huán)節(jié)。由于煙葉醇化環(huán)節(jié)需要經(jīng)過2年左右的時(shí)間,而在煙葉醇化儲(chǔ)藏的過程中,醇化煙葉容易受環(huán)境溫度、濕度波動(dòng)的影響而產(chǎn)生霉變[1 - 3]。醇化后的煙葉中含有一些雜物和霉變煙葉,為了達(dá)到煙葉打葉制絲環(huán)節(jié)原料純凈度的質(zhì)量要求,一般要對(duì)醇化后的煙葉進(jìn)行在線精選?,F(xiàn)在常用的煙葉在線精選技術(shù)主要是風(fēng)選除雜技術(shù)[4,5],此技術(shù)主要用于煙葉生產(chǎn)中非煙葉類的雜物檢測(cè)剔除。在霉變煙葉控制方面主要采用的是人工在線手工剔除的方式,該方式存在效率低下、容易漏檢等缺點(diǎn)。
隨著計(jì)算機(jī)技術(shù)、圖像處理技術(shù)和機(jī)器視覺技術(shù)的快速發(fā)展,使用傳統(tǒng)機(jī)器視覺在線精選霉變煙葉的技術(shù)已經(jīng)得到研究和開發(fā)[6,7],主要是利用圖像處理技術(shù)獲取煙葉的顏色和紋理等特征,再利用人工神經(jīng)網(wǎng)絡(luò)集成算法進(jìn)行樣本訓(xùn)練、學(xué)習(xí)和分類。傳統(tǒng)機(jī)器視覺技術(shù)需要人工分析和設(shè)計(jì)提取的特征,因此提取的特征存在偏差性和主觀性,所以存在過程復(fù)雜和準(zhǔn)確率不夠高等缺點(diǎn)。而深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)通過使用權(quán)值共享、局部連接和非線性激活等方式,可以在樣本數(shù)據(jù)中自動(dòng)學(xué)習(xí)特征,相對(duì)于傳統(tǒng)機(jī)器學(xué)習(xí)而言具有更強(qiáng)大的特征學(xué)習(xí)和表達(dá)能力。并且卷積神經(jīng)網(wǎng)絡(luò)在玉米、大豆、水果和花朵等農(nóng)產(chǎn)品精選分級(jí)和分類方面的研究和應(yīng)用也越來越多[8 - 11]。近年來,在煙葉分級(jí)方面,利用卷積神經(jīng)網(wǎng)絡(luò)的方法已經(jīng)得到關(guān)注和研究[12]。
由于霉變煙葉的霉變特征比較復(fù)雜多變,一般是易結(jié)成團(tuán)塊狀,顏色呈暗褐色,在煙葉表面的霉變區(qū)域中不同程度地分布著不同顏色的點(diǎn)狀、斑塊狀的霉點(diǎn)或者霉斑。如果使用傳統(tǒng)的圖像處理分類技術(shù),人工提取霉變煙葉特征的過程會(huì)比較復(fù)雜繁瑣,而且人為選擇和設(shè)計(jì)提取特征也存在偏差性和主觀性?;诖耍疚睦镁矸e神經(jīng)網(wǎng)絡(luò)可以在樣本數(shù)據(jù)中自動(dòng)學(xué)習(xí)特征和擁有更強(qiáng)大特征學(xué)習(xí)和表達(dá)能力的優(yōu)點(diǎn),搭建了一個(gè)針對(duì)霉變煙葉與正常煙葉圖像分類的卷積神經(jīng)網(wǎng)絡(luò)模型,通過卷積神經(jīng)網(wǎng)絡(luò)CNN對(duì)霉變煙葉照片與正常煙葉照片的圖像特征進(jìn)行提取,再對(duì)這2種煙葉圖像進(jìn)行分類模型訓(xùn)練,最后實(shí)現(xiàn)霉變煙葉的識(shí)別與檢測(cè)。
本文所選用的研究對(duì)象是醇化后的正常煙葉葉片和霉變煙葉葉片,煙葉產(chǎn)區(qū)為云南省曲靖市。由于本文以判斷煙葉是否發(fā)生霉變?yōu)檠芯繉?duì)象,根據(jù)煙葉是否霉變將煙葉分為2類:正常煙葉和霉變煙葉。首先需要手工分離出醇化后煙葉葉片中的霉變煙葉葉片和正常煙葉葉片,然后通過使用FUJIFILM X-A3設(shè)備來采集煙葉圖像數(shù)據(jù)。此設(shè)備采集的圖像尺寸為6000×4000,輸出的文件格式為PNG 。霉變煙葉的主要特點(diǎn)是易結(jié)成團(tuán)塊狀、煙葉葉片色澤呈暗褐色、煙葉葉片上分布不同程度的霉點(diǎn)和霉斑。圖1和圖2所示分別為采集的典型霉變煙葉圖像和正常煙葉圖像。
Figure 1 Moldy tobacco leaves
Figure 2 Normal tobacco leaves
由于采集圖像太大且醇化后的煙葉霉變程度一般都是輕度或者中度,煙葉霉變區(qū)域一般集中在整片煙葉的某一局部區(qū)域,為了使得圖像霉變特征較為明顯,有利于模型對(duì)圖像特征進(jìn)行學(xué)習(xí),本文使用OpenCV技術(shù)中的PartitionImage函數(shù)把原6000×4000的煙葉葉片圖像按照10×10均等分割成尺寸為600×400的小圖像;然后使用人工手動(dòng)挑選的方式把圖像中含有霉點(diǎn)、霉斑和變成黑褐色的煙葉圖像挑選出來;最后把這些挑選出來的霉變煙葉圖像和正常煙葉圖像統(tǒng)一制作成數(shù)據(jù)集,用于實(shí)驗(yàn)。數(shù)據(jù)集中含有正常煙葉圖像和霉變煙葉圖像各5 000幅,總共有10 000幅煙葉圖像,隨機(jī)選擇其中的7 000幅圖像用于訓(xùn)練,剩下3 000幅圖像用于測(cè)試。圖3和圖4分別給出了煙葉圖像預(yù)處理之后的霉變煙葉圖像和正常煙葉圖像。
Figure 4 Normal tobacco leaves after pretreatment
Figure 5 Structure of CNN-MY model
由于霉變煙葉的霉變特征具有復(fù)雜性和多樣性,本文針對(duì)霉變煙葉圖像與正常煙葉圖像分類問題提出了一種針對(duì)霉變煙葉的堆疊式的卷積神經(jīng)網(wǎng)絡(luò)模型CNN-MY(Convolutional Neural Networks-Moldy Tobacco)。該卷積神經(jīng)網(wǎng)絡(luò)模型擁有上中下3個(gè)分支,通過使用不同大小的卷積核成階梯狀逐步對(duì)圖像特征進(jìn)行提取和匯總。中分支是該卷積神經(jīng)網(wǎng)絡(luò)模型的主要軀干,擁有4個(gè)卷積核為3×3的卷積層、4個(gè)池化核為2×2的池化層、2個(gè)Dropout率為0.6的Dropout層、2個(gè)激活函數(shù)、3個(gè)用來修正線性激活的全連接層和1個(gè)log_Softmax(分類網(wǎng)絡(luò))輸出層。上分支是由1個(gè)卷積核為7×7的卷積層、1個(gè)池化核為2×2的池化層和1個(gè)卷積核為5×5的卷積層組成;從中分支的第1個(gè)池化層之后開始分支,直到中分支的最后一個(gè)池化層后開始進(jìn)行特征融合。下分支是從輸入層開始進(jìn)行分支(擁有1個(gè)卷積核為3×3的卷積層、1個(gè)池化核為2×2的池化層、1個(gè)卷積核為2×2的卷積層和1個(gè)激活函數(shù)),到中分支的第2個(gè)卷積層之后進(jìn)行特征融合和篩選。采用這種方式搭建卷積神經(jīng)網(wǎng)絡(luò)模型可以使模型既保持網(wǎng)絡(luò)結(jié)構(gòu)的稀疏性,又具有密集矩陣的高計(jì)算性能。通過3個(gè)分支中不同尺寸的(3×3,4×4,7×7等)小型卷積將相關(guān)性很高的節(jié)點(diǎn)連接在一起,這樣得到的稀疏結(jié)構(gòu)模型比較高效,更有利于減少卷積神經(jīng)網(wǎng)絡(luò)中的冗余特征。該卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖5所示。
卷積神經(jīng)網(wǎng)絡(luò)與其它神經(jīng)網(wǎng)絡(luò)相比較,不同的地方在于其包含一個(gè)由卷積層和池化層組成的特征提取器。卷積層的主要作用是對(duì)圖像特征進(jìn)行初步提取,卷積層具有局部連接、感受視野和參數(shù)共享等特性。
局部連接的主要特點(diǎn)是處理二維面(寬度和高度)和深度維度上的不對(duì)稱性,在二維面上是局部連接(沿著寬度和高度)的,然而隨著模型深度的增加,輸入的激活量幾乎都是全連接的。
感受野(Receptive Field)的大小主要與卷積核的尺寸有關(guān),通常情況下卷積核越大,感受野越大,這樣可以看到更多的圖像信息,從而可以獲得更好的圖像特征。但是,大的卷積核會(huì)使模型計(jì)算量暴增,對(duì)模型深度的增加會(huì)有很大的影響,模型的計(jì)算性能也會(huì)降低。所以,本文提出的CNN-MY模型在卷積層中使用了尺寸不同的卷積核,這樣可以獲得不同尺度的特征,最后再把這些特征篩選匯總起來,得到的特征往往比使用單一卷積核的模型要好。感受野的計(jì)算公式如式(1)所示:
RFl+1=(RFl+kernelsizel+1-1)×
dilationl+1×stridel
(1)
其中,RFl+1表示當(dāng)前卷積層(l+1層)感受野的大小,RFl表示上一卷積層感受野的大小,kernelsizel+1表示當(dāng)前卷積層卷積核的大小,dilationl+1表示當(dāng)前卷積層的空洞率,stridel表示上一層卷積的步長。
在卷積層使用參數(shù)共享可以有效地減少參數(shù)的個(gè)數(shù),這樣之所以能夠行得通,是因?yàn)榫矸e神經(jīng)網(wǎng)絡(luò)中卷積核具有權(quán)值共享的特性,也就是說相同的卷積核能夠檢測(cè)出不同位置的相同特征。因?yàn)榫矸e層的參數(shù)共享,所以輸出的數(shù)據(jù)在深度切片上都使用同一個(gè)權(quán)重向量,那么卷積層在向前傳播的過程中,每個(gè)深度切片都可以看成是神經(jīng)元的權(quán)重對(duì)輸入數(shù)據(jù)做卷積。
在卷積神經(jīng)網(wǎng)絡(luò)中,池化層往往位于2個(gè)卷積層之間。池化層的主要作用有以下2個(gè)方面:(1)在參數(shù)矩陣尺寸的縮小方面具有很好的效果,可以減少最后全連接層的參數(shù)數(shù)量。(2)可以加快模型的計(jì)算速度和防止出現(xiàn)過擬合現(xiàn)象。卷積神經(jīng)網(wǎng)絡(luò)模型池化層常用的2種池化方式分別是均值子池化(Average-Pooling)和最大值子池化(Max-Pooling)。均值子池化的特點(diǎn)是對(duì)數(shù)據(jù)進(jìn)行下采樣,減少鄰域大小受限造成估計(jì)值方差增大的誤差,進(jìn)而更好地保留圖像的背景信息。而最大值子池化的特點(diǎn)是對(duì)數(shù)據(jù)進(jìn)行下采樣,減少卷積層參數(shù)誤差造成估計(jì)均值的偏移誤差,進(jìn)而更好地保留圖像的紋理信息。而且最大值子池化對(duì)圖像特征進(jìn)行了選擇,可以選出分類識(shí)別度更好的圖像特征。由于霉變煙葉葉片和正常煙葉葉片的顏色和紋理特征具有復(fù)雜性和多樣性,所以本文搭建的CNN-MY的池化層選用的是最大值子池化方式,這樣可以更好地提取和刻畫霉變煙葉和正常煙葉的紋理信息及細(xì)微變化。
激活函數(shù)(Activation Function)的作用是在運(yùn)行時(shí)激活神經(jīng)網(wǎng)絡(luò)中的某一部分神經(jīng)元,將激活信息向后傳入下一層神經(jīng)網(wǎng)絡(luò)。激活函數(shù)的主要特點(diǎn)是加入了非線性因素,加強(qiáng)了線性模型的表達(dá)能力,利用函數(shù)的保留特點(diǎn)把“激活的神經(jīng)元的特征”傳遞到下一層。神經(jīng)網(wǎng)絡(luò)中常見的激活函數(shù)有Sigmoid、Tanh和ReLU這3種,其中Sigmoid激活函數(shù)具有函數(shù)輸出映射在(0,1)內(nèi)單調(diào)連續(xù),比較容易求導(dǎo)的優(yōu)點(diǎn),適合應(yīng)用于輸出層。但是,Sigmoid激活函數(shù)擁有軟飽和性,所以Sigmoid激活函數(shù)的輸入一旦落入飽和區(qū),Sigmoid函數(shù)值就會(huì)接近于0,容易產(chǎn)生梯度消失的問題。與Sigmoid激活函數(shù)相比,Tanh激活函數(shù)雖然也具有軟飽和性,但是它的輸出是以0為中心,收斂速度也就比Sigmoid快,該函數(shù)的缺點(diǎn)是仍然無法解決梯度消失的問題。與以上2種激活函數(shù)相比較,ReLU[13]激活函數(shù)擁有可緩解梯度消失,提高收斂速度,提供卷積神經(jīng)網(wǎng)絡(luò)的稀疏表達(dá)能力,加快計(jì)算等特點(diǎn)?;诖耍疚奶岢龅腃NN-MY模型選用ReLU激活函數(shù)作為激活函數(shù)。RelU函數(shù)的計(jì)算公式如式(2)所示:
(2)
對(duì)于卷積神經(jīng)網(wǎng)絡(luò)來說,輸出層一般都是分類器層,它的主要功能是對(duì)目標(biāo)進(jìn)行分類。卷積神經(jīng)網(wǎng)絡(luò)的輸出層一般選用Softmax分類器[14,15]。Softmax接收上一層全連接層的實(shí)數(shù)向量,輸出的也是實(shí)數(shù)向量,只不過輸出的實(shí)數(shù)向量的每一個(gè)值表示的是這個(gè)樣本屬于每個(gè)類的概率。輸出的實(shí)數(shù)向量的每個(gè)值的大小都在0~1。Softmax的表達(dá)式如式(3)所示:
(3)
其中,aj表示第j個(gè)輸出節(jié)點(diǎn)的輸出值,K表示輸出節(jié)點(diǎn)的個(gè)數(shù),即分類的類別個(gè)數(shù)。
由于Softmax求出來的概率分布中每一個(gè)概率值都在0~1,這樣就會(huì)出現(xiàn)有些概率過小,導(dǎo)致下溢的現(xiàn)象??紤]到該概率分布總歸是要經(jīng)過交叉熵函數(shù)(Cross Entropy)的,而交叉熵函數(shù)的工作原理就是直接在計(jì)算概率分布的時(shí)候求對(duì)數(shù),把概率從0~1變?yōu)?∞~0,這樣就能防止下溢現(xiàn)象出現(xiàn)。由于log_Softmax可以將本來應(yīng)該由交叉熵函數(shù)完成的求對(duì)數(shù)工作提前到預(yù)測(cè)概率分布中完成,跳過了中間的存儲(chǔ)步驟,可防止中間數(shù)值下溢,加快了運(yùn)算速度且使得數(shù)據(jù)更加穩(wěn)定。所以,本文搭建的CNN-MY卷積神經(jīng)網(wǎng)絡(luò)模型在輸出層使用的是log_Softmax。
本文實(shí)驗(yàn)的實(shí)驗(yàn)環(huán)境是Windows 7系統(tǒng)+PyTorch+Python 3.6,使用型號(hào)為GTX1650的GPU對(duì)卷積運(yùn)算進(jìn)行加速。本次實(shí)驗(yàn)使用自己制作的數(shù)據(jù)集。首先搭建CNN-MY模型,模型網(wǎng)絡(luò)結(jié)構(gòu)圖如圖5所示。在完成模型搭建之后使用自制數(shù)據(jù)集中的訓(xùn)練集進(jìn)行訓(xùn)練,在訓(xùn)練的過程中不斷對(duì)模型超參進(jìn)行調(diào)整,主要是對(duì)模型的Dropout率和學(xué)習(xí)率進(jìn)行調(diào)整和調(diào)試。Dropout技術(shù)主要用來防止模型對(duì)訓(xùn)練集過度擬合,從而使模型達(dá)到最好的效果。通過不斷地調(diào)試與實(shí)驗(yàn),最終確定當(dāng)Dropout率為0.6和學(xué)習(xí)率為0.006時(shí)模型效果最佳。為了可以更直觀和簡便地看出訓(xùn)練集和驗(yàn)證集的準(zhǔn)確率,本文實(shí)驗(yàn)調(diào)用了PyTorch的可視化工具Tensorboardx,主要是將模型訓(xùn)練后的數(shù)據(jù)進(jìn)行保存并上傳到Tensorboardx,Tensorboardx在模型訓(xùn)練時(shí)將準(zhǔn)確率對(duì)應(yīng)點(diǎn)坐標(biāo)數(shù)據(jù)上傳至.csv文件,隨著迭代步數(shù)增加,繪制訓(xùn)練集和驗(yàn)證集的準(zhǔn)確率變化曲線圖。
根據(jù)曲線圖的變化可以更直觀地看出本文實(shí)驗(yàn)的準(zhǔn)確率和模型效果。
本文實(shí)驗(yàn)基于5折交叉驗(yàn)證、1 050個(gè)epoch實(shí)現(xiàn),并進(jìn)行多次實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖6和圖7所示。
Figure 6 訓(xùn)練集準(zhǔn)確率的曲線圖
Figure 7 Curve of accuracy of validation set
從圖6中的訓(xùn)練集準(zhǔn)確率曲線圖可以看出,迭代步數(shù)在0~500時(shí),曲線的變化幅度比較明顯,訓(xùn)練中的準(zhǔn)確率在不斷上升。迭代步數(shù)在500~1050時(shí),訓(xùn)練集準(zhǔn)確率曲線變化幅度越來越小。但是,由于本文采用的是小批量梯度下降法,因此從訓(xùn)練集準(zhǔn)確率的整個(gè)曲線圖可以看出,訓(xùn)練集準(zhǔn)確率曲線不是一條光滑的線性曲線,一直都在震蕩。由于模型在前期正處于學(xué)習(xí)階段,所以曲線前期的變化幅度會(huì)比較大。后期隨著迭代次數(shù)的增加,模型在不斷收斂、不斷朝著最優(yōu)解擬合,最后模型收斂,所以后期曲線幅度變化逐漸變小。圖7所示的驗(yàn)證集準(zhǔn)確率的曲線圖與訓(xùn)練集準(zhǔn)確率的曲線圖變化規(guī)律相似。迭代步數(shù)在0~500時(shí),驗(yàn)證集準(zhǔn)確率的曲線圖變化幅度明顯。迭代步數(shù)在500~1050時(shí),驗(yàn)證集準(zhǔn)確率的曲線圖變化不再特別明顯,并逐漸穩(wěn)定在某一區(qū)間內(nèi)。通過分析訓(xùn)練集和驗(yàn)證集準(zhǔn)確率曲線的變化可以看出,本文提出的CNN-MY模型沒有出現(xiàn)過擬合和欠擬合現(xiàn)象。
傳統(tǒng)機(jī)器視覺進(jìn)行圖像分類往往需要復(fù)雜的特征提取,針對(duì)傳統(tǒng)圖像分類技術(shù),如表1所示,對(duì)于SVM圖像分類方法和KNN圖像分類方法,主要過程是首先提取圖像的HOG(Histogram of Oriented Gradient)特征,然后使用基于支持向量機(jī)SVM的算法和基于KNN的算法進(jìn)行圖像分類。與傳統(tǒng)SVM和KNN相比,卷積神經(jīng)網(wǎng)絡(luò)不需要復(fù)雜的特征工程還擁有更強(qiáng)大的特征學(xué)習(xí)和表達(dá)能力。為了進(jìn)一步說明本文針對(duì)霉變煙葉圖像與正常煙葉圖像分類問題搭建的卷積神經(jīng)網(wǎng)絡(luò)模型CNN-MY的有效性,本節(jié)將其與經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)圖像分類模型AlexNet網(wǎng)絡(luò)和VGG16網(wǎng)絡(luò)進(jìn)行對(duì)比實(shí)驗(yàn)。接下來通過使用本文建立的數(shù)據(jù)集對(duì)這5種方法分別進(jìn)行了實(shí)驗(yàn):
(1)HOG+SVM圖像分類方法,首先把數(shù)據(jù)集中的霉變煙葉作為正樣本,正常煙葉作為負(fù)樣本,然后采集正負(fù)樣本的HOG特征建立特征工程,再使用LIBSVM[16]進(jìn)行圖像分類,它的運(yùn)算速度快、運(yùn)用靈活、輸入?yún)?shù)少,可以很方便地對(duì)數(shù)據(jù)做分類或回歸。
(2)HOG+KNN圖像分類方法,首先把數(shù)據(jù)集中的霉變煙葉作為正樣本,正常煙葉作為負(fù)樣本,然后采集正負(fù)樣本的HOG特征建立特征工程。針對(duì)KNN算法,本文采用的是sklearn封裝好的KNeighborsClassifier函數(shù),其中K值設(shè)定為3。
(3)針對(duì)經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)圖像分類網(wǎng)絡(luò)模型AlexNet,本文實(shí)驗(yàn)選取的批處理大小(batch_size)為64,時(shí)鐘時(shí)期數(shù)(epoch)為1 050個(gè)。
(5)針對(duì)本文搭建的卷積神經(jīng)網(wǎng)絡(luò)模型CNN-MY,堆疊了多個(gè)卷積層,使用隨機(jī)梯度下降SGD(Stochastic Gradient Descent)優(yōu)化算法進(jìn)行優(yōu)化,本文實(shí)驗(yàn)選取的批處理大小(batch_size)為64,時(shí)鐘時(shí)期數(shù)(epoch)為1 050個(gè)。
最終實(shí)驗(yàn)得到的準(zhǔn)確率、運(yùn)行時(shí)間和F1分?jǐn)?shù)如表1所示。
由表1可以看出,在對(duì)霉變煙葉圖像和正常煙葉圖像進(jìn)行分類識(shí)別時(shí),在同一數(shù)據(jù)集上本文搭建的CNN-MY模型的準(zhǔn)確率明顯高于2種傳統(tǒng)圖像分類方法和2種經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)圖像分類模型的準(zhǔn)確率。在運(yùn)行時(shí)間方面,雖然卷積神經(jīng)網(wǎng)絡(luò)模型的時(shí)間明顯高于2種傳統(tǒng)圖像分類方法的,但是傳統(tǒng)圖像分類方法在進(jìn)行分類之前需要大量的時(shí)間進(jìn)行特征工程的建立。
Table 1 Accuracy,running time and
由于F1分?jǐn)?shù)是準(zhǔn)確率和召回率的調(diào)和均值,表示的是算法的綜合性能,而且取值范圍為0~1,值越大表示算法性能越好。從表1中可以看出,本文搭建的CNN-MY模型的F1分?jǐn)?shù)明顯高于2種傳統(tǒng)圖像分類方法和2種經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)圖像分類模型的?;谝陨峡梢缘贸?,本文針對(duì)霉變煙葉圖像與正常煙葉圖像分類問題提出的卷積神經(jīng)網(wǎng)絡(luò)模型CNN-MY的準(zhǔn)確率和穩(wěn)定性明顯優(yōu)于2種傳統(tǒng)圖像分類方法和2種經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)圖像分類模型的。
而且卷積神經(jīng)網(wǎng)絡(luò)模型的主要特點(diǎn)是可以自動(dòng)提取圖像特征,并自動(dòng)對(duì)圖像特征進(jìn)行篩選、提取和整合匯總,最后實(shí)現(xiàn)圖像分類。運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)模型可以避免傳統(tǒng)圖像識(shí)別方法中的手工選擇提取圖像特征的繁瑣操作,同時(shí)也可以克服手工提取圖像特征存在的偏差性和主觀性等缺點(diǎn)。本文針對(duì)霉變煙葉圖像與正常煙葉圖像分類問題提出的卷積神經(jīng)網(wǎng)絡(luò)模型CNN-MY是一個(gè)擁有多個(gè)卷積層和池化層的深度學(xué)習(xí)模型,它可以自動(dòng)提取、學(xué)習(xí)霉變煙葉圖像與正常煙葉圖像的有效圖像特征,進(jìn)而可以提升圖像分類的準(zhǔn)確率。這也是卷積神經(jīng)網(wǎng)絡(luò)優(yōu)于傳統(tǒng)圖像分類方法的主要原因。
針對(duì)霉變煙葉在線剔除主要依靠于手工的現(xiàn)狀和使用傳統(tǒng)圖像分類技術(shù)人工提取霉變煙葉特征的過程會(huì)比較復(fù)雜繁瑣等問題,本文提出了適用于霉變煙葉圖像和正常煙葉圖像分類識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)模型CNN-MY。在對(duì)自己制作的數(shù)據(jù)集進(jìn)行預(yù)處理之后,將煙葉圖像輸入CNN-MY模型,在模型中進(jìn)行多次卷積運(yùn)算和池化操作,通過使用不同尺寸的卷積核進(jìn)行卷積運(yùn)算和池化操作獲取有用的圖像紋理特征和其他有效特征,最后通過輸出層進(jìn)行圖像分類。實(shí)驗(yàn)結(jié)果表明,本文方法的識(shí)別率高于傳統(tǒng)圖像分類方法和2種經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)圖像分類模型的,識(shí)別準(zhǔn)確率達(dá)到了96.12%。本文模型除了具有高準(zhǔn)確率的優(yōu)點(diǎn)外,還可以自動(dòng)對(duì)圖像特征進(jìn)行提取、篩選和整合匯總,避免了傳統(tǒng)圖像分類方法中的人工提取特征的復(fù)雜過程。
考察政府機(jī)構(gòu)改革研究的核心學(xué)術(shù)團(tuán)體和機(jī)構(gòu),設(shè)置核心期刊發(fā)文量在5篇以上的閾值,運(yùn)行CiteSpace統(tǒng)計(jì)得到高產(chǎn)科研機(jī)構(gòu)如圖2所示。在CSSCI和核心期刊數(shù)據(jù)庫中發(fā)表過政府機(jī)構(gòu)改革的論文共涉及82個(gè)單位,呈現(xiàn)百家爭(zhēng)鳴、多點(diǎn)開花的局面,排名前三的有國家行政學(xué)院91篇、中國人民大學(xué)59篇和北京大學(xué)57篇,說明這三個(gè)研究單位在本課題有較強(qiáng)的科研實(shí)力與領(lǐng)域影響力,緊隨其后的有復(fù)旦大學(xué)、武漢大學(xué)、南開大學(xué)等科研單位。