宋振帥 宋龍 周艷 何磊 朱賀 王治民 韓大龍
摘要:針對冬季休眠期矮化蘋果樹果園修剪中人工修剪及半自動化修剪作業(yè)效率低的問題,在U-Net網絡模型基礎上,通過VGG16與U-Net結合構建改進的U-Net網絡模型,采用VGG16作為上采樣特征提取網絡,運用注意力機制SEnet增強圖像特征提取能力,提升分割精度,進而與下采樣提取的圖像特征進行融合,實現(xiàn)端到端圖像分割效果。結果表明,測試集上SE2網絡模型(改進U-Net網絡模型)的MIoU、MPA均大于原始U-Net網絡模型;在SE2網絡模型中,當r=8時測試集的MIoU、測試集的MPA、訓練集的Fscore、測試集的Fscore均最大,分別為89.59%、94.17%、0.942 806、0.944 506;在試驗臺上對SE2網絡模型? (r=8)進行性能驗證,表明SE2網絡模型(r=8)分割性能較好。
關鍵詞:改進U-Net;網絡模型;冬季休眠期;矮化蘋果樹;修剪枝條;分割方法
中圖分類號:TS23-9???????? 文獻標識碼:A
文章編號:0439-8114(2024)05-0194-07
DOI:10.14088/j.cnki.issn0439-8114.2024.05.034??????????? 開放科學(資源服務)標識碼(OSID):
Segmentation method for pruned branches of dwarfing apple trees during winter dormancy period based on improved U-Net
SONG Zhen-shuai 1,SONG Long2,ZHOU Yan 2, HE Lei2,ZHU He1,WANG Zhi-min1,HAN Da-long 2
(1.College of Mechanical and Electrical Engineering,Shihezi University, Shihezi? 832003, Xinjiang,China;
2.Institute of Machinery and Equipment, Xinjiang Academy of Agricultural and Reclamation Science, Shihezi? 832000, Xinjiang,China)
Abstract: In response to the low efficiency of manual and semi-automatic pruning operations in dwarfing apple trees during the winter dormancy period,based on the U-Net network model, an improved U-Net network model was constructed by combining VGG16 with U-Net. Using VGG16 as the upsampling feature extraction network, the attention mechanism SEnet was used to enhance the image feature extraction ability, improve segmentation accuracy, and then fuse with the downsampling extracted image features to achieve the end-to-end image segmentation effect. The results showed that the MIoU and MPA of the SE2 network model (improved U-Net network model) on the test set were greater than those of the original U-Net network model;in the SE2 network model, when r=8, the MIoU of the test set, MPA of the test set, Fscore of the training set, and Fscore of the test set were all the highest, with values of 89.59%, 94.17%, 0.942 806, and 0.944 506, respectively; the performance of the SE2 network model (r=8) was validated on the test bench, and it was found that the segmentation performance of the SE2 network model (r=8) was good.
Key words: improved U-Net; network model; winter dormancy period; dwarfing apple trees; pruned branches; segmentation method
收稿日期:2022-09-13
基金項目:新疆生產建設兵團重大科技項目(2021AA00503);國家重點研發(fā)計劃項目(2017YFD07014);新疆生產建設兵團農業(yè)領域重點科技攻關項目(2018AB016)
作者簡介:宋振帥(1997-),男,山東臨沂人,碩士,主要從事圖像識別與分割研究,(電話)19190249234(電子信箱)1459588016@qq.com;通信作者,周 艷(1970-),女,四川大竹人,研究員,博士,主要從事林果機械化研究,(電子信箱)806551889@qq.com。
宋振帥,宋 龍,周 艷,等. 基于改進U-Net的冬季休眠期矮化蘋果樹修剪枝條分割方法[J]. 湖北農業(yè)科學,2024,63(5):194-200,206.
新疆林果種植面積約占全國林果種植面積的13%,種植面積逐年遞增[1],是全國林果主要產區(qū)。林果業(yè)對農民增收起到重要的作用,成為當前農民致富的一條重要道路[2],是新疆優(yōu)勢突出、特色鮮明、市場前景廣闊的產業(yè),已成為優(yōu)化農村產業(yè)結構的重點。但新疆地廣人稀,且現(xiàn)階段機械修剪機以人工操作為主,自動化技術在修剪上的應用較少,人工操作效率低,并隨著人工成本的提高,林果產業(yè)的經濟效益低靡。種植者對自動化作業(yè)需求極為迫切,因此實現(xiàn)智能化、自動化機械修剪迫在眉睫,本研究利用改進的U-Net網絡模型對冬季休眠期矮化蘋果樹枝條采取端到端分割提取,對修剪枝條修剪點三維坐標的確定有重要意義。
目前分割方法主要有傳統(tǒng)方法和基于深度學習的方法,傳統(tǒng)方法主要基于邊緣檢測、模板匹配和形變模型等[3]。Momtanu等[4]采用形態(tài)學邊緣方法對目標進行檢測。2016 年Hamuda等[5]利用HSV顏色空間在不同光照及在雜草、土壤為背景的情況下分割出花椰菜。黃彪[6]利用基于色差的圖像分割獲取到間斷的枸杞枝條圖像,通過非合理間斷圖像的恢復獲取到枝條的中心坐標及直徑,進而完成枸杞枝條提取。嚴亞飛[7]將RGB顏色空間轉換到LAB顏色空間,通過K-Means聚類及膨脹腐蝕等方法獲取到枸杞枝條的輪廓,通過三維重建獲取到枝條定位。傳統(tǒng)的圖像識別方法需要人工提取圖像特征,當受到光照不均或背景較復雜時,分割效果較差。因此有針對性地選用圖像特征和自動、便捷的模型非常重要。
近年來,隨著深度學習技術及計算機技術的發(fā)展,傳統(tǒng)的深度卷積分類網絡如AlexNet和VGGNet[8]包含全連接層,其計算量較大,也無法運用到語義分割任務中。Speckmann[9]提出的全卷積神經網絡(FCN)實現(xiàn)了端到端的語義分割,但其分割精度不高。衛(wèi)長秋等[10]提出的U-Net網絡模型是在FCN網絡模型基礎上構建獲得,是一個U型結構,具有編碼器結構,左側是對圖像的下采樣,右側是對圖像的上采樣,進而進行特征融合實現(xiàn)語義分割。Keir等[11]提出了一個改進后的U-Net網絡模型,將Droupout層放在每個卷積層的后面。Fred等[12]提出了Fast R-CNN網絡模型,該網絡模型采用多任務損失函數(shù)并將原網絡模型中SVM分類用Softmax和SmoothLoss替換,進而減小了電腦磁盤的占用。
隨著遷移學習的發(fā)展,通常把在其他數(shù)據集的預訓練權重運用到自己的數(shù)據集中進行微調,以解決樣本過少導致網絡過擬合的問題[13]。Chen[14]等提出一個將預訓練權重ResNet-34作為編碼層的U型網絡模型結構,用于分割視盤,分割效果較好。雖然卷積神經網絡分割在某些方面優(yōu)于傳統(tǒng)的色差分割方法,但是依然存在一些問題,當分割背景較復雜時,編碼器的特征提取能力不足;在訓練網絡模型數(shù)據集較少時,容易出現(xiàn)過擬合現(xiàn)象。同時,也會出現(xiàn)對某些數(shù)據集分割效果較好,但對某些數(shù)據分割效果較差,且泛化性不足的情況。本研究在U-Net網絡模型的基礎上,通過VGG16與U-Net結合構建新的網絡模型,在網絡模型下采樣時,采用VGG16作為特征提取網絡,進而運用注意力機制SEnet增強圖像特征提取能力,提升分割精度,同時,在模型上采樣時,直接進行兩倍上采樣,與下采樣提取的圖像特征進行特征融合,最終獲得的特征層和輸入圖片高寬相同,分割效果與原圖相比更直觀,具有較好的穩(wěn)定性及泛化能力,魯棒性較好。
1 圖像采集與數(shù)據集的構造
1.1 圖像采集系統(tǒng)搭建
使用Bumblebee2雙目相機、1394a圖像采集卡、筆記本電腦、三角支架、12V鋰電池等進行圖像采集,相機參數(shù)如表1所示,圖像格式為JPG,電腦操作系統(tǒng)為Win10系統(tǒng),基于Python 3.6.13,Pytorch 1.7.0在編譯器Pycharm 2021開發(fā)環(huán)境上對采集的圖像進行調試和處理。
1.2 試驗臺搭建
機器視覺平臺中上位機是整個系統(tǒng)的大腦中樞,起到控制輸出和提供服務的作用。根據算法程序與儲存需要,本研究選擇型號為SP-XC841T-V720、處理器為i5-7500、運行內存為8 G的上位機。上位機主要負責接收工業(yè)相機采集的圖像信息,進行圖像處理并將相關結果發(fā)送至顯示屏。顯示屏為TPC1261Hii嵌入式一體化觸摸屏,屬于上位機的I/O設備,是一種輸入輸出設備,主要負責接收上位機的信號。采集系統(tǒng)配備了2根3 m網線,型號為SC-GN-X3,負責將相機采集的圖像信息輸送至上位機的程序處理中心,試驗臺結構如圖1所示。
試驗臺通過底部尤奈特驅動電機運輸至距離樹合理的作業(yè)位置(0.9~1.5 m),如圖2所示。首先通過導向滑軌調整相機水平高度,使其可以采集到樹的全部枝條,其次相機開始圖像采集并將采集到的圖像信息傳輸至工控機的網絡模型中進行圖像預測處理,最后將工控機上圖像預測處理結果發(fā)送并顯示在顯示屏。
1.3 數(shù)據集構造
經過篩選,剔除重疊度較高的圖像,共獲得100張有效圖像,由于雙目相機在采集枝條圖像時需要將雙目圖像切割成左目圖像和右目圖像,因此獲得了200張需要標注的圖像。由于網絡模型的圖像為512 px×512 px,為了提高后期模型的訓練效率,將圖像都調整為512 px×512 px。為了防止出現(xiàn)過擬合現(xiàn)象,模型需要大量的訓練數(shù)據集,本研究通過旋轉、鏡像、縮放等方式進行樣本數(shù)量擴充,并使用labelme對原始數(shù)據集進行標注,最終圖像數(shù)據集包含400張圖像,并按照9∶1隨機劃分為訓練集和測試集。
2 相關技術
2.1 U-Net網絡模型
FU等[15]提出了U-Net結構,U-Net最初被用到醫(yī)學影像分割中,是在全卷積網絡FCN的基礎上進行了優(yōu)化,一共包含了23個卷積層,可以在數(shù)據集上獲得較優(yōu)的結果,U-Net網絡結構被稱為編碼器-解碼器結構,如圖3所示,編碼器是左半部分的特征提取網絡,解碼器是右半部分的加強特征提取網絡。
在卷積神經網絡中,決定某一層輸出結果中一個元素所對應的輸入層區(qū)域大小被稱為感受野[16]。越深層的網絡卷積得到的特征圖有更大的感受野,所以在U-Net網絡模型中,淺層卷積得到的特征圖要關注其紋理特征,深層卷積得到的特征圖要關注其語義特征。在U-Net網絡中加強特征提取部分,通過下采樣獲取特征圖使圖像邊緣信息缺失,在每次上采樣提煉特征的同時,也必然會損失一些邊緣特征信息,而失去的特征在上采樣中不能復現(xiàn),因此通過特征的拼接來實現(xiàn)邊緣特征的復現(xiàn)。
由于U-Net網絡模型設計結構的優(yōu)越性,使得該網絡同時具備捕捉上下文信息的收縮路徑和允許精確定位的對稱擴展路徑。相較于全卷積神經網絡,U-Net的上采樣過程依然有大量的通道,這有助于網絡將上下文信息融合在一起;相較于SegNet語義分割網絡[17],U-Net網絡有著訓練樣本少且精度高的優(yōu)勢,能實現(xiàn)端到端圖像分割任務,因此也增加了該模型的精準度和使用領域。
2.2 VGG16網絡
VGG-Net是牛津大學計算機視覺組(Visual geometry group)和Google DeepMind公司一起研發(fā)的深度卷積網絡。VGG-Net網絡模型搭建16~19層卷積神經網絡,包含VGG16、VGG19 2種結構,全部運用了3×3小型卷積核和2×2最大池化核,通過不斷加深網絡結構來提升性能。VGG-Net借鑒了AlexNet的卷積模型結構,運用ZFNet的小卷積思想嘗試了1×1卷積,探索卷積神經網絡深度與其性能之間的關系,實現(xiàn)高效稠密預測。VGG-Net網絡模型運用3×3小卷積核,使VGG-Net網絡模型成為主流模型,并使其作為分類、定位、檢測、分割一系列圖像任務的骨干網絡結構。VGG16的網絡模型如圖4所示,本研究將VGG16作為特征提取網絡,并采用SEnet模塊加強圖片的有效提取特征。
2.3 遷移學習
深度學習往往需要大規(guī)模數(shù)據來進行網絡模型的訓練和優(yōu)化,在小規(guī)模數(shù)據集上訓練往往會出現(xiàn)過擬合現(xiàn)象。遷移學習可以解決數(shù)據量少導致的深度卷積神經網絡不好訓練的問題。遷移學習首先在大規(guī)模數(shù)據集上(如ImageNet數(shù)據集)進行訓練,然后運用到自己的數(shù)據集上,可以較好地降低模型訓練時間,并且取得良好的結果。
3 改進的網絡模型
輸入圖像為RGB的3通道彩色圖像,首先把圖像輸入到網絡模型中,進而進行網絡模型訓練,輸出分割好的圖像。提取的目標結果為紅色,背景區(qū)域為黑色,實現(xiàn)自動、端到端圖像分割的目標并獲取三維坐標,圖5為彩色圖像分割流程。
[改進網絡模型][后處理][解碼器][解碼器]
3.1 注意力機制
注意力機制源于人類大腦,并被引入NLP領域,從數(shù)學角度看,注意力機制提供一種權重模式運算。在神經網絡中,注意力機制利用一些網絡層計算得到圖像特征層的權重,可以較好地獲取圖像信息,因此注意力機制在圖像分類、語義分割和自然語言處理領域受到廣泛關注。2010年楊璟等[18]提出SE(Sequeeze and excitation)模塊,如圖6所示,SE模塊由Squeeze、Excitation構成。輸入圖片的維度為H×W×C,其中H為提取特征的高,W為提取特征的寬,C為通道數(shù)。第一步運用Squeeze操作沿著空間維度進行全局平均池化來提取全局信息,生成1個1×1×C維度的通道。為了將Squeeze提取到的全局信息充分利用,第二步利用Excitation操作來獲取各通道的相互關系,首先把通道數(shù)C縮小為C/r,通過參數(shù)r可以控制SE模塊的計算量,r取不同的值,模型的效果也會不同,其次經過全連接層使通道數(shù)變?yōu)樵瓉淼腃,最后通過Sigmoid函數(shù)生成1個1×1×C維度的向量,并將該向量和最初輸入的特征信息(X)進行各通道的相乘。
圖7中的2個全連接層主要決定整個SE模塊的參數(shù)量,SE模塊參數(shù)量在計算時,需對特征圖通道重新標定,如圖7所示。經過重新標定后的特征圖,不同通道的重要性也不同,圖像中有用信息被放大,不重要信息被消弱,因此SE模塊具有顯示通道之間的關系、加強主要特征提取、抑制無效特征、大幅度提升精度及減少參數(shù)量的特點。
[輸入特征][輸出特征]
3.2 改進模型的構建
基于上述分析,本研究使用的U-Net網絡結構主要由主干特征提取網絡(編碼器)和加強特征提取網絡(解碼器)構成,其形狀為U字形,如圖8所示。該模型分成3個部分,第一部分是主干特征提取,采用VGG16做主干提取部分,獲得5個初步有效特征層,具體結構參數(shù)如表2所示。第二部分是加強特征提取部分,利用獲取的5個初步有效特征層進行上采樣,并與下采樣獲取到的5個有效特征層進行融合。第三部分為預測部份,最終獲得的有效特征層利用1×1卷積對每個特征點進行分類,相當于對每個像素點進行分類。上采樣時在第4個有效特征層、第5個有效特征層后運用SE模塊,加強網絡模型的主要特征提取,抑制無效特征、減少參數(shù)量、大幅提升精度。同時,為防止出現(xiàn)過擬合現(xiàn)象,本研究采用VGG16網絡在ImageNet[18]數(shù)據集上得到的預訓練權重進行遷移學習,運用ImageNet的預訓練權重進行凍結,訓練U-Net的解碼器部分,較好地降低模型訓練時間。
原始的U-Net網絡中3×3卷積層沒有使用padding進行0的填充策略,這使得每次卷積后的卷積輸出尺寸都會減小,所以,為了方便網絡的構建與更好的通用性,在每個卷積層中都采用padding填充策略,即3×3的卷積填充padding為1,這使得卷積前后特征圖尺寸一致,因此可以利用1×1的卷積進行通道調整,獲得的輸出尺寸與原圖大小一致。
3.3 模型損失函數(shù)
本研究所使用的損失函數(shù)包含交叉熵損失函數(shù)和Dice Loss損失函數(shù)[17]。交叉熵主要是用來表達神經網絡輸入和輸出的結果差異,交叉熵越小代表輸入和輸出的結果越接近。交叉熵損失函數(shù)(L)的計算公式如下。
[L=-c=1Mytruelog(ypred)]????? ?? (1)
式中,M表示類別個數(shù);ytrue是One-hot向量,如果該類別和樣本的類別相同取1,不相同取0;ypred表示預測樣本屬于c類樣本的概率。
Dice Loss是語義分割中常見的評價指標,用來解決語義分割中正負樣本極度不平衡的場景[19]。Dice Loss來自Dice coefficient,通常用來評估2個樣本的相似性,其取值范圍在[0,1],Dice coefficient的值(Dice)越大表示越相似,其計算公式如下。
[Dice=2X?YX+Y]??????? ??????? ??(2)
式中,|X∩Y|表示X和Y的交集,|X|和|Y|分別表示Predict mask和Ground truth [15]。
基于Dice coefficient,Dice Loss(LDice)的計算公式如下,LDice越小表示分割網絡的效果越好。
[LDice=1-2|X?Y||X|+|Y|]?? ? ???(3)
3.4 評價指標
為了泛化本研究對冬季休眠期矮化蘋果樹修剪枝條的分割效果。本研究采用平均像素準確率(Mean pixel accuracy,MPA)、平均交并比(Mean intersection over union,MIoU)、F分數(shù)(Fscore)來進行評價[16],計算公式如下。
[MPA=1k+1i=0kpiij=0kpij]?????????? ? ??(4)
[MIoU=1k+1i=0kpiij=0kpij+j=0kpji-pii]? ?(5)
[Fscore=2×Precision×RecallPrecision+Recall]?????? ??????? ???(6)
式中,k為類別數(shù);pii為真陽性;pij、pji均為假陽性;i為真實類別;j為預測類別;Precision為準確率;Recall為召回率[17]。
4 試驗細節(jié)與結果分析
4.1 試驗細節(jié)
操作系統(tǒng)為Win10,語言環(huán)境為Anaconda3和Python 3.6,CPU為IntelCorei7-9700,GPU為Nvidia GeForce GTX 1660,深度學習編譯器為Pycharm。
本研究模型訓練選擇Adam優(yōu)化器進行端到端訓練,采用隨機梯度下降法訓練[18],衰減率設置為0.92。初始學習率設置為0.000 1,Batchsize設置為2,訓練共進行100次迭代循環(huán)。為加快訓練速度,本研究使用了U-Net網絡在VOC 2007數(shù)據集上的預訓練權重[19],在前50個網絡模型訓練循環(huán)中,凍結VGG16神經網絡的預訓練權重進行訓練,訓練U-Net的解碼器部分,后面50個網絡模型訓練循環(huán)中把所有的網絡層解凍進行全部訓練,同時學習速率與前50個enpoch保持不變。
4.2 試驗結果與分析
為了顯示改進的U-Net網絡模型與其他語義分割網絡模型在測試集上的性能對比。在改進U-Net網絡模型每個解碼器后放置SE模塊的模型稱為SE1網絡模型,在改進U-Net網絡模型的第四個有效特征層和第五個有效特征層后放置SE模塊的模型稱為SE2網絡模型。測試集采用原始U-Net網絡模型、SE1網絡模型、SE2網絡模型進行訓練,訓練過程中損失函數(shù)變化如圖9所示。
經過100個enpoch后,原始U-Net的訓練集、測試集的損失值最大,訓練集的損失值在0.18時保持平衡;當SE1網絡模型運用VGG16網絡進行特征提取并采用ImageNet預訓練權重數(shù)據,網絡模型損失值迅速下降,減少了訓練時間,訓練集損失值在0.042時保持平衡,模型得到改進;當網絡模型調整為SE2網絡模型時損失值更低。
由表3可知,測試集上SE2網絡模型的MIoU、MPA均大于原始U-Net網絡模型;在SE2網絡模型中,當r=8時測試集的MIoU、測試集的MPA、訓練集的Fscore、測試集的Fscore均最大,分別為89.59%、94.17%、0.942 806、0.944 506。SE2網絡模型(r=8)的分割效果較好,如圖10所示;將其在試驗臺上進行性能驗證,如圖11所示,結果表明SE2網絡模型(r=8)分割性能較好。
5 小結
為滿足對目標特征提取的需求,在原始U-Net網絡模型的基礎上對下采樣部分采用遷移學習的VGG16網絡,通過SEnet模塊提取重要信息,抑制非重要信息,并且討論了r的取值對改進網絡模型性能的影響,從而構建改進的U-Net網絡模型(SE2,r=8),該模型在測試數(shù)據集上的MIoU為89.59%,MPA為94.17%,比原始U-Net網絡模型性能有所提高,可以滿足對冬季枝剪樹木圖像分割的要求。后續(xù)將在時間序列上進行數(shù)據集的擴充,進一步提高模型的性能[20],通過語義分割二維圖像,進而將分割后的圖像進行骨架提取,并求解修剪點,將二維坐標映射到三維中,最終提取三維坐標,通過機械臂去執(zhí)行該三維坐標點,此方法可以為實現(xiàn)自動化修剪提供參考。
參考文獻:
[1] 周曉雄. 阿克蘇地區(qū)林果產業(yè)發(fā)展現(xiàn)狀與對策[D].新疆塔里木:塔里木大學,2021.
[2] 張秀莉. 蘋果紡錘形改造為主干形的技術與效果[D].新疆塔里木:塔里木大學,2017.
[3] 劉 慧,朱晟輝,沈 躍,等. 基于多特征融合的樹干快速分割算法[J].農業(yè)機械學報,2020,51(1):221-229.
[4] MOMTANU C,KHOT L R,SINDHUJN S. Evaluation of mobile 3D light detection and ranging based canopy mapping system for tree fruit crops[J]. Computers and electronics in agriculture, 2019, 158:10.
[5] HAMUDA E,GLAVIN M,JONES E. A survey of image processing techniques for plant extraction and segmentation in the field[J]. Computers and electronics in agriculture,2016,18:121-126.
[6] 黃 彪. 枇杷剪枝機器人關鍵技術的研究[D].廣州:華南理工大學,2016.
[7] 嚴亞飛. 智能枸杞采摘機器人枝條識別與定位關鍵技術研究[D].合肥:合肥工業(yè)大學,2019.
[8] WU C Y, YANG L Y.3D reconstruction of Chinese hickory tree for dynamics analysis[J]. Biosystems engineering, 2014, 119:11.
[9] SPECKMANN H. Providing measured position data for agricultural machinery[J]. Computers and electronics in agriculture, 2000,??? 25(1):13-16.
[10] 衛(wèi)長秋,崔建榮,馬海紅,等. 蘋果紡錘形改造成高光效樹形的技術要點[J].山西果樹,2007(6):46.
[11] KEIR E, KEIGHTLE Y, GERALD W, et al. 3D volumetric modeling of grapevine biomass using tripod LiDAR[J]. Computers and electronics in agriculture, 2010, 74(2):8.
[12] FRED W,MITCH B. Graph-based methods for analyzing orchard tree structure using noisy point cloud data[J]. Computers and electronics in agriculture, 2021, 187:16-21.
[13] 郝 婕,索相敏,李學營,等. 短枝富士蘋果樹體結構及相關因素分析[J].河北農業(yè)科學,2016,20(3):17-19.
[14] CHEN Y, XIONG Y J. 3D point cloud semantic segmentation toward large-scale unstructured agricultural classification[J]. Computers and electronics in agriculture, 2021, 190:198-222.
[15] FU L S, GAO F. Application of consumer RGB-D cameras for fruit detection and localization in field: A critical review[J]. Computers and electronics in agriculture, 2020, 75(6):177-178.
[16] 劉 晨. 基于機器視覺工件尺寸的高精度測量技術研究[D].長春:長春工業(yè)大學,2020.
[17] CHOLLET F. Deep learning with depth separable convolutions[J]. American journal of cardiology, 2016, 50:1006-1012.
[18] 楊 璟,朱 雷.基于RGB顏色空間的彩色圖像分割方法[J].計算機與現(xiàn)代化,2010(8):147-149,171.
[19] 張亞輝. 基于Faster R-CNN目標檢測的機器人抓取系統(tǒng)研究[D].合肥:中國科學院深圳先進技術研究院,2019.
[20] 李建坤. 基于圖像SURF特征的電路板缺陷自動檢測系統(tǒng)[D].西安:西北大學,2020.