梁長江,吳雪梅,王 芳,宋朱軍,張富貴
(貴州大學 機械工程學院,貴州 貴陽 550025)
地膜覆蓋栽培技術(shù)引入我國以來廣泛應(yīng)用于農(nóng)業(yè)生產(chǎn)中,大量研究表明,覆膜技術(shù)在增溫、保墑、除草、早熟等方面起到了積極作用,進而提高了農(nóng)產(chǎn)品的質(zhì)量和產(chǎn)量[1]。覆膜種植技術(shù)給農(nóng)業(yè)帶來巨大經(jīng)濟效益的同時也產(chǎn)生了一些問題,隨著地膜使用年限的增長,以及使用規(guī)模的不斷擴大,田地里的殘留地膜得不到及時清理,不僅造成了環(huán)境污染,而且對農(nóng)作物的生長產(chǎn)生了不良影響[2]。
數(shù)字圖像處理是指利用計算機對圖像進行加工處理的方法和技術(shù)[3]。隨著計算機軟硬件技術(shù)的不斷進步,圖像處理技術(shù)已被廣泛應(yīng)用在農(nóng)業(yè)領(lǐng)域,如農(nóng)業(yè)病蟲害診斷識別、農(nóng)作物生長狀況監(jiān)控和農(nóng)產(chǎn)品質(zhì)量無損檢測和分級等[4]。有研究者把圖像處理技術(shù)運用于地膜識別,張航[5]以皮棉中的地膜為研究對象,結(jié)合光譜分析、圖像處理和機器學習技術(shù)對夾雜在棉花里的地膜進行了識別方法研究。由于實際混入棉花中地膜的復(fù)雜性及噪聲數(shù)據(jù)對地膜特征數(shù)據(jù)的干擾等使得這種方法在圖像采集分析等方面存在一定的局限性。哈斯圖亞[6]分析地膜覆蓋農(nóng)田的遙感光譜反射特征、散射極化特征以及空間結(jié)構(gòu)特征,實現(xiàn)地膜覆蓋的農(nóng)田識別,這種方法利用衛(wèi)星采集遙感信息時效性較差,不能實時更新。針對以上研究存在的問題和田間地膜、殘膜自動視覺檢測技術(shù)的薄弱現(xiàn)狀,本文提出了一種基于無人機的田間地膜識別算法,為農(nóng)業(yè)地膜圖像自動識別技術(shù)的田間應(yīng)用提供理論依據(jù),同時也為田間殘膜的污染評估提供方法。
2018年5月在貴州安順平壩煙地采集6葉期煙苗煙田圖像,圖像采集工具為配備數(shù)碼相機的大疆無人機,懸停精度垂直為±0.1 m、水平為±0.3 m,飛行速度20 m·s-1,可轉(zhuǎn)動范圍俯仰:-90°~30°,相機有效像素為2 000萬。采集時間為上午11:01—11:11,無人機飛行高度分別為25、30、35、40、45、50 m,每個飛行高度各拍攝20張圖片,共計120張圖片,拍攝條件如表1所示。采用MatlabR2016a作為煙田地膜圖像處理和分析的軟件平臺;硬件平臺為PC機,Inter(R)Core(TM)i5-2400CPU/3.10GHz,內(nèi)存為8.00 GB。
圖像在采集、數(shù)字化、傳輸?shù)倪^程中不可避免的會受到一定程度的噪聲干擾,而這些噪聲會對圖像質(zhì)量產(chǎn)生影響[7]。為了改善圖像質(zhì)量,從圖像中提取有效信息,必須對圖像進行去噪預(yù)處理[8]。
表1 拍攝條件
Table1Shooting conditions
拍攝高度Shooting height/m風速Wind speed/(m·s-1)光照強度Light intensity/lx251.425530 301.40 5510 351.48 5830 401.53 6030 451.38 5430 501.46 5320
通過比較幾種濾波算法,發(fā)現(xiàn)中值濾波算法簡單、效率高,處理椒鹽噪聲特別好,而且在傳輸圖像時,外界影響和系統(tǒng)內(nèi)部的介入會在一定程度上造成圖像隨機性噪音影響。借助中值濾波方式能夠達到清理干預(yù)的效果,其基本原理是把將要處理像素點的某個鄰域內(nèi)的所有像素按照灰度值的大小進行排列,取排列的中值作為該像素點的新值,進而讓周圍的像素接近真實值,從而消除孤立的噪聲點[9]。因此,本論文采用中值濾波算法對采集的煙田圖像進行濾波處理。
自然彩色圖像的RGB色彩空間各個分量間存在很強的相關(guān)性,當自然彩色圖像的某個區(qū)域色彩發(fā)生變化,其相應(yīng)R、G、B分量的像素灰度值也同時發(fā)生變化[10]。在煙田環(huán)境中,植物部分(煙苗、雜草、樹木等)主要呈綠色,土壤背景主要呈黃褐色,薄膜主要呈白色(或黑色),因此可以提取圖像的RGB通道直方圖進一步分析。由于RGB顏色空間中的3個分量與亮度相關(guān),亮度改變會導(dǎo)致3個分量同時改變,穩(wěn)定性差。為避免亮度改變所導(dǎo)致的不確定性,采用HSV顏色空間模型[11-12]進行對比分析。HSV顏色空間模型的3個分量是相互獨立的,面對光照變化表現(xiàn)得更穩(wěn)健,能更好地反映顏色的本質(zhì)信息,便于顏色的量化處理[13]。RGB和HSV通道直方圖如圖1所示。
就本文而言,煙苗和土壤皆為背景,地膜為識別目標。通過比較目標和背景的RGB通道直方圖發(fā)現(xiàn),對于R和G分量圖像,地膜與背景灰度值重合較多,閾值很難分割出地膜,但是B分量中雖然地膜和背景灰度值均有部分重合,但灰度值大于155的像素點較多,而土壤和煙苗灰度值則是小于155的像素點多,如圖1所示。通過比較目標和背景的HSV通道直方圖發(fā)現(xiàn),對于H和S分量圖像,地膜與背景灰度值重合較多。V分量中地膜和背景灰度值重合較少,地膜灰度值大于178的像素點較多,而土壤和煙苗灰度值則是小于178的像素點多,如圖1所示。由此,B分量和V分量采用閾值分割法能分割出地膜,B分量分割閾值為155左右,V分量分割閾值為178左右。
圖像分割是指將圖像分成各具特征的區(qū)域,并且提取出感興趣目標的一門技術(shù)。它是圖像處理和圖像分析的關(guān)鍵步驟之一,只有在圖像分割的基礎(chǔ)上,才能對目標物進行參數(shù)測量和特征提取,使得更高層的圖像理解和圖像分析成為可能[14]。由于不同的分割算法對同一圖像中目標的分割提取有不同的效果,為了能夠找到一種適用于煙田地膜圖像中地膜的識別提取分割算法,分別對煙田地膜圖像進行不同分割算法比較,這里的分割算法主要有手動閾值分割算法、迭代閾值分割算法、大律法分割算法、基于改進遺傳算法的最大熵值法等,其中手動閾值分割算法基本思想是設(shè)定一個閾值T,灰度值大于T的部分歸為目標,標記為白色,灰度值小于T的部分歸為背景,標記為黑色;迭代閾值分割算法基本思想是開始選擇一個閾值T(T/2=最大灰度值+最小灰度值)作為初始估計值,按照一定規(guī)則不斷更新該估計值,直到前后兩次閾值相差小于0.1為止;大律法分割算法基本思想是將圖像劃分成兩類,計算每一個灰度級到兩類的灰度方差和,當類間方差達到最大時,該灰度級為最佳閾值;基于改進遺傳算法的最大熵值法是在二維最大直方圖熵法的基礎(chǔ)上對遺傳算法進行改進,對選擇、交叉、變異算子進行了優(yōu)化設(shè)置,以加快搜索過程的收斂性,達到全局最優(yōu)解。
圖1 目標與背景的B分量及V分量直方圖Fig.1 B and V component histograms of target and background
由于整幅圖像面積大、尺寸小,不利于觀察處理后效果,因此本文截取部分圖像進行分割研究。分別對截取部分圖像的RGB和HSV 6個分量圖像進行迭代閾值、手動閾值、大律法和最大熵值法分割,其中基于B分量和V分量圖像的分割效果較好,如圖2所示,比較目視效果圖發(fā)現(xiàn):同種分割方法下B分量圖像的分割效果較好;基于B分量圖像幾種分割方法中,迭代閾值法分割效果較優(yōu)。因此,本文針對B分量圖像的分割效果圖進行后續(xù)處理。
像素間的連通性是確定區(qū)域的一個重要概念,本文采用的是一種基于遞歸方法的二值圖像連通域像素標記算法[15],目的是把二值圖像中將互相鄰接的目標像素集合提取出來,并為圖像中不同的連通域填入不等的數(shù)字標記[16]。分別對4種分割算法分割后圖像進行連通域標定,通過對二值圖像的掃描和分析可得到二值圖像中的連通域劃分和連通域的數(shù)目。在二值圖像中包含黑白兩種顏色,分別作為目標顏色和背景顏色,本算法假設(shè)目標為白色,背景為黑色,標記算法只對目標像素進行標記。常用的連通性有4連通和8連通,本文采用8連通算法對圖像進行連通域標定。
圖2 不同分割方法效果比較Fig.2 Comparison of different segmentation methods
本文引入幾個概念:實際地膜面積s1(裸露在地表的地膜面積),實際地塊面積s2,地膜識別面積s3(圖像處理過程中識別圖像中的地膜面積),煙苗遮蓋地膜面積s4(煙苗破膜而出之后所遮擋的地膜面積),地膜識別率k1,識別地膜覆蓋率k2,實際地膜覆蓋率k3,以上幾個概念之間的關(guān)系用以下3個公式(公式1、2、3)表示。通過實際測量得知這塊地實際地膜面積s1為357.90 m2,該塊地實際面積s2為819.48 m2。
k1=s3÷(s1-s4);
(1)
k2=s3÷s2;
(2)
k3=s1÷s2。
(3)
分別對4種分割算法分割后圖像進行連通域標定,對標記完連通域的圖像進行目標面積求和,結(jié)果如表2所示。由于煙苗破膜而出,無人機從高空拍攝時煙苗會對地膜造成遮擋,為了對機器視覺、模型算法測得的地膜識別率進行精度分析,首先利用無人機獲取樣方煙田圖像,并進一步計算得到地膜識別面積參考值,本文采用Photoshop提供的魔棒工具,通過目視解譯、植被勾勒等方法獲取圖像中的地膜,并計算得到地膜識別面積參考值為308.3 m2。通過比較4種分割方法的圖像目標識別率,發(fā)現(xiàn)迭代閾值分割算法圖像目標識別率最高,約為71%,而且圖像處理過程用時較短,是一種理想的煙田地膜分割算法。
為了分析不同飛行高度下田間地膜的識別情況,利用無人機拍攝不同飛行高度下同一塊煙田,飛行高度分別為25、30、35、40、45、50、51、52、53 m。當無人機飛行到50 m以上高空時,出現(xiàn)抖動,拍攝圖像的穩(wěn)定性降低,因此本文采集地膜圖像時,無人機飛行高度均低于53 m。研究不同飛行高度下地膜識別情況時,每間隔5 m高度取一張地膜圖像,50 m以上高度的圖像穩(wěn)定性差,本文不做研究。由于不同飛行高度下拍攝的圖片中包含的實際煙田面積不同,飛行高度越高,圖片中煙田的實際面積越大,因此為了得到準確的地膜識別率,對拍攝圖片裁剪,取不同飛行高度下(25~50 m)同一地塊地膜圖像,利用迭代閾值分割算法進行分割處理,結(jié)果如表3所示,可知無人機在50 m飛行高度下拍攝的圖片地膜識別準確率最高,為80.06%,地膜覆蓋率為30.12%。識別率發(fā)生變化是飛行高度和光照強度共同作用的結(jié)果,由于采集圖像的條件不是理想的試驗條件,光照強度不可控,由表1和表3可知,光照強度的變化趨勢與識別率的變化趨勢大致吻合,但當飛行高度為50 m時,光照強度的影響程度下降。后續(xù)會研究光照強度對地膜識別的影響,當光照強度相差較大時,可選擇RGB分量相減來抵消光照的影響,也可選擇與光照無關(guān)的V分量圖進行處理,后續(xù)會接著研究。綜上所述,本文提出大疆精靈4無人機采集煙田地膜圖像的理想條件是:微風(或無風),光照均勻,飛行高度為45~50 m,采集時間為11:00—15:00,同時也要注意,隨著太陽光線入射角度的變化,可能會出現(xiàn)煙壟遮擋地膜的現(xiàn)象(有部分地膜出現(xiàn)在陰影區(qū),不利于后續(xù)圖像分割),采集圖像時要盡量避免這種情況。
表2 不同分割算法識別結(jié)果
Table2Different segmentation algorithm recognition results
分割算法Segmentation algorithm地膜識別面積Film recognition area/m2地膜識別率Film recognition rate/%識別地膜覆蓋率Recognition of film coverage/%手動閾值The manual threshold segmentation189.561.4723.12迭代閾值Iterative threshold segmentation218.870.9726.70大律法Large-law segmentation188.761.2123.02最大熵值法206.2 66.8825.16Maximum entropy method based on genetic algorithm
表3 不同飛行高度識別結(jié)果
Table3Different flight height recognition results
飛行高度Flight altitude/m地膜識別面積Film recognition area/ m2地膜識別率Film recognition rate/%識別地膜覆蓋率Recognition of film coverage/%25181.9259.0022.2030172.0955.8221.0035225.3873.1027.5040237.3877.0028.9745235.6876.4528.7650246.8380.0630.12
(1)通過對圖像中地膜、煙苗和土壤的RGB和HSV分量直方圖分析,發(fā)現(xiàn)B分量和V分量中地膜與背景灰度值重合較少,采用閾值分割法能有效分割出地膜。
(2)通過比較手動閾值分割、迭代閾值分割、大律法分割和基于改進遺傳算法的最大熵值法4種分割算法的圖像目標識別率,發(fā)現(xiàn)迭代閾值算法分割圖像目標識別率最高,為71%,且圖像處理過程用時較短。
(3)通過對無人機不同飛行高度(25、30、35、40、45、50 m)下同一地塊地膜圖像處理,發(fā)現(xiàn)處于50 m飛行高度時識別率最高,為80.06%,地膜識別面積為246.83 m2,地膜覆蓋率為30.12%。