鄒昆霖,張若宇,江英蘭
(石河子大學(xué)機(jī)械電氣工程學(xué)院/農(nóng)業(yè)部西北農(nóng)業(yè)裝備重點(diǎn)實(shí)驗(yàn)室,新疆 石河子832003)
棉花是關(guān)系國計(jì)民生的戰(zhàn)略物資,對國民經(jīng)濟(jì)和社會(huì)發(fā)展有著重要影響[1]。準(zhǔn)確測量棉花種植面積和空間分布,對棉花田間管理,精確測量棉田單產(chǎn),優(yōu)化棉花種植格局具有重要意義[2]。
目前作物種植面積和空間分布測量主要依靠遙感方法進(jìn)行。張芳等[3]基于遙感圖像進(jìn)行農(nóng)田判別分類和面積計(jì)算取得了良好的效果;Cong Ming 等[4]提出了一種評價(jià)無監(jiān)督遙感圖像分類輸入?yún)?shù)的初步分析方法,該方法能自動(dòng)確定無監(jiān)督圖像分類的適當(dāng)初始簇?cái)?shù)及其對應(yīng)的中心,在不需要先驗(yàn)知識的情況下,可以有效地實(shí)現(xiàn)無監(jiān)督圖像的分類,獲得準(zhǔn)確的分類結(jié)果;李曉東等[5]采用多時(shí)相遙感數(shù)據(jù)分類計(jì)算農(nóng)田,通過地表植被時(shí)序變化過程結(jié)合印象紋理等多維空間數(shù)據(jù)對水田和旱田進(jìn)行了分類;潘影等[6]利用遙感影像采用決策樹算法將背景農(nóng)業(yè)地表覆蓋進(jìn)行多種類別的劃分,共劃分出39類農(nóng)業(yè)地表類型,采用歸一化植被指數(shù)計(jì)算了北京地區(qū)裸露農(nóng)田的面積,為利用遙感圖像檢測棉田信息起到了指導(dǎo)作用;李敏等[7]采用衛(wèi)星遙感影像通過物候歷分析和主要農(nóng)作物的光譜特征,確定了棉花識別的最佳時(shí)相,并建立了識別模型;辛海強(qiáng)等利用遙感影像提取了包括棉花種植面積、棉花長勢、病蟲害等信息,為棉花遙感檢測研究和棉田精細(xì)化管理打下了基礎(chǔ)。
上述方法中遙感數(shù)據(jù)獲取的時(shí)間周期長,由于空間分辨率受限,采用遙感手段獲取作物信息的精度也有待進(jìn)一步提高[8]。
無人機(jī)近地面成像因其空間分辨率高、成本低、周期短和可重復(fù)性強(qiáng)等特點(diǎn)[9],在土地和作物信息監(jiān)測等方面逐步得到應(yīng)用[10-12]。無人機(jī)低空成像分類主要有2 種。第1 種是基于光譜圖像以各類植被指數(shù)為基礎(chǔ)的分類方法。田振坤等[13]以冬小麥為研究對象,利用農(nóng)作物的波譜特征和植被指數(shù)NDVI變化閾值,對作物分類方法進(jìn)行研究,結(jié)果表明該方法對農(nóng)作物分類具有較高的準(zhǔn)確性和普適性;高林等[14]研究對比分析了無人機(jī)高光譜數(shù)據(jù)計(jì)算的紅邊參數(shù)和光譜指數(shù)與冬小麥葉面積指數(shù)的相關(guān)性,結(jié)果表明多種光譜指數(shù)與植物信息具有較強(qiáng)相關(guān)性,為利用無人機(jī)高光譜遙感數(shù)據(jù)開展相關(guān)研究積累了經(jīng)驗(yàn)。第2 種是采用可見光相機(jī)以各類紋理特征為基礎(chǔ)的分類方法。如李宗南等[15]利用小型無人機(jī)采集可見光圖像并計(jì)算圖像紋理特征,研究了基于該特征的玉米倒伏面積的提取方法,取得了較高精度;韓文霆等[16]提取了27 項(xiàng)玉米田的紋理特征設(shè)計(jì)了玉米種植信息提取算法,結(jié)果表明該方法面積計(jì)算的誤差控制在20%以內(nèi);郭鵬等[17]對比了可見光下植被指數(shù)和紋理特征在棉花、玉米、葡萄作物分類方法,結(jié)果表明基于色彩與紋理特征提取方法優(yōu)于色彩指數(shù)的提取方法,總體精度較高,但未嘗試對兩類特征的聯(lián)合。
本文在現(xiàn)有研究基礎(chǔ)上分別對脫葉機(jī)采棉田、未脫葉手采棉田、冬小麥田、裸地的色彩、植被指數(shù)和農(nóng)田紋理特征進(jìn)行計(jì)算和分析,對比色彩、植被指數(shù)和紋理特征在農(nóng)田作物分類提取中的特點(diǎn),整合各類特征的優(yōu)勢,實(shí)現(xiàn)了棉田精確提取和面積估測,進(jìn)而為棉田精細(xì)化管理以及棉田產(chǎn)量精確估測提供一定的支撐。
研究區(qū)域位于新疆維吾爾自治區(qū)石河子墾區(qū),地理坐標(biāo)是北緯43°26′-45°20′,東經(jīng)84°58′-86°24′,平均海拔高度450.8 m,處天山北麓中段,古爾班通古特大沙漠南緣;該地區(qū)屬于溫帶大陸性氣候,冰凍期長,夏季炎熱。
該地區(qū)作物種植制度為一年一熟,主要種植經(jīng)濟(jì)作物棉花;棉花以機(jī)采棉為主,少部分為手采棉,機(jī)采棉在9月前后兩次噴施脫葉劑,10月收獲,手采棉不噴施脫葉劑,進(jìn)行人工采收。
圖1 研究區(qū)域示意圖Fig.1 Sketch map of study area
本研究數(shù)據(jù)于2017年9月17日在石河子大學(xué)農(nóng)田實(shí)驗(yàn)站內(nèi)實(shí)驗(yàn)獲得。實(shí)驗(yàn)選用F450 機(jī)架配合PIXHawk 飛控(PIXhawk 2.4.6,權(quán)盛電子科技股份有限公司,中國)作為低空成像載具,該無人機(jī)為4 軸無人機(jī),采用垂直起降方式。該機(jī)機(jī)身重量282 g,起飛重量800-1200 g,對稱電機(jī)軸距450 mm;根據(jù)該機(jī)載荷,選用鷹眼飛螢6S 可見光運(yùn)動(dòng)相機(jī)(飛螢6S,鷹眼航拍科技有限公司,中國)進(jìn)行數(shù)據(jù)采集實(shí)驗(yàn);其飛行高度100 m,采用懸停垂直向下方式拍攝,縱向重復(fù)度大于80%,橫向重復(fù)度大于60%。實(shí)驗(yàn)當(dāng)天天氣晴朗,最高氣溫29 ℃,無風(fēng)。
無人機(jī)所拍攝圖像由Agisoft Photoscan 軟件(PhotoScan X64,Agisoft 股份有限公司,俄羅斯,http://www.agisoft.ru)進(jìn)行正射影校正和拼接。在軟件中選擇高對齊精度和高精度密集點(diǎn)云模式拼接航拍圖像獲得正射影圖像。影像共包含1706×4096 圖像源,圖像橫向分辨率為0.12 m/pixel、縱向分辨率為0.12 m/pixel,面積約為163.32 畝(0.10888 km2)。由于部分影像涉及居民區(qū)等因素,為避免對棉田判別算法造成影響,本研究選取了位于研究區(qū)域南部的部分地區(qū)作為感興趣區(qū)域。感興趣區(qū)域被單獨(dú)劃分出來,面積34 m2,圖像大小為784×458,共359072個(gè)像素,數(shù)據(jù)格式為.tif,RGB 三個(gè)通道,8 字節(jié)存儲,亮度范圍0-255。
1.3.1 圖像特征分析
本研究將感興趣區(qū)域中包含多種地面物體的圖像劃分為脫葉棉田、未脫葉棉田、冬小麥田、裸地4種類型,每種類型選取3 塊區(qū)域樣本作為訓(xùn)練樣本,每個(gè)樣本區(qū)域大小為81×68,共66096 個(gè)像素點(diǎn)作為訓(xùn)練集(圖2),其余292976 個(gè)像素點(diǎn)作為測試集,選取4 種地物特征的典型圖像,并提取顏色、植被指數(shù)、紋理特征進(jìn)行分析,從而評選出適于區(qū)分不同地物類型的關(guān)鍵特征作為棉田像素判別提取的依據(jù)。
圖2 各類型地區(qū)典型樣本Fig.2 Typical sample of fields
1.3.2 特征提取
選用的可見光相機(jī)僅采集可見光下紅、綠、藍(lán)3個(gè)通道的信息,無近紅外等其他波段圖像的信息。為解決圖像分類特征量較少的問題,通過色彩空間變換、植被指數(shù)計(jì)算、紋理分析等方法進(jìn)行圖像增強(qiáng)得到了更多特征。
植被指數(shù)是指利用綠色植被對不同波段的光照敏感性不同的特點(diǎn),對不同波段進(jìn)行組合運(yùn)算,增強(qiáng)圖像信息。它本質(zhì)上是綜合考慮各有關(guān)光譜信號,把多波段反射率做一定的運(yùn)算,使有效圖像信息增強(qiáng),同時(shí)過濾無效信息[18]。胡勇等[19]研究者選取歸一化綠紅差異指數(shù)[20]、歸一化綠藍(lán)差異指數(shù)[21]、紅綠比值指數(shù)[22]、藍(lán)綠比值指數(shù)[23]、過綠指數(shù)[24]、過紅指數(shù)[20]、標(biāo)準(zhǔn)植被指數(shù)[20]、超綠超紅差分指數(shù)[25]、植被顏色指數(shù)[26]、紅綠藍(lán)植被指數(shù)[27]、可見光波段差異植被指數(shù)[24]等植被指數(shù),各植被指數(shù)計(jì)算公式如表1所示。同時(shí),圖像的色調(diào)、飽和度、明度和紅、綠、藍(lán)通道值也可作為單一輸入變量的植被指數(shù)。
計(jì)算植被指數(shù)以及圖像的色調(diào)、飽和度、明度和紅、綠、藍(lán)通道值,得到共計(jì)18 項(xiàng)植被指數(shù)特征。
表1 植被指數(shù)計(jì)算公式Tab.1 Calculation formula of vegetation index
紋理是由灰度分布在空間位置上反復(fù)交替變化而形成的,所以在圖像空間中相隔某距離的兩個(gè)像素間存在一定的相關(guān),即圖像中灰度的空間相關(guān)特性[28]。
灰度共生矩陣是一種比較常見的、區(qū)別能力強(qiáng)的描述紋理特征的方法,通過由圖像灰度值之間二階聯(lián)合條件概率密度所構(gòu)成的矩陣來反映圖像中任意兩點(diǎn)間灰度的空間相關(guān)特性[29]。
本文對RGB 色彩空間3 通道灰度值采用13×13 的窗口大小,步長取1,移動(dòng)方向取0°進(jìn)行紋理特征提取,得到多尺度紋理。
描述紋理特征的統(tǒng)計(jì)量采用RGB 各通道均值、方差、協(xié)同性、信息熵、二階矩、相關(guān)性。本文得到共計(jì)18 項(xiàng)紋理特征。
使用ENVI4.8 軟件中的統(tǒng)計(jì)功能,選擇3 處脫葉棉田、3 處未脫葉棉田、3 處冬小麥田和3 處裸地(圖2),計(jì)算這些區(qū)域36 項(xiàng)特征值。
1.3.3 棉田像素判別和面積估算
主成分分析(PCA)方法是在各個(gè)變量之間相關(guān)關(guān)系研究的基礎(chǔ)上,用一組較少的、互不相關(guān)的新變量代替原來較多的變量,并使這些新變量盡可能多地保留原來復(fù)雜變量所反映信息的一種數(shù)據(jù)分析方法,具有較好的降維去噪能力[30]。
本文先采用PCA 算法對分別對植被指數(shù)和紋理18 個(gè)特征進(jìn)行主成分分析,輸出主成分個(gè)數(shù)為18 個(gè),分別采用2 至18 個(gè)主成分為特征進(jìn)行最大似然分類[31]法判別棉田像素;再采用PCA 算法對全部色彩與紋理特征共36 個(gè)特征進(jìn)行主成分分析,輸出特征數(shù)為36 個(gè),分別采用2 至36 個(gè)主成分為特征進(jìn)行最大似然分類法[31]判別棉田像素。
統(tǒng)計(jì)分類結(jié)果中脫葉棉田和未脫葉棉田的像素?cái)?shù)量,兩類棉田總面積為棉田總面積,如式1 所示,依據(jù)空間分辨率計(jì)算棉田面積。
以人工目視提取結(jié)果為基準(zhǔn)計(jì)算誤差,誤差計(jì)算方法如式(2)。
式中:S為棉田面積(m2),n為像素點(diǎn)個(gè)數(shù),γS為空間分辨率(m2/pixel);
式(2)中:E為誤差,S1為人工目視識別棉田的面積(m2),S2為分類算法計(jì)算的棉田面積(m2)。
判別中分別基于植被指數(shù)特征、紋理特征和綜合特征對脫葉棉田、未脫葉棉田、冬小麥田、裸地圖像PCA 處理,再采用最大似然分類法判別棉田,分別對脫葉棉田面積、未脫葉棉田面積和棉田總面積與人工目視標(biāo)記結(jié)果進(jìn)行對比計(jì)算誤差。
棉田面積計(jì)算誤差如圖3所示,判別結(jié)果如圖4所示。
圖3 棉田面積誤差Fig.3 Error of cotton field area
圖4 判別結(jié)果圖Fig.4 Classification results
由圖3a 可知:基于植被指數(shù)的分類方法主成分個(gè)數(shù)為6 個(gè)時(shí),總面積誤差相對較小。該條件下計(jì)算的棉田總面積誤差為13.11%,脫葉棉田面積誤差為12.38%,未脫葉棉田面積誤差為13.90%。判別結(jié)果如圖4a 所示。
由圖3b 可知:基于紋理特征的分類方法當(dāng)主成分個(gè)數(shù)為5 個(gè)時(shí)總面積誤差最小,但脫葉棉田和未脫葉棉田的誤差均較大。由圖4b 可見:部分脫葉棉田與未脫葉棉田相互錯(cuò)分,導(dǎo)致了總體誤差小于兩類棉田各自的分類誤差。通過觀察圖3b 可以發(fā)現(xiàn)當(dāng)主成分個(gè)數(shù)在2-7 個(gè)時(shí),全部棉田的誤差與兩類棉田誤差呈現(xiàn)不規(guī)則分布。隨著主成分個(gè)數(shù)的增加,模型分類準(zhǔn)確率逐漸提高。當(dāng)主成分個(gè)數(shù)在8-18 個(gè)分時(shí),全部棉田誤差穩(wěn)定的分布在兩種棉田誤差之間,同時(shí)總體誤差趨于穩(wěn)定。這表明兩種棉田相互出錯(cuò)誤判別的情況減少,分類誤差逐步趨于穩(wěn)定。在紋理分類方法主成分個(gè)數(shù)為8-18 范圍內(nèi),主成分個(gè)數(shù)為10 個(gè)時(shí)誤差最小,面積誤差為1.99%;脫葉棉田面積誤差為0.97%,未脫葉棉田面積誤差為5.17%。判別結(jié)果如圖4c 所示。
由圖3c 可知:兩類特征綜合分類方法主成分個(gè)數(shù)為30 個(gè)時(shí)總面積誤差最小,總面積誤差為0.51%;脫葉棉田面積誤差為0.32%,未脫葉棉田面積誤差為0.72%。判別結(jié)果如圖4d 所示。
(1)基于植被指數(shù)的分類方法在棉田面積判別中的誤差為13.11%。由圖3a 可知該方法在多數(shù)主成分個(gè)數(shù)條件下(前5 個(gè)主成分條件下除外)脫葉棉田的誤差較大,而未脫葉棉田的誤差相對較小。脫葉棉田誤差主要是由于脫葉棉田與裸地在植被指數(shù)上差別不夠顯著,因此該方法判別脫葉棉田的精度較差。
同時(shí),脫葉棉田誤差和未脫葉棉田誤差始終分布在總體誤差兩側(cè),說明在植被指數(shù)空間內(nèi)脫葉棉田與未脫葉棉田混淆的現(xiàn)象不明顯,脫葉棉田與未脫葉棉田在植被指數(shù)上的差別較為明顯。
該方法主成分個(gè)數(shù)大于6 時(shí),誤差隨著主成分個(gè)數(shù)的增加而增大,表明該方法所選特征中有部分特征噪聲,干擾棉田面積判別。
(2)基于紋理特征的分類方法在棉田分類中的誤差為1.99%,該方法在主成分大于8 個(gè)時(shí),對脫葉棉田和未脫葉棉田的判別誤差均明顯小于基于植被指數(shù)特征的判別方法。該方法在主成分小于8 個(gè)時(shí),出現(xiàn)脫葉棉田誤差與未脫葉棉田誤差均大于總體誤差的現(xiàn)象。
通過觀察圖4b 可以發(fā)現(xiàn)部分脫葉棉田與未脫葉棉田錯(cuò)分現(xiàn)象,說明脫葉棉田與未脫葉棉田在紋理上的區(qū)別不夠顯著。同時(shí)該方法結(jié)果中脫葉棉田分類誤差小于總體誤差和脫葉棉田誤差,說明脫葉棉田在紋理特征上與其他地物區(qū)別較為明顯,該方法對脫葉棉田的判別精度高于未脫葉棉田。
(3)基于綜合特征分類方法中的誤差為0.51%,較其他兩類方法有較為明顯的降低。該方法在主成分個(gè)數(shù)大于15 個(gè)時(shí)趨于穩(wěn)定,而且脫葉棉田與未脫葉棉田的誤差分布于總體誤差兩側(cè),脫葉棉田與未脫葉棉田相互混淆的現(xiàn)象不明顯。
表2 不同判別方法結(jié)果與誤差Tab.2 Results and errors of cotton field area extraction
本文借助無人機(jī)低空成像技術(shù)的優(yōu)勢,利用可見光相機(jī)采集棉田及周邊圖像,通過對比分析植被指數(shù)特征和紋理特征在區(qū)分脫葉棉田、未脫葉棉田、冬小麥田、裸地的效果,結(jié)果發(fā)現(xiàn):
(1)植被指數(shù)特征在區(qū)分未脫葉棉田上具有一定優(yōu)勢,紋理特征在區(qū)分裸地和脫葉棉田上具有顯著優(yōu)勢。
(2)綜合兩類特征的優(yōu)勢,采用PCA 算法結(jié)合兩類特征,借助最大似然分類法判別棉田像素,最終得到棉田面積估測誤差為0.51%,其中脫葉棉田誤差為0.72%,未脫葉棉田誤差為0.32%,表明該方法可以比較有效的計(jì)算棉田面積,可為收獲期棉田面積測量和空間分布分析提供參考。