萬(wàn)青松,羅曉姣
(1.成都文理學(xué)院,成都 610499;2.四川錦興國(guó)試書(shū)業(yè)有限公司,成都 610041)
確定農(nóng)作物的種植面積和分布狀況能夠幫助人們更加準(zhǔn)確地估算農(nóng)作物的產(chǎn)量,通過(guò)加強(qiáng)管理,確保農(nóng)作物的空間布局為最優(yōu)布局,從宏觀管理的角度來(lái)看,對(duì)于保障糧食安全有重要意義[1,2]。針對(duì)冬小麥產(chǎn)量進(jìn)行評(píng)估,目前研究的主要方法包括數(shù)據(jù)預(yù)測(cè)統(tǒng)計(jì)、氣象數(shù)據(jù)分析以及評(píng)估預(yù)報(bào),這些方法雖然屬于經(jīng)典方法,但是相對(duì)較為傳統(tǒng),誤差較大,隨著信息技術(shù)的發(fā)展,新型技術(shù)被不斷應(yīng)用于種植區(qū)域尺度管理分區(qū)[3,4]。
種植區(qū)域尺度指標(biāo)作為一種經(jīng)濟(jì)有效的參考量,能夠很好地幫助學(xué)者們分析和預(yù)測(cè)小麥產(chǎn)量和增長(zhǎng)趨勢(shì)。通過(guò)過(guò)濾指標(biāo)確定冬小麥的種植區(qū)域,對(duì)小麥信息數(shù)據(jù)進(jìn)行預(yù)處理,篩除無(wú)用指標(biāo),能夠降低管理過(guò)程的負(fù)面影響[5,6]。目前對(duì)于指標(biāo)選擇的研究越來(lái)越多,且向著綜合性的方向發(fā)展。冬小麥種植區(qū)域指標(biāo)選擇可以分為有監(jiān)督模式和無(wú)監(jiān)督模式兩種。有監(jiān)督模式的選擇方法相對(duì)成熟,而無(wú)監(jiān)督模式的研究較少,主要原因在于無(wú)監(jiān)督模式缺少信息指導(dǎo),難以得到不同空間的搜索簇群,聚類分類法難以應(yīng)用。但是無(wú)監(jiān)督模式能夠選取具有代表性的特征數(shù)據(jù)集合成特征子集,在高維度數(shù)據(jù)中,無(wú)監(jiān)督模式能夠選擇樣本數(shù)據(jù)特征相近的數(shù)值形成數(shù)據(jù)標(biāo)簽,通過(guò)數(shù)據(jù)計(jì)算,完成指標(biāo)選擇[7-12]。
本研究為一種基于無(wú)監(jiān)督過(guò)濾式指標(biāo)選擇的冬小麥種植區(qū)域尺度管理分區(qū)算法,結(jié)合聚類算法,分析不同區(qū)域冬小麥種植結(jié)果的特征,確定信息重要程度,根據(jù)重要程度選擇特征子集。
研究區(qū)域位于重慶市境內(nèi),該地區(qū)屬于溫帶大陸性季風(fēng)氣候區(qū),植物所處區(qū)域接收的養(yǎng)分和陽(yáng)光都十分充足。該地區(qū)的氣候條件較好,四季分明,每年的降水量可達(dá)800 mm,氣溫在14 ℃左右波動(dòng),十分適合種植小麥、水稻和棉花等農(nóng)作物。
對(duì)研究區(qū)域冬小麥的生長(zhǎng)特征進(jìn)行觀察可以發(fā)現(xiàn),10 月上旬和中旬為冬小麥播種時(shí)期,10 月下旬冬小麥開(kāi)始出苗;11 月上旬和中旬,冬小麥長(zhǎng)出幼苗;11 月下旬至12 月上旬,冬小麥處于分蘗階段;12月中旬至翌年2 月上旬,冬小麥處于越冬階段;2 月中旬至3 月上旬,冬小麥處于返青階段;3 月中旬至4月上旬,冬小麥處于拔節(jié)階段;4 月中旬和下旬冬小麥處于抽穗階段;5 月冬小麥處于灌漿階段;6 月冬小麥逐漸成熟。
在確定冬小麥的生長(zhǎng)特征后,分析光譜特征,得到遙感圖像,除了提取小麥狀態(tài)數(shù)據(jù)之外,還分析了所處的綠色植被狀態(tài),野外樣方數(shù)據(jù)。提取發(fā)現(xiàn),冬小麥正處于分蘗狀態(tài),而位于冬小麥周邊的所有綠色植被都為枯萎狀態(tài)。
為更好地實(shí)現(xiàn)冬小麥種植區(qū)域尺度管理分區(qū),設(shè)置技術(shù)路線如圖1 所示。由圖1 可知,首先利用遙感圖像提取冬小麥特征指標(biāo),根據(jù)指標(biāo)特征建立樣本庫(kù),分析尺度變化,通過(guò)數(shù)據(jù)分析完成區(qū)域管理,確定內(nèi)部的樣方數(shù)據(jù),運(yùn)用計(jì)算機(jī)技術(shù)對(duì)數(shù)據(jù)進(jìn)行調(diào)節(jié),同時(shí)結(jié)合人工聚類法、識(shí)別法確定該區(qū)域種植的冬小麥面積和冬小麥在該區(qū)域的分布情況。通過(guò)GPS 調(diào)取野外數(shù)據(jù),利用計(jì)算機(jī)對(duì)提取的數(shù)據(jù)進(jìn)行多方位處理,將樣本數(shù)據(jù)轉(zhuǎn)換成翻譯數(shù)據(jù),并進(jìn)行修正,設(shè)置500 個(gè)以上的檢測(cè)點(diǎn),對(duì)提取的冬小麥圖像進(jìn)行修正,根據(jù)不同空間幅度范圍內(nèi)得到的數(shù)據(jù)尺度變化,分析樣本狀況[13-15]。
圖1 技術(shù)路線
同時(shí),計(jì)算區(qū)域精度、平均區(qū)域精度、區(qū)域精度標(biāo)準(zhǔn)差、均方根誤差和偏差,根據(jù)計(jì)算結(jié)果完成區(qū)域尺度管理。區(qū)域精度計(jì)算公式如下。
式中,A0為采集的冬小麥種植區(qū)域總量,被設(shè)定為基準(zhǔn)值;i為提取圖像分辨率;S為所選定的冬小麥種植區(qū)域;Ai為提取的小麥面積總量;K(s,i)為得到的區(qū)域精度。
平均區(qū)域精度計(jì)算公式如下。
式中,(s,i)為得到的平均區(qū)域精度;n為小麥被分的區(qū)域數(shù)目。
區(qū)域精度標(biāo)準(zhǔn)差與區(qū)域精度平均值成正相關(guān),能夠很好地反映不同區(qū)間內(nèi)部區(qū)域精度的波動(dòng)狀況,分析冬小麥所處精度的離散情況,計(jì)算公式如式(3)所示。
式中,s為所選定的冬小麥種植區(qū)域
均方根誤差計(jì)算公式如式(4)所示。
式中,RMSE(s,i)為得到的均方根誤差;g(s,i)為區(qū)域精度觀測(cè)值;bias(s,i)為區(qū)域精度的真值偏差。真值偏差計(jì)算如式(5)所示。
在得到上述5 項(xiàng)結(jié)果后,確定過(guò)濾式指標(biāo),并將指標(biāo)對(duì)象讀入集合內(nèi)部,根據(jù)指標(biāo)對(duì)象構(gòu)造一個(gè)新的簇,如果得到的數(shù)據(jù)庫(kù)數(shù)值為末尾值,則直接結(jié)束,否則進(jìn)行再次讀取,確定新的數(shù)據(jù)對(duì)象;計(jì)算不同數(shù)據(jù)簇之間的距離,確定最小距離,分析數(shù)據(jù)半徑閾值,計(jì)算指標(biāo)特征統(tǒng)計(jì)頻度,判斷是否為數(shù)據(jù)庫(kù)末尾值,如果為末尾值,則代表聚類結(jié)束。
本研究的無(wú)監(jiān)督過(guò)濾式指標(biāo)選擇法能夠根據(jù)不同指標(biāo)的特征值確定重要程度,得到特征選取子集。由于數(shù)據(jù)的局部特性十分明顯,因此可以根據(jù)數(shù)據(jù)特征聚類,確保數(shù)據(jù)簇的相似性,分析數(shù)據(jù)之間的局部特征,計(jì)算特征指標(biāo)。對(duì)特征指標(biāo)進(jìn)行離散化處理,尋求指標(biāo)內(nèi)部的連續(xù)特征值,選取聚類閾值,確定內(nèi)部特征值,尋找指標(biāo)變化數(shù)值,根據(jù)變化數(shù)值劃分為過(guò)濾式指標(biāo)選擇子集,實(shí)現(xiàn)數(shù)據(jù)操作。
通過(guò)數(shù)據(jù)分析得到不同無(wú)監(jiān)督過(guò)濾指標(biāo)下的冬小麥平均區(qū)域精度、區(qū)域精度標(biāo)準(zhǔn)差、均方根誤差和偏差,如圖2 所示。
由圖2 可知,隨著過(guò)濾式指標(biāo)降低,冬小麥平均區(qū)域精度值也逐漸降低。當(dāng)無(wú)監(jiān)督過(guò)濾指標(biāo)最高時(shí),冬小麥平均區(qū)域精度值最高可達(dá)90%。而當(dāng)無(wú)監(jiān)督過(guò)濾指標(biāo)一定時(shí),空間范圍會(huì)直接影響平均區(qū)域精度,空間范圍越大,平均區(qū)域精度值越高。
圖2 無(wú)監(jiān)督過(guò)濾式指標(biāo)對(duì)冬小麥管理分區(qū)精度的影響
相比平均區(qū)域精度,區(qū)域精度標(biāo)準(zhǔn)差、均方根誤差和偏差3 個(gè)指標(biāo)隨著過(guò)濾式指標(biāo)增高也不斷遞增;均方根誤差和偏差2 個(gè)指標(biāo)隨著空間范圍增大整體呈下降趨勢(shì)。
由上述分析結(jié)果可知,冬小麥種植區(qū)域尺度管理分區(qū)精度同時(shí)受到無(wú)監(jiān)督過(guò)濾式指標(biāo)和空間范圍2 個(gè)因素的影響,無(wú)監(jiān)督過(guò)濾式指標(biāo)的影響大于空間范圍的影響。
在一定空間范圍內(nèi),若農(nóng)作物種類不同,農(nóng)作物生長(zhǎng)狀況也會(huì)存在一定的差別,對(duì)冬小麥尺度管理分區(qū)精度也會(huì)造成影響。確定一定空間范圍內(nèi)的樣本數(shù)據(jù),得到不同農(nóng)作物的占比情況,根據(jù)占比情況進(jìn)行數(shù)據(jù)統(tǒng)計(jì),從而得到各不同參數(shù)的狀態(tài)如圖3所示。
由圖3 可知,當(dāng)農(nóng)作物種類一定時(shí),選擇過(guò)濾式指標(biāo)數(shù)值越高,得到的平均區(qū)域精度就越高;隨著作物種類的增加,平均區(qū)域精度值也會(huì)改變,整體呈增加的態(tài)勢(shì);當(dāng)農(nóng)作物種類為4~6 種時(shí),平均區(qū)域精度值處于較穩(wěn)定狀態(tài)。
圖3 農(nóng)作物種類對(duì)尺度管理分區(qū)精度的影響
對(duì)統(tǒng)計(jì)結(jié)果進(jìn)一步研究發(fā)現(xiàn),當(dāng)無(wú)監(jiān)督過(guò)濾式指標(biāo)為50時(shí),產(chǎn)生的偏差值相對(duì)較大,偏差最大值接近-10。誤差的不斷積累會(huì)直接導(dǎo)致精度的降低,因此將無(wú)監(jiān)督過(guò)濾式指標(biāo)為50 設(shè)定為尺度響應(yīng)敏感點(diǎn)。
在確定數(shù)據(jù)源后,對(duì)冬小麥的種植面積進(jìn)行測(cè)量,確定特征數(shù)據(jù)種類,分析數(shù)據(jù)狀態(tài),同時(shí)分析尺度分區(qū)精度、尺度空間范圍、分區(qū)成本和數(shù)據(jù)獲取可靠性四方面因素,得到在不同無(wú)監(jiān)督過(guò)濾式指標(biāo)下冬小麥平均區(qū)域精度,如圖4 所示。
由圖4 可知,冬小麥種植密度會(huì)對(duì)平均區(qū)域精度造成一定的影響。當(dāng)種植密度低于45%時(shí),平均區(qū)域精度較低;當(dāng)種植密度處于45%~70%時(shí),說(shuō)明冬小麥生長(zhǎng)狀況達(dá)到最佳,此時(shí)的平均區(qū)域精度為96%,分區(qū)精度趨于平穩(wěn);當(dāng)種植密度大于70%時(shí),冬小麥植株過(guò)密,不利于陽(yáng)光、養(yǎng)分等吸收利用,此時(shí)平均區(qū)域精度也較低。
圖4 種植密度對(duì)冬小麥平均區(qū)域精度的結(jié)果
本研究通過(guò)聚類分析算法和空間統(tǒng)計(jì)算法確定了無(wú)監(jiān)督過(guò)濾式指標(biāo)的選擇對(duì)冬小麥種植區(qū)域尺度管理分區(qū)精度的影響。結(jié)果表明,無(wú)監(jiān)督過(guò)濾式指標(biāo)、種植空間范圍、農(nóng)作物種類和冬小麥種植密度都會(huì)對(duì)冬小麥種植區(qū)域尺度管理分區(qū)精度造成影響。
1)隨著無(wú)監(jiān)督過(guò)濾式指標(biāo)的降低,內(nèi)部特征數(shù)目在不斷增加,對(duì)冬小麥種植區(qū)域分區(qū)時(shí)所造成的面積誤差較大,從而導(dǎo)致冬小麥種植區(qū)域尺度管理分區(qū)精度降低。
2)當(dāng)無(wú)監(jiān)督過(guò)濾指標(biāo)一定時(shí),空間范圍會(huì)直接影響平均區(qū)域精度,空間范圍越大,平均區(qū)域精度值越高。主要因?yàn)楫?dāng)人為監(jiān)測(cè)區(qū)域空間范圍增大時(shí),所造成的正負(fù)誤差也在相互抵消,測(cè)量區(qū)域精度隨之升高。
3)在空間范圍一定的情況下,農(nóng)作物種類會(huì)對(duì)冬小麥尺度管理分區(qū)精度造成影響。隨著作物種類的增加,平均區(qū)域精度值也會(huì)改變,整體呈增加的態(tài)勢(shì);當(dāng)農(nóng)作物種類為4~6時(shí),平均區(qū)域精度值處于較穩(wěn)定狀態(tài)。
4)在空間范圍和農(nóng)作物種類一定的情況下,冬小麥種植密度也會(huì)對(duì)平均區(qū)域精度造成一定的影響。當(dāng)種植密度低于45%或大于70%時(shí),冬小麥的狀態(tài)過(guò)于稀疏或過(guò)于密集,此時(shí)平均區(qū)域精度較低;當(dāng)種植密度處于45%~70%時(shí),此時(shí)的平均區(qū)域精度基本穩(wěn)定在96%。
1)本研究基于無(wú)監(jiān)督過(guò)濾式指標(biāo)選擇研究了一種新的冬小麥種植區(qū)域尺度管理分區(qū)算法,確定不同無(wú)監(jiān)督過(guò)濾式指標(biāo)所造成的影響,避免由于單個(gè)因素進(jìn)行尺度管理分區(qū)所造成的影響,從而提高分區(qū)精度。與傳統(tǒng)的分區(qū)管理方法相比,加入無(wú)監(jiān)督過(guò)濾式指標(biāo)后,冬小麥種植區(qū)域分區(qū)精度更高,更有利于及時(shí)了解冬小麥的生長(zhǎng)狀況并進(jìn)行人工調(diào)節(jié)生產(chǎn)。因此在研究過(guò)程中,可以通過(guò)測(cè)量無(wú)監(jiān)督過(guò)濾式指標(biāo),從而達(dá)到更好的冬小麥種植區(qū)域尺度管理分區(qū)效果。
2)本研究?jī)H選用了冬小麥作為研究目標(biāo),對(duì)于其他作物的研究較少,未來(lái)需要分析不同目標(biāo)作物所造成的尺度管理分區(qū)影響,從而取得更加全面和細(xì)致的尺度管理分區(qū)效果,為調(diào)控農(nóng)作物生長(zhǎng)及時(shí)提供數(shù)據(jù)參考。