仲格吉,周清波,王 迪
(中國農(nóng)業(yè)科學院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所/農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)遙感重點實驗室,北京 100081)
農(nóng)作物面積是各級管理部門進行農(nóng)業(yè)生產(chǎn)指導、國家制定糧食政策的重要依據(jù)[1],及時準確地了解農(nóng)作物種植面積,對于準確估計和預測農(nóng)作物產(chǎn)量,加強農(nóng)作物生產(chǎn)管理[2-5],確保我國糧食安全具有重要意義[6,7]。抽樣技術因具有低成本、高質(zhì)量、高效率的優(yōu)越性而被廣泛應用于社會、經(jīng)濟、科技、自然等調(diào)查領域。隨著“3S”技術的發(fā)展,結(jié)合了遙感與傳統(tǒng)抽樣方法優(yōu)勢的空間抽樣技術逐漸被應用到大區(qū)域農(nóng)作物面積監(jiān)測當中[8-12]。如美國的大面積農(nóng)作物估產(chǎn)計劃(Large Area Crop Inventory Experiment,LACIE)和歐盟的農(nóng)業(yè)遙感監(jiān)測計劃(Monitoring Agriculture with Remote Sensing,MARS),利用“3S”技術與分層抽樣相結(jié)合的空間抽樣調(diào)查方法有效提高了大區(qū)域農(nóng)作物面積信息的獲取精度和時效性[13-15]。
近年來,國內(nèi)外學者利用空間抽樣方法在農(nóng)作物面積估計領域相繼開展了研究[16-21],選用的抽樣方法包括整群抽樣、分層抽樣和多階段抽樣,涉及到的農(nóng)作物類型有小麥、玉米、水稻及棉花等。但已有的這些研究所使用的傳統(tǒng)抽樣方法均建立在抽樣單元相互獨立的基礎上[22-24],較少針對樣本點的空間分布特征開展特定的抽樣調(diào)查,農(nóng)作物由于受自然條件(氣候、土壤類型、地形地貌等)和社會經(jīng)濟因素等影響,在一定尺度上存在不同程度的空間變異,這種空間變異性會導致樣本容量和抽樣方差的過高估計[25,26],從而限制空間抽樣方案的優(yōu)化設計。變異函數(shù)作為一種解釋空間數(shù)據(jù)的方法,除了考慮樣本單元的數(shù)字特征之外,更注重于研究區(qū)域化變量的空間分布特征,能夠同時描述區(qū)域化變量的結(jié)構性變異和隨機性變異[27-29],是空間變異分析的有效工具[30]。利用變異函數(shù)計算區(qū)域農(nóng)作物種植面積的空間變異性,將對空間變異性的考量納入空間抽樣單元尺度的優(yōu)選和抽樣效率的評估當中,可進一步改善農(nóng)作物空間抽樣調(diào)查方法在不同地區(qū)的適用性,從而提高空間抽樣效率[47,49]。
德惠市位于吉林省中北部,松遼平原中部,地處125°14′E~126.28′E,44°32′N-45°51′N區(qū)間,全市總面積3 435km2,糧食播種面積20.762 0萬hm2。氣候?qū)儆谥袦貛Т箨懠撅L氣候,年平均氣溫4.4℃,年均日照時數(shù)為2 695.2h,年降水量為520mm。受夏季風影響,全年降水量集中在夏季,雨熱同季有效降水多,能夠滿足一年一熟農(nóng)作物生產(chǎn)的需要,主要農(nóng)作物為玉米、水稻,玉米播種面積15.746 1萬hm2,水稻播種面積4.597 4萬hm2。
基礎數(shù)據(jù)主要包括:(1)德惠市基礎地理信息數(shù)據(jù)。2005年后德惠市行政邊界數(shù)據(jù)(比例尺1 ∶10 000,縣界,矢量格式);(2)農(nóng)作物空間分布數(shù)據(jù)。2007年德惠市玉米、水稻空間分布數(shù)據(jù)(源自SPOT5影像提取,獲取日期:2007年8月1日,空間分辨率10m),圖1表明了2007年德惠市玉米和水稻空間分布情況。
圖1 2007年德惠市玉米和水稻空間分布
1.3.1 異常值處理
1.3.2 正態(tài)分布檢驗
地統(tǒng)計學通常要求原始數(shù)據(jù)呈正態(tài)分布,否則會產(chǎn)生比例效應[46]。比例效應的存在會使實驗變異函數(shù)值產(chǎn)生畸變,致使基臺值和塊金值增大,降低估計精度,導致某些結(jié)構特征不明顯。因此在對數(shù)據(jù)進行地統(tǒng)計分析時,首先應對其正態(tài)分布性進行檢驗。
該文利用SPSS20和Matlab2016軟件計算區(qū)域化變量的偏度系數(shù)(skewness)、峰度系數(shù)(kurtosis)等參數(shù),并以此檢驗數(shù)據(jù)是否服從正態(tài)分布(該文以skewness=0作為正態(tài)分布基準)。
地統(tǒng)計學方法是基于區(qū)域化變量理論基礎的一種空間分析方法,主要以變異函數(shù)作為工具來表達區(qū)域化變量隨著空間位置和方向不同所產(chǎn)生的差異。關于其基本原理和方法,很多文獻已經(jīng)有很好的解析和綜述[46-49],該文作以簡要說明。當區(qū)域化變量滿足二階平穩(wěn)假設和本征假設時,變異函數(shù)可表示為:
(1)
式(1)中,γ(h)半方差函數(shù);h為分隔兩樣點的矢量,稱為步長;N(h)為相距為h的樣點對數(shù)目;Z(xi)和Z(xi+h)分別為區(qū)域化變量Z(x)在位置xi和xi+h處的實測值。
該文中關于實驗變異函數(shù)的計算、理論模型的擬合及變異函數(shù)圖的繪制分別由軟件GS+9.0和Excle2010共同完成。
(1)抽樣比設計。參考以往相關研究中對抽樣比的設定結(jié)果,為了便于對比不同抽樣方法的抽樣外推精度和穩(wěn)定性,該研究設計了4種抽樣比(f=1%,5%,10%,20%)來確定不同空間抽樣下的樣本容量(n)。
(2)抽樣方案。該文選用了3種常用的抽樣方法:簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣來進行對比分析。以下3種抽樣方法的實現(xiàn)均通過Matlab2016軟件編程完成。
簡單隨機抽樣是指從一個單元數(shù)為N的總體中無放回地逐個抽取單元,每次都在所有尚未進入樣本的單元中等概率的抽取,直到n各單元被抽中。該文利用ArcGIS10.2軟件對各抽樣尺度下的全部總體單元按照由1~N順序進行數(shù)字編碼(不包括農(nóng)作物面積為0的抽樣單元),當總體單元的數(shù)字編碼與軟件生成的偽隨機數(shù)相同時,該單元即被抽中,同時該樣本單元的位置也被確定。
系統(tǒng)等距抽樣是指對研究總體按一定的順序排列,每隔一定的間隔抽取一個單元的抽樣方法。①樣本單元布設過程同簡單隨機抽樣;②抽樣間隔k確定。通過總體容量N除以樣本容量n并取整得到k值。將總體分為n段,則每段包含k個基礎單元;③從第一段的k個總體單元中隨機抽出一個單元作為起點;④對于其中的n-1段,每隔k個單元抽出一個樣本單元,以此類推,直至抽出n個樣本單元。特別地,當N不是n的整數(shù)倍時,總是會出現(xiàn)樣本容量不固定或者一些抽樣單元被排除在間隔K外永遠不會被抽中的情況,為避免這一問題,選擇使用圓圈系統(tǒng)抽樣方法對總體單元進行編號[50]。
分層隨機抽樣先按照某種規(guī)則把總體劃分為不同的層,然后在層內(nèi)再進行隨機抽樣,各層的抽樣之間是獨立進行的。①樣本單元布設同簡單隨機抽樣;②分層標志的設計。為提高分層抽樣效率,分別提取抽樣單元內(nèi)玉米和水稻的種植面積比作為分層標志;③層數(shù)設計。在兼顧層內(nèi)方差盡量小原則和抽樣調(diào)查成本的前提下,該研究選擇分層數(shù)為5層;④樣本容量分配。在已知抽樣比的條件下,采用比例分配法在各層內(nèi)進行再分配。⑤樣本抽選。各層內(nèi)采用簡單隨機方式抽選樣本單元。
根據(jù)德惠市玉米和水稻的空間分布數(shù)據(jù),利用ArcGIS10.2軟件,建立500m×500m、1 000m×1 000m、1 500m×1 500m、2 000m×2 000m、…、5 000m×5 000m共10種尺度的正方形網(wǎng)格,分別疊加玉米和水稻空間分布數(shù)據(jù)作為抽樣框,利用dissolve工具計算出每一抽樣單元內(nèi)的玉米和水稻種植面積。以每一抽樣單元中心點作為采樣點、抽樣單元內(nèi)農(nóng)作物種植面積比作為區(qū)域化變量來描述研究區(qū)內(nèi)農(nóng)作物的空間變異特征,以抽樣單元內(nèi)農(nóng)作物種植面積比作為基礎單元觀測值進行抽樣總體外推與誤差估計。
圖2 抽樣單元內(nèi)玉米種植面積比例的直方圖
在進行正態(tài)分布檢驗之前,為了更直觀地了解數(shù)據(jù)的分布情況,該文以玉米為例在圖2中展示了抽樣單元內(nèi)玉米種植面積比在10種抽樣單元尺度下的直方圖變化情況??梢钥闯觯鞒闃訂卧叨认碌闹狈綀D均呈現(xiàn)出傾斜的分布態(tài)勢,數(shù)據(jù)不服從正態(tài)分布。進一步采用偏度系數(shù)法確定數(shù)據(jù)的不對稱程度及方向,從表1和表3可以看出,不同尺度(scale)下的玉米種植面積比具有較強的左偏效應(skewness<0)水稻種植面積比表現(xiàn)出較強的右偏效應(skewness>0)這種偏態(tài)分布將導致地統(tǒng)計分析過程中計算結(jié)果的偏差。因此,在變異函數(shù)分析之前必須對其進行正態(tài)轉(zhuǎn)換。通過表2和表4,發(fā)現(xiàn)經(jīng)過反正弦轉(zhuǎn)換和平方根轉(zhuǎn)換過后的玉米和水稻種植面積比的偏度系數(shù)明顯降低,基本符合正態(tài)分布。
變異系數(shù)反映的是變量的相對變異程度,當/CV/<10%時為弱變異性,/CV/>100%為強變異性,10%
對于農(nóng)作物種植面積比例(玉米和水稻)的常規(guī)統(tǒng)計分析只在一定程度上反映樣本全體,而不能定量地刻畫農(nóng)作物種植面積比例的隨機性和結(jié)構性[51],因此該研究采用地統(tǒng)計學方法進一步對玉米和水稻種植面積比例空間變異性進行分析。
表1 玉米種植面積比常規(guī)統(tǒng)計特征值
表2 玉米種植面積比正態(tài)轉(zhuǎn)換后的統(tǒng)計特征值
表3 水稻種植面積比常規(guī)統(tǒng)計特征值
表4 水稻種植面積比正態(tài)轉(zhuǎn)換后的統(tǒng)計特征值
基于不同抽樣單元尺度內(nèi)玉米和水稻種植面積比剔除異常值并作正態(tài)轉(zhuǎn)換后的數(shù)據(jù),分別建立理論變異函數(shù)模型、計算實際變異函數(shù)值γ(h)并繪制變異函數(shù)曲線圖,由于不同的變異函數(shù)模型對于真實空間變異結(jié)構的擬合精度存在差異,該文根據(jù)殘差平方和(RSS)盡可能接近于0;決定系數(shù)(R2)盡可能接近于1的標準來選擇具有最佳擬合效果的農(nóng)作物種植面積空間變異結(jié)構的變異函數(shù)模型。為了從整體上了解研究區(qū)內(nèi)農(nóng)作物種植面積的空間變異特征,該研究利用玉米和水稻種植面積比的各向同性變異函數(shù)進行分析研究。利用GS+9.0對玉米和水稻種植面積比進行空間變異模型的擬合,得到不同抽樣單元尺度下的變異函數(shù)、最優(yōu)擬合的理論模型及其參數(shù)。
圖3和圖4分別為玉米和水稻種植面積比在各向同性條件下實際變異函數(shù)曲線圖,表5和表6為變異函數(shù)的理論模型及空間變異性的參數(shù)。各向同性變異函數(shù)圖展示了很好的空間結(jié)構,不同抽樣單元尺度下變異函數(shù)模型擬合度基本都在0.85以上,屬于理想的模型擬合度,說明選取的變異函數(shù)模型能夠很好地體現(xiàn)其空間變異性。整體而言,玉米和水稻的空間變異性表現(xiàn)出一定的相似性,空間變異函數(shù)值在抽樣單元尺度上表現(xiàn)出一定的下降趨勢;在變程范圍內(nèi)的空間變異性變化較強,空間變異與距離(Separation distance)呈正相關,當距離增加超過變程時,農(nóng)作物面積比在空間上的差異不明顯,此時空間自相關性可以忽略。
圖3 不同抽樣單元尺度下玉米種植面積比的變異函數(shù)曲線注:Semivariance表示變異函數(shù)值,Separation Distance表示變程,下同
圖4 不同抽樣單元尺度下水稻種植面積比的變異函數(shù)曲線
基臺值C0+C表示區(qū)域化變量的最大變異[49,54],C0+C越大表明總的空間變異程度越高;塊金值C0表示樣點間距為零時的變異函數(shù)值,代表隨機變異的量,表現(xiàn)為在最小距離內(nèi)由實驗誤差和灌溉、耕作措施等隨機因素引起的變異;塊金值與基臺值之比C0/C0+C即塊金系數(shù),該比值表示由隨機因素引起的變異占系統(tǒng)內(nèi)總變異的百分比,當塊金系數(shù)小于25%說明變量有強烈的空間相關性,且空間變異以結(jié)構性變異為主;25%~75%時變量有中等空間相關性;大于75%時變量空間相關性弱,空間變異主要由隨機因素引起[31,46]。
就研究區(qū)整體而言,抽樣單元尺度的變化導致農(nóng)作物面積空間結(jié)構發(fā)生變化,直接影響著對其空間變異性的分析。通常小尺度上能夠探測到更多的細節(jié)特征,而大尺度容易掩蓋小尺度上的空間變化,即空間變異性會隨著抽樣單元尺度的增加而降低,但它們之間的相互影響關系難以界定[55,56],因此適宜尺度的選取可以幫助探索作物面積的空間變化規(guī)律。
表5 不同尺度下抽樣單元內(nèi)玉米種植面積比例的變異函數(shù)模型及其參數(shù)
表6 不同尺度下抽樣單元內(nèi)水稻種植面積比例的變異函數(shù)模型及其參數(shù)
由表5和表6可以看出,不同網(wǎng)格尺度下玉米和水稻種植面積比在研究區(qū)范圍內(nèi)的總變異強度(基臺值C0+C)隨著網(wǎng)格尺度的增加呈現(xiàn)逐漸減小的趨勢,說明抽樣單元尺度與研究區(qū)內(nèi)作物的空間總變異程度為負相關關系。由表5中玉米的空間變異特征參數(shù)得出:基臺值在500m、1 000~2 500m、3 000~5 000m幅度范圍內(nèi)的基臺值表現(xiàn)出階段遞減趨勢,每一階段內(nèi)變化相對平穩(wěn),即玉米面積主要表現(xiàn)出3種空間變異性程度,其中500m尺度下的基臺值最大(0.196 0),1 000~2 500m尺度范圍內(nèi)基臺值集中在0.17左右,3 000~5 000m范圍內(nèi)基臺值集中在0.15左右;由表6中水稻的空間變異特征參數(shù)得出:基臺值在500~2 000m、2 500~5 000m幅度范圍內(nèi)的基臺值表現(xiàn)出階段遞減趨勢,500~2 000m尺度范圍內(nèi)基臺值集中在0.11左右,2 500~5 000m范圍內(nèi)基臺值集中在0.06左右,兩階段的基臺值差異較大,說明在不同抽樣單元尺度下水稻的空間變異特征突出。
圖5 不同尺度下抽樣單元內(nèi)農(nóng)作物面積空間變異結(jié)構變化
由于塊金系數(shù)C0/(C0+C)能夠反映作物面積空間變異的內(nèi)在結(jié)構特征,比值越低說明由系統(tǒng)自身的空間自相關因素(土壤、氣候等自然因素)引起的空間變異程度高,即空間自相關越明顯,比值越高則說明空間自相關性越小,變異主要由隨機因素引起。因此,以空間變異性的研究尺度為橫坐標,塊金系數(shù)為縱坐標,繪出德惠市玉米和水稻在連續(xù)尺度上的空間變異結(jié)構特征折線圖,參考圖5。
從圖5可以看出,玉米在500m處空間變異性最強(C0/C+C0=0.497),在第二階段內(nèi)空間變異性最強的尺度為2 500m(C0/C+C0=0.402),在第三階段內(nèi)空間變異性最強的尺度為4 000m(C0/C+C0=0.402),3種尺度下的塊金系數(shù)均大于40%為中等強度的空間相關,說明在這3種抽樣單元尺度下的空間變異性主要源自研究區(qū)內(nèi)部生態(tài)系統(tǒng)自身的結(jié)構因素作用的結(jié)果,即玉米面積的種植結(jié)構相對比較穩(wěn)定;對水稻而言,兩階段內(nèi)空間變異性最強的尺度分別為500m(C0/C+C0=0.344)和2 500m(C0/C+C0=0.037),500m處塊金系數(shù)大于25%為中等自相關,結(jié)合表6發(fā)現(xiàn)自1 500m之后水稻的塊金系數(shù)出現(xiàn)急劇下降的趨勢,甚至在部分較大尺度下有C0=0.000 1,說明自1 500m之后,水稻的空間變異性基本完全來自系統(tǒng)的空間自相關過程(結(jié)構因素),且在部分較大尺度上具有恒定空間變異(系統(tǒng)空間自相關引起的變異)。變程Range與塊金系數(shù)呈現(xiàn)出相反的變化特征,隨抽樣單元尺度的增加而增大,即農(nóng)作物空間依賴的范圍也隨著增大,特別是水稻在大尺度上具有明顯的空間自相關特征,但其空間變化的差異程度明顯減小。
從玉米和水稻的空間變異特征來看,塊金系數(shù)在整體上隨著抽樣單元尺度的增加而減小,即空間自相關對作物空間變異性的影響逐漸增大,表明在較大尺度上抽樣單元內(nèi)農(nóng)作物面積比的相似性更強,具有相似農(nóng)作物面積的抽樣單元空間聚集作用明顯。
2.3.1 不同抽樣單元尺度下的抽樣外推總體估計
圖6 農(nóng)作物面積抽樣外推總體相對誤差隨抽樣單元尺度的變化注:SR表示簡單隨機抽樣,SY表示系統(tǒng)抽樣,SS表示分層抽樣
圖7 農(nóng)作物面積抽樣外推總體變異系數(shù)隨抽樣單元尺度的變化
圖8 平均抽樣相對誤差隨抽樣單元尺度的變化曲線
2.3.2 抽樣方法對空間抽樣效率的影響
圖9 抽樣比隨抽樣單元尺度的變化
2.3.3 抽樣比對空間抽樣效率的影響
圖10 農(nóng)作物在分層抽樣條件下的空間抽樣效率注:當抽樣單元尺度大于3 500m×3 500m時,由于層內(nèi)方差為0,導致對應變異系數(shù)為0
2.3.4 抽樣單元尺度對空間抽樣效率的影響
由于研究目標有兩種農(nóng)作物,為了進一步選擇最優(yōu)抽樣單元尺度,根據(jù)圖7~9的結(jié)論,計算4種f下,玉米和水稻種植面積在各抽樣單元尺度下的平均分層抽樣相對誤差、和平均分層變異系數(shù),以分層平均抽樣誤差和分層平均變異系數(shù)作為德惠市農(nóng)作物空間抽樣精度和穩(wěn)定性的評選標準。從圖10可以看出,4種f下的平均相對誤差和平均變異系數(shù)均隨著抽樣單元尺度的增加而增加;在5%抽樣比條件下,當抽樣單元尺度控制在3 500m×3 500m以內(nèi)時,農(nóng)作物的分層平均相對誤差小于5%,即面積估計精度大于95%,變異系數(shù)小于7%。
綜合德惠市作物空間變異特征,玉米和水稻在3 500m尺度內(nèi)的最大空間變異對應抽樣單元尺度分別為500m和2 500m,考慮到500m抽樣單元尺度下的總體單元個數(shù)大于1萬,在節(jié)省抽樣費用的前提下,2 500m×2 500m的抽樣單元尺度為最適宜進行空間變異性農(nóng)作物的抽樣調(diào)查尺度。
該文重點分析了農(nóng)作物種植面積調(diào)查以具有空間變異性的玉米和水稻為調(diào)查對象時,空間變異性對抽樣外推總體精度和穩(wěn)定性的影響,通過對比不同抽樣方案的抽樣效率,實現(xiàn)遙感空間抽樣方案的優(yōu)選。結(jié)果如下。
(1)德惠市玉米和水稻面積的空間變異具有明顯的尺度依賴特征,由空間自相關(結(jié)構因素)引起的作物面積變異顯著。兩種作物在500m×500m和2 500m×2 500m的抽樣單元尺度下的空間變異性較強,空間自相關性相對最弱,水稻在2 500m×2 500m的抽樣單元尺度下基本具有恒定的空間變異性。
綜合德惠市玉米和水稻的空間變異性程度、樣本容量和抽樣方法3個評價指標,認為以2 500m×2 500m構建抽樣單元、采用分層抽樣方法按5%抽樣比進行抽樣的空間抽樣方案是適宜空間變異的農(nóng)作物面積進行抽樣外推調(diào)查的最高效方案。
該文在抽樣單元的選取和抽樣方案的設計上選取了具有空間變異性的調(diào)查對象,但是在空間變異性分析的方法上,僅采用了各向同性變異函數(shù)模型、基臺值作為空間變異性的定義模式,沒有考慮到各向異性變異函數(shù)模參數(shù)可能會造成不同的變異性結(jié)果。在實際應用中,不同的定義模式可能會影響抽樣相對誤差和變異系數(shù)的變化趨勢,因此在接下來的而研究中可以考慮根據(jù)不同空間定義模式判定空間變異性,然后利用分層抽樣方法,分析它們在樣本容量、抽樣精度和穩(wěn)定性方面的差異。