陳彥清,曹永生,陳麗娜,方溈
?
基于地統(tǒng)計分析方法的谷子種質(zhì)資源品質(zhì)與農(nóng)藝相關(guān)性狀 的空間分區(qū)研究
陳彥清,曹永生,陳麗娜,方溈
(中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所,北京 100081)
【目的】分析中國谷子資源相關(guān)農(nóng)藝及品質(zhì)性狀的空間分布特點,掌握相關(guān)性狀在空間上的總體質(zhì)量分布,提高對谷子資源的宏觀認(rèn)知和有效保護(hù)及高效利用。【方法】本研究從地理空間的角度出發(fā),利用空間插值、空間聚類等方法研究了谷子資源的相關(guān)性狀的空間分布規(guī)律。首先對谷子資源的目標(biāo)性狀值進(jìn)行插值,然后將全國網(wǎng)格化數(shù)據(jù)與插值數(shù)據(jù)進(jìn)行分區(qū)統(tǒng)計,利用統(tǒng)計后的網(wǎng)格數(shù)據(jù)進(jìn)行優(yōu)化熱點分析形成目標(biāo)性狀的空間分區(qū)數(shù)據(jù),進(jìn)而尋找目標(biāo)性狀對應(yīng)的高值、隨機值和低值區(qū)域。【結(jié)果】谷子資源在全國的分布上來說,粗蛋白含量平均值為(13.98±1.23)%,變幅在10.47%—17.33%,變異系數(shù)為8.80%;粗脂肪含量平均值為(4.01±0.38)%,變幅在3.08%—5.47%,變異系數(shù)為9.48%,單株粒重平均值為(10.39±4.13)g,變幅在1.65—29.30g,變異系數(shù)為39.75%;生育期平均值為(111.46±10.94)d,變幅在79.15—150.43 d,變異系數(shù)為9.81%。從區(qū)域聚集分布上來說,粗蛋白含量低值區(qū)、隨機值區(qū)和高值區(qū)的平均值分別為(12.80±0.70)%、(13.98±0.39)%和(15.24±0.42)%,變幅分別在10.47%—14.90%、12.72%—15.30%和13.61%—17.33%,變異系數(shù)分別為5.47%、2.79%和2.76%;粗脂肪含量低值區(qū)、隨機值區(qū)和高值區(qū)的平均值分別為(3.69±0.13)%、(3.99±0.16)%和(4.41±0.26)%,變幅分別為3.11%—4.39%、3.08%—4.48%和3.57%—5.47%,變異系數(shù)分別為3.52%、4.01%和5.89%;單株粒重低值區(qū)、隨機值區(qū)和高值區(qū)的平均值分別為(6.49±1.84)g、(10.51±1.49)g和(14.44±2.88)g,變幅分別為(1.65—13.38)、(5.42—16.54)和(7.63—29.30)g,變異系數(shù)分別為23.73%、14.18%和19.94%;生育期低值區(qū)、隨機值區(qū)和高值區(qū)的平均值分別為(99.58±6.64)d、(111.89±2.99)d和(121.17±6.04)d,變幅分別為(79.15—116.81)d、(99.53—124.44)d和(108.34—150.43)d,變異系數(shù)分別為6.67%、2.67%和4.98%?!窘Y(jié)論】谷子資源粗蛋白含量高值區(qū)內(nèi)部差異最小,主要集中在新疆和黑龍江省東北部,低值區(qū)內(nèi)部差異最大,主要在中部和東部,高低值區(qū)間存在隨機值過度地帶,呈現(xiàn)兩側(cè)向中間越來越小的分布趨勢;粗脂肪含量高值區(qū)內(nèi)部差異最大,主要集中在中部地區(qū),低值區(qū)內(nèi)部差異最小,主要分布在新疆和東北部分地區(qū),呈現(xiàn)中間向兩側(cè)越來越小的趨勢分布,且分區(qū)相對不規(guī)整;單株粒重的隨機值區(qū)內(nèi)部差異最小,高值區(qū)內(nèi)部差異最大,寧夏、山西、陜西等地屬于單株粒重高值區(qū),黑龍江、浙江、內(nèi)蒙北部、安徽南部以及西南大部分地區(qū),均屬單株粒重低值區(qū);生育期的隨機值區(qū)內(nèi)部差異最小,低值區(qū)內(nèi)部差異最大,東北大部分地區(qū)、西北和西南部分地區(qū)生育期較長,河南、山東、河北等谷子夏播期的地區(qū)生育期較短。
谷子;種質(zhì)資源;目標(biāo)性狀;空間插值;空間分布
【研究意義】谷子起源于中國,是傳統(tǒng)的優(yōu)勢作物、主食作物和抗旱耐瘠作物[1],距今已有8 700多年的栽培歷史[2]。谷子具有抗旱耐瘠、水分利用效率高、適應(yīng)性廣、營養(yǎng)豐富、各種成分平衡、飼草蛋白含量高等突出特點,被認(rèn)為是應(yīng)對未來水資源短缺的戰(zhàn)略貯備作物,建設(shè)可持續(xù)農(nóng)業(yè)的生態(tài)作物以及人們膳食結(jié)構(gòu)調(diào)整、平衡營養(yǎng)的特色作物[3-5]。中國既是栽培谷子的起源地,也是擁有谷子種質(zhì)資源最多、研究利用最充分的國家。全世界谷子總產(chǎn)中,中國占80%[6],主要種植區(qū)分布在北方干旱、半干旱地區(qū)。在“全國種植業(yè)結(jié)構(gòu)調(diào)整規(guī)劃(2016—2020)”[7]中指出:適當(dāng)調(diào)減“鐮刀彎”地區(qū)玉米面積,改種耐旱耐瘠薄的薯類、雜糧雜豆,滿足市場需求,保護(hù)生態(tài)環(huán)境。可見谷子等耐旱耐貧瘠雜糧類資源越來越受到重視,而掌握谷子資源在空間上的總體質(zhì)量分布概況,對于有效利用和開發(fā)谷子資源、尋找優(yōu)異谷子種質(zhì)具有重要意義?!厩叭搜芯窟M(jìn)展】近年對谷子資源的品質(zhì)及農(nóng)藝性狀的研究也越來越多。李慶春等[8]從各生態(tài)區(qū)的角度對于谷子的蛋白含量進(jìn)行和普查與評價,從統(tǒng)計學(xué)的角度分析了各生態(tài)區(qū)內(nèi)谷子資源粗蛋白含量的極值、平均值和標(biāo)準(zhǔn)差等;那海智等[9]通過研究谷子粗蛋白、粗脂肪含量與物候期的關(guān)系得出,生育期越短,粗蛋白含量越高,反之越低,而生育期對粗脂肪的影響并不顯著;王海崗等[10]利用聚類分析、相關(guān)分析和主成分分析等方法對谷子核心種質(zhì)的莖粗、穗重、粒色等15個表型性狀進(jìn)行了分析和綜合評價。劉三才等[11]測量和評價了谷子品種資源內(nèi)微量元素硒和蛋白質(zhì)的含量;劉敏軒等[12]利用統(tǒng)計分析和相關(guān)性分析等方法研究了谷子育成品種維生素E含量分布規(guī)律及其與主要農(nóng)藝性狀和類胡蘿卜素的相關(guān)性分析。以上研究的共同點在于,在研究某一性狀的分布特點或地區(qū)差異時,均采用數(shù)理統(tǒng)計、相關(guān)性分析等數(shù)學(xué)方法得到一個或幾個數(shù)值,根據(jù)數(shù)值差異定量的評價該性狀,均利用省份或生態(tài)區(qū)作為分區(qū)研究區(qū)域差異?!颈狙芯壳腥朦c】這種方法雖然能夠從定量角度充分說明資源性狀的特性,但不能直觀的反映出某一性狀在地理空間上的分布特性,可視化效果差;并且以行政區(qū)劃為單元對谷子資源性狀的地區(qū)差異進(jìn)行分析打破了原有的自然區(qū)劃關(guān)聯(lián)?!緮M解決的關(guān)鍵問題】本研究從地理空間的角度出發(fā),利用空間插值、空間聚類等方法研究谷子資源的農(nóng)藝及品質(zhì)性狀的空間分布規(guī)律,為解決傳統(tǒng)分析方法中可視化差及行政界線的限制等問題提出依據(jù)。
1.1 材料
20世紀(jì)50年代以來,中國先后組織了兩次全國規(guī)模的農(nóng)作物種質(zhì)資源調(diào)查,在資源調(diào)查和信息共享方面取得了重大進(jìn)展和顯著成效,積累了大量的種質(zhì)資源數(shù)據(jù)[13-15]。同時,近十年來,中國先后在云南、貴州、西南干旱地區(qū)、東部沿海等地區(qū)開展了多次種質(zhì)資源調(diào)查工作,豐富了國家農(nóng)作物種質(zhì)資源數(shù)據(jù)庫。對于國家農(nóng)作物種質(zhì)資源數(shù)據(jù)庫中的谷子資源數(shù)據(jù),共整理出27 000余條谷子資源數(shù)據(jù)記錄,這些數(shù)據(jù)中,初步完成了形態(tài)學(xué)特征和農(nóng)藝性狀鑒定半數(shù)種質(zhì)進(jìn)行了抗病蟲、抗逆、營養(yǎng)品質(zhì)的特性鑒定[16]。根據(jù)其經(jīng)緯度屬性信息轉(zhuǎn)換為地理空間數(shù)據(jù)(圖1)。
1.2 方法
由于谷子種質(zhì)資源數(shù)據(jù)在空間上為點數(shù)據(jù),不利于進(jìn)行空間分析等操作。而針對點數(shù)據(jù),在空間上可利用地統(tǒng)計分析方法通過插值得到面上的數(shù)據(jù),從而進(jìn)一步進(jìn)行空間分析?;谠擖c考慮,首先對谷子種質(zhì)資源待分析的屬性值進(jìn)行插值,估測全國各地對應(yīng)的屬性值情況,然后將全國網(wǎng)格化數(shù)據(jù)與插值數(shù)據(jù)進(jìn)行分區(qū)統(tǒng)計,將屬性值賦給每個網(wǎng)格,并利用賦值的網(wǎng)格數(shù)據(jù)進(jìn)行優(yōu)化熱點分析,實現(xiàn)網(wǎng)格的聚類,最后將聚類結(jié)果進(jìn)一步處理,對全國進(jìn)行分區(qū),找到目標(biāo)屬性對應(yīng)的高值、隨機值和低值區(qū)域。
圖1 谷子資源分布圖
1.2.1 農(nóng)藝及品質(zhì)性狀數(shù)據(jù)空間插值 地統(tǒng)計分析方法可用于估計尚未進(jìn)行任何采樣的位置的值以及評估這些估計的不確定性。地統(tǒng)計分析方法主要用來研究那些在空間上既有隨機性又有結(jié)構(gòu)性的自然現(xiàn)象[17]。由南非礦山工程師Krige等[18]在金礦儲量估計上提出了該方法的雛形,其應(yīng)用領(lǐng)域從地質(zhì)、礦業(yè)逐漸拓展到土壤[19]、水資源[20]、農(nóng)業(yè)[21-23]、氣象[24]、海洋[25]等領(lǐng)域。地統(tǒng)計中最常用的空間插值方法為克里金插值法,該方法是建立在變異函數(shù)理論及結(jié)構(gòu)分析基礎(chǔ)之上的,在插值時需要選擇一種適宜的半變異函數(shù)模型,并且待插值的數(shù)據(jù)需要服從或近似服從正態(tài)分布。所以在選擇使用克里金插值方法時,首選需進(jìn)行數(shù)據(jù)分布檢驗,確定該數(shù)據(jù)是否適合插值,然后利用交叉檢驗法對插值結(jié)果的精度進(jìn)行評價,從而選擇最適宜的半變異函數(shù)模型進(jìn)行插值。
1.2.2 農(nóng)藝及品質(zhì)性狀數(shù)據(jù)網(wǎng)格化處理 網(wǎng)格是對
地理空間的劃分[26]。網(wǎng)格化數(shù)據(jù)不僅能夠?qū)崿F(xiàn)不同尺度、不同類型數(shù)據(jù)的統(tǒng)一和融合,而且能夠打破行政單元約束,提高信息檢索與更新效率[27-28]。與柵格數(shù)據(jù)相比,便于空間統(tǒng)計和分析,選擇將插值得到的柵格數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一大小的網(wǎng)格數(shù)據(jù)。首先根據(jù)全國的范圍,選擇適宜的網(wǎng)格大小,創(chuàng)建全國范圍內(nèi)的網(wǎng)格數(shù)據(jù),并利用空間分析中的分區(qū)統(tǒng)計方法,將對應(yīng)的插值后的農(nóng)藝或品質(zhì)性狀數(shù)據(jù)統(tǒng)計到每個網(wǎng)格上,得到帶有目標(biāo)屬性值的網(wǎng)格數(shù)據(jù)。
1.2.3 農(nóng)藝及品質(zhì)性狀數(shù)據(jù)空間聚類及區(qū)域劃分 通過空間聚類,將空間上相鄰、數(shù)值上相近的網(wǎng)格數(shù)據(jù)聚集成一類,根據(jù)聚類結(jié)果進(jìn)行區(qū)域劃分??臻g聚類的方法很多,熱點分析方法就是其中一種,它的特點是能夠識別具有統(tǒng)計顯著性的高值(熱點)和低值(冷點)的空間聚類。利用該方法,不僅能夠?qū)崿F(xiàn)聚類,而且能夠根據(jù)聚類結(jié)果區(qū)分出哪些地區(qū)對應(yīng)的值比較高,哪些地區(qū)對應(yīng)的值比較低,比較符合本研究的需求。故在空間聚類方面,選擇利用ARCGIS的優(yōu)化熱點分析工具,對網(wǎng)格數(shù)據(jù)進(jìn)行高低值聚類。根據(jù)聚類結(jié)果,將網(wǎng)格數(shù)據(jù)分為高值、隨機值和低值三類,融合空間相鄰、類別相同的網(wǎng)格,并進(jìn)行平滑處理,劃分農(nóng)藝或品質(zhì)性狀的空間分布區(qū)域。
具體流程如下:
圖2 方法流程圖
根據(jù)谷子種質(zhì)資源的數(shù)據(jù)和地統(tǒng)計中的探索性分析,最終選擇粗蛋白含量和粗脂肪含量2個品質(zhì)性狀與生育期和單株粒重2個農(nóng)藝性狀為空間分區(qū)要素,對以上方法進(jìn)行實例化分析。在27 000余份資源數(shù)據(jù)中,分別具有粗脂肪值、粗蛋白值、單株粒重值、生育期值的資源有20 451份、20 477份、25 807份和26 420份,這4項屬性數(shù)據(jù)的缺失較少,并且經(jīng)過數(shù)據(jù)分布檢驗后表明,這4項數(shù)據(jù)的分布均接近于正態(tài)分布(圖3),適合利用克里金法進(jìn)行空間插值。
圖3 4種目標(biāo)屬性的直方圖分布情況
對以上4項屬性數(shù)據(jù)進(jìn)行空間插值,選擇球面函數(shù)、高斯函數(shù)和四球3種半變異函數(shù)模型進(jìn)行插值,利用平均值預(yù)測誤差、平均標(biāo)準(zhǔn)誤差、均方根預(yù)測誤差、均方根標(biāo)準(zhǔn)化誤差進(jìn)行交叉檢驗,檢驗結(jié)果如表1所示。在交叉檢驗中,如果預(yù)測誤差具有無偏性,平均值預(yù)測誤差應(yīng)接近于0;如果正確估計了預(yù)測中的變異性,平均標(biāo)準(zhǔn)誤差與均方根預(yù)測誤差應(yīng)接近,并且均方根標(biāo)準(zhǔn)化誤差應(yīng)接近于1。經(jīng)過綜合分析發(fā)現(xiàn),這4類性狀均在利用高斯函數(shù)模型時預(yù)測效果最優(yōu)。
對經(jīng)過插值后的數(shù)據(jù)進(jìn)行網(wǎng)格化處理、空間聚類分析、網(wǎng)格融合和平滑處理,最終得到4項要素的空間分區(qū)分布圖(圖3—圖6)。
蛋白質(zhì)含量是谷子營養(yǎng)品質(zhì)的主要構(gòu)成成分之一[29-30],在谷子品質(zhì)育種中應(yīng)重點提高蛋白質(zhì)含量[31]。谷子資源粗蛋白含量高的地區(qū)主要集中在中國的西部地區(qū)和黑龍江省東北部,低值地區(qū)主要在中國的中部和東部,在高低值之間存在隨機值過度地帶,呈現(xiàn)兩側(cè)向中間越來越小的分布趨勢,不是隨意穿插分布的,并且各分區(qū)的多邊形相對面積較大,不存在零星分布的小多邊形,說明中國谷子的粗蛋白含量地域連續(xù)性較強(圖3)。從均值上看,根據(jù)表2數(shù)據(jù),粗蛋白含量的全國平均值為(13.98±1.23)%,低值區(qū)平均值為(12.80±0.70)%,占41.89%;隨機區(qū)平均值為(13.98±0.39)%,占18.69%;高值區(qū)平均值為(15.24±0.42)%,占全國總面積39.42%。由于高值地區(qū)主要分布在西部高原地區(qū),大部分地區(qū)不適宜種植,而谷子主要種植區(qū)均屬于粗蛋白含量低值區(qū),表明中國谷子資源的粗蛋白含量高且聚集分布的區(qū)域較小,大部分谷子的粗蛋白含量水平處于低值聚集區(qū)的水平上。從變幅上看,全國粗蛋白含量變幅在10.47%—17.33%,低值區(qū)、隨機值區(qū)、高值區(qū)的變幅分別在10.47%—14.90%、12.72%—15.30%和13.61%—17.33%,低值區(qū)的跨度最大,并且三者的變幅值有重復(fù)部分,這是因為空間聚類時不僅需要考慮數(shù)值的近似性,還要考慮空間上的相鄰性,所以不會嚴(yán)格按照數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行聚類。從聚類效果看,粗蛋白含量的全國變異系數(shù)為8.80%,低值區(qū)、隨機值區(qū)和高值區(qū)的變異系數(shù)分別為5.47%、2.79%和2.76%。變異系數(shù)越小,證明聚類的效果最好,經(jīng)過聚類后的3個分區(qū)的變異系數(shù)都小于國家級變異系數(shù),高值區(qū)聚類效果最佳,低值區(qū)聚類效果最弱。
表1 不同變異函數(shù)模型的插值誤差值對比
圖4 谷子資源粗蛋白含量的區(qū)域劃分結(jié)果
谷子資源粗脂肪含量高的地區(qū)主要集中在中部地區(qū),低值地區(qū)為西部和部分東北地區(qū),與粗蛋白情況相反,呈現(xiàn)中間向兩側(cè)越來越小的趨勢分布,并且相對于粗蛋白含量的分區(qū)結(jié)果來說,出現(xiàn)多個面積較小的分區(qū)多邊形,分區(qū)相對不規(guī)整(圖4)。從均值上看,根據(jù)表2數(shù)據(jù),粗脂肪含量的全國平均值為(4.01±0.38)%,低值區(qū)平均值為(3.69±0.13)%,占44.36%;隨機值區(qū)平均值為(3.99±0.16)%,占18.67%;高值區(qū)平均值為(4.41±0.26)%,占全國總面積36.97%。雖然低值區(qū)域占地面積最大,但由于西部地區(qū)存在大面積不適宜種植的區(qū)域,所以,從整體上來看,中國谷子資源的粗脂肪含量高且呈現(xiàn)聚集的區(qū)域面積廣闊。從變幅上看,全國谷子資源粗脂肪含量變幅在3.08%—5.47%,低值區(qū)、隨機值區(qū)、高值區(qū)的變幅分別在3.11%—4.39%、3.08%—4.48%和3.57%—5.47%,3個區(qū)間均有重疊部分,其中,隨機值區(qū)域跨度最大。從聚類效果看,粗脂肪含量的全國變異系數(shù)為9.48%,高于粗蛋白含量的變異系數(shù),說明粗脂肪含量的聚類效果不如粗蛋白含量的顯著。低值區(qū)、隨機值區(qū)和高值區(qū)的變異系數(shù)分別為3.52%、4.01%和5.89%。低值區(qū)聚類效果最佳,高值區(qū)聚類效果最弱。
單株粒重直接影響谷子的產(chǎn)量,當(dāng)種植密度相同時,單株粒重越大,產(chǎn)量越高。從地理分布上分析(圖6),寧夏、山西、陜西,以及甘肅、內(nèi)蒙、湖北和新疆大部分地區(qū)、河北北部和山東中部均屬于高值區(qū),而黑龍江、浙江、內(nèi)蒙北部、安徽南部以及中國的大部分西南地區(qū),均屬于單株粒重低值區(qū);其他地區(qū)屬于高值區(qū)與低值區(qū)的過度地帶的隨機值區(qū)。從均值(表2)上看,單株粒重的全國平均值為(10.39±4.13)g,低值區(qū)平均值為(6.49±1.84)g,占39.45%;隨機值區(qū)平均值為(10.51±1.49)g,占22.80%;高值區(qū)平均值為(14.44±2.88)g,占全國總面積37.75%。正如上文所說,雖然低值區(qū)域占地面積大,但由于這些地區(qū)不屬于谷子的主要種植區(qū),所以,從整體上來看,中國谷子主要集中在單株粒重高的高值區(qū)域內(nèi)。從變幅上看,全國谷子單株粒重變幅在(1.65—29.30)g,低值區(qū)、隨機值區(qū)、高值區(qū)的變幅分別在(1.65—13.38)、(5.42—16.54)和(7.63—29.30)g,3個區(qū)間均有重疊部分,其中高值區(qū)域跨度最大。從聚類效果看,單株粒重的全國變異系數(shù)為39.75%,屬于這4項性狀中變異系數(shù)最高的1項,說明單株粒重在這4項性狀中聚類效果最弱,全國范圍內(nèi)差異最明顯;低值區(qū)、隨機值區(qū)和高值區(qū)的變異系數(shù)分別為23.73%、14.18%和19.94%。隨機值區(qū)聚類效果最佳,低值區(qū)聚類效果最弱。
從生育期的地理分布分析來看(圖7),東北大部分地區(qū)、西北和西南部分地區(qū)屬于生育期較長的地區(qū),生育期較短區(qū)域主要包括了河南、山東、河北等谷子夏播期的地區(qū)。從數(shù)值上分析(表2),生育期的全國平均值為(111.46±10.94)d,低值區(qū)平均值為(99.58±6.64)d,占34.28%;隨機值區(qū)平均值為(111.89±2.99)d,占24.30%;高值區(qū)平均值為(121.17±6.04)d,占全國總面積41.42%。從變幅上看,全國生育期變幅在(79.15—150.43) d,高值區(qū)、隨機值區(qū)、低值區(qū)的變幅分別在(108.34—150.43)、(99.53—124.44)、(79.15—116.81) d,3個區(qū)間均有重疊部分,其中高值區(qū)域跨度最大。從聚類效果看,全國變異系數(shù)為9.81%,高值區(qū)、隨機值區(qū)和低值區(qū)的變異系數(shù)分別為4.98%、2.67%和6.67%。隨機值區(qū)聚類效果最佳,低值區(qū)聚類效果最弱。
本方法主要根據(jù)插值后的結(jié)果進(jìn)行聚類分區(qū),尚未考慮其他因素對谷子種植的影響,所以未區(qū)分哪些地區(qū)是谷子的適宜和非適宜種植區(qū),而因為海拔、氣候等原因,使得一些地區(qū)無法進(jìn)行農(nóng)作物的種植。根據(jù)圖1谷子資源樣點的分布,絕大部分分布在海拔3 000 m以下的地區(qū),若將海拔3 000 m以上的區(qū)域作為谷子不適宜種植區(qū)域并進(jìn)行扣除,各性狀的高低值區(qū)域比例則會發(fā)生較大的變動,如圖8所示。粗蛋白含量被扣除的主要是高值區(qū)域,其余3個性狀被扣除的主要是低值區(qū)域。所以,在考慮海拔限制的前提下,粗蛋白含量的高值區(qū)主要集中在新疆和黑龍江省東北部,低值區(qū)主要在中部和東部;粗脂肪含量的高值區(qū)主要集中在中部地區(qū),低值地區(qū)為新疆和東北的部分地區(qū);單株粒重的高值區(qū)主要集中在寧夏、山西、陜西,以及甘肅、內(nèi)蒙、湖北和新疆大部分地區(qū)、河北北部和山東中部等谷子主要種植區(qū),低值區(qū)主要集中在東北和西南地區(qū);生育期的高值區(qū)為東北大部分地區(qū)、西北和西南部分地區(qū),低值區(qū)為東南沿海地區(qū)。再加入其它限制因素時,可進(jìn)一步縮小資源的分布區(qū)域,進(jìn)一步細(xì)化資源各性狀的高低值分區(qū)布局。
圖5 谷子資源粗脂肪含量區(qū)域劃分結(jié)果
圖6 谷子資源單株粒重區(qū)域劃分結(jié)果
圖7 谷子資源生育期區(qū)域劃分結(jié)果
表2 4項性狀聚類后的相關(guān)統(tǒng)計數(shù)值表
對于每項性狀的聚類,其高低值類型區(qū)的劃分是一個相對概念,與聚類時對應(yīng)的空間尺度關(guān)系密切,在另外一個尺度下,如生態(tài)類型區(qū)尺度下再進(jìn)行聚類,會出現(xiàn)不同的聚類結(jié)果,所以本研究的聚類僅針對國家尺度上的分析。另外,克里金插值是一種光滑的內(nèi)插方法,在數(shù)據(jù)點多時,其內(nèi)插的結(jié)果可信度較高,而數(shù)據(jù)點少的地區(qū)其插值結(jié)果的偏差則會較大。中國西部和東南部地區(qū)的樣點數(shù)量較少,并且存在大面積地區(qū)無樣點的情況,這些地區(qū)的插值結(jié)果的可信度會明顯低于中部和東北地區(qū)(圖1)。
圖8 海拔限制下的四性狀空間分布
4.1 谷子資源的粗蛋白含量、粗脂肪含量、單株粒重、生育期4種性狀數(shù)據(jù)的分布均接近于正態(tài)分布,適合利用克里金法進(jìn)行空間插值;對比球面函數(shù)、高斯函數(shù)和四球3種半變異函數(shù)模型插值效果,這4種性狀數(shù)據(jù)均選擇高斯函數(shù)模型時預(yù)測效果最優(yōu)。
4.2 谷子資源粗蛋白含量的高值區(qū)、隨機值區(qū)和低值區(qū)的變異系數(shù)分別為2.76%、2.79%和5.47%,高值區(qū)聚類效果最佳(類內(nèi)相似性最大,下同),低值區(qū)聚類效果最弱(類內(nèi)相似性最小,下同)。粗脂肪含量的高值區(qū)、隨機值區(qū)和低值區(qū)的變異系數(shù)分別為3.52%、4.01%和5.89%,低值區(qū)聚類效果最佳,高值區(qū)聚類效果最弱。單株粒重的高值區(qū)、隨機值區(qū)和低值區(qū)的變異系數(shù)分別為23.73%、14.18%和19.94%,隨機值區(qū)聚類效果最佳,低值區(qū)聚類效果最弱。生育期的高值區(qū)、隨機值區(qū)和低值區(qū)的變異系數(shù)分別為6.67%、2.67%和4.98%,隨機值區(qū)聚類效果最佳,低值區(qū)聚類效果最弱。
4.3 谷子資源粗蛋白含量的高值區(qū)集中在新疆和黑龍江省東北部,低值區(qū)主要在中部和東部,呈現(xiàn)兩側(cè)向中間越來越小的分布趨勢,地域連續(xù)性較強;粗脂肪含量的高值區(qū)主要集中在中部地區(qū),低值地區(qū)為新疆和東北的部分地區(qū),呈現(xiàn)中間向兩側(cè)越來越小的趨勢分布,并且相對于粗蛋白含量的分區(qū)結(jié)果來說,出現(xiàn)多個面積較小的分區(qū)多邊形,分區(qū)相對不規(guī)整;單株粒重的高值區(qū)主要集中在寧夏、山西、陜西,以及甘肅、內(nèi)蒙、湖北和新疆大部分地區(qū)、河北北部和山東中部,低值區(qū)主要集中在東北和西南地區(qū);生育期的高值區(qū)為東北大部分地區(qū)、西北和西南部分地區(qū),低值區(qū)主要集中在河南、山東、河北等谷子夏播期的地區(qū)。
[1] 刁現(xiàn)民. 中國谷子生產(chǎn)與產(chǎn)業(yè)發(fā)展方向//柴巖, 萬世富. 中國小雜糧產(chǎn)業(yè)發(fā)展報告. 北京: 中國農(nóng)業(yè)科學(xué)技術(shù)出版社, 2007: 32-43.
Diao X M. Developing direction of the Chinese foxtail millet production and industry//Chai Y, Wan S F.Beijing: Chinese Agricultural Science and Technology Press, 2007: 32-43. (in Chinese)
[2] Lu H Y, Zhang J P, Liu K B, Wu N Q, Li Y M, Zhou K S. Earliest domestication of common millet()in East Asia Extended to 10000 Years Ago., 2009, 106(18): 7367-7372.
[3] 李順國, 劉猛, 趙宇, 劉斐, 王慧軍. 河北省谷子產(chǎn)業(yè)現(xiàn)狀和技術(shù)需求及發(fā)展對策. 農(nóng)業(yè)現(xiàn)代化研究, 2012, 33(3): 286-289.
Li S G, Liu M, Zhao Y, Liu F, Wang H J. Industry situation, technology need and development suggestion of foxtail millet in Hebei province., 2012, 33(3): 286-289. (in Chinese)
[4] 張海金. 谷子在旱作農(nóng)業(yè)中的地位和作用. 安徽農(nóng)學(xué)通報, 2007, 13(10): 169-170.
Zhang H J. Status and effect of foxtail millet in dry-land agriculture., 2007, 13(10): 169-170. (in Chinese)
[5] 柴巖, 萬福世. 中國小雜糧產(chǎn)業(yè)發(fā)展報告. 北京: 中國農(nóng)業(yè)出版社, 2007: 32-43.
Chai Y, Wan F S.. Beijing: China Agriculture Press, 2007: 32-43. (in Chinese)
[6] 刁現(xiàn)民. 中國谷子產(chǎn)業(yè)與產(chǎn)業(yè)技術(shù)體系. 北京: 中國農(nóng)業(yè)科學(xué)與技術(shù)出版社, 2011: 20-30.
Diao X M.. Beijing: China Agricultural Sciences and Technology Press, 2011: 20-30. (in Chinese)
[7] 中華人民共和國農(nóng)業(yè)部.《全國種植業(yè)結(jié)構(gòu)調(diào)整規(guī)劃(2016-2020年)》農(nóng)農(nóng)發(fā)〔2016〕3號.
Ministry of Agriculture of the People's Republic of China, < National crop structure adjustment plan (2016-2020)>, 〔2016〕NO. 3 (in Chinese)
[8] 李慶春, 吳舒致. 不同品種小米中粗蛋白含量的普查與評價. 中國糧油學(xué)報, 1993, 8(增刊): 8-13.
Li Q C, Wu S Z. Survey and evaluation of crude protein content in different varieties of foxtail millet., 1993, 8(Suppl.): 8-13. (in Chinese)
[9] 那海智, 吳秀蘭, 趙鐵男. 試論谷子粗蛋白質(zhì)、粗脂肪含量與物候期的相關(guān)關(guān)系. 黑龍江農(nóng)業(yè)科學(xué), 1982(4). 14-16.
Na H Z, Wu X L, Zhao T N. Study on the relationship between the contents of crude protein and crude fat and the phenological phase., 1982(4): 14-16. (in Chinese)
[10] 王海崗, 賈冠清, 智慧, 溫琪汾, 董俊麗, 陳凌, 王君杰, 曹曉寧, 劉思辰, 王綸, 喬治軍, 刁現(xiàn)民. 谷子核心種質(zhì)表型遺傳多樣性分析及綜合評價. 作物學(xué)報, 2016, 42(1): 19-30.
Wang H G, Jia G Q, Zhi H, Wen Q F, Dong J L, Chen L, Wang J J, Cao X N, Liu S C, Wang L, Qiao Z J, Diao X M. Phenotypic diversity evaluations of foxtail millet core collections., 2016, 42(1): 19-30. (in Chinese)
[11] 劉三才, 朱志華, 李為喜, 劉方, 李燕, 黃蓉. 谷子品種資源微量元素硒和蛋白質(zhì)含量的測定與評價. 中國農(nóng)業(yè)科學(xué), 2009,42(11): 3812-3818.
Liu S C, Zhu Z H, Li W X, Liu F, Li Y, Huang R. Evaluation of selenium and protein content of foxtail millet landraces originated from different ecological regions of China., 2009, 42(11): 3812-3818. (in Chinese)
[12] 劉敏軒, 陸平. 中國谷子育成品種維生素E含量分布規(guī)律及其與主要農(nóng)藝性狀和類胡蘿卜素的相關(guān)性分析. 作物學(xué)報, 2013, 39(3): 398-408.
Liu M X, Lu P. Distribution of vitamin E content and its correlation with agronomic trait sand carotenoids content in foxtail millet varieties in china. China., 2013, 39(3): 398-408. (in Chinese)
[13] 曹永生, 方溈. 國家農(nóng)作物種質(zhì)資源平臺的建立和應(yīng)用. 生物多樣性, 2010, 18(5): 454-460.
Cao Y S, Fang W. Establishment and application of national crop germplasm resources infrastructure in China.2010, 18(5): 454-460. (in Chinese)
[14] 王述民, 張宗文. 世界糧食和農(nóng)業(yè)植物遺傳資源保護(hù)與利用現(xiàn)狀. 植物遺傳資源學(xué)報, 2011, 12(3): 325-338.
Wang S M, Zhang Z W. The state of the world's plant genetic resources for food and agriculture., 2011, 12(3): 325-338. (in Chinese)
[15] 司海平, 方溈, 唐鵬, 曹永生. 基于SOA的農(nóng)作物種質(zhì)資源調(diào)查信息系統(tǒng)研究. 植物遺傳資源學(xué)報, 2010, 11(5): 517-521.
Si H P, Fang W, Tang P, Cao Y S. Research of crop germplasm resources investigation information system based on SOA., 2010, 11(5): 517-521. (in Chinese)
[16] 陸平. 谷子種質(zhì)資源描述規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn). 北京: 中國農(nóng)業(yè)出版社, 2006: 3.
Lu P.. Beijing: China Agriculture Press, 2006: 3. (in Chinese)
[17] 侯景儒, 黃競先.地質(zhì)統(tǒng)計學(xué)及其在礦產(chǎn)儲量計算中的應(yīng)用. 北京: 地質(zhì)出版社, 1982.
Hou J R, Huang J X.. Beijing: Geological Press, 1982. (in Chinese)
[18] Krige D G. A statistical analysis of some of the borehole values in the Orange Free St ate gold field., 1952, 53: 47-64.
[19] Bor?vka L, Mládková L, Pení?ek V, Drábek O, Va?át R. Forest soil acidification assessment using principal component analysis and geostatistics., 2007, 140(4): 374-382.
[20] Goovaerts P. Geostatistical approaches for incorporating elevation into the spatial interpolation of rainfall., 2000, 228(1/2): 113-129.
[21] Oliver M A. Precision agriculture and geostatistics: how to manage agriculture more exactly., 2013, 10(2): 17-22.
[22] Castrignanò A, Landrum C, Benedetto D D, Poljak M. Delineation of management zones in precision agriculture by integration of proximal sensing with multivariate geostatistics., 2015, 80(1): 39-45.
[23] 王虎, 許哲, 郭靜, 劉哲, 李紹明, 張曉東, 朱德海. 玉米品種多環(huán)境測試數(shù)據(jù)的空間插值分析. 玉米科學(xué), 2012, 20(6): 43-148.
Wang H, Xu Z, Guo J, Liu Z, Li S M, Zhang X D, Zhu D H. Spatial interpolation research of multi-environment trials data for maize., 2012, 20(6): 143-148. (in Chinese)
[24] Künzli N, Jerrett M, Mack W J, Beckerman B, Labree L, Gilliland F. Ambient air pollution and atherosclerosis in los angeles., 2005, 113(2): 201-206.
[25] Jonathan P, Ewans K. Statistical modelling of extreme ocean environments for marine design: A review., 2013, 62(2): 91-109.
[26] 沈立宏, 張超, 桑玲玲, 陳亞婷, 張曉東, 楊建宇, 朱德海, 鄖文聚. 利用網(wǎng)格法確定縣域農(nóng)田整治優(yōu)先度. 農(nóng)業(yè)工程學(xué)報, 2012, 28(18): 241-247.
Shen L H, Zhang C, Sang L L, Chen Y T, Zhang X D, Yang J Y, Zhu D H, Yun W J. Determination of consolidation priority for farmland at county level using grid method., 2012, 28(18): 241-247. (in Chinese)
[27] 李德仁, 賓洪超, 邵振峰. 國土資源網(wǎng)格化管理與服務(wù)系統(tǒng)的設(shè)計與實現(xiàn). 武漢大學(xué)學(xué)報(信息科學(xué)版), 2008, 33(1): 1-6.
Li D R, Bin H C, Shao Z F. Design and Implementation of Land and Resources Grid Management and Service System., 2008, 33(1): 1-6. (in Chinese)
[28] 陳述彭, 陳星. 地球信息科學(xué)的理解與實踐. 地球信息科學(xué), 2004, 6(1): 4-10.
Chen S P, Chen X. The cognition and practice of geo-information science., 2004, 6(1): 4-10. (in Chinese)
[29] 李東輝, 王堯琴. 粟的品質(zhì)改良. 作物雜志, 1986, 1(3): 4-6.
Li D H, Wang Y Q. Quality improvement of foxtail millet., 1986, 1(3): 4-6. (in Chinese)
[30] 王玉文, 李會霞, 田崗, 王高鴻. 我國小米品質(zhì)研究進(jìn)展及其改良設(shè)想. 中國農(nóng)學(xué)通報, 2001, 17(5): 49-51.
Wang Y W, Li H X, Tian G, Wang G H. Research progress and improvement assumption of quality of foxtail millet in China., 2001, 17(5): 49-51. (in Chinese)
[31] 楊春, 田志芳, 盧健鳴, 楊秀麗, 丁衛(wèi)英. 小米蛋白質(zhì)研究進(jìn)展. 中國糧油學(xué)報, 2010, 25(8): 123-128.
Yang C, Tian Z F, Lu J M, Yang X L, Ding W Y. Research progress on millet protein., 2010, 25(8): 123-128. (in Chinese)
(責(zé)任編輯 李莉)
A Spatial partition Statistical Analysis for quality and agronomic traits of foxtail millet germplasm resources
CHEN Yanqing, CAO Yongsheng, CHEN Lina, FANG Wei
(Institute of Crop Science, Chinese Academy of Agricultural Sciences, Beijing 100081)
【Objective】 The objective of this paper is to analyze the spatial distribution characteristics of related agronomic traits and quality of millet germplasm resources in China, grasp the overall quality in spatial distribution, improve the macro cognition of millet resources and effective protection and utilization. 【Method】 From the point of view of geographical space, the methods of spatial interpolation and spatial clustering were used to study the spatial distribution rules of the related traits of foxtail millet resources. Firstly, spatial interpolation was made for target traits of foxtail millet resources, partition statistics method was used to analyze national grid and interpolation data and the optimized hot spot analysis method was used to get the spatial partition data. Finally, the high value, random value and low value spatial distribution of foxtail millet related traits were found. 【Result】 The results of the distribution of the foxtail millet resources in the country show that the average of crude protein content of foxtail millet resources is (13.98±1.23)%, the range is 10.47%-17.33%, the coefficient of variation is 8.80%. The average of crude fat content is (4.01±0.38)%, the range is 3.08%-5.47%, the coefficient of variation is 9.48%. The average of grain weight per plant is (10.39±4.13) g, the range is 1.65-29.30 g, the coefficient of variation is 39.75%. The average of growth period is (111.46±10.94) d, the range is 79.15-150.43 d, the coefficient of variation is 9.81%. From the aspect of the cluster distribution areas, the average values of crude protein content in low value area, random value area and high value area are (12.80±0.70) %, (13.98±0.39)% and (15.24±0.42)%, respectively, the amplitude of variations of the three areas, respectively, are 10.47%-14.90%, 12.72%-15.30% and 13.61%-17.33%, the variation coefficients of the three areas, respectively, are 5.47%, 2.79% and 2.76%. The average values of crude fat content in low value area, random value area and high value area are (3.69±0.13) %, (3.99±0.16) % and (4.41±0.26)%, respectively, the amplitude of variations of the three areas, respectively, are 3.11%-4.39%, 3.08%-4.48% and 3.57%-5.47%, the variation coefficients of the three areas, respectively, are 3.52%, 4.01% and 5.89%. The average values of grain weight per plant in low value area, random value area and high value area are (6.49±1.84) g, (10.51±1.49)g and (14.44±2.88)g, respectively, the amplitude of variations of the three areas, respectively, are 1.65-13.38 g, 5.42-16.54 g and 7.63-29.30 g, the variation coefficients of the three areas respectively are 23.73%, 14.18% and 19.94%. The average values of growth period in low value area, random value area and high value area are (99.58±6.64)d, (111.89±2.99)d and (121.17±6.04)d, respectively, the amplitude of variations of the three areas, respectively, are 79.15-116.81d, 99.53-124.44 d and 108.34-150.43 d, the variation coefficients of the three areas respectively are6.67%, 2.67% and 4.98%. 【Conclusion】The internal differences in the high value regions of crude protein content are the minimum and these regions are mainly concentrated in Xinjiang and the northeast of Heilongjiang province. The internal differences of the low value regions are the maximum and they are mainly distributed in the central and Eastern zones. Random value regions are mainly distributed in the areas which located between high value and low value regions. The distribution of crude protein content shows an increasing trend in the two sides. On the contrary, the high value regions of crude fat content own the maximum internal differences, which are mainly concentrated in central zones of China, the low value regions’ internal differences are the minimum, which are mainly distributed in Xinjiang and the northeast of China. The distribution of crude fat content shows a decreasing trend in the two sides and the regions are relatively not regular. The internal differences in random value areas of grain weight per plant are the minimum, and the high value areas are the maximum. Ningxia, Shanxi, Shaanxi and other places belong to the high value areas of grain weight per plant, Heilongjiang, Zhejiang, northern Inner Mongolia, southern Anhui and southwestern parts belong to the low value areas. The internal differences in random value areas of growth period are the minimum, and the low value areas are the maximum. The growth period of foxtail millet in Northeast China, northwest and southwest Henan is relatively long, and Shandong, Hebei and other areas where summer foxtail millet is planted, belong to the short growth period regions.
foxtail millet; germplasm resources; target traits; spatial interpolation; spatial distribution
2016-12-23;接受日期:2017-04-21
國家農(nóng)作物種質(zhì)資源平臺(NICGR2016)、農(nóng)作物種質(zhì)資源保護(hù)與利用專項(2016NWB036-10)
陳彥清,Tel:010-62186693;E-mail:chenyanqing@caas.cn。通信作者方溈,Tel:010-62186693;E-mail:fangwei@caas.cn