亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的新疆原棉品質(zhì)預(yù)測(cè)模型研究

        2025-03-15 00:00:00陸永迪李培松郭郁張啟鵬劉韜奮王天合楊明鳳向?qū)?/span>田景山張旺鋒

        摘要:新疆原棉品質(zhì)存在顯著的區(qū)域性差異,溫、光等氣候因素與其密切相關(guān)且影響較大,為明確氣象因子與原棉品質(zhì)的關(guān)系及科學(xué)預(yù)測(cè)原棉品質(zhì)變化趨勢(shì)和區(qū)域分布,本文開展基于機(jī)器學(xué)習(xí)算法的新疆原棉品質(zhì)預(yù)測(cè)模型研究,尋求適宜原棉品質(zhì)指標(biāo)與氣象因子的最優(yōu)預(yù)測(cè)模型,對(duì)新疆棉花生產(chǎn)管理和品質(zhì)提升具有重要意義。本研究利用2015—2022年新疆各植棉縣(市)原棉品質(zhì)公證檢驗(yàn)數(shù)據(jù)和氣象數(shù)據(jù),通過大數(shù)據(jù)分析氣象因素對(duì)纖維品質(zhì)的相對(duì)貢獻(xiàn)率及其關(guān)系;采用隨機(jī)森林(Random Forest,RF)、支持向量回歸算法(Support Vactor Regression,SVR)2種機(jī)器學(xué)習(xí)算法構(gòu)建氣象因子與纖維品質(zhì)的預(yù)測(cè)模型。結(jié)果表明,棉花生育期氣象特征變量與原棉品質(zhì)存在多重共線性,使用隨機(jī)森林算法計(jì)算不同氣象特征變量組合對(duì)原棉品質(zhì)指標(biāo)的方差解釋率,選擇方差解釋率較高的氣象特征變量組合作為模型輸入變量,得到相應(yīng)的原棉品質(zhì)指標(biāo)預(yù)測(cè)結(jié)果。與支持向量機(jī)模型相比,隨機(jī)森林模型能準(zhǔn)確地預(yù)測(cè)原棉纖維長(zhǎng)度、斷裂比強(qiáng)度、馬克隆值和整齊度指數(shù),預(yù)測(cè)精度均在88.59%以上,均方根誤差(RMSE)為0.082 6~0.319 2。因此,隨機(jī)森林算法能更好的隨機(jī)選擇最優(yōu)樣本訓(xùn)練集,在解決自變量多重共線性方面有較大的優(yōu)勢(shì);隨機(jī)森林算法對(duì)自變量進(jìn)行特征選擇會(huì)明顯提高模型的準(zhǔn)確性,用以預(yù)測(cè)原棉纖維長(zhǎng)度、斷裂比強(qiáng)度和整齊度指數(shù)的性能更好。

        關(guān)鍵詞:原棉品質(zhì);預(yù)測(cè)模型;溫度;特征選擇

        中圖分類號(hào):S562文獻(xiàn)標(biāo)志碼:A文獻(xiàn)標(biāo)識(shí)碼

        DOI:10.13880/j.cnki.65-1174/n.2025.23.001

        文章編號(hào):1007-7383(2025)01-0055-13

        Machine learning model for predicting cotton fiber quality in Xinjiang Region

        LU" Yongdi1,LI" Peisong1,GUO" Yu1,ZHANG" Qipeng1,LIU" Taofen1,WANG" Tianhe1,YANG" Mingfeng2,XIANG" Dao2,TIAN" Jingshan1*,ZHANG" Wangfeng1

        (1 Agricultural College/Key Laboratory of Oasis Ecological Agriculture of Xinjiang Production and Construction Corps,Shihezi University, Shihezi,Xinjiang 832003,China;

        2 Ulanwusu Agrometeorological Experiment Station, Shihezi Meteorological Bureau, Shihezi,Xinjiang 832003,China)

        Abstract:" There are significant regional differences in raw cotton quality in Xinjiang, and climate factors such as temperature and light are closely related to it and have great influence. In order to clarify the relationship between meteorological factors and raw cotton quality and scientifically predict the change trend and regional distribution of raw cotton quality, this paper studies the prediction model of raw cotton quality in Xinjiang based on machine learning algorithm, and seeks the optimal prediction model suitable for raw cotton quality indicators and meteorological factors, which will be of great significance for cotton production management and quality improvement in Xinjiang. In this study, the relative contribution rate of meteorological factors to fiber quality and their relationship were analyzed by using the notarization inspection data and meteorological data of raw cotton quality in cotton-growing counties (cities) in Xinjiang from 2015 to 2022. Two machine learning algorithms, Random Forest (RF) and Support Vactor Regression (SVR), are used to build the prediction model of meteorological factors and fiber quality. The results show that there are multiple collinearities between meteorological characteristic variables in cotton growth period and raw cotton quality. The random forest algorithm is used to calculate the variance explanatory rate of different meteorological characteristic variable combinations on raw cotton quality indexes, and the meteorological characteristic variable combinations with higher variance explanatory rate are selected as the model input variables, and the corresponding raw cotton quality index prediction results are obtained. Compared with the support vector machine model, the random forest model can accurately predict the fiber length, breaking tenacity, micronaire and uniformity index of raw cotton fiber, with the prediction accuracy above 88.59% and the root mean square error RMSE between 0.082 6 and 0.319 2. Therefore, the random forest algorithm can better randomly select the optimal sample training set, which has great advantages in solving the multicollinearity of independent variables; The random forest algorithm can obviously improve the accuracy of the model by selecting the characteristics of independent variables, and it has better performance in predicting the fiber length, breaking tenacity, micronaire and uniformity index of raw cotton fibers.

        Key words: raw cotton quality;prediction model;temperature;feature selection

        纖維品質(zhì)是重要的紡織工業(yè)原料,優(yōu)良纖維品質(zhì)有利于提高國(guó)際市場(chǎng)競(jìng)爭(zhēng)力1。新疆是我國(guó)重要的棉花生產(chǎn)基地,通過氣象因素科學(xué)預(yù)測(cè)新疆原棉纖維品質(zhì)的變化趨勢(shì)和區(qū)域分布,將對(duì)棉花區(qū)域生產(chǎn)與紡織企業(yè)用棉需求具有重要意義。前人的研究大多基于數(shù)學(xué)理論和建模,其中作物產(chǎn)量預(yù)測(cè)模型的研究報(bào)道較多。一些學(xué)者通過隨機(jī)森林模型構(gòu)建多種變量組合模型,明確了冬小麥實(shí)際單產(chǎn)、氣象產(chǎn)量和相對(duì)氣象產(chǎn)量的關(guān)系,對(duì)冬小麥產(chǎn)量進(jìn)行回歸預(yù)測(cè),結(jié)合袋外數(shù)據(jù)重要性提出了突破冬小麥產(chǎn)量限制因子的關(guān)鍵技術(shù)途徑2-3。唐子竣等4采用支持向量機(jī)、隨機(jī)森林和反向神經(jīng)網(wǎng)絡(luò)模型引入一階微分光譜指數(shù),構(gòu)建出大豆產(chǎn)量最優(yōu)估算模型。季宇5使用灰色系統(tǒng)理論GM(1, 1)模型與時(shí)間序列算法的組合算法模型,能夠較好且穩(wěn)定的預(yù)測(cè)玉米產(chǎn)量趨勢(shì)變化情況。Sungha等6采用決策樹、隨機(jī)森林、回歸支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、堆疊稀疏自動(dòng)編碼器、卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶等多種機(jī)器學(xué)習(xí)方法準(zhǔn)確預(yù)測(cè)水稻、玉米和大豆的產(chǎn)量趨勢(shì)?;貧w模型和機(jī)器學(xué)習(xí)模型都能很好地再現(xiàn)觀察到的產(chǎn)量模式,但基于過程作物模型的使用協(xié)調(diào)參數(shù)存在很大偏差7;在收益率概率分布方面,機(jī)器學(xué)習(xí)模型的預(yù)測(cè)表現(xiàn)最好,其次是回歸模型和基于過程模型8。從宏觀尺度來看,機(jī)器學(xué)習(xí)模型預(yù)測(cè)作物產(chǎn)量的性能優(yōu)于回歸模型和基于過程模型,對(duì)產(chǎn)量變異性的解釋度為93%,回歸模型和基于過程模型僅有42%~51%[8;與LASSO回歸方法相比,基于機(jī)器學(xué)習(xí)算法構(gòu)建的作物產(chǎn)量預(yù)測(cè)經(jīng)驗(yàn)?zāi)P透鼉?yōu)9。從區(qū)域尺度來看,卷積神經(jīng)網(wǎng)絡(luò)、高斯過程回歸和長(zhǎng)短期記憶網(wǎng)絡(luò)能更好的預(yù)測(cè)縣級(jí)冬小麥產(chǎn)量,得到了相對(duì)較好的決策結(jié)果10-11;利用隨機(jī)森林、長(zhǎng)短期記憶網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)結(jié)合多源環(huán)境變量也更好的預(yù)測(cè)了縣級(jí)小麥產(chǎn)量趨勢(shì)12?;跊Q策樹的隨機(jī)森林模型已被廣泛應(yīng)用13-15,并在產(chǎn)量預(yù)測(cè)方面均有較好的表現(xiàn)11,16。目前,用于作物品質(zhì)預(yù)測(cè)模型有時(shí)間序列法、傳統(tǒng)回歸預(yù)測(cè)模型、多元線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型等,但這些方法存在較大的局限性。GM(1, 1)預(yù)測(cè)模型是基于一階常微分方程,通過小樣本數(shù)據(jù)建立數(shù)學(xué)預(yù)測(cè)模型,對(duì)于短期預(yù)測(cè)有較高的精度,更適用于小樣本數(shù)據(jù)和貧信息序列的預(yù)測(cè)17-18。多元線性回歸模型主要用于中長(zhǎng)期預(yù)測(cè),也能直觀的顯示解釋變量對(duì)被解釋變量的影響,但會(huì)因多重共線性問題造成大量信息損失和較大誤差19??梢?,機(jī)器學(xué)習(xí)算法在非線性擬合上具有較好擬合能力,傳統(tǒng)機(jī)器學(xué)習(xí)的隨機(jī)森林算法可以從大量數(shù)據(jù)和參數(shù)中篩選出影響纖維品質(zhì)的關(guān)鍵參數(shù),支持向量機(jī)算法在處理高維數(shù)據(jù)時(shí)有很強(qiáng)的學(xué)習(xí)能力。

        機(jī)器學(xué)習(xí)預(yù)測(cè)模型雖已廣泛應(yīng)用于產(chǎn)量預(yù)測(cè),但在作物品質(zhì)預(yù)測(cè)方面的研究較少,且主要集中于品質(zhì)時(shí)空分布規(guī)律的研究。我國(guó)棉花加工企業(yè)生產(chǎn)的原棉實(shí)施包包檢測(cè),基于新疆歷年原棉公證檢驗(yàn)數(shù)據(jù),使用機(jī)器學(xué)習(xí)算法構(gòu)建氣象因子影響纖維品質(zhì)的預(yù)測(cè)模型具有重要意義。本研究利用2015—2022年新疆各植棉縣(市)原棉品質(zhì)公證檢驗(yàn)數(shù)據(jù)和氣象數(shù)據(jù),采用隨機(jī)森林和支持向量回歸算法,通過大數(shù)據(jù)分析氣象因素對(duì)纖維品質(zhì)的相對(duì)貢獻(xiàn)及其關(guān)系,篩選出適宜纖維品質(zhì)各指標(biāo)的最優(yōu)預(yù)測(cè)模型,以期為棉花區(qū)域性育種和生產(chǎn)提供理論支撐。

        1 材料與方法

        1.1 數(shù)據(jù)來源

        原棉品質(zhì)數(shù)據(jù)來源于中國(guó)纖維質(zhì)量檢測(cè)中心(http://www.ccqsc.gov.cn/),有1 041余家新疆棉花加工企業(yè)2015—2022年的纖維長(zhǎng)度、斷裂比強(qiáng)度、馬克隆值、整齊度指數(shù)等原棉品質(zhì)等級(jí)數(shù)據(jù)。農(nóng)業(yè)氣象數(shù)據(jù)來源于國(guó)家氣象科學(xué)數(shù)據(jù)中心(http://data.cma.cn),選擇新疆23個(gè)氣象站點(diǎn),收集并計(jì)算棉花發(fā)育關(guān)鍵時(shí)期7—8月逐日的平均氣溫(Tave)、最低氣溫(Tmin)、最高氣溫(Tmax)、日溫差(DTR)、降水量(Prec)、日照時(shí)數(shù)(Sun)、≥10℃有效積溫(GDDs≥10℃)、≥12℃有效積溫(GDDs≥12℃)、≥15℃有效積溫(GDDs≥15℃)、≥20℃有效積溫(GDDs≥20℃)。

        統(tǒng)計(jì)新疆各縣(市)2015—2022年棉花播種面積,選取植棉面積≥2.0×104 hm2的植棉縣(市)作為研究區(qū)域,并剔除原棉品質(zhì)數(shù)據(jù)和氣象數(shù)據(jù)缺失的部分縣(市),共選定了25個(gè)縣(市),其中北疆產(chǎn)棉區(qū)包括呼圖壁縣、博樂市、精河縣、沙灣市、烏蘇市、瑪納斯縣、第八師石河子市7個(gè)縣(市),南疆產(chǎn)棉區(qū)包括尉犁縣、沙雅縣、庫(kù)爾勒市、阿克蘇市、莎車縣、麥蓋提縣、巴楚縣、伽師縣、阿瓦提縣、新和縣、岳普湖縣、輪臺(tái)縣、庫(kù)車市、第一師阿拉爾市、第二師鐵門關(guān)市15個(gè)縣(市),東疆產(chǎn)棉區(qū)包括哈密市伊州區(qū)、吐魯番市高昌區(qū)、第十三師新星市3個(gè)縣(市)。

        1.2 數(shù)據(jù)計(jì)算與特征歸一化

        獲取的原棉品質(zhì)數(shù)據(jù)是每個(gè)棉花加工企業(yè)不同品質(zhì)等級(jí)的檢測(cè)包數(shù)。首先,匯總每個(gè)棉花加工企業(yè)歷年原棉品質(zhì)等級(jí)的檢驗(yàn)包數(shù),根據(jù)公式(1)計(jì)算其原棉品質(zhì)指標(biāo)的數(shù)值;然后,按照棉花加工企業(yè)所處經(jīng)緯度劃分至歸屬縣(市),計(jì)算出每個(gè)縣(市)原棉品質(zhì)的平均值。

        Fc=∑niFiWi∑niWi.(1)

        式中Fc是加權(quán)計(jì)算的原棉品質(zhì)數(shù)值;Fi是第i個(gè)棉花加工企業(yè)不同原棉品質(zhì)等級(jí)的取值,均取等級(jí)區(qū)間的中位數(shù),如29 mm級(jí)取值為29.5 mm、比強(qiáng)度的強(qiáng)級(jí)(29.0~30.9 cN/tex)取值為30.0 cN/tex;Wi是原棉品質(zhì)等級(jí)所對(duì)應(yīng)的公檢包數(shù)。

        獲取的原棉品質(zhì)參數(shù)包括長(zhǎng)度、斷裂比強(qiáng)度、馬克隆值和整齊度指數(shù)4個(gè)指標(biāo),氣象參數(shù)包括平均氣溫、最低氣溫、最高氣溫、日溫差、降水量、日照時(shí)數(shù)、≥10℃有效積溫、≥12℃有效積溫、≥15℃有效積溫和≥20℃有效積溫10個(gè)指標(biāo)。為了避免數(shù)據(jù)量綱的影響和特征間的差異性,所有數(shù)據(jù)根據(jù)公式(2)、公式(3)進(jìn)行特征歸一化計(jì)算;采用區(qū)間放縮法對(duì)每個(gè)縣(市)原棉品質(zhì)數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行線性變換,將特征值映射到[0, 1]11,20。

        X′i=Xi-XminXmax-Xmin,(2)

        F′c=FC-FCminFCmax-FCmin.(3)

        式中,Xi代表氣象數(shù)據(jù)平均氣溫、最低氣溫、最高氣溫、日溫差、降水量、日照時(shí)數(shù)、≥10℃有效積溫、≥12℃有效積溫、≥15℃有效積溫、≥20℃有效積溫,Xmax是氣象數(shù)據(jù)序列中最大值,Xmin是氣象數(shù)據(jù)序列中最小值,X′i是歸一化后的氣象數(shù)據(jù);Fc是加權(quán)計(jì)算的原棉品質(zhì)數(shù)值,F(xiàn)Cmin是原棉品質(zhì)數(shù)據(jù)的最小值,F(xiàn)Cmax是原棉品質(zhì)數(shù)據(jù)的最大值,F(xiàn)′c是歸一化后的品質(zhì)數(shù)據(jù)。

        1.3 隨機(jī)森林與支持向量機(jī)

        隨機(jī)森林算法是一種集成機(jī)器學(xué)習(xí)算法21,在訓(xùn)練、調(diào)參等方面簡(jiǎn)單有效,是目前比較流行的一種算法,在分類和回歸問題的研究領(lǐng)域都有涉及,回歸預(yù)測(cè)過程如圖1。首先,對(duì)原始的原棉品質(zhì)數(shù)據(jù)和氣象因子數(shù)據(jù)訓(xùn)練集進(jìn)行bootstrap重新抽樣,構(gòu)成新訓(xùn)練集并生成決策樹;其次,隨機(jī)選擇部分變量進(jìn)行決策樹節(jié)點(diǎn)的確定,生成幾百至幾千個(gè)決策樹構(gòu)成隨機(jī)森林,所有決策樹的平均值作為原棉品質(zhì)各指標(biāo)的預(yù)測(cè)值22-23。隨機(jī)森林模型采用R語(yǔ)言的Random Forest包執(zhí)行,函數(shù)random forest ()包括決策樹節(jié)點(diǎn)分裂時(shí)所用變量個(gè)數(shù)(mtry)和決策樹的數(shù)量(ntree)兩個(gè)影響模型準(zhǔn)確性的參數(shù)20;采用五折交叉驗(yàn)證和隨機(jī)網(wǎng)格搜索對(duì)訓(xùn)練集進(jìn)行超參數(shù)調(diào)優(yōu),mtry參數(shù)采用逐個(gè)嘗試方式找到比較理想的閾值,ntree參數(shù)是在誤差穩(wěn)定條件下選擇較小的閾值24。

        支持向量機(jī)回歸是一種利用核函數(shù)檢測(cè)高維特征空間中最優(yōu)回歸超平面的回歸方法,根據(jù)訓(xùn)練數(shù)據(jù)樣本來尋找合適的、擬合效果最好的函數(shù)模型與參數(shù),運(yùn)用擬合函數(shù)對(duì)將來某個(gè)或某些時(shí)刻的數(shù)據(jù)進(jìn)行回歸并預(yù)測(cè)。在回歸建模時(shí),需要先確定核函數(shù)與懲罰系數(shù)Cost、核函數(shù)內(nèi)部參數(shù)Gamma,使用網(wǎng)格搜索法進(jìn)行參數(shù)尋優(yōu);模型構(gòu)建使用RStudio軟件的e1071包實(shí)現(xiàn)25。

        將獲取的2015—2022年原棉品質(zhì)指標(biāo)和氣象參數(shù)數(shù)據(jù)集劃分成75%訓(xùn)練集和25%驗(yàn)證集,即從216個(gè)樣本點(diǎn)中隨機(jī)選取162個(gè)樣點(diǎn)用來訓(xùn)練模型,其余54個(gè)樣點(diǎn)用來測(cè)試驗(yàn)證模型。采用驗(yàn)證集的均方根預(yù)測(cè)誤差(RMSE)和精度(Accuracy)來衡量模型預(yù)測(cè)的準(zhǔn)確性20。

        RMSE=∑ni=1[Z^(Xi)-Z(Xi)]2n,(4)

        Accuracy=1-1n∑ni=1[Z^(Xi)-Z(Xi)]2Z-(Xi).(5)

        式中,n代表驗(yàn)證集中的樣點(diǎn)個(gè)數(shù),Z^(Xi)代表預(yù)測(cè)值,Z(Xi)代表實(shí)測(cè)值,Z-(Xi)代表實(shí)測(cè)值的平均值。

        2 結(jié)果與分析

        2.1 氣象因子相關(guān)性分析和多元共線性診斷

        通過計(jì)算氣象因子與纖維長(zhǎng)度、馬克隆值、斷裂比強(qiáng)度和整齊度的Pearson相關(guān)系數(shù),由圖2可看出,纖維長(zhǎng)度和整齊度指數(shù)與日照時(shí)數(shù)(Sun)和降水量(Prec)呈正相關(guān),與其它溫度變量則呈負(fù)相關(guān)性;馬克隆值與平均氣溫(Tave)、最高氣溫(Tmax)、最低氣溫(Tmin)及日溫差(DTR)呈正相關(guān)關(guān)系,與日照時(shí)數(shù)(Sun)、降水量(Prec)和積溫呈負(fù)相關(guān)關(guān)系;斷裂比強(qiáng)度則與平均氣溫(Tave)、最低氣溫(Tmin)、日照時(shí)數(shù)(Sun)和有效積溫呈正相關(guān)關(guān)系,而與最高氣溫(Tmax)、降雨量(Prec)和日溫差(DTR)之間是負(fù)相關(guān)關(guān)系?!?0℃有效積溫、≥12℃有效積溫、≥15℃有效積溫和≥20℃有效積溫之間存在高度相關(guān)性,其中≥12℃有效積溫和≥20℃有效積溫相關(guān)系數(shù)達(dá)到了0.99。

        氣象數(shù)據(jù)來源于新疆23個(gè)氣象站點(diǎn)的2015—2022年7—8月逐日資料;Tmax是最高氣溫;Tmin是最低氣溫;Tave是平均氣溫;Sun是日照時(shí)數(shù);DTR是日溫差;Prec是降水量;GDDs≥20 ℃、GDDs≥15 ℃、GDDs≥12 ℃、GDDs≥10 ℃分別是2015—2022年7月和8月份≥20 ℃、≥15 ℃、≥12 ℃、≥10 ℃有效積溫;Len是纖維長(zhǎng)度、Mic是馬克隆值、Str是斷裂比強(qiáng)度、Uni是整齊度指數(shù)。

        由表1可看出,隨著氣象因子變量的維數(shù)增多,特征值接近于0,條件指數(shù)也變大,多個(gè)自變量解釋的比例也較大,說明自變量間存在一定的共線性。隨機(jī)森林算法能更好地處理有多重共線性的數(shù)據(jù)。

        2.2 影響原棉品質(zhì)各氣象因子的相對(duì)重要性

        隨機(jī)森林算法可以評(píng)估每個(gè)特征變量的重要性,每個(gè)變量的相對(duì)重要性由“%IncMSE”指標(biāo)評(píng)估,%IncMSE值越大表明自變量相對(duì)目標(biāo)變量的重要性越高。由圖3所示,纖維長(zhǎng)度主要受棉鈴發(fā)育期平均氣溫(Tave)、最低氣溫(Tmin)和有效積溫(GDDs≥20℃)的影響,日照時(shí)數(shù)(Sun)對(duì)馬克隆值的影響最大。在對(duì)纖維斷裂比強(qiáng)度評(píng)估時(shí),GDDs≥20℃得分最高;整齊度指數(shù)的排序中則是Tmax得分最高。Prec相對(duì)所有指標(biāo)的重要性均低,其范圍在0.001%~5.900%,在纖維品質(zhì)指標(biāo)預(yù)測(cè)中的作用較小。

        Tmax是最高氣溫;Tmin是最低氣溫;Tave是平均氣溫;Sun是日照時(shí)數(shù);DTR是日溫差;Prec是降水量;GDDs≥20 ℃、GDDs≥15 ℃、GDDs≥12 ℃、GDDs≥10 ℃分別是2015—2022年7月和8月份≥20 ℃、≥15 ℃、≥12 ℃、≥10 ℃有效積溫;Length是原棉纖維長(zhǎng)度、Micronaire是馬克隆值、Strength是纖維斷裂比強(qiáng)度、Uniformity是整齊度指數(shù)。

        2.3 回歸模型構(gòu)建結(jié)果及精度比較

        2.3.1 纖維長(zhǎng)度

        由表2和圖4可知,當(dāng)特征變量為棉鈴發(fā)育期Tmax和Tmin時(shí),纖維長(zhǎng)度的解釋率最高,為15.45%。因此,選取棉鈴發(fā)育期Tmax和Tmin作為主要特征變量與纖維長(zhǎng)度進(jìn)行基于隨機(jī)森林模型的回歸預(yù)測(cè),且最優(yōu)參數(shù)呈現(xiàn)mtry為1和ntree為500。

        由圖5可看出,當(dāng)支持向量機(jī)回歸模型使用多項(xiàng)式核函數(shù)poly時(shí),均方根誤差(RMSE)為0.5757,使用線性核函數(shù)linear和徑向基核函數(shù)rbf的RMSE分別為0.5888和0.5981。支持向量機(jī)回歸模型可選擇多項(xiàng)式核函數(shù)poly,且多項(xiàng)式核函數(shù)的度數(shù)為3。該模型配置了三階多項(xiàng)式核函數(shù),通過五折交叉驗(yàn)證法和網(wǎng)格搜索法尋找得到核函數(shù)的縮放參數(shù)sigma和懲罰參數(shù)Cost,最優(yōu)值分別是0.1和0.5。

        由表3可看出,當(dāng)僅引入棉鈴發(fā)育期Tmax和Tmin作為輸入變量時(shí),隨機(jī)森林模型在訓(xùn)練集上的RMSE為0.3192、精度為89.24%,在驗(yàn)證集上的RMSE為0.3489、精度為89.03%。與隨機(jī)森林模型相比,支持向量機(jī)回歸模型的精度和性能(在訓(xùn)練集上RMSE=0.5800、精度為88.58%,在驗(yàn)證集上RMSE=0.3961、精度為88.86%)均更低。當(dāng)引入了全部特征變量組合作為輸入變量時(shí),隨機(jī)森林模型在訓(xùn)練集上表現(xiàn)出較好的性能,RMSE為0.3132,精度達(dá)到90.26%;但在驗(yàn)證集上的性能降低,精度為88.89%,RMSE為0.3973。支持向量機(jī)回歸模型則在使用全部特征組合時(shí),訓(xùn)練集上性能相對(duì)較好,RMSE為0.2581、精度達(dá)90.67%,驗(yàn)證集上的精度也達(dá)89.09%,相比隨機(jī)森林模型其性能更高。

        2.3.2 馬克隆值

        由表4可看出,當(dāng)引入氣象特征變量Sun和Prec時(shí),對(duì)馬克隆值的方差解釋率最高,為10.64%,可選擇Sun和Prec作為馬克隆值預(yù)測(cè)模型的主要變量。由圖4可知,可選擇在最優(yōu)參數(shù)mtry為1和ntree為500條件下進(jìn)行隨機(jī)森林模型的回歸預(yù)測(cè)。

        由圖6可知,支持向量機(jī)回歸模型選擇多項(xiàng)式核函數(shù)poly的RMSE為0.1558,相較于使用線性核函數(shù)linear和徑向基核函數(shù)rbf表現(xiàn)出更高的預(yù)測(cè)精度;支持向量機(jī)回歸模型使用多項(xiàng)式核函數(shù)預(yù)測(cè)馬克隆值有顯著優(yōu)勢(shì),模型多項(xiàng)式核函數(shù)的度數(shù)選擇1,通過五折交叉驗(yàn)證法和網(wǎng)格搜索法尋找得到核函數(shù)的縮放參數(shù)sigma為0.01、懲罰參數(shù)Cost為0.5。

        由表5可看出,引入Sun和Prec特征變量組合作為模型輸入變量,隨機(jī)森林模型在訓(xùn)練集上的RMSE為0.0826,精度為88.59%;支持向量機(jī)回歸模型在訓(xùn)練集上的RMSE為0.1581,誤差高于隨機(jī)森林模型且精度較低。隨機(jī)森林模型在驗(yàn)證集上的RMSE為0.1566,精度為87.44%;支持向量機(jī)回歸模型在驗(yàn)證集上的RMSE相較于隨機(jī)森林模型更高、為0.1676,其精度也更低、為87.15%。當(dāng)引入全特征變量組合作為模型輸入變量時(shí),隨機(jī)森林模型不論在訓(xùn)練集還是驗(yàn)證集上的性能均優(yōu)于支持向量機(jī)回歸模型(在訓(xùn)練集上RMSE=0.1096,精度為86.33%;在驗(yàn)證集上RMSE=0.1681,精度為83.00%),但隨機(jī)森林模型在特征變量篩選前后的性能相差較小,支持向量機(jī)回歸模型則在特征變量篩選后性能提高。

        2.3.3 斷裂比強(qiáng)度

        由表6可看出,當(dāng)引入Tmax、Tmin、Sun、Prec和GDDs≥12℃變量組合作為輸入變量時(shí),對(duì)斷裂比強(qiáng)度的方差解釋率為22.34%。通過五折交叉驗(yàn)證法得到隨機(jī)森林模型的最優(yōu)參數(shù)組合配置,mtry參數(shù)設(shè)為1,ntree設(shè)為500(圖4)。支持向量機(jī)回歸模型使用線性核函數(shù)linear、徑向基核函數(shù)rbf和多項(xiàng)式核函數(shù)poly時(shí),通過比較模型性能可看出(圖7),徑向基核函數(shù)rbf的RMSE最低,為0.5698,即在預(yù)測(cè)Str時(shí),能夠更精確地逼近測(cè)試集的真實(shí)值。支持向量機(jī)回歸模型選擇徑向基核函數(shù),并通過五折交叉驗(yàn)證和網(wǎng)格搜索法尋找得到其縮放參數(shù)sigma為1,懲罰參數(shù)Cost為0.5。

        由表7可看出,當(dāng)引入選定的特征變量組合Tmax、Tmin、Sun、Prec、GDDs≥12℃作為斷裂比強(qiáng)度模型的輸入變量時(shí),隨機(jī)森林模型(訓(xùn)練集RMSE=0.2863,精度為89.17%;驗(yàn)證集RMSE=0.6876,精度為88.11%)在訓(xùn)練集和驗(yàn)證集上均優(yōu)于支持向量機(jī)回歸模型,表現(xiàn)出更低的RMSE和更高的精度。當(dāng)引入全特征變量組合作為模型輸入變量時(shí),隨機(jī)森林模型和支持向量機(jī)回歸模型性能(在訓(xùn)練集上RMSE=0.3285,精度為89.24%;在驗(yàn)證集上RMSE=0.7350,精度為87.98%)相當(dāng),精度差異較小。但對(duì)隨機(jī)森林模型本身來說,將篩選過的特征變量組合作為輸入變量時(shí),其性能和精度明顯提升,支持向量機(jī)回歸模型性能則沒有提升。

        2.3.4 整齊度指數(shù)

        由表8可看出,當(dāng)引入Tave、Tmax、Tmin、GDDs≥10℃、GDDs≥12℃、GDDs≥15℃、GDDs≥20℃變量組合作為輸入變量時(shí),對(duì)整齊度指數(shù)的解釋貢獻(xiàn)最高,方差解釋率為12.92%。通過五折交叉驗(yàn)證法和網(wǎng)格搜索法得到隨機(jī)森林模型的最優(yōu)參數(shù)組合,mtry參數(shù)設(shè)置為1,ntree參數(shù)設(shè)為500(圖4)。

        由圖8可看出,當(dāng)選擇多項(xiàng)式核函數(shù)poly時(shí),RMSE值為0.5658,線性核函數(shù)linear與徑向基核函數(shù)rbf的RMSE分別為0.6357和0.5747。支持向量機(jī)回歸模型使用多項(xiàng)式核函數(shù)poly,且多項(xiàng)式核函數(shù)的度數(shù)為2。通過五折交叉驗(yàn)證法和網(wǎng)格搜索法得到多項(xiàng)式核函數(shù)的縮放參數(shù)sigma為0.01,懲罰參數(shù)Cost為2。

        從表9可看出,隨機(jī)森林模型在引入篩選的特征變量組合Tave、Tmax、Tmin、GDDs≥10℃、GDDs≥12℃、GDDs≥15℃、GDDs≥20℃作為輸入變量時(shí),隨機(jī)森林模型(訓(xùn)練集RMSE=0.2911,精度為89.74%,驗(yàn)證集RMSE=0.5675,精度為89.53%)的性能及精度均優(yōu)于支持向量機(jī)回歸模型。當(dāng)引入全部特征變量組合作為模型的輸入變量時(shí),隨機(jī)森林模型(訓(xùn)練集RMSE=0.2631,精度為89.77%,驗(yàn)證集RMSE=0.5614,精度為89.52%)的性能及精度是顯著優(yōu)于支持向量機(jī)回歸模型。但就隨機(jī)森林模型本身來說,模型精度及性能與特征篩選前相當(dāng);支持向量機(jī)回歸模型在特征篩選前后,其性能相當(dāng)。

        3 討論與結(jié)論

        3.1 特征選擇對(duì)模型精度的影響

        隨機(jī)森林和支持向量機(jī)在建模時(shí)一般會(huì)考慮多個(gè)與因變量相關(guān)的特征變量24,在基于隨機(jī)森林算法的草原地上生物量遙感估算方法的研究中也得到了相應(yīng)的結(jié)果25。在篩選影響纖維品質(zhì)的關(guān)鍵氣象因子時(shí),很多研究通常使用Pearson相關(guān)分析進(jìn)行篩選。由于氣象因子與棉花纖維品質(zhì)具有強(qiáng)相關(guān)性的前提是呈線性關(guān)系,而本研究中的大部分氣象因子與纖維品質(zhì)之間的線性關(guān)系并不明顯,如果將這些因子輸入到訓(xùn)練模型中,噪聲信息會(huì)影響模型的擬合效果。隨機(jī)森林模型在回歸時(shí)可以輸入很多的特征變量,且可以在輸入前不用對(duì)特征變量進(jìn)行選擇,它可以計(jì)算出每個(gè)自變量對(duì)目標(biāo)變量的貢獻(xiàn),并使變量的識(shí)別更加相關(guān),當(dāng)輸入變量很多時(shí),也能較快的計(jì)算出結(jié)果26-28。所以本研究直接采用隨機(jī)森林算法進(jìn)行特征選擇能有效的降低特征維度、篩選出對(duì)預(yù)測(cè)結(jié)果貢獻(xiàn)較大的特征變量,從而在提高模型精度、減小泛化誤差上發(fā)揮重要作用,是更為科學(xué)有效的方法2,29。

        本研究在預(yù)測(cè)纖維長(zhǎng)度時(shí),支持向量機(jī)回歸模型引入全特征變量組合預(yù)測(cè)的結(jié)果與隨機(jī)森林模型引入全特征變量組合預(yù)測(cè)的結(jié)果相比會(huì)發(fā)現(xiàn),支持向量機(jī)回歸模型在訓(xùn)練集和驗(yàn)證集上的RMSE均高于隨機(jī)森林模型在訓(xùn)練集上的RMSE,并且其精度也更高。而在經(jīng)過篩選的特征變量組合(Tmax、Tmin)下,隨機(jī)森林模型在訓(xùn)練集和驗(yàn)證集上的性能均優(yōu)于支持向量機(jī)回歸模型,其RMSE的值更低且精度更高。并且隨機(jī)森林模型本身相比在特征篩選之前的精度更高,RMSE也更低12,30。在構(gòu)建預(yù)測(cè)馬克隆值的兩種模型中,支持向量機(jī)回歸模型使用全特征變量組合預(yù)測(cè)的結(jié)果與隨機(jī)森林模型使用全特征變量組合預(yù)測(cè)的結(jié)果相比會(huì)發(fā)現(xiàn),支持向量機(jī)回歸模型在訓(xùn)練集和驗(yàn)證集上的RMSE高于隨機(jī)森林模型在訓(xùn)練集上的RMSE,并且其精度也更低。而在經(jīng)過篩選的特征變量組合下,隨機(jī)森林模型在訓(xùn)練集和驗(yàn)證集上的性能均優(yōu)于支持向量機(jī)回歸模型,其RMSE的值更低且精度也更高。對(duì)纖維斷裂比強(qiáng)度進(jìn)行預(yù)測(cè)時(shí),通過比較支持向量機(jī)回歸模型使用全特征變量組合預(yù)測(cè)的結(jié)果與隨機(jī)森林模型使用全特征變量組合預(yù)測(cè)的結(jié)果得出,支持向量機(jī)回歸模型在訓(xùn)練集上的RMSE低于隨機(jī)森林模型在訓(xùn)練集上的RMSE,并且其精度也更高。但是在驗(yàn)證集上,兩者的性能相當(dāng),精度差異也不大。在特征變量組合(Tmax、Tmin、Sun、Prec、GDDs≥12℃)下,隨機(jī)森林模型在訓(xùn)練集和驗(yàn)證集上的性能均優(yōu)于支持向量機(jī)回歸模型,其RMSE的值更低且精度更高。在對(duì)整齊度指數(shù)預(yù)測(cè)時(shí)發(fā)現(xiàn)支持向量機(jī)回歸模型引入全特征變量組合預(yù)測(cè)的結(jié)果與隨機(jī)森林模型引入全特征變量組合預(yù)測(cè)的結(jié)果相比要略低。而在經(jīng)過篩選的特征變量組合下,支持向量機(jī)回歸模型訓(xùn)練集的RMSE增大到了0.5806,但驗(yàn)證集的RMSE和精度與全特征變量組合時(shí)的值相差不大。

        綜上所述,隨機(jī)森林模型在結(jié)合適宜的特征降維后,能夠在保持較高精度的同時(shí)降低模型的復(fù)雜性29,31。相比之下,支持向量機(jī)回歸模型在經(jīng)過特征篩選的變量組合下的訓(xùn)練集RMSE會(huì)有所增加,表明在該特定的特征集上,隨機(jī)森林模型的魯棒性更好。因此,如果需要在減少計(jì)算復(fù)雜度的同時(shí)仍保持高精度的模型,隨機(jī)森林模型是更優(yōu)的選擇。本研究是基于原棉品質(zhì)公正檢驗(yàn)數(shù)據(jù)和建立在棉花生長(zhǎng)的7、8月份去選擇變量,且沒有考慮品種差異、栽培管理等農(nóng)作措施對(duì)原棉品質(zhì)的影響。另外也很少有研究去分析原棉品質(zhì)預(yù)測(cè)的最佳時(shí)間段,如果在今后的研究中能在整個(gè)生長(zhǎng)季節(jié)找到對(duì)原棉品質(zhì)預(yù)測(cè)效果最好的時(shí)間段,通過特征選擇將會(huì)顯著提高預(yù)測(cè)模型的應(yīng)用效果。

        3.2 參數(shù)尋優(yōu)與模型精度的關(guān)系

        在實(shí)際應(yīng)用中,為了使模型達(dá)到最好的預(yù)測(cè)效果,必須調(diào)整其參數(shù)。參數(shù)調(diào)優(yōu)的常用方法有基于梯度的優(yōu)化、網(wǎng)格搜索法、遺傳算法,粒子群優(yōu)化算法在內(nèi)的元啟發(fā)式算法等2,7,26-27,每種方法都有其優(yōu)勢(shì)和局限。本文中使用隨機(jī)網(wǎng)格搜索法對(duì)隨機(jī)森林模型和支持向量機(jī)模型的參數(shù)進(jìn)行調(diào)整,減小了模型的計(jì)算成本,提高了模型的預(yù)測(cè)準(zhǔn)確性。該方法是目前運(yùn)用最廣泛的探索超參數(shù)配置空間最常用的尋參方法7,能夠找到在交叉驗(yàn)證意義下的最高準(zhǔn)確率,即全局最優(yōu)解。在多個(gè)參數(shù)取不同值的情況下,通過列舉所有可能的組合來估計(jì)目標(biāo)函數(shù),這對(duì)于使用小樣本數(shù)據(jù)構(gòu)建模型時(shí)具有重要參考意義。本研究表明,針對(duì)隨機(jī)森林模型和支持向量機(jī)回歸模型進(jìn)行調(diào)參的主要目標(biāo)就是盡可能的降低過擬合程度,使用五折交叉驗(yàn)證法和隨機(jī)網(wǎng)格搜索法相結(jié)合的方式得出最好的預(yù)測(cè)結(jié)果,均是通過梯度迭代方式得到最優(yōu)超參數(shù)組合,較大程度上提高了模型的預(yù)測(cè)精度,從而保證模型的精度和穩(wěn)定性,實(shí)現(xiàn)原棉品質(zhì)的準(zhǔn)確預(yù)測(cè)。本研究是基于歷年原棉品質(zhì)公證檢驗(yàn)數(shù)據(jù),鑒于新疆棉區(qū)試驗(yàn)?zāi)攴莺驼军c(diǎn)數(shù)量有限,導(dǎo)致模型訓(xùn)練樣本較少,參數(shù)優(yōu)化受限,驗(yàn)證精度不高,無法獲得更好的預(yù)測(cè)效果。今后在研究中需要增加訓(xùn)練樣本,進(jìn)行多年多點(diǎn)試驗(yàn)對(duì)模型進(jìn)行優(yōu)化和調(diào)整,建立更精確的預(yù)測(cè)模型。還可以將整個(gè)研究區(qū)域與可測(cè)站點(diǎn)人工搜集到的數(shù)據(jù)進(jìn)行綜合分析,提高預(yù)測(cè)結(jié)果的適用性。此外,還需擴(kuò)展在更多作物,更多相似氣候條件下地區(qū)的應(yīng)用上。此外,單一統(tǒng)計(jì)模型經(jīng)常出現(xiàn)擬合不佳的問題,除了集成學(xué)習(xí)模型之外,可以考慮比個(gè)體表現(xiàn)更好的模型的組合,如混合模型的構(gòu)建。

        3.3 結(jié)論

        隨機(jī)森林算法可以更好的隨機(jī)選擇最優(yōu)樣本訓(xùn)練集和在解決自變量多重共線性的影響方面有較大的優(yōu)勢(shì),且通過隨機(jī)森林算法對(duì)自變量進(jìn)行特征選擇會(huì)明顯提高模型的性能。預(yù)測(cè)原棉品質(zhì)指標(biāo)纖維長(zhǎng)度、斷裂比強(qiáng)度和整齊度指數(shù)時(shí),隨機(jī)森林模型的相對(duì)性能更好,其精度均在88.59%以上,RMSE在0.0826~0.3192。研究結(jié)果有效地預(yù)測(cè)了新疆原棉品質(zhì)各指標(biāo)的變化趨勢(shì)且得出了隨機(jī)森林模型對(duì)品質(zhì)指標(biāo)的預(yù)測(cè)結(jié)果最優(yōu)。因此,隨機(jī)森林模型在原棉品質(zhì)指標(biāo)的預(yù)測(cè)中有一定的適用性和可行性,為棉花生產(chǎn)管理和品質(zhì)提升提供參考依據(jù)。

        參考文獻(xiàn)(References)

        [1] 唐淑榮, 郭瑞林, 韋京艷, 等. 國(guó)家棉花品種區(qū)域試驗(yàn)纖維品質(zhì)時(shí)空分布與發(fā)展趨勢(shì)[J]. 應(yīng)用生態(tài)學(xué)報(bào), 2017, 28(2): 589-602.

        TANG S R, GUO R L, WEI J Y, et al. Trends and temporal-spatial distribution of fiber quality in the national cotton variety regional trials[J]. Chinese Journal of Applied Ecology, 2017, 28(2): 589-602.

        [2] 劉峻明, 和曉彤, 王鵬新, 等. 長(zhǎng)時(shí)間序列氣象數(shù)據(jù)結(jié)合隨機(jī)森林法早期預(yù)測(cè)冬小麥產(chǎn)量[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2019, 35(6): 158-166.

        LIU J M, HE X T, WANG P X, et al. Early prediction of winter wheat yield with long time series meteorological data and random forest method[J]. Transactions of the Chinese Society of Agricultural Engineering, 2019, 35(6): 158-166.

        [3] GASO D V, BERGER A G, CIGANDA V S. Predicting wheat grain yield and spatial variability at field scale using a simple regression or a crop model in conjunction with Landsat images[J]. Computers and Electronics in Agriculture, 2019, 159: 75-83.

        [4] 唐子竣, 張威, 黃向陽(yáng), 等. 基于地面高光譜遙感技術(shù)的大豆產(chǎn)量估算模型研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2024, 55(1): 145-153, 240.

        TANG Z J, ZHANG W, HUANG X Y, et al. Soybean seed yield estimation model based on ground hyperspectral remote sensing technology[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(1): 145-153, 240.

        [5] 季宇. 組合灰色模型在黑土區(qū)玉米產(chǎn)量預(yù)測(cè)中的應(yīng)用[D]. 長(zhǎng)春:吉林農(nóng)業(yè)大學(xué), 2018.

        JI Y. Application of combined grey model in maize yield prediction in black soil area[D]. Jilin Agricultural University, 2018.

        [6] JU S, LIM H, MA J W, et al. Optimal county-level crop yield prediction using MODIS-based variables and weather data: A comparative study on machine learning models[J]. Agricultural and Forest Meteorology, 2021, 307: 108530.

        [7] FENG P Y, WANG B, LIU D L, et al. Incorporating machine learning with biophysical model can improve the evaluation of climate extremes impacts on wheat yield in south-eastern Australia[J]. Agricultural and Forest Meteorology, 2019, 275: 100-113.

        [8] LENG G Y, HALL J W. Predicting spatial and temporal variability in crop yields: an inter-comparison of machine learning, regression and process-based models[J]. Environmental Research Letters, 2020, 15(4): 4027-4040.

        [9] CAI Y P, GUAN K Y, LOBELL D, et al. Integrating satellite and climate data to predict wheat yield in Australia using machine learning approaches[J]. Agricultural and Forest Meteorology, 2019, 274: 144-159.

        [10] WANG X L, HUANG J X, FENG Q L, et al. Winter wheat yield prediction at county level and uncertainty analysis in main wheat-producing regions of China with deep learning approaches[J]. Remote Sensing, 2020, 12(11): 1744.

        [11] HAN J C, ZHANG Z, CAO J, et al. Prediction of winter wheat yield based on multi-Source data and machine learning in China[J]. Remote Sensing, 2020, 12(2): 236.

        [12] CAO J, ZHANG Z, LUO Y C, et al. Wheat yield predictions at a county and field scale with deep learning, machine learning, and google earth engine[J]. European Journal of Agronomy, 2021, 123: 126204.

        [13] REHFELDT G E, CROOKSTON N L, SENZ-ROMERO C, et al. North American vegetation model for land-use planning in a changing climate: A solution to large classification problems[J]. Ecological Applications, 2012, 22(1): 119-141.

        [14] SINGH B, SIHAG P, SINGH K. Modelling of impact of water quality on infiltration rate of soil by random forest regression[J]. Modeling Earth Systems and Environment, 2017, 3(3): 999-1004.

        [15] ZHAO X Z, YU B L, LIU Y, et al. Estimation of poverty using random forest regression with multi-source data: A case study in Bangladesh[J]. Remote Sensing, 2019, 11(4): 375.

        [16] GOPAL P" S M, BHARGAVI R. Performance evaluation of best feature subsets for crop yield prediction using machine learning algorithms[J]. Applied Artificial Intelligence, 2019, 33(7): 621-642.

        [17] 梁毅, 劉世洪. 基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型方法研究[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2012, 45(23): 4924-4930.

        LIANG Y, LIU S H. Research on the combined forecast model method based on BP neural network improved by genetic algorithm [J]. Scientia Agricultura Sinica, 2012, 45(23): 4924-4930.

        [18] 陳榮江, 朱明哲, 孫長(zhǎng)法. 棉花新品種產(chǎn)量品質(zhì)性狀的綜合評(píng)價(jià)及聚類分析[J]. 西北農(nóng)業(yè)學(xué)報(bào), 2007, 16(4): 264-268.

        CHEN R J, ZHU M Z, SUN C F. Synthetic evaluation and cluster analysis on yield and quality characters of new cotton varieties [J]. Acta Agriculturae Boreali-occidentatlis Sinica, 2007, 16(4): 264-268.

        [19] 陶惠林, 徐良驥, 馮海寬, 等. 基于無人機(jī)高光譜遙感數(shù)據(jù)的冬小麥產(chǎn)量估算[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2020, 51(7): 146-155.

        TAO H L, XU L J, FENG H K, et al. Winter wheat yield estimation based on UAV hyperspectral remote sensing data [J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(7): 146-155.

        [20] 姜賽平, 張認(rèn)連, 張維理, 等. 近30年海南島土壤有機(jī)質(zhì)時(shí)空變異特征及成因分析[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2019, 52(6): 1032-1044.

        JIANG S P, ZHANG R L, ZHANG W L, et al. Spatial and temporal variation of soil organic matter and cause analysis in Hainan Island in resent 30 years [J]. Scientia Agricultura Sinica, 2019, 52(6): 1032-1044.

        [21] KRZYWINSKI M, ALTMAN N. Classification and regression trees[J]. Nature Methods, 2017, 14(8): 757-758.

        [22] GENUER R, POGGI J M, TULEAU-MALOT C. Variable selection using random forests[J]. Pattern Recognition Letters, 2010, 31(14): 2225-2236.

        [23] 辜勇, 楊澤昭. 基于隨機(jī)森林的集裝箱多式聯(lián)運(yùn)貨運(yùn)量預(yù)測(cè)[J]. 武漢理工大學(xué)學(xué)報(bào), 2023, 45(1): 35-44.

        GU Y, YANG Z Z. Prediction of container multimodal transport freight volume based on random forest[J]. Journal of Wuhan University of Technology, 2023, 45(1): 35-44.

        [24] 陳兵林, 曹衛(wèi)星, 周治國(guó). 棉花單鈴干物質(zhì)積累分配的分期動(dòng)態(tài)模擬及檢驗(yàn)[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2006, 39(3): 487-493.

        CHEN B L, CAO W X, ZHOU Z G. Simulation and validation of dry matter accumulation and distribution of cotton bolls at different flowering stages [J]. Scientia Agricultura Sinica, 2006, 39(3): 487-493.

        [25] 邢曉語(yǔ), 楊秀春, 徐斌, 等. 基于隨機(jī)森林算法的草原地上生物量遙感估算方法研究[J]. 地球信息科學(xué)學(xué)報(bào), 2021, 23(7): 1312-1324.

        XING X Y, YANG X C, XU B, et al. Remote sensing estimation of grassland aboveground biomass based on random forest[J]. Journal of Geo-information Science, 2021, 23(7): 1312-1324.

        [26] SUN S H, CAO Z H, ZHU H, et al. A survey of optimization methods from a machine learning perspective[J]. IEEE Transactions on Cybernetics, 2020, 50(8): 3668-3681.

        [27] SHAHHOSSEINI M, HU G P, HUBER I, et al. Coupling machine learning and crop modeling improves crop yield prediction in the US Corn Belt[J]. Scientific Reports, 2021, 11: 1606.

        [28] FASSNACHT" F E, POBLETE-OLIVARES J, RIVERO L, et al. Using Sentinel-2 and canopy height models to derive a landscape-level biomass map covering multiple vegetation types[J]. International Journal of Applied Earth Observations and Geoinformation, 2021, 94: 102236.

        [29] 谷曉博, 程智楷, 周智輝, 等. 基于特征降維和機(jī)器學(xué)習(xí)的覆膜冬小麥LAI遙感反演[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2023, 54(6): 148-157, 167.

        GU X B, CHENG Z K, ZHOU Z H, et al. Remote sensing inversion of leaf area index of mulched winter wheat based on feature downscaling and machine learning [J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(6): 148-157, 167.

        [30] 邢卓冉, 張凱, 劉旭東, 等. 基于隨機(jī)森林特征優(yōu)選的雪茄煙葉晾制過程含水率預(yù)測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2024, 40(7): 343-354.

        XING Z R, ZHANG K, LIU X D, et al. Prediction of moisture content in cigar tobacco leaves during the drying process based on random forest feature selection[J]. Transactions of the Chinese Society of Agricultural Engineering, 2024, 40(7): 343-354.

        [31] 韋春宇, 杜婭丹, 程智楷, 等. 基于無人機(jī)遙感植被指數(shù)優(yōu)選的覆膜冬小麥估產(chǎn)研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2024, 55(4): 146-154.

        WEI C Y, DU Y D, CHENG Z K, et al. Yield estimation of mulched winter wheat based on UAV remote sensing optimized by vegetation index [J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(4): 146-154.

        (責(zé)任編輯:編輯郭蕓婕)

        基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(32060440);兵團(tuán)財(cái)政科技計(jì)劃項(xiàng)目(2023AB080);八師石河子市中青年科技創(chuàng)新領(lǐng)軍人才計(jì)劃項(xiàng)目(2023RC03)

        作者簡(jiǎn)介:陸永迪(1997—), 女, 碩士研究生, 研究方向?yàn)閿?shù)學(xué)建模與作物品質(zhì)生態(tài)。

        *通信作者:田景山(1983—), 男, 副教授, 從事作物高產(chǎn)生理與栽培技術(shù)方向的研究, e-mail: tianjs@shzu.edu.cn。

        99久久精品免费看国产情侣| 巨爆中文字幕巨爆区爆乳| √天堂中文官网在线| 人妻少妇被猛烈进入中文字幕 | 日产一区二区三区免费看| 成人国产精品一区二区视频 | 国产人与zoxxxx另类| 国产乱子伦农村叉叉叉| 精品五月天| 青青草伊人视频在线观看| 漂亮人妻被强了中文字幕| 真实国产老熟女无套中出| 中文字幕一区二区人妻| 国产欧美VA欧美VA香蕉在| 久久国产av在线观看| 熟妇人妻精品一区二区视频免费的| 国产乱人对白| 激情欧美日韩一区二区| 好爽~又到高潮了毛片视频 | 欧美jizzhd精品欧美| 久久中文字幕久久久久| 亚洲最大不卡av网站| 极品尤物一区二区三区| 国产成人久久精品77777综合| 日本a在线天堂| 在线观看免费不卡网站| 蜜桃一区二区三区| 国产精品jizz观看| 亚洲中文字幕熟女五十| 91丝袜美腿亚洲一区二区| 国产乱人视频在线播放| 亚洲成在人线电影天堂色| 丝袜美腿亚洲综合在线播放| 日韩精品无码一区二区| 国产精品露脸视频观看| 日韩女人毛片在线播放| 亚洲一区二区三区免费的视频| 亚洲日韩激情无码一区| 国产精品一区二区暴白浆| 亚洲午夜精品国产一区二区三区 | 国内少妇自拍区免费视频|