亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于PCA建立蠟梅花初花期預測模型①

        2022-10-29 03:36:34吉莉劉曉冉武強李強
        關鍵詞:蠟梅實測值花期

        吉莉, 劉曉冉, 武強, 李強

        1.重慶市北碚區(qū)氣象局, 重慶 400700; 2.重慶市氣象科學研究所, 重慶 401147

        蠟梅為蠟梅科蠟梅屬植物, 是珍貴的天然香料植物[1]. 重慶市北碚區(qū)蠟梅種植面積占全市蠟梅總面積的85%, 有500多年種植歷史, 與河南鄢陵、 湖北??挡⒎Q為“中國三大蠟梅基地”, 每年吸引了大量的游客來此地觀賞蠟梅. 科學、 準確地開展蠟梅花期預報可指導人們合理安排時間觀賞蠟梅, 促進當?shù)厣鷳B(tài)旅游發(fā)展.

        關于植物花期與氣候變化規(guī)律, 以及花期預測技術國內(nèi)外均有大量的研究[2-6]. Gonsamo等[7]模擬加拿大19種植物的始花期變化; 劉流等[8]對桂林桃花開花期與氣象要素的關系進行研究, 發(fā)現(xiàn)桃花開花期與當年1月下旬到2月下旬氣溫和上年冬季降水量有顯著的相關性; 張志薇等[9]基于1986-2016年油菜花物候觀測資料, 分析了盛花期的物候特征及與溫度因子的關系; 孫明等[10]基于1990-2020年懸鈴木花的物候資料, 明確了關鍵氣象因子對始花期的定量影響, 并建立預測模型; 岳高峰等[11]以牡丹花花期為預報主體, 選取氣溫、 積溫、 日照和空氣濕度氣象因子進行主成分分析和逐步回歸分析, 建立多元回歸預測模型, 為牡丹文化節(jié)組委會提供決策依據(jù). 相對而言, 由于蠟梅種植面積少, 種植范圍不廣, 對蠟梅花期研究較少, 目前國內(nèi)外關于蠟梅的研究報道主要集中在栽培技術[12-17]、 化學成分、 品種等方面.

        近年來, 機器學習作為人工智能領域的重要分支, 國內(nèi)外越來越多的學者將機器學習技術應用于各個領域, 其中在作物預測方面的研究取得了較好的成績[18-20]. 這些分析方法能夠從多水平、 多因素著手, 綜合分析各指標的整體效應, 使篩選出的結果更具科學性. 本研究以重慶市北碚區(qū)靜觀素心蠟梅早熟品種的初花期為研究對象, 統(tǒng)計分析2007-2021年初花期變化特征, 基于PCA主成分分析法, 通過BP神經(jīng)網(wǎng)絡算法及逐步回歸算法, 對蠟梅初花期預測進行預測試驗, 以期為科學有效開展蠟梅初花期氣象服務提供理論依據(jù)和技術支持.

        1 資料與方法

        1.1 資料

        1.1.1 資料來源

        素心蠟梅初花期是指蠟梅樹枝開花率為20%左右的時間, 素心蠟梅早熟品種初花期2007-2013年資料為課題組對北碚區(qū)靜觀鎮(zhèn)、 柳蔭鎮(zhèn)等地實地走訪調(diào)查所得, 2014-2021年數(shù)據(jù)來源于靜觀蠟梅氣象服務站觀測數(shù)據(jù). 氣象資料是北碚區(qū)國家氣象觀測站2007-2021年逐日資料, 包括平均氣溫、 最低氣溫、 最高氣溫、 降水量、 日照時數(shù)等, 氣溫、 降水量、 日照時數(shù)的日氣象資料統(tǒng)計為旬資料, 雨日數(shù)為日降水量L≥0.1 mm的日數(shù).

        蠟梅初花期轉換為年日序值, 即1月1日為1, 1月2日為2, 以此類推.

        1.1.2 氣象因子

        影響蠟梅花開花的過程主要是受氣溫、 降水、 日照的影響. 光、 溫、 水條件的匹配程度影響初花期的早晚時間, 因此為篩選出對蠟梅花初花期有影響的氣象因子, 本研究將氣溫、 降水、 日照作為預測初花期的初選因子. 蠟梅一般在10月進入長枝期, 11月進入定型期, 花芽逐漸生出, 早熟初花期一般在12月11日左右, 因此本研究主要選取11月的18類氣象因子(表1).

        表1 影響蠟梅初花期的氣象因子

        1.2 研究方法

        1.2.1 PCA

        主成分分析(PCA)[21-22]是通過對協(xié)方差矩陣進行特征分析, 在減少數(shù)據(jù)維數(shù)的同時, 保持數(shù)據(jù)集對方差貢獻最大的目的. 利用數(shù)據(jù)降維的思想, 在損失較少數(shù)據(jù)信息的前提下, 把多個指標轉化成幾個為數(shù)較少的綜合指標的多元分析方法, 各個主成分是原始變量的線性組合, 彼此之間互不相關. 主成分分析以方差作為信息量的測度, 取累計貢獻率大的幾個成分作為主成分.

        1.2.2 BP神經(jīng)網(wǎng)絡預報方法

        BP神經(jīng)網(wǎng)絡算法是目前應用最廣泛的預測方法, 其基本思想是工作信號正向傳遞和誤差信號反向傳遞兩個子過程, 學習規(guī)則和目標是使用最速下降法, 通過反向傳播不斷調(diào)整網(wǎng)絡的權值和閾值使全局誤差系數(shù)最小, 學習本質(zhì)是對連接權值的動態(tài)調(diào)整. 基本結構由輸入層、隱層和輸出層構成[23].

        1.2.3 逐步回歸預報方法

        采用回歸方法是根據(jù)自變量的取值來預測因變量的取值[24-25], 以變量對目標的影響程度大小, 從大到小逐個引入回歸方程, 再對回歸方程所含的變量進行檢驗, 顯著則引入方程, 不顯著則剔除, 直到?jīng)]有顯著因素可以引入, 或不顯著變量需剔除為止. 本文主要選取主成分作為初花期預測因子, 采用SPSS軟件, 利用“步進法”建立蠟梅花初花期預測模型.

        1.2.4 數(shù)據(jù)評估方法

        偏度系數(shù)是統(tǒng)計數(shù)據(jù)分布偏斜方向和程度的度量, 用于衡量數(shù)據(jù)的對稱性的特征數(shù); 峰度系數(shù)是表征概率密度分布曲線在平均值處峰值高低的特征數(shù). 本研究主要采用SPSS軟件對蠟梅花序日進行正態(tài)分布性檢驗[23].

        1.2.5 數(shù)據(jù)預處理

        通常使用的機器學習算法將數(shù)據(jù)樣本分為訓練集與測試集, 通過訓練集數(shù)據(jù)建立模型, 測試數(shù)據(jù)則用于檢驗模型的泛化能力, 因此在確定建立模型前, 為消除指標之間的量綱影響, 需對數(shù)據(jù)進行歸一化處理. 通過對數(shù)據(jù)進行分段建模的方式擬合, 本研究以2007-2017年有效初花期數(shù)據(jù)作為訓練集數(shù)據(jù), 再選取高影響氣象因子, 以初花期日序為輸入目標, 利用SPPS Modeler軟件構建BP神經(jīng)網(wǎng)絡預測模型和逐步回歸預測模型, 然后利用boosting 集成學習思想, 為每一個訓練樣本賦一個權重, 在每一輪提升過程結束時自動調(diào)整權重, 提高預測模型的泛化能力, 防止模型過度擬合. 最后為進一步驗證該模型的準確性, 對2018-2021的數(shù)據(jù)進行預測效果檢驗.

        2 結果分析

        2.1 蠟梅初花期及氣象要素分析

        由圖1蠟梅花初花期可知, 2007-2021年, 蠟梅初花期主要集中在12月, 平均初花期在12月11日左右, 接近入冬初日. 其中年份較晚的初花期出現(xiàn)在12月18日(2010年), 最早的初花期出現(xiàn)在12月5日(2009年), 最早和最晚的日期相差13 d. 采用偏度和峰度檢驗法, 對蠟梅花序日進行正態(tài)分布性檢驗[23], 計算出花序日時間序列的偏度、 偏度標準差、 峰度、 峰度標準差, 其值分別為-0.134,0.580,-0.055,1.121, 發(fā)現(xiàn)偏度和峰度均在±1.96之間, 說明靜觀蠟梅初花期資料符合正態(tài)分布的特征, 可以通過建立回歸模型進行預報.

        根據(jù)氣象學定義, 入冬日為當年滑動平均氣溫序列連續(xù)5天小于10 ℃, 則以其對應的常年氣溫序列中第一個小于10 ℃的日期作為入冬初日, 由圖1可見入冬日在2007年后略有提前, 2007-2021年蠟梅初花期多數(shù)晚于入冬初期, 相差不超過5 d, 其中入冬初日最早出現(xiàn)日期為2019年11月30日, 蠟梅初花期則為12月14日, 入冬初日最晚出現(xiàn)日期為2007年12月28日, 但是當年蠟梅初花期并未延后, 接近平均初花期.

        圖1 2007-2021年蠟梅花初花期及入冬日變化圖

        對2007-2021年蠟梅花開花前期氣溫趨勢圖(圖2)分析發(fā)現(xiàn), 近16 a的時間段內(nèi), 11月平均氣溫為13.9 ℃, 11月中旬平均氣溫為14.0 ℃, 11月下旬平均氣溫為12.0 ℃, 其中下旬氣溫除2009年為9.8 ℃, 2011年為16.6 ℃外, 氣溫主要集中在10 ℃~14 ℃之間, 其中花日序與11月下旬平均氣溫相關系數(shù)最高(0.444), 這與前人研究結論基本一致[24], 即蠟梅開花時的適宜溫度在10 ℃左右, 溫度越低, 花蕾比例越高, 且隨著溫度的升高, 花蕾開花數(shù)量隨之增加. 由圖2可知,t≥10 ℃活動積溫趨勢與11月中旬平均氣溫趨勢基本一致,t≥10 ℃活動積溫主要集中在221 ℃~432 ℃之間, 其中2015年積溫最大, 為431.2 ℃, 其次是2011年, 為379.1 ℃, 最小值出現(xiàn)在2009年. 花日序與t≥10 ℃活動積溫呈正相關性, 相關系數(shù)為0.486, 說明花期與t≥10 ℃活動積溫的關系較為密切.

        圖2 蠟梅初花期前期氣溫趨勢圖

        2.2 蠟梅花初花期氣象因子篩選

        本研究利用SPSS軟件將表1中的18個氣象因子作為原始輸入變量, 以降維方式提取主成分, 提取出的主成分是原始變量的綜合考量, 簡化數(shù)據(jù)的復雜度. 采用PCA算法分別對18項影響因素進行特征值和特征向量計算, 從表2中可知, 前6個主成分均大于1, 累積貢獻率為85.239%, 對比旋轉載荷平方和的結果, 發(fā)現(xiàn)兩者累計貢獻率一致, 基本上可以反映氣象因子的大部分信息.

        表2 2007-2021年氣象資料主成分特征值和方差貢獻率

        表3是2007-2021年氣象因子主成分特征向量值, 由表3可知, 在第1主成分的特征向量中, 特征值大于0.8的因子是t≥10℃活動積溫、 11月中旬極端最低氣溫、 11月中旬平均氣溫, 說明第1主成分中初花期與11月中旬的氣溫有著緊密的相關性; 在第2主成分的特征向量中, 特征值絕對值大于0.8的因子是11月上旬日照、 11月上旬極端最高氣溫、 11月雨日, 其中正值最大的是11月上旬日照(0.862), 負值最小的是11月雨日(-0.862), 說明第2主成分中初花期與光照和雨水關系較大; 第3主成分的特征向量中, 最大的正值是11月中旬日照, 而最小的負值是11月下旬日照, 說明在第3主成分中初花期主要受日照的影響; 同理, 第4主成分中初花期受11月上旬氣溫的影響較大, 第5主成分中初花期受11月上旬降水和11月下旬最高氣溫的影響較大, 第6主成分中初花期受11月中旬降水的影響較大. 根據(jù)主成分的特征向量, 獲得6個主成分與氣象因子間的線性方程, 即第1主成分(F1)為各氣象因子與主成分系數(shù)的積相加的總和:

        (1)

        表3 2007-2021年氣象資料主成分特征向量

        2.3 預測模型結果分析

        2.3.1 模型構建

        以主成分分析法得到的影響蠟梅花初花期的6個主成分作為預測模型的影響因子, 以蠟梅花初花期年日序為目標, 構建BP網(wǎng)絡神經(jīng)預測模型, 在建立BP神經(jīng)網(wǎng)絡預測模型過程中, 基于Boosting 集成學習思想, 模型的擬合高達99%, 其中預測值與實際值的相關性為0.99, 通過了α=0.01的檢驗, 標準差為0.171, 均方根誤差為0.17.

        以6個主成分作為自變量, 蠟梅花初花期日序為因變量, 利用SPSS軟件, 運用逐步回歸算法建模, 得到預報模型:

        Y=278.196+0.019F2

        (2)

        從模型中可看出, 主成分2是影響蠟梅花初花期的關鍵氣象因子, 結合表3可知, 11月上旬的光照、 氣溫及雨水日數(shù)是影響初花期主要氣象因子. 利用逐步回歸預報模型對2007-2017年的初花期日序進行擬合, 模型預測值與實際值的相關性為0.77, 通過了α=0.01的檢驗, 標準差為2.212, 均方根誤差為2.10.

        繪制模型預測值與實際值對比發(fā)現(xiàn)(圖3), BP模型預測值與實際值的趨勢, 除2008年外, 其余年份的趨勢基本重合, 其中誤差最大年份是2008年, 誤差為1 d; 基于逐步回歸算法的預測值與實測值的誤差較BP神經(jīng)網(wǎng)絡的模型較大, 平均誤差有1.7 d, 最小誤差出現(xiàn)在2011年, 與實測值基本一致; 最大誤差出現(xiàn)在2010年(5 d), 其余年份與實測值基本相差1 d左右.

        圖3 模型預測值與實際值對比圖

        2.3.2 預測模型回代檢驗

        將2018-2021的數(shù)據(jù)代入該模型進行進一步預測效果檢驗, 繪制檢驗結果對比圖(圖4), 從圖中可知, 基于逐步回歸算法的預測模型較基于BP神經(jīng)網(wǎng)絡算法的預測模型的誤差較?。?基于BP神經(jīng)網(wǎng)絡算法的預測模型回代檢驗平均誤差為3.3 d, 其中2019年預測值與實測值誤差最大(提前了5 d), 誤差值最小值出現(xiàn)2021年, 與實測值基本一致, 2018年和2020年均延后了4 d; 基于逐步回歸算法的預測模型的平均誤差為2.1 d, 誤差值最大的年份同樣出現(xiàn)在2019年, 延后了3 d, 誤差值最小的年份出現(xiàn)在2021年, 與實測值基本一致. 造成誤差的原因是由于構建預報模型時出于預報時效性考慮, 選擇11月的氣象要素作為主要因子, 若蠟梅受前期氣象要素的影響, 導致生長期的變化, 花期也易相應得到改變; 同時若臨近預測期的天氣情況有較大的關系, 若常年初花期前出現(xiàn)持續(xù)晴好天氣或者陰雨天氣, 易提前或推遲花期. 因此在實際應用過程中, 需根據(jù)蠟梅生育期情況, 結合實際氣候趨勢, 進行訂正.

        圖4 模型檢驗對比

        2.4 評價

        對比2種建模方法發(fā)現(xiàn)(表4), 在2007-2017年訓練集中, 2種預測模型的效果都較好, 其中基于BP神經(jīng)網(wǎng)絡算法的預測模型效果最好, 其預測值的獨立樣本更接近實測值, 標準差低于基于逐步回歸算法的預測, 線性相關性也較強.

        表4 各模型預測模型的預測值與實測值統(tǒng)計分析

        選取2018-2021年的有效數(shù)據(jù)作為檢驗樣本, 由表4中可知, 2種預測模型的預測效果較訓練時有所下降, 從檢驗樣本來看, 基于逐步回歸算法的預測模型獨立樣本值, 即最大值、 最小值都較基于BP神經(jīng)網(wǎng)絡算法的預測值更接近實測值; 從標準差和平均絕對誤差來看, 同樣基于逐步回歸算法的預測模型表現(xiàn)要優(yōu)于另外一種預測模型. 同時從線性相關性來看, 基于逐步回歸算法的預測模型在建模和回代檢驗的過程中, 線性相關性都較穩(wěn)定, 均在0.78左右. 總體來說, 從預報檢驗結果來看, 基于逐步回歸算法的預測模型在檢驗過程中更優(yōu)于基于BP神經(jīng)網(wǎng)絡算法的預測模型.

        繪制2007-2017年模型預報初花期日序箱線圖(圖5a), 從箱線上下邊緣可見, 基于BP神經(jīng)網(wǎng)絡算法的預測模型較基于逐步回歸算法的模型更接近實測值; 從箱體來看基于逐步回歸算法的模型的預測值較為集中, 箱體主要在343.3~345.6之間, 中位數(shù)344; 基于BP神經(jīng)網(wǎng)絡算法的模型的箱體則在343.2~346.1之間, 中位數(shù)343; 實測值的箱體則在343.25~346之間, 中位數(shù)344. 綜上所述, 基于BP神經(jīng)網(wǎng)絡算法的模型較接近實測值.

        繪制2018-2021年模型預報初花期日序箱線圖(圖5b), 從圖中可知, 2018-2021年實測值整體較為集中, 上邊緣349, 下邊緣345, 上四分位348, 下四分位346, 中位數(shù)347; 基于BP神經(jīng)網(wǎng)絡算法的預測值的上邊緣和上四分位基本接近, 分別是349.34和349.19, 下邊緣342.54, 下四分位343.19, 中位數(shù)346.28; 基于逐步回歸算法的模型的上邊緣348, 下邊緣341.85, 上四分位347.59, 下四分位343.52, 中位數(shù)345.6; 兩個模型對比可見, 基于逐步回歸算法的預報模型較基于BP神經(jīng)網(wǎng)絡算法的模型的最大值與實測值基本一致, 最小值基于BP神經(jīng)網(wǎng)絡算法更接近實測值, 但從整個箱體來看, 基于逐步回歸算法的模型較BP神經(jīng)網(wǎng)絡算法更穩(wěn)定.

        圖5 2007-2021年模型預報初花期日序箱線圖

        3 結論與討論

        為探索蠟梅花早熟品種的初花期的預測, 本研究基于PCA通過BP神經(jīng)網(wǎng)絡算法及逐步回歸算法, 構建了2007-2021年初花期預測模型, 并對2種預測模型的預報效果進行對比檢驗, 篩選最優(yōu)預測模型. 結果表明, 基于BP神經(jīng)網(wǎng)絡算法的預測模型在訓練中的預報擬合率高達99%, 與實測值的相關性超過了0.9, 擬合度較高, 在回代檢驗中擬合率低于訓練時; 基于逐步回歸算法的預測模型在訓練中與實測值誤差大于基于BP神經(jīng)網(wǎng)絡算法, 平均誤差為1.7 d, 在回代檢驗中效果明顯優(yōu)于基于BP神經(jīng)網(wǎng)絡算法, 且線性相關性也較穩(wěn)定; 同時在回代模型中基于逐步回歸算法的預測模型的獨立樣本值、 標準差和平均絕對誤差也同樣優(yōu)于基于BP神經(jīng)網(wǎng)絡算法的預測模型. 總體來說, 基于逐步回歸算法的預測模型更優(yōu)于基于BP神經(jīng)網(wǎng)絡算法的預測模型.

        花期預測模型的基礎就是預報因子的篩選, 主成分分析法(PCA)是機器學習方法中對多指標綜合分析方法, 這種分析方法能夠從多水平、 多因素著手, 綜合分析各指標的整體效應, 使篩選出的結果更具有科學性. 但是蠟梅花開花的生育期, 不僅僅受氣象要素的影響, 還與田間管理、 肥料、 品種等多方面有著密切的關聯(lián), 因此通過機器學習建立預測模型, 還存在一定的偏差. 同時, 本研究蠟梅花的生育期觀測資料還較少, 預測模型還有較大的不確定性, 因此在后續(xù)研究中, 需進行持續(xù)觀測, 收集更多的蠟梅花花期樣本資料, 不斷地調(diào)試模型, 提高預測精度.

        猜你喜歡
        蠟梅實測值花期
        蠟梅
        蠟梅森林的小梅仙
        ±800kV直流輸電工程合成電場夏季實測值與預測值比對分析
        大豆:花期結莢期巧管理
        風中的舞者——蠟梅
        科學大眾(2021年6期)2021-07-20 07:42:50
        《蠟梅報春》
        軍工文化(2021年2期)2021-03-30 08:35:34
        常用高溫軸承鋼的高溫硬度實測值與計算值的對比分析
        哈爾濱軸承(2020年1期)2020-11-03 09:16:22
        市售純牛奶和巴氏殺菌乳營養(yǎng)成分分析
        中國奶牛(2019年10期)2019-10-28 06:23:36
        一種基于實測值理論計算的導航臺電磁干擾分析方法
        電子制作(2018年23期)2018-12-26 01:01:22
        Current status and challenges in sentinel node navigation surgery for early gastric cancer
        国产成人精品蜜芽视频| 小宝极品内射国产在线| 亚洲欧美综合在线天堂| 国产精品国产午夜免费福利看| 亚洲一区二区岛国高清| 极品粉嫩嫩模大尺度无码视频| 少妇高潮惨叫正在播放对白| 亚洲精品亚洲人成在线下载| 亚洲精品乱码久久麻豆| 狠狠cao日日橹夜夜十橹| 国产综合无码一区二区色蜜蜜| 亚洲AV无码精品呻吟| 自拍偷拍一区二区三区四区| 国产精品自线一区二区三区| 东京热人妻一区二区三区| 日韩免费小视频| 一本色道久久88综合亚精品| 中文字幕日韩人妻少妇毛片| 97久久人人超碰超碰窝窝| 国产AV国片精品有毛| 五十路在线中文字幕在线中文字幕| 97se色综合一区二区二区| 中文字幕无码不卡一区二区三区| 国产成年无码久久久免费| 亚洲av乱码国产精品观| 乱码丰满人妻一二三区| 在线精品免费观看| 日本黑人人妻一区二区水多多| 精品国产一区二区三区三| 日本一卡2卡3卡四卡精品网站| 亚洲三级香港三级久久| 国产精品麻豆一区二区三区| √天堂中文官网在线| 精品久久综合亚洲伊人| 亚洲中文字幕熟女五十| 色偷偷久久久精品亚洲| 亚洲一区二区三区成人网站| 天天澡天天揉揉AV无码人妻斩| 中文av字幕一区二区三区| 韩日午夜在线资源一区二区| 亚洲国产成人无码影院|