石建輝,張君亞,李 宏
(云南農業(yè)大學經濟管理學院,云南昆明650201)
甘蔗是世界上最重要的糖料作物、食糖最重要的來源之一,目前中國甘蔗種植面積占全部糖料作物種植面積的 85%以上,產糖量約占食糖產量的88%,是全國糖業(yè)的重要支柱[1]。云南是僅次于廣西的全國第2大甘蔗產區(qū),2017年云南省蔗糖產業(yè)經濟研究室數據顯示,全省約有 150萬戶、600萬蔗農從事甘蔗種植,歷年平均種植面積超過30萬hm2,平均產糖量超過200萬t,對于保障我國食糖供給、滿足食糖需求發(fā)揮了重要作用。然而由于農業(yè)生產的弱質性和蔗糖產業(yè)的特殊性,面對種植、市場和貿易等風險,會出現蔗農生產積極性降低和制糖企業(yè)虧損現象,加大了國內糖市風險,因此蔗糖產業(yè)的風險預警就顯得十分必要。
蔗糖產業(yè)風險包括了甘蔗生產、加工和經營過程中所面臨的來自于自然和社會經濟等方面并最終反映到市場和甘蔗生產上的一切危害和損失。甘蔗預警系統(tǒng)可以根據甘蔗生產和經營過程所出現的細微趨勢或跡象進行預測和警報,從而為生產和經營者進行調控提供參考,減少反應時間,及時規(guī)避風險。
近些年來,國內許多學者對農業(yè)領域進行了風險預警的研究。安曉寧[2]、馬九杰等[3]分別從糧食安全預警的系統(tǒng)設計和指標體系進行了研究,前者認為政府應借助預警理論相關方法,加強預警系統(tǒng)在宏觀調控中的作用,提出在中國早期的糧食安全預警系統(tǒng)設計上應包括信息員系統(tǒng)、信息分析系統(tǒng)和信息反饋系統(tǒng);后者分別在宏、微觀2個方面對糧食安全進行度量,提出了使用食物及膳食能量供求平衡指標、糧食及食物生產和需求狀況指標、安全儲備狀況指標、進出口狀況指標、市場價格穩(wěn)定性指標、糧食安全綜合衡量指標、反映糧食安全的補充性指標的不同區(qū)間代表不同安全程度,建立警戒系統(tǒng)。吳清華、高峰、馮中朝[4]運用BP神經網絡對中國油菜產業(yè)風險進行了預測研究,以油菜籽收購價格波動率為警情指標,驗證得出 BP神經網絡對于油菜價格的波動預測與期望值十分接近,可利用神經網絡模型設計預警系統(tǒng),規(guī)避油菜產業(yè)風險。趙瑞瑩、楊學成[5]以生豬價格波動率為警情指標,建立了基于 BP神經網絡的農產品風險預警模型,認為 BP神經網絡對于農產品風險預警十分可行,可推廣至對其他農產品的警情預報。
通過對比分析諸多學者關于農業(yè)領域預警的研究,結合研究所面臨的實際情況,本文嘗試采用BP神經網絡,對云南蔗糖產業(yè)進行預警分析。首先,結合云南省蔗糖產業(yè)的實際情況,構建蔗糖產業(yè)預警機制的指標體系;其次,通過因子分析判斷云南省蔗糖產業(yè)的主要風險因子,以主要風險因子按其方差貢獻度占總方差百分比為權重,加總得到綜合因子得分為警情指標;最后,依據預測所得的2019/20年榨季的因子得分所處的風險區(qū)間,判斷2019/20年榨季云南蔗糖產業(yè)風險情況。警界范圍的選擇使用3σ原理,即跟據正態(tài)分布特征,以指標因子綜合得分均值μ為中心,以綜合得分的正負一倍標準差、二倍標準差和三倍標準差作為區(qū)間分割點,將所有可能的綜合得分劃分為 5個警報區(qū)間,從左至右依次為:高度風險 1(-3σ,-2σ]、一般風險 1(-2σ,-σ]、無風險(-σ,σ],一般風險 2(σ,2σ]、高度風險2(2σ,3σ]。
1.1.1 因子分析
因子分析通過對原始數據的相關系數矩陣內部結構的分析,將多個關聯的指標轉化為少數不相關的綜合指標,其目的是用少量無關指標代替原來存在多重共線的多個指標,消除共線性,綜合反映原來較多的信息[6]。因子分析認為所有的原始變量都是由公共因子和唯一因子所構成,其中由所有原始變量所共有,并且用以解釋變量之間關系的變量稱為公共因子,不能解釋變量之間關系、由原始變量特有的變量稱為唯一因子。因子分析可以通過提取變量公共因子,對原始變量進行解釋,并通過因子方差貢獻率占總方差的比重和對應因子的得分,計算得出綜合因子得分。
1.1.2 BP神經網絡模型
神經網絡是一種模擬生物神經網絡系統(tǒng)的人工智能技術,有非常強的自學習、自組織、自適應和非線性映射能力,適合于因果關系復雜的非確定性推理、判斷、識別和分類等問題[7]。BP神經網絡是一種誤差反方向傳播網絡,由輸入層、隱層、輸出層組成,分為正向傳播的學習信號和反向傳播的誤差信號。訓練過程中,當實際輸出與期望輸出大于規(guī)定誤差范圍時,進入反向傳播,調整權值,直到誤差減少至允許的范圍。在對蔗糖產業(yè)風險進行預警時,由于需要考慮的因素很多,很難建立有效的模型進行預測,BP神經網絡憑借其非線性逼近能力、強大的學習能力和容錯能力等優(yōu)勢,能準確的對所面臨的風險進行預測。
本研究所采用的數據來源于《云南農業(yè)年鑒》和《云南省統(tǒng)計年鑒》以及云南糖網、沐甜科技、中國糖業(yè)協會等權威數據統(tǒng)計資料和實地調研所得,個別數據的缺失由相關數據計算得出。通過2009/10~2018/19年榨季 10年間的相關統(tǒng)計數據,對云南省蔗糖產業(yè)面臨的風險進行評估預測。根據云南蔗糖產業(yè)發(fā)展所面臨的實際情況以及對國內外產業(yè)風險的歸納總結,本研究將在種植風險、市場風險和貿易風險等3個方面選取評價指標,評價指標設置分為三級,總指標下分3個一級指標,12個二級指標,14個三級指標。具體指標設置如表1。
表1 指標設置
Z-score法是為消除變量間的量綱關系,使數據更有可比性,對數據進行標準化處理一種方法,可通過將數據代入以下公式得到標準化數據結果:
公式(1)為標準化公式,其中,x~為標準化后的數值,xj為第j個榨季指標的數值,μj為第j個榨季指標的均值,sj為第j個榨季指標的標準差;公式(2)為均值公式,其中,m為指標數量,xij為第j個榨季中第i個指標數值;公式(3)為標準差公式,字母含義同上。標準化處理結果如下表2所示。
表2 指標變量標準化處理結果
表3 解釋總方差
利用SPSS 25.0進行因子分析,解釋總方差如表3。通過因子分析,共提出 3個因子,分別記作F1、F2、F3,累計得分為 89.823%,綜合得分記作Ft。其中,F1主要描述種植風險中旱地成本、水田成本和水澆地成本;F2主要描述入榨量和產糖量;F3主要描述自然災害。根據方差貢獻率確定各因子權重,則3個公因子的權重為:
公式(4)中αi為第i個因子占因子綜合得分的權重,θi為第i個因子的方差百分比。綜合得分Ft=α1F1+α2F2+α3F3。通過因子得分的均值和標準差,設定高度風險、一般風險和無風險區(qū)間,假設高度風險1為A(10000)、一般風險1為B(01000)、無風險為C(00100)、一般風險2為D(00010)、高度風險2為E(00001),然后根據3σ法,設置風險區(qū)間。具體因子得分和風險區(qū)間上下限如下表4和表5所示。
表4 因子得分表
表5 風險區(qū)間表
結合所獲得的數據資料和研究目的,本研究以2009/10~2016/17年榨季云南省甘蔗的市場風險、種植風險和貿易風險指標數據為訓練樣本,其因子綜合得分對應的區(qū)間值為實際輸出,以2017/18年榨季因子得分作為訓練樣本的檢驗值,最后以2018/19年榨季蔗糖產業(yè)的指標數據為基礎對2019/20年榨季產業(yè)風險進行預測。
以2009/10年榨季至2016/17年榨季數據為預警研究的樣本建立模型。警兆指標包括:種植面積、種植成本(水田成本、旱地成本、水澆地成本)、總產量、入榨量、產糖量、產糖率、自然災害、食糖價格、平均收購價、白砂糖含稅成本、進口量、出口量。
結合分析需要及神經網絡,研究設置輸入 14個特征向量,輸出 5個向量。3層神經網絡,其中包括2個隱含層和1個輸出層,每個隱含層5個神經元,輸出層 5個神經元,隱含層傳遞函數 tansig函數,輸出層傳遞函數 purelin函數。學習率0.05,學習函數 trainscg函數。最大迭代次數為 5000次,神經網絡的驗證數據的 RMSE最小,訓練收斂于0.00225。
表6 模型精度確認
根據2009/10~2018/19年榨季指標數據,依托Matlab 12軟件,建立BP神經網絡模型,模型輸出為因子綜合得分值,將綜合得分與風險區(qū)間表進行對照,可以判斷風險程度。通過對比模型預測輸出與實際值驗證模型預測精度,表6可得 2010/11~2016/17年榨季神經網絡預測輸出與實際輸出一致,滿足模型預測精度要求。
以2016/17年榨季14個指標數據為輸入值,驗證2017/18年榨季風險情況,得出2017/18年榨季云南省蔗糖產業(yè)處于無風險區(qū)間C(00100),期望輸出與實際輸出一致,模型驗證成功,可用于 2018/19年榨季數據對 2019/20年榨季云南省蔗糖產業(yè)風險情況進行預測。以 2018/19年榨季云南蔗糖產業(yè)的種植、市場和貿易指標數據為輸入數據,可得2019/20年榨季云南省蔗糖產業(yè)預測結果處于高度風險1區(qū)間,具體預測結果Ft為(0.9987,0.0399,-0.0039,-0.0466,0.0775)即 A(10000)。其中F1為A(-∞,-1.87),F2為 C(-1.72,2.05),F3為 A(-∞,-2.54)。
由因子分析可得,種植風險為云南蔗糖產業(yè)面臨的首要風險,主要體現在種植成本(水田、旱地、水澆地)、入榨量、產糖量和自然災害。由BP神經網絡分析可得,2019/20年榨季云南蔗糖產業(yè)總體處于高度風險區(qū)間 A(-∞,-1.87),風險敞口較大,其因子F1處于高度風險1(-∞,-2.37),因子F2處于無風險區(qū)間(-1.72,2.05),因子F3處于高度風險1(-∞,-2.54),即實證研究結果表明,在 2019/20年榨季,云南省蔗糖產業(yè)將面臨較大風險,風險來源為種植成本(水田、旱地和水澆地種植成本)和自然災害風險,應注意加強控制成本和自然風險的預防。
云南蔗糖產業(yè)面臨的風險最主要的來源為種植成本過高。甘蔗種植成本主要由人工成本、地租、化肥等費用組成,其中中耕管理成本和砍收成本等人工成本是降低甘蔗種植成本的重要制約因素,其費用占到了總成本的 50%以上,細碎化小規(guī)模的小農戶經營方式生產成本高,無法面對激烈的市場競爭。因此,應大力發(fā)展機械化甘蔗生產,提高甘蔗規(guī)?;N植水平,降低人工成本的同時實現甘蔗生產和銷售階段的規(guī)模效益。然而,在 2019/20年榨季,云南機收率僅為 2.26%,相比廣西省 2019/20年榨季“雙高”基地 13.2%的機收率,云南蔗糖產業(yè)的機械化推進還需繼續(xù)加強[8]。
云南蔗糖產業(yè)風險的另一個來源是甘蔗產量。根據歷年云南糖業(yè)協會和云南糖網關于蔗糖產業(yè)的統(tǒng)計數據,云南省歷年平均甘蔗種植面積在 30萬hm2左右,為在有限的面積內提升甘蔗產量,應積極推進甘蔗良種培育。根據國家甘蔗品種第 6輪集成示范德宏點的試驗結果,粵甘50號、云蔗11-3898、云瑞10-187、粵甘48號4個品種在甘蔗蔗莖產量上有較高產表現[9],應因地制宜地進行推廣。此外,還應加強對甘蔗新品種的研究培育,開發(fā)高產高糖抗逆性抗蟲害好的甘蔗新品種,從而保證甘蔗產量的穩(wěn)步增加。
自然風險也是云南省蔗糖產業(yè)的發(fā)展的一個重要威脅。甘蔗生產面臨著旱災、病蟲、洪澇和霜凍等自然災害。針對云南省甘蔗種植主要面臨的旱災和病蟲災害,在研究培育新種同時,應強化外部的監(jiān)測和治理?;A設施建設是促進農業(yè)活動發(fā)展的關鍵,包括蔗田灌溉、道路及坡地改造等內容,完善的基礎設施建設能有效地應對甘蔗旱災,達到抗旱目的。針對可能的病蟲害,應注重監(jiān)測,開展專業(yè)化防治服務,積極推廣物理、生物防治措施指導。