王建華 李碩
摘 要:質量興農是保障糧食安全的基礎,也是推進農業(yè)供給側結構性改革的邏輯起點和內在要求,文章基于山東、河南、江蘇、浙江、黑龍江等五個典型農業(yè)生產省份的100個行政村986個農戶的調研數據,運用樸素貝葉斯模型對影響農戶農產品安全生產行為的各要素進行了系統(tǒng)的分析。通過研究發(fā)現,樸素貝葉斯模型能夠較好地反應不同因素對農戶安全生產行為的影響,是預測、評價農戶安全生產行為的有效工具,此模型具有良好的農戶安全生產行為預測精度與應用前景。此外,應發(fā)揮政府的引導作用,加大對社會組織的扶持力度,不斷提高農戶整體素質水平,從而規(guī)范農戶的安全生產行為,實現對農產品質量安全源頭治理的目標。
關鍵詞:貝葉斯網絡;樸素貝葉斯;農戶安全生產行為;影響因素
一、引言
2018年中央1號文件指出,必須堅持質量興農、綠色興農,以農業(yè)供給側結構性改革為主線,加快構建現代農業(yè)產業(yè)體系、生產體系、經營體系,提高農業(yè)創(chuàng)新力、競爭力和全要素生產率,加快實現由農業(yè)大國向農業(yè)強國轉變。全國農業(yè)工作會議提出了“唱響質量興農、綠色興農、品牌強農主旋律”的重要工作思路,將2018年確定為“農業(yè)質量年”,這表明著中國農業(yè)進入了高質量發(fā)展的新階段。同時,隨著社會經濟的快速發(fā)展和人們收入水平的逐步提高,人們對食品安全的訴求日益提高。農產品安全生產作為食品安全的源頭和保障食品安全的根本之一,受到人們的廣泛關注。目前在中國,農產品安全風險已由傳統(tǒng)自然因素引致的風險轉變?yōu)槿藶橐蛩卣T發(fā)的社會風險。
近年來,由于農戶不規(guī)范施用農藥所誘發(fā)的農產品安全事件頻頻發(fā)生,引起社會各界的高度關注與普遍擔憂。由此,采取科學方式分析農戶不當施藥行為的關鍵影響因素,有效預測并規(guī)范農戶施藥行為,減少農產品安全生產風險對解決食品安全問題具有深遠的研究意義和重要的實用價值。
二、相關研究的文獻梳理
已有研究表明,農戶施藥行為極具復雜性,且受諸多因素的綜合影響,但主要分為以下三個方面的原因:
(一)復雜的農戶個體特征影響農戶的安全生產行為。農戶個體特征是指戶主性別、年齡、受教育程度、婚姻狀況、打工經歷等。Michael and Cheryl(2001)的研究認為,農戶性別的不同影響著農戶對農用化學品的施用行為,女性文化水平相對較低,具有更高的施藥風險。Nicol(2003)等的研究也發(fā)現,男性比女性更致力于了解農藥基礎知識以確保農藥施用的預期效果,施藥行為更加規(guī)范。Ntow(2006)等和周潔紅(2009)等的研究表明,年齡是影響農戶農藥施用量、施用頻率等的重要因素。周潔紅(2009)等對浙江省農戶調查后,發(fā)現年齡較大的菜農更可能使用高毒殺蟲劑,以及采取不正確的施藥行為。顧俊(2007)等在江蘇通過調查分析了農戶特征對水稻新技術采用的影響,發(fā)現戶主年齡與水稻技術采用率呈負相關,而受教育年限與之呈正相關。高啟杰(2000)、石瑜敏(2004)、張云華(2004)等和蒙秀鋒(2005)等的研究表明,受教育程度是影響農戶認知的關鍵因素,受教育程度越高,農戶選擇低濃度或標準濃度配藥的概率越大,因此提高受教育程度能夠從源頭上減少農藥配比過大等問題。Stephanie(2008)認為,文化程度低的農戶由于缺乏農藥專業(yè)知識,往往忽略農藥安全性等隱性因素,僅僅以農藥效果作為評判農藥好壞的唯一標準。與Stephanie(2008)的研究結論類似,Abhilash(2009)在印度調查時也發(fā)現,由于農戶文化水平和認知水平不高,過量使用相同的農藥、不合理配比的混合農藥等現象時常出現。此外,王建華與吳林海(2013)通過對河南、山東、江蘇、浙江、黑龍江等五個典型農業(yè)生產省份的調查分析,發(fā)現打工經歷與婚姻狀況也顯著影響著農戶的農藥施用行為,已婚和有過打工經歷的農戶相對更能做出安全的農業(yè)生產行為選擇。
(二)農戶的經濟特征限制農戶的安全生產行為。農戶施藥行為不僅受個體基本特征的影響,還受家庭土地規(guī)模、農業(yè)收入比例、生產經營類型、農產品主要用途等經濟特征的影響。高啟杰(2000)、陸彩明(2004)和孔祥智(2005)等研究認為,經濟狀況影響和改變農戶對農藥新技術的采用。陽檢(2010)、吳林海(2011)等的研究表明,農戶家庭年收入、家庭人口數、種植人口數等因素對不同階段的施藥行為有著不同程度的影響。Dariush(2009)以伊朗為研究對象,發(fā)現農戶收入高低是決定其農業(yè)安全生產意愿的主要因素。胡豹(2005)等研究發(fā)現非農收入占總收入的比重影響了農戶結構調整決策行為。姜培紅(2005)探究了福建省農戶農藥使用的經濟影響因素,發(fā)現種植結構的調整也能顯著減少農藥使用。目前,許多學者雖認為家庭勞動力數量對農藥新技術采用有不顯著的正面作用,但普遍贊同家庭種植面積大小與農戶對農藥新技術采用的可能性呈正相關的觀點,如趙建欣(2008)等研究了河北、山東兩省菜農的生產行為,發(fā)現生產規(guī)模及其模式顯著影響農戶安全蔬菜的生產行為。
(三)外部環(huán)境特征制約農戶的安全生產行為。外部市場環(huán)境與政策因素也在不同程度上影響著農戶的生產行為。FAO(2005)和Dasgupta et al(2007)認為由于殺蟲劑等化學農藥的低成本和廣譜殺蟲性,加上收入水平、地理位置等方面的差異因素,亞洲的發(fā)展中國家農戶使用最為普及。Christiaans et al.(2007)研究發(fā)現農產品價格下降,農戶收入減少,直接導致農戶農藥施用量的減少。Ngow et al.(2007)認為,市場服務狀況對農戶施用農藥的行為會產生重要的影響,農藥商販對農戶的農藥品種選擇和農藥施用量具有較強的影響。Hruska et al.(2002)研究表明,政府的傾向性政策會影響農戶農產品生產結構和農藥施用行為。朱劍橋(2004)研究認為,農戶專業(yè)合作組織的建立,可以起到規(guī)范農戶施藥行為和提高出口效率的雙重效果。黃祖輝(2005)等則認為相關企業(yè)及行業(yè)協會可以幫助茶農有效減少高毒化學農藥施用和采用安全農藥施用行為。農戶施藥行為受到農戶個體基本特征、認知現狀、心理態(tài)度、外部環(huán)境和經濟條件等方面的綜合影響?;诖耍恼略诂F有研究的基礎上,依據我國五個典型農業(yè)生產省份986個樣本農戶的微觀調研數據,采用樸素貝葉斯模型為主要分析工具,從數據分類的角度研究不同因素對農戶安全生產行為的影響以及各因素間的關系,為有效規(guī)范農戶農藥施用行為、降低農產品安全生產風險提供有力的理論支持和實踐依據。
三、方法選擇及其模型設計
(一)方法選擇及其相關內容介紹
貝葉斯準則最早是由英國科學家Reverend Thomas Bayes在17世紀首先提出的,并在1812年由數學家Laplace以貝葉斯定理的方式展示出來,從而得到新的研究和應用。從本質上講,貝葉斯準則提供了一種表示因果關系的模型,它利用統(tǒng)計知識進行數據的相關分類,通過計算未知類別的數據樣本類歸屬各類別的概率來判定其最終歸屬;其貝葉斯公式(Bayesian Equation)為:
P(A│B)=P(A│B)P(A)P(B)(1)
其中,P(A)代表事件A發(fā)生的概率,被稱為A的先驗概率;P(B)代表事件B發(fā)生的概率,是式(1)的歸一化因子;P(B│A)是已知事件A發(fā)生的情況下,B發(fā)生的概率,被稱為已知事件A發(fā)生后事件B的發(fā)生的條件概率。而P(A│B)是已知事件B發(fā)生的情況下,A發(fā)生的概率,也被稱為A的后驗概率。
在數據分類的應用中,B代表未分類的樣本數據,A是可能的一個類別。P(B│A)是數據B的似然函數。換句話說,貝葉斯公式綜合了未知分類參數的先驗信息和特征數據的似然函數,通過計算未知分類參數的后驗概率分布來實現對其的貝葉斯統(tǒng)計推斷。上述貝葉斯數據分類原則已成功用于自然語言的理解、垃圾郵件的自動識別、醫(yī)療診斷、統(tǒng)計決策、專家系統(tǒng)等不同的領域中。
對于農戶安全生產行為分析研究而言,利用式(1)的貝葉斯準則,可通過構建貝葉斯分類器,在已知農戶施藥行為影響因素的條件下,實現對農戶安全生產行為的有效預測;另外,也可在已知農戶生產行為是否安全的條件下,通過研究影響因素的似然函數,分析、比較不同影響因素對農戶生產行為的影響程度。
(二)相關方法的具體描述
貝葉斯分類器(Bayesian Classifier)利用訓練數據集(即已分類好的數據集)進行訓練形成分類器,然后利用分類器對未分類的數據進行歸類,驗證分類器的正確性和有效性。貝葉斯分類器有如下幾個特點:在計算過程中,通過比較樣本數據歸屬各類別的概率,判定概率最大的類別為該數據的最終歸屬;在貝葉斯分類中,所有的屬性都直接或間接地影響分類結果。
圖1是貝葉斯分類器的結構示意圖。由圖可知,貝葉斯分類器實質上是一個數據生成模型。它的數據處理過程繁瑣,主要有三點原因:一是若屬性之間具有相關性,分類器結構繁雜將造成似然函數P(Xj│Ci )本身復雜度的提升;二是準確的貝葉斯分類器的獲得需要訓練大量的數據;三是具有后驗概率的類標簽也需進行大量復雜的計算才有可能獲取。
為了降低問題的復雜度,可假設在給定類別Ci的條件下,其所有屬性Xj是相互統(tǒng)計獨立的;采用上述統(tǒng)計獨立假設的貝葉斯分類器被稱為樸素貝葉斯分類器。該假設極大的簡化了貝葉斯分類器的訓練過程,降低了訓練所需要的總數據量;也降低了貝葉斯分類器實際應用時后驗概率的計算復雜性。大量實際應用表明,屬性統(tǒng)計獨立假設的引入不會顯著降低樸素貝葉斯分類器的性能;因而,樸素貝葉斯分類器是一種簡單有效的分類和數據建模方法,其結構示意圖由圖2所示。
四、樸素貝葉斯在農戶安全生產中的應用
(一)分析評價指標
2013年2-3月深入河南、山東、江蘇、浙江、黑龍江等五個典型農業(yè)生產省份,選取了其中100個行政村的986位農戶,利用分層抽樣與隨機抽樣相結合的方式,進行了農戶農產品安全生產行為的專項調研。調研結果表明,影響我國農戶農產品安全生產行為的因素眾多,但主要分為主觀層次和客觀層次兩大方面的原因。主觀層面的因素主要指農戶的個體特征、打工經歷、婚姻狀況、家庭收入、家庭土地規(guī)模以及家庭農業(yè)收入在家庭總收入的比例等;客觀層面的因素主要指農藥的價格、家庭農產品的主要用途、預期售價以及家庭農業(yè)生產經營類型等,如圖3所示。
對農戶的安全生產行為的評估主要從以下4個方面考慮,農戶在生產過程中是否會施用農藥,農戶在實際生產過程中是否會考慮施用農藥的安全間隔期(下文中簡寫為“安全間隔期”,表格中用SI(Safety Interval)表示),農戶對農藥殘留所引發(fā)農產品安全風險的態(tài)度以及農戶是否會過量施用農藥防病蟲害。表1和表2分別給出了農戶安全生產行為的影響因子及其評估參數以及農戶施藥行為及其評估參數。
(二)訓練數據集和測試數據集
在已知的986份數據中隨機選取850份調查數據作為訓練樣本用于樸素貝葉斯分類器的訓練,剩下的數據作為測試數據集。對缺失數據,采用單元格均值插補和熱卡插補等方法對數據缺失值進行補齊。
(三)樸素貝葉斯分類器的訓練和測試
限于篇幅,這里僅給出利用訓練數據集生成針對“農戶在實際生產過程中是否會考慮施用農藥的安全間隔期”的樸素貝葉斯分類器的訓練、測試過程以及相應的中間結果。
作為示例,該分類器將用來預測年齡在26-45歲之間、已婚、大專教育水平并曾有過打工經歷的純農戶經營類型的農戶行為,預測其在農業(yè)收入占比31-40%,土地規(guī)模在3-6畝之間,當農產品主要用來滿足家庭需要,面對適中的農藥價格,在農產品預售價上漲的情況下,在生產過程中是否會施用農藥。
可以看出,大部分農戶會考慮施用農藥的安全間隔期。其次,計算各條件概率P(Xj│Ci ),其結果如表4所示。在本例中,利用表3的分類先驗概率所得到的結果和表4的條件概率所得到的結果,根據式(4)計算其后驗概率,得到的最大后驗概率的類標簽為農戶在實際生產過程中經常會考慮施用農藥的安全間隔期。最后,通過測試數據集檢驗通過訓練數據集生成的樸素貝葉斯分類器對現有數據建模的準確程度。對測試數據分類正確率的測度結果如表5所示。
在數據的具體分析上,由表4可知,年齡在26-45歲的農戶在“很少考慮”安全間隔期的條件下概率最高,為47.62%;在“完全不考慮”安全間隔期的條件下概率最低,為32.08%。在“完全不考慮”安全間隔期的條件下,農戶已婚的概率最高為18.87%;而在“經??紤]”安全間隔期的條件下,概率最低僅為3.98%。具有打工經歷的農戶“偶爾考慮”安全間隔期的概率最高,為70.59%;“完全不考慮”安全間隔期的概率最低,為54.72%。純農戶在“考慮很少”安全間隔期的條件下概率最高,為61.90%;在“經??紤]”安全間隔期的條件下概率最低,為40.69%。農業(yè)收入比例介于31%-40%的農戶“偶爾考慮”安全間隔期的條件概率最高,為41.18%;“完全不考慮”安全間隔期的概率最低,為5.66%。土地規(guī)模介于3-6畝的農戶“總是會考慮”安全間隔期的概率最高,為32.84%;“完全不考慮”安全間隔期的概率最低,為15.09%。