亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于貝葉斯網(wǎng)絡(luò)數(shù)據(jù)挖掘的蔬菜質(zhì)量安全分析

        2017-03-17 11:25:03方永美熊俊濤楊振剛廖鑒康
        湖北農(nóng)業(yè)科學(xué) 2016年23期
        關(guān)鍵詞:貝葉斯網(wǎng)絡(luò)農(nóng)藥殘留數(shù)據(jù)挖掘

        方永美+熊俊濤+楊振剛+廖鑒康

        摘要:蔬菜是人們?nèi)粘I畹谋仨毱罚彩侨菀壮霈F(xiàn)質(zhì)量安全問題的產(chǎn)品。影響蔬菜質(zhì)量安全的一個重要因素就是農(nóng)藥殘留問題。以蔬菜農(nóng)藥殘留檢測數(shù)據(jù)為對象,利用貝葉斯網(wǎng)絡(luò)進行數(shù)據(jù)挖掘,得到不同品種蔬菜的農(nóng)藥殘留含量分布,以及同一品種在不同時間的分布趨勢,經(jīng)過可信度分析,該結(jié)論可信。該結(jié)果可為蔬菜的生產(chǎn)者、消費者以及監(jiān)管人員提供一定的決策依據(jù)。

        關(guān)鍵詞:數(shù)據(jù)挖掘;貝葉斯網(wǎng)絡(luò);農(nóng)藥殘留;質(zhì)量

        中圖分類號:TS201.6;R857.3 文獻標識碼:A 文章編號:0439-8114(2016)23-6253-05

        DOI:10.14088/j.cnki.issn0439-8114.2016.23.063

        Abstract: Vegetable is one of the necessities of peoples daily life. It is also prone to occurring quality and safety issues. It is pesticide residue that was one of the important factors which effects on the vegetable quality and safety. Bayesian network of data mining technology is applied to mining the limited assay information of vegetable. It got to pesticide residues distribution for varieties of vegetables, and the same vegetable distribution trends in different months. The results are credible and can offer some decision for producers, consumers and supervisors of vegetable quality and safety.

        Key words: data mining;bayesian network;pesticide residue;quality

        隨著社會的發(fā)展和生活水平的提高,人們對蔬菜產(chǎn)品安全的關(guān)注與日俱增,影響蔬菜質(zhì)量安全的一個重要因素就是農(nóng)藥殘留問題。以蔬菜農(nóng)藥殘留監(jiān)測為基礎(chǔ)的蔬菜安全風(fēng)險分析作為現(xiàn)代蔬菜安全管理工作的發(fā)展方向,正逐步成為各國遵循的準則和行為規(guī)范[1]。Li等[2]研究認為,中國食品安全保障體系的標準陳舊且執(zhí)行不嚴謹。Rudder[3]通過對蔬菜的銷售渠道進行研究發(fā)現(xiàn),農(nóng)民把蔬菜賣給生產(chǎn)廠商來降低安全責(zé)任。

        周潔紅等[4]以經(jīng)濟學(xué)為理論基礎(chǔ),提出了以批發(fā)市場為核心實施蔬菜質(zhì)量安全可追溯體系是現(xiàn)階段建設(shè)蔬菜質(zhì)量安全管理的最有效方法。劉中華[5]認為供貨商對蔬菜質(zhì)量管理意識的缺乏以及對供貨商的約束力不足導(dǎo)致出現(xiàn)差異。樊紅平等[6]用系統(tǒng)理論分析了農(nóng)產(chǎn)品檢驗檢測體系構(gòu)成及其功能。樊孝鳳[7]從信息不對稱理論的角度,著重解釋了中國蔬菜農(nóng)殘普遍超標的現(xiàn)象。許宇飛[8]認為,對食品安全狀態(tài)評價應(yīng)根據(jù)各污染物的限量標準進行逐級評價;秦燕等[9]提出運用控制圖方法來監(jiān)測食品安全質(zhì)量是否處于控制狀態(tài)。王志剛[10]利用Probit模型對影響消費者農(nóng)產(chǎn)品質(zhì)量安全的認知和購買行為的主要影響因素進行了解析。

        大部分研究采用傳統(tǒng)方法,難以滿足對蔬菜農(nóng)藥殘留檢測數(shù)據(jù)的深度分析需求。國內(nèi)開展對DMKD(數(shù)據(jù)挖掘和知識發(fā)現(xiàn))的研究稍晚,沒有形成整體力量[11]。有關(guān)蔬菜質(zhì)量安全方面應(yīng)用數(shù)據(jù)挖掘技術(shù)的研究鮮見報道[12]。陳晨等[13]采用貝葉斯分類算法,以玉米生長環(huán)境和質(zhì)量數(shù)據(jù)庫為對象,對新生長環(huán)境下玉米的生長質(zhì)量進行挖掘。劉春玲等[14]認為,在農(nóng)業(yè)領(lǐng)域積累的大量農(nóng)業(yè)數(shù)據(jù)信息中運用數(shù)據(jù)挖掘是極具應(yīng)用前景的方案。本研究以山東省煙臺市的蔬菜檢測數(shù)據(jù)為對象,運用貝葉斯網(wǎng)絡(luò)方法進行數(shù)據(jù)挖掘,得出蔬菜質(zhì)量安全的規(guī)律以及趨勢,以期為蔬菜農(nóng)藥殘留檢測數(shù)據(jù)分析提供參考。

        1 數(shù)據(jù)獲取

        數(shù)據(jù)均來自煙臺蔬菜質(zhì)量安全信息網(wǎng),數(shù)據(jù)的時間覆蓋范圍是從自2006年7月到2013年2月(除2009年9、10月外),共78期抽檢信息。記錄項目包括檢測時間、檢測地點、品種、平均酶抑制率和平均合格率。

        平均酶抑制率是決定了蔬菜農(nóng)藥殘留的量化標準,根據(jù)國家頒布的農(nóng)藥殘留檢測條例,如果檢測得出酶抑制率超過50%則認定為農(nóng)藥殘留超標,評定結(jié)果為不合格。使用Weka3.6[15]作為數(shù)據(jù)挖掘工具,在對數(shù)據(jù)進行挖掘前,要對收集的數(shù)據(jù)進行集中、整合、清理。

        對收集的每月原始數(shù)據(jù)進行集中、整合。把整合后的數(shù)據(jù)轉(zhuǎn)換成XLS文件,并由XLS文件轉(zhuǎn)換成Weka能識別的CSV文件;通過Weka的Explorer運行CSV文件,并將其另存為ARFF文件。圖1是Explorer運行CSV文件后成功讀取數(shù)據(jù)的結(jié)果。從圖1中可以看到,該文件中數(shù)據(jù)數(shù)量為3 768。

        2 數(shù)據(jù)處理

        2.1 屬性選擇

        通過分析原始實例得到5個屬性值。

        1)地點屬性:文化路市場、三環(huán)市場、大世界市場、紅利市場、前進路市場、新橋市場、煙大市場、祥和市場、宏達市場、其他地點,共10個可取值,是名詞性屬性,沒有殘缺值。

        2)品種屬性:韭菜、黃瓜、生菜、油菜、茼蒿、芹菜、蕓菜、菠菜、其他蔬菜,共9個可選值,是名詞性屬性,沒有殘缺值。

        3)時間屬性:2006年7月~2013年2月(除2009年9、10月外),以月為單位,共78個可選值,沒有殘缺值。

        4)平均酶抑制率和平均合格率屬性都是數(shù)值性屬性,區(qū)間在[0,100],單位是百分比。

        5)平均酶抑制率是根據(jù)抽檢單位抽檢統(tǒng)計而來的直接數(shù)據(jù)。平均合格率只是平均酶抑制率的另一個反映,因此,平均合格率是冗余屬性,在處理過程中不考慮,通過Weka中的Remove按鈕刪除。處理后,得到4個屬性,分別為品種、地點、時間和平均酶抑制率。

        2.2 數(shù)據(jù)清理

        經(jīng)過檢查,實例集中一共有109個殘缺值,約占2.9%,且其屬性均為平均酶抑制率。黃瓜和蕓豆中的平均酶抑制率的殘缺值最多,并且多集中在煙大市場、文化路市場;其原因是這兩個品種的供應(yīng)量很少,導(dǎo)致抽檢量也少。平均酶抑制率作為類屬性,其值的缺失使得該實例失去了參考意義。因此,刪除這兩個市場的黃瓜和蕓豆實例,實例數(shù)量分布如表1所示。

        對于連續(xù)抽檢實例集,還需考察各個屬性的實例數(shù)量比例情況。表1中所示的品種為菠菜、地點為宏達市場的實例數(shù)較少,分別只有23個和8個。這2種實例會給挖掘算法帶來較大的誤差率。通過查初始數(shù)據(jù)得知,菠菜的抽檢只在2006年7月到2006年10月進行,而宏達市場的抽檢則只在2007年8月進行。在一共78個抽檢月里,這些實例屬于少數(shù),從實例的健壯性考慮,刪除地點是宏達市場和品種是菠菜的實例。

        2.3 屬性離散

        在進行相關(guān)數(shù)據(jù)挖掘前,對平均酶抑制率進行離散化。由于平均酶抑制率為50%是一個閾值,因此只需進行等區(qū)間劃分,使用過濾器Discretize功能實現(xiàn),結(jié)果如表2所示。區(qū)間內(nèi)數(shù)值的單位是百分比。平均酶抑制率越小,代表其農(nóng)藥殘留成分越低。由于平均酶抑制率大于或等于50%的蔬菜不能食用,對區(qū)間進行修正。首先,將50以上的三個區(qū)間合并成一個區(qū)間;其次,要把“-∞”替換成最小值“0”,把“∞”替換成最大值“100”。得到一個四區(qū)間的分布。為方便起見,把區(qū)間[0,16.666 667)、[16.666 667,

        33.333 333)、[33.333 333,50)、[50,100]分別稱為A類、B類、C類、D類。A類代表農(nóng)藥殘留水平是最低,其次是B類,兩者都是可以放心食用的類別。C類是一個警戒的農(nóng)藥殘留水平;對于D類,平均酶抑制率超過50%,不能食用。

        2.4 數(shù)據(jù)轉(zhuǎn)換

        通過數(shù)據(jù)轉(zhuǎn)換,得到2個一樣的實例集:數(shù)值型版本實例集和名詞型版本實例集。除了表現(xiàn)形式,其他方面完全一樣。名詞型版本中,包括品種、地點、年份、月份、平均酶抑制率5個屬性;數(shù)值型版本中,共有40個屬性,其中品種有9個、地點有10個、年份有8個、月份有12個以及平均酶抑制率。得到這2個實例集后,將這些實例的順序隨機打亂,將排序的影響降到最小。用Randomize過濾器進行順序隨機化。

        3 蔬菜質(zhì)量安全趨勢的數(shù)據(jù)挖掘

        3.1 運行貝葉斯網(wǎng)絡(luò)

        貝葉斯網(wǎng)絡(luò)是一種基于統(tǒng)計理論,具有較強理論根基,采用圖解方式表達概率分布的方法。貝葉斯網(wǎng)絡(luò)畫出的圖形就像是節(jié)點網(wǎng)絡(luò)圖,每個節(jié)點代表一個屬性,節(jié)點間用有方向的連線連接著,卻不能形成環(huán),是一個有向無環(huán)圖[15]。

        在Weka當中,選取貝葉斯網(wǎng)絡(luò)分類器(Bayes Net),將初始累計值alpha設(shè)置為0.5以避免零頻率;選擇K2算法并將最大父輩節(jié)點數(shù)量設(shè)為1;在useADTree中選擇true,以減少搜索算法重復(fù)搜索這個實例集的次數(shù)。點擊OK按鈕,算法開始工作。選擇visualize graph,查看到網(wǎng)絡(luò)結(jié)構(gòu),如圖2所示。

        分別運行圖2中的平均酶抑制率節(jié)點、月份節(jié)點、地點節(jié)點、品種節(jié)點、年份節(jié)點,將會出現(xiàn)各屬性的概率密度。點擊平均酶抑制率節(jié)點,出現(xiàn)總體實例集在各個區(qū)間的分布概率,其在A類(0,16.666 667)的概率是0.268,B類[16.666 667, 33.333 333)的概率是0.586,C類[33.333 333,50)的概率是0.144,D類[50,100]的概率是0.002。實例大部分處于A、B類,說明蔬菜農(nóng)藥殘留程度總體上不高。

        3.2 可信度分析

        點擊Summary,得到貝葉斯網(wǎng)絡(luò)的基礎(chǔ)評估信息,其相關(guān)系數(shù)達到84.2%,Kappa統(tǒng)計量是70.1%。從正確的肯定率來看,貝葉斯網(wǎng)絡(luò)對A類的正確肯定率為69.3%,其對A類的錯誤肯定率只有4.9%。對B類、C類的正確肯定率則較高,分別達到92.6%和78.6%。ROC Area方面,在A類、B類、C類均達到了91%以上,取得比較好的效果。

        3.3 蔬菜質(zhì)量安全分析

        3.3.1 單個屬性分析 運行圖2中的月份節(jié)點,得到關(guān)于平均酶抑制率在不同月的概率密度,結(jié)果如圖3所示。從圖3分析得到,7、8月的總體平均酶抑制率最高,以其為中軸,其他月的情況逐漸好轉(zhuǎn)。7、8月C類的概率較高;5、6月D類的概率較高??傮w來講,從5月到9月,屬于C、D類的概率較大,說明蔬菜的農(nóng)藥殘留水平超標的風(fēng)險增加。這是因為這個時間段氣溫轉(zhuǎn)高、濕度適宜,是害蟲的發(fā)育階段,危害最為嚴重,相應(yīng)地,菜農(nóng)對蔬菜的用藥量也大幅度提高。處于一年中的年首和年尾的蔬菜農(nóng)藥殘留較低。

        運行圖2中的地點節(jié)點,得到關(guān)于平均酶抑制率在不同地點的概率密度,結(jié)果如圖4所示。從圖4可以看出,對于地點而言,祥和市場蔬菜的總體平均酶抑制率偏低。祥和市場中,A類的概率密度遠遠高于其他市場,其次是煙大市場、新橋市場、大世界市場。高危的是紅利市場、文化路市場,在這些地點平均酶抑制率偏高的概率密度較大。尤其是紅利市場,C類的實例占到了一半以上。D類的5個實例中有2個就屬于紅利市場,2個是文化路市場,1個是新橋市場。

        運行圖2中的品種節(jié)點,得到關(guān)于平均酶抑制率在不同蔬菜品種間的概率密度,結(jié)果如圖5所示。從圖5可以看出,平均酶抑制率較低的分別是蕓豆、生菜、茼蒿以及其他蔬菜;平均酶抑制率較高的分別是韭菜、油菜、黃瓜、芹菜。韭菜屬于C類的概率密度超過其他品種。

        對于葉菜類蔬菜,如油菜,容易生蟲子,對這類蟲害的處理方法一般是葉面噴灑農(nóng)藥;因此,葉菜類一般比根莖類蔬菜的農(nóng)藥殘留多。黃瓜作為瓜果類蔬菜的一種,比較特殊,由于生長的環(huán)境濕度較大,容易生病,對其用藥量一般較大。一般認為,像韭菜這類辛辣類蔬菜或者鱗莖類蔬菜具有較好的抗蟲害能力;實際上,韭菜的農(nóng)藥殘留問題一般比較嚴重。因為韭菜會受到韭蛆的危害,為了消滅地下的蟲害,不得不使用更多劑量的農(nóng)藥;一些菜農(nóng)甚至采用大面積、大劑量地使用有毒的有機磷農(nóng)藥灌地,從而導(dǎo)致農(nóng)藥殘留的情況比較嚴重。

        3.3.2 綜合分析 對品種屬性與地點屬性的關(guān)系,以及品種屬性與月份屬性的關(guān)系進行分析。設(shè)總體實例關(guān)于平均酶抑制率的概率為Pr(總體)(表3),不同蔬菜品種在不同地點的概率為Pr(地點/品種),關(guān)于品種的概率為Pr(品種),按照條件概率計算并作歸一化處理,分別得到每個市場的各個蔬菜品種的概率。以紅利市場為例,分析結(jié)果如表3所示。

        在紅利市場上,韭菜、黃瓜在C類(排名分別為1、2)和D類(排名分別為2、1)排名靠前,而在A類(排名分別為8、7)、B類(排名分別為7、7)的排名靠后,說明這些品種的蔬菜農(nóng)藥殘留水平較高,而生菜、蕓豆、茼蒿等則相反。

        韭菜所含的農(nóng)藥殘留總體水平較高,但并不是所有市場上的韭菜的農(nóng)藥殘留都高。點擊地點、品種屬性,從其運行結(jié)果中摘錄得到韭菜所含農(nóng)藥殘留水平在不同市場的分布,如圖6所示。從圖6可以看出,韭菜實例在祥和市場上屬于A類的比例最多,其次是煙大市場。而紅利市場最差,其主要屬于C類和D類。這表明,即使是同一品種的蔬菜,其在不同市場的平均酶抑制率水平也不相同。

        另外,總體較安全的蔬菜,并不是在任何時期都很安全。相同品種的蔬菜,在不同月農(nóng)藥殘留水平也不一樣。設(shè)Pr(總體)、Pr(月份︳品種)和Pr(品種),進行條件概率運算,然后做歸一化處理。以黃瓜為例,其趨勢如圖7所示。從圖7中可知,黃瓜的平均酶抑制率在A類的概率從一月開始逐漸下降,一直到8月達到最低,之后呈升高趨勢;B類和C類隨著時間的變化呈上升趨勢。說明,黃瓜的安全性越來越低,其原因是夏季蔬菜上市的季節(jié),同時也是蟲害多發(fā)季節(jié),菜農(nóng)使用農(nóng)藥增多。

        4 小結(jié)

        通過貝葉斯網(wǎng)絡(luò)的數(shù)據(jù)挖掘工具的分析,得出如下結(jié)論:①在品種分類問題上一些蔬菜如生菜、蕓豆等的酶抑制率水平相對較低,而韭菜等則處于一個非常警戒的水平;②在以地點作為分類,祥和市場、煙大市場等市場的平均酶抑制率水平比較低,而其他地點、文化路市場、紅利市場等其平均酶抑制率水平則相對較高;③在時間方面,平均酶抑制率呈現(xiàn)出較大的季節(jié)性規(guī)律,每年的5月平均酶抑制率開始升高,直到9月開始回落;④在品種與地點之間的聯(lián)系上,通過分析韭菜在其他地點的平均酶抑制率分布區(qū)間的概率密度發(fā)現(xiàn),即使韭菜總體被認為農(nóng)藥殘留水平較高的蔬菜,在祥和市場還是值得信賴;⑤在品種和時間之間的聯(lián)系,通過對蔬菜在各月的平均酶抑制率水平變化情況進行分析,探討其季節(jié)規(guī)律,以黃瓜為例,分析其在受到季節(jié)因素影響的大小;⑥在品種和地點、時間的聯(lián)系,以韭菜為例,結(jié)合了地點和時間,分析了對韭菜最佳的選取方案。

        參考文獻:

        [1] 李泰然.中國食源性疾病現(xiàn)狀及管理建議[J].中華流行病學(xué)雜志,2003,24(8):651-653.

        [2] LI B,MA C L,GONG S L,et al. Food safety assurance systems in China[J].Food Control,2007(18):480-484.

        [3] RUDDER A.Food safety and the risk assessment of ethnic minority food retail businesses[J].Food Control,2006(17):189-196.

        [4] 周潔紅,張仕都.蔬菜質(zhì)量安全可追溯體系建設(shè):基于供貨商和相關(guān)管理部門的二維視角[J].農(nóng)業(yè)經(jīng)濟問題,2011(1):32-39.

        [5] 劉中華.蔬菜質(zhì)量安全可追溯體系建設(shè)研究[D].青島:中國海洋大學(xué),2012.

        [6] 樊紅平,王 敏,王 芳,等.中美農(nóng)產(chǎn)品質(zhì)量安全檢驗檢測體系比較研究[J].家畜生態(tài)報,2008,29(6):1-5,12.

        [7] 樊孝鳳.我國生鮮蔬菜質(zhì)量安全治理的逆向選擇研究[D].武漢:華中農(nóng)業(yè)大學(xué),2007.

        [8] 許宇飛.沈陽市主要農(nóng)產(chǎn)品污染調(diào)查及防治途徑的研究[J].農(nóng)業(yè)環(huán)境保護,1996,15(1):32-35.

        [9] 秦 燕,李 輝,李 聰.控制圖分析在食品安全預(yù)警中的應(yīng)用[J].中國公共衛(wèi)生,2004,20(9):1089-1090.

        [10] 王志剛.食品安全的認知和消費決定:關(guān)于天津市個體消費者的實證分析[J].中國農(nóng)村經(jīng)濟,2003(4):41-48.

        [11] 陳卓民.數(shù)據(jù)挖掘技術(shù)在國內(nèi)外的研究和發(fā)展現(xiàn)狀[J].青年文學(xué)家,2009(16):122-123.

        [12] 邢平平,施鵬飛,熊范綸.數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)數(shù)據(jù)中的有效應(yīng)用[J].計算機工程與應(yīng)用,2001,37(2):4-6.

        [13] 陳 晨,董 倩,吳玉潔.基于貝葉斯分類的農(nóng)作物產(chǎn)品質(zhì)量挖掘研究[J].安徽農(nóng)業(yè)科學(xué),2011,39(12):7448-7449.

        [14] 劉春玲,崔凌云,賈冬青,等.數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用[J].農(nóng)機化研究,2010(7):201-204.

        [15] WITTEN I H,F(xiàn)RANK E.數(shù)據(jù)挖掘?qū)嵱脵C器學(xué)習(xí)技術(shù)[M].北京:機械工業(yè)出版社,2012.

        猜你喜歡
        貝葉斯網(wǎng)絡(luò)農(nóng)藥殘留數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        無人機數(shù)據(jù)鏈測試與評估研究
        科技資訊(2016年25期)2016-12-27 16:22:32
        基于貝葉斯網(wǎng)絡(luò)的流域內(nèi)水文事件豐枯遭遇研究
        蔬菜中農(nóng)藥殘留檢測前處理方法對比研究
        農(nóng)產(chǎn)品質(zhì)量控制中農(nóng)藥殘留檢測技術(shù)的應(yīng)用
        基于興趣預(yù)測和熱點分析的聯(lián)合推薦算法研究 
        我國農(nóng)產(chǎn)品農(nóng)藥殘留的困境
        殺菌劑嘧菌酯的研究進展
        科技視界(2016年4期)2016-02-22 08:45:26
        基于貝葉斯網(wǎng)絡(luò)的城市居民出行方式研究
        久久精品国产9久久综合| 亚洲产国偷v产偷v自拍色戒| 久久男人av资源网站无码| 亚洲女同恋中文一区二区| 丰满少妇按摩被扣逼高潮| 亚洲女初尝黑人巨高清| 亚洲欧洲日本精品| 综合久久青青草免费观看视频| 国产精品熟女一区二区三区| 大胸少妇午夜三级| 丁香综合网| 91大神蜜桃视频在线观看| 亚洲日本国产精品久久| 久久99精品久久久久久秒播| 中文字幕一区二区三区乱码不卡| 国产自产自现在线视频地址 | 一边摸一边做爽的视频17国产 | 亚洲日韩欧美国产高清αv| 亚洲午夜久久久精品国产| 日本一区二区视频高清| 极品少妇一区二区三区四区| 91亚洲无码在线观看| 中文字幕久久人妻av| 午夜影视免费| 亚洲精品国产av成拍色拍| 精品久久久久88久久久| 三级日本理论在线观看| 亚洲国产成人久久综合| 四虎在线播放免费永久视频| 少妇隔壁人妻中文字幕| 久久婷婷国产综合精品| 国产又色又爽无遮挡免费| a√无码在线观看| 亚洲国产中文字幕无线乱码| 亚洲综合欧美在线一区在线播放| 亚洲日韩精品久久久久久| 国产成人综合久久大片| 亚洲av无码av在线播放| 无码专区中文字幕DVD| 伊人久久综合狼伊人久久| 美女扒开大腿让男人桶|