□ 鄭 劍 周 豪 巫 丹 遂昌縣食品藥品安全檢驗檢測中心
食品安全風(fēng)險預(yù)警領(lǐng)域大數(shù)據(jù)挖掘的應(yīng)用
□ 鄭 劍 周 豪 巫 丹 遂昌縣食品藥品安全檢驗檢測中心
食品安全綜合評價和食品安全預(yù)警是食品安全領(lǐng)域的難點與重點,也是食品安全領(lǐng)域一直探討的問題。隨著新技術(shù)的崛起,大數(shù)據(jù)、云計算等技術(shù)開始在各個領(lǐng)域應(yīng)用,食品安全風(fēng)險預(yù)警領(lǐng)域在這個方面也有所探究。本文主要分析大數(shù)據(jù)以及三種典型的大數(shù)據(jù)挖掘技術(shù)的概念,并進(jìn)一步探討其在大數(shù)據(jù)挖掘中的應(yīng)用現(xiàn)狀。
近年來,隨著國家經(jīng)濟(jì)的高速發(fā)展,互聯(lián)網(wǎng)隨之普及,并在人們的工作生活中扮演重要的角色。各行業(yè)積累大量的數(shù)據(jù),人們逐漸看到大數(shù)據(jù)背后存在的一些潛在價值,應(yīng)如何挖掘這些數(shù)據(jù)的潛在價值,讓這些數(shù)據(jù)的潛在價值指導(dǎo)行業(yè)發(fā)展。近年來,食品安全問題接連不斷,食品安全事件嚴(yán)重威脅人們的健康,食品安全綜合指數(shù)評價和安全預(yù)警也就越來越成為人們討論的熱點。要想解決食品安全問題,就需要建立食品安全風(fēng)險預(yù)警機(jī)制。隨著大數(shù)據(jù)在各個領(lǐng)域的使用,人們都將目光投向?qū)⒋髷?shù)據(jù)運用在食品安全風(fēng)險預(yù)警領(lǐng)域。因此,本文主要淺談大數(shù)據(jù)挖掘在食品安全風(fēng)險預(yù)警應(yīng)用的現(xiàn)狀,以供參考。
大數(shù)據(jù)的概念
大數(shù)據(jù)顧名思義是很多數(shù)據(jù)的意思,就現(xiàn)在的百科上來說,大數(shù)據(jù)是指需要新的處理模式才能具有更強(qiáng)決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。簡而言之,就是用一定的過程處理后,可以優(yōu)化業(yè)務(wù)流程、增強(qiáng)決策力和洞察力的各種各樣的數(shù)據(jù),具有大量、高速、多樣、價值密度和真實性等特點。大數(shù)據(jù)的最初引用是在開源項目Nutch中,那時的大數(shù)據(jù)被定義為“更新網(wǎng)絡(luò)搜素需要進(jìn)行批量處理或分析的大量數(shù)據(jù)”?,F(xiàn)如今,大數(shù)據(jù)在個個領(lǐng)域都有涉及,馬云曾說過未來的商業(yè)競爭是數(shù)據(jù)的競爭。大數(shù)據(jù)在人們的日常生活中不斷積累,并不斷發(fā)展為一種潛在資產(chǎn)。
3種數(shù)據(jù)挖掘方式應(yīng)用的現(xiàn)狀
貝葉斯圖
貝葉斯圖反映的是一種不確定模式,每一個節(jié)點代表一個不確定的變量,依據(jù)變量之間的因果關(guān)系推算出其變量發(fā)生的概率,反映的是整個數(shù)據(jù)域間的概率關(guān)系,可以用來發(fā)現(xiàn)讓人信服的概率依賴關(guān)系。它是基于行為結(jié)果和他們的因果條件,解釋可能出現(xiàn)的結(jié)果,從而達(dá)到預(yù)測和決策的效果。在食品安全方面,具有代表性的應(yīng)用是食品產(chǎn)品設(shè)計。比如,在食品貝葉斯網(wǎng)絡(luò)建模中,知道人們喜歡吃甜食后,在樣本中也會存在人們喜歡的甜食,在這個模型中就會推理出食品的顏色影響人們喜愛的程度。由于它的本身特點,可以建立相關(guān)風(fēng)險因素,依據(jù)網(wǎng)絡(luò)模型對于不同事件的反應(yīng)程度、發(fā)展過程和結(jié)果,可以獲取相關(guān)節(jié)點變量的概率值,進(jìn)而得到風(fēng)險值。
決策樹
決策樹通過邏輯思維的方式來優(yōu)化決策,進(jìn)而解決復(fù)雜的問題。其在食品行業(yè)的運用,有利于農(nóng)產(chǎn)品的食品安全研究。決策樹通過降維方式進(jìn)行數(shù)據(jù)預(yù)處理,找出影響農(nóng)產(chǎn)品質(zhì)量的特征值,然后構(gòu)建基于組合優(yōu)化的決策樹模型,判別農(nóng)產(chǎn)品質(zhì)量安全。在這個過程中,可以選取土壤的酸堿度、地區(qū)水的質(zhì)量等級等作為決策樹的屬性。通過后期數(shù)據(jù)的訓(xùn)練,計算出相應(yīng)的準(zhǔn)確率,最后得出決策樹是否可以評估農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險的結(jié)論。
人工神經(jīng)網(wǎng)絡(luò)
人工網(wǎng)絡(luò)神經(jīng)是模仿生物學(xué)中的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行的建模,通過長時間的訓(xùn)練和測試,可以有效學(xué)習(xí)數(shù)據(jù)中的一些錯誤,是一種學(xué)習(xí)精度相對較高的數(shù)據(jù)挖掘方式。目前,常見的網(wǎng)絡(luò)模型將近10種,其中常見的為反響傳播神經(jīng)網(wǎng)絡(luò)。通過數(shù)據(jù)在不同層級中的不同神經(jīng)元中正向傳播、權(quán)值調(diào)整和反向傳播,學(xué)習(xí)所給的數(shù)據(jù)集,進(jìn)而訓(xùn)練好相應(yīng)的模型。其與主成分分析結(jié)合做過有關(guān)利用紅外光譜鑒別蘋果品種的研究,其識別的準(zhǔn)確率達(dá)到了100%。在后續(xù)的研究中,可以利用類似原理,利用不合格產(chǎn)品主要的成分進(jìn)行相關(guān)篩選,挑揀不安全食品或預(yù)警相關(guān)食品的安全。
結(jié)語
由于食品的種類繁多,加工的程序復(fù)雜,對不同的食品其挖掘數(shù)據(jù)的模型不應(yīng)過于單一。在大數(shù)據(jù)時代,利用大數(shù)據(jù)來進(jìn)行食品安全風(fēng)險預(yù)警也成為食品行業(yè)的急切需要,食品安全問題關(guān)乎人們的身體健康和生命安全,只有做好相關(guān)的食品安全風(fēng)險預(yù)警,才能有效解決食品安全問題。同時,不能只依賴大數(shù)據(jù)來解決問題,也要加強(qiáng)食品制作人員的食品安全意識。