□ 鄭 劍 周 豪 巫 丹 遂昌縣食品藥品安全檢驗(yàn)檢測(cè)中心
食品安全風(fēng)險(xiǎn)預(yù)警領(lǐng)域大數(shù)據(jù)挖掘的應(yīng)用
□ 鄭 劍 周 豪 巫 丹 遂昌縣食品藥品安全檢驗(yàn)檢測(cè)中心
食品安全綜合評(píng)價(jià)和食品安全預(yù)警是食品安全領(lǐng)域的難點(diǎn)與重點(diǎn),也是食品安全領(lǐng)域一直探討的問(wèn)題。隨著新技術(shù)的崛起,大數(shù)據(jù)、云計(jì)算等技術(shù)開(kāi)始在各個(gè)領(lǐng)域應(yīng)用,食品安全風(fēng)險(xiǎn)預(yù)警領(lǐng)域在這個(gè)方面也有所探究。本文主要分析大數(shù)據(jù)以及三種典型的大數(shù)據(jù)挖掘技術(shù)的概念,并進(jìn)一步探討其在大數(shù)據(jù)挖掘中的應(yīng)用現(xiàn)狀。
近年來(lái),隨著國(guó)家經(jīng)濟(jì)的高速發(fā)展,互聯(lián)網(wǎng)隨之普及,并在人們的工作生活中扮演重要的角色。各行業(yè)積累大量的數(shù)據(jù),人們逐漸看到大數(shù)據(jù)背后存在的一些潛在價(jià)值,應(yīng)如何挖掘這些數(shù)據(jù)的潛在價(jià)值,讓這些數(shù)據(jù)的潛在價(jià)值指導(dǎo)行業(yè)發(fā)展。近年來(lái),食品安全問(wèn)題接連不斷,食品安全事件嚴(yán)重威脅人們的健康,食品安全綜合指數(shù)評(píng)價(jià)和安全預(yù)警也就越來(lái)越成為人們討論的熱點(diǎn)。要想解決食品安全問(wèn)題,就需要建立食品安全風(fēng)險(xiǎn)預(yù)警機(jī)制。隨著大數(shù)據(jù)在各個(gè)領(lǐng)域的使用,人們都將目光投向?qū)⒋髷?shù)據(jù)運(yùn)用在食品安全風(fēng)險(xiǎn)預(yù)警領(lǐng)域。因此,本文主要淺談大數(shù)據(jù)挖掘在食品安全風(fēng)險(xiǎn)預(yù)警應(yīng)用的現(xiàn)狀,以供參考。
大數(shù)據(jù)的概念
大數(shù)據(jù)顧名思義是很多數(shù)據(jù)的意思,就現(xiàn)在的百科上來(lái)說(shuō),大數(shù)據(jù)是指需要新的處理模式才能具有更強(qiáng)決策力、洞察力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。簡(jiǎn)而言之,就是用一定的過(guò)程處理后,可以?xún)?yōu)化業(yè)務(wù)流程、增強(qiáng)決策力和洞察力的各種各樣的數(shù)據(jù),具有大量、高速、多樣、價(jià)值密度和真實(shí)性等特點(diǎn)。大數(shù)據(jù)的最初引用是在開(kāi)源項(xiàng)目Nutch中,那時(shí)的大數(shù)據(jù)被定義為“更新網(wǎng)絡(luò)搜素需要進(jìn)行批量處理或分析的大量數(shù)據(jù)”?,F(xiàn)如今,大數(shù)據(jù)在個(gè)個(gè)領(lǐng)域都有涉及,馬云曾說(shuō)過(guò)未來(lái)的商業(yè)競(jìng)爭(zhēng)是數(shù)據(jù)的競(jìng)爭(zhēng)。大數(shù)據(jù)在人們的日常生活中不斷積累,并不斷發(fā)展為一種潛在資產(chǎn)。
3種數(shù)據(jù)挖掘方式應(yīng)用的現(xiàn)狀
貝葉斯圖
貝葉斯圖反映的是一種不確定模式,每一個(gè)節(jié)點(diǎn)代表一個(gè)不確定的變量,依據(jù)變量之間的因果關(guān)系推算出其變量發(fā)生的概率,反映的是整個(gè)數(shù)據(jù)域間的概率關(guān)系,可以用來(lái)發(fā)現(xiàn)讓人信服的概率依賴(lài)關(guān)系。它是基于行為結(jié)果和他們的因果條件,解釋可能出現(xiàn)的結(jié)果,從而達(dá)到預(yù)測(cè)和決策的效果。在食品安全方面,具有代表性的應(yīng)用是食品產(chǎn)品設(shè)計(jì)。比如,在食品貝葉斯網(wǎng)絡(luò)建模中,知道人們喜歡吃甜食后,在樣本中也會(huì)存在人們喜歡的甜食,在這個(gè)模型中就會(huì)推理出食品的顏色影響人們喜愛(ài)的程度。由于它的本身特點(diǎn),可以建立相關(guān)風(fēng)險(xiǎn)因素,依據(jù)網(wǎng)絡(luò)模型對(duì)于不同事件的反應(yīng)程度、發(fā)展過(guò)程和結(jié)果,可以獲取相關(guān)節(jié)點(diǎn)變量的概率值,進(jìn)而得到風(fēng)險(xiǎn)值。
決策樹(shù)
決策樹(shù)通過(guò)邏輯思維的方式來(lái)優(yōu)化決策,進(jìn)而解決復(fù)雜的問(wèn)題。其在食品行業(yè)的運(yùn)用,有利于農(nóng)產(chǎn)品的食品安全研究。決策樹(shù)通過(guò)降維方式進(jìn)行數(shù)據(jù)預(yù)處理,找出影響農(nóng)產(chǎn)品質(zhì)量的特征值,然后構(gòu)建基于組合優(yōu)化的決策樹(shù)模型,判別農(nóng)產(chǎn)品質(zhì)量安全。在這個(gè)過(guò)程中,可以選取土壤的酸堿度、地區(qū)水的質(zhì)量等級(jí)等作為決策樹(shù)的屬性。通過(guò)后期數(shù)據(jù)的訓(xùn)練,計(jì)算出相應(yīng)的準(zhǔn)確率,最后得出決策樹(shù)是否可以評(píng)估農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險(xiǎn)的結(jié)論。
人工神經(jīng)網(wǎng)絡(luò)
人工網(wǎng)絡(luò)神經(jīng)是模仿生物學(xué)中的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行的建模,通過(guò)長(zhǎng)時(shí)間的訓(xùn)練和測(cè)試,可以有效學(xué)習(xí)數(shù)據(jù)中的一些錯(cuò)誤,是一種學(xué)習(xí)精度相對(duì)較高的數(shù)據(jù)挖掘方式。目前,常見(jiàn)的網(wǎng)絡(luò)模型將近10種,其中常見(jiàn)的為反響傳播神經(jīng)網(wǎng)絡(luò)。通過(guò)數(shù)據(jù)在不同層級(jí)中的不同神經(jīng)元中正向傳播、權(quán)值調(diào)整和反向傳播,學(xué)習(xí)所給的數(shù)據(jù)集,進(jìn)而訓(xùn)練好相應(yīng)的模型。其與主成分分析結(jié)合做過(guò)有關(guān)利用紅外光譜鑒別蘋(píng)果品種的研究,其識(shí)別的準(zhǔn)確率達(dá)到了100%。在后續(xù)的研究中,可以利用類(lèi)似原理,利用不合格產(chǎn)品主要的成分進(jìn)行相關(guān)篩選,挑揀不安全食品或預(yù)警相關(guān)食品的安全。
結(jié)語(yǔ)
由于食品的種類(lèi)繁多,加工的程序復(fù)雜,對(duì)不同的食品其挖掘數(shù)據(jù)的模型不應(yīng)過(guò)于單一。在大數(shù)據(jù)時(shí)代,利用大數(shù)據(jù)來(lái)進(jìn)行食品安全風(fēng)險(xiǎn)預(yù)警也成為食品行業(yè)的急切需要,食品安全問(wèn)題關(guān)乎人們的身體健康和生命安全,只有做好相關(guān)的食品安全風(fēng)險(xiǎn)預(yù)警,才能有效解決食品安全問(wèn)題。同時(shí),不能只依賴(lài)大數(shù)據(jù)來(lái)解決問(wèn)題,也要加強(qiáng)食品制作人員的食品安全意識(shí)。