□ 盧大安 杭州市食品藥品檢驗研究院
隨著我國社會主義市場經(jīng)濟的繁榮發(fā)展,互聯(lián)網(wǎng)也滲入到社會的方方面面,并成為人們生活及工作的重要工具。計算機及互聯(lián)網(wǎng)的長時間運用,幫助各個領(lǐng)域搜集存儲了大量數(shù)據(jù),這些數(shù)據(jù)都蘊含著極高的利用價值,為了充分發(fā)揮這些數(shù)據(jù)的最大使用價值,使這些來自于各個行業(yè)的數(shù)據(jù)在經(jīng)過整合處理后,再應(yīng)用于推動行業(yè)進步,大數(shù)據(jù)技術(shù)應(yīng)運而生。近些年來,食品安全問題屢次發(fā)生,每次事件的曝光都意味著大批消費者已經(jīng)深受其害,食品安全直接關(guān)系到民生安全,食品安全風(fēng)險預(yù)警也逐漸成為社會關(guān)注的焦點。若要減少食品安全事件,必須建立完善的食品安全風(fēng)險預(yù)警制度。大數(shù)據(jù)技術(shù)在各個領(lǐng)域獲得的成就,也使食品安全預(yù)警領(lǐng)域關(guān)注到這一技術(shù)[1]。
大數(shù)據(jù),從字面意思來看就是多種數(shù)據(jù),百科將其定義為需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。通俗來講,即在采取一系列處理措施之后,可以實現(xiàn)優(yōu)化工作流程、提高決策能力及洞察能力的大量相關(guān)數(shù)據(jù),其特征有5個,分別為大量、高速、多樣、低價值密度以及真實性。大數(shù)據(jù)最初被使用于Nutch這一開源項目中,彼時大數(shù)據(jù)的定義較為簡單,被稱為為實現(xiàn)網(wǎng)絡(luò)搜索更新而進行的分析或者批量處理的大量數(shù)據(jù)。發(fā)展到現(xiàn)在,大數(shù)據(jù)已經(jīng)被廣泛應(yīng)用于各個行業(yè)領(lǐng)域,市場競爭的趨勢也逐漸向信息數(shù)據(jù)競爭發(fā)展。大數(shù)據(jù)經(jīng)過長期積累與發(fā)展,已經(jīng)成為一種蘊含多種潛在價值的重要資產(chǎn)。
經(jīng)過近幾年來各種計算機硬件設(shè)備的發(fā)展,其所儲存的各種數(shù)據(jù)信息已經(jīng)形成一個巨大的數(shù)據(jù)庫,如何將這些沉積的數(shù)據(jù)靈活運用起來,使其轉(zhuǎn)變?yōu)橛行У臄?shù)據(jù)資源,成為了人們研究的重要課題。大數(shù)據(jù)挖掘技術(shù)就產(chǎn)生于此種背景下,它能夠?qū)⒍逊e的數(shù)據(jù)轉(zhuǎn)變?yōu)榭捎玫闹R資源。大數(shù)據(jù)挖掘就是運用計算機技術(shù)自動挖掘數(shù)據(jù)庫中的潛在有效信息,并歸納總結(jié)其發(fā)展趨勢的一種方法[2]。
貝葉斯圖代表的是一種不確定因素的挖掘模式,它的每個節(jié)點都是一個變量,貝葉斯圖就是按照這些變量之間的聯(lián)系來測算出下一變量可能出現(xiàn)的概率,它所反映的是所有數(shù)據(jù)之間的概率規(guī)律,所以其一般用來發(fā)現(xiàn)數(shù)據(jù)之間的概率相關(guān)關(guān)系。它的原理是根據(jù)行為結(jié)果以及它們之間的原因結(jié)果關(guān)系,來推測這種結(jié)果未來可能發(fā)生的概率。它在食品安全風(fēng)險預(yù)警領(lǐng)域主要運用于食品產(chǎn)品設(shè)計,例如已知行為結(jié)果是人們愛吃甜食,那么貝葉斯圖中的各個節(jié)點便是人們愛吃的各種甜食,通過建模推測,可以得出食品的顏色會改變?nèi)藗儗κ挛锏南矚g程度。結(jié)合貝葉斯圖的特征,設(shè)定有關(guān)的風(fēng)險節(jié)點,并對其進行多次模型測試,發(fā)現(xiàn)其在不同情況下發(fā)生的變化、具體變化過程及最終結(jié)果,從中得到各個節(jié)點上變量發(fā)生改變的概率,推測出食品安全風(fēng)險發(fā)生概率值。
決策樹側(cè)重于使用邏輯推測方法選擇出最優(yōu)方案來解決疑難問題,將它應(yīng)用到食品安全風(fēng)險預(yù)警領(lǐng)域中,有助于食品安全的研究創(chuàng)新。決策樹采取降維方法事先進行數(shù)據(jù)分析處理,從中發(fā)現(xiàn)能夠影響農(nóng)產(chǎn)品質(zhì)量的相關(guān)特征值,之后再建立決策樹模型進行組合優(yōu)化分析,來判定農(nóng)產(chǎn)品的質(zhì)量情況。在決策樹建模分析過程中,選擇土壤情況、該區(qū)域水質(zhì)情況等要素構(gòu)成決策樹的基本因素,采取相關(guān)數(shù)據(jù)測試的方式得出對應(yīng)的準確率,以此作為評測農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險預(yù)警的工具。
人工神經(jīng)網(wǎng)絡(luò)的建模方式借鑒了生物學(xué)概念中的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),并進行多次的測試及調(diào)整,發(fā)現(xiàn)數(shù)據(jù)中存在的錯誤并對其進行精準學(xué)習(xí),此種數(shù)據(jù)挖掘方式具有高學(xué)習(xí)精度特征?,F(xiàn)今存在的網(wǎng)絡(luò)模型有數(shù)十種,使用最為頻繁的是反響傳播神經(jīng)網(wǎng)絡(luò),它的評測原理是讓數(shù)據(jù)在各個層級中的不同神經(jīng)元中進行正向傳播,然后調(diào)整權(quán)值,以及反向傳播,對數(shù)據(jù)集進行研習(xí)了解,從而調(diào)試好相關(guān)模型。在今后的食品安全風(fēng)險預(yù)警領(lǐng)域中,可以根據(jù)該原理尋找不合格食品的主要結(jié)構(gòu)成分,或者直接根據(jù)結(jié)構(gòu)要素挑出不安全產(chǎn)品。
目前食品市場中的產(chǎn)品種類紛繁復(fù)雜,其生產(chǎn)加工過程也千差萬別,在利用大數(shù)據(jù)技術(shù)進行食品安全風(fēng)險預(yù)警的過程中應(yīng)該采用多種模型,以提升預(yù)警的準確率,食品安全問題直接關(guān)系到人們的身體安全,所以必須運用大數(shù)據(jù)技術(shù)進行分析預(yù)警。除此之外,還要注意提升食品制造產(chǎn)業(yè)人員的社會責(zé)任意識,從根源杜絕食品安全事故。