中國物品編碼中心福建分中心 楊 林
食品安全數(shù)據(jù)分類編碼不統(tǒng)一,是當(dāng)前食品安全數(shù)據(jù)難以融合共享的最大障礙。
當(dāng)前亟需改變基于條塊業(yè)務(wù)和監(jiān)管權(quán)限所形成的封閉、孤立系統(tǒng)現(xiàn)狀,建立一套符合中國特色的食品安全數(shù)據(jù)分類編碼系統(tǒng)。
隨著信息技術(shù)蓬勃發(fā)展,與食品安全、營養(yǎng)、健康相關(guān)的數(shù)據(jù)得到了一定的積累。在信息共享階段,應(yīng)將這些數(shù)據(jù)轉(zhuǎn)化為可分析利用的大數(shù)據(jù),賦予數(shù)據(jù)以生命力,為政府決策、經(jīng)濟(jì)發(fā)展和科學(xué)研究提供技術(shù)支撐。實(shí)施食品安全數(shù)據(jù)分類編碼標(biāo)準(zhǔn)化是實(shí)現(xiàn)食品安全數(shù)據(jù)跨界融合、形成大數(shù)據(jù)的必要前提。
在當(dāng)今信息化時(shí)代,食品安全數(shù)據(jù)來源范圍較廣,日常生活中人們能夠接觸到的與食品相關(guān)的數(shù)據(jù)都包括在內(nèi),主要包括:(1)各種食品安全檢測裝置的結(jié)果;(2)RFID傳感器的食品質(zhì)量檢測數(shù)據(jù);(3)企業(yè)和監(jiān)管部門;(4)移動(dòng)互聯(lián)網(wǎng)、社交媒體等。
食品安全數(shù)據(jù)涵蓋圖像、視頻、信號(hào)、圖表、文字等多種形式,數(shù)據(jù)量隨時(shí)間的積累變得越來越大。
食品安全大數(shù)據(jù)除具有大數(shù)據(jù)的4V(大量、高速、多樣、真實(shí)性)特性外,還受錯(cuò)綜復(fù)雜的食品安全環(huán)境、消費(fèi)人群、監(jiān)測數(shù)據(jù)飛速增長等因素的影響,表現(xiàn)出以下具體特征:(1)數(shù)據(jù)容量大。來自食品安全監(jiān)測點(diǎn)和哨點(diǎn)的數(shù)據(jù)、各個(gè)地方上報(bào)的食品污染物數(shù)據(jù)、食品安全環(huán)境監(jiān)測數(shù)據(jù)和其他食品企業(yè)自身生產(chǎn)的數(shù)據(jù),這些數(shù)據(jù)聚集在一起就形成了十分龐大的數(shù)據(jù)庫;(2)更新速度迅速。食品安全信息中包含大量的在線或?qū)崟r(shí)數(shù)據(jù)分析和處理要求;(3)種類多。食品安全數(shù)據(jù)包含各種結(jié)構(gòu)化數(shù)據(jù)、非(半)結(jié)構(gòu)化數(shù)據(jù)和其他多種數(shù)據(jù)存儲(chǔ)形式;(4)成本低、價(jià)值大。食品安全大數(shù)據(jù)中存在著大量無用的、冗余的信息,但這些信息具有很大的挖掘和應(yīng)用價(jià)值,與個(gè)人生活、食品行業(yè)、國民經(jīng)濟(jì)息息相關(guān)。
以食品健康鏈為主線,食品安全大數(shù)據(jù)主要包括:農(nóng)業(yè)大數(shù)據(jù)、食品工業(yè)大數(shù)據(jù)、食品屬性大數(shù)據(jù)、膳食健康大數(shù)據(jù)、食品相關(guān)產(chǎn)業(yè)大數(shù)據(jù)和公共媒體數(shù)據(jù)等的完整食品安全數(shù)據(jù)庫。
以食品為導(dǎo)向,食品安全數(shù)據(jù)分類編碼主要包括:食品分類代碼、食源性疾病分類代碼、生物污染物分類代碼(細(xì)菌、寄生蟲、病毒、毒素)、化學(xué)污染物分類代碼、農(nóng)藥分類代碼、天然毒素分類代碼、金屬分類代碼等。
目前,國際上食品安全相關(guān)分類編碼體系有國際物品編碼組織(Globle Standard 1,GS1)的GS1系統(tǒng) ;國際食品法典委員會(huì)(CAC)的食品分類編碼體系、獸藥殘留標(biāo)準(zhǔn)的食品分類編碼、食品添加劑使用標(biāo)準(zhǔn)的食品分類編碼;世界衛(wèi)生組織(WHO)、聯(lián)合國糧農(nóng)組織(FAO)與聯(lián)合國環(huán)境規(guī)劃署共同建立的食品污染物監(jiān)測評(píng)估規(guī)劃(GEMS/Food)的食品分類體系、食品消費(fèi)數(shù)據(jù)庫的食品分類。發(fā)達(dá)國家的食物分類編碼系統(tǒng),主要有歐盟FoodEx2食品分類編碼體系(EFSA)、美國農(nóng)業(yè)部國家營養(yǎng)數(shù)據(jù)庫食物編碼系統(tǒng)(USDA)、德國食品法典與營養(yǎng)數(shù)據(jù)庫食物編碼系統(tǒng)、澳大利亞和新西蘭的食品分類系統(tǒng)等。
國際上,食品編碼方式注重食品分類的規(guī)律性和鏈條式信息的科學(xué)性,方便食物的提取和利用,特別是美國農(nóng)業(yè)部國家營養(yǎng)數(shù)據(jù)庫,它是由多個(gè)部門和企業(yè)配合,專門由美國農(nóng)業(yè)部營養(yǎng)數(shù)據(jù)實(shí)驗(yàn)室制定,并通過專門的網(wǎng)站進(jìn)行發(fā)布。其中的數(shù)據(jù)基本上每年均在更新,同時(shí)也及時(shí)公布新添加食品的編碼和營養(yǎng)成分的數(shù)據(jù)。
總體來說,國外食品安全數(shù)據(jù)分類編碼系統(tǒng)各有特色,能夠較好地滿足各自需求,同時(shí)對(duì)我國食品安全數(shù)據(jù)分類編碼系統(tǒng)建設(shè)具有參考借鑒意義。
為了提升我國食品安全信息化水平,在過去幾年我國已經(jīng)建成了多類信息系統(tǒng),包括:農(nóng)產(chǎn)品質(zhì)量安全監(jiān)管追溯系統(tǒng)、食品安全抽檢監(jiān)測信息系統(tǒng)、食品微生物污染監(jiān)測系統(tǒng)、食品化學(xué)污染物監(jiān)測系統(tǒng)、食源性疾病病例監(jiān)測系統(tǒng)、食源性疾病爆發(fā)事件系統(tǒng)、食源性疾病分子溯源系統(tǒng)、食品安全輿情監(jiān)測系統(tǒng)、膳食消費(fèi)量系統(tǒng)等,這些信息系統(tǒng)在各自領(lǐng)域發(fā)揮著重要作用。近幾年來,我國對(duì)食品分類編碼工作高度重視,各領(lǐng)域根據(jù)各自需要梳理食品分類,形成了多個(gè)食品分類編碼體系,例如,食品生產(chǎn)許可證審查細(xì)則的食品分類、農(nóng)產(chǎn)品分類與代碼、全國食品污染物監(jiān)測網(wǎng)絡(luò)的食品分類、中國居民營養(yǎng)與健康狀況調(diào)查中的食品分類、中國食物成分表、總膳食研究中的食品分類等,這些食品分類編碼體系中,存在食品分類相互交叉且編碼不統(tǒng)一的現(xiàn)象,使現(xiàn)有各信息系統(tǒng)之間很難進(jìn)行數(shù)據(jù)融合共享。
在食品安全數(shù)據(jù)標(biāo)準(zhǔn)化方面,涉及食品分類編碼體系的標(biāo)準(zhǔn)有:GB 2760-2011《食品添加劑使用標(biāo)準(zhǔn)》、GB 2762-2017《食品中污染物限量》、GB 2763-2016《食品中農(nóng)藥最大殘留限量》等,這些標(biāo)準(zhǔn)中食品分類編碼體系不盡相同,存在較大差異,為食品抽檢工作帶來許多困擾。
原國家食品藥品監(jiān)督管理總局已經(jīng)制定了部分食品安全數(shù)據(jù)標(biāo)準(zhǔn),例如,食品抽檢系統(tǒng)中,所制定的標(biāo)準(zhǔn)已涵蓋食品安全數(shù)據(jù)部分內(nèi)容,使各級(jí)食品藥品監(jiān)督管理部門的食品檢驗(yàn)機(jī)構(gòu)均使用統(tǒng)一的標(biāo)準(zhǔn)出具檢驗(yàn)報(bào)告,實(shí)現(xiàn)了對(duì)食品分類、食品檢驗(yàn)項(xiàng)目、食品檢驗(yàn)方法、食品判定的數(shù)字標(biāo)準(zhǔn)化。但是我國在跨部門之間的食品數(shù)據(jù)標(biāo)準(zhǔn)尚未建立。以小麥為例,GB 7635.1-2002《全國主要產(chǎn)品分類與代碼》中小麥類食品類代碼組成為5+3格式,而在原國家食品藥品監(jiān)督管理總局發(fā)布的關(guān)于食品生產(chǎn)許可證分類目錄的公告(2016年第2號(hào))中,小麥粉的食品分類代碼卻為4位固定代碼。目前,同一食品的代碼,在不同條件下不兼容,而不同實(shí)驗(yàn)室之間的數(shù)據(jù)代碼差異更大。
食品安全數(shù)據(jù)分類編碼不統(tǒng)一,是當(dāng)前食品安全數(shù)據(jù)難以融合共享的最大障礙。由于歷史原因,當(dāng)初食品安全信息系統(tǒng)建設(shè)時(shí)缺乏整體規(guī)劃,各部門采用不同的分類編碼規(guī)則,甚至同一部門信息化系統(tǒng)中的分類編碼也不統(tǒng)一,導(dǎo)致各信息系統(tǒng)互不兼容,“信息孤島”問題嚴(yán)重,無法對(duì)不同系統(tǒng)所產(chǎn)生的數(shù)據(jù)進(jìn)行整合、綜合利用與分析。因此,當(dāng)前亟需改變基于條塊業(yè)務(wù)和監(jiān)管權(quán)限所形成的封閉、孤立系統(tǒng)現(xiàn)狀,建立一套符合中國特色的食品安全數(shù)據(jù)分類編碼系統(tǒng)。
通過對(duì)國內(nèi)外各食品分類體系的分類原則分析,得知對(duì)食品進(jìn)行分類時(shí),基本遵循以下原則:(1)各分類體系的主要作用是為農(nóng)殘、食品添加劑等限量的制/修訂服務(wù);(2)各分類體系均將具有相似特征和相同風(fēng)險(xiǎn)的食品歸為一類;(3)各分類體系均將食品分為植物來源的食品和動(dòng)物來源的食品;(4)同類食品具有相同的理化特征或相似的農(nóng)業(yè)耕種特征;(5)同一類型的食品包括的食品細(xì)類范圍較窄。
我國有專家學(xué)者在研究國內(nèi)外食品安全數(shù)據(jù)分類編碼現(xiàn)狀和編碼系統(tǒng)框架設(shè)計(jì)的基礎(chǔ)上,提出了一套具有中國特色的食品安全大數(shù)據(jù)智能編碼系統(tǒng)設(shè)計(jì)架構(gòu):(1)梳理現(xiàn)有食品安全相關(guān)信息系統(tǒng),初步編寫數(shù)據(jù)字典。(2)以數(shù)據(jù)融合共享為導(dǎo)向,科學(xué)分類,將錯(cuò)亂缺失的分類樹梳理成標(biāo)準(zhǔn)的分類樹。(3)確定數(shù)據(jù)顆粒度,建立編碼解碼規(guī)則。在編、解碼方面,歐盟食品分類與編碼系統(tǒng)FoodEx2具有較強(qiáng)的適用性,可作為重要參考。(4)食品安全相關(guān)數(shù)據(jù)系統(tǒng)與標(biāo)準(zhǔn)食品分類樹編碼進(jìn)行映射。采用“柔性編碼對(duì)接體系”方式進(jìn)行映射,進(jìn)行關(guān)鍵詞概率匹配,實(shí)現(xiàn)自動(dòng)化智能映射,再輔以人工核實(shí),提高映射匹配的準(zhǔn)確度和工作效率。