袁彥彥,王興芬,楊 浩
(北京信息科技大學(xué) 信息管理學(xué)院,北京 100192)
基于關(guān)聯(lián)規(guī)則技術(shù)的肉類食品冷鏈物流質(zhì)量安全保障因素發(fā)現(xiàn)及質(zhì)量安全預(yù)警模型
袁彥彥,王興芬,楊 浩
(北京信息科技大學(xué) 信息管理學(xué)院,北京 100192)
針對多種影響冷鏈物流過程食品質(zhì)量安全的因素,結(jié)合關(guān)聯(lián)規(guī)則挖掘技術(shù),提出了一種肉類食品冷鏈物流質(zhì)量安全保障因素發(fā)現(xiàn)及質(zhì)量安全預(yù)警模型。該模型通過關(guān)聯(lián)規(guī)則技術(shù)首先從肉類食品冷鏈物流數(shù)據(jù)庫中的數(shù)據(jù)發(fā)現(xiàn)食品質(zhì)量安全保障因素,確定權(quán)重后進(jìn)行了食品質(zhì)量安全預(yù)警。實(shí)驗(yàn)結(jié)果表明,該模型能準(zhǔn)確發(fā)現(xiàn)肉類冷鏈物流質(zhì)量安全因素以及質(zhì)量安全預(yù)警,給管理者提供良好的決策支持,同時(shí)有助于加強(qiáng)食品質(zhì)量安全的管理。
肉類食品;冷鏈物流;質(zhì)量安全因素發(fā)現(xiàn);關(guān)聯(lián)規(guī)則技術(shù);質(zhì)量安全預(yù)警
在食品安全管理領(lǐng)域,建立食品冷鏈物流跟蹤與追溯體系,是生鮮食品安全的有效保障。目前,國內(nèi)外學(xué)者就冷鏈物流管理展開了廣泛的研究。國外學(xué)者結(jié)合歐美等發(fā)達(dá)國家冷鏈物流的發(fā)展現(xiàn)狀,提出建立高度協(xié)調(diào)的一體化冷鏈物流體系,國內(nèi)學(xué)者分析了我國冷鏈物流發(fā)展的特點(diǎn),指出應(yīng)完善冷鏈基礎(chǔ)設(shè)施,整合冷鏈上下游各環(huán)節(jié),從而實(shí)現(xiàn)冷鏈的協(xié)調(diào)控制[1-6]。然而冷鏈物流系統(tǒng)是一類典型的復(fù)雜的分布式系統(tǒng),它需要各環(huán)節(jié)之間的高度配合、協(xié)調(diào),而這正是傳統(tǒng)冷鏈物流體系無法實(shí)現(xiàn)的,除此之外,各環(huán)節(jié)采集的大量監(jiān)控?cái)?shù)據(jù)沒有得到有效利用,導(dǎo)致大量有價(jià)值的信息沒有被發(fā)現(xiàn)[2,5]。
關(guān)聯(lián)規(guī)則挖掘技術(shù)能夠發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系,是數(shù)據(jù)挖掘中的一個(gè)重要的課題,被業(yè)界廣泛研究及應(yīng)用。以往的研究學(xué)者在食品質(zhì)量安全方面主要是從宏觀或微觀的角度建立質(zhì)量安全指標(biāo)體系,然后采用層析分析法、時(shí)間序列法等進(jìn)行質(zhì)量安全預(yù)警[8-10],主觀性因素比較大,而本文則旨在充分利用肉類食品冷鏈物流監(jiān)控?cái)?shù)據(jù),采用關(guān)聯(lián)規(guī)則技術(shù)挖掘有價(jià)值的信息,建立模型,發(fā)現(xiàn)肉類食品冷鏈物流過程質(zhì)量安全保障因素以及進(jìn)行質(zhì)量安全預(yù)警,這樣發(fā)現(xiàn)的因素更貼合實(shí)際的肉類食品安全管理因素,預(yù)警效果更能反映實(shí)際情況。
挖掘肉類食品冷鏈物流訂單流(如從工廠A到分銷商B)與端到端的聯(lián)系(如運(yùn)輸模式、產(chǎn)品類型、配送周期等)數(shù)據(jù)庫中記錄了每次配送的所有物流相關(guān)的數(shù)據(jù),如圖1所示:
圖1 冷鏈物流數(shù)據(jù)流
整個(gè)冷鏈物流數(shù)據(jù)流包括產(chǎn)品信息(如產(chǎn)品類型、數(shù)量、重量等)和運(yùn)行信息(如運(yùn)輸模式、業(yè)務(wù)事件時(shí)間、所處業(yè)務(wù)階段、環(huán)境數(shù)據(jù)等)。通過關(guān)聯(lián)規(guī)則和食品質(zhì)量的限制條件就可以挖掘出某些內(nèi)在聯(lián)系,構(gòu)建基于規(guī)則技術(shù)的肉類食品冷鏈物流質(zhì)量安全保障因素以及質(zhì)量安全預(yù)警總體模型,如圖2所示:
圖2 基于關(guān)聯(lián)規(guī)則的肉類食品冷鏈物流質(zhì)量安全保障因素發(fā)現(xiàn)及預(yù)警模型
該模型主要分為兩步:
第一步:關(guān)聯(lián)規(guī)則挖掘,發(fā)現(xiàn)質(zhì)量安全保障因素,并確定權(quán)重。標(biāo)準(zhǔn)的關(guān)聯(lián)規(guī)則由前置條件(如X)和結(jié)果(如Y)組成,表示如下:X->Y(X,Y包含于I,I是一個(gè)項(xiàng)目集),在我們的系統(tǒng)中,X就是案例的相關(guān)屬性集合,比如產(chǎn)品數(shù)量、產(chǎn)品重量、產(chǎn)品類型、溫度等,而Y就是質(zhì)量安全保障屬性;而是否是感興趣的規(guī)則由支持度(前置條件和結(jié)果在知識(shí)庫中同時(shí)發(fā)生的概率)和置信度(條件概率)決定。
支持度(X->Y)=所有包含X、Y案例的數(shù)目/總案例的數(shù)目
置信度(X->Y)=所有包含X、Y案例的數(shù)目/包含X案例的數(shù)目
通過關(guān)聯(lián)規(guī)則挖掘算法得到質(zhì)量保證屬性的權(quán)重:
Wj=Max{置信度(a1->dj),置信度(a2->dj),置信度(a3->dj),…,置信度(am->dj)},即尋找最大關(guān)聯(lián)規(guī)則的過程。比如:(0.95)產(chǎn)品類型->溫度,(0.65)產(chǎn)品數(shù)量->溫度,(0.70)產(chǎn)品重量->溫度,那么溫度的權(quán)重就是0.95。
第二步:質(zhì)量安全預(yù)警。
整合第一步中發(fā)現(xiàn)的質(zhì)量安全保障因素,對其各因素的權(quán)重標(biāo)準(zhǔn)化處理:Ni=Wi/(W1+…+Wj)。然后新將案例中各項(xiàng)相應(yīng)的質(zhì)量安全保障因素屬性值歸一化預(yù)處理即為與各因素的權(quán)值進(jìn)行加權(quán)計(jì)算,得質(zhì)量安全預(yù)警值Y,并將結(jié)果發(fā)送給相關(guān)管理人員,根據(jù)預(yù)警信息,案例檢索異常事件處理源案例庫,尋找相似度最大的異常事件所對應(yīng)的異常處理策略或行為,為相關(guān)管理人員決策提供支持。
在第一步尋找規(guī)則的過程中,采用的是Apriori算法,該算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法[7]。算法使用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),首先找出頻繁1-項(xiàng)集的集合,記作L1。L1用于找頻繁2-項(xiàng)集的集合L2,而L2用于找L3,如此下去,直到不能找到頻繁k-項(xiàng)集。
為了提高頻繁項(xiàng)目集逐層產(chǎn)生的效率,Apriori算法利用了兩個(gè)重要的性質(zhì)用于壓縮搜索空間:
(1)若X是頻繁項(xiàng)集,則x的所有子集都是頻繁項(xiàng)集。
(2)若x是非頻繁項(xiàng)集,則X的所有超集都是非頻繁項(xiàng)集。
Apriori核心算法分析
算法:Apriori算法,使用逐層迭代找出頻繁項(xiàng)集。
輸入:事務(wù)數(shù)據(jù)庫D;最小支持度閾值min_sup。
輸出:D中的頻繁項(xiàng)集L。
算法描述:
L1={large1-itemsets};
for(k=2;Lk-1≠?;k++)do begin
Ck=apriori-gen(Lk-1);//新的候選集
for all transactions t∈D do begin
Ct=subset(Ck,t);//事務(wù)t中包含的候選集
for all candidates c∈Ct do
c.count++;
end
Lk={c∈Ck|c.count≥minsup}
end
Answer=∪kLk;
首先產(chǎn)生頻繁1-項(xiàng)集L1,然后是頻繁2-項(xiàng)集L2,直到有某個(gè)r值使得Lr為空,這時(shí)算法停止。在第k次循環(huán)中,過程先產(chǎn)生候選k-項(xiàng)集的集合Ck,Ck中的每一個(gè)項(xiàng)集是對兩個(gè)只有一個(gè)項(xiàng)不同的屬于Lk-1的頻集做一個(gè)(k-2)-連接來產(chǎn)生的。Ck中的項(xiàng)集是用來產(chǎn)生頻集的候選集,最后的頻集Lk必須是Ck的一個(gè)子集。
頻繁1-項(xiàng)集可以是食品的溫度、濕度、微生物含量以及冷鏈運(yùn)輸時(shí)間等。
通過關(guān)聯(lián)規(guī)則技術(shù),從大量的已經(jīng)采集的質(zhì)量安全信息挖掘出有價(jià)值的信息,比如某類產(chǎn)品安全運(yùn)輸?shù)臏囟葪l件、濕度條件、微生物含量等,這樣就能給管理者提供決策支持,從而間接實(shí)現(xiàn)對冷鏈質(zhì)量安全的提前預(yù)防。
本文涉及的肉類食品冷鏈物流數(shù)據(jù)是來源于某肉類食品冷鏈物流追溯系統(tǒng)(CCQSM)的溯源數(shù)據(jù)庫中的數(shù)據(jù),包括了肉類食品冷鏈物流過程中運(yùn)輸、配送、倉儲(chǔ)所產(chǎn)生的相關(guān)數(shù)據(jù),抽取、清洗所需要的數(shù)據(jù),得到產(chǎn)品從產(chǎn)地到達(dá)目的地所包含的部分?jǐn)?shù)據(jù)記錄,見表1。
表1 原始數(shù)據(jù)表
根據(jù)本文所建立的模型,挖掘感興趣的規(guī)則,最后根據(jù)挖掘的規(guī)則進(jìn)行整合尋找保證食品冷鏈物流質(zhì)量安全的因素,并向食品冷鏈物流相關(guān)管理者提供質(zhì)量安全保障的決策支持。具體操作如下:
4.1 發(fā)現(xiàn)食品冷鏈物流中感興趣的規(guī)則
根據(jù)表1,我們先將數(shù)據(jù)表中的某些字段值進(jìn)行定性化。通過觀察數(shù)據(jù),將根據(jù)臨界值進(jìn)行定性處理,見表2。
表2 字段屬性值離散化
根據(jù)表2,將表1的數(shù)據(jù)處理后得到表3所示的數(shù)據(jù)定性表:
然后,采用Weka軟件連接MySQL數(shù)據(jù)庫,直接獲取數(shù)據(jù)庫中的預(yù)處理數(shù)據(jù),然后對產(chǎn)品重量、產(chǎn)品數(shù)量、平均溫度、微生物含量、重金屬含量、運(yùn)輸時(shí)間進(jìn)行基于Apriori算法的多維關(guān)聯(lián)規(guī)則挖掘,發(fā)現(xiàn)肉類食品冷鏈物流質(zhì)量安全保障因素。取最小支持度=0.2,最小置信度=0.9,最大規(guī)則數(shù)=500,實(shí)驗(yàn)進(jìn)行了16輪的搜索,產(chǎn)生11個(gè)頻繁1項(xiàng)集和184條關(guān)聯(lián)規(guī)則。選取置信度最大的部分關(guān)聯(lián)規(guī)則,見表4。
那么滿足條件的且可以作為此肉類食品冷鏈物流的質(zhì)量安全保障因素只有溫度、重金屬含量、微生物含量和運(yùn)輸時(shí)間,而產(chǎn)品重量和產(chǎn)品數(shù)量作為規(guī)則的后件,其相關(guān)規(guī)則的置信度不滿足條件,不包含在所發(fā)現(xiàn)的關(guān)聯(lián)規(guī)則中。另外,通過查看整理國家食品藥品監(jiān)管總局公布的2015年第1-3期食品安全監(jiān)督抽檢結(jié)果,造成肉類食品出現(xiàn)質(zhì)量安全問題的主要因素見表5。
表3 數(shù)據(jù)定性表
表4 關(guān)聯(lián)規(guī)則
表5 國家食品安全監(jiān)督抽檢結(jié)果統(tǒng)計(jì)(2015:1-3)
這些因素與本文所發(fā)現(xiàn)的因素(微生物含量、重金屬含量)相對應(yīng),說明本文采用關(guān)聯(lián)規(guī)則技術(shù)來發(fā)現(xiàn)肉類食品冷鏈物流質(zhì)量安全保障因素是可行的。這些因素中,重金屬含量是不可逆的,如果超標(biāo),產(chǎn)品就需要被召回;運(yùn)輸時(shí)間會(huì)影響銷售商或分銷商對產(chǎn)品的滿意度,時(shí)間的長短又與運(yùn)輸配送路徑有關(guān),如果運(yùn)輸配送過程中出現(xiàn)路徑異常,延長了時(shí)間,除增加額外的成本外,還會(huì)使得其他因素出現(xiàn)異常,比如微生物的含量、溫度異常等,進(jìn)而增加食品變質(zhì)的風(fēng)險(xiǎn);微生物含量直接影響產(chǎn)品的品質(zhì),并且一般肉類產(chǎn)品的腐敗變質(zhì)都與微生物存在很大的關(guān)系;溫度的波動(dòng)影響微生物含量的變化,溫控不當(dāng)會(huì)使得食品的腐爛變質(zhì)加快,間接影響著食品的品質(zhì)。所以加強(qiáng)對這些內(nèi)在因素的安全控制,可以使得肉類食品的質(zhì)量安全得以保障。
根據(jù)前面模型步驟一所述,確定這些質(zhì)量安全保障因素對應(yīng)的權(quán)重,并將進(jìn)行標(biāo)準(zhǔn)化處理,見表6。
表6 因素權(quán)重及標(biāo)準(zhǔn)化
從表6可以看出因素權(quán)重的大小,說明肉類產(chǎn)品質(zhì)量安全各保障因素重要性程度,可以根據(jù)重要程度對食品的質(zhì)量安全進(jìn)行重點(diǎn)防控。
4.2 質(zhì)量安全預(yù)警
在進(jìn)行上述分析后,確定了肉類食品冷鏈物流質(zhì)量安全保障因素,以及它們相應(yīng)的權(quán)重值,接下來進(jìn)行食品的質(zhì)量安全預(yù)警:
(1)歸一化。由表2中的劃分標(biāo)準(zhǔn),將本文數(shù)據(jù)中的微生物含量、溫度值按下式進(jìn)行歸一化處理:
時(shí)間因素、重金屬含量的歸一化處理:根據(jù)運(yùn)輸距離和以往的運(yùn)輸經(jīng)驗(yàn)史,當(dāng)產(chǎn)品在規(guī)定時(shí)間之內(nèi)送達(dá),則為0;超過規(guī)定時(shí)間,則為1。因?yàn)橹亟饘俸渴鞘称钒踩兄匾蛩刂?,一旦超?biāo),那么產(chǎn)品就需要處理掉或者召回[6],當(dāng)其含量在標(biāo)準(zhǔn)范圍內(nèi)即不超過0.03,為0,超出標(biāo)準(zhǔn)范圍即為異常狀態(tài)為1。
(2)預(yù)警計(jì)算。當(dāng)接收到新案例后,將案例中各因素的值進(jìn)行歸一化處理后,求質(zhì)量安全預(yù)警值隨機(jī)選取數(shù)據(jù)庫中的5條原始數(shù)據(jù),包含異常數(shù)據(jù)和正常數(shù)據(jù),計(jì)算每條數(shù)據(jù)的質(zhì)量安全預(yù)警值,結(jié)果見表7。
表7 風(fēng)險(xiǎn)預(yù)警結(jié)果
表8 異常事件處理源案例
表7中結(jié)果分為兩種情況:如果預(yù)警值為0,說明未出現(xiàn)任何異常;若果預(yù)警值為大于0,說明出現(xiàn)異常,需要向相關(guān)人員進(jìn)行預(yù)警,這樣相關(guān)人員針對異常數(shù)據(jù),通過案例檢索CCQSM系統(tǒng)中的異常事件處理源案例庫,為其決策提供支持,表8所示為異常處理源案例:
通過計(jì)算出該異常事件與案例庫中所有事件的相似度[6],選擇相似度最大的異常案例所對應(yīng)的策略或者行為。例如當(dāng)新案例出現(xiàn)異常:溫度、微生物出現(xiàn)異常,根據(jù)檢索相似度最大的異常事件所對應(yīng)的策略,相關(guān)人員可以檢查冷藏車制冷器,及時(shí)將溫度調(diào)整到正常范圍;運(yùn)輸時(shí)間超時(shí),則通知車主,檢測運(yùn)輸路徑是否正確等。這樣,一方面可以保障肉類食品冷鏈物流的質(zhì)量安全,另一方面可以規(guī)范冷鏈物流操作,加強(qiáng)安全管理。
本文分析了冷鏈物流過程的數(shù)據(jù)流,提出基于關(guān)聯(lián)規(guī)則技術(shù)的肉類食品冷鏈物流質(zhì)量安全保障因素發(fā)現(xiàn)以及質(zhì)量安全預(yù)警模型,該模型分為兩步,第一步是關(guān)聯(lián)規(guī)則挖掘,通過關(guān)聯(lián)規(guī)則算法Apriori發(fā)現(xiàn)冷鏈質(zhì)量安全保障因素,并確定權(quán)重;第二步質(zhì)量安全預(yù)警,預(yù)警之后相關(guān)人員可以案例檢索系統(tǒng)中的異常事件處理源案例庫,尋找相似度最大的相似案例,為其決策提供支持。最后通過實(shí)證研究表明該模型能有效發(fā)現(xiàn)肉類食品冷鏈質(zhì)量安全保障因素以及預(yù)警,給管理者提供決策支持,達(dá)到有效加強(qiáng)食品質(zhì)量安全管理的目的。
[1]Ting S L,TseY K,HoGTS,et al.Mining logistics data to assure the quality in a sustainable food supply chain:A case in the red wine industry[J]. International Journal of Production Economics,2014,(6):200-209.
[2]張智勇,劉承,楊磊.基于MAS的冷鏈物流系統(tǒng)協(xié)調(diào)機(jī)制研究[J].食品工業(yè)科技,2010,(5):387-389.
[3]朱劍鋒.基于多Agent的供應(yīng)鏈協(xié)同信息系統(tǒng)研究[J].中國商貿(mào),2013, (32).
[4]Kang Y S,Lee Y H.Development of generic RFID traceability services[J]. Computers in Industry,2013,64(5):609-623.
[5]Yu X.A research about the tracing technology and system designing of food cold chain[A].Artificial Intelligence,Management Science and Electronic Commerce(AIMSEC)[C].2011.
[6]楊浩,王興芬,莫立民.基于多Agent的食品冷鏈物流質(zhì)量安全管理模型[J].物流技術(shù),2015,34(1):137-140.
[7]Anekritmongkol,Somboon.The comparative of Boolean Algebra compress and Apriori rule techniques for new theoretic association rule mining model[J].International Journal of Advancements in Computing Technology,2011,(3):58-67.
[8]李鵬,章力建.綠色食品質(zhì)量安全預(yù)警體系構(gòu)建研究[J].中國農(nóng)業(yè)資源與區(qū)劃,2013,34(5):92-94.
[9]安珺.基于層次分析法的乳品質(zhì)量安全預(yù)警系統(tǒng)研究[D].哈爾濱:東北農(nóng)業(yè)大學(xué),2012.
[10]許世衛(wèi).畜產(chǎn)品質(zhì)量安全預(yù)警研究[D].北京:中國農(nóng)業(yè)科學(xué)院, 2008.
Quality and Safety Supporting Factor Discovery and Forewarning Model of Meat Product Cold Chain Logistics Based on Association Rule Mining Technology
Yuan Yanyan,Wang Xingfen,Yang Hao
(School of Information Management,Beijing Information&Technology University,Beijing 100192,China)
In this paper,in view of the multiple factors influencing the food quality in the cold chain logistics process and in connection with the association rule mining technology,we proposed a quality and safety supporting factor discovery and forewarning model for a type of meat product cold chain logistics system,then elaborated on the working mechanism of the model,and at the end,in connection with a numerical case,demonstrated the validity of the model.
meat food;cold chain logistics;quality and safety factor discovery;association rule technology;quality and safety forewarning
F762;F253.9
A
1005-152X(2015)11-0182-04
10.3969/j.issn.1005-152X.2015.11.049
2015-08-16
北京市教委科技重點(diǎn)項(xiàng)目“電子商務(wù)平臺(tái)交易糾紛規(guī)避的若干支撐技術(shù)研究”(KZ201411232036)
袁彥彥(1988-),女,山東人,北京信息科技大學(xué)信息管理學(xué)院碩士研究生,研究方向:物流工程;王興芬(1968-),女,教授,博士,研究方向:物流管理、電子商務(wù)與WEB安全;楊浩(1989-),男,湖南岳陽人,北京信息科技大學(xué)信息管理學(xué)院碩士研究生,研究方向:物流工程。