陳 博, 楊亭榆, 劉艾萌, 賴冬寅
(四川工商職業(yè)技術(shù)學(xué)院智能制造與信息工程學(xué)院, 四川 都江堰 611830)
濃香型白酒是一種以糧谷為原料,濃香大曲為糖化發(fā)酵劑,經(jīng)泥窖固態(tài)發(fā)酵后,固態(tài)蒸餾、陳釀、勾調(diào)而成[1]。濃香型白酒的發(fā)酵過程是一個厭氧生物發(fā)酵的過程,采用封閉式的固態(tài)發(fā)酵,發(fā)酵中途無法通過檢測發(fā)酵參數(shù)分析準(zhǔn)確評估發(fā)酵狀態(tài)[2]。雖然酒醅參數(shù)最能反映發(fā)酵整體質(zhì)量,但是酒醅作為半固體的形態(tài),對于它的理化參數(shù)的檢測,首先需要對黃水進(jìn)行繁雜的樣品前處理,速度較慢。而黃水作為濃香型白酒發(fā)酵過程中最重要的副產(chǎn)物,在較大程度上能夠反映發(fā)酵質(zhì)量[3]。因此通過快速檢測黃水液體理化參數(shù),用于發(fā)酵質(zhì)量的評估分析,并進(jìn)一步指導(dǎo)濃香型白酒生產(chǎn)工藝,包括蒸餾和黃水的回收利用,從而提高濃香型白酒的生產(chǎn)效率。
目前對于發(fā)酵質(zhì)量的評估主要依賴人工經(jīng)驗進(jìn)行判斷。首先需要將定量的參數(shù)轉(zhuǎn)化為對于發(fā)酵質(zhì)量定性的描述。而云模型是一種描述定性概念與定量描述之間不確定轉(zhuǎn)換的數(shù)學(xué)模型,同時集成模糊性和隨機性[4]。程方明等[5]通過建立云模型作為評價模型,結(jié)合序關(guān)系分析法和熵權(quán)法確定權(quán)重,分析了某變電站火災(zāi)風(fēng)險等級。劉紀(jì)坤等[6]采用改進(jìn)的層次分析法(analytic hierarchy process,AHP)-熵權(quán)組合賦權(quán)法來分配權(quán)重,結(jié)合云模型理論技術(shù),綜合分析了某地鐵站應(yīng)急能力。通過云模型將測得定量的黃水理化參數(shù)映射成發(fā)酵質(zhì)量的定性描述,保留了評價過程的隨機性和模糊性。
黃水理化參數(shù)包含酸度、還原糖以及酒精度等,它們對于發(fā)酵質(zhì)量的判斷結(jié)果可能不一致甚至存在沖突。D-S(Dempster-Shafer)證據(jù)理論是一種解決多種數(shù)據(jù)融合的方法,被廣泛應(yīng)用于決策融合和信息融合方面[7]。閆善勇[8]提出了一種基于D-S證據(jù)理論的關(guān)聯(lián)方法,利用Dempster規(guī)則對證據(jù)進(jìn)行組合,采用Murphy方法處理證據(jù)沖突,實現(xiàn)雷達(dá)目標(biāo)與敵我識別(identification friend or foe,IFF) 點跡的有效關(guān)聯(lián)。張歡等[9]針對傳統(tǒng)D-S證據(jù)理論所存在的證據(jù)沖突問題,利用皮爾遜相關(guān)系數(shù)對證據(jù)的權(quán)重進(jìn)行修正,提出了一種改進(jìn)的D-S證據(jù)理論。本文采用D-S證據(jù)理論將不同黃水參數(shù)的判斷結(jié)果進(jìn)行融合,針對證據(jù)間的沖突,提出了一種基于改進(jìn)沖突系數(shù)的D-S證據(jù)理論,有效地降低沖突焦元的影響以及融合結(jié)果中的不確定性部分的概率分布。
云模型廣泛應(yīng)用于定性概念與定量表達(dá)之間的相互轉(zhuǎn)化,將概率論和模糊集合論進(jìn)行融合,可以更好地體現(xiàn)出概念的不確定性,廣泛應(yīng)用于工程領(lǐng)域。不確定性是相對精度的概念,包含模糊性與隨機性,模糊性主要指任主觀理解上的不確定性,而隨機性反映的是自然規(guī)律的不確定性[10]。云模型數(shù)字特征由期望值Ex、熵En和超熵He這3個值表示,它把模糊性和隨機性完全集合在一起,構(gòu)成定性和定量之間的映射作為知識表示的基礎(chǔ)[11]。其中,Ex是云滴的分布期望,也是這個概念最典型的量化樣本,它反映了云滴群分布的平均位置;熵En是定性概念不確定性的度量,包括隨機性和模糊性,隨機性是指能反映這一概念的云滴的離散性,模糊性是指在論域中能反映概念的云滴取值范圍;超熵He是En的不確定性的度量,即熵的熵,超熵越小,代表云滴分布越緊密,越大代表云滴分布越離散。
濃香型白酒的發(fā)酵過程的本質(zhì)是一個從淀粉到葡萄糖、到乙醇、再到各種香味成分的過程,發(fā)酵產(chǎn)物中的各個參數(shù)的高低可以反映這個過程進(jìn)行得是否充分[12]。目前對于發(fā)酵狀態(tài)和發(fā)酵質(zhì)量主要是基于人工經(jīng)驗,通過酒醅溫度、氣味、水分進(jìn)行綜合判斷,具體一定程度的主觀性和不穩(wěn)定性。酒醅的理化檢測數(shù)據(jù)雖然可以準(zhǔn)確檢測出發(fā)酵產(chǎn)物中的醇類、酸類、酯類物質(zhì)成分,但由于樣品前處理復(fù)雜,檢測結(jié)果相比實際生產(chǎn)具有滯后性,無法及時用于指導(dǎo)生產(chǎn)。而黃水作為濃香型白酒的發(fā)酵副產(chǎn)物,在發(fā)酵中后期,各類醇類、酸類物質(zhì)以及其他發(fā)酵產(chǎn)物會沉降到黃水中,通過分析黃水參數(shù)可判斷發(fā)酵質(zhì)量。根據(jù)某酒廠黃水參數(shù)與實際生產(chǎn)數(shù)據(jù)(出酒率、總酸、總酯等)的關(guān)聯(lián)分析,整合得到表1中的黃水對發(fā)酵質(zhì)量的評價標(biāo)準(zhǔn),表中分別反映了黃水酸度、還原糖和酒精度3大成分,在不同區(qū)間時,對于發(fā)酵質(zhì)量的定性評價,包含優(yōu)、中、差3個等級。
表1 黃水對發(fā)酵質(zhì)量的評價標(biāo)準(zhǔn)
基于表1中的發(fā)酵質(zhì)量分布,可以得到不同參數(shù)對于發(fā)酵質(zhì)量進(jìn)行定性評價云模型的參數(shù)期望Ex;結(jié)合其他定性評價的參數(shù)期望,可以得到熵En;選擇合適的超熵He,并通過MATLAB繪制云圖。最終可以對黃水的酸度、還原糖酒精度3個參數(shù)對于發(fā)酵質(zhì)量的映射概率分布建立相應(yīng)云模型,如圖1所示。對于黃水樣本,可以根據(jù)它的酸度、還原糖、酒精度分別在圖中得到對于發(fā)酵質(zhì)量判斷結(jié)果的概率分布,其中不滿1的部分算作不確定概率m(X)。
圖1 黃水酸度、還原糖、酒精度隸屬度云模型
黃水樣品通過理化測定方式,分別測量出各自的酸度(以酚酞為指示劑用0.1 mol/L氫氧化鈉標(biāo)準(zhǔn)溶液滴定)、還原糖(堿性酒石酸銅甲液和乙液在加熱狀態(tài)下滴定)和酒精度(酒精計測量)的生產(chǎn)數(shù)據(jù)[13-15]。為驗證黃水參數(shù)對于發(fā)酵的參考性,在采集黃水樣品時也整合了酒廠的相關(guān)生產(chǎn)數(shù)據(jù),包括基酒產(chǎn)量、酒醅總酸及酒醅總酯,5個樣本的生產(chǎn)數(shù)據(jù)見表2。再通過各樣本的黃水參數(shù)的隸屬度模型得到對于樣本在該參數(shù)上“優(yōu)”“中”“差”的分布概率m(A3)、m(A2)、m(A1),除去這3種分布以外的余量采用不確定m(X)來表示,以滿足D-S證據(jù)理論歸一化的運算前提。最終黃水樣本各參數(shù)對應(yīng)的概率分布見表3。
表2 黃水樣本的相關(guān)生產(chǎn)數(shù)據(jù)
表3 黃水樣本所對應(yīng)的概率分布
分析表3中的5個樣本結(jié)果可以發(fā)現(xiàn),不同黃水參數(shù)對各自發(fā)酵質(zhì)量隸屬度的基本概率分散于多個區(qū)間。除了樣本4的3個隸屬度均較集中分布于“中”,其他幾個樣本組在“差”“中”“優(yōu)”3個區(qū)間均有分布,且存在基本概率為0的焦元。因此需要采用信息融合技術(shù),進(jìn)一步將各參數(shù)所反映的發(fā)酵質(zhì)量進(jìn)行綜合評估。
D-S證據(jù)理論起源于1967年Dempster[16]提出的多值映射導(dǎo)出的上概率和下概率,之后其學(xué)生Shafer進(jìn)一步將其完善,建立了命題和集合之間的對應(yīng)關(guān)系,把命題的不確定性問題轉(zhuǎn)化為集合的不確定性問題,滿足比概率論弱的情況,形成了一套關(guān)于證據(jù)推理的數(shù)學(xué)理論。
證據(jù)理論在多傳感器數(shù)據(jù)融合、多源信息融合中得到了廣泛的利用,已成為一種基本的、重要的融合算法。
D-S證據(jù)理論的基本原理和計算規(guī)則如下。
設(shè)U為識別框架,基本信任分配函數(shù)m是一個從集合2U到[0,1]的映射,A表示識別框架U的任一子集,記作A?U,且滿足
(1)
式中:m(A)為事件A的基本信任分配函數(shù),它表示證據(jù)對A的信任程度。
假設(shè)辨識框架U下兩證據(jù)的基本信任分配函數(shù)分別為m1和m2,焦元分別為Ai和Bj,則D-S組合公式為
(2)
(3)
式中:K反映了各個證據(jù)之間的沖突程度,稱為沖突系數(shù),范圍為[0,1]。K值越接近1,表明證據(jù)間沖突越大;越接近0,表明沖突越小。當(dāng)K=1時,兩證據(jù)完全沖突,無法合成;當(dāng)K>1時,合成結(jié)果將沒有意義。系數(shù)1/(1-K)稱為正則化因子。
3.2.1 組合規(guī)則不合理的論證
對于D-S證據(jù)理論,K是表示證據(jù)間沖突大小的物理量。面對證據(jù)中含有概率分配為0的焦元時、證據(jù)間存在較大沖突時、或在同一證據(jù)中存在內(nèi)部焦元時,使用D-S證據(jù)理論進(jìn)行信息融合,可能會產(chǎn)生完全不合理的組合結(jié)果[17]。例如,當(dāng)K過大時,組合結(jié)果容易出現(xiàn)與事實不符的情況,具體可通過以下例子來說明。
(1)假設(shè)對于識別框架U={A1,A2,A3},存在兩個證據(jù)m1和m2,各自焦元的概率分配為
(4)
從而可計算出沖突系數(shù)K為0.96,進(jìn)一步可得到證據(jù)理論的組合結(jié)果為
m(A1)=0,m(A2)=1,m(A3)=0
(5)
這顯然與事實不符,也驗證了證據(jù)理論在規(guī)則的組合方面確實存在不合理的地方。產(chǎn)生這一現(xiàn)象的根本原因是焦元含有為0的基本概率分配,按照傳統(tǒng)融合規(guī)則,這會直接導(dǎo)致該部分的組合結(jié)果也為0。
(2)對于框架U,當(dāng)基本概率分配為
(6)
此時兩個證據(jù)具有完全相同的焦元與基本概率分配函數(shù),但依然存在沖突系數(shù)K=0.34,這也說明了合成規(guī)則的不合理。
(3)對于框架U,當(dāng)基本概率分配為
(7)
相較于式(5),這一概率分配數(shù)值完全相同,但在中間的焦元存在包含關(guān)系,最終沖突系數(shù)K=0.18,與式(5)不相同。這說明在同一證據(jù)中,內(nèi)部焦元分配發(fā)生變化時,也會引起沖突系數(shù)K的變化。
綜合以上分析可知,證據(jù)理論在組合規(guī)則上存在的主要缺陷包括:當(dāng)證據(jù)中含有概率分配為0的焦元時,可能會產(chǎn)生完全不合理的組合結(jié)果;證據(jù)間的沖突考慮不合理,以致完全相同的兩組證據(jù)進(jìn)行組合后會由于沖突系數(shù)的存在而與原證據(jù)產(chǎn)生偏差;未考慮內(nèi)部焦元的分配對沖突系數(shù)的影響。
3.2.2 改進(jìn)的沖突系數(shù)
對于識別框架U={A1,A2,…,An},存在兩個證據(jù)m1和m2,它們的概率分配函數(shù)分別為
(8)
考慮到為0的概率分配函數(shù)可能對組合所產(chǎn)生的巨大影響,因此將各證據(jù)與其自身進(jìn)行組合,與自身組合結(jié)果可寫為
m(AR)=
(9)
式中:AR為兩焦元的交集;m1(Ai)為證據(jù)m1的第i個焦元。
由于內(nèi)部各焦元的基本概率分配是相互影響的,同一證據(jù)內(nèi)部焦元間也存在沖突,因此當(dāng)某證據(jù)與自身進(jìn)行組合時需考慮焦元內(nèi)部所產(chǎn)生的沖突因素。結(jié)合證據(jù)理論關(guān)于沖突系數(shù)的計算公式,定義同一證據(jù)自身沖突系數(shù)KY為
(10)
式中:Ai、Aj分別為證據(jù)m1與m2的兩個焦元。
類似的,不同證據(jù)間的沖突系數(shù)KN為
(11)
由于每條證據(jù)理論各次的組合結(jié)果所得的焦元概率必須滿足和為1的原則,因此可將各次組合寫成交集為空與交集不為空兩種情況之和,即
(12)
由于沖突系數(shù)K為所有交集為空集的和,因此當(dāng)有兩條證據(jù)進(jìn)行組合時,它們的總沖突系數(shù)KTotal為
KTotal=K11+K22+K12+K21=
(13)
相比傳統(tǒng)的沖突系數(shù),KTotal可以較全面包含各證據(jù)間的沖突及證據(jù)與自身組合的沖突。
對兩個證據(jù)進(jìn)行組合時,共有22種組合方式,從而這4種組合方式的概率之和為4,另外由于焦元的概率綜合等于總的概率和減去沖突概率之和,因此可得到兩個證據(jù)組合時的組合規(guī)則為
m(AR)=
(14)
同理,當(dāng)對n個證據(jù)進(jìn)行組合時,組合規(guī)則為
m(AR)=
(15)
改進(jìn)后的計算規(guī)則如下。
(16)
(2)計算各證據(jù)到參考證據(jù)的偏差di。
(17)
(3)設(shè)定證據(jù)可信度分級系數(shù)wi。信度級數(shù)為10級時,根據(jù)各證據(jù)的證據(jù)可信度可根據(jù)距離的值來確定分級系數(shù)的公式為
(18)
式中:Δd=dmax-dmin。
(4)根據(jù)信度分級系數(shù)可得到加權(quán)系數(shù)ci。
(19)
(20)
對于表3中黃水樣本的基本概率分配,首先采用傳統(tǒng)D-S證據(jù)理論進(jìn)行信息融合,組合結(jié)果見表4。表4的結(jié)果中,存在多個概率分配為0的極端結(jié)果,融合結(jié)果沒有完全體現(xiàn)表3所反映的發(fā)酵質(zhì)量信息;同時不確定的概率分配較大,影響對于判斷結(jié)果的解讀;前后數(shù)據(jù)對比發(fā)現(xiàn)融合結(jié)果存在一定出入。例如,表3中樣本5的還原糖和酒精度都反映發(fā)酵質(zhì)量為差,而表4中的融合結(jié)果卻是中。
表4 傳統(tǒng)D-S證據(jù)理論組合結(jié)果
然后采用改進(jìn)的D-S證據(jù)理論的規(guī)則進(jìn)行結(jié)合,最終所得結(jié)果匯總見表5。表5的結(jié)果中,不確定部分明顯減少,同時各個概率區(qū)間的分配數(shù)據(jù)能夠較為全面地反映發(fā)酵質(zhì)量的評估結(jié)果,并且與表3中的原始數(shù)據(jù)一致。例如,樣本1融合結(jié)果為差、樣本2融合結(jié)果為中、樣本5融合結(jié)果為差。
表5 改進(jìn)后的D-S證據(jù)理論組合結(jié)果
對比表4和表5數(shù)據(jù)可以發(fā)現(xiàn),改進(jìn)后的D-S證據(jù)理論,有效降低了概率分配為0的焦元所產(chǎn)生的影響,使融合結(jié)果更加具有代表性;同時降低了不確定部分的分配概率。將評估結(jié)果分別與表2中的生產(chǎn)數(shù)據(jù)進(jìn)行分析對比,發(fā)現(xiàn)改進(jìn)后的D-S證據(jù)理論評估結(jié)果與實際更接近。
基于黃水檢測數(shù)據(jù),通過云模型,得到了定量黃水理化數(shù)據(jù)向定性發(fā)酵質(zhì)量的映射結(jié)果;通過D-S證據(jù)理論,將不同黃水參數(shù)所反映的發(fā)酵質(zhì)量進(jìn)行融合評估;最終,通過將模糊理論和信息融合技術(shù)相結(jié)合,最終得到一種快速評估白酒發(fā)酵質(zhì)量的方法。
在這個過程中,對D-S證據(jù)理論的沖突系數(shù)計算方式進(jìn)行改進(jìn)。改進(jìn)后的D-S證據(jù)理論有效降低了沖突焦元的影響以及概率分配的不確定性,對發(fā)酵質(zhì)量的評估結(jié)果更準(zhǔn)確。最終得到一種可靠的濃香型白酒發(fā)酵質(zhì)量的綜合評估方法,有助于在濃香型白酒生產(chǎn)工藝中,降低人工判別的主觀性。
對濃香型白酒發(fā)酵產(chǎn)物和副產(chǎn)物的快速檢測技術(shù)以及信息融合分析技術(shù),有利于推進(jìn)在白酒生產(chǎn)過程中的自動化和數(shù)字化轉(zhuǎn)型,推動白酒行業(yè)的發(fā)展。