祝田田,張力,杜成成,張保華
1.安徽大學(xué)電子信息工程學(xué)院(合肥 230601);2.安徽大學(xué)集成電路學(xué)院(合肥 230601)
固態(tài)發(fā)酵是我國白酒釀造中獨(dú)有的生產(chǎn)工藝。固態(tài)發(fā)酵通過微生物群落的代謝將酒醅中的糖類轉(zhuǎn)化成酒精及各種酸酯等呈香物質(zhì)。其中,發(fā)酵產(chǎn)生的少量酸酯關(guān)系到白酒的口感體驗(yàn),測定酒醅發(fā)酵過程中酸類和酯類化合物的含量[1],以獲得最佳的風(fēng)味和質(zhì)量成為白酒發(fā)酵技術(shù)研究熱點(diǎn)。
業(yè)界對酒醅酸酯比值獲取,多由酒醅采樣、理化實(shí)驗(yàn)室化驗(yàn)測定并經(jīng)相關(guān)公式計算等一系列操作實(shí)現(xiàn),過程繁瑣且效率低下。隨著人工智能技術(shù)與傳統(tǒng)行業(yè)深度融合,業(yè)內(nèi)初步開展白酒固態(tài)發(fā)酵窖池內(nèi)部各種參數(shù)預(yù)測的研究。余天陽[2]提出的基于時延神經(jīng)網(wǎng)絡(luò)的酒醅溫度時序預(yù)測,模型預(yù)測精度較高,為掌握窖池內(nèi)部溫度實(shí)時變化提供了解決方案;王昆等[3]提出的建立偏最小二乘軟測量模型,預(yù)測清香型白酒發(fā)酵過程中窖池內(nèi)的水分、酸度和淀粉含量,為預(yù)測白酒發(fā)酵產(chǎn)物提供方向。將發(fā)酵歷史數(shù)據(jù)和發(fā)酵變量參數(shù)進(jìn)行關(guān)聯(lián)度分析,運(yùn)用物聯(lián)網(wǎng)技術(shù)實(shí)時監(jiān)測重要發(fā)酵參數(shù)指標(biāo),構(gòu)建并訓(xùn)練神經(jīng)網(wǎng)絡(luò),對關(guān)鍵酸酯比進(jìn)行分析預(yù)測,將顯著提高工作效率,同時也為發(fā)酵過程調(diào)控進(jìn)行有益探索。
在國內(nèi)某大型白酒企業(yè)對其濃香型白酒展開發(fā)酵過程中的酒醅酸酯比預(yù)測研究。該酒企采用小麥、大麥和豌豆等作物混合作為釀酒原料,其配比約7∶2∶1,通過多菌種(如乳酸菌、酵母菌、霉菌和放線菌等)參與的窖池固態(tài)發(fā)酵。發(fā)酵中,乙酸和乙酸乙酯含量主要受溫度和酒精度的影響;CO2濃度和蛋白酶的活力通過影響酸酯化學(xué)反應(yīng)干預(yù)乙酸乙酯生成乙酸;水分和酸度通過影響酵母菌等微生物的生長也會影響乙酸的生成[4]。通過對影響乙酸和乙酸乙酯含量的變量參數(shù)進(jìn)行關(guān)聯(lián)度分析后確定預(yù)測模型的輸入;選擇乙酸與乙酸乙酯質(zhì)量的比值作為預(yù)測對象;實(shí)時監(jiān)測發(fā)酵前2周的溫度、水分、酸度、酒精度、CO2濃度和蛋白酶活力等參數(shù)對發(fā)酵時乙酸與乙酸乙酯的比值進(jìn)行預(yù)測,判斷窖池內(nèi)的變化是否正常,從而合理調(diào)節(jié)窖池的環(huán)境,生產(chǎn)出高質(zhì)量白酒。
數(shù)據(jù)來源于國內(nèi)某大型白酒企業(yè),其中溫度、水分和CO2濃度均由窖池監(jiān)測系統(tǒng)測得。酸度、酒精度以及蛋白酶活力通過監(jiān)測系統(tǒng)無法采集,需要人工采樣測定。
乙酸與乙酸乙酯質(zhì)量的比值則由反應(yīng)式中各物質(zhì)間數(shù)量關(guān)系計算得出[8]。乙酸乙酯生成乙酸的化學(xué)式為式(1)。
式中:CH3COOC2H5為乙酸乙酯,H2O為水,CH3COOH為乙酸,C2H5OH為乙醇。
化學(xué)反應(yīng)式的平衡常數(shù)K表示為式(2)。
式中:c(CH3COOH)、c(C2H5OH)、c(CH3COOC2H5)和c(H2O)分別為乙酸、乙醇、乙酸乙酯和水的濃度,mol/L。
因?yàn)橐欢囟群蛪簭?qiáng)下的平衡常數(shù)K固定,通過測量乙酸乙酯、水、乙酸和乙醇的濃度即可得到,因此在平衡條件下乙酸與乙酸乙酯的比值就可通過式(3)計算得出。
式中:m(C2H4O2)和m(C4H8O2)分別是乙酸和乙酸乙酯的質(zhì)量,g;V/V為發(fā)酵過程中白酒的酒精度,%vol;ρ(H2O)和ρ(C2H6O)分別為當(dāng)前溫度下水和乙醇的密度,是2個具體的數(shù)值,g/m3;T為絕對溫度,K。
數(shù)據(jù)采集之后會有部分?jǐn)?shù)據(jù)明顯偏離其他數(shù)值,形成野值[9]。為處理野值,使用滑動窗口的異常點(diǎn)探測法進(jìn)行判別并將異常值用修剪平均值替換[10]。
設(shè)某個窖池某季節(jié)下的數(shù)據(jù)長度為k,含有6個變量,即溫度、水分、酸度、酒精度、CO2濃度和蛋白酶活力,其數(shù)據(jù)序列可表示為x(t)=[x1(t),x2(t), …,x6(t)],l≤t≤k,其中變量i的第j個長度為l的滑動窗口,可以表示為si,j=[xi(j),xi(j+1), …,xi(j+l-1)]。該滑動窗口實(shí)際上是一段數(shù)據(jù)子序列,且長度為l。
每個滑動窗口的變化趨勢可以用置信區(qū)間的距離半徑表示[11],依據(jù)此值便可對異常點(diǎn)進(jìn)行判別。變量xi的第j個長度為l的滑動窗口si,j=[xi(j),xi(j+1), …,xi(j+l-1)]的置信區(qū)間的距離半徑為式(4)。
根據(jù)得到的變化趨勢值,給出一個疑似異常點(diǎn)的判別方法。含有6個變量的數(shù)據(jù)序列x(t),按照目標(biāo)窗口對每個窗口j計算其距離半徑di,j,并進(jìn)行劃分,由預(yù)先設(shè)定的閾值T進(jìn)行判斷,如果在窗口j中存在某個變量x的距離半徑di,j>T,則認(rèn)為該窗口中可能存在異常點(diǎn)。
為使異常點(diǎn)位置的判斷更為準(zhǔn)確,需要對相鄰窗口之間的關(guān)聯(lián)信息進(jìn)行分析,對初步篩選出的可能為異常點(diǎn)的位置進(jìn)行再次判別,得出相對變化趨勢數(shù)值特征。用各滑動窗口基于式(4)中提取的變化趨勢數(shù)值特征定義其相對變化趨勢數(shù)值,記為式(5)。
對于研究的預(yù)測模型,給出二次判斷方法。數(shù)據(jù)序列x(t)有6個存在聯(lián)系的變量xi,i=1, 2, 3, 4, 5, 6,設(shè)這6個變量的第j個目標(biāo)窗口的相對變化趨勢值為Ωi,j,若式(6)成立,則表明數(shù)據(jù)序列該位置處有異常點(diǎn)。
式中:γ為閾值。
白酒生產(chǎn)周期的前2周尤為重要,為確保發(fā)酵過程順利進(jìn)行,選擇發(fā)酵車間隨機(jī)3個窖池在春季和冬季前2個星期的發(fā)酵參數(shù)數(shù)據(jù)。每個窖池每個季節(jié)下的每組數(shù)據(jù)時間間隔為3 h,數(shù)據(jù)預(yù)處理后共112組數(shù)據(jù),3個窖池兩個季節(jié)下的數(shù)據(jù)共112×6組。以窖池1的春季數(shù)據(jù)為例,圖1(a)是窖池1春季數(shù)據(jù)預(yù)處理前的溫度圖像,圖1(b)是窖池1春季數(shù)據(jù)預(yù)處理后的溫度圖像,其中縱軸表示該窖池每天8組溫度數(shù)據(jù)的方差,橫軸代表發(fā)酵天數(shù)。圖2是窖池1春季數(shù)據(jù)預(yù)處理后的水分、酒精度、酸度、CO2濃度和蛋白酶活力圖像。
圖1 窖池1春季溫度數(shù)據(jù)預(yù)處理前后圖像
圖2 窖池1春季數(shù)據(jù)預(yù)處理圖像
觀察圖1(a)和圖1(b)可以得到,在進(jìn)行數(shù)據(jù)預(yù)處理之前,由于個別異常值的影響,在這一天采集到的溫度數(shù)據(jù)出現(xiàn)較大方差。然而,在進(jìn)行數(shù)據(jù)預(yù)處理后,使用修剪平均值替換這些異常數(shù)據(jù),數(shù)據(jù)的取值在一個合理的波動范圍內(nèi),從而使方差恢復(fù)到正常水平。圖2是除溫度外的其他參數(shù)數(shù)據(jù)經(jīng)過預(yù)處理的圖像,可以看出每個參數(shù)2周內(nèi)的數(shù)據(jù)方差都在較小的范圍內(nèi)波動,這表明數(shù)據(jù)預(yù)處理過程有效地處理異常值,提高數(shù)據(jù)的穩(wěn)定性和可靠性。
每個窖池每個季節(jié)選擇112組酒醅發(fā)酵數(shù)據(jù)來訓(xùn)練和驗(yàn)證模型,其中90組被用作訓(xùn)練學(xué)習(xí)樣本,另外22組則被用作預(yù)測樣本。在建立預(yù)測模型前,基于灰色關(guān)聯(lián)度分析法對乙酸與乙酸乙酯比值的影響變量進(jìn)行分析,影響變量包括溫度、水分、酸度、酒精度、CO2濃度和蛋白酶活力。分析過程包括步驟:(1)建立影響變量參考矩陣和乙酸與乙酸乙酯比值參考序列;(2)對數(shù)據(jù)做歸一化處理,使其標(biāo)準(zhǔn)化、規(guī)范化;(3)計算每個比較序列對應(yīng)影響變量與參考序列的絕對誤差,得到其最大值和最小值;(4)計算每個影響變量與乙酸/乙酸乙酯比值的相關(guān)系數(shù)并取均值,得到關(guān)聯(lián)度。
通過流程計算可得,溫度和酒精度的關(guān)聯(lián)度都超過0.85,說明其對乙酸與乙酸乙酯的比值影響較大,水分、酸度、CO2濃度和蛋白酶活力的關(guān)聯(lián)度在0.55~0.70的范圍內(nèi),均大于0.5,可作為預(yù)測模型的輸入,對乙酸與乙酸乙酯的比值進(jìn)行預(yù)測。
使用BP神經(jīng)網(wǎng)絡(luò)(Back-ProPagation Network)對窖池內(nèi)乙酸與乙酸乙酯的比值進(jìn)行預(yù)測。通過前向傳遞算法計算輸出[12],反向傳播算法不斷調(diào)節(jié)參數(shù)以降低誤差。該模型可在窖池異常時調(diào)整配料配比和發(fā)酵工藝,確保酒醅中酸酯物質(zhì)含量達(dá)到預(yù)期,提供最佳的香氣和口感[13]。
經(jīng)關(guān)聯(lián)度分析,建立的BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖3所示。將窖池內(nèi)各項與乙酸/乙酸乙酯影響較大的參數(shù)(溫度、水分、酸度、酒精度、CO2濃度和蛋白酶活力)作為輸入,將對應(yīng)的乙酸與乙酸乙酯比值作為輸出,所以輸入層節(jié)點(diǎn)數(shù)有6個,輸出層節(jié)點(diǎn)數(shù)有1個。輸入層到隱含層和隱含層到輸出層的激勵函數(shù),都采用sigmod函數(shù)[14],如式(7)所示。
圖3 BP神經(jīng)網(wǎng)絡(luò)模型圖
設(shè)隱含層有10個神經(jīng)元,記vih為輸入層第i個神經(jīng)元到隱含層第h個神經(jīng)元的權(quán)值[15],隱含層第h個神經(jīng)元的閾值則一般被直接表示為bh,隱含層第h個神經(jīng)元到輸出層的權(quán)值通常還可同時被表示為whj,輸出神經(jīng)元的閾值表示為yo[16],乙酸與乙酸乙酯比值的神經(jīng)網(wǎng)絡(luò)預(yù)測模型輸出為式(8)。
使用粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)對神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化訓(xùn)練,每個粒子的位置代表一個群集[17],該群集包含上述網(wǎng)絡(luò)模型中的權(quán)值和閾值信息,粒子的速度表示權(quán)值和閾值的更新方向和大小。通過不斷地更新粒子的位置和速度[18],粒子群優(yōu)化算法可找出神經(jīng)網(wǎng)絡(luò)中使目標(biāo)函數(shù)最小化的權(quán)值參數(shù)和閾值[19-20],從而提高神經(jīng)網(wǎng)絡(luò)的性能。粒子群優(yōu)化算法的實(shí)現(xiàn)過程如圖4所示。
粒子群算法需要將上面建立的BP神經(jīng)網(wǎng)絡(luò)的部分參數(shù)進(jìn)行完善和調(diào)整,主要是對傳遞過程中權(quán)值和閾值的改進(jìn)。在一次又一次的迭代中,粒子的位置和速度會不斷更新,直至找到BP神經(jīng)網(wǎng)絡(luò)中最優(yōu)的權(quán)值和閾值。
具體優(yōu)化步驟:(1)初始值設(shè)定,即對模型中各個參數(shù)賦初值[21]。其中,迭代次數(shù)設(shè)為112;學(xué)習(xí)因子c1=c2=2;種群規(guī)模設(shè)為15;粒子速度控制在[-1, 1]內(nèi);粒子位置控制在[-4, 4]內(nèi)。
(2)隨機(jī)初始化一個種群,將神經(jīng)網(wǎng)絡(luò)模型轉(zhuǎn)化為粒子群算法中的種群粒子,以實(shí)數(shù)編碼方式初始化,每個個體編碼,Wi=(wi1,wi2,...,wiST)代表BP神經(jīng)網(wǎng)絡(luò)的初始值,如式(9)所示。
式中:N、M、L分別為輸入、輸出和隱含層這幾層的結(jié)點(diǎn)數(shù),建立的模型中N=6,M=1,L=10,故S=17。
(3)粒子群算法對神經(jīng)網(wǎng)絡(luò)優(yōu)化時,要有確定的適應(yīng)度函數(shù)。將適應(yīng)度函數(shù)定義為乙酸與乙酸乙酯比值的預(yù)測值與實(shí)際值差的平方求倒。為更好地逼近目標(biāo)函數(shù),還要使用優(yōu)化算法對BP神經(jīng)網(wǎng)絡(luò)傳遞過程中的權(quán)值和閾值賦初值。適應(yīng)度函數(shù)fiti按式(10)計算。
式中:yi為乙酸與乙酸乙酯比值的預(yù)測值,oi為乙酸與乙酸乙酯比值的實(shí)際值,n=22。
(4)在粒子群算法中,通過計算初始粒子的初始值與代表該粒子所處位置解決方案質(zhì)量的值V,可以得到初始時群體所有粒子中的最優(yōu)解和每個粒子自身所取到的最優(yōu)解,并設(shè)置每個粒子的當(dāng)前最佳位置。
(5)每一次迭代過程中,粒子的速度和位置會根據(jù)全局最優(yōu)解和個體最優(yōu)解進(jìn)行更新。在達(dá)到設(shè)定的迭代次數(shù)后,使用已搜索到的最優(yōu)解初始化BP神經(jīng)網(wǎng)絡(luò)神經(jīng)元之間連接的權(quán)重和閾值。對網(wǎng)絡(luò)預(yù)測模型進(jìn)行訓(xùn)練,并輸出乙酸與乙酸乙酯的比值預(yù)測結(jié)果的最優(yōu)解。
經(jīng)過粒子群優(yōu)化前后的BP神經(jīng)網(wǎng)絡(luò)對3個窖池在不同季節(jié)下乙酸與乙酸乙酯比值的預(yù)測結(jié)果如圖5所示。通過對比同一季節(jié)下的3個窖池以及不同季節(jié)下同一窖池的數(shù)據(jù),可以觀察到在采用粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型后,乙酸與乙酸乙酯比值的預(yù)測結(jié)果相對于實(shí)際值的誤差明顯減小,最大偏差未超過0.13。即使在優(yōu)化前,模型的預(yù)測結(jié)果與實(shí)際值之間的差異也不大,但與經(jīng)過優(yōu)化后的模型相比,其預(yù)測表現(xiàn)較差。優(yōu)化后的模型能夠更準(zhǔn)確地預(yù)測乙酸與乙酸乙酯比值,提高了預(yù)測的準(zhǔn)確程度、精確度和可靠性。
為更好地評估神經(jīng)網(wǎng)絡(luò)預(yù)測模型的性能,引入絕對誤差這一評估指標(biāo),以進(jìn)一步了解模型的預(yù)測精度和準(zhǔn)確性。在圖6中,對比2種預(yù)測模型的絕對誤差情況。通過觀察,可以明顯看出經(jīng)過優(yōu)化后的預(yù)測模型的絕對誤差都在-0.1~0.1的范圍內(nèi),表明優(yōu)化后的模型對于乙酸與乙酸乙酯比值的預(yù)測相對準(zhǔn)確。而未經(jīng)優(yōu)化的預(yù)測模型的絕對誤差最大超過0.2,說明其預(yù)測偏差較大。這表明優(yōu)化后的模型能夠更準(zhǔn)確地預(yù)測乙酸與乙酸乙酯比值,并且絕對誤差保持在較小的范圍內(nèi)。
圖6 預(yù)測模型的絕對誤差比較圖
對6組數(shù)據(jù)進(jìn)行誤差參數(shù)指標(biāo)平均值計算,得出表1中的數(shù)據(jù)。相對于未優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,經(jīng)過粒子群算法優(yōu)化后的預(yù)測模型在各項性能指標(biāo)上表現(xiàn)更優(yōu)秀。相較于未經(jīng)優(yōu)化的BP神經(jīng)網(wǎng)絡(luò),粒子群優(yōu)化算法可以加速BP神經(jīng)網(wǎng)絡(luò)的收斂速度,通過引入粒子的位置和速度更新機(jī)制,快速搜索到更優(yōu)的權(quán)值和閾值組合,從而加快模型的收斂過程;該模型具有全局搜索能力,能夠幫助跳出局部最優(yōu)解,并朝向更好的解決方案,提高模型的準(zhǔn)確性和可靠性。總體來看,經(jīng)過優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的表現(xiàn)較為理想,可以用于不同窖池不同季節(jié)下乙酸與乙酸乙酯的比值預(yù)測。
表1 預(yù)測模型結(jié)果評價
在白酒生產(chǎn)過程中,固態(tài)發(fā)酵是一個關(guān)鍵的步驟,它直接影響到最終產(chǎn)品的質(zhì)量和口感。乙酸與乙酸乙酯的比值是白酒的重要指標(biāo)之一,它反映了白酒的品質(zhì)[22]。優(yōu)化后的預(yù)測模型可以幫助酒企實(shí)現(xiàn)對固態(tài)發(fā)酵過程的優(yōu)化和精確控制。通過準(zhǔn)確預(yù)測關(guān)鍵酸酯比,企業(yè)可以調(diào)整發(fā)酵條件、原料配比和操作策略,以實(shí)現(xiàn)更穩(wěn)定、高效和可控的發(fā)酵過程[23]。
試驗(yàn)建立粒子群優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型并與未優(yōu)化的模型對比,對酒醅中乙酸與乙酸乙酯的比值進(jìn)行預(yù)測。結(jié)果表明,由于白酒固態(tài)發(fā)酵時多個參數(shù)都處于動態(tài)變化的過程[24],其中乙酸與乙酸乙酯的比值是衡量白酒質(zhì)量和口感的主要指標(biāo),通過對影響乙酸與乙酸乙酯比值的幾個重要參數(shù)(包括溫度、酸度、水分、酒精度、CO2濃度和蛋白酶活力)進(jìn)行關(guān)聯(lián)度分析,可以確定用這6項參數(shù)作為預(yù)測模型的輸入,預(yù)測乙酸與乙酸乙酯的比值。為建立起一個能夠精確描述酒醅發(fā)酵過程中乙酸與乙酸乙酯比值的預(yù)測模型,選取樣本數(shù)據(jù)總量的近80%作為學(xué)習(xí)試驗(yàn)樣本,剩下的作為預(yù)測研究樣本。建立BP神經(jīng)網(wǎng)絡(luò),采用粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)模型,對酒醅發(fā)酵前2周窖池里乙酸與乙酸乙酯的比值進(jìn)行預(yù)測,通過對模型優(yōu)化前后的各項評判指標(biāo)對比發(fā)現(xiàn),優(yōu)化后的網(wǎng)絡(luò)模型性能更高。通過對已建模型進(jìn)行優(yōu)化、數(shù)據(jù)預(yù)測處理并分析計算,可得R2=0.985 0,MSE值僅為0.006 5,絕對誤差處于-0.1~0.1的范圍,充分表明粒子群優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型能夠較好地定量描述酒醅發(fā)酵產(chǎn)物中乙酸與乙酸乙酯含量比值的變化趨勢。相較于類似研究,試驗(yàn)提供一種可行的方法預(yù)測濃香型白酒固態(tài)發(fā)酵過程中乙酸與乙酸乙酯的比值,并在此基礎(chǔ)上為預(yù)測其他香型白酒發(fā)酵過程中的參數(shù)探索新思路,可以幫助酒企準(zhǔn)確控制固態(tài)發(fā)酵過程中的關(guān)鍵參數(shù),調(diào)整發(fā)酵條件、原料配比和操作策略,以實(shí)現(xiàn)更穩(wěn)定、高效和可控的發(fā)酵過程,優(yōu)化產(chǎn)品質(zhì)量[25]。