代志凱
(浙江醫(yī)藥股份有限公司新昌制藥廠,浙江新昌 312500)
食品工業(yè)是人類賴以生存與發(fā)展的基礎(chǔ),是關(guān)系國計民生的主要產(chǎn)業(yè)。而食品加工工藝及配方優(yōu)化是食品開發(fā)與研制中不可缺少的環(huán)節(jié),選擇合適的優(yōu)化工藝及配方對縮短試驗時間、減低生產(chǎn)成本、保證食品的質(zhì)量具有重要的作用。
國內(nèi)外用得比較成熟的工藝及配方優(yōu)化方法有正交試驗、均勻設(shè)計和響應(yīng)面設(shè)計等。雖然上述方法在試驗處理時可以取得較佳點,基本可以滿足一般試驗的要求,但它們還存在一些問題,如試驗的精度不夠,選擇的試驗取值僅僅是接近最佳取值,無法精確找到最佳點,難以描述優(yōu)化指標與各因素之間的非線性關(guān)系,誤差較大[1]。隨著人工神經(jīng)網(wǎng)絡(luò)技術(shù)的成熟和完善以及優(yōu)化設(shè)計理論與算法的進步和發(fā)展,為食品加工工藝及配方的優(yōu)化開辟了新的途徑[2-3]。但是利用神經(jīng)網(wǎng)絡(luò)與遺傳算法優(yōu)化需要較高的理論知識和較強的計算機編程能力,限制了其在食品工業(yè)中的應(yīng)用。
本文從神經(jīng)網(wǎng)絡(luò)和遺傳算法的原理、實驗設(shè)計的選擇、數(shù)據(jù)處理和分析入手對其進行系統(tǒng)的介紹,重點介紹如何使神經(jīng)網(wǎng)絡(luò)的非線性映射和遺傳算法的全局搜索的能力有機結(jié)合在一起應(yīng)用于食品工藝及配方優(yōu)化中,以期有更多的研究工作者采用神經(jīng)網(wǎng)絡(luò)和遺傳算法技術(shù)方便有效地優(yōu)化生產(chǎn)過程提高工作效率。
人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)簡稱神經(jīng)網(wǎng)絡(luò),是20世紀80年代重新興起的一種模擬人腦及其活動的理論化的數(shù)學模型,由多個非常簡單的處理單元按某種分時相互聯(lián)接而形成的計算系統(tǒng),具有自組織、自適應(yīng)、自學習等特點,對解決非線性問題特別有效,還有很強的輸入輸出非線性映射能力,易于學習和訓練等優(yōu)點。它基本上類似黑箱理論,只根據(jù)輸入數(shù)據(jù)和輸出數(shù)據(jù)來建立模型,網(wǎng)絡(luò)的統(tǒng)計信息儲存在數(shù)量巨大的加權(quán)矩陣內(nèi),可以反映十分復雜的關(guān)系。目前對于不同目的的神經(jīng)網(wǎng)絡(luò)有60多種,其中在食品工藝優(yōu)化中應(yīng)用最多的是誤差反傳網(wǎng)絡(luò)即BP(Back-propagation)神經(jīng)網(wǎng)絡(luò)。典型的BP神經(jīng)網(wǎng)絡(luò)如圖1所示。
遺傳算法(Genetic algorithm,GA)是一種借鑒生物界自然選擇和進化機制發(fā)展起來的高度并行、隨機、自適應(yīng)搜索算法。它將問題域中的可能解看作是群體的一個個體或染色體,并將變量進行二進制或十進制編碼,確定個體性能的評價依據(jù),即適應(yīng)度函數(shù),然后模擬生物進化過程,對群體反復進行類似于遺傳的操作(選擇、交叉和變異),根據(jù)預(yù)定的目標適應(yīng)度函數(shù)對每個個體進行評價,依據(jù)適者生存,優(yōu)勝劣汰的進化規(guī)則,不斷得到更優(yōu)的群體,同時以全局并行方式來搜索群體中的最優(yōu)個體,最終獲得適應(yīng)度最好的個體。由于其思想簡單、易于實現(xiàn)、遺傳算法已廣泛應(yīng)用于智能控制、問題優(yōu)化及求解、模式識別和人工生命等領(lǐng)域,并取得了許多令人鼓舞的成就。
ANN有很強的輸入輸出非線性映射能力,特別適用于非線性、非結(jié)構(gòu)化的復雜模型中。而GA又是一種有導向的全局隨機搜索方法,對于目標函數(shù)和搜索空間沒有任何限制,因此非常適合ANN模型等無明確分析函數(shù)形式的優(yōu)化問題。將神經(jīng)網(wǎng)絡(luò)與遺傳算法有機的融合,充分利用ANN的非線性擬合能力與GA的全局搜索能力,從而增強了ANN的智能搜索和泛化能力。目前在工藝優(yōu)化領(lǐng)域中BP神經(jīng)網(wǎng)絡(luò)應(yīng)用的最為廣泛,也相對簡單,因此本文將主要介紹BP神經(jīng)網(wǎng)絡(luò)和遺傳算法耦合過程。
由于食品加工過程涉及的工藝參數(shù)種類很多,不同工藝參數(shù)對產(chǎn)品質(zhì)量的影響程度也各不相同,因此為提高模型工作效率,降低網(wǎng)絡(luò)模型的復雜度,必須對模型要考察的輸入工藝參數(shù)項目進行選取。ANN建模過程中參數(shù)項的選擇將遵循以下原則:
1)所選輸入?yún)?shù)必須是易于控制和測量的變量。
2)所選輸入?yún)?shù)應(yīng)盡可能是相互獨立的變量。
3
)所選輸入?yún)?shù)對輸出目標有顯著影響。
由于BP神經(jīng)網(wǎng)絡(luò)是一種有到導師的學習過程,因此選擇合適的樣本來訓練網(wǎng)絡(luò)就顯得很關(guān)鍵。隨機進行實驗的數(shù)據(jù)來訓練神經(jīng)網(wǎng)絡(luò),需要較多樣本,且分布不合理,效率不高。按照一定優(yōu)化設(shè)計進行實驗,得到的實驗數(shù)據(jù)來訓練ANN建模,優(yōu)于一般的隨機實驗數(shù)據(jù)所建的模型。因為這些設(shè)計的取點在空間分布均勻,更有代表性,能減少訓練樣本數(shù),所建的ANN模型的效果也更佳[4]。目前常用正交、均勻設(shè)計和響應(yīng)面設(shè)計(response surface optimization,RSM)所得到的試驗樣本一般均能滿足要求。
當樣本選取好后,以避免由于變量取值范圍的差異造成的網(wǎng)絡(luò)不穩(wěn)定性,所有的變量(包括輸入、輸出變量)一般均做標準化處理。
利用ANN技術(shù)構(gòu)建模型時,由于受各種因素的制約,所采集到的工藝參數(shù)值與實際值總有一定的差異,因此要求所建立的神經(jīng)網(wǎng)絡(luò)模型除具有良好的非線性映射能力之外,還必須具有較強的去除噪能力和泛化能力。因此常常將收集到的實驗數(shù)據(jù)隨機的分成兩組,即訓練組和預(yù)測組。訓練組用來訓練神經(jīng)網(wǎng)絡(luò),預(yù)測組檢驗網(wǎng)絡(luò)的泛化能力。
ANN的拓撲結(jié)構(gòu)確定以后,可以通過不斷調(diào)試網(wǎng)絡(luò)的參數(shù)來訓練ANN。當網(wǎng)絡(luò)訓練好之后還要檢驗其預(yù)測能力(即網(wǎng)絡(luò)的泛化能力)。為了更準確的測試網(wǎng)絡(luò)的性能,必須從訓練集之外的數(shù)據(jù)樣本中選取測試樣本,這是因為如果測試樣本本身來自訓練集之中,由于ANN訓練精度非常高,網(wǎng)絡(luò)模型對每組數(shù)據(jù)都高精度地擬合了,但是擬合的好并不一定網(wǎng)絡(luò)的泛化能力強,有時可能會陷入過度擬合,所以必須選用訓練集以外的樣本檢驗網(wǎng)絡(luò)的預(yù)測能力[5]。故應(yīng)該將數(shù)據(jù)樣本分成兩部分,一部分用來訓練神經(jīng)網(wǎng)絡(luò),另外一部分用來檢驗網(wǎng)絡(luò)的預(yù)測能力。當網(wǎng)絡(luò)的擬合和泛化能力都滿足要求后,我們就可以利用GA來尋優(yōu)了。
將上述完成訓練的ANN輸出,作為求解目標函數(shù)值。由于GA不需要明確的數(shù)學導數(shù)表達式,故可利用它計算尋優(yōu)。ANN與GA相結(jié)合的優(yōu)化方法,整個流程見圖2。
圖2ANN與GA結(jié)合的框圖Fig.2 Schema of the working principle for ANN coupling GA
在圖2中,實驗數(shù)據(jù)被分成訓練組和預(yù)測組,訓練組用來訓練BP神經(jīng)網(wǎng)絡(luò),然后預(yù)測組用來對訓練好的網(wǎng)絡(luò)進行測試,由此構(gòu)建ANN模型,并以該模型的輸出為GA的目標函數(shù),通過GA的全局尋優(yōu),找到最優(yōu)工藝或配方組合[6]。
由于ANN強大的非線性擬合能力和GA優(yōu)良的全局收索能力,ANN-GA耦合已廣泛應(yīng)用于食品工業(yè)工藝優(yōu)化的各個方面。具體見表1。
例如周先漢等[16]首先在單因素試驗基礎(chǔ)上,確定合理的因素水平范圍,設(shè)計均勻試驗,使試驗點盡可能多的分布在可行的試驗。然后再將單因素和均勻設(shè)計的41組實驗數(shù)據(jù)分為訓練(30組)和預(yù)測(11組)兩部分,建立拓撲結(jié)果為(5-16-1)的ANN模型,訓練組用來訓練ANN,預(yù)測組則用來檢驗網(wǎng)絡(luò)的泛化能力。最后以訓練好的ANN作為適應(yīng)度函數(shù),利用GA全局尋優(yōu)求取最優(yōu)工藝參數(shù)。
ANN-GA的特點在于:對于ANN模型而言,通過結(jié)合GA的優(yōu)化作用,使網(wǎng)絡(luò)的性能在合理范圍內(nèi)得到提高;對于GA而言,ANN起的是一種約束作用,通過ANN的模擬使GA的優(yōu)化范圍大致限定在的實際合理的范圍內(nèi)。目前限制ANN-GA在食品工藝優(yōu)化中應(yīng)用的主要原因還是由于其需要一定的算法方面的論理知識和較強的計算機編程能力。因此下面將就一個具體實例為例詳細講解ANN-GA耦合在工藝優(yōu)化中的應(yīng)用,旨在更加形象直觀展示其實現(xiàn)過程。
3.2.1 ANN模型的建立
本文以文獻[10]為例,具體說明ANN-GA的優(yōu)化過程。考察pH值、交聯(lián)劑濃度和時間3個因素對固定纖維素酶活的影響,首先建立3因素5水平的中心組合設(shè)計,利用中心組合設(shè)計的20組數(shù)據(jù)建立ANN模型,然后利用另外3組合數(shù)據(jù)檢驗?zāi)P偷姆夯芰Α?/p>
表1ANN-GA在食品工藝優(yōu)化中的應(yīng)用Table 1 The application of ANN-GA in optimization of food technology
由于文獻[10]中提供的細節(jié)有限,因此本文只能簡單模擬其實現(xiàn)過程。
ANN的建立與檢驗程序如下:
注:本文的所建立的神經(jīng)網(wǎng)絡(luò)只是對簡單的還原,并非與文中的模型完全一致,旨在幫助讀者形象的了解神經(jīng)網(wǎng)絡(luò)的建立過程。
文獻[10]還分別比較了ANN模型和響應(yīng)面(RSM)模型的擬合與預(yù)測能力。本文利用上述程序建立的神經(jīng)網(wǎng)絡(luò)模型也能實現(xiàn)文獻中的效果,結(jié)果分別見圖3和4,可見,圖3和4表明所建的ANN模型的擬合與預(yù)測能力均優(yōu)于RSM模型。
3.2.2 GA優(yōu)化
當所建的ANN模型符合要求后,就可以利用GA來優(yōu)化求取最優(yōu)解,一般ANN的擬合能力非常強,關(guān)鍵是看其泛化能力,即對訓練集之外樣本的預(yù)測能力,由圖3可知上述所建的ANN的擬合和泛化能力基本達到要求,因此下面就利用gaot遺傳算法工具箱求解其最佳工藝。
GA的性能追蹤如圖5所示。
當經(jīng)過約25次遺傳操作后最優(yōu)解和總?cè)浩骄饩諗坑?6%左右,即當pH=4.34,交聯(lián)劑濃度為0.085%,時間4.59 h,纖維素酶的最高固定化率為65.97%,最優(yōu)值與原文的66.75%相差不大,最佳工藝參數(shù)有少許差別,有待實驗檢驗。不過這并不是本文的重點,本文旨在還原ANN-GA在工藝優(yōu)化中實現(xiàn)的具體步驟和過程,為其實際應(yīng)用提供一個參考。上述就是ANN-GA優(yōu)化的整個源程序,讀者只需掌握一定Mablab語言便可根據(jù)需要將程序稍許改動就能靈活運用,希望通過本文能給廣大科技工作者在利用ANN-GA優(yōu)化工藝及配方時提供便利。
在生產(chǎn)工藝及配方優(yōu)化過程中,影響因素很難用精確模型描述,傳統(tǒng)的正交及響應(yīng)面方法存在模型粗糙,精度低等缺陷[19-20]。而利用ANN高度非線性擬合和GA的全局尋優(yōu)的能力能在很大的程度上克服傳統(tǒng)方法的缺陷,為生產(chǎn)工藝的決策和控制提供可靠的依據(jù)。
ANN-GA優(yōu)化工藝參數(shù)的過程中,關(guān)鍵步驟在于訓練ANN,理論上訓練ANN數(shù)據(jù)點越多越好,但是在實際的試驗中往往不能達到,通常是利用盡可能少的試驗次數(shù)得到盡量多的試驗信息。因此在訓練網(wǎng)絡(luò)時,在有限信息中,合理的數(shù)據(jù)點分布對ANN訓練的好壞起著重要的作用。理論上來說ANN訓練所需的試驗點應(yīng)該在空間分布均勻,且有足夠的代表性。利用正交設(shè)計、均勻設(shè)計和中心組合設(shè)計等得到的數(shù)據(jù)點一般都能符合上述條件,其中尤其是均勻設(shè)計得到的數(shù)據(jù)點最佳,因為在相同的實驗次數(shù)下,均勻設(shè)計能考慮更多的因素和水平,而且均勻設(shè)計試驗點的分布和代表性均優(yōu)于中心組合設(shè)計。因此,利用均勻設(shè)計的試驗點來訓練ANN,能得到更好,泛化能力更強的網(wǎng)絡(luò)模型[21-22]。
利用ANN-GA優(yōu)化食品工藝時,可以直接利用正交、均勻設(shè)計或者響應(yīng)面設(shè)計的實驗數(shù)據(jù)建立ANN,然后利用GA直接尋優(yōu),并不需要額外單獨的設(shè)計試驗。因此將傳統(tǒng)的實驗設(shè)計方法與ANN-GA相結(jié)合,提出了一種新的數(shù)據(jù)分析和處理方法。該方法能充分挖掘和利用試驗設(shè)計數(shù)據(jù)的信息,得出的結(jié)論可以和常規(guī)的實驗設(shè)計分析方法互相驗證,可預(yù)見在以后的研究中,ANN-GA在食品工藝及配方優(yōu)化中將越來越發(fā)揮重要的作用。
:
[1]Ba■D,Boyacl I H.Modeling and optimization I:Usability of response surface methodology[J].Journal of Food Engineering,2007,78:836-845
[2]李琳,趙謀明,張黎.人工神經(jīng)網(wǎng)絡(luò)在食品工業(yè)中的應(yīng)用[J].食品研究與開發(fā),2005,26(1):13-16
[3]Huang H.Applications of Artificial Neural Networks(ANNs)in Food Science[J].Critical Reviews in Food Science and Nutrition,2007,47:113-126
[4]Cheng J,Li Q S,Xiao RC.A new artificial neural network-based response surface method for structural reliability analysis[J].Probabilistic Engineering Mechanics,2008,23:51-63
[5]He L,Xu Y Q,Zhang X H.Medium factors optimization and fermentation kinetics for phenazine-1-carboxylic acid production by Pseudomonas sp.M18G[J].Biotechnol Bioeng,2008,100(2):250-259
[6]代志凱,張翠,阮征.試驗設(shè)計與統(tǒng)計優(yōu)化及其在培養(yǎng)基優(yōu)化中的應(yīng)用[J].微生物學通報,2010,37(6):894-903
[7]Bao Y,Mou M Z,Yue M J.Optimization of tyrosinase inhibition activity of ultrasonic-extracted polysaccharides from longan fruit pericarp[J].Food Chemistry,2008,110:294-300
[8]Koc1 A B,Heinemann P H,Ziegler GR.optimization of whole milk powder processing variables with neural networks and genetic algorithms[J].Food and Bioproducts Processing,2007,85(C4):336-343
[9]Izadifar M,Zolghadri M.Application of genetic algorithm for optimization of vegetable oil hydrogenation process[J].Journal of Food Engineering,2007,78:1-8
[10]Zhang Y,Xu J L,Yuan Z H,et al.Artificial neural network-genetic algorithm based optimization for the immobilization of cellulase on the smart polymer Eudragit L-100[J].Bioresource Technology,2010,101:3153-3158
[11]Tushar G,Mainak C,Anshu S.Comparative Study of Response Surface Methodology,Artificial Neural Network and Genetic Algorithms for Optimization of Soybean Hydration[J].Food Technol.Biotechnol,2010,48(1):11-18
[12]Zhu Y B,Zhang J H,SHI Z P.Optimization of Operating Conditions in Rice Heat Blast Process for Chinese Rice Wine Production by Combinational Utilization of Neural Network and Genetic Algorithms[J].journal of the institute of brewing,2004,110(2):117-123
[13]唐明,藏占鋒,邵偉.酵母抽提物干燥工藝節(jié)能優(yōu)化研究[J].現(xiàn)代食品科技,2010,26(2):167-169
[14]趙武奇,仇農(nóng)學,王宏.蘋果渣多酚提取工藝的神經(jīng)網(wǎng)絡(luò)建模與遺傳算法優(yōu)化[J].食品科學,2007,28(12):138-142
[15]曹晞,吳毅強,李積華.人工神經(jīng)網(wǎng)絡(luò)-遺傳算法優(yōu)化酶法提取綠豆渣水溶性纖維素工藝研究[J].食品科技,2006,10:296-299
[16]周先漢,阮少鈞,成剛.基于遺傳算法與神經(jīng)網(wǎng)絡(luò)的微波浸提過程優(yōu)化[J].食品科學,2007,28(10):180-183
[17]肖連冬,許彬,臧晉,等.基于BP神經(jīng)網(wǎng)絡(luò)和遺傳算法研究啤酒糟不溶性膳食纖維的酶法脫脂工藝[J].食品科學,2010,31(14):18-21
[18]趙武奇,殷涌光,仇農(nóng)學.基于神經(jīng)網(wǎng)絡(luò)和遺傳算法的紅景天苷緩釋微囊制備過程建模與優(yōu)化[J].西北農(nóng)林科技大學學報(自然科學版),2006,34(11):106-110
[19]Nagata Y,Chu K H.Optimization of a fermentation medium using neural networks and genetic algorithms[J].Biotechnol Lett,2003,25(1):1837-1842
[20]Wang J L,Wan W.Optimization of fermentative hydrogen production process using genetic algorithm based on neural network and response surface methodology[J].Int J Hydrogen Energy,2009,34:255-261
[21]Lin Z,Yi Z L,Jian H J,et al.Uniform design applied to nonlinear multivariate calibration by ANN[J].Analytica Chimica Acta,1998,370:65-77
[22]Cheng J,Li Q S.Reliability analysis of structures using artificial neural network based genetic algorithms[J].Comput Methods Appl Mech Engrg,2008,197:3742-3750