徐 利,周麗偉,郭文強,張亞萍,陳 彥,*(.安徽大學(xué)生命科學(xué)學(xué)院,安徽 合肥 3060;.安徽農(nóng)業(yè)大學(xué)茶與食品科技學(xué)院,安徽 合肥 30036)
基于支持向量機-遺傳算法灰樹花發(fā)酵模型的建立及優(yōu)化
徐 利1,周麗偉2,郭文強1,張亞萍1,陳 彥1,*
(1.安徽大學(xué)生命科學(xué)學(xué)院,安徽 合肥 230601;2.安徽農(nóng)業(yè)大學(xué)茶與食品科技學(xué)院,安徽 合肥 230036)
對食用藥用真菌灰樹花發(fā)酵進行建模,獲得使目標(biāo)發(fā)酵產(chǎn)物達到最大產(chǎn)量的培養(yǎng)條件。運用支持向量機(support vector machine,SVM)方法進行非線性擬合,并采用遺傳算法預(yù)測優(yōu)化培養(yǎng)基成分,結(jié)果表明其能夠較好預(yù)測灰樹花發(fā)酵過程。運用此方法可在灰樹花發(fā)酵生產(chǎn)過程中根據(jù)所需產(chǎn)物控制發(fā)酵條件與時間,具有較高指導(dǎo)意義。
支持向量機;遺傳算法;發(fā)酵模型;灰樹花
徐利, 周麗偉, 郭文強, 等. 基于支持向量機-遺傳算法灰樹花發(fā)酵模型的建立及優(yōu)化[J]. 食品科學(xué), 2016, 37(11): 143-146. DOI:10.7506/spkx1002-6630-201611025. http://www.spkx.net.cn
XU Li, ZHOU Liwei, GUO Wenqiang, et al. Establishment and optimization of a predictive model for the growth and exopolysaccharide production of Grifola frondosa based on support vector machine and genetic algorithm[J]. Food Science, 2016, 37(11): 143-146. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-201611025. http://www.spkx.net.cn
支持向量機(support vector machine,SVM)是一種機器學(xué)習(xí)方法,由于SVM非線性擬合很強,且運算時收斂到全局最優(yōu)解、處理小樣本時的泛化性能相對較好等優(yōu)點,被廣泛應(yīng)用于數(shù)學(xué)建模、智能控制等領(lǐng)域且使這些領(lǐng)域取得巨大的進展[1-3]。遺傳算法來源于進化論、物種選擇學(xué)說和群體遺傳學(xué)說,是模擬生物進化過程與機制解決極值問題的一種自組織、自適應(yīng)人工智能算法[4]。其以高效、自適應(yīng)及全局搜索的優(yōu)勢得到廣泛應(yīng)用。
灰樹花(Grifola frondosa)是珍稀食藥兩用真菌[5]。灰樹花多糖具有抗腫瘤等多種活性[6-10],其中灰樹花多糖D組分更是被美國食品和藥物管理局(Food and Drug Administration,F(xiàn)DA)批準直接進入二期臨床。液體發(fā)酵菌絲體與子實體藥用效果相當(dāng),且生產(chǎn)周期短、不受氣候和季節(jié)的限制、產(chǎn)品質(zhì)量穩(wěn)定、便于工業(yè)化放大生產(chǎn)等優(yōu)點而日益受到人們的重視[11-13]。目前研究多偏重單獨進行培養(yǎng)條件優(yōu)化或單獨進行發(fā)酵動力學(xué)研究,利用實驗數(shù)據(jù)建立指標(biāo)與因素間的回歸方程,但是其模型粗糙,很難說明指標(biāo)與因素之間的非線性關(guān)系,誤差大且不能預(yù)測發(fā)酵結(jié)果[14-17]。而本實驗所用方法則能夠有效克服以上缺點,使用SVM法建立模型,通過遺傳算法對SVM模型進行全局訓(xùn)練,得到最佳方案,可以預(yù)測真菌液體發(fā)酵過程不同時間的產(chǎn)量,預(yù)測生物量的合成。
1.1 菌種、培養(yǎng)基與試劑
菌種灰樹花(Grifola frondosa)購自中國普通微生物菌種保藏管理中心;馬鈴薯為市售。
基礎(chǔ)培養(yǎng)基組成為每1 L培養(yǎng)基含蛋白胨5 g、葡萄糖30 g、MgSO4·7H2O 1.5 g、KH2PO43 g、VB11 mg。
葡萄糖、磷酸二氫鉀、七水硫酸鎂、VB1、苯酚、濃硫酸、氫氧化鈉、亞硫酸鈉、馬鈴薯淀粉、蛋白胨國藥化學(xué)試劑有限公司;3,5-二硝基水楊酸 天津市光復(fù)精細化工研究所;酒石酸鉀 上海埃彼化學(xué)試劑有限公司;以上試劑均為國產(chǎn)分析純。
1.2 儀器與設(shè)備
MLS-3750滅菌鍋 日本Sanyo公司;BCD-285WNMVS冰箱 韓國Samsung公司;電熱恒溫鼓風(fēng)干燥箱 上海一恒科技有限公司;UV5100B紫外-可見光分光光度計 上海元析儀器有限公司;RE-52旋轉(zhuǎn)蒸發(fā)器 東京理化器械公司;TE612-L電子天平 北京賽多利斯儀器系統(tǒng)有限公司;ZHWY-2102C搖床 上海智城分析儀器制造有限公司。
1.3 方法
1.3.1 搖瓶發(fā)酵培養(yǎng)
將發(fā)酵培養(yǎng)基裝入搖瓶后滅菌備用,參考文獻[18]設(shè)計UL25(56)正交試驗,從液體種子搖瓶中以10%接種量接種在發(fā)酵培養(yǎng)基中,置于搖床中200 r/min、25 ℃條件下培養(yǎng)8 d,培養(yǎng)結(jié)束后測定胞外多糖生成量、菌絲體干質(zhì)量等指標(biāo)[19-20]。
1.3.2 模型測試集與模型驗證集的獲得
在考察因素的水平取值范圍內(nèi),使用Matlab內(nèi)置的隨機數(shù)生成函數(shù)隨機生成2 組驗證實驗表格,并將其轉(zhuǎn)變成與UL25(56)正交試驗設(shè)計表編碼一致的形式。
函數(shù)調(diào)用:
按上述方法生成的Ttest與Tval安排發(fā)酵實驗,用于SVM模型的測試和驗證。
1.3.3 SVM模型的建立
參考楊海龍等[21]所述培養(yǎng)條件并稍作修改,以UL25(56)實驗中馬鈴薯淀粉添加量、VB1添加量、葡萄糖添加量、裝液量添加量的編碼值,以及時間編碼值的n 次冪,作為SVM的輸入變量,以菌絲體干質(zhì)量、胞外多糖生成量2 個實驗值作為擬合目標(biāo)變量Y1、Y2。使用Matlab平臺下的LS-SVM工具包訓(xùn)練模型,n值為1~5以步長0.05變化,計算不同n值下所得模型對Ttest測試集預(yù)測的均方根誤差,通過枚舉尋找最優(yōu)建模參數(shù)[22-23]。使均方根誤差(root mean square error,RMSE)最小的n值將被選擇用于模型訓(xùn)練。
1.3.4 優(yōu)化模型的預(yù)測精度
優(yōu)化結(jié)果所述n值n_jst,n_bwt,對應(yīng)得到2 個優(yōu)化后模型OM_JST(預(yù)測菌絲體干質(zhì)量)、OM_BWT(預(yù)測胞外多糖生成量)。繪制上述2 個優(yōu)化模型對驗證集實驗值的擬合曲線,觀察模型預(yù)測效果,并比較2 種模型優(yōu)化后對驗證集實驗值預(yù)測的均方根誤差。
1.4 遺傳算法優(yōu)化發(fā)酵條件[24]
采用浮點編碼方式對發(fā)酵過程中馬鈴薯淀粉添加量、VB1添加量、葡萄糖添加量、裝液量、發(fā)酵時間5 個因素在其各自取值范圍內(nèi)進行SVM模擬推算,并以模型擬合值作為遺傳算法的適應(yīng)性函數(shù),進行選擇、變異、交換操作。菌絲體干質(zhì)量與胞外多糖量生成量越高,則適應(yīng)度越高。程序通過Matlab 7.6軟件和其附帶的遺傳算法工具箱編寫完成。
2.1 正交試驗結(jié)果
表1 UL25(56)正交試驗設(shè)計及結(jié)果Table 1 UL 1 UL2525(5 (56) design and corresponding experimental results
灰樹花發(fā)酵是時間累積過程,在灰樹花正常培養(yǎng)范圍內(nèi),發(fā)酵時間對發(fā)酵的影響要遠高于其他因素,在此處如對該正交試驗(表1)進行方差分析,時間所造成的考察目標(biāo)的變差將極有可能影響其他因素的顯著性分析,故在變量選擇中選取時間變量的n 次冪較為可行[25]。
2.2 SVM模型訓(xùn)練與優(yōu)化
以表1中的試驗數(shù)據(jù)作為SVM的訓(xùn)練樣本,gam、sig2通過tunelssvm函數(shù)搜索獲得,alpha、b通過trainlssvm函數(shù)確定,根據(jù)試驗因素的個數(shù)和優(yōu)化指標(biāo)的個數(shù)設(shè)計SVM的結(jié)果,然后用試驗數(shù)據(jù)對SVM進行訓(xùn)練。圖1反映了n值變化時,建立的SVM模型對測試集菌絲體干質(zhì)量和胞外多糖生成量這2 個試驗值預(yù)測的均方根誤差大小。Matlab中記錄的n值最優(yōu)結(jié)果為:菌絲體干質(zhì)量最優(yōu)n=2.10,胞外多糖生成量最優(yōu)n=2.05。
圖1 歸一化的不同n值所得模型對測試集的RRMMSSEEFig. 1 Predicted root-mean-square error (RMSE) using the normalized models obtained from different n-values
圖2 SVM模型對驗證集胞外多糖生成量(a)和菌絲體干質(zhì)量(b)的預(yù)測情況Fig. 2 Prediction of EPS production (a) and dry mycelial biomass (b) for validation set using SVM model
由圖2可知,在n值分別為2.05與2.10時,胞外多糖生成量和菌絲體產(chǎn)量模型模擬結(jié)果與試驗值的擬合度較好,兩者之間的相對誤差在5%以內(nèi),說明建立的SVM性能良好。由圖2還可知,當(dāng)n值取1時,與實際過程存在極大差距,當(dāng)把n的權(quán)重分別增加為n=2.10、n=2.05時,預(yù)測值與實際值接近,模型對菌絲體干質(zhì)量、胞外多糖生成量等的預(yù)測能力較好,經(jīng)計算其RMSE分別為0.421和0.139。
2.3 遺傳算法對發(fā)酵條件的優(yōu)化
2.3.1 發(fā)酵周期內(nèi)目標(biāo)產(chǎn)物的日產(chǎn)出速率的優(yōu)化
圖3 發(fā)酵物平均日產(chǎn)出速率的遺傳算法優(yōu)化過程Fig. 3 Optimal generation determined using genetic algorithm for average daily production rate of mycelia and EPS
運用遺傳算法如圖3所示,在遺傳至53 代時,得到使每日平均產(chǎn)出菌絲體最多的發(fā)酵條件:馬鈴薯淀粉添加量51.68 g/L、VB1添加量1.50 mg/L、葡萄糖添加量5.00 g/L、裝液量112.80 mL、發(fā)酵時間6.28 d,菌絲體平均產(chǎn)出速率預(yù)測為3.67 g/(L·d)。以胞外多糖平均產(chǎn)出速率作為優(yōu)化指標(biāo),遺傳算法運算至57 代時,產(chǎn)出胞外多糖最大為:0.45 g/(L·d),對應(yīng)發(fā)酵條件:馬鈴薯淀粉添加量47.41 g/L、VB1添加量1.50 mg/L、葡萄糖添加量5.00 g/L、裝液量101.43 g/L、發(fā)酵培養(yǎng)5.54 d。
按上述2 組優(yōu)化條件設(shè)置驗證實驗,重復(fù)3 次,最優(yōu)菌絲體產(chǎn)出速率對應(yīng)條件下菌絲體產(chǎn)率平均為20.27 g/L,故每天產(chǎn)出3.23 g/L,與預(yù)測值基本一致;最優(yōu)化胞外多糖產(chǎn)出速率對應(yīng)條件下胞外多糖產(chǎn)量平均值為2.45 g/L,每天平均產(chǎn)出量為0.44 g/L,證明運用遺傳算法可以很好地優(yōu)化模型條件,當(dāng)SVM與遺傳算法相結(jié)合使用時,則可以較好地實現(xiàn)對發(fā)酵條件的優(yōu)化與產(chǎn)物的預(yù)測。
2.3.2 不同發(fā)酵時間下目標(biāo)產(chǎn)物的優(yōu)化
分別將培養(yǎng)時間固定在1~8 d,以最大菌絲體干質(zhì)量為最優(yōu)適應(yīng)度函數(shù),使用遺傳算法得到了最佳培養(yǎng)條件,以及菌絲體最高產(chǎn)量,結(jié)果如表2所示。前6 d菌絲體干質(zhì)量迅速積累,之后菌絲體干質(zhì)量變化趨于水平,符合其生長曲線,綜合考慮以培養(yǎng)時間為6 d最佳。
表2 不同發(fā)酵時間下菌絲體干質(zhì)量的優(yōu)化Table 2 Optimization of culture conditions for mycelium production at different fermentation times
分別將發(fā)酵時間固定在1~8 d,以最大胞外多糖生成量為最優(yōu)適應(yīng)度函數(shù),使用遺傳算法得到了最佳培養(yǎng)條件、以及胞外多糖最高產(chǎn)量,結(jié)果如表3所示。
表3 不同發(fā)酵時間下胞外多糖生成量的優(yōu)化Table 3 Optimization of culture conditions for EPS production at different fermentation times
按上述各組優(yōu)化條件設(shè)置驗證實驗,重復(fù)3 次,所得各組數(shù)據(jù)與預(yù)測值相接近,證明優(yōu)化與預(yù)測結(jié)果可行,模型擬合良好,SVM-遺傳算法能夠在發(fā)酵控制中良好運用。
灰樹花在液體發(fā)酵培養(yǎng)的過程是復(fù)雜且非線性,本實驗成功運用SVM聯(lián)合遺傳算法預(yù)測灰樹花發(fā)酵培養(yǎng)基與生物量的關(guān)系及得到最佳生物量的培養(yǎng)條件。另外,在建立SVM預(yù)測模型時,證明了采用冪函數(shù)方法對提高模型中某個因素的權(quán)重,以提高模型預(yù)測能力的方法是可行的。SVM-遺傳算法不僅能有效地預(yù)測生物量,極大降低培養(yǎng)成本,而且可以大大減少實驗工作量,縮短研究周期,與傳統(tǒng)固定培養(yǎng)時間方法相比具有更明確的指導(dǎo)意義,同時也為建立與優(yōu)化其他真菌發(fā)酵模型提供了借鑒。
[1] HEIKAMP K, BAJORATH J. Support vector machines for drug discovery[J]. Expert Opinion on Drug Discovery, 2014, 9(1): 93-104. DOI:10.1517/17460441.2014.866943.
[2] LI G Q, WEN C Y, LI Z G, et al. Model-based online learning with kernels[J]. IEEE Transactions on Neural Networks and Learning Systems, 2013, 24(3): 356-369. DOI:10.1109/TNNLS.2012.2229293.
[3] NEGRI R G, DUTRA L V, SANT’ANNA S J S. An innovative support vector machine based method for contextual image classification[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2014, 87: 241-248. DOI:10.1016/j.isprsjprs.2013.11.004.
[4] 張文修, 梁怡. 遺傳算法的數(shù)學(xué)基礎(chǔ)[M]. 西安: 西安交通大學(xué)出版社, 2000: 2-3.
[5] 崔鳳杰. 灰樹花深層發(fā)酵條件優(yōu)化及其菌絲體抗腫瘤糖肽的研究[D].無錫: 江南大學(xué), 2006.
[6] SHIH L, CHOU B W, CHEN C C, et al. Study of mycelial growth and bioactive polysaccharide production in batch and fedbatch culture of Grifola frondoa[J]. Bioresource Technology, 2008, 99(4): 785-793. DOI:10.1016/j.biortech.2007.01.030.
[7] MIZUNO T, OHSAWA K, HAGIWARA N, et al. Fractionation and characterization of antitumor polysaccharides from Maitake, Grifola frondosa[J]. Agricultural and Biological Chemistry, 1986, 50(7): 1679-1688. DOI:10.1080/00021369.1986.10867644.
[8] 李小定, 吳謀成, 曾曉波, 等. 灰樹花多糖PGF-1對荷瘤小鼠免疫功能的影響[J]. 華中農(nóng)業(yè)大學(xué)學(xué)報, 2002, 21(3): 261-263. DOI:10.13300/j.cnki.hnlkxb.2002.03.016.
[9] KUBO K, NANBA H. Anti-hyperliposis effect of maitake fruit body (Grifola frondosa). I[J]. Biological and Pharmaceutical Bulletin, 1997, 20(7): 781-785. DOI:10.1248/bpb.20.781.
[10] KUBO K, AOKI H, NANBA H. Anti-diabetic activity present in the fruit body of Grifola frondosa (Maitake). I[J]. Biological and Pharmaceutical Bulletin, 1994, 17(8): 1106-1110. DOI:10.1248/ bpb.17.1106.
[11] 李悅, 薛橋麗, 李世俊, 等. 響應(yīng)面法優(yōu)化小刺青霉16-7產(chǎn)纖維素酶液體發(fā)酵工藝[J]. 食品科學(xué), 2014, 35(17): 137-145. DOI:10.7506/ spkx1002-6630-201417028.
[12] 趙俊杰. 香菇液體發(fā)酵及多糖提取工藝研究[D]. 鄭州: 鄭州大學(xué), 2014.
[13] 葉文姣. 蛹蟲草多糖的發(fā)酵條件優(yōu)化、結(jié)構(gòu)及抗氧化活性研究[D].武漢: 華中農(nóng)業(yè)大學(xué), 2014.
[14] CHIMILOVSKI J S, HABU S, TEIXEIRA R F B, et al. Antitumour activity of Grifola frondosa exopolysaccharides produced by submerged fermentation using sugar cane and soy molasses as carbon sources[J]. Food Technology and Biotechnology, 2011, 49(3): 359-363.
[15] 鄧功成, 趙洪, 高禮安, 等. 灰樹花菌絲體液體發(fā)酵條件優(yōu)化[J]. 江蘇農(nóng)業(yè)科學(xué), 2013, 41(9): 216-218. DOI:10.3969/ j.issn.1002-1302.2013.09.086.
[16] 武秋立, 安家彥. 羊肚菌胞外多糖發(fā)酵動力學(xué)模型[J]. 南開大學(xué)學(xué)報, 2005, 38(1): 44-48. DOI:10.3969/j.issn.0465-7942.2005.01.008.
[17] 方俊濤. 響應(yīng)曲面方法中試驗設(shè)計與模型估計的比較研究[D]. 天津: 天津大學(xué), 2011.
[18] 盧春曉, 吳朝霞, 徐亞平, 等. 響應(yīng)面法優(yōu)化黑豆皮花色苷提取工藝的研究[J]. 食品研究與開發(fā), 2012, 33(9): 69-73.
[19] 顧廣州. 灰樹花深層發(fā)酵多糖、提取純化及抗氧化作用研究[D]. 揚州: 揚州大學(xué), 2010.
[20] 張維杰. 糖復(fù)合物生化研究技術(shù)[M]. 2版. 杭州: 浙江大學(xué)出版社, 1999: 10-11.
[21] 楊海龍, 活潑, 肖彩霞, 等. 藥用真菌深層發(fā)酵生產(chǎn)技術(shù)[M]. 北京:化學(xué)工業(yè)出版社, 2009: 140-148.
[22] 黃煒, 黃志華. 一種基于遺傳算法和SVM的特征選擇[J]. 計算機技術(shù)與發(fā)展, 2010, 20(6): 21-24. DOI:10.3969/j.issn.1673-629X.2010.06.006.
[23] 郭新辰. 最小二乘支持向量機算法及應(yīng)用研究[D]. 吉林: 吉林大學(xué), 2008.
[24] 雷英杰. MATLAB遺傳算法工具箱及應(yīng)用[M]. 西安: 西安電子科技大學(xué)出版社, 2005: 146-207.
[25] 熊偉麗, 王肖, 陳敏芳, 等. 基于加權(quán)LS-SVM的青霉素發(fā)酵過程建模[J]. 化工學(xué)報, 2012, 63(9): 2913-2919. DOI:10.3969/ j.issn.0438-1157.2012.09.038.
Establishment and Optimization of a Predictive Model for the Growth and Exopolysaccharide Production of Grifola frondosa Based on Support Vector Machine and Genetic Algorithm
XU Li1, ZHOU Liwei2, GUO Wenqiang1, ZHANG Yaping1, CHEN Yan1,*
(1. School of Life Science, Anhui University, Hefei 230601, China; 2. School of Tea and Food Science, Anhui Agricultural University, Hefei 230036, China)
To obtain the best medium constituents and culture conditions for maximum production of exopolysaccharides (EPS) by Grifola frondosa, nonlinear fitting was done using support vector machine (SVM) and the response variables, EPS production and mycelial biomass, were predicted using genetic algorithm. The results showed that the nonlinear model performed well in predicting the growth and EPS production of Grifola frondosa. The approach proposed in this study can provide a signifi cant guideline to control culture conditions and time for the production of desired products by Grifola frondosa.
support vector machine (SVM); genetic algorithm; fermentation model; Grifola frondosa
10.7506/spkx1002-6630-201611025
Q815
A
2015-05-05
安徽大學(xué)現(xiàn)代生物制造協(xié)同中心開放課題(20150455);安徽大學(xué)重點教學(xué)研究項目(ZLT52015038)
徐利(1990—),男,碩士研究生,研究方向為天然產(chǎn)物提取純化與發(fā)酵工程。E-mail:richuriluoxl@163.com
*通信作者:陳彥(1963—),男,教授,博士,研究方向為糖分子生物學(xué)與糖工程。E-mail:chenyan600@163.com