何 琴,張 丹,朱 蕾
(許昌學院 化學化工學院,河南 許昌 461000)
香水百合是百合花的一種,以其清新?lián)浔堑南銡獾妹?香氣是衡量果實[1,2]、煙葉[3,4]、茶[5,6]、酒[7,8]等風味品質的重要指標,也是衡量花卉質量[9,10]的重要內容.香氣成分量微而復雜,近年來大多側重于定性、定量研究香氣的主要成分[2~10].定性、定量研究香氣主要成分時,通常需選用不同的方法獲得其揮發(fā)性組分后,結合氣相色譜/質譜聯(lián)用儀進行測定[11,12],方法較為繁瑣.近年來,物質定量結構-色譜保留相關(Quantitative structure retention relationship,QSRR)研究備受關注[13-16],可用于解釋和預測各種香氣物質的色譜保留行為[17],在香氣成分的分析、基于香氣成分的聚類評價及產(chǎn)地預報等方面應用廣泛,能夠解決一些傳統(tǒng)的化學研究方法難以解決的問題[18,19].因此,QSRR技術對于建立香氣中化合物分子結構與色譜保留之間的變化規(guī)律具有重要的意義.
有關香水百合頭香成分的QSRR研究,論文采用人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN)方法構建香水百合頭香成分的QSRR模型,分別建立結構與色譜保留時間、結構與Kovats指數(shù)的定量關系的一維和二維模型,對預測香水百合頭香成分色譜保留值、選擇其分離條件等具有重要意義,并為了解香水百合頭香成分特征,對香水百合進行深加工和開發(fā)應用以及香水百合香氣成分分離條件的選擇等提供適當?shù)睦碚撘罁?jù).
香水百合頭香成分結構數(shù)據(jù)和色譜保留數(shù)據(jù)來源于文獻[17].
采用ANN方法建模,構建一維(保留時間、科瓦茨指數(shù))分別預測模型和二維(保留時間和科瓦茨指數(shù))同時預測模型,并與多元線性回歸(multiple linear regressions,MLR)方法進行比較.
一個好的模型除了擁有很好的自相容能力和泛化能力,還必須進行必要的模型檢驗.論文采用留一交叉檢驗法(Leave-one-outcross-validation ,LOO-CV)和外部檢驗相結合的方法對構建的模型進行穩(wěn)健性和交叉預測能力的檢驗.
經(jīng)過反復的數(shù)據(jù)試驗,最終確定BP-ANN模型的網(wǎng)絡拓撲結構為6×4×1(二維模型6×4×2),網(wǎng)絡目標函數(shù)為10-5,網(wǎng)絡學習速度為0.1,網(wǎng)絡訓練步長為10 000.
在BP-ANN的最優(yōu)條件下,一維模型分別預測和二維模型同時預測的預測值、MLR模型預測值及相對誤差見表1.
表1 ANN和MLR預測結果
注:*表示測試集;1為one-dimensional model,一維模型;2為two-dimensional model,二維模型.
圖1 ANN和MLR預測相對誤差值散點圖
挑選BP-ANN二維模型的同時,將預測得到的RI(Kovats)預測值與文獻值之間的相對誤差做相對誤差分布圖,如圖1所示,并將其與MLR法進行比較.
由表1和圖1可見,BP-ANN模型預測值(一維分別預測和二維模型同時預測)與實驗值比較接近,與MLR法也相當.而MLR法在多維預測時,需要分別構建多個模型才能實現(xiàn),方法比較耗費時間.ANN一維模型分別預測的RI(Kovats)預測值與文獻值的相對誤差分布在-6.84%~2.90%之間,ANN二維模型同時預測的RI(Kovats)預測值與文獻值的相對誤差分布在-3.70%~4.16%之間,MLR法的相對誤差分布在-3.55%~6.62%之間,說明BP-ANN擬合能力與MLR法相當.但是,二維模型可以同時預測保留時間和保留值,相對于MLR法需要建立兩個模型分別進行預測而言,更節(jié)省時間.這意味著在實際應用時,神經(jīng)網(wǎng)絡多元建??梢愿玫毓?jié)省時間成本.另外,二維模型同時預測與一維分別預測所得數(shù)值相當,說明BP-ANN模型的同時預測效果也非常好.
以Kovats保留指數(shù)為代表,進行模型相關分析.三種模型的相關分析如表2、圖2、圖3所示.一維BP-ANN模型線性相關系數(shù)R為0.994 6(Kovats保留指數(shù))和0.999 3(保留時間),ANN二維同時預測模型的相關系數(shù)R為0.991 3(Kovats保留指數(shù))和0.990 9(保留時間),MLR模型相關系數(shù)R為0.990 1,BP-ANN模型略優(yōu)于MLR模型,自相容能力更好.基于BP-ANN模型的訓練集留一交叉檢驗相關系數(shù)RCV分別為0.999 3(Kovats保留指數(shù)、一維)、0.999 7(保留時間、一維)和0.994 1(Kovats保留指數(shù)、二維)、0.988 8(保留時間、二維),而基于MLR法的訓練集(Kovats保留指數(shù))留一交叉檢驗相關系數(shù)RCV為0.990 5,說明三種模型的穩(wěn)健性相當.而基于BP-ANN模型的外部檢驗相關系數(shù)Rext為0.983 1(Kovats保留指數(shù)、一維)、0.997 2(保留時間、一維)和0.981 0(Kovats保留指數(shù)、二維)、0.983 6(保留時間、二維),基于MLR法的外部檢驗相關系數(shù)Rext為0.893 7,說明BP-ANN法的泛化能力優(yōu)于MLR法.
表2 BP-ANN網(wǎng)絡模型和MLR模型的效果分析
圖2 基于BP-ANN的35種香氣成分保留時間的實驗值與預測值的相關分析(一維)
圖3 基于MLR的35種香氣成分保留時間的實驗值與預測值的相關分析(一維)
由上可知,可以采用BP-ANN進行保留時間和保留值的二維同時建模,模型穩(wěn)健性與BP-ANN一維模型相當,自相容能力和泛化能力優(yōu)于MLR一維模型.不過,二維模型在穩(wěn)健性相當?shù)那疤釛l件下具有快速和準確的優(yōu)勢,比一維模型更能大量節(jié)省時間.
采用人工神經(jīng)網(wǎng)絡中的誤差反向傳播神經(jīng)網(wǎng)絡BP-ANN對35種香水百合頭香成分進行了QSRR研究,分別建立了BP-ANN的一維模型和二維模型,并且模型預測得到的預測值與文獻值非常接近,相對誤差分布在-6.84%~2.90%(一維模型)和-3.70%~4.16%(二維模型)之間,與MLR法的相對誤差分布(-3.55%~6.62%)相當.BP-ANN二維模型具有自組織、自適應和自學習能力,可以同時預測多種色譜保留值,大量節(jié)約時間.在模型的穩(wěn)健性方面,兩種方法基本相當,但BP-ANN的外部預測能力要更強一些.
[1] 郭東花,范崇輝,李高潮,等.不同果袋對“阿布白”桃果實香氣成分的影響[J].食品科學,2016,37(2):232-237.
[2] 胡文舜,蔣際謀,黃愛萍,等.“晚香”龍眼果實香氣成分的3種萃取頭GC-MS效果分析[J].福建農業(yè)學報,2015,30(12):1 149-1 154.
[3] Yan Jun, Liu Xin-Bo, Zhu Wei-Wei, et al. Retention Indices for Identification of Aroma Compounds by GC:Development and Application of a Retention Index Database[J]. Chromatographia, 2015, 78(1): 89-108.
[4] 潘 玲,云月利,孫光偉,等.湖北烤煙中性香氣成分的主成分分析和聚類分析[J].湖北大學學報:自然科學版,2016,38(2):127-134.
[5] 喬 陽,杜麗平,肖冬光.不同極性色譜柱在滇紅香氣成分分析中的對比研究[J].茶葉科學,2016,36(1):38-44.
[6] 鮑忠贊,董榮建,鄧昭浦,等.基于陳茶特征香氣成分的綠茶新茶和陳茶鑒定方法的研究[J].茶葉科學,2015,35(6):583-588.
[7] 劉殿鋒,吳春昊,朱學文,等.番茄酒香氣成分的氣相色譜-質譜分析[J].釀酒科技,2016(2):104-106.
[8] 陸 印,陳 亮,胡仙妹,等.不同蒸餾次數(shù)對藍莓白蘭地香氣成分影響[J].食品研究與開發(fā),2016,37(1):95-99.
[9] Yang Xiaoxia, Zhao Jing, Zheng Jian, et al. Analysis of floral scent emitted from Syringa plants[J]. Journal of Forestry Research, 2016, 27(2): 273-281.
[10] 張輝秀,胡增輝,冷平生,等.不同品種百合花揮發(fā)性成分定性與定量分析[J].中國農業(yè)科學,2013,46(4):790-799.
[11] Li Zuguang, Cao Hui, Lee Mawrong, et al. Analysis of Volatile Compounds Emitted from Chimonanthus praecox (L.) Link in Different Florescence and QSRR Study of GC Retention Indices[J]. Chromatographia, 2009, 70(7-8): 1 153-1 162.
[12] 高天榮,徐 銳,楊 樹,等.GC、GC/MS分析香水百合香精的化學成分[J].云南師范大學學報,2005,25(5):55-57,70.
[13] Noorizadeh Hadi, Farmany Abbas. QSRR Models to Predict Retention Indices of Cyclic Compounds of Essential Oils[J]. Chromatographia, 2010, 72(5-6): 563-569.
[14] 陳 欣,金 俏,金 飆.QSRR結合人工神經(jīng)網(wǎng)絡預測多氯聯(lián)苯色譜保留時間[J].計算機與應用化學,2013,30 (5):515-518.
[15] Ghavami Raouf, Faham Shadab. QSRR Models for Kováts’ Retention Indices of a Variety of Volatile Organic Compounds on Polar and Apolar GC Stationary Phases Using Molecular Connectivity Indexes [J]. Chromatographia, 2010, 72(9-10): 893-903.
[16] Li Zuguang, Cao Hui, Lee Mavrong, et al. Analysis of Volatile Compounds Emitted from Chimonanthus praecox (L.) Link in Different Florescence and QSRR Study of GC Retention Indices[J]. Chromatographia, 2009, 70: 1 153.
[17] 曹 慧,李祖光,楊美丹,等.香水百合頭香成分的定量結構-色譜保留關系研究[J].分析測試學報,2008,28(11):1 198-1 202.
[18] Angelo Antonio D’Archivio, Maria Anna Maggi, Fabrizio Ruggieri. Artificial neural network prediction of multilinear gradient retention in reversed-phase HPLC:comprehensive QSRR-based models combining categorical or structural solute descriptors and gradient profile parameters [J]. Analytical and Bioanalytical Chemistry, 2015, 407(4): 1 181-1 190.
[19] 李祖光,曹 慧,王麗麗,等.萜類化合物的QSRR研究及其在結構鑒定中的應用[J].化學學報,2009,67(4):289-294.