摘要:為煙葉油分檔次的判別提供參考,以三門峽主產(chǎn)區(qū)132份初烤煙葉為樣品,評定油分檔次后,測定煙葉樣品中主要含氮化合物的含量,運用方差分析、Spearman相關(guān)性分析和主成分分析篩選出油分檔次的判別指標,采用Fisher判別分析建立煙葉油分檔次的判別模型。結(jié)果表明,不同油分煙葉的含氮化合物中大多數(shù)氨基酸含量(19/21)存在顯著差異,除脯氨酸外,基本與油分呈顯著或極顯著負相關(guān)。經(jīng)過主成分分析,從主要含氮化合物中提取出4個主成分,代表了總指標73.441%的信息,篩選出17種煙葉油分的特征含氮化合物。經(jīng)Fisher判別分析,確定了17種游離氨基酸作為煙葉油分的有效判別指標,構(gòu)建了煙葉油分檔次的Fisher判別模型,訓練集和測試集的識別率均為100%。并利用江西吉安和云南楚雄的20份樣品對模型進行了驗證,準確率分別為100%和80%,對煙葉油分檔次的判別效果較好。游離氨基酸的檢測結(jié)合多元統(tǒng)計分析方法可用于煙葉油分檔次的判別。
關(guān)鍵詞:煙葉;含氮化合物;游離氨基酸;油分;Fisher判別分析
中圖分類號:TS41+1;TS41+3" 文獻標志碼:A
文章編號:1002-1302(2024)13-0181-07
油分作為烤煙外觀質(zhì)量的重要指標之一,與煙葉的理化特性和感官質(zhì)量密切相關(guān),在煙葉分級和質(zhì)量評價中發(fā)揮著重要作用[1]。已有的研究表明,油分與煙葉物理特性、化學成分協(xié)調(diào)性及感官評吸各指標之間存在不同程度的正相關(guān)關(guān)系,隨著油分檔次的提高,烤煙的含梗率降低、葉面密度提高,耐加工性增強,煙葉化學成分更加協(xié)調(diào),煙葉感官評吸的各項指標得分及總得分也越高[2-3]。即烤煙油分越多,煙葉的品質(zhì)越好。
目前,針對煙葉油分的主流評價方法仍以煙葉分級中的眼看、手摸并結(jié)合其他外觀特征對油分進行檔次的劃分,另有一些學者采用機器學習的方法,通過工業(yè)COD攝像頭[4]、近紅外光譜儀[5]、高光譜成像儀[6]等獲得煙葉外觀的幾何、顏色和光譜特征,利用建模方法對煙葉油分檔次進行識別和預(yù)測。利用化學成分對煙葉油分進行預(yù)測的研究鮮有報道。
化學成分不僅是形成煙草制品感官質(zhì)量的物質(zhì)基礎(chǔ),同時也決定了煙草制品的風格與質(zhì)量,其中含氮化合物作為煙葉中一類重要的化學成分,主要包括煙堿、蛋白質(zhì)和游離氨基酸,前人的研究已經(jīng)表明,油分足的煙葉,其總氮、煙堿等的含量都不高[7]。謝利麗等發(fā)現(xiàn),烤煙油分與煙堿含量呈極顯著正相關(guān),與總氮含量關(guān)系不大[2];劉峰峰等的研究結(jié)果表明,中部不同油分煙葉的煙堿含量與總氮含量間未見顯著性差異[3];韋克蘇等認為,多油分煙葉比少油分煙葉的煙堿、總氮和蛋白質(zhì)含量低[8]。董洪旭等提出,隨煙葉油分變差,其芳香族氨基酸比例以及酸性、堿性、脂肪族氨基酸的含量和比例升高,亞氨基酸比例降低[9];徐磊等報道,除脯氨酸外的多數(shù)氨基酸含量及其占游離氨基酸總量比例與煙葉油分呈負相關(guān)[10]。以上結(jié)果表明,含氮化合物含量與煙葉油分存在較強的關(guān)聯(lián)性,因此,有必要針對主要含氮化合物指標建立評價模型,對烤煙油分進行評價。上述研究均把不同油分檔次的煙葉原料限制在特定等級[2-3]或特定部位[8-10],缺乏對于整株全葉位的覆蓋,這可能會使結(jié)果存在一定的局限性,因此,本研究制取整株全葉位覆蓋的不同油分檔次煙葉樣品對烤煙油分進行評價。
Fisher判別分析又名典型相關(guān)分析,能夠在現(xiàn)有分組的基礎(chǔ)上識別并建立判別函數(shù),從而對新樣本進行組別的預(yù)測和分類,其優(yōu)點主要是能在一定程度上克服數(shù)據(jù)高維距離度量無效性帶來的困擾,對多維數(shù)據(jù)進行降維,對數(shù)據(jù)的分布沒有要求[11]。當前Fisher判別分析廣泛應(yīng)用于醫(yī)療、農(nóng)業(yè)、采礦等領(lǐng)域[11-14]。在煙草行業(yè)中,F(xiàn)isher判別分析目前在烤煙香型[15]、品質(zhì)[16]和卷煙原料檔次[17]判別方面有所應(yīng)用?;诖耍狙芯恳哉耆~位覆蓋的初烤煙葉(品種為云煙87)為材料,分析不同油分檔次煙葉主要含氮化合物含量的差異,并進行相關(guān)性分析和主成分分析,采用Fisher判別分析構(gòu)建分類模型,對不同油分檔次煙葉進行油分判別,并利用江西和云南的煙葉對模型的普適性進行了驗證,以期為煙葉油分等級的預(yù)測提供參考。
1 材料與方法
1.1 試驗材料
采集2022年河南三門峽、江西吉安和云南楚雄的全部位覆蓋的代表性初烤煙葉(品種均為當?shù)刂髟云贩N云煙87)。
1.2 樣品制備
采用KBF240型恒溫恒濕箱(德國Binder公司)平衡初烤煙葉的含水率至16%~18%后,由河南省煙草公司三門峽市公司的9位專業(yè)評級技術(shù)人員依照GB 2635—1992《烤煙》的標準[18],采用唯一差別原則(即除煙葉油分外,樣品的身份、葉片結(jié)構(gòu)、顏色等外觀質(zhì)量盡可能保持一致),將樣品分成油分多(Rich)、有(Oily)、稍有(Less Oily)、少(Lean)4個檔次,其中三門峽各油分檔次的樣品共計132份,江西和云南的樣品各10份(表1)。
1.3 含氮化合物含量的測定
選取各油分檔次煙葉,干燥粉碎,過60目篩,采用YC/T 249—2008《煙草及煙草制品 蛋白質(zhì)的測定 連續(xù)流動法》測定蛋白質(zhì)的含量(儀器為德國Bran+Luebbe公司的AA3型連續(xù)流動化學分析儀);采用文獻[19]中的近紅外掃描方法測定煙堿、總氮和游離氨基酸的含量;依據(jù)文獻[20]中的分類方法,將本研究中檢測到的21種游離氨基酸分為蛋白類和非蛋白類氨基酸(γ-氨基丁酸)兩大類,蛋白類氨基酸再根據(jù)側(cè)鏈結(jié)構(gòu)不同分為8類,包括亞氨基酸、酰胺類氨基酸、含硫氨基酸、酸性氨基酸、堿性氨基酸、芳香族氨基酸、脂肪族氨基酸和含羥基氨基酸。根據(jù)各類氨基酸含量與游離氨基酸總量計算出9類氨基酸的占比。
1.4 數(shù)據(jù)處理
采用Microsoft Office Excel 2019進行數(shù)據(jù)處理,采用IBM Statistics SPSS 23.0軟件進行差異顯著性分析、相關(guān)性分析、主成分分析,F(xiàn)isher判別分析采用Origin 2022軟件進行,多重比較采用Duncans新復(fù)極差法。
2 結(jié)果與分析
2.1 不同油分檔次煙葉主要含氮化合物的差異
由表2可知,不同油分檔次煙葉的煙堿、總氮和蛋白質(zhì)含量未表現(xiàn)出差異顯著性,這與前人的研究結(jié)果[3]基本一致,但與謝利麗等的研究結(jié)果[2]不同,造成這種結(jié)果的原因可能是煙葉產(chǎn)區(qū)不同,還可能與本研究采取全葉位覆蓋的取樣方式,各油分檔次中存在多個部位煙葉有關(guān)。各油分檔次煙葉的9類氨基酸占比中,亞氨基酸占比依次為多油分>有油分>稍有油分>少油分,且差異顯著;其余包括酰胺類、含硫類、酸性、堿性、芳香族、脂肪族和含羥基類在內(nèi)的8類氨基酸占比均隨煙葉油分檔次由少到多整體呈顯著降低趨勢;不同油分檔次煙葉的游離氨基酸總量略有增加,除絲氨酸和胱氨酸外,不同油分檔次煙葉的其他19種游離氨基酸含量均存在顯著性差異;其中,脯氨酸含量以多油分煙葉的最高,為12.05 mg/g,顯著高于另外3個油分檔次煙葉;其余的18種氨基酸含量均隨煙葉油分檔次由少到多整體呈顯著降低趨勢,這與董洪旭等和徐磊等的研究結(jié)果[9-10]基本一致。
2.2 不同煙葉油分得分與主要含氮化合物的相關(guān)性分析
由于油分是定序變量,所以要先把煙葉的4個不同油分檔次轉(zhuǎn)換為數(shù)據(jù), 目前通用的方法是對油分賦分得到數(shù)據(jù)[21],這種方法中的多(0~3)、有(gt;3~5)、稍有(gt;5~8)、少(gt;8~10)的分值區(qū)間并不相同,對于后續(xù)分析可能存在影響。為此,本研究參考并調(diào)整了烤煙外觀質(zhì)量的數(shù)字化方法[22],對烤煙外觀質(zhì)量中的油分進行4分度數(shù)字化表征,多、有、稍有、少油分煙葉分別賦分4、3、2、1。相關(guān)性分析采用Spearman相關(guān)性分析。
由表3可知,煙葉油分與總氮和蛋白質(zhì)含量呈顯著負相關(guān),與煙堿含量未見顯著相關(guān)性。謝利麗等研究認為,曲靖煙區(qū)烤煙油分與煙堿含量顯著正相關(guān),與總氮含量負相關(guān)[2]。劉峰峰等針對73個產(chǎn)區(qū)的烤煙進行研究,認為煙葉油分與煙堿含量、總氮含量相關(guān)性不大[3]。韋克蘇等的研究結(jié)果表明,貴州產(chǎn)區(qū)多油分煙葉的煙堿、總氮和蛋白質(zhì)含量均低于少油分煙葉[8]。本研究結(jié)果與韋克蘇等的結(jié)論[8]較為一致,而與前兩者研究結(jié)論不盡相同,這可能與本研究中煙葉樣品的部位覆蓋度和產(chǎn)區(qū)不同有關(guān)。
油分與除脯氨酸外的多數(shù)游離氨基酸含量呈極顯著負相關(guān),與脯氨酸含量呈極顯著正相關(guān),與亞氨基酸占比呈極顯著正相關(guān),與其余8類氨基酸占比呈極顯著負相關(guān),與游離氨基酸總量未表現(xiàn)出明顯相關(guān)性,這與前人的研究結(jié)果[9-10]基本一致。
2.3 不同油分檔次煙葉主要含氮化合物的主成分分析
由于總氮含量、9類氨基酸占比及游離氨基酸總量均包含多種含氮化合物,考慮到共線性問題,最終選取煙堿、蛋白質(zhì)和21種氨基酸含量指標進行主成分分析。對獲得的不同油分檔次煙葉含氮化合物數(shù)據(jù)標準化后,進行KMO檢驗和Barlette球度檢驗,結(jié)果見表4。KMO統(tǒng)計量為0.858(>0.6),Barlette球度檢驗的相伴概率為0.000(<0.05),表明不同油分煙葉的含氮化合物適合進行主成分分析且效果較好。
經(jīng)過主成分分析得到了4個主成分。由表5可知,第1主成分的方差貢獻率為48.004%,綜合了蘇氨酸、天冬酰胺、谷氨酸、谷氨酰胺、甘氨酸、丙氨酸、亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、賴氨酸、組氨酸和精氨酸含量的信息;第2主成分的方差貢獻率為11.080%,綜合了脯氨酸和纈氨酸含量的信息;第3主成分的方差貢獻率為7.995%,綜合了蛋白質(zhì)含量的信息;第4主成分的方差貢獻率為6.362%,綜合了胱氨酸含量的主要信息。4個主成分的累計方差貢獻率為73.441%,篩選出蛋白質(zhì)、蘇氨酸、天冬酰胺、谷氨酸、谷氨酰胺、甘氨酸、丙氨酸、亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、賴氨酸、組氨酸、精氨酸、脯氨酸、纈氨酸、胱氨酸共17種不同油分烤煙的特征含氮化合物。
2.4 基于含氮化合物含量的烤煙油分Fisher判別模型
不同油分檔次煙葉中主要含氮化合物含量存在差異,為了對煙葉油分檔次進行準確判別,還需要建立基于Fisher判別函數(shù)的一般判別方法。以主成分分析中的23種主要含氮化合物含量作為判別分析的自變量,對煙葉樣品進行多變量判別分析,篩選出脯氨酸、天冬氨酸、谷氨酸、蘇氨酸、甘氨酸、丙氨酸、纈氨酸、蛋氨酸、亮氨酸、異亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、賴氨酸、組氨酸、色氨酸、精氨酸共17種對油分檔次判別效果顯著的含氮化合物,用于煙葉樣品的判別模型,利用正態(tài)隨機數(shù)法使132份已分組的樣品分散,選取前4/5(105份)樣品進行模型的構(gòu)建,剩余1/5(27份)樣品通過交叉驗證進行模型準確度的檢驗,共建立了3個判別函數(shù)。
由表6可知,函數(shù)1、函數(shù)2和函數(shù)3的特征值分別為8.959、5.028、1.332,函數(shù)3的特征值明顯較??;總變異系數(shù)分別為58.48%、32.82%和8.69%;進行Willks Lambda檢驗后(表7),得到各判別函數(shù)的顯著性分別為0.000、0.000和0.000,在α=0.05的顯著水平下,函數(shù)1、函數(shù)2和函數(shù)3均具有判別意義,因前2個函數(shù)的累計百分比達到了91.31%,出于簡化模型考慮,選擇前2個判別函數(shù)構(gòu)建模型。
利用判別函數(shù)1和2得到煙葉的判別函數(shù)散點圖(圖1),判別函數(shù)1和函數(shù)2的系數(shù)如表8所示。
由圖1可知,4個不同油分檔次的煙葉得到了有效區(qū)分,組質(zhì)心未見互相重疊,表明通過含氮化合物對煙葉油分檔次進行Fisher判別的效果較好。并建立了Y1(油分多)、Y2(油分有)、Y3(油分稍有)和Y4(油分少)的分類函數(shù)模型:
Y1(油分多)=17.449ωPro+0.438ωAsp+0.254ωThr+0.102ωGlu-2.684ωGly+0.208ωAla+0.473ωVal+3.657ωMet+11.383ωIle+0.442ωLeu-0.306ωTyr-0.219ωPhe-0.252ωGABA-0.914ωLys-0.373ωHis+0.448ωTrp+3.264ωArg-297.653;
Y2(油分有)=15.209ωPro+0.435ωAsp+0.148ωThr+0.100ωGlu-2.212ωGly+0.232ωAla+0.410ωVal+4.415ωMet+10.583ωIle+1.169ωLeu-0.540ωTyr-0.223ωPhe-0.248ωGABA-0.666ωLys-0.258ωHis+0.506ωTrp+1.767ωArg-266.947;
Y3(油分稍有)=14.891ωPro+0.402ωAsp+0.340ωThr+0.067ωGlu-2.047ωGly+0.204ωAla+0.396ωVal+3.870ωMet+9.787ωIle+1.724ωLeu-0.092ωTyr-0.178ωPhe-0.220ωGABA-0.688ωLys-0.238ωHis+0.508ωTrp+1.537ωArg-283.251;
Y4(油分少)=15.337ωPro+0.509ωAsp+0.456ωThr+0.106ωGlu-1.984ωGly+0.202ωAla+0.482ωVal+3.264ωMet+11.632ωIle+0.93ωLeu-0.068ωTyr-0.268ωPhe-0.235ωGABA-1.176ωLys-0.316ωHis+0.557ωTrp+3.433ωArg-357.319。
Y1、Y2、Y3、Y4分別表示多油分煙葉、有油分煙葉、稍有油分煙葉、少油分煙葉的判別得分;ωPro、ωAsp、ωThr、ωGlu、ωGly、ωAla、ωVal、ωMet、ωIle、ωLeu、ωTyr、ωPhe、ωGABA、ωLys、ωHis、ωTrp、ωArg分別表示煙草樣品中脯氨酸、天冬氨酸、蘇氨酸、谷氨酸、甘氨酸、丙氨酸、纈氨酸、蛋氨酸、異亮氨酸、亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、賴氨酸、組氨酸、色氨酸、精氨酸的含量,其中脯氨酸含量單位為mg/g,其余單位均為μg/g。
煙葉油分檔次的判別分析檢驗結(jié)果見表9。由表9可知,訓練集的正確識別率為100%,測試集的識別率達到100%,誤判率為0。表明采用17種對油分檔次判別效果顯著的游離氨基酸指標對三門峽烤煙油分檔次進行判別的效果好,可實現(xiàn)對烤煙油分檔次的區(qū)分。
2.5 模型適用性驗證
模型驗證的結(jié)果見表10。該模型對江西吉安10份樣品的油分預(yù)測準確率達到100%,對云南楚雄10份樣品的油分預(yù)測準確率為80%,總體上效果較好,該模型具有較強的適用性。
3 結(jié)論
通過對三門峽不同油分檔次煙葉的主要含氮化合物含量進行分析, 明確了大部分氨基酸含量存在顯著差異(P<0.05)。采用主成分分析確定了蛋白質(zhì)、蘇氨酸、天冬酰胺、谷氨酸、谷氨酰胺、甘氨酸、丙氨酸、亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、賴氨酸、組氨酸、精氨酸、脯氨酸、纈氨酸、胱氨酸共17種不同油分烤煙的特征含氮化合物。利用Fisher判別分析方法確定了脯氨酸、天冬氨酸、谷氨酸、蘇氨酸、甘氨酸、丙氨酸、纈氨酸、蛋氨酸、亮氨酸、異亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、賴氨酸、組氨酸、色氨酸、精氨酸共17種三門峽烤煙油分檔次的有效判別指標,所構(gòu)建的Fisher判別分析模型的訓練集和測試集的識別率均為100%,對其他產(chǎn)區(qū)煙葉油分進行判別的效果也較好,具有較強的適用性。
參考文獻:
[1]中國煙葉生產(chǎn)購銷公司. 烤煙分級國家標準培訓教材[M]. 北京:中國標準出版社,2005: 39-40.
[2]謝利麗,盧秀萍,解 燕,等. 曲靖烤煙油分與煙葉品質(zhì)指標的關(guān)系分析[J]. 河南農(nóng)業(yè)大學學報,2015,49(6):742-747.
[3]劉峰峰,董世良,王 波,等. 烤煙油分與煙葉內(nèi)在質(zhì)量的關(guān)系的研究[J]. 武漢理工大學學報,2019,41(12):45-50.
[4]杜東亮. 烤煙煙葉視覺分級中標準定量化模型的研究[D]. 洛陽:河南科技大學,2008:65.
[5]周漢平,王信民,宋紀真,等. 煙葉結(jié)構(gòu)和油分的近紅外光譜預(yù)測[J]. 煙草科技,2006,39(1):10-14,29.
[6]葉 磊,韋克蘇,李德侖,等. 基于改進RF特征選擇策略的烤煙油分高光譜特征分析[J]. 中國農(nóng)機化學報,2021,42(8):196-202.
[7]錢曉波. 烤煙中西柏三烯醇、糖苷類物質(zhì)的檢測及其與煙葉油潤性的關(guān)系[D]. 合肥:中國科學技術(shù)大學,2014:5.
[8]韋克蘇,涂永高,宋澤民,等. 貴州不同油分煙葉化學成分的差異[J]. 湖南農(nóng)業(yè)大學學報(自然科學版),2013,39(5):453-457.
[9]董洪旭,周 蕓,黃善松,等. 烤煙游離氨基酸區(qū)域性差異及其與外觀品質(zhì)關(guān)系[J]. 西南農(nóng)業(yè)學報,2017,30(4):937-944.
[10] 徐 磊,劉 偉,過偉民,等. 烤煙游離氨基酸組分與感官品質(zhì)的相關(guān)分析[J]. 煙草科技,2020,53(10):21-31.
[11]沈海軍,張湯磊,許振興,等. 基于Fisher判別分析對蘋果新鮮度的識別研究[J]. 食品工業(yè)科技,2023,44(4):361-368.
[12]許章華,黃旭影,林 璐,等. 基于Fisher判別分析與隨機森林的馬尾松毛蟲害檢測[J]. 光譜學與光譜分析,2018,38(9):2888.
[13]張忠磊,蕭家芳,柏 剛. 評價剪切波彈性成像及Fisher判別分析法對乳腺結(jié)節(jié)的預(yù)測價值[J]. 放射學實踐,2022,8(3):390-393.
[14]段李宏,戴 磊,張金陵. 基于Fisher判別模型的煤層底板突水水源預(yù)測[J]. 工礦自動化,2022,48(4):128-134.
[15]詹 軍,周芳芳,鄧國賓,等. 基于化學成分和致香物質(zhì)的烤煙上部葉香型判別分析[J]. 湖南農(nóng)業(yè)大學學報(自然科學版),2013,39(3):232-241.
[16]單秋甫,張 濤,李 超,等. 基于Fisher線性判別分析方法的卷煙主流煙氣質(zhì)量預(yù)測模型構(gòu)建[J]. 食品與機械,2021,37(2):78-84,92.
[17]邵惠芳,趙昕宇,許自成,等. 基于Fisher判別分析的烤煙感官質(zhì)量與工業(yè)應(yīng)用價值的關(guān)系研究[J]. 中國煙草學報,2011,17(6):13-18.
[18]中國國家標準化管理委員會. 烤煙:GB/T 2635—1992[S]. 北京:中國標準出版社,1992.
[19]季舜華,蘇明亮,張 燁,等. 不同葉片結(jié)構(gòu)烤煙化學成分的差異[J]. 煙草科技,2022,55(9):57-64.
[20]沈 晗,葛 炯,王逸楓,等. 福建煙葉游離氨基酸等主要含氮化合物與感官質(zhì)量的關(guān)系[J]. 中國煙草學報,2022,28(5):23-31.
[21]左偉標,蔡憲杰,徐海清,等. 南嶺丘陵生態(tài)區(qū)-焦甜醇甜香型主產(chǎn)區(qū)烤煙外觀特征研究[J]. 中國煙草學報,2022,28(2):92-100.
[22]張永安,馬彩娟,劉立博,等. 烤煙外觀質(zhì)量數(shù)字化方法與感官質(zhì)量相關(guān)性分析[J]. 農(nóng)學學報,2020,10(4):48-52.