摘要:煙絲化學(xué)成分可以由實驗方法提取出來,但其關(guān)鍵致香成分很難確定。針對這一問題,一般采用化學(xué)分析方法,但分析耗時比較長。根據(jù)煙絲化學(xué)成分與香氣風格關(guān)系,使用基于信息增益的特征選擇方法進行提取致香成分。通過計算煙絲化學(xué)成分中的每個屬性的信息增益,從中挑選出信息增益大于0的值作為特征選擇的結(jié)果進行分類預(yù)測。實驗結(jié)果表明,使用該方法能夠得到較準確的關(guān)鍵致香成分,與傳統(tǒng)特征選擇方法相比,其特征數(shù)據(jù)集的分類結(jié)果也更加準確,可以作為煙葉香型分類的有效工具。
關(guān)鍵詞:信息增益;特征選擇;致香成分;煙葉香型
中圖分類號:TN911—34;TP391文獻標識碼:A文章編號:1004—373X(2012)18—0092—03
香味、香氣是評價卷煙產(chǎn)品品質(zhì)的重要指標,主要依靠專家進行評吸來完成,由于受到個人主觀方面的制約以及香味無法定量描述其數(shù)量和品質(zhì)等原因,始終無法確定煙絲中的致香成分對卷煙產(chǎn)品的香氣風格的影響作用[1—2]。目前,大多研究都集中在結(jié)合數(shù)理統(tǒng)計方法等對卷煙產(chǎn)品的研究。
針對這一現(xiàn)狀,提出了一種基于信息增益的特征選擇算法對煙絲關(guān)鍵致香成分進行分析。通過信息增益方法提取關(guān)鍵特征,能夠?qū)崿F(xiàn)數(shù)據(jù)集有效降維,深入認識關(guān)鍵特征屬性對輸出變量的影響關(guān)系,并且給出了M5P決策樹、逐步線性回歸、偏最小二乘回歸算法在原始數(shù)據(jù)集以及兩個特征選擇的數(shù)據(jù)集的比較分析結(jié)果,實驗表明基于信息增益的特征選擇方法提取的關(guān)鍵特征的分類結(jié)果具有較高的準確率。
1信息增益與特征選擇
1.1信息增益