摘" " 要:為提高不同醇化后雪茄煙葉品種的判別準(zhǔn)確性,采用多元散射校正等預(yù)處理算法對光譜數(shù)據(jù)進(jìn)行去噪處理,以降低試驗、環(huán)境和儀器噪音對數(shù)據(jù)的影響。結(jié)合支持向量機、BP神經(jīng)網(wǎng)絡(luò)和隨機森林建立不同品種的近紅外光譜判別模型,通過準(zhǔn)確率和混淆矩陣評估模型性能。結(jié)果表明:采用SNV+FD預(yù)處理算法和CARS特征波長選擇算法建立的模型效果最佳,在訓(xùn)練集和預(yù)測集上均表現(xiàn)出較高準(zhǔn)確性,證實了利用近紅外光譜技術(shù)快速判別不同醇化后雪茄煙葉品種的可行性。綜上,利用近紅外光譜技術(shù)可實現(xiàn)對不同品種醇化后雪茄煙葉的無損、快速判別,進(jìn)一步提高雪茄煙葉工業(yè)可用性。
關(guān)鍵詞:雪茄煙葉;近紅外光譜技術(shù);品種判別;支持向量機;隨機森林;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號:S572" " " " " 文獻(xiàn)標(biāo)識碼:A" " " " "DOI 編碼:10.3969/j.issn.1006-6500.2024.04.013
Study on Discrimination Model of Alcoholized Cigar Tobacco Varieties Based on Near Infrared Spectroscopy
SUN Li1, ZHANG Yi1, MENG Guangyun2, YU Yan2, GAO Fei2, WANG Lu2
(1. College of Biological Science and Technology, Hunan Agricultural University, Changsha, Hunan 410128, China; 2." Baoshan City Company, Yunnan Tobacco Company, Baoshan, Yunan 678000, China)
Abstract: The aim of this study was to improve the discrimination accuracy of different post-alcoholised cigar tobacco varieties, pre-processing algorithms such as multiple scattering correction were used to denoise the spectral data in order to reduce the influence of experimental, environmental and instrumental noise on the data. Support vector machines, BP neural networks and random forests were combined to establish near-infrared spectral discrimination models for different varieties. The model performance was evaluated by accuracy and confusion matrix. The results showed that the model built with SNV+FD preprocessing algorithm and CARS feature wavelength selection algorithm was the most effective, and showed high accuracy in both training and prediction sets, which confirmed the feasibility of the use of NIR spectroscopy to quickly discriminate different varieties of post-alcoholisation cigar tobacco leaves.In summary, the use of near infrared spectroscopy could realize the non-destructive and rapid discrimination of different varieties of alcoholized cigar tobacco, and further improve the industrial availability of cigar tobacco.
Key words: cigar tobacco; near infrared spectroscopy; variety discrimination; support vector machine; random forest; BP neural network
目前,有關(guān)雪茄的研究主要聚焦于煙葉種植技術(shù)的改進(jìn)以及對不同產(chǎn)地?zé)熑~的理化指標(biāo)進(jìn)行比較,而對雪茄煙葉原料的應(yīng)用方向的研究報道較少[1]。據(jù)國產(chǎn)雪茄原料生產(chǎn)技術(shù)研究現(xiàn)狀顯示,國產(chǎn)雪茄煙葉原料質(zhì)量亟待提升,且缺乏統(tǒng)一的質(zhì)量評價標(biāo)準(zhǔn)及系統(tǒng)的生產(chǎn)技術(shù)體系[2]。醇化是雪茄煙葉原料處理的重要過程,其目的在于改善煙葉的質(zhì)地、口感和氣味。醇化后雪茄煙葉品種的判別尤為重要,不僅關(guān)乎煙葉本身的特征,也關(guān)乎后續(xù)雪茄產(chǎn)品的品質(zhì)和消費者的體驗。醇化改善了口感與燃燒性,不同品種煙葉表現(xiàn)出獨特風(fēng)味與氣味,品種判別可確保產(chǎn)品質(zhì)量與口味多樣性,滿足市場需求。
近紅外光譜技術(shù)(near infrared spectroscopy,NIRS)在烤煙品種判別方面已經(jīng)得到廣泛的應(yīng)用[3]。NIRS是一種非破壞性、實時性強的分析技術(shù),可以通過檢測煙葉中的化學(xué)成分來進(jìn)行品種判別。付秋娟等[4]研究發(fā)現(xiàn),不同組別之間存在顯著的含量差異,驗證了光譜技術(shù)用于煙葉分級的可行性。這項技術(shù)不僅有助于確保煙葉產(chǎn)品的質(zhì)量,還能夠提高生產(chǎn)效率,滿足市場需求,同時推動煙草行業(yè)朝著可持續(xù)發(fā)展的方向邁進(jìn)。
本研究擬采用隨機森林法、BP神經(jīng)網(wǎng)絡(luò)法、支持向量機法,構(gòu)建3種近紅外光譜判別模型,并比較分析3種判別模型的準(zhǔn)確度,建立醇化后雪茄煙葉品種的快速判別方法,以期構(gòu)建有一定應(yīng)用價值,并可實現(xiàn)推廣應(yīng)用的不同品種雪茄醇化煙葉近紅外判別模型,為不同品種雪茄醇化煙葉的快速、無損判別提供方法和理論依據(jù)。
1 材料與方法
1.1 材料
選用云南省和四川省培育的雪茄品種云雪1號、云雪2號、德雪7號、德雪4號,共取957個樣品。各雪茄品系樣本數(shù)量情況見表1。
1.2 光譜采集
近紅外光譜數(shù)據(jù)采集系統(tǒng)由定制的PRNIR-2200在線近紅外光譜儀、一體化步進(jìn)電機、暗箱,以及裝有SpectrovPulse(上海譜為科技有限公司)軟件的計算機組成。所采用的近紅外光譜儀尺寸為438× 210×126 mm,采集數(shù)據(jù)時系統(tǒng)參數(shù)為:波長范圍為950~1 650 nm,光譜分辨率為1 nm,波長重復(fù)性為0.05 nm,光斑有效面積直徑為10 cm,測樣方式是漫反射。采集操作包括:通過正確連接電源、數(shù)據(jù)線、電腦等輔助設(shè)備,建立光路系統(tǒng)[5];啟動近紅外光譜儀后,利用儀器管理軟件控制光源功能,并進(jìn)行半小時的光源預(yù)熱,待性能檢測合格后,方可進(jìn)行后續(xù)步驟;對近紅外光譜儀器四周的黑布進(jìn)行遮光性檢查,以降低遮光不足而導(dǎo)致的光譜數(shù)據(jù)采集偏差。確認(rèn)采集環(huán)境的遮光性后,在光譜儀的光斑范圍內(nèi),選擇避開煙葉的主脈,對不同品種醇化后的雪茄煙葉逐一采集光譜數(shù)據(jù)。
1.3 數(shù)據(jù)處理方法
1.3.1 光譜預(yù)處理 在光譜采集過程中,除了包含被測樣本的待測成分信息外,還涵蓋了測量環(huán)境和儀器所產(chǎn)生的噪聲,如高頻隨機噪聲、基線漂移等無關(guān)信息[6]。為了減輕或消除各種非目標(biāo)因素對光譜信息的影響,通常會對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,以提高模型的預(yù)測能力和穩(wěn)定性[7]。本研究采用多元散射校正[8](Multiplicative scatter correction,MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variate transformation,SNV)、一階導(dǎo)數(shù)(First derivative,F(xiàn)D)、二階導(dǎo)數(shù)(Second derivative,SD)等方法對光譜進(jìn)行預(yù)處理[9]。本研究的光譜數(shù)據(jù)集共957組,其中云雪1號、云雪2號、德雪7號、德雪4號的光譜數(shù)據(jù)分別為239組、240組、240組、238組。為實現(xiàn)不同品種的近紅外光譜數(shù)據(jù)的訓(xùn)練集和測試集均勻分布并確保劃分的隨機性,本研究采用數(shù)據(jù)分離的方法,即先將不同品種的數(shù)據(jù)分開,得到各個品種的訓(xùn)練集和測試集數(shù)據(jù),隨后整合為整體數(shù)據(jù)的訓(xùn)練集和測試集,這樣的處理方式有助于提高模型的泛化性能。采用隨機取樣法以7∶3的比例劃分訓(xùn)練集與測試集后,對使用不同預(yù)處理方法后的光譜數(shù)據(jù)分別建立SVM、BP神經(jīng)網(wǎng)絡(luò)、RF模型,記錄并統(tǒng)計模型的預(yù)測準(zhǔn)確率,最終使用得到模型預(yù)測率最高的預(yù)處理方法對不同品種的原光譜進(jìn)行光譜預(yù)處理。
1.3.2 特征波長篩選 主連續(xù)投影算法[10](Sequential
Projection Algorithm,SPA)是一種用于特征選擇的算法。SPA的目標(biāo)是通過一系列的投影操作來逐步減小數(shù)據(jù)的維度,以達(dá)到選擇最具代表性特征的目的。近紅外光譜數(shù)據(jù)通常包含大量的波長特征,而其中只有一部分對于分析任務(wù)具有顯著信息。SPA能夠從大量的光譜特征中選出最具代表性的一組,提高分析的準(zhǔn)確性和效率。在近紅外光譜分析等領(lǐng)域應(yīng)用SPA可以優(yōu)化特征選擇,提高模型性能,降低計算復(fù)雜性,是近紅外光譜數(shù)據(jù)處理中的重要工具。
無信息變量消除法[11](Uninformative Variable Elimination,UVE)是一種特征波長選擇方法,用于從光譜數(shù)據(jù)中識別并刪除對模型建設(shè)沒有貢獻(xiàn)的不相關(guān)變量。在近紅外光譜分析等領(lǐng)域使用UVE方法,可以提高模型的效率和性能,同時減少計算負(fù)擔(dān)。UVE可以降低光譜數(shù)據(jù)的維度,提高建模的效率,同時剔除對目標(biāo)變量無貢獻(xiàn)的信息,有助于提高模型的泛化能力。
競爭性自適應(yīng)重加權(quán)法[12](Competitive Adaptive Reweighted Sampling,CARS)是一種特征波長選擇方法,常用于光譜數(shù)據(jù)處理,尤其在化學(xué)分析和光譜建模中。CARS方法通過自適應(yīng)地對波長進(jìn)行重采樣,以提高模型的性能。CARS主要優(yōu)勢在于它具有自適應(yīng)性,能夠根據(jù)每個波長點的貢獻(xiàn)度進(jìn)行調(diào)整,因此在一定程度上能夠提高模型的精度和泛化能力。此外,CARS方法避免了手動選擇特征的主觀性,使得波長選擇更加科學(xué)和有效。
1.4 判別模型的建立及評價指標(biāo)
本研究使用Matlab R2023b軟件分析近紅外光譜數(shù)據(jù),建立并對比了隨機森林法、BP神經(jīng)網(wǎng)絡(luò)法、支持向量機法3種不同的判別模型的正確判別率,采用混淆矩陣(Confusion Matrix)和接收者操作特征曲線(Receiver Operating Characteristic Curve,ROC曲線)來客觀評估模型的性能。ROC曲線是一種反映敏感性和特異性連續(xù)變化的綜合指標(biāo),通常通過ROC曲線下面積(Area Under Curve,AUC)來評估模型的性能,其取值范圍為0~1,最大值為1,模型的性能與AUC成正比關(guān)系[7]。AUC能夠較好地反映模型的泛化能力,數(shù)值接近1表示性能較好,數(shù)值小于0.5表示模型性能需要改進(jìn)。
1.4.1 隨機森林法 隨機森林(Random Forest,RF)是Breiman等[13]提出的一種基于決策樹的集成算法,它通過構(gòu)建多個決策樹并將它們集成在一起來提高整體模型的性能和泛化能力。近紅外光譜數(shù)據(jù)通常包含大量波長,隨機森林可以通過對數(shù)據(jù)進(jìn)行分析,自動選擇和提取對于煙葉品種分類有用的特征,這有助于剔除不相關(guān)的波長,提高模型的效率和準(zhǔn)確性。
1.4.2 BP神經(jīng)網(wǎng)絡(luò) BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network),也稱為多層感知機(Multilayer Perceptron,MLP),是一種常見的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)結(jié)構(gòu),本質(zhì)上是一種對誤差進(jìn)行逆向傳播,反復(fù)訓(xùn)練得到的多層前饋神經(jīng)網(wǎng)絡(luò)[14]。近紅外光譜包含了與化學(xué)成分相關(guān)的信息,而BP神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)這些信息,可以實現(xiàn)對醇化后不同雪茄煙葉品種的分類。王學(xué)順等[15]利用木材近紅外光譜數(shù)據(jù)建立反向傳播(BP)神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)對木材樹種的分類識別。魯夢瑤等[16]將方形矩陣卷積核轉(zhuǎn)換為一維卷積核以此構(gòu)建一維NIR-CNN模型,從而對煙葉近紅外光譜進(jìn)行定級,判別準(zhǔn)確率達(dá)95.0%。
1.4.3 支持向量機法 支持向量機(Support Vector Machine,SVM)是一種監(jiān)督學(xué)習(xí)算法,主要用于分類任務(wù)[17]。該方法的目標(biāo)是通過尋找一個最優(yōu)的超平面來有效地將不同類別的數(shù)據(jù)分隔開。支持向量機的基本思想是將數(shù)據(jù)點映射到高維空間,以便在這個高維空間中,數(shù)據(jù)點更容易被一個超平面分隔[18]。這通常涉及到使用一個稱為核函數(shù)的技術(shù),它計算2個樣本之間在高維空間中的相似度。對于多類別問題,可以使用一對一(One-vs-One)或一對其余(One-vs-Rest)等策略來擴展SVM。
2 結(jié)果與分析
2.1 光譜預(yù)處理
利用近紅外原始光譜構(gòu)建不同品種分類模型,SVM、BP神經(jīng)網(wǎng)絡(luò)、RF模型的原始光譜分類預(yù)測準(zhǔn)確率分別為35.54%、33.45%、35.19%。通過觀察近紅外原始光譜曲線,筆者發(fā)現(xiàn)不同品種的光譜曲線在整個光譜范圍內(nèi)存在顯著差異。這表明在不同雪茄煙煙葉品種原始光譜中存在許多干擾因素(圖1)。通過應(yīng)用MSC、SNV、FD、SD,以及它們的不同組合方法對原始光譜進(jìn)行預(yù)處理,均能提高模型的預(yù)測準(zhǔn)確率,但是準(zhǔn)確率提升幅度有限。而一階導(dǎo)數(shù)處理后的SVM、BP神經(jīng)網(wǎng)絡(luò)、RF模型預(yù)測準(zhǔn)確率分別為83.62%、73.17%、85.37%,較原始光譜分別提高了48.08%、39.72%、50.18%。在不同預(yù)處理方法的組合中,經(jīng)過SNV+FD處理后建立的模型預(yù)測準(zhǔn)確率達(dá)90%以上。通過對比原始光譜(圖1)、MSC、SNV、FD等不同預(yù)處理后的光譜圖,可以觀察到直觀差異逐漸減小,干擾因素逐步被消除(圖2)。模型預(yù)測結(jié)果顯示,采用SNV和FD組合預(yù)處理方法的效果最佳,不同預(yù)處理方法后的模型預(yù)測結(jié)果詳見表2。
2.2 特征波長篩選
2.2.1 基于SPA特征波長篩選 連續(xù)投影算法是一種用于矢量空間共線性最小化的前向變量選擇算法[19]。其顯著優(yōu)勢在于能夠從整個光譜波段中提取出關(guān)鍵特征波長,從而消除原始光譜矩陣中的冗余信息[20]。經(jīng)過SPA算法篩選后,在SD、MSC+SD預(yù)處理算法下,模型性能并未得到提升,反而出現(xiàn)下降。而其他預(yù)處理算法則僅使模型性能略微改善(表3)。相對其他預(yù)處理算法的建模效果,SNV+FD平滑算法的建模效果最好,該算法下SVM、BP神經(jīng)網(wǎng)絡(luò)、RF模型預(yù)測集準(zhǔn)確率均能達(dá)90%以上。
2.2.2 基于UVE特征波長篩選 無信息變量消除法用于剔除與目標(biāo)物質(zhì)無關(guān)的光譜波長,以減少模型計算的復(fù)雜度并提高其預(yù)測準(zhǔn)確性。與未經(jīng)篩選的原始光譜模型相比,在每種預(yù)處理算法下,經(jīng)過篩選后的模型性能都有所提升。值得注意的是,直接對原始光譜進(jìn)行UVE特征波長篩選的建模效果仍然是最差的(表4)。在8個預(yù)處理算法中,SNV+FD算法提升效果最明顯,SVM、BP神經(jīng)網(wǎng)絡(luò)、RF模型預(yù)測集準(zhǔn)確率分別為92.97%、97.41%、95.24%。
2.2.3 基于CARS特征波長篩選 競爭自適應(yīng)重加權(quán)采樣法是一種結(jié)合了競爭性機制和自適應(yīng)權(quán)重調(diào)整的采樣方法,可有效篩選出最佳波長組合。由表5可知,每種預(yù)處理算法下,3個模型的預(yù)測結(jié)果均優(yōu)于原始光譜的建模效果。通過比較不同預(yù)處理算法的建模效果可知,SNV+FD算法優(yōu)化效果最好,SVM、BP神經(jīng)網(wǎng)絡(luò)、RF模型預(yù)測集準(zhǔn)確率分別為96.52%、95.12%、94.43%,模型分類準(zhǔn)確率均高于SPA、UVE特征波長篩選算法。
2.3 最優(yōu)模型參數(shù)選擇
從SVM、BP神經(jīng)網(wǎng)絡(luò)、RF 3個模型分類結(jié)果看,結(jié)果較好的模型預(yù)處理算法為SNV+FD,特征波長選擇算法為CARS。為直觀呈現(xiàn)所建模型對4個雪茄煙葉品種識別性能的優(yōu)劣,使用AUC以及混淆矩陣作為模型精度及性能的評價指標(biāo)?;贑ARS特征波長算法篩選,SVM模型訓(xùn)練集和測試集的分類準(zhǔn)確率為100%、96.52%(圖3),BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練集和測試集的分類準(zhǔn)確率為98.21%、95.12%(圖4),RF模型訓(xùn)練集和測試集的分類準(zhǔn)確率為99.85%、94.43%(圖5),且3個模型的AUC值均達(dá)0.9以上。
3 討論與結(jié)論
本研究采用近紅外光譜技術(shù)結(jié)合支持向量機、BP神經(jīng)網(wǎng)絡(luò)和隨機森林模型,對不同醇化后雪茄煙葉品種的光譜數(shù)據(jù)進(jìn)行了分析。筆者使用了8種近紅外光譜預(yù)處理算法以及3種特征波長選擇算法,結(jié)果顯示,每種預(yù)處理算法下,模型性能皆有所提升,證明了光譜預(yù)處理在建模前的必要性。因為醇化后的雪茄煙葉樣本存在不均勻性和采集光譜條件差異等因素,所以直接使用原始近紅外光譜及所有波長點進(jìn)行建模效果較差。因此,在建模之前,需要對所采集樣本光譜數(shù)據(jù)進(jìn)行預(yù)處理和選擇特征波長。SNV+FD和SNV+SD預(yù)處理效果接近,都優(yōu)于單一預(yù)處理方法。盡管SNV和MSC的計算方式不同,但它們均能有效消除顆粒大小不均勻和光程變化等因素的影響。UVE和CARS算法顯著減少建模所需的波長數(shù)量,從而降低了模型的復(fù)雜度。CARS算法所選擇的波長數(shù)更多,有助于提取光譜的特征。然而,SPA算法雖然也能減少波長數(shù)量,但有用信息也可能被剔除,導(dǎo)致光譜信息不足,僅能略微提升模型性能。
采用智能化手段實現(xiàn)煙葉品種鑒別和等級判定是煙草工業(yè)評判煙葉品質(zhì)的未來發(fā)展趨勢,不少學(xué)者已將這一技術(shù)應(yīng)用于煙草領(lǐng)域。付博等[21]基于近紅外光譜技術(shù)進(jìn)行鑒別烤煙八大香型。章英等[22]基于近紅外光譜技術(shù)結(jié)合LS-SVM對烤煙煙葉產(chǎn)地進(jìn)行判別。施豐成等[23]通過近紅外光譜的PLS-DA算法對煙葉進(jìn)行識別。李士靜等[24]通過比較不同預(yù)處理方法、分類模型和特征波長對煙葉分類準(zhǔn)確率的影響。王超等[25]基于2018年采集768份不同產(chǎn)地的烤煙煙葉樣品建立偏最小二乘判別分析煙葉等級預(yù)測模型,并在類別量化方面采用連續(xù)數(shù)字編碼方式,此定量等級預(yù)測模型具有一定的創(chuàng)新性但存在判別準(zhǔn)確性較低的問題。本研究通過采用不同的近紅外光譜預(yù)處理算法以及特征波長選擇算法進(jìn)行建模,隨后進(jìn)行評價參數(shù)的比較,最終確定雪茄煙葉品種判別最佳的分類預(yù)測模型。通過選擇SNV+FD作為預(yù)處理算法和選取50個波長的CARS特征波長算法,結(jié)果表明,該組合算法下建立的模型效果最佳。3個模型在訓(xùn)練集和預(yù)測集上均表現(xiàn)出較高的準(zhǔn)確性,雪茄品種判別的準(zhǔn)確率均達(dá)90%以上,表明利用近紅外光譜技術(shù)快速鑒別不同品種醇化后的雪茄煙葉是可行的。此外,為進(jìn)一步提升模型的準(zhǔn)確性和精度,建議擴大樣本規(guī)模并增加樣本的多樣性,以覆蓋更廣泛的來源和品種的醇化后雪茄煙葉,還可以考慮采用其他預(yù)處理算法和特征波長選擇算法,以進(jìn)一步提高模型的性能。
參考文獻(xiàn):
[1] 王琰琰, 劉國祥, 向小華, 等. 國內(nèi)外雪茄煙主產(chǎn)區(qū)及品種資源概況[J]. 中國煙草科學(xué), 2020, 41(3): 93-98.
[2] 周婷, 范靜苑, 邢蕾, 等. 國產(chǎn)雪茄煙葉原料應(yīng)用研究的探索和思考[J]. 現(xiàn)代工業(yè)經(jīng)濟和信息化, 2021, 11(7): 140-142, 148.
[3] 陶帥, 馬翔, 李軍會, 等. 基于煙葉近紅外光譜主成分?jǐn)?shù)據(jù)的投影方法研究及其在復(fù)烤配方中的應(yīng)用[J]. 光譜學(xué)與光譜分析, 2009, 29(11): 2970-2974.
[4] 付秋娟, 王樹聲, 竇玉青, 等. 近紅外定量分析青煙葉中K、Ca、Mg含量的研究[J]. 中國煙草學(xué)報, 2006, 12(2): 17-19.
[5] 于智海. 基于近紅外光譜的南疆紅棗水分動態(tài)無損檢測模型研究[D]. 阿拉爾: 塔里木大學(xué), 2022.
[6] 李慶波, 汪韆, 徐可欣, 等. 牛奶主要成分含量近紅外光譜快速測量法[J]. 食品科學(xué), 2002, 23(6): 121-124.
[7] 王巧, 熊豐, 王游游, 等. 紅外光譜結(jié)合化學(xué)計量學(xué)鑒別西紅花的產(chǎn)地[J]. 化學(xué)試劑, 2023, 45(3): 112-119.
[8] WILLIAMS P, NORRIS K. Near-infrared technology in the agricultural and food industries[M]. Paul, MN: The American Association of Cereal Chemists, 1987.
[9] 褚小立. 化學(xué)計量學(xué)方法與分子光譜分析技術(shù)[M]. 北京: 化學(xué)工業(yè)出版社, 2011: 41-48.
[10] DOS SANTOS CANOVA L, VALLESE F D, PISTONESI M F, et al. An improved successive projections algorithm version to variable selection in multiple linear regression[J]. Analytica Chimica Acta, 2023, 1274: 341560.
[11] KOSHOUBU J, IWATA T, MINAMI S. Elimination of the uninformative calibration sample subset in the modified UVE(Uninformative Variable Elimination)-PLS (Partial Least Squares) method[J]. Analytical Sciences, 2001, 17(2): 319-322.
[12] XIA Z Z, YANG J, WANG J, et al. Optimizing rice near-infrared models using fractional order Savitzky-Golay derivation (FOSGD) combined with competitive adaptive reweighted sampling(CARS)[J]. Applied Spectroscopy, 2020, 74(4): 417-426.
[13] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[14] WANG Q, LI H Q, YOU J L, et al. An integrated strategy of spectrum-effect relationship and near-infrared spectroscopy rapid evaluation based on back propagation neural network for quality control of Paeoniae Radix Alba[J]. Analytical Sciences, 2023, 39(8): 1233-1247.
[15] 王學(xué)順, 孫一丹, 黃敏高, 等. 基于BP神經(jīng)網(wǎng)絡(luò)的木材近紅外光譜樹種識別[J]. 東北林業(yè)大學(xué)學(xué)報, 2015, 43(12): 82-85, 89.
[16] 魯夢瑤, 楊凱, 宋鵬飛, 等. 基于卷積神經(jīng)網(wǎng)絡(luò)的煙葉近紅外光譜分類建模方法研究[J]. 光譜學(xué)與光譜分析, 2018, 38(12): 3724-3728.
[17] 劉志剛, 李德仁, 秦前清, 等. 支持向量機在多類分類問題中的推廣[J]. 計算機工程與應(yīng)用, 2004, 40(7): 10-13, 65.
[18] 顧傲. 基于機器學(xué)習(xí)的惡意URL識別[D]. 阜陽: 阜陽師范大學(xué), 2023.
[19] 楊晨波, 馮美臣, 孫慧, 等. 不同灌水處理下冬小麥地上干生物量的高光譜監(jiān)測[J]. 生態(tài)學(xué)雜志, 2019, 38(6): 1767-1773.
[20] 郭志明. 基于近紅外光譜及成像的蘋果品質(zhì)無損檢測方法和裝置研究[D]. 北京: 中國農(nóng)業(yè)大學(xué), 2015.
[21] 付博, 楊永鋒, 劉向真, 等. 基于近紅外光譜的烤煙香型分類模型研究[J]. 河南農(nóng)業(yè)科學(xué), 2023, 52(7): 163-171.
[22] 章英, 賀立源, 葉穎澤, 等. 基于LS-SVM的烤煙煙葉產(chǎn)地判別[J]. 湖北農(nóng)業(yè)科學(xué), 2012, 51(3): 583-585.
[23] 施豐成, 李東亮, 馮廣林, 等. 基于近紅外光譜的PLS-DA算法判別烤煙煙葉產(chǎn)地[J]. 煙草科技, 2013, 46(4): 56-59.
[24] 李士靜, 潘羲, 陳熙卓, 等. 基于高光譜信息的煙葉分級方法比較[J]. 煙草科技, 2021, 54(10): 82-91.
[25] 王超, 劉藝琳, 楊凱, 等. 近紅外快速檢測烤煙等級質(zhì)量與關(guān)鍵化學(xué)指標(biāo)的關(guān)系[J]. 中國測試, 2021, 47(2): 81-86.