朱毅寧 楊平 楊新艷 李嘉銘 郝中騏 李秋實(shí) 郭連波 李祥友 曾曉雁 陸永楓
摘要為提高激光誘導(dǎo)擊穿光譜技術(shù)(Laserinduced breakdown spectroscopy, LIBS)對鮮肉品種的識別率, 采用支持向量機(jī)結(jié)合主成分分析算法輔助LIBS技術(shù)對鮮肉品種進(jìn)行識別。對鮮肉切片用載玻片壓平, 采用LIBS技術(shù)對鮮肉組織(豬肉、牛肉和雞肉)表面進(jìn)行光譜數(shù)據(jù)的采集, 每種鮮肉采集150幅光譜并進(jìn)行隨機(jī)排列, 取前75幅光譜作為訓(xùn)練集建立模型, 后75幅作為測試集測試建模結(jié)果。研究選取K、Ca、Na、Mg、Al、H、O等元素的49條歸一化譜線數(shù)據(jù)進(jìn)行主成分分析, 并用所得數(shù)據(jù)建立支持向量機(jī)分類模型。結(jié)果表明, 通過主成分分析降維, 輸入變量從49個優(yōu)化減少到18個, 模型建模速度從88.91 s降至55.52 s, 提高了支持向量機(jī)的建模效率; 并使預(yù)測集的平均識別率提高到89.11%。本研究為激光誘導(dǎo)擊穿光譜技術(shù)在鮮肉品種快速分類領(lǐng)域提供了方法和數(shù)據(jù)參考。
關(guān)鍵詞激光誘導(dǎo)擊穿光譜; 支持向量機(jī); 主成分分析; 組織分類
1引 言
肉類品種多樣、價格不一, 一些不良商家以次充好, 不斷出現(xiàn)“豬肉充當(dāng)牛肉”、“鼠肉充當(dāng)羊肉”、“摻假牛羊肉”、“僵尸肉”等嚴(yán)重危害消費(fèi)者利益和食品安全的事件。因此, 肉類品種的快速分類分析有著重要的現(xiàn)實(shí)意義。傳統(tǒng)的肉類檢測技術(shù)有聚合酶鏈反應(yīng)技術(shù)(Polymerase chain reaction)[1]、氣相層析質(zhì)譜分析技術(shù)(Gas chromatography mass spectrometer)[2]、芯片毛細(xì)管凝膠電泳(Capillary gel electrophoresis)[3]等。雖然上述方法檢測準(zhǔn)確度高, 但需要專業(yè)人員對樣品進(jìn)行DNA或蛋白質(zhì)的萃取, 操作過程復(fù)雜耗時[4], 不能滿足快速檢測的需求, 因此亟需開發(fā)一種快速肉類品種區(qū)分的檢測技術(shù)。
激光誘導(dǎo)擊穿光譜(Laserinduced breakdown spectroscopy, LIBS)是一種原子發(fā)射光譜分析技術(shù)[5], 已廣泛用于固、液、氣等物質(zhì)的檢測[6~13], 并逐漸進(jìn)入工業(yè)生產(chǎn)檢測領(lǐng)域[14], 尤其以微損、非接觸、快速分析的特點(diǎn)在生物組織檢測方面受到越來越多的關(guān)注[15~18]。近年來, 將LIBS技術(shù)與化學(xué)計(jì)量學(xué)方法相結(jié)合識別生物組織已成為研究熱點(diǎn)[19]。Kumar等[20]使用LIBS技術(shù)對狗肝正常組織和惡性腫瘤組織進(jìn)行光譜區(qū)分, 實(shí)驗(yàn)表明, 組織中不同元素譜線強(qiáng)度比值差異可以有效區(qū)分正常組織和腫瘤組織。Yueh等[21]使用層析聚類分析(Hierarchical cluster analysis, HCA)、主成分分析(Principal components analysis, PCA)、偏最小二乘判別分析(Partial least square discriminant analysis, PLSDA)和BP神經(jīng)網(wǎng)絡(luò)(Back propagation artificial neural networks, BPANN)4種算法對冰凍雞肉組織的不同部位(大腦、肝、肺、脾臟、腎臟、肌肉)進(jìn)行LIBS實(shí)驗(yàn)分析, HCA對44個樣品驗(yàn)證,僅有3個沒有正確識別, 其它算法(如PLSDA、BPANN)由于訓(xùn)練集建模樣品數(shù)據(jù)太少及訓(xùn)練集與驗(yàn)證集采集時間不一致, 不能有效地建立訓(xùn)練模型, 造成對驗(yàn)證集的識別率差。Bilge等[22]采用LIBS技術(shù)結(jié)合PCA算法對烘干壓片處理的肉類組織(豬、牛、雞)進(jìn)行種類區(qū)分, 識別率為83.37%。除此之外, 還對相互摻雜的肉制品進(jìn)行了PLS定量分析的研究。上述研究表明, LIBS對肉類組織的識別率有待提高, 且樣品的制作方法如冰凍、壓片法, 制樣耗時、復(fù)雜, 需要改善。
相對于以上所使用的分類算法, 支持向量機(jī)[23](Support vector machines, SVM)具有在小樣本建模、訓(xùn)練速度、預(yù)測穩(wěn)定等方面的優(yōu)勢, 被廣泛用于LIBS分類研究中。 Yu等[24]利用LIBS結(jié)合SVM對11種塑料的識別率達(dá)到了100%, 但SVM常會受輸入變量過多和噪聲的影響, 使得建模效率和穩(wěn)定性降低。鑒于PCA具有降維、除噪[25]的優(yōu)勢, 目前已有研究者將PCA引入SVM算法, 提高SVM的建模效率和穩(wěn)定度, 并成功應(yīng)用于土壤[26]、巖石[27]、柑橘葉[28]和蛋白質(zhì)[29]等LIBS的分類研究中, 識別率分別達(dá)到100%, 91.33%, 97.5%和98%。然而, 將SVM與PCA結(jié)合用于LIBS鮮肉品種分類方面的研究鮮有報道。
本研究采用載玻片壓制鮮肉樣品的簡單處理方法, 使用SVM輔助LIBS技術(shù)對豬肉、牛肉、雞肉等6種不同品種的鮮肉進(jìn)行快速、準(zhǔn)確地分類識別, 并利用PCA算法優(yōu)化SVM建模效率, 以期提高建模的速度和識別準(zhǔn)確率, 從而證實(shí)了PCASVM方法對于識別鮮肉品種有較好的效果。
2實(shí)驗(yàn)部分
2.1實(shí)驗(yàn)裝置
實(shí)驗(yàn)裝置如圖1所示, 采用調(diào)Q開關(guān)Nd∶YAG脈沖激光器(Quantel Brilliant B, 波長532 nm, 脈沖寬度8 ns, 最大重復(fù)頻率10 Hz)。激光經(jīng)過反射鏡和平凸透鏡(焦距為100 mm)聚焦到樣品表面, 激發(fā)出等離子光譜。
2.2樣品處理
本實(shí)驗(yàn)所采用的鮮肉樣品為: 恩施土豬里脊肉(簡稱為恩施土豬)、黑豬里脊肉(簡稱黑豬)、中糧豬特級里脊肉(中糧集團(tuán)有限公司, COFCO, 簡稱中糧豬)、牛里脊、牛后腿和雞脯肉, 實(shí)驗(yàn)材料均購自當(dāng)?shù)爻?。鮮肉組織制樣的具體步驟為: (1)用醫(yī)用切片刀將鮮肉組織切成長寬約為50 mm×18 mm、厚2~3 mm的小片, 放在普通載玻片(25.4 mm×76.2 mm)上; (2)用另一塊載玻片壓在肉片上, 并用10 kg重物將其壓制1 min, 使得肉片平鋪在下面的載玻片上, 壓片效果如圖2所示。(3)利用LIBS系統(tǒng)對制作好的樣品進(jìn)行光譜采集。
3結(jié)果與討論
3.1數(shù)據(jù)采集與提取
采用優(yōu)化的實(shí)驗(yàn)參數(shù), 能量30 mJ/脈沖, 頻率5 Hz。光譜儀積累模式的采集參數(shù): 曝光時間1 s, 積累次數(shù)為2, 采集延時時間為0.9 μs, 門寬為10 μs, 每幅光譜積累10個激光脈沖。每種鮮肉壓制5個樣品, 每樣品采集30幅光譜, 因此6種鮮肉組織樣品共獲得900幅光譜數(shù)據(jù)。
為降低光譜強(qiáng)度的波動性的影響, 以生物組織基體元素C 247.86 nm光譜強(qiáng)度對其它元素譜線強(qiáng)度進(jìn)行歸一化處理。圖3所示為牛里脊LIBS光譜強(qiáng)度歸一化后的全譜圖, 部分分析譜線位置也在全譜中予以標(biāo)出。實(shí)驗(yàn)中所使用的49條譜線也在表1中列出。不同組織間部分主量元素歸一化譜線強(qiáng)度的差異如表2所示。
由表2可知, 價格較低的中糧豬, 其歸一化譜線Ca/C、Na/C、K/C、Al/C強(qiáng)度明顯低于價格高的恩施土豬和黑豬; 而兩種不同價格的牛肉其譜線Ca/C、Na/C、K/C、Al/C強(qiáng)度則高于恩施土豬和黑豬。這表明不同種鮮肉組織元素含量存在較大差異, 這為鮮肉樣品的分類奠定了基礎(chǔ)。
3.2主成分分析
主成分分析算法(PCA)是一種高效的信息壓縮方法, 采用特征分解方法獲得最大方差的主成分(PC)來代替原有變量, 可以消除原始數(shù)據(jù)的相關(guān)性和信息冗雜[31], 通過優(yōu)化主成分個數(shù)代替原有變量個數(shù)進(jìn)行數(shù)學(xué)建模, 提高建模速度和穩(wěn)定度, 并使用得到的主要主成分對數(shù)據(jù)進(jìn)行聚類分析。分析所用的PCA算法和SVM算法程序均在Matlab R2010b環(huán)境下實(shí)現(xiàn)。
獲得的900幅組織光譜經(jīng)譜線強(qiáng)度提取、C線歸一化處理后, 對其進(jìn)行PCA降維分析。圖4為前3個主成分下不同種組織光譜的散點(diǎn)圖, 所使用3個主成分的累計(jì)貢獻(xiàn)率達(dá)到了95.79%。由圖4可知, 除了部分牛里脊光譜數(shù)據(jù)在三維主成分圖中可聚集到同一區(qū)域, 其它種類的鮮肉組織光譜交互在一起, 難以區(qū)分, 因此需結(jié)合其它算法進(jìn)一步區(qū)分。
3.3SVM與PCASVM對比分析
支持向量機(jī)(SVM)是一種通過尋求結(jié)構(gòu)化風(fēng)險最小來提高學(xué)習(xí)機(jī)泛化能力的方法, 實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險和置信范圍最小化, 從而達(dá)到在取樣少亦能達(dá)到良好統(tǒng)計(jì)規(guī)律的目的。其很重要的特點(diǎn)是可以將線性不可分的數(shù)據(jù)通過構(gòu)造核函數(shù)的方式映射到高維空間中, 從而在高維空間得到線性區(qū)分[20]。本研究采用Chang等[32]開發(fā)的支持向量機(jī)軟件工具箱(Library for Support Vector Machines, LIBSVM)進(jìn)行數(shù)據(jù)分類處理。數(shù)據(jù)集等分為訓(xùn)練集和測試集。每個類別設(shè)置標(biāo)簽進(jìn)行區(qū)分, 相同類使用相同的標(biāo)簽。因?yàn)閮?nèi)核選擇的是映射徑向基函數(shù), 需要選擇合適的懲罰參數(shù)C和徑向基函數(shù)系數(shù)g才能獲得較佳的預(yù)測結(jié)果。設(shè)置的方式和優(yōu)化選擇參數(shù)的方法詳見文獻(xiàn)[33], 不同的是本研究使用的是3折交互驗(yàn)證。
為使SVM分類模型更加穩(wěn)健, 將每種鮮肉樣品的150幅光譜數(shù)據(jù)隨機(jī)排列, 選擇前75幅光譜進(jìn)行訓(xùn)練, 剩余的75幅光譜進(jìn)行預(yù)測。在訓(xùn)練過程中使用交叉驗(yàn)證法選擇最佳的懲罰參數(shù)C和內(nèi)核參數(shù)g。結(jié)果表明, 單獨(dú)的SVM模型平均訓(xùn)練、
在SVM算法中, 輸入變量越多, 訓(xùn)練時間越長; 且難免存在變量共線性和光譜噪聲的影響。因此采用PCA算法對原始變量進(jìn)行線性組合對數(shù)據(jù)進(jìn)行壓縮, 去除多余的變量, 減弱光譜噪聲影響。通過使用PCA算法對49個光譜變量重新組合得到新的49個主成分, 不同主成分變量數(shù)對SVM訓(xùn)練集識別結(jié)果的影響如圖5所示, 主成分?jǐn)?shù)分別在18, 19, 21, 28, 29, 30, 33時均可達(dá)到最佳的平均訓(xùn)練識別率88.22%。在同樣的訓(xùn)練識別率下, 取最小數(shù)目的主成分個數(shù)可以加快SVM算法的建模效率, 因此本研究采用18個主成分進(jìn)行建模和分類識別, 其平均預(yù)測識別率可達(dá)到89.11%, 高于未降維SVM的識別效果, 此時的(C, g)優(yōu)化參數(shù)為(1024.00, 0.0030), 對比文獻(xiàn)[22]中對豬肉、牛肉和雞肉識別率, 提高了5.74%, 具體的識別結(jié)果如表3所示。SVM與PCASVM建模結(jié)果對比見表4, 在不降低SVM算法識別率的情況下, PCA算法的引入大大縮短了SVM建模的時間, 使得建模時間從89.11 s降至55.52 s。
4結(jié) 論
通過對6種鮮肉進(jìn)行簡單的載破片壓制處理, 聯(lián)合PCA和SVM算法對LIBS采集的光譜數(shù)據(jù)進(jìn)行分析和建模, 提高了SVM的建模效率, 獲得較好的識別效果, 其中建模時間縮短至55.52 s, 平均預(yù)測識別率達(dá)到89.11%。以上結(jié)果表明, LIBS結(jié)合PCA與SVM算法可以用于快速檢測新鮮肉類品種, 為市場鮮肉的快速識別提供一種新途徑。
References
1Rodríguez M A, García T, González I, Hernández P E, Martín R. Meat Sci., 2005, 70(1): 113-120
2Hites R A. Handbook of Instrumental Techniques For Analytical Chemistry, 1997: 609-626
3VallejoCordoba B, CotaRivas M. J. Capillary Electrophor., 1997, 5(56): 171-175
4Kumar A, Kumar R R, Sharma B D, Gokulakrishnan P, Mendiratta S K, Sharma D. Crit. Rev. Food Sci., 2015, 55(10): 1340-1351
5Radziemski L J. Spectrochim. Acta, 2002, 57(7): 1109-1113
6Radziemski L, Cremers D. Spectrochim. Part B, 2013, 87: 3-10
7CHEN QiMeng, DU Min, HAO ZhongQi, ZOU XiaoHeng, LI JiaMing, YI RongXing, LI XiangYou, LU YongFeng, ZENG XiaoYan. Spectroscopy and Spectral Analysis, 2016, 36(5): 1473-1477
陳啟蒙, 杜 敏, 郝中騏, 鄒孝恒, 李嘉銘, 易榮興, 李祥友, 陸永楓, 曾曉雁. 光譜學(xué)與光譜分析, 2016, 36(5): 1473-1477
8Li C M, Zou Z M, Yang X Y, Hao Z Q, Guo L B, Li X Y, Lu Y F, Zeng X Y. J. Anal. Atom. Spectrom., 2014, 29(8): 1432-1437
9LI JiaMing, CHU YingBo, ZHAO Nan, ZHOU Ran, YI RongXing, GUO LianBo, LI JinYan, LI XiangYou, ZENG XiaoYan, LU YongFeng. Chinese J. Anal. Chem., 2016, 44(7): 1042-1046
李嘉銘, 褚應(yīng)波, 趙 楠, 周 冉, 易榮興, 郭連波, 李進(jìn)延, 李祥友,曾曉雁, 陸永楓. 分析化學(xué), 2016, 44(7): 1042-1046
10SHAO Yan, ZHANG YanBo, GAO Xun, DU Chuang,LIN JingQuan. Spectroscopy and Spectral Analysis, 2013, 33(10): 2593-2598
邵 妍, 張艷波, 高 勛, 杜 闖, 林景全. 光譜學(xué)與光譜分析, 2013, 33(10): 2593-2598
11LIU Li. Las. Optoelect. Prog., 2015, 52(7): 295-299
劉 莉. 激光與光電子學(xué)進(jìn)展, 2015, 52(7): 295-299
12Zeng Q, Guo L, Li X, He C, Shen M, Li K, Duan J, Zeng X, Lu Y. J. Anal. Atom. Spectrom., 2015, 30(2): 403-409
13Hao Z, Guo L, Li C, Shen M, Zou X, Li X, Lu Y, Zeng X. J. Anal. Atom. Spectrom., 2014, 29(12): 2309-2314
14Sun L X, Yu H B, Cong Z B, Xin Y, Li Y, Qi L F. Spectrochim. Acta B, 2015, 112: 40-48
15Rehse S, Salimnia H, Miziolek A. J. Med. Eng. Technol., 2012, 36(2): 77-89
16CHEN TianBing, LIU MuHua, HUANG Lin, ZHOU HuaMao, WANG CaiHong, YANG Hui, HU HuiQin, YAO MingYin. Chinese J. Anal. Chem., 2016, 44(7): 1029-1034
陳添兵, 劉木華, 黃 林, 周華茂, 王彩虹, 楊 暉, 胡慧琴, 姚明印. 分析化學(xué), 2016, 44(7): 1029-1034
17Liu X Y, Zhang W J. J. Med. Biol. Eng., 2008, 1(3): 147
18Yao M, Huang L, Zheng J, Fan S, Liu M. Opt. Laser. Technol., 2013, 52: 70-74
19Singh V K, Rai A K. Laser Med. Sci., 2011, 26(5): 673-687
20Kumar A, Yueh F Y, Singh J P, Burgess S. Appl. Optics, 2004, 43(28): 5399-5403
21Yueh F Y, Zheng H, Singh J P, Burgess S. Spectrochim. Acta B, 2009, 64(10): 1059-1067
22Bilge G, Velioglu H M, Sezer B, Eseller K E, Boyaci I H. Meat Sci., 2016, 119: 118-122
23Cortes C, Vapnik V. Mach. Learn., 1995, 20(3): 273-297
24Yu Y, Guo L, Hao Z, Li X, Shen M, Zeng Q, Li K, Zeng X, Lu Y, Ren Z. Opt. Express, 2014, 22(4): 3895-3901
25Shi Q, Niu G, Lin Q, Xu T, Li F, Duan Y. J. Anal. Atom. Spectrom., 2015, 30(12): 2384-2393
26Yu K Q, Zhao Y R, Liu F, He Y. Sci. Rep., 2015, 6: 27574-27574
27Yang H X, Fu H B, Wang D H, Jia J W, Dong F Z. Chinese Phys. B, 2016, 25(6): 290-295
28Sankaran S, Ehsani R, Morganc K T. Appl. Spectrosc., 2015, 69(8): 913-919
29Pokrajac D, Lazarevic A, Kecman V, Marcano A, Markushin Y, Vance T, Reljin N, McDaniel S, Melikechi N. Appl. Spectrosc., 2014, 68(9): 1067-1075
30Pearse R W B, Gaydon A G, Pearse R W B, Gaydon A G. The Identification Of Molecular Spectra (Chapman and Hall London), 1976, Vol. 297
31YIN Fei, FENG DaZheng. Comput. Technol. Dev., 2008, 18(10): 31-33
尹 飛, 馮大政. 計(jì)算機(jī)技術(shù)與發(fā)展, 2008, 18(10): 31-33
32Chang C C, Lin C J. Acm. T. Intel. Syst. Tec., 2011, 2(3): 27
33YU Yang, HAO ZhongQi, LI ChangMao, GUO LianBo, LI KuoHu, ZENG QinDong, LI XiangYou, REN Zhao, ZENG XiaoYan. Acta. Phys. Sin, 2013, 62(21): 215201-215201
于 洋, 郝中騏, 李常茂, 郭連波, 李闊湖, 曾慶棟, 李祥友, 任 昭, 曾曉雁. 物理學(xué)報, 2013, 62(21): 215201-215201
AbstractTo improve the classification accuracy of fresh meat species using laserinduced breakdown spectroscopy (LIBS), the support vector machine (SVM) and principal component analysis (PCA) were combined to classify fresh meat species (including pork, beef, and chicken). A simple sample preparation to flatten fresh meat by glass slides was proposed. For each meat sample, 150 spectra were recorded and randomly arranged. The first 75 spectra were used to train a model while the others were used for model validation. By analyzing the 49 normalized spectral lines (K, Ca, Na, Mg, Al, H, O, etc.) in the different tissues, the classification model was built. The results showed that the dimensionality of input variables was decreased from 49 to 10 and modeling time was reduced from 89.11 s to 55.52 s using PCA, thus improving the modeling efficiency. The mean classification accuracy of 89.11% was achieved. The method and reference data are provided for further study of fresh meat classification by laserinduced breakdown spectroscopy technique.
KeywordsLaserinduced breakdown spectroscopy; Support vector machine; Principal component analysis; Tissue classification