李慶波,畢智棋,石冬冬
1. 北京航空航天大學儀器科學與光電工程學院,精密光機電一體化技術教育部重點實驗室,北京 100191 2. 中國農業(yè)科學院飼料研究所,北京 100081
隨著我國經濟和科技水平不斷提高,人們的生活水平和物質需求日漸增長,養(yǎng)殖業(yè)也應需求進行產業(yè)改革,通過科學養(yǎng)殖、宏觀調配進行優(yōu)化。魚粉作為飼料中最重要的蛋白質來源,對魚粉的品質要求也隨之提高。魚粉的品質好壞決定了飼料質量的高低,從而影響畜禽健康發(fā)育。我國是全世界最大的魚粉需求國,建立完善的魚粉市場秩序,有效鑒別魚粉摻假,以次充好是不可或缺的。由于不同產地魚粉的品質差別巨大,會有不法商家用劣質魚粉冒充高品質魚粉,因此為打擊此類不法行為,維護市場秩序,我們需要對魚粉產地溯源進行研究。
能量色散X射線熒光光譜根據元素輻射X射線熒光光子能量不同,能夠檢測樣品礦物質元素種類和含量。該方法具有光譜譜峰尖銳,重疊少,信息豐富,測量更加精準,對樣品無破壞,可重復使用的優(yōu)點。由于不同產地所處海域不同,制作魚粉的魚類差異導致魚粉的化學礦物質元素組成和含量存在區(qū)別,因此本文首次提出采用能量色散X射線熒光光譜法對魚粉產地進行溯源。2015年宋濤[1]等基于近紅外光譜技術對淡水魚粉、進口魚粉和國產魚粉建立主成分分析模型進行分類。近紅外光譜技術具有方便、快速的優(yōu)點,但近紅外光譜缺點是譜峰重疊,反映的是有機化合物分子結構的信息。2018年,韋紫玉[2]等基于能量色散型X射線熒光光譜技術對小麥產地識別進行研究,通過主成分分析,Fisher判別分析與二次識別分析建立小麥產地識別模型樣本識別率達94.12%。證明以產生的熒光光譜為研究對象結合化學計量學方法可以實現產品的產地溯源。2019年,Herreros-Chavez[3]等采用能量色散X射線熒光法研究豆類和水果的礦物分布,通過偏最小二乘法(PLS)建模。建立了鋁、鈣、銅、鐵、鉀、鎂、磷、鍶、鋅的濃度預測模型。對豆類和水果元素含量進行定量分析取得很好的效果,表明能量色散X射線熒光法不僅可以對礦石[4]、土壤[5]等中的礦物質元素進行定量檢測,也可以對食品中的礦物元素進行檢測。2019年,鄧玉福[6]等采用EDXRF法對含磷飼料中磷元素含量進行測定,采用曲線擬合方法對飼料中磷成分進行定量分析,表明EDXRF法能夠對飼料所含礦物元素進行分析檢測。本研究通過能量色散X射線熒光光譜獲取魚粉礦物質元素信息,建立鯨魚算法改進后的自適應凈信號權重局部超平面方法分類模型對魚粉產地進行溯源,對維護魚粉市場秩序及畜禽業(yè)健康發(fā)展具有重要意義。
實驗制作了51個魚粉樣品壓片,其中產地為遼寧24份,浙江27份,每個壓片分別使用不同濾光片獲取了6條EDXRF光譜曲線,總共是306條光譜數據。隨機選取各產地樣品的70%為訓練集,30%為測試集(表1)。
表1 魚粉樣品測試訓練分組情況Table 1 Grouping of fishmeal sample testing and training
實驗所用的EDXRF譜儀是Epsilon1型號(帕納科品牌的臺式XRF能譜儀一體機),采用眾合ZHY-401B熒光光譜儀用粉末壓片機制成魚粉樣品壓片,實驗采用不放置濾光片和放置五種不同初級濾光片獲得光譜曲線。其中五種濾光片材質、厚度以及適用元素如(表2)所示。
表2 初級濾光片的參數屬性Table 2 Parametric properties of primary filters
X射線能量色散熒光光譜在采集過程中會受到樣品壓片質量、環(huán)境溫度、射線散射等因素影響。因此本實驗采用自適應迭代重加權懲罰最小二乘法對光譜的基線進行校正,消除基線漂移。采用小波變換的方法對光譜曲線進行平滑去噪,消除高頻噪聲的干擾。將每個樣品的6條光譜有效區(qū)段拼接,選取16個明顯譜峰波形,計算譜峰面積得到16維代表樣品元素的向量。
1.4.1 自適應凈信號權重局部超平面
自適應凈信號權重局部超平面(adaptive Net analyte signal weight K_local hyperplane,ANWKH)方法[7]是基于K近鄰算法的改進,ANWKH算法首先將原始光譜利用前f個主成分進行光譜重構投影到子空間X-k,通過公式計算出凈光譜x。
(1)
然后計算訓練樣本的特征權重w和預測樣q到訓練樣本的權重歐氏距離D
(2)
(3)
根據D,得到c類樣本中與q最近的nc個訓練樣本pc=(pc1,…,pcnc),并構造超平面
Vi=pci-mc
α=(α1,…,αnc)T
(4)
最后計算預測樣本q到c類超平面的最小距離并根據距離判斷類別
W=diag(w1,…,wd)
(5)
label(q)=argmincJc(q)
(6)
1.4.2 鯨魚算法
自適應凈信號權重局部超平面法需要對最近鄰數、主成分數、調節(jié)參數進行設定,為達到最佳分類效果,本文采取鯨魚算法[8]尋找最優(yōu)參數。鯨魚算法是模仿座頭鯨捕食過程的仿生算法,通過預測獵物位置并按螺旋型運動將其包圍,從而尋找到最優(yōu)參數。
首先鯨魚算法設定最優(yōu)候選解為目標獵物,并設立一定數量搜索代理協(xié)助搜索最優(yōu)解,進行迭代更新位置。
(7)
(8)
式中,D為鯨魚向獵物移動距離,t為當前迭代次數,A和C為系數向量,XP是當前最佳解,X是位置向量,其中A和C向量計算式如式(9)和式(10)
(9)
(10)
式中,a是在迭代過程中由2到0的線性衰減向量,r1和r2為0到1之間的隨機向量。鯨魚算法采取收縮環(huán)繞機制和螺旋型機制進行位置更新。
(11)
式(11)中,b是定義對數螺線形狀常數,l為-1到1之間隨機數,p為0到1之間隨機數。當|A|<1時鯨魚結束游走,根據模型的適應度對目標獵物進行捕獲獲得最佳參數。
圖1為魚粉樣品在無濾光片和五種初級濾光片條件下獲得的6條能量色散X射線熒光光譜,圖2為采用airPLS方法[9-10]對能量色散X射線熒光光譜進行基線校正。圖3為基線校正前后對比圖,明顯看出經校正后基線漂移消除。
圖1 原始光譜曲線Fig.1 Raw spectral curve
圖4為原始光譜和小波變換去噪后光譜局部放大對比圖,可見,在一定程度上去除了光譜的高頻噪聲,得到一條相對平滑的曲線,對波形和譜峰高度影響很小。
通過對魚粉6條光譜曲線有效區(qū)段進行選擇,計算譜峰面積得到用于模式識別的特征向量。對遼寧產地和浙江產地的魚粉樣品隨機抽取70%作為訓練集進行建模,30%作為測試集進行驗證。分別采用人工選擇參數和鯨魚算法選擇最優(yōu)參數,然后使用自適應凈信號權重局部超平面預測模型對魚粉產地進行預測。
從表3中可以看出鯨魚算法改進后的自適應凈信號權重局部超平面算法對遼寧和浙江魚粉產地識別正確率為94.3%和100%,總正確率為97.3%。均比人工尋參的正確率高,說明鯨魚算法起到對自適應凈信號權重局部超平面算法的最優(yōu)參數尋找作用,提高了識別率。實驗結果證明WOA-ANWKH算法能夠準確對魚粉產地溯源。
圖2 基線校正后的光譜曲線Fig.2 Spectrum curves corrected by baseline
圖3 原始曲線與基線校正后的曲線的對比Fig.3 Comparison of the original curve withthe baseline-corrected curve
圖4 小波去噪前后光譜局部放大對比圖(a): 原始光譜曲線; (b): 小波去噪后光譜曲線
表3 魚粉產地識別結果Table 3 Identification results of fishmeal origin
采用能量色散X射線熒光光譜進行魚粉產地溯源,通過光譜反映不同產地魚粉所含礦物質元素差異,從而進行精準產地判別。采用airPLS和小波變換方法對光譜分別進行了基線校正和平滑去噪,并采用鯨魚算法自動確定自適應凈信號權重局部超平面算法的最優(yōu)參數,與人工主觀選擇參數相比,該方法具有快速和精確的優(yōu)點。實驗結果表明,本文提出的基于鯨魚算法改進的自適應凈信號權重局部超平面算法能夠準確區(qū)分遼寧產地與浙江產地的魚粉。本研究能為更廣泛的魚粉產地溯源提供參考。