亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SPA-LSSVM的混合農(nóng)藥殘留熒光檢測建模方法

        2022-11-15 06:53:26王曉燕季仁東卞海溢楊玉東蔣喆臻馮小濤徐江宇
        南京理工大學學報 2022年5期
        關(guān)鍵詞:特征方法模型

        王曉燕,季仁東,韓 月,卞海溢,楊玉東,蔣喆臻,馮小濤,徐江宇

        (淮陰工學院 江蘇省湖泊環(huán)境遙感技術(shù)工程實驗室,江蘇 淮安 223001)

        農(nóng)藥殘留是影響生態(tài)環(huán)境及食品安全的重要因素,目前針對農(nóng)藥殘留的檢測主要應(yīng)用氣相色譜法[1]、高效液相色譜方法[2]、色譜-質(zhì)譜聯(lián)用方法[3]、免疫分析方法[4]、酶抑制方法[5]、生物傳感器方法[6]以及光譜方法等[7,8]。熒光檢測屬于光譜方法中的一種,它具有檢測速度快、靈敏度高、操作簡便等優(yōu)點,常用于農(nóng)藥殘留的檢測及分析[9,10]。

        農(nóng)藥殘留的定量分析通常應(yīng)用偏最小二乘法[11](Partial least square,PLS)、支持向量機方法[12]以及神經(jīng)網(wǎng)絡(luò)[13]等方法,其中,偏最小二乘法是化學計量學中應(yīng)用最廣泛的校正方法之一,其綜合了主成分分析和典型相關(guān)分析的優(yōu)勢,在基于光譜對農(nóng)藥殘留的定量分析中具有較好的預測性能。支持向量機方法通過應(yīng)用結(jié)構(gòu)風險最小化原理提高模型的泛化能力,能夠較好地解決小樣本問題,它通過非線性變換將原始變量映射到高維特征空間,并在高維空間中進行線性處理,從而避免出現(xiàn)維數(shù)災(zāi)難問題[14,15]。

        目前,針對混合農(nóng)藥殘留的定量分析中,PLS方法仍是主流方法,文獻[16]基于表面增強拉曼光譜應(yīng)用PLS方法對臍橙表面的混合農(nóng)藥(亞胺硫磷和樂果)進行檢測分析,獲得了較好的含量預測結(jié)果。文獻[17]基于熒光光譜采用神經(jīng)網(wǎng)絡(luò)方法對速滅威和西維因兩種成分的混合農(nóng)藥進行定量分析,并分別比較了全光譜和遺傳算法獲取特征光譜兩種情況下的預測性能,結(jié)果顯示,遺傳算法優(yōu)選出特征波長后對應(yīng)的BP神經(jīng)網(wǎng)絡(luò)模型具有更高的預測精度。文獻[18]基于熒光光譜研究4種成分混合農(nóng)藥的含量預測,應(yīng)用支持向量機方法在全波長情況下對各成分進行了定量分析。在農(nóng)藥殘留的熒光檢測及分析建模中,支持向量機方法結(jié)合全光譜往往能夠取得較高的分析精度,但基于全波段的支持向量機模型也存在訓練時間長、運算復雜、冗余度高等不足。若首先針對熒光光譜進行特征選擇,優(yōu)選出較顯著的特征波長點,然后基于特征光譜建立支持向量機模型,則可大大加快訓練速度,獲得更加簡單實用的特征光譜模型。

        本文提出了一種基于連續(xù)投影算法(Successive projections algorithm,SPA)和最小二乘支持向量機(Least squares support vector machines,LSSVM)的分析方法,用于混合農(nóng)藥殘留的含量預測。應(yīng)用連續(xù)投影方法優(yōu)選出熒光特征波長,并基于最小二乘支持向量機方法建立多組分定量分析模型,以期獲得優(yōu)于傳統(tǒng)偏最小二乘方法的預測精度。

        1 SPA-LSSVM算法原理

        1.1 連續(xù)投影算法

        在光譜分析中應(yīng)用SPA方法選擇特征波長的原理為:首先將原始波長中的某一個波長點選中,然后分別計算出該波長在其它剩余未被選中波長上的投影,再將其中投影向量最大的波長點篩選到特征波長組合中,依次共篩選完成所需個數(shù)的特征波長后結(jié)束計算[19,20]。

        若將光譜屬性矩陣記為XM×J(M為樣本數(shù),J為波長個數(shù)),Xk(0)代表初始波長向量,需要篩選的特征波長個數(shù)設(shè)為N,則SPA的實現(xiàn)步驟為

        (1)在迭代開始前(n=1),任選一個光譜屬性矩陣X中的某一列向量xj,記作Xk(0);

        (2)將其它未被選中的波長變量集合記為set,set={j,1≤j≤J,j?{k(0),k(1),…,k(n-1)}};

        (3)按照如式(1)計算當前向量xk(n-1)對set集合中的剩余列向量xj投影

        j∈set

        (1)

        (4)獲取最大投影值Pxj所對應(yīng)的波長k(n),則k(n)=arg(max(‖pxj‖)),j∈set;

        (5)將最大投影值Pxj作為下次迭代時的初始值,即:xj=Pxj,j∈set;

        (6)令n=n+1,若n

        (7)直到n=N,循環(huán)結(jié)束,最終提取出的特征波長位置為{k(n),n=0,1,…,N-1}。

        對應(yīng)于每一個初始k(0)和N,在循環(huán)一次后計算出交叉驗證集對應(yīng)的均方根誤差,其中均方根誤差最小值所對應(yīng)的k(n)即為篩選出的特征變量組合。本文應(yīng)用SPA算法從原始熒光光譜中篩選出與樣本濃度關(guān)系最為顯著的少數(shù)幾個波長點作為特征光譜,基于特征光譜回歸建模能夠減少計算量,進一步提高模型的訓練速度。

        1.2 最小二乘支持向量機

        最小二乘支持向量機方法將傳統(tǒng)支持向量機(Support vector machine,SVM)的不等式約束轉(zhuǎn)變?yōu)榈仁郊s束,將SVM所對應(yīng)的二次規(guī)劃問題轉(zhuǎn)換成了線性方程組的求解[21,22],其簡化了計算且訓練速度明顯快于傳統(tǒng)支持向量機方法。

        LSSVM用于回歸時,其損失函數(shù)定義為誤差的二次項,對應(yīng)如下優(yōu)化問題

        s.t.:yk=wTφ(xk)+b+ekk=1,…,N

        (2)

        式中:誤差e類似于SVM問題中的松弛變量,參數(shù)γ與懲罰變量的意義相同,作為權(quán)重用于平衡尋找最優(yōu)超平面和偏差量最小這兩個因素。

        應(yīng)用拉格朗日方法求解上述優(yōu)化問題可得

        b+ek-yk}

        (3)

        式中:αk,k=1,…,N,為拉格朗日乘子。根據(jù)優(yōu)化條件,分別對w、b、ek、αk求導,即

        (4)

        可得:

        αk=γek

        wTφ(xk)+b+ek-yk=0k=1,…,N

        (5)

        將其轉(zhuǎn)化為如下線性方程組的求解

        (6)

        式中:核矩陣Ωkl=φ(xk)Tφ(xl)=K(xk,xl),k,l=1,…,N。

        求解上述方程組可得LSSVM的回歸函數(shù)為

        (7)

        1.3 SPA-LSSVM算法流程

        本文提出了將連續(xù)投影算法與最小二乘支持向量機方法相結(jié)合,用于對混合農(nóng)藥殘留的定量分析。實現(xiàn)流程如圖1所示。

        圖1 SPA-LSSVM算法流程

        對應(yīng)的算法步驟為:

        (1)獲取樣品光譜信息,將原始光譜屬性矩陣記為XM×J(M為樣本數(shù),J為波長個數(shù));

        (2)應(yīng)用連續(xù)投影算法,從XM×J對應(yīng)的全波長中優(yōu)選出特征波長點,記為Kn(1≤n≤N);

        (3)將Kn對應(yīng)的特征光譜屬性矩陣XM×N作為最小二乘支持向量機的模型輸入,樣品濃度作為模型輸出,訓練回歸模型;

        (4)訓練完成后即可獲得LSSVM回歸函數(shù),用于對未知樣品的含量預測。

        2 試驗與分析

        2.1 檢測過程

        分別配制濃度均為0.1 mg/mL的滅蠅胺、異丙甲草胺、克菌丹、噻蟲嗪標準溶液各100 mL,放置備用。從標準溶液中量取不同的4種農(nóng)藥進行混合并搖勻,共配制完成156個四組分混合農(nóng)藥測試樣本,應(yīng)用LS55熒光光度計檢測每個混合溶液的熒光光譜,設(shè)置儀器采樣間隔為0.5 nm,波長范圍為300~500 nm,激發(fā)波長為280 nm,狹縫寬度為6.0 nm。

        2.2 樣本數(shù)據(jù)集

        試驗樣本共156個,每個樣本的熒光光譜中共有401個波長,波長范圍為300~500 nm,波長間隔為0.5 nm。4組分混合農(nóng)藥樣本的熒光光譜如圖2(b)所示。圖2(a)為4種農(nóng)藥各自對應(yīng)的熒光光譜,其中,異丙甲草胺的熒光峰位于334 nm,滅蠅胺、克菌丹兩者的熒光峰均為340 nm,噻蟲嗪對應(yīng)的熒光峰在350 nm處,由此可見各組分之間有較嚴重的光譜重疊。

        圖2 農(nóng)藥熒光光譜

        將混合農(nóng)藥熒光光譜對應(yīng)的屬性矩陣記作X(156,401),則156代表樣本個數(shù),401代表300~500 nm光譜范圍內(nèi)的采樣點個數(shù)。樣本濃度矩陣可記作y(156,4),共4列,分別對應(yīng)4種農(nóng)藥的濃度。從試驗樣本中隨機抽取102組作為訓練集,剩余54組作為測試集。將數(shù)據(jù)集導入MATLAB平臺后,基于LSSVM方法建立四組分混合農(nóng)藥的回歸模型并測試驗證。

        2.3 SPA-LSSVM模型建立過程

        SPA-LSSVM模型的建立過程如圖3所示。獲得四組分混合農(nóng)藥的熒光光譜后,首先,對光譜進行平滑、歸一化預處理,分別以每種農(nóng)藥的濃度為因變量,混合農(nóng)藥樣本對應(yīng)的熒光強度為自變量,應(yīng)用SPA算法優(yōu)選出每種農(nóng)藥對應(yīng)的特征波長,共獲得4組不同的特征波長組合,每組特征波長表示其位置處的熒光強度對該種農(nóng)藥的濃度變化最為顯著,為了獲得較全面的熒光屬性且不漏掉較顯著的熒光波長,對四組特征波長取其合集作為該混合農(nóng)藥所對應(yīng)的特征波長點;然后,應(yīng)用LSSVM方法進行模型訓練,其中模型輸入為特征波長處的熒光強度,模型輸出對應(yīng)4種組分的濃度值;最后,對模型預測性能進行測試,并與傳統(tǒng)PLS方法分析對比。

        圖3 SPA-LSSVM模型建立過程

        2.4 模型性能評價

        模型評價主要通過決定系數(shù)(相關(guān)系數(shù)的平方,R2)、校正均方根誤差(Root mean square error for calibration,RMSEC)、預測均方根誤差(Root mean square error for prediction,RMSEP)等參數(shù)對本文的SPA-LSSVM方法及傳統(tǒng)PLS方法性能進行對比,決定系數(shù)、均方根誤差的計算式如下

        (8)

        3 結(jié)果與討論

        3.1 SPA優(yōu)選特征波長

        以混合農(nóng)藥對應(yīng)的401個波長處熒光強度為自變量,以每種農(nóng)藥的濃度為因變量,應(yīng)用SPA算法分別優(yōu)選出4種農(nóng)藥對應(yīng)的特征波長點,算法中的特征維數(shù)范圍設(shè)置為:1~20,其篩選出的特征波長結(jié)果如圖4所示。其中,滅蠅胺對應(yīng)11個特征波長點,說明這11個波長處的熒光強度對滅蠅胺濃度變化較為顯著。異丙甲草胺、克菌丹、噻蟲嗪對應(yīng)的特征波長個數(shù)分別為:11、8和14。由圖4可知,4種農(nóng)藥優(yōu)選出的特征波長個數(shù)雖然不一致,但其大部分重合或者非常接近,本文將4種結(jié)果求合集作為最終的SPA特征波長優(yōu)選結(jié)果,共獲得25個特征波長,其分布如圖5所示。

        圖4 4種農(nóng)藥對應(yīng)的SPA特征波長分布

        圖5 混合農(nóng)藥殘留SPA特征波長分布圖

        由圖5可知,合集中的25個特征波長點分布于300~500 nm的整個區(qū)間,在特征峰340 nm處比較集中。尤其在光譜趨勢發(fā)生顯著變化的位置,均對應(yīng)特征波長點。

        3.2 LSSVM模型結(jié)果

        以SPA算法所優(yōu)選出25個特征波長處的混合農(nóng)藥熒光強度作為輸入,應(yīng)用LSSVM方法訓練多回歸模型。模型參數(shù)設(shè)置如下:核函數(shù)選用徑向基核函數(shù)(Radial basis function,RBF),其表達式為K(xi,xj)=exp(-g‖xi-xj‖2),參數(shù)g的取值大小影響模型的分類精度;以網(wǎng)格搜索法優(yōu)化LSSVM參數(shù),即分別針對懲罰因子和核函數(shù)參數(shù)設(shè)定搜索范圍,在指定區(qū)間內(nèi)實現(xiàn)參數(shù)的尋優(yōu);另外,設(shè)置5折交叉驗證。模型訓練完成后分別對訓練集、測試集進行測試驗證,結(jié)果如圖6和圖7所示。

        由圖6可知,訓練集的模型測試結(jié)果較為理想,除了噻蟲嗪對應(yīng)的決定系數(shù)稍低,其他3種農(nóng)藥對應(yīng)的決定系數(shù)均大于0.9。圖7中的測試集驗證結(jié)果整體低于訓練集,異丙甲草胺中有個別樣本點對應(yīng)的測試誤差較大,其他3種農(nóng)藥對應(yīng)的模型決定系數(shù)均大于0.8。

        3.3 傳統(tǒng)PLS模型結(jié)果

        為驗證SPA-LSSVM方法的優(yōu)越性,應(yīng)用傳統(tǒng)PLS方法對該四組分混合農(nóng)藥進行回歸分析,針對訓練集、測試集分別進行測試驗證,結(jié)果如圖8和圖9所示。

        由圖8和圖9可知,PLS方法對應(yīng)的訓練集預測精度稍優(yōu)于測試集。以滅蠅胺農(nóng)藥為例,其訓練集對應(yīng)的均方根誤差(RMSEC)為0.003 6 mg/mL,優(yōu)于測試集的均方根誤差(RMSEP)0.005 5 mg/mL;訓練集對應(yīng)的決定系數(shù)為0.939 2,也優(yōu)于測試集對應(yīng)的0.912 8。其余3種農(nóng)藥,均表現(xiàn)出類似的性能測試結(jié)果。

        圖6 訓練集SPA-LSSVM回歸結(jié)果

        圖7 測試集SPA-LSSVM回歸結(jié)果

        圖8 訓練集PLS回歸結(jié)果

        圖9 測試集PLS回歸結(jié)果

        3.4 SPA-LSSVM與PLS、SVR方法的性能對比

        為了驗證SPA-LSSVM方法性能的優(yōu)越性,在同等試驗條件下,基于全波長對該混合農(nóng)藥進行了支持向量機方法的回歸分析,分別將SPA-LSSVM、SVR、PLS 3種模型結(jié)果列于表1中。

        由表1可知,針對訓練集,SPA-LSSVM對應(yīng)的4種農(nóng)藥校正均方根誤差RMSE均低于PLS方法,且其決定系數(shù)R2均高于PLS;將其與SVR模型結(jié)果進行對比,發(fā)現(xiàn)除了噻蟲嗪之外,其他3種農(nóng)藥的含量預測結(jié)果均顯示SPA-LSSVM方法的性能更優(yōu)。對測試集來說,前兩種農(nóng)藥(滅蠅胺、異丙甲草胺)對應(yīng)的SPA-LSSVM性能參數(shù)稍低于PLS方法,而后兩種農(nóng)藥(克菌丹、噻蟲嗪)則是SPA-LSSVM方法所對應(yīng)的預測精度更高,再將其與SVR模型結(jié)果進行對比,發(fā)現(xiàn)除了編號為2的農(nóng)藥(異丙甲草胺)對應(yīng)的預測結(jié)果相接近,其余3種農(nóng)藥均顯示SPA-LSSVM具有更優(yōu)的預測性能。

        為了更加顯著地對比SPA-LSSVM、SVR、PLS方法的預測性能,將各項模型參數(shù)曲線繪制于圖10中。

        顯然,綜合訓練集、測試集兩者的測試結(jié)果可知,SPA-LSSVM方法的預測性能更優(yōu)??梢奡PA方法能夠有效優(yōu)選出混合農(nóng)藥熒光光譜中的特征波長點,且這些波長處對應(yīng)的熒光強度與各成分的濃度之間具有較顯著的關(guān)系,故基于這些特征波長點訓練完成的LSSVM模型更具優(yōu)越性。另外,相比傳統(tǒng)PLS方法以及基于全波長的SVR方法,SPA-LSSVM不僅預測性能更優(yōu),且其因為只有25個特征波長作為輸入,使得對應(yīng)的模型形式更加簡單,且訓練速度大大加快。

        表1 SPA-LSSVM、SVR、PLS方法性能參數(shù)

        圖10 SPA-LSSVM、SVR、PLS方法性能參數(shù)對比

        4 結(jié)論

        本文提出一種基于SPA-LSSVM的多組分混合農(nóng)藥殘留熒光檢測分析方法。這種方法首先應(yīng)用SPA算法優(yōu)選出特征波長,有效消除了熒光光譜間的相關(guān)性,然后基于LSSVM方法訓練定量分析模型,并分別對訓練集、測試集進行模型測試,結(jié)果表明這種方法的預測性能優(yōu)于傳統(tǒng)PLS方法。這說明連續(xù)投影算法方法能夠有效篩選出混合農(nóng)藥的特征熒光光譜,且應(yīng)用最小二乘支持向量機模型對其中的多組分進行定量分析時,具有較高的預測精度。本文對SPA-LSSVM方法的有效性進行了分析驗證。

        猜你喜歡
        特征方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        抓住特征巧觀察
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        欧美黑人乱大交| 亚洲综合中文字幕日韩| а天堂中文地址在线| 国产乱码一二三区精品| 国产亚洲欧美日韩综合一区在线观看| 国产精品日韩中文字幕| 五月婷婷开心五月激情| 校园春色人妻激情高清中文字幕| 无遮挡呻吟娇喘视频免费播放| 久久久久无码精品亚洲日韩| 百合av一区二区三区| 一区二区三区在线日本| 国产亚洲成性色av人片在线观 | 亚洲av综合久久九九| 午夜a福利| 亚洲国语对白在线观看| 伊人久久大香线蕉av波多野结衣| 色偷偷久久一区二区三区| 国产精品久久婷婷婷婷| 毛茸茸的女性外淫小视频| 欲香欲色天天综合和网| 亚洲最大日夜无码中文字幕 | 国产一区二区白浆在线观看| 摸丰满大乳奶水www免费| 亚洲精品一区二区三区大桥未久| 亚洲国产成人资源在线桃色| 女同av一区二区三区| 国产精品无码一区二区在线观一| 精品性影院一区二区三区内射| 日产精品一区二区免费| 国产一区二区三区在线蜜桃 | 欧美极品少妇性运交| 蜜桃av多人一区二区三区| 国产在线观看视频一区二区三区 | 国产精品熟女视频一区二区三区 | 激性欧美激情在线| 国产乱人伦AV在线麻豆A| 午夜视频手机在线免费观看| 亚洲日韩在线中文字幕综合| 亚洲熟妇色xxxxx欧美老妇y| 国产精品一区二区av白丝在线 |