李艷芬,馬瑞峻,陳瑜,黃麗,顏振鋒,蔡祥
(華南農(nóng)業(yè)大學(xué)工程學(xué)院,廣州 510642)
目前,水稻中常用的農(nóng)藥有三唑磷、辛硫磷、阿維菌素、三氟苯嘧啶、四氯蟲酰胺、氯蟲苯甲酰胺、茚蟲威、呋蟲胺、烯啶蟲胺等,這些農(nóng)藥當(dāng)中有機(jī)磷農(nóng)藥三唑磷[1]、辛硫磷[2]和生物農(nóng)藥阿維菌素[3]對(duì)水生生物的毒性比較高,其他農(nóng)藥對(duì)水生生物的毒性都比較低。阿維菌素在防治水稻螟蟲、稻縱卷葉螟(目前對(duì)水稻危害最大的害蟲之一)方面表現(xiàn)優(yōu)異,因此具有較高的研究?jī)r(jià)值。
阿維菌素(Avermectin)是由日本和美國(guó)首先開發(fā)的由土壤微生物阿維鏈霉(Strentomyces avermitilis)發(fā)酵產(chǎn)生的一類具有殺蟲、殺螨、殺線蟲活性的十六元大環(huán)內(nèi)酯化合物[4],其化學(xué)式為C48H72O14(B1a)·C47H70O14(B1b),分子結(jié)構(gòu)如圖1 所示。市售阿維菌素活性物質(zhì)是avermectinB1a+B1b,其中B1a≥90%、B1b≤5%,以B1a的含量來標(biāo)定,阿維菌素是防治水稻害蟲理想的生物農(nóng)藥[5]。目前對(duì)于水體中阿維菌素農(nóng)藥的檢測(cè)最常用且最準(zhǔn)確的方式是液相色譜法[6],包括高效液相色譜紫外檢測(cè)法(HPLC-UV)、高效液相色譜熒光檢測(cè)法(HPLC-FLD)等,該方法具有檢測(cè)限低、重復(fù)性高的優(yōu)勢(shì),但其檢測(cè)樣品多集中在蔬菜、水果、脂肪、肉類等方面,且其檢測(cè)設(shè)備價(jià)格高且大型,需要專業(yè)維護(hù),預(yù)處理繁瑣耗時(shí),檢測(cè)時(shí)需嚴(yán)謹(jǐn)操作,依賴性強(qiáng),只能用于實(shí)驗(yàn)室檢測(cè),無法實(shí)現(xiàn)現(xiàn)場(chǎng)快速檢測(cè)[7]。因此,尋找一種現(xiàn)場(chǎng)快速、準(zhǔn)確、經(jīng)濟(jì)的方法用于檢測(cè)水體中阿維菌素具有重要的實(shí)際意義。
圖1 阿維菌素分子結(jié)構(gòu)Figure 1 Molecular structure of avermectin
光譜分析技術(shù)以其快速性、無損性、準(zhǔn)確性等檢測(cè)特點(diǎn)已經(jīng)被廣泛應(yīng)用于各個(gè)領(lǐng)域,是現(xiàn)代快速檢測(cè)的研究熱點(diǎn)[8]。但直接使用光譜技術(shù)檢測(cè)農(nóng)藥會(huì)存在光譜背景噪聲干擾明顯,檢測(cè)精度難以滿足定量要求等各種問題[9],因此需將光譜技術(shù)和化學(xué)計(jì)量學(xué)分析方法結(jié)合起來。目前,直接采用光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)分析方法快速定量檢測(cè)水體中生物農(nóng)藥的研究未有報(bào)道。故本文選擇阿維菌素為研究對(duì)象,使用光譜儀獲取其不同濃度樣本的紫外/可見光吸收光譜數(shù)據(jù),對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,樣本集劃分,剔除異常樣本,篩選特征波長(zhǎng)變量,建立偏最小二乘PLS 定量分析模型,實(shí)現(xiàn)對(duì)阿維菌素農(nóng)藥快速有效的定量檢測(cè)研究。
阿維菌素實(shí)驗(yàn)樣本的配制:用1/10 000 電子天平稱取90%阿維菌素0.066 7(±0.000 2)g,用少量甲醇超聲溶解,然后用甲醇準(zhǔn)確定容至600 mL,搖勻,得到濃度為100 mg·L-1的阿維菌素標(biāo)準(zhǔn)液。本次實(shí)驗(yàn)以純凈水為稀釋劑,配制濃度為0.05 mg·L-1、0.1~2.0 mg·L-1(濃度梯度為0.1 mg·L-1)和6.0 mg·L-1共22 個(gè)不同濃度阿維菌素實(shí)驗(yàn)樣本,再配制濃度為0.05 mg·L-1和0.1~6.0 mg·L-1(濃度梯度為0.1 mg·L-1)共61個(gè)不同濃度阿維菌素實(shí)驗(yàn)樣本,每個(gè)樣本溶液配制50 mL。
實(shí)驗(yàn)所用的光譜采集器為水體中有機(jī)磷無機(jī)磷含量檢測(cè)儀,由美國(guó)Ocean Optics 海洋光學(xué)公司的Maya2000Pro光譜儀,型號(hào)為DT-MINI-2-GS的氘-鹵鎢燈組合光源以及可調(diào)光程比色皿支架構(gòu)成。在PC機(jī)上安裝與光譜儀配套的BiaoQi SpecSuite 軟件,并設(shè)置積分時(shí)間為9 ms,平滑度為2,樣本光譜平均次數(shù)為20,取其平均光譜數(shù)據(jù)為最終光譜數(shù)據(jù)。
由朗伯-比爾定律A=Klc(A為吸光度,K為吸收系數(shù),l為光程,c為吸光物質(zhì)的濃度)[10]可知當(dāng)吸光物質(zhì)的濃度一定時(shí),光程與吸光度呈線性關(guān)系,選擇的比色皿光程越大,吸光度值越大??晒┻x擇的光程比色皿有10、30、50、100 mm 4 種,為了提高低濃度阿維菌素農(nóng)藥樣本的吸光度值,獲得較強(qiáng)的光譜信號(hào),又為防止高濃度阿維菌素農(nóng)藥樣本的吸光度值過高,出現(xiàn)光譜信號(hào)失真的情況,選擇一種最佳光程比色皿,得到最佳實(shí)驗(yàn)數(shù)據(jù)用于后續(xù)定量處理分析尤為重要,故本實(shí)驗(yàn)選擇了50 mm 和100 mm 光程比色皿獲取光譜數(shù)據(jù)進(jìn)行對(duì)比。使用50 mm 光程比色皿采集了濃度范圍為0.05 mg·L-1、0.1~2.0 mg·L-1(濃度梯度為0.1 mg·L-1)和6.0 mg·L-1共22個(gè)樣本的光譜數(shù)據(jù)以及使用100 mm 光程比色皿采集了濃度范圍為0.05 mg·L-1和0.1~6.0 mg·L-1(濃度梯度為0.1 mg·L-1)共61 個(gè)樣本的光譜數(shù)據(jù)。
本文采用Savitzky-Golay 卷積平滑法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,采用SPXY 算法劃分樣本集,采用主成分分析結(jié)合馬氏距離算法(PCA-MD)剔除異常樣本,采用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法(CARS)篩選特征波長(zhǎng)變量。
1.4.1 光譜數(shù)據(jù)預(yù)處理
Savitzky-Golay 卷積平滑法(S-G 平滑法)又稱多項(xiàng)式平滑法,通過多項(xiàng)式對(duì)移動(dòng)窗口內(nèi)的數(shù)據(jù)進(jìn)行多項(xiàng)式最小二乘擬合,其實(shí)質(zhì)是一種加權(quán)平均法[10]。當(dāng)平滑窗口寬度選取恰當(dāng)時(shí),檢測(cè)時(shí)儀器所引入的光譜數(shù)據(jù)噪聲可有效降低。
1.4.2 樣本集劃分
SPXY(Sample set partitioning based on joint x-y distance)算法是由Galvao 等[11]基于K-S(Kennardstone)算法提出的,能對(duì)低濃度樣本進(jìn)行合理的劃分。
1.4.3 剔除異常樣本
主成分分析(Principle component analysis,PCA)是一種線性特征提取方法,可將光譜數(shù)據(jù)降維。采用主成分分析法對(duì)光譜數(shù)據(jù)進(jìn)行處理,可得到光譜數(shù)據(jù)的主成分個(gè)數(shù)和得分?jǐn)?shù)據(jù)。主成分個(gè)數(shù)選取是否恰當(dāng),會(huì)影響其預(yù)測(cè)模型精度的高低。馬氏距離(Mahalanobis Distance,MD)表示數(shù)據(jù)的協(xié)方差距離,它是一種有效計(jì)算兩個(gè)樣本的相似度的方法。通過設(shè)置合適的距離閾值,可以剔除小于該閾值的樣本數(shù)據(jù)[12]。PCA-MD 剔除異常樣本即采用主成分分析方法獲得光譜數(shù)據(jù)的主成分得分,計(jì)算各樣本光譜數(shù)據(jù)得分到樣本光譜數(shù)據(jù)平均得分的馬氏距離,通過設(shè)置合理閾值剔除異常樣本,進(jìn)而得到有效樣本。
1.4.4 篩選特征波長(zhǎng)變量
競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣法(Competitive adaptive reweighted sampling,CARS)是基于達(dá)爾文“適者生存”的思想,提出的基于迭代統(tǒng)計(jì)信息的變量選擇算法[13]。利用蒙特卡羅采樣、指數(shù)衰減函數(shù)和自適應(yīng)重加權(quán)采樣得到最佳的建模波長(zhǎng)變量組合。
PLS 是常用的一種基于線性回歸的新型多元統(tǒng)計(jì)數(shù)據(jù)分析方法[14]。PLS 模型的評(píng)價(jià)系數(shù)包括決定系數(shù)(R2)、均方根誤差(RMSE)剩余預(yù)測(cè)殘差(RPD)和潛變量(LVs)。R2越接近1,RMSE(校正集RMSEC、預(yù)測(cè)集RMSEP)越小,模型精度越高。RPD 是預(yù)測(cè)集的標(biāo)準(zhǔn)偏差與預(yù)測(cè)均方根誤差的比值,反映了模型的分辨能力和穩(wěn)健性。RPD≥3 表示模型預(yù)測(cè)效果很好,可應(yīng)用于定量分析和實(shí)際檢測(cè);2.5<RPD<3 表示此模型可以進(jìn)行定量分析;RPD≤2.5表示此模型不適合進(jìn)行定量分析[15]。LVs 的選擇是否合理會(huì)直接影響到模型預(yù)測(cè)性能的好壞。
本文數(shù)據(jù)處理均基于MATLAB R2020b、Origin-Pro8.5和The Unscrambler X10.4軟件平臺(tái)進(jìn)行。
50 mm 和100 mm 光程比色皿采集得到的不同濃度阿維菌素溶液的原始吸收光譜如圖2、圖3所示,波長(zhǎng)范圍200~900 nm。由圖2、圖3可見,兩種光程比色皿采集的光譜數(shù)據(jù)均有一個(gè)明顯的特征吸收峰,其波段均在243.5~247.3 nm 之間,近似在245.4 nm 處為其特征吸收峰。
圖2 50 mm光程比色皿-阿維菌素原始吸收光譜圖Figure 2 50 mm optical path cuvettes-original absorption spectra of avermectin
圖3 100 mm光程比色皿-阿維菌素原始吸收光譜圖Figure 3 100 mm optical path cuvettes-original absorption spectra of avermectin
又由圖2、圖3 可知,阿維菌素溶液濃度為6 mg·L-1時(shí)50 mm 和100 mm 光程比色皿光譜曲線達(dá)到最高吸光度值,分別為1.01 和2.09??梢?00 mm 光程比色皿光譜曲線最高吸光度值比50 mm 光程比色皿光譜曲線最高吸光度值高一倍左右,其吸收光譜信號(hào)較強(qiáng)且未出現(xiàn)光譜信號(hào)失真的情況,有利于低濃度檢測(cè),故本文后續(xù)數(shù)據(jù)處理使用的光譜數(shù)據(jù)為通過100 mm 光程比色皿采集得到的61 個(gè)樣本光譜數(shù)據(jù)。此外,由于阿維菌素農(nóng)藥在波長(zhǎng)為500 nm 之后吸光度無限接近零,基本沒有吸收,包含的光譜數(shù)據(jù)信息有限,研究?jī)r(jià)值較小,故本文后續(xù)數(shù)據(jù)處理波長(zhǎng)范圍選擇200~500 nm,共計(jì)650個(gè)波長(zhǎng)點(diǎn)。
采用平滑窗口寬度為3 的S-G 平滑法對(duì)200~500 nm 波長(zhǎng)范圍的阿維菌素原始光譜數(shù)據(jù)進(jìn)行平滑去噪預(yù)處理,預(yù)處理后的光譜圖如圖4所示。由圖3、圖4 可知,經(jīng)過S-G 平滑法預(yù)處理后的光譜曲線變平滑,說明S-G 平滑法提高了光譜的平滑性,降低了噪聲的干擾,優(yōu)化了光譜信號(hào)。
圖4 S-G平滑法-阿維菌素吸收光譜圖Figure 4 S-G smoothing method-absorption spectra of avermectin
2.3.1 SPXY算法劃分樣本集后建立PLS預(yù)測(cè)模型
將原始光譜數(shù)據(jù)和S-G 平滑法預(yù)處理后的光譜數(shù)據(jù)采用SPXY 算法校正集和預(yù)測(cè)集分別按2∶1比例和3∶1 比例(SPXY 算法樣本集劃分最常用的兩種比例)進(jìn)行樣本集劃分,分別建立PLS定量分析模型,結(jié)果見表1。
表1 PLS模型預(yù)測(cè)結(jié)果Table 1 PLS model prediction results
由表1可知,無論是原始數(shù)據(jù)還是原始數(shù)據(jù)經(jīng)SG 平滑法預(yù)處理后采用SPXY 算法進(jìn)行樣本集劃分后,所建立的PLS 模型均有較高的精度,滿足定量分析的要求,說明利用光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)分析方法可以快速檢測(cè)水體中生物農(nóng)藥阿維菌素的濃度。
原始數(shù)據(jù)以及原始數(shù)據(jù)經(jīng)S-G平滑法預(yù)處理后,采用SPXY 算法校正集和預(yù)測(cè)集按3∶1比例劃分后建立的模型均比按2∶1 比例建立的模型精度更高,穩(wěn)健性更好,尤其是RPD 值,分別從20.031 2、19.983 3 提升為28.425 5、28.499 7。
數(shù)據(jù)S-G平滑預(yù)處理對(duì)所建立的模型精度影響較小,S-G-SPXY(2∶1)-PLS 模型比Original data-SPXY(2∶1)-PLS 模型效果略差的原因可能是由誤差導(dǎo)致的;而效果最好的是S-G-SPXY(3∶1)-PLS 模型,其R2p為0.998 7,RMSEP為0.070 4,RPD為28.499 7。
2.3.2 PCA-MD 剔除異常樣本和CARS 篩選特征波長(zhǎng)后建立PLS預(yù)測(cè)模型
為了進(jìn)一步優(yōu)化模型,采用PCA-MD算法、CARS算法和PCA-MD 算法結(jié)合CARS 算法分別對(duì)2.3.1 優(yōu)選出的原始數(shù)據(jù)經(jīng)S-G平滑法預(yù)處理后采用SPXY算法校正集和預(yù)測(cè)集按3∶1比例劃分后的光譜數(shù)據(jù)進(jìn)行剔除異常樣本處理、篩選特征波長(zhǎng)變量處理以及剔除異常樣本后再篩選特征波長(zhǎng)變量處理,分別建立PLS模型,結(jié)果見表2。
表2 PLS模型預(yù)測(cè)結(jié)果Table 2 PLS model prediction results
由表1、表2可知,采用PCA-MD 算法剔除異常樣本后建立的S-G-SPXY(3∶1)-(PCA-MD)-PLS 模型比S-G-SPXY(3∶1)-PLS 模型的RMSEP 值小,從0.070 4 降至0.065 1,但R2p 和RPD 值也略有減小,故模型預(yù)測(cè)效果變化不大。
采用CARS 算法篩選特征波長(zhǎng)變量后建立的SG-SPXY(3∶1)-CARS-PLS 模型與S-G-SPXY(3∶1)-PLS 模型相比波長(zhǎng)變量數(shù)明顯減小,從650 個(gè)減少至20 個(gè),減少了96.92%,簡(jiǎn)化了模型,但其模型預(yù)測(cè)效果變化也不大。
采用PCA-MD算法剔除異常樣本后再采用CARS算法篩選特征波長(zhǎng)變量后建立的S-G-SPXY(3∶1)-(PCA-MD)-CARS-PLS 模型篩選出的特征波長(zhǎng)變量數(shù)為28個(gè),與S-G-SPXY(3∶1)-PLS 模型相比減少了95.69%,其R2p 值為0.998 8,RMSEP 值為0.061 1,RPD 值為29.589 4,模型精度更高,穩(wěn)健性更好,簡(jiǎn)化模型的同時(shí)也有效提高了模型的預(yù)測(cè)效果。
阿維菌素紫外/可見吸收光譜S-G-SPXY(3∶1)-(PCA-MD)-CARS-PLS模型具體公式表達(dá)如下:
式中:Y表示阿維菌素農(nóng)藥濃度;Xn表示阿維菌素農(nóng)藥在特征波長(zhǎng)點(diǎn)n處的吸光度值。
阿維菌素不同濃度下S-G-SPXY(3∶1)-(PCAMD)-CARS-PLS模型預(yù)測(cè)結(jié)果如圖5所示。由圖5可知,阿維菌素濃度樣本校正集的真實(shí)濃度與預(yù)測(cè)濃度的線性擬合圖與預(yù)測(cè)集的真實(shí)濃度與預(yù)測(cè)濃度的線性擬合圖幾乎重合,模型預(yù)測(cè)效果較好,可見利用紫外/可見吸收光譜測(cè)量技術(shù)結(jié)合化學(xué)計(jì)量學(xué)分析方法快速檢測(cè)水體中生物農(nóng)藥阿維菌素濃度是可行的。
圖5 S-G-SPXY(3∶1)-(PCA-MD)-CARS-PLS模型預(yù)測(cè)結(jié)果Figure 5 S-G-SPXY(3∶1)-(PCA-MD)-CARS-PLS model prediction result graph
對(duì)于實(shí)際復(fù)雜自然環(huán)境水體,例如農(nóng)田水中生物農(nóng)藥阿維菌素含量的快速檢測(cè)還有待繼續(xù)深入研究。采用光譜儀獲得復(fù)雜自然環(huán)境水體中阿維菌素不同濃度下的復(fù)雜光譜數(shù)據(jù),建立濃度預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)復(fù)雜自然環(huán)境水體中阿維菌素的快速定性定量分析??刹捎没瘜W(xué)計(jì)量學(xué)二階校正分析方法如平行因子法(PARAFAC)[16]、交替三線性分解法(ATLD)[17]、自加權(quán)交替三線性分解法(SWATLD)、交替懲罰三線性分解法(APTLD)和多維偏最小二乘法(N-PLS)等對(duì)獲得的復(fù)雜光譜數(shù)據(jù)進(jìn)行分解分析,建立基于二階校正方法的多元回歸濃度預(yù)測(cè)模型。但是對(duì)二階校正方法(上述各種算法)的理解掌握和運(yùn)行是一個(gè)難點(diǎn),以及使用二階校正方法處理的數(shù)據(jù)必須是二階張量數(shù)據(jù),即所謂的三維數(shù)據(jù)矩陣(包含的樣本信息更全面,能夠提取的有用信息也相對(duì)變多)。而本文采用光譜儀獲得的數(shù)據(jù)是二維吸光度光譜數(shù)據(jù)矩陣,因此,如何把獲得的二維數(shù)據(jù)構(gòu)建成適用于二階校正方法的三維數(shù)據(jù)矩陣進(jìn)行二階校正分析也是一個(gè)難點(diǎn)。后續(xù)深入研究需注意攻克以上難點(diǎn),實(shí)現(xiàn)對(duì)實(shí)際自然環(huán)境受污染水域的大面積快速篩查監(jiān)測(cè)。
(1)采用100 mm 光程比色皿采集阿維菌素溶液樣本從低濃度0.05 mg·L-1到高濃度6.0 mg·L-1所得的光譜吸光度值更好,243.5~247.3 nm 為其特征吸收峰波段,245.4 nm處近似為其特征吸收峰。
(2)利用紫外/可見吸收光譜測(cè)量技術(shù)獲得的不同濃度下的阿維菌素的原始光譜數(shù)據(jù)建立的PLS預(yù)測(cè)模型具有較高的精度,完全滿足定量分析的要求,說明采用紫外/可見吸收光譜法結(jié)合化學(xué)計(jì)量學(xué)分析方法快速檢測(cè)純凈水中生物農(nóng)藥阿維菌素濃度是可行的。原始數(shù)據(jù)經(jīng)S-G 平滑、SPXY 算法以3∶1 比例劃分校正集和預(yù)測(cè)集、PCA-MD 算法剔除異常樣本,CARS 算法篩選特征波長(zhǎng)后所建立的PLS 模型更優(yōu)。
農(nóng)業(yè)環(huán)境科學(xué)學(xué)報(bào)2023年9期