仝昂鑫,湯曉君,張 峰,王 斌
西安交通大學(xué)電氣工程學(xué)院電力設(shè)備電氣絕緣國家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710049
β-苯乙胺(PEA)是一種重要的有機(jī)合成中間體,PEA及其衍生物在染料、醫(yī)藥、乳化劑及香料等領(lǐng)域有著廣泛的應(yīng)用[1]。在PEA生產(chǎn)過程中,氫氧化鈉(NaOH)常作為一種反應(yīng)物,最終的生成物中常常含有氯化鈉(NaCl)、NaOH和PEA的混合物[2]。目前,PEA的主要檢測(cè)方法包括高效液相色譜法、氣相色譜、毛細(xì)管電泳、離子色譜-質(zhì)譜法、薄層色譜等[3]。但是,上述方法存在費(fèi)時(shí)、繁瑣等缺點(diǎn),且對(duì)實(shí)驗(yàn)人員操作水平、檢測(cè)環(huán)境以及色譜板的要求較高,不能適應(yīng)簡便、快速和現(xiàn)場(chǎng)等要求,亟需探索新的有效的PEA檢測(cè)方法和技術(shù)。相比之下,紫外光譜法具有實(shí)時(shí)檢測(cè)快、無化學(xué)試劑、成本低、無二次污染、可實(shí)現(xiàn)在線原位測(cè)量等優(yōu)點(diǎn)[3]。國內(nèi)外學(xué)者也很少對(duì)最終PEA生成物的物質(zhì)種類進(jìn)行鑒別,因此NaCl,NaOH,PEA以及混合物的種類進(jìn)行鑒別,對(duì)PEA的合成以及定性檢測(cè)具有重要的意義。
對(duì)于物質(zhì)種類的鑒別,國內(nèi)外學(xué)者將紅外光譜、熒光光譜、高光譜成像技術(shù)、太赫茲光譜、激光誘導(dǎo)擊穿光譜和拉曼光譜等新型的檢測(cè)方法,結(jié)合線性判別(LDA)、支持向量機(jī)(SVM)和神經(jīng)網(wǎng)絡(luò)(ANN)等有監(jiān)督的模式識(shí)別技術(shù),成功對(duì)人臉、語音信號(hào)、藏藥紅景天品種、熱帶森林樹種、玉米品種、花生油真?zhèn)蔚冗M(jìn)行了鑒別[4-8]。但是上述對(duì)物質(zhì)種類檢測(cè)的方法依然存在著測(cè)量周期長、速度慢、需要樣品預(yù)處理、二次污染等缺點(diǎn)[9]。在這一背景下,紫外可見光譜法結(jié)合LDA,SVM和ANN等有監(jiān)督的模式識(shí)別技術(shù)被成功用來鑒別茶葉種類[10]、葡萄酒品種[11]和辣椒原產(chǎn)地[12]。然而,各類的類別中心重疊時(shí),不能繼續(xù)使用LDA;SVM對(duì)解決多分類問題存在困難;ANN具有容易陷入局部最小值、收斂速度慢等缺點(diǎn)。
鑒于此在對(duì)比LDA,Sigmoid SVM,RBF-SVM,RBF-ANN和BP-ANN等有監(jiān)督模式識(shí)別技術(shù)的基礎(chǔ)上[6-9],提出了一種新的模式識(shí)別技術(shù),用人工蜂群算法(artificial bee colony,ABC)[13]優(yōu)化神經(jīng)網(wǎng)絡(luò)(BP-ANN)[8]的權(quán)值和閾值。從獲得的敏感性和特異性可知,紫外光譜法結(jié)合ABC-BP-ANN對(duì)NaCl,NaOH,PEA及其混合物進(jìn)行分類是一種簡便、快速、可靠的分類方法,研究結(jié)果為PEA的合成以及定性測(cè)量提供了新的理論依據(jù)。
實(shí)驗(yàn)所用的NaCl,NaOH和PEA三種試劑均購自上海阿拉丁試劑有限公司。首先,分別配制1 mol·L-1NaCl,2 mol·L-1NaOH和0.031 2 mol·L-1PEA標(biāo)準(zhǔn)液,用去離子水進(jìn)行稀釋,分別配制成30組不同濃度的單組分樣本,PEA的濃度范圍為0.000 016 7~0.008 91 mol·L-1,NaCl的濃度范圍為0.003 68~1 mol·L-1,NaOH的濃度范圍為0.000 762~2 mol·L-1。最后,配制7種不同摩爾分?jǐn)?shù)的混合物(混合物摩爾分?jǐn)?shù)是指PEA物質(zhì)的量占混合物總物質(zhì)的量的百分比),濃度范圍為0%mol·L-1~60%mol·L-1,每個(gè)濃度處配制30份溶液,獲得30組光譜數(shù)據(jù),共210組光譜數(shù)據(jù)。所有樣品的制備均在20 ℃進(jìn)行。
以去離子水作為參比樣品,對(duì)NaCl,NaOH,PEA和混合物樣本進(jìn)行紫外可見光譜測(cè)定。采用UV2900紫外可見分光光度計(jì),光譜測(cè)量范圍為190~400 nm,取樣間隔為1 nm,掃描速度為中速。每個(gè)樣品重復(fù)掃描5次,計(jì)算平均光譜。每次光譜測(cè)量時(shí)間約為1 min。為了能夠更加直觀地說明實(shí)驗(yàn)過程,圖1和圖2分別列出了樣品稀釋結(jié)構(gòu)圖和設(shè)備結(jié)構(gòu)圖。
圖1 樣品稀釋結(jié)構(gòu)圖Fig.1 Structure diagram of sample dilution
圖2 設(shè)備結(jié)構(gòu)圖Fig.2 Structure diagram of the equipment
將20組樣本作為訓(xùn)練集,另外10組樣本作為測(cè)試集。采用偏最小二乘法(PLS)減少分類模型構(gòu)建中需要用到的變量數(shù)量。應(yīng)用LDA,Sigmoid SVM,RBF-SVM,RBF-ANN,BP-ANN和ABC-BP-ANN進(jìn)行分類。所有程序均在Matlab 14.0上運(yùn)行,統(tǒng)計(jì)分析采用Statistica 8.0軟件包。
圖3所示為0.001 49 mol·L-1NaCl,NaOH和PEA的紫外吸收光譜。圖3中,在190~400 nm波長范圍內(nèi),PEA在210和258 nm處有特征吸收峰;NaOH的特征吸收峰在202 nm;NaCl在197 nm處有特征吸收峰。且PEA的吸收峰最強(qiáng),NaOH次之,NaCl的吸收峰最弱。由于不同的物質(zhì)具有不同的特征吸收峰,可以利用這些特征吸收峰作為物質(zhì)的“指紋”,對(duì)物質(zhì)種類進(jìn)行鑒別。因此,根據(jù)特征吸收峰的不同,可以直觀的將三種物質(zhì)區(qū)別出來。然而NaCl和NaOH的特征吸收峰很相似,不同濃度的NaCl和NaOH溶液的特征吸收峰會(huì)出現(xiàn)重疊現(xiàn)象,此時(shí),利用特征吸收峰對(duì)NaCl和NaOH進(jìn)行識(shí)別,會(huì)出現(xiàn)誤判。
圖3 0.001 49 mol·L-1 NaCl,NaOH和PEA的紫外吸收光譜Fig.3 UV absorption spectra of NaCl,NaOH and PEA at 0.001 49 mol·L-1
圖4所示為七種不同濃度混合物的紫外吸收光譜。從圖4中可以看出,當(dāng)PEA濃度較高時(shí),混合物在210和258 nm波長處有特征吸收峰,這兩個(gè)吸收峰與PEA的特征吸收峰相吻合。因此,當(dāng)混合物中PEA含量較高時(shí),可以通過混合物的特征吸收峰判斷出含有PEA。另外,吸收峰的強(qiáng)度隨著混合物中PEA濃度的降低而減小,當(dāng)混合物中PEA的濃度小于10%mol·L-1時(shí),混合物在258 nm波長處的特征吸收峰消失。因此,當(dāng)混合物中PEA濃度小于10%mol·L-1時(shí),無法判斷混合物中是否含有PEA。
圖4 七種不同濃度混合物的紫外吸收光譜Fig.4 UV absorption spectra of the mixtures at seven different concentrations
通過以上分析可發(fā)現(xiàn),當(dāng)被測(cè)物質(zhì)的吸收峰存在很相似的情況,且當(dāng)被測(cè)物質(zhì)的濃度降低時(shí),僅僅依靠物質(zhì)吸收峰對(duì)其進(jìn)行判別具有一定的局限性,需要借助模式識(shí)別技術(shù)進(jìn)行判別,以便有效地克服依靠吸收峰進(jìn)行判別的局限性。
圖5所示為用PLS提取的NaCl,NaOH和PEA在前三個(gè)主成分空間中得分向量值的分布。NaCl,NaOH和PEA前三個(gè)主成分累計(jì)貢獻(xiàn)率分別是96.64%,99.44%和99.95%。由此可知,NaCl,NaOH和PEA的前三個(gè)主成分基本包含了大部分的光譜信息。由圖5可以將NaCl,NaOH和PEA三種樣品明顯區(qū)分開。針對(duì)這些趨勢(shì),采用有監(jiān)督的模式識(shí)別方法,利用前三個(gè)主成分的得分向量作為輸入變量,找出一個(gè)合適的分類模型。
圖5 前三個(gè)主成分空間中得分向量值的分布Fig.5 Distribution of score vector values in the space of the first three PCs
敏感性和特異性兩個(gè)指標(biāo)可以通過混淆矩陣求得[14]。圖6為判別函數(shù)平面內(nèi)樣本的分布情況。從圖6中可以看出,PEA的第一個(gè)判別函數(shù)值為負(fù),NaCl和NaOH的第一個(gè)判別函數(shù)值均為正,據(jù)此可以判別出NaCl,NaOH和PEA的種類,但是NaCl和NaOH的判別函數(shù)有部分重疊,不能完全區(qū)分二者的種類。表1總結(jié)了將不同分類模型應(yīng)用于測(cè)試集得到的結(jié)果。如表1所示,LDA模型獲得的總的敏感性和特異性分別為95.6%和94.4%;Sigmoid-SVM并沒有改善LDA的結(jié)果,但RBF-SVM獲得的總的敏感性和特異性分別提高了0.3%和0.7%;建立輸入層、隱藏層和輸出層分別由3,12和3個(gè)神經(jīng)元組成的RBF-ANN模型,從總體結(jié)果來看,與RBF-SVM模型的結(jié)果非常相似;構(gòu)建輸入層、隱藏層和輸出層分別由3,8和3個(gè)神經(jīng)元組成的BP-ANN模型,隱含層和輸出層的傳遞函數(shù)分別為tansig和logsig,反向傳播的訓(xùn)練函數(shù)為traingdm,與RBF-ANN獲得的總體結(jié)果相比,BP-ANN獲得的敏感性和特異性分別提高了1.1%和1.5%。
圖6 NaCl,NaOH和PEA樣本在判別函數(shù)平面內(nèi)的分布Fig.6 Sample distribution of NaCl,NaOH and PEA in the plane of the discriminant functions
傳統(tǒng)的BP-ANN模型具有容易陷入局部最小值、收斂速度慢、對(duì)初始值敏感等缺點(diǎn)。鑒于此,將ABC與BP-ANN結(jié)合,利用ABC優(yōu)化BP-ANN的權(quán)值和閾值。ABC通過控制解的個(gè)數(shù)(Ns)、極限值(limit)和最大循環(huán)次數(shù)(MCN)這三個(gè)參數(shù)尋找最優(yōu)的閾值和權(quán)值。根據(jù)仿真結(jié)果進(jìn)行調(diào)試,選取Ns為150,limit為170,MCN為200。如表1所示,與BP-ANN獲得的總體結(jié)果相比,ABC-BP-ANN獲得的敏感性和特異性分別提高了2.7%和2.5%。
表1 有監(jiān)督分類方法得到的測(cè)試集NaCl,NaOH和PEA的敏感性和特異性/%Table 1 The sensitivity and specificity of NaCl,NaOH and PEA for test sets obtained by supervised classification methods/%
將RBF-SVM,BP-ANN和ABC-BP-ANN三種分類方法應(yīng)用于混合物的分類,圖7給出了三種分類方法對(duì)70組混合物測(cè)試樣本的分類結(jié)果。從圖中可以看到,誤判發(fā)生在10%mol·L-1,20%mol·L-1,40%mol·L-1和60%mol·L-1這四個(gè)濃度處。圖7(a)所示為用RBF-SVM方法得到的分類結(jié)果,可知有三個(gè)10%mol·L-1的樣本被誤分類為0%mol·L-1;有三個(gè)20%mol·L-1的樣本被誤分類為30%mol·L-1;有一個(gè)40%mol·L-1的樣本被誤分類為30%mol·L-1,另外一個(gè)40%mol·L-1的樣本被誤分類為50%mol·L-1;有兩個(gè)60%mol·L-1的樣本被誤分類為50%mol·L-1。圖7(b)所示為用BP-ANN方法得到的分類結(jié)果,可知有兩個(gè)10%mol·L-1的樣本被誤分類為0%mol·L-1;有兩個(gè)20%mol·L-1的樣本被誤分類為30%mol·L-1;有一個(gè)40%mol·L-1的樣本被誤分類為30%mol·L-1,另外一個(gè)40%mol·L-1的樣本被誤分類為50%mol·L-1;有一個(gè)60%mol·L-1的樣本被誤分類為50%mol·L-1。圖7(c)所示為用ABC-BP-ANN方法得到的分類結(jié)果,可知有一個(gè)10%mol·L-1的樣本被誤分類為0%mol·L-1;有一個(gè)20%mol·L-1的樣本被誤分類為30%mol·L-1;有一個(gè)40%mol·L-1的樣本被誤分類為30%mol·L-1;有一個(gè)60%mol·L-1的樣本被誤分類為50%mol·L-1。
圖7 三種有監(jiān)督分類方法得到的混合物分類結(jié)果(a):RBF-SVM;(b):BP ANN;(c):ABC BP ANN; 1:0%mol·L-1;2:10%mol·L-1;3:20%mol·L-1; 4:30%mol·L-1;5:40%mol·L-1,6:50%mol·L-1; 7:60%mol·L-1Fig.7 Classification results of the mixture obtained by three supervised classification method(a):RBF-SVM;(b):BP ANN;(c):ABC BP ANN; (a):RBF-SVM;(b):BP ANN;(c):ABC BP ANN; 1:0%mol·L-1;2:10%mol·L-1;3:20%mol·L-1; 4:30%mol·L-1;5:40%mol·L-1,6:50%mol·L-1; 7:60%mol·L-1
由以上結(jié)果可知,發(fā)生誤判的混合物樣本的濃度往往比較低,分析認(rèn)為低濃度混合物樣本的吸收峰比較弱甚至消失。對(duì)比表2中的敏感性和特異性可以得知,ABC-BP-ANN方法獲得的結(jié)果最好,BP-ANN次之,RBF-SVM結(jié)果最差?;旌衔锏玫降慕Y(jié)果與單組分的結(jié)果相一致。
表2 三種有監(jiān)督分類方法得到的測(cè)試集混合物的敏感性和特異性Table 2 The sensitivity and specificity of the mixture for test sets obtained by three supervised classification methods
根據(jù)NaCl,NaOH,PEA和混合物的紫外可見光譜,用190~400 nm范圍內(nèi)的吸光度值作為輸入變量,并應(yīng)用有監(jiān)督的模式識(shí)別方法,對(duì)其樣品種類進(jìn)行了鑒別。首先采用PLS提取NaCl,NaOH,PEA和混合物紫外光譜的主成分,將得到的主成分作為輸入變量,然后通過比較LDA,Sigmoid SVM,RBF-SVM,RBF-ANN,BP-ANN和ABC-BP-ANN幾種不同的有監(jiān)督的模式識(shí)別方法,可以得知運(yùn)用ABC-BP-ANN模式識(shí)別方法,有效提高了分類敏感性和特異性,證明了所提出的ABC-BP-ANN方法的有效性。相比于其他使用昂貴設(shè)備或涉及繁瑣樣品制備的檢測(cè)方法,紫外可見分光光度法具有易于獲得、操作簡單、成本低、易于維護(hù)和無二次污染等優(yōu)點(diǎn)。因此,將紫外光譜法結(jié)合ABC-BP-ANN模式識(shí)別方法對(duì)NaCl,NaOH,PEA和混合物進(jìn)行分類,研究結(jié)果對(duì)PEA的在線合成分析提供了一種新的理論依據(jù)和思路。