王憲雙,郭 帥,徐向君,李昂澤,何雅格,郭 偉,劉瑞斌*,張緯經(jīng),張同來(lái)
(1.北京理工大學(xué) 物理學(xué)院,北京 100081;2.北京理工大學(xué) 爆炸科學(xué)與技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100081)
四唑是能夠穩(wěn)定存在的一種重要的五元芳雜環(huán),具有多氮富電子的平面結(jié)構(gòu)特征,是高氮含能材料領(lǐng)域的天之驕子。四唑類化合物因其高密度、高生成焓、高氣體生成量、分解產(chǎn)物多為環(huán)境友好型氣體N2等優(yōu)越的性質(zhì),在藥物合成、炸藥、推進(jìn)劑等方面具有廣泛的用途[1]。四唑類非金屬含能離子化合物是近年來(lái)逐漸發(fā)展起來(lái)的一類新型不敏感含能材料,包括氨基四唑、偶氮四唑等。關(guān)于四唑類化合物的合成及應(yīng)用[2-4]的研究工作比較活躍,但鮮有與其光譜表征和分類識(shí)別相關(guān)的研究。
光譜技術(shù)由于其檢測(cè)速度快、非接觸等優(yōu)勢(shì)在含能材料檢測(cè)方面起著不可代替的作用。太赫茲(THz)光譜由于具有穿透性高和安全性高等優(yōu)越的光電性質(zhì),常被用于探測(cè)隱藏炸藥。THz波可以穿透塑料、紡織物等,可對(duì)含能材料進(jìn)行分類和識(shí)別[5-6]。激光誘導(dǎo)擊穿光譜(Laser-induced Breakdown Spectrum,LIBS)是一種原子發(fā)射光譜,憑借其檢測(cè)速度快,基本無(wú)需樣品處理,對(duì)樣品損傷小等優(yōu)點(diǎn),已經(jīng)逐步走向工業(yè)現(xiàn)場(chǎng)[7-14]。美國(guó)陸軍實(shí)驗(yàn)室(ARL)利用LIBS技術(shù),結(jié)合偏最小二乘法判別分析(PLS-DA)對(duì)爆炸物和非爆炸物加以區(qū)分[15]。拉曼光譜作為一種分子振動(dòng)光譜,廣泛應(yīng)用于含能材料的無(wú)損鑒別。Jin等人利用自制的遠(yuǎn)程拉曼系統(tǒng)成功鑒別出三硝基甲苯(TNT)、黑索金(RDX)等炸藥[16]。離子遷移譜(IMS) 被認(rèn)為是爆炸物痕量檢測(cè)的最佳技術(shù)之一,廣泛應(yīng)用于機(jī)場(chǎng)的爆炸物檢測(cè)[17-18]。由于每項(xiàng)技術(shù)都有一定的局限性,近年來(lái),幾種探測(cè)技術(shù)聯(lián)合使用的應(yīng)用越來(lái)越多。韓國(guó)中南大學(xué)將離子遷移譜和質(zhì)譜 (IMS-MS) 聯(lián)用,用于奧克托金(HMX)、RDX的檢測(cè)[19]。將LIBS和Raman這兩種高度互補(bǔ)的光譜技術(shù)聯(lián)用,就能從原子和分子結(jié)構(gòu)層次實(shí)現(xiàn)對(duì)復(fù)雜物質(zhì)的快速無(wú)損的識(shí)別和分類。已見(jiàn)報(bào)道的用于炸藥探測(cè)的只有西班牙Malaga大學(xué)開(kāi)發(fā)的遠(yuǎn)程LIBS-Raman聯(lián)合探測(cè)系統(tǒng)[20]。
上述研究表明,光譜技術(shù)對(duì)于含能材料的痕量探測(cè)、識(shí)別和分類具有一定的可行性。但是識(shí)別和分類集中于對(duì)爆炸物和非爆炸物的研究。采用四唑類化合物的光譜表征對(duì)結(jié)構(gòu)相似的含能材料進(jìn)行分類與識(shí)別鮮有涉及。本文搭建了激發(fā)光為1 064 nm的LIBS-Raman集成測(cè)試系統(tǒng),通過(guò)采集和分析4種四唑類化合物的Raman光譜和LIBS光譜,為結(jié)構(gòu)相似的四唑類化合物以及其他含能材料的識(shí)別和分類提供了一種快速而準(zhǔn)確的方法。
圖1 LIBS-Raman集成測(cè)試系統(tǒng) Fig.1 Schematic diagram of integrated LIBS-Ramansystem
LIBS-Raman集成測(cè)試系統(tǒng)如圖1所示,樣品放置在三維電動(dòng)樣品臺(tái)上。Raman測(cè)試采用1 064 nm單縱模連續(xù)激光器,最大輸出功率為500 mW。激光通過(guò)反射棱鏡打到樣品表面,散射光通過(guò)兩個(gè)銀鏡和一個(gè)焦距為150 mm的透鏡耦合進(jìn)光柵光譜儀(iHR 550,光柵刻痕為1 200線/mm),1 064 nm陷波濾光片位于兩個(gè)反射鏡之間,濾掉激發(fā)光。LIBS測(cè)試光源為主動(dòng)調(diào)Q的Nd∶YAG(Quantel Ultra,F(xiàn)rench)固體激光器,波長(zhǎng)為1 064 nm,脈寬為7 ns,重復(fù)頻率1~20 Hz可調(diào),最大輸出能量為100 mJ,輸出能量波動(dòng)小于3%。光譜儀為三通道光纖光譜儀(Avantes,Netherlands),CCD 分辨率為2 048 pixel×2 048 pixel,探測(cè)波長(zhǎng)為180~720 nm,光學(xué)分辨率為0.1 nm。激光經(jīng)過(guò)反射棱鏡打到樣品表面,用焦距分別為35 mm和75 mm透鏡組收集的等離子體的輻射并耦合至光纖光譜儀。采用光譜儀觸發(fā)激光器模式,激光能量為30 mJ,延遲時(shí)間為193.5 μs,積分時(shí)間為1.05 ms。每個(gè)樣品采集250個(gè)光譜作為待處理數(shù)據(jù)。
本實(shí)驗(yàn)選取了4種單環(huán)粉末狀的四唑類化合物:四氮唑、5-氨基四氮唑、1,5-二氨基四氮唑和1-甲基-5-氨基四氮唑,分別記為1號(hào)、2號(hào)、3號(hào)、4號(hào)樣品,其主要信息如表1所示。為了減小LIBS光譜的不穩(wěn)定性,首先將4種樣品分別用粉碎機(jī)粉碎15 s,使樣品顆粒直徑均在200 μm左右。然后用壓餅機(jī)在15 MPa恒壓下制成厚度約為2 mm,直徑為10 mm的表面平整的圓餅備用。
表1 四唑類化合物的主要信息Tab.1 Main information of tetrazole compounds
分別選擇532、785、1 064 nm為激發(fā)波長(zhǎng),對(duì)餅狀四唑類化合物進(jìn)行Raman光譜測(cè)試,結(jié)果如圖2(a)所示。實(shí)驗(yàn)表明,采用波長(zhǎng)為532 nm的連續(xù)激光激發(fā)時(shí),樣品的波峰信息被熒光背景掩蓋,測(cè)試結(jié)果較差。采用785 nm和1 064 nm激發(fā)時(shí),Raman峰較豐富且強(qiáng)度較強(qiáng)。尤其是當(dāng)激發(fā)波長(zhǎng)為1 064 nm時(shí),幾乎沒(méi)有熒光背景,不需要光譜預(yù)處理。為了得到更好的測(cè)試結(jié)果,本實(shí)驗(yàn)中選擇1 064 nm為激發(fā)波長(zhǎng)。在激光器功率450 mW,曝光時(shí)間為5 s,光譜掃描范圍為200~1 800 cm-1的測(cè)試條件下,對(duì)每個(gè)樣品進(jìn)行10次測(cè)量,取平均值,并將歸一化處理結(jié)果作為其拉曼光譜,測(cè)試結(jié)果如圖2(b)所示。1 000~1 300 cm-1波段的峰位來(lái)源于四唑環(huán)的振動(dòng),其中1 050 cm-1左右的峰位源自環(huán)上N-H鍵的搖擺振動(dòng),1 057 cm-1和1 099 cm-1附近的峰位源自環(huán)的伸縮振動(dòng),1 293 cm-1附近的峰位源自環(huán)的呼吸振動(dòng)[21-22]。4個(gè)樣品均在這個(gè)波段有明顯的拉曼峰,此波段可以用于識(shí)別四唑類化合物和其它無(wú)四唑環(huán)的化合物。3號(hào)和4號(hào)樣品該波段拉曼峰強(qiáng)度相對(duì)較弱,原因在于隨著環(huán)上連接的官能團(tuán)的增加,四唑環(huán)自身的振動(dòng)受到一定的抑制。由此可以將環(huán)上3號(hào)和4號(hào)樣品與1號(hào)和2號(hào)樣品區(qū)分開(kāi)來(lái)。783 cm-1附近的拉曼峰為環(huán)上碳垂直于四唑環(huán)平面的振動(dòng),僅在2號(hào)、3號(hào)和4號(hào)樣品觀測(cè)到該峰位,說(shuō)明當(dāng)環(huán)上的C原子連接官能團(tuán)之后,加劇了其垂直于四唑環(huán)平面的振動(dòng),由此可以識(shí)別1號(hào)樣品。4號(hào)樣品較3號(hào)樣品分子結(jié)構(gòu)復(fù)雜,因此測(cè)到的拉曼峰較豐富,由此可以把3號(hào)和4號(hào)樣品區(qū)分開(kāi)來(lái)。因此,基于Raman光譜,不僅可以區(qū)分四唑類化合物和其他化合物,還可以將結(jié)構(gòu)稍有差異的不同種類的四唑類化合物快速識(shí)別出來(lái)。
圖2 四唑類化合物的Raman光譜圖 Fig.2 Raman spectra of tetrazole compounds
在采集LIBS過(guò)程中由于激光能量波動(dòng)以及樣品表面起伏等原因,會(huì)引入不可避免的光譜誤差,以及大量的干擾信息,利用數(shù)據(jù)預(yù)處理方法可以減少基體效應(yīng)、自吸收效應(yīng)、激光器能量波動(dòng)或儀器與測(cè)量誤差對(duì)光譜的影響,是光譜定量分析的重要預(yù)處理環(huán)節(jié)。本實(shí)驗(yàn)首先采用窗口平移平滑去背景方法來(lái)消除光譜中不必要的背景輻射[23]。由于基體效應(yīng)和儀器誤差的存在,同一樣品在不同測(cè)試點(diǎn)得到的光譜會(huì)出現(xiàn)一個(gè)像素點(diǎn)的峰位漂移現(xiàn)象,對(duì)應(yīng)波長(zhǎng)漂移量為光譜分辨率,即0.1 nm。為處理方便,先將背景消除的光譜數(shù)據(jù)進(jìn)行尋峰處理,找出每組光譜中的特征峰的峰值強(qiáng)度和對(duì)應(yīng)波長(zhǎng),并記錄,然后用峰位漂移函數(shù)對(duì)漂移峰修正[24]。然后采用統(tǒng)計(jì)學(xué)上的“跳躍度”判別法[25]進(jìn)行數(shù)據(jù)篩選。取出每個(gè)樣品250次測(cè)量中H(656.3 nm)元素譜線強(qiáng)度,以0.96作為判別異常數(shù)據(jù)的臨界值。經(jīng)過(guò)篩選后每個(gè)樣品約剩余210個(gè)光譜。最后從每個(gè)樣品中隨機(jī)抽取200個(gè)光譜數(shù)據(jù),每4個(gè)數(shù)據(jù)求平均,作為一組光譜,進(jìn)一步提升光譜的穩(wěn)定性。最終每個(gè)樣品可獲得50組相對(duì)穩(wěn)定的光譜數(shù)據(jù),做強(qiáng)度歸一化處理后,每組光譜數(shù)據(jù)除以該組最大值作為相對(duì)強(qiáng)度。
依據(jù)美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)的原子光譜數(shù)據(jù)庫(kù)(Atomic Spectra Database,ASD)指認(rèn)譜線位置對(duì)應(yīng)元素。通過(guò)測(cè)量譜線波長(zhǎng)與數(shù)據(jù)庫(kù)波長(zhǎng)比對(duì)的方法最終確定分析譜線的元素歸屬,如圖3(a)所示。其中C(247.9 nm,588.9 nm),N(279.9 nm),Ca(393.3 nm,396.8 nm,422.7 nm),H(655.8 nm);另外,分子峰CN(388.3 nm,421.6 nm)和C2(516.06 nm)被觀測(cè)到[26]。4種樣品的LIBS光譜如圖3(b)所示,4種樣品的元素組成相同,因此其峰位基本一致但是由于元素含量不同,特征譜線相對(duì)強(qiáng)度存在明顯差異。最終選取了上述10條譜線的峰值作為分類依據(jù)。
圖3 四唑類化合物的LIBS光譜圖 Fig.3 LIBS spectra of tetrazole compounds
圖4 前3個(gè)主成分對(duì)原始數(shù)據(jù)的解釋率及累計(jì)解釋率 Fig.4 Individual interpretation rate(left, bar graph) and cumulative interpretation rates(right, line) of the first three principal components to the original data
本實(shí)驗(yàn)中,一組光譜由6 144個(gè)數(shù)據(jù)點(diǎn)組成,如此龐大的變量數(shù)會(huì)大大增加問(wèn)題的復(fù)雜性。即便是選取了特定譜線的強(qiáng)度作為變量,在一般情況下,各個(gè)變量之間仍然有一定的相關(guān)性,它們所提供的信息也會(huì)有一定程度的重疊。本文取出特征變量進(jìn)行主成分分析[27],基本計(jì)算步驟如下:(1)、提取10條特征譜線的峰值作為特征變量,構(gòu)造出一個(gè)200×10的原始光譜數(shù)據(jù)矩陣X;(2)、對(duì)矩陣X做標(biāo)準(zhǔn)化處理,縮放后的值位于(0,1)之間;(3)、求解X的協(xié)方差矩陣,獲得特征值和特征向量;(4)、將特征值和特征向量按照由大到小的順序排列,前3個(gè)主成分的方差貢獻(xiàn)率分別為80.6%、12.7%和4.9%,累計(jì)解釋率大于95%,如圖4所示。因此選用前3個(gè)主成分進(jìn)行研究;(5)計(jì)算出每組光譜的主成分得分,在前3個(gè)主成分構(gòu)成的三維特征空間內(nèi),每種樣品都集中在特定區(qū)域,并且與其他類別的樣品有明顯的間隔,如圖5所示。圖5顯示出較好的聚類效果。
圖5 前3個(gè)主成分的三維得分圖 Fig.5 Scoreplot of the tetrazole compounds samples′ LIBS spectra with respect to the first three principal components
支持向量機(jī)(SVM)是監(jiān)督學(xué)習(xí)中最有影響力的方法之一,在解決小樣本、非線性及高維模式識(shí)別中具有很強(qiáng)的分類學(xué)習(xí)能力[28],非常適合本文中判別模型的建立。在每個(gè)樣品的50組光譜數(shù)據(jù)中,隨機(jī)選取35組作為訓(xùn)練集,剩余的15組作為測(cè)試集。模型建立及預(yù)測(cè)步驟如下:(1)以PCA降維后獲得的訓(xùn)練集光譜數(shù)據(jù)的主成分得分作為SVM模型的輸入變量,以樣品的類別標(biāo)簽值為輸出變量;(2)選取應(yīng)用最廣泛,且其對(duì)非線性問(wèn)題有較好處理能力的徑向基函數(shù)(Radial Basis Function,RBF)作為核函數(shù);(3)通過(guò)網(wǎng)格搜索法優(yōu)化懲罰因子c和核參數(shù)g,從而確定最優(yōu)的分類超平面,c和g分別為1.3和5.2,建立分類模型;(4)將測(cè)試集光譜數(shù)據(jù)輸入模型驗(yàn)證,最終模型分類準(zhǔn)確率為100%,如表2所示。此外,本文還將全譜6 144個(gè)變量直接進(jìn)行主成分分析,然后提取前64個(gè)主成分,其累計(jì)解釋率為98.3%,基于SVM算法進(jìn)行分類研究,結(jié)果顯示這種方法不僅計(jì)算量大,而且最終平均分類準(zhǔn)確率僅為88.3%,如表3所示。通過(guò)兩種方法的對(duì)比發(fā)現(xiàn),對(duì)于本文中4種四唑類化合物的分類模型的建立和預(yù)測(cè),選取差異較為明顯的特征譜線為變量,并結(jié)合PCA-SVM算法可以得到較好的分類結(jié)果。
表2 基于特征變量降維的四唑類化合物分類結(jié)果Tab.2 Classification results of tetrazole compounds based on dimension reduction of characteristic variables
表3 基于全譜降維的四唑類化合物分類結(jié)果Tab.3 Classification results of tetrazole compounds based on dimension reduction of full spectrum
通過(guò)光譜采集和合理的數(shù)據(jù)處理分析了4種四唑類化合物在波長(zhǎng)為1 064 nm的激光作用下的Raman光譜和LIBS光譜,實(shí)現(xiàn)了四唑類化合物的快速識(shí)別和分類。通過(guò)Raman測(cè)試,得到了四唑類化合物的特征振動(dòng)(四唑環(huán)的振動(dòng)),并根據(jù)振動(dòng)峰位的差異將各個(gè)樣品識(shí)別出來(lái)。通過(guò)對(duì)LIBS光譜數(shù)據(jù)進(jìn)行窗口平移平滑去背景、峰位漂移修正、跳躍度判別法篩選、取均值重組、歸一化等有效的數(shù)據(jù)預(yù)處理手段,采用PCA與SVM相結(jié)合的分類算法,得到了準(zhǔn)確度為100%的分類模型。實(shí)驗(yàn)結(jié)果表明,利用LIBS-Raman集成系統(tǒng)對(duì)含能材料的檢測(cè)在公共安全領(lǐng)域有著廣泛的應(yīng)用價(jià)值。為了充分發(fā)掘該方法的識(shí)別和分類潛力,在本文基礎(chǔ)上,未來(lái)將進(jìn)一步擴(kuò)充樣品種類和數(shù)量,實(shí)現(xiàn)對(duì)更多含能材料和爆炸物的準(zhǔn)確鑒別。