南迪娜, 董力強(qiáng), 傅文翔, 劉衛(wèi)衛(wèi), 孔景臨
國(guó)民核生化災(zāi)害防護(hù)國(guó)家重點(diǎn)實(shí)驗(yàn)室, 北京 102205
快速準(zhǔn)確地識(shí)別化學(xué)毒劑、 有毒工業(yè)化學(xué)品等危險(xiǎn)物質(zhì)在重大活動(dòng)安保、 交通運(yùn)輸、 海關(guān)物流、 司法物證、 反化學(xué)恐怖等公共安全領(lǐng)域需求明顯。 這些化學(xué)危險(xiǎn)品如可揮發(fā)、 強(qiáng)致死的神經(jīng)性毒劑沙林、 梭曼等均為無(wú)色透明液體, 外觀與水、 乙醇等常見(jiàn)液體無(wú)異, 具有被人員夾帶、 謊報(bào)、 隱蔽投放到公共場(chǎng)所的風(fēng)險(xiǎn)。 要快速排查及準(zhǔn)確識(shí)別此類液體樣品, 一般都要開瓶采樣進(jìn)行現(xiàn)場(chǎng)檢測(cè)或送實(shí)驗(yàn)室分析, 這種方式增加了執(zhí)行任務(wù)人員的暴露風(fēng)險(xiǎn)且檢測(cè)操作耗時(shí)。 拉曼光譜(Raman spectroscopy)技術(shù)憑借其快速、 靈敏、 非接觸式操作、 儀器可便攜化等優(yōu)勢(shì)成為現(xiàn)場(chǎng)快速檢測(cè)領(lǐng)域的研究熱點(diǎn)。 目前, 美國(guó)Wiley的Bio-Rad以及國(guó)內(nèi)同方威視[1]等研究出版機(jī)構(gòu)和拉曼光譜儀供應(yīng)商等都建立了拉曼光譜數(shù)據(jù)庫(kù), 包含多種環(huán)境污染物、 易燃易爆及強(qiáng)腐蝕性化學(xué)危險(xiǎn)品; 針對(duì)危險(xiǎn)品識(shí)別的需求, 有研究通過(guò)實(shí)測(cè)譜圖與數(shù)據(jù)庫(kù)中正反向特征峰匹配分析危險(xiǎn)液體[2], 或開發(fā)一些拉曼光譜識(shí)別方法[3]和軟件[4]; 還有研究通過(guò)硬件改進(jìn), 互補(bǔ)式使用雙波長(zhǎng)激光器手持式拉曼系統(tǒng)實(shí)現(xiàn)危險(xiǎn)品檢測(cè)[5]。 上述拉曼光譜數(shù)據(jù)庫(kù)均不包含化學(xué)毒劑等的光譜信息, 利用市售的數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)公共安全領(lǐng)域中危險(xiǎn)液體的有效識(shí)別。 本研究較為系統(tǒng)地研究了多種化學(xué)毒劑及其前體或降解產(chǎn)物、 有毒工業(yè)化學(xué)品等危險(xiǎn)液體的拉曼光譜檢測(cè)方法, 獲得了41種危險(xiǎn)液體的高信噪比拉曼光譜數(shù)據(jù)并將其錄入數(shù)據(jù)庫(kù), 再利用多種模式識(shí)別算法開展危險(xiǎn)液體的識(shí)別研究, 通過(guò)線性判別分析(linear discriminant analysis, LDA)方法, 提出的譜圖識(shí)別模型可對(duì)上述危險(xiǎn)液體進(jìn)行準(zhǔn)確識(shí)別歸類, 并能將其與水等無(wú)害物質(zhì)快速區(qū)分。
innoRam便攜式拉曼光譜儀(美國(guó)BWTEK公司), 配備有785 nm激光器。
檢測(cè)物包括沙林、 梭曼、 塔崩、 維??怂?、 芥子氣等化學(xué)毒劑; 磷酸三甲酯、 磷酸三乙酯、 磷酸三丁酯、 甲基膦酸二甲酯、 甲基膦酸二異丙酯等化學(xué)毒劑模擬劑; 亞磷酸二甲酯、 亞磷酸三甲酯、 亞磷酸三乙酯、 甲基膦酰氯乙酯、 甲基膦酰二氯、 甲基膦酰二氟、 氯沙林、 二乙胺基磷酰氯、 2-二乙胺基乙硫醇、 硫二甘醇、 異丙醇、 頻吶基醇、 甲基膦酸、 甲基膦酸異丙酯、 甲基膦酸頻吶基酯等化學(xué)毒劑前體、 中間產(chǎn)物、 水解產(chǎn)物; 鄰二甲苯、 間二甲苯、 苯甲醚、 氯代苯、 乙酸乙酯、 乙酸乙烯酯、 乙酸芐酯、 甲醇、 乙醇、 乙腈、 丙酮、 1,1,1-三氯乙烷、 正己烷、 正丁醇、 四氯化碳等有毒工業(yè)化學(xué)品以及汽油和水。 其中磷酸三甲酯為分析純, 購(gòu)自中國(guó)醫(yī)藥集團(tuán)上?;瘜W(xué)試劑公司; 磷酸三乙酯、 乙酸乙酯為分析純, 購(gòu)自天津市福晨化學(xué)試劑廠; 磷酸三丁酯為分析純, 購(gòu)自天津市化學(xué)試劑; 甲基膦酸二甲酯為分析純, 購(gòu)自麥克林; 鄰二甲苯、 間二甲苯、 苯甲醚、 氯代苯、 乙酸乙烯酯、 正丁醇純度大于99.0%, 購(gòu)自天津市光復(fù)精細(xì)化工研究所; 乙酸芐酯純度大于99%, 購(gòu)自北京百靈威科技有限公司; 甲醇、 乙腈為高效液相色譜純度, 購(gòu)自Sigma。 乙醇、 丙酮、 四氯化碳純度大于99.5%, 購(gòu)自北京化工廠; 1,1,1-三氯乙烷純度大于96%, 購(gòu)自阿拉?。?正己烷純度大于95.0%, 購(gòu)自北京世紀(jì)紅星化工有限公司; 水為市售娃哈哈純凈水。
1.2.1 建立拉曼光譜檢測(cè)方法
拉曼光譜儀開機(jī)后, 掃描空白光譜作為扣除的背景, 以消除儀器帶來(lái)的噪聲。 采集硅片的拉曼光譜并確認(rèn)出峰波數(shù)為512 cm-1。 取適量樣品至潔凈透明玻璃瓶并放到樣品池中, 設(shè)置激光功率為滿值150 mW的10%~100%、 積分時(shí)間500~7 000 ms、 累積1~5次, 采集各條件下拉曼光譜并保存數(shù)據(jù)。
1.2.2 光譜數(shù)據(jù)分析
使用Matlab R2019a完成光譜數(shù)據(jù)分析。 將采集到的619個(gè)拉曼譜圖截取200~3 000 cm-1范圍的主要波段, 以1 cm-1間隔等距線性插值采樣得到1×2 801維樣本數(shù)據(jù), 將光譜進(jìn)行離差標(biāo)準(zhǔn)化處理, 完成光譜樣本預(yù)處理。 采用主成分分析方法對(duì)光譜數(shù)據(jù)進(jìn)行降維壓縮, 選擇前7個(gè)主成分作為數(shù)據(jù)集樣本, 以覆蓋原始數(shù)據(jù)80%以上信息。 各樣品隨機(jī)分配70%譜圖為訓(xùn)練集數(shù)據(jù), 其余歸入測(cè)試集。 利用訓(xùn)練集數(shù)據(jù)訓(xùn)練線性判別分析、 二次判別分析(quadratic discriminant analysis, QDA)、 k近鄰(k-nearest neighbor, kNN)、 樸素貝葉斯(naive Bayesian, NB)模型、 分類決策樹(classification tree, CT)、 支持向量機(jī)(support vector machine, SVM)6種模式識(shí)別算法的模型, 再用訓(xùn)練好的模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行識(shí)別歸類。
1.2.3 盲樣測(cè)試
重新隨機(jī)選取10個(gè)樣品采集光譜, 用訓(xùn)練好的線性判別分析模型識(shí)別新測(cè)得的譜圖, 以驗(yàn)證本研究檢測(cè)及識(shí)別方法的可靠性。
由圖1可見(jiàn)拉曼光譜反映了化合物的化學(xué)鍵構(gòu)成, 是一種可用于化合物鑒別的指紋譜。 但由于分子振動(dòng)的復(fù)雜性, 不是所有譜峰都易于歸屬, 僅靠拉曼光譜提供的信息難以準(zhǔn)確判定化合物結(jié)構(gòu), 而利用化學(xué)計(jì)量學(xué), 將模式識(shí)別方法與拉曼光譜結(jié)合是提高鑒別準(zhǔn)確性的有效手段。
圖1 化學(xué)危險(xiǎn)品和水的拉曼光譜
各樣品的前3個(gè)主成分分布如圖2所示。 由圖可見(jiàn), 拉曼光譜作為分子指紋譜, 具有豐富的化學(xué)鍵及其所處環(huán)境的信息, 可將不同類型的樣品加以區(qū)分。 為比較模型的識(shí)別準(zhǔn)確率, 使用線性判別分析、 二次判別分析、 k近鄰、 樸素貝葉斯模型、 分類決策樹、 支持向量機(jī)6種模式識(shí)別算法對(duì)180個(gè)測(cè)試集數(shù)據(jù)進(jìn)行識(shí)別歸類后, 識(shí)別結(jié)果列于表1。
圖2 各樣品的前3個(gè)主成分分布
由表1可見(jiàn), 支持向量機(jī)、 線性判別分析模型具有100%的最高識(shí)別準(zhǔn)確率。 支持向量機(jī)是以各類樣本間隔最大為原則, 其分類判別界面取決于類別邊界的“支持向量”。 線性判別分析則是以原始樣本投影得到向量的類間距離最大、 類內(nèi)方差最小為原則, 通過(guò)Fisher判別式對(duì)樣本進(jìn)行分類的模型, 其判別界面更取決于“類心”。 當(dāng)各樣品多個(gè)訓(xùn)練集譜圖中有個(gè)別因儀器影響或外界環(huán)境改變出現(xiàn)一定偏差的譜圖時(shí), 支持向量機(jī)模型在對(duì)未知樣品識(shí)別時(shí), 會(huì)因此對(duì)結(jié)果產(chǎn)生較大影響。 因數(shù)據(jù)庫(kù)中該樣品“類心”無(wú)大偏差, 同樣情況下線性判別分析模型的識(shí)別結(jié)果波動(dòng)較小具有穩(wěn)健性, 故本研究選取線性判別分析模型進(jìn)行未知危險(xiǎn)化學(xué)品的識(shí)別。 利用線性判別分析模型重復(fù)10次識(shí)別歸類后, 其識(shí)別結(jié)果穩(wěn)定于100%的準(zhǔn)確率不變, 可見(jiàn)該模型具有高識(shí)別準(zhǔn)確率及穩(wěn)定性。 對(duì)重新采集的10個(gè)盲樣譜圖, 線性判別分析模型可以全部準(zhǔn)確識(shí)別。 不同化合物即使元素組成相同, 基團(tuán)或其所處環(huán)境的差異會(huì)使其具有不同的拉曼光譜特征。 拉曼光譜的分子指紋譜特點(diǎn)防止了線性判別分析模型可能過(guò)度擬合數(shù)據(jù)而導(dǎo)致分類識(shí)別結(jié)果準(zhǔn)確率降低。
表1 6種模式識(shí)別方式對(duì)測(cè)試集拉曼數(shù)據(jù)的識(shí)別準(zhǔn)確率(%)
以多種化學(xué)毒劑及其前體、 中間體、 水解產(chǎn)物、 模擬劑和有毒工業(yè)化學(xué)品等為研究對(duì)象, 建立了化學(xué)毒害物質(zhì)拉曼光譜數(shù)據(jù)庫(kù)。 在此基礎(chǔ)上, 以不同模式識(shí)別方法對(duì)上述毒害物質(zhì)以及常見(jiàn)液體如水、 乙醇、 汽油等進(jìn)行了快速篩查研究。 結(jié)果表明, 外觀均為無(wú)色透明液體的各類化合物散射光譜特征差異顯著, 反映出拉曼光譜的指紋譜特征; 模式識(shí)別方法與拉曼光譜結(jié)合可有效鑒別危險(xiǎn)液體, 其中線性判別分析模型的識(shí)別結(jié)果波動(dòng)較小更具穩(wěn)健性; 全部測(cè)試過(guò)程在較短時(shí)間內(nèi)即可完成且不損耗樣品, 保證了測(cè)試通量和遂行任務(wù)人員安全, 該研究可為與不明化學(xué)品篩查相關(guān)的公共安全問(wèn)題提供技術(shù)支撐。