趙旻
(長(zhǎng)江水利委員會(huì)水文局,武漢,430010)
眾所周知,水資源是任何生命活動(dòng)所需的必需條件,我們生活的地球表面上有約71%都被水覆蓋,但是地球上的絕大部分水資源都在海洋中,將近97%的水資源都為海水,我們?nèi)祟?lèi)可以直接飲用的淡水資源十分有限。隨著改革開(kāi)放以來(lái),我國(guó)的經(jīng)濟(jì)有了飛速的發(fā)展,同時(shí)城鎮(zhèn)化、工業(yè)化的飛速發(fā)展帶來(lái)的能源緊缺問(wèn)題也愈發(fā)嚴(yán)重,尤其是水資源的緊缺。根據(jù)最近的世界水論壇會(huì)議公布的聯(lián)合國(guó)水資源評(píng)估報(bào)告[1],每天在世界各地的江河湖泊中被倒入將近200噸的生產(chǎn)生活垃圾,導(dǎo)致水體生態(tài)系統(tǒng)遭到了嚴(yán)重的破壞。水資源緊缺,淡水污染嚴(yán)重和生態(tài)系統(tǒng)被人類(lèi)嚴(yán)重破壞,這三個(gè)問(wèn)題共同影響,使全世界范圍內(nèi)的農(nóng)業(yè)發(fā)展受阻和工廠停產(chǎn),嚴(yán)重地影響了人類(lèi)社會(huì)的可持續(xù)發(fā)展,對(duì)人類(lèi)的生存帶來(lái)了前所未有的危機(jī)[2-5]。
目前世界上主流的表征水質(zhì)污染程度的方法是使用水體有機(jī)物含量綜合指標(biāo),表1中給出了三個(gè)主要的指標(biāo)。從上述內(nèi)容我們可以得出,把我國(guó)的水資源作為長(zhǎng)期監(jiān)測(cè)對(duì)象,不但可以有效地保護(hù)水資源,還一定程度地控制了水資源的污染和浪費(fèi);在長(zhǎng)期的水質(zhì)監(jiān)測(cè)中還可以判斷出水資源的污染情況,進(jìn)而為我國(guó)國(guó)民提供安全放心的水質(zhì)環(huán)境,切實(shí)履行習(xí)近平總書(shū)記提出的“綠水青山就是金山銀山”的可持續(xù)發(fā)展理念。
表1 表征水質(zhì)有機(jī)物的綜合指標(biāo)
在表1中提到的水質(zhì)監(jiān)測(cè)參數(shù)中,水質(zhì)的化學(xué)需氧量(Chemical Oxygen Demand,COD)是一個(gè)比較重要的檢測(cè)參數(shù),水質(zhì)COD的含義是在一定的檢測(cè)條件下,氧化1L測(cè)試水樣品中還原性物質(zhì)所需要的氧化劑的質(zhì)量,常用單位為mg/L,水質(zhì)COD可以體現(xiàn)出水質(zhì)被還原性物質(zhì)的污染程度。我國(guó)早在2000年就把水質(zhì)COD的在線檢測(cè)以及分析儀器作為重點(diǎn)研發(fā)的水質(zhì)質(zhì)量監(jiān)測(cè)儀器。
隨著科技的進(jìn)步和計(jì)算機(jī)的普及,不同種類(lèi)的儀器和試劑都可以用在水質(zhì)COD的監(jiān)測(cè)中,目前水質(zhì)COD的常用監(jiān)測(cè)方法有三類(lèi),如圖1所示。在眾多的水質(zhì)COD檢測(cè)手段之中,光譜技術(shù)中的紫外-可見(jiàn)光譜法作為一種準(zhǔn)確、快速、靈敏的檢測(cè)技術(shù),由于其樣品用量較少,不需要化學(xué)試劑,沒(méi)有二次污染而成為了水質(zhì)COD檢測(cè)中最常用到的方法。紫外-可見(jiàn)光譜水質(zhì)COD檢測(cè)的原理基于分子內(nèi)部的運(yùn)動(dòng)規(guī)律,由于不同物質(zhì)的分子結(jié)構(gòu)不同,分子結(jié)構(gòu)中特定的基團(tuán)吸收紫外-可見(jiàn)光之后發(fā)生電子能級(jí)的躍遷,躍遷之后會(huì)有特定的吸收光譜線。因此,根據(jù)不同物質(zhì)分子空間構(gòu)型的差異,檢測(cè)待測(cè)樣品會(huì)在200nm~1100nm之間的波長(zhǎng)范圍內(nèi)吸收光譜上的特定特征波長(zhǎng),特征波長(zhǎng)的吸光度和高度兩個(gè)參數(shù)可以得出待檢測(cè)物質(zhì)中的分子成分和含量。通過(guò)以往文獻(xiàn)可知,當(dāng)一束平行分單色光垂直地穿過(guò)無(wú)散射、均勻的溶液時(shí)候,吸光溶液的吸光度和吸光溶液的濃度和光程呈正相關(guān),用數(shù)學(xué)表達(dá)式可以表示為朗伯-比爾定律,數(shù)學(xué)關(guān)系如公式1所示[6]:
圖1 水質(zhì)COD監(jiān)測(cè)技術(shù)手段分類(lèi)
式中I和Io分別代表入射光的強(qiáng)度和透射光的強(qiáng)度;ε,C和L分別代表測(cè)試溶液的吸收常數(shù),濃度和光程。而綜合分析吸光度的定義,可得到另一個(gè)表達(dá)式為:
而在實(shí)際的實(shí)驗(yàn)過(guò)程中,數(shù)學(xué)表達(dá)式(2)中的摩爾吸光系數(shù)K和光程L是恒定的常數(shù),L代表溶液層的厚度,因此,可以得到溶液吸光度與濃度的線性函數(shù)關(guān)系。由于不同物質(zhì)結(jié)構(gòu)差異造成的特征吸收光譜的不同,即可通過(guò)數(shù)學(xué)表達(dá)式(2)中的函數(shù)關(guān)系構(gòu)建基準(zhǔn)曲線,通過(guò)基準(zhǔn)曲線就可以得到關(guān)于水質(zhì)檢測(cè)的各個(gè)參數(shù)。
水質(zhì)COD檢測(cè)的信號(hào)往往十分的復(fù)雜多變,有很多的變量和多重共線性,所以直接用數(shù)學(xué)表達(dá)式(2)預(yù)測(cè)模型結(jié)果誤差會(huì)很大?;谶@個(gè)問(wèn)題,本實(shí)驗(yàn)設(shè)計(jì)了一種紫外-可見(jiàn)光譜法水質(zhì)COD檢測(cè)試驗(yàn)方法。第一步先研究了一階導(dǎo)數(shù)和平滑處理兩種方法對(duì)實(shí)驗(yàn)?zāi)P皖A(yù)測(cè)的準(zhǔn)確性,然后配制鄰苯二甲酸氫鉀水質(zhì)COD標(biāo)準(zhǔn)液進(jìn)行水質(zhì)COD檢測(cè),通過(guò)朗伯-比爾定律分析溶液吸光度和樣品水中COD的關(guān)系,然后通過(guò)最小二乘法回歸算法,建立預(yù)測(cè)COD模型。
本實(shí)驗(yàn)所用紫外-可見(jiàn)光譜儀為UV360紫外可見(jiàn)紅外分光光度計(jì),測(cè)試的波長(zhǎng)范圍在185mm-3300nm,分光光度計(jì)的分辨率在0.1nm。分光光度計(jì)的檢測(cè)器為光電倍增管/InGaAs/Cooled PbS。
產(chǎn)生紫外-可見(jiàn)光譜的光譜儀檢測(cè)水質(zhì)COD的原始數(shù)據(jù)中存在著一些干擾信號(hào),包括噪音和采集到光譜的平移或者旋轉(zhuǎn)。這些干擾信號(hào)會(huì)對(duì)預(yù)測(cè)模型的準(zhǔn)確性產(chǎn)生很大的影響,所以為了減少干擾信號(hào)的影響和提高預(yù)測(cè)模型的準(zhǔn)確性,必須要對(duì)光譜進(jìn)行預(yù)處理,預(yù)處理可以分為基線校準(zhǔn)和消除噪音[7]。
2.2.1 導(dǎo)數(shù)法
光譜儀采集到的原始數(shù)據(jù)中的一些干擾信號(hào),包括光譜的平移、旋轉(zhuǎn)或者其他變形現(xiàn)象,這時(shí)我們可以對(duì)執(zhí)行頻譜求一階導(dǎo)數(shù)消除基線平移,對(duì)執(zhí)行頻譜求二階導(dǎo)數(shù)可以消除頻譜旋轉(zhuǎn)。數(shù)學(xué)表達(dá)式如下[8]:
數(shù)學(xué)表達(dá)式(3)中E為真實(shí)吸光度,E′為表現(xiàn)吸光度,ΔE表示兩者之間的固定偏差。對(duì)數(shù)學(xué)表達(dá)式(3)求導(dǎo)后得到:
公式(4)中λ是某一中心波數(shù)點(diǎn),E(λ)為λ處的吸光度數(shù)值。由于本實(shí)驗(yàn)測(cè)試的為液體,采集樣品時(shí)方法比較簡(jiǎn)單,所以執(zhí)行頻譜的旋轉(zhuǎn)誤差可以不用考慮,只用一階導(dǎo)數(shù)就可以消除原始數(shù)據(jù)的基線平移。
2.2.2 平滑處理
頻譜中的噪音是一種隨機(jī)的高頻信號(hào),噪音越高,預(yù)測(cè)模型的準(zhǔn)確性也就越差,所以必須要通過(guò)平滑處理來(lái)消除噪音的影響以提高預(yù)測(cè)模型的精準(zhǔn)度。平滑處理一般可以用下面數(shù)學(xué)表達(dá)式來(lái)進(jìn)行[9]:
公式(5)中,yi代表第k個(gè)點(diǎn)(即中心點(diǎn))進(jìn)行平滑前的數(shù)值,y*k為進(jìn)行平滑處理后的數(shù)值,ai表示權(quán)重系數(shù)。
只有利用合適并且精準(zhǔn)的模型評(píng)價(jià)標(biāo)準(zhǔn),才可以減小預(yù)測(cè)模型的誤差,所以評(píng)價(jià)標(biāo)準(zhǔn)往往決定了最終預(yù)測(cè)模型的準(zhǔn)確性。紫外-可見(jiàn)光譜法水質(zhì)COD預(yù)測(cè)模型常用的評(píng)價(jià)標(biāo)準(zhǔn)有兩個(gè),分別是相關(guān)系數(shù)R2和均方根誤差RMSE,兩個(gè)評(píng)價(jià)標(biāo)準(zhǔn)的數(shù)學(xué)表達(dá)式分別為[10]:
兩個(gè)數(shù)學(xué)表達(dá)式中:yi,act代表的含義是第i個(gè)樣品實(shí)際值,yi,pre代表的含義是通過(guò)預(yù)測(cè)模型得到的預(yù)測(cè)值,n則表示測(cè)試的樣本總數(shù)。在兩個(gè)評(píng)價(jià)標(biāo)準(zhǔn)參數(shù)中,R2的值越接近1,表示預(yù)測(cè)模型性能越好,RMSE數(shù)值越小,則代表性能越好。
紫外-可見(jiàn)光譜法水質(zhì)COD標(biāo)準(zhǔn)測(cè)試溶液為鄰苯二甲酸氫鉀溶液,各個(gè)濃度的標(biāo)準(zhǔn)測(cè)試溶液如表2所示。
表2 紫外-可見(jiàn)光譜法水質(zhì)COD標(biāo)準(zhǔn)測(cè)試溶液濃度
通過(guò)表2中不同濃度的標(biāo)準(zhǔn)測(cè)試溶液,可以得到不同波長(zhǎng)處的吸收特性。對(duì)表2中的不同濃度標(biāo)準(zhǔn)測(cè)試溶液進(jìn)行光譜掃描,在相同的實(shí)驗(yàn)條件下,采集光譜圖。為了減小實(shí)驗(yàn)誤差,使得到的光譜更加平滑,本實(shí)驗(yàn)通過(guò)均值濾波的方法對(duì)譜線進(jìn)行預(yù)處理,可得到圖2。通過(guò)圖2可以看到標(biāo)準(zhǔn)測(cè)試溶液在253mm處和277nm兩處有明顯的特征峰。單波長(zhǎng)檢測(cè)法是利用253nm處的點(diǎn)作為檢測(cè)波長(zhǎng)[5-6]。由于水質(zhì)樣品本身的存在差異,也會(huì)導(dǎo)致特征峰的差異,所以針對(duì)253nm的固定波長(zhǎng)檢測(cè)存在的缺陷。本實(shí)驗(yàn)首先在253nm點(diǎn)處建立特征波長(zhǎng)與水質(zhì)COD值間的關(guān)系,然后選取277nm作為特征吸收波長(zhǎng),得到與水質(zhì)COD值之間的函數(shù)關(guān)系;最后通過(guò)得到水質(zhì)掃描結(jié)果的最優(yōu)波段(200-310nm之間),得到積分面積和水質(zhì)COD值之間的關(guān)系。通過(guò)上述實(shí)驗(yàn)得到的不同水質(zhì)樣品濃度和在不同波長(zhǎng)點(diǎn)的吸光度函數(shù)關(guān)系如圖3-圖5所示。
圖2 紫外-可見(jiàn)光譜法水質(zhì)COD標(biāo)準(zhǔn)測(cè)試溶液吸收光譜
圖3 253nm處吸光度和標(biāo)準(zhǔn)測(cè)試溶液濃度關(guān)系
圖4 277nm處吸光度和標(biāo)準(zhǔn)測(cè)試溶液濃度關(guān)系
圖5 200-310nm吸光度積分與標(biāo)準(zhǔn)測(cè)試溶液濃度關(guān)系
通過(guò)圖3-圖5可以看到,當(dāng)鄰苯二甲酸氫鉀標(biāo)準(zhǔn)溶液的濃度高于160mg/L時(shí),253nm、277nm和200nm-310nm吸光度積分所對(duì)應(yīng)的曲線都有向下彎曲的趨勢(shì),所以當(dāng)標(biāo)準(zhǔn)測(cè)試溶液濃度過(guò)高時(shí),曲線會(huì)偏離直線關(guān)系,不再符合朗伯-比爾定律。為了減小預(yù)測(cè)模型的誤差,應(yīng)該選取160mg/L以下的濃度建立標(biāo)準(zhǔn)曲線,可以看出擬合曲線是一條直線,所以設(shè)擬合函數(shù)為y=ax+b。函數(shù)關(guān)系中的x為鄰苯二甲酸氫鉀標(biāo)準(zhǔn)溶液的濃度,y為吸光度。表3中給出了擬合關(guān)系和上面提到的評(píng)價(jià)標(biāo)準(zhǔn)的相關(guān)參數(shù)。
表3 擬合曲線相關(guān)參數(shù)
通過(guò)表3可以看到,在253nm和277nml兩處的相關(guān)系數(shù)分別達(dá)到了0.9946和0.9977,當(dāng)相關(guān)系數(shù)R2達(dá)到0.9以上的時(shí)候,預(yù)測(cè)模型就可以認(rèn)是“優(yōu)秀”模型[11],說(shuō)明我們建立的標(biāo)準(zhǔn)曲線在160mg/L的濃度以下誤差不大,相關(guān)性較高。所以本文下面的實(shí)驗(yàn)均選用160mg/L以下濃度的水質(zhì)樣品,利用前面配置的水質(zhì)COD標(biāo)準(zhǔn)溶液,一共52個(gè)水質(zhì)樣品,按照標(biāo)準(zhǔn)液的濃度從小到大放置,選取其中33個(gè)樣品作為校正實(shí)驗(yàn)樣品,剩下的19樣品用作預(yù)測(cè)模型。
偏最小二乘法(PLS)是一種多元線性回歸方法[12],PLS首先要做的是對(duì)光譜矩陣進(jìn)行分解(光譜矩陣X,濃度矩陣Y)。
T和U分別代表兩個(gè)矩陣的得分矩陣,P、Q則是代表兩個(gè)矩陣的載荷矩陣,E、F代表兩個(gè)矩陣的偏最小二乘擬合殘差矩陣,PLS接下來(lái)要做的是將T和U分別做線性回歸,數(shù)學(xué)表達(dá)式如下所示[13]:
在對(duì)預(yù)測(cè)模型進(jìn)行預(yù)測(cè)的時(shí)候,可以計(jì)算出未知水質(zhì)樣品的X未知和T未知,然后通過(guò)下面的數(shù)學(xué)表達(dá)式可以計(jì)算得到濃度預(yù)測(cè)值:
偏最小二乘法建模需要一個(gè)參數(shù)來(lái)表示預(yù)測(cè)能力的精確性,本文采用殘差平方和PRESS作為判斷的依據(jù),兩者的數(shù)值越小,就代表預(yù)測(cè)模型的精準(zhǔn)度越高。在PLS建模中,選擇不同的因子數(shù),最小的PRESS值就會(huì)對(duì)應(yīng)得到最佳因子數(shù),本實(shí)驗(yàn)中兩者的關(guān)系如圖6所示。
圖6 PLS模型與因字?jǐn)?shù)關(guān)系
如圖6所示,當(dāng)因字?jǐn)?shù)是4的時(shí)候,PLS模型的PRESS值到達(dá)最小值,所以本實(shí)驗(yàn)選擇的最佳因子數(shù)為4。然后將獲得的紫外-可見(jiàn)光譜進(jìn)行回歸分析,得到模型如圖7所示。圖7中得到的相關(guān)系數(shù)R2為0.9921,回歸系數(shù)令人滿意,校正標(biāo)準(zhǔn)差SEC=8.19mg/L,預(yù)測(cè)模型的標(biāo)準(zhǔn)差SEP=8.86mg/L。這個(gè)結(jié)果是沒(méi)對(duì)紫外可見(jiàn)光譜進(jìn)行預(yù)處理的結(jié)果,下面將原始實(shí)驗(yàn)數(shù)據(jù)通過(guò)平滑處理和導(dǎo)數(shù)處理,再次進(jìn)行偏最小二乘法回歸處理,得到表4結(jié)果。通過(guò)表4可以看出,通過(guò)導(dǎo)數(shù)法預(yù)處理的結(jié)果優(yōu)于平滑處理的結(jié)果,因?yàn)閷?dǎo)數(shù)預(yù)處理方法可以消除基線平移的影響。然后把19個(gè)預(yù)測(cè)集導(dǎo)入到預(yù)測(cè)模型中,得到預(yù)測(cè)值。預(yù)測(cè)值與真實(shí)值的對(duì)比如圖8所示。
圖7 PLS回歸定標(biāo)方程
圖8 PLS擬合值與真實(shí)值對(duì)比曲線
表4 預(yù)測(cè)模型評(píng)價(jià)參數(shù)
兩種預(yù)處理方法下的偏最小二乘法回歸
從圖8中可以得出偏最小二乘法回歸預(yù)測(cè)模型精確度較高,誤差在6%之內(nèi),基本到達(dá)了預(yù)期的準(zhǔn)確度。
本實(shí)驗(yàn)基于紫外-可見(jiàn)光譜法檢測(cè)水質(zhì)COD的檢測(cè)方法進(jìn)行了研究,提出了預(yù)測(cè)模型。首先設(shè)計(jì)了實(shí)驗(yàn)方案,通過(guò)不同濃度的COD檢測(cè)標(biāo)準(zhǔn)溶液,得出了水質(zhì)COD檢測(cè)朗伯-比爾定律的適用范圍,接著通過(guò)偏最小二乘法回歸進(jìn)行了預(yù)測(cè)模型分析,得出結(jié)論。偏最小二乘法回歸預(yù)測(cè)模型精確度較高,誤差在6%之內(nèi),基本到達(dá)了預(yù)期的準(zhǔn)確度。