張釗熔 ,石海蘭
(1.自然資源部退化及未利用土地整治工程重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710021;2.陜西地建土地工程技術(shù)研究院有限責(zé)任公司,陜西 西安710021;3.陜西省土地工程建設(shè)集團(tuán)有限責(zé)任公司,陜西 西安 710075;4.陜西省土地整治工程技術(shù)研究中心,陜西 西安 710021)
受自然來源和人為活動引起的土壤重金屬污染由于污染面積擴(kuò)大、危害加劇等成為一個(gè)全球性污染問題。因此,土壤重金屬污染的現(xiàn)狀、來源和修復(fù)受到了各國學(xué)者、相關(guān)環(huán)保機(jī)構(gòu)以及政府和民眾的密切關(guān)注[1-3]。近些年來,我國政府多次主導(dǎo)國內(nèi)土壤污染狀況調(diào)查(全國土壤污染狀況調(diào)查,土壤地球化學(xué)調(diào)查等),調(diào)查結(jié)果表明,作為土壤污染物的重金屬污染已經(jīng)嚴(yán)重影響了部分地區(qū)的土壤安全,對當(dāng)?shù)剞r(nóng)作物和居民身體健康有著極大的危害[4-5]。重金屬作為污染物進(jìn)入土壤,不能由自然環(huán)境的自凈能力去除,只能在土壤介質(zhì)的條件下由一種重金屬化合物轉(zhuǎn)變?yōu)榱硪环N重金屬化合物或受土壤溶液的影響在水平或垂直方向遷移。因此,土壤中的重金屬污染物在自然環(huán)境的條件下不能有效地去除,對生態(tài)環(huán)境的危害具有長久性。農(nóng)田中的重金屬污染物可以通過作物種植時(shí)的根系間作用進(jìn)入到作物體內(nèi),自農(nóng)作物根部向地上部分運(yùn)移,最后在作物可食用器官累積,對糧食的安全生產(chǎn)造成隱患。當(dāng)人食用重金屬污染的糧食和環(huán)境暴露等途徑將重金屬攝入體內(nèi),將引起人體重金屬中毒[6]。因此對土壤重金屬污染的空間分布特征進(jìn)行研究,是了解土壤重金屬污染和著手修復(fù)治理的前提?,F(xiàn)今對土壤重金屬污染空間分布特征的研究是通過實(shí)地調(diào)查取樣、室內(nèi)化驗(yàn)。但是由于經(jīng)費(fèi)、樣品代表性、采樣方式等原因,所得的土壤重金屬含量數(shù)據(jù)出現(xiàn)是否有代表性、且數(shù)據(jù)不連續(xù)等問題,這必然影響土壤重金屬污染物的實(shí)際空間分布與模型擬合間的準(zhǔn)確性。因此,土壤重金屬的空間分布含量預(yù)測及影響因素一直是國內(nèi)外環(huán)境學(xué)者研究的熱點(diǎn)問題[7-9]。現(xiàn)今土壤重金屬污染物含量預(yù)測不再僅僅是定性地研究土壤重金屬含量分布特征,而是定性與定量建模相結(jié)合的系統(tǒng)性研究。首先,這一研究方法能對空間上土壤重金屬含量得到較準(zhǔn)確的預(yù)測。其次,通過一段時(shí)間內(nèi)的多次采樣監(jiān)測,也能夠?qū)ξ磥砟骋浑A段或某一時(shí)間點(diǎn)的重金屬含量作出預(yù)測[10]。較為準(zhǔn)確的土壤重金屬含量分布模型能夠讓研究者和相關(guān)工作者了解該地區(qū)土壤重金屬含量變化及其主要影響因素,這對區(qū)域土地合理規(guī)劃、土壤修復(fù)治理、農(nóng)業(yè)生產(chǎn)管理等問題具有重要的參考價(jià)值。
現(xiàn)階段對土壤重金屬含量預(yù)測的研究方法主要有兩類:一是遙感高光譜反演[11-12];二是通過土壤理化性質(zhì)(土壤粒級、pH值、腐殖值、有機(jī)碳含量)、污染源方向、污染源距離、地面坡度等條件下的反演[13-14]。這兩種技術(shù)的理論方法是相似的,遙感光譜反演是將含重金屬的土壤光譜與高光譜遙感獲得的土壤光譜信息通過建模擬合聯(lián)系起來;土壤理化性質(zhì)、污染源方向、坡度等條件下的反演同樣是在同一樣點(diǎn)將這些因素與土壤重金屬含量通過建?;蛘咚惴〝M合聯(lián)系起來。兩種方法最終都是通過這種聯(lián)系來預(yù)測反演其他點(diǎn)位的土壤重金屬含量。對于這兩個(gè)方向的學(xué)者做了很多研究[15-17],本論文主要綜述幾種通過土壤理化性質(zhì)等條件下的土壤重金屬含量預(yù)測模型或算法,討論模型間的優(yōu)缺點(diǎn)和適應(yīng)性,以期推動土壤重金屬空間分布模型在土壤重金屬分布特征中的研究與實(shí)踐應(yīng)用。
多元線性回歸是一種傳統(tǒng)的統(tǒng)計(jì)學(xué)方法,可以同時(shí)綜合多個(gè)變量,從多元數(shù)據(jù)中獲取信息。在實(shí)際應(yīng)用中,某一事物的變化總是由多種因素共同影響的結(jié)果,為了明確這些影響因子對這一事物的影響權(quán)重以及通過這些因子來預(yù)測事物發(fā)展變化,進(jìn)而引入了多元線性這一統(tǒng)計(jì)分析方法理論。多元線性回歸模型是研究一個(gè)因變量和多個(gè)自變量之間關(guān)系的理論和方法[18-20]。多元線性回歸模型的構(gòu)建,有未標(biāo)準(zhǔn)化和標(biāo)準(zhǔn)化兩個(gè)模式。未標(biāo)準(zhǔn)化回歸模型是使用原始數(shù)據(jù)的回歸模型。在其他因素保持不變的情況下,它能切實(shí)反映自變量每變化一個(gè)單位對因變量的影響程度。由未標(biāo)準(zhǔn)化回歸模式建立的模型,可以直接對因變量進(jìn)行預(yù)測得出結(jié)論。標(biāo)準(zhǔn)化回歸系數(shù)是將自變量和因變量的數(shù)據(jù)消除量綱、數(shù)量級等處理后,構(gòu)建的回歸模型。使得不同變量間的關(guān)系清晰,可相互對比,進(jìn)而確定自變量對因變量的影響大小。標(biāo)準(zhǔn)化回歸系數(shù)的絕對值越大,則認(rèn)為對因變量的影響就越大。
多元線性回歸模型已頻繁應(yīng)用于土壤重金屬空間分布研究,根據(jù)其理論,多元線性回歸不僅能構(gòu)建土壤重金屬預(yù)測的回歸方程,同樣能確定影響土壤重金屬含量的幾種因素間的相對重要程度。早在1989年,胡永定就開始使用多元線性回歸來預(yù)測土壤中的重金屬含量[21]。近些年來,這一方面的研究也越來越多,同時(shí)也有學(xué)者著重于多元線性回歸對土壤重金屬來源分析。Zeinab Salim等人在巴基斯坦喜馬拉雅山麓采樣主成分和多元線性回歸分析了對道路灰塵、土壤和植被中的重金屬來源,認(rèn)為主要來源為長距離的大氣輸送、濕沉降、母巖釋放、車輛排放以及其他大氣來源[22]。Zhao等人采用主成分分析和線性回歸分析了公園粉塵中的Pb來源,其主要來源于煤燃燒、土壤母質(zhì)和施肥以及交通,各項(xiàng)來源占比與Pb同位素示蹤來源占比相吻合[23]。
為了滿足具有空間屬性的數(shù)據(jù)處理分析,1981年,空間自回歸模型建立。目前,該模型已經(jīng)開始應(yīng)用于具有空間屬性數(shù)據(jù)的多個(gè)研究領(lǐng)域[24-26]??臻g回歸模型將分析中的假設(shè)(獨(dú)立性、隨機(jī)性)弱化,然后進(jìn)行求解加入空間距離,根據(jù)空間距離來加權(quán),距離越近權(quán)重越高。
空間回歸模型的一般形式為[27]:
式中:y為因變量;x為自變量;β為自變量x相關(guān)的參數(shù)向量;ρ為空間滯后項(xiàng)w1y的系數(shù);λ為空間誤差項(xiàng)的回歸系數(shù);w1、w2為與因變量和殘差的空間自回歸過程相關(guān)的權(quán)重矩陣;ln為殘差的空間自相關(guān)系數(shù)。
空間回歸模型有三種OLS、SLM、SEM。OLS(普通線性回歸模型):由于OLS不考慮空間上相鄰區(qū)域變量的互相影響,w1、w2前面的系數(shù) ρ、λ 都為 0。
SEM(空間誤差模型):系數(shù) ρ=0,λ≠0;表明某一空間對象上的因變量與同一對象上的自變量有關(guān),還與相鄰對象的自變量、因變量有關(guān)。
SLM(空間滯后模型):系數(shù) ρ≠0,λ=0,空間滯后模型是考慮因變量的空間相關(guān)性。即,某一空間對象上的因變量不僅與同一對象上的自變量有關(guān),還與相鄰對象的因變量有關(guān),通常把變量的前期值,即帶有滯后作用的變量稱為滯后變量,滯后變量分為滯后解釋變量與滯后被解釋變量[28]。
霍霄妮等人研究認(rèn)為空間自回歸模型能夠很好地解釋重金屬含量與其影響因素間的相關(guān)關(guān)系[29]。Wu等人研究認(rèn)為空間滯后模型優(yōu)于多層線性回歸模型??臻g滯后項(xiàng)的顯著系數(shù)表明Pb和Cd的空間變化依賴于它們周圍的觀測。研究結(jié)果強(qiáng)調(diào)了重金屬的空間自相關(guān)性,以及內(nèi)在因素和環(huán)境變量對這些金屬空間變化的影響,揭示了空間回歸模型在識別重金屬影響因素方面的有效性[30]。
構(gòu)建理念源自生物神經(jīng)網(wǎng)絡(luò)的人工神經(jīng)網(wǎng)絡(luò)(神經(jīng)網(wǎng)、連接模型)[31],由神經(jīng)元、節(jié)點(diǎn)之間的權(quán)重等結(jié)構(gòu)組成。每個(gè)節(jié)點(diǎn)都有相對應(yīng)的函數(shù)稱為激勵函數(shù)。任意兩節(jié)點(diǎn)之間的連接都可以通過信號的加權(quán)值(也稱為權(quán)重)完成[32]。神經(jīng)網(wǎng)絡(luò)上層的神經(jīng)元通過傳遞函數(shù)與下層神經(jīng)元連接,同層神經(jīng)元之間沒有連接,學(xué)習(xí)樣本提供給神經(jīng)網(wǎng)絡(luò)后,神經(jīng)網(wǎng)絡(luò)首先進(jìn)行正向傳播。如果輸出結(jié)果與目標(biāo)值的誤差超出預(yù)期,則正向傳播過程轉(zhuǎn)為反向傳播過程,誤差信號沿原鏈路返回。通過改變每一層神經(jīng)元的權(quán)重來減少誤差,這種誤差反向傳播修正不斷進(jìn)行,網(wǎng)絡(luò)對輸入模式的響應(yīng)精度不斷提高,最終達(dá)到適用的精度[33]。神經(jīng)網(wǎng)絡(luò)因此具有學(xué)習(xí)、統(tǒng)計(jì)、歸納等能力。換言之,通過數(shù)理統(tǒng)計(jì)神經(jīng)網(wǎng)絡(luò)能夠像人類一樣進(jìn)行簡單判斷,這比現(xiàn)代一些邏輯推理運(yùn)算更準(zhǔn)確[34]。
人工神經(jīng)網(wǎng)絡(luò)已經(jīng)頻繁應(yīng)用于環(huán)境生態(tài)污染研究中,侯藝璇等用BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型對小麥、水稻、油菜籽及蔬菜可食部分Cd含量預(yù)測,劃分得到4種作物適宜種植區(qū)[35]。Ihuaku Anagu等認(rèn)為神經(jīng)網(wǎng)絡(luò)模型能夠較好地以土壤基本性質(zhì)來估算土壤重金屬吸附[36]。秦夕淳在土壤Cd含量預(yù)測研究中發(fā)現(xiàn),不同參數(shù)和不同模型下,神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果是不同的[37]。樊寧將BP神經(jīng)網(wǎng)絡(luò)與情景分析法相結(jié)合對燃煤電廠周邊土壤重金屬含量進(jìn)行未來預(yù)測,預(yù)測精度較高[38]。
多元線性回歸在土壤重金屬含量的預(yù)測,可以先將影響因素標(biāo)準(zhǔn)化,確定各影響因素影響力占比,然后使用未標(biāo)準(zhǔn)的回歸系數(shù),做多元回歸方程,對回歸方程進(jìn)行檢驗(yàn),從而對因變量預(yù)測。但是采用傳統(tǒng)回歸模型來進(jìn)行土壤重金屬含量及其影響因素間相關(guān)關(guān)系的分析,該方法的理論假設(shè)前提是數(shù)據(jù)本身在統(tǒng)計(jì)上是獨(dú)立的且均勻分布[39],而土壤重金屬含量作為空間數(shù)據(jù)的一種往往具有一定的空間依賴關(guān)系,即空間性,若采用傳統(tǒng)的回歸模型,通常會忽略空間相關(guān)的影響而產(chǎn)生偏差[29]。空間回歸可更好地解釋地理事物的空間關(guān)系。土壤空間位置與各種重金屬的含量之間,以及污染程度與不同重金屬含量之間均存在高度復(fù)雜的非線性映射關(guān)系[40]。神經(jīng)網(wǎng)絡(luò)可以綜合考慮土壤環(huán)境質(zhì)量模糊性及各污染因素的權(quán)重,循環(huán)地對權(quán)重值進(jìn)行調(diào)整,使輸出誤差平方和達(dá)到最小值,使得計(jì)算預(yù)測結(jié)果更具科學(xué)性[41-42]。
現(xiàn)今土壤重金屬含量空間預(yù)測研究模型多樣,還有一些其他方法理論,例如:空間數(shù)據(jù)分析(ESDA)、地統(tǒng)計(jì)學(xué)及空間插值分析、空間隨機(jī)模擬等。各種不同模型對土壤重金屬空間含量的預(yù)測精確性是不同的,故而今后可能在需要對比不同的土壤重金屬含量預(yù)測模型來探討各模型的優(yōu)劣性。其次,算法模型并不是一成不變的,可以收集前人經(jīng)驗(yàn)結(jié)合自己的學(xué)識對模型進(jìn)行改良和創(chuàng)新。