付龍飛
(陜西華正生態(tài)建設(shè)設(shè)計監(jiān)理有限公司,西安 710100)
土壤侵蝕是指在其他非人作用力下,土壤和其他地表成分被損毀、腐蝕、移動和下沉的過程。水力、風(fēng)力、重力和人類社會活動等都是本文中提到的外力因素。無論是對自然環(huán)境的保護(hù),還是對農(nóng)業(yè)用地的保障,都產(chǎn)生了非常惡劣的影響[1]。防治水土資源流失,宜采取防重于治的方針,比起治山治水、綠化造林,在土壤未遭到侵蝕前,通過有效手段進(jìn)行準(zhǔn)確預(yù)測更能減少土地侵蝕的發(fā)生。只有準(zhǔn)確的水土流失預(yù)測,才能針對已發(fā)生的情況針對性地采取有效的水土流失防治措施,準(zhǔn)確預(yù)測未來的水土流失狀況。當(dāng)前,土壤侵蝕已成為我國亟待預(yù)防和解決的問題。國內(nèi)外曾研究出許多用于計算土壤侵蝕量的模型,文獻(xiàn)[2]中采用瞬時數(shù)字圖像采集、去噪等手段,將連續(xù)降雨條件下的土壤侵蝕形態(tài)演變過程進(jìn)行了動態(tài)監(jiān)測[2]。文獻(xiàn)[3]中,利用土壤侵蝕分布模型記錄了1986年來連續(xù)29年的土壤侵蝕變化,并與泥沙侵蝕強度進(jìn)行了對比[3]。以上方法中都取得了許多成果,但是目前使用的土壤侵蝕量檢測方法對于土壤侵蝕程度的分類方面還有所欠缺。因此,本文采用機(jī)器學(xué)習(xí)中的支持向量機(jī)(SVM)作為模型核心,設(shè)計一種基于機(jī)器學(xué)習(xí)的小流域土壤侵蝕量檢測方法。
在對土壤侵蝕量進(jìn)行檢測的過程中,主要是依靠拍攝到的研究區(qū)圖像作為依據(jù)進(jìn)行判斷,實現(xiàn)土壤侵蝕圖像的讀取和預(yù)處理。要做到有效地控制國內(nèi)土壤侵蝕的加劇,準(zhǔn)確預(yù)測是關(guān)鍵的一步[4-5]。通過提取圖像中所顯示出的特征,對其進(jìn)行分類統(tǒng)計,得到侵蝕程度的分類檢測結(jié)果。土壤侵蝕圖像的提取流程見圖1。
圖1 圖像特征提取流程
在圖1流程中,首先圖像需要灰度化,進(jìn)行灰度化處理的原因是灰度圖像是一個二維數(shù)組矩陣,灰度值是這個二維數(shù)矩陣歸一化的表現(xiàn)?;叶葓D像處理方法使操作更加簡單便捷,對后續(xù)處理的幫助極大[6-7]。圖像灰度處理方法有3種,本文采用的是加權(quán)平均法。即:
(1)
圖像中的每個像素由3個相同R、G和B分量表示。任何顏色都可以由3種基本顏色合成。WR、WG和WB分別是R、G和B的權(quán)重。由于綠色和藍(lán)色分別是最敏感和最遲鈍的,根據(jù)這種情況進(jìn)行處理得到的灰度圖像更為合理。
圖像在分析處理的各個環(huán)節(jié)中,都有可能因為圖像采集過程中各種外界因素的影響而降低圖像質(zhì)量,影響到模糊圖像的特征,對于分析結(jié)果非常不利,因此必須對圖像進(jìn)行去噪處理。本文去噪中采用的是均值濾波,它是一種低通濾波器,屬于一種線性濾波器[8-9]。它可以減少圖像灰度的急劇變化,從而降低噪聲,去除圖像中不相關(guān)的特征細(xì)節(jié)。但同時,均值濾波操作由于其高頻特性,也會使邊緣變得模糊。設(shè)圖像f(x,y)有M×M個像素,用非加權(quán)均值濾波后得到的圖像g(x,y)可以表示為:
(2)
式中:S為(x,y)的去心鄰域;N為集合S包含的總像素數(shù)。通常情況下,N值越大,即鄰域越大,則平滑效果越理想。
圖像處理中還有一種常用的方法即圖像二值化法,在圖像預(yù)處理中是非常重要的。圖像經(jīng)過二值化后,能夠?qū)⒂杏眯畔⒑蜔o用信息的對比度最大化,突出有用的信息,在模式識別等方面都有著重要的應(yīng)用。
圖像邊緣檢測是監(jiān)測圖像邊緣特征的常用方法,在一個圖像中,邊緣位置往往是圖像特征的斷點邊界,比如對比度發(fā)生強烈變化等等。所以利用邊緣值的異常變化就能識別出特征信息并加以保存,去除掉無用的部分,可以大大減少數(shù)據(jù)工作量。
用圖像的形態(tài)學(xué)處理設(shè)計出最能分辨的結(jié)構(gòu)元素(形狀和尺寸)是成功的關(guān)鍵[10-11]。結(jié)構(gòu)元素的選擇一般應(yīng)該比圖像的幾何結(jié)構(gòu)簡單,而且凸性很強,數(shù)學(xué)形態(tài)學(xué)即在圖像形態(tài)學(xué)處理中合理地提供了一種分析圖像形狀的工具。
膨脹處理需要指定結(jié)構(gòu)元素,并利用結(jié)構(gòu)元素對圖像進(jìn)行變換提取信息。因此,形態(tài)學(xué)處理成功的關(guān)鍵是結(jié)構(gòu)元素的形狀和尺寸的設(shè)計。通過一系列展開操作,可以填充圖像中的孔洞和圖像邊緣的凹陷,形成連通區(qū)域[12-13]。也就是說,擴(kuò)展形狀操作的效果是在二值圖像中對目標(biāo)進(jìn)行生長或粗化,粗化的范圍和方向由結(jié)構(gòu)元素的大小和形狀控制。設(shè)某圖像Z上有兩個集合A和B,用B對A膨脹,其過程見圖2。
圖2 膨脹過程
根據(jù)上述過程,得到膨脹公式:
(3)
由式(3)可知,方形結(jié)構(gòu)元素B到集合A的整體擴(kuò)展是所有位移的集合,a和b具有相同的單元。圖2顯示了擴(kuò)展到a的結(jié)果。在完成形態(tài)學(xué)處理后,通過標(biāo)記,得到圖像特征。小流域土壤侵蝕圖像特征提取后,該模型構(gòu)建還需要利用地理信息系統(tǒng)(GIS)提取出風(fēng)力、土質(zhì)結(jié)構(gòu)、地形地貌、利用類型等因子。至此,完成小流域土壤侵蝕圖像特征及類型因子的提取。
在SVM之前,有兩種模型比較有代表性,分別是通用土壤流失方程(USLE)和土壤侵蝕預(yù)報模型(WEPP)。這兩種模型各有弊端,USLE的問題主要在于構(gòu)建模型的數(shù)據(jù)來源于同一地區(qū)的反復(fù)試驗,無法形成普適性,無法適用于不同的天氣環(huán)境、不同土質(zhì)地區(qū)。對于某地區(qū)的年平均土壤流失量的計算來說,方程式如下:
(4)
上式中各參數(shù)所表示的含義見表1。
表1 公式表示以及含義
由式(4)及表1可以看出,USLE屬于經(jīng)驗?zāi)P?,是通過大量實驗數(shù)據(jù)得出的。
而WEPP是最復(fù)雜的一種模型,它運用眾多子模型來對土壤侵蝕的物理過程進(jìn)行模擬,相對于經(jīng)驗?zāi)P蛠碚f精準(zhǔn)度要高很多,但在實際應(yīng)用中,由于模型所需的大部分?jǐn)?shù)據(jù)往往無法從各個不同的方面取得,因此會對模型的運作造成影響[14-15]。SVM的特點在一定程度上恰好可以彌補以上兩種模型的不足,可以幫助構(gòu)建一種新的土壤侵蝕分類模型,既能準(zhǔn)確分類又能廣泛使用并且有效推廣。這些弊端的存在,對于防治水土流失問題造成困擾,導(dǎo)致對土壤侵蝕無法進(jìn)行全面系統(tǒng)的研究。
支持向量機(jī)( SVM )的理論最早是來自于對兩類數(shù)據(jù)進(jìn)行分類這個問題的綜合處理,即能夠找到不同的超平面,使得各種類型的數(shù)據(jù)點都在超平面兩側(cè)處于不同的偏移區(qū)且盡可能地遠(yuǎn)離這些超平面,從而使這些超平面兩側(cè)的空白區(qū)域變得是最大的,見圖3。
圖3 SVM最優(yōu)超平面示意圖
圖3顯示了兩種二維線性可分離模式。圖3中的黑色和白色圓圈分別代表兩種樣品。H代表區(qū)分兩種正確樣品的基準(zhǔn)分類線。在圖3中有兩條相等的平行線,這兩條平行線上的兩個點分別稱為是H1和H2,這兩個點都是平行于兩條分類線上的直線,它們是所有樣品中最接近的兩個點,兩條平行線之間的直線距離也就是這兩種樣品之間的分類區(qū)間。得到最優(yōu)超平面的前提條件是先找出最優(yōu)的分類線,最優(yōu)的分類先在打開高位空間后就已經(jīng)成為最優(yōu)的超平面,而將這兩類樣品之間的分類區(qū)間間隙間隔最大的那條分類線即可稱為最優(yōu)的分類線。支持向量機(jī)在本質(zhì)上就是一個用于解決二分類問題的學(xué)習(xí)機(jī)器,土壤侵蝕量指的是連續(xù)變化數(shù)據(jù),因此需要利用支持向量機(jī)進(jìn)行數(shù)據(jù)回歸。目前支持向量機(jī)方法在本質(zhì)上,訓(xùn)練集數(shù)據(jù)X通過已在備選中的函數(shù)模型庫總選擇的函數(shù)映射到H中。根據(jù)式(4),可以得到線性回歸函數(shù)為:
(5)
數(shù)據(jù)經(jīng)過歸一化之后,可以使用SVM對其進(jìn)行分類檢測。至此,完成基于機(jī)器學(xué)習(xí)的小流域土壤侵蝕量檢測方法的研究。
為驗證本文設(shè)計的基于機(jī)器學(xué)習(xí)的小流域土壤侵蝕檢測方法具有一定的有效性,選擇某小流域區(qū)域進(jìn)行檢測方法測試。在檢測過程中,需要全面考慮整個土壤在侵蝕過程中可能產(chǎn)生作用的所有因素,選取當(dāng)?shù)氐膮?shù)進(jìn)行建模。根據(jù)環(huán)境因子的特性,得到具體的變量參數(shù),見表2。
表2 研究區(qū)土壤侵蝕模型參數(shù)
將上述研究區(qū)的相關(guān)參數(shù)輸入到檢測平臺Matlab中,并利用SVM-C分類功能,在該環(huán)境下完成檢測預(yù)測工作。對于本文的檢測方法,支持向量機(jī)的懲罰系數(shù)C和超參數(shù)P這兩個參數(shù)對最終的預(yù)測結(jié)果影響很大。因此,選擇合適的參數(shù)值是非常重要的。軟件包中沒有參數(shù)選擇功能,只能通過設(shè)置C值和P值的范圍和步長來選擇最佳的參數(shù)組合。以測試數(shù)據(jù)預(yù)測準(zhǔn)確率的高低作為判斷參數(shù)優(yōu)劣的標(biāo)準(zhǔn)。準(zhǔn)確率計算方式為:
(6)
在試驗區(qū)內(nèi),設(shè)置若干的土壤侵蝕檢測點,分別使用本文方法和傳統(tǒng)的方法在檢測點進(jìn)行檢測。為了驗證本文方法的檢測精度,在相同的實驗環(huán)境下,使用傳統(tǒng)方法對研究區(qū)統(tǒng)建進(jìn)行檢測,并對檢測結(jié)果進(jìn)行對比和分析。
在上述實驗條件下,得到兩種檢測方法的檢測結(jié)果,見圖4。
圖4 兩種檢測方法的檢測結(jié)果
將兩種方法的檢測結(jié)果與實際結(jié)果進(jìn)行對比,不同侵蝕強度的面積統(tǒng)計見表3。
表3 不同檢測方法土壤侵蝕面積
從表3的數(shù)據(jù)可以計算出,本文方法的檢測面積與實際面積之間的誤差率約為2.6%;傳統(tǒng)方法的檢測面積與實際面積之間的誤差率約為77.1%。整體預(yù)測準(zhǔn)確率有所提高,由此可以判定本文設(shè)計的基于機(jī)器學(xué)習(xí)的小流域土壤侵蝕量檢測方法在土壤侵蝕強度分類的過程中具有一定的準(zhǔn)確度。
支持向量機(jī)方法和傳統(tǒng)的檢測方法都屬于集中式參數(shù)預(yù)測方法。這種方法具有即使在缺乏數(shù)據(jù)的情況下也能使用的特點,它廣泛適用于參數(shù)變化不大的系統(tǒng)。在缺乏水文地質(zhì)資料、系統(tǒng)結(jié)構(gòu)不明確的情況下,該靈活的、適用性強的地區(qū)土壤侵蝕量預(yù)測模型往往能得到可接受的模擬和預(yù)測結(jié)果。在此基礎(chǔ)上,將支持向量機(jī)方法應(yīng)用于小流域水土流失預(yù)測,取得了較好的效果。