武欣慧, 劉鐵軍
(1.內蒙古農業(yè)大學,內蒙古呼和浩特 010050;2.水利部牧區(qū)水利科學研究所,內蒙古呼和浩特 010020;3.內蒙古大學,內蒙古呼和浩特 010025)
?
基于最大熵理論的黑土地土壤風蝕主導因子概率密度函數
武欣慧1, 劉鐵軍2,3
(1.內蒙古農業(yè)大學,內蒙古呼和浩特 010050;2.水利部牧區(qū)水利科學研究所,內蒙古呼和浩特 010020;3.內蒙古大學,內蒙古呼和浩特 010025)
土壤風蝕是一個復雜的過程,影響因素眾多。嚴重的土壤風蝕會引起土壤質地變粗,結構變壞,土壤肥力下降,可持續(xù)生產能力降低,尤其東北黑土地耕作土壤疏松,抗蝕能力弱,水土流失日趨嚴重。眾多因子對風蝕結果的影響是一個隨機連續(xù)的概率事件,最終結果反映在風蝕量上。一次土壤風蝕可看作各變量隨機組合作用于地表土的連續(xù)分布事件。為了將事件明了化,引入最大熵原理對風蝕變量尋找其熵概率密度函數,而目前運用最大熵原理來研究土壤風蝕的相關成果甚少。該方法對風蝕建模的篩選模型變量具有重要意義。
黑土地;風蝕;最大熵
土壤風蝕是一個復雜的過程,影響因素眾多,如氣溫、空氣濕度、風速、氣壓、地表土壤含水量、土壤質地、地表覆蓋度、地表粗糙度等[1]。眾多因子對風蝕結果的影響是一個隨機連續(xù)的概率事件,最終結果反映在風蝕量上。嚴重的土壤風蝕會引起土壤質地變粗,結構變壞,土壤肥力下降,可持續(xù)生產能力降低[2]。我國北方旱作農田土壤風蝕問題嚴重,影響范圍較大[3],尤其東北黑土地耕作土壤疏松、抗蝕能力弱[4]。由于降雨、風力和長期以來人口增加導致的過度墾殖等不合理開發(fā)利用,該區(qū)水土流失日趨嚴重[5]。一次土壤風蝕可看作各變量隨機組合作用于地表土的連續(xù)分布事件。為了將事件明了化,引入最大熵原理,對風蝕變量尋找其熵概率密度函數,通過求解得出概率密度函數方程式,得知在風蝕發(fā)生過程中各因子的概率分布情況,進而辨別風蝕主要影響因子的影響時段,最終將風蝕系統(tǒng)過程的混沌狀態(tài)清晰化、數值化。目前,運用最大熵原理來研究土壤風蝕的相關成果甚少[6]。該方法對風蝕建模的篩選模型變量具有重要意義。
1.1 信息熵的定義及基本性質
熵是由Clausius[7]于1865年首次提出的一個概念,主要用來衡量一個系統(tǒng)中分子運動的混亂程度。它是一個極其重要的物理量,但又以其抽象隱晦、難以理解而著稱。熵作為一個狀態(tài)函數,其含義非常豐富。在熱力學中,它是不可用能的度量;在統(tǒng)計物理學中,它是系統(tǒng)微觀態(tài)數目的度量。在不同場合,針對不同對象,熵可以作為系統(tǒng)的混亂性或無序度。1948年,信息科學的創(chuàng)始人貝爾實驗室的美國電氣工程師香農(Shannon C.E.)為研究信息的不確定性,依據熱力學中熵的概念,把通信過程中信源信號的平均信息量稱為熵,使熵概念的應用領域又獲得史無前例的擴展。在信息科學中,熵是衡量系統(tǒng)不確定性程度的一個量度。信息論中的熵有時被稱為“信息熵”或“香農熵”。信息熵的出現為現代信息論奠定科學理論基礎[8]。
如果把一個離散信源表示為
(1)
隨機變量X取值xi時的先驗概率為pi,其中i=1,2,3,…,n。
p(X=xi∩X=xj)=0 (i≠j)
(2)
(3)
pi≥0
(4)
對于該信源只有部分知識,即信源具有隨機不確定性,可用先驗概率分布(p1,p2,…,pn)來描述。若有一函數(p1,p2,…,pn),則要求它滿足以下條件:①對于固定的n來說,H是p1,p2,…,pn的連續(xù)函數;②如果所有pi相等,則H(1/n,1/n,…,1/n)是n的單調遞增函數;③若將一試驗分解成多個相繼的試驗,則原先的H值應為分解后多個試驗的各個相應H值的加權和。
滿足上述3個條件的測度H具有唯一形式,即
(5)
上述3個條件也是對要描述該樣本窨不確定程度的要求,即信息熵的定義。其中,常數k取決于所選用的單位,通常取k=1。為了便于數學運算,常取自然數e為底,則式(5)可表示為:
(6)
式中,pi為信息源中第i種信號出現的概率;-lnpi為pi帶來的信息量。
H(x)具有這樣的意義,即在試驗進行之前,它是試驗結果不確定性的量度;在試驗完成之后,它是從試驗中所得到的信息的量度(信息量)。信息熵表征信源整體的統(tǒng)計特性,是總體的平均不確定性的量度。對于某一特定的信源,其信息熵只有一個。若統(tǒng)計特性不同,則其熵也不同。
對于連續(xù)信源,X的分布以概率密度函數p(x)來描述。仿照式(6)可以寫出X具有連續(xù)分布情況下熵的表達式為:
(7)
1.2 最大熵原理
熱力學統(tǒng)計物理中有熵增加原理,在信息論中也有對應的關于信息熵的著名定理——最大熵原理。按最大熵原理,筆者從全部相容的分布中挑選這樣的分布。它是在某些約束條件(通常是給定的某些隨機變量的平均值)下使信息熵達到極大值的分布。這是因為信息熵取得極大值時對應的一組概率分布出現的概率占絕對優(yōu)勢。從理論上可以證明這一點。
任何物質系統(tǒng)除了受或多或少的外部約束外,其內部總是具有一定的自由度。這種自由度導致系統(tǒng)內各元素處于不同的狀態(tài)。而狀態(tài)的多樣性以及狀態(tài)的豐富程度(混亂程度、復雜程度)的定量計量標尺就是熵。熵最大就是事物狀態(tài)的豐富程度自動達到最大值。換句話說,事物總是在約束下爭取(或呈現)最大的自由權。人們把這看作是自然界的根本原則。
Shannon解決了不確定性的度量問題,但這里還存在如何進行概率分配的問題。對于一個隨機過程,概率密度事先是未知的且對于觀測值的概率分配,可以有無限多組。Jaynes提出,當根據部分信息進行推理時,必須選擇這樣一組概率分配,它應具有最大的熵,并且服從一切已知的信息。這是能夠做出的唯一的無偏分配;使用任何其他分配,就等于對原來所有信息做了隨意假設。這一統(tǒng)計推理準則被稱為最大熵原理[9]。
在數學上,最大熵原理可表示為:
(8)
(9)
(10)
pi≥0
(11)
式中,gj(x)為可觀測的函數值;E[gj(x)]為相應的均值。
Tribus曾證明,正態(tài)分布、伽瑪分布及指數分布等都是最大熵原理的特殊情況。對于連續(xù)變量x,該模型為:
(12)
約束條件為:
(13)
(14)
設拉格朗日函數為L,拉格朗日乘子為λ0,對于等式約束的極值問題式(12)~式(14),就有
(15)
得出
(16)
式(16)就是最大熵概率密度函數的解析形式,也就是上述優(yōu)化問題的一個最優(yōu)解。
一般的,拉格朗日乘子法的法則可敘述如下:欲求n元函數f(x1,x2,…,Xn)在m個(m>n)約束條件
(17)
下的條件極值,可用常數λ1,λ2,…,λm依次乘f,ψ1,ψ2,…,ψm,把結果加起來,得函數
F(x1,x2,…,xm)=f+λ1φ1+λ2φ2+…+λmφm
(18)
然后,列出F(x1,x2, …,xn)無約束條件時具有極值的必要條件。
(19)
這n個方程與m個方程聯立解出n+m個x1,x2,…Xn,λ1,λ2,…,λm的值,而其中x1,x2,…,xn就是可能的極值點,稱為駐點。其中,H(x)是分布函數f(x)的泛函數。而對于給定情況下的隨機事件,若希望得到其特定意義的解析表達式,需確定參數λ0,λ1,λ2,…,λn。這屬于一個多參數尋優(yōu)問題。
選取2010~2012年在風沙運動頻繁的春季測量的2 m高風速(x1)、氣溫(x2)和空氣濕度(x3)3個風蝕主導因子。基于上述理論分析,利用Matlab編制相應的計算程序,得出主導因子分布規(guī)律的熵概率密度函數的表達式。在黑土地風蝕過程中,風速、氣溫、空氣相對濕度的熵概率密度函數表達式為:
根據上述熵概率密度函數,將觀測變量樣本代入,得出風速、氣溫、空氣相對濕度的熵概率密度函數分布規(guī)律擬合曲線(圖1)。
應用最大熵原理尋找風蝕主導因子的概率密度函數,得出概率密度曲線,可以直觀地發(fā)現風蝕發(fā)生過程影響因子數值區(qū)間出現的概率情況,進一步對試驗數據的有效性、風蝕時段進行辨別。通過對最大熵原理在風蝕影響因子統(tǒng)計分布模型中應用的研究,突出利用最大熵原理風蝕影響因子確定隨機變量統(tǒng)計分布模型的優(yōu)越性,同時為研究土壤的風蝕規(guī)律奠定基礎。但是,利用最大熵原理得到的風蝕影響因子熵概率密度函數,受樣本容量的影響較大,所以在利用該方法時,要事先采集盡量多的實測數據資料以提高精度。
[1] 吳正.風沙地貌與治沙工程學[M].北京:科學出版社,2003.
[2] 麻碩士,陳智.土壤風蝕測試與控制技術[M].北京:科學出版社,2010.
[3] 董治寶,董光榮,陳廣庭.以北方旱作農田為重點開展我國的土壤風蝕研究[J].干旱區(qū)資源與環(huán)境,1996(2):31-37.
[4] 劉鐵軍,趙顯波,趙愛國,等.東北黑土地土壤風蝕風洞模擬試驗研究[J].水土保持學報,2013,27(2):67-70.
[5] 謝軍.黑龍江省黑土區(qū)水土流失危害及治理途徑[J].水土保持通報,1991(5):61-64.
[6] 鄒春霞,申向東,李春娥.土壤風蝕影響因子分布規(guī)律研究的最大熵方法[J].農業(yè)環(huán)境科學學報,2007,26(6):2095-2098.
[7] 馮端,馮步云.熵[M].北京:科學出版社,1992.
[8] 姜丹.信息理論與編碼[M].合肥:中國科學技術大學出版社,1992.
[9] 吳乃龍,袁素云.最大熵方法[M].長沙:湖南科學技術出版社,1991.
Probability Density Function about the Maximum Entropy Theory of Black Land Soil Wind Erosion Dominating Factor
WU Xin-hui1,LIU Tie-jun2,3
(1. Inner Mongolia Agricultural University, Hohhot, Inner Mongolia 010050; 2.Institute of Water Resources for Pastoral Area, Ministry of Water Resources, Huhhot, Inner Mongolia 010020; 3.Inner Mongolia University, Hohhot, Inner Mongolia 010025)
Soil wind erosion is a complex process,it is affected by many factors.Serious soil wind erosion can cause soil texture,structures deteriorate,soil fertility decline, sustainable production ability to reduce.Especially in the northeast tillage soil loosen, erosion resistance weak,soil and water loss is becoming more and more serious.The results of many factors on wind erosion is a random probability event,the final result reflects on the amount of wind erosion.A soil wind erosion can be combined as the random variables in overburden continuous distribution incident,in order to clear the incident,the introduction of the maximum entropy principle of wind erosion variables to find its entropy probability density function and using the maximum entropy principle to the relevant achievements of research is little on soil wind erosion.This method is of great importance in the screening model of variable wind erosion modeling.
Black soil; Wind erosion; Maximum entropy
國家自然科學家基金項目(51579157);內蒙古自然科學基金項目(2015MS0387);中國水科院科研專項項目(JSJBKY1556)。
武欣慧(1972- )女,內蒙古烏拉特前旗人,講師,碩士,從事荒漠化防治與教學工作。
2015-11-09
S 157.1
A
0517-6611(2015)35-003-02