亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進決策樹模型的礦區(qū)土地復(fù)墾適宜性評價

        2016-02-09 12:31:07王世東劉毅王新闖吳超
        中國水土保持科學(xué) 2016年6期
        關(guān)鍵詞:決策樹條件分類

        王世東,劉毅,王新闖,吳超

        (河南理工大學(xué)測繪與國土信息工程學(xué)院,454000,河南焦作)

        基于改進決策樹模型的礦區(qū)土地復(fù)墾適宜性評價

        王世東,劉毅,王新闖?,吳超

        (河南理工大學(xué)測繪與國土信息工程學(xué)院,454000,河南焦作)

        針對礦區(qū)傳統(tǒng)的土地復(fù)墾適宜性評價方法,運用模糊數(shù)學(xué)的隸屬函數(shù)法,對決策樹的ID3算法加以改進,建立基于改進決策樹的礦區(qū)土地復(fù)墾適宜性評價方法。以平禹二礦為研究區(qū),將改進的評價模型運用到塌陷區(qū)土地復(fù)墾適宜性評價中,選取7個評價指標作為測試屬性,提取100個已確定復(fù)墾方向的評價單元作為樣本,運用改進的ID3算法,構(gòu)建研究區(qū)土地復(fù)墾適宜性評價決策樹,然后運用生成的決策樹分類規(guī)則,對各評價單元按其屬性進行分類,最終確定各評價單元的復(fù)墾方向,并將分類結(jié)果與模糊綜合評價方法得到的評價結(jié)果進行對比分析。結(jié)果表明:基于改進決策樹模型的礦區(qū)土地復(fù)墾適宜性評價方法,不依賴于經(jīng)驗知識,依靠樣本的自主學(xué)習(xí),制定分類規(guī)則,得到的分類結(jié)果較為客觀合理,而且決策樹分類規(guī)則確定后,可以直接應(yīng)用于同一地區(qū)的其他待評價區(qū),且分類過程簡單明了,便于操作,避免傳統(tǒng)評價方法中較為繁瑣和復(fù)雜的計算過程,提高礦區(qū)土地復(fù)墾適宜性評價的效率,為礦區(qū)土地復(fù)墾適宜性評價工作提供一種新的思路。

        ID3算法;改進決策樹;礦區(qū);土地復(fù)墾;適宜性評價

        土地復(fù)墾是保證土地資源可持續(xù)利用的重要途徑之一,而土地復(fù)墾適宜性評價又是土地復(fù)墾項目投資前期工作的中心環(huán)節(jié)和項目決策的依據(jù),在土地復(fù)墾工作中起著重要的作用[1]。不同評價方法的選取,將影響土地復(fù)墾適宜性評價結(jié)果的準確性和合理性,進而影響土地復(fù)墾的決策工作。目前,土地復(fù)墾適宜性評價方法多采用極限條件法、指數(shù)和法、模糊綜合評價法、可拓法和人工神經(jīng)網(wǎng)絡(luò)評價法等[2];但是目前尚沒有一個統(tǒng)一、全面的理論體系,各評價方法存在一些不足。如極限條件法適宜性等級偏低,指數(shù)和法主觀性較強,可拓法體系不夠完善等;因此,有關(guān)土地復(fù)墾適宜性評價方法的研究,還有待進一步完善與發(fā)展。

        礦區(qū)土地復(fù)墾適宜性評價的實質(zhì)是按照某種評價規(guī)則,對復(fù)墾后土地未來用途的一種分類,決策樹是數(shù)據(jù)挖掘的一種分類方法,它根據(jù)樣本學(xué)習(xí)得到分類規(guī)則,并根據(jù)生成的分類規(guī)則,對待分類樣本進行歸類;因此,將決策樹分類方法應(yīng)用于礦區(qū)土地復(fù)墾適宜性評價具有可行性與合理性。目前常用的決策樹分類算法有ID3算法、C4.5算法和CART算法等[3]。在這些算法中,C4.5算法對連續(xù)數(shù)據(jù)的處理過程較為復(fù)雜,工作量較大,不利于現(xiàn)實的工程應(yīng)用;CART算法是一種大樣本的統(tǒng)計分析方法,樣本量較大時,效率較高,不適用小樣本數(shù)據(jù)的處理;而本文采用簡便易行、便于工程應(yīng)用的ID3算法構(gòu)建分類決策樹,進行土地復(fù)墾適宜性評價。但是,傳統(tǒng)的ID3算法無法處理連續(xù)型數(shù)據(jù),針對這一問題,本文將模糊數(shù)學(xué)的隸屬度概念引入ID3算法,運用隸屬函數(shù)法對連續(xù)數(shù)據(jù)進行處理,對ID3算法進行改進,擴展了ID3算法的適用范圍,建立基于改進ID3算法的決策樹分類模型,并運用改進模型,對平禹二礦待復(fù)墾地適宜性進行評價,以期為我國礦區(qū)土地復(fù)墾適宜性評價工作,提供一種新的思路,為礦區(qū)土地可持續(xù)利用與生態(tài)恢復(fù)、以及生態(tài)環(huán)境保護提供參考,并為礦區(qū)水土流失防治提供重要科學(xué)依據(jù)。

        1 研究區(qū)概況

        研究區(qū)河南平禹二礦位于禹州市鴻暢鎮(zhèn)許家溝村(E 113°13′17″~113°16′15″,N 34°05′54″~34°06′31″)。屬于低山丘陵區(qū),沖溝發(fā)育,地貌復(fù)雜,為侵蝕地形,多為深10~20 m左右的南北向的黃土沖溝,其中較深的溝底往往有基巖出露。區(qū)內(nèi)最高處標高+371.44 m(禹王山),最低處為+136.00 m,最大相對高差235.44 m。土地利用類型主要有耕地、林地、草地和交通運輸用地等;地形起伏不大,地表塌陷深度在0~3 m之間,部分區(qū)域裂縫發(fā)育較大,地表植被出現(xiàn)傾倒。

        2 研究方法

        2.1 基于改進ID3算法的決策樹分類模型

        采用ID3算法,生成決策樹分類模型,將模糊數(shù)學(xué)中的隸屬函數(shù)法引入ID3算法,對其進行改進,建立基于改進ID3算法的決策樹分類模型。

        2.1.1 ID3算法原理 ID3是一種經(jīng)典的決策樹分類算法,其中,根節(jié)點被賦予一個最好的屬性,然后對該屬性的每個取值生成相應(yīng)的分支,在每個分支上又生成新的節(jié)點[4]。ID3算法原理如下:

        設(shè)E=F1×F2×…×Fn是n維有窮向量空間,其中:Fj是有窮離散符號集,E中的元素e=〈V1,V2,…,Vn〉稱為例子[4],Vj∈Fj,j=1,2,…n。設(shè)PE和NE是E的2個例子集,分別叫正例集和反例集[4]。假設(shè)向量空間E中的正例集P{E}和反例集N{E}的大小分別為P、N,由決策樹的基本思想可知,ID3算法是基于如下2種假設(shè):

        1)在向量空間E上的一棵正確決策樹,對任意樣本集的分類概率同E中的正反例的概率一致。

        2)一棵決策樹對一樣本集做出正確類別判斷所需的信息熵:

        如果以屬性A作為決策樹的根,A具有V個值{V1,V2,…,Vv},它將E分成V個子集{E1,E2,…, Ev},假設(shè)Ei中含有Pi個正例和Ni個反例,那么子集Ei所需的期望信息是I(P1,N1),以屬性A為根所需的期望熵:

        其中:

        以A為根的信息增益:

        ID3選擇Gain(A)最大,也就是E(A)最小的屬性A*作為根結(jié)點,對A*的不同取值對應(yīng)的E的V個子集Ei遞歸,調(diào)用上述過程生成A*的子結(jié)點B1, B2,…,Bv。

        ID3基本原理是基于2類問題,但由決策樹的基本思想很容易擴展到多類[4]。設(shè)樣本集S共有C類樣本,每類樣本數(shù)為Pi,i=l,2,…,C。如果以屬性A作為決策樹的根,A具有v個值V1,V2,…,Vv,它將E分為v個子集El,E2,…,Ev,假設(shè)Ei中含有第j類樣本的個數(shù)為Pij,j=1,2,…,C,那么子集Ei熵:

        以A為根分類后的熵:

        選擇屬性A使Entorpy(E|A)最小,則信息增益將增大。

        2.1.2 數(shù)據(jù)篩選與處理 使用ID3算法構(gòu)建決策樹前,需要對樣本的屬性數(shù)據(jù)進行篩選與處理,這是由于樣本數(shù)據(jù)中,往往包含過多繁雜冗余的數(shù)據(jù),這些數(shù)據(jù)并不會影響決策樹的分類結(jié)果,屬于無效屬性,如市場調(diào)查中的姓名、電話等屬性。數(shù)據(jù)的預(yù)處理工作一般包括數(shù)據(jù)的選擇、凈化(消除冗余數(shù)據(jù))、轉(zhuǎn)換和歸納等幾個步驟[5]。一般來說,ID3算法的數(shù)據(jù)處理過程就是對于樣本屬性中,與分類結(jié)果無關(guān)以及某些可能值大于7種,又不能歸納的屬性,做刪除處理。由于ID3算法無法處理連續(xù)型數(shù)據(jù),而筆者對樣本屬性數(shù)據(jù)的處理還包括連續(xù)數(shù)據(jù)的定性化轉(zhuǎn)換。對于樣本數(shù)據(jù)中的連續(xù)型數(shù)據(jù),通過隸屬函數(shù)法將其分類,并將其類別定性表示,從而實現(xiàn)連續(xù)數(shù)據(jù)的定性化表示。

        常用的隸屬函數(shù)確定方法有二元對比排序法、指派法和模糊統(tǒng)計法等[6]。筆者對于定量描述的連續(xù)型屬性,根據(jù)實際情況,選用指派函數(shù)二元對比排序法等,確定其隸屬函數(shù)。隸屬函數(shù)確定以后,將連續(xù)型數(shù)據(jù)的數(shù)值代入隸屬函數(shù),得出其評語,所得評語即為其轉(zhuǎn)換后的定性屬性。這樣就實現(xiàn)連續(xù)數(shù)據(jù)的定性化,轉(zhuǎn)換后的數(shù)據(jù)就可以運用ID3算法進行處理。

        2.1.3 計算屬性的熵 樣本的屬性分為決策屬性與條件屬性,決策屬性即最終的分類結(jié)果,條件屬性就是構(gòu)建決策樹分類模型的指標體系,它直接決定決策樹的分類結(jié)果。一般來說,條件屬性越多,構(gòu)建的決策樹就越復(fù)雜,其分類結(jié)果也越精確。

        ID3采用基于信息熵定義的信息增益,來選擇內(nèi)節(jié)點的測試屬性,熵表示任意樣本集的純度[7]。設(shè)S是n個數(shù)據(jù)樣本的集合,將樣本集劃分為C個不同的類Ci(i=1,2,…,c),每個類Ci含有的樣本數(shù)目為ni,則S劃分為c個類的信息熵或期望信息:

        式中Pi=ni/n,表示S中樣本屬于第i類Ci的概率。

        假設(shè)屬性A的所有不同值的集合為Xa,Sv是S中屬性A的值為v的樣本子集,即Sv={s∈S|A· (s)=v},在選擇屬性A后的每一個分支節(jié)點上,對該節(jié)點的樣本集Sv分類的熵為E(Sv)。選擇A產(chǎn)生的期望熵定義為每個子集Sv的熵的加權(quán)和,權(quán)值為屬于Sv的樣本占原始樣本S的比例即期望熵:

        式中:E(Sv)是將Sv中的樣本劃分到c個類的信息熵。屬性A相對樣本集合S的信息增益Gain(S,A)的計算公式為

        式中:Gain(S,A)是指因知道屬性A的值后產(chǎn)生的熵的期望壓縮。其值越大,表示屬性A對分類提供的信息就越多。

        2.1.4 決策樹的生成 由于ID3算法是將每個節(jié)點選擇信息增益Gain(S,A)最大的屬性作為測試屬性;因此,首先根據(jù)式(7),求出決策屬性的熵值,然后根據(jù)式(8)和式(9),求出每個條件屬性的信息增益,選擇信息增益最大的條件屬性作為決策樹的根節(jié)點。根節(jié)點生成以后,對于每個分支,再分別計算其余條件屬性的信息增益,選擇信息增益最大的條件屬性為子節(jié)點,以此類推,直到每條分支的最后節(jié)點均為決策屬性為止,這樣就生成了最終的決策樹。

        2.2 評價模型的建立

        2.2.1 初步復(fù)墾方向的確定 土地的初步復(fù)墾方向,一般要根據(jù)當?shù)卣卟⒔Y(jié)合民眾的意愿來制定,它代表了當?shù)厝罕妼ν恋貜?fù)墾結(jié)果的期望。本文結(jié)合研究區(qū)的實際情況,確定其土地復(fù)墾適宜性評價的初步復(fù)墾方向為耕地、林地和草地,對于決策樹分類模型來說,這些初步的復(fù)墾方向即為最終分類結(jié)果的方向,即決策樹模型的決策屬性;因此,生成該決策樹的決策屬性為耕地、林地和草地。

        2.2.2 評價單元的劃分 進行土地復(fù)墾適宜性評價,首先要劃分評價單元,評價單元是土地的自然屬性和社會經(jīng)濟屬性基本一致的空間客體[8]。由于全國第2次土地調(diào)查是按照用地類型來劃分的圖斑,每個圖斑的用地類型都是單一的,符合上述要求;因此,本文把全國第2次土地調(diào)查數(shù)據(jù)中,研究區(qū)的土地利用現(xiàn)狀圖的每個圖斑作為一個評價單元。

        2.2.3 決策樹條件屬性的確定 確定初步的復(fù)墾方向,即確定了決策樹模型的決策屬性,接下來需要確定決策樹模型的條件屬性,也就是確定研究區(qū)土地復(fù)墾適宜性評價模型的評價指標。依據(jù)TD/T 1031.3—2011《土地復(fù)墾方案編制規(guī)程第3部分:井工煤礦》和TD/T 1036—2013《土地復(fù)墾質(zhì)量控制標準》,在調(diào)研的基礎(chǔ)上,結(jié)合研究區(qū)土地損毀特點,選取影響復(fù)墾工作的地面坡度、有效土層厚度、土壤質(zhì)地、土地損毀程度、土源保證率、交通條件和灌溉條件這7個屬性(或稱評價指標),作為土地復(fù)墾適宜性評價決策樹模型的條件屬性,也就是土地復(fù)墾適宜性評價模型的指標體系。

        2.2.4 決策樹分類模型的建立 依據(jù)空間分布均勻和樣本級別分布均勻兩大原則,選取了100個地塊作為決策樹訓(xùn)練樣本集,表1為其中部分樣本的屬性數(shù)據(jù)。

        根據(jù)上述決策樹模型的生成流程,首先對樣本的原始數(shù)據(jù)(表1)進行處理,從表面上無法確定這7個樣本屬性信息與決策屬性是否存在關(guān)系;因此,保留樣本的所有屬性,即這些屬性均為決策樹模型的條件屬性。在這些條件屬性中,灌溉條件、土壤質(zhì)地、損毀程度和交通條件為離散型數(shù)據(jù),而地面坡度、土層厚度和土壤侵蝕度為連續(xù)型數(shù)據(jù),需根據(jù)隸屬函數(shù)法進行離散化處理。以土壤侵蝕度為例,其分布規(guī)律滿足梯形分布特征;因此,采用指派法中的梯形分布隸屬函數(shù),計算它們隸屬于每種評語的隸屬度,梯形分布隸屬函數(shù)如下所示:

        表1 研究區(qū)評價樣本數(shù)據(jù)集(部分)Tab.1 Sample data set for evaluation of the studied area(Partially)

        根據(jù)土壤侵蝕程度的數(shù)值分布特征,確定其隸屬函數(shù)為:

        將每個指標的土壤侵蝕度的實測值代入上述隸屬函數(shù),計算其隸屬于這3種評語的隸屬度,按照最大隸屬度原則,將其確定為評語集中隸屬度最大的評語。以樣本7為例,其土壤侵蝕度的實測值為18,將其實測值代入隸屬函數(shù)中,得到其隸屬于每種評語的隸屬度為(0.4,0.6,0),即其隸屬于輕度的隸屬度為0.4,隸屬于中度的隸屬度為0.6,隸屬于重度的隸屬度為0,根據(jù)最大隸屬度原則,確定其土壤侵蝕度為中度。以此類推,對于地面坡度和土層厚度2個條件屬性進行同樣的處理,從而實現(xiàn)樣本數(shù)據(jù)的完全離散化。然后對屬性條件相同的樣本數(shù)量進行統(tǒng)計,統(tǒng)計整理后的數(shù)據(jù)見表2。

        表2 處理后的研究區(qū)評價樣本數(shù)據(jù)集Tab.2 Processed sample data set for evaluation of the studied area

        由表2可知,條件屬性中的連續(xù)屬性都轉(zhuǎn)換成了離散型數(shù)據(jù)。其中地面坡度根據(jù)其實際數(shù)據(jù)的大小,用大、中、小來代替,而土層厚度則使用厚、中、薄等屬性來代替,整理后的數(shù)據(jù)就可以通過ID3算法來生成分類決策樹。根據(jù)ID3算法生成決策樹的流程,首先需要計算決策屬性的熵值,筆者決策樹的決策屬性有3種,即宜耕、宜林和宜草。其中宜耕樣本數(shù)為46,宜林為33,宜草為21,根據(jù)式(7)和式(8),求出決策屬性的熵值:

        整理后的樣本數(shù)據(jù)中,共有7個條件數(shù)據(jù),需求出每個條件屬性的信息增益,將信息增益最大的條件屬性作為根節(jié)點,這里以損毀程度為例進行說明。損毀程度分3組,分別為輕度、中度和重度,按照式(1),計算每個組別的熵,例如輕度損毀的樣本中,宜耕的樣本數(shù)為35,宜林的樣本數(shù)為22,宜草的樣本數(shù)為0,則輕度損毀的熵值I輕度=I(35,22,0)= 0.962 1,同理可計算出I中度=1.404 1,I重度=0。然后求出每個組的樣本數(shù)占總樣本數(shù)的比例,得到P輕度=57/100=0.57,P中度=0.31,P重度=0.12,則根據(jù)式(2),求出損毀程度的平均信息期望:

        E損毀程度=0.57×0.9621+0.31×1.4041+0=0.9837。根據(jù)式(9),求出損毀程度這一條件屬性的信息增益:

        G損毀程度=E決策-E損毀程度=1.4688-0.9837=0.4851。同理,依次求出每個條件屬性的信息增益分別為:G地面坡度=0.156 2,G灌溉條件=0.085 4,G土層厚度= 0.298 3,G土壤質(zhì)地=0.183 5,G土壤侵蝕度=0.098 7, G交通條件=0.132 9。從上述數(shù)據(jù)看出,損毀程度的信息增益最大;因此,將信息增益這一條件屬性作為根節(jié)點,得到?jīng)Q策樹的第1個分支(圖1)。

        圖1 決策樹分支示意圖Fig.1 Sketch map of branches in the decision tree

        圖2 完整決策樹示意圖Fig.2 Sketch map of the complete decision tree

        由圖1可知,損毀程度為重度的樣本全部為宜草型,說明這一條分支不可再分,則作為最終的葉子節(jié)點;對于輕度和中度損毀的樣本,則需重復(fù)上述步驟依次計算剩余條件屬性的信息增益,取信息增益最大的屬性作為下一個節(jié)點,知道每條分支都最終成為葉子節(jié)點,這樣就生成了完整的分類決策樹。最終生成的研究區(qū)土地復(fù)墾適宜性評價決策樹分類模型見圖2。

        從圖2可知,該決策樹結(jié)構(gòu)較為簡單,其樹深為5,節(jié)點數(shù)為9,屬于較為小型的決策樹。該決策樹中,并沒有出現(xiàn)交通條件這一條件屬性,這可能是由于樣本數(shù)量較少,分類規(guī)則不完整所致,也可能是因為交通條件對樣本分類無影響或影響很小,可以忽略,這里認為交通條件屬性為后者。分析可知,生成的決策樹由根節(jié)點損毀程度出發(fā),當樣本損毀程度為重度時,將其歸類為宜草類型,即其復(fù)墾方向為草地,當其損毀程度為輕度時,則將土層厚度作為下一個節(jié)點進行歸類。當樣本土層厚度為厚時,將其歸類為宜耕類型,為薄時歸為宜林類型;當土層厚度為中時,將土壤侵蝕度作為下一個分節(jié)點。土壤侵蝕度為輕度時,歸類為宜耕類型,重度或中度時歸類為宜林類型;當損毀程度為中度時,土壤質(zhì)地為下一個分節(jié)點。當為沙壤土?xí)r,歸類為宜草類型;當為壤土?xí)r,則將地面坡度作為下一分節(jié)點。地面坡度小時,歸為宜耕類型;地面坡度大時,將灌溉條件作為一下分節(jié)點,灌溉條件優(yōu)的歸為宜耕類型,差的為宜林地類。這樣就建立起了決策樹的分類規(guī)則,按照這一規(guī)則就可對待評價區(qū)的其他評價單元進行分類。由于交通條件對決策樹分類規(guī)則沒有影響,這一條件屬性可以剔除。

        將生成的決策樹分類模型應(yīng)用到研究區(qū)土地復(fù)墾適宜性評價中,首先對待評價單元的屬性數(shù)據(jù)進行整理,將其整理為表2所示格式,然后把每個評價單元的屬性依次帶入決策樹模型進行歸類,確定出每個評價單元最終的分類方向,即土地復(fù)墾的適宜性方向,最終土地復(fù)墾適宜性評價結(jié)果見表3。

        表3 決策樹模型土地復(fù)墾適宜性評價結(jié)果(部分)Tab.3 Evaluation results of land reclamation suitability by decision tree model(Partially)

        3 結(jié)果與分析

        為驗證評價結(jié)果的準確性,本文采用土地復(fù)墾適宜性評價較為常用的極限條件法,對研究區(qū)土地復(fù)墾適宜性進行評價,以便與本文提出的方法進行對比分析。極限條件法計算過程中,評價單元序號與本文提出的改進決策樹模型的相對應(yīng),極限條件法評價結(jié)果見表4。

        表4 極限條件法土地復(fù)墾適宜性評價結(jié)果(部分)Tab.4 Evaluation results of land reclamation suitability by limit condition method(Partially)

        表3與表4對比可知,這2種方法得出的適宜性評價結(jié)果基本一致,但是評價單元2和7,在改進決策樹評價模型中的評價結(jié)果為宜耕與宜林,在極限條件法中的評價結(jié)果變成了宜林與宜草,其評價等級均降低。經(jīng)統(tǒng)計,基于改進決策樹模型的評價結(jié)果中,研究區(qū)內(nèi)宜耕地面積365.87 hm2,宜林地98.83 hm2,宜草地97.98 hm2;而基于極限條件法的評價結(jié)果中,宜耕地面積為334.95 hm2,宜林地106.26 hm2,宜草地類121.47 hm2。2種方法得出的評價結(jié)果中,有92.50%的評價單元的評價結(jié)果一致;而評價結(jié)果不一致的評價單元中,極限條件法得出的評價結(jié)果等級均低于決策樹模型的結(jié)果等級。例如,在決策樹模型中評價結(jié)果為宜耕的單元,在極限條件法的評價結(jié)果中可能會變成宜林。這主要是因為極限條件法是基于系統(tǒng)工程中的“木桶原理”,強調(diào)主導(dǎo)限制因子的作用,評價單元的最終結(jié)果取決于條件最差的因子的質(zhì)量[10]。這樣就可能忽略了土地某種性質(zhì)的不足,可被其他性質(zhì)所部分彌補的情況,并且只是將某一項主要影響因子的適宜性等級作為總的評價等級,造成評價結(jié)果過于保守,也驗證了極限條件法適宜性等級偏低的缺點[11]。決策樹模型則是通過樣本學(xué)習(xí)來制定分類規(guī)則,它不依賴于經(jīng)驗知識,評價結(jié)果較為客觀合理。該方法比目前應(yīng)用較為廣泛的極限條件法具有更好的合理性。因為極限條件法評價得出的適宜性等級偏低,對于露天煤礦損壞土地較為適用,而對于井工開采的煤礦塌陷地來說,本文提出的改進決策樹模型,則具有更好的普適性與合理性[1213];因此,從以上2種方法對比分析,并結(jié)合實地調(diào)研,基于改進決策樹的礦區(qū)土地復(fù)墾適宜性評價模型得到的評價結(jié)果,比較符合研究區(qū)實際,復(fù)墾方向也較為合理,具有一定的應(yīng)用與參考價值。

        4 結(jié)論

        本文建立了一種基于改進決策樹模型的礦區(qū)土地復(fù)墾適宜性評價方法,該方法運用模糊數(shù)學(xué)的隸屬函數(shù)法,對決策樹的ID3算法加以改進,克服了ID3算法對于定量指標難以處理的問題,提高ID3算法的適用范圍。與極限條件法評價結(jié)果的對比分析表明,基于改進決策樹的礦區(qū)土地復(fù)墾適宜性評價方法不依賴于經(jīng)驗知識,依靠樣本的自主學(xué)習(xí)制定分類規(guī)則,得到的分類結(jié)果較為客觀合理,而且決策樹分類規(guī)則確定后,可以直接運用于同一地區(qū)的其他待評價區(qū),分類過程簡單明了,便于操作,避免傳統(tǒng)評價方法中較為繁瑣和復(fù)雜的計算過程,提高礦區(qū)土地復(fù)墾適宜性評價的效率,為礦區(qū)土地復(fù)墾適宜性評價工作提供了一種新的思路;然而,決策樹方法在土地復(fù)墾適宜性評價中的應(yīng)用,仍然需要進一步完善和深入研究,如決策樹算法在樣本數(shù)較少時,分類規(guī)則的不完整性,改進方法與評價模型的普遍適用性等問題,還需要在今后的實踐中進一步驗證和完善。

        [1] 王歡,王平,謝立祥,等.土地復(fù)墾適宜性評價方法[J].中南林業(yè)科技大學(xué)學(xué)報,2010,30(4):154. Wang Huan,Wang Ping,Xie Lixiang,et al.Commentary on methods for suitability evaluation of land reclamation[J].Journal of Central South University of Forestry &Technology,2010,30(4):154.(in Chinese)

        [2] 王世東,郭徵,陳秋計,等.基于極限綜合評價法的土地復(fù)墾適宜性評價研究與實踐[J].測繪科學(xué),2012, 37(1):67. Wang Shidong,Guo Zheng,Chen Qiuji,et al.Study and application of suitability evaluation of land reclamation based on comprehensive extreme condition method[J].Science of Surveying and Mapping,2012,37(1):67.(in Chinese)

        [3] 黃宇達,王逸冉.基于樸素貝葉斯與ID3算法的決策樹分類[J].計算機工程,2012,38(14):41. Huang Yuda,Wang Yiran.Decision tree classification based on naive Bayesian and ID3 algorithm[J].Computer Engineering,2012,38(14):41.(in Chinese)

        [4] 王小魏,蔣玉明.決策樹ID3算法的分析與改進[J].計算機工程與設(shè)計,2011,32(9):3069. Wang Xiaowei,Jiang Yuming.Analysis and improvement of ID3 decision tree algorithm[J].Computer Engineering and Design,2011,32(9):3069.(in Chinese)

        [5] 楊俊,王占岐,金貴,等.基于AHP與模糊綜合評價的土地整治項目實施后效益評價[J].長江流域資源與環(huán)境,2013,22(8):1036. Yang Jun,Wang Zhanqi,Jin Gui,et al.Post-benefit evaluation of land consolidation project bimplementation based on AHP and fuzzy comprehensive evaluation[J]. Resources and Environment in the Yangtze Basin,2013, 22(8):1036.(in Chinese)

        [6] 黃愛輝,陳湘濤.決策樹ID3算法的改進[J].計算機工程與科學(xué),2009,31(6):109. Huang Aihui,Chen Xiangtao.An improved ID3 algorithm of decision trees[J].Computer Engineering&Science,2009,31(6):109.(in Chinese)

        [7] 文學(xué)菊,周家云.礦山土地破壞程度評價:以攀枝花市花山煤礦為例[J].山地學(xué)報,2006,24(3):378. Wen Xueju,Zhou Jiayun.Evaluation on the degree of destructed land in area of mining:A case study of Huashan coal mine[J].Journal of Mountain Science,2006, 24(3):378.(in Chinese)

        [8] 常青,邱瑤,謝苗苗,等.基于土地破壞的礦區(qū)生態(tài)風(fēng)險評價:理論與方法[J].生態(tài)學(xué)報,2012,32(16):5164. Chang Qing,Qiu Yao,Xie Miaomiao,et al.Theory and method of ecological risk assessment f or mining areas based on the land destruction[J].Acta Ecologica Sinica, 2012,32(16):5164.(in Chinese)

        [9] 何宏,劉勇,郭柏棟,等.基于模糊綜合評價法的經(jīng)濟開發(fā)區(qū)土地評價研究[J].中國人口·資源與環(huán)境, 2012,22(5):158. He Hong,LiuYong,Guo Bodong,et al.The Evaluation on the land intensive utilization of economic developing zones based on fuzzy comprehensive evaluation method [J].China Population,Resources and Environment, 2012,22(5):158.(in Chinese)

        [10]康家瑞,劉志斌,楊榮斌.基于GIS的土地生態(tài)適宜性模糊綜合評價[J].系統(tǒng)工程,2010,28(9):108. Kang Jiarui,Liu Zhibin,Yang Rongbin.Fuzzy comprehensive evaluation of ecological suitability of land based on GIS systems rngineering,2010,28(9):108.(in Chinese)

        [11]王世東.河南省煤礦塌陷地復(fù)墾模式研究[J].礦業(yè)研究與開發(fā),2010,30(4):81. Wang Shidong.Research on land reclamation model of subsidence area in coal mines in Henan[J].Mining Research and Development,2010,30(4):81.(in Chinese)

        [12]王世東,劉毅.基于改進模糊綜合評價模型的礦區(qū)土地損毀程度評價[J].中國生態(tài)農(nóng)業(yè)學(xué)報,2015,23 (9):1191. Wang Shidong,Liu Yi.Evaluation of the degree of land destruction in mining areas using improved fuzzy comprehensive evaluation method[J].Chinese Journal of Eco-Agriculture,2015,23(9):1191.(in Chinese)

        [13]張紫昭,郭瑞清,周天生,等.新疆煤礦土地復(fù)墾為草地的適宜性評價方法與應(yīng)用[J].農(nóng)業(yè)工程學(xué)報, 2015,31(11):278. Zhang Zizhao,Guo Ruiqing,Zhou Tiansheng,et al. Suitability evaluation method and application for land reclamation to grassland in Xinjiang coal mines[J].Transactions of the Chinese Society of Agricultural Engineering,2015,31(11):278.(in Chinese)

        Suitability evaluation of mining-land reclamation based on improved decision tree model

        Wang Shidong,Liu Yi,Wang Xinchuang,Wu Chao
        (School of Surveying and Land Information Engineering,Henan Polytechnic University,454000,Jiaozuo,Henan,China)

        [Background]The essence of evaluating land reclamation suitability in mining areas is a type of classifying the land reclamation for the future according to certain evaluation rules(or criteria).Thus, it is feasible and reasonable to apply classification rules with decision tree induction method in suitability evaluation of land reclamation in mining areas.[Methods]In this paper,we applied the subordinate function method of the fuzzy mathematics to improve ID3 algorithm(the Iterative Dichotomiser 3)of the decision tree,established a model for evaluating land reclamation suitability,and then applied this improved model in Pingyu Second Mining Area.Selecting 7 evaluation indexes as the attributes of measurement,and extracting 100 units which directions of land reclamation have been determined as the samples,we established the decision tree for land reclamation suitability evaluation with the improved ID3 algorithm.Then,we applied the established classification rules of the decision tree to classify them according to their attributes,to evaluate various units and to determine the reclamation directions forvarious evaluated units.Further,to verify the accuracy of evaluation results,we compared the most frequently used limit condition method with the proposed method.[Results]The statistics result showed that there were 365.87 hm2suitable for arable land,98.83 hm2suitable for woodland and 97.98 hm2suitable for meadow by using improved decision tree model in the studied area.However,there were 334.95 hm2suitable for arable land,106.26 hm2suitable for woodland and 121.47 hm2suitable for meadow by using limit condition method in the studied area.The 92.50%of evaluation results of the proposed method were consistent with those by limit condition method.In inconsistent results,the grades of evaluation result by limit condition method were lower than those by decision tree model.After comparing the two methods,the results revealed that the limiting condition method was more suitable for reclamation suitability evaluation of opencast coal mine damaged land,and the improved decision tree model proposed in this paper was more suitable for mine subsidence land of underground mining.Thus, from the above comparative analysis of two methods,combined with field research,the result based on improved decision tree model were more in line with actual study area,and the reclamation directions were also more reasonable.[Conclusions]The results indicated that this evaluation method for land reclamation suitability in mining areas based on the improved decision tree did not rely on the empirical knowledge but relied on classification rules/criteria formulated by self-directed learning of the samples. The classification results obtained were more objective and reasonable.Furthermore,once the classification rules of decision tree have been determined,they can be directly applied in other areas to be evaluated in the same region and the classification process is simple,clear and easy to be operated. This approach can provide a new thinking way for the evaluation of land reclamation suitability in mining areas.

        ID3 algorithm;improved decision tree;mining areas;land Reclamation;suitability evaluation

        S114

        A

        1672-3007(2016)06-0035-09

        10.16843/j.sswc.2016.06.005

        2016 06 13

        2016 09 06

        項目名稱:國家自然科學(xué)基金“生態(tài)約束條件下的區(qū)域土地利用結(jié)構(gòu)與空間格局優(yōu)化研究”(41301617);中國博士后科學(xué)基金“基于遙感的礦區(qū)土地復(fù)墾質(zhì)量評價與監(jiān)測研究”(2016M590679);中國博士后科學(xué)基金“煤礦區(qū)土地生態(tài)質(zhì)量評價及變化機理研究”(2015M580629);河南省高等學(xué)校重點科研項目“典型煤礦區(qū)土地生態(tài)質(zhì)量時空變化規(guī)律與機理研究”(17A420001,16A420003)

        王世東(1978—),男,博士,副教授。主要研究方向:土地復(fù)墾與生態(tài)恢復(fù)。E-mail:wsd0908@163.com

        ?通信作者簡介:王新闖(1979—),男,博士,副教授。主要研究方向:林業(yè)生態(tài)恢復(fù)。E-mail:wangxc_382@163.com

        猜你喜歡
        決策樹條件分類
        排除多余的條件
        分類算一算
        選擇合適的條件
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        分類討論求坐標
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        為什么夏天的雨最多
        基于決策樹的出租車乘客出行目的識別
        久久不见久久见免费影院| 国产高潮精品一区二区三区av | 东京热加勒比久久精品| 亚洲av日韩av永久无码下载| www国产精品内射熟女| 欧美精品aaa久久久影院| 久久精品国产亚洲av网在| 欧美乱妇高清无乱码免费| 亚洲第一av导航av尤物| 国产成人精品午夜福利免费APP| 国产精品日本一区二区三区| 国产精品黑丝美女啪啪啪| 亚洲熟女乱色综合亚洲av| 国产成人77亚洲精品www| 久久本道久久综合一人| 久久久久av综合网成人| 国产精品久久久久久影视| 精品18在线观看免费视频| 亚洲中文乱码在线观看| 美女内射毛片在线看免费人动物| 久久精品国产亚洲av忘忧草18 | 精品久久综合亚洲伊人| 中文字幕人成乱码中文乱码| 激情五月我也去也色婷婷| 国产亚洲真人做受在线观看| 好爽受不了了要高潮了av| 天堂精品人妻一卡二卡| 国产精品久人妻精品老妇| 久久国产精久久精产国| 亚洲无码美韩综合| 国产精品国产三级野外国产| 波多野42部无码喷潮| 国产无套视频在线观看香蕉 | 精品人妻丰满久久久a| 蜜桃视频在线在线观看| 国产亚洲精品美女久久久| 爽妇网国产精品| 美女福利视频网址导航| 少妇高潮av久久久久久| 国产裸体歌舞一区二区| 亚洲AV无码日韩一区二区乱|