潘明哲
( 黑龍江省自然資源權益調(diào)查監(jiān)測院,黑龍江 哈爾濱150000)
森林資源, 從廣義講是指林木、 竹類和林區(qū)范圍內(nèi)其他植物、動物、微生物、林地資源和環(huán)境資源的總稱,從狹義講是指以喬木為主體的森林植物組成部分。 森林資源經(jīng)營是為取得森林多種效益,通過計劃、組織、指揮、協(xié)調(diào)和控制,對一地域內(nèi)的森林資源及相關因素進行籌劃和控制的過程。 森林資源分布的地域性以及資源本身所具有的空間屬性決定了森林資源信息必須應用數(shù)據(jù)挖掘技術,才能更合理、直觀、及時和動態(tài)地監(jiān)測和預測森林資源的動態(tài)變化,取得更好的經(jīng)營效果和效益。
在當前的大數(shù)據(jù)時代下, 數(shù)據(jù)挖掘技術在各個行業(yè)范圍內(nèi)都起到了重要作用。 該技術結(jié)合了現(xiàn)代尖端的人工智能、 數(shù)據(jù)分析、數(shù)據(jù)庫以及信息識別系統(tǒng)等多種技術手段,滿足市場變化范圍的各個領域的基本需求。 在當前的發(fā)展情況下, 這種大數(shù)據(jù)模式對于數(shù)據(jù)發(fā)掘來說,不僅是一個快速發(fā)展的機會,也是一個挑戰(zhàn)。 在這種背景下,數(shù)據(jù)挖掘技術也在不斷的摸索,調(diào)整技術的運轉(zhuǎn)體系,對數(shù)據(jù)進行更準確的分析,提高其準確性與處理效率,不斷地進行優(yōu)化,使其應用的領域更加廣泛。
在一般情況下的數(shù)據(jù)挖掘分析當中, 大致分為以下八個步驟: 第一步信息收集,在初步確定數(shù)據(jù)分析對象后,對其中的具體數(shù)據(jù)內(nèi)容信息進行選定,再選擇適當?shù)氖占绞?,將?shù)據(jù)進行篩選儲存,將其準確的輸入的數(shù)據(jù)庫當中。 第二步數(shù)據(jù)集成,將不同類型、格式的數(shù)據(jù)進行分類數(shù)據(jù)化處理,在分析時,能夠為其提供數(shù)據(jù)共享的便利條件。 第三步數(shù)據(jù)規(guī)約, 這一步的目的實際上是提高數(shù)據(jù)的處理時間, 提高效率與準確率。 通過技術的內(nèi)部運轉(zhuǎn),進行數(shù)據(jù)規(guī)約處理,在保證原數(shù)據(jù)的準確性與完整性的同時,精確了數(shù)據(jù)挖掘的結(jié)果。 第四步數(shù)據(jù)清理,在數(shù)據(jù)的收集輸入當中,也會存在一些數(shù)據(jù)不準確、部分缺失的問題,為了保證數(shù)據(jù)挖掘技術的準確性,對于這部分數(shù)據(jù)應進行數(shù)據(jù)清理,將準確、完整、統(tǒng)一的數(shù)據(jù)錄入其中。 第五步數(shù)據(jù)變換,準確來說是對數(shù)據(jù)的形式進行變化,統(tǒng)一其形式,為數(shù)據(jù)發(fā)掘分析提供便利。 第六步數(shù)據(jù)挖掘的過程,根據(jù)數(shù)據(jù)庫中的信息,應用適當?shù)奶幚砉ぞ吲c方法,挖掘出重要的信息。第七步模式評估,對于數(shù)據(jù)挖掘的結(jié)果,有第三方專業(yè)人員介入進行驗證評估。 第八步知識表示,將數(shù)據(jù)挖掘評估后的結(jié)果,轉(zhuǎn)化為用戶可視化的信息模式,供其參考應用。 數(shù)據(jù)挖掘的過程是比較漫長的,且環(huán)節(jié)步驟比較多,我們需要嚴格把控各個環(huán)節(jié),保證數(shù)據(jù)挖掘結(jié)果的準確性。
隨著數(shù)據(jù)挖掘技術不斷優(yōu)化、內(nèi)容的不斷豐富,所適用范圍也越來越廣泛,涉及到的數(shù)據(jù)信息內(nèi)容不僅量大,種類也比較多。 隨著科技水平的不斷發(fā)展與提升,數(shù)據(jù)挖掘系統(tǒng)中分類、識別、預測、基礎預測等功能都有所提升,挖掘的對象內(nèi)容也在不斷的擴大。 在大數(shù)據(jù)與互聯(lián)網(wǎng)+ 的大時代背景下,數(shù)據(jù)挖掘技術從這個角度上也順應了時代的發(fā)展,再加上未來信息通信技術的結(jié)合,數(shù)據(jù)挖掘技術的發(fā)展是非常客觀的。
神經(jīng)網(wǎng)絡通常是與數(shù)學模型共同結(jié)合, 執(zhí)行功能計算處理的,該挖掘方法是在十九世紀五十年代由國外的物理學家與數(shù)學學家共同創(chuàng)建的。 這種數(shù)據(jù)挖掘方法自身的兼容性、適用性、組織能力以及數(shù)據(jù)處理等性能都比較好,可以識別、預測的數(shù)據(jù)類型也比較多。 通過網(wǎng)絡神經(jīng)單元的處理,進行了非線性的新型計算處理,大幅度提升了數(shù)據(jù)的挖掘速率。 但是該方法也存在缺點,就是對于用戶來說,這種神經(jīng)網(wǎng)絡比較空洞,對于挖掘的過程相對茫然。
隨著科技水平的不斷發(fā)展,決策樹法也逐漸在更新優(yōu)化,推出了不同類型的算法,例如:ID3、C4.5。 該方法適用于預測類的數(shù)據(jù)計算,能夠?qū)?shù)據(jù)進行有效的分類,并從中快速獲取有價值的信息,進行數(shù)據(jù)分類與基本描述,在數(shù)據(jù)挖掘當中,更適合規(guī)模較大的數(shù)據(jù)處理。 并且分類算法之間的關聯(lián)性比較強,在此基礎上,數(shù)據(jù)處理的限制屬性也比較弱,挖掘的結(jié)果也便于用戶的理解。
貝葉斯分類法是一種算法簡單且精準度較高的分類算法,當前可以分樸素貝葉斯算法與動態(tài)貝葉斯算法等。 從分類的功能上來看,該方法與決策樹和神經(jīng)網(wǎng)絡法之間,有著緊密的聯(lián)系。 與其它方法不同的是,該方法不是獨立存在的,通常以模塊處理器組合的方式呈現(xiàn)出來。 在精準度與數(shù)據(jù)處理上,都優(yōu)于其它方法,并且對于數(shù)據(jù)的處理更加全面,能夠通過信息處理、自動控制和識別系統(tǒng)來進行多范疇的共同運作,更能體現(xiàn)挖掘技術的基本性質(zhì)。
森林資源經(jīng)營中,最重要的就是森林資源的質(zhì)量,這就需要對森林資源進行實時監(jiān)測,了解其基本情況,這樣對森林的成長狀態(tài)和森林資源的經(jīng)營狀況也能有所了解。 森林資源范圍比較廣,在監(jiān)測上工作難度比較大,且需要調(diào)查統(tǒng)計的數(shù)據(jù)也比較多,傳統(tǒng)的數(shù)據(jù)調(diào)查模式,不僅費時費力,信息的準確程度也相對較低。 但應用數(shù)據(jù)挖掘技術, 可以更好的實現(xiàn)對數(shù)據(jù)的統(tǒng)計, 并且通過決策樹或是神經(jīng)網(wǎng)絡的方法不僅調(diào)查起來耗時短、準確率高,數(shù)據(jù)的結(jié)果也更加清晰,為監(jiān)測工作提供了便利。
林木的生長在一般情況下,都是呈周期性規(guī)則變化的,通過數(shù)據(jù)挖掘技術可以將林木的生長情況進行系統(tǒng)的數(shù)據(jù)分析,以數(shù)據(jù)的形式對林木未來的成長趨勢進行預測,并針對其未來的成長趨勢做出相應的培養(yǎng)方案,促使林木的生長更加健康。 并通過貝葉斯分類法,將林木的狀況進行基本的分類,以此來實現(xiàn)森林資源經(jīng)營效益。
相應促進森林資源的健康發(fā)展, 就要了解林木容易出現(xiàn)的問題,并對此做出相應的措施防護。 其中包括:森林的防火和防蟲害工作,森林火災是一種常見的自然災害,發(fā)生的頻率比較高,且一般呈現(xiàn)蔓延的趨勢,人們大多時候不能及時的發(fā)現(xiàn)。 但是通過數(shù)據(jù)發(fā)掘技術,可以通過計算機對比數(shù)據(jù)的變化,并且在出現(xiàn)火災情況后,也會及時預警。 而防蟲害則是通過對比林木的健康數(shù)據(jù)實現(xiàn)的,通過數(shù)據(jù)挖掘技術的及時反應,能夠?qū)ζ渥龀黾皶r的防護,避免造成更大的經(jīng)濟損失,增強森林資源的經(jīng)營效益。
我國大部分森林資源的范圍都比較廣闊, 且資源內(nèi)容較為豐富,傳統(tǒng)的數(shù)據(jù)統(tǒng)計不能滿足當前的經(jīng)營需求,呈現(xiàn)出一種盲視感。 通過數(shù)據(jù)挖掘技術的實踐證明,對于數(shù)據(jù)的統(tǒng)計,該技術手段的優(yōu)勢更大,結(jié)合GIS 和GPS 的雙定位技術,數(shù)據(jù)信息的特征會更加明顯,數(shù)據(jù)的規(guī)律性也更強,增強了森林資源的可視化,進一步擴大了森林資源的經(jīng)營優(yōu)勢。
總而言之,面對復雜的森林資源狀況,數(shù)據(jù)挖掘技術的應用必不可少,想要該技術得到更全面的應用,相關人員也該對技術的流程、內(nèi)容、系統(tǒng)以及處理模式進一步分析,為森林資源的經(jīng)營提供更有價值的技術支持。