一、引言
吉林省各地自然、經(jīng)濟、社會條件各有差異,對農(nóng)業(yè)經(jīng)濟的影響很大。為了穩(wěn)定提高糧食綜合生產(chǎn)能力,促進農(nóng)業(yè)經(jīng)濟結構進一步優(yōu)化。就需要準確地對省內各市縣農(nóng)業(yè)經(jīng)濟類型進行劃分,以期做到合理的資源優(yōu)化配置。本文采用一種改進的k-均值聚類分析技術對所采集的吉林省各縣市農(nóng)業(yè)生產(chǎn)的相關數(shù)據(jù)進行分析,目的是對吉林省各地農(nóng)業(yè)經(jīng)濟類型進行劃分,揭示各地區(qū)農(nóng)業(yè)生產(chǎn)的特點和優(yōu)勢,為加快全省農(nóng)業(yè)經(jīng)濟發(fā)展提供依據(jù)。
二、改進的聚類算法基本原理
改進的聚類算法的基本思想是:首先對數(shù)據(jù)集合進行系統(tǒng)聚類分析,得到聚類樹及相應的聚類中心矩陣;接著從聚類樹中查找較早形成的大類,并計算其聚類中心,這樣我們就得到了較好的聚類數(shù)k及比較具有代表性的初試聚類中心集合;最后通過k-均值算法進行聚類分析。
雖然此改進算法需要我們人為的設定條件,但是這些條件都是在進行系統(tǒng)聚類分析之后的數(shù)據(jù)基礎上得來的,比經(jīng)典的k-均值算法的直接判斷聚類數(shù)和隨機抽取初始聚類中心要具有明顯的優(yōu)勢。根據(jù)本文待挖掘的數(shù)據(jù)量和系統(tǒng)聚類的結果,初始條件設定如下:被判定為較早形成的大類聚類,其包含的數(shù)據(jù)對象應大于4,與下一次合并的聚類間距越小越好,且應小于所有聚類過程中的聚類間距均值。
三、改進的聚類算法在吉林農(nóng)業(yè)經(jīng)濟類型劃分中的應用
?。ㄒ唬┓诸愔笜说倪x擇
農(nóng)業(yè)經(jīng)濟系統(tǒng)是一個多因素、多層次、結構復雜的系統(tǒng),要正確地劃分農(nóng)業(yè)經(jīng)濟類型,首先必須選擇一套能全面反映當前農(nóng)業(yè)經(jīng)濟狀況的指標體系。為此我們根據(jù)吉林農(nóng)業(yè)的實際情況,選擇對農(nóng)業(yè)經(jīng)濟發(fā)展起主導作用的因子作為聚類指標,通過實地調查和對統(tǒng)計資料的綜合分析,選定以下10個指標:X1 ,年平均降水量;X2 ,年平均溫度;X3 ,農(nóng)業(yè)人口;X4 ,每公頃糧食產(chǎn)量;X5 ,農(nóng)業(yè)機械總動力;X6 ,糧食面積占耕地面積比例;X7 ,林業(yè)產(chǎn)值占農(nóng)業(yè)總產(chǎn)值比例;X8 ,牧業(yè)產(chǎn)值占農(nóng)業(yè)總產(chǎn)值比例;X9,漁業(yè)產(chǎn)值占農(nóng)業(yè)總產(chǎn)值比例;X10 ,人均收入。
?。ǘ?shù)據(jù)準備
根據(jù)以上10項指標,我們通過查閱2010年《吉林省統(tǒng)計年鑒》可以得到吉林省各地區(qū)農(nóng)業(yè)經(jīng)濟各項指標的原始數(shù)據(jù),如表1所示。
數(shù)據(jù)來源:根據(jù)2010年《吉林省統(tǒng)計年鑒》整理。
(三)數(shù)據(jù)挖掘結果
首先對以上數(shù)據(jù)進行標準化轉換,之后采用系統(tǒng)聚類分析法得到聚類樹,分析聚類樹及聚類間距我們可以得到初始聚類數(shù)為k=5。之后,本文進行k=5的k-均值聚類分析,得到聚類成員表如下:
?。ㄋ模┙Y果分析
方差分析表的結果表明,分類后各變量在不同類別之間的差異都是顯著的(p值基本都小于0.05,接近于零),表示把20個縣市地區(qū)分成5類是比較合理的。
第一類,梨樹、伊通、公主嶺、雙遼、東豐、長嶺6個縣市。這些縣市年平均溫度較高,降水較少,糧食面積占耕地面積比例都比較小,牧業(yè)相對于林業(yè)、漁業(yè)有明顯的優(yōu)勢,其人居收入相對較高。這類地區(qū)應該對其農(nóng)業(yè)產(chǎn)業(yè)結構進行適當調整,使農(nóng)林牧副業(yè)各產(chǎn)業(yè)協(xié)調發(fā)展。
第二類,樺甸、通化、輝南3個縣市。這類縣市農(nóng)、林、牧漁各業(yè)都有一定發(fā)展,各項經(jīng)濟指標居于全省中上等水平,其振興經(jīng)濟最好的途徑就是各業(yè)協(xié)調發(fā)展,根據(jù)各縣實際情況,積極引進科學技術和優(yōu)良品種,走農(nóng)業(yè)產(chǎn)業(yè)化發(fā)展之路。
第三類,農(nóng)安、榆樹、德惠、扶余4個縣市。這類縣市雖然糧食面積占耕地面積比例很高,但是由于自然條件相對較差,降水貧乏,從而制約了該類地區(qū)的農(nóng)業(yè)經(jīng)濟發(fā)展。對此,應該采取興修水利的措施來緩解雨水不足的現(xiàn)狀。此外,應在穩(wěn)定糧食產(chǎn)量的基礎上積極改善生態(tài)環(huán)境,發(fā)展多種經(jīng)營,穩(wěn)步發(fā)展其農(nóng)業(yè)經(jīng)濟。
第四類,蛟河市、梅河口市。這兩個市的農(nóng)業(yè)經(jīng)濟狀況是所有縣市中最好的,該地區(qū)雨水充足、糧食面積占耕地面積比例較高、畜牧業(yè)發(fā)展相對滯后、林業(yè)和漁業(yè)發(fā)展較其他地區(qū)有明顯優(yōu)勢且人均收入明顯高于其他各地區(qū)。因此,該類地區(qū)應注意保持其現(xiàn)有的農(nóng)業(yè)產(chǎn)業(yè)結構同時兼顧畜牧業(yè)的發(fā)展,做到以優(yōu)勢產(chǎn)業(yè)拉動劣勢產(chǎn)業(yè)的協(xié)調發(fā)展。
第五類,九臺、永吉、舒蘭、磐石、東遼5個縣市。這類縣市自然條件適宜、糧食面積占耕地面積比例很高,林業(yè)、畜牧業(yè)和漁業(yè)協(xié)調發(fā)展較好。該地區(qū)應充分合理利用自然條件優(yōu)勢,實行以發(fā)展糧食生產(chǎn)為主,兼顧其他各業(yè)的農(nóng)業(yè)發(fā)展思路。
四、結論
將數(shù)據(jù)挖掘技術應用到農(nóng)業(yè)經(jīng)濟類型的劃分中,極大地改善了以往的劃分方式。本文通過聚類分析方式對吉林省農(nóng)業(yè)經(jīng)濟數(shù)據(jù)進行了數(shù)據(jù)挖掘,并提出了一種聚類分析的改進方法,使其更好地應用于農(nóng)業(yè)經(jīng)濟類型的分類中,使得對農(nóng)業(yè)經(jīng)濟類型的劃分更客觀、可靠。
參考文獻:
?、俸螘匀海嘣y(tǒng)計分析[M].北京:中國人民大學出版社,2008
?、跍?,戴如源.數(shù)據(jù)挖掘中聚類分析的技術方法[J].微計算機信息,2003(19)
?、蹚埣t云等.數(shù)據(jù)挖掘中聚類算法比較研究[J].計算機應用與軟件,2003(2)
?、茉拘郏环N有效的基于劃分和層次的混合聚類算法[J].計算機應用,2007(7):1692—1695
?。ㄒ?,1972年生,吉林省吉林市人,東北電力大學經(jīng)濟管理學院教授。研究方向:技術經(jīng)濟理論與實務。姜域,1988年生,新疆阿勒泰人,東北電力大學碩士研究生。研究方向:科技與經(jīng)濟協(xié)調發(fā)