李麗穎
(吉林師范大學計算機學院 吉林 四平 136000)
利用Motyka相似系數(shù)進行農(nóng)業(yè)產(chǎn)值的Q-型聚類分析
李麗穎
(吉林師范大學計算機學院 吉林 四平 136000)
利用Motyka相似系數(shù)作為兩個群之間相似程度的一種度量,給出了分析群相似性的Q-型聚類分析方法,利用這種方法對2014年我國各省、市、區(qū)的農(nóng)、林、牧、漁各產(chǎn)業(yè)的產(chǎn)值結(jié)構(gòu)類型進行了區(qū)劃,并將結(jié)果與10年前進行比較,對其發(fā)展趨勢進行了統(tǒng)計分析。
Motyka相似系數(shù);聚類分析;農(nóng)業(yè)區(qū)劃
國家統(tǒng)計局每年公開發(fā)行的統(tǒng)計年鑒中,有全國各地區(qū)農(nóng)業(yè)總產(chǎn)值和農(nóng)、林、牧、漁等各產(chǎn)業(yè)的產(chǎn)值,如何按照這四項產(chǎn)值將各省、市、區(qū)進行相似性劃分具有判斷我國農(nóng)業(yè)類型的現(xiàn)實意義。群的相似程度分析在本質(zhì)上是每個群有若干個相同類型的數(shù)據(jù)數(shù)量指標的Q-型聚類分析問題。
進行群分相似程度分析時,要用數(shù)值作為群相似性的度量指標,假設(shè)兩個群I和II各有若干個同類指標,群I的指標為a1,a2,a3,K,am,群II的相應(yīng)指標為b1,b2,b3,K,bm,那么利用Motyka相似系數(shù)來分析兩個群的相似程度可以按照如下方法進行:
假設(shè)有n個群落A1,A2,···,An,首先根據(jù)數(shù)據(jù)統(tǒng)計軟件可以計算出任意兩個群的相似系數(shù)陣,然后利用動態(tài)聚類法的原理進行Q型聚類分析,其步驟為:
(1)選取相似系數(shù)陣中最小的相似系數(shù)d(AS,AK)=min{d(Ai,Aj)│i,j=1,2,∧,n},則AS,AK這兩個群為兩個聚點。
(2)對 i=1,2,……,n,i≠s,i≠k,比較 d(Ai,AK)與 d(Ai,As)的大小。
①若 d(Ai,AK)>d(Ai,As)則 Ai歸屬于 AK類。
②若 d(Ai,AK)<d(Ai,As)則 Ai歸屬于 As類。
③若d(Ai,AK)=(Ai,As)則Ai自成一類,這一次的劃分完畢。
本次分類后形成2-3個類,分別檢驗每個類中的最小相似系數(shù),如果該系數(shù)較大,說明本類中各個群之間具有較高的相似程度,可以停止分類,否則,在對應(yīng)的類中重復(fù)步驟(1)和(2),直到各類中最小相似系數(shù)達到滿意則停止分類。
利用2014年國家統(tǒng)計局公布的統(tǒng)計年鑒中的數(shù)據(jù),可以計算出我國31個地區(qū)(不含港澳臺)的農(nóng)、林、牧、漁產(chǎn)值在總產(chǎn)值中所占比例,通過以上方法進行計算,就可以求出任意兩地區(qū)之間的相似系數(shù)陣,經(jīng)過反復(fù)分析將全國分成了五個區(qū)域,具體分組情況見表1。
表1 各類中包含的地區(qū)
各類中最小的相似系數(shù)取值區(qū)間為[0.885,0.97],說明各類內(nèi)部的相似程度已經(jīng)很高,每類所包含的地區(qū)大體具有相同的農(nóng)業(yè)產(chǎn)值結(jié)構(gòu)。按照地圖的地理位置劃分各個類,大致上把我國分成自東北到西南方向的幾個區(qū)域,同我國傳統(tǒng)劃分的土地資源分布有異曲同工之妙。
如果進行進一步分析,將各類內(nèi)部按農(nóng)、林、牧、漁產(chǎn)值分類累和再求各產(chǎn)值的比例,那么就可以得出表2的結(jié)果:
表2 各類內(nèi)的產(chǎn)值比例
10年前的相關(guān)數(shù)據(jù)如下:
根據(jù)以上表格中的數(shù)據(jù)進行分析,各類的農(nóng)業(yè)產(chǎn)業(yè)值的變化趨勢為由西向東,由南向北,結(jié)合10年前的相關(guān)數(shù)據(jù),可以得出以下結(jié)論:
第一,我國農(nóng)作物產(chǎn)值基本上是由南向北遞減的。這種情況出現(xiàn)的主要原因是因為北方(以東三省為主要代表)的土壤肥沃,非常適合農(nóng)作物生長,而南部(以東南地區(qū)為主)的人口密度大,因此人均占有耕地面積少,造成的結(jié)果是從事農(nóng)業(yè)生產(chǎn)的人只占總?cè)丝诘囊恍〔糠?,因而農(nóng)作物產(chǎn)值在總產(chǎn)值中所占的比例偏低。但是山東、河南這類內(nèi)陸地區(qū)已經(jīng)取代東北三省成為農(nóng)業(yè)產(chǎn)值的大戶,說明這類省份加強了農(nóng)作物尤其是蔬菜的耕種面積,成為供應(yīng)全國的蔬菜大省,增加了地方農(nóng)業(yè)產(chǎn)值??傮w看來,農(nóng)作物產(chǎn)值比10年前低,部分原因是由于近10年樓市火爆,所以各地都減少了種植面積用于房地產(chǎn)開發(fā)。
第二,從林業(yè)產(chǎn)值比例上看,對比10年前的數(shù)據(jù),我國林業(yè)產(chǎn)值有顯著升高,說明我國普遍重視林業(yè)發(fā)展,擴大林業(yè)種植面積提高綠化面積。內(nèi)陸省份明顯比例增高,而原來占絕對優(yōu)勢的東南地區(qū)和東北地區(qū)則稍顯落后。
第三,牧業(yè)產(chǎn)值最高的由西部地區(qū)轉(zhuǎn)移到了東南地區(qū),這說明我國為保護環(huán)境而減少了游牧,同時牧業(yè)也從落后的游牧進入到了集中養(yǎng)殖,是牧業(yè)擺脫自然環(huán)境限制進入現(xiàn)代化、科技化養(yǎng)殖階段的體現(xiàn)。同時牧業(yè)產(chǎn)值對比10年前明顯大幅度降低,部分原因是由于我國的乳制品質(zhì)量不高,大部分人對乳制品的購買由國內(nèi)奶源地產(chǎn)品轉(zhuǎn)向國外奶源地產(chǎn)品,這給我國的牧業(yè)產(chǎn)業(yè)帶來了巨大的沖擊。
第四,東南沿海地區(qū)將漁業(yè)高產(chǎn)值比例轉(zhuǎn)讓給了內(nèi)陸省份,這種現(xiàn)象說明了我國漁業(yè)生產(chǎn)轉(zhuǎn)入了內(nèi)陸湖泊的淡水漁業(yè)和人工養(yǎng)殖,近海漁業(yè)產(chǎn)值降低說明我國對近海的資源保護已見成效。
根據(jù)以上分析,我國農(nóng)業(yè)產(chǎn)值的新特點說明我國農(nóng)業(yè)已經(jīng)基本擺脫了地理環(huán)境的限制,不再是幾十年前的受自然資源限制的初級農(nóng)業(yè)類型,人對環(huán)境進行了積極有效的干預(yù)。根據(jù)農(nóng)業(yè)生態(tài)經(jīng)濟的發(fā)展規(guī)律,農(nóng)業(yè)應(yīng)由順應(yīng)自然到積極干預(yù)自然并逐步建立合理的農(nóng)、林、牧漁結(jié)構(gòu)。隨著消費能力的提高,市場需要的變化,商品經(jīng)濟的發(fā)展,以及科學技術(shù)的進步,對農(nóng)業(yè)結(jié)構(gòu)的影響應(yīng)由單純的自然條件因素轉(zhuǎn)向自然條件和社會經(jīng)濟技術(shù)兩個因素共同起作用[1]。
綜上,利用Motyka相似系數(shù)對我國各地區(qū)進行農(nóng)業(yè)類型劃分得出的農(nóng)業(yè)區(qū)劃結(jié)構(gòu)準確,符合我國農(nóng)業(yè)發(fā)展的現(xiàn)狀,這種劃分對分析農(nóng)業(yè)發(fā)展趨勢,指導(dǎo)農(nóng)業(yè)健康發(fā)展具有現(xiàn)實的指導(dǎo)意義。產(chǎn)權(quán)理論創(chuàng)始人、諾貝爾經(jīng)濟學獎得主、美國經(jīng)濟學家科斯認為:缺乏統(tǒng)一市場勢必造成區(qū)域間交易成本擴大、導(dǎo)致產(chǎn)業(yè)結(jié)構(gòu)通化、產(chǎn)業(yè)相似度偏高、過度競爭激烈、競爭費用、保護成本增大等畸形發(fā)展。[4]若能連續(xù)對農(nóng)業(yè)產(chǎn)值進行區(qū)域劃分,對農(nóng)業(yè)產(chǎn)值類型進行持續(xù)監(jiān)控,將對我國農(nóng)業(yè)的宏觀調(diào)控起到積極干預(yù)的作用。
[1]國家統(tǒng)計局編.中國統(tǒng)計摘要[M].北京:中國統(tǒng)計出版社,2014:115.
[2]宋立新,李麗穎.關(guān)于我國各省市區(qū)農(nóng)林牧漁產(chǎn)值結(jié)構(gòu)類型的區(qū)劃[J].數(shù)理統(tǒng)計與管理,2005(5):15-17.
[3]唐保國.我國區(qū)域經(jīng)濟協(xié)調(diào)發(fā)展指標體系及定量評估研究[D].山東財經(jīng)大學碩士論文,2013(5).
[4]王文森.產(chǎn)業(yè)結(jié)構(gòu)相似系數(shù)在統(tǒng)計分析中的應(yīng)用[J].中國統(tǒng)計,2007(10).
Q-accumulate analysis on Agricultural output value by the Utilization of Motyka Similar Coefficient
Li li-ying
(Jilin Normal University Computer College Jilin Siping 136000)
This article use Motyka similar coefficient as a measurement of similarity between two communities,provide the method of Q-accumulate analyzing.We also practice the method by making agricultural divisions according to the structure type of the output of farming,forestry,stock rising and fishery in 2014,and compare the results with 10 years ago,analyze the develop tend from statistics figures.
Motyka similar coefficient;Analyze the accumulating;Agricultural divisions
O212
A
2095-7327(2017)-10-0045-02
李麗穎(1978—),女,漢族,吉林柳河人,碩士,講師,畢業(yè)于吉林師范大學數(shù)學學院,主要研究方向為數(shù)理統(tǒng)計。