摘 要:本文運用R軟件對20個國家的信息基礎(chǔ)設(shè)施發(fā)展情況進行分析,最后根據(jù)分析結(jié)果,將這20個國家分為了三類。
關(guān)鍵詞:聚類分析;信息基礎(chǔ)設(shè)施;SPSS18.0
聚類分析的基本思想是,從一批樣品的多個指標變量中,定義能度量樣品間或變量間相似程度(或親疏關(guān)系)的統(tǒng)計量,在此基礎(chǔ)上求出各樣品(或變量)之間相似程度度量值,按相似程度的大小,把樣品(或變量)逐一分類,關(guān)系密切的類聚集到一個小的分類單位,關(guān)系疏遠的類聚集到一個大的分類單位,直到所有的樣品或變量都聚集完畢,把不同的類型一一劃分出來,形成一個親疏關(guān)系譜系圖,用以更直觀地顯示分類對象(樣品或變量)的差異和聯(lián)系。
1 數(shù)據(jù)收集
根據(jù)信息基礎(chǔ)設(shè)施的發(fā)展情況,對世界20個國家和地區(qū)進行聚類分析。
2 聚類分析
利用SPSS18.0軟件對表1中的數(shù)據(jù)進行聚類分析,具體操作為:
(1)Analyze-Classify-Hierarchical Cluster Analysis,將所有的變量選入到Variables中,將國家選入Label Cases by。(2)在Statistics選項中,勾選Range of Solutions,在Mininum number of clusters中輸入3,在Maxinum number of clusters中輸入8。(3)在Plot選項中,勾選Dendrogram(4)在Method選項中。將Cluster Method選擇Wards Methods,Transform Values:選擇Standardize:Z Scores(5)在Save選項中,Cluster Membership: Range of solutions:3-8
聚類分析產(chǎn)生的最重要的結(jié)果就樹狀圖。如圖1-1所示。通過樹狀圖可以非常直觀地看出整個聚類過程和結(jié)果。
3 結(jié)論
按照上面的樹狀圖,世界20個國家信息基礎(chǔ)設(shè)施的發(fā)展情況可以大體分為3類,具體分類如下:
[參考文獻]
[1](美)約翰遜(Johnson,R.A.).實用多元統(tǒng)計分析.清華大學出版社,2008.
[2]薛毅.統(tǒng)計建模與R軟件.清華大學出版社.
作者簡介:王芳(1981-),女,漢族,陜西西安人,助教,2010年畢業(yè)于西安工程大學供熱、供燃氣、通風機空調(diào)工程專業(yè),碩士研究生學歷,陜西國防工業(yè)職業(yè)技術(shù)學院在職教師,現(xiàn)從事暖通空調(diào)教學研究工作。