尹楠
(南京曉莊學(xué)院商學(xué)院,江蘇南京211171)
我國各省份互聯(lián)網(wǎng)區(qū)域化發(fā)展競爭力差異分析
尹楠
(南京曉莊學(xué)院商學(xué)院,江蘇南京211171)
本文選取網(wǎng)民數(shù)量、網(wǎng)民規(guī)模增長速度、域名數(shù)量、網(wǎng)站數(shù)量、IPv4地址數(shù)比例和頁面平均大小等作為研究指標(biāo),利用因子對應(yīng)分析方法對我國31個(gè)省、市、自治區(qū)的互聯(lián)網(wǎng)發(fā)展?fàn)顩r進(jìn)行分析,結(jié)果表明,北京、上海、福建、浙江、江蘇、黑龍江屬于互聯(lián)網(wǎng)發(fā)展競爭力較強(qiáng)的地區(qū),廣東和山東屬于互聯(lián)網(wǎng)發(fā)展競爭力中等程度地區(qū),其他地區(qū)的互聯(lián)網(wǎng)發(fā)展競爭力較弱。從總體上看,互聯(lián)網(wǎng)發(fā)展水平高低與經(jīng)濟(jì)發(fā)展水平有一定相關(guān)性,但也存在例外的情況。
因子對應(yīng)分析;K聚類算法;互聯(lián)網(wǎng)
互聯(lián)網(wǎng)作為一項(xiàng)高新技術(shù)產(chǎn)業(yè),已經(jīng)成為經(jīng)濟(jì)增長最具有活力的產(chǎn)業(yè)之一,李克強(qiáng)總理在2015年兩會(huì)期間明確提出了“互聯(lián)網(wǎng)+”的概念,[1]互聯(lián)網(wǎng)已經(jīng)完全融合進(jìn)社會(huì)經(jīng)濟(jì)發(fā)展的各個(gè)方面?!盎ヂ?lián)網(wǎng)+”代表一種新的經(jīng)濟(jì)形態(tài),必須充分發(fā)揮互聯(lián)網(wǎng)在生產(chǎn)要素配置中的優(yōu)化和集成作用,將互聯(lián)網(wǎng)的創(chuàng)新成果深度融合于經(jīng)濟(jì)社會(huì)各領(lǐng)域之中,提升實(shí)體經(jīng)濟(jì)的創(chuàng)新力和生產(chǎn)力,形成更廣泛的以互聯(lián)網(wǎng)為基礎(chǔ)設(shè)施和實(shí)現(xiàn)工具的經(jīng)濟(jì)發(fā)展新形態(tài)。[2]據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的最新統(tǒng)計(jì)數(shù)據(jù)顯示,截至2013年12月,中國網(wǎng)民規(guī)模達(dá)6.18億,全年共計(jì)新增網(wǎng)民5358萬人。互聯(lián)網(wǎng)普及率為45.8%,較2012年底提升3.7個(gè)百分點(diǎn)。2013年,中國各省市區(qū)網(wǎng)民規(guī)模均有一定幅度增長,大陸31個(gè)省、直轄市、自治區(qū)中網(wǎng)民數(shù)量超過千萬規(guī)模的省份已達(dá)25個(gè),網(wǎng)絡(luò)普及率超過全國平均水平的省份達(dá)13個(gè),相比2012年增加了青海和河北兩省,其網(wǎng)絡(luò)普及率分別為47.8%和46.5%。[3]
但是我國具體哪些地區(qū)的互聯(lián)網(wǎng)發(fā)展競爭力水平較高,哪些地區(qū)的互聯(lián)網(wǎng)發(fā)展競爭力水平較低,并未有一個(gè)詳細(xì)的分類。本文選取一些能反映我國各地區(qū)互聯(lián)網(wǎng)發(fā)展競爭力水平的指標(biāo),利用因子對應(yīng)分析法對各指標(biāo)數(shù)值進(jìn)行分類,從中得出我國各地區(qū)該指標(biāo)值的相應(yīng)發(fā)展程度;然后再利用K聚類分析算法對我國各省、市、自治區(qū)的互聯(lián)網(wǎng)發(fā)展競爭力情況做一個(gè)系統(tǒng)的分類,了解我國大陸31個(gè)省、市、自治區(qū)互聯(lián)網(wǎng)發(fā)展的水平,為網(wǎng)絡(luò)服務(wù)供應(yīng)商更好地提供網(wǎng)絡(luò)服務(wù)提供參考,為我國各地區(qū)的互聯(lián)網(wǎng)發(fā)展和建設(shè)提供一定的借鑒。
目前對我國互聯(lián)網(wǎng)區(qū)域發(fā)展競爭力差異性方面的研究幾乎是空白,國內(nèi)學(xué)者對這方面的研究較少,對我國互聯(lián)網(wǎng)領(lǐng)域的研究主要是基于經(jīng)濟(jì)增長視角的互聯(lián)網(wǎng)區(qū)域發(fā)展研究,或者采用某種經(jīng)濟(jì)研究方法研究我國互聯(lián)網(wǎng)區(qū)域發(fā)展的差異,并未有依據(jù)一些研究指標(biāo)采用特定研究方法對我國互聯(lián)網(wǎng)區(qū)域發(fā)展競爭力進(jìn)行區(qū)域分類的研究。查閱相關(guān)文獻(xiàn)資料,目前對我國互聯(lián)網(wǎng)區(qū)域發(fā)展差異性情況的相關(guān)研究成果主要有以下幾個(gè)方面:
劉文新、張平宇[4]從網(wǎng)絡(luò)普及率、網(wǎng)絡(luò)信息資源豐度及互聯(lián)網(wǎng)商業(yè)應(yīng)用三個(gè)角度初步探討了中國互聯(lián)網(wǎng)發(fā)展存在的區(qū)域差異,并設(shè)計(jì)了互聯(lián)網(wǎng)發(fā)展指數(shù)(IDI),從人均的角度反映互聯(lián)網(wǎng)發(fā)展的綜合水平。
劉桂芳[5]將中國互聯(lián)網(wǎng)域名地區(qū)分布數(shù)據(jù)與圖形數(shù)據(jù)結(jié)合,運(yùn)用相關(guān)分析、洛倫茲(Lorenz)曲線和區(qū)位熵等方法,從時(shí)間和空間上探討了中國互聯(lián)網(wǎng)分布的區(qū)域差異。
金兼斌、吳科特[6]基于創(chuàng)新擴(kuò)散理論,對我國互聯(lián)網(wǎng)擴(kuò)散的地區(qū)不平衡狀況及其影響因素進(jìn)行了初步探索,以基尼系數(shù)來描述互聯(lián)網(wǎng)發(fā)展的地區(qū)不平衡,并通過回歸分析探究影響互聯(lián)網(wǎng)擴(kuò)散的關(guān)鍵因素。研究發(fā)現(xiàn),近年來我國互聯(lián)網(wǎng)發(fā)展的地區(qū)差距在不斷縮小,其差異程度逐漸和經(jīng)濟(jì)發(fā)展水平的差異程度接近。
寧進(jìn)廳、邱娟、汪明峰[7]基于互聯(lián)網(wǎng)產(chǎn)業(yè)的生產(chǎn)與消費(fèi)兩個(gè)方面,利用錫爾系數(shù)和集中化指數(shù)等方法,對2000年至2009年我國31個(gè)省、市、自治區(qū)的互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展?fàn)顩r進(jìn)行了系列研究。結(jié)果發(fā)現(xiàn):我國互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展的區(qū)域差異仍然十分顯著,但消費(fèi)層面的省際差異明顯小于生產(chǎn)層面,而且消費(fèi)層面差異縮小的幅度也明顯大于生產(chǎn)層面;同時(shí),從空間來看,東部地區(qū)的變化顯著,大部分省市有了較大發(fā)展,但中西部地區(qū)的大部分省份仍處于低消費(fèi)、低生產(chǎn)的狀況。
張?jiān)?、李琪[8]通過收集各地區(qū)經(jīng)濟(jì)發(fā)展水平及互聯(lián)網(wǎng)發(fā)展水平的相關(guān)數(shù)據(jù),建立模型進(jìn)行分析并得出結(jié)論:互聯(lián)網(wǎng)發(fā)展與經(jīng)濟(jì)發(fā)展之間存在著重要的關(guān)系,互聯(lián)網(wǎng)普及率與互聯(lián)網(wǎng)基礎(chǔ)設(shè)施建設(shè)水平對經(jīng)濟(jì)發(fā)展影響顯著。
汪明峰、邱娟[9]從人均GDP、城鎮(zhèn)化水平、基礎(chǔ)設(shè)施水平、受教育程度、對外開放度等變量的角度,發(fā)現(xiàn)我國東、中、西三大區(qū)域存在顯著的互聯(lián)網(wǎng)發(fā)展區(qū)域性差異。
馮湖、張璇[10]研究發(fā)現(xiàn),中國“數(shù)字鴻溝”日趨縮小,是東、中、西部地區(qū)內(nèi)省際間差距不斷縮小的結(jié)果。區(qū)域知識(shí)發(fā)展水平、經(jīng)濟(jì)生活水平和對外開放程度對互聯(lián)網(wǎng)發(fā)展區(qū)域差異的解釋力最強(qiáng),信息基礎(chǔ)設(shè)施的影響也較顯著。
鄭素俠[11]認(rèn)為,互聯(lián)網(wǎng)在大陸擴(kuò)散的區(qū)域性差異,不僅存在于發(fā)達(dá)地區(qū)和欠發(fā)達(dá)地區(qū)之間,也存在于各城市體系之間,更深的“數(shù)字鴻溝”潛存于對互聯(lián)網(wǎng)的使用質(zhì)量之中。只有當(dāng)互聯(lián)網(wǎng)能夠?yàn)楦纳魄钒l(fā)達(dá)地區(qū)和農(nóng)村貧困人口的生活發(fā)揮作用時(shí),它才真正成為推動(dòng)社會(huì)發(fā)展的技術(shù)工具。
綜上所述,以上文獻(xiàn)主要是從經(jīng)濟(jì)增長的視角并結(jié)合我國的實(shí)際情況,對我國互聯(lián)網(wǎng)的區(qū)域發(fā)展差異性進(jìn)行了研究,取得了一定的研究成果。但從目前的文獻(xiàn)資料來看,并未有利用特定的研究分析法對我國各省、市、自治區(qū)的互聯(lián)網(wǎng)區(qū)域發(fā)展競爭力的差異性進(jìn)行系統(tǒng)分類和總結(jié)的研究。
從2014年中國互聯(lián)網(wǎng)絡(luò)信息中心公布的第33次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告中,選取一些相應(yīng)的統(tǒng)計(jì)指標(biāo)作為實(shí)現(xiàn)因子對應(yīng)分析和K聚類分析的變量指標(biāo),選取的研究指標(biāo)如下所示:
指標(biāo)1:網(wǎng)民數(shù)量,指各個(gè)省份的網(wǎng)民總?cè)藬?shù)。
指標(biāo)2:網(wǎng)民規(guī)模增長速度,指各省份的網(wǎng)民數(shù)量2014年比2013年的增長程度。
指標(biāo)3:域名數(shù)量,指各個(gè)省份的域名擁有數(shù)量,域名是指每個(gè)互聯(lián)網(wǎng)網(wǎng)絡(luò)使用者在建設(shè)網(wǎng)站后向互聯(lián)網(wǎng)管理機(jī)構(gòu)申請的名稱,該名稱在網(wǎng)絡(luò)上是獨(dú)一無二的。
指標(biāo)4:網(wǎng)站數(shù)量,指各個(gè)省份擁有的網(wǎng)站數(shù)量。
指標(biāo)5:IPv4地址數(shù)比例,指各個(gè)省份的IPv4地址數(shù)占全國的比例,IPv4是一種傳統(tǒng)的互聯(lián)網(wǎng)協(xié)議的地址。
指標(biāo)6:頁面平均大小,指各省份的網(wǎng)站總?cè)萘颗c各省份擁有的網(wǎng)頁數(shù)量的比值。
選取以上指標(biāo)作為研究分析的主要指標(biāo)是考慮到三個(gè)方面的因素。首先,所選指標(biāo)的數(shù)據(jù)都可以從公開的資料中提取,滿足數(shù)據(jù)的可獲得性要求;其次,所選指標(biāo)的數(shù)據(jù)都是可以量化的,屬于定量研究的數(shù)據(jù),使得研究更具客觀性,不受人為因素的干擾;最后,所選擇的指標(biāo)能夠基本反映我國互聯(lián)網(wǎng)區(qū)域發(fā)展競爭力的各方面要求,能夠反映一個(gè)地區(qū)的互聯(lián)網(wǎng)發(fā)展競爭力的大致狀況(參見表1)。
表1 我國31個(gè)省、市、自治區(qū)互聯(lián)網(wǎng)區(qū)域發(fā)展競爭力指標(biāo)值
1.因子對應(yīng)分析的基本原理
因子對應(yīng)分析是在因子分析基礎(chǔ)上發(fā)展起來的一種多元統(tǒng)計(jì)分析方法,主要通過分析定性變量構(gòu)成的列聯(lián)表來揭示變量之間的關(guān)系,也稱R-Q分析。在因子分析中一般只是分析原始變量的因子結(jié)構(gòu),找出決定原始變量的公共因子,從而使問題的分析簡化和清晰。這種研究對象是變量的因子分析稱為R型因子分析。但是對于有些問題來說,還需要研究樣品的結(jié)構(gòu),若對于樣品進(jìn)行因子分析,稱為Q型因子分析。對同一觀測數(shù)據(jù)進(jìn)行R和Q型因子分析,并分別保留兩個(gè)公共因子,則是對應(yīng)分析的基礎(chǔ)。[12]
R型因子分析和Q型因子分析反映的是一個(gè)整體的不同側(cè)面,R型因子分析是從列來討論(對變量),Q型因子分析是從行來討論(對樣本點(diǎn)),因此他們之間存在內(nèi)在的聯(lián)系。對應(yīng)分析的基本步驟可以表述如下:(1)獲取對應(yīng)分析數(shù)據(jù);(2)確定研究的目的,選擇對應(yīng)分析中所需數(shù)據(jù)和應(yīng)該包括的背景資料;(3)建立列聯(lián)表;(4)進(jìn)行對應(yīng)分析;(5)畫出對應(yīng)分析圖并解釋結(jié)果的意義。
2.因子對應(yīng)分析過程
根據(jù)以上對應(yīng)分析的基本原理,可以確定R型因子分析的變量分別為網(wǎng)民數(shù)量、網(wǎng)民規(guī)模增長速度、域名數(shù)量、網(wǎng)站數(shù)量、IPv4地址數(shù)比例、頁面平均大小,分別用X1~X6來表示。Q型因子分析的樣本點(diǎn)為我國31個(gè)省、市、自治區(qū)。在R數(shù)據(jù)分析軟件中,通過計(jì)算可以得到R型因子分析(變量)和Q型因子分析(樣本點(diǎn))在矩陣中的具體坐標(biāo)值數(shù)據(jù),如表2和表3所示。然后將這些坐標(biāo)值數(shù)據(jù)在R軟件中作圖,畫出對應(yīng)分析圖。由于R型因子和Q型因子各自的坐標(biāo)值數(shù)據(jù)在對應(yīng)分析圖中的位置較為緊湊,難以在圖中形象地表示出來,本文省略對應(yīng)分析圖的繪制。根據(jù)對應(yīng)分析顯示的結(jié)果可以把R型因子分析(變量)和Q型因子分析(樣本點(diǎn))分為幾類:
第一類,變量為網(wǎng)民數(shù)量,樣本點(diǎn)為內(nèi)蒙古、寧夏、貴州、新疆、廣西、江西等省份。第二類,變量為網(wǎng)民規(guī)模增速,樣本點(diǎn)為青海。第三類,變量為域名數(shù)量,樣本點(diǎn)為廣東。第四類,變量為網(wǎng)站數(shù)量,樣本點(diǎn)為江蘇和北京等。第五類,變量為IPv4地址數(shù)比例,樣本點(diǎn)為重慶、江蘇等。第六類,變量為頁面平均大小,樣本點(diǎn)為西藏。
表2 Q型因子分析(樣本點(diǎn))的矩陣坐標(biāo)值數(shù)據(jù)
表3 R型因子分析(變量)的矩陣坐標(biāo)值數(shù)據(jù)
1.K聚類分析的基本原理
K聚類分析是一種將研究對象進(jìn)行分類統(tǒng)計(jì)的多元統(tǒng)計(jì)方法,通過確定對象之間的相似性和差異性,進(jìn)行分類統(tǒng)計(jì)。這些對象之間的相似性和差異性的劃分完全是根據(jù)數(shù)據(jù)聚類統(tǒng)計(jì)結(jié)果確定的。聚類分析的思想是先將n個(gè)樣品各自看成一類,然后規(guī)定類與類之間的距離,選擇距離最小的一對合并成新的一類,計(jì)算新類與其他類的距離,再將距離最近的兩類合并,這樣每次減少一類,直至所有的樣品都成為一類為止。[13]
K-means算法和K-medoids算法都屬于基于劃分的啟發(fā)式聚類方法,K-means算法的每個(gè)簇用該簇中對象的平均值來表示,而K-medoids算法的每個(gè)簇用接近聚類中心的一個(gè)對象來表示。
K-means算法是一種基于樣本間相似性度量的間接聚類方法。該算法以K為參數(shù),把n個(gè)對象分為K個(gè)簇,簇內(nèi)具有較高的相似度,而且簇間的相似度較低。相似度的計(jì)算根據(jù)一個(gè)簇中對象的平均值來進(jìn)行。此算法的過程為:首先從n個(gè)數(shù)據(jù)對象任意選擇K個(gè)對象作為初始聚類中心。而對于所剩下其他對象,則根據(jù)它們與這些聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;然后再計(jì)算每個(gè)所獲新聚類的聚類中心(該聚類中所有對象的均值),不斷重復(fù)這一過程直到標(biāo)準(zhǔn)測度函數(shù)開始收斂為止。[14]
K-medoids算法和K-means算法基本相似,唯一不同的地方在于中心點(diǎn)的選取,K-means算法將中心點(diǎn)取為當(dāng)前聚類分析中所有數(shù)據(jù)點(diǎn)的平均值,而K-medoids算法從聚類分析中選取一個(gè)點(diǎn)作為中心點(diǎn),即該中心點(diǎn)到其他所有點(diǎn)的距離之和最小。
K-medoids算法的基本思想:首先為每個(gè)簇隨意選擇一個(gè)代表對象;剩余的對象根據(jù)其與代表對象的距離分配給最近的一個(gè)簇;然后反復(fù)地用非代表對象替代代表對象,以改進(jìn)聚類的質(zhì)量;聚類結(jié)果的質(zhì)量用一個(gè)代價(jià)函數(shù)估算,該函數(shù)評估了對象與其參照對象之間的平均相異度。[15]
2.K聚類分析過程
由于人工計(jì)算聚類分析的過程較為復(fù)雜,這里利用R統(tǒng)計(jì)軟件實(shí)現(xiàn)K-means和K-medoids算法的聚類分析過程。在R統(tǒng)計(jì)軟件中,利用編程計(jì)算出各類別的聚類優(yōu)度,可以比較選擇出最優(yōu)的類別數(shù),利用該類別數(shù)劃分得出的聚類分析結(jié)果為最優(yōu)。研究樣本有31個(gè)省、市、自治區(qū),在研究中將類別數(shù)從1到30取遍,得出的結(jié)果如表4所示。
從以上各類別的聚類優(yōu)度結(jié)果可以看出,在類別等于3時(shí),隨著類別數(shù)的增加聚類效果也發(fā)生變化(聚類優(yōu)度值從0.83到0.94),當(dāng)類別數(shù)超過4后,聚類的效果保持不變,因此在本研究中,將類別數(shù)指定為3是最合適的。如圖1所示,圖1中第3個(gè)圓點(diǎn)即為最優(yōu)類別數(shù),之后的圓點(diǎn)基本上呈現(xiàn)出一條直線,說明聚類的類別數(shù)在3之后進(jìn)行聚類分析時(shí)基本上沒有差異。
基于K-means算法計(jì)算得出了三個(gè)類別包含的樣本數(shù),分別為6、2、23以及各類別中心點(diǎn)的坐標(biāo)值,分別為第1類(0.0630000,916444.3,231677.67,0.07240000,43.83333),第2類(0.0875000,3938785.5,340858.50,0.07280000,49.00000),第3類(0.1186522,127414.3,35964.91,0.01425217,47.30435)。即表示第1類被認(rèn)為是互聯(lián)網(wǎng)發(fā)展競爭力較強(qiáng)的地區(qū),第2類是互聯(lián)網(wǎng)發(fā)展競爭力中等的地區(qū),第3類是互聯(lián)網(wǎng)發(fā)展競爭力較弱的地區(qū)。
基于K-medoids算法在R語言中得到輸出結(jié)果,與之前的K-means算法相比,輸出結(jié)果中多了一項(xiàng)中心點(diǎn)(Medoids),從中可以得到聚類分析完成時(shí)的各類別的中心點(diǎn)分別是哪幾個(gè)樣本點(diǎn)及變量的取值范圍,在本研究中三個(gè)類別的中心點(diǎn)分別是浙江、廣東和江西。從兩種聚類分析的結(jié)果可知,根據(jù)K-medoids算法得出的聚類分析結(jié)果和K-means算法的結(jié)論完全相同,聚類分析的結(jié)論如表5所示。
圖1 選擇最優(yōu)聚類優(yōu)度
基于互聯(lián)網(wǎng)區(qū)域發(fā)展競爭力的各項(xiàng)具體指標(biāo)所做的因子對應(yīng)分析的結(jié)論,可以看出,北京、江蘇、重慶等省份擁有的網(wǎng)站數(shù)量和IPv4地址數(shù)比例較高,福建、浙江、湖北等省份在對應(yīng)分析圖中的位置離這兩個(gè)指標(biāo)的距離也不是太遠(yuǎn),說明這些省份的網(wǎng)站數(shù)量及IPv4地址數(shù)比例也較高;在域名數(shù)量指標(biāo)上,廣東擁有的域名數(shù)量最多;在網(wǎng)民數(shù)量這一指標(biāo)上,大多數(shù)中西部省份的網(wǎng)民數(shù)量較多;在網(wǎng)民規(guī)模增速指標(biāo)和頁面平均大小指標(biāo)上,最有代表性的分別是青海和西藏,說明這兩個(gè)省份在互聯(lián)網(wǎng)的普及和發(fā)展方面正在逐步加快。
表4 聚類類別數(shù)量與聚類優(yōu)度
表5 基于K-means和K-medoids算法的聚類分析結(jié)果
根據(jù)K聚類分析得出的結(jié)論,可以將31個(gè)省、市、自治區(qū)按以上規(guī)則劃分為東、中、西部來考察。針對我國區(qū)域經(jīng)濟(jì)發(fā)展嚴(yán)重不平衡的現(xiàn)狀,我國現(xiàn)行的區(qū)域政策基本上是按照東、中、西三大地區(qū)區(qū)別對待的?;谝陨蟽煞NK聚類分析算法得出的結(jié)論,第1類屬于互聯(lián)網(wǎng)發(fā)展競爭力較強(qiáng)的地區(qū),包括北京、上海、福建、浙江、江蘇、黑龍江,大部分都位于發(fā)達(dá)的東部沿海地區(qū),其互聯(lián)網(wǎng)的發(fā)展?fàn)顩r與經(jīng)濟(jì)的發(fā)展水平相一致;唯一例外的是黑龍江,按我國的區(qū)域劃分屬于中部內(nèi)陸地區(qū),經(jīng)濟(jì)上相對東部沿海地區(qū)要落后一些,但其互聯(lián)網(wǎng)發(fā)展競爭力水平卻較高,原因在于黑龍江的互聯(lián)網(wǎng)發(fā)展競爭力各指標(biāo)值數(shù)據(jù)離中心點(diǎn)的距離較為接近,這也是聚類分析算法的意義所在,如黑龍江省在總體網(wǎng)民人數(shù)中,每萬人擁有的域名數(shù)量、網(wǎng)站數(shù)量和IPv4的比例相對于其他省份較高,雖然其總體數(shù)量并不占優(yōu)勢,因此可以認(rèn)定為黑龍江省的互聯(lián)網(wǎng)發(fā)展競爭力水平較高。
第2類屬于互聯(lián)網(wǎng)發(fā)展競爭力中等程度的地區(qū),包括廣東和山東。這兩個(gè)省份都位于經(jīng)濟(jì)發(fā)達(dá)的東部沿海地區(qū),但由于網(wǎng)民總體數(shù)量大、網(wǎng)民規(guī)模增速較慢、人均擁有域名數(shù)和網(wǎng)站數(shù)量不高等因素,導(dǎo)致這兩個(gè)省份的互聯(lián)網(wǎng)發(fā)展競爭力水平相對弱一些。
第3類屬于互聯(lián)網(wǎng)發(fā)展競爭力較弱的地區(qū),包括以上統(tǒng)計(jì)剩余的中國大多數(shù)省份,大多數(shù)省份屬于中部內(nèi)陸地區(qū)和西部邊遠(yuǎn)地區(qū),這些省份的互聯(lián)網(wǎng)發(fā)展競爭力水平還比較低,都有上升和發(fā)展的空間。
K聚類分析得出的結(jié)論與我國傳統(tǒng)的東、中、西部三大區(qū)域的劃分規(guī)則總體上是相吻合的,從另一個(gè)側(cè)面也可以得出這樣的結(jié)論:從總體上來說,互聯(lián)網(wǎng)發(fā)展水平高低與經(jīng)濟(jì)的發(fā)展程度有一定的關(guān)系,一個(gè)地區(qū)經(jīng)濟(jì)發(fā)展程度越高,其互聯(lián)網(wǎng)發(fā)展競爭力水平也越高,但也存在一定的例外。如按照本文的研究結(jié)論,黑龍江的互聯(lián)網(wǎng)發(fā)展競爭力水平較高,而天津和遼寧的互聯(lián)網(wǎng)發(fā)展競爭力水平反而較低。
本文利用兩種K聚類算法對我國互聯(lián)網(wǎng)的區(qū)域發(fā)展競爭力水平進(jìn)行了一個(gè)系統(tǒng)的聚類劃分,兩種研究方法得出的結(jié)論完全相同,說明K聚類分析的結(jié)論具有一定的科學(xué)性。本研究說明,我國只有少數(shù)幾個(gè)省份的互聯(lián)網(wǎng)發(fā)展競爭力水平較高,大多數(shù)省份的互聯(lián)網(wǎng)發(fā)展競爭力水平較低。目前我國正在加快信息化和網(wǎng)絡(luò)化建設(shè),可以重點(diǎn)關(guān)注本研究中的第3類地區(qū),這些地區(qū)的互聯(lián)網(wǎng)發(fā)展競爭力水平都有待提高。
綜合考慮K聚類算法和因子對應(yīng)分析法的結(jié)論,可以看出,在整體上東部地區(qū)的互聯(lián)網(wǎng)發(fā)展競爭力要強(qiáng)于中西部地區(qū),東部地區(qū)擁有的網(wǎng)絡(luò)資源也較西部地區(qū)更加豐富,但是在一些分指標(biāo)上,如在網(wǎng)民規(guī)模增速和頁面平均大小上,西部地區(qū)的一些省份正在快速增長。目前,我國正在加快信息化建設(shè)的步伐,提升我國各個(gè)地區(qū)互聯(lián)網(wǎng)的發(fā)展建設(shè)競爭力水平尤為重要。對于中西部大多數(shù)省份,隨著網(wǎng)民人數(shù)的不斷增長,對于這些地區(qū)的網(wǎng)絡(luò)資源,如在擁有域名數(shù)量和IPv4地址數(shù)比例等指標(biāo)上,也應(yīng)該給予這些省份更多的分配。
基于以上分析得出的結(jié)論可以從以下三個(gè)方面為網(wǎng)絡(luò)服務(wù)供應(yīng)商更好地提供網(wǎng)絡(luò)服務(wù)提供參考,并且也可以為我國各地區(qū)的互聯(lián)網(wǎng)發(fā)展和建設(shè)提供一定的借鑒。第一,在互聯(lián)網(wǎng)基礎(chǔ)設(shè)施建設(shè)和信息產(chǎn)業(yè)的發(fā)展中,要為中西部的大多數(shù)省份提供更多的支持,為互聯(lián)網(wǎng)接入提供更加便利的條件,讓各省份的網(wǎng)民數(shù)量及擁有網(wǎng)站數(shù)量等指標(biāo)有更大的提升。第二,網(wǎng)絡(luò)服務(wù)供應(yīng)商應(yīng)積極推動(dòng)互聯(lián)網(wǎng)的應(yīng)用發(fā)展,讓更多的人使用互聯(lián)網(wǎng)。第三,新技術(shù)的發(fā)展如移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展,尤其是手機(jī)網(wǎng)民數(shù)量的持續(xù)增長,讓中西部地區(qū)網(wǎng)民數(shù)量快速增長,網(wǎng)絡(luò)服務(wù)供應(yīng)商需要在降低移動(dòng)網(wǎng)絡(luò)收費(fèi)、提升移動(dòng)互聯(lián)技術(shù)等方面多下功夫。
[1]趙竹青.學(xué)者熱議:李克強(qiáng)提的“互聯(lián)網(wǎng)+”是個(gè)啥概念?[EB/OL].(2015-03-06).http://news.china.com.cn/2015li anghui/2015-03/06/content_34978805.htm.
[2]林其玲.“互聯(lián)網(wǎng)+”助力中國經(jīng)濟(jì)“彎道超車”[EB/ OL].(2015-03-16).http://news.xinhuanet.com/tech/2015-03/ 16/c_27583775.htm.
[3]中國互聯(lián)網(wǎng)絡(luò)信息中心.第33次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[R].2014.
[4]劉文新,張平宇.中國互聯(lián)網(wǎng)發(fā)展的區(qū)域差異分析[J].地理科學(xué),2003(4):388-407.
[5]劉桂芳.中國互聯(lián)網(wǎng)區(qū)域差異的時(shí)空分析[J].地理科學(xué)進(jìn)展,2006(4):47-54.
[6]金兼斌,吳科特.我國互聯(lián)網(wǎng)擴(kuò)散之地區(qū)差異的影響因素探究[J].南京郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2006(4):8-13.
[7]寧進(jìn)廳,邱娟,汪明峰.中國互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展的區(qū)域差異及其動(dòng)態(tài)演進(jìn)——基于生產(chǎn)和消費(fèi)的視角[J].世界地理研究,2010(4):58-64.
[8]張?jiān)?,李?互聯(lián)網(wǎng)對我國各省區(qū)經(jīng)濟(jì)發(fā)展的影響[J].山西財(cái)經(jīng)大學(xué)學(xué)報(bào),2008(6):38-44.
[9]汪明峰,邱娟.中國互聯(lián)網(wǎng)用戶增長的省際差異及其收斂性分析[J].地理科學(xué),2011(1):42-48.
[10]馮湖,張璇.中國互聯(lián)網(wǎng)發(fā)展的區(qū)域差異與政策治理[J].北京科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2011(3):399-407.
[11]鄭素俠.互聯(lián)網(wǎng)在中國大陸擴(kuò)散的區(qū)域性差異[J].國際新聞界,2007(2):55-59.
[12]王斌會(huì).多元統(tǒng)計(jì)分析及R語言建模[M].廣州:暨南大學(xué)出版社,2011:288-320.
[13]湯銀才.R語言與統(tǒng)計(jì)分析[M].北京:高等教育出版社,2005:113-150.
[14]薛京花,劉震宇,崔適時(shí).對K-means算法初始聚類中心選取的優(yōu)化[J].電子世界,2012(5):11-18.
[15]李洪升.K-Medoids算法在人臉識(shí)別系統(tǒng)中的應(yīng)用[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2009(4):59-62.
責(zé)任編輯:方程
Analysis on the Regional Development Competitiveness Differences of China's Internet
YIN Nan
(Nanjing Xiaozhuang University,Nanjing,Jiangsu211171,China)
Taking such factors as number of Internet users,number of networks,and so on as the research factors,and using factor correspondence analysis,the author analyzes the Internet development situation of 31 princes,cities and municipalities.It shows that the development competitiveness of Internet in Beijing,Shanghai,F(xiàn)ujian,Zhejiang,Jiangsu and Heilongjiang is stronger;that of Guangdong and Shandong is moderate;and that of other regions is weaker.Generally speaking,the development level of Internet has some relations with the economic development level;but there are still some exceptions.
factor correspondence analysis;K clustering algorithm;Internet
F127
A
1007-8266(2015)09-0052-07
尹楠(1982—),男,江蘇省鎮(zhèn)江市人,南京曉莊學(xué)院商學(xué)院教師,博士,主要研究方向?yàn)楣芾硇畔⑾到y(tǒng)、企業(yè)信息化。