譚立云
(華北科技學院理學院,河北 三河065201)
經(jīng)查詢2019 年我國國家統(tǒng)計局官網(wǎng),我國2019 年31 個省、直轄市和自治區(qū)交通事故總數(shù)為247646 起,其中最多的省份是湖北高達23168 起,最低的省份是西藏,共468 起。為了對總體情況進行更好了解,我們利用Geoda 空間統(tǒng)計分析軟件來進行空間探索和分析。
在Geoda 空間統(tǒng)計分析軟件中,箱形圖是一種特殊的四分位數(shù)地圖,是在四分位地圖基礎上,再加上兩個異常值,這種地圖實際與“箱形”沒任何聯(lián)系,只是其構(gòu)思是從箱線圖演化而成,故稱箱形圖,它尤其強調(diào)具有異常值的地域單位。所謂異常值是指那些大于Q3+1.5d,或小于Q1-1.5d,其中d=Q3-Q1,稱為四分位距,異常值又可以分為極端和溫和兩種:那些大于Q3+3d,或小于Q1-3d 的異常值稱為極端異常值,而那些小于或等于Q3+3d,或大于或等于Q1-3d 的異常值稱為溫和異常值。在Geoda 中很容易做出箱形圖,這里取溫和異常值,見圖1。
圖1 交通事故箱線圖分布圖
從圖1 可以看出,有一個高的溫和異常值,這是湖北省,沒有低溫和異常值;交通事故低的省份(即小于Q1)集中在西藏、寧夏、甘肅、青海、湖南、海南、北京、上海等8 個地區(qū);Q1和Q2之間的省份有新疆、內(nèi)蒙古、東三省、重慶及河等7 個地區(qū);Q2和Q3之間的省份有云南、山西、陜西、四川、天津、浙江、江蘇、江西等8 個地區(qū);大于Q3的省份有貴州、廣西、廣東、河南、山東、安徽和福建等7 個地區(qū)。交通事故總量表現(xiàn)出的聚集性非常明顯。
在Geoda 空間統(tǒng)計分析軟件中,很容易進行空間聚類,圖2是聚為四類時的聚類圖,從聚類圖中可以看出這四類基本都是地理位置靠近且成片在一起的,這里的聚類圖與線形圖略有出入,地理位置特征更加明顯。
圖2 空間聚類(4 類)圖
莫蘭1950 年提出了全局自相關莫蘭指數(shù)I,它是最早應用于檢驗空間關聯(lián)性和集聚問題的指標,反映了整個研究區(qū)域內(nèi),各個地域單元與鄰近地域單元之間的相似性,其計算公式為:
莫蘭指數(shù)I 取值介于-1 與1 之間,大于0 表示正相關,值越大表明具有相似的屬性集聚在一起(即高值與高值鄰接、低值與低值鄰接),小于0表示負相關,值越接近-1,表明具有相異的屬性集聚在一起(即高值與低值鄰接、低值與高值鄰接),接近0,則表示屬性是隨機分布的,或者說不具有空間自相關性。
本案例中用GeoDa 計算得到全局自相關莫蘭指數(shù)I=0.111>0,表現(xiàn)出正相關,即表現(xiàn)出高指與高值鄰接、低值與低值鄰接。圖3 表示的高值與高值鄰接的行政區(qū),圖4 表現(xiàn)的是低值與低值鄰接的行政區(qū)
圖3 高值- 高值鄰接的行政區(qū)示意圖
圖4 低值與低值鄰接的行政區(qū)示意圖
以下考察GDP 與交通事故總量之間的回歸關系,通過采取普通最小二乘回歸、空間滯后回歸和空間誤差回歸三種模型進行對比后發(fā)現(xiàn),本模型最合適的模型是空間誤差回歸模型。
空間誤差回歸模型是如下的模型:
其中Y,X,W 分別表示GDP、交通事故總量、空間權(quán)重矩陣??臻g權(quán)重我們這里取得按共邊或共頂點及視為鄰接,采取“后”方式計算權(quán)重矩陣。
最后得到的模型如表1(這里只展示回歸系數(shù),其他信息均刪除)。
表1
即我們得到GDP 與交通事故總量的回歸模型為:
GDP=9972.60+2.63628* 交通事故總數(shù)
但從模型檢驗結(jié)果可以看出來,參數(shù)λ 不顯著,常數(shù)也不夠顯著,模型較為粗糙,GDP 與交通事故總量二者之間的正向關系我們可以理解,我們目前的經(jīng)濟發(fā)展在一定程度上還是粗放型,經(jīng)濟越發(fā)達的省份交通事故越多,從前面的箱形圖、聚類圖都可以印證這一點。
通常數(shù)據(jù)都具有空間地理位置,因此我們在進行數(shù)據(jù)分析時,最理想的方法應該是采取利用空間數(shù)據(jù)分析方法。我們對2019 年我國31 個行政區(qū)的交通事故總量進行了分析,表現(xiàn)出較強的聚集性,即高值與高值鄰接,低值與低值鄰接。我們進一步對GDP與交通事故總數(shù)關系時發(fā)現(xiàn),經(jīng)濟越發(fā)達的地區(qū),交通事故總數(shù)越多,在發(fā)展經(jīng)濟時應該尊重人的生活,堅持人民至上、生命至上。