李順勇,張睿軒,張佳璇,趙冠婕
(山西大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006)
近年來,數(shù)字經(jīng)濟發(fā)展規(guī)模不斷擴大,很大程度上促進了我國整體經(jīng)濟規(guī)模穩(wěn)步向前。2016 年在杭州召開的G20 峰會重新定義數(shù)字經(jīng)濟[1]:以使用數(shù)字化的知識和信息作為關(guān)鍵生產(chǎn)要素、以現(xiàn)代信息網(wǎng)絡(luò)作為重要載體、以信息通訊技術(shù)的有效使用作為效率提升和經(jīng)濟結(jié)構(gòu)優(yōu)化的重要推動力的一系列經(jīng)濟活動?,F(xiàn)今中國經(jīng)濟正處于高質(zhì)量發(fā)展階段,并逐步向數(shù)字強國邁進[2-3]。加快合理評價數(shù)字經(jīng)濟發(fā)展的步伐,提高我國各省份數(shù)字經(jīng)濟發(fā)展水平迫在眉睫。
徐小凡(2021)[4]通過對比國內(nèi)外不同研究方法之間的共性與差異,總結(jié)出兩種基于數(shù)字經(jīng)濟測算角度的統(tǒng)計口徑和測算方法。張媛媛和周春應(yīng)(2021)[5]使用熵權(quán)法建立評價體系,研究長三角等三大都市圈的數(shù)字經(jīng)濟發(fā)展?fàn)顩r。高露靜和姚正海(2021)[6]主要從數(shù)字基礎(chǔ)設(shè)施、數(shù)字創(chuàng)新能力、數(shù)字產(chǎn)業(yè)化三個維度運用熵權(quán)法研究華東地區(qū)2013—2018 年的數(shù)字經(jīng)濟發(fā)展?fàn)顩r。李英杰和韓平(2022)[7]基于熵值法測度了中國2010—2018 年數(shù)字經(jīng)濟水平發(fā)展趨勢,并建立灰色預(yù)測模型對2019—2028 年的數(shù)字經(jīng)濟發(fā)展走向進行預(yù)測。盛斌和劉宇英(2022)[8]研究了數(shù)字經(jīng)濟發(fā)展指數(shù)的測度與空間分異特征之間的關(guān)系,認為不同空間的數(shù)字經(jīng)濟發(fā)展水平不均衡,且省域差異逐年減小。王娟娟和佘干軍(2021)[9]在對數(shù)字經(jīng)濟的研究中,創(chuàng)造性地引入地區(qū)發(fā)展新指標(biāo),評估各地區(qū)差異化發(fā)展?fàn)顩r,將我國區(qū)域經(jīng)濟發(fā)展水平劃分為三大梯度。
本文在建立數(shù)字經(jīng)濟測度體系的基礎(chǔ)上,采用熵權(quán)法、層次聚類、灰色馬爾可夫模型等方法深入研究我國各省市數(shù)字經(jīng)濟發(fā)展水平的差異,對完善、延申數(shù)字經(jīng)濟理論知識和制定地方性政策具有現(xiàn)實意義。
信息熵[10]表示特征包含信息量的期望,用于衡量信息量大小。表達式如下:
式(1)中,U 表示所有可能事件的集合,pi為事件Ui發(fā)生的概率。
信息熵越小,表示指標(biāo)包含的信息量越大,熵權(quán)法賦予該指標(biāo)的權(quán)重則越大[11]。
熵權(quán)法[12]步驟如下:
(1)確定指標(biāo)體系:設(shè)原始數(shù)據(jù)的第i 個特征為xi,第i 個指標(biāo)的第j 個值為xij(1≤i≤n,1≤j ≤m);
(2)數(shù)據(jù)歸一化公式如下:
(3)計算第i 個指標(biāo)第j 個值的比重:
(4)計算第i 個指標(biāo)的信息熵:
(5)計算第i 個指標(biāo)的權(quán)重:
(6)根據(jù)指標(biāo)權(quán)重計算樣本評分:
熵權(quán)法能夠根據(jù)各指標(biāo)的區(qū)分能力確定權(quán)重,具有較高的合理性和可信度[13]。
層次聚類[14]利用樹形結(jié)構(gòu)反映聚類結(jié)果,常采用歐氏距離計算兩樣本點之間的距離,平均值距離計算類間距離,用dij表示第i 個樣品與第j 個樣品之間的距離,dmean(ci,cj)表示簇間距離,公式如下:
其中,mi、mj分別表示兩簇的中心點。
灰色預(yù)測[15]是對灰色系統(tǒng)所作的預(yù)測,可以有效處理小樣本、信息不確定的預(yù)測問題,被廣泛應(yīng)用在股票價格、電力負荷預(yù)測等領(lǐng)域?;疑R爾可夫模型[16]引入馬爾可夫鏈預(yù)測修正殘差,利用其狀態(tài)轉(zhuǎn)移概率矩陣二次擬合,提高模型預(yù)測精度?;疑R爾科夫模型的步驟如下:
首先,建立GM(1,1)灰色模型:
1.可行性分析
定義級比σ(k):
原始序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),級比滿足:
則序列X(0)可作GM(1,1)建模。
2.數(shù)據(jù)變換
若序列未通過級比檢驗,則需要利用對數(shù)變換、平移變換等方法對序列進行處理。
3.模型預(yù)測
模型預(yù)測表達式為:
4.模型檢驗
本文主要采用預(yù)測精度等級對照的方法進行精度檢驗,等級對照表如表1 所示。
表1 預(yù)測精度等級對照表
5.建立灰色馬爾可夫模型
(1)劃分馬爾可夫狀態(tài)區(qū)間
其中,[a1i,a2i]為狀態(tài)Ei的區(qū)間。
(2)計算狀態(tài)轉(zhuǎn)移矩陣
式(14)中pij=pij(k)=,ni(k)表示k 時刻狀態(tài)i 發(fā)生狀態(tài)轉(zhuǎn)移的總次數(shù),nij(k)表示k 時刻狀態(tài)i 轉(zhuǎn)移到狀態(tài)j 的總次數(shù)。
(3)求解預(yù)測模型
當(dāng)預(yù)測值高于實際值時取負,反之取正。
(4)模型修正與精度檢驗
灰色馬爾可夫模型根據(jù)模型殘差,計算平均殘差對模型預(yù)測值進行修正,提高模型的擬合精度,再進行灰色模型的精度檢驗。
本文綜合考慮現(xiàn)有數(shù)字經(jīng)濟評價指標(biāo)體系,遵循科學(xué)性和簡明性原則,從數(shù)字終端設(shè)施、網(wǎng)絡(luò)資源、數(shù)字產(chǎn)業(yè)規(guī)模、技術(shù)創(chuàng)新投入、數(shù)字經(jīng)濟可持續(xù)發(fā)展、數(shù)字金融發(fā)展水平6 個維度選取22 個評價指標(biāo)構(gòu)建數(shù)字經(jīng)濟發(fā)展水平評價體系[17-18],評價指標(biāo)如下:
數(shù)據(jù)主要來自《中國統(tǒng)計年鑒》《中國信息產(chǎn)業(yè)年鑒》《中國數(shù)字經(jīng)濟發(fā)展白皮書(2020)》等??紤]到新疆和西藏兩地區(qū)數(shù)字經(jīng)濟發(fā)展水平有待提高,且部分指標(biāo)數(shù)據(jù)不完整,本文選擇其余29 個省、自治區(qū)、直轄市2013—2020 年的各項指標(biāo)數(shù)據(jù)進行分析。
圖1 為部分評價指標(biāo)數(shù)據(jù)的箱線圖,可以發(fā)現(xiàn)各指標(biāo)間存在量綱差異,應(yīng)首先對指標(biāo)數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化后的箱線圖如圖2 所示。
圖1 標(biāo)準(zhǔn)化前4 個評價指標(biāo)的箱線圖
圖2 標(biāo)準(zhǔn)化后4 個指標(biāo)的箱線圖
在數(shù)據(jù)標(biāo)準(zhǔn)化的基礎(chǔ)上,利用熵權(quán)法對構(gòu)建數(shù)字經(jīng)濟評價體系中的評價指標(biāo)賦予權(quán)重。由于熵權(quán)法確定的權(quán)重對樣本具有依賴性,會隨著樣本的變化而波動。故本文用熵權(quán)法對2013—2020 年的評價指標(biāo)賦權(quán),每個指標(biāo)得到8 個權(quán)重,將所得權(quán)重取平均作為該評價指標(biāo)最終的權(quán)重,結(jié)果如表3 所示。
表3 各評價指標(biāo)熵權(quán)法結(jié)果及最終權(quán)重
根據(jù)權(quán)重計算29 個地區(qū)數(shù)字經(jīng)濟發(fā)展水平評分,計算公式如下:
式(16)中,xij表示第i 個指標(biāo)在第j 個地區(qū)的統(tǒng)計數(shù)據(jù),wi表示第i 個指標(biāo)的權(quán)重值。上述29 個省、自治區(qū)、直轄市2013—2020 年數(shù)字經(jīng)濟發(fā)展水平的評分取值如表4 所示。
表4 2013—2020 年各地區(qū)數(shù)字經(jīng)濟發(fā)展水平評分
1.數(shù)字經(jīng)濟發(fā)展水平總體分析。首先,對全國29 個地區(qū)的總體數(shù)字經(jīng)濟發(fā)展水平進行分析,數(shù)字經(jīng)濟發(fā)展水平隨時間的變化趨勢如圖3 所示。
圖3 2013—2020 年各省份數(shù)字技術(shù)層發(fā)展評價值變化趨勢
廣東、浙江、江蘇、北京、山東、上海數(shù)字經(jīng)濟優(yōu)勢明顯,與其他省份地區(qū)有較大的差距。華東地區(qū)整體發(fā)展較好,華北華中處于中間位置,西北、東北、海南、內(nèi)蒙古數(shù)字經(jīng)濟發(fā)展始終處于末位。
2.數(shù)字經(jīng)濟水平省域差異分析。根據(jù)上述2013—2020 年各地區(qū)數(shù)字經(jīng)濟發(fā)展水平評分,對29 個地區(qū)的數(shù)字經(jīng)濟發(fā)展水平進行聚類分析,以便進一步分析全國各地的數(shù)字經(jīng)濟發(fā)展水平的異同點。本文采用層次聚類分析的方法,29 個地區(qū)的數(shù)字經(jīng)濟發(fā)展水平聚類結(jié)果如圖4 所示。
圖4 層次聚類分析結(jié)果
由圖4 可以看出,根據(jù)數(shù)據(jù)經(jīng)濟發(fā)展水平,可以將上述29 個省、自治區(qū)、直轄市分為不同類別。
山東、上海、浙江、北京、廣東、江蘇六地區(qū)數(shù)字經(jīng)濟發(fā)展水平較高,發(fā)展態(tài)勢穩(wěn)定,這主要得益于政策引導(dǎo)、地理優(yōu)勢以及人才引進。以山東省、北京市例,山東省[19]將數(shù)字經(jīng)濟與實體經(jīng)濟融合發(fā)展,具有大規(guī)模的高技術(shù)產(chǎn)業(yè),聚集大量科研人才;北京市[20]不斷完善人工智能和區(qū)塊鏈等產(chǎn)業(yè)體系,推進數(shù)字化轉(zhuǎn)型發(fā)展。
四川、山西等23 個地區(qū)為數(shù)字經(jīng)濟發(fā)展水平相對較低的地區(qū)。這些地區(qū)需要進一步夯實數(shù)字基礎(chǔ)設(shè)施建設(shè),可以借鑒長三角城市群和一線城市數(shù)字經(jīng)濟的發(fā)展路徑和經(jīng)驗,結(jié)合自身特色,借助數(shù)字經(jīng)濟改變地區(qū)生產(chǎn)和消費方式。
根據(jù)2013—2020 年各地區(qū)的數(shù)字經(jīng)濟發(fā)展水平評分,建立灰色馬爾可夫模型測度2021 年評分。
首先對各項指標(biāo)數(shù)據(jù)進行級比檢驗。樣本量n=8,級比σ 的允許取值范圍為σ(k)?(0.801,1.249)。經(jīng)過計算,各地區(qū)2013—2020 年數(shù)字經(jīng)濟評分序列基本都無法通過級比檢驗,因此需要平移變換,即:
結(jié)合原始數(shù)據(jù)情況,a 取1 時各地區(qū)的數(shù)字經(jīng)濟發(fā)展水平評分序列均可通過級比檢驗,可以建立GM(1,1)模型。
利用GM(1,1)模型預(yù)測各地區(qū)2021 年數(shù)字經(jīng)濟發(fā)展水平評分,MSE 為0.002 6。經(jīng)過檢驗發(fā)現(xiàn),部分地區(qū)的灰色模型不能通過精度檢驗,因此引入馬爾可夫模型,利用其狀態(tài)轉(zhuǎn)移概率矩陣二次擬合,重新測度2021 年數(shù)字經(jīng)濟發(fā)展水平評分,結(jié)果如表5 所示,灰色馬爾可夫模型相應(yīng)的MSE 為0.000 09。相較于灰色模型,灰色馬爾可夫模型有更好的預(yù)測表現(xiàn)。
表5 2021 年各地區(qū)數(shù)字經(jīng)濟發(fā)展水平評分預(yù)測結(jié)果
以山東省為例,對比灰色預(yù)測值、灰色馬爾可夫預(yù)測值與真實值之間的差異,預(yù)測折線圖如圖5、圖6 所示,具體情況如表6 所示。
圖5 灰色模型GM(1,1)預(yù)測
圖6 灰色馬爾可夫預(yù)測
表6 山東省數(shù)字經(jīng)濟發(fā)展水平評分真實值與預(yù)測值
對比圖5 和圖6 發(fā)現(xiàn),灰色馬爾可夫模型擬合精度明顯高于灰色模型。通過計算可知,灰色模型的均方誤差值為0.000 09,灰色馬爾可夫模型的均方誤差值為0.000 01,再次證明灰色馬爾可夫模型的預(yù)測優(yōu)勢。
本文通過熵權(quán)法、層次聚類、灰色馬爾可夫模型定量分析29 個地區(qū)的數(shù)字經(jīng)濟水平,主要得到以下結(jié)論:
1.不同地區(qū)的發(fā)展水平存在較大的差異,同一地區(qū)的數(shù)字經(jīng)濟年增長速率也有顯著變化。以2020年為例,廣東省的數(shù)字經(jīng)濟發(fā)展程度最高,利用熵權(quán)法得到的數(shù)字經(jīng)濟評分達到0.744,而寧夏地區(qū)的數(shù)字經(jīng)濟得分僅有0.013。以山西省為例,山西省2016—2017 年數(shù)字經(jīng)濟水平增長27.55%,2017—2018 年、2018—2019 年分別降低8.8%、22.8%,2019—2020 年數(shù)字經(jīng)濟快速增長,發(fā)展指標(biāo)增長37.5%。
2.通過時序差異演化分析和聚類算法可以發(fā)現(xiàn),2013—2020 年全國數(shù)字經(jīng)濟發(fā)展水平總體呈現(xiàn)先上升后下降的趨勢,數(shù)字經(jīng)濟水平發(fā)展第一梯隊:廣東、江蘇、浙江、北京、上海、山東,發(fā)展較好,發(fā)展態(tài)勢穩(wěn)定。相比較而言,四川、湖北、山西等23 個地區(qū)數(shù)字經(jīng)濟發(fā)展緩慢。
3.本文采用灰色馬爾可夫模型預(yù)測各地區(qū)數(shù)字經(jīng)濟發(fā)展水平,可以有效把握各地區(qū)數(shù)字經(jīng)濟發(fā)展方向,為上述29 個省市自治區(qū)推動數(shù)字經(jīng)濟發(fā)展提供決策依據(jù),豐富定量評價數(shù)字經(jīng)濟的方法和內(nèi)容。
本文所引入的指標(biāo)同時包含線性和非線性數(shù)據(jù),后續(xù)研究中可以嘗試構(gòu)建灰色神經(jīng)網(wǎng)絡(luò)模型,結(jié)合灰色模型預(yù)測小樣本的優(yōu)勢以及神經(jīng)網(wǎng)絡(luò)處理非線性數(shù)據(jù)能力強的優(yōu)點,提高預(yù)測精度。