郭明軍,陳沁,安小米,王建冬,易成岐
1. 國家信息中心,北京 100045;2. 中國人民大學(xué)信息資源管理學(xué)院,北京 100872;3. 成都數(shù)聯(lián)銘品科技有限公司,四川 成都 610041;4. 中國人民大學(xué)智慧城市研究中心,北京 100872
指數(shù)是客觀反映事物發(fā)展水平的有效工具之一。隨著大數(shù)據(jù)的快速發(fā)展,大數(shù)據(jù)指數(shù)研究成為學(xué)術(shù)界的重點議題,成為客觀反映中國大數(shù)據(jù)發(fā)展現(xiàn)狀的重要手段,有助于政府、企業(yè)、社會了解大數(shù)據(jù)領(lǐng)域的發(fā)展?fàn)顩r,為相關(guān)決策的制定提供參考。
近年來,隨著我國大數(shù)據(jù)戰(zhàn)略的持續(xù)推進(jìn),如何對大數(shù)據(jù)發(fā)展水平進(jìn)行量化評估,為政府科學(xué)決策、精準(zhǔn)施策提供客觀數(shù)據(jù)支撐,成為眾多研究機構(gòu)的一項重要任務(wù)。許多學(xué)者圍繞大數(shù)據(jù)指數(shù)進(jìn)行了深入研究,形成了豐富的指數(shù)類研究成果。但受限于數(shù)據(jù)的可獲得性,目前大數(shù)據(jù)指數(shù)領(lǐng)域研究利用的數(shù)據(jù)或者僅涉及經(jīng)濟或民生等某一具體領(lǐng)域,或者僅使用政府統(tǒng)計類小數(shù)據(jù)或互聯(lián)網(wǎng)大數(shù)據(jù),數(shù)據(jù)種類及數(shù)量不足,難以真正實現(xiàn)“統(tǒng)籌規(guī)劃政務(wù)數(shù)據(jù)資源和社會數(shù)據(jù)資源”的目標(biāo)。這成為我國大數(shù)據(jù)指數(shù)研究的重要瓶頸,亟待突破。本文以2019年貴陽數(shù)博會發(fā)布的《中國大數(shù)據(jù)發(fā)展指數(shù)報告(2018年)》提出的大數(shù)據(jù)發(fā)展指數(shù)(2018)為例,充分融合政務(wù)數(shù)據(jù)和社會數(shù)據(jù)資源,為我國大數(shù)據(jù)指數(shù)研究探索新的路徑。
在國外,大數(shù)據(jù)指數(shù)研究首先在預(yù)測流行病的發(fā)生概率方面取得了顯著成效[1],隨后,大數(shù)據(jù)方法逐步被拓展到經(jīng)濟學(xué)領(lǐng)域[2],許多學(xué)者圍繞個人消費行為[3]、失業(yè)率預(yù)測[4-5]、勞動供需分析[6]、就業(yè)歧視[7]等進(jìn)行了大數(shù)據(jù)指數(shù)監(jiān)測預(yù)測研究。近年來,采用綜合集成方法,融合多視角、多層面、多利益方,把各方面構(gòu)成要素有機融合,成為大數(shù)據(jù)治理體系框架構(gòu)建的基本思路[8]。在國內(nèi),大數(shù)據(jù)指數(shù)研究的力度逐漸加強,形成了兩種主要類型,第一類是以高校為代表的學(xué)術(shù)類研究,第二類是權(quán)威信息化機構(gòu)發(fā)布的評估類研究報告。
國內(nèi)學(xué)術(shù)類大數(shù)據(jù)指數(shù)研究主要由高校牽頭,往往聚焦某個特定領(lǐng)域。比如,一些學(xué)者圍繞消費[9]、交通[10]、就業(yè)[11]、融資[12]、生活質(zhì)量[13]等民生領(lǐng)域,編制了大數(shù)據(jù)指數(shù)進(jìn)行預(yù)測分析研究;也有學(xué)者聚焦經(jīng)濟領(lǐng)域,通過形成電力大數(shù)據(jù)指數(shù)[14]、金融風(fēng)險指數(shù)[15]、制造業(yè)指數(shù)[16]、實體經(jīng)濟指數(shù)[17]等,對經(jīng)濟發(fā)展趨勢進(jìn)行監(jiān)測預(yù)測研究;還有一些學(xué)者關(guān)注政府治理[18]、互聯(lián)網(wǎng)輿情[19]、居民情緒[20]、社會信用[21]、城市發(fā)展[22]等社會治理領(lǐng)域,開發(fā)了相關(guān)的大數(shù)據(jù)指數(shù)。
評估類大數(shù)據(jù)指數(shù)研究主要由國家信息中心、中國信息通信研究院(以下簡稱中國信通院)、中國電子信息產(chǎn)業(yè)發(fā)展研究院(以下簡稱賽迪研究院)等國家級信息化機構(gòu)編制,從國家層面、區(qū)域?qū)用?、省級層面、產(chǎn)業(yè)層面等對我國大數(shù)據(jù)的發(fā)展情況進(jìn)行評估排名,阿里巴巴集團、南方基金管理股份有限公司、新浪財經(jīng)等企業(yè)也基于自身數(shù)據(jù)資源優(yōu)勢,針對某個領(lǐng)域開展大數(shù)據(jù)指數(shù)評估。
根據(jù)數(shù)據(jù)源及分析方法的不同,評估類研究又可分為互聯(lián)網(wǎng)大數(shù)據(jù)分析與統(tǒng)計數(shù)據(jù)分析兩種情況?;ヂ?lián)網(wǎng)大數(shù)據(jù)分析的典型代表是國家信息中心編寫的《中國大數(shù)據(jù)發(fā)展報告(2017)》,該報告基于40多億條互聯(lián)網(wǎng)數(shù)據(jù),應(yīng)用大數(shù)據(jù)分析技術(shù),從政策環(huán)境、人才狀況、投資熱度、創(chuàng)新創(chuàng)業(yè)、產(chǎn)業(yè)發(fā)展、網(wǎng)民信心等方面,對全國各省大數(shù)據(jù)的發(fā)展情況進(jìn)行評估。阿里研究院2017年發(fā)布的《品質(zhì)消費指數(shù)報告》[23]從全網(wǎng)采集數(shù)據(jù),使用大數(shù)據(jù)技術(shù)分析了我國居民消費的升級趨勢。南方新浪大數(shù)據(jù)指數(shù)則在利用上市公司數(shù)據(jù)的基礎(chǔ)上,將互聯(lián)網(wǎng)大數(shù)據(jù)引入指數(shù)編制中,利用大數(shù)據(jù)對市場主體的情緒進(jìn)行刻畫和量化。這類評估的好處在于,基于海量的互聯(lián)網(wǎng)數(shù)據(jù)、使用大數(shù)據(jù)技術(shù)進(jìn)行的分析評估,其數(shù)據(jù)樣本很大,有的指數(shù)涵蓋數(shù)十億甚至數(shù)百億條數(shù)據(jù),且很多數(shù)據(jù)能夠?qū)崟r動態(tài)更新,同時使用了數(shù)據(jù)挖掘、文本分析、語義分析等大數(shù)據(jù)技術(shù),是真正意義上的大數(shù)據(jù)分析。不足之處在于,由于數(shù)據(jù)采自互聯(lián)網(wǎng),容易被認(rèn)為是網(wǎng)絡(luò)輿情分析或不能直接反映現(xiàn)實情況。統(tǒng)計數(shù)據(jù)分析的典型案例是中國信通院發(fā)布的《中國大數(shù)據(jù)發(fā)展調(diào)查報告(2018年)》,其主要通過現(xiàn)場訪問、電話采訪、在線調(diào)研和專家訪談等方式獲取數(shù)據(jù)。賽迪研究院發(fā)布的《中國大數(shù)據(jù)發(fā)展指數(shù)報告(2018年)》也主要以統(tǒng)計數(shù)據(jù)為基礎(chǔ),對我國31個省、自治區(qū)、直轄市的大數(shù)據(jù)發(fā)展環(huán)境、大數(shù)據(jù)產(chǎn)業(yè)、大數(shù)據(jù)應(yīng)用、技術(shù)研發(fā)創(chuàng)新及數(shù)據(jù)共享開放情況進(jìn)行評估。這類評估主要基于官方統(tǒng)計數(shù)據(jù)或調(diào)查研究數(shù)據(jù),使用傳統(tǒng)數(shù)據(jù)分析方法進(jìn)行分析評估,好處是數(shù)據(jù)相對權(quán)威,不足之處在于這類評估并非真正意義上的大數(shù)據(jù)分析,而是基于傳統(tǒng)統(tǒng)計方法開展的小樣本數(shù)據(jù)分析。
從以上分析可以看出,無論是學(xué)術(shù)類大數(shù)據(jù)指數(shù)研究還是評估類大數(shù)據(jù)指數(shù)研究,雖然都可以在一定程度上進(jìn)行大數(shù)據(jù)預(yù)測或反映大數(shù)據(jù)的發(fā)展水平,但也存在一些不足。學(xué)術(shù)類大數(shù)據(jù)指數(shù)研究由于缺少海量數(shù)據(jù)支撐,即便擁有較好的分析技術(shù)方法,往往也只能對某一領(lǐng)域進(jìn)行研究,分析對象無法覆蓋各個省市。權(quán)威機構(gòu)發(fā)布的評估類指數(shù)也存在一定缺陷,從數(shù)據(jù)源來看,該類評估僅僅基于互聯(lián)網(wǎng)大數(shù)據(jù)或統(tǒng)計小數(shù)據(jù),不能體現(xiàn)多源數(shù)據(jù)廣泛代表性的優(yōu)勢,同時由于數(shù)據(jù)獲取困難,評估對象只能覆蓋到省級地區(qū),無法延伸到地市層面。
為了彌補上述兩類方法的不足,國家信息中心聯(lián)合相關(guān)單位,探索將政府部門數(shù)據(jù)、政府網(wǎng)站數(shù)據(jù)、統(tǒng)計數(shù)據(jù)等政務(wù)數(shù)據(jù)與互聯(lián)網(wǎng)大數(shù)據(jù)、企業(yè)數(shù)據(jù)等社會數(shù)據(jù)進(jìn)行對接融合,構(gòu)建了大數(shù)據(jù)發(fā)展指數(shù)(2018),使用大數(shù)據(jù)方法對全國及各省市大數(shù)據(jù)發(fā)展情況進(jìn)行評估,從而既體現(xiàn)政務(wù)數(shù)據(jù)的直接性和權(quán)威性,也保證互聯(lián)網(wǎng)等社會數(shù)據(jù)的鮮活性和大樣本量。
一是數(shù)據(jù)層面,拓展多源數(shù)據(jù)?!爸笜?biāo)好編、數(shù)據(jù)難得”是評估工作中普遍存在的問題,是否擁有廣泛的數(shù)據(jù)源和足夠的數(shù)據(jù)量,直接關(guān)系到定量評估的效果的好壞。本文通過大數(shù)據(jù)評估解決了數(shù)據(jù)源問題:一是通過搭建大數(shù)據(jù)指標(biāo)監(jiān)測系統(tǒng),抓取互聯(lián)網(wǎng)中與大數(shù)據(jù)評估相關(guān)的指標(biāo),包括政府大數(shù)據(jù)規(guī)劃及政策、企業(yè)注冊數(shù)據(jù)、專利數(shù)據(jù)、招聘數(shù)據(jù)、經(jīng)濟金融產(chǎn)業(yè)中間投入及數(shù)量等數(shù)據(jù);二是采集國家統(tǒng)計局、工信部、知識產(chǎn)權(quán)局發(fā)布的相關(guān)政務(wù)數(shù)據(jù);三是參考借鑒現(xiàn)有研究成果,包括財新BBD(成都數(shù)聯(lián)銘品科技有限公司)數(shù)字經(jīng)濟指數(shù)中的產(chǎn)業(yè)指數(shù)、新華三數(shù)字經(jīng)濟指數(shù)和國家行政學(xué)院電子政務(wù)研究中心提出的政務(wù)應(yīng)用指數(shù)等。通過互聯(lián)網(wǎng)數(shù)據(jù)與政務(wù)數(shù)據(jù)融合分析,保證多源數(shù)據(jù)的代表性,同時也兼顧了數(shù)據(jù)的權(quán)威性。相關(guān)數(shù)據(jù)見表1。
表1 大數(shù)據(jù)發(fā)展指數(shù)的政務(wù)數(shù)據(jù)與社會數(shù)據(jù)使用情況
二是對象層面,覆蓋所有城市。此前的評估主要針對國家層面、區(qū)域?qū)用婕笆〖墝用?,缺少全方位對城市層面進(jìn)行的專門評估。本文將評估對象下沉到城市級,獲取全國各個城市的多源異構(gòu)數(shù)據(jù),對各城市的大數(shù)據(jù)發(fā)展進(jìn)行全景式分析,力求展現(xiàn)各城市的大數(shù)據(jù)發(fā)展水平。
三是技術(shù)層面,使用先進(jìn)技術(shù)。傳統(tǒng)的統(tǒng)計分析僅能處理小樣本數(shù)據(jù),而對于數(shù)十億甚至數(shù)百億條的數(shù)據(jù),往往束手無策。更重要的是,對于互聯(lián)網(wǎng)上的大量非結(jié)構(gòu)化數(shù)據(jù),只能通過大數(shù)據(jù)手段,才能進(jìn)行有效的分析挖掘。大數(shù)據(jù)發(fā)展指數(shù)(2018)的數(shù)據(jù)加工處理綜合使用了文本挖掘、語義分析、情感分析、機器學(xué)習(xí)等先進(jìn)技術(shù)手段,體現(xiàn)了應(yīng)用大數(shù)據(jù)技術(shù)開展大數(shù)據(jù)評估的特點。
為了確保評價指標(biāo)的有效性,準(zhǔn)確、全面地衡量我國大數(shù)據(jù)的發(fā)展水平,本文在設(shè)計大數(shù)據(jù)發(fā)展指標(biāo)時堅持以下4項原則。
一是完備性。指標(biāo)體系中的指標(biāo)能夠全面地反映評估對象的發(fā)展情況,確保不遺漏重要指標(biāo)項。本評估指標(biāo)體系包含了基礎(chǔ)能力、創(chuàng)新應(yīng)用、綜合保障三大方面,從50個維度評估省市的大數(shù)據(jù)發(fā)展情況。
二是客觀性。在指標(biāo)選取及整個指標(biāo)體系的確立中,每個環(huán)節(jié)均選取客觀、可量化的指標(biāo),除了能夠在網(wǎng)上直接采集的客觀數(shù)據(jù),也采用了政府部門及相關(guān)機構(gòu)發(fā)布的客觀統(tǒng)計數(shù)據(jù),并借鑒了已有研究成果,盡可能規(guī)避主觀因素帶來的干擾。
三是導(dǎo)向性。整個指標(biāo)設(shè)計突出了應(yīng)用導(dǎo)向,將“創(chuàng)新應(yīng)用”指標(biāo)作為最重要的指標(biāo),并賦予最大的權(quán)重,重點評估各個省市在政務(wù)、經(jīng)濟及民生三大領(lǐng)域的應(yīng)用成效。
四是易操作性。所有指標(biāo)的數(shù)據(jù)均能獲取,有些數(shù)據(jù)甚至可以做到實時獲取。評價方法采用專家賦權(quán)法,該方法具有很強的操作性。同時,專業(yè)分析人員及大數(shù)據(jù)分析平臺保證了整個評估工作的易操作性。
大數(shù)據(jù)發(fā)展指數(shù)(2018)以“應(yīng)用”為核心,圍繞“能力-成效-保障”3個方面,構(gòu)建了由基礎(chǔ)能力、創(chuàng)新應(yīng)用、綜合保障構(gòu)成的一級指標(biāo)。按照每個一級指標(biāo)包含的核心要素,設(shè)置了9個二級指標(biāo),同時,根據(jù)數(shù)據(jù)的可獲得性以及為了充分體現(xiàn)政務(wù)數(shù)據(jù)與社會數(shù)據(jù)的融合,構(gòu)建了50個三級指標(biāo),形成了我國大數(shù)據(jù)發(fā)展指數(shù)。大數(shù)據(jù)發(fā)展指數(shù)屬于大數(shù)據(jù)指數(shù)范疇,兩者在數(shù)據(jù)采集匯聚、加工處理以及編制思路等方面基本相似,只是大數(shù)據(jù)發(fā)展指數(shù)更加強調(diào)發(fā)展應(yīng)用,“能力-成效-保障”3個維度更加突出發(fā)展的導(dǎo)向。
(1)基礎(chǔ)能力指標(biāo)
基礎(chǔ)能力指標(biāo)主要衡量地區(qū)的大數(shù)據(jù)基礎(chǔ),包括數(shù)據(jù)、算力、算法3個二級指標(biāo)和20個三級指標(biāo),見表2。
表2 基礎(chǔ)能力指標(biāo)
(2)創(chuàng)新應(yīng)用指標(biāo)
創(chuàng)新應(yīng)用指標(biāo)包括政務(wù)應(yīng)用、經(jīng)濟應(yīng)用和民生應(yīng)用3個二級指標(biāo)和24個三級指標(biāo),體現(xiàn)大數(shù)據(jù)在政府治理、產(chǎn)業(yè)發(fā)展和便民服務(wù)領(lǐng)域的應(yīng)用,見表3。
表3 創(chuàng)新應(yīng)用指標(biāo)
(3)綜合保障指標(biāo)
綜合保障指標(biāo)包含政策保障、合作保障和安全保障3個二級指標(biāo)及6個三級指標(biāo),著重分析大數(shù)據(jù)應(yīng)用的穩(wěn)定性及可持續(xù)性,見表4。
表4 綜合保障指標(biāo)
指標(biāo)使用了所有可獲得的能夠度量大
數(shù)據(jù)發(fā)展的年度城市數(shù)據(jù),并創(chuàng)新地納入了全網(wǎng)大數(shù)據(jù)。例如,“數(shù)據(jù)”二級指標(biāo)主要來自其他指數(shù)的評估結(jié)果,包括復(fù)旦大學(xué)發(fā)布的中國開放數(shù)林指數(shù)、新華三的中國城市數(shù)字經(jīng)濟指數(shù);“算力”二級指標(biāo)主要來自各項統(tǒng)計指標(biāo);而“算法”部分則主要來自大數(shù)據(jù),從人才總量和專利申請、專利流轉(zhuǎn)3個方面度量大數(shù)據(jù)的技術(shù)水平,選用的數(shù)據(jù)總量達(dá)20億條。各種類型數(shù)據(jù)的使用保證了在更細(xì)、更高頻維度上度量城市大數(shù)據(jù)的發(fā)展情況,這也是目前其他機構(gòu)發(fā)布的大數(shù)據(jù)指標(biāo)中未能體現(xiàn)的特點。
大數(shù)據(jù)發(fā)展指數(shù)的測算采用主觀賦權(quán)法對指標(biāo)體系中的各指標(biāo)進(jìn)行賦權(quán),通過專家打分再求平均值獲得各指標(biāo)的權(quán)重,在保證指標(biāo)體系科學(xué)性、全面性的同時,力求指標(biāo)權(quán)重的穩(wěn)定性。
使用定基標(biāo)準(zhǔn)化方法將測算結(jié)果進(jìn)行標(biāo)準(zhǔn)化處理,既可以較方便地進(jìn)行橫向和縱向比較,也能與2018年北京的數(shù)值進(jìn)行對標(biāo),有利于各個地方找到大數(shù)據(jù)發(fā)展過程中自身存在的短板。
使用定基標(biāo)準(zhǔn)化方法的原理如下:
● 設(shè)原始值為Xijt,其中i表示指標(biāo)項,j表示城市,t表示時間;
● 選擇2018年北京各項數(shù)值作為基期,標(biāo)準(zhǔn)化數(shù)值為100,記錄其縮放比例,即當(dāng)j=北京、t=2018時,記錄Φi= 100/Xi;
● 將所有指標(biāo)數(shù)值乘以對應(yīng)的iΦ,得到Xijt=XijtΦi;
● 將Xijt作為新的指標(biāo)數(shù)值進(jìn)行計算。
按照此設(shè)計方法,本文對9個二級指標(biāo)權(quán)重進(jìn)行了賦值,見表5。從表5可知,創(chuàng)新應(yīng)用指標(biāo)的權(quán)重最高,達(dá)到45%,體現(xiàn)了創(chuàng)新應(yīng)用的重要性,突出了發(fā)展導(dǎo)向的指標(biāo)制定思路。
表5 大數(shù)據(jù)發(fā)展指數(shù)的指標(biāo)權(quán)重賦值
大數(shù)據(jù)發(fā)展指數(shù)(2018)編制形成之后,從橫向、縱向兩個維度驗證了指標(biāo)體系在評估國家及城市大數(shù)據(jù)發(fā)展水平方面的有效性。通過對2015—2018年全國大數(shù)據(jù)發(fā)展水平進(jìn)行縱向?qū)Ρ仍u估,比較了歷年大數(shù)據(jù)發(fā)展的變化情況。通過對351個城市的大數(shù)據(jù)發(fā)展水平進(jìn)行橫向?qū)Ρ仍u估,分析了各城市大數(shù)據(jù)發(fā)展特點及存在的短板。
基于構(gòu)建的大數(shù)據(jù)發(fā)展指標(biāo),筆者對2015—2018年全國大數(shù)據(jù)發(fā)展指數(shù)進(jìn)行了測算,如圖1所示。結(jié)果顯示,4年來,我國大數(shù)據(jù)發(fā)展總體呈現(xiàn)上升趨勢,但2018年略有下降。從具體指標(biāo)來看,2015—2018年我國大數(shù)據(jù)發(fā)展的基礎(chǔ)能力始終保持上升態(tài)勢,但由于創(chuàng)新應(yīng)用水平在2018年有所下降,總指數(shù)下降了0.3。
圖1 2015—2018年全國大數(shù)據(jù)發(fā)展指數(shù)
通過進(jìn)一步的分析發(fā)現(xiàn),2018年指數(shù)下降主要有兩方面原因。一是我國經(jīng)濟增速放緩,經(jīng)濟下行壓力增大,“資本寒冬”持續(xù)存在,給大數(shù)據(jù)行業(yè)的發(fā)展造成了影響,數(shù)據(jù)顯示,2018年大數(shù)據(jù)行業(yè)的風(fēng)險投資額度只有2017年的20%;二是前幾年由政府主導(dǎo)推動的大數(shù)據(jù)應(yīng)用因補貼高速擴張而在2018年資金短缺時無法持續(xù),一些大數(shù)據(jù)公司2018年支付高級人才的工資也不如2017年高,招聘數(shù)量也出現(xiàn)明顯萎縮。
筆者對2018年全國351個城市大數(shù)據(jù)的發(fā)展水平進(jìn)行了評估,2018年大數(shù)據(jù)發(fā)展指數(shù)排名前40名的城市如圖2所示。結(jié)果顯示,2018年城市大數(shù)據(jù)發(fā)展指數(shù)排名前十的分別為深圳、北京、上海、杭州、成都、廣州、天津、南京、東莞、武漢,呈現(xiàn)出一線城市引領(lǐng),成都、天津等地快速跟進(jìn)的特點。
圖2 2018年大數(shù)據(jù)發(fā)展指數(shù)排名前40名的城市
● 分項指標(biāo)方面,一線城市在經(jīng)濟及民生應(yīng)用方面遙遙領(lǐng)先,而江蘇、浙江、廣東等地的政務(wù)應(yīng)用水平位居前列,算法優(yōu)勢集中于北京、上海、深圳等地,而算力資源在東北地區(qū)較為豐富。
● 數(shù)據(jù)指標(biāo)排名前五的分別為成都、深圳、廣州、青島和福州,它們均為數(shù)據(jù)資源及經(jīng)濟基礎(chǔ)較好的城市。
● 算力指標(biāo)排名前五的為大慶、牡丹江、哈爾濱、長春和北京。東北之所以排名靠前,主要是因為算力指標(biāo)主要的計算來源是與大數(shù)據(jù)相關(guān)的信息系統(tǒng)基礎(chǔ),東北三省在人均光纖長度、人均互聯(lián)網(wǎng)端口數(shù)量等方面均處全國領(lǐng)先地位。
● 算法指標(biāo)排名前五的為北京、深圳、東莞、上海和西安,這主要得益于城市科教資源豐富、對大數(shù)據(jù)領(lǐng)域人才吸引力較強。
● 政務(wù)應(yīng)用指標(biāo)排名前五的分別為東莞、深圳、無錫、南通和金華,主要集中于江蘇、浙江、廣東,其政府部門的大數(shù)據(jù)整體應(yīng)用水平相對較高。
● 經(jīng)濟應(yīng)用和民生應(yīng)用方面,上海、北京、深圳和杭州位居前四,這表明這4個城市在大數(shù)據(jù)推動產(chǎn)業(yè)發(fā)展及提升便民服務(wù)水平方面位居全國前列。
● 綜合保障指標(biāo)方面排名前五的分別是天津、杭州、寧波、武漢和成都,表明這些城市在政策、合作和安全方面的保障力度較大,可持續(xù)發(fā)展能力較強。
本文將政務(wù)數(shù)據(jù)與社會數(shù)據(jù)進(jìn)行融合,構(gòu)建了國內(nèi)第一個將政務(wù)數(shù)據(jù)與社會數(shù)據(jù)融合、全景式展示城市大數(shù)據(jù)“畫像”的大數(shù)據(jù)發(fā)展指數(shù),彌補了大數(shù)據(jù)指標(biāo)存在的數(shù)據(jù)源單一、無法下沉到城市的不足。總體來看,該指標(biāo)體系具有“專、新、多”三大特點:“?!?,評估對象聚焦到市,覆蓋全國351個城市;“新”,充分利用大數(shù)據(jù)手段,包括數(shù)據(jù)挖掘、語義分析、社會網(wǎng)絡(luò)分析等技術(shù);“多”,將政務(wù)數(shù)據(jù)、統(tǒng)計數(shù)據(jù)、企業(yè)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)融合,應(yīng)用數(shù)據(jù)量達(dá)20億條。未來研究將基于多類數(shù)據(jù)融合的思路,進(jìn)一步拓展數(shù)據(jù)資源范圍,充分利用大數(shù)據(jù)分析技術(shù),構(gòu)建更為合理的指標(biāo)體系,客觀評估我國國家、區(qū)域、領(lǐng)域及省市縣各級大數(shù)據(jù)發(fā)展水平,為政府治理、產(chǎn)業(yè)發(fā)展及民生服務(wù)能力提升提供客觀參考。