湯志偉 郭雨暉 黃怡蕓
(1.電子科技大學(xué)公共管理學(xué)院 成都 611731;2.電子科技大學(xué)經(jīng)濟(jì)與管理學(xué)院 成都 611731)
在數(shù)據(jù)時(shí)代,各國政府陸續(xù)開展開放政府?dāng)?shù)據(jù)(Open Government Data)戰(zhàn)略,向社會(huì)公開政府資源,以期促進(jìn)數(shù)據(jù)利用、釋放數(shù)據(jù)紅利,實(shí)現(xiàn)社會(huì)、經(jīng)濟(jì)的創(chuàng)新發(fā)展。在我國,隨著《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(2015年)、《公共信息資源開放試點(diǎn)工作方案》(2018年)等相關(guān)政策的逐步頒布,越來越多的地方政府開始建立開放政府?dāng)?shù)據(jù)平臺(tái),并有序上線覆蓋生態(tài)環(huán)境、政府機(jī)構(gòu)、企業(yè)服務(wù)、交通運(yùn)輸、衛(wèi)生健康等各個(gè)領(lǐng)域的數(shù)據(jù)集。據(jù)統(tǒng)計(jì),截至2018年8月20日,我國已上線省市兩級(jí)地方政府開放數(shù)據(jù)平臺(tái)共47個(gè),累計(jì)開放數(shù)據(jù)集接近5萬個(gè)。然而,開放政府?dāng)?shù)據(jù)本身并不是該戰(zhàn)略的核心目標(biāo),能否將開放后的數(shù)據(jù)進(jìn)行有效利用,才是使數(shù)據(jù)發(fā)揮其價(jià)值的關(guān)鍵一步。
隨著相關(guān)研究的不斷推進(jìn),學(xué)術(shù)界也逐漸開始關(guān)注開放數(shù)據(jù)利用的話題:Mila等認(rèn)為開放數(shù)據(jù)利用率低的原因之一是使用者缺乏靈活運(yùn)用數(shù)據(jù)的能力,而通過培訓(xùn)與干預(yù)的方式可以提高用戶對開放數(shù)據(jù)的認(rèn)識(shí)、理解和掌握[1]。Antonio等通過構(gòu)建開放政府?dāng)?shù)據(jù)評估框架,指出提高數(shù)據(jù)質(zhì)量、及時(shí)更新數(shù)據(jù)等有助于數(shù)據(jù)的有效利用[2]。陳美認(rèn)為應(yīng)從商業(yè)應(yīng)用角度出發(fā),鼓勵(lì)政企合作,實(shí)現(xiàn)開放政府?dāng)?shù)據(jù)收益最大化[3]。湯志偉等對國內(nèi)開放政府?dāng)?shù)據(jù)利用研究進(jìn)行了系統(tǒng)性文獻(xiàn)綜述,發(fā)現(xiàn)平臺(tái)、數(shù)據(jù)等直接條件與政策、文化等間接條件,對開放政府?dāng)?shù)據(jù)利用的各個(gè)環(huán)節(jié)都會(huì)存在潛在影響[4]。而在地方政府?dāng)?shù)據(jù)開放平臺(tái)中,最有可能通過廣泛利用,率先釋放數(shù)據(jù)紅利的當(dāng)屬交通數(shù)據(jù),其緣由有三:第一,國務(wù)院常務(wù)會(huì)議上強(qiáng)調(diào),我國要優(yōu)先推動(dòng)包括交通在內(nèi)的民生領(lǐng)域政府?dāng)?shù)據(jù)向社會(huì)開放,可見交通數(shù)據(jù)具備必要的國家助力[5];第二,隨著我國城市化建設(shè)和交通運(yùn)輸業(yè)的高速發(fā)展,人均汽車擁有率、鐵路公路里程、公共交通設(shè)施數(shù)量等逐年攀升,由此帶來的交通擁堵問題、道路規(guī)劃欠佳問題、環(huán)境污染問題等引起了公眾的廣泛關(guān)注,因而由交通帶來的城市病亟待通過數(shù)據(jù)科學(xué)的方式進(jìn)行解決[6];第三,交通數(shù)據(jù)相對于教育、衛(wèi)生、社保、服務(wù)等其他民生數(shù)據(jù)來說,更具備大體量、高質(zhì)量、實(shí)時(shí)性等特征,對于分析和解決當(dāng)前城市問題、建設(shè)新型智慧城市等具備明顯的數(shù)據(jù)優(yōu)勢。
因此,深入研究打響開放政府?dāng)?shù)據(jù)利用環(huán)節(jié)第一槍的交通數(shù)據(jù),具有顯著的現(xiàn)實(shí)意義和理論意義,可為探討其他種類的數(shù)據(jù)如何進(jìn)行有效利用和價(jià)值發(fā)揮提供指導(dǎo)與借鑒?;诖耍恼聫慕煌愰_放數(shù)據(jù)入手,選取來自省市兩級(jí)共43個(gè)政府?dāng)?shù)據(jù)開放平臺(tái)中的交通數(shù)據(jù)集,參考了鄭磊等人從“數(shù)據(jù)、使用、效果”幾方面評估政府開放數(shù)據(jù)的研究成果[7],探索交通數(shù)據(jù)開放和利用的現(xiàn)狀與所存在的問題。同時(shí)還參照了OECD的開放政府?dāng)?shù)據(jù)指數(shù)(OGD)評估框架,從數(shù)據(jù)可用性(Data Availability)、可獲取性(Data Accessibility)和數(shù)據(jù)再利用(Re-use)三個(gè)維度進(jìn)行數(shù)據(jù)收集和評估[8],試圖通過數(shù)據(jù)的優(yōu)質(zhì)開放來打開高效利用的大門,以創(chuàng)造較高的社會(huì)、經(jīng)濟(jì)價(jià)值。
截至2018年8月,全國共計(jì)開放47個(gè)政府?dāng)?shù)據(jù)開放平臺(tái),除去蘇州、威海、煙臺(tái)、淄博這四個(gè)平臺(tái)未提供交通數(shù)據(jù)以外,文章對其余43個(gè)來自省市兩級(jí)政府?dāng)?shù)據(jù)開放平臺(tái)的交通數(shù)據(jù)集進(jìn)行爬取和分析。以平臺(tái)分類為依據(jù),采集“交通出行”“城市交通”等板塊內(nèi)的交通數(shù)據(jù)集共1 375個(gè),其中山東省的省、市兩級(jí)平臺(tái)中重復(fù)數(shù)據(jù)集達(dá)280個(gè),有效數(shù)據(jù)集1 095個(gè)。表1首先列出了交通類數(shù)據(jù)集個(gè)數(shù)大于40的平臺(tái)與其占總數(shù)據(jù)集的比例情況,其中山東、上海、武漢、廣東的交通數(shù)據(jù)集總量均已超過100,上海、寧波、中山的交通數(shù)據(jù)集占比分別達(dá)到12.23%、12.81%和19.81%,雖然部分城市交通數(shù)據(jù)開放數(shù)量情況較為樂觀,但仍有大量城市并未對此給予重視。
表1 主要交通類數(shù)據(jù)集發(fā)布平臺(tái)情況
其次,文章對1 095個(gè)交通類數(shù)據(jù)集的發(fā)布單位進(jìn)行了統(tǒng)計(jì)分析,發(fā)現(xiàn)目前數(shù)據(jù)來源主要集中于交通委員會(huì)、公安局、交通運(yùn)輸局這三個(gè)部門(交通委員會(huì)和交通運(yùn)輸局因地域行政文化差異的原因,大部分市級(jí)政府中只存其一),其數(shù)據(jù)總量高達(dá)574個(gè),已超過所有交通類數(shù)據(jù)集的50%,是交通數(shù)據(jù)開放的主要推動(dòng)者。除此以外,交通類數(shù)據(jù)集還有來源于統(tǒng)計(jì)局、港航局、公路管理局等多個(gè)部門的數(shù)據(jù),圖1列出了發(fā)布數(shù)據(jù)集超過10個(gè)的單位。
圖1 交通數(shù)據(jù)集發(fā)布部門統(tǒng)計(jì)
目前國內(nèi)外都有科學(xué)的評估體系,對各個(gè)國家和地區(qū)的開放政府?dāng)?shù)據(jù)能力進(jìn)行綜合評估。國外如由萬維網(wǎng)基金會(huì)和開放數(shù)據(jù)研究會(huì)發(fā)布的開放數(shù)據(jù)晴雨表,從準(zhǔn)備度、執(zhí)行力和影響力三個(gè)角度對世界各國進(jìn)行評價(jià)[9];國內(nèi)如復(fù)旦大學(xué)數(shù)字與移動(dòng)治理實(shí)驗(yàn)室發(fā)布的《中國地方政府?dāng)?shù)據(jù)開放報(bào)告》,從基礎(chǔ)層、數(shù)據(jù)層和平臺(tái)層對中國各省市政府?dāng)?shù)據(jù)開放水平進(jìn)行橫向評估[10]。無論是國外評估體系還是國內(nèi)評估體系,都全面評價(jià)了開放政府?dāng)?shù)據(jù)的各個(gè)維度,對各國政府都有較強(qiáng)的現(xiàn)實(shí)指導(dǎo)意義,但其問題診斷和對策建議卻往往是針對整個(gè)開放政府?dāng)?shù)據(jù)生態(tài)系統(tǒng)進(jìn)行的綜合性、全面性考量,作為報(bào)告本身還難以回答如何促進(jìn)數(shù)據(jù)高效利用和價(jià)值體現(xiàn)的現(xiàn)實(shí)問題?;诖?,文章在綜合各類評估體系的指標(biāo)前提下,專注于數(shù)據(jù)本身及其使用情況,構(gòu)建與開放利用有關(guān)的數(shù)據(jù)集調(diào)查維度——“優(yōu)質(zhì)開放”和“高效利用”,來對我國地方政府所開放的交通數(shù)據(jù)進(jìn)行調(diào)查研究。
“優(yōu)質(zhì)開放”維度。主要從數(shù)據(jù)集本身進(jìn)行考察,包括數(shù)據(jù)集的內(nèi)容、質(zhì)量、種類、更新情況等方面。這些指標(biāo)均以“用”為最終導(dǎo)向,探索怎樣的“開放”才能促進(jìn)利用效率的提升。
“高效利用”維度。主要從數(shù)據(jù)集使用情況進(jìn)行考察,既包括數(shù)據(jù)集自身的瀏覽量、下載量、評論量,也包括類似APP等數(shù)據(jù)集產(chǎn)品的落地。同時(shí),文章還將相關(guān)數(shù)據(jù)應(yīng)用競賽納入調(diào)查范圍內(nèi),最大程度解析當(dāng)前開放數(shù)據(jù)的應(yīng)用和產(chǎn)出。
數(shù)據(jù)介紹包括數(shù)據(jù)集的名稱、關(guān)鍵詞、摘要等基本信息,完備的數(shù)據(jù)介紹是使用者準(zhǔn)確找尋所需數(shù)據(jù)集的前提,也可謂是促進(jìn)數(shù)據(jù)充分利用的第一步。首先,文章對所有交通數(shù)據(jù)集名稱進(jìn)行了詞云分析。如圖2所示,“機(jī)動(dòng)車”“運(yùn)輸”“企業(yè)”“道路”“公路”等出現(xiàn)頻率最高,形成了交通數(shù)據(jù)集詞云的主干,體現(xiàn)了各地方交通數(shù)據(jù)以車輛數(shù)據(jù)、運(yùn)輸情況數(shù)據(jù)、城市道路數(shù)據(jù)和相關(guān)運(yùn)輸企業(yè)數(shù)據(jù)為主。與此同時(shí),“客運(yùn)”“駕駛”“許可”“車輛”等詞作為交通數(shù)據(jù)領(lǐng)域的第二梯隊(duì)關(guān)鍵詞出現(xiàn),指出了交通運(yùn)輸服務(wù)和車輛駕駛許可等公眾參與較多的領(lǐng)域也易形成數(shù)據(jù)積累。通過數(shù)據(jù)集關(guān)鍵詞的詞云分析,不難發(fā)現(xiàn)目前政府部門對交通數(shù)據(jù)開放的價(jià)值取向,既對后續(xù)數(shù)據(jù)分類、數(shù)據(jù)目錄制作大有裨益,也為未進(jìn)行交通數(shù)據(jù)開放的城市指明了道路。其次,在全部交通類數(shù)據(jù)集中,有175個(gè)數(shù)據(jù)集并未提供關(guān)鍵詞,占全部交通數(shù)據(jù)集總量的15.98%,涵蓋15個(gè)城市,其中山東省各市尤為嚴(yán)重。摘要(部分城市為數(shù)據(jù)描述、簡介)部分,是對數(shù)據(jù)集整體情況的概述,目前主要存在三種類型:其一,信息缺失,并未提供數(shù)據(jù)摘要內(nèi)容;其二,對數(shù)據(jù)集名稱的簡單重復(fù);其三,包含數(shù)據(jù)發(fā)布單位、名稱、數(shù)據(jù)集具體指標(biāo)的簡要描述,這也應(yīng)是目前政府?dāng)?shù)據(jù)開放平臺(tái)的基本要求。
圖2 交通數(shù)據(jù)集的詞云圖
數(shù)據(jù)內(nèi)容與質(zhì)量是數(shù)據(jù)能否產(chǎn)生價(jià)值的關(guān)鍵環(huán)節(jié),低內(nèi)容、低質(zhì)量的數(shù)據(jù)集發(fā)布得再多,其價(jià)值量也難以企及一個(gè)保質(zhì)保量的數(shù)據(jù)集。因此,為了深入了解交通數(shù)據(jù)集的開放質(zhì)量,筆者切實(shí)下載并打開了1 095個(gè)數(shù)據(jù)集,將所有數(shù)據(jù)集內(nèi)容進(jìn)行分類梳理,以便客觀地分析問題。
文章結(jié)合數(shù)據(jù)介紹與數(shù)據(jù)實(shí)質(zhì)內(nèi)容,對所搜集的數(shù)據(jù)集進(jìn)行系統(tǒng)分類,其主要分為道路站點(diǎn)信息、企業(yè)信息、人員信息、車船信息、統(tǒng)計(jì)數(shù)據(jù)、執(zhí)法機(jī)構(gòu)信息、路況數(shù)據(jù)、費(fèi)用信息等,具體見表2。由此可知,目前我國各地交通數(shù)據(jù)集的發(fā)布,主要趨向于道路、企業(yè)、人員、車船四個(gè)方面,且占有較大比重,與關(guān)鍵詞詞云相互契合。仔細(xì)觀察各數(shù)據(jù)集實(shí)際內(nèi)容,存在的問題也十分典型:其一,信息與數(shù)據(jù)的邊界尚不明確,大量數(shù)據(jù)信息公開、新聞發(fā)布的內(nèi)容被以數(shù)據(jù)集形式強(qiáng)硬進(jìn)行發(fā)布。其二,統(tǒng)計(jì)數(shù)據(jù)與數(shù)據(jù)開放混淆,多數(shù)地方平臺(tái)均有由統(tǒng)計(jì)局發(fā)布的歷年統(tǒng)計(jì)數(shù)據(jù),并將其分行業(yè)分年份進(jìn)行強(qiáng)行拆分。其三,動(dòng)態(tài)數(shù)據(jù)比例明顯少于靜態(tài)數(shù)據(jù),含金量較高的動(dòng)態(tài)數(shù)據(jù)或?qū)崟r(shí)流量數(shù)據(jù)較少,對于數(shù)據(jù)實(shí)時(shí)調(diào)用與展現(xiàn)較為困難。
表2 交通數(shù)據(jù)集內(nèi)容分類
其次,在數(shù)據(jù)容量方面,總體出現(xiàn)數(shù)據(jù)容量體量偏小、字段數(shù)維度狹窄的問題?!吨袊胤秸?dāng)?shù)據(jù)開放報(bào)告》中首次提出“數(shù)據(jù)容量”這一概念,即將字段數(shù)(列數(shù))乘以條數(shù)(行數(shù))得出數(shù)據(jù)的總量,以衡量數(shù)據(jù)集的實(shí)際數(shù)據(jù)量大小[10]。在文章統(tǒng)計(jì)的交通類數(shù)據(jù)集中,數(shù)據(jù)容量突破10 000的僅有116個(gè)數(shù)據(jù)集,占總數(shù)據(jù)集個(gè)數(shù)的10.59%,而數(shù)據(jù)容量低于100的多達(dá)293個(gè),占比26.76%。雖然低容量數(shù)據(jù)可能存在數(shù)據(jù)搜集的現(xiàn)實(shí)局限性,但不可否認(rèn)的是,它們所產(chǎn)生的價(jià)值是微小而有限的,甚至在大數(shù)據(jù)時(shí)代中,這樣的數(shù)據(jù)集其含金量幾乎為0。其次,部分城市為了在數(shù)據(jù)集“量”上做文章,將數(shù)據(jù)集刻意拆分,如武漢市地鐵運(yùn)行時(shí)間數(shù)據(jù),按不同地鐵線路拆分為多個(gè)數(shù)據(jù)集;又如揚(yáng)州市按月發(fā)布郵政業(yè)經(jīng)濟(jì)運(yùn)行情況,以月為單位分割為多個(gè)數(shù)據(jù)集;再如中山市沙口大橋交通量數(shù)據(jù),以地點(diǎn)為單位分割為上、下橋位兩個(gè)數(shù)據(jù)集。如此種種,不勝枚舉。其本質(zhì)是對數(shù)據(jù)集進(jìn)行降維處理以增加數(shù)據(jù)集數(shù)量。這種做法嚴(yán)重缺乏促進(jìn)數(shù)據(jù)利用的大局觀,也加大了使用者的利用成本。
數(shù)據(jù)格式關(guān)系到用戶利用數(shù)據(jù)的方式手段,最直接影響到用戶分析數(shù)據(jù)的效率和效果,不同格式的數(shù)據(jù)集對發(fā)布者和使用者具有不同的成本效益[11]。文章從可機(jī)讀格式和開放格式兩個(gè)角度入手進(jìn)行分析:可機(jī)讀格式是指能被計(jì)算機(jī)自動(dòng)讀取與處理的格式,包括XLS、CSV、JSON、XML等,而不可機(jī)讀格式包括DOC、PDF、JPG等。其次,開放格式是指可下載數(shù)據(jù)集應(yīng)以開放的、非專屬的格式提供,不得在格式上排除他人使用數(shù)據(jù)的權(quán)利。在Berners Lee提出的開放數(shù)據(jù)五星標(biāo)準(zhǔn)中,指出數(shù)據(jù)格式應(yīng)滿足可獲取、非專屬的要求,即可達(dá)到三星標(biāo)準(zhǔn)[12],如CSV、XML等,該標(biāo)準(zhǔn)在我國各地政府中多有實(shí)踐,同時(shí)也是開放格式的題中應(yīng)有之義,因而作為文章調(diào)查交通數(shù)據(jù)格式的重點(diǎn)觀測指標(biāo)。
在各省市開放數(shù)據(jù)平臺(tái)中所檢索到的1 095條交通數(shù)據(jù)集中,有100條數(shù)據(jù)尚未提供任何可下載獲取的數(shù)據(jù)格式,僅能檢索到名稱和簡介,其主要出現(xiàn)在日照、泰安、濰坊、棗莊和濟(jì)南。在可下載數(shù)據(jù)集中,存有88.28%的可機(jī)讀數(shù)據(jù),但其中僅有66.60%滿足可獲取、非專屬的開放格式要求。其中,貴陽、濟(jì)南、東莞、廣州、山東等24個(gè)地方平臺(tái)上提供的交通數(shù)據(jù)集已全部滿足開放格式的標(biāo)準(zhǔn)。例如貴陽交通運(yùn)輸建設(shè)從業(yè)人員信息提供了xls,csv,xlm,json,rdf等5種數(shù)據(jù)格式,用戶可根據(jù)自身需求選擇不同格式下載使用。在整體數(shù)據(jù)格式形勢較好的情況下,仍有浙江、武漢、肇慶等6個(gè)開放數(shù)據(jù)平臺(tái)存有58條(占總量5.2%)數(shù)據(jù)集提供的是不可機(jī)讀格式。例如2016年肇慶市郵電業(yè)務(wù)總量,數(shù)據(jù)容量小且采用DOC格式展示表格數(shù)據(jù),其實(shí)這類數(shù)據(jù)完全可以采用XLS格式,以方便用戶下載利用。究其原因,一方面是部分交通數(shù)據(jù)集內(nèi)容使然,如湖北省已建高速公路圖、漢口漢陽片區(qū)堵點(diǎn)繞行圖等通過JPG的方式呈現(xiàn)更加直觀,另一方面則是可用機(jī)讀格式實(shí)現(xiàn)的數(shù)據(jù)卻未使用,如武漢市車管所及其分所、荊門市交通運(yùn)輸局行政執(zhí)法持證人員信息公示、肇慶市運(yùn)輸工具擁有量等。除此以外,部分省市還出現(xiàn)所展示數(shù)據(jù)格式與可供下載的數(shù)據(jù)格式并不匹配的問題,如某市“道路運(yùn)輸從業(yè)人員查詢”數(shù)據(jù)集,展示了xls,csv,xlm,json,rdf五種格式,卻只提供了csv格式下載渠道。
數(shù)據(jù)持續(xù)是指各個(gè)數(shù)據(jù)集更新的時(shí)間頻率,關(guān)系到數(shù)據(jù)本身的時(shí)效性和用戶對數(shù)據(jù)的持續(xù)使用。政府?dāng)?shù)據(jù)開放平臺(tái)管理運(yùn)營是一項(xiàng)持續(xù)性和常態(tài)化工作,平臺(tái)上線后應(yīng)持續(xù)更新和添加數(shù)據(jù)集,以滿足社會(huì)對開放數(shù)據(jù)日益增長的需求。文章跟蹤考察各個(gè)數(shù)據(jù)平臺(tái)在截至2018年8月20日更新的交通類數(shù)據(jù)集情況,發(fā)現(xiàn)大量平臺(tái)能基本保持新增數(shù)據(jù)集持續(xù)增加與存量數(shù)據(jù)集動(dòng)態(tài)更新,但仍有不少地方平臺(tái)存在交通數(shù)據(jù)集延遲更新或停滯現(xiàn)象。
表3 交通數(shù)據(jù)集更新情況
調(diào)查發(fā)現(xiàn),在各數(shù)據(jù)開放平臺(tái)所提供的1 095條交通數(shù)據(jù)集中,共有183條(16.71%)數(shù)據(jù)集并未承諾更新頻率,導(dǎo)致用戶無法尋求數(shù)據(jù)更新時(shí)間以持續(xù)利用數(shù)據(jù);另有178條(16.26%)數(shù)據(jù)集承諾更新頻率類型為自定義和不定時(shí)更新,即不能提供準(zhǔn)確更新頻率。上述現(xiàn)象皆容易造成數(shù)據(jù)的維護(hù)與更新缺乏監(jiān)督機(jī)制,從而導(dǎo)致數(shù)據(jù)集發(fā)布形同虛設(shè),無法持續(xù)產(chǎn)生數(shù)據(jù)價(jià)值。實(shí)際情況也印證了以上觀點(diǎn):在承諾更新頻率為自定義的數(shù)據(jù)集中,有85%以上的數(shù)據(jù)都未再進(jìn)行更新。除此以外,承諾更新頻率以年為周期所占的比重最大,達(dá)到41.37%,相比之下以半年、季度、月、周為承諾更新頻率的數(shù)據(jù)集占比較少,如表3所示。一般來說,更新周期越短,更新頻率越快,用戶利用數(shù)據(jù)的可能性也越大,從而更能推動(dòng)相關(guān)部門更新數(shù)據(jù),形成良性循環(huán)。不可否認(rèn),部分?jǐn)?shù)據(jù)確實(shí)存在收集成本大、難度高,并不適用于短頻更新。但在承諾更新的數(shù)據(jù)集中,共有38.54%的數(shù)據(jù)集并未履行承諾,直接影響了各平臺(tái)數(shù)據(jù)持續(xù)性的整體水平。其中,貴陽、山東各地、上海等市的交通數(shù)據(jù)更新情況較好,但大部分省市在數(shù)據(jù)持續(xù)方面仍然存在未及時(shí)更新的情況,且無法找到其歷史存量數(shù)據(jù)的情況。
數(shù)據(jù)瀏覽量和下載量直觀展現(xiàn)了數(shù)據(jù)利用情況,反映出用戶對數(shù)據(jù)信息的需求導(dǎo)向和使用意向,有助于平臺(tái)運(yùn)營維護(hù)者根據(jù)用戶需求有針對性地完善數(shù)據(jù)集內(nèi)容,逐步提升平臺(tái)數(shù)據(jù)利用率。
從交通數(shù)據(jù)瀏覽量上看,各數(shù)據(jù)集瀏覽量普遍偏低,其中低于500人次瀏覽的共有758條,占比達(dá)69.22%;數(shù)據(jù)集瀏覽量在5 000以上的僅占2%,主要體現(xiàn)為北京軌道交通路線、廣州市機(jī)動(dòng)車交通違法監(jiān)控抓拍位置信息、高架上匝道關(guān)閉時(shí)間等信息,其瀏覽量均超過10 000,其中北京軌道交通路線瀏覽量達(dá)到了22 968,這類信息與市民日常交通出行密切相關(guān),因此其利用率較高。
在數(shù)據(jù)下載量方面,下載量在500以內(nèi)的數(shù)據(jù)集占到73.97%,其中有近19.36%的數(shù)據(jù)集下載量為0。零下載量數(shù)據(jù)集的存在一方面是由于數(shù)據(jù)不滿足用戶需求,另一方面是該部分?jǐn)?shù)據(jù)集未提供可下載的文件,用戶無法進(jìn)行下載和使用。另外,數(shù)據(jù)下載量高于500的僅占7.03%,主要體現(xiàn)為廣東機(jī)動(dòng)車臨界未檢驗(yàn)通告、上海城市道路信息、上海車輛統(tǒng)計(jì)等信息,尤其上海高架上匝道關(guān)閉時(shí)間信息下載量達(dá)到5 603,居所有交通數(shù)據(jù)下載量榜首。
值得注意的是,部分?jǐn)?shù)據(jù)集出現(xiàn)下載量嚴(yán)重大于瀏覽量的奇怪現(xiàn)象,通過政府信箱反饋后,被告知為技術(shù)問題,但并未做出修正。
應(yīng)用程序編程接口(Application Program Interface)是各地?cái)?shù)據(jù)開放平臺(tái)都會(huì)普遍提供的一種數(shù)據(jù)調(diào)用形式,相比于數(shù)據(jù)集下載,API更能使用戶高效獲取所需要的數(shù)據(jù)條目,以滿足開發(fā)者的數(shù)據(jù)需求。在文章所搜集的交通類數(shù)據(jù)集中,有112個(gè)數(shù)據(jù)集提供了調(diào)用接口,占10.23%。同時(shí),部分城市借鑒數(shù)據(jù)下載量的形式,展示了API調(diào)用統(tǒng)計(jì)量,以便于更加深入了解數(shù)據(jù)集的利用程度與開發(fā)程度,如北京市政務(wù)數(shù)據(jù)資源網(wǎng)和東營市公共數(shù)據(jù)開放網(wǎng)。
目前,雖然大量城市的數(shù)據(jù)開放平臺(tái)已認(rèn)識(shí)到數(shù)據(jù)接口對促進(jìn)數(shù)據(jù)活化的重要性,但總體實(shí)施仍處于初級(jí)階段,以致數(shù)據(jù)調(diào)用接口提供的規(guī)范性較差、自主性較強(qiáng)。主要問題有:其一,數(shù)據(jù)調(diào)用和下載的混亂,部分城市分別提供了數(shù)據(jù)和接口兩個(gè)欄目,但具體數(shù)據(jù)集分配交叉,如上海“快速路路面網(wǎng)流量”數(shù)據(jù)集在數(shù)據(jù)產(chǎn)品中提供了普通下載渠道和調(diào)用渠道,但在數(shù)據(jù)接口中卻無法檢索到該數(shù)據(jù)集。相對而言,北京市整體較為規(guī)范,所有交通數(shù)據(jù)集都可進(jìn)行下載和調(diào)用。其二,數(shù)據(jù)調(diào)用說明缺失,增大數(shù)據(jù)利用難度。部分城市提供了以json和xml為主的可調(diào)用格式,但卻未提供涵蓋接口描述、錯(cuò)誤代碼等數(shù)據(jù)調(diào)用說明,增大了數(shù)據(jù)利用難度。
數(shù)據(jù)分析工具是由政府?dāng)?shù)據(jù)開放平臺(tái)所提供,用以幫助用戶對數(shù)據(jù)集進(jìn)行簡單分析和程序開發(fā)。目前國內(nèi)政府?dāng)?shù)據(jù)開放平臺(tái)提供的工具主要包括三類,分別是:可視化分析工具、開發(fā)工具和地理空間工具。
可視化分析工具是指平臺(tái)提供了實(shí)現(xiàn)數(shù)據(jù)集可視化或統(tǒng)計(jì)分析的工具。用戶可以在數(shù)據(jù)集頁面通過設(shè)置不同條件,對數(shù)據(jù)進(jìn)行初步的統(tǒng)計(jì)分析,還可以對統(tǒng)計(jì)結(jié)果進(jìn)行可視化呈現(xiàn),如餅狀圖、柱狀圖和曲線圖。其次,開發(fā)工具的提供以便利開發(fā)者為目的,但部分地區(qū)僅提供了付費(fèi)下載的跳轉(zhuǎn)鏈接或僅有對工具的文字介紹,性質(zhì)更接近于開發(fā)工具的推薦者,而不是開發(fā)工具的提供者。地理空間工具是指平臺(tái)提供了將政府開放數(shù)據(jù)和地理信息進(jìn)行融合應(yīng)用的功能。目前,長沙、東莞、佛山、山東等平臺(tái)提供了地理空間工具,這類地圖工具多與高德、百度等企業(yè)合作,提供導(dǎo)航功能,或?qū)⒁恍┕膊块T的位置疊加在地圖上提供服務(wù)。以山東公共數(shù)據(jù)開放網(wǎng)為例,用戶可在頁面上自行檢索或根據(jù)主題分類查找地理數(shù)據(jù)集,然后疊加在地圖上顯示。
交通數(shù)據(jù)開放的利用成果主要包括APP應(yīng)用程序、數(shù)據(jù)分析結(jié)果和各項(xiàng)研究成果,其中APP應(yīng)用程序使用范圍最廣,對于公眾來說實(shí)用價(jià)值最高??v觀43個(gè)數(shù)據(jù)開放平臺(tái),僅有貴陽、濟(jì)南、無錫、成都等12個(gè)平臺(tái)在應(yīng)用欄目中提供了交通領(lǐng)域的APP應(yīng)用程序,但都未直接提供下載鏈接,用戶最便捷的方式是在手機(jī)應(yīng)用下載中搜索APP名稱進(jìn)行下載。通過下載該類APP發(fā)現(xiàn),超過一半的應(yīng)用程序存在閃退、系統(tǒng)不兼容、更新慢、用戶體驗(yàn)感差等問題。例如成都熊貓駕信APP,是一款實(shí)現(xiàn)駕駛?cè)撕蜋C(jī)動(dòng)車違法查詢、處理、繳費(fèi)的一條龍?zhí)幚碥浖瑩碛懈哌_(dá)171萬次的下載量,但卻存在評分低、數(shù)據(jù)處理能力弱、繳費(fèi)慢、廣告多、高額代辦費(fèi)等各項(xiàng)問題。
數(shù)據(jù)應(yīng)用比賽是政府和企業(yè)從推動(dòng)數(shù)據(jù)利用、鼓勵(lì)公眾參與、宣傳數(shù)據(jù)開放的角度出發(fā),所籌辦的大數(shù)據(jù)應(yīng)用創(chuàng)新設(shè)計(jì)大賽。由于城市交通問題日益突出,很多數(shù)據(jù)應(yīng)用比賽都從交通層面出發(fā),開展以交通為主題的應(yīng)用比賽,例如貴州省2017年舉辦的“云上貴州智慧交通大數(shù)據(jù)應(yīng)用創(chuàng)新大賽”,貴陽市2016年舉辦的“貴陽交通大數(shù)據(jù)系列競賽”和上海市2015年舉辦的以城市交通為主題的“上海開放數(shù)據(jù)創(chuàng)新應(yīng)用大賽”。這類比賽都是以解決交通問題為目的,有針對性地利用交通數(shù)據(jù)研發(fā)新應(yīng)用,形成以公交線路優(yōu)化、出行行為分析、路網(wǎng)流量預(yù)測、高速路異常事件監(jiān)測等交通主題作品,既實(shí)現(xiàn)了對數(shù)據(jù)的跨越融合和創(chuàng)新應(yīng)用,釋放了數(shù)據(jù)隱含的價(jià)值,也為城市交通治理的智能化、數(shù)據(jù)化發(fā)展提供了探索思路。
數(shù)據(jù)始終是開放政府?dāng)?shù)據(jù)戰(zhàn)略的基本元素,沒有優(yōu)質(zhì)的、可用的、規(guī)范的數(shù)據(jù),那么數(shù)據(jù)開放也僅僅是變相的進(jìn)行統(tǒng)計(jì)數(shù)據(jù)發(fā)布或數(shù)據(jù)信息公開。因此,文章認(rèn)為要想提高交通數(shù)據(jù)利用率,首要解決數(shù)據(jù)本身的問題。在數(shù)據(jù)內(nèi)容方面,各部委應(yīng)對一部分在各省市中都廣泛涉及的數(shù)據(jù)集類型進(jìn)行統(tǒng)一化和標(biāo)準(zhǔn)化,具體如介紹、格式、更新頻率、數(shù)據(jù)維度等,以做到各平臺(tái)交通數(shù)據(jù)橫向可綜合利用。而對于非統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)集,應(yīng)盡可能的向“統(tǒng)一標(biāo)準(zhǔn)”靠攏,最大程度提升數(shù)據(jù)質(zhì)量,以實(shí)現(xiàn)各平臺(tái)縱向創(chuàng)新發(fā)展。其次,對屬于信息公開和統(tǒng)計(jì)數(shù)據(jù)等非“開放數(shù)據(jù)”進(jìn)行嚴(yán)格的審查和追責(zé),確保各平臺(tái)開放的是真正有價(jià)值的數(shù)據(jù)。在數(shù)據(jù)主題分類方面,交通部門應(yīng)設(shè)置規(guī)范的數(shù)據(jù)目錄,對各平臺(tái)發(fā)布的各類交通數(shù)據(jù)進(jìn)行明確規(guī)定,而針對各平臺(tái)創(chuàng)新特色的交通數(shù)據(jù)集,則可先在已分類基礎(chǔ)上進(jìn)行劃分,不屬于任何分類的則劃入其他類型中,如北京市將交通數(shù)據(jù)劃分為飛機(jī)、汽車、火車等。
當(dāng)前各平臺(tái)中80%以上的交通數(shù)據(jù)集屬于靜態(tài)數(shù)據(jù),且降維增量的情況頻出。因此,各平臺(tái)應(yīng)整合已發(fā)布的交通數(shù)據(jù),擴(kuò)充數(shù)據(jù)維度,如時(shí)間維度、區(qū)域維度等,而非為圖方便和數(shù)量,而以某某年某某數(shù)據(jù)集的形式進(jìn)行數(shù)據(jù)開放。例如某市公交類數(shù)據(jù)集,應(yīng)盡可能包含各路公交站臺(tái)名、收發(fā)車時(shí)間、每日班次、收費(fèi)標(biāo)準(zhǔn)、車型等數(shù)據(jù),而非形成路線數(shù)據(jù)集、收費(fèi)數(shù)據(jù)集、車型車檢數(shù)據(jù)集等。
對于路況流量數(shù)據(jù),其數(shù)據(jù)粒度更小、更新頻率更高,對于數(shù)據(jù)利用與數(shù)據(jù)價(jià)值產(chǎn)生的作用較大,也更能開發(fā)出高質(zhì)量的交通數(shù)據(jù)應(yīng)用程序。例如地鐵線路流量數(shù)據(jù)集、高速收費(fèi)站流量數(shù)據(jù)、路口違章數(shù)據(jù)等,是有條件形成優(yōu)質(zhì)數(shù)據(jù)集并向社會(huì)公眾開放的。相較于其他類型的數(shù)據(jù)集,交通數(shù)據(jù)中動(dòng)態(tài)流量數(shù)據(jù)來源渠道多、種類多,且目前多由人工智能設(shè)備采集統(tǒng)計(jì),從而增加流量數(shù)據(jù)占比,并促進(jìn)交通數(shù)據(jù)的高效利用。
交通數(shù)據(jù)的開放和利用,乃至更為廣泛的政府?dāng)?shù)據(jù)的開放和利用,其主要推力仍來自于政府部門對數(shù)據(jù)開放的正確認(rèn)識(shí),包括開放什么、怎么開放、如何追責(zé)、如何評估等。以交通數(shù)據(jù)為例,其開放的目的在于和社會(huì)公眾一起探討和解決城市擁堵問題、公路運(yùn)輸問題、尾氣排放問題等,以期實(shí)現(xiàn)智慧交通、智慧城市。同樣,為促進(jìn)交通數(shù)據(jù)活用,政府交通部門可通過政府采購、服務(wù)外包、社會(huì)眾包等方式,將數(shù)據(jù)量大、敏感度高的數(shù)據(jù)集,依托企業(yè)、高等院校、科研機(jī)構(gòu)來開展交通數(shù)據(jù)應(yīng)用,創(chuàng)造更多新產(chǎn)品和新業(yè)態(tài)。目前,由交通運(yùn)輸部采用政企合作模式建設(shè)的、基于公共云服務(wù)的綜合交通出行服務(wù)數(shù)據(jù)開放、管理與應(yīng)用平臺(tái)——出行云(綜合交通出行大數(shù)據(jù)開放云平臺(tái))已上線,其匯聚了交通部門、院校、企業(yè)等搜集的交通數(shù)據(jù),并聯(lián)合了各單位提供的決策服務(wù)與開發(fā)服務(wù),為各類數(shù)據(jù)集的開發(fā)應(yīng)用提供了借鑒[13]。
交通數(shù)據(jù)開放的根本目的在于促進(jìn)數(shù)據(jù)利用,大力提倡和鼓勵(lì)舉辦各類數(shù)據(jù)大賽,有助于挖掘數(shù)據(jù)潛在價(jià)值,可為交通領(lǐng)域帶來巨大的商業(yè)價(jià)值和社會(huì)價(jià)值。目前各地?cái)?shù)據(jù)大賽以數(shù)據(jù)開放為切口,通過政府搭臺(tái)、政企合作等方式,發(fā)動(dòng)公眾參與和協(xié)作來共同解決公共問題。在舉辦大賽的過程中,政府部門感受到了開放數(shù)據(jù)的巨大潛能,加大了對開放數(shù)據(jù)的支持力度,有助于政府部門拓展思路,促使決策實(shí)現(xiàn)科學(xué)化和精準(zhǔn)化;而社會(huì)各界基于開放數(shù)據(jù)提出的創(chuàng)新方案,也為解決實(shí)際交通問題提供了實(shí)證依據(jù)和新思路。從比賽效果來看,各類數(shù)據(jù)大賽吸引了企業(yè)、高校和社會(huì)組織的廣泛參與[14],對解決實(shí)際問題、宣傳普及開放數(shù)據(jù)文化、提升公眾數(shù)據(jù)素養(yǎng)具有深刻意義[15]。舉辦大賽的成果也對其他尚未開放數(shù)據(jù)的政府部門起到了示范效應(yīng),加速各行各業(yè)數(shù)據(jù)開放的深入推進(jìn)。
隨著各省市數(shù)據(jù)開放平臺(tái)的陸續(xù)推出,不少專家學(xué)者提出在重視數(shù)據(jù)質(zhì)量的同時(shí),更應(yīng)關(guān)注對數(shù)據(jù)的充分利用。文章以交通數(shù)據(jù)為切入點(diǎn),對廣東省及其各市、貴州省及其各市、山東省及其各市平臺(tái)的數(shù)據(jù)利用情況進(jìn)行省、市兩級(jí)的對比調(diào)查,發(fā)現(xiàn)當(dāng)前省市兩級(jí)政府存在普遍使用不同平臺(tái)、市級(jí)數(shù)據(jù)無法在省級(jí)平臺(tái)中找到、同省各市級(jí)平臺(tái)各自為營等現(xiàn)象,唯有山東省較為樂觀,能夠?qū)崿F(xiàn)省市兩級(jí)同一平臺(tái)、數(shù)據(jù)共享。上述省市分離現(xiàn)象雖在開放數(shù)據(jù)前期易形成各平臺(tái)創(chuàng)新發(fā)展趨向,但若長期如此,勢必造成網(wǎng)站運(yùn)營成本高昂、數(shù)據(jù)共享難以貫通、用戶查找困難、數(shù)據(jù)標(biāo)準(zhǔn)不一等現(xiàn)象,無形之中為數(shù)據(jù)跨區(qū)域利用增加了難度。正如目前政務(wù)服務(wù)網(wǎng)站一般,省市分離情況嚴(yán)重,全面實(shí)現(xiàn)省級(jí)統(tǒng)籌非一朝一夕之功。因此,在政府?dāng)?shù)據(jù)開放平臺(tái)建立初期,各地政府如何以實(shí)現(xiàn)數(shù)據(jù)充分利用為目的,兼顧省級(jí)統(tǒng)籌建設(shè)與地方創(chuàng)新發(fā)展,將會(huì)成為后續(xù)探討數(shù)據(jù)橫向跨區(qū)域利用的重要話題。
(來稿時(shí)間:2018年12月)