趙龍文 洪逸飛 趙雪琦
關鍵詞:政府開放數據:數據包絡分析:效率評價:數據創(chuàng)新應用
DOI:10.3969/j.issn.1008-0821.2023.07.013
[中圖分類號]G203 [文獻標識碼]A [文章編號]1008-0821(2023)07-0133-12
數據資源作為新型生產要素,是國家基礎性戰(zhàn)略資源。在數字技術快速發(fā)展和疫情對線上辦公的催化等因素共同作用下,數據資源作為國家經濟發(fā)展、公共服務和社會治理等方面的重要基石,側面反映一個國家的軟實力與競爭力。作為社會主要數據持有者的政府部門在履行社會治理與公共服務職能過程中采集、應用并存儲了大量數據,通過開放這些數據供社會應用和創(chuàng)新,可以發(fā)揮數據資源對經濟、公共服務和社會治理發(fā)展的促進作用。在企業(yè)方面,可供企業(yè)識別市場機會,正確做出決策;在公眾方面,可為大眾創(chuàng)業(yè)、萬眾創(chuàng)新提供良好基礎;在政府方面,可促進政府工作透明度和公信力提高并改進政府管理流程。2009年,美國政府先后簽署了《開放透明政府備忘錄》并創(chuàng)建了首個政府開放數據平臺,建設政府開放數據平臺成為開放政府數據的主要途徑。根據《2020/21開放數據清單》可知,截至2021年7月,全球范圍內已經有187個國家和地區(qū)上線了政府開放數據平臺。我國開放政府數據運動開始于2012年,上海、北京率先上線開放數據平臺,雖然我國開放政府數據運動起步較晚,但隨著中央和地方政策文件的出臺,明確提出要推進政府數據的開放共享,促進數據的創(chuàng)新應用,促進開放數據平臺建設,加快數字化轉型。截至2021年10月,我國已上線地級及以上政府開放數據平臺193個,其中省級平臺20個,政府開放數據平臺建設已經取得了可觀的成果。
學界目前針對政府開放數據進行了以下3個方面研究:首先,是政府開放數據建設研究,包括開放數據建設的構成內容、建設路徑、政策法規(guī)、隱私保護與機制機構保障研究;隨著政府開放數據建設的完善,學者開始進行政府開放數據應用研究,包括開放數據的利用價值、影響因素、保障措施以及價值創(chuàng)造機制,政府開放數據的應用實現過程涉及諸多利益相關者,是一個多主體共同參與及多領域覆蓋的過程,但由于公眾對于數據的利用只涵蓋了交通出行、教育科技、健康衛(wèi)生和住房等少數領域,產出成果量和覆蓋面都處于較低水平,導致政府開放數據利用率低且未能發(fā)揮數據價值;針對開放數據的應用情況,學者進行了政府開放數據評價及改進的相關研究,研究熱點更多的聚焦于對開放數據質量與開放平臺建設情況的評價。
近年來,開放數據平臺數量不斷增長,我國現有的政府開放數據平臺在數據集數量、數據集開放情況、數據集規(guī)范程度、數據集更新情況和數據質量之間存在較大差異,平臺建設質量良莠不齊??陀^準確地對政府開放數據建設成果進行評價并提出啟發(fā)式建議十分必要。然而,現有的評價方法中,人工觀察評價受限于效率與主觀性,無法做到全面、完整、客觀;基于專家打分建立評價矩陣并進行評價則受限于專家打分情況,專家主觀性與知識水平會直接影響評價結果,甚至使結果產生偏差;基于投入產出數據的數據評價則只采集了平臺相關數據進行評價,對數據開放的多種促進作用則缺乏考慮。因此,本研究在現有數據評價體系的基礎上,將開放數據對城市創(chuàng)新應用的影響情況納入體系中,旨在為政府開放數據建設與數據資源創(chuàng)新應用提供啟發(fā)式建議。
1相關研究現狀述評
1.1國內外研究現狀
政府開放數據平臺作為政府開放數據應用過程的核心,通過其提供的公共服務,將該過程中的其他主體及參與者連接起來。政府開放數據平臺直接影響到整個數據應用過程的運作,對政府開放數據平臺進行評價并對其提供的公共服務進行改進是重要且必要的。隨著開放政府數據運動的發(fā)展,學界對政府開放數據的關注點逐漸由“怎么開放”轉移到“開放得怎么樣”,越來越多的學者對政府開放數據的成果進行了評價研究。
目前,對政府開放數據平臺評價的相關研究已經有了一定的成果,學者們主要通過以下3種評價方法對平臺進行評價:①結合平臺功能和服務情況,分析評估數據集和數據資源內容,對單個平臺直接評價。Umbrich J等使用CKAN數據管理系統,從可檢索性、實用性、完整性、準確性、開放性和連續(xù)性6個維度通過分析涉及的數據資源對82個政府開放數據平臺進行質量情況評價。Wang V等分別從開放程度、內容價值和反饋情況這3個維度對英國政府開放數據平臺上的400個數據集進行分析,發(fā)現數據的實用性、覆蓋范圍、即時性及顆粒度直接影響政府數據開放情況。李曉彤等對廣州、北京和哈爾濱三地政府開放數據平臺共1900個數據集進行調研,構建出數據完整性、準確性、一致性、時效性、唯一性、可理解性、開放性7個維度的評價指標進行評價。還有學者結合平臺服務情況和用戶使用情況建立了綜合評價框架,對平臺進行更全面的評價。Raca V等基于平臺開放性、數據集質量與數據質量3個維度構建評估框架,對西巴爾干國家開放數據平臺進行評估,發(fā)現數據集及數據的格式、更新速度、可發(fā)現性和一致性是政府開放數據利用的先決條件。Nikiforova A等根據用戶反饋和開放政府數據門戶可用性分析框架得出數據可使用性、平臺技術水平、數據質量等因素很大程度上影響著用戶體驗。Zhang W等從可持續(xù)利用角度,使用以實驗決策分析法為基礎的網絡層次分析法建立了包括數據、平臺、產出和用戶4個維度12個指標的政府開放數據平臺評價體系,對4個城市的政府開放數據平臺進行評價;②以專家打分產生的評價矩陣為基礎,使用定性一定量相結合的方法對不同平臺進行對比評價。曹海軍等使用熵權法,根據專家打分從有形性、易用性、可靠性、響應性、移情性5個維度對6個省級、副省級政府開放數據平臺的服務質量進行評價,發(fā)現易用性、可靠性、響應性是影響平臺質量的關鍵因素。阮霽陽在此基礎上將層次分析法與熵權法結合,基于服務質量差距理論從有形性、功能性、可靠性、響應性、移情性5個維度對10個省級政府開放數據平臺服務質量進行評價,認為平臺優(yōu)化建設應考慮功能性與可靠性方面。王迪等基于可用性框架體系,根據4位專家的評估打分對8個省級政府開放數據平臺進行可用性評價,認為目前我國政府開放數據平臺應當在差錯預防、用戶交互、數據標簽、篩選推薦、數據格式和數據可視化方面進行改進以提高平臺建設水平。陳水湘采用德爾菲法、層次分析法和權值評優(yōu)法構建平臺價值評價模型,對19個政府開放數據平臺進行評價,發(fā)現這些平臺在開放數據質量、用戶需求滿足與數據開放程度上還存在問題;③采集平臺數據、技術、資金、政策等層面的投入產出數據,使用非參數法進行平臺評估。馬海群等、海倫等、韓磊等學者從數據和平臺兩個維度收集政府開放數據平臺的相關數據,利用數據包絡分析法對我國省級、副省級和地級開放平臺進行總體效率、純技術效率以及規(guī)模效率評估,根據評估結果為政府開放數據平臺建設提出改進建議。鄧崧等則從數據、技術、資金、利用率和透明度5個維度,使用數據包絡分析法對13個省級、副省級政府開放數據平臺進行效率評估,并從提高平臺影響力、提高平臺曝光度、優(yōu)化用戶使用體驗等方面給出了效率改進建議。
隨著政府開放數據生態(tài)系統相關研究不斷深入,一些學者也開始從生態(tài)系統的角度對政府開放數據成果進行評價。朱紅燦等結合社會技術系統理論和成熟度模型構建了政府開放數據平臺生態(tài)系統5級成熟度模型,從政策、組織、用戶、創(chuàng)新、數據、門戶6個維度進行評價。鄭娜靜基于生態(tài)系統理論與生態(tài)鏈理論構建了政府開放數據生態(tài)系統模型,從數據資源、基礎保障、組織管理、制度建設、用戶參與、個性化服務、開發(fā)利用、數據可持續(xù)性、自我調節(jié)能力等維度進行評估。LnenickaM等基于智慧城市開放數據生態(tài)系統透明度水平評估框架,從數據量與結構、數據質量、數據可訪問性、可查找性、可理解性、有用性、公眾參與和協作及服務質量8個維度對22個城市的34個開放數據門戶進行評價。
隨著政府開放數據建設的不斷完善,在大量政府數據被開放的同時,也營造了良好的政府數據使用環(huán)境,為公眾創(chuàng)新及企業(yè)創(chuàng)新提供了前提。在大數據時代,政府數據的開放共享為創(chuàng)新創(chuàng)業(yè)提供了高質量的信息資源,通過社會對政府開放數據的增值開發(fā)和創(chuàng)新應用,可營造大眾創(chuàng)業(yè)、萬眾創(chuàng)新的氛圍,提高城市創(chuàng)新能力,同時,基于政府開放數據非歧視性、機器可讀性、開放授權性等特性開展的政府開放數據創(chuàng)新應用競賽能夠吸引公眾開發(fā)利用政府開放數據,實現政府開放數據價值創(chuàng)造,發(fā)揮其蘊含的潛力并以此激發(fā)出“群體智慧”與創(chuàng)新創(chuàng)業(yè)活力。在企業(yè)創(chuàng)新方面,政府數據的開放為企業(yè)商業(yè)智能的創(chuàng)新突破提供了條件,通過對政府開放數據的可視化分析可以將數據分析、轉化并用于商業(yè)智能的訓練,該商業(yè)智能可用于對市場機會的識別和商業(yè)戰(zhàn)略的制定。
1.2研究評述
考慮到方法①通過對數據集和數據資源的人工評價來實現對平臺的評估,雖然人工評價可以一定程度地在數據層面對一個平臺做出評價,但受限于人工評價的效率與評價者的主觀性,對一個平臺的數據評價必然無法做到全面且完整,若想同時對多個平臺進行評價,通過對比平臺間優(yōu)劣進行改進,則需要花費大量人力物力。方法②對平臺的評價很大程度上受限于專家打分情況,雖然采用了定性一定量相結合的評價方法,但定量評價部分是基于定性的打分進行的,評價結果可能由于主觀性過強而產生偏差,另外,基于專家打分的評價方法雖然可以在寬度上實現對多個平臺的對比評價,但在對單個平臺的評價深度方面存在一定問題。目前對于政府開放數據平臺的評價大多是針對平臺的建設情況進行的,雖然已有研究從生態(tài)系統視角進行政府開放數據成果評價,但相關研究較少且對于政府開放數據對城市經濟、公共服務和社會治理發(fā)展的促進作用缺乏考慮,沒有將政府開放數據平臺與所在城市的企業(yè)、政府等其他參與者聯系起來作為整體進行系統分析。同時,雖然已有研究表明政府開放數據對公眾創(chuàng)新與企業(yè)創(chuàng)新具有促進作用,但水平不一的政府開放數據建設對創(chuàng)新的促進作用有何種程度的差距以及何種政府開放數據建設路徑可以更加充分地發(fā)揮對創(chuàng)新的促進作用缺乏相關研究。
綜上所述,本研究選擇使用數據包絡分析法,根據從政府開放數據平臺采集到的數據對政府開放數據資源利用效能進行評價,數據包絡分析法具有客觀性,在對決策單元進行效率評估時約束較少,生產函數及投入指標與產出指標的權向量不是人為提前預設的,在很大程度上避免了因函數形式錯誤而導致結論錯誤。此外,本研究除了使用數據包絡分析法根據平臺數據對數據資源利用效能進行評價,還以城市創(chuàng)新能力為例,評價政府開放數據資源對城市創(chuàng)新的促進作用,基于兩次評價的結果對政府開放數據建設改進提出建議對策。
2評價模型構建
2.1數據包絡分析法
數據包絡分析(Data Envelopment Analysis,DEA)由Charnes A、Cooper W W和Rhodes E 3位運籌學家于1978年提出。數據包絡分析法是一種基于線性規(guī)劃技術,可以有效評價具有多項投入與多項產出的決策單元(Decision Making Units,DMU)的相對有效性的效率評價方法。效率評價通過測算每個決策單元投入指標與產出指標的權重確定效率包絡面后,再將各決策單元與改效率包絡面進行對比計算得到效率值的差值來實現。
CCR模型是DEA的最基本模型,它假設規(guī)模報酬不變。在該模型中約束條件均以不等式存在,因此會存在松弛變量,在CCR-I模型中松弛變量存在于投入指標中,為多余的投入。在CCR-O模型中松弛變量存在于產出指標中,為欠缺的產出,松弛變量可以在尋找改進方向時提供幫助?,F實中的實際生產環(huán)境由于競爭以及環(huán)境中不利的約束的存在,大部分決策單元的規(guī)模并不能處于最優(yōu)狀態(tài)。因此,CCR模型具有一定的局限性,僅能判斷一個決策單元是否在技術與規(guī)模兩個方面同時處于有效狀態(tài)。而BCC模型假設規(guī)模報酬可變,可以用來判斷一個決策單元在技術與規(guī)模兩個方面中任一方面的有效狀態(tài)。
在DEA方法的多種模型中,CCR模型雖然基本,但是十分重要。而CCR模型關于規(guī)模報酬不變的假設在現實生活中很難實現,容易與實際情況發(fā)生沖突。同時,由于BCC模型只能運行得出純技術效率與規(guī)模報酬情況,因此選擇同時使用BCC與CCR兩種模型進行效率評估,對政府開放數據平臺的綜合技術效率、純技術效率以及規(guī)模報酬進行綜合評估,并根據投影情況進行進一步的分析,最后給出改進建議實現效率優(yōu)化。
2.2評價樣本選取
本研究主要評價政府開放數據資源利用效能以及數據資源對所在省市創(chuàng)新能力的促進情況。選取的評價樣本為域名中應包含data、gov.cn等相關字符的政府開放數據平臺,為確保所選擇平臺擁有足夠的數據量和較好的穩(wěn)定性以供評價和數據獲取,本研究選擇省級以及副省級平臺作為評價樣本。在初步確定樣本選取范圍后,通過線上考察對初步擬定的平臺進行基于數據量和數據可獲得性的篩選,去除北京平臺、重慶平臺這類數據不易獲取的平臺以及陜西平臺、江西平臺這類數據量過少的平臺,最終選擇上海、浙江、貴州、廣東、山東、天津、福建、河南、四川、廣西、寧夏11個省級平臺以及深圳、廣州、哈爾濱、廈門、成都、寧波、武漢7個副省級平臺共18個政府開放數據平臺作為研究樣本,如表1所示。
通過對18個政府開放數據平臺進行初步調研后發(fā)現,省級平臺與省級平臺、省級平臺與副省級平臺及副省級平臺與副省級平臺之間在平臺建設投入與成果產出均存在不同程度的差別,通過數據包絡分析確定DEA有效平臺后便可以根據DEA有效平臺與DEA無效平臺之間的差別進行投影分析,為DEA無效平臺的投入產出改進提供指導建議。同時,各個平臺的建設政策和指導方針均存在不同程度的差異,在平臺具體的模塊設計和服務提供上有不同的側重,通過對DEA有效與無效平臺之間的異質性問題進行綜合分析,可以對比分析得出更有利于政府開放數據資源利用與創(chuàng)新應用效能提升的政府開放數據平臺建設模式。
2.3評價指標構建
政府開放數據平臺的平臺建設技術是為了平臺提供數據資源服務的,即平臺建設技術是一個平臺的基礎,平臺所能提供的數據資源才是一個平臺真正的核心,在確定評價樣本的初步考察中,所有的平臺均可以通過搜索“省市名”+“數據開放平臺”找到。同時,隨著我國政府開放數據平臺10年的發(fā)展,平臺搭建技術已趨近成熟,評價樣本平臺在初步考察中均表現出了可靠穩(wěn)定的性能,并沒有出現平臺崩潰、卡頓等影響使用的情況。
考慮到各個平臺搭建技術處于較為均衡的情況下,本研究將評價指標構建的重點聚焦在數據資源利用維度。在政府開放數據資源利用效能評估模型中,本研究通過參考《中國地方政府數據開放報告》中的開放數林指數評估指標體系,同時考慮使用數據包絡分析法對數據完整性和可獲得性的要求,在對作為研究樣本的開放數據平臺進行調研和數據爬取與匯總分析后,選擇數據集數量、平均數據集容量、可機讀數據集數量、及時更新數據集數量和無條件開放數據集數量作為投入指標,分別反映數據資源的數據質量、使用便捷性、資源時效性以及開放性;選擇平臺公示的典型應用數量、瀏覽量和下載量位列前25%的數據資源的平均瀏覽量和平均下載量作為產出指標,來反映平臺數據資源的曝光情況、使用情況和應用情況,從數據數量、數據質量、數據規(guī)范、數據獲取和利用成果維度進行評估,如表2所示。各個指標的具體內容如下:
在政府開放數據資源利用效能評估模型中,通過平臺提供的數據集數量(包括數據接口),以及數據集平均擁有的數據條數作為平臺提供數據數量和質量的評價指標。
根據維基百科的定義,可機讀數據是指符合可由電腦處理格式的數據,其劃分依據為某種格式的數據是否可以由計算機輕松處理而無需人工干預,同時確保不丟失語義。JSON、XML、CSV、RDF、XLS、XLSX等數據格式是主要用于機器處理的數據文件格式,可通過電腦編程邏輯來提取、轉換和處理其內容;雖然人們可以通過電腦瀏覽并獲取DOC、DOCX、PDF、JPG、RAR格式的數據內容,但這些內容卻很難通過電腦編程邏輯來提取、轉換和處理。因此,若平臺提供數據集格式為JSON、XML、CSV、RDF、XLS、XLSX等,認為其是可機讀數據集,若格式為DOC、DOCX、PDF、JPG、RAR等,則認為其為不可機讀數據集,統計可機讀數據集數量作為平臺提供數據可機讀性的評價指標。
通過對開放數據平臺公示具有較強時效性、對數據來源更新頻率具有較高要求,如交通、氣象、民生、教育查詢應用的數據來源更新頻率進行數據收集和分析發(fā)現,這些數據集的更新頻率大多高于每周1次。因此,本研究認為更新頻率高于每周1次(包括每周1次、每天1次、每小時1次、每分鐘1次以及實時更新數據集)的數據集是高頻更新數據集,通過比較數據集創(chuàng)建時間與最后更新時間,若在數據集創(chuàng)建后有過更新,認為是持續(xù)更新數據集,通過統計高頻更新數據集數量與持續(xù)更新數據集數量作為平臺提供數據更新情況的評價指標。
不同平臺對無條件開放的定義存在一定差別,一部分平臺(如貴州、山東)是真正意義上的無條件開放,即不需要登錄、實名認證等額外操作就可以下載無條件開放數據集,其他平臺標記為無條件開放的數據集通常需要登錄或實名制后才可以下載,有條件開放的數據集則需要上傳額外的證明材料進行申請,審批通過后才可以下載。本文不將登錄或實名制后才可以下載的數據集認定為有條件開放,僅將需要提供額外材料申請開放的數據集認定為有條件開放。統計無條件開放數據集數量作為平臺提供開放數據程度的評價指標。
通過統計下載量與瀏覽量之和排名前25%的數據集的平均下載量與瀏覽量作為平臺曝光度的評價指標。
通過統計平臺上公示的典型應用數量(包括優(yōu)化方案、APP、小程序、Web應用等)以及平均下載量作為平臺數據利用情況的評價指標。
在數據資源創(chuàng)新應用效能評估模型中,選擇平臺公示的典型應用數量、瀏覽量和下載量位列前25%的數據資源的平均瀏覽量和平均下載量作為投入指標,以反映政府開放數據平臺數據資源的使用情況。為了衡量城市創(chuàng)新能力的高低,通過查閱文獻發(fā)現發(fā)明專利申請量通常被用來衡量創(chuàng)新水平,同時考慮到高新技術企業(yè)對于數據資源具有較高的需求,最終選擇將平臺所在省市發(fā)明專利申請量和高新技術企業(yè)數量作為產出指標,來反映平臺所在省市的創(chuàng)新能力,如表3所示。
2.4數據來源與采集
根據已構建的評價指標體系,實現政府開放數據資源利用效能評估需要的具體數據信息包括評價樣本平臺所有數據資源(包括數據集和數據接口)的ID、名稱、數據容量、更新頻率、創(chuàng)建時間、最后更新時間、開放條件、承諾更新頻率、數據格式、數據資源訪問量和下載量。部分平臺如山東、廣東、廣州、深圳等平臺會提供EXCEL格式的開放目錄,從中可以得到部分數據信息,對于缺失的數據信息和不提供開放目錄的平臺,則通過Python爬蟲工具爬取缺失的信息。對得到的信息進行預處理,清除或填補缺失信息后,統計數據集總量、平均數據集容量、可機讀數據集數量、持續(xù)更新及高頻更新數據集數量、無條件開放數據集數量、平均訪問量與平均下載量。典型應用數量則根據平臺網站公示的典型應用案例經篩選去除無意義應用、垃圾廣告應用后得到。
關于政府開放數據資源創(chuàng)新應用效能評估模型中的數據,省市發(fā)明專利申請量通過查閱《中國統計年鑒2021》以及各省市統計局發(fā)布的《統計年鑒2021》得到,省市高新技術企業(yè)數在各省市統計局發(fā)布的《2020年國民經濟和社會發(fā)展統計公報》中查找得到,部分城市缺失的發(fā)明專利申請量及高新技術企業(yè)數信息通過查找相關新聞報道材料,提取對應數據,對缺失數據進行填充。
政府開放數據資源利用效能評估模型中投入產出指標共8個,政府開放數據資源創(chuàng)新應用效能評估模型中投入產出指標共5個,選擇的評估樣本平臺數量為18個,無論在哪個評估模型中,均能滿足數據包絡分析中決策單元個數不少于投入產出指標總數2倍的要求。
3效率評價
3.1政府開放數據資源利用效能評價
將采集得到的政府開放數據平臺數據資源信息統計整理得到的政府開放數據資源利用效能評估模型投入產出數據表,如表4所示。
為了得到具體效率情況,將以上投入產出數據表使用DEA-Solver Pro5的CCR-I模型與BCC-I模型運行,通過CCR-I模型運行結果得到綜合技術效率,通過BCC-I模型運行結果得到純技術效率與規(guī)模報酬情況。通過綜合技術效率值除以純技術效率值得到規(guī)模效率值。政府開放數據平臺效率表如表5所示。
根據表5可以看出,18個政府開放數據平臺的數據資源利用效率情況可以分為3類,綜合技術效率、純技術效率、規(guī)模效率均為1,即DEA有效,上海、浙江、廣東等9個省市的平臺屬于此種情況;綜合技術效率、規(guī)模效率小于1,純技術效率為1,福建、寧夏、廈門的平臺屬于此種情況;綜合技術效率、純技術效率、規(guī)模效率均小于1,貴州、山東、天津等6個省市的平臺屬于此種情況,后兩種情況均為DEA無效。
綜合技術效率受管理、技術、規(guī)模等多個因素影響,將綜合技術效率分解為規(guī)模效率與純技術效率后,若綜合技術效率不為1,純技術效率為1,則說明投入產出結構和資源配置已達到最優(yōu)狀態(tài),但規(guī)模效率為無效狀態(tài),未處于最優(yōu)規(guī)模狀態(tài),表示在當前的投入產出結構下,投入的生產要素已經發(fā)揮了最大作用,但由于沒有達到最優(yōu)生產規(guī)模而造成DEA無效,改進方向在于生產規(guī)模的優(yōu)化。若純技術效率不為1,說明資源配置存在問題,需要改變投入要素的組合方式;規(guī)模效率不為1,說明生產要素投入量水平需要調整;規(guī)模報酬遞減說明投入可能存在冗余,需要縮減規(guī)模。
通過DEA模型得到的效率值可以明確各個平臺數據資源的DEA效率狀態(tài),通過純技術效率值、規(guī)模效率值和規(guī)模報酬情況對DEA無效平臺進行定性分析,對平臺效率改進提供大致方向。通過DEA-Solver Pr05運行得到的投影結果,則可以定量分析決策單元效率不足的原因和程度,并從更具體的角度實現平臺效率改進,政府開放數據資源利用效率投影結果如表6所示。
通過表6可以看出,在投入指標方面,由于可機讀性、更新頻率、開放條件指標是由滿足相應標準的數據資源數量表示的,因此投影情況反映出這些指標的冗余實質上與數據資源數量的冗余相關,因此,所有的數據資源利用DEA無效平臺在投入指標方面存在的問題為數據資源不同程度的冗余。由于政府開放數據平臺在本質上屬于公共服務具有特殊要求,即只要滿足相關政策法規(guī),就需要滿足任何潛在用戶的數據資源需求,即使某些數據資源只有個別用戶群體才需要,這種類型的數據也同樣需要提供。由于這種特殊要求的存在,對冗余平臺數據資源進行清理顯然是無法實現的,為了在一定程度上解決提供數據資源的冗余情況,實現平臺的效率改進,只能從數據利用率角度人手,在提供特殊的、小眾的資源同時,追蹤社會熱點,研究熱點,對數據需求進行分析,提供社會需要、使用者需要的熱點數據資源與核心數據資源。
在產出指標方面,除天津、成都和廣州平臺,其余DEA無效平臺的數據瀏覽量和下載量均存在較為嚴重的不足,反映出平臺曝光度的不足與數據資源利用率的缺乏。政府開放數據平臺建設的最終目標并不僅僅是簡單地將政府掌握的數據資源開放出去,而是在實現開放的基礎上,引導、鼓勵使用者去利用這些數據資源實現價值創(chuàng)造,實現數據資源對經濟、公共服務和社會治理方面的促進作用。
3.2政府開放數據資源創(chuàng)新應用效能評價
政府開放數據資源創(chuàng)新應用效能評價與政府開放數據資源利用效能評價過程相同,對已收集的城市創(chuàng)新應用數據進行匯總整理得到政府開放數據資源創(chuàng)新應用效能評估模型投入產出數據表,如表7所示,使用DEA-Solver Pro5的CCR-I模型與BCC-I模型運行得到政府開放數據資源創(chuàng)新應用效率表,如表8所示。
對比政府開放數據資源利用效率情況與政府開放數據資源創(chuàng)新應用效率情況可以看出,在數據資源利用方面達到DEA有效的平臺在數據資源創(chuàng)新應用方面未必有效,例如:上海、浙江、廣西等平臺;而在數據資源利用方面處于DEA無效狀態(tài)的平臺在數據資源創(chuàng)新應用方面也未必同樣無效,例如:廣州、山東、天津、福建等平臺。
通過對以上海平臺為代表的數據資源利用有效而數據資源創(chuàng)新應用無效平臺和以廣州平臺為代表的數據資源利用無效而數據資源創(chuàng)新應用有效平臺進行綜合分析對比,分析平臺除開放數據資源外的其他功能模塊發(fā)現,廣州平臺在政策咨詢功能模塊中提供了資訊動態(tài)、法規(guī)與政策、標準規(guī)范3種咨詢信息。在資訊動態(tài)模塊中提供了從2017年至今以廣東省為主、其他省為輔的數據資源應用咨詢,應用范圍除城市創(chuàng)新外,還涵蓋了氣象、防疫、數字經濟、數字安全、交通出行等多個領域;在法規(guī)與政策模塊中則提供了國家及各省市發(fā)布的包括數字資源、數字經濟及數字治理等數字化相關的法規(guī)與政策;在標準規(guī)范模塊中則提供了數據資源質量評估標準和利用要求,以及平臺具體的操作規(guī)范。對比上海平臺,雖也有相關消息及制度保障模塊,但模塊所處位置并不容易發(fā)現且相關消息提供咨詢超過一半為2015年平臺相關數據資源開放清單,在提供咨詢的時效性與豐富性上遠不及廣州平臺;在制度保障模塊存在同樣的問題,僅提供了5項相關政策,全部為上海市數據資源使用相關政策文件。通過數據資源應用相關咨詢的分享,平臺用戶可以了解到當下數據資源應用的熱點領域和前沿領域,對引導用戶使用資源、提高數據資源利用率具有良好的促進作用。通過數字化相關法規(guī)與政策的發(fā)布,對平臺建設、數據資源質量和用戶數據利用都有較好的規(guī)范約束作用。
因此,數據資源創(chuàng)新應用應是一個政府部門、開放數據平臺、數據資源用戶相互作用的過程,其中,政府部門通過制定相關政策與法規(guī),保證平臺建設與數據資源的質量并規(guī)范用戶利用資源的行為,在該過程中發(fā)揮主導作用;開放數據平臺作為核心,承載著開放數據、維護數據、引導用戶、與用戶互動并根據用戶反饋做出相應改進等責任;用戶則是城市創(chuàng)新的主體,通過使用數據資源進行創(chuàng)新活動,實現城市創(chuàng)新能力的提高。
除了政府部門、開放數據平臺、數據資源用戶兩兩之間的相互作用,用戶與用戶之間的互動在數據資源創(chuàng)新應用過程中同樣重要且不可忽視,雖然上海平臺為用戶提供的基于論壇的互動社區(qū)使用情況不佳,論壇帖子數較少,用戶使用意愿不強,討論熱度不高,但仍為用戶與用戶之間的互動提供了渠道。用戶之間的互動更有利于創(chuàng)意產生,同時用戶之間的合作也可以實現創(chuàng)意的完善,實現從創(chuàng)意到創(chuàng)新的前進。
4結論與建議
本研究以上海、浙江、廣州等18個省級、副省級政府開放數據平臺作為研究樣本,通過采集各平臺數據集數量、平均數據集容量、可機讀數據集數量、及時更新數據集數量、無條件開放數據集數量以及公示的典型應用數量、瀏覽量和下載量位列前25%的數據資源的平均瀏覽量和平均下載量,使用數據包絡分析法對政府開放數據資源利用效率進行評估,發(fā)現上海、浙江、廣東等9個省市的平臺DEA有效,數據資源利用情況良好;福建、寧夏、廈門平臺雖然投入產出結構和資源配置合理,但由于未處于最優(yōu)規(guī)模狀態(tài)而DEA無效;貴州、山東、天津等6個省市的平臺則在投入產出結構、資源配置和規(guī)模狀態(tài)都存在問題,為DEA無效狀態(tài)。
為解決DEA無效平臺在投入數據資源冗余方面的問題,政府應在滿足任何潛在用戶的數據資源需求,即不對冗余數據資源進行清理的前提下,對數據需求進行分析,提供社會需要、使用者需要的熱點數據資源與核心數據資源,通過增加高使用率數據資源比例來緩解投入冗余;為解決數據瀏覽量和下載量不足的問題,政府應通過適當的宣傳增加曝光度,確保數據資源能被有需要的用戶發(fā)現,同時加強引導,促進數據資源的利用。
在政府開放數據資源創(chuàng)新應用情況研究中,通過采集各平臺典型應用數量、前25%的數據資源平均瀏覽量和平均下載量以及平臺所在省市的發(fā)明專利申請量和高新技術企業(yè)數量,對政府開放數據資源創(chuàng)新應用情況進行評估,通過對比以上海平臺為代表的數據資源利用有效但數據資源創(chuàng)新應用無效的平臺和以廣州平臺為代表的數據資源創(chuàng)新應用有效但數據資源利用無效的平臺,對兩類平臺具體提供的功能模塊進行分析,認為應通過構建以政府部門為主導、以開放數據平臺為核心、以數據資源用戶為創(chuàng)新主體的數據資源創(chuàng)新應用過程,政府通過發(fā)布政策法規(guī)發(fā)揮整體規(guī)范約束作用,平臺通過開放數據、維護數據、引導使用數據、根據反饋改進服務為用戶創(chuàng)新活動的進行提供良好基礎,用戶以數據資源為基礎,在與平臺和其他用戶的互動中實現創(chuàng)新活動,最終在數據資源創(chuàng)新應用過程各方參與者的相互作用下實現城市創(chuàng)新水平的提高。
本研究認為,政府開放數據平臺建設的目標不僅僅是簡單地將政府數據通過平臺開放出去,而是在開放的基礎上引導用戶使用數據,充分發(fā)揮數據的潛在價值,相對于現有的政府開放數據平臺評價研究,本研究在通過數據資源利用效能評價平臺建設的同時,以城市創(chuàng)新應用為例對數據資源價值發(fā)揮情況進行了評價,并綜合分析兩次評價的結果,為政府開放數據平臺建設、促進數據資源利用、提高創(chuàng)新應用效能提供建議。但本研究在數據資源利用效能評價中評價數據集質量時,由于對平臺中每個數據集的具體質量情況進行判斷十分困難,本研究僅通過數據集平均容量來衡量質量高低,這是不全面的;同時,數據資源對城市發(fā)展的促進作用是體現在多方面的,包括對經濟發(fā)展的促進作用、對社會治理的促進作用,對城市創(chuàng)新的促進只是其中一方面。在后續(xù)研究中將進一步完善評價體系,對數據集質量進行更全面的衡量,同時從經濟、社會治理、城市創(chuàng)新等多角度評價數據資源對城市發(fā)展的促進作用,以得到更加全面、合理、完備的政府開放數據平臺建設模式。