高 豐
開放數(shù)據(jù)中國 上海 200438
開放數(shù)據(jù):概念、現(xiàn)狀與機(jī)遇
高 豐
開放數(shù)據(jù)中國 上海 200438
在“數(shù)據(jù)革命”時(shí)代,數(shù)據(jù)的自由流通最為關(guān)鍵,必須打破數(shù)據(jù)孤島。為此,開放數(shù)據(jù)運(yùn)動(dòng)應(yīng)運(yùn)而生,這項(xiàng)運(yùn)動(dòng)將開源世界的開放理念移植到數(shù)據(jù)孤島問題中,提倡并號(hào)召解鎖政府、企業(yè)、非營利機(jī)構(gòu),甚至特定的個(gè)人數(shù)據(jù)。而現(xiàn)階段,開放數(shù)據(jù)更多意味著打破最大的數(shù)據(jù)孤島——開放政府?dāng)?shù)據(jù)。因此,聚焦于開放政府?dāng)?shù)據(jù),系統(tǒng)地回顧并盤點(diǎn)了開放數(shù)據(jù)的基本概念、歷史發(fā)展路徑、國際現(xiàn)狀、商業(yè)潛能以及中國發(fā)展現(xiàn)狀和挑戰(zhàn)。
開放數(shù)據(jù);政府?dāng)?shù)據(jù);商業(yè)潛能;商業(yè)模式
要理解開放數(shù)據(jù),不妨先了解開放究竟意味著什么?根據(jù)英國開放知識(shí)基金會(huì)(Open Knowledge Foundation)1http://opendefinition.org的定義,開放(openness)需具備以下3項(xiàng)基本元素。
(1)非歧視性:數(shù)據(jù)若開放,則其對(duì)任何人都開放。
(2)機(jī)器可讀性:數(shù)據(jù)若開放,則應(yīng)是機(jī)器可讀格式,例如對(duì)于表格數(shù)據(jù),應(yīng)該采用.csv,而非.pdf。
(3)開放授權(quán)性:數(shù)據(jù)若開放,則其對(duì)應(yīng)授權(quán)條款應(yīng)確保使用者自由免費(fèi)訪問、獲取、使用、加值、演繹、拷貝、傳播的權(quán)利。
基于上述定義不難看出,開放數(shù)據(jù)相較于數(shù)據(jù)共享而言,其更秉承著開源世界所倡導(dǎo)的平等、自由的價(jià)值觀。開放數(shù)據(jù)強(qiáng)調(diào)的非歧視性和開放授權(quán)性,打破了傳統(tǒng)數(shù)據(jù)共享中設(shè)定的“共享?xiàng)l件”和“特定共享方”的限制。
相對(duì)于政府一直推行的信息公開而言,開放數(shù)據(jù)所強(qiáng)調(diào)的機(jī)器可讀性以及其明確賦予數(shù)據(jù)使用者的自由加值利用(包括商業(yè)使用和非商業(yè)使用)和分享傳播權(quán)利,更好地刺激了公眾對(duì)政府?dāng)?shù)據(jù)資源的需求,并鼓勵(lì)公眾對(duì)政府?dāng)?shù)據(jù)加值利用。
透明化是開放數(shù)據(jù)的原動(dòng)力。開放數(shù)據(jù)有別于信息公開,更有別于數(shù)據(jù)共享,因此它所要求的非歧視性、機(jī)器可讀性、開放授權(quán)性對(duì)數(shù)據(jù)提供者提出了更高的要求。這意味著數(shù)據(jù)提供者需要背負(fù)更高的成本來確保數(shù)據(jù)開放在正確的格式與協(xié)議之下,并且承擔(dān)可能的直接經(jīng)濟(jì)收益損失(即損失了原本通過數(shù)據(jù)交易可得的利益)。在這樣的情況下,如何推動(dòng)政府中的各數(shù)據(jù)提供者開放數(shù)據(jù)?
如果將開放數(shù)據(jù)運(yùn)動(dòng)比作一場馬拉松,那么開放數(shù)據(jù)運(yùn)動(dòng)的前半程則完全由政府透明化在推動(dòng)。事實(shí)上,最早開啟開放數(shù)據(jù)運(yùn)動(dòng)的美國就是以2009年奧巴馬簽署的《開放政府指令》(Open Government Directive)為基礎(chǔ),朝著讓政府更透明、讓民眾更好監(jiān)督政府運(yùn)作的方向,推進(jìn)開放數(shù)據(jù)的發(fā)展。在這個(gè)過程中,政府預(yù)算、政府支出、政府選舉3項(xiàng)數(shù)據(jù)是開放政府?dāng)?shù)據(jù)計(jì)劃中的重點(diǎn)對(duì)象,因此美國奧巴馬政府在2014年進(jìn)一步推動(dòng)了《數(shù)據(jù)法令》(Data Act)的通過,從而加強(qiáng)政府預(yù)算和支出數(shù)據(jù)的開放。
美國自然不是唯一通過開放數(shù)據(jù)實(shí)現(xiàn)政府透明的國家,根據(jù)開放政府伙伴(Open Government Partnership)計(jì)劃的記錄,目前全球共有超過60個(gè)國家加入了伙伴計(jì)劃,而作為伙伴計(jì)劃成員,需要承諾的便是開放政府?dāng)?shù)據(jù),從而通過數(shù)據(jù)開放實(shí)現(xiàn)政府的透明化,幫助民眾問責(zé)政府。
公眾對(duì)政府透明化的訴求,在歐美民主體制下變成了一股政府無法忽視的力量,這股力量對(duì)于政府?dāng)?shù)據(jù)的開放既是壓力也是動(dòng)力。從壓力的角度來說,民選政府有義務(wù)推進(jìn)政府透明化的進(jìn)程,而在數(shù)據(jù)時(shí)代,必須要通過數(shù)據(jù)開放去加強(qiáng)透明化;從動(dòng)力角度來說,為了迎合公眾對(duì)政府透明化的需求,率先開展政府?dāng)?shù)據(jù)開放,使民眾可以自由了解并監(jiān)督政府,可以為主要的行政長官贏得政績,更可能贏得未來民眾的選票。因此,在這樣的前提下,無論遇到什么阻礙(如清洗并轉(zhuǎn)化數(shù)據(jù)格式的成本或是無法再交易數(shù)據(jù)的損失),都將因?yàn)殚_放數(shù)據(jù)所帶來的政治資本收益而得以突破。
僅憑透明化所帶來的動(dòng)力并不能推動(dòng)開放數(shù)據(jù)運(yùn)動(dòng)走向終點(diǎn)。隨著民眾對(duì)政府?dāng)?shù)據(jù)的需求日益增長,開放數(shù)據(jù)的倡導(dǎo)者和實(shí)踐者們不得不開始正視隨之而來的巨大成本壓力。而另一方面,透明化的主題并非是企業(yè)和創(chuàng)業(yè)者感興趣的,若要進(jìn)一步吸引這一群體參與推進(jìn)開放數(shù)據(jù)運(yùn)動(dòng),創(chuàng)建正向循環(huán)的數(shù)據(jù)開放生態(tài),就必須探索開放數(shù)據(jù)的商業(yè)潛能。也因此開放數(shù)據(jù)的倡導(dǎo)者和實(shí)踐者逐步開始研究并宣傳開放數(shù)據(jù)的經(jīng)濟(jì)價(jià)值,希望借此吸引商業(yè)人士的注意和參與。
2013年,國際知名的咨詢公司麥肯錫發(fā)布了名為《Open Data: Unlocking Innovation and Performance with Liquid Information》[1]的研究報(bào)告,它指出全球每年因開放數(shù)據(jù)釋放的經(jīng)濟(jì)價(jià)值可以達(dá)到3萬億美元,這其中不僅包含了因開放數(shù)據(jù)創(chuàng)造的新財(cái)富,也包含了因開放數(shù)據(jù)可以節(jié)省的開支。
2014年,知名慈善創(chuàng)投基金Omidyar Network 聘請澳大利亞咨詢公司 Lateral Economics 就開放數(shù)據(jù)經(jīng)濟(jì)潛能進(jìn)行研究。其發(fā)布的報(bào)告《Open for Business: How Open Data Can Help Achieve the G20 Growth Target》[2]指出,綜合G20(20國集團(tuán))各國的經(jīng)濟(jì),開放數(shù)據(jù)將在未來5年中實(shí)現(xiàn)總額為13萬億美元的增長。因此,開放數(shù)據(jù)將在未來5年中為G20國家貢獻(xiàn)大約 1.1個(gè)百分點(diǎn)的 GDP增長,這將占到G20未來5年GDP增長目標(biāo)(2%)的55%。
無論是麥肯錫報(bào)告提到的3萬億美元,還是Lateral Economics提到的13萬億美元的增長,都預(yù)示著開放數(shù)據(jù)所能帶來的巨大經(jīng)濟(jì)價(jià)值。而經(jīng)濟(jì)價(jià)值的實(shí)現(xiàn),一方面來自于市場因數(shù)據(jù)開放透明而節(jié)省的成本開支,另一方面來自于開放數(shù)據(jù)所激活的新興創(chuàng)新市場。如果套用當(dāng)下“互聯(lián)網(wǎng)+”的提法,開放數(shù)據(jù)所激活的新興創(chuàng)新市場實(shí)際就是在做“開放數(shù)據(jù)+”的工作,通過結(jié)合開放數(shù)據(jù),一些傳統(tǒng)的行業(yè)得到改變,而另一些創(chuàng)新的應(yīng)用服務(wù)也成為可能。
2015年初,英國開放數(shù)據(jù)研究院(Open Data Institute,ODI)針對(duì)英國企業(yè)使用開放數(shù)據(jù)的情況進(jìn)行了調(diào)研2http://theodi.org/ open-data-meansbusiness-ukinnovationsectors-regions。在調(diào)研的270家企業(yè)中,雖然70%屬于小微企業(yè)(10人以下公司),但大型企業(yè)(占8%,250人以上公司)也不乏使用開放數(shù)據(jù)的案例。另一方面,雖然開放數(shù)據(jù)開辟了大量新的創(chuàng)新領(lǐng)域,促使大量創(chuàng)業(yè)公司得以誕生,但ODI也發(fā)現(xiàn),一些已經(jīng)建立10年以上的企業(yè)(占39%)也加入了使用開放數(shù)據(jù)的隊(duì)伍。
盡管目前使用開放數(shù)據(jù)來創(chuàng)建服務(wù)的企業(yè)都相對(duì)很小,但其中也有一些已經(jīng)成長飛快,成為有顯著經(jīng)濟(jì)價(jià)值的企業(yè),具體介紹如下。
Zillow公司作為一家市值30億美元的公司,創(chuàng)建了一個(gè)在線房產(chǎn)交易平臺(tái),供房屋產(chǎn)權(quán)人、購買者、售賣者、租賃者、中介、出租者、貸款經(jīng)紀(jì)、房產(chǎn)經(jīng)理等發(fā)現(xiàn)并分享房產(chǎn)及周邊相關(guān)(如貸款)信息。整個(gè)平臺(tái)由一個(gè)記錄了超過1.1億條美國房產(chǎn)記錄的數(shù)據(jù)庫驅(qū)動(dòng),這個(gè)數(shù)據(jù)庫中既有掛牌出售的房產(chǎn)信息,也有未掛牌的房產(chǎn)信息。Zillow將美國政府開放的土地交易記錄、房屋交易記錄、房屋整修記錄、治安狀況等有關(guān)社區(qū)狀況的開放數(shù)據(jù)整合進(jìn)原有平臺(tái),建立更為合理的房屋估值模型。
Climate Corp公司于2013年10月被Monsanto公司以9億3千萬美元收購。它利用美國政府免費(fèi)開放的60年農(nóng)作物收成數(shù)據(jù)、美國超過100萬個(gè)氣象監(jiān)測站的氣象數(shù)據(jù)以及14 TB的土壤質(zhì)量數(shù)據(jù),為農(nóng)民提供農(nóng)業(yè)種植和金融決策輔助信息。它的一款主打產(chǎn)品是“全氣候保險(xiǎn)”,這款保險(xiǎn)產(chǎn)品將在系統(tǒng)預(yù)測有惡劣天氣時(shí)自動(dòng)賠付農(nóng)民的損失,而不需要農(nóng)民舉證實(shí)際損失。Climate Corp公司是2006年由兩名前Google公司員工創(chuàng)建的,它每天要利用從22個(gè)數(shù)據(jù)集中經(jīng)過高級(jí)數(shù)據(jù)分析產(chǎn)出的300萬份數(shù)據(jù)資料。這些數(shù)據(jù)來自不同的第三方機(jī)構(gòu),比如美國氣象局,并且這些數(shù)據(jù)都是免費(fèi)、自由重復(fù)使用的。
上述開放數(shù)據(jù)的企業(yè)案例也使得開放數(shù)據(jù)的倡導(dǎo)者得以洞察幾類常見的商業(yè)模式,在世界銀行高級(jí)開放數(shù)據(jù)顧問Andrew Stott 撰寫的《Open Data For Economic Growth》[3]報(bào)告中,商業(yè)模式被歸納為 5 類。
(1)供應(yīng)者(supplier)
供應(yīng)者指的是發(fā)布開放數(shù)據(jù)供第三方使用和重利用的企業(yè)和機(jī)構(gòu)。這里不單單包括公共部門,也包括私營企業(yè),比如英國鐵路運(yùn)營公司(英國鐵路為私人運(yùn)營)。發(fā)布數(shù)據(jù)本身并不能獲利,但發(fā)布數(shù)據(jù)卻可能提升用戶忠誠度和參與度,從而間接獲利。同時(shí),供應(yīng)者也可能利用自己對(duì)數(shù)據(jù)理解的優(yōu)勢開發(fā)加值服務(wù),進(jìn)而獲利,比如德國統(tǒng)計(jì)局在 2008年10月開始開放其數(shù)據(jù),而此開放數(shù)據(jù)項(xiàng)目使其附加服務(wù)和咨詢服務(wù)的營業(yè)額在兩年內(nèi)增長了95%。一些數(shù)據(jù)供應(yīng)商(如英國氣象局)采用雙軌模式:一個(gè)是免費(fèi)版本,公眾可以免費(fèi)使用相應(yīng)數(shù)據(jù),但只能得到有限的技術(shù)支持;一個(gè)是收費(fèi)版本,將相同數(shù)據(jù)授權(quán)在相同協(xié)議下,但提供有保障的技術(shù)支持。
(2)聚合者(aggregator)
聚合者指的是搜集并聚合開放數(shù)據(jù),有時(shí)也包括封閉數(shù)據(jù)的企業(yè)和機(jī)構(gòu),通常面向一個(gè)特定垂直領(lǐng)域或地域。比如:Data Publica是一個(gè)法國一站式綜合數(shù)據(jù)門戶;Placr/Transport API致力于打造英國第一個(gè)交通領(lǐng)域開放平臺(tái);Open Corporates則聚合了全球81個(gè)國家的企業(yè)注冊數(shù)據(jù),目前共記錄了66 665 508家企業(yè)數(shù)據(jù)。相應(yīng)的商業(yè)模式有:對(duì)聚合數(shù)據(jù)本身收費(fèi),提供額外的增值服務(wù),比如API(application programming interface,應(yīng)用程序編程接口)以及分級(jí)收費(fèi)模式(例如,數(shù)據(jù)提供在“以相同方式”授權(quán)模式下,要求第三方整合數(shù)據(jù)后必須以相同開放授權(quán)開放新數(shù)據(jù),若遵從則數(shù)據(jù)免費(fèi),如果需要無限制的授權(quán)則需要付費(fèi))。
(3)開發(fā)者(developer)
開發(fā)者指的是設(shè)計(jì)、開發(fā)并售賣Web應(yīng)用或移動(dòng)應(yīng)用的企業(yè)或個(gè)人開發(fā)者。這些應(yīng)用將政府開放的數(shù)據(jù),通過吸引人的方式表現(xiàn)給終端用戶,以供其方便使用。在紐約,地鐵應(yīng)用就超過了 68 個(gè),而在倫敦,更有約 500 個(gè)公共交通應(yīng)用使用開放數(shù)據(jù)。
(4)增值者(enricher)
增值者指的是通過分析開放數(shù)據(jù)獲取進(jìn)一步洞見后,將其整合到相應(yīng)面向終端消費(fèi)者的服務(wù)或產(chǎn)品的企業(yè)或機(jī)構(gòu),通常這些服務(wù)和產(chǎn)品都是依靠開放數(shù)據(jù)而全新誕生的。前文提到的 Climate Corp公司正是采用此類商業(yè)模式。同樣美國的Zillow公司和英國的Zoopla公司也屬于此類。增值者可能屬于所有商業(yè)模式中附加價(jià)值最高的一種,同時(shí)也是更容易在市場估值中得到認(rèn)同的一類。
(5)賦能者(enabler)
賦能者指的是提供平臺(tái)和技術(shù)來供第三方企業(yè)和個(gè)人使用的企業(yè)和機(jī)構(gòu),是開放數(shù)據(jù)生態(tài)的重要組成部分,在確保盈利的同時(shí),向數(shù)據(jù)供應(yīng)者和消費(fèi)者提供高性價(jià)比、易于訪問的服務(wù),如面向政府提供軟件即服務(wù)的開放數(shù)據(jù)門戶解決方案的Socrata公司、法國競爭者OpenDataSoft公司以及Musigma和Cloudera這種提供數(shù)據(jù)分析服務(wù)和平臺(tái)的公司。
為了鼓勵(lì)不同類型和大小的企業(yè)、初創(chuàng)公司和個(gè)人能夠利用開放數(shù)據(jù)進(jìn)行創(chuàng)新,并找到合適的商業(yè)模式來持續(xù)化自身的產(chǎn)品和服務(wù),一批專注于開放數(shù)據(jù)的孵化器正在誕生。ODI便是此類孵化器的先驅(qū)之一。ODI作為一家由萬維網(wǎng)之父蒂姆·伯納斯·李所創(chuàng)辦的非營利機(jī)構(gòu),得到了英國政府1 000萬英鎊的投資,不但針對(duì)開放數(shù)據(jù)本身進(jìn)行研究、培訓(xùn)和咨詢,也提供創(chuàng)業(yè)企業(yè)孵化的服務(wù)。ODI在孵化過程中并不提供資金,但借助其創(chuàng)始人和執(zhí)行團(tuán)隊(duì)與英國政府、學(xué)界、非營利機(jī)構(gòu)之間的強(qiáng)大人脈網(wǎng)絡(luò),能夠幫助入駐孵化的創(chuàng)業(yè)企業(yè)解決最核心的開放數(shù)據(jù)供給與質(zhì)量問題,并提供合適的媒體、會(huì)議等宣傳平臺(tái)幫助這些創(chuàng)業(yè)企業(yè)曝光在大眾的視野中,從而使其更好地成長。
如今,ODI作為孵化器已經(jīng)成功孵化了11家創(chuàng)業(yè)企業(yè),其中包含了整合并開放企業(yè)注冊數(shù)據(jù)的OpenCorportates公司以及整合并提供交通數(shù)據(jù)API的Placr公司。在新一輪孵化項(xiàng)目中,12家新興創(chuàng)業(yè)企業(yè)入駐ODI,其中就包含了明星企業(yè)Spend Network公司,它的主要業(yè)務(wù)是整合并分析英國政府財(cái)政支出和采購數(shù)據(jù),而之前讓其獲得矚目的一個(gè)項(xiàng)目便是揭露低效政府采購系統(tǒng)導(dǎo)致2百億英鎊現(xiàn)金流的滯緩。同時(shí),ODI這一輪的企業(yè)中也不乏從英國開放數(shù)據(jù)競賽(Open Data Challenge)中脫穎而出的獲獎(jiǎng)團(tuán)隊(duì),比如基于食品數(shù)據(jù)提供服務(wù)的FoodTrade公司和專注于解決社會(huì)住房問題的RentSquare公司。
受ODI孵化開放數(shù)據(jù)企業(yè)的啟發(fā),歐洲聯(lián)盟(以下簡稱歐盟)在2015年也啟動(dòng)了面向整個(gè)歐盟的開放數(shù)據(jù)孵化器(ODINE)3http:// opendataincubator. eu。ODINE項(xiàng)目由英國南安普敦大學(xué)協(xié)同ODI在內(nèi)的共7家機(jī)構(gòu)組成聯(lián)盟共同組織運(yùn)營,其從歐盟2020年戰(zhàn)略基金中獲得了1 440萬歐元的資金,用于在30個(gè)月內(nèi)投資開放數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)業(yè)企業(yè)。每家通過申請的創(chuàng)業(yè)企業(yè)都將獲得最多10萬歐元的投資(不占股權(quán))以及配套的培訓(xùn)、媒體宣傳、專家指導(dǎo)、風(fēng)投對(duì)接等服務(wù)。
從2009年到2015年,開放數(shù)據(jù)的發(fā)展從依靠透明化為單純動(dòng)力,演變到如今透明化和商業(yè)潛能雙驅(qū)動(dòng)的模式,而開放數(shù)據(jù)也不再僅是歐美發(fā)達(dá)國家所能開展的計(jì)劃,無論是非洲的肯尼亞、拉美的墨西哥,還是亞洲的菲律賓,都是發(fā)展中國家中開放數(shù)據(jù)發(fā)展的佼佼者,開放數(shù)據(jù)已成為各國政府在這個(gè)數(shù)據(jù)革命時(shí)代不得不為之事。
面對(duì)開放數(shù)據(jù)如此高速的發(fā)展以及其所能帶來的經(jīng)濟(jì)和社會(huì)價(jià)值,中國是否做好足夠準(zhǔn)備去擁抱這一變革?中國開放數(shù)據(jù)發(fā)展的現(xiàn)狀如何?
當(dāng)前,開放數(shù)據(jù)在中國的發(fā)展整體落后于歐美各國。在國家層面上,中央還未正式出臺(tái)任何開放數(shù)據(jù)政策,也沒有上線的國家級(jí)開放數(shù)據(jù)門戶。近兩年,中央在開放數(shù)據(jù)上的聲音越來越強(qiáng)。比如,在2015年兩會(huì)期間,李克強(qiáng)總理在回應(yīng)山東代表團(tuán)有關(guān)開放數(shù)據(jù)相關(guān)提議時(shí)說道:“政府掌握的數(shù)據(jù)要公開,除依法涉密的之外,數(shù)據(jù)要盡最大可能地公開,以便于云計(jì)算企業(yè)為社會(huì)服務(wù),也為政府決策、監(jiān)管服務(wù)。”而在2015年5月底召開的貴陽國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)暨全球大數(shù)據(jù)時(shí)代貴陽峰會(huì)上,中共中央政治局委員、國務(wù)院副總理馬凱也強(qiáng)調(diào):“要共促數(shù)據(jù)開放,讓大數(shù)據(jù)惠及更多民眾”、“要加快建立政府開放數(shù)據(jù)門戶,優(yōu)先開放高價(jià)值數(shù)據(jù),鼓勵(lì)基于開放數(shù)據(jù)開展應(yīng)用創(chuàng)新,讓大數(shù)據(jù)惠及更多民眾,要制定鼓勵(lì)政策,引導(dǎo)更多非公共數(shù)據(jù)向社會(huì)開放。”這些來自中央高層的支持無疑代表了中央政府推進(jìn)開放政府?dāng)?shù)據(jù)的巨大決心。
雖然開放數(shù)據(jù)尚未在中央層面全面開展,一些市政府乃至區(qū)政府早已開始了開放數(shù)據(jù)的實(shí)驗(yàn)。上海市在2012年6月就上線了中國第一個(gè)開放數(shù)據(jù)門戶“上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)”,而在之后幾年中,北京、佛山、武漢等也陸續(xù)推出了自己的開放數(shù)據(jù)門戶網(wǎng)站,見表1。當(dāng)歐美各國正在思考如何從中央走向地方發(fā)展開放數(shù)據(jù)時(shí),中國開放數(shù)據(jù)的發(fā)展卻從一開始就深入地方開始了發(fā)展。
在近期,由筆者和復(fù)旦大學(xué)數(shù)字和移動(dòng)政務(wù)實(shí)驗(yàn)室合作的《中國開放政府?dāng)?shù)據(jù)平臺(tái)研究:框架、現(xiàn)狀與建議》[4],針對(duì)北京、上海、武漢、無錫、湛江、海曙、南海7個(gè)地方開展了全面、系統(tǒng)的開放政府?dāng)?shù)據(jù)項(xiàng)目評(píng)估。評(píng)估發(fā)現(xiàn),目前中國地方政府開放數(shù)據(jù)的發(fā)展已經(jīng)從特大型城市(北京、上海)擴(kuò)展到不同地域、不同規(guī)模的地方,但仍舊相對(duì)集中于沿海(江)城市(區(qū)),基本都為國家或省市內(nèi)的一線地區(qū),經(jīng)濟(jì)較為發(fā)達(dá),政府信息化基礎(chǔ)相對(duì)較好,IT產(chǎn)業(yè)發(fā)展具備一定潛力。
整體而言,各地方開放政府?dāng)?shù)據(jù)項(xiàng)目仍處于初級(jí)探索階段,各地方公開的數(shù)據(jù)總量及可機(jī)讀數(shù)據(jù)數(shù)量如圖1所示。截至2015年5月20日,上述7個(gè)地方共發(fā)布了1 946個(gè)數(shù)據(jù)集。其中,發(fā)布數(shù)據(jù)最多的是武漢(635個(gè)數(shù)據(jù)集),發(fā)布數(shù)據(jù)最少的則是湛江(29個(gè)數(shù)據(jù)集),平均每個(gè)地方發(fā)布278個(gè)數(shù)據(jù)集。進(jìn)一步考察各地方所發(fā)布數(shù)據(jù)中符合可機(jī)讀要求的比例發(fā)現(xiàn):當(dāng)前平均可機(jī)讀率為84.1%,其中北京和海曙兩地可機(jī)讀比例最高(100%),武漢則最低(54%)。而從可機(jī)讀總數(shù)量角度來說,當(dāng)前上海則以398個(gè)可機(jī)讀數(shù)據(jù)集位列全國第一。
表1 已正式上線的開放數(shù)據(jù)項(xiàng)目
圖1 各地方公開的數(shù)據(jù)總量及可機(jī)讀數(shù)據(jù)數(shù)量
數(shù)據(jù)的開放授權(quán)性也是需要重點(diǎn)考察的一項(xiàng)內(nèi)容,從研究結(jié)果來看,目前各地方數(shù)據(jù)授權(quán)條款符合開放授權(quán)的比例為0,其中能夠確保數(shù)據(jù)永久免費(fèi)性的為28.5%(2個(gè)地方),明確保障自由加值利用權(quán)利的比例為0,明確保障自由分享傳播權(quán)利的比例為0(其中57%,即4個(gè)地方的條款限制自由分享傳播)。從目前數(shù)據(jù)的時(shí)效性來看,各地方平均86.25%的數(shù)據(jù)為靜態(tài)數(shù)據(jù)(以年為單位更新或按需更新),即使如此,數(shù)據(jù)按承諾頻率更新的比例也僅達(dá)到17.21%。各地方數(shù)據(jù)更新情況如圖2所示。
基于上述現(xiàn)狀可知,當(dāng)前各地方對(duì)于開放數(shù)據(jù)概念及其原則尚未能充分理解,在實(shí)際工作中仍舊延續(xù)了信息公開的舊思路和實(shí)踐方法。實(shí)際上,這些問題相當(dāng)程度上可歸咎于開放數(shù)據(jù)政策的缺位。在研究調(diào)研的7個(gè)地方中,除上海以外,未有一個(gè)地方發(fā)布針對(duì)開放數(shù)據(jù)的政策,但即使在上海,其所發(fā)布的《關(guān)于推進(jìn)政府信息資源向社會(huì)開放利用工作的實(shí)施意見》也未明確開放數(shù)據(jù)的含義與原則,建立起地方范圍內(nèi)對(duì)開放數(shù)據(jù)的統(tǒng)一認(rèn)知。在實(shí)際操作過程中,各部門可能基于對(duì)開放數(shù)據(jù)的不同理解而造成數(shù)據(jù)開放性差、數(shù)據(jù)多靜態(tài)、數(shù)據(jù)更新率低的問題。
開放數(shù)據(jù)的發(fā)展離不開生態(tài)的發(fā)展,離不開每一個(gè)利益相關(guān)者——政府、企業(yè)、媒體、NGO(non-governmentalorganization,非政府組織)乃至普通市民的參與和貢獻(xiàn)。目前,中國開放數(shù)據(jù)生態(tài)的發(fā)展還未系統(tǒng)性地開展。
圖2 各地方數(shù)據(jù)更新情況
(1)開放數(shù)據(jù)概念尚未在社會(huì)普及
2015年初,筆者針對(duì)當(dāng)前中國社會(huì)各界了解開放數(shù)據(jù)的程度進(jìn)行了一次小規(guī)模的問卷調(diào)研。參與問卷的人群主要來自北京、武漢、上海3地,工作在政府、高校、規(guī)劃院、NGO等。在收到的近200份答復(fù)中,80%的人認(rèn)為信息公開(數(shù)據(jù)公開)等同于數(shù)據(jù)開放。從這一點(diǎn)來說,對(duì)于社會(huì)大眾而言,現(xiàn)階段的主要焦點(diǎn)還是在于是否能夠訪問到政府的數(shù)據(jù),而不是關(guān)心這樣的數(shù)據(jù)是否能夠易用(可機(jī)讀)、是否可以自由使用(開放授權(quán)性)。一方面是因?yàn)殚L久以來政府?dāng)?shù)據(jù)對(duì)于社會(huì)大眾而言過于封閉,所以大眾在現(xiàn)階段最關(guān)心的是政府?dāng)?shù)據(jù)能否不那么封閉;另一方面,也說明開放數(shù)據(jù)作為一個(gè)新興概念尚未在社會(huì)普及。
對(duì)于現(xiàn)有的開放數(shù)據(jù)門戶,社會(huì)大眾是否了解他們的存在?問卷調(diào)研的結(jié)果顯示,50%的人群從未聽說過任何一個(gè)開放數(shù)據(jù)門戶,但其中最早的開放數(shù)據(jù)門戶(上海)早在2012年就已上線。這也暴露出目前政府在運(yùn)作開放數(shù)據(jù)項(xiàng)目時(shí),對(duì)社會(huì)大眾的推廣宣傳的力度不足,不但開放數(shù)據(jù)這一概念尚未能夠很好地得到普及,連作為項(xiàng)目核心用于提供數(shù)據(jù)資源的開放數(shù)據(jù)門戶也未能得到足夠的推廣宣傳,吸引社會(huì)大眾的使用。
針對(duì)這一問題,政府部門應(yīng)當(dāng)通過媒體積極向大眾普及開放數(shù)據(jù)的理念,宣傳相應(yīng)政府所做的努力。借助PPP(publicprivate-partnership,公私合作)模式,透過高校、企業(yè)、NGO等向特定人群(如記者、創(chuàng)業(yè)者等)普及開放數(shù)據(jù)及其行業(yè)應(yīng)用價(jià)值,并介紹國內(nèi)外開放數(shù)據(jù)資源,鼓勵(lì)特定人群對(duì)數(shù)據(jù)進(jìn)行利用,并在可能的情況下,激勵(lì)特定人群開放或共享數(shù)據(jù),與政府?dāng)?shù)據(jù)整合。
(2)缺乏有效的參與路徑和政府共同推進(jìn)開放數(shù)據(jù)的進(jìn)程
雖然各地方的開放數(shù)據(jù)門戶均允許大眾提交數(shù)據(jù)的需求,從而基于需求推動(dòng)數(shù)據(jù)釋放,但是各地方提供的數(shù)據(jù)請求功能均是基于單向通信的,即大眾僅能通過一個(gè)簡單問卷將需求提交給政府,而大眾之間卻無法基于共同的數(shù)據(jù)請求進(jìn)行進(jìn)一步的研討,也無法了解政府的回復(fù),這并不利于各方了解數(shù)據(jù)請求的進(jìn)展,也不利于大眾頭腦風(fēng)暴出可能的數(shù)據(jù)應(yīng)用。
另一方面,北京、上海兩地雖然在2014年均舉辦了開放數(shù)據(jù)的創(chuàng)意大賽,面向社會(huì)征集應(yīng)用政府開放數(shù)據(jù)的創(chuàng)意,但兩地的大賽均未能成功釋放參賽者所需要的數(shù)據(jù),從而幫助參賽者進(jìn)一步落地想法。值得喝彩的一點(diǎn)是,上海市政府在2015年8月將啟動(dòng)全新的上海開放數(shù)據(jù)應(yīng)用創(chuàng)新大賽(以下簡稱SODA,微信公眾號(hào)為SODAChallenge),這次大賽將聚焦交通出行,開放一批政府?dāng)?shù)據(jù),并共享一批來自政府和事業(yè)單位的數(shù)據(jù)(今后可能考慮全面開放這部分?jǐn)?shù)據(jù)),從而激勵(lì)社會(huì)大眾基于這些數(shù)據(jù)發(fā)現(xiàn)交通系統(tǒng)的問題,并提出新的改良建議,或者基于數(shù)據(jù)直接去創(chuàng)建全新的交通應(yīng)用或服務(wù),并將其轉(zhuǎn)化為可持續(xù)的商業(yè)產(chǎn)品,落地孵化。
針對(duì)大眾參與的問題,政府應(yīng)當(dāng)認(rèn)識(shí)到開放數(shù)據(jù)并非與傳統(tǒng)電子政務(wù)問題相同,僅靠自身投入即可實(shí)現(xiàn)預(yù)期的目標(biāo)。建立有效、公開的數(shù)據(jù)請求機(jī)制,激勵(lì)并推動(dòng)大眾基于數(shù)據(jù)需求探討及頭腦風(fēng)暴,將會(huì)加速政府自身推進(jìn)數(shù)據(jù)釋放的進(jìn)程。同時(shí),設(shè)定開放數(shù)據(jù)的預(yù)期價(jià)值目標(biāo),圍繞目標(biāo)開展應(yīng)用創(chuàng)意大賽等活動(dòng),既能更好向社會(huì)普及宣傳開放數(shù)據(jù),又能有針對(duì)性地開放特定數(shù)據(jù),激勵(lì)社會(huì)利用特定數(shù)據(jù)解決特定問題,從而提高政府內(nèi)部各部門對(duì)政府?dāng)?shù)據(jù)開放的信心和參與程度,也同時(shí)刺激了社會(huì)大眾對(duì)開放數(shù)據(jù)的進(jìn)一步需求。
在歐美國家,開放數(shù)據(jù)的生態(tài)絕非單靠政府來搭建。英國開放數(shù)據(jù)研究院就是為了催化開放數(shù)據(jù)文化,搭建開放數(shù)據(jù)生態(tài)而創(chuàng)建的,同時(shí)英國的開放知識(shí)基金會(huì)也扮演著重要的生態(tài)搭建者角色。而在美國,諸如“為美國而編程(Code for America)”、陽光基金會(huì)(Sunlight Foundation)等非營利機(jī)構(gòu)也在生態(tài)搭建中起到了積極的居中協(xié)調(diào)統(tǒng)籌的作用。在中國,可以從民間社區(qū)角度、非營利機(jī)構(gòu)角度嘗試去推進(jìn)生態(tài)的建設(shè)。
2014年2月,筆者所在的開放知識(shí)基金會(huì)中國小組聯(lián)合上海青悅(環(huán)保NGO)、城市數(shù)據(jù)派(數(shù)據(jù)+規(guī)劃的垂直社區(qū))、數(shù)據(jù)科學(xué)家聯(lián)盟(大數(shù)據(jù)垂直社區(qū))等7個(gè)社群和社群代表共同發(fā)起了開放數(shù)據(jù)中國(opendatachina.com)。
開放數(shù)據(jù)中國的使命在于催化并支持中國開放數(shù)據(jù)的生態(tài)建設(shè),它試圖在開放數(shù)據(jù)運(yùn)動(dòng)最弱小之時(shí),就開始吸引不同群體的參與和關(guān)注,通過建立起一個(gè)虛擬網(wǎng)絡(luò)來連接這些人、機(jī)構(gòu)、項(xiàng)目,從而使得網(wǎng)絡(luò)內(nèi)成員可以有一個(gè)共同平臺(tái)互相學(xué)習(xí)、支持、協(xié)作。這些“星星之火”通過開放數(shù)據(jù)中國凝聚在一起,從而能夠推動(dòng)開放數(shù)據(jù)在中國的發(fā)展。而同時(shí),網(wǎng)絡(luò)成為協(xié)作的基礎(chǔ),幫助網(wǎng)絡(luò)內(nèi)的不同機(jī)構(gòu)、個(gè)人尋找到合作伙伴,并通過開放數(shù)據(jù)中國維護(hù)的國際合作伙伴關(guān)系,為不同項(xiàng)目尋求資金、宣傳、技術(shù)指導(dǎo)等支持,讓中國的項(xiàng)目得以成長。而這一過程也幫助了國際社區(qū)進(jìn)一步了解中國的開放數(shù)據(jù)進(jìn)程。
開放數(shù)據(jù)中國還負(fù)責(zé)搭建共創(chuàng)平臺(tái),使數(shù)據(jù)發(fā)布者(政府等)、數(shù)據(jù)利用者(創(chuàng)變客等)、最終得益者(民眾、創(chuàng)變客的服務(wù)對(duì)象)能夠有一個(gè)共同的平臺(tái)進(jìn)行對(duì)話,了解各方的需求,從而優(yōu)化協(xié)作。比如在2014年10月,開放數(shù)據(jù)中國便協(xié)同世界銀行和復(fù)旦大學(xué)數(shù)字與移動(dòng)治理實(shí)驗(yàn)室共同舉辦了第一屆“開放數(shù)據(jù)在中國”研討會(huì)[5],邀請了7個(gè)國內(nèi)開放數(shù)據(jù)計(jì)劃的政府代表、6位行業(yè)需求端代表、5位國際專家共同探討開放數(shù)據(jù)生態(tài)建設(shè)。而針對(duì)前文提到的大眾對(duì)開放數(shù)據(jù)的不了解、政府操作中的一些問題,開放數(shù)據(jù)中國也為數(shù)據(jù)發(fā)布者和數(shù)據(jù)利用者提供咨詢、研究和培訓(xùn)服務(wù),幫助他們提升自身在這一領(lǐng)域的知識(shí)和技能,改善工作的流程,挖掘新的機(jī)遇。
本文對(duì)開放數(shù)據(jù)的基本概念、歷史發(fā)展路徑與現(xiàn)狀、商業(yè)發(fā)展?jié)摿?、中國發(fā)展現(xiàn)狀和挑戰(zhàn)進(jìn)行了較為全面的回顧與盤點(diǎn)。開放數(shù)據(jù)運(yùn)動(dòng)發(fā)展至今還遠(yuǎn)未至終點(diǎn)。即使歐美國家先于中國完成了大量類似建立開放數(shù)據(jù)門戶建設(shè)、政策和組織架構(gòu)設(shè)立等基礎(chǔ)工作,但仍舊有諸如如何推進(jìn)開放數(shù)據(jù)商業(yè)使用、如何制定全球通用的數(shù)據(jù)標(biāo)準(zhǔn)、如何衡量開放數(shù)據(jù)影響力等問題亟待解決。目前,中國雖然暫時(shí)落后于人,但值此中央大力推進(jìn)“互聯(lián)網(wǎng)+”、“萬眾創(chuàng)新、大眾創(chuàng)業(yè)”的時(shí)刻,開放數(shù)據(jù)在中國的發(fā)展勢必將得到充分的支持,追趕并非是癡人說夢。
而最為關(guān)鍵的,可能正如開放數(shù)據(jù)創(chuàng)業(yè)中心(Center for Open Data Enterprise)創(chuàng)始人 Joel Gurin所說:“請即刻開放數(shù)據(jù)吧(open data now)?!?/p>
[1] McKinsey Global Institute. Open data: unlocking innovation and performance with liquid information. http://www. mckinsey.com/insights/business_ technology/open_data_unlocking_ innovation _and_performance_with_ liquid_information, 2013
[2] Lateral Economics. Open for Business: How Open Data Can Help Achieve the G20 Growth Target, 2015
[3] The World Bank. Open data for economic growth. http://www.worldbank.org/content/ dam/Worldbank/document/Open-Data-for-Economic-Growth.pdf, 2014
[4] 鄭磊, 高豐. 中國開放政府?dāng)?shù)據(jù)平臺(tái)研究:框架、現(xiàn)狀與建議. 電子政務(wù), 2015(7): 8~16 Zheng L, Gao F. Research on open government data platform in China: framework, current status and suggestion. E-Government, 2015(7) : 8~16
[5] Joel Gurin. The people’s republic of open data. http://www.opendatanow. com/2014/12/ peoples-republic-opendata, 2014
Gao F. Open data: concepts, status and opportunities. Big Data Research, 2015014
Open Data: Concepts, Status and Opportunities
Gao Feng
Open Data China, Shanghai 200438, China
Making data flow like liquid is at the heart of this so-called “Data Revolution” age. Open data movement, influenced by open source movement, advocates that government data but also private-sector data, third-sector data, and even particular type of personal data should be opened up for public interest. Therefore, what is open data, how the movement advanced thus far, the global status of the movement, potential for business, and status and challenges of the movement in China were reviewed and summarized.
open data, government data, potential for business, model for business
10.11959/j.issn.2096-0271.2015014
2015-06-25
高豐. 開放數(shù)據(jù):概念、現(xiàn)狀與機(jī)遇. 大數(shù)據(jù), 2015014
高豐,英國南安普敦大學(xué)計(jì)算機(jī)博士,現(xiàn)為開放數(shù)據(jù)與創(chuàng)新獨(dú)立咨詢顧問,兼復(fù)旦大學(xué)數(shù)字與移動(dòng)治理實(shí)驗(yàn)室特邀研究員。自2013年起,擔(dān)任英國開放知識(shí)(原英國開放知識(shí)基金會(huì))大使,在中國大陸地區(qū)倡導(dǎo)、推廣、支持開放數(shù)據(jù)運(yùn)動(dòng)。2014年2月,聯(lián)合發(fā)起開放數(shù)據(jù)中國,致力于打造中國開放數(shù)據(jù)生態(tài)圈。先后作為受邀專家參與開放數(shù)據(jù)指數(shù)(open data index)、開放數(shù)據(jù)晴雨表(open data barometer)、英國城市級(jí)別開放數(shù)據(jù)普查等研究和咨詢項(xiàng)目。已與英國開放知識(shí)、開放數(shù)據(jù)合作伙伴計(jì)劃、世界銀行、瑞士Lift創(chuàng)新會(huì)議等在開放數(shù)據(jù)事務(wù)上開展過合作。