1? ?構建政府數(shù)據開放共享標準體系的必要性
2020年4月9日,中共中央、國務院印發(fā)《關于構建更加完善的要素市場化配置體制機制的意見》(以下簡稱為《意見》),將“推進政府數(shù)據開放共享”列為加快培育數(shù)據要素市場的三大要點之首。
政府數(shù)據作為國家基礎性戰(zhàn)略資源,在數(shù)據要素市場化配置中起經濟治理的作用,對《意見》提及的“提高要素配置效率”“促進...數(shù)據資源有效流動”至關重要。而這一作用的發(fā)揮依賴于政府數(shù)據開放共享,并且需要在政府數(shù)據社會化利用的過程中實現(xiàn)增值,拓展至“豐富數(shù)據產品”“引導培育大數(shù)據交易市場”“培育數(shù)字經濟新產業(yè)”等價值空間。正如美國政府數(shù)據開放平臺(data.gov)上的聲明所言,“政府數(shù)據開放共享賦能應用程序的開發(fā)”[1];國家發(fā)改委提出“加快全國一體化大數(shù)據中心建設”,也只有實現(xiàn)數(shù)據的流通與共享,才能激發(fā)這種新型基礎設施的經濟動能[2]。然而政府數(shù)據從創(chuàng)建伊始、采集、組織直至開放共享等全生命周期過程,均離不開統(tǒng)一的標準規(guī)范作為數(shù)據質量和利用水平的保障。
構建政府數(shù)據開放共享標準體系是我國國家戰(zhàn)略的需要?!洞龠M大數(shù)據發(fā)展行動綱要》(以下簡稱為《綱要》)指出“提升政府數(shù)據開放共享標準化程度”“制定實施政府數(shù)據開放共享標準”“建立標準規(guī)范體系”;《2018年政務公開工作要點的通知》強調“依托政府網站集中統(tǒng)一開放政府數(shù)據,探索制定相關標準規(guī)范”?!兑庖姟诽岢觥敖⒔y(tǒng)一規(guī)范的數(shù)據管理制度”“制定數(shù)據隱私保護制度和安全審查制度”“推動完善...數(shù)據分類分級安全保護制度”,可見標準體系的建設,對營造安全有序的數(shù)據要素市場環(huán)境十分必要。
構建政府數(shù)據開放共享標準體系是破解當前現(xiàn)實難題的途徑。我國缺乏統(tǒng)籌兼用的政府數(shù)據開放共享標準體系,僅有廣東、山東、上海出臺了關于數(shù)據開放的地方標準和指南共6項,國家標準僅有全國信標委大數(shù)據標準工作組研制的3項,并且還尚待發(fā)布。然而這種現(xiàn)狀之下,政府數(shù)據開放共享的標準化建設依然遠未引起重視,只有上海、北京、福州等9個城市在其發(fā)布的數(shù)據開放政策文件中略有提及,如上海市政府發(fā)布的《上海市公共數(shù)據開放暫行辦法》第三十二條“標準體系和技術規(guī)范”提到,鼓勵不同主體參與制定數(shù)據開放標準。正是由于我國政府數(shù)據開放共享標準規(guī)范的缺失,造成當前102個地方政府數(shù)據開放平臺[3]系統(tǒng)各異、“煙囪”林立,各平臺共開放的71092個數(shù)據集異構分散、難以整合,甚至給我國部分政府部門帶來了開放共享后數(shù)據價值的流失、數(shù)據流通存在安全隱患等隱憂[2],這既不利于用戶的利用,也很難使政府數(shù)據成為市場有效流動、交換共享的要素。
因此,亟待構建我國政府數(shù)據開放共享標準體系,促進政府數(shù)據的綜合利用。
2? ?我國政府數(shù)據開放共享標準體系的構建
為了使我國政府數(shù)據開放共享工作有據可依、規(guī)范實施,筆者以數(shù)據生命周期理論為指導,主要參考了多個開放數(shù)據全生命周期模型,如“開放政府數(shù)據生命周期”[4]“關聯(lián)開放政府數(shù)據與元數(shù)據生命周期”[5],由此構建了貫穿我國政府數(shù)據開放共享全流程的政府數(shù)據開放共享標準體系框架(見圖1)。
依據規(guī)范化流程的界定,該體系劃分成6個標準子體系,按照各階段不同環(huán)節(jié)涉及的領域、范圍、功能和活動,細化形成23項標準,并對其覆蓋范圍、關鍵內容進行總結,選擇重點領域標準進行研制。
2.1? ? 數(shù)據創(chuàng)建與匯交標準
數(shù)據開放原則規(guī)定我國政府數(shù)據開放共享的最低限度、行動準則和目標指向,具體內容源于國家政策。數(shù)據格式標準指明不同領域數(shù)據、混合數(shù)據應采用的格式類型。數(shù)據采集標準從采集原則和方式入手,是獲取高質量數(shù)據的保證。數(shù)據提交標準涉及技術規(guī)范,包括提交流程、可用接口及元數(shù)據要求;也涉及操作規(guī)范,包括提交者的認證方式和數(shù)據上傳頻率。
2.2? ? 數(shù)據選擇與處理標準
數(shù)據審選標準在內容上涵蓋與數(shù)據集相關的法律、安全、技術及元數(shù)據的信息,流程上建議遵循“數(shù)據集映射、優(yōu)先級排序、實施選擇、主題分類、數(shù)據目錄發(fā)布”[6]的次序。數(shù)據安全風險評估標準是針對數(shù)據中個人隱私、商業(yè)機密、國家安全等敏感信息進行安全影響評估的指標和流程。數(shù)據脫敏標準包括處理敏感信息的原則、流程、方法和工具。
2.3? ? 數(shù)據描述與組織標準
元數(shù)據標準用于揭示政府數(shù)據的外部特征和內容特征,筆者此前已撰文設計我國開放政府數(shù)據元數(shù)據元素集方案[7],并在該版本基礎上增設了“共享(Sharing)”元素。數(shù)據分級標準的重點是確定分級方法,并限定各等級的數(shù)據的開放共享程度。數(shù)據目錄分類標準是從資源屬性、基礎信息、主題信息、屬地類別、業(yè)務屬性和授權類別等多個角度建立的類目體系。
2.4? ? 數(shù)據關聯(lián)與發(fā)布標準
數(shù)據開放優(yōu)先級標準要指明重點開放《綱要》明確提到的20個領域,優(yōu)先開放利于促進公共服務效益、提高政府透明度的數(shù)據集。數(shù)據關聯(lián)標準要遵循W3C政府關聯(lián)數(shù)據工作組建議的關聯(lián)數(shù)據發(fā)布實踐、以及《開放數(shù)據五星部署方案》中的相關要求,對關聯(lián)流程、技術原則和衡量關聯(lián)程度的指標進行統(tǒng)一規(guī)范。數(shù)據發(fā)布標準規(guī)定的是有待開放的數(shù)據上傳至數(shù)據開放平臺的流程和方式。
2.5? ? 數(shù)據發(fā)現(xiàn)與利用標準
開放許可協(xié)議采用兼容性強、應用廣泛的《知識共享許可協(xié)議》。數(shù)據開放平臺標準提出建立國家和地方層面政府數(shù)據開放門戶的底層技術架構、統(tǒng)一數(shù)據檢索協(xié)議,同時明確運營管理規(guī)則,以確保各平臺的功能一致性、運行穩(wěn)定性。數(shù)據互操作標準側重于規(guī)范數(shù)據互操作框架和互操作級別,前者用于統(tǒng)一互操作的原則和條件,后者考慮法律、機構、語義和技術等方面的互操作問題。數(shù)據利用反饋標準涉及用戶的反饋渠道、方式及主管部門分析反饋結果的方法。
2.6? ? 數(shù)據管理與評估標準
數(shù)據保存標準通過規(guī)定數(shù)據存儲的介質、方式、保存格式和編碼方式實現(xiàn)政府數(shù)據長期保存。數(shù)據更新標準參照地方標準的更新規(guī)則和模式進行建立。數(shù)據管理標準說明數(shù)據管理的主體及其職責、流程與制度,以及針對人口、法人等政府主數(shù)據的統(tǒng)籌管理。數(shù)據維護標準遵循“定期維護數(shù)據和元數(shù)據、檢查URI、根據用戶反饋進行改進”[6]的流程。數(shù)據質量評價標準用于評價數(shù)據內容質量,涉及具體的指標和流程。政府數(shù)據開放共享評估標準包括規(guī)范的評價策略、指標和方法。
3? ?我國政府數(shù)據開放共享標準體系構建的考慮
3.1? ? 廣泛吸納國內外實踐成果
該體系在設計之初,除借鑒國外的數(shù)據生命周期模型,關注國際動態(tài)以外,還通過參考我國大數(shù)據標準體系的構建思路,注重與大數(shù)據標準化工作的協(xié)調,其所劃分的標準類型均能在該體系中體現(xiàn),如具有基礎特性的數(shù)據開放原則、數(shù)據方面的元數(shù)據標準、技術方面的數(shù)據互操作標準、平臺方面的數(shù)據開放平臺標準、管理方面的數(shù)據維護標準、安全和隱私方面的數(shù)據安全風險評估標準等。
在確定標準的關鍵內容時,還重視采納國內外標準、較為成熟的協(xié)議和指南的核心內容,如數(shù)據格式標準選用愛爾蘭《開放數(shù)據技術框架》的“開放數(shù)據推薦格式”;數(shù)據安全風險評估標準的制定根據國際標準《信息技術安全技術 隱私影響評估指南》(ISO/IEC 29134:2017)的要求;數(shù)據脫敏標準規(guī)定的原則、流程和方法采用了山東省地方標準《公共數(shù)據開放第2部分:數(shù)據脫敏指南》(DB37/T 3523.2-2019)。
3.2? ? 立足當前需求與未來發(fā)展
該體系圍繞我國建立國家政府數(shù)據統(tǒng)一開放平臺、識別重點和優(yōu)先開放領域、分級分類開放共享等需求,分別制定了數(shù)據開放平臺標準、數(shù)據發(fā)布標準、數(shù)據分級標準,旨在貼合國家政府數(shù)據開放共享建設的實際要求。同時,該體系還考慮到政府數(shù)據開放共享的熱點和前沿問題,以期適應未來發(fā)展的需要,如數(shù)據關聯(lián)標準著眼于解決關聯(lián)開放政府數(shù)據的發(fā)布問題;數(shù)據管理標準可為開放共享環(huán)境下政府主數(shù)據管理的實踐提供具體的參考。
3.3? ? 面向多個主體的規(guī)范應用
該體系所涵蓋的多數(shù)標準有助于為數(shù)據提供方有序開展政府數(shù)據的創(chuàng)建、采集、加工、發(fā)布等活動提供參考。數(shù)據平臺標準能對數(shù)據平臺方解決搭建、管理和運營政府數(shù)據開放平臺的問題提供具有可操作性的策略。數(shù)據利用反饋標準用于幫助數(shù)據利用方以規(guī)范的行為獲取數(shù)據、提交反饋信息和對數(shù)據進行再利用。政府數(shù)據開放共享評估標準有利于引導評估機構開展評測工作。
該體系力求架構完整,界限分明,以及各項標準之間的有序銜接。希望政府部門、標準化機構、高校、企業(yè)給予關注,推動該體系在我國試點地區(qū)進行驗證、實施和應用,加速政府數(shù)據開放共享整體進程,從而擴大要素市場化配置范圍,健全要素市場體系,激發(fā)全社會創(chuàng)造力和市場活力。
當然,該體系需要在實際應用過程中及時調整和持續(xù)完善。正如國家標準《標準體系構建原則和要求》(GB/T 13016-2018)的規(guī)定,“標準體系是一個動態(tài)的系統(tǒng),在使用過程中應不斷優(yōu)化完善,并隨著業(yè)務需求、技術發(fā)展的不斷變化進行維護更新”。
參考文獻:
[1]? Data.gov.Applications[EB/OL].[2020-04-24].https://www.data.gov/applications.
[2]? 吳月輝.建好用好大數(shù)據中心[N].人民日報,2020-04-27(19).
[3]? 復旦大學數(shù)字與移動治理實驗室,復旦大學國家信息中心數(shù)字中國研究院.中國地方政府數(shù)據開放報告(2019下半年)[R/OL].[2020-04-24].http://ifopendata.fudan.edu.cn/report.
[4]? Attard J,Orlandi F,Scerri S,et al.A systematic review of open government data initiatives[J].Government Information Quarterly,2015,32(4):399-418.
[5]? Open Data Support.The linked open government data and metadata lifecycle[EB/OL].[2020-04-24].https://www.europeandataportal.eu/sites/default/files/d2.1.2_training_module_2.1_the_linked_open_government_data_lifecycle_en_edp.pdf.
[6]? EDP.Open data goldbook for data managers and data holders[EB/OL].[2020-04-24].https://www.europeandataportal.eu/sites/default/files/goldbook.pdf.
[7]? 黃如花,林焱.國外開放政府數(shù)據描述規(guī)范的調查與分析[J].圖書情報工作,2017,61(20):37-52.
作者簡介:黃如花,女,武漢大學信息管理學院教授,博士生導師,研究方向:政府數(shù)據開放、信息素養(yǎng)教育、信息組織與檢索。