亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        英國政府?dāng)?shù)據(jù)共享與開放的元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)及啟示*

        2021-04-29 04:44:46裴心童李劍鋒
        情報(bào)雜志 2021年4期
        關(guān)鍵詞:詞匯表英國標(biāo)準(zhǔn)

        翟 軍 翟 瑋 裴心童 李劍鋒

        (大連海事大學(xué)航運(yùn)經(jīng)濟(jì)與管理學(xué)院 大連 116026)

        0 引 言

        英國擁有歐洲最大的數(shù)據(jù)市場(chǎng)(Data Market),一直處于世界范圍數(shù)據(jù)創(chuàng)新(Data Innovation)的前沿[1]。據(jù)分析,2015-2020年大數(shù)據(jù)產(chǎn)業(yè)為英國帶來約2 410億英鎊的收益,占GDP的2%左右,“數(shù)據(jù)經(jīng)濟(jì)”(Data Economy)已逐漸成為英國經(jīng)濟(jì)增長(zhǎng)的重要引擎和數(shù)字經(jīng)濟(jì)的主要組成部分[2]。

        在發(fā)展數(shù)字經(jīng)濟(jì)的過程中,英國非常重視政府?dāng)?shù)據(jù)的作用,積極推動(dòng)政府?dāng)?shù)據(jù)的共享、開放與應(yīng)用[3]。2017年3月,英國政府出臺(tái)《數(shù)字化戰(zhàn)略》(Digital Strategy),七大戰(zhàn)略任務(wù)之一是發(fā)展數(shù)據(jù)經(jīng)濟(jì)、釋放數(shù)據(jù)的價(jià)值[4-5],包括更好地管理、共享和開放政府?dāng)?shù)據(jù),促進(jìn)創(chuàng)造新的數(shù)據(jù)產(chǎn)品和服務(wù)。英國的《政府轉(zhuǎn)型戰(zhàn)略(2017-2020)》更是明確,通過開放政府?dāng)?shù)據(jù)、設(shè)立首席數(shù)據(jù)官和建立數(shù)據(jù)安全體系等措施保障政府?dāng)?shù)據(jù)的深度開發(fā)和利用[6-7]。

        2020年4月,英國政府成立“數(shù)據(jù)標(biāo)準(zhǔn)局”(Data Standards Authority, DSA),隸屬于政府?dāng)?shù)字服務(wù)局(Government Digital Service,GDS),致力于數(shù)據(jù)標(biāo)準(zhǔn)的建設(shè),以提升跨部門的數(shù)據(jù)共享和利用水平及保障數(shù)據(jù)質(zhì)量[8]。2020年8月,DSA公布第一批成果——共享和開放數(shù)據(jù)的元數(shù)據(jù)系列標(biāo)準(zhǔn)及實(shí)施指南,具有開放性和系統(tǒng)性的鮮明特征,代表著國際上元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)的發(fā)展方向[9]。本文通過對(duì)該系列標(biāo)準(zhǔn)的系統(tǒng)介紹和分析,提煉出有益的做法和經(jīng)驗(yàn),為我國各級(jí)政府?dāng)?shù)據(jù)資源的元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)提供借鑒和參考。

        1 英國元數(shù)據(jù)標(biāo)準(zhǔn)的建設(shè)情況

        數(shù)據(jù)和元數(shù)據(jù)的“標(biāo)準(zhǔn)化”(Standardization)是各國推動(dòng)政府?dāng)?shù)據(jù)開放共享的普遍做法和最佳實(shí)踐[9-10]。在元數(shù)據(jù)的標(biāo)準(zhǔn)和規(guī)范上,代表性的成果有美國的DCAT-US(即POD v1.1)、歐盟的DCAT-AP、德國的DCAT-AP.DE、澳大利亞的Data.Gov.AU元數(shù)據(jù)和英國的CKAN元數(shù)據(jù)等[11-14]及面向地理領(lǐng)域的英國GEMINI元數(shù)據(jù)標(biāo)準(zhǔn)等[14-15]。

        英國連續(xù)五年(2013-2017年)居于萬維網(wǎng)基金會(huì)的“開放數(shù)據(jù)晴雨表”(Open Data Barometer,ODB)全球評(píng)估的榜首,元數(shù)據(jù)標(biāo)準(zhǔn)的廣泛應(yīng)用對(duì)提升開放數(shù)據(jù)水平發(fā)揮了關(guān)鍵作用[16]。歐盟數(shù)據(jù)門戶網(wǎng)站(European Data Portal)對(duì)各國數(shù)據(jù)目錄元數(shù)據(jù)質(zhì)量的監(jiān)測(cè)顯示,英國國家數(shù)據(jù)目錄在元數(shù)據(jù)互操作和促進(jìn)數(shù)據(jù)再利用等質(zhì)量維度上的表現(xiàn)較為突出[17]。這次,英國又率先在政府?dāng)?shù)據(jù)共享和開放領(lǐng)域邁出了全面采納“開放標(biāo)準(zhǔn)”(Open Standards)的步伐。

        1.1采納開放標(biāo)準(zhǔn)2017年底,在“創(chuàng)新英國”(Innovate UK,即英國政府技術(shù)戰(zhàn)略委員會(huì))的資助下,英國開放數(shù)據(jù)研究所(Open Data Institute,ODI)聯(lián)合W3C(World Wide Web Consortium,萬維網(wǎng)聯(lián)盟)啟動(dòng)“數(shù)據(jù)的開放標(biāo)準(zhǔn)”(Open Standards for Data,OSD)項(xiàng)目(周期2017-2020年),旨在為政府和機(jī)構(gòu)開發(fā)、采納和實(shí)施開放標(biāo)準(zhǔn)提供指南和幫助[18]。

        ODI將“數(shù)據(jù)標(biāo)準(zhǔn)”定義為“關(guān)于數(shù)據(jù)的表示、格式、結(jié)構(gòu)、傳輸、操作、使用和管理等的文檔化協(xié)議”,而“開放的數(shù)據(jù)標(biāo)準(zhǔn)”則是以開放、協(xié)作和廣泛共識(shí)的方式開發(fā)、批準(zhǔn)和維護(hù),任何人都可以免費(fèi)或低成本訪問、使用或共享的標(biāo)準(zhǔn),能夠幫助機(jī)構(gòu)發(fā)布、訪問、共享和使用質(zhì)量更好的數(shù)據(jù),更能為企業(yè)參與政府服務(wù)創(chuàng)造公平、高效的競(jìng)爭(zhēng)環(huán)境。ODI認(rèn)為,數(shù)據(jù)的開放標(biāo)準(zhǔn)能夠有效提高數(shù)據(jù)的互操作性、可比性、聚合性和連接性,與開放數(shù)據(jù)運(yùn)動(dòng)一起推動(dòng)數(shù)據(jù)從封閉、共享和開放發(fā)展到廣泛應(yīng)用[19]。ODI建議,數(shù)據(jù)治理和管理實(shí)踐中應(yīng)盡可能使用已有的開放標(biāo)準(zhǔn),而不是開發(fā)新的標(biāo)準(zhǔn)。目前,OSD項(xiàng)目的主要成果包括開放標(biāo)準(zhǔn)的開發(fā)方法、選擇指南和標(biāo)準(zhǔn)目錄等。

        在OSD項(xiàng)目成果的基礎(chǔ)上,英國內(nèi)閣辦公室領(lǐng)導(dǎo)的“開放標(biāo)準(zhǔn)委員會(huì)”(Open Standards Board)制定了“開放標(biāo)準(zhǔn)的選擇原則和流程”[20],在開放數(shù)據(jù)領(lǐng)域已采納和使用了“開放合同數(shù)據(jù)標(biāo)準(zhǔn)”和“國際援助透明度倡議數(shù)據(jù)標(biāo)準(zhǔn)”。

        在開放標(biāo)準(zhǔn)委員會(huì)的指導(dǎo)下,數(shù)據(jù)標(biāo)準(zhǔn)局(DSA)確立三項(xiàng)開放標(biāo)準(zhǔn)作為英國政府?dāng)?shù)據(jù)共享和開放的元數(shù)據(jù)標(biāo)準(zhǔn)(見表1)[21],分別是都柏林核心元數(shù)據(jù)(Dublin Core Schema,簡(jiǎn)稱DC)、Schema.org 數(shù)據(jù)集詞匯表和W3C CSVW(CSV on the Web)標(biāo)準(zhǔn)。它們主要應(yīng)用于通用的表格數(shù)據(jù)(Tabular Data),而在管理地理數(shù)據(jù)(包括GeoJSON、KML等格式)時(shí),仍然使用原有的GEMINI標(biāo)準(zhǔn)。

        表1 英國政府?dāng)?shù)據(jù)共享和開放的元數(shù)據(jù)標(biāo)準(zhǔn)

        1.2政府?dāng)?shù)據(jù)共享的元數(shù)據(jù)標(biāo)準(zhǔn)為實(shí)現(xiàn)高質(zhì)量的政府?dāng)?shù)字服務(wù),需要政府機(jī)構(gòu)間的數(shù)據(jù)共享。DSA選擇都柏林核心元數(shù)據(jù)(DC)描述政府?dāng)?shù)據(jù)的主要原因是:①英國政府網(wǎng)站GOV.UK是數(shù)據(jù)共享的主要平臺(tái),而DC利于Web環(huán)境中數(shù)據(jù)的編目、校驗(yàn)和復(fù)用;②DC是其他復(fù)雜元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ),包括支持開放數(shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)DCAT(Data Catalog Vocabulary)和Schema.org 數(shù)據(jù)集詞匯表,有利于從數(shù)據(jù)共享到數(shù)據(jù)開放的平滑轉(zhuǎn)換;③DC元數(shù)據(jù)模式定義和元數(shù)據(jù)記錄都支持機(jī)器可讀的格式,如XML Schemas、RDF Schemas、RDF/XML、JSON和RDFa等,符合W3C的最佳實(shí)踐[10]。

        在描述共享的政府?dāng)?shù)據(jù)時(shí),DSA要求提供:①發(fā)現(xiàn)元數(shù)據(jù),使用的元素有title(名稱)、description(簡(jiǎn)介)和identifier(標(biāo)識(shí)符);②校驗(yàn)元數(shù)據(jù),使用的元素有expires(失效日期)、supersededBy(替換者,即dct:isReplacedBy)、temporalCoverage(時(shí)間覆蓋范圍,即dct:temporal)和conformsTo(遵循的標(biāo)準(zhǔn));③溯源元數(shù)據(jù),使用的元素有creator(創(chuàng)建者)、contributor(貢獻(xiàn)者)和dateCreated(創(chuàng)建日期);④使用元數(shù)據(jù),使用的元素有encodingFormat(編碼格式)和license(許可)等。

        1.3政府?dāng)?shù)據(jù)開放的元數(shù)據(jù)標(biāo)準(zhǔn)為提高數(shù)據(jù)的Web可發(fā)現(xiàn)性,DSA選擇Schema.org 數(shù)據(jù)集詞匯表描述開放的數(shù)據(jù)集。

        2011年6月,主要的搜索引擎公司Google、Bing、Yahoo!與Yandex聯(lián)合發(fā)起Schema.org行動(dòng)計(jì)劃,共同開發(fā)和使用單一的“詞匯表”(Vocabulary,即本體),為Web的結(jié)構(gòu)化數(shù)據(jù)標(biāo)記提供統(tǒng)一的模式定義[22]。從2012年至今,Schema.org詞匯表的版本從V0.91升級(jí)到V9.0,從最初的297個(gè)類、187個(gè)屬性,發(fā)展到626個(gè)類、901個(gè)屬性。從2013年4月的V1.0a開始,Schema.org聯(lián)合W3C進(jìn)行Web Schemas/Datasets部分的擴(kuò)展,到2019年4月的V3.5版本形成了穩(wěn)定的數(shù)據(jù)集詞匯表,包括DataCatalog(數(shù)據(jù)目錄)、Dataset(數(shù)據(jù)集)、DataDownload(可下載的數(shù)據(jù)/文件)和WebAPI(數(shù)據(jù)接口/服務(wù))四個(gè)核心類,見表2。

        表2 Schema.org數(shù)據(jù)集詞匯表的核心類

        英國政府?dāng)?shù)字服務(wù)局(GDS)歷來重視使用Schema.org 詞匯表標(biāo)注政府網(wǎng)站的內(nèi)容,以提高搜索引擎的搜索效果[23]。例如,GOV.UK已使用Schema.org的SpecialAnnouncement詞匯表描述新冠疫情信息,使得在谷歌(Google)搜索中突出顯示Covid-19的相關(guān)內(nèi)容。對(duì)于數(shù)據(jù)集的描述,GDS和DSA建議的元數(shù)據(jù)元素(即詞匯表中類的屬性)見表3,這也是谷歌“數(shù)據(jù)集搜索”(Dataset Search)引擎工具所要求的[24]。

        表3 Schema.org數(shù)據(jù)集詞匯表的主要屬性

        1.4 Tabular數(shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)英國開放標(biāo)準(zhǔn)委員會(huì)將CSV(Comma-Separated Values,逗號(hào)分隔值)文件格式確立為政府Tabular數(shù)據(jù)(即表格數(shù)據(jù))的首選格式。進(jìn)一步,DSA將W3C CSVW標(biāo)準(zhǔn)確立為描述 Tabular數(shù)據(jù)內(nèi)容和結(jié)構(gòu)的元數(shù)據(jù)標(biāo)準(zhǔn),以幫助用戶更好地理解和使用數(shù)據(jù)。

        W3C于2013年成立CSV工作組(CSV on the Web Working Group),聯(lián)合英國開放數(shù)據(jù)研究所(ODI)于2015年12月-2016年2月發(fā)布了Web中CSV格式數(shù)據(jù)的系列標(biāo)準(zhǔn)[25],見表4。

        為使得用戶的應(yīng)用程序能夠通過讀取和分析元數(shù)據(jù),自動(dòng)實(shí)現(xiàn)CSV數(shù)據(jù)的校驗(yàn)、轉(zhuǎn)換、聚合、顯示和搜索功能,CSVW標(biāo)準(zhǔn)明確定義了CSV數(shù)據(jù)的結(jié)構(gòu)和數(shù)據(jù)類型,并建立描述這種結(jié)構(gòu)的“詞匯表”(即元數(shù)據(jù)模型),含有的詞匯諸如csvw:TableGroup、csvw:Table、csvw:Row、csvw:Column、csvw:Cell、csvw:Schema、csvw:Datatype、csvw:format等,形成W3C最佳實(shí)踐所推薦的“結(jié)構(gòu)型元數(shù)據(jù)”(Structural Metadata)[10]。在描述CSV對(duì)象(如csvw:TableGroup、csvw:Table)的一般屬性(如title、keyword等)時(shí),仍使用DC、DCAT或Schema.org元數(shù)據(jù)。

        2 元數(shù)據(jù)標(biāo)準(zhǔn)的實(shí)施指南

        伴隨著正式采納“開放標(biāo)準(zhǔn)”及配合《政府轉(zhuǎn)型戰(zhàn)略(2017-2020)》的“高效使用數(shù)據(jù)”的戰(zhàn)略目標(biāo),英國政府?dāng)?shù)字服務(wù)局(GDS)和數(shù)據(jù)標(biāo)準(zhǔn)局(DSA)發(fā)布了上述元數(shù)據(jù)標(biāo)準(zhǔn)的實(shí)施指南(見表5的前3個(gè)),同時(shí)更新了一些指南(見表5的后4個(gè))配合這些指南的使用。

        指南要求政府機(jī)構(gòu)發(fā)布數(shù)據(jù)的同時(shí)要提供完備的元數(shù)據(jù)。除了面向人的閱讀,還應(yīng)提供機(jī)器可讀的元數(shù)據(jù):元數(shù)據(jù)可以與數(shù)據(jù)在同一個(gè)文件中,也可以放到單獨(dú)的文件中,或者嵌入到數(shù)據(jù)集所在的網(wǎng)頁。當(dāng)數(shù)據(jù)與元數(shù)據(jù)不在一起時(shí),要設(shè)置從數(shù)據(jù)到元數(shù)據(jù)的鏈接。例如,政府網(wǎng)站GOV.UK和開放數(shù)據(jù)網(wǎng)站DATA.GOV.UK是數(shù)據(jù)共享和開放的主要渠道,其中每個(gè)數(shù)據(jù)集的機(jī)器可讀的元數(shù)據(jù)記錄采用了JSON-LD格式,以腳本的方式嵌入到網(wǎng)頁的HTML代碼中;數(shù)據(jù)目錄網(wǎng)站ckan.publishing.service.gov.uk/dataset則為每個(gè)數(shù)據(jù)集提供了四種格式的元數(shù)據(jù)文件,分別是XML、JSON-LD、TTL和N3。

        指南對(duì)數(shù)據(jù)集的標(biāo)識(shí)符也給出了明確的規(guī)定。在數(shù)據(jù)共享時(shí),標(biāo)識(shí)符可以是局部的,如“362857580”,而在數(shù)據(jù)開放時(shí),標(biāo)識(shí)符應(yīng)是全局的,建議采用URL(Uniform Resource Locator,統(tǒng)一資源定位器)且是HTTP協(xié)議可解析的。目前,GOV.UK和DATA.GOV.UK都為每個(gè)數(shù)據(jù)集分配了持久的、靜態(tài)的URL,可直接定位到數(shù)據(jù)集所在的網(wǎng)頁。

        指南還特別強(qiáng)調(diào),在創(chuàng)建、發(fā)布和使用元數(shù)據(jù)時(shí)應(yīng)遵守英國《數(shù)據(jù)保護(hù)法(2018)》(Data Protection Act 2018)和《數(shù)據(jù)倫理框架》(Data Ethics Framework)對(duì)數(shù)據(jù)安全、個(gè)人隱私保護(hù)和數(shù)據(jù)使用的倫理道德的規(guī)定。

        3 元數(shù)據(jù)標(biāo)準(zhǔn)的應(yīng)用

        隨著開放數(shù)據(jù)網(wǎng)站和數(shù)據(jù)集數(shù)量的快速增長(zhǎng),谷歌(Google)于2018年9月推出專業(yè)搜索引擎“數(shù)據(jù)集搜索”(測(cè)試版),致力于打造全新的國際數(shù)據(jù)生態(tài)系統(tǒng)。該搜索引擎是新一代的智能搜索引擎,只有以Schema.org數(shù)據(jù)集詞匯表標(biāo)記的網(wǎng)頁才能被采集到專門的索引庫[24]。2020年1月,其正式版發(fā)布,收錄了全世界數(shù)千個(gè)網(wǎng)站中的約2 500萬個(gè)數(shù)據(jù)集[26]。

        英國數(shù)據(jù)標(biāo)準(zhǔn)局(DSA)采納Schema.org 詞匯表的主要目的就是提高數(shù)據(jù)的Web搜索引擎可發(fā)現(xiàn)性,促進(jìn)政府?dāng)?shù)據(jù)的大范圍流動(dòng),并已取得了良好的效果。例如,當(dāng)使用谷歌數(shù)據(jù)集搜索引擎工具搜索“新冠疫情”(COVID-19)的相關(guān)數(shù)據(jù)時(shí),可以找到100多個(gè)來自英國的數(shù)據(jù)集,它們廣泛分布在各級(jí)政府網(wǎng)站、國家醫(yī)療服務(wù)體系(National Health Service,NHS)網(wǎng)站和各類開放數(shù)據(jù)網(wǎng)站中,網(wǎng)頁標(biāo)注的方式主要是JSON-LD和微數(shù)據(jù)[27],實(shí)例見表6。

        表6 英國發(fā)布的新冠疫情開放數(shù)據(jù)集實(shí)例

        圖1顯示了布里斯托市開放數(shù)據(jù)網(wǎng)站中一個(gè)數(shù)據(jù)集的元數(shù)據(jù)實(shí)例,標(biāo)注代碼的格式是JSON-LD,使用的Schema.org元數(shù)據(jù)項(xiàng)有name、description、url、keywords等(見表3)。從元數(shù)據(jù)記錄可見這個(gè)數(shù)據(jù)集含有CSV格式的數(shù)據(jù)文件,數(shù)據(jù)集所在的網(wǎng)頁也給出了CSV數(shù)據(jù)的結(jié)構(gòu)元數(shù)據(jù),定義了表格的area_name、specimen_date和geo_shape等字段及其數(shù)據(jù)類型。

        面向數(shù)據(jù)使用者和普通用戶,數(shù)據(jù)集搜索引擎工具大幅度提高了數(shù)據(jù)搜索的便捷性和準(zhǔn)確性。調(diào)查顯示,截至2019年下半年,42%的歐洲數(shù)據(jù)門戶網(wǎng)站的訪問者借助了搜索引擎的引導(dǎo)[28]。在開放數(shù)據(jù)領(lǐng)域,采納和使用Schema.org 數(shù)據(jù)集詞匯表等開放標(biāo)準(zhǔn),能夠幫助英國加速形成國際化的數(shù)據(jù)生態(tài)系統(tǒng)(Data Ecosystem,見圖2),助力實(shí)現(xiàn)《國家數(shù)據(jù)戰(zhàn)略》(National Data Strategy,NDS)確立的“數(shù)據(jù)的國際流動(dòng)”的目標(biāo)[29],在數(shù)據(jù)驅(qū)動(dòng)的抗擊新冠疫情的國際合作上更是發(fā)揮著積極作用。

        圖2 英國開放數(shù)據(jù)的生態(tài)系統(tǒng)

        4 對(duì)我國的啟示

        在國家大數(shù)據(jù)戰(zhàn)略的引領(lǐng)下,我國各級(jí)政府正在穩(wěn)步推進(jìn)數(shù)據(jù)開放工作。根據(jù)復(fù)旦大學(xué)《中國地方政府?dāng)?shù)據(jù)開放報(bào)告》,截至2020年4月底,我國已有130個(gè)省級(jí)、副省級(jí)和地級(jí)政府上線了開放數(shù)據(jù)平臺(tái)[30]。近兩年,上海、浙江、哈爾濱和青島等省市政府先后出臺(tái)《公共數(shù)據(jù)開放管理辦法》,確立了“有序開放、安全可控、統(tǒng)一標(biāo)準(zhǔn)”等工作原則[31]。

        在元數(shù)據(jù)標(biāo)準(zhǔn)的建設(shè)上,山東、廣東和貴州等率先研制和發(fā)布了開放數(shù)據(jù)元數(shù)據(jù)的地方標(biāo)準(zhǔn)[30],如山東省的《政務(wù)信息資源目錄 第2部分:核心元數(shù)據(jù)》(DB37/T 3521.2-2019)、廣東省的《電子政務(wù)數(shù)據(jù)資源開放數(shù)據(jù)技術(shù)規(guī)范》(DB44/T 2110-2018)和貴州省的《政府?dāng)?shù)據(jù) 開放數(shù)據(jù)核心元數(shù)據(jù)》(DB52/T 1407-2019)。2020年4月,國家標(biāo)準(zhǔn)化管理委員會(huì)發(fā)布了《信息技術(shù) 大數(shù)據(jù) 政務(wù)數(shù)據(jù)開放共享 第1部分:總則》(GB/T 38664.1-2020)、《第2部分:基本要求》(GB/T 38664.2-2020)和《第3部分:開放程度評(píng)價(jià)》(GB/T 38664.3-2020)三項(xiàng)政府?dāng)?shù)據(jù)開放共享領(lǐng)域的國家標(biāo)準(zhǔn),于2020年11月1日起實(shí)施[32]。

        但我國還缺乏國家層面的開放政府?dāng)?shù)據(jù)的統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn),元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)滯后于實(shí)踐需求,也落后于國際先進(jìn)水平。相應(yīng)地,我國公共數(shù)據(jù)開放共享總體上還處于發(fā)展階段,在ODB上的排名僅為第24位[16],實(shí)踐中還需要積極借鑒國際上的先進(jìn)經(jīng)驗(yàn)[33-35]。在此背景下,應(yīng)重點(diǎn)從以下三方面學(xué)習(xí)和借鑒英國的做法和經(jīng)驗(yàn)。

        4.1將元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)提升到數(shù)據(jù)基礎(chǔ)設(shè)施的高度在大數(shù)據(jù)和開放數(shù)據(jù)時(shí)代,英國政府將“數(shù)據(jù)基礎(chǔ)設(shè)施”(Data Infrastructure)的重要程度提升到與傳統(tǒng)的基礎(chǔ)設(shè)施(如交通、通信等)相同的高度[36]。ODI認(rèn)為,數(shù)據(jù)基礎(chǔ)設(shè)施不僅包括數(shù)據(jù)資產(chǎn)本身,還包括如何管理和使用數(shù)據(jù)的標(biāo)準(zhǔn)和指南及管理和維護(hù)這些資產(chǎn)的組織、人員、設(shè)施和技術(shù)等[19]。在政府?dāng)?shù)字服務(wù)局(GDS)的領(lǐng)導(dǎo)下,英國政府?dāng)?shù)據(jù)標(biāo)準(zhǔn)局(DSA)將在未來3年建立一個(gè)以數(shù)據(jù)標(biāo)準(zhǔn)為核心的“數(shù)據(jù)基礎(chǔ)設(shè)施”,以幫助政府部門提供以用戶為中心的、跨越組織機(jī)構(gòu)邊界的數(shù)字服務(wù)[37],而政府?dāng)?shù)據(jù)開放共享的元數(shù)據(jù)標(biāo)準(zhǔn)和指南則是這個(gè)數(shù)據(jù)基礎(chǔ)設(shè)施的第一個(gè)“構(gòu)造塊”。

        我國正在推動(dòng)各類新型基礎(chǔ)設(shè)施的建設(shè)。在“新基建”中,數(shù)據(jù)中心(如科學(xué)數(shù)據(jù)中心、政府?dāng)?shù)據(jù)中心等)等數(shù)據(jù)基礎(chǔ)設(shè)施是投資的重點(diǎn)之一,連續(xù)3年保持著30%以上的增長(zhǎng)[38]。在數(shù)據(jù)中心的建設(shè)中,應(yīng)重視數(shù)據(jù)標(biāo)準(zhǔn)和元數(shù)據(jù)標(biāo)準(zhǔn)的同步開發(fā)和應(yīng)用,打破“數(shù)據(jù)孤島”,實(shí)現(xiàn)數(shù)據(jù)資源之間的連接和互操作,為“新基建”在各個(gè)領(lǐng)域的廣泛應(yīng)用提供海量數(shù)據(jù)的支撐[38]。

        4.2重視引進(jìn)開放標(biāo)準(zhǔn)和融入國際數(shù)據(jù)生態(tài)系統(tǒng)英國歷來重視在政府?dāng)?shù)字服務(wù)中使用國際標(biāo)準(zhǔn)和開放標(biāo)準(zhǔn)。2012年6月出臺(tái)的《開放數(shù)據(jù)白皮書》將“使用開放標(biāo)準(zhǔn)”確立為開放數(shù)據(jù)的十四項(xiàng)原則之一[36]。2020年9月9日,英國數(shù)字、文化、媒體和體育部(DCMS)頒布《國家數(shù)據(jù)戰(zhàn)略》(National Data Strategy,NDS),將“在安全的前提下支持?jǐn)?shù)據(jù)的國際流動(dòng)”確立為5個(gè)戰(zhàn)略目標(biāo)之一[29],保障的措施包括與各國合作開發(fā)“共享標(biāo)準(zhǔn)”,這次將DC和Schema.org 數(shù)據(jù)集詞匯表等開放標(biāo)準(zhǔn)采納為國家層面的元數(shù)據(jù)標(biāo)準(zhǔn)只是邁出的第一步。

        在應(yīng)對(duì)新冠疫情的國際合作中,通過開放數(shù)據(jù)和開放標(biāo)準(zhǔn)構(gòu)建開放可信的國際數(shù)據(jù)生態(tài)系統(tǒng)日益得到各國的重視[39]。我國的開放政府?dāng)?shù)據(jù),特別是新冠疫情數(shù)據(jù),也是國際數(shù)據(jù)生態(tài)系統(tǒng)的重要一環(huán)。但還存在著一些問題影響著我國在國際合作上的主動(dòng)權(quán)和話語權(quán),如數(shù)據(jù)標(biāo)準(zhǔn)缺失[40]、元數(shù)據(jù)與國際標(biāo)準(zhǔn)(Schema.org 和DCAT)不兼容和通過搜索引擎(如百度、微軟Bing和谷歌等)難以發(fā)現(xiàn)和定位到開放數(shù)據(jù)集等。

        因此,我國在開展大數(shù)據(jù)和開放數(shù)據(jù)領(lǐng)域新標(biāo)準(zhǔn)研制工作的同時(shí),應(yīng)重視引進(jìn)和鼓勵(lì)使用國際上成熟的開放標(biāo)準(zhǔn),同時(shí)積極參與數(shù)據(jù)標(biāo)準(zhǔn)開發(fā)和推廣使用的國際合作,如W3C的Web數(shù)據(jù)標(biāo)準(zhǔn)化工作已經(jīng)吸引了英國、德國、加拿大和澳大利亞等國家的幾十家合作機(jī)構(gòu)[41]。

        4.3加強(qiáng)元數(shù)據(jù)治理、提高元數(shù)據(jù)管理的成熟度水平從2011年至今,英國政府已連續(xù)實(shí)施四輪“開放政府國家行動(dòng)計(jì)劃”(Open Government National Action Plan)[42],數(shù)據(jù)標(biāo)準(zhǔn)和開放標(biāo)準(zhǔn)建設(shè)是貫穿其中的重點(diǎn)內(nèi)容之一。這次采納元數(shù)據(jù)領(lǐng)域的開放標(biāo)準(zhǔn)是英國政府持續(xù)開展元數(shù)據(jù)治理、不斷提高元數(shù)據(jù)管理水平的標(biāo)志性成果之一。

        政府元數(shù)據(jù)管理的成熟度水平從低到高分為5個(gè)級(jí)別[43],分別是:①第一級(jí)別,沒有認(rèn)識(shí)到元數(shù)據(jù)的重要性,隨意使用元數(shù)據(jù)、數(shù)據(jù)模型和詞匯表等,缺乏文檔化的元數(shù)據(jù),導(dǎo)致互操作問題;②第二級(jí)別,已實(shí)現(xiàn)元數(shù)據(jù)的文檔化,但還不是集中管理和結(jié)構(gòu)化的;③第三級(jí)別,元數(shù)據(jù)經(jīng)過充分的文檔化、可被重用,但還不是機(jī)器可讀的;④第四級(jí)別,使用開放且可重用的元數(shù)據(jù),元數(shù)據(jù)集中管理,提供機(jī)器可讀的文檔或API;⑤第五級(jí)別,使用語義Web技術(shù)(如詞匯表/本體、RDF和關(guān)聯(lián)數(shù)據(jù)等)定義和描述元數(shù)據(jù),元數(shù)據(jù)是關(guān)聯(lián)且開放的。目前,英國、美國、澳大利亞和歐盟的開放數(shù)據(jù)元數(shù)據(jù)管理基本處于第四或第五級(jí)別[11-14],其中英國的成熟度水平無疑是最高的。

        我國各地方政府的元數(shù)據(jù)還存在著互操作水平低[12]、不是機(jī)器可讀的和數(shù)據(jù)質(zhì)量不高[44]等問題,是政府?dāng)?shù)據(jù)治理的薄弱環(huán)節(jié)。研究表明,“治理能力”是開放政府?dāng)?shù)據(jù)的關(guān)鍵制約因素[45],我國應(yīng)構(gòu)建跨部門的政府?dāng)?shù)據(jù)治理框架[46]。因此,政府部門應(yīng)通過有效的元數(shù)據(jù)治理,持續(xù)提高管理的成熟度水平和元數(shù)據(jù)質(zhì)量,為開放政府?dāng)?shù)據(jù)的可持續(xù)健康發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。

        5 結(jié) 語

        英國是世界范圍開放政府?dāng)?shù)據(jù)運(yùn)動(dòng)的領(lǐng)跑者,其數(shù)據(jù)戰(zhàn)略、政策法規(guī)、行動(dòng)計(jì)劃、平臺(tái)和標(biāo)準(zhǔn)建設(shè)等一直是各國的典范。元數(shù)據(jù)標(biāo)準(zhǔn)是保障政府?dāng)?shù)據(jù)開放共享的關(guān)鍵基礎(chǔ)設(shè)施,得到了各國的普遍重視。近年來,英國相繼成立開放標(biāo)準(zhǔn)委員會(huì)和數(shù)據(jù)標(biāo)準(zhǔn)局,加大了元數(shù)據(jù)領(lǐng)域開放標(biāo)準(zhǔn)的采納、建設(shè)和推廣力度,為數(shù)字經(jīng)濟(jì)時(shí)代實(shí)施新的國家數(shù)據(jù)戰(zhàn)略和構(gòu)建國際化的數(shù)據(jù)生態(tài)系統(tǒng)提供了有力保障。本文在對(duì)該系列標(biāo)準(zhǔn)進(jìn)行系統(tǒng)介紹和分析的基礎(chǔ)上,提煉出了對(duì)我國有益的啟示。

        后續(xù)研究將繼續(xù)關(guān)注英國新的數(shù)據(jù)戰(zhàn)略框架下的數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)、數(shù)據(jù)保護(hù)法規(guī)、數(shù)據(jù)倫理框架和數(shù)據(jù)驅(qū)動(dòng)的人工智能等內(nèi)容,為我國數(shù)字經(jīng)濟(jì)和開放數(shù)據(jù)的政策、法規(guī)和標(biāo)準(zhǔn)建設(shè)提供更多的建議和參考。

        猜你喜歡
        詞匯表英國標(biāo)準(zhǔn)
        2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
        英國的環(huán)保
        歐盟同意英國“脫歐”再次延期申請(qǐng)
        中國外匯(2019年21期)2019-05-21 03:04:06
        忠誠的標(biāo)準(zhǔn)
        美還是丑?
        英國圣誕節(jié)
        一家之言:新標(biāo)準(zhǔn)將解決快遞業(yè)“成長(zhǎng)中的煩惱”
        專用汽車(2016年4期)2016-03-01 04:13:43
        巧妙提取英文詞匯表的純英文單詞
        電腦迷(2014年16期)2014-04-29 03:32:41
        英國立法向酗酒“宣戰(zhàn)”
        詞匯表
        亚洲日产一线二线三线精华液| av二区三区在线观看| 国产一区在线视频不卡| 麻豆亚洲一区| 精品水蜜桃久久久久久久| 国产一及毛片| 少妇极品熟妇人妻高清| 国内精品亚洲成av人片| 精品伊人久久大香线蕉综合| 色婷婷五月综合亚洲小说| av手机在线天堂网| 亚洲国产91精品一区二区| 亚洲午夜av久久久精品影院色戒| 中文字幕精品久久久久人妻红杏ⅰ | 久久精品国产亚洲av一般男女| 成视频年人黄网站免费视频| 又色又污又爽又黄的网站| 日本高清一区二区不卡视频| 国产一区二区三区成人av| 国产freesexvideos中国麻豆| a级国产乱理论片在线观看| 91精品综合久久久久m3u8| 激情五月天色婷婷久久| 青娱乐极品视觉盛宴国产视频| 国产成+人+综合+亚洲 欧美| 日产乱码一区二区国产内射| 少妇被爽到高潮喷水免费福利| 亚洲乱码日产精品一二三| 在线播放人成午夜免费视频| 91在线视频视频在线| 国产精品一区二区三区在线免费| 人妻夜夜爽天天爽一区| 粗大挺进尤物人妻一区二区| 激情五月六月婷婷俺来也| 中国无码人妻丰满熟妇啪啪软件| 色一情一乱一伦一区二区三欧美| 青青草一级视频在线观看| 性色视频加勒比在线观看| 最新高清无码专区| 99热这里只有精品久久6| 国产一区白浆在线观看 |