亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        政府?dāng)?shù)據(jù)門(mén)戶(hù)網(wǎng)站及其數(shù)據(jù)集的建設(shè)研究

        2011-01-01 00:00:00劉祖斌
        信息化建設(shè) 2011年4期

        政府?dāng)?shù)據(jù)門(mén)戶(hù)網(wǎng)站發(fā)展及意義

        隨著電子政務(wù)的發(fā)展,政府各個(gè)部門(mén)聚集了大量的數(shù)據(jù)。如何讓公眾通過(guò)一個(gè)入口,更便利地獲取自己感興趣的數(shù)據(jù)集呢?更進(jìn)一步,如果一個(gè)軟件愛(ài)好者要對(duì)來(lái)自不同部門(mén)的多個(gè)數(shù)據(jù)集進(jìn)行整合(marshup),建立有意義的關(guān)聯(lián),政府的信息主管(CIO)能提供一個(gè)相關(guān)的數(shù)據(jù)基礎(chǔ)設(shè)施(data infrasture)嗎?

        作為有責(zé)任的政府,政府部門(mén)的一個(gè)重要任務(wù)就是向公眾提供這些數(shù)據(jù), 減少政府于公眾之間的信息不對(duì)稱(chēng),增強(qiáng)互信和理解。去年以來(lái),美國(guó)國(guó)內(nèi)掀起了一股“數(shù)據(jù)民主化”的浪潮,白宮把數(shù)十萬(wàn)項(xiàng)以前政府專(zhuān)有的數(shù)據(jù)庫(kù)推向了互聯(lián)網(wǎng),設(shè)立了數(shù)據(jù)門(mén)戶(hù)網(wǎng)站data.gov。在2009年5月21日網(wǎng)站上線時(shí),11個(gè)機(jī)構(gòu)提供了最早的76項(xiàng)數(shù)據(jù)集。而后數(shù)據(jù)集的數(shù)量激升。表1就兩個(gè)時(shí)點(diǎn)給出美國(guó)數(shù)據(jù)門(mén)戶(hù)網(wǎng)站上公開(kāi)的數(shù)據(jù)集的發(fā)展?fàn)顩r。

        數(shù)據(jù)門(mén)戶(hù)不是簡(jiǎn)單地分類(lèi)地將來(lái)自各個(gè)機(jī)構(gòu)的數(shù)據(jù)源集中起來(lái),其意義在于提供了許多數(shù)據(jù)基礎(chǔ)設(shè)施工具。這些基礎(chǔ)設(shè)施工具是由最適合的專(zhuān)業(yè)團(tuán)隊(duì)開(kāi)發(fā)的。這些基礎(chǔ)設(shè)施工具有機(jī)構(gòu)之間相互協(xié)作的數(shù)據(jù)基礎(chǔ)設(shè)施、反饋數(shù)據(jù)基礎(chǔ)設(shè)施、查找數(shù)據(jù)基礎(chǔ)設(shè)施、機(jī)構(gòu)和站點(diǎn)儀表板數(shù)據(jù)基礎(chǔ)設(shè)計(jì)。正因?yàn)橛腥绱吮姸嗷A(chǔ)設(shè)施,一個(gè)重要的現(xiàn)象就是EPA原放在自己部門(mén)網(wǎng)站的45個(gè)關(guān)于有害物的數(shù)據(jù)集,在整合到data.gov門(mén)戶(hù)之后,下載次數(shù)增加了十多倍.

        數(shù)據(jù)門(mén)戶(hù)網(wǎng)站實(shí)施原則

        目前很多國(guó)家政府已經(jīng)認(rèn)識(shí)到向公眾開(kāi)放高價(jià)值數(shù)據(jù)集的作用,并主動(dòng)引導(dǎo)形成一個(gè)創(chuàng)新性的社會(huì)。信息技術(shù)就是生產(chǎn)力。基于統(tǒng)一的門(mén)戶(hù)網(wǎng)站,能避免各個(gè)職能部門(mén)在軟件、硬件上的重復(fù)投資,如軟件上的檢索模塊、硬件方面的主機(jī)設(shè)備。基于統(tǒng)一的門(mén)戶(hù)網(wǎng)站,還能在政策法規(guī)上避免各個(gè)職能部門(mén)各自為政的情形,促進(jìn)協(xié)調(diào)、統(tǒng)一,通過(guò)其數(shù)據(jù)集檢驗(yàn)其部門(mén)任務(wù)的落實(shí)是否符合其使命,是否為社會(huì)創(chuàng)造了價(jià)值。

        數(shù)據(jù)門(mén)戶(hù)網(wǎng)站的實(shí)施主體是信息產(chǎn)業(yè)相關(guān)部門(mén)。為此信息產(chǎn)業(yè)相關(guān)部門(mén)推出相應(yīng)的政策和實(shí)施措施。針對(duì)政務(wù)數(shù)據(jù)集,信息技術(shù)管理戰(zhàn)略就是利用好現(xiàn)有數(shù)據(jù)集并推出滿(mǎn)足公眾要求的新數(shù)據(jù)集。表2給出對(duì)應(yīng)戰(zhàn)略的操作層面的實(shí)施步驟。

        為了實(shí)現(xiàn)上面的任務(wù),政府?dāng)?shù)據(jù)網(wǎng)站提出了七個(gè)原則來(lái)成就其透明、參與、協(xié)作這一系列的價(jià)值主張。

        data.gov是一個(gè)高價(jià)值的政府?dāng)?shù)據(jù)集的門(mén)戶(hù)網(wǎng)站。那么,什么是高價(jià)值的政務(wù)數(shù)據(jù)集呢?這里,主要是從數(shù)據(jù)集能起到的作用和產(chǎn)生的影響角度進(jìn)行闡述。作為向公眾開(kāi)放的最原始的基礎(chǔ)數(shù)據(jù),高價(jià)值數(shù)據(jù)集應(yīng)該能提高公眾對(duì)該機(jī)構(gòu)的認(rèn)知和對(duì)其運(yùn)作流程的理解;推進(jìn)該機(jī)構(gòu)的核心使命;能及時(shí)滿(mǎn)足公眾的目的和需求。

        在社會(huì)可以自由獲取這樣的高價(jià)值的數(shù)據(jù)集之后,極大地促進(jìn)了美國(guó)社會(huì)對(duì)數(shù)據(jù)的重視和應(yīng)用,很多領(lǐng)域提出了一系列社會(huì)問(wèn)題的解決方案。針對(duì)這種應(yīng)用的全國(guó)范圍內(nèi)的比賽“apps for America”也已進(jìn)行了兩屆。比如在航空運(yùn)輸服務(wù)上,民間就有程序員利用它開(kāi)發(fā)了航班延誤的免費(fèi)查詢(xún)系統(tǒng)(http://flyontime.us/),任何旅客都可以查詢(xún)?nèi)珖?guó)各航班的飛行時(shí)間和機(jī)場(chǎng)等候時(shí)間。其中,和航班相關(guān)的信息來(lái)源于美國(guó)交通部,安檢排隊(duì)等待的時(shí)間來(lái)源于普通旅行人員的提交。其帶來(lái)的管理功能有:一是可以幫助消費(fèi)者找到表現(xiàn)最佳、或者符合自己需要的航班;二是最大程度降低了旅客等待時(shí)間的不確定性;三是有利用推動(dòng)航空市場(chǎng)的良性競(jìng)爭(zhēng)。

        數(shù)據(jù)源目錄的管理

        數(shù)據(jù)門(mén)戶(hù)首先要求對(duì)數(shù)據(jù)源進(jìn)行分類(lèi)和描述,并以數(shù)據(jù)目錄的形式發(fā)布政府?dāng)?shù)據(jù)。data.gov提供了三類(lèi)目錄,它們是原始數(shù)據(jù)目錄、工具數(shù)據(jù)目錄、地理空間數(shù)據(jù)目錄。原始數(shù)據(jù)目錄下的數(shù)據(jù)源是指在滿(mǎn)足數(shù)據(jù)隱私、秘密、安全等要求下所能提供的最翔實(shí)的、能直接下載的數(shù)據(jù),且具有機(jī)器可讀的格式。data.gov以原始數(shù)據(jù)的形式免費(fèi)提供政務(wù)數(shù)據(jù),其范圍涵蓋了美國(guó)人口特征統(tǒng)計(jì)數(shù)據(jù)、GIS地理信息,以及環(huán)保、教育、能源、地域、健康、法令相關(guān)主題的數(shù)據(jù)。工具數(shù)據(jù)目錄下的數(shù)據(jù)源是指與一定應(yīng)用相關(guān)聯(lián)的數(shù)據(jù),比如由交通統(tǒng)計(jì)署提供的編號(hào)為123的美國(guó)航班延誤數(shù)據(jù)集(Airline On-Time Performance and Causes of Flight Delays),公眾可以定制自己想要的任何查詢(xún)結(jié)果。地理空間數(shù)據(jù)目錄則同時(shí)包含與地理空間相關(guān)的原始數(shù)據(jù)和工具。

        在每個(gè)目錄下數(shù)據(jù)源還按其所屬范疇進(jìn)行劃分,提供了與職能部門(mén)有一定關(guān)系的分類(lèi)準(zhǔn)則,如地理與環(huán)境、人口等范疇。不能歸入相關(guān)范疇的,專(zhuān)門(mén)設(shè)置一個(gè)“其他”來(lái)容納。

        對(duì)于原始數(shù)據(jù)目錄、工具數(shù)據(jù)目錄,data.gov是通過(guò)元數(shù)據(jù)目錄來(lái)進(jìn)行管理的。一個(gè)元數(shù)據(jù)目錄下的目錄記錄大致有四部分組成,即目錄記錄頭、數(shù)據(jù)源地址、數(shù)據(jù)源域、相關(guān)文檔。其中數(shù)據(jù)源域又分為數(shù)據(jù)源本身描述和數(shù)據(jù)源機(jī)構(gòu)描述兩部分。

        在資源描述框架RDF文件格式下,目錄對(duì)應(yīng)的項(xiàng)為,數(shù)據(jù)源機(jī)構(gòu)對(duì)應(yīng)的項(xiàng)為,相關(guān)文檔則包含有、等項(xiàng)。

        對(duì)關(guān)鍵詞的分析

        在熟悉了元數(shù)據(jù)目錄下的目錄記錄的格式后,我們通過(guò)文件http://www.data.gov/ data_gov_catalog.csv對(duì)數(shù)據(jù)源記錄進(jìn)行逐一的檢查。我們主要對(duì)數(shù)據(jù)源記錄中的三種描述信息即title、description、keywords進(jìn)行了比較。在3533個(gè)記錄中,每一個(gè)記錄都有一個(gè)較為貼切的標(biāo)題,有比較細(xì)致的文字描述來(lái)說(shuō)明數(shù)據(jù)源的大致起因和目的。但對(duì)于keywords則出現(xiàn)了兩個(gè)比較嚴(yán)重的現(xiàn)象。

        現(xiàn)象一是大量的數(shù)據(jù)源記錄中的關(guān)鍵詞是重復(fù)的。也就是兩個(gè)數(shù)據(jù)源記錄有不同的標(biāo)題、描述,但卻對(duì)應(yīng)著相同的關(guān)鍵詞集合。

        現(xiàn)象二是關(guān)鍵詞的數(shù)目相差很大。有兩個(gè)關(guān)于核能的數(shù)據(jù)源記錄(2465、2466)沒(méi)有任何關(guān)鍵詞。而農(nóng)業(yè)部給出的2007年農(nóng)業(yè)調(diào)查數(shù)據(jù)集記錄(1425)有248個(gè)關(guān)鍵詞,更有甚者,農(nóng)業(yè)部給出的關(guān)于1997、2002、2007三次五年調(diào)查數(shù)據(jù)集記錄(961)有330個(gè)關(guān)鍵詞。

        為了對(duì)數(shù)據(jù)源記錄中關(guān)鍵詞數(shù)目的分布有一個(gè)全面的理解,我們首先將3533個(gè)記錄的關(guān)鍵詞抽取出來(lái),將沒(méi)有關(guān)鍵詞和關(guān)鍵詞完全重復(fù)的記錄刪除,這樣得到1408個(gè)有獨(dú)立關(guān)鍵詞的記錄。關(guān)鍵詞數(shù)目介于1-50之間的記錄有1387個(gè),其分布見(jiàn)圖1。

        關(guān)鍵詞個(gè)數(shù)介于51-74之間記錄有10個(gè);介于75-100之間有3個(gè);介于101-150之間有6個(gè),剩余兩個(gè)就是上面提到的農(nóng)業(yè)部的數(shù)據(jù)源。

        還有一些細(xì)微的問(wèn)題有待改進(jìn)的方面有,http://www.data.gov/details/6的描述的拼寫(xiě)錯(cuò)誤,將information寫(xiě)為informaiton。http://www.data.gov/details/1446-1451為衛(wèi)生與服務(wù)部下屬的醫(yī)療與醫(yī)療卡中心提供的數(shù)據(jù),其關(guān)鍵詞不規(guī)范,關(guān)鍵詞之間的分隔為“;”。類(lèi)似還有Broadcasting Board of Governors所提供的http://www.data.gov/details/2123、2125。http://www.data.gov/details/2644-2645、http://www.data.gov/details/1487為衛(wèi)生與服務(wù)部下屬的 Administration on Aging中心提供的數(shù)據(jù),其關(guān)鍵詞不規(guī)范,關(guān)鍵詞之間的沒(méi)有分隔。類(lèi)似的還有總務(wù)署所提供的http://www.data.gov/details/4008,七個(gè)連在一起的詞應(yīng)該為七個(gè)關(guān)鍵詞。http://www.data.gov/details/1490所包含的關(guān)鍵詞“Arts participation Arts audiences. United StatesArts, AmericanPublic opinion. United StatesArts. U.S. citizen participationArts surveys. United StatesLeisure. United States”,這應(yīng)該是八個(gè)關(guān)鍵詞。

        數(shù)據(jù)門(mén)戶(hù)網(wǎng)站和應(yīng)用開(kāi)發(fā)是當(dāng)前發(fā)達(dá)國(guó)家在電子政務(wù)上所正在進(jìn)行的工作。我們通過(guò)對(duì)數(shù)據(jù)目錄記錄的分析,認(rèn)為在title、description、keywords三種描述信息中,keywords的設(shè)置是當(dāng)前數(shù)據(jù)門(mén)戶(hù)網(wǎng)站的薄弱環(huán)節(jié)。這里data.gov還有許多工作可做。

        我們知道keywords是由數(shù)據(jù)源提供機(jī)構(gòu)在提交數(shù)據(jù)集時(shí)設(shè)定的,在公眾使用該數(shù)據(jù)集時(shí)可能給該數(shù)據(jù)集以不同的tag,且這樣的tag在公眾的使用中不斷得到豐富。結(jié)合原則4即漸進(jìn)成長(zhǎng)原則,通過(guò)tag來(lái)完善keywords是一個(gè)可行的方向。

        (作者系廣東省電子商務(wù)重點(diǎn)實(shí)驗(yàn)室研究人員,博士后)

        论理视频二区三区四区在线观看| 一本久道久久综合久久| 国产一起色一起爱| 亚洲乱码av中文一区二区第八页 | 国产午夜福利片在线观看| 亚洲av无码不卡久久| 国产乱人伦偷精品视频免| 亚洲天堂一区二区三区视频| 国产18禁黄网站免费观看| 成片免费观看视频大全| 国产精品一区二区av片| 亚洲国产中文字幕九色| 日日噜噜夜夜狠狠视频| 国产午夜福利在线播放| 免费看欧美日韩一区二区三区| 美女射精视频在线观看| 三级全黄裸体| 麻豆亚洲av永久无码精品久久| 91精品久久久久含羞草| 在线亚洲精品免费视频| 久久黄色视频| 国产精品va在线观看无码| 91福利精品老师国产自产在线| 大陆成人精品自拍视频在线观看| 东京热久久综合久久88| 红杏亚洲影院一区二区三区| 精品国产你懂的在线观看| 99久久婷婷国产一区| 把女邻居弄到潮喷的性经历| 99热这里只有精品4| 色佬易精品视频免费在线观看| av区无码字幕中文色| 婷婷丁香五月中文字幕| 中国产无码一区二区三区| 极品一区二区在线视频| 亚洲国产精华液网站w| 欧美a视频在线观看| 开心五月激动心情五月| 午夜dy888国产精品影院| 国产精品99久久久久久宅男| 欧美亚洲国产丝袜在线|