亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        英國數據檔案館的發(fā)展現狀及其借鑒

        2019-12-17 07:32:29海嘯
        山東檔案 2019年6期
        關鍵詞:數據服務數據管理檔案館

        文·海嘯

        一、檔案數據管理及英國數據檔案館概述

        數據是以定性或定量的方式來描述事物的符號記錄,是通過觀察或實驗得來的對現實世界中的地方、事件、對象或概念的描述和反映[1]。而檔案數據處理技術的對象主要是電子檔案和元數據,檔案部門的檔案數據包括存量檔案數據和增量檔案數據,存量檔案數據主要來自現存的電子檔案和檔案數字化成果,增量檔案數據的來源一方面是各業(yè)務系統(tǒng)產生的各種電子文件,另一方面是檔案部門在日常業(yè)務中產生的各種數據。檔案部門在館藏建設和各種管理活動中形成了大量數據,因此加強檔案的數據管理至關重要[2]。此外,檔案的數據管理已經逐漸成為檔案工作的一個重要發(fā)展方向,一方面隨著大數據時代的到來,在社會各行各業(yè)中產生了海量的數據,如何管理存儲這些數據已經成為了一個重要的問題。檔案部門隨著檔案數字化工作的不斷推進,也保存了內容豐富、種類多樣的檔案數據資源,因此從檔案工作本身來說需要加強檔案數據管理。另一方面隨著社會公眾檔案意識的增強以及檔案開放利用法規(guī)的不斷完善,強調檔案數據的開放獲取和利用已經成為一個重要的時代潮流,社會對檔案的利用需求越來越多,因此需要加強檔案的數據管理來為用戶提供高質量的可共享的檔案數據。

        英國數據檔案館成立于1967年,在英國社會科學研究委員會的資助下于埃塞克斯大學成立,最初旨在收集高質量的科學研究數據進行分析和利用。后來經濟和社會研究理事會(ESRC)繼續(xù)為數據存檔提供資助與支持,是英國數據基礎設施的重要組成部分。2005年成為英國國家檔案館的指定數據存放地點,允許管理社會經濟類的公共記錄,成為世界上最頂級的國家數據檔案館。英國數據檔案館提供獲取、利用英國社會和經濟數據的管理和服務,是英國數據服務的牽頭機構,該機構提供統(tǒng)一訪問英國最大的社會、經濟和人口數據集的服務,并為政策相關研究提供支持和為發(fā)展數據使用技能提供指導和培訓。該檔案館通過與英國各地的主要數據機構緊密合作,已成為公認的國際數據管理、保存和獲取中心。英國數據檔案館以及在此基礎上建立的數據服務中心由于發(fā)展較早,并且由于對數據管理的重視,已經在數據檔案管理方面積累了豐富的經驗,而我國在檔案數據管理方面的工作總體而言比較滯后,因此需要對國外的先進經驗進行合理的借鑒。

        二、英國數據檔案館的數據管理現狀

        (一)數據收集與獲取

        在基于快速興起的數據密集型科學研究的第四范式時期,數據收集和獲取工作更加注重數據源的權威性與時效性,數據獲取更加主動、快速,對數據的可獲得性、準確性、新穎性有了更高的要求[3]。在數據收集和獲取期間,要保證數據記錄能夠反映真實發(fā)生的情況、觀察或者事件,數據收集的內容要豐富多樣,數據收集和獲取形式要更加主動快捷。英國數據檔案館在檔案數據的收集和獲取方式上主要有以下三個方面的特點:一是收集的內容和形式比較豐富多樣。英國數據檔案館是國際公認的獲取、管理和提供社會科學和人文數據的專業(yè)中心。英國數據檔案館收集的數據反映了影響公民從出生到教育、就業(yè)、公民的社會交往直至老年的所有生活和經歷的問題,這些問題既涉及國內也涉及國際,涉及每一個大陸。而且英國數據檔案館也整合了埃塞克斯的定性數據部門和專業(yè)的歷史數據服務中心,大大擴展了它以調查為主的收藏,開始囊括非數值型、文本型、圖片和混合方法的數據集。二是數據收集方法多樣。對于首次提供數據的主體,可以向數據檔案館發(fā)送收集到的數據的簡短說明,從而提供主體的數據,數據檔案館根據自身的收集開發(fā)政策評估數據。對于經常提供數據的主體,如對于大型社會調查或政府數據系列的存儲人,由數據檔案館的處理團隊進行策展,數據檔案館準備資料,對收到的資料進行核對,以及提供指引保障資料的方法。對于可以共享的數據擁有人,特別是ESRC資助持有者,可以將他們的研究數據存儲到英國數據服務的再共享數據存儲庫中。三是在數據獲取的形式上也主要采取合作的形式,英國數據服務與英國一些最重要的社會和經濟數據源的所有者和生產者密切合作,以確保這些數據源能夠及時提供給用戶。如與世界銀行、國際貨幣基金組織、英國商業(yè)、能源和工業(yè)戰(zhàn)略部進行合作,而且英國數據檔案館還擴展到了面向數據的合作項目,如包括末日審判項目和農村地區(qū)數據庫。

        (二)數據的組織與管理

        良好的檔案數據組織與管理對于保證數據的可靠性、完整性、有效性,促進檔案數據的共享和利用有著重要的意義。英國數據檔案館保存了大量的社會和經濟數據,可以用于未來的科學和教育目的,因此良好的數據管理組織和管理實踐對于促進數據的開放共享有著重要的意義。在英國數據檔案館的數據組織方面,主要是建立數據詞典和編撰主題詞表來實現的,英國數據檔案館在數據處理階段為每一個存檔過的SPSS格式的數據文件建立了數據詞典,在每一個SPSS文件中嵌入數據層級的元數據:變量標簽、變量值和缺失的變量代碼。而且英國數據檔案館也編撰了主題詞表—人文與社會科學電子主題詞表(HASSET),用來對它們的數據集進行索引,HASSET中的主題覆蓋廣泛,反映了英國數據檔案館館藏主要集中在社會科學領域[4]。在檔案數據的管理方面,英國數據檔案館主要是進行數據校驗,即對數據進行編輯、清理、驗證、交叉校驗和確認。在英國數據檔案館,當研究數據準備建立專屬的數據集進行存檔的時候,將會進行各種各樣的質量控制檢驗。檢驗包括:根據文檔檢查個案和變量的數量;檢查超出范圍值和不合理編碼的分類變量;檢查數據和文檔是否違反機密性規(guī)則,并確保文檔是數字格式。并且根據預期的未來使用及數據和文檔的條件,對于每個即將入庫的數據,在四個數據處理標準(A*、A、B、C)之中挑選一個標準進行處理,這樣可以對收集上來的數據進行分層次的處理,有效的保證了數據的有效性,同時也有利于數據的科學性。

        (三)數據的安全控制

        數據本身的開放性、關聯(lián)性會引發(fā)數據安全問題,在透明政府、開放治理理念推動下實施的政府數據開放共享和個人隱私保護存在價值和利益沖突[5]。而維護個人數據的安全是英國數據檔案館的重要工作,比起不包含個人信息的數據,更需要謹慎的對待包含了個人信息的數據,1998年英國頒布的《數據保護法案》更加凸顯出了對數據安全工作的重視。英國數據檔案館開展維護個人數據安全的工作主要有以下三個方面:一是注重存儲安全,英國數據檔案館對攝取披露的安全數據有嚴格的程序,所有用于課題研究的數字化文件必須加密,并保存在位于網絡存儲設備上的指定驅動器中的一個標記為“RESRICTED”的目錄中,且在整個處理階段必須保留他們,所有包含受限調查數據的數字化處理文件還必須在文件名中包含“RESRICTED”文字,方便對它們進行識別。二是注重制度安全,英國數據檔案館的所有工作人員都簽署了一份保密協(xié)議,特別是對那些被數據生產者或該檔案館認定為可在一定程度上開放的數據,包括涉及個人數據或個人信息的內容,該檔案館有責任確保為其提供必要的安全保護。三是注重訪問安全,英國數據檔案館所擁有的大部分數據資源都不屬于公共領域,這些數據僅限于注冊用戶已特定的目的進行使用。英國數據檔案館要求利用者可根據研究目的使用數據,但不得發(fā)布數據,嚴格控制數據訪問,與此同時,英國數據檔案館也采取了一些其他的措施來保證數據的安全,如訪問數據時需要取得數據擁有者的專門授權、為保密數據設置一定的限制期、對數據提供安全訪問及允許對機密數據進行遠程分析,但不得下載或帶走數據。英國數據檔案館從存儲、制度、訪問等方面來加強檔案數據的安全工作,將會有效減少檔案數據遺漏、丟失、泄密的風險,促進檔案數據的安全保存。

        (四)數據的服務

        檔案數據服務是在數據密集生產的背景下,對散在于檔案中的數據進行人工或智能發(fā)現、關聯(lián)、聚合、重用等一系列管理,使用戶能夠直接用來解決問題的服務,它能提升已有知識、數據的使用效率,促進新知識的產生和傳播[6]。開展檔案數據服務是英國數據檔案館的重要工作環(huán)節(jié)之一,通過積極的開展檔案的數據服務,能夠在更大程度上促進檔案數據資源的共享。英國數據檔案館開展檔案數據服務主要表現在以下幾個方面:英國數據檔案館首先是提供的數據服務對象和范圍非常廣泛,英國數據檔案館能夠滿足來自所有部門的研究人員、學生、教師、數據用戶和數據所有者當前和未來的數字數據需求,英國數據檔案館在全球擁有超過2.3萬注冊用戶,它使研究人員和決策者能夠從其擁有7000多個數據集的可信存儲庫中提取知識和見解,以支持有利于社會的基于證據的決策。其次,檔案數據查詢也很方便快捷,以英國數據服務的發(fā)現目錄為例,用戶能通過主題、數據類型、數據生產者和數據收集的日期來進行檢索和瀏覽,而且當數據目錄被搜索引擎如谷歌收錄后,谷歌搜索也能可靠的定位數據集,用戶一旦確定找到合適的數據集,通過簡單的注冊過程就可以索取數據。最后,英國數據檔案館也為利用者提供了數據分析技能的指導,幫助利用者能夠更好地開展研究工作,如編制如何使用特定數據集、主題分類、方法和軟件(包括操作或重用數據)的指南,研究教學案例、展示如何使用數據,開展全年的網絡研討會和面對面的培訓服務??偠灾?,英國數據檔案館以用戶為中心,通過開展檔案數據檢索和指導服務,檔案數據服務的對象和范圍越來越廣泛,極大地滿足了社會對檔案數據資源的需求。

        三、對我國檔案數據管理的啟示

        (一)擴大收集范圍,創(chuàng)新收集方法

        我國開展檔案收集工作的主體主要是國家和地方綜合性檔案館,并且主要以收集到的公文檔案和歷史檔案為主,對于一些經濟民生、教育科研種類的檔案數據資源涉及的較少。而且收集方式和途徑單一,以紙質檔案歸檔和被動歸檔為主,檔案部門在檔案收集的工作上主動性不足,往往會滯后于時代的發(fā)展。在大數據時代,需要管理海量的數據,這些數據往往具有動態(tài)性強、更新快、高時效性的特點,因此開展檔案數據管理工作需要與時俱進。首先檔案部門應不斷擴大檔案收集的范圍和類型,多收集一些反映社會真實運行情況的經濟類、教育科研類、民生類的檔案數據資源。不僅收集文本型數據集,還要擴大一些多媒體數據集的收集,使檔案館的館藏結構更加合理,更好地滿足社會的檔案信息需求。其次,檔案部門也應不斷創(chuàng)新檔案收集工作的方式,明確收集對象的范圍,加強與社會上各種數據生產者和數據管理者的合作,相互分工協(xié)調。與這些數據機構合作一方面可以擴充檔案館的數據資源,豐富檔案館數據資源的種類,另一方面檔案部門也可以借鑒這些數據機構先進的管理經驗、技術、方法,更好的把握數據資源的特點,提高檔案部門的數據管理水平。

        (二)加強檔案數據的組織和質量控制

        實現數據有效管理的關鍵是數據組織,數據組織是數據管理的基礎,其水平決定了數據管理的水平[7]。首先我國檔案部門進行檔案數據管理的基礎性標準是《檔案著錄規(guī)則》,這個標準規(guī)定了檔案著錄項的字段名、字段內容、字段類型和字段長度,促進了檔案數據格式的規(guī)范化。但是這個標準在大數據時代進行檔案數據的管理是遠遠不夠的,還需要規(guī)范和統(tǒng)一當前檔案著錄項數據格式和交換格式?!吨袊鴻n案機讀目錄格式》很好地規(guī)范了檔案數據的組織和設計,以《中國檔案機讀目錄格式 》作為數據標準化準繩,按此規(guī)定要求組織和設計檔案數據的框架結構,對不規(guī)范的數據進行規(guī)范處理,逐步將檔案數據轉換成符合《中國檔案機讀目錄格式》標準的數據,即一條檔案數據記錄應包括記錄頭標、記錄目次區(qū)、數據字段區(qū)(變長)和數據結束符等組織部分,也就是說一條完整的檔案數據除了自身的數據內容外,還應有數據的輔助說明內容,這種結構的檔案數據具有數據的自我說明能力。其次,檔案部門還應加強對檔案數據的質量控制,因為在大數據時代會有大量的數據形成和傳遞到檔案部門手中,因此檔案部門需要加強檔案數據的質量控制。檔案部門可以通過自動化和手動操作的方式加強檔案數據的質量控制,如可以通過雙重數據輸入、統(tǒng)計分析、校對轉錄、同行評議的方式來保證檔案數據的質量。總而言之,只有加強檔案數據的組織和質量控制工作,檔案數據才能更加有序和真實。

        (三)注重對個人信息的保護

        公民的個人信息,也可稱為個人數據、私人信息等,主要是指任何與已確定的或可確定的個人相關的信息[8]。根據《中國網民權益保護調查報告( 2016)》,54% 的中國網民認為個人信息泄露嚴重[9]。檔案數據工程的建設必然會促進大范圍的檔案數據資源的共享,只有在保證檔案數據個人信息安全的前提下進行檔案數據管理工作,才能更好的實現檔案數據共享和利用服務的目的。而且隨著《網絡安全法》等法律法規(guī)的頒布,國家和社會對于在各種活動中保護個人信息安全的重要性有了充分的認識。而我國檔案部門對個人信息的保護性認識略顯不足,為此,檔案部門應該加強在檔案數據管理和利用工作中對包含有個人信息的檔案數據的保護。首先應該完善檔案數據保密制度,檔案部門應該加強保護個人信息安全的教育,與員工簽署保密協(xié)議,明確相關責任,在檔案數據利用的過程中建立知情同意制度。其次,保護個人信息在檔案數據存儲中的安全,檔案部門可以建立專門的包含有個人信息的檔案數據資源庫,對包含有個人信息的檔案數據實行加密處理。而且檔案部門也可以建立匿名識別系統(tǒng),匿名識別系統(tǒng)可以將個人信息和數據文件關聯(lián)在一起,有效減少了個人信息泄密的風險。最后,檔案部門在檔案數據訪問的過程中也要加強權限控制,合理分配檔案數據資源所有者、管理者、利用者之間的權限,如利用者訪問數據時需要取得數據擁有者的專門授權,檔案數據資源所有者只有權訪問擁有自己信息的檔案數據源而無權訪問他人的數據,檔案數據資源的管理者只有在獲得利用者的訪問請求后才能查看數據??傊挥薪⒁粋€完善的個人信息安全保護體系,檔案數據資源才能更好地發(fā)揮自己的作用。

        (四)主動開展檔案數據服務

        促進檔案數據資源的共享和開展檔案數據服務是進行檔案數據管理的重要目的。目前中國政府數據積累少,只能發(fā)布極其有限的文本數據和統(tǒng)計數據,數據可用性不足和開放程度不高阻礙了數據的進一步共享利用[10]。因此作為檔案數據資源管理的主體,檔案部門要承擔起數據開放利用的責任,主動開展數據服務,最大程度的地滿足社會和公眾的數據資源需求。首先檔案部門可以建立大數據服務中心,統(tǒng)籌管理本區(qū)域的檔案數據資源,為利用者提供一站式檔案數據服務。其次,檔案部門應該主動開展檔案數據服務的宣傳指導工作,編制數據指導服務指南,幫助利用者了解檔案館保存了哪些種類的檔案數據資源和查詢檢索檔案數據的流程方法。最后,要不斷完善檢索條件,提高檢索效果,使用戶能夠通過主題、數據類型、形成者等條件快捷的查詢到自己所需要的檔案數據資源,而不是以往的通過檔號、分類號等過為專業(yè)化的詞匯來查找。

        總之,在大數據時代,社會各個活動主體產生了大量的有價值的檔案數據,因此對數據的管理就顯得尤為重要。英國數據檔案館的工作實踐為我們提供了良好的借鑒,檔案部門只有不斷提高自身的檔案數據管理和服務水平,完善檔案數據的收集、管理、服務程序和方法,才能更好地發(fā)揮自身的角色和作用。

        猜你喜歡
        數據服務數據管理檔案館
        地理空間大數據服務自然資源調查監(jiān)測的方向分析
        企業(yè)級BOM數據管理概要
        定制化汽車制造的數據管理分析
        海洋環(huán)境數據管理優(yōu)化與實踐
        CTCS-2級報文數據管理需求分析和實現
        關于縣級檔案館館藏檔案開發(fā)利用的思考
        蘭臺內外(2017年6期)2017-05-30 06:46:41
        全省部分檔案館新館掠影
        浙江檔案(2017年10期)2017-03-31 06:27:31
        如何運用稅收大數據服務供給側結構性改革
        中國商論(2016年34期)2017-01-15 14:24:18
        基于頻繁子圖挖掘的數據服務Mashup推薦
        when與while檔案館
        国产av一区网址大全| 无码日韩精品一区二区三区免费| 国产精品福利视频一区| 国产国语对白一区二区三区| 白白色青青草视频免费观看| 无码AⅤ最新av无码专区| 中文字幕一区二区三区综合网| 午夜被窝精品国产亚洲av香蕉 | 精品一区二区三区人妻久久| 国产精品黑丝美女av| 国产精品久久久三级18| 无码国模国产在线观看| 日韩高清无码中文字幕综合一二三区| 黄网站a毛片免费观看久久| 国产三a级三级日产三级野外| 国产办公室沙发系列高清| 国产女女精品视频久热视频| 国产欧美乱夫不卡无乱码| 亚洲国产精品第一区二区三区| 91精品久久久老熟女91精品 | 国产亚洲欧美精品久久久| 日本a在线看| 久久亚洲春色中文字幕久久久综合| 凌辱人妻中文字幕一区| 国产又爽又大又黄a片| 蜜臀av一区二区| 网友自拍人妻一区二区三区三州| 国产性虐视频在线观看| 国内精品视频在线播放不卡| 四虎精品免费永久在线| 人妻少妇av中文字幕乱码免费| 日韩人妻久久中文字幕| 国产三级久久久精品麻豆三级| 激情五月婷婷综合| 91精品国产综合久久久蜜臀九色| 日本添下边视频全过程| 亚州少妇无套内射激情视频| 狠狠亚洲婷婷综合久久久| 91精品国产在热久久| 精品国产这么小也不放过| 亚洲AV日韩AV永久无码电影|