亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據時代下高校檔案管理實施策略研究

        2016-12-12 09:59:15胡瀟瀟
        山東行政學院學報 2016年6期
        關鍵詞:信息管理檔案管理數(shù)據庫

        胡瀟瀟

        (山東行政學院組織人事處,濟南 250014)

        大數(shù)據時代下高校檔案管理實施策略研究

        胡瀟瀟

        (山東行政學院組織人事處,濟南250014)

        大數(shù)據時代的到來,給高等院校檔案信息管理帶來了巨大的機遇和挑戰(zhàn)。依據大數(shù)據技術,分析高校檔案信息管理的現(xiàn)狀,闡述大數(shù)據技術的基本特點和高校在檔案管理方面利用大數(shù)據技術對檔案進行信息的收集、整理以及數(shù)據挖掘的策略,建立以大數(shù)據、云存儲技術為基礎的高校檔案信息管理中心的實施方案,探討高校檔案信息管理利用大數(shù)據技術的前景和發(fā)展方向。

        大數(shù)據;檔案管理;云存儲;檔案信息管理中心

        隨著信息時代的迅速發(fā)展,人們的生活和思維方式伴隨著大數(shù)據時代的到來而改變著。近年來,隨著社交網絡、物聯(lián)網、移動互聯(lián)網、云計算等技術的發(fā)展而產生了大數(shù)據這個新的科技名詞,大數(shù)據在學術、商業(yè)、科技等許多領域都得到了廣泛的應用。面對當下大數(shù)據技術的應用,高等院校檔案信息管理工作如何與“大數(shù)據”有機結合,大大提升檔案的利用價值,為工作提供更多更好的信息和方便,是值得我們研究的一個重要課題。

        一、問題的提出

        “大數(shù)據(Big Data)”是由IT行業(yè)首先引發(fā)的網絡技術革命,它的概念是由美國的麥肯錫公司最先提出來的,美國計算機研究機構Garther認為“大數(shù)據”的定義應為以虛擬化、分布式的海量存儲技術為依托,實現(xiàn)信息的實時擷取、管理、處理的新型信息技術。根據Garther預測,大數(shù)據將在2020年成為現(xiàn)代信息技術的引領者,全世界的大數(shù)據容量將達到35ZB~40ZB。大數(shù)據技術不但可以存儲、處理結構型與關系型信息,還可以存儲非結構型與非關系型信息,并且傳輸速度更快、使用價值更高。大數(shù)據最主要的特點是4V特性,首先是數(shù)據量(Volumes)大,數(shù)據量遠遠超過了傳統(tǒng)意義上的數(shù)據庫,達到了PB量級;其次是指數(shù)據類別(Variety)多樣,和傳統(tǒng)意義的結構化數(shù)據不同,大數(shù)據來自多種數(shù)據源,包括音頻、視頻、圖片、網頁等的結構化數(shù)據、非結構化數(shù)據和半結構化數(shù)據;再是數(shù)據處理速度(Velocity)快,大數(shù)據使用云計算的手段來快速處理海量的信息,與傳統(tǒng)的數(shù)據管理相比,最顯著的區(qū)別在于可以實時提取需要的數(shù)據信息,實現(xiàn)高效、實用、便捷和共享;最后是數(shù)據真實性(Veracity)高,由于大數(shù)據的數(shù)據源往往是來源于最原始的業(yè)務活動,因此它受人為干擾的因素就比傳統(tǒng)的結構化數(shù)據小得多,其真實性相對來說就比較高,更有利用的價值。

        大數(shù)據時代的到來,影響并改變著我們的世界,有學者對大數(shù)據與檔案管理做過系統(tǒng)的研究,提出檔案館需要融入智慧城市,需要大數(shù)據技術的支持,檔案工作已不能滿足于紙質的工作,需要進一步引進電子化、數(shù)字化程序,從而掌握數(shù)據背后的信息處理和數(shù)據儲存的知識;還有學者雖指出大數(shù)據使檔案管理面臨從紙質化轉為數(shù)字化的挑戰(zhàn),但都沒有涉及具體的實施意見。本文將大數(shù)據與高等院校檔案信息管理工作相結合,針對檔案數(shù)據的存儲與備份,從通過大數(shù)據進行全過程控制、構建新的檔案收集、對檔案信息數(shù)字化管理建立新平臺的建議等方面,結合工作實際,將諸多觀點綜合提煉,對高等院校檔案數(shù)據信息管理工作作了進一步的探究與思考。

        二、當前高校檔案工作管理現(xiàn)狀與存在問題

        (一)檔案數(shù)據信息量巨大,查找利用難

        在大數(shù)據時代背景下,高等院校里的各項工作時時刻刻都在產生著大量的數(shù)據信息,包括圖片數(shù)據、網頁數(shù)據、視頻數(shù)據、音頻數(shù)據、文本文件,等等。這些都屬于檔案管理的數(shù)據信息收集范圍,信息量巨大。然而各個高等院?,F(xiàn)在使用的檔案管理信息系統(tǒng)多數(shù)為C/S或B/S的單一服務器系統(tǒng)架構形式,最多能做磁帶或者光盤的備份。隨著檔案信息資源數(shù)據存儲量的不斷增大,如果在不引入云存儲技術或者服務器集群的前提下,就可能引起磁盤物理存儲容量不足,從而導致檔案信息數(shù)據庫的崩潰。面臨這些巨量且復雜的數(shù)據,如何進行高效的管理是一個難題,我們越來越認識到對所產生的大量數(shù)據進行有效、高質量管理的重要性、迫切性和必要性,而檔案信息數(shù)字化管理尤其重要。隨著檔案數(shù)量的不斷增多,在查找、利用中很難實現(xiàn)需求的即時性、多樣化和高效化。因此,在了解目前檔案管理現(xiàn)狀的同時,發(fā)現(xiàn)檔案管理所存在的問題,把大數(shù)據充分地利用到工作中,實現(xiàn)最佳的工作方法和效果。

        (二)檔案數(shù)據多源異構,系統(tǒng)處理難

        高等院校內部的檔案資源數(shù)據來源廣泛,種類繁雜,包含了高校內部的教學、科研、后勤等日?;顒又T多業(yè)務,各部門的業(yè)務不同,產生的檔案數(shù)據信息也各不相同。據相關資料記載,2012年以來,像表格、文檔、音頻、視頻、網頁等這種非機構化的電子文件所產生的數(shù)據信息,在整個校園網數(shù)據信息中,占85%以上。在紙質檔案時期,所有信息是以“份”、“卷”等進行管理,對存儲的地點、環(huán)境、空間都有要求,查詢材料也有局限性,由于檔案材料紙質管理時代的不穩(wěn)定性,會出現(xiàn)部分資料不能有效保存,進而導致查檔時遇到困難,耽誤正常工作。隨著時代的變遷,檔案管理慢慢由紙質進化到數(shù)字管理,所有格式不同、內容各異的紙質信息都逐步轉換成數(shù)據信息,這每一份數(shù)據信息都是一個重要的數(shù)據源,而且各個數(shù)據源的結構也不盡相同,構成了檔案數(shù)據多源異構的現(xiàn)象,而現(xiàn)有正在使用的檔案管理系統(tǒng)在處理這些不同數(shù)據時就顯得力不從心。

        (三)檔案數(shù)據需求多樣化,工作管理難

        在大數(shù)據的引領下,高等院校各部門、各業(yè)務系統(tǒng),既是檔案數(shù)據信息的生產者,也是檔案數(shù)據信息的使用者,都在利用檔案數(shù)據信息來指導、規(guī)劃、管理教學、科研、校園文化等各個方面的工作。使用者的不盡相同,對各種類型檔案材料的需求也不盡相同,而現(xiàn)有檔案管理體系已經不能滿足當前工作的需求。對于這種多樣化的需求,需要建立一個高科技平臺做支撐,而大數(shù)據時代就為高等院校多樣化的檔案管理提供了一個新平臺,使傳統(tǒng)紙質檔案文件中的“卷、宗”管理升級到數(shù)字檔案下的“關鍵詞、對象、字段”的精細管理,讓傳統(tǒng)的紙質檔案管理發(fā)生翻天覆地的變化,使管理的手段不斷創(chuàng)新、業(yè)務不斷豐富。

        三、高校檔案工作的相關對策與實施策略

        (一)建立高校檔案信息管理中心,設置系統(tǒng)總體架構

        如何利用大數(shù)據信息量巨大、處理快捷、數(shù)據類型多樣的特性,與我們傳統(tǒng)的檔案管理工作有機結合是一個重要課題。在大數(shù)據技術支持下,對還在使用紙質管理的高校檔案信息進行重新規(guī)劃,建設以大數(shù)據、云存儲技術為支撐的高校檔案信息管理中心,是當前最主要和最迫切的任務。檔案信息管理中心是檔案數(shù)據處理加工和數(shù)據分析應用的中心,在總體框架建設上要依托內外網隔離的網絡架構,構建資源整合、互聯(lián)互通、資源共享的統(tǒng)一檔案數(shù)據中心資源庫,構建完善的底層支撐平臺。系統(tǒng)設計按一個基礎支撐環(huán)境、兩個保障體系、五個核心數(shù)據庫、四大應用系統(tǒng)和一個頂層綜合平臺的架構進行(系統(tǒng)總體架構圖見圖1)。

        基礎支撐環(huán)境為高校檔案信息管理中心建設和部署提供基礎設置,包括機房運行環(huán)境、校園網、互聯(lián)網、移動網絡等;檔案標準規(guī)范體系是建立檔案信息管理中心的基礎,大數(shù)據的數(shù)據格式、來源雜亂無章,如何提取、挖掘出有用的信息為我所用,必須依據一定的規(guī)則和規(guī)范進行數(shù)據清洗和提取,因此建立一套檔案標準規(guī)范體系是我們檔案信息管理中心的前提;檔案信息安全體系則是高校檔案信息管理中心建設的安全基礎和重要保證。

        核心數(shù)據庫包括元數(shù)據庫、原始數(shù)據庫、綜合應用數(shù)據庫、主題專題數(shù)據庫以及共享發(fā)布數(shù)據庫,通過合理規(guī)劃數(shù)據庫,對上層應用提供持續(xù)的數(shù)據服務支撐,同時還滿足高并發(fā)處理的性能需求。

        檔案數(shù)據應用系統(tǒng)是基礎性的應用系統(tǒng),主要包括檔案數(shù)據云服務系統(tǒng)、數(shù)據決策支持系統(tǒng)、綜合分析系統(tǒng)和檔案數(shù)據查詢系統(tǒng)四個方面。

        頂層綜合平臺是面向院校各部門、各個業(yè)務系統(tǒng)、各用戶提供綜合性檔案信息數(shù)據服務的高級應用系統(tǒng),包括智能門戶系統(tǒng)和移動應用服務系統(tǒng)。

        (二)規(guī)范高校檔案信息管理中心業(yè)務流程

        如圖2所示,高校檔案信息管理中心的數(shù)據采集主要有兩個途徑,一個是以檔案標準規(guī)范體系為基礎,通過ETL(抽取、轉換、加載)數(shù)據過濾器將院校的歷史檔案數(shù)據、各業(yè)務系統(tǒng)實時產生的數(shù)據和互聯(lián)網相關數(shù)據加載到我們的檔案信息中心核心數(shù)據庫中;另一個途徑是檔案管理人員通過手持終端或者電腦客戶端,依據一定的數(shù)據審核關系直接進行檔案信息的錄入。檔案信息中心的核心數(shù)據庫是我們一切應用的基礎,它對用戶提供檔案數(shù)據綜合查詢、檔案云服務系統(tǒng)、數(shù)據決策系統(tǒng)和綜合分析系統(tǒng)服務。

        (三)加強高校檔案信息管理關鍵技術的應用

        1.檔案信息管理中大數(shù)據的收集。在檔案信息的收集過程中,為了進一步加強檔案材料收集的實效性,可以利用大數(shù)據的Hadoop,HDFS功能,利用分布式客戶端的功能對數(shù)據進行收集;在抽取、轉換、加載的過程中,利用分布式文件系統(tǒng)(DFS)和MAP技術,將相關數(shù)據上傳到分布式服務器中,以確保在對海量的數(shù)據進行抽取時的速度和安全。

        2.檔案信息管理中大數(shù)據的存儲。由于檔案信息量大,數(shù)據規(guī)模龐大,結構復雜,因此必須構建分布式存儲信息系統(tǒng),改變現(xiàn)在以結構化為主體的單一存儲方案,對結構松散、沒有模式的半結構化數(shù)據改為采用面向文檔的分布式key/value存儲引擎來解決,在存儲過程中,要方便增加節(jié)點,實現(xiàn)穩(wěn)步處理,對非結構化數(shù)據采用分布式文件系統(tǒng)進行存儲。對大量的系統(tǒng)碎片數(shù)據進行分類、聚類和相關性分析,并且通過SQL等技術的“數(shù)據壓縮、信息抽取”等方式進行系統(tǒng)碎片識別,增大加強檔案信息管理時識別的針對性和可操作性。

        3.檔案信息管理中大數(shù)據的開發(fā)利用。傳統(tǒng)意義中的檔案信息管理一直保留在檔案材料的目錄管理、材料分類、材料歸檔、材料存儲和簡單的數(shù)據統(tǒng)計查詢階段,而大數(shù)據時代檔案信息管理的重要信息則利用大數(shù)據的RDBMS、HBASE數(shù)據分析與預測技術,可以實現(xiàn)非結構數(shù)據與結構數(shù)據的信息分類、信息聚類,通過SAAS、SOA“云服務器”與電腦、手機平臺的聯(lián)動,使高校檔案信息的使用者能夠實時地利用檔案信息路徑,快捷、方便地獲取自己需要的信息。

        圖1 高校檔案信息管理中心系統(tǒng)總體架構圖

        圖2 高校檔案信息管理中心業(yè)務流程

        四、大數(shù)據背景下高校檔案信息管理的發(fā)展方向與前景

        隨著時代變遷,人類在科學技術方面不斷發(fā)展進步,無論是檔案材料的本身還是檔案信息管理工作自身的特點,都在發(fā)生著令人矚目的巨大變化。大數(shù)據時代給檔案信息管理工作帶來了新的挑戰(zhàn)和改變。

        首先,檔案在其定義上的變化。和傳統(tǒng)的紙質檔案卷冊不同,未來的工作中,檔案是指所有有保存價值的視頻、音頻、文件、數(shù)據信息以及網絡信息。如何使用和利用大數(shù)據,在大數(shù)據的使用中得到什么,這些基本條件都要處理好,否則就會用大量的時間來分析數(shù)據,給我們的工作帶來不便。確定目標后,再利用大數(shù)據工具對檔案進行數(shù)據管理。

        其次,檔案在其服務中的變化。在大數(shù)據時代中,檔案服務會朝著開放性、先進性和多元化方向發(fā)展,檔案服務以客戶個性化的需求為導向,提供網絡化、智慧型的服務。檔案信息中蘊藏著巨大的知識寶藏,正確利用大數(shù)據的服務,可以在信息管理上獲得巨大的突破,使檔案管理中的知識寶藏真正得到挖掘和利用。

        最后,檔案信息管理技術手段的變化。在大數(shù)據時代,檔案信息管理將是利用數(shù)據過濾器、網絡爬蟲等先進技術在云平臺上建設檔案信息系統(tǒng)核心數(shù)據庫,并在此基礎上安排精通檔案信息管理的專業(yè)人員與大數(shù)據開發(fā)公司合作,對各種檔案數(shù)據資源進行挖掘,取得決策支持,用技術手段構建各類信息服務子系統(tǒng),從而全面實現(xiàn)技術手段向知識應用的轉變。

        [1]尹寶君.大數(shù)據時代檔案管理中新媒體與傳統(tǒng)紙媒的融合研究[J].蘭臺世界,2015(07).

        [2]陳明潔.大數(shù)據時代對檔案現(xiàn)代化影響和要求[J].檔案管理,2013(06).

        [3]李小晨.大數(shù)據時代背景下的檔案管理探討[J].云南檔案,2013(08).

        [4]劉文照.大數(shù)據時代檔案管理模式的轉換與創(chuàng)新[J].辦公室業(yè)務,2015(20).

        [5]蘭祝剛.大數(shù)據時代下的檔案工作[J].中國檔案,2014(06).

        [6]施永利.大數(shù)據時代背景下的檔案利用服務研討[J].商,2012(11).

        編輯:鹿風芍

        G271

        A

        2095-7238(2016)06-0119-04

        10.3969/J.ISSN.2095-7238.2016.06.022

        2016-09-12

        猜你喜歡
        信息管理檔案管理數(shù)據庫
        造價信息管理在海外投標中的應用探討
        評《現(xiàn)代物流信息管理與技術》(書評)
        檔案管理中的電子檔案管理
        檔案管理與企業(yè)內部控制關系的思考
        消費導刊(2017年24期)2018-01-31 01:29:20
        數(shù)據庫
        財經(2017年2期)2017-03-10 14:35:35
        在高速公路信息管理中如何做好QC小組活動
        數(shù)據庫
        財經(2016年15期)2016-06-03 07:38:02
        數(shù)據庫
        財經(2016年3期)2016-03-07 07:44:46
        數(shù)據庫
        財經(2016年6期)2016-02-24 07:41:51
        健康檔案管理的“云”前景
        日本亚洲一级中文字幕| 亚洲av免费不卡在线观看| 国产成人午夜高潮毛片| 精品欧洲av无码一区二区三区| 无遮挡边吃摸边吃奶边做 | 亚洲中文久久久久无码| 国产精品久久国产精麻豆| 亚洲国产区中文在线观看| 亚洲国产精彩中文乱码av| 色欲aⅴ亚洲情无码av蜜桃| 亚洲片在线视频| 精品成人av人一区二区三区| 欧美日韩精品一区二区视频| 伊人久久大香线蕉亚洲五月天 | 亚洲av天堂久久精品| 91久久大香伊蕉在人线国产| 亚洲乱码无人区卡1卡2卡3| 国产99视频精品免视看9| 久久久一本精品99久久| 国产一级黄色av影片| 久久精品一区二区三区蜜桃| 天天躁夜夜躁av天天爽| 国产久热精品无码激情| 国产一起色一起爱| 日本视频一区二区三区在线| 成人免费直播| 国产在线高清视频| 亚洲av毛片一区二区久久| 图片小说视频一区二区| 亚洲国产精品无码专区影院| 精品十八禁免费观看| 中文字幕一区二区三区精品在线 | 久久影院午夜理论片无码| 国产乱人伦精品一区二区| 亚洲日日噜噜噜夜夜爽爽| 日本一二三区免费在线| 精品久久久无码中字| 国产一起色一起爱| 国产成人久久蜜一区二区| 中文字幕乱码人妻在线| 国产av一区二区精品凹凸|