亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        企業(yè)數(shù)字檔案信息數(shù)據(jù)挖掘與風險控制

        2015-07-23 19:45:14茹敏敏
        檔案天地 2015年7期
        關鍵詞:數(shù)據(jù)挖掘關聯(lián)檔案管理

        茹敏敏

        企業(yè)檔案工作作為企業(yè)管理的一部分,必須適應現(xiàn)代企業(yè)和新時期的發(fā)展需要,樹立新的觀念,建立新的體制,運用新技術。利用數(shù)據(jù)挖掘技術,進行企業(yè)檔案管理并嚴密控制風險是拓展企業(yè)檔案管理的一條新途徑。

        數(shù)據(jù)挖掘技術是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程,它是通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)和模式識別等諸多方法來實現(xiàn)。

        一、數(shù)據(jù)挖掘的功能

        數(shù)據(jù)挖掘通過預測未來趨勢及行為,做出預測性的、基于知識的決策。數(shù)據(jù)挖掘的目標是從數(shù)據(jù)庫中發(fā)現(xiàn)隱含的、有意義的知識,按其功能可分為以下幾類。

        1、關聯(lián)分析

        關聯(lián)分析能尋找到數(shù)據(jù)庫中大量數(shù)據(jù)的相關聯(lián)系,常用的一種技術為關聯(lián)規(guī)則和序列模式。關聯(lián)規(guī)則是發(fā)現(xiàn)一個事物與其他事物間的相互關聯(lián)性或相互依賴性。

        2、聚類

        輸入的數(shù)據(jù)并無任何類型標記,聚類就是按一定的規(guī)則將數(shù)據(jù)劃分為合理的集合,即將對象分組為多個類或簇,使得在同一個簇中的對象之間具有較高的相似度,而在不同簇中的對象差別很大。聚類技術主要包括傳統(tǒng)的模式識別方法和數(shù)學分類學。

        3、自動預測趨勢和行為

        數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中進行分類和預測,尋找預測性信息,自動地提出描述重要數(shù)據(jù)類的模型或預測未來的數(shù)據(jù)趨勢,這樣以往需要進行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結論。

        4、概念描述

        對于數(shù)據(jù)庫中龐雜的數(shù)據(jù),人們期望以簡潔的描述形式來描述匯集的數(shù)據(jù)集。概念描述就是對某類對象的內(nèi)涵進行描述并概括出這類對象的有關特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對象的共同特征,后者描述不同類對象之間的區(qū)別。生成一個類的特征性只涉及該類對象中所有對象的共性。生成區(qū)別性描述的方法很多,如決策樹方法、遺傳算法等。

        5、偏差檢測

        數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫中檢測這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常實例、不滿足規(guī)則的特例、觀測結果與模型預測值的偏差、量值隨時間的變化等。偏差檢測的基本方法是尋找觀測結果與參照值之間有意義的差別。這常用于金融銀行業(yè)中檢測欺詐行為,或市場分析中分析特殊消費者的消費習慣。

        二、數(shù)據(jù)挖掘在企業(yè)檔案管理中的應用

        1、資源類數(shù)據(jù)包括館藏檔案經(jīng)過數(shù)字化加工而產(chǎn)生的各類電子檔案、電子文件中心中存儲的各類電子檔案、檔案軟件收集的信息、檔案信息網(wǎng)建設和維護信息。我們從企業(yè)檔案用戶的信息需求出發(fā),數(shù)據(jù)挖掘為企業(yè)檔案館全面掌握和準確理解檔案用戶的信息需求提供了方法。

        (1) 利用Web訪問信息挖掘技術發(fā)現(xiàn)其中的關聯(lián)模式、序列模式和Web訪問趨勢等,構建多維視圖的用戶興趣模型。從而可以確定檔案信息或服務受歡迎的程度,發(fā)現(xiàn)用戶訪問模式和用戶需求的趨勢,從不同側(cè)面來研究用戶的信息需求,為優(yōu)化檔案館的檔案信息資源建設提供了科學依據(jù)。

        (2) 收集企業(yè)檔案網(wǎng)web服務器保留的用戶注冊信息、訪問記錄,以及有關用戶與系統(tǒng)交互的信息等原始數(shù)據(jù),經(jīng)過清洗、濃縮和轉(zhuǎn)換形成便于統(tǒng)計分析的用戶查閱數(shù)據(jù)庫、日志數(shù)據(jù)庫、用戶定制信息庫、用戶反饋信息等各種數(shù)據(jù)集合。

        2、從建設企業(yè)檔案館館藏信息資源出發(fā),數(shù)據(jù)挖掘為企業(yè)檔案館提供了選擇一條科學發(fā)展道路的重要依據(jù)。

        (1) 利用檔案網(wǎng)和檔案管理軟件訪問信息的挖掘分析出檔案資源的利用率,將利用率高、需求量大的傳統(tǒng)載體檔案優(yōu)先數(shù)字化。例如:通過對檔案信息的訪問記錄、檢索請求中用戶請求失敗的數(shù)據(jù)進行分析,按類統(tǒng)計檔案拒用集和頻繁利用集,結合聚集算法發(fā)現(xiàn)館藏資源的缺漏,有針對性地補充和豐富檔案信息資源。

        (2) 在企業(yè)檔案管理過程中利用文本挖掘,運用關聯(lián)、分類、聚類等方法,從海量檔案信息中按照相關專題進行挖掘、分類、加工、整理和有序化重組,構建特色檔案信息庫及各類專題檔案信息庫等。

        3、從做好企業(yè)檔案館信息管理工作的角度出發(fā),數(shù)據(jù)挖掘為優(yōu)化館藏信息和對未來工作的預測發(fā)揮重要作用。

        (1) 在提供利用環(huán)節(jié)中,對用戶每次借閱的信息進行關聯(lián)分析,發(fā)現(xiàn)各類檔案信息之間的關聯(lián)規(guī)則或比例關系,這樣可以進一步優(yōu)化館藏信息。

        (2) 開展企業(yè)檔案館館藏信息文本特征的建立、特征提取、特征匹配、特征集縮減和模型評價工作,實現(xiàn)對大量文檔集合的內(nèi)容進行總結、分類、聚類、關聯(lián)分析、分布分析,通過歸納與總結,發(fā)現(xiàn)的知識可以為未來檔案工作的趨勢進行預測。

        三、企業(yè)檔案管理信息數(shù)據(jù)挖掘技術應用的風險控制

        提前預防,在風險還沒有出現(xiàn)的時候就進行遏制是規(guī)避風險最有效的方式,也是最經(jīng)濟的方式,對于電子檔案來說,應該以其自身的潛在缺陷為根據(jù)來實施控制管理,保證內(nèi)部信息的安全可靠,主要措施有:

        1.積極引進最新技術。數(shù)據(jù)挖掘技術應用在工作過程中存在很多風險,而規(guī)避風險的最好的辦法就是引進新的技術,新技術可以使電子信息檔案更加安全可靠。

        2.規(guī)范管理,提高檔案質(zhì)量。一要規(guī)范歸檔材料收集工作。要制定、完善、健全收集制度,嚴格按照文件材料分類方案、歸檔范圍、保管期限的規(guī)定收集。二要規(guī)范檔案整理工作。要嚴格按照各類檔案管理要求進行整理,做到組卷合理、案卷(件)內(nèi)文件排列有序、案卷標題簡明、保管期限準確、案卷(件)封面、卷內(nèi)文件目錄、案卷(件)裝訂結實美觀。三要規(guī)范檔案管理工作。要實行各種門類、載體檔案集中統(tǒng)一管理,方便檔案的保管和利用。

        3.及時消除風險。為了確保信息檔案數(shù)據(jù)的安全性,及時消除潛在的風險是非常重要的,在計算機維修期內(nèi),企業(yè)尤其要注意隨時可能存在的風險,主動采取應對措施。

        4.及時進行預防和保護。為了及時消除危險電子信息檔案的因素,有效的避免信息數(shù)據(jù)受到外界因素的破壞,保證信息的安全可靠。要組織檔案管理人員定期或不定期地深入企業(yè)檢查指導檔案工作,發(fā)現(xiàn)問題,要及時通報,督促整改,力促規(guī)范。

        5.分散風險的措施

        在電子信息檔案管理中,還有一種經(jīng)常使用的規(guī)避風險的措施就是轉(zhuǎn)移策略,所謂轉(zhuǎn)移策略實質(zhì)上是一種風險的分散,即把風險轉(zhuǎn)到其他的地方,以此來把已經(jīng)存在的風險降到最低,一般而言,能夠從多個角度對風險轉(zhuǎn)移的方法實施修正,如:修改配置模式、購買保險、外包給其他機構、或者與提供商簽署服務合同等等。經(jīng)過這樣的處理之后,我們可以把復雜的風險問題進行簡化,再對原先實施的電子信息檔案管理策略優(yōu)化改進,創(chuàng)造更加先進的電子信息檔案管理系統(tǒng)。此外,還可以與網(wǎng)絡供應商互相協(xié)調(diào),讓供應商的安全服務符合電子信息檔案的使用需要。

        (作者單位:平山縣安全生產(chǎn)監(jiān)督管理局)

        猜你喜歡
        數(shù)據(jù)挖掘關聯(lián)檔案管理
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        “一帶一路”遞進,關聯(lián)民生更緊
        當代陜西(2019年15期)2019-09-02 01:52:00
        檔案管理中的電子檔案管理
        奇趣搭配
        檔案管理與企業(yè)內(nèi)部控制關系的思考
        消費導刊(2017年24期)2018-01-31 01:29:20
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        健康檔案管理的“云”前景
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        久久久亚洲精品无码| 国产麻豆一区二区三区在线播放 | 欧美丝袜激情办公室在线观看| 白色橄榄树在线阅读免费| 精品一区二区av在线| 2019nv天堂香蕉在线观看| 麻豆国产在线精品国偷产拍| 国产亚洲精品久久久久久久久动漫| 国产亚洲日本人在线观看| 亚洲av色香蕉一区二区三区软件| 2020国产在视频线自在拍| 四川丰满妇女毛片四川话| 久久精品国产亚洲一区二区| 欧美久久中文字幕| 中文字幕丰满人妻被公强| 中文字幕一区二区中文| 亚洲中文字幕无码av| a国产一区二区免费入口| 特级毛片全部免费播放a一级| 日本高清不卡二区三区| 国产香蕉视频在线播放| 亚洲日本va中文字幕| 国产精品一区二区韩国AV| 在线免费观看视频播放| 日本在线观看一二三区| 疯狂做受xxxx国产| 亚洲色大网站www永久网站| 亚洲综合综合在线| 午夜免费观看一区二区三区| 国产亚洲精品久久久久久国模美| 欧美国产一区二区三区激情无套| 蜜桃在线播放免费一区二区三区| 久久2020精品免费网站| 亚洲av中文无码乱人伦在线观看| 东京热人妻一区二区三区| 麻豆国产乱人伦精品一区二区 | 老熟妇嗷嗷叫91九色| 影音先锋久久久久av综合网成人| 又粗又粗又黄又硬又深色的| 久久这里都是精品一区| 亚洲av网站在线免费观看|