亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        葫蘆島市檔案局國(guó)有企業(yè)退休人員人事檔案數(shù)字化驗(yàn)收方法

        2021-12-28 06:56:47葫蘆島市檔案局李泓博葫蘆島市檔案館
        蘭臺(tái)世界 2021年6期
        關(guān)鍵詞:頁(yè)數(shù)全文數(shù)據(jù)庫(kù)

        □ 葫蘆島市檔案局 李泓博 葫蘆島市檔案館 陶 冶

        一、退休人事檔案數(shù)據(jù)普遍存在的問題

        1.紙質(zhì)人事檔案不規(guī)范。紙質(zhì)檔案是檔案數(shù)字化的基礎(chǔ),如果紙質(zhì)檔案在收集整理過程中出現(xiàn)問題,那么數(shù)字化形成的數(shù)據(jù)必然是不合格的。以人事檔案為例,經(jīng)過數(shù)字化的人事檔案信息錄入電腦后,雖然人事檔案文件題名、編號(hào)、成文日期等信息變得一目了然,但是無法通過這些信息來確認(rèn)分類、頁(yè)碼是否正確以及檔案資料是否收集齊全,仍然需要人工核對(duì),才能確保實(shí)體檔案的齊全、完整。因此,紙質(zhì)檔案不規(guī)范是威脅檔案數(shù)字化的首要問題,然而紙質(zhì)檔案的問題僅能通過檔案數(shù)字化工作得到一定程度修復(fù)或者補(bǔ)充,并不能通過檔案數(shù)字化徹底根除紙質(zhì)檔案存在的問題。

        2.人事檔案目錄信息錄入不完備。檔案目錄信息錄入是人事檔案數(shù)字化工作的重要組成部分,而且直接關(guān)系著人事檔案檢索利用的效果。如何在數(shù)十萬甚至上百萬的人員信息數(shù)據(jù)中檢索出所需要的人事檔案,主要依靠人事檔案目錄數(shù)據(jù)庫(kù)的建設(shè)是否完備。根據(jù)《遼寧省國(guó)有企業(yè)退休人員人事檔案規(guī)范化整理和數(shù)字化工作實(shí)施細(xì)則》(以下簡(jiǎn)稱《實(shí)施細(xì)則》)的要求,人事檔案數(shù)字化目錄錄入項(xiàng)目一般都包括材料名稱、材料形成時(shí)間、文件頁(yè)數(shù)、姓名、身份證號(hào)碼等十幾項(xiàng)內(nèi)容。實(shí)際工作中常見的問題主要有身份證號(hào)錄入有誤、檔案記載出生年月與身份證不一致、性別錄入錯(cuò)誤等,這些信息的準(zhǔn)確與否直接關(guān)系著人事檔案的安全保管和信息檢索。

        3.人事檔案全文數(shù)據(jù)庫(kù)不合格。全文數(shù)據(jù)庫(kù)的問題主要體現(xiàn)在兩個(gè)方面。一方面,全文數(shù)據(jù)庫(kù)文件數(shù)量不合格。在掃描的過程中,由于人員疏忽或系統(tǒng)錯(cuò)誤,經(jīng)常造成掃描形成的圖像數(shù)量與紙質(zhì)檔案數(shù)量不一致的狀況。以2020年葫蘆島市國(guó)有企業(yè)退休人員人事檔案驗(yàn)收情況為例,除經(jīng)過專門檢測(cè)軟件檢驗(yàn)過的檔案數(shù)據(jù),全市100余家國(guó)有企業(yè)退休職工人事檔案數(shù)字化驗(yàn)收一審合格率為0%。掃描過程中極易出現(xiàn)漏掃、多掃的情況,造成掃描頁(yè)數(shù)與檔案目錄記載的頁(yè)數(shù)不一致,這樣輕則造成數(shù)據(jù)重復(fù)冗余,重則造成檔案信息無法查詢。如果掃描圖片數(shù)量不清,一旦在數(shù)據(jù)傳輸或管理時(shí)發(fā)生數(shù)據(jù)丟失,則無法明確交接雙方責(zé)任,為移交工作埋下隱患。另一方面,全文數(shù)據(jù)庫(kù)文件質(zhì)量不合格。在掃描過程中,由于設(shè)備不同、實(shí)體檔案的類型和狀態(tài)不同會(huì)造成掃描形成的圖像質(zhì)量參差不齊,主要體現(xiàn)在掃描圖像的色彩、分辨率、偏斜度等方面。另外,原始圖像上的雜質(zhì)、折痕以及背透等問題都影響著圖像的掃描效果,進(jìn)而影響光學(xué)字符識(shí)別(OCR)的效果。

        4.目錄和全文數(shù)據(jù)庫(kù)關(guān)聯(lián)失效。按照《實(shí)施細(xì)則》的要求,目錄數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)的指針為掛接索引。掛接索引是關(guān)聯(lián)兩個(gè)數(shù)據(jù)庫(kù)的唯一通道,因此掛接索引的準(zhǔn)確率是確保兩個(gè)數(shù)據(jù)相互關(guān)聯(lián)的前提。然而人事檔案掛接索引比一般檔案復(fù)雜,且掛接索引必須100%準(zhǔn)確才能保證數(shù)據(jù)關(guān)聯(lián)。掛接索引形成過程中,英漢符號(hào)的差別、全角半角輸入的差別以及數(shù)位補(bǔ)零之間的差別都會(huì)影響最終的結(jié)果,導(dǎo)致檔案目錄數(shù)據(jù)與檔案圖像無法有效關(guān)聯(lián)。例如,目錄數(shù)據(jù)庫(kù)全宗號(hào)字段在錄入數(shù)據(jù)前多敲入一個(gè)空格鍵,這樣的錯(cuò)誤很難通過肉眼觀察發(fā)現(xiàn),但是會(huì)造成全部數(shù)據(jù)無法實(shí)現(xiàn)鏈接,而且不知從何下手修改數(shù)據(jù)。

        以上四類問題是人事檔案數(shù)字化驗(yàn)收過程中普遍存在的,想要提高退管人事檔案數(shù)字化的質(zhì)量,僅靠嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度,而沒有一套行之有效的驗(yàn)收方法,很可能導(dǎo)致檔案數(shù)字化工作事倍功半,人事檔案的驗(yàn)收無法給予檔案數(shù)據(jù)以合理保證。

        二、國(guó)企退休人員人事檔案數(shù)字化驗(yàn)收方法

        隨著海量的人事檔案數(shù)字化信息不斷生成,檢測(cè)糾錯(cuò)的難度是成幾何倍數(shù)增長(zhǎng)的,即便理論上存在驗(yàn)收方法可以保證檔案數(shù)據(jù)萬無一失,實(shí)踐中在經(jīng)濟(jì)條件和技術(shù)條件的制約下也僅是紙上談兵。因此,通過人事檔案數(shù)字化驗(yàn)收的檔案,驗(yàn)收單位無法對(duì)檔案數(shù)據(jù)給予絕對(duì)保證,而是按照《實(shí)施細(xì)則》的相關(guān)要求,結(jié)合現(xiàn)有檔案工作實(shí)際情況,通過一定的信息技術(shù)檢測(cè)后,給予高標(biāo)準(zhǔn)的合理保證。以下結(jié)合葫蘆島市退管人事檔案數(shù)字化驗(yàn)收工作實(shí)際,按照技術(shù)實(shí)現(xiàn)的難易程度或投入資金量列出四種驗(yàn)收方法,供各位檔案同仁參考。本文所討論的人事檔案數(shù)字化驗(yàn)收方法,僅限于對(duì)人事檔案數(shù)字化數(shù)據(jù)的檢驗(yàn),對(duì)于紙質(zhì)檔案已經(jīng)整理完畢,但既沒有錄入目錄信息又沒有掃描成為圖像的紙質(zhì)檔案無法進(jìn)行檢測(cè),不在本文討論范圍之內(nèi)。

        1.方案一:格式審查+數(shù)量關(guān)系試算+數(shù)據(jù)抽檢。格式審查是指對(duì)國(guó)有企業(yè)退休人員人事檔案數(shù)字化形成的檔案數(shù)據(jù)的格式對(duì)照《實(shí)施細(xì)則》相關(guān)要求進(jìn)行形式上的審查,即審查目錄數(shù)據(jù)庫(kù)中必錄字段是否齊全完整、非空字段有無缺失信息、掛接索引格式是否正確、全文數(shù)據(jù)庫(kù)中圖片存儲(chǔ)格式以及圖片命名格式是否正確。數(shù)量關(guān)系試算是指通過計(jì)算案卷目錄總頁(yè)數(shù)、份目錄頁(yè)數(shù)以及掃描圖片數(shù)三者相等的數(shù)量關(guān)系,去檢驗(yàn)案卷目錄總頁(yè)數(shù)與份目錄總頁(yè)數(shù)之間、目錄總頁(yè)數(shù)與掃描圖片數(shù)之間是否相等,從而判斷兩個(gè)數(shù)據(jù)庫(kù)有關(guān)數(shù)據(jù)是否準(zhǔn)確。數(shù)據(jù)抽查是對(duì)目錄數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)進(jìn)行抽檢,檢測(cè)目錄與圖像的關(guān)聯(lián)是否準(zhǔn)確、圖像掃描質(zhì)量是否達(dá)標(biāo)。通過以上操作,能在一定程度上保證人事檔案數(shù)據(jù)的準(zhǔn)確性,雖然這套方案幾乎不需要投入任何經(jīng)費(fèi),且不依賴檢測(cè)系統(tǒng),但這套簡(jiǎn)易驗(yàn)收方法基本上是依靠驗(yàn)收人員的觀察來判斷合格與否,因此保證程度不高,即便是通過驗(yàn)收的數(shù)據(jù),未來檔案利用過程中發(fā)現(xiàn)錯(cuò)誤的概率也很高。

        2.方案二:?jiǎn)蜗蛳到y(tǒng)檢測(cè)+數(shù)量關(guān)系試算。單向系統(tǒng)檢測(cè)是指通過檔案檢測(cè)系統(tǒng),從目錄數(shù)據(jù)庫(kù)出發(fā),自動(dòng)進(jìn)行格式審查、非空校驗(yàn)、身份證號(hào)檢測(cè)以及掛接索引有效性等檢測(cè)。目錄數(shù)據(jù)庫(kù)合格后,檢測(cè)系統(tǒng)根據(jù)掛接索引去關(guān)聯(lián)圖像,并檢測(cè)圖像分辨率、色彩以及存儲(chǔ)格式,保證與目錄數(shù)據(jù)庫(kù)成功掛接的全文數(shù)據(jù)庫(kù)圖像質(zhì)量,再對(duì)兩個(gè)數(shù)據(jù)庫(kù)內(nèi)的數(shù)量關(guān)系進(jìn)行試算。這套方案需要借助專業(yè)的檔案信息管理或檢測(cè)系統(tǒng),目前市場(chǎng)上常見的檔案管理軟件稍作修改后,基本可以實(shí)現(xiàn)單向檢測(cè)的功能,但單向檢測(cè)是以全部目錄數(shù)據(jù)庫(kù)中的數(shù)據(jù)為基準(zhǔn),去測(cè)試全文數(shù)據(jù)庫(kù)數(shù)據(jù)的有效性和準(zhǔn)確性,并不能反向從全文數(shù)據(jù)庫(kù)向目錄數(shù)據(jù)庫(kù)發(fā)起測(cè)試。這就難免造成一些數(shù)據(jù)錯(cuò)誤無法檢測(cè)出來,例如全文數(shù)據(jù)庫(kù)中存在掃描圖片,但是目錄數(shù)據(jù)庫(kù)中并未輸入對(duì)應(yīng)的目錄信息,這樣的錯(cuò)誤單向檢測(cè)系統(tǒng)是無法發(fā)現(xiàn)的。通過數(shù)量關(guān)系試算可以有效彌補(bǔ)單向檢測(cè)系統(tǒng)的不足,通過兩步檢測(cè)可以在合理的置信區(qū)間內(nèi)推定通過數(shù)字化驗(yàn)收的數(shù)據(jù)是準(zhǔn)確無誤的。但這套方案的弊端就是定位較為困難,通過數(shù)量關(guān)系測(cè)算發(fā)現(xiàn)的問題,無法精準(zhǔn)定位,需檢測(cè)人員具備較強(qiáng)的檔案業(yè)務(wù)和計(jì)算機(jī)操作能力,逐步嘗試以縮小范圍。在實(shí)際工作中,經(jīng)常是在幾萬條目錄和幾十萬張圖片中尋找錯(cuò)誤,費(fèi)時(shí)耗力,效率很低。雖然這套方案存在著不足之處,但是相比于其他方法并綜合考慮資金和人力成本,此方案的性價(jià)比最高,且實(shí)用性、兼容性較好。因此,現(xiàn)實(shí)工作中葫蘆島市檔案局采用了該套方案。

        3.方案三:雙向系統(tǒng)檢測(cè)。雙向系統(tǒng)檢測(cè)是指實(shí)現(xiàn)檔案數(shù)字化目錄數(shù)據(jù)庫(kù)與全文數(shù)據(jù)庫(kù)雙向檢測(cè),既包括從每一條目錄信息檢測(cè)對(duì)應(yīng)的每一張圖片,也包括從每一張圖片反向檢測(cè)對(duì)應(yīng)的目錄信息。這樣單靠一套檢測(cè)系統(tǒng)就能確保兩個(gè)數(shù)據(jù)庫(kù)內(nèi)所有的數(shù)據(jù)都經(jīng)過檢驗(yàn),同時(shí)都與對(duì)應(yīng)數(shù)據(jù)庫(kù)的信息建立了關(guān)聯(lián),全面實(shí)現(xiàn)自動(dòng)檢測(cè)和精準(zhǔn)報(bào)錯(cuò),大大提高數(shù)據(jù)糾錯(cuò)以及數(shù)字化驗(yàn)收的效率,并且通過驗(yàn)收檢測(cè)的數(shù)據(jù)比較接近絕對(duì)準(zhǔn)確,完全達(dá)到合理保證的要求。然而這套系統(tǒng)存在著兩項(xiàng)不足,一方面,目前此類軟件需要定向開發(fā),且開發(fā)費(fèi)用較高,同時(shí)雙向檢測(cè)對(duì)計(jì)算機(jī)運(yùn)算能力要求較高,當(dāng)檢測(cè)數(shù)據(jù)量較大時(shí),配置較低的電腦很可能無法流暢運(yùn)行該系統(tǒng)甚至導(dǎo)致系統(tǒng)崩潰;另一方面,這套系統(tǒng)雖然可以保證數(shù)字化掃描圖片與目錄正確關(guān)聯(lián)掛接索引正確,但圖片實(shí)際內(nèi)容與目錄記載信息仍有可能不一致。相比于方案二,方案三有更高的效率,大大節(jié)省人力和時(shí)間,但對(duì)于檔案數(shù)據(jù)準(zhǔn)確性的提升不大,方案的整體性價(jià)比并不高,比較適用于設(shè)備較為先進(jìn)且檔案數(shù)量龐大的檔案館。

        4.方案四:雙向系統(tǒng)檢測(cè)+OCR檢驗(yàn)。OCR檢驗(yàn)是通過光學(xué)字符識(shí)別(OCR)技術(shù),將圖像中的字符識(shí)別成為計(jì)算機(jī)可處理的字符,并將識(shí)別出的信息與目錄數(shù)據(jù)庫(kù)內(nèi)的信息進(jìn)行對(duì)比,從根本上確保圖片內(nèi)的信息與目錄對(duì)應(yīng)字段信息保持一致。能通過雙向系統(tǒng)檢測(cè)+OCR檢驗(yàn)驗(yàn)收合格的數(shù)據(jù),無限接近于零差錯(cuò),只是由于目錄數(shù)據(jù)庫(kù)記載信息有限,無法全面反映文件全部?jī)?nèi)容,所以理論上目錄數(shù)據(jù)沒有記載的信息部分仍然存在錯(cuò)誤的可能性。方案四對(duì)驗(yàn)收軟硬件設(shè)備要求極高,部分技術(shù)尚在研究階段,尚不具備大規(guī)模推廣應(yīng)用條件,但是此類解決方案代表未來檔案數(shù)字化發(fā)展的方向,目前屬于學(xué)科前沿。

        猜你喜歡
        頁(yè)數(shù)全文數(shù)據(jù)庫(kù)
        全文中文摘要
        《語(yǔ)文建設(shè)》(下半月)2020年1—12月總目錄
        全文中文摘要
        應(yīng)該從第幾頁(yè)看起
        青年再造
        數(shù)據(jù)庫(kù)
        嘟嘟真會(huì)想
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        国产精品三级在线观看| 欧美噜噜久久久xxx| 成人做受视频试看60秒| 欧美z0zo人禽交欧美人禽交| 无码一区二区丝袜| 亚洲第一区二区精品三区在线| 综合色就爱涩涩涩综合婷婷| 久久婷婷国产剧情内射白浆| 亚洲AV无码乱码精品国产草莓| 日本精品中文字幕人妻| 丰满人妻被两个按摩师| 亚洲日本va午夜在线电影| 国产精品丝袜美女在线观看| 免费女女同黄毛片av网站| 久久久亚洲欧洲日产国码二区| 日本高清色倩视频在线观看| 99成人无码精品视频| 国产av剧情精品麻豆| 国内精品久久久久伊人av| 亚洲欧美国产双大乳头| 欧美成人a视频免费专区| 久久精品免费视频亚洲| 中文字幕日韩精品一区二区三区| 在线看亚洲十八禁网站| 亚洲中文字幕有综合久久| 在线观看视频日本一区二区| 中文字幕免费不卡二区| 国产精品久久久久…| 白白色发布视频在线播放| 亚洲精品一区二区国产精华液| 99精品国产兔费观看久久99| 亚洲色欲色欲欲www在线| 亚洲一区二区三区偷拍厕所| 国产亚洲欧美精品久久久| 巨爆乳中文字幕爆乳区| 日韩精品视频av在线观看| 精品无人码麻豆乱码1区2区| 国产成人精品日本亚洲18| 成av人片一区二区三区久久| 日本三级香港三级人妇99| 欧洲日本一线二线三线区本庄铃|