亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        漢字識別技術(shù)在檔案管理工作中應(yīng)用之我見

        2010-07-09 02:22:52段如菲段玉春
        活力 2010年7期
        關(guān)鍵詞:檔案管理工作

        崔 萍 段如菲 段玉春

        [關(guān)鍵詞]漢字識別技術(shù);檔案管理工作;信息資源的應(yīng)用

        漢字識別技術(shù)(簡稱OCR)可以理解為是讓計(jì)算機(jī)認(rèn)字的技術(shù)。它通過光電信號轉(zhuǎn)換,即文本數(shù)據(jù)。

        一、漢字識別技術(shù)的應(yīng)用價(jià)值

        漢字識別技術(shù)的應(yīng)用價(jià)值主要體現(xiàn)在兩個(gè)方面:一方面,把紙質(zhì)檔案上的固定信息變成可以被檢索利用的活信息,為文本數(shù)據(jù)管理技術(shù)提供豐富的數(shù)據(jù)源。

        首先,從庫存檔案的情況來看,近幾十年來形成的大量印刷漢字檔案記載了我們黨和國家的重要?dú)v史,對我國現(xiàn)代化事業(yè)的發(fā)展,對精神文明和物質(zhì)文明的建設(shè)都有著非常重要的利用價(jià)值。但這部分檔案的內(nèi)容都沒有文本數(shù)據(jù),或者說都只是固定在紙質(zhì)載體上的死信息。既使通過掃描以圖像方式存儲(chǔ)于計(jì)算機(jī)中,檢索利用也有不便之處,難于滿足現(xiàn)代社會(huì)對檔案信息的多種利用需求。其次,從辦公自動(dòng)化的發(fā)展情況來看,每年接收的檔案中仍然會(huì)有相當(dāng)數(shù)量的檔案沒有文本文件。漢字識別技術(shù)的應(yīng)用價(jià)值 就是使這兩大部分紙質(zhì)檔案上的固定信息變成可以被檢索利用的活信息,為全文檢索提供數(shù)據(jù),使深層次的開發(fā)利用成為可能,更好地為現(xiàn)代化建設(shè)事業(yè)服務(wù)。

        另一方面,提供了一種新的檔案目錄數(shù)據(jù)的錄入方式。 應(yīng)用計(jì)算機(jī)以來,漢字錄入只有一種方式,即健盤錄入。雖然目前漢字鍵盤錄入的方法有許多種,而且日趨簡便快捷,已是年輕人必備的職業(yè)技能,但是它畢竟屬于一種技能,不僅需要反應(yīng)靈敏,手指靈活,而且要熟記錄入的原則、方法和要領(lǐng)。這對于在檔案部門占有相當(dāng) 比例的中老年同志來說,掌握起來確有難度。因此,鍵盤錄入方式仍然是影響一些檔案部門 建立檔案目錄信息數(shù)據(jù)庫的因素之一。OCR軟件為我們提供了一條新的途徑。它通過“拖拉 ”的方式,將屏幕上文件的目錄項(xiàng)如標(biāo)題、文號、責(zé)任者等直接移植到檔案目錄數(shù)據(jù)庫的相應(yīng)字段中去,簡單易學(xué),一看就會(huì)。遺憾的是手工“拖拉”速度較慢,而且需要即時(shí)掃描或 調(diào)用圖像數(shù)據(jù),所以單一利用這種方式錄入檔案目錄,速度不及熟練錄入員的鍵入速度。但它畢竟是一種新的錄入方式,為建立檔案目錄信息數(shù)據(jù)庫提供了一條前所未有的途徑。

        二、漢字識別后生成文本數(shù)據(jù)的屬性問題

        原始性是檔案的基本屬性。漢字識別后生成的文本數(shù)據(jù)是根據(jù)檔案的本源信息,即固定在紙質(zhì)載體上的漢字信息進(jìn)行加工處理:掃描、識別、校對、修改等工序后形成的復(fù)制加工品, 因此不具有檔案的原始性。

        知識性是檔案的又一個(gè)屬性。漢字識別后生成的文本數(shù)據(jù)如果不計(jì)算人工校對后仍然可能存在的微小誤差,應(yīng)該說具有與檔案原件同等的內(nèi)容,因此具有檔案的知識性。

        漢字識別后生成的文本數(shù)據(jù)是將檔案的內(nèi)容以特殊的物理方式重新記錄在特殊的載體之上,比以文字的方式記錄在紙質(zhì)載體之上更具有便于傳遞、接收、存儲(chǔ)、利用以及不磨損、不丟 失等屬性。因此具有更強(qiáng)的信息性。

        漢字識別后生成的文本數(shù)據(jù)應(yīng)該說,它是一種新型的檔案一次信息的復(fù)制品或編研開發(fā)成果 。但作為一種新型的復(fù)制品或編研開發(fā)成果,因其生成的目的不同,又具有兩種不同的屬性 :當(dāng)以提供利用為目的通過漢字識別建立文本數(shù)據(jù)庫時(shí),其文本數(shù)據(jù)具有類似于匯編類檔案 編研成果的屬性;當(dāng)以編輯出版紙質(zhì)的檔案編研材料如大事記、組織機(jī)構(gòu)沿革、文件匯編等為目的進(jìn)行漢字識別時(shí),其文本數(shù)據(jù)不僅具有類似于檔案編研成果的屬性,而且具有檔案原始性的基本屬性,因?yàn)樗鼈兪怯∷⑵坊虺霭嫖锏谋驹葱畔ⅰS纱丝梢?漢字識別后生成的文本數(shù)據(jù)是一種不同于傳統(tǒng)檔案屬性的新型檔案信息。

        三、漢字識別技術(shù)的應(yīng)用方式

        漢字識別技術(shù)在檔案管理工作中的應(yīng)用,根據(jù)其目前的技術(shù)水平主要適用于近幾十年來印刷漢字檔案內(nèi)容的識別,圖像、文本數(shù)據(jù)的形成、存儲(chǔ)和目錄數(shù)據(jù)的錄入等項(xiàng)工作。

        主要的應(yīng)用方式有:(一)利用者閱讀紙質(zhì)檔案的內(nèi)容之后,對其所需要的內(nèi)容進(jìn)行掃描和漢字識別,或打印出統(tǒng) 一格式的利用摘錄,或直接提供文本拷貝。這種利用方式的優(yōu)點(diǎn)主要有:方便用戶,可減少信息利用過程中的重復(fù)勞動(dòng);不給檔案人員增加建庫的工作負(fù)擔(dān);節(jié)省建庫所需的經(jīng)費(fèi)開支。其缺點(diǎn)主要有:不能為全文檢索提供數(shù)據(jù),實(shí)現(xiàn)深層次開發(fā)檔案信息資源的目的;存在對同一檔案內(nèi)容重復(fù)進(jìn)行掃描和漢字識別的可能性。(二)輸入檔案目錄。這是加快檔案目錄信息數(shù)據(jù)庫建設(shè)的一條新路,能夠使更多的人員從事輸入工作,但輸入速度不甚理想,而且成本費(fèi)用相對較高。(三)掃描、保存圖像并提供利用,只針對利用者需要的圖像內(nèi)容進(jìn)行漢字識別等利用服務(wù)。這種方式必須在已有文件目錄的前提下使用。其優(yōu)點(diǎn)主要有:具有提供原件和提高信息利用效率的雙重優(yōu)勢;檔案人員不承擔(dān)漢字識別后生成的文本數(shù)據(jù)的維護(hù)工作。其缺點(diǎn)主要有:同第一種利用方式的缺點(diǎn);漢字識別技術(shù)要求圖像的光學(xué)分辨率較高,這種高代價(jià)的圖像存儲(chǔ)僅用來滿足用戶利用識別的需要似乎有點(diǎn)得不償失。因此低分辨率的圖像也能進(jìn)行漢字識別,只是識別率相對較低而已。(四)建立文本數(shù)據(jù)庫。這種方式也應(yīng)在已有文件目錄的條件下使用。其優(yōu)點(diǎn)主要有:節(jié)省存儲(chǔ)空間和存儲(chǔ)成本;為全文檢索提供數(shù)據(jù),能夠?qū)崿F(xiàn)深層次開發(fā)利用檔案信息資源的目的。其缺點(diǎn)主要有:建立文本數(shù)據(jù)庫的工作量較大;不能滿足用戶閱讀檔案原件的需求;由于沒有圖像隨時(shí)提供依據(jù),不便于對文本數(shù)據(jù)的準(zhǔn)確性進(jìn)行核實(shí)。(五)輸入目錄并保存圖像。(六)輸入目錄、建立文本數(shù)據(jù)庫。(七)保存圖像、建立文本件數(shù)據(jù)。(八)輸入目錄、保存圖像并建立文本數(shù)據(jù)庫。

        這是充分發(fā)揮OCR軟件功能,深層次開發(fā)利用檔案信息資源的應(yīng)用方式。但工程量較大,人力、資金需求較多,建庫周期較長。 隨著漢字識別技術(shù)水平的提高和應(yīng)用的普及,可能還會(huì)產(chǎn)生新的應(yīng)用方式,但無論使用哪一種方式,都必須符合本單位檔案管理工作的實(shí)際,統(tǒng)籌考慮檔案狀況、人員配備、經(jīng)費(fèi)能力、辦公自動(dòng)化水平、檔案現(xiàn)代化建設(shè)發(fā)展規(guī)劃等方面的因素,以切實(shí)提高檔案信息資源開發(fā)利用能力為目的,這樣才能收到事半功倍的效果?!?

        (編輯/永安)

        猜你喜歡
        檔案管理工作
        淺談如何應(yīng)對疾控中心檔案管理工作的新形勢
        中文信息(2016年11期)2017-02-11 17:09:06
        高校檔案管理工作的創(chuàng)新方略解析
        中職院校檔案管理工作存在的問題及措施
        青春歲月(2016年22期)2016-12-23 10:11:49
        加強(qiáng)新形勢下檔案管理工作的思考
        淺談檔案管理工作內(nèi)容及模式轉(zhuǎn)變
        淺談事業(yè)單位檔案管理的優(yōu)化
        檔案管理人員應(yīng)具備的素質(zhì)
        中國市場(2016年27期)2016-07-16 04:18:37
        關(guān)于做好事業(yè)單位檔案管理工作的思考
        企業(yè)檔案管理工作的探析
        基于大數(shù)據(jù)時(shí)代的檔案管理工作挑戰(zhàn)及機(jī)遇分析
        国产又黄又硬又粗| 亚洲av一二三又爽又爽又色| 一本到亚洲av日韩av在线天堂| 精品久久有码中文字幕| 帮老师解开蕾丝奶罩吸乳视频 | 91色区在线免费观看国产| 成人亚洲精品777777| 精品人体无码一区二区三区| 精品无码人妻久久久一区二区三区 | 伊人久久大香线蕉av不卡| 国产免费久久精品国产传媒| aⅴ色综合久久天堂av色综合| 北条麻妃在线中文字幕| av中文字幕潮喷人妻系列| 精品一区二区三区在线观看视频| 无码高潮少妇毛多水多水免费 | 日本在线中文字幕一区| 日本熟妇另类一区二区三区| 性色av闺蜜一区二区三区| 2021国产成人精品国产| av免费在线观看在线观看| 女人无遮挡裸交性做爰| 国产suv精品一区二人妻| 免费国产黄片视频在线观看| 日产国产亚洲精品系列| 婷婷丁香五月激情综合| 国产人妖视频一区二区| 中文字幕精品亚洲二区| 国产一区二区三区激情视频| 日日碰狠狠添天天爽无码| 天天躁日日操狠狠操欧美老妇 | 日本熟妇色xxxxx日本妇| 好爽…又高潮了毛片免费看| 蜜桃一区二区三区自拍视频| 亚洲毛片在线免费视频| 日日摸天天摸人人看| 亚洲AV成人无码久久精品在| 久久婷婷综合色一区二区| 成年女人vr免费视频| 亚洲国产成人91| 亚洲国产av午夜福利精品一区|