牟凱旋
摘 要:檔案鑒定雖然有著成熟的理論體系和較為完整的規(guī)范,但囿于實踐取向與鑒定者能力的不同,其工作質(zhì)量與客觀性存有不足。通過知識挖掘,將檔案鑒定中的知識規(guī)范化地表述出來,然后以之為基礎(chǔ),構(gòu)建并應(yīng)用檔案初級鑒定系統(tǒng),能夠以系統(tǒng)的規(guī)范化操作來提升檔案鑒定工作的質(zhì)量與客觀性。
關(guān)鍵詞:知識挖掘;檔案鑒定;系統(tǒng)
Abstract: Despite the developed theories and specifications, the quality and objectiveness of the archival appraisal is weakened by the actual situation and the disparity of the operators ability. Based on the formulation of the knowledge in archival appraisal practice by knowledge mining, maybe we can improve the quality and objectiveness of archival appraisal practice by structuring and applying an primary archival appraisal system.
Keywords: Knowledge Mining; Archival Appraisal;System
知識挖掘,是知識管理領(lǐng)域的重要內(nèi)容,是信息處理方面的新技術(shù)。知識挖掘的目標(biāo)非常明確,那就是對目標(biāo)對象進(jìn)行分析處理,進(jìn)而獲得有實際意義的知識。在信息時代,知識挖掘是非常有益的,因為它有助于從龐大的數(shù)據(jù)、信息中獲取有用的知識。知識挖掘的知識抽取、分析與聚類整合過程對于目前的檔案鑒定工作有著一定的啟發(fā)意義。當(dāng)前的檔案鑒定工作存在著明顯的主觀性與手動性,其客觀性與工作效率存在著一定的不足。將知識挖掘應(yīng)用到檔案鑒定工作中,構(gòu)建有效的檔案初級鑒定系統(tǒng),對于提高檔案鑒定工作的質(zhì)量與客觀性大有裨益。
1 知識挖掘概述
1.1 概念。關(guān)于知識挖掘的定義較多,其中Usama M.Fayyyad給出的定義:“知識挖掘是從數(shù)據(jù)集中識別出有效的新穎的潛在有用的以及最終可理解的模式的非平凡過程”,被公認(rèn)為較為中肯。知識挖掘可根據(jù)信息載體的不同分為圖像知識挖掘、數(shù)據(jù)挖掘和文本挖掘。相比于已經(jīng)形成較為成熟的程序化技術(shù)方法的數(shù)據(jù)挖掘,知識挖掘領(lǐng)域目前的著眼點主要在于隱性知識的挖掘,尚未形成模式化的技術(shù)方法,更注重依據(jù)研究對象的特點,有針對性地開展具有一定主觀性的挖掘活動。
1.2 技術(shù)方法。雖然上文述及知識挖掘與數(shù)據(jù)挖掘相比,體現(xiàn)出一定的主觀性,但是知識挖掘涉及數(shù)據(jù)庫技術(shù)、人工智能、統(tǒng)計學(xué)等多種學(xué)科的技術(shù)基礎(chǔ),這決定了它能夠以現(xiàn)代化的信息技術(shù)構(gòu)建出比傳統(tǒng)的經(jīng)驗總結(jié)更具客觀性和科學(xué)性的方法體系。目前常用的知識挖掘的技術(shù)方法有聚類分析、神經(jīng)網(wǎng)絡(luò)方法、決策樹方法、遺傳算法、規(guī)則推理等方法。統(tǒng)計學(xué)方法與人工智能在知識挖掘中有著重要的作用,它們的應(yīng)用有助于人們通過知識挖掘?qū)Τ槿〕龅拇罅繚撛谥R進(jìn)行高效的分析。
1.3 流程。目前對知識挖掘流程的研究尚未成熟,尚未產(chǎn)生公認(rèn)的知識挖掘流程體系。一套完整的知識挖掘流程應(yīng)當(dāng)包含確定應(yīng)用領(lǐng)域、建立目標(biāo)數(shù)據(jù)集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘、數(shù)據(jù)評價這幾個步驟。
2 當(dāng)前檔案鑒定的主要理論與方法
檔案鑒定理論迄今發(fā)展已經(jīng)較為成熟。早期法國在檔案管理工作中確立的來源原則和普魯士的邁斯奈爾提出的“高齡檔案應(yīng)當(dāng)受到保護(hù)”的觀點為檔案鑒定提供了初步的框架,這兩條準(zhǔn)則至今仍然適用。其后的檔案鑒定方法更為成熟,更為系統(tǒng),對檔案鑒定工作更具現(xiàn)實的指導(dǎo)意義。波蘭檔案學(xué)家卡林斯基提出了“職能鑒定論”,認(rèn)為檔案的價值取決于其產(chǎn)生機(jī)關(guān)的職能與地位。這一理論對檔案鑒定實踐具有重要的、突出的意義。英國檔案學(xué)家謝拉里·詹金遜根據(jù)古典檔案理論,提出檔案工作者只是檔案的保管者、保護(hù)者,不宜對檔案進(jìn)行鑒定,檔案鑒定應(yīng)當(dāng)是行政人員的職責(zé)。美國的謝倫伯格在總結(jié)前人研究成果的基礎(chǔ)上提出了雙重價值鑒定理論,將檔案的價值區(qū)分為對其產(chǎn)生機(jī)關(guān)的第一價值(初始價值)和對其他利用者的第二價值(從屬價值),第二價值又分為證據(jù)價值和情報價值。謝倫伯格的理論對檔案價值進(jìn)行了全新解讀,使得檔案的價值系統(tǒng)地、有層次地展現(xiàn)在人們眼前,對現(xiàn)今的檔案鑒定理論與實踐有著顯著的影響。
以上這些理論形成了檔案鑒定方面的基礎(chǔ)性理論,在此之后的檔案鑒定理論在這些理論之上有了新的發(fā)展。社會分析和職能鑒定理論是對卡林斯基職能鑒定理論的繼承與發(fā)展,其將檔案鑒定的重心放在了對檔案形成機(jī)關(guān)職能的系統(tǒng)化分析,區(qū)分不同的職能、活動與計劃及其之間的聯(lián)系,并依其不同的重要性來對檔案進(jìn)行鑒定。
總的說來,根據(jù)上述理論以及檔案工作實踐,檔案人員在對檔案進(jìn)行鑒定時主要依據(jù)其形成機(jī)關(guān)的職能地位或檔案本身的價值來進(jìn)行鑒定。檔案人員通過對鑒定理論的內(nèi)化,以及在實踐中的探索來對檔案進(jìn)行鑒定的活動,表明檔案鑒定活動中存在著公認(rèn)的隱性知識,只有獲得了這種隱性知識的人員才能對檔案進(jìn)行有效的鑒定。對這種隱性知識進(jìn)行挖掘有助于我們構(gòu)建檔案初級鑒定系統(tǒng)。
3 檔案初級鑒定系統(tǒng)構(gòu)想
筆者所定義的檔案初級鑒定系統(tǒng),是基于目前的檔案鑒定理論與實踐經(jīng)驗所構(gòu)建的一個自動化系統(tǒng)。該系統(tǒng)將此前檔案工作者鑒定檔案時所依賴的知識素養(yǎng)與工作經(jīng)驗通過知識挖掘整合到其中,進(jìn)而依據(jù)擬定的規(guī)則對檔案進(jìn)行初步的鑒定,輸出鑒定結(jié)果,并將未能形成鑒定結(jié)論的檔案交由檔案工作者進(jìn)行鑒定。所謂“初級”,一方面是指這套系統(tǒng)可能尚不成熟,還需不斷完善,提高準(zhǔn)確性;另一方面是指這套系統(tǒng)在檔案鑒定工作實踐中,可能只是輔助工具,無法徹底取代人工鑒定。
但是,這套系統(tǒng)也有其積極意義?,F(xiàn)行檔案鑒定體系下,檔案形成部門以及檔案管理部門都有可能涉及鑒定工作,而檔案鑒定人員的理論素養(yǎng)與實踐經(jīng)驗卻是參差不齊的,即使是有著長期檔案鑒定工作經(jīng)驗的人員,也可能在實際操作中遵循著不同的標(biāo)準(zhǔn),這樣可能有損檔案鑒定的質(zhì)量與客觀性。而檔案初級鑒定系統(tǒng)則可以彌補(bǔ)這一不足,同時也能顯著地提高工作效率。
3.1 檔案鑒定知識挖掘。構(gòu)建檔案初級鑒定系統(tǒng),首先應(yīng)當(dāng)結(jié)合鑒定理論,將鑒定實踐經(jīng)驗顯性化、系統(tǒng)化。檔案鑒定相關(guān)的知識非常豐富,包括檔案鑒定理論,檔案鑒定工作標(biāo)準(zhǔn)、規(guī)范或細(xì)則,檔案保管期限表等顯性知識和檔案鑒定人員的實踐經(jīng)驗等隱性知識。這些信息的聚集,為知識挖掘提供了條件。檔案鑒定人員經(jīng)驗相比于其他的信息集,較為零散,但也能夠有效地記錄、組織。在檔案鑒定活動中,無論是從檔案形成機(jī)關(guān)的職能地位,還是從檔案本身的價值來進(jìn)行鑒定,檔案鑒定的流程應(yīng)當(dāng)是固定的、系統(tǒng)的,從固定流程中的最初環(huán)節(jié)逐級向下推導(dǎo),將各個環(huán)節(jié)所有的可能組合都記錄下來,則能基本總結(jié)出檔案鑒定相關(guān)的經(jīng)驗。
在建立包含檔案鑒定相關(guān)顯性知識與隱性知識數(shù)據(jù)庫之后,應(yīng)當(dāng)對其中數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)庫中的數(shù)據(jù)可能存在冗余、錯誤,必須去粗取精、去偽存真。其間的數(shù)據(jù)也可能只是量的堆積,而缺乏明確的關(guān)系網(wǎng)絡(luò)。比如檔案鑒定工作細(xì)則中可能存在著一定的行政事務(wù)性規(guī)范,這些與知識發(fā)現(xiàn)的目標(biāo)相關(guān)性較弱,應(yīng)當(dāng)降低其重要性,或者直接去除。而來自不同的檔案鑒定人員的經(jīng)驗記錄可能存在缺乏科學(xué)性,甚至相互沖突的內(nèi)容,應(yīng)將這些經(jīng)驗記錄進(jìn)行規(guī)范化的統(tǒng)一表述,然后對其應(yīng)進(jìn)行分析比對,謹(jǐn)慎篩選。
檔案鑒定知識挖掘的核心在于將檔案鑒定工作中的隱性知識系統(tǒng)地抽取出來,并以系統(tǒng)能夠理解的方式進(jìn)行處理與表述。在具體的檔案管理工作實踐中,檔案形成部門與檔案管理部門一般都有較為穩(wěn)定的業(yè)務(wù)工作聯(lián)系,檔案真?zhèn)舞b定較為少見,檔案價值鑒定是檔案鑒定工作的主要內(nèi)容。在日常的檔案鑒定工作中,檔案鑒定人員通常利用檔案保管期限表來確定檔案價值與保管期限。檔案保管期限表對不同部門、不同具體類型文件的價值與保管期限作了較為明確的規(guī)定。不同的部門,其職能輕重有別。同一部門,在處理重要性不同的具體事務(wù)時產(chǎn)生的檔案的價值也是有區(qū)別的。服務(wù)全局的部門產(chǎn)生的檔案、核心部門產(chǎn)生的檔案,其價值較高。輔助性部門、邊緣性部門產(chǎn)生的檔案的價值較低。同一部門內(nèi)部不同文件,其價值也有不同,譬如機(jī)關(guān)辦公室,年度工作總結(jié)、計劃與一般性的宣傳教育及培訓(xùn)文件的價值應(yīng)當(dāng)是有區(qū)別的,在具體的實踐操作中,其保管期限也很有可能是不同的。對于會計、設(shè)備等專門性檔案,其檔案保管期限表也對不同來源與類型文件的保管期限做出了規(guī)定。通過區(qū)分檔案的不同來源與類型能夠?qū)n案價值進(jìn)行初步的鑒定。對于涉及多個部門或半獨立部門等檔案來源較為復(fù)雜的情況,以及在檔案保管期限表下難以對文件類型進(jìn)行歸類的情況,則需要檔案鑒定人員以其經(jīng)驗進(jìn)行判定。對于某些具體的文件,譬如因應(yīng)突發(fā)性事務(wù)而成立的臨時性機(jī)構(gòu)產(chǎn)生的文件,其鑒定則需要鑒定人員對具體文件的內(nèi)容進(jìn)行判別,包括為處理該項事務(wù)而涉及的領(lǐng)導(dǎo)層級、部門職能與地位、內(nèi)容是否關(guān)乎全局工作或核心工作等幾個方面,從而來對其價值進(jìn)行鑒定。
不同機(jī)構(gòu)有不同的工作實踐情況,因而其檔案鑒定標(biāo)準(zhǔn)可能是有區(qū)別的。但同一行業(yè)、同一業(yè)務(wù)系統(tǒng),其鑒定標(biāo)準(zhǔn)應(yīng)該是有共性的,是能夠進(jìn)行標(biāo)準(zhǔn)化規(guī)范的。同一機(jī)構(gòu)內(nèi)部,檔案管理部門與不同的檔案形成部門,其標(biāo)準(zhǔn)應(yīng)當(dāng)統(tǒng)一,并且在實踐中得到切實遵守。對于檔案管理部門來說,進(jìn)行前端控制,將工作延伸到檔案形成部門的文件管理工作中,必然能提高檔案鑒定工作的質(zhì)量與效率。但在實際工作中,這很難實現(xiàn),鮮有先例。設(shè)計一套能夠替代或輔助檔案鑒定人員開展鑒定工作的系統(tǒng)能夠提高檔案鑒定工作的質(zhì)量與效率,保證在某一機(jī)構(gòu)內(nèi)部或某行業(yè)系統(tǒng)內(nèi)檔案鑒定的規(guī)范性與客觀性。
3.2 檔案初級鑒定系統(tǒng)構(gòu)想。對于檔案初級鑒定系統(tǒng),本文只是提出一種構(gòu)想,重點在于其工作模塊與運作邏輯,并未試圖建立完整的技術(shù)框架。本文的自動鑒定系統(tǒng)構(gòu)想,只涉及檔案的價值鑒定,而沒有涉及真?zhèn)舞b定,主要適用于紙質(zhì)檔案。
3.2.1 檔案初級鑒定系統(tǒng)功能分析。檔案初級鑒定系統(tǒng)功能主要有來源與類型定位和內(nèi)容分析。要實現(xiàn)這兩項功能,需要首先建立兩套數(shù)據(jù)庫,能夠區(qū)分價值層級的來源與類型庫和關(guān)鍵詞庫。來源與類型定位,主要是掃描提取檔案的來源與類型信息,并與數(shù)據(jù)庫中的信息進(jìn)行比對,確定其來源,以及在某一來源下的具體檔案類型,從而對檔案進(jìn)行準(zhǔn)確的定位,確定其價值。檔案內(nèi)容分析,包括關(guān)鍵詞與文摘的分析。當(dāng)不能對檔案進(jìn)行準(zhǔn)確定位,無法鑒定其價值時,系統(tǒng)開始進(jìn)行檔案內(nèi)容分析。對檔案的關(guān)鍵詞與文摘等信息進(jìn)行掃描提取,與系統(tǒng)關(guān)鍵詞庫進(jìn)行比對,從而確定其保管期限。
3.2.2 檔案初級鑒定系統(tǒng)模塊分析。檔案初級鑒定系統(tǒng)主要包含著錄模塊、鑒定對象描述轉(zhuǎn)換模塊、檔案來源與類型定位模塊、檔案內(nèi)容分析模塊、鑒定結(jié)果輸出模塊。著錄模塊主要是根據(jù)相應(yīng)著錄規(guī)則,將紙質(zhì)檔案的標(biāo)題、時間、責(zé)任者、文種、檔號、主題詞、關(guān)鍵詞,甚至文摘等信息輸入系統(tǒng)中形成可供系統(tǒng)鑒定的基本單元。鑒定對象描述轉(zhuǎn)換模塊將用戶著錄的檔案信息的語法規(guī)范進(jìn)行審核,并在審核通過后將其轉(zhuǎn)換成系統(tǒng)能夠識別的形式。檔案來源與類型定位模塊提取檔案的來源與定位等基本信息,根據(jù)系統(tǒng)確立的檔案保管期限規(guī)則進(jìn)行定位,從而確定其價值與保管期限。對于不能進(jìn)行定位的被鑒定對象,將其關(guān)鍵詞組合與系統(tǒng)關(guān)鍵詞庫進(jìn)行比對,根據(jù)系統(tǒng)關(guān)鍵詞庫中不同關(guān)鍵詞組合所對應(yīng)的價值層級,從而對被鑒定對象開展價值鑒定。若系統(tǒng)無法依據(jù)來源與類型庫和關(guān)鍵詞庫對被鑒定對象進(jìn)行鑒定,直接將未能鑒定的結(jié)果發(fā)送到結(jié)果輸出模塊。
結(jié)果輸出模塊,主要是對輸出檔案鑒定的結(jié)果,區(qū)分不同檔案的保管期限,將無法鑒定的檔案反饋給用戶,同時輸出鑒定結(jié)果統(tǒng)計。檔案初級鑒定系統(tǒng)鑒定流程如圖所示。
檔案初級鑒定系統(tǒng)鑒定流程圖
4 結(jié)束語
本文所嘗試構(gòu)建的檔案初級鑒定系統(tǒng)意在通過系統(tǒng)的規(guī)范化操作,盡可能地消除因為實踐取向與鑒定者能力的差異而導(dǎo)致的檔案鑒定工作質(zhì)量與客觀性不足的問題。檔案鑒定在本質(zhì)上是一種較為主觀性的活動,因為檔案價值是難以量化認(rèn)定的。經(jīng)典的檔案鑒定理論對具體檔案價值的判斷也可能不是完全一致的。對于主觀性活動而言,無論實施主體在能力上是否對等,其結(jié)果都有可能因人而異。但是,無論這項工作的主觀性多強(qiáng),在一個機(jī)構(gòu)中,其長期的檔案鑒定實踐一般都能在不斷的試錯與學(xué)習(xí)中探索出一套能夠持續(xù)運行,且為各方接受的操作方案,盡管可能存在著一些或者能夠及時消除,或者需要不斷完善的誤差。這種方案一般是經(jīng)驗式的,難以形成知識體系并進(jìn)行系統(tǒng)的傳承。若能對這種經(jīng)驗式的知識進(jìn)行抽取、挖掘,并構(gòu)建一套以其為基礎(chǔ)的自動鑒定系統(tǒng),則能消除鑒定工作中的主觀性,保證鑒定工作的質(zhì)量。當(dāng)然,筆者深知,一套所謂的鑒定系統(tǒng)并不能一勞永逸地解決鑒定工作中存在的所有問題,但希望這能提供有益的啟發(fā)。
(作者單位:武漢理工大學(xué)檔案館 來稿日期:2014-04-12)
但是,這套系統(tǒng)也有其積極意義?,F(xiàn)行檔案鑒定體系下,檔案形成部門以及檔案管理部門都有可能涉及鑒定工作,而檔案鑒定人員的理論素養(yǎng)與實踐經(jīng)驗卻是參差不齊的,即使是有著長期檔案鑒定工作經(jīng)驗的人員,也可能在實際操作中遵循著不同的標(biāo)準(zhǔn),這樣可能有損檔案鑒定的質(zhì)量與客觀性。而檔案初級鑒定系統(tǒng)則可以彌補(bǔ)這一不足,同時也能顯著地提高工作效率。
3.1 檔案鑒定知識挖掘。構(gòu)建檔案初級鑒定系統(tǒng),首先應(yīng)當(dāng)結(jié)合鑒定理論,將鑒定實踐經(jīng)驗顯性化、系統(tǒng)化。檔案鑒定相關(guān)的知識非常豐富,包括檔案鑒定理論,檔案鑒定工作標(biāo)準(zhǔn)、規(guī)范或細(xì)則,檔案保管期限表等顯性知識和檔案鑒定人員的實踐經(jīng)驗等隱性知識。這些信息的聚集,為知識挖掘提供了條件。檔案鑒定人員經(jīng)驗相比于其他的信息集,較為零散,但也能夠有效地記錄、組織。在檔案鑒定活動中,無論是從檔案形成機(jī)關(guān)的職能地位,還是從檔案本身的價值來進(jìn)行鑒定,檔案鑒定的流程應(yīng)當(dāng)是固定的、系統(tǒng)的,從固定流程中的最初環(huán)節(jié)逐級向下推導(dǎo),將各個環(huán)節(jié)所有的可能組合都記錄下來,則能基本總結(jié)出檔案鑒定相關(guān)的經(jīng)驗。
在建立包含檔案鑒定相關(guān)顯性知識與隱性知識數(shù)據(jù)庫之后,應(yīng)當(dāng)對其中數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)庫中的數(shù)據(jù)可能存在冗余、錯誤,必須去粗取精、去偽存真。其間的數(shù)據(jù)也可能只是量的堆積,而缺乏明確的關(guān)系網(wǎng)絡(luò)。比如檔案鑒定工作細(xì)則中可能存在著一定的行政事務(wù)性規(guī)范,這些與知識發(fā)現(xiàn)的目標(biāo)相關(guān)性較弱,應(yīng)當(dāng)降低其重要性,或者直接去除。而來自不同的檔案鑒定人員的經(jīng)驗記錄可能存在缺乏科學(xué)性,甚至相互沖突的內(nèi)容,應(yīng)將這些經(jīng)驗記錄進(jìn)行規(guī)范化的統(tǒng)一表述,然后對其應(yīng)進(jìn)行分析比對,謹(jǐn)慎篩選。
檔案鑒定知識挖掘的核心在于將檔案鑒定工作中的隱性知識系統(tǒng)地抽取出來,并以系統(tǒng)能夠理解的方式進(jìn)行處理與表述。在具體的檔案管理工作實踐中,檔案形成部門與檔案管理部門一般都有較為穩(wěn)定的業(yè)務(wù)工作聯(lián)系,檔案真?zhèn)舞b定較為少見,檔案價值鑒定是檔案鑒定工作的主要內(nèi)容。在日常的檔案鑒定工作中,檔案鑒定人員通常利用檔案保管期限表來確定檔案價值與保管期限。檔案保管期限表對不同部門、不同具體類型文件的價值與保管期限作了較為明確的規(guī)定。不同的部門,其職能輕重有別。同一部門,在處理重要性不同的具體事務(wù)時產(chǎn)生的檔案的價值也是有區(qū)別的。服務(wù)全局的部門產(chǎn)生的檔案、核心部門產(chǎn)生的檔案,其價值較高。輔助性部門、邊緣性部門產(chǎn)生的檔案的價值較低。同一部門內(nèi)部不同文件,其價值也有不同,譬如機(jī)關(guān)辦公室,年度工作總結(jié)、計劃與一般性的宣傳教育及培訓(xùn)文件的價值應(yīng)當(dāng)是有區(qū)別的,在具體的實踐操作中,其保管期限也很有可能是不同的。對于會計、設(shè)備等專門性檔案,其檔案保管期限表也對不同來源與類型文件的保管期限做出了規(guī)定。通過區(qū)分檔案的不同來源與類型能夠?qū)n案價值進(jìn)行初步的鑒定。對于涉及多個部門或半獨立部門等檔案來源較為復(fù)雜的情況,以及在檔案保管期限表下難以對文件類型進(jìn)行歸類的情況,則需要檔案鑒定人員以其經(jīng)驗進(jìn)行判定。對于某些具體的文件,譬如因應(yīng)突發(fā)性事務(wù)而成立的臨時性機(jī)構(gòu)產(chǎn)生的文件,其鑒定則需要鑒定人員對具體文件的內(nèi)容進(jìn)行判別,包括為處理該項事務(wù)而涉及的領(lǐng)導(dǎo)層級、部門職能與地位、內(nèi)容是否關(guān)乎全局工作或核心工作等幾個方面,從而來對其價值進(jìn)行鑒定。
不同機(jī)構(gòu)有不同的工作實踐情況,因而其檔案鑒定標(biāo)準(zhǔn)可能是有區(qū)別的。但同一行業(yè)、同一業(yè)務(wù)系統(tǒng),其鑒定標(biāo)準(zhǔn)應(yīng)該是有共性的,是能夠進(jìn)行標(biāo)準(zhǔn)化規(guī)范的。同一機(jī)構(gòu)內(nèi)部,檔案管理部門與不同的檔案形成部門,其標(biāo)準(zhǔn)應(yīng)當(dāng)統(tǒng)一,并且在實踐中得到切實遵守。對于檔案管理部門來說,進(jìn)行前端控制,將工作延伸到檔案形成部門的文件管理工作中,必然能提高檔案鑒定工作的質(zhì)量與效率。但在實際工作中,這很難實現(xiàn),鮮有先例。設(shè)計一套能夠替代或輔助檔案鑒定人員開展鑒定工作的系統(tǒng)能夠提高檔案鑒定工作的質(zhì)量與效率,保證在某一機(jī)構(gòu)內(nèi)部或某行業(yè)系統(tǒng)內(nèi)檔案鑒定的規(guī)范性與客觀性。
3.2 檔案初級鑒定系統(tǒng)構(gòu)想。對于檔案初級鑒定系統(tǒng),本文只是提出一種構(gòu)想,重點在于其工作模塊與運作邏輯,并未試圖建立完整的技術(shù)框架。本文的自動鑒定系統(tǒng)構(gòu)想,只涉及檔案的價值鑒定,而沒有涉及真?zhèn)舞b定,主要適用于紙質(zhì)檔案。
3.2.1 檔案初級鑒定系統(tǒng)功能分析。檔案初級鑒定系統(tǒng)功能主要有來源與類型定位和內(nèi)容分析。要實現(xiàn)這兩項功能,需要首先建立兩套數(shù)據(jù)庫,能夠區(qū)分價值層級的來源與類型庫和關(guān)鍵詞庫。來源與類型定位,主要是掃描提取檔案的來源與類型信息,并與數(shù)據(jù)庫中的信息進(jìn)行比對,確定其來源,以及在某一來源下的具體檔案類型,從而對檔案進(jìn)行準(zhǔn)確的定位,確定其價值。檔案內(nèi)容分析,包括關(guān)鍵詞與文摘的分析。當(dāng)不能對檔案進(jìn)行準(zhǔn)確定位,無法鑒定其價值時,系統(tǒng)開始進(jìn)行檔案內(nèi)容分析。對檔案的關(guān)鍵詞與文摘等信息進(jìn)行掃描提取,與系統(tǒng)關(guān)鍵詞庫進(jìn)行比對,從而確定其保管期限。
3.2.2 檔案初級鑒定系統(tǒng)模塊分析。檔案初級鑒定系統(tǒng)主要包含著錄模塊、鑒定對象描述轉(zhuǎn)換模塊、檔案來源與類型定位模塊、檔案內(nèi)容分析模塊、鑒定結(jié)果輸出模塊。著錄模塊主要是根據(jù)相應(yīng)著錄規(guī)則,將紙質(zhì)檔案的標(biāo)題、時間、責(zé)任者、文種、檔號、主題詞、關(guān)鍵詞,甚至文摘等信息輸入系統(tǒng)中形成可供系統(tǒng)鑒定的基本單元。鑒定對象描述轉(zhuǎn)換模塊將用戶著錄的檔案信息的語法規(guī)范進(jìn)行審核,并在審核通過后將其轉(zhuǎn)換成系統(tǒng)能夠識別的形式。檔案來源與類型定位模塊提取檔案的來源與定位等基本信息,根據(jù)系統(tǒng)確立的檔案保管期限規(guī)則進(jìn)行定位,從而確定其價值與保管期限。對于不能進(jìn)行定位的被鑒定對象,將其關(guān)鍵詞組合與系統(tǒng)關(guān)鍵詞庫進(jìn)行比對,根據(jù)系統(tǒng)關(guān)鍵詞庫中不同關(guān)鍵詞組合所對應(yīng)的價值層級,從而對被鑒定對象開展價值鑒定。若系統(tǒng)無法依據(jù)來源與類型庫和關(guān)鍵詞庫對被鑒定對象進(jìn)行鑒定,直接將未能鑒定的結(jié)果發(fā)送到結(jié)果輸出模塊。
結(jié)果輸出模塊,主要是對輸出檔案鑒定的結(jié)果,區(qū)分不同檔案的保管期限,將無法鑒定的檔案反饋給用戶,同時輸出鑒定結(jié)果統(tǒng)計。檔案初級鑒定系統(tǒng)鑒定流程如圖所示。
檔案初級鑒定系統(tǒng)鑒定流程圖
4 結(jié)束語
本文所嘗試構(gòu)建的檔案初級鑒定系統(tǒng)意在通過系統(tǒng)的規(guī)范化操作,盡可能地消除因為實踐取向與鑒定者能力的差異而導(dǎo)致的檔案鑒定工作質(zhì)量與客觀性不足的問題。檔案鑒定在本質(zhì)上是一種較為主觀性的活動,因為檔案價值是難以量化認(rèn)定的。經(jīng)典的檔案鑒定理論對具體檔案價值的判斷也可能不是完全一致的。對于主觀性活動而言,無論實施主體在能力上是否對等,其結(jié)果都有可能因人而異。但是,無論這項工作的主觀性多強(qiáng),在一個機(jī)構(gòu)中,其長期的檔案鑒定實踐一般都能在不斷的試錯與學(xué)習(xí)中探索出一套能夠持續(xù)運行,且為各方接受的操作方案,盡管可能存在著一些或者能夠及時消除,或者需要不斷完善的誤差。這種方案一般是經(jīng)驗式的,難以形成知識體系并進(jìn)行系統(tǒng)的傳承。若能對這種經(jīng)驗式的知識進(jìn)行抽取、挖掘,并構(gòu)建一套以其為基礎(chǔ)的自動鑒定系統(tǒng),則能消除鑒定工作中的主觀性,保證鑒定工作的質(zhì)量。當(dāng)然,筆者深知,一套所謂的鑒定系統(tǒng)并不能一勞永逸地解決鑒定工作中存在的所有問題,但希望這能提供有益的啟發(fā)。
(作者單位:武漢理工大學(xué)檔案館 來稿日期:2014-04-12)
但是,這套系統(tǒng)也有其積極意義?,F(xiàn)行檔案鑒定體系下,檔案形成部門以及檔案管理部門都有可能涉及鑒定工作,而檔案鑒定人員的理論素養(yǎng)與實踐經(jīng)驗卻是參差不齊的,即使是有著長期檔案鑒定工作經(jīng)驗的人員,也可能在實際操作中遵循著不同的標(biāo)準(zhǔn),這樣可能有損檔案鑒定的質(zhì)量與客觀性。而檔案初級鑒定系統(tǒng)則可以彌補(bǔ)這一不足,同時也能顯著地提高工作效率。
3.1 檔案鑒定知識挖掘。構(gòu)建檔案初級鑒定系統(tǒng),首先應(yīng)當(dāng)結(jié)合鑒定理論,將鑒定實踐經(jīng)驗顯性化、系統(tǒng)化。檔案鑒定相關(guān)的知識非常豐富,包括檔案鑒定理論,檔案鑒定工作標(biāo)準(zhǔn)、規(guī)范或細(xì)則,檔案保管期限表等顯性知識和檔案鑒定人員的實踐經(jīng)驗等隱性知識。這些信息的聚集,為知識挖掘提供了條件。檔案鑒定人員經(jīng)驗相比于其他的信息集,較為零散,但也能夠有效地記錄、組織。在檔案鑒定活動中,無論是從檔案形成機(jī)關(guān)的職能地位,還是從檔案本身的價值來進(jìn)行鑒定,檔案鑒定的流程應(yīng)當(dāng)是固定的、系統(tǒng)的,從固定流程中的最初環(huán)節(jié)逐級向下推導(dǎo),將各個環(huán)節(jié)所有的可能組合都記錄下來,則能基本總結(jié)出檔案鑒定相關(guān)的經(jīng)驗。
在建立包含檔案鑒定相關(guān)顯性知識與隱性知識數(shù)據(jù)庫之后,應(yīng)當(dāng)對其中數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)庫中的數(shù)據(jù)可能存在冗余、錯誤,必須去粗取精、去偽存真。其間的數(shù)據(jù)也可能只是量的堆積,而缺乏明確的關(guān)系網(wǎng)絡(luò)。比如檔案鑒定工作細(xì)則中可能存在著一定的行政事務(wù)性規(guī)范,這些與知識發(fā)現(xiàn)的目標(biāo)相關(guān)性較弱,應(yīng)當(dāng)降低其重要性,或者直接去除。而來自不同的檔案鑒定人員的經(jīng)驗記錄可能存在缺乏科學(xué)性,甚至相互沖突的內(nèi)容,應(yīng)將這些經(jīng)驗記錄進(jìn)行規(guī)范化的統(tǒng)一表述,然后對其應(yīng)進(jìn)行分析比對,謹(jǐn)慎篩選。
檔案鑒定知識挖掘的核心在于將檔案鑒定工作中的隱性知識系統(tǒng)地抽取出來,并以系統(tǒng)能夠理解的方式進(jìn)行處理與表述。在具體的檔案管理工作實踐中,檔案形成部門與檔案管理部門一般都有較為穩(wěn)定的業(yè)務(wù)工作聯(lián)系,檔案真?zhèn)舞b定較為少見,檔案價值鑒定是檔案鑒定工作的主要內(nèi)容。在日常的檔案鑒定工作中,檔案鑒定人員通常利用檔案保管期限表來確定檔案價值與保管期限。檔案保管期限表對不同部門、不同具體類型文件的價值與保管期限作了較為明確的規(guī)定。不同的部門,其職能輕重有別。同一部門,在處理重要性不同的具體事務(wù)時產(chǎn)生的檔案的價值也是有區(qū)別的。服務(wù)全局的部門產(chǎn)生的檔案、核心部門產(chǎn)生的檔案,其價值較高。輔助性部門、邊緣性部門產(chǎn)生的檔案的價值較低。同一部門內(nèi)部不同文件,其價值也有不同,譬如機(jī)關(guān)辦公室,年度工作總結(jié)、計劃與一般性的宣傳教育及培訓(xùn)文件的價值應(yīng)當(dāng)是有區(qū)別的,在具體的實踐操作中,其保管期限也很有可能是不同的。對于會計、設(shè)備等專門性檔案,其檔案保管期限表也對不同來源與類型文件的保管期限做出了規(guī)定。通過區(qū)分檔案的不同來源與類型能夠?qū)n案價值進(jìn)行初步的鑒定。對于涉及多個部門或半獨立部門等檔案來源較為復(fù)雜的情況,以及在檔案保管期限表下難以對文件類型進(jìn)行歸類的情況,則需要檔案鑒定人員以其經(jīng)驗進(jìn)行判定。對于某些具體的文件,譬如因應(yīng)突發(fā)性事務(wù)而成立的臨時性機(jī)構(gòu)產(chǎn)生的文件,其鑒定則需要鑒定人員對具體文件的內(nèi)容進(jìn)行判別,包括為處理該項事務(wù)而涉及的領(lǐng)導(dǎo)層級、部門職能與地位、內(nèi)容是否關(guān)乎全局工作或核心工作等幾個方面,從而來對其價值進(jìn)行鑒定。
不同機(jī)構(gòu)有不同的工作實踐情況,因而其檔案鑒定標(biāo)準(zhǔn)可能是有區(qū)別的。但同一行業(yè)、同一業(yè)務(wù)系統(tǒng),其鑒定標(biāo)準(zhǔn)應(yīng)該是有共性的,是能夠進(jìn)行標(biāo)準(zhǔn)化規(guī)范的。同一機(jī)構(gòu)內(nèi)部,檔案管理部門與不同的檔案形成部門,其標(biāo)準(zhǔn)應(yīng)當(dāng)統(tǒng)一,并且在實踐中得到切實遵守。對于檔案管理部門來說,進(jìn)行前端控制,將工作延伸到檔案形成部門的文件管理工作中,必然能提高檔案鑒定工作的質(zhì)量與效率。但在實際工作中,這很難實現(xiàn),鮮有先例。設(shè)計一套能夠替代或輔助檔案鑒定人員開展鑒定工作的系統(tǒng)能夠提高檔案鑒定工作的質(zhì)量與效率,保證在某一機(jī)構(gòu)內(nèi)部或某行業(yè)系統(tǒng)內(nèi)檔案鑒定的規(guī)范性與客觀性。
3.2 檔案初級鑒定系統(tǒng)構(gòu)想。對于檔案初級鑒定系統(tǒng),本文只是提出一種構(gòu)想,重點在于其工作模塊與運作邏輯,并未試圖建立完整的技術(shù)框架。本文的自動鑒定系統(tǒng)構(gòu)想,只涉及檔案的價值鑒定,而沒有涉及真?zhèn)舞b定,主要適用于紙質(zhì)檔案。
3.2.1 檔案初級鑒定系統(tǒng)功能分析。檔案初級鑒定系統(tǒng)功能主要有來源與類型定位和內(nèi)容分析。要實現(xiàn)這兩項功能,需要首先建立兩套數(shù)據(jù)庫,能夠區(qū)分價值層級的來源與類型庫和關(guān)鍵詞庫。來源與類型定位,主要是掃描提取檔案的來源與類型信息,并與數(shù)據(jù)庫中的信息進(jìn)行比對,確定其來源,以及在某一來源下的具體檔案類型,從而對檔案進(jìn)行準(zhǔn)確的定位,確定其價值。檔案內(nèi)容分析,包括關(guān)鍵詞與文摘的分析。當(dāng)不能對檔案進(jìn)行準(zhǔn)確定位,無法鑒定其價值時,系統(tǒng)開始進(jìn)行檔案內(nèi)容分析。對檔案的關(guān)鍵詞與文摘等信息進(jìn)行掃描提取,與系統(tǒng)關(guān)鍵詞庫進(jìn)行比對,從而確定其保管期限。
3.2.2 檔案初級鑒定系統(tǒng)模塊分析。檔案初級鑒定系統(tǒng)主要包含著錄模塊、鑒定對象描述轉(zhuǎn)換模塊、檔案來源與類型定位模塊、檔案內(nèi)容分析模塊、鑒定結(jié)果輸出模塊。著錄模塊主要是根據(jù)相應(yīng)著錄規(guī)則,將紙質(zhì)檔案的標(biāo)題、時間、責(zé)任者、文種、檔號、主題詞、關(guān)鍵詞,甚至文摘等信息輸入系統(tǒng)中形成可供系統(tǒng)鑒定的基本單元。鑒定對象描述轉(zhuǎn)換模塊將用戶著錄的檔案信息的語法規(guī)范進(jìn)行審核,并在審核通過后將其轉(zhuǎn)換成系統(tǒng)能夠識別的形式。檔案來源與類型定位模塊提取檔案的來源與定位等基本信息,根據(jù)系統(tǒng)確立的檔案保管期限規(guī)則進(jìn)行定位,從而確定其價值與保管期限。對于不能進(jìn)行定位的被鑒定對象,將其關(guān)鍵詞組合與系統(tǒng)關(guān)鍵詞庫進(jìn)行比對,根據(jù)系統(tǒng)關(guān)鍵詞庫中不同關(guān)鍵詞組合所對應(yīng)的價值層級,從而對被鑒定對象開展價值鑒定。若系統(tǒng)無法依據(jù)來源與類型庫和關(guān)鍵詞庫對被鑒定對象進(jìn)行鑒定,直接將未能鑒定的結(jié)果發(fā)送到結(jié)果輸出模塊。
結(jié)果輸出模塊,主要是對輸出檔案鑒定的結(jié)果,區(qū)分不同檔案的保管期限,將無法鑒定的檔案反饋給用戶,同時輸出鑒定結(jié)果統(tǒng)計。檔案初級鑒定系統(tǒng)鑒定流程如圖所示。
檔案初級鑒定系統(tǒng)鑒定流程圖
4 結(jié)束語
本文所嘗試構(gòu)建的檔案初級鑒定系統(tǒng)意在通過系統(tǒng)的規(guī)范化操作,盡可能地消除因為實踐取向與鑒定者能力的差異而導(dǎo)致的檔案鑒定工作質(zhì)量與客觀性不足的問題。檔案鑒定在本質(zhì)上是一種較為主觀性的活動,因為檔案價值是難以量化認(rèn)定的。經(jīng)典的檔案鑒定理論對具體檔案價值的判斷也可能不是完全一致的。對于主觀性活動而言,無論實施主體在能力上是否對等,其結(jié)果都有可能因人而異。但是,無論這項工作的主觀性多強(qiáng),在一個機(jī)構(gòu)中,其長期的檔案鑒定實踐一般都能在不斷的試錯與學(xué)習(xí)中探索出一套能夠持續(xù)運行,且為各方接受的操作方案,盡管可能存在著一些或者能夠及時消除,或者需要不斷完善的誤差。這種方案一般是經(jīng)驗式的,難以形成知識體系并進(jìn)行系統(tǒng)的傳承。若能對這種經(jīng)驗式的知識進(jìn)行抽取、挖掘,并構(gòu)建一套以其為基礎(chǔ)的自動鑒定系統(tǒng),則能消除鑒定工作中的主觀性,保證鑒定工作的質(zhì)量。當(dāng)然,筆者深知,一套所謂的鑒定系統(tǒng)并不能一勞永逸地解決鑒定工作中存在的所有問題,但希望這能提供有益的啟發(fā)。
(作者單位:武漢理工大學(xué)檔案館 來稿日期:2014-04-12)