文/雷 榮 尹 君
本文立足于基層企業(yè)管理環(huán)境,利用Python的中文分詞工具,分析文檔信息形成的特征和文檔信息利用的特點(diǎn),探尋文檔信息形成場景和利用場景之間的規(guī)律,構(gòu)建用戶畫像和文件之間的關(guān)聯(lián),實(shí)現(xiàn)文檔信息的智能服務(wù)
檔案管理部門管理對象多樣化,包括紙質(zhì)檔案、電子檔案和業(yè)務(wù)系統(tǒng)中在線歸檔的檔案數(shù)據(jù)?!皫缀蹩梢钥隙ǖ氖?未來文檔管理一定是處于多態(tài)并存的局面,因而對管理對象的態(tài)勢感知顯得尤為重要,不同態(tài)別的對象需要與之配套協(xié)同的管理手段和方法?!盵1]面對多態(tài)的管理對象,檔案管理需要采用精細(xì)化的管理方法和手段,探尋智能化的利用服務(wù)方式。雖然檔案利用逐步實(shí)現(xiàn)了電子化和網(wǎng)絡(luò)化,但是仍局限于以文件為單位的利用服務(wù),檔案數(shù)據(jù)的深層次開發(fā)缺乏需求導(dǎo)向。檔案工作者需要掌握一套快速、準(zhǔn)確的響應(yīng)用戶的需求,提供檔案信息智能服務(wù)方法和能力。
在企業(yè)運(yùn)行較為成熟的辦公自動化系統(tǒng)中,提取該系統(tǒng)中核心業(yè)務(wù)數(shù)據(jù)進(jìn)行詞頻分析。在實(shí)際的公文處理活動中,公文的數(shù)據(jù)可以分為發(fā)文形成的數(shù)據(jù)和收文形成的數(shù)據(jù)。選擇公文標(biāo)題和責(zé)任部門(形成部門和承辦部門)兩個維度,分析公文數(shù)據(jù)的形成和處理情況。
在規(guī)范的公文標(biāo)題中包含發(fā)文機(jī)關(guān)名稱、事由和文種這三個要素,其中“事由”信息揭示了公文的主要內(nèi)容。通過數(shù)據(jù)清洗剔除公文標(biāo)題數(shù)據(jù)中的“發(fā)文機(jī)關(guān)名稱”和“文種”信息,對“事由”信息進(jìn)行分詞和統(tǒng)計。
利用Python的結(jié)巴中文分詞,對公文標(biāo)題中的“事由”數(shù)據(jù)進(jìn)行分詞處理并統(tǒng)計出高頻詞匯。按照承辦部門分類統(tǒng)計收文的詞頻結(jié)果,按照形成部門分類統(tǒng)計發(fā)文的分詞結(jié)果,選取人事部門和財務(wù)部門在一定時期內(nèi)形成和處理的公文數(shù)據(jù),經(jīng)過分詞、統(tǒng)計詞頻及數(shù)據(jù)的可視化后結(jié)果見下圖:
財務(wù)部門和人事部門的公文數(shù)據(jù)中“事由”涵蓋了部門基本職能,其中高頻詞反映部門的核心關(guān)鍵業(yè)務(wù)。通過文件標(biāo)題“事由”部分的詞頻分析可以看出:在職能活動中形成了與崗位、職責(zé)高度匹配的文件信息。在企業(yè)組織環(huán)境中,組織中的崗位和職責(zé)賦予了文檔形成和使用者(簡稱文檔用戶)鮮明的特性,正是這些因素構(gòu)成了文檔用戶特有的工作場景。他們在職能活動中處理各種各樣的文件,同時在職能活動中生成各種各樣的文件。
正如上圖財務(wù)部門和人事部門在各自的職能活動中,既需要處理大批與其職責(zé)相關(guān)的文件,也產(chǎn)生了文檔信息的利用需求。部門業(yè)務(wù)活動中形成的公文數(shù)據(jù),能夠展示出這個業(yè)務(wù)活動的前因后果,也反映出部門履職過程和業(yè)務(wù)完成情況。例如:
關(guān)于開展某某活動的通知——起因
關(guān)于印發(fā)《某某活動方案》的通知——經(jīng)過
關(guān)于上報《某某活動總結(jié)》的報告——結(jié)果
在職能活動中,用戶對文檔信息的需求來源于當(dāng)前工作場景;同時需要再現(xiàn)和還原過去相關(guān)社會活動的時間、人物、行為、背景、情景關(guān)系等一系列場景信息。
場景思維就是利用場景來對問題進(jìn)行思考,從需求行為產(chǎn)生的時間和背景等角度,對用戶需求從不同角度和不同維度進(jìn)行分析和理解,探尋本質(zhì)性的需求,并據(jù)此提供符合需求的產(chǎn)品或者服務(wù)。文檔利用工作者一方面積極挖掘企業(yè)文檔中包含的場景信息;另一方面從企業(yè)生產(chǎn)經(jīng)營活動場景出發(fā)分析文檔信息需求,挖掘用戶在特定業(yè)務(wù)場景中文檔信息需求;最后將文檔信息場景和業(yè)務(wù)活動場景相匹配,提供符合場景需求的文檔信息,推送相應(yīng)的文檔信息,提高信息需求和信息產(chǎn)品連接的效率和質(zhì)量,實(shí)現(xiàn)文檔信息利用的智能化。
在復(fù)雜的人類社會實(shí)踐活動中形成了檔案,檔案是社會活動的原始記錄,檔案記錄各種各樣的社會職能活動。檔案記錄了社會活動時間、空間、目的、用途等一系列場景信息。業(yè)務(wù)活動中形成了其特定職責(zé)、業(yè)務(wù)范圍內(nèi)的檔案信息。
黨和政府機(jī)關(guān)在辦理公務(wù)活動中形成了具有特定效力和規(guī)范格式的文件和檔案。這些文檔數(shù)據(jù)一般由“時間、部門、人員、事件、主題”等要素組成,反映了公務(wù)活動起因、經(jīng)過、結(jié)果。可見,檔案形成于社會實(shí)踐的各個場景中,記錄和保存了當(dāng)時的場景信息。
檔案信息的收集、整理、保管、鑒定、統(tǒng)計和提供利用管理工作,都是為了確保檔案信息的完整、準(zhǔn)確、系統(tǒng)和安全,維護(hù)檔案的原始性。文書類電子文件元數(shù)據(jù)方案明確了文書類電子文件形成、交換、歸檔、移交、保管、利用等全過程中元數(shù)據(jù)的設(shè)計、捕獲和著錄要求[2];元數(shù)據(jù)描述記錄了文件的背景、內(nèi)容、結(jié)構(gòu),包括文件生成和管理的全過程的數(shù)據(jù),包括文件、機(jī)構(gòu)和人員、業(yè)務(wù)以及其關(guān)系等數(shù)據(jù)[2]。這些元數(shù)據(jù)記錄了文件形成場景信息,包括文件形成時的組織機(jī)構(gòu)、時間、人員、業(yè)務(wù)、行為及其相互關(guān)系等。文書類電子文件元數(shù)據(jù)的管理過程,既確保元數(shù)據(jù)的規(guī)范和完整,也維護(hù)了文書類文件場景信息的準(zhǔn)確和完整??梢?,檔案工作也是對檔案形成場景信息規(guī)范管理的過程。
檔案利用的過程是通過查找、使用或檢索檔案信息、獲取檔案信息的過程。實(shí)際也就是指檔案工作者通過一定的方式、方法,將檔案信息提供給利用者的過程。檔案利用活動包括檔案管理者、檔案和檔案利用者這三個主體。檔案管理者通過一系列的管理工作保持檔案信息的原始性,通過利用工作來滿足利用者對檔案信息的需求,實(shí)現(xiàn)了檔案的價值。檔案利用者需要通過各類檔案信息還原歷史活動的真實(shí)情景,指導(dǎo)當(dāng)下的社會實(shí)踐活動。
但是在傳統(tǒng)以“關(guān)鍵詞”查詢?yōu)橹鞯睦没顒又?,檔案部門守著浩瀚的文件資料卻不能滿足用戶的需求。這是因?yàn)閭鹘y(tǒng)的檔案工作是以“文件”為單元,以檢索為目標(biāo),通過收集、著錄、分類、編目、提供利用活動開展工作。這種利用方式不能滿足用戶對文檔內(nèi)容信息多維度的智能化需求。特里·庫克認(rèn)為傳統(tǒng)的檔案工作重點(diǎn)是檔案實(shí)體的保管,在后保管時代檔案工作關(guān)注重點(diǎn)將轉(zhuǎn)為:檔案的來源、檔案信息的形成過程、檔案的形成目的、檔案之間的關(guān)聯(lián)關(guān)系和來源部門(單位)之間的職能業(yè)務(wù)關(guān)系,檔案形成部門(單位)、形成者的職責(zé)范圍等[3]。
當(dāng)用戶以一定的角色首次登錄業(yè)務(wù)系統(tǒng)時,系統(tǒng)根據(jù)用戶基本信息(如崗位、職責(zé))結(jié)合業(yè)務(wù)系統(tǒng)中已有的相似角色或歷史角色信息,分析構(gòu)建這個用戶“畫像”。系統(tǒng)定期分析該用戶在系統(tǒng)中形成的信息和處理的信息,不斷地修正用戶“畫像”。系統(tǒng)將具有相關(guān)職責(zé)的用戶活動信息進(jìn)行分析,形成一定主題或一段時期內(nèi)相似的用戶群的“畫像”。這樣在相對穩(wěn)定的組織場景中,通過分析特定職責(zé)用戶信息記錄,積累形成用戶的信息需求特征。
改變傳統(tǒng)的以檢索為目標(biāo)的信息收集和采集方式,注重背景信息的收集。利用信息技術(shù),挖掘用戶在業(yè)務(wù)活動中形成和處理文檔信息的規(guī)律,利用信息技術(shù),分析數(shù)據(jù)特有的場景信息,以此構(gòu)建以特定要素為基礎(chǔ)的文件群,通過特定的算法為每一個用戶推薦其高度關(guān)注的文檔信息。
在用戶日常的業(yè)務(wù)活動中,通過活動場景觸發(fā)特定的用戶畫像,完成需求與信息產(chǎn)品的匹配,形成關(guān)聯(lián)性高度匹配的文檔信息集合推送給用戶,實(shí)現(xiàn)檔案信息服務(wù)的智能化。
在業(yè)務(wù)活動場景中由職能要素關(guān)聯(lián)用戶文檔需求。建立職責(zé)要素的用戶畫像,用戶在職責(zé)要素下形成的文檔群,用戶在職責(zé)要素下處理的文檔群;用戶在職責(zé)活動中觸發(fā)潛在的文檔需求,系統(tǒng)將“形成文檔群”和“處理文檔群”中相匹配的文檔推送給特定的用戶。
當(dāng)然在實(shí)際的業(yè)務(wù)系統(tǒng)中,這里的匹配要素可能不僅僅表現(xiàn)為“職責(zé)”,也可以是“專業(yè)”“學(xué)科”“工作節(jié)點(diǎn)”等。根據(jù)不同的業(yè)務(wù)場景具體分析,我們才能夠滿足用戶需求的多樣性,滿足用戶潛在需求。
總之,文檔管理部門應(yīng)轉(zhuǎn)變思維,立足于企業(yè)信息化建設(shè)中積累的數(shù)據(jù)信息,立足于多樣化的業(yè)務(wù)場景,運(yùn)用成熟的信息技術(shù)分析用戶需求規(guī)律,摸索出適合本企業(yè)文檔信息的開發(fā)模式和智能服務(wù)方式,實(shí)現(xiàn)文檔信息價值,改進(jìn)文檔信息服務(wù)質(zhì)量和效果,提升企業(yè)檔案管理的精細(xì)化水平。