薛瑋璐
(秦皇島日報(bào)社 河北 秦皇島 066000)
電子檔案用于生成并記錄人們?nèi)粘K纬傻臋n案信息資料[1],它依托于計(jì)算機(jī)系統(tǒng),可以實(shí)時(shí)進(jìn)行檔案信息內(nèi)容的存儲(chǔ)和提取。隨著電子檔案數(shù)量的劇增,若還是采用傳統(tǒng)檔案信息查詢的方式,由于頻繁的查詢和翻閱,則很容易對原始檔案信息資料造成損壞,并且所需要查詢的時(shí)間也較長,從而嚴(yán)重影響了工作效率[2-3]。因此,運(yùn)用云計(jì)算手段構(gòu)建電子檔案信息系統(tǒng),除能建立起一套數(shù)據(jù)規(guī)范之外,還能提高檔案的處理效率。為了能實(shí)現(xiàn)該需求,很多學(xué)者試圖來解決由于查詢繁瑣造成的工作效率滯后問題,并最終提出通過數(shù)據(jù)跟蹤管理功能來對這些異構(gòu)的數(shù)據(jù)結(jié)構(gòu)進(jìn)行統(tǒng)一化規(guī)范,希望借助于原始紙質(zhì)檔案信息資料與電子檔案信息一并應(yīng)用的方式來進(jìn)行[4]。但在實(shí)踐中發(fā)現(xiàn),這一方法并未從根本上解決問題。為此本文提出了基于云計(jì)算系統(tǒng)平臺(tái)的電子檔案輔助查詢功能,該系統(tǒng)的設(shè)計(jì)可以根據(jù)電子檔案信息存在的業(yè)務(wù)問題,通過對用戶權(quán)限進(jìn)行不同方式的設(shè)定,以此來實(shí)現(xiàn)用戶權(quán)限管理。
云計(jì)算是借助于互聯(lián)網(wǎng)技術(shù)使所有的檔案信息資料由傳統(tǒng)式的桌面式任務(wù)完成變?yōu)橐罁?jù)于網(wǎng)絡(luò)來進(jìn)行[5-6]?;ヂ?lián)網(wǎng)技術(shù)作為現(xiàn)代科技的手段,廣泛應(yīng)用于生活中,通過使用云計(jì)算能使電子檔案輔助信息查詢變得更為迅捷,其設(shè)計(jì)的目的就是為了方便個(gè)性化的服務(wù),使系統(tǒng)得到更大范圍的擴(kuò)展,以此來實(shí)現(xiàn)高效率的查詢。根據(jù)大數(shù)據(jù)目標(biāo)和業(yè)務(wù)需求設(shè)計(jì)該系統(tǒng),具體架構(gòu)見圖1。
由圖1可知,根據(jù)系統(tǒng)的需求,檔案信息系統(tǒng)的建立依賴于云計(jì)算,其不僅能有效提升業(yè)務(wù)管理的效率,并且也能使電子檔案的存儲(chǔ)容量變得更加寬泛。因此,對于現(xiàn)有的電子檔案輔助信息資料的管理,必須通過云計(jì)算的應(yīng)用來進(jìn)行,否則面對海量的資料信息很難進(jìn)行存儲(chǔ)和管理。
根據(jù)系統(tǒng)功能結(jié)構(gòu)進(jìn)行設(shè)計(jì),見圖2。
由圖2可知,系統(tǒng)功能結(jié)構(gòu)由機(jī)構(gòu)層和平臺(tái)層組成。機(jī)構(gòu)層中包含了系統(tǒng)的運(yùn)作機(jī)構(gòu),如便于數(shù)據(jù)檔案信息查詢的信息系統(tǒng),它也是檔案數(shù)據(jù)信息的源頭所在,以及用于數(shù)據(jù)交換的部分和基本檔案服務(wù)的機(jī)構(gòu)設(shè)置以及數(shù)據(jù)分析與利用。平臺(tái)層則包括索引服務(wù)、業(yè)務(wù)服務(wù)、數(shù)據(jù)服務(wù)以及其他方面的功能模塊。對于系統(tǒng)功能部分,其中的難點(diǎn)主要體現(xiàn)在數(shù)據(jù)的交換以及數(shù)據(jù)分析與利用部分,重點(diǎn)則體現(xiàn)在個(gè)人基本信息和資源共享方面。
檔案信息系統(tǒng)是根據(jù)云計(jì)算而設(shè)定的,它所采用的也是靜態(tài)與動(dòng)態(tài)網(wǎng)頁相結(jié)合的方式來進(jìn)行。后臺(tái)數(shù)據(jù)庫采用Microsoft SQL Server 2020,ADO.NET作為中間數(shù)據(jù)庫可以直接訪問數(shù)據(jù)庫。整個(gè)系統(tǒng)的管理人員,在系統(tǒng)運(yùn)行的過程中,可以通過輸入不同的檔案信息類目來進(jìn)行搜索以及其他內(nèi)容的管理。為了能夠方便操作,特此設(shè)計(jì)了數(shù)據(jù)中心存儲(chǔ)機(jī)制,見圖3。
采用關(guān)系數(shù)據(jù)庫SQL,同時(shí)在存儲(chǔ)機(jī)制上還設(shè)置了非關(guān)系數(shù)據(jù)庫NOSQL相結(jié)合的模式對外提供存儲(chǔ)服務(wù),該系統(tǒng)所呈現(xiàn)的優(yōu)越性便是對數(shù)據(jù)精準(zhǔn)地分析處理的能力[7-8]。系統(tǒng)具備高速存儲(chǔ)功能,因此對于數(shù)據(jù)的存儲(chǔ)敏感度較高,從而使得數(shù)據(jù)分析與應(yīng)用也更為精準(zhǔn)。
在傳統(tǒng)的電子檔案輔助信息存儲(chǔ)方面,所采用的方式主要是串形式存儲(chǔ)。該方式固然能有效實(shí)現(xiàn)電子檔案輔助信息的存儲(chǔ)功能,但它更傾向于對靜態(tài)信息的存儲(chǔ),而對于動(dòng)態(tài)信息的存儲(chǔ)則很難完成。而在云計(jì)算環(huán)境下,卻能實(shí)現(xiàn)對動(dòng)態(tài)數(shù)據(jù)的實(shí)時(shí)存儲(chǔ),從而有效解決對動(dòng)態(tài)信息的存儲(chǔ)問題。它的存儲(chǔ)原理就是借助于系統(tǒng)物理存儲(chǔ)介質(zhì)上的變化來進(jìn)行的,通過與動(dòng)態(tài)信息的有效結(jié)合,從而形成統(tǒng)一化的固定結(jié)構(gòu)形式來進(jìn)行信息的存儲(chǔ)。但需要強(qiáng)調(diào)的是,該方式的運(yùn)用既需要借助于互聯(lián)網(wǎng)等相關(guān)硬件設(shè)備,又需要服務(wù)器來加以支撐。對于硬件系統(tǒng)中較難處理的數(shù)據(jù)交換以及數(shù)據(jù)分析部分,則可以通過建立數(shù)據(jù)中心的手段,將存儲(chǔ)的所有檔案資料信息存放于服務(wù)器中,這樣不僅方便對所有的信息資料進(jìn)行統(tǒng)一化管理,而且還能做到靜態(tài)與動(dòng)態(tài)信息資料的實(shí)時(shí)存儲(chǔ)。具體結(jié)構(gòu)設(shè)計(jì)見圖4。
由圖4可知,面對大量的電子檔案信息,所進(jìn)行的存儲(chǔ)部分顯得尤為關(guān)鍵,尤其是存儲(chǔ)的時(shí)間,如果時(shí)間過長會(huì)耗費(fèi)過多的資源,并且對動(dòng)態(tài)信息的存儲(chǔ)也會(huì)形成障礙。但通過信息存儲(chǔ)器能有效減少存儲(chǔ)所使用的時(shí)間,并且信息可直接被CPU訪問。這時(shí)的內(nèi)部存儲(chǔ)器存儲(chǔ)信息的速度會(huì)明顯加快,它內(nèi)部轉(zhuǎn)換的形式也會(huì)隨之增強(qiáng)。這時(shí)所存儲(chǔ)的信息也可以被CPU訪問。而面對海量信息,它的存儲(chǔ)能力如果達(dá)不到預(yù)期的要求,這時(shí)便需要通過提高存儲(chǔ)速度來加快它的數(shù)據(jù)轉(zhuǎn)換形式,以此來形成內(nèi)部存儲(chǔ)的方式,即通過高速緩存使數(shù)據(jù)被CPU訪問。
分析處理模塊能對系統(tǒng)上所記載的歷史記錄進(jìn)行系統(tǒng)性分析,并且能將分析的結(jié)果進(jìn)行細(xì)化處理,并記錄在系統(tǒng)中。這對于硬件系統(tǒng)運(yùn)行而言是難點(diǎn)的部分。除此,對處于休眠狀態(tài)的文件也可進(jìn)行恢復(fù)處理操作,同樣便于信息查詢服務(wù)的實(shí)施。信息查詢的分析處理模塊接口電路設(shè)計(jì)見圖5。
由圖5可知,該接口電路由MCS-51-8051單片機(jī)進(jìn)行電流傳輸,由CAPI服務(wù)器進(jìn)行電流傳出。這兩個(gè)電阻的功能主要表現(xiàn)為電流的輸入與輸出,以保障電流處于平穩(wěn)的運(yùn)行狀態(tài)。
根據(jù)上述信息分析處理結(jié)果,對信息查詢模塊進(jìn)行設(shè)計(jì),見圖6。
由圖6可知,當(dāng)不同人員對電子檔案信息查閱時(shí),首先進(jìn)行身份驗(yàn)證。驗(yàn)證是否是管理員的身份或普通查閱者的身份。系統(tǒng)會(huì)根據(jù)身份限定的不同來決定信息的開放程度。所有的信息都要依據(jù)云計(jì)算的環(huán)境來進(jìn)行數(shù)據(jù)的轉(zhuǎn)換。而這些數(shù)據(jù)信息可以直接被CPU所訪問,而云計(jì)算所得到的電子檔案輔助信息的精準(zhǔn)度則變得更高,這也充分說明了基于云計(jì)算的檔案信息系統(tǒng)的設(shè)計(jì)的有效性。當(dāng)然也包括對休眠文件的恢復(fù)處理。
對查詢模塊進(jìn)行軟件部分設(shè)計(jì)時(shí),同樣要根據(jù)云計(jì)算中所形成的網(wǎng)絡(luò)系統(tǒng)結(jié)構(gòu)來進(jìn)行,并根據(jù)系統(tǒng)內(nèi)部的軟件功能進(jìn)行模塊的劃分,具體見圖7。
由圖7可知,通過對電子檔案的處理,可以獲取到基本的輔助信息,這些輔助信息可以用來進(jìn)行信息的檢索,使所檢索的信息變得更為精準(zhǔn),并且它會(huì)根據(jù)用戶身份的不同來設(shè)定出不同的信息搜索范圍。總之,當(dāng)進(jìn)行批量的電子檔案信息查詢時(shí),可以實(shí)現(xiàn)新電子檔案輔助查詢的過程。由于在電子檔案錄入的過程中,會(huì)以網(wǎng)頁打開的方式進(jìn)行,并會(huì)根據(jù)需要來決定第1個(gè)電子檔案的打開是否被替換掉,從而使檔案的錄入程序變得更為簡單。它只需要通過初始化的整理過程,便可對打開的檔案信息進(jìn)行分析,并根據(jù)分析的結(jié)果來判定是否需要進(jìn)行存儲(chǔ)。如果需要直接按下保存鍵,如果不需要,便可進(jìn)行另外的檔案項(xiàng)目搜索。
采用Matlab R2000b作為實(shí)驗(yàn)平臺(tái),將Lucene的電子檔案以對比組的形式進(jìn)行系統(tǒng)查詢性能研究。本文所研究的云計(jì)算平臺(tái)上的檔案信息系統(tǒng)為實(shí)驗(yàn)組,利用實(shí)驗(yàn)組與對比組之間查詢信息的區(qū)別進(jìn)行有效性和準(zhǔn)確性比較。同時(shí)在查詢的功能上,分別設(shè)置了單個(gè)電子檔案查詢功能、批量式電子檔案查詢功能等不同方式。通過查詢系統(tǒng)能夠獲取到單個(gè)或多個(gè)電子檔案輔助信息,但對于信息所存在的精準(zhǔn)性還需要進(jìn)一步驗(yàn)證。此次實(shí)驗(yàn)中,將傳統(tǒng)的電子檔案查詢系統(tǒng)與本文開發(fā)的檔案信息系統(tǒng)的查詢精準(zhǔn)度進(jìn)行對比。將傳統(tǒng)的查詢信息與依賴于云計(jì)算的查詢方式所獲取到的輔助信息進(jìn)行對比,發(fā)現(xiàn)所呈現(xiàn)出的結(jié)果是完全不同的。由分析可知:通過不同的查詢時(shí)間比較,兩種系統(tǒng)所呈現(xiàn)出的輔助信息查詢精準(zhǔn)度也會(huì)有很大的不同。特別是在查詢時(shí)間超過60 s之后,這種變化性更為明顯,且呈現(xiàn)出一定的規(guī)律性。隨著查詢時(shí)間的延長,依據(jù)傳統(tǒng)方式進(jìn)行信息的查詢的精準(zhǔn)性變得更低,精準(zhǔn)度僅僅為20%,但依據(jù)于云計(jì)算所呈現(xiàn)出的輔助信息查詢方式,則會(huì)隨著時(shí)間的延長,它的精準(zhǔn)度變得越來越高。
利用傳統(tǒng)與基于云計(jì)算所進(jìn)行的對多個(gè)電子檔案的查詢,當(dāng)查詢時(shí)間為100 s時(shí),傳統(tǒng)方式得到的結(jié)果,它的精準(zhǔn)性要低于依據(jù)于云計(jì)算所進(jìn)行的查詢結(jié)果。隨著查詢時(shí)間的延長,所用傳統(tǒng)方式進(jìn)行查詢的結(jié)果,它的精準(zhǔn)度變得更低,而依靠云計(jì)算所進(jìn)行的查詢結(jié)果,它的精準(zhǔn)度則變得更高,可以達(dá)到83%左右。
通過本文所研究的系統(tǒng)實(shí)驗(yàn),可以得到以下結(jié)論:(1)以傳統(tǒng)方式進(jìn)行電子檔案查詢,不管是單個(gè)電子檔案還是批量電子檔案查詢,查詢精準(zhǔn)度都要低于本文開發(fā)的基于云計(jì)算檔案信息系統(tǒng),特別是隨著查詢頻率和信息量的增加,本系統(tǒng)的性能及精準(zhǔn)度優(yōu)勢更加明顯。(2)傳統(tǒng)方式所進(jìn)行查詢結(jié)果得到的精準(zhǔn)度會(huì)變得更低,而云計(jì)算技術(shù)下查詢及應(yīng)用檔案信息,其精準(zhǔn)度則變得更高,這也充分說明了基于云計(jì)算的檔案信息系統(tǒng)的設(shè)計(jì)是十分有效的[9-10]。
電子檔案信息系統(tǒng)建設(shè)中,數(shù)據(jù)分析能力、數(shù)據(jù)準(zhǔn)確性以及查詢能力是衡量整個(gè)系統(tǒng)好壞的重要指標(biāo),開發(fā)技術(shù)的應(yīng)用與這些指標(biāo)存在著直接關(guān)系。本文將云計(jì)算技術(shù)應(yīng)用到檔案信息系統(tǒng)中,分析了基于云架構(gòu)的系統(tǒng)結(jié)構(gòu),重點(diǎn)闡述了數(shù)據(jù)處理及查詢模塊。通過與傳統(tǒng)電子檔案查詢系統(tǒng)的對比,本系統(tǒng)在數(shù)據(jù)處理效率和查詢精準(zhǔn)度方面存在很大優(yōu)勢,使原本復(fù)雜的電子檔案查詢工作變得高效且簡便了許多,并且還針對不同用戶的身份設(shè)計(jì)了分類功能,提升了檔案信息系統(tǒng)的安全性,并提供了個(gè)性化服務(wù)。