李韜,王紅濤,王富強(qiáng),趙靜,馮連強(qiáng)
(中國(guó)重型機(jī)械研究院股份公司, 陜西 西安 710032)
近年來(lái)因?yàn)樾畔⑿姑芏斐傻囊恍┕緳?quán)益受到侵害的情況屢見(jiàn)不鮮,而公司中往往需要頻繁的拷貝文件,這在很大程度上增加信息泄露的可能。為避免內(nèi)部信息泄露事件,對(duì)于一個(gè)公司來(lái)說(shuō)很需要有一個(gè)文件拷貝檢測(cè)系統(tǒng)。
一般的拷貝文件,操作人員需要按照清單一個(gè)個(gè)對(duì)比文件內(nèi)容來(lái)甄別違規(guī)文件,對(duì)于一個(gè)或兩個(gè)簡(jiǎn)單的圖紙文件,這種傳統(tǒng)的文件檢查高效又準(zhǔn)確;而當(dāng)文件過(guò)多或者有復(fù)雜的圖紙文件時(shí),傳統(tǒng)的人工文件檢查方法就顯得執(zhí)行速度比較慢,并且操作人員容易出現(xiàn)檢查失誤。將拷貝文件中的文件檢查工作交由計(jì)算機(jī)來(lái)處理,將極大提高工作效率及準(zhǔn)確性。
本文采用圖像檢索分析的方法對(duì)拷貝文件進(jìn)行檢測(cè),這種方法快捷、準(zhǔn)確,自適應(yīng)地應(yīng)對(duì)各種類型的文件。減少了拷貝過(guò)程中消耗的時(shí)間,提高了甄別違規(guī)文件的準(zhǔn)確性,在很大程度上杜絕了拷貝過(guò)程中的信息泄露。
目前對(duì)于文件拷貝時(shí)文件的檢查分析并沒(méi)有統(tǒng)一有效的方法,圖像作為信息的主要載體之一在項(xiàng)目設(shè)計(jì)中更具直觀性,它包含的信息數(shù)據(jù)較之文本的信息數(shù)據(jù)更難被檢查分析。
本系統(tǒng)采用圖像檢索分析方法檢查分析文件,這種圖像檢索方法將拷貝文件分為通用的圖像類型文件、文檔文件和CAD圖紙文件,分別采用不同的方式進(jìn)行分析,如圖1所示。對(duì)于通用的圖像類型文件,只需要將圖像文件直接顯示;對(duì)于文檔文件,文件中可能包含了很多圖紙圖像,需要先將文件中所有的圖像檢索出來(lái),再將圖像依次顯示在交互界面;CAD文件不僅需要將圖紙顯示在交互界面,還需要對(duì)圖紙內(nèi)部的信息進(jìn)行分析,例如一個(gè)圖紙文件包含幾個(gè)圖紙,圖紙的類型等信息都需要確認(rèn)。
圖1 圖像檢索分析方法過(guò)程圖
需求分析是建立新系統(tǒng)的關(guān)鍵環(huán)節(jié),它可以幫助確定系統(tǒng)的需求,描述系統(tǒng)的目的和功能。本系統(tǒng)需求分析階段的主要工作是根據(jù)系統(tǒng)初始要求以及用戶咨詢意見(jiàn)確定系統(tǒng)具體要實(shí)現(xiàn)的功能模塊。
本系統(tǒng)實(shí)現(xiàn)的初始目標(biāo)為:
(1)針對(duì)AutoCAD軟件產(chǎn)生的DWG文件,能夠判斷是否包含多個(gè)圖紙文件及圖幅大?。?/p>
(2)針對(duì)JPG等圖像文件,能夠產(chǎn)生縮略圖,給用戶提供判斷依據(jù);
(3)針對(duì)DOC、EXCEL文件,能夠提取文件中的圖片,并展示給用戶;
(4)針對(duì)PDF文件,可以判斷文件包含的頁(yè)數(shù),并展現(xiàn)每一頁(yè)給用戶以作為判斷依據(jù)。
通過(guò)詳細(xì)分析文件拷貝檢測(cè)系統(tǒng)的初始目標(biāo),可將系統(tǒng)的需求分析劃分為:信息需求分析、功能需求分析和方法需求分析。信息需求分析指分析系統(tǒng)中的輸入數(shù)據(jù)和輸出數(shù)據(jù),包含用戶的信息數(shù)據(jù)、拷貝文件的類型數(shù)據(jù)、拷貝文件的檢測(cè)分析結(jié)果信息數(shù)據(jù)等。信息需求分析階段對(duì)于一個(gè)系統(tǒng)的建立很重要,需求分析人員分析信息需求可以幫助系統(tǒng)設(shè)計(jì)人員更好地設(shè)計(jì)出系統(tǒng)的整體框架和功能模塊。信息需求分析階段需要對(duì)系統(tǒng)的輸入數(shù)據(jù)進(jìn)行采集,需要采集管理員的用戶信息以及不同用戶可能在系統(tǒng)中需要的信息類別數(shù)據(jù)和拷貝文件涉及到的文件類型數(shù)據(jù),然后進(jìn)行分析歸納出完整的輸入數(shù)據(jù)。對(duì)于搜集和整理過(guò)的輸入數(shù)據(jù)需要通過(guò)一些方法,例如:過(guò)程控制方法、信息交互驗(yàn)證方法和數(shù)據(jù)應(yīng)答方法等,處理得到輸出數(shù)據(jù),輸出數(shù)據(jù)包含信息修改結(jié)果數(shù)據(jù)、拷貝文件的檢測(cè)分析結(jié)果信息數(shù)據(jù)等。
系統(tǒng)的功能需求分析基于系統(tǒng)的初始目標(biāo)以及信息需求分析,主要包括用戶驗(yàn)證、操作交互、基于圖像檢索分析方法的文件分析、文件拷貝、異常事件的診斷處理、操作記錄、信息修改以及系統(tǒng)可視化界面構(gòu)建等,同時(shí)需要根據(jù)實(shí)際情況添加輔助處理功能。
方法需求分析主要包括界面搭建方法、框架設(shè)計(jì)方法和數(shù)據(jù)采集整理方法等。系統(tǒng)基于C#編程語(yǔ)言進(jìn)行界面設(shè)計(jì)搭建,以Windows應(yīng)用程序界面的形式與用戶進(jìn)行交互;系統(tǒng)使用MySQL數(shù)據(jù)庫(kù)對(duì)系統(tǒng)涉及的數(shù)據(jù)進(jìn)行管理,其中借助ODBC驅(qū)動(dòng)實(shí)現(xiàn)系統(tǒng)對(duì)MySQL數(shù)據(jù)庫(kù)的操作;對(duì)系統(tǒng)執(zhí)行過(guò)程中產(chǎn)生的異常事件采用自動(dòng)診斷方式;對(duì)于多文件檢測(cè)分析根據(jù)不同文件對(duì)應(yīng)的檢測(cè)方式處理,然后將所有的檢測(cè)分析結(jié)果統(tǒng)一輸出。
本系統(tǒng)是一個(gè)Windows應(yīng)用程序,系統(tǒng)的整體結(jié)構(gòu)框圖如圖2所示。系統(tǒng)用戶登錄驗(yàn)證功能和用戶操作界面,為了方便管理系統(tǒng)的數(shù)據(jù)信息,將用戶分為普通用戶和管理員。普通用戶在拷貝文件外還可以查看個(gè)人信息和修改密碼,管理員相比普通用戶可以操作用戶信息和文件拷貝記錄信息。
圖2 系統(tǒng)的整體結(jié)構(gòu)框圖
系統(tǒng)基于圖像檢索分析的方法設(shè)計(jì),在拷貝文件前先將要拷貝的文件進(jìn)行檢索和分析。在文件的分析過(guò)程中采取圖1所示的圖像檢索分析方法,對(duì)通用的圖像格式文件直接進(jìn)行界面上的交互預(yù)覽;對(duì)文檔類型文件需要先檢索出文件包含的所有圖像,然后再進(jìn)行交互預(yù)覽;對(duì)CAD圖紙文件在進(jìn)行交互預(yù)覽的同時(shí),還要深度分析圖紙的組成,提取圖紙的規(guī)格等信息。
系統(tǒng)中大量涉及到數(shù)據(jù)的處理,系統(tǒng)通過(guò)圖3所示的過(guò)程完成與MySQL數(shù)據(jù)庫(kù)的交互。系統(tǒng)涉及到的信息通過(guò)MySQL數(shù)據(jù)庫(kù)存儲(chǔ),借助ODBC驅(qū)動(dòng)程序?qū)⑿畔⒌恼?qǐng)求控制消息傳遞給MySQL數(shù)據(jù)庫(kù),然后再由傳遞過(guò)程返還相應(yīng)信息到系統(tǒng)。
圖3 系統(tǒng)和數(shù)據(jù)庫(kù)交互過(guò)程圖
本文提出的文件拷貝檢測(cè)系統(tǒng)以某公司為應(yīng)用背景,通過(guò)搜集文件的信息數(shù)據(jù)來(lái)開(kāi)發(fā)系統(tǒng)?;诠镜膶?shí)際情況調(diào)研,設(shè)計(jì)出系統(tǒng)的整體設(shè)計(jì)框架,每個(gè)用戶都需要交互驗(yàn)證成功才能登錄,普通用戶和管理員可以使用不同的系統(tǒng)功能來(lái)完成相應(yīng)的工作。操作人員通過(guò)與系統(tǒng)完成信息修改查驗(yàn)和文件檢索分析,系統(tǒng)后臺(tái)通過(guò)ODBC驅(qū)動(dòng)程序過(guò)程控制對(duì)數(shù)據(jù)庫(kù)中信息進(jìn)行控制。由于運(yùn)行過(guò)程復(fù)雜,數(shù)據(jù)處理上與界面刷新存在相應(yīng)延遲,系統(tǒng)采用完成等待的方法來(lái)達(dá)到時(shí)間上的一致,在數(shù)據(jù)處理和界面刷新的同時(shí),系統(tǒng)在可視化界面使用遮擋防止人員操作直至控制結(jié)束。
系統(tǒng)在實(shí)現(xiàn)過(guò)程中要充分考慮到系統(tǒng)的可維護(hù)性和可修改性,便于后期擴(kuò)充維護(hù),同時(shí)還要考慮可視化界面的人性化,在系統(tǒng)初步設(shè)計(jì)的基礎(chǔ)上將這些因素考慮進(jìn)去,并且對(duì)系統(tǒng)反復(fù)測(cè)試維護(hù)。
在系統(tǒng)的測(cè)試階段先將測(cè)試條件按照功能模塊進(jìn)行分類歸納,逐條反復(fù)進(jìn)行測(cè)試,同時(shí)還要考慮測(cè)試條件的交叉干擾情況。在系統(tǒng)的測(cè)試中軟件的任務(wù)目標(biāo)和性能指標(biāo)都符合預(yù)期設(shè)計(jì)。通過(guò)系統(tǒng)測(cè)試發(fā)現(xiàn),基于圖像檢索分析的文件拷貝檢測(cè)系統(tǒng)對(duì)于CAD圖紙文件的分析判定更有優(yōu)勢(shì),通過(guò)嚴(yán)格分析圖紙的內(nèi)部組成,精準(zhǔn)地給出判定結(jié)果。經(jīng)由長(zhǎng)時(shí)間的測(cè)試評(píng)估,確定系統(tǒng)測(cè)試運(yùn)行結(jié)果良好,滿足使用需求。
本系統(tǒng)的上線投入運(yùn)行結(jié)果顯示,該系統(tǒng)可預(yù)覽和檢測(cè)各種涉及到圖像的文件,并記錄下拷貝記錄,方便用戶在拷貝文件前檢查文件及后期的查責(zé),將公司圖形信息泄露的可能性降至最低,充分保證公司圖形信息的安全保密,并配合后期圖形加密技術(shù)的應(yīng)用,將建立了一套事前防護(hù)、事中控制、事后追查的完整防護(hù)體系,防止了核心數(shù)據(jù)外泄。