◎北京航天長征飛行器研究所 王錦程 楊寧 謝蕾 張弛 劉銘
郵件發(fā)送中的知識流失管控模型初探
◎北京航天長征飛行器研究所 王錦程 楊寧 謝蕾 張弛 劉銘
電子文件傳輸以其便捷性與高效性逐漸成為工作中最為主要的文件流轉(zhuǎn)方式,但在享受這種便捷與高效的同時,也存在著關(guān)鍵知識流失的風(fēng)險。因此,航天企業(yè)在郵件系統(tǒng)基本功能的基礎(chǔ)上,增加了統(tǒng)一用戶身份認(rèn)證及信息傳輸管控環(huán)節(jié)。
統(tǒng)一用戶身份認(rèn)證是指通過讀取用戶CA-KEY信息來實現(xiàn)身份鑒別,用戶只能在授權(quán)的計算機上使用本人的郵箱,保證了郵箱與用戶的一一對應(yīng),在發(fā)送郵件的時候能夠清楚地知道知識的傳播對象。信息傳輸管控是指在用戶寫新郵件時需要標(biāo)明郵件的級別,若有附件上傳則需要標(biāo)明每個附件的級別,且附件的級別不能高于郵件的級別。信息傳輸管控環(huán)節(jié)能在用戶發(fā)送郵件的時候提醒用戶郵件級別與附件級別的匹配,防止重要知識的流失。此外,針對向外域發(fā)送的郵件,還要通過外發(fā)審核來防止核心知識的外流。
通過對北京航天長征飛行器研究所2014年上半年的郵件收發(fā)記錄分析后得出,信息傳輸管控功能在信息系統(tǒng)知識傳播管理中發(fā)揮了較大的作用。圖1為2014年上半年疑似知識流失郵件的數(shù)量分布圖,可以看出,知識流失的情況已經(jīng)變得越來越嚴(yán)重。郵件系統(tǒng)中的知識流失主要反應(yīng)在郵件的“高密低傳”上,即附件名中標(biāo)注的級別高于郵件級別。
圖2為2014年上半年研究所的郵件收發(fā)數(shù)量統(tǒng)計,針對如此龐大的郵件收發(fā)記錄,通過人工的方法進(jìn)行知識流失現(xiàn)象識別是一件難以完成的工作。此外,在用戶頻繁使用郵件進(jìn)行溝通的過程中,不可避免地會出現(xiàn)因誤操作而產(chǎn)生知識流失的現(xiàn)象。為此,筆者提出基于規(guī)則的郵件級別匹配模型,一方面根據(jù)郵件收發(fā)記錄自動生成知識流失集合,對用戶加以提醒;另一方面將此模型應(yīng)用于郵件系統(tǒng)中,在用戶上傳附件時對附件名進(jìn)行檢查,避免知識流失現(xiàn)象的發(fā)生。
圖1 2014年上半年知識流失郵件數(shù)量分布圖
圖2 2014年上半年郵件收發(fā)趨勢圖
郵件級別匹配主要是檢查郵件的附件名級別、附件級別以及郵件級別之間的匹配性。其中郵件級別是指發(fā)送郵件的級別,只有選定了郵件級別才能夠上傳附件和發(fā)送郵件。附件級別是指每個附件上傳后用戶為其選擇的級別,附件級別通過系統(tǒng)界面中的菜單選擇,因此附件級別不高于郵件級別。附件名級別是指附件名稱中標(biāo)注的級別,由用戶在計算機上對文件名進(jìn)行標(biāo)注而產(chǎn)生,附件名級別不受郵件系統(tǒng)控制,因此可以通過附件名級別識別出系統(tǒng)中存在的知識流失現(xiàn)象。
1.附件名與郵件的級別匹配關(guān)系
郵件系統(tǒng)能發(fā)送“一般”、“重要”與“關(guān)鍵”3個級別的信息,而附件名級別由用戶自行標(biāo)注產(chǎn)生。因此,郵件級別集合取值如下:
為了級別之間具備可比性,對(1)進(jìn)行量化后產(chǎn)生;Sn={1,2,3}為了更方便地描述郵件級別之間的匹配問題,定義附件名級別為附件級別為郵件級別為
因此,附件名級別與附件級別之間的匹配關(guān)系為:
附件名級別與郵件級別之間的匹配關(guān)系為:
即,如果一封郵件中的每個附件滿足ana=0,且同時滿足ama≥0,則說明該封郵件符合知識傳播要求,不存在知識流失現(xiàn)象。
2.規(guī)則的定義
由于郵件級別可從日志記錄中直接獲取,此處定義的規(guī)則主要為識別附件級別和附件名級別。郵件級別的匹配是在附件名均有級別標(biāo)注的前提下開展的,當(dāng)附件名未標(biāo)注級別時,計算機無法自動判斷該附件的級別,在此筆者假定所有郵件的附件名均為已標(biāo)注級別的合規(guī)文件。
通過對日志文件中的附件名字符串分析,對附件名字符串按“;”進(jìn)行分割可以得到每個附件的附件名及其級別的子字符串;對每個子字符串按“:”進(jìn)行分割可以得到附件級別與附件名;對附件名進(jìn)行匹配與判別,可以獲取附件名級別。
因此,可以得出如下規(guī)則:
(1)獲取單個附件。若獲取的附件名字符串中不存在“;”,則附件名為單個附件,否則按“;”分割字符串,得到若干個獨立的單個附件。
(2)獲取附件級別與附件名。若單個附件字符串中不存在“:”,則附件字符串不合法,無法獲取附件級別。否則按“:”分割字符串,得到第一個字符串為附件級別,第二個字符串為附件名。
(3)獲取附件名級別。對附件名匹配級別識別正則表達(dá)式,獲取附件名級別。
根據(jù)以上3條規(guī)則,可以得出郵件級別匹配的框架。
3.級別集合的構(gòu)建
級別集合的構(gòu)建是指根據(jù)郵件日志集,形成附件級別三元組的過程。第一,對每封郵件建立郵件的存儲對象,包括郵件級別、郵件標(biāo)題、發(fā)送時間、附件字符串等屬性。第二,建立附件存儲對象,包括附件級別、附件名、附件名級別等屬性。根據(jù)規(guī)則(1)獲取郵件的附件存儲對象集合,并根據(jù)規(guī)則(2)識別出每封附件的附件級別。第三,根據(jù)規(guī)則(3)獲得每封附件的附件名級別,并完善附件存儲對象的屬性值。第四,產(chǎn)生每封郵件的附件級別三元組集合。
4.匹配關(guān)系集合的構(gòu)建
匹配關(guān)系集合是指一封郵件的附件名級別與郵件級別的匹配關(guān)系以及附件名與附件級別的匹配關(guān)系的集合。通過構(gòu)建郵件的匹配關(guān)系集合能夠判斷出該郵件是否是按保密要求進(jìn)行發(fā)送。第一,根據(jù)每封郵件的附件級別三元組集合分別計算附件三元組的匹配關(guān)系取值;第二,根據(jù)匹配關(guān)系取值分別計算附件的兩種匹配關(guān)系;第三,計算郵件中每個附件的匹配關(guān)系,產(chǎn)生郵件的匹配關(guān)系集合。
模型構(gòu)建完善后,以研究所目前使用的郵件系統(tǒng)為試點,依照級別匹配模型開發(fā)關(guān)鍵知識檢索模塊,并在實際工作中檢驗?zāi)P偷膶嶋H效果。
1.文件傳輸行為審計
每月的郵件收發(fā)數(shù)量數(shù)以萬計,依靠人工準(zhǔn)確高效識別其中的知識流失是一件非常困難的事情。依據(jù)級別匹配模型,將日志信息作為輸入條件,制定判別條件與輸出內(nèi)容,可以將繁雜的行為審計工作交由計算機來完成。這不僅避免了人工判別帶來的誤差,也極大地提高了效率、降低了人力成本,為優(yōu)化工作模式、提升工作效率帶來極大的幫助。
2.異常傳輸行為阻斷
在用戶發(fā)送郵件之前,對郵件的內(nèi)容、附件名、郵件名稱以及郵件的級別進(jìn)行識別與匹配,當(dāng)出現(xiàn)不符合規(guī)則的結(jié)果時,對用戶進(jìn)行提醒。提醒的策略有2種,第一種是提醒用戶郵件中有關(guān)鍵信息,如果用戶認(rèn)為該信息符合郵件的級別,則可以繼續(xù)發(fā)送;第二種是發(fā)現(xiàn)與級別不相符的關(guān)鍵信息后直接阻斷該郵件發(fā)送。
經(jīng)過3個月的測試發(fā)現(xiàn),采取第一種策略時,系統(tǒng)中仍然有用戶會因為誤操作而導(dǎo)致關(guān)鍵知識的流失。而采取第二種策略時,系統(tǒng)中不再出現(xiàn)關(guān)鍵知識流失情況,且并未對用戶的使用造成影響。目前,研究所實際采用的是第二種策略,有效地防止了信息系統(tǒng)中關(guān)鍵知識的流失。
網(wǎng)絡(luò)傳輸?shù)拈_放性和高效性為信息系統(tǒng)中的知識成果保護工作帶來了新的挑戰(zhàn),如何做到既發(fā)揮網(wǎng)絡(luò)的便利性又保護知識成果不會肆意流失,是當(dāng)前涉密信息系統(tǒng)中知識管理的熱點問題。郵件系統(tǒng)是涉密信息系統(tǒng)中主要的信息傳輸平臺,防止涉密信息通過郵件系統(tǒng)進(jìn)行“高密低傳”能夠極大地減少知識的流失。因此,北京航天長征飛行器研究所考慮從郵件系統(tǒng)的附件名級別出發(fā),對信息傳播中的知識成果保護起到借鑒作用,也為信息系統(tǒng)中知識保護提供思路。后續(xù)將對本模型的思路進(jìn)一步深化,實現(xiàn)基于內(nèi)容的檢查與判別模型,為在更多系統(tǒng)中的使用打下基礎(chǔ)。