【摘 要】TXT數(shù)字水印技術(shù)是通過(guò)隱藏的數(shù)字水印信息,保證TXT文本文檔身份識(shí)別和來(lái)源追蹤,增強(qiáng)事前威懾和事后追蹤能力,保障客戶敏感數(shù)據(jù)安全。TXT數(shù)字水印技術(shù)從接入管理、水印管理、水印生成算法和水印安全控制四個(gè)方面著手建立了一種全新的針對(duì)TXT文本文檔的數(shù)據(jù)追蹤模式,提升系統(tǒng)的TXT文本文檔安全保障能力。
【關(guān)鍵詞】TXT數(shù)字水印 數(shù)字水印 文本文檔數(shù)字水印 水印生成算法 水印安全控制
在目前互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)等技術(shù)高速發(fā)展的時(shí)期,企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中所存儲(chǔ)的業(yè)務(wù)數(shù)據(jù)類型及數(shù)據(jù)量不斷增加,涉及到的敏感數(shù)據(jù)也越來(lái)越多,同時(shí)由于TXT文本文檔的廣泛應(yīng)用, TXT中存有較多的敏感數(shù)據(jù),一旦泄漏,將給企業(yè)和社會(huì)帶來(lái)極大的安全影響和經(jīng)濟(jì)損失,因此如何能有效保護(hù)系統(tǒng)TXT數(shù)據(jù)的安全,成為急待解決的安全問題。傳統(tǒng)的安全控制主要采用“事前”權(quán)限控制、“事中”數(shù)據(jù)加密以及“事后”數(shù)據(jù)追蹤,其中數(shù)據(jù)追蹤需要采用全文檢索技術(shù)來(lái)實(shí)現(xiàn),硬件部署成本很大,因此TXT數(shù)字水印技術(shù)的引入和研究,只需存儲(chǔ)用戶訪問的水印要素信息,可以節(jié)約大量的成本并保證TXT身份識(shí)別和來(lái)源追蹤,對(duì)文檔傳播者起到一定的威懾作用,具有較高的現(xiàn)實(shí)意義。
一、接入管理
接入管理用于管理數(shù)字水印裝置的接入,并提供多樣化的接入方式,增強(qiáng)數(shù)字水印的易用性,提升數(shù)字水印的客戶端適應(yīng)能力,主要包括HTTP接入、標(biāo)準(zhǔn)WebService SOAP服務(wù)接入,和API調(diào)用方式的接入。應(yīng)用系統(tǒng)通過(guò)接入管理的接口,將要進(jìn)行水印嵌入的TXT文本文檔,以及用于形成水印的相關(guān)要素信息傳遞給水印管理模塊。
二、水印管理
水印管理模塊將應(yīng)用系統(tǒng)傳遞過(guò)來(lái)的水印相關(guān)要素信息進(jìn)行持久化存儲(chǔ),并生成與之相對(duì)應(yīng)的水印唯一識(shí)別碼,其中用于形成水印的相關(guān)要素信息包括用戶編號(hào)、用戶名、組織機(jī)構(gòu)、ip地址、訪問時(shí)間等信息。具體如下圖所示:
三、TXT水印生成算法
TXT水印生成算法主要通過(guò)隱藏類型的字符編碼,如Tab鍵字符、空格鍵字符等,經(jīng)過(guò)一定的組合算法合成,并通過(guò)TXT不可見水印處理算法將隱藏編碼隨機(jī)散布于一個(gè)或多個(gè)記錄行的尾部,最終構(gòu)成TXT文本文檔的隱藏記錄。
具體算法說(shuō)明如下:
(一)TXT文檔處理引擎:具備TXT文檔文件流的處理能力,包括文件的打開、關(guān)閉、文件游標(biāo)的定位,文件數(shù)據(jù)的讀取、寫入和刪除等功能,用于解析TXT文檔、嵌入隱藏的不可見水印。
(二)TXT不可見水印處理算法:負(fù)責(zé)將隱藏的水印信息隨機(jī)散布于一個(gè)或多個(gè)記錄行的尾部,形成不可見的TXT數(shù)字水印。 “隨機(jī)散布算法”原理舉例如下:將隱藏水印信息平均拆分成<=n份(沒法平均分配時(shí),多出的歸給最后一份),即當(dāng)TXT文本文檔的記錄行數(shù)>=n時(shí),則都拆分成n份,而TXT文本文檔的記錄行數(shù)如果 (三)TXT隱藏記錄生成算法:主要通過(guò)隱藏類型的字符編碼,如Tab鍵字符、空格鍵字符等,經(jīng)過(guò)一定的組合算法合成,并通過(guò)TXT不可見水印處理算法將隱藏編碼隨機(jī)散布于一個(gè)或多個(gè)記錄行的尾部,最終構(gòu)成TXT文本文檔的隱藏記錄。舉例如下:假設(shè)水印唯一識(shí)別碼是“1001”,將水印唯一識(shí)別碼拆分成單個(gè)數(shù)字,每個(gè)數(shù)字由空格鍵字符的組合來(lái)替代,而數(shù)字跟數(shù)字之間用Tab鍵字符隔開,則其對(duì)應(yīng)的隱藏記錄為“2個(gè)空格鍵+tab鍵+1個(gè)空格鍵+tab鍵+一個(gè)空格鍵+tab鍵+2個(gè)空格鍵”,即“ ”,在TXT文本文檔中對(duì)應(yīng)的16進(jìn)制碼為 四、水印安全控制 用于控制水印的安全校驗(yàn),包含水印信息的加密和解密提取,以及有效性和完整性的檢測(cè)。加密后的“水印信息安全串”主要由:水印前綴+水印識(shí)別碼加密串+水印后綴+水印校驗(yàn)碼,幾個(gè)部分組成。具體說(shuō)明如下: (一)水印前綴和水印后綴:都由“空格鍵+tab鍵+tab鍵+空格鍵”組成; (二)水印識(shí)別碼加密串:由原始水印識(shí)別碼進(jìn)行可逆加密后得到,如:由原始水印識(shí)別碼*2+1組成,即假設(shè)水印識(shí)別碼為91,則加密串為“183”; (三)水印校驗(yàn)碼:由水印識(shí)別碼長(zhǎng)度和原始水印識(shí)別碼的可逆加密串組成,如:由兩位的水印識(shí)別碼長(zhǎng)度(不足兩位補(bǔ)零)+(原始水印識(shí)別碼*3+2)組成,即假設(shè)水印識(shí)別碼為91,則水印校驗(yàn)碼為02275。 提取水印信息后,需進(jìn)行安全檢測(cè),即將校驗(yàn)碼和水印識(shí)別碼加密串分別解碼后進(jìn)行數(shù)據(jù)和長(zhǎng)度的比對(duì),結(jié)果一致才能確認(rèn)水印沒有被破壞。水印提取和檢查通過(guò)專門的水印檢查器實(shí)現(xiàn)。 TXT數(shù)字水印使用隨機(jī)散布算法、隱藏記錄生成算法等,成功解決了隱藏?cái)?shù)字水印生成算法問題,有效提升了TXT數(shù)字水印的防破壞能力;同時(shí)可精確、快速的定位安全事故責(zé)任人,有效節(jié)約了數(shù)據(jù)追蹤成本,提升數(shù)據(jù)追蹤效率,增強(qiáng)客戶信息安全管控能力。