沙金
(上海計算機軟件技術開發(fā)中心,上海201112)
在大數據時代,信息安全在數據采集、傳輸、存儲、管理、分析和發(fā)布等多個方面都面臨著新常態(tài),使用和破壞存在于大數據生命周期的整個過程中,大數據面臨著成為網絡攻擊的明顯目標,增加了隱私泄露的風險,以及大數據技術被適用于攻擊方法,并成為高級可持續(xù)攻擊(APT)的載體。
在大數據的深入研究和應用中可以看出在大數據環(huán)境中,數據量大,數據類型多樣,數據組成復雜,因此傳統的數據安全機制面臨數據隔離的要求更高、存儲系統的安全防護存在漏洞等多重挑戰(zhàn)且急需更新和優(yōu)化。因此,迫切需要通過研究關鍵技術,構建全面的大數據安全管理技術架構和制定安全管理戰(zhàn)略來應對這些挑戰(zhàn)。
在安全架構,數據隱私,數據管理和數據完整性以及主動安全保護方面,對大數據安全和隱私保護而言是十分重要的,然而如今主要面臨以下十大技術挑戰(zhàn):
(1)分布式計算涉及更多組織,更容易受到安全攻擊和未經授權的訪問。
(2)非關系型數據庫結構化查詢統計需要加強,應用層需要保障數據一致性,訪問控制安全機制存在漏洞。
(3)大量的交易數據和日志是黑客攻擊的焦點,需要確保安全的數據存儲和交易日志。
(4)輸入驗證/過濾的移動終端重點有很大的安全不定性,敏感數據的訪問監(jiān)控、非法內容的控制等方面需要加強。
(5)利用系統漏洞,拒絕服務攻擊(DoS)和破壞性高的高級持續(xù)威脅(APT)攻擊的攻擊需要實時安全監(jiān)控。
(6)數據挖掘過程中,有著對隱私保護的挑戰(zhàn),需要在挖掘并分析數據時保護數據的可擴展性和可組合性
(7)有必要研究結構更好,效率更高,并滿足特定功能的加密方案,使用端對端的加密的數據保護來保證數據中心的安全性。
(8)大數據規(guī)??捎^,數據多樣,業(yè)務連續(xù)性高,用戶群龐大,數據擁有者無法控制全部數據資源。數據機密訪問控制需要細化粒度并提高可擴展性。
(9)審計在細粒度上仍然不能完全涵蓋所有數據的關鍵信息,因此有必要開發(fā)細粒度審計技術。
(10)在大數據環(huán)境中,數據可追溯技術的數據標記的可靠性,數據標記與數據內容之間的綁定的安全性問題更加突出。
目前,傳統的安全防護技術仍然是大數據安全防護技術的基礎。雖然有部分發(fā)展但是仍然有更進一步的空間。與大數據安全相關的某些關鍵技術也在研究中,并開始取得了一些進展。
(1)數據加密技術
數據加密是在對信息進行數學編碼和解碼的基礎上,利用特定算法改變原有的信息數據使其不可讀或無意義,以保障數據機密性。熊金波等人[1]提出一種角色對稱加密算法,并基于其提出一套云數據安全去重方案,實現云數據授權去重。李順東等人[2]提出了一套基于ElGamal加密算法的云外包計算下的同態(tài)加密方案,據此解決了保密的字符串排序問題。
(2)身份認證技術
身份認證技術通過驗證被認證對象的屬性來驗證用戶是否為有效的合法性,從而防止非法用戶訪問系統,從而驗證被認證對象的真實性。游林等人[3]基于RLWE的同態(tài)加密和消息編碼技術,提出了基于同態(tài)加密和生物特征的身份認證方案,實現在加密域匹配用戶身份信息。來齊齊等人[4]構造了一個光滑并且密文尺寸較小的基于身份的新型哈希證明系統,提出一種新型的對隱私信息進行保護的密碼方案。
(3)訪問控制技術
訪問控制是指在驗證用戶之后,根據用戶的身份和用戶所屬的預定義組來限制信息項訪問或功能使用。李鳳華等人[5]實現了單一網絡空間到復雜網絡環(huán)境中的訪問控制機制映射,并提出一套完整的訪問控制管理模型。羅楊等人[6]提出了一種為RESTful接口訪問控制提供語法一致的策略描述語言,進而提出了一種基于遺傳算法的RESTful權限劃分方法。
(4)安全審計技術
安全審計是記錄和監(jiān)控正常流程,異常情況和安全事件的手段,以防止違反信息安全策略,實現責任認定、性能調整和安全評估。周穎等人[7]提出了一種基于污點分析的SQL注入行為檢測模型,并基于此模型解決了PHP應用程序中的SQL注入問題。金瑜等人[8]為減少用戶端和服務器端計算量,并同時支持加密數據去重和數據完整性驗證,提出一種新的安全審計方案。
(5)跟蹤與取證技術
數據溯源技術是為了確定數據的來源或文件的溯源與恢復而存在的技術。劉耀宗等人[9]提出了一種基于區(qū)塊鏈技術的RFID大數據溯源安全模型。任丹妮等人[10]針對網絡惡意刷流量現象,提出一種面向SDN的網絡溯源系統以實現輔助惡意流量追溯分析。
(6)恢復與銷毀技術
數據恢復技術是在丟失原始數據后恢復原始數據。數據銷毀技術旨在破壞敏感數據以防止數據被盜。張江濤等人[11]提出一種基于壓縮感知中的采用內點法的基追蹤算法實現對測井大數據中的缺失數據進行恢復。于游等人[12]提出了一種基于加密存儲的磁盤快速銷毀的方案,以解決磁盤敏感數據銷毀速度較慢,無法應對緊急時刻快速銷毀需求的問題。
本文結合了ISO N IS T的大數據參考框架和大數據安全與隱私保護參考框架[13],針對如何保證大數據安全和提高隱私保護提出了技術體系的參考模型。
在技術體系中大數據安全和隱私保護的安全保護技術主要分為四個層次,即設施層、數據層、接口層和系統層。大數據安全技術架構設計如圖1所示。
圖1大數據安全技術架構設計
設施層的安全防護主要用于應對終端、云平臺和大數據基礎設施設備的安全問題,包含針對平臺崩潰、設備失效、電磁破壞等,采用的主要安全防護技術有:云平臺安全防護技術、大數據基礎設施安全防護技術、終端安全防護技術等,大數據基礎設施安全主要保護大數據網絡設施、存儲設施、計算設施及其物理環(huán)境。
數據處理生命周期中的安全問題通過數據層安全保護解決,例如數據竊取、數據篡改、數據混淆等,采用數據存儲安全技術、數據發(fā)布與應用安全技術、數據采集安全技術、數據挖掘安全技術、隱私數據保護安全技術等構成所需要的安全防護技術。
接口層安全保護主要針對數據提供者、數據消費者、大數據處理提供商、大數據框架提供商、系統協調員等之間的接口所面臨的安全問題,包括隱私泄露、未識別人員的入侵、未經授權的訪問、數據意外丟失等,使用的關鍵技術包括數據提供商-大數據應用提供商接口安全控制技術,大數據應用提供商-數據消費者之間的接口安全控制技術,大數據應用提供商-大數據框架提供商接口安全控制技術,大數據框架提供商和系統控制器內部的安全控制技術。
系統層安全保護主要用于解決系統面臨的安全問題,包括僵尸攻擊、平臺攻擊、運行干擾、遠程控制、APT攻擊、業(yè)務風險等。使用的關鍵技術包括實時安全檢測,安全事件管理,大數據安全態(tài)勢感知以及防御高級持續(xù)性威脅攻擊。
為了提高數據庫的可用性和安全性,應用系統的數據庫服務器通常采用“雙節(jié)點熱備份”模式。系統數據中心采用多個虛擬化管理平臺,形成集群,服務器、虛擬化管理平臺和磁盤陣列,實現全冗余,消除所有單點故障,提高容災半徑。當設備出現問題時,集群系統將會自動運行并將服務切換到另一臺服務器,以確保服務不會中斷且數據不會丟失。故障恢復后,可以重建災難恢復結構。
數據備份是數據安全的常規(guī)保證。其將邏輯備份與物理備份相結合,并定期在備份介質上存儲系統數據。當需要恢復系統時,備份數據將從備份媒體傳輸到生產系統。備份數據無法確保其有效性,因此需要定期驗證,為縮小影響建議在訓練環(huán)境下模擬數據恢復。數據庫和各種物理文件等物理備份可以使用第三方軟件執(zhí)行備份操作。
導出/導入是Oracle提供的邏輯備份/恢復工具。通過提取數據庫的數據字典信息和數據信息,并將其以二進制文件形式保存,以實現邏輯備份功能。將導出的二進制文件還原到源數據庫或其他數據庫,以實現數據恢復功能。數據庫的邏輯校驗操作可以在邏輯備份過程中執(zhí)行,同時也可以在導出過程中對數據進行加密操作,以防止數據濫用問題的發(fā)生??梢栽跀祿謴瓦^程中生成訓練環(huán)境。
數據庫需要構建包括數據庫防火墻、數據庫審計、訪問控制、數據加密和屏蔽在內的縱深防御體系,如圖2所示。
圖2數據庫縱深防御體系
(1)數據庫防火墻
數據庫防火墻用于對應用程序合規(guī)性進行檢測,并劃分出應用程序的紅名單和黑名單。在實際情況中會存在程序員不驗證用戶輸入的漏洞,此類漏洞會給惡意數據的輸入和SQL語句的篡改創(chuàng)造機會,進而導致數據的盜用。因此需要通過建立數據庫防火墻來監(jiān)控數據庫事務,對程序合規(guī)性實時監(jiān)測,以防止SQL注入攻擊的發(fā)生。
(2)數據庫審計
數據庫審計是依照用戶、操作時間、終端IP地址、操作對象、操作行為和返回代碼六個要素監(jiān)視和記錄數據庫中給定用戶的操作行為[13]。由于用戶通過中間層應用程序服務器訪問數據庫以連接到數據庫服務器,因此,Oracle審計記錄無法獲取B/S結構接入終端的用戶名和IP地址,只能跟蹤應用程序服務器的IP地址和連接到數據庫的應用程序服務器的用戶信息。因此,審計工作需要結合應用系統與數據庫以獲得最終的審計需求。
(3)訪問控制與口令字選擇
訪問控制用于確保數據免受惡意攻擊。訪問控制通過對用戶授權進行限制來賦予指定用戶訪問數據的能力,通過制定安全策略可以防止數據濫用?;诮巧脑L問控制(RBAC)模型由用戶Users、角色Roles、權限Permissions、會話Sessions和限制Constraints五類實體組成,通過在用戶和權限之間添加角色,對數據庫資源的訪問權限將封裝在角色中。用戶通過分配的角色間接訪問系統資源,并在系統資源范圍內執(zhí)行操作。
口令問題同樣需要重視。為了確保數據庫的安全性,有必要隔離數據庫的系統管理員和應用系統管理員,同時需要定期更改密碼,加強密碼強度,防止密碼被盜。此外,面向不同業(yè)務需求,可以通過為每個應用程序管理員創(chuàng)建一個獨立帳戶進行特定授權。通過數據庫配置文件Profile控制普通用戶帳戶,僅賦予系統管理員為鎖定用戶解鎖的權限。
(4)數據加密和屏蔽
數據中的敏感信息通常需要加密處理,以防泄露,但數據加密可能會造成數據庫原始數據無法正常使用,因此需要采用特定加密技術保障數據隱私的同時不損害數據的可使用性。為實現上述需求,可以通過選擇透明數據加密技術進行敏感信息的加密操作,只要數據被讀取就會自動加密,且不影響基礎架構。
數據屏蔽用于保證測試、開發(fā)環(huán)境的數據安全。數據屏蔽的目標對象是開發(fā)和測試數據庫中的個人信息等敏感信息,識別敏感數據后可以對敏感字段選擇適當的屏蔽格式,設定屏蔽規(guī)則,替換敏感字段等,以實現敏感信息和普通數據的隔離。
隨著大數據時代的到來,數據安全保護面臨了全新的挑戰(zhàn),傳統的安全架構、數據隱私、數據管理等方面已經出現諸多不足,亟需改進。面向大數據安全保護中數據層、應用層、接口層和系統層四個層級的安全保護維度,研究了大數據安全的關鍵技術,提供有效的技術框架來解決大數據安全問題,并提出了一個大數據安全管理策略,包括強大的系統架構,完善的備份機制和深度數據庫防御系統。只有優(yōu)化大數據安全保護機制和方法,才能有效降低大數據時代數據資產的風險,從而更好地保護和控制大數據安全。