【摘 要】本文旨在闡述大數據背景下的信息安全,首先以大數據基本概念入手,介紹了大數據的數據量大、結構多樣化、價值密度低、處理速度快、復雜性的4C+V的特征,然后闡述了大數據網絡APT攻擊、用戶隱私數據保護、海量數據存儲等安全問題,最后詳細介紹了大數據信息安全體系構建、添加數據標識、加密數據通信以及實施動態(tài)數據存儲監(jiān)控和管理的大數據信息安全策略,從而構建大數據的信息安全的網絡環(huán)境。
【關鍵詞】大數據;信息安全;APT;數據標識;存儲監(jiān)控
一、概述
隨著國民經濟的不斷快速發(fā)展,尤其是我國加入世界貿易組織(WTO)之后,我國經濟正朝著經濟全球化和國際市場化的方向快速發(fā)展,從而使得我國各個企業(yè)與國外經濟體的聯(lián)系和交流越來越廣泛。在經濟全球化日益加速的今天,互聯(lián)網技術的不斷優(yōu)化和更新,企業(yè)經濟的發(fā)展越來越快,經濟樣式也越來越多,也就催生了企業(yè)生產數據的不斷增加,尤其是近幾年智能網絡終端的增加、云計算技術的廣泛應用等,互聯(lián)網的數據量更是呈爆炸式增長。據國際互聯(lián)網數據中心IDC (Internet Data Center)預計,互聯(lián)網內現(xiàn)有的數據量90%以上是近幾年才產生的,而且每兩年就會翻一番的速度增長,到2020年,全球互聯(lián)網數據量將增加50倍。這就表明,互聯(lián)網經濟已經步入了大數據時代。大數據是指互聯(lián)網內數據信息量非常巨大且不能用當前常見的工具在正常時間內無法處理的數據信息。由于互聯(lián)網自身的特點,這些數據絕大多數都是以非結構化的多樣化形式存在,但是為人們的決策、規(guī)律研究、有用信息挖掘等提供重要的數據依據。隨著時代的前進,大數據將會隨著互聯(lián)網絡的發(fā)展而更具開發(fā)性,這也為大數據的私密數據泄露和敏感信息竊取等信息安全問題的解決提出了更大的挑戰(zhàn)。所以如何確保數據信息安全性對于在在大數據背景下推動各個政府部門、教育科研機構、企業(yè)單位和金融機構等諸多領域的快速安全發(fā)展來說具有非常重要的現(xiàn)實意義。
二、大數據簡介
上世紀八十年代初,美國著名謝家Alvin Toffler在《第三次浪潮》中提及了“大數據”(Big Data)的概念。大數據是指以計算機技術為基礎的規(guī)模龐大、利用當前常規(guī)的數據處理工具無法在合理時間內進行正常存儲、提取、搜索、分析、處理等的數據信息。同時,大數據也代表著異于傳統(tǒng)數據信息處理系統(tǒng)的新的技術和框架,可以更加有效、經濟地、高頻率地、智能地從大容量、不同數據結構和類型的多樣化數據中獲取有用的價值和信息。
大數據具有五個特征,可以通過4C+V來描述,分別是Volume,Variety,Value,Velocity,Complexity。
其中Volume表示大數據的數據量多、規(guī)模巨大的特性。在對大數據進行描述時,常見的GB或者TB的數據存儲單位已經不再使用,而是以PB(1024TB)、EB(1024PB)甚至ZB(1024EB)。根據一些資料顯示,國際互聯(lián)網數據中心IDC預測,2020年全球互聯(lián)網數據量為35ZB。所以,大數據的特點首先就是數據規(guī)模龐大。Variety表示大數據的數據結構多樣化,數據類型更加復雜,不僅包括常見的計算機處理的結構數據,包括二維或多維的數據結構存儲表,而且有很多文件、視頻、圖片、音頻等非結構化的數據信息。由于互聯(lián)網分布式的特點,加上物聯(lián)網、云計算等技術平臺的不斷發(fā)展,信息數據的來源逐漸趨于多樣化,互聯(lián)網數據來源逐漸增加,首先是互聯(lián)網終端用戶,在各種互聯(lián)網應用中產生的文字、圖片、視頻、音頻等各類數據信息,然后就是各種互聯(lián)網設備以及各種信息管理系統(tǒng),在生產過程中產生的各種文件、數據庫、審計、操作日志等信息數據,最后就是各種物聯(lián)網的傳感設備和信號采集設備,如醫(yī)療設備產生的各種生命特征數據、天文望遠鏡產生的大量天文相關的信息數據等。Value表示大數據的價值密度低的特征。由于大數據數據量多,所以數據基數大,加上對于企業(yè)生產決策的有用信息并不多,所以大數據價值密度低也是大數據的另外一個特性。這里值得說明的是,價值密度低不是沒有價值,對于企業(yè)來說,大數據的存儲是一個企業(yè)在發(fā)展過程中非常寶貴的財富。Velocity表示大數據的數據信息處理速度快的特性,由于大數據基數龐大,所以數據處理速度快將是大數據時代數據處理工具一個最為明顯的特征。Complexity表示大數據的復雜性的特征。特別是當前人們要求大數據的智能分析和處理的階段,大數據處理和分析的復雜性將進一步提升。
三、大數據面臨的安全問題
在大數據時代,數據信息成為企業(yè)發(fā)展的重要資源,然而隨著數據的不斷增加,大數據的安全風險也會逐漸增加,加上大數據是未來互聯(lián)網絡新的競爭點,必然也成為眾矢之的,引發(fā)更多的安全為題。
(一)大數據的網絡攻擊
由于大數據的數據規(guī)模龐大,在互聯(lián)網云端采用分布式存儲形式進行存儲,相關數據已經形成了統(tǒng)一的視圖,就存儲形勢來看,數據保護相對簡單,很容易為黑客留下攻擊漏洞,更加便以黑客實施高持續(xù)行威脅APT攻擊,造成安全問題。由于大數據環(huán)境下終端用戶非常多,且群體復雜,所以系統(tǒng)很難對網絡用戶的合法性進行快速實時的判斷。所以,大數據為高持續(xù)性威脅攻擊提供了良好的隱藏環(huán)境,APT在一個不確定的時間內進行持續(xù)攻擊,并且無法被實時檢測到,對大數據造成極大的威脅。在2013年3月份,韓國包括KBS以及多家民間企業(yè)在內的網站受到黑客的高持續(xù)性威脅攻擊(APT),導致互聯(lián)網絡受阻,計算機系統(tǒng)癱瘓。在此次APT中,韓國的金融機構共受到1500多次的非法入侵,受害的計算機達48000臺,成為2013年度最嚴重的APT攻擊。如圖1.所示,為近些年互聯(lián)網絡受到APT攻擊的趨勢圖。
由于高持續(xù)威脅攻擊具有很強的針對性,且攻擊時間長,配合數據挖掘技術等大數據分析攻擊和手段,很容易獲取大數據中獲取有用的數據信息,從而引發(fā)數據泄露,造成更大的危害。
(二)大數據的用戶隱私
由于大數據對所有網絡用戶的數據進行匯集存儲,在一定程度上,為用戶的個人數據的隱私保護埋下了安全隱患。如果大數據安全機制不完善,在用戶對個人數據操作不當的情況下,可能會造成一些相關的隱私數據的泄露,從而造成嚴重的隱私數據的安全問題。大數據的個人用戶數據的隱私保護,需要強大的大數據分析和處理技術和完善的隱私數據保護機制,來提升數據安全級別。如果在大數據管理端沒有完善的數據管理機制,用戶的一些敏感數據信息的所有權和使用權的界定或者分配可能會出現(xiàn)問題,對于大數據分析的應用來說,勢必會造成用戶隱私數據泄露,引發(fā)數據安全問題。
在對大數據進行數據采集和信息挖掘的時候,要注重用戶隱私數據的安全問題,在不泄露用戶隱私數據的前提下進行數據挖掘,完成有用信息提取。當前,大數據與云計算平臺的結合,使得分布式計算的應用逐漸廣泛,如何在分布計算的信息傳輸和數據交換時保證各個存儲點內的用戶隱私數據不被非法泄露和使用是當前大數據背景下云計算信息安全的主要問題。同時,當前的大數據數據量并不是固定的,而是在應用過程中動態(tài)增加的,而傳統(tǒng)的數據隱私保護技術大都是針對靜態(tài)數據的,所以如何有效地應對大數據動態(tài)數據屬性和表現(xiàn)形式的數據隱私保護也是要注重的安全問題。最后,大數據的數據遠比傳統(tǒng)數據復雜,現(xiàn)有的敏感數據的隱私保護是否能夠滿足大數據復雜的數據信息也是應該考慮的安全問題。
(三)大數據的數據存儲
大數據的數據類型和數據結構是傳統(tǒng)數據不能比擬的,在大數據的存儲平臺上,數據量是非線性甚至是指數級的速度增長的,各種類型和各種結構的數據進行數據存儲,勢必會引發(fā)多種應用進程的并發(fā)且頻繁無序的運行,極易造成數據存儲錯位和數據管理混亂,為大數據存儲和后期的處理帶來安全隱患。當前的數據存儲管理系統(tǒng),能否滿足大數據背景下的海量數據的數據存儲需求,還有待考驗。不過,如果數據管理系統(tǒng)沒有相應的安全機制升級,出現(xiàn)問題后則為時已晚。
四、大數據的信息安全策略
由于大數據自身的寶貴價值,在如火如荼地發(fā)展期間,必然要注重大數據的信息安全問題,來從而提升大數據的安全策略,推動大數據下的云計算的廣泛應用。
(一)加快大數據信息安全體系建設
大數據的信息安全體系建設不僅是計算機信息技術的發(fā)展問題,更是國家數據安全的策略問題。在大數據的發(fā)展規(guī)劃階段,要在戰(zhàn)略角度出發(fā),切實認識到大數據信息安全的重要性,不僅要在技術上加強大數據信息安全體系建設,更要在策略上態(tài)度上重視大數據信息安全建設,明確大數據的重點數據保護對象,構建大數據價值等級,加快完成大數據信息安全體系的建設。
(二)實施大數據信息安全技術
大數據的信息安全技術是通過相關的工具和一定的安全策略,構建完善的大數據信息安全模型,來實現(xiàn)數據信息的安全。首先,可以通過一定的工具,在數據收錄和存儲階段完成數據類型的劃分,并通過數據挖掘等技術,持續(xù)自動地對大數據進行分類、分析、評估,從而為有用信息提取做準備,最后要確保大數據框架下各個節(jié)點之間的加密安全的通信,降低大數據的攻擊。
在數據收錄和存儲時對數據進行標記處理,是在確保大數據安全性的前提下,對大規(guī)模的價值密度低的大數據實現(xiàn)快速運算處理的有效方法。針對數據標識的內容,可以根據系統(tǒng)不同的要求,對數據的類別、敏感等級等進行標記,然后數據管理系統(tǒng)對該表示進行判斷之后,存放到數據庫中。如圖2.所示,為數據標識判斷流程圖。
如圖2.所示,當數據增加標識后,如果數據庫內未對該標識進行記錄,則會將該表示直接存入數據庫。如果已經有記錄,則會直接將該數據存入數據庫。在數據已經有數據標識之后,則可以通過數據挖掘技術(如決策樹、聚類等)對數據進行實施快速處理,為后期有用價值提取做好準備。
在大數據的分布式計算框架下,數據加密的安全傳輸是加強大數據信息安全的重要問題,可以在分布式框架下的客戶端和服務器端配置統(tǒng)一的數據傳輸加密配置文件,通過將密鑰與通信數據的分開存儲來增加分布式系統(tǒng)的數據傳輸的安全性。
(三)加強大數據動態(tài)存儲機制
大數據的數據存儲問題是解決海量數據動態(tài)并發(fā)存儲的安全監(jiān)控問題,在海量數據的動態(tài)存儲過程中,要對數據存儲程序進程等進行安全監(jiān)控和檢測,同時對系統(tǒng)各種硬件資源如CPU、內存、磁盤、輸入輸出端口進行全面監(jiān)控和控制,從而建立高校的動態(tài)數據細粒度的分析機制和安全監(jiān)控機制,確保大數據的海量數據動態(tài)并發(fā)存儲的有序進行,保證大數據管理系統(tǒng)自身的運行可靠性和安全性。
五、總結
大數據的信息安全是針對大數據環(huán)境下的網絡APT攻擊、用戶隱私數據保護以及數據存儲等安全問題的安全的策略,主要是通過構建完善的大數據信息安全體系、實施數據標識、加密通信以及動態(tài)存儲監(jiān)控等方法手段來提升大數據信息安全性,從而為互聯(lián)網絡創(chuàng)建一個安全穩(wěn)定的大數據環(huán)境。
參考文獻:
[1]郭三強,郭燕錦. 大數據環(huán)境下的數據安全研究[J]. 科技廣場. 2013(02)
[2]陳明奇,姜禾,張娟,廖方宇. 大數據時代的美國信息網絡安全新戰(zhàn)略分析[J]. 信息網絡安全. 2012(08)
[3]陳建昌. 大數據環(huán)境下的網絡安全分析[J]. 中國新通信. 2013(17)
[4]王文超,石海明,曾華鋒. 芻議大數據時代的國家信息安全[J]. 國防科技. 2013(02)
[5]吳蓓,劉海光.淺析大數據時代的信息安全[J]. 計算機光盤軟件與應用. 2013(15)
[6]錢林紅,鄧家榮. 信息系統(tǒng)數據安全防范策略[J]. 電腦知識與技術. 2011(12)
[7]網珊,王會舉,覃雄派,周烜. 架構大數據:挑戰(zhàn)、現(xiàn)狀與展望[J]. 計算機學報. 2011(10)
[8]馮登國,張敏,李昊. 大數據安全與隱私保護[J]. 計算機學報. 2014(01)