王琦煜
摘 要 當(dāng)前我們已經(jīng)進(jìn)入到大數(shù)據(jù)時(shí)代。大數(shù)據(jù)給人們的生活與工作帶來了較大積極影響的同時(shí)也引發(fā)了一定風(fēng)險(xiǎn)。如何確保大數(shù)據(jù)安全與隱私保護(hù)成為了現(xiàn)階段研究較為熱點(diǎn)的問題之一。本文從大數(shù)據(jù)概述入手,分析了大數(shù)據(jù)存在的安全問題,并提出了大數(shù)據(jù)安全與隱私保護(hù)對策。
關(guān)鍵詞 大數(shù)據(jù);安全;隱私保護(hù);探究
中圖分類號 TP3 文獻(xiàn)標(biāo)識碼 A 文章編號 1674-6708(2017)184-0061-02
大數(shù)據(jù)時(shí)代中,數(shù)據(jù)與信息研究和分析工作更加繁瑣、復(fù)雜,整個(gè)過程也較難管理。根據(jù)大量統(tǒng)計(jì)數(shù)據(jù)表明,僅在過去3年時(shí)間內(nèi),全球范圍內(nèi)所產(chǎn)生的數(shù)據(jù)量也超過了先前500年出現(xiàn)的數(shù)據(jù)量。隨著數(shù)據(jù)量的不斷增加,企業(yè)與個(gè)人對數(shù)據(jù)隱私性與安全性要求更高,大數(shù)據(jù)隱私與安全問題也更加的突出,如何應(yīng)對在大數(shù)據(jù)背景下的數(shù)據(jù)安全問題,是全世界范圍內(nèi)均應(yīng)當(dāng)積極思考的問題。
1 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)來源與特征
根據(jù)大數(shù)據(jù)來源的不同,大數(shù)據(jù)可分為3類:其一是來源于人,人們在使用互聯(lián)網(wǎng)的過程中所伴生的各種數(shù)據(jù),包含視頻、圖片、文字等;其二是來源于機(jī),各種類型的計(jì)算機(jī)在運(yùn)行過程中產(chǎn)生的數(shù)據(jù),以多媒體、數(shù)據(jù)庫、文件等形式存在;其三是來自于物。各種類型的數(shù)字設(shè)備在運(yùn)行過程中所采集得到的數(shù)據(jù),例如:攝像頭采集得到的數(shù)字信號等。
1.2 大數(shù)據(jù)分析目標(biāo)
當(dāng)前大數(shù)據(jù)在商業(yè)、醫(yī)藥、科學(xué)研究等領(lǐng)域應(yīng)用較多。其用途較多,因此帶來的分析目標(biāo)也比較多。
其一,推測趨勢與獲取知識。大數(shù)據(jù)中包含有很多重要信息,通過對大數(shù)據(jù)的分析工作可以更為深入地把握各種數(shù)據(jù)背后存在的問題與知識,實(shí)現(xiàn)對表層現(xiàn)象的深入挖掘。
其二,研究掌握個(gè)性化的特征。以大數(shù)據(jù)為基礎(chǔ),通過多角度、長期的數(shù)據(jù)分析、對比工作,可以將用戶個(gè)性化特征分析出來。從而在得到用戶習(xí)慣的基礎(chǔ)上,對不同的用戶提供出更為針對性的服務(wù)。
2 大數(shù)據(jù)存在的安全問題
2.1 用戶隱私
若大數(shù)據(jù)在使用的過程中對用戶數(shù)據(jù)沒有做到較好保護(hù),那么將直接威脅到用戶隱私與數(shù)據(jù)的安全性。按照保護(hù)內(nèi)容不同,其可以分為標(biāo)識符匿名、匿名保護(hù)及位置隱私保護(hù)等。
在大數(shù)據(jù)時(shí)代下,人們數(shù)據(jù)安全面臨的問題不僅僅是傳統(tǒng)的個(gè)人隱私問題,更多的是根據(jù)對人們數(shù)據(jù)的分析與研究,對人們狀態(tài)與行為的針對性預(yù)測,例如:零售商可以比家長更加了解自己的孩子的消費(fèi)習(xí)慣等,從而郵寄相關(guān)廣告信息等。再如對用戶在網(wǎng)絡(luò)上發(fā)表的一些狀態(tài)內(nèi)容等,能夠分析這個(gè)人的政治傾向、喜歡球隊(duì)、消費(fèi)習(xí)慣等隱私信息。目前,很多企業(yè)認(rèn)為對信息進(jìn)行了匿名處理之后,標(biāo)識符就會被隱藏,然后信息就能公布了,但現(xiàn)實(shí)情況為,僅采用匿名保護(hù)的方式并不能實(shí)現(xiàn)對隱私的有效保護(hù)。例如,某個(gè)公司在對3個(gè)月之內(nèi)部分搜索歷史記錄進(jìn)行匿名處理之后,供人們使用,雖然其中包含的標(biāo)識信息經(jīng)過了較為精心的處理,但是其中包含的很多記錄項(xiàng)內(nèi)容還能夠被精確的定位。
2.2 大數(shù)據(jù)的可信性
人們普遍認(rèn)為雖然數(shù)據(jù)可以在一定程度上說明一些問題,數(shù)據(jù)自身就是事實(shí),但是現(xiàn)實(shí)情況為,若對數(shù)據(jù)不能進(jìn)行有效甄別,人們也會被數(shù)據(jù)欺騙。
其一,不法分子可對大數(shù)據(jù)中的數(shù)據(jù)進(jìn)行刻意編造與偽造,而大數(shù)據(jù)分析的基礎(chǔ)就是這些數(shù)據(jù),錯(cuò)誤的數(shù)據(jù)必然導(dǎo)致錯(cuò)誤的結(jié)果。如果數(shù)據(jù)使用場景較為明確,部分人可能編造數(shù)據(jù)從而營造出對其有利的數(shù)據(jù)假象,從而導(dǎo)致人們得出錯(cuò)誤的判斷。如,某些網(wǎng)站中包含的虛假評論,用戶在看到這些虛假的評論之后,非常容易去購買這些劣質(zhì)的商品與服務(wù)。再加上當(dāng)前互聯(lián)網(wǎng)技術(shù)的普及,這些虛假信息帶來的影響是不可估量的,使用信息安全技術(shù)對這些數(shù)據(jù)進(jìn)行甄別難度也非常大。
其二,大數(shù)據(jù)在進(jìn)行傳播過程中可能出現(xiàn)失真的情況,這里主要是由于人們在信息傳播過程中可能出現(xiàn)信息逐步失真的情況。
2.3 大數(shù)據(jù)訪問控制
因?yàn)榇髷?shù)據(jù)使用范圍較為廣,來源也較多,對數(shù)據(jù)設(shè)置訪問控制是非常必要的。但是在大數(shù)據(jù)下,需要對大量的用戶進(jìn)行權(quán)限管理,但是用戶實(shí)際需求是未知的,這就導(dǎo)致對角色進(jìn)行預(yù)設(shè)是較為困難的。
3 大數(shù)據(jù)安全與隱私保護(hù)對策
3.1 數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)
對大數(shù)據(jù)安全與隱私保護(hù)中,數(shù)據(jù)發(fā)布匿名保護(hù)的關(guān)鍵在于使用的基本手段與關(guān)鍵技術(shù),現(xiàn)階段該項(xiàng)工作正處于不斷完善過程中。當(dāng)前數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)仍舊較為復(fù)雜,大數(shù)據(jù)攻擊者能夠從多個(gè)方面獲得數(shù)據(jù)信息,而不單單是某一個(gè)數(shù)據(jù)源。因?yàn)槟涿P褪菍λ袑傩约隙O(shè)定的,對某個(gè)具體的屬性并沒有給予其明確定義,這就導(dǎo)致在處理的過程中較易出現(xiàn)匿名處理不足的可能性,數(shù)據(jù)攻擊者就能夠?qū)⒃搶傩灾荡_定。因此,應(yīng)當(dāng)對數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)進(jìn)行完善,在具體實(shí)施時(shí)可以使用多樣化匿名,其優(yōu)勢主要在于在可對每個(gè)匿名屬性數(shù)據(jù)進(jìn)行多樣化處理,可使用裁剪算法方案與數(shù)據(jù)置換方案,從而將其中包含的敏感數(shù)據(jù)平均化,從而可大大增強(qiáng)數(shù)據(jù)匿名保護(hù)的效果,可有效預(yù)防數(shù)據(jù)攻擊者對數(shù)據(jù)進(jìn)行的聯(lián)合攻擊,有效確保數(shù)據(jù)匿名特性。
3.2 社交網(wǎng)絡(luò)匿名保護(hù)技術(shù)
大數(shù)據(jù)的重要來源之一就是社交網(wǎng)絡(luò)中產(chǎn)生的數(shù)據(jù)。因此做好大數(shù)據(jù)匿名保護(hù)是非常重要的。但是在社交網(wǎng)絡(luò)中,其中通常包含有大量圖片,因此,若采用傳統(tǒng)的數(shù)據(jù)結(jié)構(gòu)化匿名保護(hù)技術(shù)不能滿足社交網(wǎng)絡(luò)匿名保護(hù)需求。為了確保社交網(wǎng)絡(luò)數(shù)據(jù)安全性,在具體實(shí)施中,對圖結(jié)構(gòu)應(yīng)當(dāng)從超級節(jié)點(diǎn)進(jìn)行集聚與分割,例如,基于節(jié)點(diǎn)聚集的匿名方案、基于基因算法的實(shí)現(xiàn)方案、基于模擬退火算法的實(shí)現(xiàn)方案以及先填充再分割超級節(jié)點(diǎn)的方案。在社交網(wǎng)絡(luò)匿名保護(hù)當(dāng)中,關(guān)系型預(yù)測方法的使用具有較多優(yōu)點(diǎn),例如其能夠準(zhǔn)確從社交網(wǎng)絡(luò)中局部性連接增加密度增長,積聚系數(shù)增加進(jìn)行有效防護(hù)。
3.3 數(shù)據(jù)水印技術(shù)
數(shù)據(jù)水印技術(shù)就是將數(shù)據(jù)中所含的標(biāo)識信息,再方式嵌入的方式嵌入到其中,從而確保數(shù)據(jù)安全被使用,可有效解決數(shù)據(jù)存在的動態(tài)性、無序性特征。在具體實(shí)施中,可以將數(shù)據(jù)通過集合的方式嵌入到某一個(gè)固定的屬性中,這種方式可有效避免數(shù)據(jù)攻擊者對水印的破壞。另外,可采用將數(shù)據(jù)庫指紋信息錄入到水印當(dāng)中,可以識別出信息的所有者以及被分發(fā)的對象,有利于在分布式環(huán)境下追蹤泄密者。此外,可采用獨(dú)立分析技術(shù),能夠?qū)崿F(xiàn)無密鑰水印驗(yàn)證,進(jìn)一步確保數(shù)據(jù)安全性。此外,這里還可以使用數(shù)據(jù)溯源技術(shù),由于數(shù)據(jù)的來源多樣化,所以有必要記錄數(shù)據(jù)的來源及其傳播、計(jì)算過程,為后期的挖掘與決策提供輔助支持。
4 結(jié)論
綜上概述,我們在享受大數(shù)據(jù)時(shí)代給我們帶來便利的同時(shí)也應(yīng)當(dāng)應(yīng)對其存在的數(shù)據(jù)安全與隱私保護(hù)帶來的挑戰(zhàn),增強(qiáng)信息保護(hù)與信息安全。如要真正實(shí)現(xiàn)大數(shù)據(jù)時(shí)代下數(shù)據(jù)安全與隱私保護(hù)工作,必須對大數(shù)據(jù)存在的安全漏洞分析入手,充分應(yīng)用各種類型的數(shù)據(jù)安全與隱私保護(hù)技術(shù)措施,同時(shí)構(gòu)建其對應(yīng)的法律法規(guī),才能確保大數(shù)據(jù)安全與隱私保護(hù)。
參考文獻(xiàn)
[1]雷海.乘大數(shù)據(jù)東風(fēng) 揚(yáng)追越之帆——大數(shù)據(jù)時(shí)代提高航運(yùn)服務(wù)業(yè)品質(zhì)的理念及策略[J].水運(yùn)管理,2014(5):1-3.
[2]董楊慧,謝友寧.大數(shù)據(jù)視野下的數(shù)據(jù)泄露與安全管理——基于90個(gè)數(shù)據(jù)泄露事件的分析[J].情報(bào)雜志,2014(11):154-158.
[3]范昱.信息系統(tǒng)安全及數(shù)據(jù)安全管理的探討[J].技術(shù)與市場,2012(5):268-269.
[4]陳靜,孫林夫.基于SaaS的產(chǎn)業(yè)鏈協(xié)作公共服務(wù)平臺數(shù)據(jù)安全解決方案[J].計(jì)算機(jī)集成制造系統(tǒng),2011(6):1317-1324.