文|張營軍
?
大數(shù)據(jù)安全與隱私保
文|張營軍
在如今這個(gè)信息時(shí)代中,“大數(shù)據(jù)”儼然已經(jīng)逐漸的稱為了廣受社會(huì)各界關(guān)注的熱點(diǎn)問題之一。不口否認(rèn)的是,大數(shù)據(jù)的存在對(duì)人們生活生產(chǎn)等多方面都帶來了較為積極的作用,但不可避免的是,大數(shù)據(jù)的應(yīng)用依舊存在著諸多的風(fēng)險(xiǎn)。那么,如何利用有效的措施來保護(hù)大數(shù)據(jù)的安全與隱私,顯然已經(jīng)成為了當(dāng)下大數(shù)據(jù)應(yīng)用領(lǐng)域中最需得到解決的問題。該文基于大數(shù)據(jù)的應(yīng)用目標(biāo)來對(duì)大數(shù)據(jù)安全與隱私的保護(hù)技術(shù)進(jìn)行了系統(tǒng)的分析與探究。
在人們對(duì)數(shù)據(jù)使用量日益增加的背景下,繼互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算過后,大數(shù)據(jù)已經(jīng)逐漸的稱為了信息技術(shù)領(lǐng)域當(dāng)中的“標(biāo)志”。大數(shù)據(jù),具備了多樣性、復(fù)雜性、高速性等特點(diǎn),因此人們對(duì)其數(shù)據(jù)信息的分析與研究將不會(huì)那么容易。顯然,要想較好的處理與管理這樣復(fù)雜的數(shù)據(jù)系統(tǒng),需要全面的安全、隱私保護(hù)技術(shù)。但就目前的情況來看,關(guān)于大數(shù)據(jù)信息安全及隱私的問題并沒有得到實(shí)質(zhì)性的解決。
就目前的情況來看,大數(shù)據(jù)已經(jīng)被廣泛的應(yīng)用于科學(xué)、商業(yè)、醫(yī)藥、教育等多種領(lǐng)域當(dāng)中。而對(duì)于每一個(gè)不同的領(lǐng)域而言,雖然大數(shù)據(jù)的用途也存在著一定的差異,但整個(gè)應(yīng)用目標(biāo)來說,顯然是極為相似的。具體而言,主要體現(xiàn)在以下幾個(gè)方面:一是對(duì)數(shù)據(jù)進(jìn)行長期性、多角度的分析、對(duì)比與積累,即能夠有效的總結(jié)出用戶的個(gè)性化特征。而對(duì)于企業(yè)而言,即能夠通過對(duì)這些個(gè)性化特征的利用,來有效的了解與掌握用戶的行為習(xí)慣,從而對(duì)用戶進(jìn)行科學(xué)合理的定位與分類,最終為不同的人群提供不同的個(gè)性化服務(wù);二是經(jīng)過對(duì)現(xiàn)有數(shù)據(jù)的深入挖掘與分析,即能夠及時(shí)、有效的獲取具有價(jià)值的信息。通過信息的挖掘,人們即能透過現(xiàn)象看到事物的本質(zhì),從而實(shí)現(xiàn)對(duì)事物發(fā)展趨勢(shì)的正確預(yù)測(cè),更快、更好的把握事物的發(fā)展規(guī)律。
數(shù)據(jù)溯源技術(shù)。之前,對(duì)于數(shù)據(jù)溯源技術(shù)的研究僅僅針對(duì)于數(shù)據(jù)庫的領(lǐng)域當(dāng)中,而目前這項(xiàng)技術(shù)也被廣泛的應(yīng)用的到了大數(shù)據(jù)的安全與隱私保護(hù)中。作為數(shù)據(jù)溯源技術(shù)中最為基礎(chǔ)的手段,標(biāo)記法的作用主要是實(shí)現(xiàn)對(duì)數(shù)據(jù)出處及計(jì)算方法的記錄。通過對(duì)來源數(shù)據(jù)的標(biāo)記,不僅能夠幫助使用者對(duì)分析的結(jié)果進(jìn)行有效的檢驗(yàn),也能夠讓使用在判斷信息真?zhèn)蔚臅r(shí)間得以縮短。同時(shí),數(shù)據(jù)溯源技術(shù)的作用在文件的恢復(fù)與溯源中也能夠得到充分的發(fā)揮。
數(shù)據(jù)水印技術(shù)。所謂數(shù)據(jù)水印技術(shù),即是指在不影響數(shù)據(jù)使用及數(shù)據(jù)內(nèi)容的前提下將可標(biāo)示信息以一些很難察覺的方式嵌入到數(shù)據(jù)載體當(dāng)中[1]。這樣的技術(shù)一般都用于媒體版權(quán)的保護(hù),當(dāng)然也有一些文本文件與數(shù)據(jù)庫因員工數(shù)據(jù)水印技術(shù)。但是,在多媒體載體上與文本文檔或數(shù)據(jù)庫應(yīng)用數(shù)據(jù)水印技術(shù)卻有著極大的不同,即與這兩者數(shù)據(jù)的動(dòng)態(tài)性、無序等特點(diǎn)不相一致。從作用的力度來看,可以將數(shù)據(jù)水印技術(shù)劃分為強(qiáng)健水印類與脆弱水印類。一般情況下,強(qiáng)健水印類都用于數(shù)據(jù)起源的證明上,能夠有效的保護(hù)原作者的創(chuàng)作權(quán)等。而脆弱水印類則多用于證明數(shù)據(jù)真實(shí)與否。但針對(duì)于目前快速大量生產(chǎn)的大數(shù)據(jù)而言,水印技術(shù)明顯還需要在很多地方進(jìn)行改進(jìn)與完善。
身份認(rèn)證技術(shù)。所謂身份認(rèn)證技術(shù),即通過對(duì)用戶以及其所使用設(shè)備行為數(shù)據(jù)的采集與分析來獲取行為特征,從而通過利用這些所獲取的特征信息來對(duì)相應(yīng)的操作者、用戶以及所使用的設(shè)備的行為進(jìn)行有效的驗(yàn)證,最終確定其身份。顯然,通過身份認(rèn)證技術(shù)的應(yīng)用,黑客入侵攻擊的難度將得到陡增,不僅減輕了用戶的負(fù)擔(dān),也讓不同系統(tǒng)的認(rèn)證機(jī)制得到了統(tǒng)一。
數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)。以結(jié)構(gòu)化數(shù)據(jù)的角度來看,數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)即是保護(hù)數(shù)據(jù)安全與隱私過程中極為關(guān)鍵的部分。但是,就目前的情況來看,這項(xiàng)技術(shù)還存在著諸多的問題,需要進(jìn)行不斷的發(fā)掘與完善。目前,在數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)的基本理論中,絕大部分在設(shè)定環(huán)境的時(shí)候都是由用戶靜態(tài)的、一次性的對(duì)數(shù)據(jù)進(jìn)行發(fā)布。比如:通過抑制處理方式和元祖泛化方式來對(duì)標(biāo)識(shí)符進(jìn)行分組,而針對(duì)于具有共同屬性的集合而言,則采用匿名模式來對(duì)其進(jìn)行匿名處理[2]。顯然,這樣的方式很容易將某些特殊的屬性遺漏掉。但現(xiàn)實(shí)是多變的,一般情況下,數(shù)據(jù)發(fā)布都是多次的、連續(xù)的。在復(fù)雜的大數(shù)據(jù)環(huán)境下,要想讓數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)得以實(shí)現(xiàn),顯然是較困難的。針對(duì)于攻擊者而言,可以通過不同的渠道、不同的發(fā)布點(diǎn)來獲取各種數(shù)據(jù)、信息,從而確定用戶的信息。因此,針對(duì)于這一點(diǎn)而言,作為信息領(lǐng)域的相關(guān)研究人員,應(yīng)該投入更多的精力對(duì)其進(jìn)行深入的研究。
總之,就整體來看,國內(nèi)外針對(duì)于大數(shù)據(jù)安全與隱私保護(hù)技術(shù)的相關(guān)研究而言,明顯還不夠充分。因此,我們不僅要進(jìn)一步對(duì)技術(shù)手段進(jìn)行改善與創(chuàng)新,同時(shí)也要建立健全相關(guān)的政策法規(guī)。只有這樣,大數(shù)據(jù)安全與隱私的保護(hù)問題才能夠得以解決。
(作者單位:空軍指揮學(xué)院)