張曉芬
摘 要:隨著計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的飛速發(fā)展,數(shù)據(jù)信息技術(shù)得到了空前的發(fā)展,大數(shù)據(jù)的概念由此而生。在信息呈現(xiàn)爆炸式增長(zhǎng)的今天,大數(shù)據(jù)的產(chǎn)生給人們的生產(chǎn)和生活帶來(lái)了很大的便利,大數(shù)據(jù)之于傳統(tǒng)數(shù)據(jù)相比,最明顯的特點(diǎn)是數(shù)據(jù)量非常大、數(shù)據(jù)價(jià)值的無(wú)限、數(shù)據(jù)類(lèi)型的復(fù)雜,在實(shí)際的應(yīng)用中大數(shù)據(jù)更加高效且多元化。但是在大數(shù)據(jù)實(shí)際的運(yùn)用過(guò)程中也存在著許多的問(wèn)題,比如大數(shù)據(jù)安全和隱私保護(hù)問(wèn)題給人們帶來(lái)非常多的麻煩。因此從大數(shù)據(jù)的運(yùn)用現(xiàn)狀入手,來(lái)重點(diǎn)談?wù)劥髷?shù)據(jù)安全與隱私保護(hù)關(guān)鍵技術(shù)。
關(guān)鍵詞:大數(shù)據(jù);隱私保護(hù);關(guān)鍵技術(shù);信息安全
中圖分類(lèi)號(hào):D9 文獻(xiàn)標(biāo)識(shí)碼:A doi:10.19311/j.cnki.16723198.2019.32.071
0 引言
科學(xué)技術(shù)是一把雙刃劍,在當(dāng)今大數(shù)據(jù)被日益普及的今天,由大數(shù)據(jù)帶來(lái)的價(jià)值和大數(shù)據(jù)引發(fā)的安全問(wèn)題同樣引人注目,各種由于大數(shù)據(jù)沒(méi)有被妥善處理造成的泄露用戶(hù)隱私泄露問(wèn)題層出不窮,給人們帶來(lái)非常嚴(yán)重的危害。網(wǎng)絡(luò)的普及使得人們對(duì)于大數(shù)據(jù)的安全問(wèn)題的重視程度越來(lái)越高,對(duì)于大數(shù)據(jù)安全與隱私保護(hù)關(guān)鍵技術(shù)的研究也越來(lái)越多。
1 大數(shù)據(jù)安全與隱私保護(hù)研究背景和研究意義
1.1 大數(shù)據(jù)安全與隱私保護(hù)研究背景
隨著互聯(lián)網(wǎng)信息技術(shù)的發(fā)展,大數(shù)據(jù)與云計(jì)算成為人們關(guān)注的焦點(diǎn)。Web 2.0時(shí)代的到來(lái),使得互聯(lián)網(wǎng)發(fā)展進(jìn)入了一個(gè)新階段,普通用戶(hù)不單單是信息的瀏覽者和接受者,而成為信息的制造和參與者,各種信息數(shù)據(jù)呈現(xiàn)大爆炸式的增長(zhǎng)。美國(guó)互聯(lián)萬(wàn)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)的數(shù)據(jù)是以每年50%的增長(zhǎng)速度,數(shù)據(jù)的增長(zhǎng)速度快且呈現(xiàn)多樣,不僅表現(xiàn)為在互聯(lián)網(wǎng)或者移動(dòng)互聯(lián)網(wǎng)使用中所產(chǎn)生和發(fā)布的各種信息,還包括各類(lèi)數(shù)字設(shè)備和計(jì)算機(jī)系統(tǒng)所產(chǎn)生或采集到的數(shù)據(jù),包括全世界的電表、汽車(chē)和工業(yè)設(shè)備等的數(shù)碼傳感器的數(shù)據(jù)信息,一些關(guān)于運(yùn)動(dòng)、位置、震動(dòng)、溫度等變化的信息等。與傳統(tǒng)的數(shù)據(jù)相比,大數(shù)據(jù)的產(chǎn)生給人們的生活和企業(yè)的生產(chǎn)都帶來(lái)非常大的改變。大數(shù)據(jù)和計(jì)算機(jī)技術(shù)的結(jié)合,使得企業(yè)能夠從眾多的數(shù)據(jù)信息中提取出來(lái)并被運(yùn)用從而提高生產(chǎn)的效率和經(jīng)濟(jì)效益。大數(shù)據(jù)滲透到人們生活中的各個(gè)方面比如醫(yī)療、衛(wèi)生和環(huán)境保護(hù)等,使得人們的生活發(fā)生了翻天覆地的變化。大數(shù)據(jù)時(shí)代的到來(lái),使得眾多領(lǐng)域都發(fā)生了巨大的變革。同時(shí)我們還應(yīng)該看到,大數(shù)據(jù)時(shí)代的到來(lái)給網(wǎng)絡(luò)架構(gòu)和數(shù)據(jù)處理能力帶來(lái)了巨大的挑戰(zhàn),如何海量的數(shù)據(jù)中準(zhǔn)確且方便地提取出有用的信息,如何保障大數(shù)據(jù)的可信性,如何保護(hù)大數(shù)據(jù)中的普通用戶(hù)的隱私信息等,成了擺在人們面前的一個(gè)難題?,F(xiàn)在,在生產(chǎn)領(lǐng)域以阿里巴巴和谷歌為代表的互聯(lián)網(wǎng)企業(yè)正在搭建大數(shù)據(jù)存儲(chǔ)和分析平臺(tái),而在學(xué)術(shù)界對(duì)于大數(shù)據(jù)分析的研究也層出不窮。
1.2 大數(shù)據(jù)安全與隱私保護(hù)研究意義
大數(shù)據(jù)在國(guó)內(nèi)外發(fā)展非常迅速,但是隨之而來(lái)的大數(shù)據(jù)的安全與隱私保護(hù)問(wèn)題也屢見(jiàn)不鮮。大數(shù)據(jù)的安全與隱私保護(hù)涉及每一個(gè)人的相關(guān)利益,近些年人們?cè)诰W(wǎng)絡(luò)上的一言一行都被互聯(lián)網(wǎng)和大數(shù)據(jù)記錄了下來(lái),使得人們的社交情況、生活習(xí)慣、閱讀習(xí)慣、消費(fèi)習(xí)慣、生活方式等信息被互聯(lián)網(wǎng)商家掌握,一旦發(fā)生外泄給人們帶來(lái)很多的不便和困擾。同時(shí)大數(shù)據(jù)的可信性如果受到挑戰(zhàn),使得一些虛假的數(shù)據(jù)盛行網(wǎng)絡(luò),而虛假的數(shù)據(jù)又會(huì)給企業(yè)在分析時(shí)產(chǎn)生錯(cuò)誤或無(wú)效的大數(shù)據(jù)分析結(jié)果,使得企業(yè)在進(jìn)行大數(shù)據(jù)預(yù)判消費(fèi)者的消費(fèi)習(xí)慣等時(shí)出現(xiàn)較大的偏差,影響了后期的生產(chǎn)過(guò)程和銷(xiāo)售過(guò)程,不利于企業(yè)利潤(rùn)最大化和企業(yè)價(jià)值目標(biāo)的實(shí)現(xiàn)。
我們要意識(shí)到大數(shù)據(jù)安全和隱私保護(hù)能夠帶來(lái)國(guó)家的穩(wěn)定和經(jīng)濟(jì)的繁榮,大數(shù)據(jù)的安全既關(guān)系到普通的生活生產(chǎn),還會(huì)關(guān)系到國(guó)家的長(zhǎng)治久安和國(guó)家安全,只有建立完整的大數(shù)安全與隱私保護(hù),才能捍衛(wèi)國(guó)家網(wǎng)絡(luò)空間主權(quán),保護(hù)國(guó)家信息的安全,提升國(guó)家層面的信息數(shù)據(jù)競(jìng)爭(zhēng)力,維護(hù)國(guó)家的穩(wěn)定和經(jīng)濟(jì)的可持續(xù)發(fā)展。同時(shí)大數(shù)據(jù)在安全和隱私保護(hù)等技術(shù)上有所突破,有可能會(huì)產(chǎn)生新的行業(yè)或產(chǎn)業(yè),由此產(chǎn)生的數(shù)據(jù)服務(wù)、數(shù)據(jù)材料邁入信息化和數(shù)字化的新階段,最終實(shí)現(xiàn)了人—機(jī)—物三者的有機(jī)融合,實(shí)現(xiàn)了產(chǎn)業(yè)技術(shù)的升級(jí)。總之,大數(shù)據(jù)安全與隱私保護(hù)意義深刻,我們應(yīng)該予以高度的重視。
2 大數(shù)據(jù)帶來(lái)的安全與隱私保護(hù)的挑戰(zhàn)
2.1 大數(shù)據(jù)中的用戶(hù)隱私外泄
大數(shù)據(jù)在使用過(guò)程中經(jīng)歷了數(shù)據(jù)的生成、數(shù)據(jù)的存儲(chǔ)、數(shù)據(jù)處理和分析、數(shù)據(jù)的應(yīng)用這幾個(gè)階段。在大數(shù)據(jù)安全與隱私保護(hù)系統(tǒng)中數(shù)據(jù)的生成者、數(shù)據(jù)的收集和監(jiān)管者、數(shù)據(jù)的用戶(hù)都有可能會(huì)造成數(shù)據(jù)和隱私的外泄。首先,大數(shù)據(jù)的生成和擁有者,一些數(shù)據(jù)或信息通過(guò)主動(dòng)或被動(dòng)的形式為大數(shù)據(jù)擁有者所獲取,比如銀行的用戶(hù)交易信息,在用戶(hù)進(jìn)行交易或者開(kāi)戶(hù)時(shí)所填寫(xiě)的用戶(hù)姓名、電話(huà)、住址和職業(yè)等,還包括用戶(hù)在銀行的存款、經(jīng)濟(jì)狀況和消費(fèi)習(xí)慣等都會(huì)通過(guò)開(kāi)戶(hù)建檔的形式成為銀行所擁有的企業(yè)信息資料。這些信息記錄一旦完成用戶(hù)交易這個(gè)過(guò)程,就會(huì)脫離作為這些數(shù)據(jù)的生成者的用戶(hù)的掌控,成為銀行所掌握和使用的資料,給用戶(hù)的隱私保護(hù)帶來(lái)巨大的威脅。其次,數(shù)據(jù)的收集和監(jiān)管者造成的用戶(hù)隱私泄露,這些持有大數(shù)據(jù)信息的單位或個(gè)人是數(shù)據(jù)的管理者,也是數(shù)據(jù)的分析和使用者,他們通過(guò)各種技術(shù)和手段對(duì)于大量的數(shù)據(jù)進(jìn)行分析和挖掘,找出有用的信息來(lái)進(jìn)行使用從而進(jìn)一步提高企業(yè)的生產(chǎn)利潤(rùn)。在這一過(guò)程中如果沒(méi)有對(duì)相關(guān)信息進(jìn)行匿名或相關(guān)處理,就有可能會(huì)在數(shù)據(jù)分享或公開(kāi)的過(guò)程中發(fā)生用戶(hù)隱私的泄露。第三方面是數(shù)據(jù)用戶(hù)也就是從數(shù)據(jù)收集者手里通過(guò)有償或無(wú)償?shù)姆绞将@得的數(shù)據(jù)或有關(guān)數(shù)據(jù)的查詢(xún)信息,這些數(shù)據(jù)雖然是經(jīng)過(guò)脫敏等處理過(guò)的,但是也有可能通過(guò)一些技術(shù)進(jìn)行還原,造成用戶(hù)隱私外泄。最后是數(shù)據(jù)攻擊者,這些數(shù)據(jù)攻擊者或者通過(guò)合法購(gòu)買(mǎi)的方式,或者通過(guò)非法攻擊的手段來(lái)取得相關(guān)數(shù)據(jù)信息,獲得數(shù)據(jù)生成者的一些包括姓名、年齡、消費(fèi)習(xí)慣等敏感信息,從而進(jìn)行某些活動(dòng)的行為,數(shù)據(jù)攻擊者是造成用戶(hù)隱私外泄的最有可能的因素所在??傊诖髷?shù)據(jù)的生成、儲(chǔ)存、使用和監(jiān)管過(guò)程中都缺乏有效的監(jiān)督和監(jiān)管技術(shù),用戶(hù)無(wú)法確保自己的相關(guān)信息是否被用于合理的研究還是非法的買(mǎi)賣(mài)。
2.2 大數(shù)據(jù)中的可信性下降
大數(shù)據(jù)的可信性的威脅主要表現(xiàn)在兩個(gè)方面:首先大數(shù)據(jù)本身被篡改或者刻意被偽造,使得數(shù)據(jù)在傳輸和使用前就出現(xiàn)了失真的情況,從而造成的大數(shù)據(jù)的可信性大大下降的情況。為了達(dá)到一定的商業(yè)目的通過(guò)偽造和仿造的形式來(lái)制造一些虛假的數(shù)據(jù)信息,錯(cuò)誤的數(shù)據(jù)得出的往往是錯(cuò)誤的結(jié)論或決定,這導(dǎo)致了大數(shù)據(jù)的使用者,比如一些使用這些數(shù)據(jù)的企業(yè)會(huì)根據(jù)這些錯(cuò)誤的結(jié)論作出不利于企業(yè)發(fā)展的戰(zhàn)略決策,使得企業(yè)在激烈的市場(chǎng)競(jìng)爭(zhēng)中處于不利的地位。再加上假的數(shù)據(jù)信息往往是和真的數(shù)據(jù)信息相互結(jié)合的,我們很難從冗繁的數(shù)據(jù)庫(kù)中通過(guò)信息安全鑒別手段從而找出哪個(gè)信息是假的,哪個(gè)信息是真的;其次。大數(shù)據(jù)信息在傳播和使用過(guò)程中出現(xiàn)的失真和偏差,從而影響了大數(shù)據(jù)的可信性。這一過(guò)程造成的數(shù)據(jù)失真很大程度上是由于人為干預(yù)所引起的,在數(shù)據(jù)的采集過(guò)程中或者有意或者無(wú)意造成大數(shù)據(jù)的誤差和失真,也會(huì)造成數(shù)據(jù)分析的結(jié)果的偏差。另外一些過(guò)時(shí)的早期信息也會(huì)對(duì)大數(shù)據(jù)的可信性構(gòu)成威脅,比如早已經(jīng)更改的聯(lián)系方式的個(gè)人或企業(yè),由于收集的相關(guān)數(shù)據(jù)信息沒(méi)有及時(shí)的補(bǔ)充和更新,不能真實(shí)反映現(xiàn)今的真實(shí)狀況。
2.3 缺失大數(shù)據(jù)的規(guī)范管理
現(xiàn)如今,我國(guó)政府和有關(guān)部門(mén)還沒(méi)有制定專(zhuān)門(mén)的有關(guān)大數(shù)據(jù)信息安全和用戶(hù)隱私保護(hù)的法律法規(guī),對(duì)于當(dāng)今大數(shù)據(jù)的監(jiān)管主要還依靠企業(yè)的自覺(jué)和個(gè)人的職業(yè)道德,當(dāng)真的出現(xiàn)大數(shù)據(jù)安全和用戶(hù)隱私泄露時(shí)又沒(méi)有進(jìn)行及時(shí)止損,由此而造成的損失則會(huì)越來(lái)越大。同時(shí)再加上大數(shù)據(jù)的使用過(guò)程比較多且復(fù)雜,人和一個(gè)環(huán)節(jié)都有可能會(huì)出現(xiàn)安全或隱私泄露問(wèn)題,我們要對(duì)這其中的每一個(gè)環(huán)節(jié)進(jìn)行監(jiān)督和管理,由此所帶來(lái)的相關(guān)管理成本增大。
3 大數(shù)據(jù)安全與隱私保護(hù)關(guān)鍵技術(shù)
3.1 數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)
數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)是實(shí)現(xiàn)大數(shù)據(jù)安全和隱私保護(hù)的基本手段和核心關(guān)鍵技術(shù)。隱私保護(hù)數(shù)據(jù)包括微數(shù)據(jù)、標(biāo)識(shí)符、準(zhǔn)標(biāo)識(shí)符、敏感屬性和非敏感屬性等幾個(gè)方面,以銀行開(kāi)戶(hù)信息為例,微數(shù)據(jù)指的是原始的個(gè)人數(shù)據(jù),開(kāi)戶(hù)人的姓名是標(biāo)識(shí)符,而開(kāi)戶(hù)人的性別、年齡、職業(yè)和家庭住址等屬于準(zhǔn)標(biāo)識(shí)符,而開(kāi)戶(hù)人的銀行流水情況和資產(chǎn)多少都屬于敏感屬性,應(yīng)該得到保護(hù),如果一旦這些信息被泄露出去,就會(huì)使得客戶(hù)受到各種困擾,對(duì)他的生活造成不利影響,因此我們?cè)跀?shù)據(jù)發(fā)布中要實(shí)行匿名保護(hù)技術(shù),從數(shù)據(jù)的發(fā)布角度保護(hù)用戶(hù)的隱私問(wèn)題,提出MNSAGM匿名模型和算法,從而有效抵御多維數(shù)值型敏感屬性數(shù)據(jù)的近似攻擊。
3.2 社交網(wǎng)絡(luò)數(shù)據(jù)的匿名化隱私保護(hù)技術(shù)
社交網(wǎng)絡(luò)數(shù)據(jù)的匿名化隱私保護(hù)技術(shù)指的是在計(jì)算機(jī)網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)中運(yùn)用對(duì)敏感信息進(jìn)行模糊、隱匿和清洗的過(guò)程,從而將用戶(hù)隱私的泄露風(fēng)險(xiǎn)降低到最小水平。社交網(wǎng)絡(luò)具有圖結(jié)構(gòu)的特征,社交網(wǎng)絡(luò)之間的所記錄的數(shù)據(jù)不是相互獨(dú)立的,而是相互之間存在著某種關(guān)聯(lián),或者是協(xié)同關(guān)系或者是關(guān)聯(lián)關(guān)系,所以數(shù)據(jù)攻擊者有可能通過(guò)一種數(shù)據(jù)信息從而推測(cè)得出另一種數(shù)據(jù)信息,也可以通過(guò)公開(kāi)信息去推測(cè)隱匿的信息,所以我們要推廣社交網(wǎng)絡(luò)數(shù)據(jù)的匿名化隱私保護(hù)技術(shù)。社交網(wǎng)絡(luò)數(shù)據(jù)的匿名方法包括樹(shù)泛化、域泛化、數(shù)據(jù)扭曲和子圖匿名四種,不同的社交網(wǎng)絡(luò)類(lèi)型選擇的匿名方法也各不相同。針對(duì)協(xié)同性社交網(wǎng)絡(luò),可以通過(guò)樹(shù)泛化和分類(lèi)樹(shù)的匿名方法來(lái)清除隱私標(biāo)識(shí)符對(duì)用戶(hù)的辨認(rèn)作用從而實(shí)現(xiàn)匿名化的隱私保護(hù)。對(duì)于關(guān)聯(lián)性社交網(wǎng)絡(luò)的匿名化方法采用的是域泛化和消減樹(shù)的方式來(lái)實(shí)現(xiàn)匿名模型的節(jié)點(diǎn)隱私和邊隱私。針對(duì)大規(guī)模協(xié)同性社交網(wǎng)絡(luò)采用樹(shù)泛化和并行改進(jìn)的匿名方法。而復(fù)雜關(guān)聯(lián)性社交網(wǎng)絡(luò)采用的是域泛化和平衡理論的匿名方法。
3.3 數(shù)據(jù)水印技術(shù)
數(shù)據(jù)水印技術(shù)是將標(biāo)識(shí)信息嵌入到數(shù)據(jù)載體內(nèi)部,但是卻不影響數(shù)據(jù)的使用的一種技術(shù)方法。數(shù)字水印是信息隱藏技術(shù)的一個(gè)重要研究方向。數(shù)字水印技術(shù)具有很高的安全性,信息難以篡改或偽造,而且誤檢測(cè)率特別低。同時(shí)數(shù)據(jù)水印技術(shù)還具有很高的隱蔽性、魯棒性和水印容量。在使用數(shù)據(jù)水印后,不影響被保護(hù)數(shù)據(jù)的正常使用,而且在經(jīng)歷過(guò)多次信息處理或修改后,可以準(zhǔn)確鑒別其真實(shí)性和完整性。我們要運(yùn)用數(shù)據(jù)水印技術(shù)就要掌握數(shù)字水印生成和隱藏技術(shù)、水印防復(fù)制技術(shù)、抗衰減技術(shù)、數(shù)字水印檢驗(yàn)機(jī)讀化技術(shù)等。
3.4 數(shù)據(jù)溯源技術(shù)
數(shù)據(jù)溯源技術(shù)是對(duì)大數(shù)據(jù)的記錄來(lái)源、傳播和計(jì)算的過(guò)程等進(jìn)行追根溯源,從而確保數(shù)據(jù)的準(zhǔn)確性和精確性,為后期的數(shù)據(jù)的分析和使用提供有效的支持和輔助。我們?cè)跀?shù)據(jù)溯源過(guò)程中常用的方法包括標(biāo)注法和反向查詢(xún)法兩種。標(biāo)注法是對(duì)原始數(shù)據(jù)的重要信息進(jìn)行標(biāo)注并使其隨著原始數(shù)據(jù)的傳播而傳播的過(guò)程,反向查詢(xún)法是用戶(hù)通過(guò)設(shè)置函數(shù)和相對(duì)應(yīng)的驗(yàn)證函數(shù)來(lái)進(jìn)行逆向推理的過(guò)程。總之?dāng)?shù)據(jù)溯源技術(shù)的應(yīng)用十分廣泛,并在大數(shù)據(jù)安全與用戶(hù)隱私保護(hù)中起到了非常重要的作用。
3.5 風(fēng)險(xiǎn)自適應(yīng)的訪(fǎng)問(wèn)控制
風(fēng)險(xiǎn)自適應(yīng)的訪(fǎng)問(wèn)控制主要適用于因?yàn)閿?shù)據(jù)安全管理員缺乏專(zhuān)業(yè)大數(shù)據(jù)安全管理知識(shí),缺少為用戶(hù)指定訪(fǎng)問(wèn)數(shù)據(jù)經(jīng)驗(yàn)的大場(chǎng)景中。我們可以提前設(shè)置一個(gè)訪(fǎng)問(wèn)的預(yù)定門(mén)限,當(dāng)某一位用戶(hù)在進(jìn)行大數(shù)據(jù)訪(fǎng)問(wèn)的過(guò)程中超過(guò)了這一預(yù)定門(mén)限,就對(duì)其采取限制措施,使其不能再繼續(xù)訪(fǎng)問(wèn)。我們要設(shè)置風(fēng)險(xiǎn)自適應(yīng)的訪(fǎng)問(wèn)控制的門(mén)限就要綜合多方面的因素來(lái)考慮,實(shí)現(xiàn)既能保護(hù)用戶(hù)的隱私和數(shù)據(jù)的安全,又能盡可能滿(mǎn)足大數(shù)據(jù)使用者的數(shù)據(jù)信息使用的需求。
4 總結(jié)
大數(shù)據(jù)帶來(lái)的安全問(wèn)題和用戶(hù)隱私泄露問(wèn)題值得我們每一個(gè)人進(jìn)行深思,我們要通過(guò)對(duì)關(guān)鍵技術(shù)的完善和發(fā)展,包括數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)、社交網(wǎng)絡(luò)數(shù)據(jù)的匿名化隱私保護(hù)技術(shù)、數(shù)據(jù)水印技術(shù)、數(shù)據(jù)溯源技術(shù)和風(fēng)險(xiǎn)自適應(yīng)的訪(fǎng)問(wèn)控制等,將大數(shù)據(jù)的安全和用戶(hù)隱私泄露的隱患降到最低,真正實(shí)現(xiàn)大數(shù)據(jù)為人們的生產(chǎn)和生活服務(wù)。
參考文獻(xiàn)
[1]馮登國(guó).張敏.李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014,(37).
[2]曾琴.大數(shù)據(jù)環(huán)境下隱私保護(hù)及其關(guān)鍵技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2018,(07).