南陽醫(yī)學高等??茖W校 張 琪
大數(shù)據(jù)環(huán)境下的安全與隱私保護
南陽醫(yī)學高等專科學校 張 琪
當前時期,大數(shù)據(jù)已成為互聯(lián)網(wǎng)信息技術(shù)產(chǎn)業(yè)發(fā)展的大熱點,人們的生產(chǎn)生活已經(jīng)離不開手機和電腦,個人信息及隱私都存儲于互聯(lián)網(wǎng)上。為了防止信息的泄露,安全與隱私保護已成為大數(shù)據(jù)面臨的兩個重要問題。本文分析了解決大數(shù)據(jù)安全與隱私保護問題的關(guān)鍵技術(shù)。
大數(shù)據(jù);信息安全;隱私保護
大數(shù)據(jù)對當前社會的影響已經(jīng)深入到方方面面,各大互聯(lián)網(wǎng)企業(yè)早就意識到大數(shù)據(jù)的重要性,在發(fā)展過程中收集了大量有用的數(shù)據(jù)。利用大數(shù)據(jù)的專業(yè)的處理技術(shù)提取有用的信息,這些信息有相當?shù)膬r值,可用于公司下一步戰(zhàn)略發(fā)展的指導。不過,大數(shù)據(jù)與生俱來地存在著及大的安全隱患,由于個人大量的數(shù)據(jù)存儲于互聯(lián)網(wǎng)上,如果泄漏很容易被用來分析個人的基本情況,相當于沒有任何遮擋的暴露隱私。
大數(shù)據(jù)與傳統(tǒng)的信息安全問題相比,面臨的挑戰(zhàn)性問題有以下幾個。
1.1 大量個人數(shù)據(jù)的保護
大數(shù)據(jù)的存儲沒有得到妥善處理會對用戶的隱私造成極大的損害。根據(jù)隱私的外在表現(xiàn)形式,可將隱私分為抽象的隱私和具體的隱私,抽象的隱私是指隱私內(nèi)容是由一些數(shù)據(jù)、情報等形式所形成的,具體的隱私是指隱私的內(nèi)容能夠以具體形狀、行為等形式表現(xiàn)出來。人們面臨的威脅并不僅僅局限于個人隱私信息的泄漏,更在于不法分子基于大數(shù)據(jù)對個人狀態(tài)和行為的預測和分析。比如,通過分析用戶的所有微博、微信等信息,可以推測其生活習慣、消費能力和個人喜好等。
當前的互聯(lián)網(wǎng)公司眾多,大部分公司由于實力限制對用戶數(shù)據(jù)的收集、存儲、管理與使用等環(huán)節(jié)都缺乏規(guī)范,缺乏重視。用戶無法確定自己的信息是否保密,是否被他人不正當利用,自己也不能控制自己的信息在不再使用時銷毀掉。
1.2 大量虛假信息的排除
在這個數(shù)據(jù)爆發(fā)時代,有用信息多,無用或虛假信息也不少。很多數(shù)據(jù)收集到后如果不通過分析判斷很難分辯出哪些是有用的,哪些是虛假無用的。這些數(shù)據(jù)有可能是人為刻意偽造的,想通用這些信息誤導分析者,使其做出對其有利的行為。這類信息往往具有隱蔽性,混雜在其它真實數(shù)據(jù)當中。比如,淘寶的一些商品的評價,往往都是各類評價都有的,但有些商家雇人刷好評,試圖讓人們相信大多數(shù)人還是很看好這件商品的。這樣一些買家的真實體驗的評價就被當能少數(shù)人的意見而忽略。網(wǎng)絡(luò)中的虛假信息產(chǎn)生的影響是不可低估的,同時這種虛假信息是很難排除的。還有一種情況是由于信息經(jīng)過一斷時間后原始的信息來源發(fā)生變化,造成的信息失效。這種情況能可能過數(shù)據(jù)審核發(fā)現(xiàn),對無效數(shù)據(jù)進行去除或更新。
由于當前很多事務(wù)的辦理都在網(wǎng)上,網(wǎng)站或者軟件公司不能很好的保護用戶的信息,而且當前個人自己信息的態(tài)度也不是很重視??傊孤┖苋菀?,防范不可少。
2.1 軟件根據(jù)提供的服務(wù)要求用戶提供信息
現(xiàn)在大多數(shù)的手機軟件都會在安裝時開啟一些功能來收集用戶的數(shù)據(jù)。比如QQ和微信之類的社交軟件會自動攻取你的聯(lián)系人信息,當有聯(lián)系人也使用相同的軟件時,軟件會自動提醒你是否加為好友,并顯示其一些信息。有些瀏覽器和資訊軟件會要求用戶提供位置信息。而用戶對這些是沒有辦法選擇的,不得不接受這些服務(wù)。
2.2 個人隱私信息的自我泄漏
隨著互聯(lián)網(wǎng)的普及互聯(lián)網(wǎng)+的發(fā)展推動,越來越多的單位和個人傾向于在網(wǎng)上辦理各種事務(wù),交流和娛樂。人們在利用網(wǎng)絡(luò)的時候為了方便,會主動提交個人的真實姓名,照片甚至生日和家庭住址等信息,這種做法雖然顯得真誠,但也將自己的隱私暴露給了不該知道的人。
2.3 公司出于利益目地主動收集或購買數(shù)據(jù)
現(xiàn)在大數(shù)據(jù)已廣泛應(yīng)用于各行各業(yè)中了,每個行業(yè)對數(shù)據(jù)都有著及其的渴望。因為這些在數(shù)據(jù)能讓公司更加全面地了解客戶的特點,了解市場的需求,了解當前領(lǐng)域的發(fā)展動向。所以公司就需要大量的隱私數(shù)據(jù)來了解真實的情況,因為這將帶來巨大的收益而同時付出的代價卻是極小了,所以他們會利用各種辦法收集、購買所需數(shù)據(jù),這必然會造成大量的用戶隱私信息泄漏。
當前迫切需要對大數(shù)據(jù)面臨的安全問題進行解決,對用戶隱私保護、數(shù)據(jù)內(nèi)容真實性驗證,數(shù)據(jù)加密、訪問控制等方面進行技術(shù)研究。
3.1 數(shù)據(jù)匿名發(fā)布保護技術(shù)
要有效地保護用戶的數(shù)據(jù)安全和隱私,數(shù)據(jù)匿名發(fā)布保護技術(shù)是結(jié)構(gòu)化數(shù)據(jù)(或稱關(guān)系數(shù)據(jù))的核心技術(shù)。用戶一次性、靜態(tài)地發(fā)布數(shù)據(jù)是大部分數(shù)據(jù)匿名發(fā)布保護技術(shù)設(shè)定的前提。但現(xiàn)實情況下是多變的,用戶發(fā)布數(shù)據(jù)是持續(xù)多次的。因此攻擊者可以從不同的方式,網(wǎng)絡(luò)地址獲得各種信息,以此來組建特定用戶的信息體系。所以這一技術(shù)也不夠成熟,需要進一步的研究。
3.2 社交網(wǎng)絡(luò)匿名保護技術(shù)
社交網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)中,大量的是用戶隱私的非結(jié)構(gòu)化數(shù)據(jù)。這類數(shù)據(jù)特點是有一定的相關(guān)性,一般竊取信息者都會利用相關(guān)屬性進行分析整合,重塑個人的信息。由于社交網(wǎng)絡(luò)的圖結(jié)構(gòu)的特征,社交網(wǎng)絡(luò)中的典型匿名保護為用戶的用戶標識匿名與屬性匿名,這些數(shù)據(jù)在發(fā)布時既隱藏用戶的標識又隱藏了用戶間的關(guān)系,這樣攻擊者就不能通過節(jié)點屬性關(guān)系來識別用戶的身份信息。社交網(wǎng)絡(luò)匿名保護技術(shù)面臨的問題是,攻擊者根據(jù)用戶在社交網(wǎng)絡(luò)上公開的信息來推測匿名用戶,進一步判斷用戶與其它用戶之間的連接關(guān)系。
3.3 數(shù)據(jù)水印技術(shù)
數(shù)據(jù)水印技術(shù)是將保護識別信息以隱蔽的方式插入原始數(shù)據(jù)中,且不破壞原結(jié)構(gòu)不影響使用。多用于圖片、文檔和多媒體數(shù)據(jù)中,這類數(shù)據(jù)的特點是有一定的冗余信息且在使用中允許有一定的精度差。該技術(shù)可用于殘缺數(shù)據(jù)的驗證,前提是殘余數(shù)據(jù)量達到一定的閾值,就可驗證出水印,因此有廣闊的發(fā)展前景。
3.4 數(shù)據(jù)溯源技術(shù)
由于數(shù)據(jù)來源的多樣,信息來源變化較快,所以有必要記錄數(shù)據(jù)的來源及其傳播過程、處理方式等,為后期的挖掘與決策提供輔助支持。首先通過分析技術(shù)獲得大數(shù)據(jù)的來源,然后進行安全策略和安全機制的處理,同時用戶卻不希望數(shù)據(jù)來源本身這個隱私被分析者得到,所以這是一個要解決的問題。另一個問題是數(shù)據(jù)有大規(guī)模、多樣性和高速性的特點,使得標記信息是否正確成為此技術(shù)自身的安全問題。
3.5 自適應(yīng)的訪問控制
由于大數(shù)據(jù)安全管理員可能缺乏一定的專業(yè)知識,使得其無法為用戶提供相應(yīng)的訪問數(shù)據(jù),針對這種情況提出了自適應(yīng)訪問控制技術(shù)。通過統(tǒng)計學的方法定義了量化的算法,從而實現(xiàn)用戶隱私數(shù)據(jù)的可量化控制。
大數(shù)據(jù)時代的到來,帶來了新的發(fā)展機遇,同時也帶來了其安全問題。針對大數(shù)據(jù)環(huán)境下的安全和隱私保護問題,行業(yè)內(nèi)的技術(shù)人員研究出了一些關(guān)鍵的技術(shù),但這些技術(shù)并不太完善還需要進一步的研究與討論。大數(shù)據(jù)發(fā)展初期還需要政府提出相關(guān)的政策和法律規(guī)范來促進和保護,相信大數(shù)據(jù)會在未來更加安全、高效地為人們服務(wù)。
[1]馮登國,張敏,李昊.大數(shù)據(jù)安全與隱私保護[J].計算機學報,2014(1).
[2]謝邦昌,姜葉飛.大數(shù)據(jù)時代 隱私如何保護[J].中國統(tǒng)計,2013(06):24-28.
[3]戈悅迎.大數(shù)據(jù)時代信息安全與公民個人隱私保護[J].中國信息界,2014(1).