鎮(zhèn)江船艇學(xué)院基礎(chǔ)部信息技術(shù)教研室 楊 珍 鐘 誠(chéng) 杜曉靜
淺析大數(shù)據(jù)環(huán)境下的隱私保護(hù)問(wèn)題
鎮(zhèn)江船艇學(xué)院基礎(chǔ)部信息技術(shù)教研室 楊 珍 鐘 誠(chéng) 杜曉靜
大數(shù)據(jù)是當(dāng)前的研究熱點(diǎn),正影響著人們?nèi)粘I罘绞?、工作?xí)慣及思考模式.但目前大數(shù)據(jù)在收集、存儲(chǔ)和使用過(guò)程中面臨著諸多安全風(fēng)險(xiǎn),大數(shù)據(jù)所導(dǎo)致的隱私泄露為用戶帶來(lái)嚴(yán)重困擾,本文分析了實(shí)現(xiàn)大數(shù)據(jù)安全與隱私保護(hù)所面臨的技術(shù)挑戰(zhàn),給出了相應(yīng)的對(duì)策。
大數(shù)據(jù);隱私保護(hù)
近年來(lái),隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等IT與通信技術(shù)的迅猛發(fā)展,信息社會(huì)已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,數(shù)據(jù)的快速增長(zhǎng)成了許多行業(yè)共同面對(duì)的嚴(yán)峻挑戰(zhàn)和寶貴機(jī)遇。大數(shù)據(jù)已被美國(guó)在內(nèi)的多國(guó)政府視為重要的戰(zhàn)略資源,我國(guó)也在抓緊研究并制定相應(yīng)的大數(shù)據(jù)戰(zhàn)略。
大數(shù)據(jù)的特點(diǎn)多總結(jié)為“3V”,即,規(guī)模性(volume)、多樣性(variety)、高速性(Velocity)[1],還有人提出真實(shí)性(Veracity)和價(jià)值性(Value)等特征[2]。由于其數(shù)據(jù)來(lái)源及應(yīng)用涉及廣泛,導(dǎo)致了以往在生產(chǎn)、經(jīng)濟(jì)活動(dòng)、科學(xué)研究甚至日常生活中的很多思維方式發(fā)生巨大變化,帶來(lái)了無(wú)數(shù)機(jī)遇。但由于網(wǎng)絡(luò)大數(shù)據(jù)具有復(fù)雜性、不確定性和涌現(xiàn)性,導(dǎo)致網(wǎng)絡(luò)數(shù)據(jù)安全方面面臨巨大的挑戰(zhàn),制約大數(shù)據(jù)未來(lái)發(fā)展的瓶頸之一就是安全與隱私問(wèn)題。
在大數(shù)據(jù)時(shí)代,通過(guò)對(duì)大數(shù)據(jù)分析、歸納,從中挖掘出潛在的模式,研究社會(huì)運(yùn)行的規(guī)律與發(fā)展趨勢(shì),可以幫助企業(yè)、商家調(diào)整市場(chǎng)政策、減少風(fēng)險(xiǎn)、理性面對(duì)市場(chǎng)做出決策。隨著新技術(shù)的不斷出現(xiàn),在發(fā)現(xiàn)規(guī)律的同時(shí),可能會(huì)泄漏個(gè)人隱私,嚴(yán)重威脅到人們的個(gè)人信息安全和機(jī)構(gòu)的商業(yè)秘密安全。例如,我們的位置信息,每天的行程數(shù)據(jù),在大數(shù)據(jù)時(shí)代,通過(guò)GPS、手機(jī)定位等,可以輕易獲得。
如果僅僅為了保護(hù)隱私就將所有的數(shù)據(jù)都加以隱藏,那么數(shù)據(jù)的價(jià)值無(wú)法體現(xiàn)。數(shù)據(jù)公開(kāi)是非常有必要的,政府可以利用公開(kāi)的數(shù)據(jù)了解整個(gè)國(guó)民經(jīng)濟(jì)的運(yùn)行,以便更好地宏觀指導(dǎo)。企業(yè)可以利用公開(kāi)的數(shù)據(jù)了解客戶的需求,從而推出特色服務(wù)。研究者可以利用公開(kāi)的數(shù)據(jù),從社會(huì)、經(jīng)濟(jì)、技術(shù)等不同的角度來(lái)進(jìn)行研究。但是網(wǎng)絡(luò)中大量的公開(kāi)數(shù)據(jù)如果缺乏監(jiān)管,會(huì)導(dǎo)致用戶無(wú)法確定自己隱私的用途,增大了隱私泄漏的風(fēng)險(xiǎn)。
在網(wǎng)絡(luò)上人們?yōu)榱吮Wo(hù)個(gè)人隱私,可能采取匿名等方式將自己的行為隱藏起來(lái)。但是互聯(lián)網(wǎng)尤其是社交網(wǎng)絡(luò)的出現(xiàn),使得人們?cè)诰W(wǎng)絡(luò)中產(chǎn)生越來(lái)越多的數(shù)據(jù)足跡。這種數(shù)據(jù)具有累積性和關(guān)聯(lián)性,單個(gè)信息可能不會(huì)暴露用戶的隱私,但是如果有辦法將某個(gè)人的很多行為聚集在一起時(shí),他的隱私就很可能會(huì)暴露,因?yàn)橛嘘P(guān)他的信息已經(jīng)足夠多,這種隱性的數(shù)據(jù)暴露往往是個(gè)人無(wú)法預(yù)知和控制的。從技術(shù)層面來(lái)說(shuō),可以通過(guò)數(shù)據(jù)抽取和集成來(lái)實(shí)現(xiàn)用戶隱私的獲取,因此大數(shù)據(jù)時(shí)代的隱私性主要體現(xiàn)在不暴露用戶敏感信息的前提下進(jìn)行有效的數(shù)據(jù)挖掘,這有別于傳統(tǒng)的信息安全技術(shù)手段。
文獻(xiàn)[3]中提出保護(hù)隱私的數(shù)據(jù)挖掘這一概念,近年來(lái)逐漸成為相關(guān)領(lǐng)域的研究熱點(diǎn)。主要研究新型的數(shù)據(jù)發(fā)布技術(shù),嘗試在盡可能少損失數(shù)據(jù)信息的同時(shí)最大化地隱藏用戶隱私。Dwork在2006年提出了新的差分隱私方法[4]。差分隱私保護(hù)技術(shù)可能是解決大數(shù)據(jù)中隱私保護(hù)問(wèn)題的一個(gè)方向,但是這項(xiàng)技術(shù)離實(shí)際應(yīng)用還很遠(yuǎn)。大數(shù)據(jù)未被妥善處理會(huì)對(duì)用戶的隱私造成極大的侵害,根據(jù)需要保護(hù)的內(nèi)容不同,隱私保護(hù)又可以進(jìn)一步細(xì)分為位置隱私保護(hù)、標(biāo)識(shí)符匿名保護(hù)、連接關(guān)系匿名保護(hù)等[5]。根據(jù)大數(shù)據(jù)處理流程,可以分為幾個(gè)階段:
(1)數(shù)據(jù)采集與預(yù)處理時(shí)的隱私保護(hù),如數(shù)據(jù)精度處理;
(2)數(shù)據(jù)共享、發(fā)布時(shí)的隱私保護(hù),如數(shù)據(jù)的匿名處理等;
(3)數(shù)據(jù)分析時(shí)的隱私保護(hù);
(4)隱私數(shù)據(jù)可信銷毀等。
保證用戶個(gè)人信息安全是大數(shù)據(jù)時(shí)代可持續(xù)發(fā)展的重要需求之一,賬戶被盜、資料丟失、隱私被敲詐等等問(wèn)題,讓我們意識(shí)到隱私保護(hù)問(wèn)題是一個(gè)綜合性的問(wèn)題,需要用戶、運(yùn)營(yíng)商和監(jiān)管部門(mén)共同協(xié)作,從國(guó)家、行業(yè)和用戶等各個(gè)層面來(lái)應(yīng)對(duì)大數(shù)據(jù)環(huán)境中出現(xiàn)的安全問(wèn)題。
1.從法律政策上加強(qiáng)信息保護(hù)和管理?!叭旨夹g(shù),七分管理”,大數(shù)據(jù)下的隱私保護(hù)應(yīng)該是體制和法律的配套過(guò)程。數(shù)據(jù)資源是全民財(cái)產(chǎn),政府在推動(dòng)數(shù)據(jù)公開(kāi)的基礎(chǔ)上,需要對(duì)信息的保護(hù)范圍和措施從法律角度上限定,如敏感數(shù)據(jù)的所有權(quán)和使用權(quán)界定及侵犯他人隱私的處罰問(wèn)題。2013年3月1日開(kāi)始實(shí)施的《信息安全技術(shù)、公共及商用服務(wù)信息系統(tǒng)個(gè)人信息保護(hù)指南》,作為個(gè)人信息保護(hù)方面的最高國(guó)家標(biāo)準(zhǔn),它對(duì)大數(shù)據(jù)時(shí)代如何合理利用個(gè)人信息給予界定,以指導(dǎo)和規(guī)范利用信息系統(tǒng)處理個(gè)人信息的活動(dòng)。
2.從技術(shù)上保護(hù)基礎(chǔ)設(shè)施和網(wǎng)絡(luò)安全。大數(shù)據(jù)時(shí)代下的社交網(wǎng)絡(luò)數(shù)據(jù)的存儲(chǔ)和處理需要大規(guī)?;A(chǔ)設(shè)施的支撐,由于大量的數(shù)據(jù)匯集在一起,敏感數(shù)據(jù)集中起來(lái)會(huì)帶來(lái)攻擊效益的提高,極易成為黑客們攻擊的目標(biāo),基礎(chǔ)設(shè)施被攻擊的風(fēng)險(xiǎn)顯著提高,因而托管數(shù)據(jù)的云的安全非常重要,需要開(kāi)發(fā)相應(yīng)的反數(shù)據(jù)挖掘技術(shù)手段。
3.從管理上加強(qiáng)運(yùn)營(yíng)公司的監(jiān)控力度。社交網(wǎng)絡(luò)運(yùn)營(yíng)商應(yīng)該杜絕公司內(nèi)部人員對(duì)用戶數(shù)據(jù)的非正當(dāng)訪問(wèn),對(duì)外限制第三方公司對(duì)平臺(tái)內(nèi)數(shù)據(jù)的訪問(wèn)及相應(yīng)的授權(quán)公司能夠訪問(wèn)到的數(shù)據(jù)對(duì)象范圍,來(lái)加強(qiáng)數(shù)據(jù)的可控性。
4.從認(rèn)識(shí)上提高用戶的隱私保護(hù)意識(shí)。要讓大眾知道數(shù)據(jù)有價(jià)值,并能意識(shí)到數(shù)據(jù)管理不善可能帶來(lái)的危害,提高自身的數(shù)據(jù)意識(shí)。
大數(shù)據(jù)給人們帶來(lái)極大便利的同時(shí),也帶來(lái)了新的安全挑戰(zhàn)。本文主要闡述了大數(shù)據(jù)帶來(lái)的個(gè)人隱私方面的安全問(wèn)題。由于基于隱私保護(hù)的數(shù)據(jù)挖掘技術(shù)還處于起步階段,進(jìn)一步地完善基于隱私保護(hù)的大數(shù)據(jù)挖掘技術(shù)仍是將來(lái)的研究熱點(diǎn)。
[1]Grobelink M.Big-data computing:Creating revoIutionary breakthroughs in commerce,science and society[R/OL].20I2:10-02.
[2]http://wenku.baidu.com/view/abfb3a1552d380e b62946d9d.html:劉念真.利用0racle信息模型駕馭大數(shù)據(jù).
[3]Agrawal R,Srikant R.Privacy preserving data mining[C]//Proc of SIGMOD 2000.New York:ACM,2000:439-450.
[4]Dwork C.Differential privacy[C]//Proc of ICALP2006.Berlin:Springer,2006:1-12.
[5]馮登國(guó),張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014.
book=176,ebook=110