胡 柳,王 梅,鄧 杰,葉 靜,趙正偉
(1.湖南信息職業(yè)技術(shù)學(xué)院 計(jì)算機(jī)工程學(xué)院,湖南 長(zhǎng)沙 410200;2.湖南省長(zhǎng)沙市岳麓觀沙嶺街道,湖南 長(zhǎng)沙 410023;3.廣西民族大學(xué) 信息科學(xué)與工程學(xué)院,廣西 南寧 530006)
?
大數(shù)據(jù)環(huán)境下的隱私保護(hù)研究
胡 柳1,王 梅1,鄧 杰1,葉 靜2,趙正偉3
(1.湖南信息職業(yè)技術(shù)學(xué)院 計(jì)算機(jī)工程學(xué)院,湖南 長(zhǎng)沙 410200;2.湖南省長(zhǎng)沙市岳麓觀沙嶺街道,湖南 長(zhǎng)沙 410023;3.廣西民族大學(xué) 信息科學(xué)與工程學(xué)院,廣西 南寧 530006)
針對(duì)大數(shù)據(jù)處理過(guò)程中泄露用戶(hù)隱私的問(wèn)題,必須要對(duì)大數(shù)據(jù)進(jìn)行有效的保護(hù),盡可能減少用戶(hù)敏感信息的泄露。采用匿名與分級(jí)管理技術(shù)為中心的大數(shù)據(jù)隱私保護(hù)策略,研究表明,在現(xiàn)有的技術(shù)基礎(chǔ)之上采用該策略,能有效減少用戶(hù)隱私信息的泄露,為大數(shù)據(jù)隱私保護(hù)的研究提供了參考。
大數(shù)據(jù);隱私數(shù)據(jù);匿名技術(shù);分級(jí)管理
隨著物聯(lián)網(wǎng)、智能交通、金融中心、云計(jì)算等技術(shù)的發(fā)展與運(yùn)用,大數(shù)據(jù)概念逐漸進(jìn)入人們的視野,這些無(wú)結(jié)構(gòu)的數(shù)據(jù)通過(guò)網(wǎng)絡(luò)進(jìn)行交換與處理,最終形成與生活密切相關(guān)的支撐服務(wù)基礎(chǔ)數(shù)據(jù),如智能家居中各類(lèi)傳感器產(chǎn)生的數(shù)據(jù)、地下軌道交通中各設(shè)備傳回管理中心的數(shù)據(jù)、云平臺(tái)中的各類(lèi)數(shù)據(jù)等[1-2]。
大數(shù)據(jù)的發(fā)展IDC的研究結(jié)果表明:全球數(shù)據(jù)量大約每?jī)赡攴环?,且產(chǎn)生的數(shù)據(jù)量按指數(shù)級(jí)增長(zhǎng),預(yù)計(jì)到2020年全球的數(shù)據(jù)量將達(dá)35 ZB(1 ZB=1 024 EB)[3]。大數(shù)據(jù)將成為信息產(chǎn)業(yè)的增長(zhǎng)點(diǎn),IDC預(yù)計(jì)中國(guó)大數(shù)據(jù)技術(shù)和服務(wù)市場(chǎng)在2011~2017年之間,年均增長(zhǎng)率38.7%,由1.65億美元增長(zhǎng)至8.5億美元[4]。目前,數(shù)據(jù)的增長(zhǎng)速度已超越了數(shù)據(jù)存儲(chǔ)如數(shù)據(jù)處理技術(shù),如淘寶網(wǎng)每天產(chǎn)生的交易數(shù)據(jù)高達(dá)10 TB[5]。
大數(shù)據(jù)的特征大數(shù)據(jù)帶來(lái)了機(jī)遇,但也存在對(duì)數(shù)據(jù)的有效管理和利用提出了新的挑戰(zhàn)[6]。由于數(shù)據(jù)來(lái)源范圍廣,大數(shù)據(jù)的特征也比較明顯,孟小峰等人對(duì)現(xiàn)有的大數(shù)據(jù)研究資料進(jìn)行歸納和總結(jié),在大數(shù)據(jù)定義層次上的3V(Volume,Variety,Velocity)基礎(chǔ)上考慮4V(Value)特性[7]。大數(shù)據(jù)的來(lái)源有人、機(jī)、物等,其中人是指人們?cè)谛畔⒕W(wǎng)絡(luò)中進(jìn)行的各項(xiàng)活動(dòng)產(chǎn)生的數(shù)據(jù),如文本、音頻、視頻等數(shù)據(jù)。機(jī)是指計(jì)算機(jī)、磁盤(pán)等設(shè)備中的文件、數(shù)據(jù)等。物是指各類(lèi)感知設(shè)備收集的數(shù)據(jù)信息。
(1)數(shù)據(jù)量巨大(Volume)。傳統(tǒng)的存儲(chǔ)技術(shù)和處理技術(shù)難以管理、處理PB、ZB級(jí)別的數(shù)據(jù),未來(lái)將在存儲(chǔ)、計(jì)算、分析技術(shù)及處理工具的發(fā)展上進(jìn)行重點(diǎn)研究,以確保未來(lái)大數(shù)據(jù)的處理完整、精確;
(2)數(shù)據(jù)種類(lèi)多(Variety)。大數(shù)據(jù)是包含著不同來(lái)源、不同數(shù)據(jù)產(chǎn)生源的數(shù)據(jù),如網(wǎng)絡(luò)、物聯(lián)網(wǎng)、移動(dòng)應(yīng)用、汽車(chē)、傳感器、醫(yī)療、金融、交通等各行業(yè)內(nèi)產(chǎn)生的數(shù)據(jù)都是大數(shù)據(jù)的一部分,數(shù)據(jù)種類(lèi)和格式無(wú)法實(shí)現(xiàn)以往的結(jié)構(gòu)化、組織化、規(guī)律化,其中的數(shù)據(jù)可能是半結(jié)構(gòu)化、非結(jié)構(gòu)化、無(wú)組織、無(wú)邏輯的數(shù)據(jù);
(3)數(shù)據(jù)產(chǎn)生速度快(Velocity)。IDC的預(yù)測(cè)中,數(shù)據(jù)量將呈現(xiàn)指數(shù)級(jí)別的增長(zhǎng),到2020年數(shù)據(jù)量為35ZB,隨著處理技術(shù)的進(jìn)步,而自處理過(guò)程同樣將產(chǎn)生新的數(shù)據(jù);
(4)區(qū)域內(nèi)價(jià)值密度低(Value)。由于數(shù)據(jù)量的擴(kuò)大,而在其中能尋找到的有效價(jià)值則越低。
大數(shù)據(jù)處理技術(shù)大數(shù)據(jù)的處理主要過(guò)程有:數(shù)據(jù)采集與預(yù)處理、管理與提取、分析、應(yīng)用等,其整體架構(gòu)如圖1所示。
圖1 大數(shù)據(jù)處理技術(shù)架構(gòu)
(1)數(shù)據(jù)采集及預(yù)處理。對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化或無(wú)規(guī)則的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行前期處理,如數(shù)據(jù)清洗、去除重復(fù)的數(shù)據(jù)、數(shù)據(jù)規(guī)整、結(jié)構(gòu)化等,檢查數(shù)據(jù)的一致性、處理無(wú)效值和缺失值等。文獻(xiàn)[8]基于D-S證據(jù)理論中置信區(qū)間的概念,提出了一種基于待測(cè)數(shù)據(jù)項(xiàng)置信區(qū)間來(lái)檢測(cè)查詢(xún)結(jié)果中錯(cuò)誤數(shù)據(jù)的方法;
(2)數(shù)據(jù)管理。采用NoSQL技術(shù)、文件存儲(chǔ)、索引等技術(shù)對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)與管理,大數(shù)據(jù)的來(lái)源廣泛,對(duì)實(shí)時(shí)性要求較高的系統(tǒng)需要提高數(shù)據(jù)吞吐量,一般采用分布式文件來(lái)存儲(chǔ)大數(shù)據(jù),如GFS/HDFS[9],GFS是谷歌文件系統(tǒng),一種可擴(kuò)展的分布式文件系統(tǒng),用于大型的、分布式的、對(duì)大量數(shù)據(jù)進(jìn)行訪問(wèn)的應(yīng)用。它運(yùn)行于廉價(jià)的普通硬件上,并提供容錯(cuò)功能。HDFS是Hadoop分布式文件系統(tǒng),HDFS具有高度容錯(cuò)性,適合部署在普通的設(shè)備上,具有較高吞吐量的數(shù)據(jù)訪問(wèn),適合大規(guī)模數(shù)據(jù)集上的應(yīng)用;
(3)數(shù)據(jù)分析。對(duì)大數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,是大數(shù)據(jù)應(yīng)用的核心部分,MapReduce是當(dāng)前采用最為廣泛的計(jì)算模型,文獻(xiàn)[10]對(duì)MapReduce并行編程進(jìn)行了綜述研究,重點(diǎn)對(duì)模型改進(jìn)、任務(wù)調(diào)度、負(fù)載均衡和容錯(cuò)性進(jìn)行分析。文獻(xiàn)[11]提出了基于BloomFilter的等值連接算法,利用BloomFilter減少M(fèi)ap和Reduce之間網(wǎng)絡(luò)傳輸量從而提高等值連接算法的效率。文獻(xiàn)[12]提出一種在異構(gòu)環(huán)境下基于蟻群算法的多任務(wù)集群調(diào)度算法MSBACO,同時(shí)提出一種新的目標(biāo)轉(zhuǎn)移函數(shù),提高集群性能;
(4)數(shù)據(jù)應(yīng)用。通過(guò)對(duì)大數(shù)據(jù)統(tǒng)計(jì)分析得到的結(jié)果可以進(jìn)行相應(yīng)的預(yù)測(cè)、推理,用于醫(yī)院、交通、金融等行業(yè),對(duì)日常生活將產(chǎn)生積極的推動(dòng)作用。
2.1 個(gè)人數(shù)據(jù)隱私
大數(shù)據(jù)環(huán)境下最為關(guān)鍵的就是個(gè)人數(shù)據(jù)的隱私問(wèn)題,當(dāng)海量而繁雜的數(shù)據(jù)匯總到一塊時(shí),會(huì)呈現(xiàn)出結(jié)構(gòu)化、非結(jié)構(gòu)化等形式,而其中就會(huì)包括各類(lèi)含有個(gè)人隱私的數(shù)據(jù),如論壇、貼吧、資訊、博客等網(wǎng)站上的用戶(hù)數(shù)據(jù),可以匹配出聯(lián)系電話(huà)、郵箱、姓名、價(jià)值取向、位置等用戶(hù)個(gè)人的隱私數(shù)據(jù)。如A用戶(hù)在博客上的信息包括用戶(hù)名、性別、地址、從事職業(yè),其在資訊網(wǎng)上的信息包括姓名、電話(huà)等實(shí)名注冊(cè)信息,當(dāng)這些信息混合在一起時(shí),通過(guò)相同的用戶(hù)名進(jìn)行連接,則有可能將該用戶(hù)的全面的個(gè)人隱私資料都分析出來(lái)。
2.2 安全風(fēng)險(xiǎn)提升
在網(wǎng)絡(luò)中,大數(shù)據(jù)以其信息量、集中度、規(guī)范性等特點(diǎn),成為黑客攻擊的主要目標(biāo),只要能進(jìn)入到平臺(tái)中,即意味著能獲取大量的信息,這些內(nèi)容中包含有用戶(hù)信息、商業(yè)信息、金融信息等各類(lèi)敏感數(shù)據(jù),這樣降低了黑客獲取數(shù)據(jù)的成本、提高了效率。因此,安全風(fēng)險(xiǎn)問(wèn)題不斷提升,成為黑客攻擊的主要目標(biāo)。
2.3 平臺(tái)管理
大數(shù)據(jù)平臺(tái)通常都具有較快的運(yùn)算速度、數(shù)據(jù)存儲(chǔ)速度、網(wǎng)絡(luò)傳輸速度,全面的大數(shù)據(jù)平臺(tái)每天都處理海量的數(shù)據(jù)信息,平臺(tái)管理者需要時(shí)時(shí)監(jiān)控當(dāng)前的運(yùn)行情況,包括數(shù)據(jù)處理和數(shù)據(jù)存儲(chǔ),采用新的處理技術(shù)、數(shù)據(jù)緩沖技術(shù)來(lái)解決遇到的問(wèn)題。
3.1 加密技術(shù)
若用戶(hù)在A應(yīng)用程序中進(jìn)行注冊(cè),應(yīng)用程序可以對(duì)其提交的每條信息進(jìn)行加密存儲(chǔ),Y為加密后的密文,n為字符串長(zhǎng)度,C為加密算法,對(duì)每一位字符進(jìn)行條件加密,如式(1)所示
(1)
應(yīng)用程序在使用用戶(hù)的信息時(shí),則進(jìn)行解密過(guò)程,按加密的逆過(guò)程將明文應(yīng)用于數(shù)據(jù)處理過(guò)程中。
3.2 水印技術(shù)
大數(shù)據(jù)平臺(tái)中,水印技術(shù)可以用于驗(yàn)證和溯源,但是大數(shù)據(jù)快速的處理速度和存儲(chǔ)速度又使得水印技術(shù)需提高其應(yīng)用場(chǎng)景,不僅在多媒體載體文件,而應(yīng)該是包含在更多的數(shù)據(jù)信息中。
3.3 匿名技術(shù)
社交網(wǎng)絡(luò)數(shù)據(jù)通常是攻擊者的主要目標(biāo),大數(shù)據(jù)中某一份用戶(hù)數(shù)據(jù)將包含大量其它用戶(hù)群體的數(shù)據(jù),通常一個(gè)用戶(hù)的社交數(shù)據(jù)可以描述如式(2)所示
k={(t1,r1),(t2,r2),(t3,r3),…,(tn,rn)}
(2)
其中,t為序列,r為關(guān)系,即當(dāng)前用戶(hù)的n個(gè)社交關(guān)系數(shù)據(jù)集合。
當(dāng)攻擊者獲取到部分?jǐn)?shù)據(jù)時(shí),可以通過(guò)循環(huán)而獲取大量社交網(wǎng)絡(luò)用戶(hù)群體的個(gè)人信息,從而造成嚴(yán)重的后果。
匿名技術(shù)要求用戶(hù)或大數(shù)據(jù)平臺(tái)都采用相關(guān)的機(jī)制進(jìn)行隱私保護(hù),如對(duì)用戶(hù)關(guān)系結(jié)點(diǎn)、邊界、中心進(jìn)行加密或重分布技術(shù),保護(hù)用戶(hù)隱私數(shù)據(jù)不被泄露或破解。
3.4 訪問(wèn)控制技術(shù)
用戶(hù)訪問(wèn)大數(shù)據(jù)平臺(tái)時(shí),根據(jù)其興趣或角色的不同為其提供不同的數(shù)據(jù)服務(wù),安全維護(hù)管理員需要為訪問(wèn)者進(jìn)行數(shù)據(jù)訪問(wèn)控制,跟蹤訪問(wèn)者在大數(shù)據(jù)平臺(tái)中的操作行為,查看是否存在有危險(xiǎn)的操作。對(duì)用戶(hù)訪問(wèn)進(jìn)行控制,將敏感數(shù)據(jù)進(jìn)行角色或權(quán)限保護(hù),安全管理員確認(rèn)用戶(hù)的合法性之后再放開(kāi)權(quán)限。隨著安全技術(shù)的不斷提高,目前采用自適應(yīng)的訪問(wèn)控制技術(shù)進(jìn)行安全性控制是較好的方法,Cheng等人[13]提出了一個(gè)多級(jí)別的安全模型的安全自適應(yīng)訪問(wèn)控制解決方案。大數(shù)據(jù)平臺(tái)由于其處理程度復(fù)雜、數(shù)據(jù)行為監(jiān)控難度大、安全風(fēng)險(xiǎn)量化困難等因素,導(dǎo)致采用訪問(wèn)控制技術(shù)來(lái)解決安全問(wèn)題顯得比較困難。
大數(shù)據(jù)的數(shù)據(jù)來(lái)源廣泛,為了有效保護(hù)用戶(hù)隱私數(shù)據(jù),提出采用基于匿名技術(shù)對(duì)網(wǎng)絡(luò)社交數(shù)據(jù)進(jìn)行保護(hù)與分級(jí)管理的保護(hù)策略,網(wǎng)絡(luò)中每天產(chǎn)生的社交數(shù)據(jù)量大,騰訊QQ、微信、人人網(wǎng)等社交網(wǎng)絡(luò)平臺(tái)中用戶(hù)發(fā)表的言論或圖片達(dá)數(shù)TB,這些隱私數(shù)據(jù)既包含用戶(hù)的行為、生活、政治傾向、社會(huì)關(guān)系等內(nèi)容,通過(guò)心智模型、語(yǔ)言模型的分析,則很有可能完整的分析出用戶(hù)的心理狀態(tài),造成一定的影響。
匿名技術(shù)應(yīng)用在社交網(wǎng)絡(luò)數(shù)據(jù)中能在一定程度上切斷用戶(hù)之間的關(guān)系。當(dāng)前有一些學(xué)者對(duì)這類(lèi)問(wèn)題進(jìn)行了研究,文獻(xiàn)[14]對(duì)匿名化隱私保護(hù)技術(shù)進(jìn)行綜述研究,闡述了匿名化技術(shù)的一般原理,并從匿名化原則、匿名化方法和匿名化度量等方面對(duì)匿名化技術(shù)進(jìn)行了總結(jié)。文獻(xiàn)[15]對(duì)數(shù)據(jù)發(fā)布中的個(gè)性化隱私匿名技術(shù)進(jìn)行研究,對(duì)各類(lèi)技術(shù)和基本原理、特征進(jìn)行概括性的闡述,根據(jù)信息度量的差異給出個(gè)性化隱私度量的方法與標(biāo)準(zhǔn)。文獻(xiàn)[16]對(duì)社交網(wǎng)絡(luò)隱私保護(hù)技術(shù)最新研究進(jìn)展進(jìn)行了分析與闡述,重點(diǎn)對(duì)基于K-匿名、Markov鏈、聚類(lèi)、隨機(jī)化等技術(shù)的隱私保護(hù)方案的優(yōu)點(diǎn)與不足進(jìn)行了深入比較與分析。同時(shí),在保護(hù)用戶(hù)的屬性方面也有較好的效果。
分級(jí)管理策略是根據(jù)大數(shù)據(jù)平臺(tái)中對(duì)數(shù)據(jù)的級(jí)別定義,可以將其定義為5級(jí),每一級(jí)別的訪問(wèn)策略不同,當(dāng)訪問(wèn)者請(qǐng)求數(shù)據(jù)時(shí),先對(duì)其身份等級(jí)進(jìn)行審核,再給予其相應(yīng)的訪問(wèn)權(quán)限。同時(shí),為了實(shí)現(xiàn)最佳的效果,也需要將數(shù)據(jù)進(jìn)行分級(jí)管理,其級(jí)別定義如表1所示。
輸入為字符串或段落A,對(duì)其進(jìn)行級(jí)別定義過(guò)程即是對(duì)字符串的分類(lèi),一般采用SVM或其它文本分類(lèi)算法,如文獻(xiàn)[17]設(shè)計(jì)與實(shí)現(xiàn)了新型快速中文文本分類(lèi)器,提出一種將詞頻和綜合評(píng)估函數(shù)值相結(jié)合的權(quán)重計(jì)算方法,設(shè)計(jì)了基于貝葉斯原理的快速分類(lèi)器。文獻(xiàn)[18]設(shè)計(jì)了一個(gè)基于Boosting算法的文本自動(dòng)分類(lèi)器。
表1 分級(jí)管理策略中級(jí)別定義
每一次訪問(wèn)都將判斷請(qǐng)求者的身份級(jí)別,默認(rèn)級(jí)別為中,通過(guò)操作行為來(lái)不斷維護(hù)請(qǐng)求者的身份級(jí)別,請(qǐng)示者的級(jí)別定義如式(3)
(3)
其中,Ts為級(jí)別類(lèi)型;Ri為某個(gè)請(qǐng)求者第i次的級(jí)別;n為某個(gè)請(qǐng)求者的訪問(wèn)總次數(shù)。
得到請(qǐng)求者的訪問(wèn)級(jí)別之后,能在大數(shù)據(jù)平臺(tái)中請(qǐng)求到與之相應(yīng)級(jí)別的數(shù)據(jù)信息,這樣有利于屏蔽非法用戶(hù)的非法請(qǐng)求,避免個(gè)人隱私數(shù)據(jù)大范圍的泄露。
針對(duì)數(shù)據(jù)安全問(wèn)題,用戶(hù)個(gè)人隱私在大數(shù)據(jù)中成為新的安全域。從加密技術(shù)、水印技術(shù)、匿名技術(shù)、訪問(wèn)控制技術(shù)及個(gè)人信息保護(hù)、法律制度監(jiān)督管理等方面進(jìn)行闡述,提出了基于匿名技術(shù)與分級(jí)管理技術(shù)相結(jié)合對(duì)大數(shù)據(jù)平臺(tái)中用戶(hù)隱私數(shù)據(jù)的保護(hù),通過(guò)技術(shù)手段和相關(guān)政策法規(guī)相結(jié)合來(lái)保障用戶(hù)的隱私數(shù)據(jù)。
[1] 陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)仿真學(xué)報(bào),2013,25(8S):142-146.
[2] 維基百科.大數(shù)據(jù)[EB/OL].(2014-12-12)[2016-8-27]http:∥zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B8%E6%93%9A.
[3] 孫紅,郝澤明.大數(shù)據(jù)處理流程及存儲(chǔ)模式的改進(jìn)[J].電子科技,2015,28(12):167-172.
[4] 潘永花.中國(guó)大數(shù)據(jù)技術(shù)與服務(wù)市場(chǎng)2013-2017年預(yù)測(cè)與分析[EB/OL].(2014-03-05)[2016-8-27]http:∥www.idc.com.cn/prodserv/detail.jsp?id=NTc3.
[5] 程建云,魏文軍.軌道電路故障診斷大數(shù)據(jù)處理技術(shù)綜述[J].電子科技,2015,28(11):161-165.
[6] 申德榮,于戈,王習(xí)特,等.支持大數(shù)據(jù)管理的NoSQL系統(tǒng)研究綜述[J].軟件學(xué)報(bào),2013,24(8):1786-1803.
[7] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
[8] 樊金輝,岳昆,張?bào)K先.基于D-S證據(jù)理論的不確定數(shù)據(jù)清洗[J].云南大學(xué)學(xué)報(bào):自然科學(xué)版,2014,36(6):815-822.
[9] 孫知信,黃涵霞.基于云計(jì)算的數(shù)據(jù)存儲(chǔ)技術(shù)研究[J].南京郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2014,34(4):13-19.
[10] 李建江,崔建,王聃,等.MapReduce并行編程模型研究綜述[J].電子學(xué)報(bào),2011,39(11):2635-2642.
[11] 張常淳.基于MapReduce的大數(shù)據(jù)連接算法的設(shè)計(jì)與優(yōu)化[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2014.
[12] 張建平.云計(jì)算中基于MapReduce集群模型的調(diào)度優(yōu)化與研究[D].南京:南京郵電大學(xué),2013.
[13] Cheng P C,Rohatgi P,Keser C,et al.Fuzzy multi-level security: an experiment on quantified risk-adaptive access control[C].Oakland,USA:Proceedings of the 2007 IEEE Symposium on Security and Privacy(S&P’2007),2007.
[14] 王平水,王建東.匿名化隱私保護(hù)技術(shù)研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2010,27(6):2016-2019.
[15] 王波,楊靜.數(shù)據(jù)發(fā)布中的個(gè)性化隱私匿名技術(shù)研究[J].計(jì)算機(jī)科學(xué),2012,39(4):168-171.
[16] 馬飛,蔣建國(guó),李娟.社交網(wǎng)絡(luò)隱私保護(hù)技術(shù)最新研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2015,32(5):1291-1297.
[17] 陳艷秋,熊耀華.新型快速中文文本分類(lèi)器的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(22):53-55.
[18] 董樂(lè)紅,耿國(guó)華,周明全.基于Boosting算法的文本自動(dòng)分類(lèi)器設(shè)計(jì)[J].計(jì)算機(jī)應(yīng)用,2007,27(2):384-386.
Research on Big Data Privacy Protection
HU Liu1, WANG Mei1, DENG Jie1, YE Jing2, ZHAO Zhengwei3
(1.School of Computer, Hunan College of Information, Changsha 410200 China;2. Guanshaling Street,Yuelu District, Changsha 410023, China;3. School of Information Science and Engineering, Guangxi University for Nationalities, Nanning 530006, China)
Effective protection for big data is a must and the leakage of sensitive information of users should be minimized. The anonymous technology and hierarchical management is adopted as the center of big data privacy protection. Research suggests that this policy effectively reduces the leakage of user privacy information and brings a new and important approach to big data privacy protection.
big data; private data; anonymous technology; hierarchical management
2016- 08- 25
湖南省教育廳高校研究項(xiàng)目(15C0980)
胡柳(1988-),男,碩士研究生。研究方向:大數(shù)據(jù)等。王梅(1978-),女,講師。研究方向:大數(shù)據(jù)。鄧杰(1982-),男,高級(jí)工程師。研究方向:信息安全。
10.16180/j.cnki.issn1007-7820.2017.07.045
TP309
A
1007-7820(2017)07-159-04