周先春,孫文榮,嵇亞婷
?
基于云計算的大數(shù)據(jù)安全隱私保護研究
周先春,孫文榮,嵇亞婷
(南京信息工程大學 電子與信息工程學院,江蘇 南京 210044)
云計算技術是信息技術快速發(fā)展下的產(chǎn)物,其實現(xiàn)了大數(shù)據(jù)的整合運用,給人們的生活帶來了極大便利。大數(shù)據(jù)在云計算技術構建的平臺上得到充分利用。同時,其潛在安全隱患和用戶的隱私問題成為目前云計算的重要研究課題。為此,本文簡要闡述了云計算及大數(shù)據(jù)的概念定義,在此基礎上提出了基于云計算的大數(shù)據(jù)安全隱私問題,并針對這些問題提出了基于云計算的大數(shù)據(jù)安全隱私保護策略。
云計算;大數(shù)據(jù);安全隱私;隱私保護
云計算是一種基于互聯(lián)網(wǎng)的新型計算方式。在這種計算方式下計算機按照不同需要通過云平臺實現(xiàn)信息資源共享[1]。這些共享資源有很多種,如應用程序,服務器、存儲器等。在云計算環(huán)境下不需要管理員的干預就可便捷地釋放或配置共享資源。而大數(shù)據(jù)是指規(guī)模龐大的數(shù)據(jù)總和,現(xiàn)有數(shù)據(jù)處理存儲技術已無法快捷地對海量數(shù)據(jù)進行管理,更無法從中整理出具有價值的信息[2]。當前基于云計算的大數(shù)據(jù)存儲技術發(fā)展迅猛,然而基于云計算的大數(shù)據(jù)安全問題是限制其發(fā)展的主要因素。為此,本文深入研究了基于云計算的大數(shù)據(jù)安全隱私保護方案,希望能夠促進我國基于云計算的大數(shù)據(jù)技術的發(fā)展。
所謂云計算大數(shù)據(jù)隱私安全是指整個生命周期中數(shù)據(jù)的安全隱私。從數(shù)據(jù)存儲角度來看,云計算安全隱私問題是指云計算平臺中用戶數(shù)據(jù)的安全問題[3]。大數(shù)據(jù)背景下,數(shù)據(jù)機密性、完整性、可用性面臨挑戰(zhàn),傳統(tǒng)安全算法協(xié)議不再像之前那么有效;從數(shù)據(jù)計算角度來看,云計算安全隱私問題主要包括用戶行為被監(jiān)視,數(shù)據(jù)被篡改等;從云計算平臺的生態(tài)系統(tǒng)角度來看,云計算安全隱私問題包括云計算平臺的可靠性、服務收費是否合理等。問題產(chǎn)生原因主要有兩個,第一,云計算服務提供商不可靠,盜取用戶數(shù)據(jù)或隨意使用用戶數(shù)據(jù)。為解決該問題,我們可以引入第三方監(jiān)督。第二,云平臺遭受外部入侵,通常云計算服務提供商會提供各種形式的身份認證、訪問控制以及數(shù)據(jù)加密措施。如圖1所示的稅收云平臺模型。
圖1 政府稅收云平臺模型
在這個云平臺中政府稅務部門通過云平臺整合企業(yè)、社會團體、非盈利組織的稅收情況,對云平臺的稅收數(shù)據(jù)進行數(shù)據(jù)統(tǒng)計,為政府部門的決策提供數(shù)據(jù)支持。這種云平臺稅收模式和傳統(tǒng)的稅收模式相比,透明程度更高,可靠性更高[4]。但是,假如這個云平臺的安全隱私保護措施不到位就可能導致政府稅收信息遭到破壞、泄露、篡改,從而給國家政府決策和稅收安全帶來不利影響。
各個行業(yè)的安全需求在大數(shù)據(jù)環(huán)境下都在發(fā)生變化。隨著數(shù)據(jù)規(guī)模的不斷擴大,整個數(shù)據(jù)鏈條面臨的安全問題日益增多,數(shù)據(jù)的安全隱私保護難度越來越高。當前,各大企業(yè)非常關注基于云計算的大數(shù)據(jù)安全隱私問題[5]。此外,大數(shù)據(jù)技術的不斷發(fā)展帶來數(shù)據(jù)共享便利的同時也帶來了不容忽視的數(shù)據(jù)隱私安全問題,一方面,用戶受益于大數(shù)據(jù)技術可以用更低的價格獲得更加個性化的商品,另一方面,大數(shù)據(jù)環(huán)境下,用戶的個人行為數(shù)據(jù)被收集被統(tǒng)計的過程中存在隱私泄露的可能性。
下面我們將分析基于同態(tài)加密機制的云平臺安全計算方案和安全存儲方案。在這兩個方案中成功解決了云計算環(huán)境下對數(shù)據(jù)的隱私保護和計算信息的隱私保護。此外,還解決了完整性驗證和數(shù)據(jù)恢復問題。該方案提高了云平臺數(shù)據(jù)的安全隱私性[6]。
當前云服務提供商在數(shù)據(jù)計算安全性和數(shù)據(jù)隱私性方面的保護措施非常有限。本章中提到的基于隱式機制的數(shù)據(jù)存儲方案中使基于代數(shù)中的多項式以及矩陣理論,不涉及數(shù)據(jù)加密,避免了管理密鑰等復雜的數(shù)據(jù)處理過程[7]。但是,如果存儲用戶數(shù)據(jù)的云服務器合謀就會導致用戶數(shù)據(jù)泄露,威脅到用戶數(shù)據(jù)的安全隱私。和顯式的同態(tài)加密機制相比,隱式機制無需密鑰管理,但是也解決不了云服務器合謀導致數(shù)據(jù)泄露的問題。為此,文本提出了一種基于多個云服務器的數(shù)據(jù)存儲計算方案,經(jīng)過加密的用戶數(shù)據(jù)被分別存儲在多個云服務器中,然后再統(tǒng)一通過一個云服務器進行數(shù)據(jù)計算,最終得到加密的數(shù)據(jù),數(shù)據(jù)被使用之前需要使用者先解密數(shù)據(jù)[8]。這種數(shù)據(jù)存在計算方案可以顯著降低數(shù)據(jù)存儲計算成本,同時云計算技術的應用能夠顯著提升數(shù)據(jù)的計算處理效率,有效提高用戶數(shù)據(jù)的安全性。此方案的主要優(yōu)勢在于不但能保護數(shù)據(jù)計算結果的安全隱私,還能保證計算條目內(nèi)容,計算條目數(shù)的安全隱私,同時確保計算結果的準確性。圖2為該方案中基于云端的多用戶數(shù)據(jù)安全計算系統(tǒng)示意圖:
圖2 云端多方安全計算系統(tǒng)
我們給該用戶數(shù)據(jù)計算系統(tǒng)模型中的實體賦予相應的定義:數(shù)據(jù)擁有者(DO)。擁有多個數(shù)據(jù)條目及對應數(shù)據(jù)值的DO有多個;云服務器(CS),云服務器主要用于儲存DO上傳的數(shù)據(jù),每個DO將自己的數(shù)據(jù)上傳到擁有海量存儲空間的云服務器中,由云服務提供商對上傳的數(shù)據(jù)進行相應的分配存儲;Proxy:同樣是云服務器,只是和CS不同的是,Proxy負責接收用戶的請求,然后對數(shù)據(jù)進行相應的計算處理,最后將計算結果返回給用戶。User:計算服務的使用者[9]。該方案的主要設計目標是確保云平臺數(shù)據(jù)的安全隱私,下面我們從數(shù)據(jù)存儲的安全隱私、計算結果的安全隱私、計算結果的準確性和完整性等方面來闡述該方案的安全性。該方案中對數(shù)據(jù)的上傳進行加密操作以確保云服務器上存儲數(shù)據(jù)的安全隱私。一旦云服務器收到攻擊或服務器之間進行合謀,數(shù)據(jù)竊取者只能得到加密后的數(shù)據(jù)。只要加密算法足夠復雜且在本次存儲密鑰,網(wǎng)絡黑客就不可能破解出其中的明文,從而保證用戶數(shù)據(jù)的安全性。此外,該方案中,服務器接受用戶請求對數(shù)據(jù)進行計算,再返回相應的計算結果給用戶。假設用戶是可靠的,那么云服務器得到的是加密后的結果,因為用戶沒有數(shù)據(jù)密鑰,所以不可能獲得具體的計算結果,從而保證了數(shù)據(jù)計算結果的隱私性。該方案中接受用戶計算請求的云服務器Proxy在實行數(shù)據(jù)計算之前就會驗證參與計算的數(shù)據(jù)完整性,這樣做的目的是為了保證計算內(nèi)容的正確性和完整性。因為,有些惡意的CS和Proxy有可能會隱瞞已發(fā)生的數(shù)據(jù)事故,所以,該方案會預先計算salt-hash值來防范此類風險,進而在一定程度上確保了計算結果的準確性。
上述的方案在驗證數(shù)據(jù)完整性和恢復數(shù)據(jù)方面還有很多需要完善的地方。在實踐應用中,數(shù)據(jù)擁有者(DO)有可能擁有大量的最大條目,而數(shù)據(jù)擁有者(DO)擁有的最大條目數(shù)量每提升一個,需要預計算的salt-hash數(shù)據(jù)將增加一倍,但實際上可能只需要計算區(qū)區(qū)幾個條目組合,這樣會導致服務器的計算資源閑置或浪費[10]。由此可見,如此檢驗數(shù)據(jù)的效率非常低,同時上述方案中驗證數(shù)據(jù)完整性的次數(shù)也是有限的m次,而在實踐應用中我常常需要進行遠遠多于m次的數(shù)據(jù)完整性檢驗,這也會導致給方案無法正常進行。此外,當數(shù)據(jù)經(jīng)檢驗后被確定完整性不符合要求時,就應該對數(shù)據(jù)進行相應的恢復處理,這樣的處理方式有助于提高數(shù)據(jù)的安全性。正是因為我們在基于保護數(shù)據(jù)隱私的安全計算方案中提出的數(shù)據(jù)完整性驗證及恢復的問題,促使我們對該方案進行完善,改進后的方案需要實現(xiàn)以下幾個目標:①能夠不限次數(shù)地檢驗數(shù)據(jù)完整性;②一旦數(shù)據(jù)完整性遭到破壞,應該可以對數(shù)據(jù)進行相應的恢復處理;③能夠準確找到錯誤數(shù)據(jù),快速定位出現(xiàn)錯誤的數(shù)據(jù)塊;④盡量降低數(shù)據(jù)計算成本相:⑤數(shù)據(jù)擁有者只需支付很低的計算成本就可以對數(shù)據(jù)進行完整性檢驗;⑥有效避免浪費計算資源。
該方案中的系統(tǒng)模型與上一個章節(jié)中基于保護數(shù)據(jù)隱私的安全計算方案是一致的,我們利用結構圖來深入探討新方案,如圖3所示。我們可以給圖中的實體分別賦予其定義:數(shù)據(jù)擁有者(DO)。擁有多個數(shù)據(jù)條目及對應數(shù)據(jù)值的DO有多個;云服務器(CS),云服務器主要用于儲存DO上傳的數(shù)據(jù),每個DO將自己的數(shù)據(jù)上傳到擁有海量存儲空間的云服務器中,由云服務提供商對上傳的數(shù)據(jù)進行相應的分配存儲;Proxy:這里的Proxy的作用和基于保護數(shù)據(jù)隱私的安全計算方案中的proxy一樣。User:這里的User的作用和基于保護數(shù)據(jù)隱私的安全計算方案中的User一樣。該方案是對基于保護數(shù)據(jù)隱私的安全計算方案的優(yōu)化,該方案在上一個方案的基礎上增加了不限次數(shù)的數(shù)據(jù)完整性驗證及恢復功能。在基于保護數(shù)據(jù)隱私的安全計算方案中,考慮到CS和Proxy可能會惡意隱瞞數(shù)據(jù)丟失的錯誤,從而導致數(shù)據(jù)計算結果出現(xiàn)錯誤。為此,該方案中,我們給所有結算條目組合添加x個salt值,確保用戶User進行x次挑戰(zhàn)-應答協(xié)議,其中選用的x值都是隨機保密的,可以有效避免云服務器CS作弊,從而有效保證參與計算處理的數(shù)據(jù)的完整性。在該方案中,我們可以通過雙線性對的性質(zhì)進行數(shù)據(jù)完整性檢驗。由于用戶User產(chǎn)生的挑戰(zhàn)值都是隨機的,同時每一次挑戰(zhàn)生成的值同樣是隨機的,因此,云服務器CS、Proxy除了猜測以外,沒有 別的方法可以獲取該值,只有誠實地將計算值發(fā)送給用戶User,如此一來,就避免了CS和Proxy 作弊。
圖3 三個網(wǎng)絡實體的結構圖
綜上所述,近些年來隨著信息技術的發(fā)展,云計算和大數(shù)據(jù)成為最典型的信息技術代表。云計算技術和大數(shù)據(jù)技術顛覆了傳統(tǒng)數(shù)據(jù)存儲、計算模式,給人類社會帶來了巨大改變,人們從云計算和大數(shù)據(jù)中獲得了絕大的便利,各個行業(yè)也越來越重視云計算和大數(shù)據(jù)。大數(shù)據(jù)就像“埋在地下的金子”,而云計算就是探測挖掘“金子”的有效工具。信息大爆炸下,呈現(xiàn)指數(shù)增長巨量數(shù)據(jù)必須利用更加高效的云計算技術進行數(shù)據(jù)提取、數(shù)據(jù)分析、數(shù)據(jù)存儲、數(shù)據(jù)計算等操作,以更加充分地發(fā)揮數(shù)據(jù)價值。因為傳統(tǒng)地計算機網(wǎng)絡技術無法高效分配、處理數(shù)據(jù),假如沒有云計算技術,大數(shù)據(jù)就像深深埋藏在地下的金子永遠沒有發(fā)光的機會,而如果沒有大數(shù)據(jù),云計算技術就會英雄無用武之地,因此,這兩者之間是相互依賴的關系,他們的結合是科技發(fā)展的必然趨勢。
[1] 吳延順. 基于云計算的大數(shù)據(jù)安全隱私保護的研究[J]. 電子技術與軟件工程, 2016(4): 199-199.
[2] 馬凱航, 高永明, 吳止鍰等. 大數(shù)據(jù)時代數(shù)據(jù)管理技術研究綜述[J]. 軟件, 2015, 36(10): 46-49.
[3] 齊榮. 用戶隱私研究綜述[J]. 軟件, 2015, 36(1): 125-130.
[4] 榮艷冬. 基于云計算的高校就業(yè)信息服務平臺的應用研究[J]. 軟件, 2015, 36(5): 45-48.
[5] 崔繼仁, 張艷麗, 王越男. 基于云計算的大數(shù)據(jù)安全隱私保護分析[J]. 網(wǎng)絡安全技術與應用, 2016(6): 72-73.
[6] 卜曉波. 試論大數(shù)據(jù)云計算環(huán)境下的數(shù)據(jù)安全[J]. 軟件, 2018, 39(2): 197-199.
[7] 田鵬程, 張莉梅, 楊俊. 就業(yè)信息服務平臺數(shù)據(jù)隱私保護方案設計[J]. 軟件, 2015, 36(4): 18-23.
[8] 張小波, 付達杰. 網(wǎng)絡信息資源個性化推薦中隱私保護的研究[J]. 軟件, 2015, 36(4): 62-66.
[9] 謝晉. 基于云計算的大數(shù)據(jù)安全隱私保護研究[J]. 通訊世界, 2017(02): 112-112.
[10] 張亮. 基于云計算環(huán)境的大數(shù)據(jù)安全存儲機制研究[D]. 東南大學, 2016.
Research on Security and Privacy Protection of Big Data Based on Cloud Computing
ZHOU Xian-chun, SUN Wen-rong, JI Ya-ting
(College of Electronic and Information Engineering, Nanjing University of Information Science and Technology, Nanjing 210044, China)
Cloud computing technology is the product of the rapid development of information technology, which realizes the integration and application of large data, and brings great convenience to people's lives. Big data is fully utilized on the platform of cloud computing technology. At the same time, its potential security risks and user privacy problems have become an important research topic in cloud computing. Therefore, this paper briefly describes the concept of cloud computing and large data definition, based on this proposed cloud-based large data security and privacy issues, and to address these issues proposed cloud-based large data security and privacy protection strategy.
Cloud computing; Big data; Security privacy; Privacy protection
TP309.2
A
10.3969/j.issn.1003-6970.2018.10.013
周先春(1974-),男,副教授,主要研究方向:信號與信息處理;孫文榮(1989-),男,研究生,主要研究方向:信號與信息處理;嵇亞婷(1989-),女,研究生,主要研究方向:信號與信息處理。
周先春,孫文榮,嵇亞婷. 基于云計算的大數(shù)據(jù)安全隱私保護研究[J]. 軟件,2018,39(10):60-63