陳希鋒 華南農(nóng)業(yè)大學(xué)珠江學(xué)院
通過改革開放30多年的發(fā)展,我國互聯(lián)網(wǎng)技術(shù)都取得了突飛猛進(jìn)的發(fā)展,尤其是以互聯(lián)網(wǎng)技術(shù)為基礎(chǔ)的信息化平臺技術(shù),已經(jīng)實現(xiàn)了彎道超車。當(dāng)下大數(shù)據(jù),云計算都把數(shù)據(jù)量推到了前所未有的量級模式,為了更加高效快捷的處理相關(guān)信息。云計算突破了傳統(tǒng)的計算機計算能力,給人們生活帶來的極大的便利,與此同時,所產(chǎn)生的信息不安全因素也越來越多。如何能保證云環(huán)境下信息安全數(shù)據(jù)泄露成為我們關(guān)注的主題。
我們所說的云平臺一般由兩部分組成,一是客戶端,二是云端。用戶將文檔,圖片,視頻等數(shù)據(jù)經(jīng)過不安全的上傳通道,將數(shù)據(jù)上傳到云端。云服務(wù)商會將客戶的上傳數(shù)據(jù)進(jìn)行一次加密處理,以防止黑客對于云服務(wù)器的攻擊。一般的云平臺框架分為四層,用戶訪問層數(shù)據(jù)服務(wù)處理層,數(shù)據(jù)服務(wù)管理層,數(shù)據(jù)存儲層。
數(shù)據(jù)用戶訪問層,在開通用戶只需要擁有訪問權(quán)限,就可以通過手機移動端或互聯(lián)網(wǎng)PC端,隨時隨地的通過相應(yīng)的端口對互聯(lián)網(wǎng)云平臺存儲設(shè)備進(jìn)行數(shù)據(jù)的存儲或讀取。
數(shù)據(jù)服務(wù)層,是個人用戶及網(wǎng)絡(luò)終端的交匯接口處主要起到的作用是對客戶的需求進(jìn)行有效反應(yīng),這其中包括備份數(shù)據(jù),共享數(shù)據(jù),獲取資源,請求存儲需求。
數(shù)據(jù)管理層,數(shù)據(jù)管理層在云存儲系統(tǒng)中主要起到的功能是管理多個存儲硬件設(shè)備,使之能夠協(xié)調(diào)工作將底層的數(shù)據(jù)存儲與上層的應(yīng)用銜接到一起,使他們能夠協(xié)調(diào)高效地為用戶提供良好的數(shù)據(jù)服務(wù)。
數(shù)據(jù)存儲層,數(shù)據(jù)云端存儲層是將服務(wù)器組成的集群存儲設(shè)備,通過虛化技術(shù)為客戶提供云端數(shù)據(jù)的存儲及隔離服務(wù)。
傳統(tǒng)的云平臺中端存儲數(shù)據(jù),雖然進(jìn)行了加密技術(shù)處理,擁有密鑰的服務(wù)商卻能夠通過。技術(shù)揭秘直接接觸到數(shù)據(jù)銘文。另外由于數(shù)據(jù)在傳輸過程中,客戶端與云端是以明文。傳輸?shù)挠嘘P(guān)數(shù)據(jù)。在這一過程中,所傳輸?shù)臄?shù)據(jù)非常容易被黑客截取。為了讓傳輸過程中信息更加機密??梢越档驮品?wù)商及黑客竊取數(shù)據(jù)的風(fēng)險。需要在明文數(shù)據(jù)進(jìn)入云端之前進(jìn)行前期的數(shù)據(jù)加密處理。
圖1
為了解決上傳數(shù)據(jù)更加保密的問題,我們設(shè)計出了一個系統(tǒng)模型,在該系統(tǒng)模型中。在用戶端對數(shù)據(jù)進(jìn)行加密密文數(shù)據(jù)的上傳與下載,以及用戶的個人身份確認(rèn)三部分進(jìn)行。完善及改進(jìn)。在云端存儲過程中,主要把數(shù)據(jù)檢索,文件檢索及數(shù)據(jù)存儲三部分加以改進(jìn)。如圖1所示:
第一,數(shù)據(jù)的有效存儲。用戶將數(shù)據(jù)上傳到云端存儲。有關(guān)秘聞用于對稱加密算法,加密過程中的關(guān)鍵詞集合及非關(guān)鍵詞集合以及檢索詞的屬性信息等是文檔資源池。云端服務(wù)器會通過該模型進(jìn)行合理的虛擬,從而區(qū)分所存儲的數(shù)據(jù)。另外云端數(shù)據(jù)存儲區(qū)也存儲相關(guān)的數(shù)據(jù),進(jìn)而共享相關(guān)權(quán)限。
第二,數(shù)據(jù)秘聞的檢索。互聯(lián)網(wǎng)用戶將數(shù)據(jù)檢索詞進(jìn)行對稱,加密處理后上傳到云端。云端存儲服務(wù)器就會對檢索文獻(xiàn)進(jìn)行有效的檢索,如果找到了匹配的相關(guān)檢索詞,就會通過檢索文件進(jìn)行有關(guān)的查找。通過數(shù)據(jù)指向倒排文件的某一個區(qū)域,進(jìn)而通過倒排文件區(qū)域找到相關(guān)的檢索文件。最后在云端計算出相關(guān)的檢索詞和這些有關(guān)的文檔之間的關(guān)聯(lián)度,進(jìn)而根據(jù)相關(guān)關(guān)聯(lián)度的大小將文檔進(jìn)行有效的排序,然后將這些文檔反饋給用戶。
第三,數(shù)據(jù)文件的索引。當(dāng)互聯(lián)網(wǎng)用戶需要索引時,云端系統(tǒng)通過。索引的文件對數(shù)據(jù)進(jìn)行匹配檢索。為了更好地建立索引文件,需要解決兩方面的問題。一是如何對文本進(jìn)行有效的區(qū)分,二是如何建立起云數(shù)據(jù)結(jié)構(gòu)的索引。文件生成的索引大小以及分詞的準(zhǔn)確與否,該系統(tǒng)都采用中文分詞法。用戶端需要對數(shù)據(jù)銘文進(jìn)行有效的中文分詞并將該有效的分詞結(jié)果進(jìn)行系統(tǒng)的加密為了使得數(shù)據(jù)加密的效率不影響,所以該處需要采用對稱加密的算法。這樣將對稱加密后的磁條以及全銅加密后的有效文檔一起高速地傳送至云端存儲服務(wù)器中。然后基于這些詞條,在數(shù)據(jù)云端存儲中有效的構(gòu)建倒排索引。這里我們所說的倒排索引是指將每一個單詞作為一個索引項,然后根據(jù)該索引項查找有關(guān)單詞所在的文檔文本。
最后,秘聞的上傳和下載模塊用于云端及。戶端的數(shù)據(jù)高速傳輸,為了有效地防止數(shù)據(jù)泄密以及黑客攻擊,云端存儲服務(wù)器會對存儲在云端的數(shù)據(jù)進(jìn)行再次加密,該模塊中包含了上傳數(shù)據(jù)時,云端存儲服務(wù)器數(shù)據(jù)的二次加密,以及用戶在下載云端數(shù)據(jù)時數(shù)據(jù)的解密過程。
由于本文的字?jǐn)?shù)限制,無法對相關(guān)技術(shù)進(jìn)行更加深入的探討,本文通過對云存儲數(shù)據(jù)平臺模擬的簡單結(jié)構(gòu)介紹分析了有關(guān)數(shù)據(jù),通過用戶端上傳以及云端存儲所存在的風(fēng)險并針對該風(fēng)險提出了相關(guān)的數(shù)據(jù)解決辦法,在此基礎(chǔ)上進(jìn)行了相關(guān)數(shù)據(jù)加密解密的流程闡釋。為有關(guān)研究人員提供了粗淺的意見。希望本文章能夠?qū)罄m(xù)云端存儲數(shù)據(jù)泄密保護(hù)工作有些許的參考意義。