摘 ?要:隨著現(xiàn)代電子信息技術(shù)的發(fā)展,產(chǎn)生的數(shù)據(jù)日益增多,人們已經(jīng)處于大數(shù)據(jù)時(shí)代中。同時(shí),又因?yàn)槭艿綌?shù)據(jù)數(shù)量大、種類多、結(jié)構(gòu)化、半結(jié)構(gòu)化或非結(jié)構(gòu)化的影響,需要快速處理的情況,絕大部分的傳統(tǒng)大數(shù)據(jù)保護(hù)技術(shù)已經(jīng)無法再適用于如今的大數(shù)據(jù)環(huán)境。因此,近年來提出了許多大數(shù)據(jù)的安全保護(hù)方法和技術(shù)。作者通過對(duì)大數(shù)據(jù)環(huán)境下數(shù)據(jù)的研究,從數(shù)據(jù)安全的角度深入分析了它的具體情況以及解決方法,并探討了它的未來發(fā)展趨勢(shì)。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)特性;時(shí)代分析;數(shù)據(jù)安全
中圖分類號(hào):TP393.08 ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)18-0129-02
Abstract:With the modern electronic information technology exhibition,the data produced is growing day by day,people are already in the era of big data. At the same time,most of the traditional big data protection technologies can no longer be applied to the big data environment due to the large amount and variety of data,structured or semi-structured or unstructured,and the need for fast processing. Therefore,many security protection methods and technologies for big data have been proposed in recent years. Through the study of data in the big data environment,the author makes an in-depth analysis of its specific situation and solutions from the perspective of data security,and discusses its future development trend.
Keywords:big data;data characteristics;analysis of the times;data security
0 ?引 ?言
在信息社會(huì)高度發(fā)達(dá)的今天,大數(shù)據(jù)已經(jīng)滲透進(jìn)生活的方方面面、各行各業(yè),在衣食住行各方面,都可以做到未卜先知。然而,隨著數(shù)據(jù)價(jià)值的持續(xù)生長(zhǎng)、規(guī)模的不斷壯大,利用大數(shù)據(jù)技術(shù)在改善社會(huì)生活生產(chǎn)的同時(shí),也產(chǎn)生了棘手的安全問題,其中最為值得注意的便是數(shù)據(jù)自身的安全。所以,本文就數(shù)據(jù)安全這一問題產(chǎn)生的原因以及解決方法進(jìn)行了分析。
1 ?大數(shù)據(jù)的概念及特性
大數(shù)據(jù)的定義較為寬泛抽象,不過也可以簡(jiǎn)單地進(jìn)行理解。什么是大數(shù)據(jù)[1],從字面理解的話可能是表述數(shù)量或者表述質(zhì)量的數(shù)據(jù),事實(shí)上并不只是如此。大數(shù)據(jù)是指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,它的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)超過任何一臺(tái)計(jì)算機(jī)能夠處理的數(shù)據(jù)量。
相對(duì)于傳統(tǒng)數(shù)據(jù)而言,大數(shù)據(jù)具有明顯的5V特性,其中分別是數(shù)量大(volume)、速度快(velocity)、種類多(variety)、識(shí)別度低(varacity)、價(jià)值密度低(value)。另外,大數(shù)據(jù)規(guī)模仍將繼續(xù)增長(zhǎng),未來甚至預(yù)計(jì)能夠達(dá)到EB、ZB,這側(cè)面也反映出了利用技術(shù)手段處理大數(shù)據(jù)時(shí)的效率必須要高。
如果根據(jù)數(shù)據(jù)來源不同進(jìn)行分類,大數(shù)據(jù)可以主要分為3類[2]:(1)人機(jī)交互活動(dòng)。人們?cè)谑褂没ヂ?lián)網(wǎng)(包括移動(dòng)互聯(lián)網(wǎng))過程中所產(chǎn)生的多種類型數(shù)據(jù);(2)計(jì)算機(jī)(主要是電腦)。各種計(jì)算機(jī)系統(tǒng)或者與計(jì)算機(jī)有關(guān)的系統(tǒng)產(chǎn)生的數(shù)據(jù),多以圖像音頻等文件、關(guān)系型非關(guān)系型等數(shù)據(jù)庫(kù)、聲音數(shù)據(jù)等信息載體形式存在;(3)物理世界。各類電子數(shù)字設(shè)備所采集的數(shù)據(jù),比如水電網(wǎng)系統(tǒng)采集設(shè)備所收集的海量水電網(wǎng)數(shù)據(jù)、聲頻監(jiān)控系統(tǒng)產(chǎn)生的海量聲頻數(shù)據(jù)等。
2 ?大數(shù)據(jù)時(shí)代問題分析及解決建議
為了能夠較好地理解大數(shù)據(jù)以及大數(shù)據(jù)時(shí)代下的數(shù)據(jù)行為,就大數(shù)據(jù)環(huán)境下數(shù)據(jù)分析過程中存在的問題,作者提出以下兩點(diǎn)意見。[3]
2.1 ?培養(yǎng)萬維網(wǎng)時(shí)代下的大數(shù)據(jù)思維
目前,我國(guó)以大數(shù)據(jù)為產(chǎn)業(yè)的經(jīng)濟(jì)得到了飛速發(fā)展,大數(shù)據(jù)幾乎與所有的互聯(lián)網(wǎng)公司都有所關(guān)聯(lián),甚至形成了一種共生關(guān)系。其中也包括一些我們耳熟能詳?shù)幕ヂ?lián)網(wǎng)公司。在美國(guó),亞馬遜每天都要處理數(shù)以億萬計(jì)的數(shù)據(jù),這些數(shù)據(jù)容量已經(jīng)達(dá)到國(guó)家圖書館中所含數(shù)據(jù)的幾萬倍,如今甚至更多。在中國(guó),淘寶光是每天的物品詳情圖片超過數(shù)億張、視頻大小超過上萬TB。從很大的程度上來說,大數(shù)據(jù)的來源就是互聯(lián)網(wǎng)應(yīng)用。大數(shù)據(jù)技術(shù)的內(nèi)在邏輯基礎(chǔ)或內(nèi)在哲學(xué)基礎(chǔ)即為大數(shù)據(jù)思維[4]。從對(duì)數(shù)據(jù)的整理,就可以看出擁有大數(shù)據(jù)思維的重要性,甚至還有學(xué)者提出,在所謂的大數(shù)據(jù)時(shí)代下,最核心的不是大數(shù)據(jù)用途,也不是大數(shù)據(jù)技術(shù),而是不常被人提及、甚至被人忽略的大數(shù)據(jù)思維。
2.2 ?構(gòu)建大數(shù)據(jù)環(huán)境下的數(shù)據(jù)資源保障體系
一個(gè)國(guó)家或者地區(qū)可以通過多種技術(shù)手段進(jìn)行數(shù)據(jù)整合,建立一個(gè)能滿足社會(huì)國(guó)家在各個(gè)方面的數(shù)據(jù)分析需求的系統(tǒng),即數(shù)據(jù)資源保障體系。經(jīng)過數(shù)十年的大數(shù)據(jù)發(fā)展,我國(guó)的資源體系發(fā)生了一系列的改變,從文獻(xiàn)資源到數(shù)據(jù)資源,再到數(shù)據(jù)服務(wù)和消費(fèi)資源,取得了明顯的進(jìn)展。各個(gè)地區(qū),乃至全國(guó),經(jīng)過實(shí)踐形成了各個(gè)地區(qū)中心的服務(wù)體系。除此之外,也從不同方向研究數(shù)據(jù)保障系統(tǒng)體系的建設(shè),發(fā)表了一系列的研究成果。不難發(fā)現(xiàn),數(shù)據(jù)資源保障體系的建立具有舉足輕重的意義,包括我們熟知的醫(yī)療體系、檔案體系、以及案卷體系等。
3 ?安全問題涉及的方面與由來分析
3.1 ?個(gè)人方面
在現(xiàn)實(shí)生活中,當(dāng)用戶下載手機(jī)應(yīng)用時(shí),往往會(huì)彈出是否允許訪問信息和手機(jī)聯(lián)系人等的詢問框,這就意味著該用戶將面臨信息泄露的風(fēng)險(xiǎn),原因在于大數(shù)據(jù)時(shí)代,用戶如果想使用大數(shù)據(jù)帶來的服務(wù)就無法阻止個(gè)人信息直接或間接地泄露。其實(shí),國(guó)家層面也認(rèn)識(shí)到這方面的問題,不僅出臺(tái)了相關(guān)政策整治這一現(xiàn)象,甚至下架了大數(shù)據(jù)APP或其他相關(guān)種類的軟件應(yīng)用,不過效果甚微,因?yàn)槲覀兤饺绽锏纳罹团c數(shù)據(jù)息息相關(guān),就連QQ、微信等常用軟件也需要獲得用戶信息。當(dāng)然,不僅是手機(jī),大部分情況下使用互聯(lián)網(wǎng)設(shè)備或者互聯(lián)網(wǎng)時(shí)包含著種種不確定的因素,數(shù)據(jù)安全存在著極大地隱患,也讓人們的信息安全和財(cái)產(chǎn)受到了巨大的威脅。
3.2 ?企業(yè)方面
在企業(yè)單位里,企業(yè)可以利用數(shù)據(jù)分析及采集技術(shù)處理各種數(shù)據(jù)以便獲取有效價(jià)值,黑客也可以通過同樣或者其他的方式向企業(yè)或個(gè)人發(fā)起攻擊,而這時(shí)候大數(shù)據(jù)技術(shù)無疑又為黑客進(jìn)行更精確的攻擊提供了幫助,弊端也就顯示出來。黑客這一職業(yè)我們并不陌生,既然有了信息技術(shù)所帶來的便利,就會(huì)有信息漏洞所帶來的威脅,而黑客更加青睞的就是相對(duì)金錢而言不被人們或企業(yè)引起重視的各人數(shù)據(jù)信息了。事實(shí)上,有時(shí)候竊取的數(shù)據(jù)的價(jià)值遠(yuǎn)比實(shí)體利益更加重要。同時(shí),企業(yè)還包含著許多私人的信息,無論是普通企業(yè)或是對(duì)大數(shù)據(jù)技術(shù)利用已經(jīng)成熟的互聯(lián)網(wǎng)企業(yè),不可否認(rèn)的是它們對(duì)數(shù)據(jù)安全的保護(hù)措施并不是無懈可擊,就連中國(guó)電子巨頭阿里巴巴也曾被入侵過。
3.3 ?國(guó)家方面
在大數(shù)據(jù)時(shí)代,國(guó)家安全需直面數(shù)據(jù)信息戰(zhàn)與網(wǎng)絡(luò)恐怖主義,國(guó)家在軍事、文化、經(jīng)濟(jì)、生態(tài)、資源、核等領(lǐng)域?qū)W(wǎng)絡(luò)的依賴性不斷增加,通過網(wǎng)絡(luò)這一樞紐直接使得國(guó)家安全面臨巨大威脅。甚至大多學(xué)者提到過,通過分析近代世界戰(zhàn)爭(zhēng),從水陸空作戰(zhàn)到太空作戰(zhàn),從機(jī)械化作戰(zhàn)到智能化作戰(zhàn),這些都不及網(wǎng)絡(luò)化作戰(zhàn)來的恐怖,而且,它造成的后果將不可估量。目前來看,國(guó)家的數(shù)據(jù)安全保護(hù)相對(duì)更為嚴(yán)密,雖然不曾聽聞過國(guó)家的數(shù)據(jù)被入侵、被泄露的消息,但是它的數(shù)據(jù)來源太廣,也很難做到各方面的保護(hù)。就比如,美軍曾使用一款叫做“斯特拉瓦”的健身運(yùn)動(dòng)軟件,結(jié)果幾乎是毫不保留地將美國(guó)太平洋地區(qū)的軍事基地的地理位置信息告知于眾。
4 ?大數(shù)據(jù)的數(shù)據(jù)安全
首先在大數(shù)據(jù)時(shí)代,來源眾多的多源數(shù)據(jù)信息被瀏覽器、萬維網(wǎng)相關(guān)設(shè)備、多數(shù)應(yīng)用軟件等所收集,并且數(shù)據(jù)來源廣泛、種類多樣。那么,保證所收集的數(shù)據(jù)的真實(shí)性以及對(duì)數(shù)據(jù)前后輸入輸出進(jìn)行前端和后端的完整性校驗(yàn),以主流數(shù)據(jù)庫(kù)Microsoft旗下的SQL Server和甲骨文公司旗下的Oracle為例,數(shù)據(jù)庫(kù)管理平臺(tái)在對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)使用時(shí),都會(huì)以保持?jǐn)?shù)據(jù)的完整性為前提,可見保證數(shù)據(jù)真實(shí)性以及完整性是至關(guān)重要的。另外,大量數(shù)據(jù)在大數(shù)據(jù)平臺(tái)聚集時(shí),來自多個(gè)用戶的數(shù)據(jù)可能存儲(chǔ)在同一個(gè)數(shù)據(jù)池中,然而這些數(shù)據(jù)可能會(huì)分別被非法或不同用戶盜取使用,這樣就會(huì)直接導(dǎo)致數(shù)據(jù)安全問題出現(xiàn),其危害性更是不言而喻。為了解決這類問題,就要求一種相應(yīng)技術(shù)實(shí)施,即要實(shí)現(xiàn)數(shù)據(jù)的“不可見不可用”效應(yīng),在未得到他人的允許授權(quán)情況下不可以查看數(shù)據(jù)庫(kù)內(nèi)容,在看不見數(shù)據(jù)庫(kù)內(nèi)容的情況下不可以對(duì)數(shù)據(jù)進(jìn)行使用,為此必須完善訪問控制權(quán)限,強(qiáng)化數(shù)據(jù)隔離操作,否則極有可能會(huì)引發(fā)數(shù)據(jù)泄露風(fēng)險(xiǎn)。其次,大數(shù)據(jù)技術(shù)[5]促使數(shù)據(jù)的生命周期由簡(jiǎn)單的單鏈條逐漸演變成為復(fù)雜的多鏈條形態(tài),不僅增加了共享、交易等環(huán)節(jié),而且數(shù)據(jù)應(yīng)用場(chǎng)景和參與角色愈加多樣化。此外,利用大數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行分析所得的結(jié)果可能包含涉及國(guó)家、社會(huì)穩(wěn)定等的敏感信息,因此必須對(duì)分析結(jié)果的使用加強(qiáng)管理,否則一經(jīng)泄露,將威脅國(guó)家社會(huì)安全。
總之,隨著大數(shù)據(jù)的不斷發(fā)展,數(shù)據(jù)安全問題必將得到完整系統(tǒng)地解決,至于有什么方法、用什么技術(shù)、達(dá)到什么效果,在這個(gè)科技技術(shù)飛速發(fā)展的時(shí)代之中,未來我們一定會(huì)見證它的產(chǎn)生與成功。[6]
5 ?結(jié) ?論
在大數(shù)據(jù)到來之前,我們接觸更多的是物聯(lián)網(wǎng)、互聯(lián)網(wǎng)、云計(jì)算等,到現(xiàn)在為止,從新興到成熟的大數(shù)據(jù)技術(shù)又是引起信息產(chǎn)業(yè)的又一顛覆性信息技術(shù)革命。與此同時(shí),如何保護(hù)大數(shù)據(jù)的數(shù)據(jù)安全自然成為了研究大數(shù)據(jù)的重點(diǎn)、難點(diǎn)和熱點(diǎn)。本文先通過介紹大數(shù)據(jù)的概念以及特點(diǎn),然后去分析大數(shù)據(jù)時(shí)代的形式,給出相應(yīng)的建議之后,進(jìn)一步引出文章主題——數(shù)據(jù)安全涉及的方面及由來情況,分別闡述了數(shù)據(jù)安全在個(gè)人、企業(yè)、國(guó)家層面面臨的挑戰(zhàn)和危險(xiǎn),最后得出數(shù)據(jù)安全的研究進(jìn)展,并且探討其未來的發(fā)展趨勢(shì)。
參考文獻(xiàn):
[1] 朱瀅穎.什么是大數(shù)據(jù) [J].數(shù)字通信世界,2018(4):283-284.
[2] 魏凱敏,翁健,任奎.大數(shù)據(jù)安全保護(hù)技術(shù)綜述 [J].網(wǎng)絡(luò)與信息安全學(xué)報(bào),2016,2(4):1-11.
[3] 王淞.大數(shù)據(jù)時(shí)代信息分析的關(guān)鍵問題、挑戰(zhàn)與對(duì)策 [J].計(jì)算機(jī)產(chǎn)品與流通,2019(6):131.
[4] 劉偉偉,何偉華.大數(shù)據(jù)思維的真理觀 [J].晉中學(xué)院學(xué)報(bào),2019,36(2):22-26.
[5] 鄭宗煜.大數(shù)據(jù)技術(shù)及其在運(yùn)營(yíng)商經(jīng)營(yíng)分析中的運(yùn)用 [J].現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化,2019,9(4):59-60.
[6] 姚鑫.大數(shù)據(jù)中若干安全和隱私保護(hù)問題研究 [D].長(zhǎng)沙:湖南大學(xué),2018.
作者簡(jiǎn)介:劉家銘(1999-),男,漢族,江西南昌人,本科在讀,研究方向:軟件工程。