馮麗
摘要:大數(shù)據(jù)技術(shù)并不是指數(shù)據(jù)量很大,而是指數(shù)據(jù)源頭、數(shù)據(jù)格式和數(shù)據(jù)渠道的多樣性及相關(guān)匯總分析。簡(jiǎn)稱為“三多一分析”。大數(shù)據(jù)分析和其他計(jì)算機(jī)分析技術(shù)的差別在于它所分析的不是單一源頭、單一渠道、單一格式數(shù)據(jù),而是多樣性數(shù)據(jù),大數(shù)據(jù)安全是傳統(tǒng)數(shù)據(jù)安全特性的和新安全特定的結(jié)合。針對(duì)新安全特性,采用發(fā)布干擾消息、風(fēng)險(xiǎn)預(yù)警和防范、大數(shù)據(jù)反分析等技術(shù)進(jìn)行安全建設(shè)。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);數(shù)據(jù)源;數(shù)據(jù)格式;數(shù)據(jù)渠道;多樣化;數(shù)據(jù)分析;大數(shù)據(jù)安全
中圖分類號(hào): TP399? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)25-0013-02
1 大數(shù)據(jù)技術(shù)的特征
大數(shù)據(jù)技術(shù)是近些年來(lái)比較熱門的話題,很多機(jī)構(gòu)和人員都在研究。但是,相當(dāng)一部分人員對(duì)大數(shù)據(jù)技術(shù)的認(rèn)識(shí)并不清晰。僅僅從字面將它理解為信息量很大的數(shù)據(jù),這是典型的以偏概全。信息量很大的數(shù)據(jù)被稱為海量數(shù)據(jù)。海量數(shù)據(jù)與大數(shù)據(jù)技術(shù)并不是一回事,根據(jù)筆者的分析和認(rèn)識(shí),大數(shù)據(jù)技術(shù)有如下幾個(gè)顯著特點(diǎn):
數(shù)據(jù)格式多樣:結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù);文字、圖片、影像、聲音等等各種各樣格式的數(shù)據(jù),均可以被統(tǒng)稱為大數(shù)據(jù)技術(shù)的數(shù)據(jù)格式。
數(shù)據(jù)來(lái)源多樣:電腦、手機(jī)、傳感器均可以作為大數(shù)據(jù)技術(shù)的數(shù)據(jù)源。
通信方式多樣:網(wǎng)站、郵件、手機(jī)短信、即時(shí)聊天工具、影音播放器都可以作為大數(shù)據(jù)技術(shù)的通信方式。
著重?cái)?shù)據(jù)分析:通過(guò)多個(gè)源頭、多種渠道收集到的多種格式數(shù)據(jù),要根據(jù)某一個(gè)計(jì)算模型,進(jìn)行計(jì)算分析,并得到某一個(gè)有價(jià)值的結(jié)論。
用一句話概括:大數(shù)據(jù)技術(shù)就是“三多一分析”。
以一個(gè)真實(shí)案例來(lái)說(shuō)明大數(shù)據(jù)的特性。根據(jù)釘釘軟件的考勤統(tǒng)計(jì)報(bào)告,某男性A近期出現(xiàn)很多缺勤記錄。通過(guò)手機(jī)監(jiān)視程序發(fā)現(xiàn),該A男性近期經(jīng)常光臨淘寶、京東等電商平臺(tái),查看嬰兒床、嬰兒紙尿褲等用品;同時(shí),該男性所在城市的婦幼保健醫(yī)院攝像頭顯示,A男性有若干次出入醫(yī)院的記錄。由此我們可以分析出,A男性的老婆、姐妹或者其他女性親屬是孕婦,并且將要臨產(chǎn)。如果保險(xiǎn)公司得到該結(jié)論,并獲得該男性聯(lián)系方式,可以向該男性推薦生育保險(xiǎn)。當(dāng)然,我們的分析是人工完成的,在真實(shí)的應(yīng)用環(huán)境當(dāng)中,數(shù)據(jù)分析主要通過(guò)程序或者人機(jī)結(jié)合的方式獲得,這就是大數(shù)據(jù)技術(shù)的典型應(yīng)用。
根據(jù)這個(gè)案例,我們可以知道,大數(shù)據(jù)技術(shù)的涵蓋面非常廣,它可能是涵蓋面最廣的計(jì)算機(jī)技術(shù),所有電子數(shù)據(jù)內(nèi)容、數(shù)據(jù)源和通信方式,都是大數(shù)據(jù)技術(shù)的輸入。此外,大數(shù)據(jù)技術(shù)的彈性非常大,少到分析一個(gè)人的一條短信和一段視頻,多到分析一個(gè)國(guó)家全年的醫(yī)療影像和用藥記錄,雖說(shuō)規(guī)模差別巨大,但都從屬于大數(shù)據(jù)技術(shù)。大數(shù)據(jù)技術(shù)這個(gè)名稱,本身沒(méi)有明確指出大數(shù)據(jù)技術(shù)的本質(zhì)特點(diǎn),所以才會(huì)被簡(jiǎn)單理解為海量數(shù)據(jù)。
2 大數(shù)據(jù)分析技術(shù)與其他數(shù)據(jù)分析技術(shù)的區(qū)別
數(shù)據(jù)加分析,是很多計(jì)算機(jī)技術(shù)的特性,比如模式識(shí)別技術(shù)、自然語(yǔ)言處理技術(shù)、人工智能技術(shù),那么大數(shù)據(jù)技術(shù)與這些技術(shù)的區(qū)別是什么?
大數(shù)據(jù)技術(shù)最突出的特征,是數(shù)據(jù)的源頭、格式和渠道的多樣性。大數(shù)據(jù)技術(shù)的數(shù)據(jù)分析與其他計(jì)算機(jī)技術(shù)的數(shù)據(jù)分析差別不大,甚至還要弱一些,即使數(shù)據(jù)分析有差別,也是因?yàn)樵紨?shù)據(jù)的源頭、渠道和格式的多樣化造成的。
3 大數(shù)據(jù)典型應(yīng)用
由于數(shù)據(jù)源頭、格式和渠道的多樣性,大數(shù)據(jù)涵蓋面廣。凡是涉及數(shù)據(jù)的地方,都能應(yīng)用大數(shù)據(jù)技術(shù)。典型應(yīng)用就是預(yù)測(cè)技術(shù):用戶行為預(yù)測(cè)、市場(chǎng)物價(jià)預(yù)測(cè)、人體健康預(yù)測(cè)、疾病疫情預(yù)測(cè)、交通行為預(yù)測(cè)、災(zāi)害災(zāi)難預(yù)測(cè)。
4 大數(shù)據(jù)安全
大數(shù)據(jù)安全是個(gè)籠統(tǒng)的概念,可以有如下三種解釋:一、利用大數(shù)據(jù)技術(shù)保護(hù)傳統(tǒng)信息系統(tǒng)安全。二、如何保護(hù)大數(shù)據(jù)技術(shù)本身的安全。三、如何防止基于大數(shù)據(jù)技術(shù)的破壞活動(dòng)。
第一個(gè)解釋,屬于大數(shù)據(jù)技術(shù)的一個(gè)應(yīng)用,應(yīng)用對(duì)象是傳統(tǒng)信息系統(tǒng)安全。從多個(gè)角度、多種技術(shù)收集數(shù)據(jù),并針對(duì)安全問(wèn)題進(jìn)行分析,得到有價(jià)值的結(jié)論。問(wèn)題的關(guān)鍵是數(shù)據(jù)源、數(shù)據(jù)渠道和分析模型,通過(guò)充足的數(shù)據(jù)源和數(shù)據(jù)渠道,迅速收集到有價(jià)值的數(shù)據(jù),并根據(jù)模型分析出有效的安全結(jié)論。
第二解釋,屬于大數(shù)據(jù)技術(shù)自身的安全,針對(duì)的目標(biāo)是大數(shù)據(jù)本身。問(wèn)題的關(guān)鍵是大數(shù)據(jù)基礎(chǔ)設(shè)施如服務(wù)器、網(wǎng)絡(luò)設(shè)備、是否具備有效的安全防護(hù)措施,數(shù)據(jù)源、數(shù)據(jù)渠道是否被屏蔽、數(shù)據(jù)內(nèi)容是否真實(shí)。分析模型是否有效。分析結(jié)論是否被竊取或者篡改。
第三種解釋,指如何防范基于大數(shù)據(jù)技術(shù)的入侵行為。針對(duì)目標(biāo)是基于大數(shù)據(jù)技術(shù)的入侵行為。
三種解釋當(dāng)中,第二、第三種會(huì)帶來(lái)安全問(wèn)題,第二種屬于傳統(tǒng)安全問(wèn)題,第三種屬于新安全問(wèn)題。因?yàn)榉缸锓肿永么髷?shù)據(jù)技術(shù)這一新技術(shù)進(jìn)行破壞,傳統(tǒng)的安全防護(hù)措施,不能有效抵擋這種新型進(jìn)攻,要專門制定新的模型和安全措施。為了陳述方便,將第三種解釋重命名為基于大數(shù)據(jù)技術(shù)的入侵行為。
為了防范基于大數(shù)據(jù)技術(shù)的入侵行為。要根據(jù)大數(shù)據(jù)技術(shù)“三多一分析”的特點(diǎn),制定防范措施。防護(hù)措施分為數(shù)據(jù)源防護(hù)、數(shù)據(jù)渠道防護(hù)、數(shù)據(jù)內(nèi)容防護(hù),數(shù)據(jù)分析阻斷四個(gè)角度。其中數(shù)據(jù)源防護(hù)、數(shù)據(jù)渠道防護(hù)、數(shù)據(jù)內(nèi)容防護(hù)未脫離傳統(tǒng)信息安全領(lǐng)域,可以采用傳統(tǒng)的身份鑒別、訪問(wèn)控制、安全審計(jì)、通信加密等技術(shù)。數(shù)據(jù)分析不在我方進(jìn)行,而是在不法販子方進(jìn)行,較難阻斷,我方可以采用發(fā)送干擾數(shù)據(jù)的方法,干擾不法分子的數(shù)據(jù)分析結(jié)論。
大數(shù)據(jù)技術(shù)本身可以作為防護(hù)手段,防范基于大數(shù)據(jù)技術(shù)的入侵行為。大數(shù)據(jù)技術(shù)的一個(gè)重要應(yīng)用就是預(yù)測(cè)技術(shù),我方采用大數(shù)據(jù)技術(shù)構(gòu)造風(fēng)險(xiǎn)預(yù)警平臺(tái),提前預(yù)知可能發(fā)生的基于大數(shù)據(jù)技術(shù)的入侵行為。
同時(shí),可以對(duì)不法分子的攻擊行為大數(shù)據(jù)分析,即反向大數(shù)據(jù)分析。通過(guò)多源頭、多渠道采集不同格式的犯罪分子數(shù)據(jù),并做關(guān)聯(lián)分析,為捕獲不法分子創(chuàng)造可能。
5 總結(jié)
科學(xué)技術(shù)是把雙刃劍,大數(shù)據(jù)技術(shù)也不例外,它既可以為我們創(chuàng)造價(jià)值,也可以被不法分子利用并進(jìn)行破壞,我們要慎重合理對(duì)待大數(shù)據(jù)技術(shù),不可以過(guò)于樂(lè)觀,也不可以盲目悲觀。要以平和端正的態(tài)度,從客觀事實(shí)出發(fā),一分為二地看待問(wèn)題,充分利用大數(shù)據(jù)技術(shù)的優(yōu)勢(shì),積極抵御大數(shù)據(jù)技術(shù)帶來(lái)的危害,為人類造福。
【通聯(lián)編輯:唐一東】