三亞學(xué)院信息與智能工程學(xué)院 鄒琴琴
隨著網(wǎng)絡(luò)環(huán)境以及結(jié)構(gòu)的復(fù)雜化發(fā)展,各種數(shù)據(jù)信息呈現(xiàn)出爆發(fā)式的增長(zhǎng),海量的數(shù)據(jù)信息使得信息管理工作更加的困難。所以,需要不斷的加強(qiáng)信息安全管理工作,通過(guò)數(shù)據(jù)挖掘技術(shù)在大量的數(shù)據(jù)當(dāng)中提取對(duì)社會(huì)發(fā)展以及經(jīng)濟(jì)增長(zhǎng)有用的信息。目前,網(wǎng)絡(luò)安全技術(shù)存在相應(yīng)的問(wèn)題,比如安全漏洞多、防護(hù)水平低等,這些在一定程度上影響到了網(wǎng)絡(luò)信息安全性。由此可見(jiàn),對(duì)信息化時(shí)代數(shù)據(jù)挖掘產(chǎn)生的信息安全問(wèn)題進(jìn)行研究具有重要的意義。
隨著人工智能等科學(xué)技術(shù)的迅速發(fā)展,使得各種數(shù)據(jù)朝著指數(shù)增長(zhǎng)的方向發(fā)展,因此需要在海量的信息當(dāng)中獲取更多有價(jià)值的內(nèi)容,從而滿足用戶的不同需求。但是不同行業(yè)對(duì)數(shù)據(jù)信息的實(shí)際需求存在著很大的差別,而通過(guò)數(shù)據(jù)挖掘技術(shù)能夠在各種數(shù)據(jù)信息當(dāng)中提取到有價(jià)值的內(nèi)容,能夠給數(shù)據(jù)的應(yīng)用者提供完善的信息服務(wù)。
數(shù)據(jù)挖掘技術(shù)就是指從海量的信息當(dāng)中快速地搜索到人們需要有價(jià)值的內(nèi)容,利用現(xiàn)代化信息技術(shù)、大數(shù)據(jù)技術(shù)等獲取到相關(guān)的信息資源。能夠進(jìn)行數(shù)據(jù)挖掘的信息數(shù)據(jù)需要是真實(shí)的、有效的,且經(jīng)過(guò)獲取和篩選后得到的信息需要是對(duì)社會(huì)有意義的。在數(shù)據(jù)挖掘的過(guò)程中,相應(yīng)的數(shù)據(jù)庫(kù)越大、信息量越大,其挖掘后的結(jié)果也更加的具有科學(xué)性、代表性,因此,數(shù)據(jù)挖掘技術(shù)的核心部分就是對(duì)數(shù)據(jù)的處理效率。
數(shù)據(jù)挖掘技術(shù)的方法主要包括數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)分類及數(shù)據(jù)聚類等。利用數(shù)據(jù)挖掘技術(shù),第一要對(duì)數(shù)據(jù)庫(kù)資源進(jìn)行分析,提取出有價(jià)值的內(nèi)容,同時(shí)進(jìn)行加工處理,變?yōu)橛欣谶M(jìn)行數(shù)據(jù)挖掘的形式。第二,利用科學(xué)的數(shù)據(jù)算法對(duì)數(shù)據(jù)進(jìn)行提取,同時(shí)進(jìn)行評(píng)估,以便以簡(jiǎn)單的方式呈現(xiàn)給用戶。大數(shù)據(jù)挖掘技術(shù)主要有數(shù)據(jù)的提取、預(yù)處理、深度挖掘以及評(píng)估等幾個(gè)過(guò)程。
在信息化時(shí)代背景下,個(gè)人信息數(shù)據(jù)收集隨處可見(jiàn),海量的數(shù)據(jù)信息雖然可以給人們提供一定的便利性,然而在使用數(shù)據(jù)的過(guò)程中,該行為是不透明的,因此使得人們的隱私會(huì)受到危害。當(dāng)個(gè)人用戶在享受一些機(jī)構(gòu)提供的服務(wù)時(shí),往往會(huì)簽訂相關(guān)的免責(zé)協(xié)議書或者合同條款等,這些聲明中往往包含用戶協(xié)議、隱私等。當(dāng)簽署協(xié)議之后表明機(jī)構(gòu)組織能夠利用數(shù)據(jù)信息給用戶提供相應(yīng)的服務(wù)。在這一過(guò)程中,用戶的數(shù)據(jù)信息就會(huì)傳輸?shù)交ヂ?lián)網(wǎng)當(dāng)中。比如,當(dāng)用戶使用共享單車的時(shí)候,就會(huì)獲取相應(yīng)的位置信息以及時(shí)間等。此外,能夠進(jìn)行云存儲(chǔ)服務(wù)的公司可以獲取用戶傳輸?shù)奈淖?、視頻、語(yǔ)音等內(nèi)容。而能夠進(jìn)行AI語(yǔ)音服務(wù)的機(jī)構(gòu)就可以獲取用戶的位置、語(yǔ)音信息、關(guān)鍵字等。
在實(shí)際生活當(dāng)中,很多因素都會(huì)使得用戶隱私出現(xiàn)暴露。由于智能化終端的廣泛應(yīng)用,通過(guò)大數(shù)據(jù)技術(shù),機(jī)構(gòu)組織就可以獲取用戶的位置信息、聲音等。當(dāng)用戶進(jìn)行購(gòu)物的過(guò)程中,與此相關(guān)的支付金額、賬戶、消費(fèi)類型等內(nèi)容也會(huì)上傳到互聯(lián)網(wǎng)當(dāng)中。用戶的隱私問(wèn)題一直在持續(xù)的發(fā)展,且產(chǎn)生大量的數(shù)據(jù),而只有“事件”才能被保護(hù)起來(lái)。但是還存在很多的連續(xù)數(shù)據(jù)也與用戶的隱私相關(guān),這部分不能得到有效的保護(hù),給不法分子帶來(lái)可乘之機(jī)。
用戶以及設(shè)備都會(huì)產(chǎn)生很多的數(shù)據(jù),然而數(shù)據(jù)之外的部分信息可能也會(huì)存在一定的隱患。根據(jù)相關(guān)學(xué)者指出,現(xiàn)階段互利網(wǎng)上僅存在20%的信息,而有80%的數(shù)據(jù)還游離在互聯(lián)網(wǎng)之外,并且大部分是作為垃圾數(shù)據(jù)的游離狀態(tài)。比如,用戶設(shè)備的日常數(shù)據(jù),手機(jī)中刪除的照片、視頻等。這些數(shù)據(jù)都存在被傳到互聯(lián)網(wǎng)上的可能性,當(dāng)數(shù)據(jù)信息進(jìn)行處理之后就能夠獲取到很多隱秘的信息,從而帶來(lái)巨大的威脅。
除此之外,游離的數(shù)據(jù)按照目前互聯(lián)網(wǎng)中開(kāi)放性的信息資源,并且進(jìn)行邏輯推理之后能夠?qū)C(jī)構(gòu)等的數(shù)據(jù)安全帶來(lái)威脅。當(dāng)用戶由于喜好等原因拍攝一些照片時(shí),傳輸當(dāng)網(wǎng)絡(luò)當(dāng)中的時(shí)候,這些游離的信息就會(huì)被獲取到。然后分析組織再進(jìn)行數(shù)據(jù)測(cè)試,利用卷積神經(jīng)網(wǎng)絡(luò)模型開(kāi)展深度學(xué)習(xí)。當(dāng)建立好相應(yīng)的模型之后,就能夠更容易的應(yīng)用到數(shù)據(jù)的挖掘過(guò)程中。此外,根據(jù)人工識(shí)別分析能夠獲取到事件當(dāng)中的主要內(nèi)容。因此,在互聯(lián)網(wǎng)當(dāng)中存在的大量的游離信息能夠?qū)M織造成巨大的影響。
為了確保網(wǎng)絡(luò)信息的安全,需要提高網(wǎng)絡(luò)環(huán)境的安全性,按照現(xiàn)階段行業(yè)的發(fā)展現(xiàn)狀分析,第一,要對(duì)隔離以及訪問(wèn)控制技術(shù)進(jìn)行科學(xué)應(yīng)用與創(chuàng)新。其中,不僅要完成物理層面的更新,還要不斷地加強(qiáng)邏輯層面的隔離,禁止一切未授權(quán)的網(wǎng)絡(luò)用戶訪問(wèn)網(wǎng)絡(luò)資金。第二,合理的使用反病毒技術(shù)。木馬病毒等是威脅信息安全的重要影響因素,因此,為了加強(qiáng)數(shù)據(jù)信息的安全性能,可以建立一個(gè)科學(xué)的病毒預(yù)警和防護(hù)機(jī)制,一旦受到病毒的威脅與損害時(shí),利用病毒檢測(cè)技術(shù)就能夠在較短的時(shí)間內(nèi)檢測(cè)出來(lái),同時(shí)完成對(duì)數(shù)據(jù)信息安全性的定性分析,及時(shí)的解決此問(wèn)題。最后,在網(wǎng)絡(luò)系統(tǒng)當(dāng)中加入數(shù)據(jù)統(tǒng)計(jì)分析功能,保證系統(tǒng)可以對(duì)用戶的訪問(wèn)次數(shù)及時(shí)間進(jìn)行記錄,并且對(duì)網(wǎng)絡(luò)環(huán)境的使用情況及時(shí)地進(jìn)行反饋,保證網(wǎng)絡(luò)不會(huì)受到病毒的攻擊。另外,還要在網(wǎng)絡(luò)環(huán)境當(dāng)中加入備份以及恢復(fù)等功能,這樣不僅能夠確保信息受到攻擊后不被刪除破壞,而且使得相應(yīng)的信息在最短的時(shí)間內(nèi)恢復(fù)到原來(lái)的狀態(tài)。
在進(jìn)行數(shù)據(jù)挖掘的時(shí)候,需要確保挖掘信息的安全性,主要表現(xiàn)為數(shù)據(jù)的存儲(chǔ)安全、傳輸安全和信息的使用安全等方面。在數(shù)據(jù)實(shí)際挖掘的過(guò)程中,第一,要使得數(shù)據(jù)信息存在物理層面的邏輯完整性,其中,邏輯完整性以及保密性是保證數(shù)據(jù)安全的核心內(nèi)容。當(dāng)保密數(shù)據(jù)傳輸?shù)臅r(shí)候,數(shù)據(jù)的安全性對(duì)其挖掘操作至關(guān)重要,現(xiàn)階段,在各種應(yīng)用環(huán)境內(nèi),一般應(yīng)用傳輸加密技術(shù)、數(shù)據(jù)完整性技術(shù)等來(lái)確保數(shù)據(jù)傳輸時(shí)的安全性。除此之外,在實(shí)際操作過(guò)程中,也要確保信息的安全性以及傳輸過(guò)程的準(zhǔn)確性,防止出現(xiàn)信息丟失等問(wèn)題。使用的安全性主要指當(dāng)數(shù)據(jù)應(yīng)用的時(shí)候必須對(duì)使用主體開(kāi)展核驗(yàn)以及校準(zhǔn)工作,防止未經(jīng)授權(quán)的用戶使用相應(yīng)的數(shù)據(jù)資源,以便提高信息的安全性。
在數(shù)據(jù)挖掘技術(shù)的支撐下,解決信息安全問(wèn)題需要構(gòu)建科學(xué)的數(shù)據(jù)挖掘模型,可通過(guò)以下幾點(diǎn):
第一,可以按照關(guān)聯(lián)性的分析結(jié)果來(lái)建立相關(guān)的數(shù)據(jù)模型,根據(jù)現(xiàn)階段的研究技術(shù),關(guān)聯(lián)數(shù)據(jù)模型一般是利用外部攻擊的相關(guān)內(nèi)容進(jìn)行分析和總結(jié),同時(shí)根據(jù)現(xiàn)階段應(yīng)用的數(shù)據(jù)挖掘技術(shù),展示出使用較為廣泛、效果較好的攻擊行為態(tài)勢(shì)。對(duì)于攻擊行為而言,主要包括攻擊類型、源地址以及目的地址等幾個(gè)部分,同時(shí)能夠表現(xiàn)出攻擊行為的主要特點(diǎn)。所以,在確保信息安全的過(guò)程中,需要對(duì)攻擊次數(shù)較多的行為進(jìn)行綜合和分析,并且建立相應(yīng)的數(shù)據(jù)模型,以便構(gòu)建科學(xué)的數(shù)據(jù)體系。
第二,建立完善的事件預(yù)測(cè)機(jī)制。預(yù)測(cè)機(jī)制主要是指當(dāng)對(duì)某一個(gè)事件的發(fā)展趨勢(shì)進(jìn)行跟蹤調(diào)查的時(shí)候,通過(guò)數(shù)據(jù)挖掘技術(shù)里面的聚類算法,同時(shí)利用相應(yīng)的演算過(guò)程判斷此事件能否是大規(guī)模的網(wǎng)絡(luò)攻擊行為,而面對(duì)大規(guī)模的網(wǎng)絡(luò)安全事件,其出現(xiàn)的次數(shù)并不是主要的研究?jī)?nèi)容,其中,需要重點(diǎn)關(guān)注的內(nèi)容就是事件發(fā)生的擴(kuò)散程度、面積以及相應(yīng)的速度等。例如,在對(duì)數(shù)據(jù)信息進(jìn)行檢測(cè)的過(guò)程中,如果出現(xiàn)某一種木馬病毒的IP地址數(shù)量迅速地增加,就需要引入充分的關(guān)注,所以出現(xiàn)這種事件的現(xiàn)象就可以看做一次網(wǎng)絡(luò)攻擊事件。除此之外,還要構(gòu)建可控?cái)?shù)量的預(yù)測(cè)模型。一般而言,可控?cái)?shù)量的預(yù)測(cè)模型是對(duì)觀察事件的受控主機(jī)的增長(zhǎng)情況進(jìn)行分析與監(jiān)控,能夠?qū)κ录母腥具M(jìn)行一個(gè)科學(xué)的判斷。通過(guò)對(duì)受控主機(jī)狀態(tài)的增長(zhǎng)情況的分析,能夠在未察覺(jué)異常情況前采用有效的檢測(cè)方式,從而得出主機(jī)在受到攻擊后其數(shù)量出現(xiàn)大規(guī)模的增長(zhǎng),可以得出受控主機(jī)狀態(tài)的增長(zhǎng)趨勢(shì)。例如,在監(jiān)測(cè)的過(guò)程中如果出現(xiàn)木馬病毒等,并且主機(jī)之前從未發(fā)生過(guò)這種攻擊情況,在監(jiān)測(cè)的時(shí)候發(fā)現(xiàn)主機(jī)被病毒感染,那么主機(jī)就處于受控情況下的增長(zhǎng)狀態(tài)。
第三,可以建立分析和處理模型,此模型的建立一般是對(duì)相關(guān)的數(shù)據(jù)和事件進(jìn)行處理,以便提升被控主機(jī)的處理水平。在模型分析的過(guò)程中,主要是對(duì)未處理過(guò)的主機(jī)以及處理效率等進(jìn)行全面的評(píng)價(jià),這樣就能夠得到主機(jī)處理能力的評(píng)價(jià)標(biāo)準(zhǔn)。
本文通過(guò)對(duì)信息化時(shí)代數(shù)據(jù)挖掘產(chǎn)生的信息安全問(wèn)題的研究,使我們了解到了,在信息化時(shí)代背景下,數(shù)據(jù)挖掘產(chǎn)生的信息安全問(wèn)題日益突出,給用戶的身份信息安全帶來(lái)了巨大的隱患,主要體現(xiàn)在對(duì)個(gè)人數(shù)據(jù)信息的影響以及“游離”數(shù)據(jù)對(duì)組織的影響等兩個(gè)方面。因此,需要建立安全的網(wǎng)絡(luò)環(huán)境,確保數(shù)據(jù)挖掘信息的安全性,同時(shí)構(gòu)建科學(xué)的數(shù)據(jù)挖掘模型,從而保證網(wǎng)絡(luò)信息安全。