邢翀
[摘 要]隨著社會的發(fā)展和信息技術(shù)的進(jìn)步,在這個信息化的時代下,計算機(jī)的應(yīng)用頻率越來越高。伴隨計算機(jī)應(yīng)用產(chǎn)生的各種軟件也都不盡相同,計算機(jī)和網(wǎng)絡(luò)的出現(xiàn)改變了人們傳統(tǒng)的交流方式,人們可以不需要通過面對面的方式也可以實現(xiàn)在虛擬網(wǎng)絡(luò)中的交流。信息化時代的到來催生了電商平臺的發(fā)展,人們可以通過網(wǎng)上購物、付款的方式,實現(xiàn)方便快捷的線上購物。雖然網(wǎng)絡(luò)豐富方便了我們的生活,但是網(wǎng)絡(luò)安全漏洞問題同時會危及我們的信息、財產(chǎn)安全,提升網(wǎng)絡(luò)環(huán)境的安全性,創(chuàng)造干凈、安全的網(wǎng)絡(luò)空間,已經(jīng)成為信息化時代下我們信息工作者的重要任務(wù),解決網(wǎng)絡(luò)安全問題刻不容緩。本文首先介紹了計算機(jī)文本挖掘技術(shù)和網(wǎng)絡(luò)安全問題的相關(guān)概念和現(xiàn)狀,其次分析了計算機(jī)文本挖掘技術(shù)的工作原理,最后闡述了計算機(jī)文本挖掘技術(shù)在解決網(wǎng)絡(luò)安全問題中的應(yīng)用。通過計算機(jī)文本挖掘技術(shù),完善計算機(jī)漏洞自動分類技術(shù),打造一個無垃圾信息的網(wǎng)絡(luò)環(huán)境,大大提升了網(wǎng)絡(luò)空間的安全性。
[關(guān)鍵詞]計算機(jī)文本挖掘技術(shù);計算機(jī)漏洞;總動分類技術(shù);研究
[中圖分類號]TP393.08 [文獻(xiàn)標(biāo)識碼]A
1 計算機(jī)漏洞
1.1 計算機(jī)漏洞的概述
計算機(jī)漏洞是指在系統(tǒng)設(shè)計、實現(xiàn)、維護(hù)或者運(yùn)營過程中造成的可被非授權(quán)人員非法利用的軟硬件缺陷。計算機(jī)漏洞的出現(xiàn)很容易導(dǎo)致網(wǎng)絡(luò)系統(tǒng)被攻擊,造成各種各樣的網(wǎng)絡(luò)安全事故,是眾多信息安全事故的罪魁禍?zhǔn)?,計算機(jī)漏洞的出現(xiàn)和快速繁殖是由于黑客的盛行,黑客主要是通過對網(wǎng)絡(luò)系統(tǒng)的薄弱環(huán)節(jié)進(jìn)行攻擊,攻克系統(tǒng)后會形成幾個少量的計算機(jī)漏洞,然后黑客又通過這幾個少量的漏洞之間進(jìn)行相互滲透,達(dá)到通過非法手段獲得操作權(quán)限的目的,從而逐漸實現(xiàn)對目標(biāo)系統(tǒng)的攻陷,非法地對操作系統(tǒng)進(jìn)行控制,甚至是對系統(tǒng)目標(biāo)的完整性進(jìn)行破壞。計算機(jī)漏洞問題的出現(xiàn)歷史已經(jīng)較為久遠(yuǎn)了,應(yīng)該說是計算計漏洞是伴隨著網(wǎng)絡(luò)的出現(xiàn)而產(chǎn)生的,有網(wǎng)絡(luò)的地方不可避免的就會出現(xiàn)計算機(jī)漏洞,計算機(jī)漏洞并不可怕,可怕的沒有及時發(fā)現(xiàn)計算機(jī)漏洞,缺乏對計算漏洞的及時、有效管理,因此,為了防范網(wǎng)絡(luò)風(fēng)險,保護(hù)個人隱私和財產(chǎn)安全,及時防范和及時補(bǔ)救計算機(jī)漏洞的工作是不可或缺的。
1.2 解決計算機(jī)漏洞問題的必要性
計算機(jī)漏洞的出現(xiàn)已經(jīng)是在很久之前了,在過去的十幾年前,就已經(jīng)發(fā)現(xiàn)計算機(jī)漏洞的出現(xiàn),一旦漏洞出現(xiàn),在此后的十幾年中會以極其迅猛的速度發(fā)展,可以說計算機(jī)漏洞問題已經(jīng)成了計算機(jī)用戶界的災(zāi)難。有具體數(shù)據(jù)指出,截止到今年年底,全世界被公布的漏洞數(shù)量已經(jīng)53526個。由于計算機(jī)信息化的發(fā)展程度越來越深化,用戶對計算機(jī)的智能化、人工化要求的增加,導(dǎo)致計算機(jī)漏洞發(fā)展更加迅速,據(jù)不完全統(tǒng)計,目前計算機(jī)漏洞的出現(xiàn)個數(shù)每天甚至能夠達(dá)到20個之多。因此,解決計算機(jī)漏洞問題,保護(hù)用戶信息隱私和財產(chǎn)安全已經(jīng)成為當(dāng)務(wù)之急。
1.3 計算機(jī)漏洞處理工作的復(fù)雜性
“紙上得來終覺淺,絕知此事要躬行”,計算機(jī)漏洞補(bǔ)救工作是一項非常艱巨的任務(wù),工作的艱巨性體現(xiàn)在兩個方面,一是計算機(jī)漏洞補(bǔ)救工作需要耗費大量的人力、物力、財力,后期的維護(hù)成本也相對較高,是一項資源消耗量巨大的工作,計算機(jī)漏洞技術(shù)作為一項高端的網(wǎng)絡(luò)操作技術(shù),對操作人員的要求非常高,操作人員不僅要有善于及時發(fā)現(xiàn)計算機(jī)漏洞的敏銳性,而且還應(yīng)該具有及時修補(bǔ)漏洞的技術(shù),不具備專業(yè)的網(wǎng)絡(luò)技術(shù),就算已經(jīng)進(jìn)行了修復(fù)措施,還是無濟(jì)于事,甚至非官方的漏洞補(bǔ)丁還會增加其他計算機(jī)漏洞的風(fēng)險,等等。同時,還要求工作人員最好有預(yù)測漏洞的能力,做到防范風(fēng)險于未然,定期檢查系統(tǒng)防御較為薄弱的部分,及時找到安全的官方補(bǔ)丁。另外,在對網(wǎng)絡(luò)連續(xù)性要求較高的大企業(yè)、公司等等,由于計算機(jī)漏洞的出現(xiàn)需要進(jìn)行修復(fù),修復(fù)的過程造成了計算機(jī)工作的不連續(xù)性,極易導(dǎo)致公司數(shù)據(jù)的丟失或損壞,在修復(fù)階段還會暫停工作,可見漏洞修補(bǔ)的時間成本也較為高昂。
1.4 計算機(jī)漏洞產(chǎn)生的原因
計算機(jī)漏洞的出現(xiàn)很容易導(dǎo)致網(wǎng)絡(luò)系統(tǒng)被攻擊,造成各種各樣的網(wǎng)絡(luò)安全事故,是眾多信息安全事故的罪魁禍?zhǔn)祝嬎銠C(jī)漏洞的出現(xiàn)和快速繁殖是由于黑客的盛行。為了防范網(wǎng)絡(luò)風(fēng)險,保護(hù)個人隱私和財產(chǎn)安全,及時防范和及時補(bǔ)救計算機(jī)漏洞的工作是不可或缺的,因此,為了實現(xiàn)對計算機(jī)漏洞的控制,首先我們來了解一下計算機(jī)漏洞產(chǎn)生的原因:
1.4.1 系統(tǒng)復(fù)雜性
首先系統(tǒng)漏洞的誘發(fā)原因最主要的就是系統(tǒng)的復(fù)雜性造成的,由于網(wǎng)絡(luò)系統(tǒng)的復(fù)雜性,造成難以全面地掌控系統(tǒng)安全,極易產(chǎn)生系統(tǒng)的風(fēng)險性。通過復(fù)雜的系統(tǒng),計算機(jī)病毒極易入侵系統(tǒng),造成大規(guī)模的系統(tǒng)漏洞。因此,系統(tǒng)的復(fù)雜性是導(dǎo)致計算機(jī)漏洞產(chǎn)生的原因之一。
1.4.2 基礎(chǔ)操作系統(tǒng)的設(shè)計缺陷
操作系統(tǒng)是硬件系統(tǒng)的靈魂,是所有應(yīng)用軟件的基礎(chǔ)環(huán)境,操作系統(tǒng)在計算機(jī)系統(tǒng)中扮演著重要的角色,因此操作系統(tǒng)的設(shè)計缺陷極容易造成計算機(jī)漏洞的出現(xiàn),例如對操作系統(tǒng)的設(shè)計有缺陷,會造成操作系統(tǒng)管理員權(quán)限的失控,當(dāng)系統(tǒng)漏洞出現(xiàn)時,會出現(xiàn)管理員權(quán)限被非法侵入等一系列的系統(tǒng)漏洞。
1.4.3 用戶的使用與配置錯誤
用戶的使用也很容易造成系統(tǒng)漏洞的出現(xiàn),如用戶對計算機(jī)系統(tǒng)的陌生,輕易地點擊帶有木馬病毒的陌生鏈接或者是設(shè)置用戶密碼的內(nèi)容較為簡單,極易破解,等等,這些缺少防范意識的操作很容易導(dǎo)致計算機(jī)漏洞的出現(xiàn)。
1.4.4 常見的代碼
常見的代碼設(shè)計是最初的漏洞產(chǎn)生的原因以及定義范圍,這一原因同基礎(chǔ)操作系統(tǒng)的設(shè)計缺陷原因類似,都是由于前期的系統(tǒng)設(shè)計問題遺留的隱患,如不能有效地避免這些設(shè)計缺陷,會加大后期計算機(jī)使用過程中的漏洞出現(xiàn)概率。如在代碼的設(shè)計時,設(shè)計過程較為簡單,缺少針對用戶登錄時的有效驗證:不對用戶輸入進(jìn)行全面有效的驗證,可能會被攻擊者利用來執(zhí)行惡意代碼,最常見的緩沖區(qū)溢出、注入都是利用這一方式。
1.4.5 設(shè)備熟知度
設(shè)備的熟知度也是導(dǎo)致計算機(jī)漏洞出現(xiàn)幾率較大的一個因素,由于在系統(tǒng)設(shè)計過程中,程序員運(yùn)用了較為簡單常見的通用代碼或者是軟件,一個完全陌生的設(shè)備與一個在日常使用中比較常見的軟件相比,產(chǎn)生計算機(jī)漏洞的概率較高的一方一目了然,在系統(tǒng)設(shè)計時,采用簡單常見的設(shè)備極容易造成系統(tǒng)密碼被破譯,產(chǎn)生系統(tǒng)漏洞的結(jié)果。
有網(wǎng)絡(luò)的地方不可避免的就會出現(xiàn)計算機(jī)漏洞,計算機(jī)漏洞的出現(xiàn)是不可避免的,只要及時防范和及時補(bǔ)救計算機(jī)漏洞的工作到位,就可以規(guī)避風(fēng)險把損失降到最小。只有充分研究造成計算機(jī)漏洞的原因,才能從源頭上把握計算機(jī)漏洞的補(bǔ)救原理,以不變應(yīng)萬變。
2 計算機(jī)文本挖掘技術(shù)的概述
2.1 計算機(jī)文本挖掘技術(shù)的概念
計算機(jī)文本挖掘技術(shù)簡單來說就是對計算機(jī)中文本信息的處理,因此,文本挖掘技術(shù)的主要操作對象即計算機(jī)中的文本信息,這一技術(shù)在計算機(jī)的數(shù)據(jù)處理中處于非常重要的位置。詳細(xì)來說,計算機(jī)文本挖掘技術(shù)就是從海量的文本信息中挖掘、識別有用的信息,是從抽象內(nèi)容提取出具體、可理解信息的過程,在文本挖掘這個核心階段中,挖掘結(jié)果最終體現(xiàn)為文本分類、文本聚類、關(guān)聯(lián)分析、趨勢預(yù)測等,其中海量的信息包括各類文本信息,如期刊中的文本信息、網(wǎng)頁中的文本信息、基于文本信息構(gòu)建的數(shù)據(jù)庫,等等。這些文本信息應(yīng)該在計算機(jī)執(zhí)行文本挖掘技術(shù)之前進(jìn)行人工處理,如對文本信息的去噪處理、分詞處理、停詞處理、特征表示、特征提取等等,這樣在執(zhí)行文本挖掘技術(shù)時,會降低處理難度,提升處理的準(zhǔn)確性和效率。
2.2 計算機(jī)文本挖掘技術(shù)的重要意義
通過計算機(jī)文本挖掘技術(shù),挖掘網(wǎng)絡(luò)中有價值、安全的信息,實現(xiàn)對網(wǎng)絡(luò)信息垃圾的分類并攔截,打造一個無垃圾信息的網(wǎng)絡(luò)環(huán)境,大大提升了網(wǎng)絡(luò)空間的安全性。
3 基于文本挖掘的計算機(jī)漏洞自動分類技術(shù)
3.1 RISOS分類法
該種分類方法主要是從漏洞產(chǎn)生,是從攻擊的角度進(jìn)行的漏洞分類,出現(xiàn)的年代已經(jīng)較為久遠(yuǎn),無法識別到最近出現(xiàn)的一些較為新型的計算機(jī)漏洞,對于后面出現(xiàn)的新類型的漏洞已經(jīng)不適用于此種分類方法了,屬于較為傳統(tǒng)的計算機(jī)漏洞自動分類技術(shù)。
3.2 PA分類法
該分類法是由美國提出的,該種分類方法是對傳統(tǒng)的、僅包含操作系統(tǒng)漏洞的分類法的改進(jìn)和綜合,是在原有的傳統(tǒng)分類法基礎(chǔ)上又加入了對操作系統(tǒng)中應(yīng)用程序漏洞的分類,改進(jìn)后的分類法按照漏洞產(chǎn)生的原因?qū)⒙┒捶譃樗念悾河蛎e誤、校驗錯誤、命名錯誤、串行化錯誤。
3.3 SIAM分類法
第三種分類方法較之前兩種都比較先進(jìn),出現(xiàn)的時間相對較晚,該分類方法主要是對平臺上軟件執(zhí)行級漏洞的詳細(xì)信息進(jìn)行歸納和分類。其優(yōu)點顯而易見就是適用對象更加廣泛,適用面更加寬廣,但缺點是仍屬于一種較為初級的分類方法,不涉及高層軟件設(shè)計相關(guān)的漏洞和缺陷,應(yīng)用面還停留在初級平臺上。
3.4 venter分類法
該種分類方法共包含個不同的類別:密碼破解與嗅探、網(wǎng)絡(luò)系統(tǒng)信息收集、后門、特洛伊木馬與遠(yuǎn)程控制、遠(yuǎn)程連接與服務(wù)的非授權(quán)訪問、用戶權(quán)限提升、電子欺騙與冒充、配置錯誤、拒絕服務(wù)與緩沖區(qū)溢出、病毒與蠕蟲、硬件細(xì)節(jié)、軟件細(xì)節(jié)與升級以及安全政策違反。
3.5 Anday Gray分類法
該分類方法是在吸取前人工作成果的基礎(chǔ)上提出的,包括十個類別的漏洞分類體系,在分類過程中考慮了漏洞起源、引入時間、位置、執(zhí)行環(huán)境、質(zhì)量影響、發(fā)現(xiàn)方法、滲透場景、修復(fù)步驟等因素。該分類法的優(yōu)點在于其具體實現(xiàn)為了滿足不同的人在不同的環(huán)境下的分類要求,會針對不同的漏洞分析需求而改變。
3.6 Eric Knight分類法
該分類方法首次提出從軟件設(shè)計、協(xié)議實現(xiàn)、系統(tǒng)脆弱性和人為因素等多個方面對系統(tǒng)安全漏洞進(jìn)行分類和評估,改變了傳統(tǒng)漏洞分類方法僅僅考慮某一單一因素的思路,大大增加了分類方法的涵蓋范圍,使得大部分漏洞都可以在這個分類機(jī)制下進(jìn)行分類,對每個類別之間的區(qū)別進(jìn)行了詳細(xì)的定義,因此在實際應(yīng)用具有較大的意義。
隨著經(jīng)濟(jì)的發(fā)展和社會的進(jìn)步,人類已步入信息社會時代,計算機(jī)廣泛地應(yīng)用于人們生活的各個方面。為了適應(yīng)現(xiàn)代網(wǎng)絡(luò)安全問題的要求,計算機(jī)文本挖掘技術(shù)的掌握工作顯得尤為重要。計算機(jī)漏洞的出現(xiàn)是導(dǎo)致網(wǎng)絡(luò)安全問題的首要原因,通過對漏洞的自動分類技術(shù)研究,一方面可以維護(hù)網(wǎng)絡(luò)環(huán)境的安全穩(wěn)定,另一方面可以有效打擊網(wǎng)絡(luò)犯罪,保護(hù)人民的個人隱私和財產(chǎn)的安全。因此,應(yīng)將基于文本挖掘的計算機(jī)漏洞自動分類技術(shù)作為首要任務(wù),通過計算機(jī)漏洞自動分類技術(shù),大大提升網(wǎng)絡(luò)空間的安全性。
[參考文獻(xiàn)]
[1] 文翰.面向信息檢索的 Web 文本挖掘方法研究[D].廣州:華南理工大學(xué),2012.
[2] 劉智勇.基于云計算的文本挖掘算法研究[D].成都:電子科技大學(xué),2011.
[3] 范并思.社會科學(xué)信息分析中的文本挖掘[J].圖書情報工作,2012(08).
[4] 周雪忠,吳朝暉.文本知識發(fā)現(xiàn):基于信息抽取的文本挖掘[J].計算機(jī)科學(xué),2003(01).
[5] 鄭雙怡.文本挖掘及其在知識管理中的應(yīng)用[J].中南民族大學(xué)學(xué)報,2005(04).
[6] 韓客松,王永成.文本挖掘、數(shù)據(jù)挖掘和知識管理——二十一世紀(jì)的智能信息處理[J].情報學(xué)報,2001(01).