?
基于垃圾郵件檢測(cè)及過(guò)濾技術(shù)的研究
鄔江
廣州工商學(xué)院510850
[摘要]針對(duì)當(dāng)前互聯(lián)網(wǎng)上垃圾郵件,分析了其危害性及相關(guān)的處理技術(shù)。詳細(xì)描述了目前垃圾郵件的處理方法,并分析了每種處理技術(shù)的缺陷。最后得出垃圾郵件處理要采用多種方法,綜合治理的結(jié)論。
[關(guān)鍵詞]垃圾郵件;過(guò)濾;基于特征;基于內(nèi)容
網(wǎng)絡(luò)時(shí)代的發(fā)展,給人們的生活帶來(lái)極大的便利,作為現(xiàn)在網(wǎng)絡(luò)在人們生活中的最廣泛的應(yīng)用之一,電子郵件(E-mail)以其安全可靠,快速廉價(jià)的優(yōu)勢(shì)逐漸取代傳統(tǒng)的郵件形式,成為獲取網(wǎng)絡(luò)信息,溝通交流的重要渠道。但是,在正常使用的郵件的同時(shí),幾乎每個(gè)人都接收過(guò)各種各樣的商業(yè)廣告、非法宣傳甚至反動(dòng)信息,這給社會(huì)和個(gè)人都帶來(lái)極大的危害。因此,如何將這些垃圾郵件在互聯(lián)網(wǎng)上盡可能的減少,成了學(xué)術(shù)界研究的課題。
按照中國(guó)電信《中國(guó)電信對(duì)邊圾郵件處理暫行辦法》的定義,垃圾郵件是指向未主動(dòng)請(qǐng)求的用戶發(fā)送的電子郵件廣告、刊物或其他資料;有明確的退信方法、發(fā)信人、回信地址等的郵件;利用網(wǎng)絡(luò)從事違反其他網(wǎng)絡(luò)服務(wù)供應(yīng)商的安全策略或服務(wù)條款的行為和其他預(yù)計(jì)會(huì)導(dǎo)致投訴的郵件。
垃圾郵件的危害很大,主要表現(xiàn)在以下幾個(gè)方面:1、垃圾郵件的泛濫對(duì)計(jì)算機(jī)存儲(chǔ)資源及網(wǎng)絡(luò)帶寬都造成極大的浪費(fèi),有可能危害到正常的互聯(lián)網(wǎng)使用。2、垃圾郵件作為病毒傳播、非法商業(yè)宣傳、不良信息等的主要傳播載體對(duì)社會(huì)及個(gè)人產(chǎn)生極大的安全隱患。由于垃圾郵件具有強(qiáng)制接收、反復(fù)復(fù)制發(fā)送、地址欺騙及快速傳播等特點(diǎn),嚴(yán)重干擾了互聯(lián)網(wǎng)正常秩序及個(gè)人的正常生活,少數(shù)別有用心的人,將垃圾郵件作為一個(gè)宣傳陣地,對(duì)社會(huì)穩(wěn)定帶來(lái)極大的威脅。
隨著互聯(lián)網(wǎng)的普及,越來(lái)越多的人在使用電子郵件,這也使得垃圾郵件的危害覆蓋面更廣。有研究表明,中國(guó)是世界上除了美國(guó)外垃圾郵件產(chǎn)生和接收最多的國(guó)家,形式迫使我們要對(duì)垃圾郵件進(jìn)行圍剿。
目前互聯(lián)網(wǎng)上針對(duì)垃圾郵件的過(guò)濾所采取的主要措施有:郵件收發(fā)服務(wù)器端及客戶端的過(guò)濾、白名單及黑名單的過(guò)濾、基于郵件特征的過(guò)濾、基于內(nèi)容的郵件過(guò)濾。
郵件收發(fā)服務(wù)器端及客戶端的過(guò)濾:用戶的郵件收發(fā)的過(guò)程是:首先客戶端經(jīng)郵件用戶代理(MUA,Mail User Agent)把報(bào)文送至服務(wù)器臨時(shí)存儲(chǔ)系統(tǒng),并與服務(wù)器郵件傳輸代理(MTA,Mail Transfer Agent)建立連接,然后使用SMTP命令將報(bào)文傳送過(guò)去(MTA過(guò)濾),郵件投遞代理(MDA,Mail Delivery Agent)從MTA取得信件傳送至最終服務(wù)器信箱(MDA過(guò)濾),最后MUA定期檢查服務(wù)器信箱,并通知用戶下載(MDA過(guò)濾)。
但是無(wú)論是客戶端的過(guò)濾,還是服務(wù)器端的過(guò)濾,都需要對(duì)郵件的各部分結(jié)構(gòu)進(jìn)行分析,才能得出是否垃圾郵件。
白名單及黑名單過(guò)濾也是目前常用的一種垃圾郵件過(guò)濾方式。白名單中的地址所發(fā)的郵件,用戶都認(rèn)為是合法的郵件。用戶可以根據(jù)需要來(lái)設(shè)置自己的白名單,這樣可以防止有效郵件被誤殺。黑名單則是最簡(jiǎn)單有效的垃圾郵件過(guò)濾技術(shù),用戶將黑名單地址所發(fā)的所有郵件認(rèn)為是垃圾郵件不予接受。黑名單主要是對(duì)過(guò)郵件地址、所發(fā)送的服務(wù)器(IP)等相關(guān)信息進(jìn)行識(shí)別。
黑名單技術(shù)和白名單技術(shù)在實(shí)際使用過(guò)程中,存在著諸多技術(shù)上的缺陷。比如在實(shí)時(shí)黑名單中的查詢中存在著較大的時(shí)間延遲問(wèn)題,垃圾郵件及代理服務(wù)器ip地址欺騙等問(wèn)題。使得過(guò)濾規(guī)則需要經(jīng)常做出調(diào)整,既耗費(fèi)大量時(shí)間,實(shí)際過(guò)濾效果又不足以令人滿意,在使用中逐漸不能滿足過(guò)濾要求.
基于郵件特征的垃圾郵件過(guò)濾:垃圾郵件在發(fā)送的過(guò)程中,為了防止互聯(lián)網(wǎng)的抵制,往往在發(fā)送過(guò)程中會(huì)采取相應(yīng)的措施。而基于郵件特征垃圾郵件的過(guò)濾技術(shù)就是利用垃圾郵件的反制特征進(jìn)行過(guò)濾。垃圾郵件在發(fā)送的過(guò)程中,往往會(huì)利用偽造地址,即在經(jīng)過(guò)中間服務(wù)器時(shí),修改其地址信息。我們可以分析其接收和發(fā)送地址及簽名來(lái)分辨是否垃圾郵件。
垃圾郵件為了其宣傳效果最佳及利益最大化,往往會(huì)采取群發(fā)技術(shù)。通過(guò)監(jiān)測(cè)是否大量的群發(fā)郵件可以進(jìn)行垃圾郵件的過(guò)濾。如果一個(gè)郵件服務(wù)器在短時(shí)間內(nèi)收到大量相同發(fā)件人的郵件,或者同一郵件服務(wù)器在短時(shí)間內(nèi)收到內(nèi)容相同的郵件,則基于特征的垃圾郵件過(guò)濾就會(huì)啟動(dòng)。
在基于特征的垃圾郵件過(guò)濾中,對(duì)關(guān)鍵詞的匹配是技術(shù)簡(jiǎn)單且可行性比較高的一種方式。在郵件傳送過(guò)程中,可對(duì)主題及正文內(nèi)容進(jìn)行掃描,如果出現(xiàn)大量具有垃圾郵件特征的關(guān)鍵詞時(shí),如賺錢、免費(fèi)、淫蕩等等,則判定其為垃圾郵件采取過(guò)濾。
基于郵件特征的垃圾郵件過(guò)濾,由于其技術(shù)相對(duì)簡(jiǎn)單,且行之有效,在實(shí)際應(yīng)用中使用較多,但是這種過(guò)濾技術(shù)有時(shí)可能會(huì)造成誤殺。
基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)。以上所有的垃圾郵件的過(guò)濾方法都有其缺陷,再加上垃圾郵件發(fā)送者也在不斷偽裝和變更發(fā)送技術(shù),給垃圾郵件的過(guò)濾造成了不少困難。于是基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)便產(chǎn)生了,通過(guò)對(duì)垃圾郵件的內(nèi)容進(jìn)行分類,從而檢查出垃圾郵件。此技術(shù)是將信息過(guò)濾及文本分類相結(jié)合,來(lái)實(shí)現(xiàn)垃圾郵件的檢測(cè)及過(guò)濾效果。其突出特點(diǎn)在于能跟蹤垃圾郵件特征變化,并且可以自動(dòng)獲得垃圾郵件的特征,從而可以大提高垃圾郵件的過(guò)濾效果。
綜合以上種種情況,垃圾郵件處理是個(gè)長(zhǎng)期的過(guò)程,在過(guò)濾技術(shù)上采取單一的過(guò)濾技術(shù)效果往往不好,而且可能造成誤殺的情況。所以垃圾郵件的處理應(yīng)該采取多種過(guò)濾技術(shù)相結(jié)合的情況進(jìn)行處理,這樣才能達(dá)到好的處理效果。
參考文獻(xiàn)
[1]中國(guó)電信出臺(tái)對(duì)垃圾郵件處理的暫行辦法規(guī)范[EB/OL].http://www. people.com.cn/GB/paper39/1320/204610.html.
[2]潘文鋒基于內(nèi)容的垃圾郵件過(guò)濾研究.北京:中國(guó)科學(xué)院計(jì)算技術(shù)研究所,2004.
[3]王波,黃迪明.遺傳神經(jīng)網(wǎng)絡(luò)在郵件過(guò)濾器中的應(yīng)用電子科技大學(xué)學(xué)報(bào),2005.
[4]譚營(yíng),朱元春.反垃圾電子郵件方法研究進(jìn)展智能系統(tǒng)學(xué)報(bào),2010.