呂建強(qiáng)
摘要:垃圾郵件問題成為了困擾國內(nèi)外用戶的主要問題,隨著數(shù)量和形式不斷增加的網(wǎng)絡(luò)垃圾郵件,人們迫切地想要尋找能夠有效應(yīng)對的措施,而云計算的明顯存儲和處理優(yōu)勢能夠有效計算海量的郵件數(shù)據(jù),使得垃圾郵件的過濾性的得到顯著提升,因此,人們要在不斷地研究和改進(jìn)過程中注重云計算在反垃圾郵件系統(tǒng)中的運(yùn)用。
關(guān)鍵詞:云計算;反垃圾;郵件;系統(tǒng);數(shù)據(jù);過濾;存儲
電子郵件目前已廣泛普遍于人們的日常生活當(dāng)中,成為了大家相互交流所使用的主要交流方式,究其原因,不乏為它便捷、即時、價格低廉等優(yōu)勢極大地方便了人們之間的溝通交流,但是,隨著人們對電子郵件的越發(fā)依賴,以致另一個影響人們使用電子郵件的嚴(yán)重問題出現(xiàn),即垃圾郵件問題。人們在使用電子郵件進(jìn)行正常信息交流的過程不僅會嚴(yán)重受到垃圾郵件的干擾,使人們的精力和時間被大量的浪費(fèi),而且垃圾郵件還會對傳輸和存儲方面的資源大量占用,極大的浪費(fèi)了網(wǎng)絡(luò)資源。尤其是在中國,人們是受垃圾郵件所影響的主要受害國之一,當(dāng)然,人們也針對這個問題采取了不少的發(fā)垃圾郵件措施,但是相較于對無孔不入的垃圾郵件進(jìn)行過濾和處理,將會需要大量的人力物力來開展此項工作,黑白名單、貝葉斯算法以及在關(guān)鍵詞和規(guī)則的基礎(chǔ)上進(jìn)行過濾等這些技術(shù)都是目前所主要采用的反垃圾郵件產(chǎn)品。由于全網(wǎng)是垃圾郵件發(fā)送的基礎(chǔ),但是統(tǒng)一集中的對垃圾郵件進(jìn)行管理則是這些傳統(tǒng)的反垃圾郵件系統(tǒng)所無法實現(xiàn)的,除此之外,高昂的成本投入、其維護(hù)過程也存在著很多困難、建設(shè)重復(fù)、給服務(wù)器帶來過重的負(fù)擔(dān)等都是尚未解決且普遍存在的問題,所以說,對于這些嚴(yán)重威脅著人們使用電子郵件的大量垃圾郵件,人們很有必要通過對網(wǎng)絡(luò)資源整合對其進(jìn)行整體預(yù)防。
在人們探索反垃圾郵件系統(tǒng)的過程中,出現(xiàn)了使人們思路煥然一新的云計算,它的服務(wù)除了能夠?qū)崿F(xiàn)一體化和動態(tài)變化之外,還能夠?qū)崿F(xiàn)可擴(kuò)展化,云計算在一定程度上可以在識別和阻攔垃圾郵件的過程中將其進(jìn)行分類,然后在“云”端對需要存儲和過濾的郵件進(jìn)行處理。
1.什么是云計算
互聯(lián)網(wǎng)領(lǐng)域近幾年出現(xiàn)了一個備受大家關(guān)注的熱點(diǎn),那就是云計算,它主要是由“云”端來對通過服務(wù)器所接收的終端應(yīng)用“計算“來進(jìn)行處理,使得終端設(shè)備對于處理的需求降低。對于具體如何才能夠?qū)?yīng)用進(jìn)行實現(xiàn)的方式這種事情用戶并不在意,所以說提供商可以自行實現(xiàn)和維護(hù)應(yīng)用,再者,由于同一個應(yīng)用可以通過互聯(lián)網(wǎng)提供給多個用戶使用,客戶之間也可以通過在這種情況下對資源進(jìn)行共享,由此便可以在利用處理器和存儲設(shè)備方面的效率得以顯著提升,重復(fù)建設(shè)這種情況在用戶使用信息系統(tǒng)的過程中也可以有效規(guī)避,由此可見,云計算在規(guī)模方面具有較強(qiáng)的經(jīng)濟(jì)性。就目前的云計算而言,SAAS(軟件即服務(wù))、Platform as a service(平臺即服務(wù))、U-tility Computing(實用計算)這三種是其主要的應(yīng)用形式。云計算是進(jìn)化和延續(xù)網(wǎng)格計算的最新最熱計算方法,云計算除了具有以上所說的共享資源型和費(fèi)用廉價等特點(diǎn)之外,它還能夠?qū)⒂嬎闼俣扔行У拇蠓忍岣?,換言之,處理大規(guī)模的數(shù)據(jù)僅需要將這種技術(shù)應(yīng)用至云平臺上便可以高速實現(xiàn)。可以說,云計算不僅將計算的共享資源特性充分的利用到了數(shù)據(jù)處理當(dāng)中,還使網(wǎng)絡(luò)計算的優(yōu)勢得到了充分的發(fā)揮。因此,具有強(qiáng)大計算功能的云計算應(yīng)用到反垃圾郵件系統(tǒng)中時,要不斷地改進(jìn)云計算的郵件處理技術(shù),不僅要在處理時間方面使其盡可能地降低,還要確保其攔截質(zhì)量的高效性。
2.運(yùn)用云計算實現(xiàn)郵反垃圾郵件系統(tǒng)的可行性研究
將從客戶端代理處所接收的郵件通過網(wǎng)絡(luò)反垃圾郵件服務(wù)分析處理后的結(jié)果報告?zhèn)鬏斀o客戶端的過程,我們將其稱之為反垃圾郵件系統(tǒng)。
2.1反垃圾郵件在目前最主要使用的過濾技術(shù)方法
以規(guī)則為基礎(chǔ)的方法。這是指對電子郵件的報頭信息進(jìn)行處理之前要以用戶的自定義規(guī)則為基礎(chǔ)而進(jìn)行過濾,這種方法的過濾規(guī)則是由用戶定義而得的,所以說靈活性也就能夠最大限度地通過這種方法體現(xiàn)出來,但是這種方法的操作并不簡易,也就是說它的操作相對復(fù)雜,使得用戶的質(zhì)量要求在相同的時間內(nèi)是相對較高的。使人們在判斷過程中能夠促使人類思維得以簡化的實現(xiàn)就是規(guī)則的學(xué)習(xí)過程,以樣本提出規(guī)律為依據(jù)總結(jié)規(guī)律和大部分常識的過程中就能夠?qū)?yán)密規(guī)則逐步總結(jié)出來,而能否準(zhǔn)確判定結(jié)果決定性因素就是規(guī)則是否合理。再者,這種規(guī)則最大的優(yōu)勢就是可以將人類對規(guī)則的理解過程模擬出來,需要注意的是,并不是很容易地就能夠做到對精確規(guī)則的尋求,其應(yīng)用效果只有在鮮明規(guī)律性的時候才能夠得以顯著展現(xiàn)。
黑白名單方法。一般來說,合法的電子郵件是通過白名單當(dāng)中的發(fā)送者發(fā)送的,而垃圾郵件則是通過黑名單中發(fā)送者所發(fā)出的。目前在E-mail和短信當(dāng)中使用最廣泛的過濾任務(wù)技術(shù)之一就是這種簡單的技術(shù)。但是對于這種需要對黑名單和白名單開發(fā)和維護(hù)的過濾技術(shù)仍然存在著一定的紕漏,比如說,由于其名單的制定是需要通過公信力和權(quán)威性較高的組織來提供,用戶再根據(jù)這些名單來自己確定是否要往黑名單的垃圾郵件服務(wù)器中添加或者是根據(jù)自身需要對黑名單和白名單進(jìn)行自定義維護(hù),但是由于不斷變化的垃圾郵件發(fā)送者,使得無法確定其發(fā)送人員所使用的郵箱地址,致使局限性和滯后性是黑白名單技術(shù)尚未解決的一大難題。
統(tǒng)計的方法。分析統(tǒng)計已知郵件信息的方法我們稱之為統(tǒng)計法,這種方法與文本分類技術(shù)相類似,也就是說,其郵件的歸類可以通過已知郵件的信息來實現(xiàn)的。目前對于垃圾郵件的及時發(fā)現(xiàn)和有效解決辦法的這種目的的實現(xiàn)是我國很多大型電子郵件系統(tǒng)還無法做到的,致使垃圾郵件不斷騷擾用戶的情況始終得不到有效的抑制,對于這種需要浪費(fèi)大量精力和時間去解決的工作,不僅無法將服務(wù)器空間和網(wǎng)絡(luò)寬帶被占用的情況有效緩解,還致使網(wǎng)絡(luò)埋下了安全隱患。很多國外的發(fā)送者也正是利用這個漏洞經(jīng)常將垃圾郵件發(fā)送至國內(nèi)的郵件服務(wù)器上,從而導(dǎo)致很多互聯(lián)網(wǎng)服務(wù)商在應(yīng)對這種情況的過程中不僅無法取得顯著成效,反而為自己帶來用戶損失以及其他相關(guān)損失。
由此可見,目前我國在針對垃圾郵件的應(yīng)對策略方面仍然沒有取得顯著成效,而對垃圾郵件進(jìn)行過濾處理又是當(dāng)前十分緊迫、亟待解決的重要任務(wù),所以說,全球化、高效率、高可靠識別性的反垃圾郵件系統(tǒng)是當(dāng)前人們迫切需求的重要應(yīng)用。
2.2垃圾郵件的發(fā)送過程特點(diǎn)
發(fā)送方的IP不固定。垃圾郵件被發(fā)送時的IP可以由發(fā)送用戶登錄到互聯(lián)網(wǎng)動態(tài)的獲取,也就是說,傳播垃圾郵件的過程由于動態(tài)IP的存在而獲得了一個天然的隱蔽條件,這也就無形當(dāng)中為垃圾郵件的防止工作增添了難度。
發(fā)件人和收件人是不固定的地址。簡單郵件傳輸協(xié)議(SMTP)服務(wù)器在郵件發(fā)送者是否合法的查詢方面還存在缺陷,很容易被郵件收件人隨機(jī)生成的地址所欺騙,進(jìn)而無法對傳輸代理的大部分郵件進(jìn)行判別。
由于隨機(jī)變化的信頭內(nèi)容使得偽造郵件標(biāo)題成為一件非常容易操作的事情。就簡單郵件傳輸協(xié)議(SMTP)的安全方面而言,其安全并不可靠,由于電子郵件的發(fā)送者在很多情況下系統(tǒng)都無法通過郵件服務(wù)器查詢出來,導(dǎo)致無法對垃圾郵件的來源進(jìn)行準(zhǔn)確跟蹤查詢,進(jìn)而也就為簡單郵件傳輸協(xié)議(SMTP)埋下了安全隱患。
3.云計算在反垃圾郵件系統(tǒng)中的應(yīng)用
3.1云計算反垃圾郵件系統(tǒng)設(shè)計
就郵件接收者而言,通過反垃圾郵件系統(tǒng)而能夠最終獲益的受益者就是郵件接收者,郵件的接收者并不僅僅是指最終接收郵件的用戶,還指中間對郵件接收進(jìn)而轉(zhuǎn)發(fā)的服務(wù)器,客戶端代理會接收到通過轉(zhuǎn)發(fā)服務(wù)器所轉(zhuǎn)交的郵件,安全模式和警告模式使郵件接收者最常使用的兩種與客戶端代理進(jìn)行交互的方式。垃圾郵件一般會在安全模式下被劃分為用戶不允許對其進(jìn)行訪問的郵件,而警告模式下的垃圾郵件則是指用戶可以在收到警告框的情況下自行對郵件進(jìn)行選擇是否訪問。
就客戶端代理而言,它就是一個輕量級的代理,它主要是在各個終端系統(tǒng)上運(yùn)行,將郵件從接收者那里接收并在對郵件唯一摘要生成之前先預(yù)處理郵件,之后在通過云端對郵件進(jìn)行分析,云端也會將生成的結(jié)果報告?zhèn)鬏敾乜蛻舳舜?,所以說,不僅僅是在此平臺可以運(yùn)行客戶端代理,而是在多個平臺上都可以運(yùn)行客戶端代理。在此需要注意的是,為了避免由于安全隱患而造成客戶隱私泄露,所以在網(wǎng)絡(luò)傳遞過程中盡量不要在電子郵件內(nèi)容中使用明白,而可以針對該封郵件而生成一個摘要來進(jìn)行傳遞。所以說,為了能夠為郵件生成可以作為唯一標(biāo)識的一個摘要,郵件摘要生成器就是客戶端代理的核心部件,雖然說有很多方法都能夠生成郵件摘要,但是Nilsimsa摘要生成算法是目前最為流行普遍的摘要生成方法。
3.2反垃圾郵件云服務(wù)
郵件通過互聯(lián)網(wǎng)中不同客戶端代理所上傳的都可以被反垃圾郵件云服務(wù)進(jìn)行接收。首先是由數(shù)據(jù)庫對上傳的垃圾郵件通過服務(wù)器進(jìn)行查看,垃圾郵件數(shù)據(jù)庫可以通過查看是否存在這個郵件來對其是否是垃圾郵件進(jìn)行判定。其次,對于垃圾郵件數(shù)據(jù)庫中沒有的郵件,可以通過信譽(yù)數(shù)據(jù)庫來對發(fā)件人進(jìn)行查看,進(jìn)而對郵件是否屬于垃圾郵件進(jìn)行判定,一般的判定依據(jù)是根據(jù)信譽(yù)數(shù)據(jù)庫中發(fā)送者的IP是否存在,并且將發(fā)送者的信譽(yù)分?jǐn)?shù)與系統(tǒng)所設(shè)定的信譽(yù)分?jǐn)?shù)做對比,如果說系統(tǒng)設(shè)定分?jǐn)?shù)高于發(fā)送者的信譽(yù)分?jǐn)?shù),那么就可以將該發(fā)送者發(fā)送的郵件判定為垃圾郵件。除此之外,由于反垃圾郵件服務(wù)器群可以通過過濾器對不同垃圾郵件進(jìn)行分析整合,進(jìn)而對郵件是否屬于垃圾郵件的判定得出一個結(jié)果報告,客戶端代理也能夠接收這個郵件及相關(guān)分析內(nèi)容。而用戶的錯判和漏判報告的接收以及統(tǒng)計分析相關(guān)內(nèi)容的服務(wù)工作則是通過云端網(wǎng)絡(luò)來實現(xiàn),信譽(yù)數(shù)據(jù)庫中發(fā)件人的信息以及垃圾郵件數(shù)據(jù)庫中相關(guān)的反垃圾郵件過濾參數(shù)都可以通過云端進(jìn)行修改。
4.結(jié)束語
隨著網(wǎng)絡(luò)信息化的發(fā)展,廣大郵件用戶對郵件的安全問題也越來越重視,云計算的出現(xiàn)以及其處理大規(guī)模文本的顯著優(yōu)勢彌補(bǔ)了反垃圾郵件系統(tǒng)中存在的缺陷,它不僅使綜合管理反垃圾郵件成為了現(xiàn)實,還有效解決了重復(fù)建設(shè)、維護(hù)困難、過濾垃圾郵件效率低等問題,反垃圾郵件技術(shù)也會通過高速發(fā)展的云計算技術(shù)而得到顯著提升。