亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于免疫多Agent的垃圾郵件過(guò)濾模型研究

        2016-05-30 03:09:30蔣亞平
        現(xiàn)代計(jì)算機(jī) 2016年10期
        關(guān)鍵詞:垃圾郵件

        蔣亞平,梅 驍

        (鄭州輕工業(yè)學(xué)院計(jì)算機(jī)與通信工程學(xué)院,鄭州 450000)

        ?

        基于免疫多Agent的垃圾郵件過(guò)濾模型研究

        蔣亞平,梅驍

        (鄭州輕工業(yè)學(xué)院計(jì)算機(jī)與通信工程學(xué)院,鄭州450000)

        摘要:針對(duì)傳統(tǒng)的垃圾郵件過(guò)濾方法有效識(shí)別未知特征以及變異特征的能力不強(qiáng),借鑒生物免疫系統(tǒng)基本原理和多Agent技術(shù),提出一種基于免疫多Agent垃圾郵件過(guò)濾模型。該模型實(shí)現(xiàn)各個(gè)Agent的信息交互,增強(qiáng)整個(gè)模型“記憶”機(jī)制,有效地提取垃圾郵件的信息和變異特征。垃圾郵件實(shí)驗(yàn)仿真結(jié)果表明,該模型與其它模型相比具有更好的性能,有效地提高垃圾郵件模型的正確率等特性,降低虛報(bào)率。

        關(guān)鍵詞:人工免疫;垃圾郵件;抗原提呈;多Agent

        1 多Agent技術(shù)介紹

        垃圾郵件中存在的信息一般具有不易被發(fā)現(xiàn)、變異能力強(qiáng)等特點(diǎn)?,F(xiàn)有的垃圾郵件過(guò)濾方法,如支持向量機(jī)(SVM)[1]、樸素貝葉斯(Naive Bayesian)、k鄰近算法(k-Nearest Neighbour)[2]等文本分類方法,可有效地實(shí)現(xiàn)了垃圾郵件的檢測(cè)和過(guò)濾功能,但對(duì)于郵件中變異的特征或新出現(xiàn)的特征則往往不能及時(shí)發(fā)現(xiàn)與提取郵件特征,信息交互不及時(shí)。近年來(lái),人工免疫系統(tǒng)AIS (Artificial Immune System)[3]以生物免疫系統(tǒng)為原型進(jìn)行模擬已被成功運(yùn)用,采用人工免疫技術(shù)構(gòu)造效率高,信息交互性強(qiáng)的反垃圾郵件模型也逐漸成為研究的熱點(diǎn)。

        對(duì)于單一的郵件服務(wù)器收轉(zhuǎn)發(fā)節(jié)點(diǎn),發(fā)現(xiàn)新型垃圾郵件特征信息對(duì)整個(gè)郵件系統(tǒng)并不明顯,且隨著應(yīng)用的不斷增加,網(wǎng)絡(luò)終端的負(fù)載日益加重,垃圾郵件的數(shù)量越來(lái)越多。為解決終斷服務(wù)器負(fù)載較大,特征不能提取或提取時(shí)延較長(zhǎng)等問(wèn)題,可將多Agent技術(shù)應(yīng)用于垃圾郵件過(guò)濾模型。在模型中將郵件過(guò)濾模型中不同的單個(gè)聯(lián)網(wǎng)轉(zhuǎn)發(fā)節(jié)點(diǎn)看作不同的進(jìn)程Agent,每個(gè)A-gent都具有提取垃圾郵件特征的能力,并且能單獨(dú)完成各自的任務(wù),將所有Agent組合起來(lái)便能組成一個(gè)多Agent系統(tǒng)。這既能夠?qū)蝹€(gè)Agent進(jìn)行相對(duì)獨(dú)立的檢測(cè),又可以互相交流信息,學(xué)習(xí)積累郵件特征信息,實(shí)現(xiàn)復(fù)雜環(huán)境下的問(wèn)題求解。

        2 免疫多Agent過(guò)濾模型設(shè)計(jì)

        免疫多Agent十分類似于人體免疫系統(tǒng)的免疫細(xì)胞,能夠?qū)Σ煌h(huán)境的刺激產(chǎn)生各種不同應(yīng)答,不同類型的免疫Agent相當(dāng)于不同抗體針對(duì)于不同的抗原,這種免疫多Agent對(duì)于實(shí)現(xiàn)復(fù)雜系統(tǒng)的分布式問(wèn)題求解具有很強(qiáng)的啟發(fā)性,它具有自主性、應(yīng)激性、高效率的認(rèn)知性、較強(qiáng)的學(xué)習(xí)和記憶能力、防御性等免疫特征[4]。經(jīng)過(guò)分析免疫細(xì)胞和Agent之間、人工免疫系統(tǒng)和郵件過(guò)濾模型之間在性質(zhì)和行為上的相似性,建立了具有不同功能的免疫Agent組成具有垃圾郵件過(guò)濾模型,如圖1所示。

        我們定義自體為合法郵件集合(Self),非自體為垃圾郵件集合(Nonself)??乖ˋg)定義為自體和非自體的并集(Ag=Self∪Nonself)。郵件集合為P,p為P的子集,定義正常郵件集合H,H∈P;垃圾郵件集合S,S∈P,滿足:H∩S=?,H∪S=P。

        在免疫Agent中,根據(jù)免疫系統(tǒng)中抗體對(duì)抗原的記憶、防御和耐受以及抗體之間相互作用機(jī)制,實(shí)現(xiàn)自垃圾郵件的過(guò)濾和學(xué)習(xí)記憶。

        圖1 免疫多Agent垃圾郵件過(guò)濾模型

        檢測(cè)模型中,設(shè)計(jì)了執(zhí)行層Agent、檢測(cè)層Agent、通信層Agent、和決策層Agent[5]。采用免疫多Agent結(jié)構(gòu),分別完成垃圾郵件模型的檢測(cè)、通信、執(zhí)行和決策等任務(wù)將不同的檢測(cè)Agent聯(lián)合起來(lái)。

        執(zhí)行層Agent:是指在服務(wù)器中正在發(fā)送或接收郵件狀態(tài)的Agent模塊。歸類郵件信息,并實(shí)時(shí)與執(zhí)行Agent和通信Agent保持通信。

        檢測(cè)層Agent:檢測(cè)層Agent在網(wǎng)絡(luò)服務(wù)器各個(gè)節(jié)點(diǎn)之間監(jiān)視檢測(cè),并與特定的設(shè)備通信。在模型中,用戶層尋找異常用戶行為模式;監(jiān)視并檢測(cè)郵件的大小、數(shù)目以及所屬的類型、源地址與目的地址,信封郵件主要內(nèi)容等。若可疑,則上報(bào)給通信Agent,請(qǐng)求其作出決策。

        通信層Agent:通信Agent充當(dāng)其他Agent模塊的通信網(wǎng)絡(luò)的任務(wù)。

        決策層Agent:接收來(lái)自各個(gè)免疫檢測(cè)Agent的模塊檢測(cè)結(jié)果,對(duì)是否為垃圾郵件或異常異常郵件結(jié)果做出判定。模塊圖如圖2。

        圖2 免疫多Agent模塊

        如果在檢測(cè)過(guò)程中,檢測(cè)群中Agent檢測(cè)到可疑的垃圾郵件抗原,則上報(bào)給通信Agent模塊。若通信Agent確定其包含垃圾郵件信息特征的抗原D,則從正在執(zhí)行Agent中選取若干個(gè)Agent,將D所包含的信息共享給這些進(jìn)程Agent并進(jìn)行特征提取。當(dāng)不同Agent接收到提取特征的信息指令后,從檢測(cè)器中選取能與抗原D匹配的種群并進(jìn)行特征提取。

        要實(shí)現(xiàn)垃圾郵件過(guò)濾,需將待測(cè)郵件數(shù)據(jù)特征轉(zhuǎn)變成計(jì)算機(jī)可識(shí)別的語(yǔ)言,再經(jīng)過(guò)一定模式的過(guò)濾,實(shí)現(xiàn)郵件分類。在郵件樣本中,數(shù)據(jù)經(jīng)過(guò)抗原提呈,形成抗原集合,由特定長(zhǎng)度的抗原提呈基因庫(kù)對(duì)郵件進(jìn)行特征提取,從而得到郵件的特征,即抗原決定基因,存儲(chǔ)在郵件特征向量中。

        抗原提呈基因定義為從郵件子集中提取的IM (Information Feature of Mail)[6]。定義長(zhǎng)度為l的抗原提呈基因集合ag-l為:

        其中:函數(shù)fe執(zhí)行從郵件中提取IM的操作,l為提取的IM的長(zhǎng)度,單位為bit,H'、S'為合法郵件和垃圾郵件的子集。即提取郵件子集中的所有長(zhǎng)度為l的、不重復(fù)的IM,并將其添加到抗原提呈基因集合ag-l中。

        定義郵件(抗原)特征集合為F:

        其中:xi(i=1,…,n)為抗原提呈基因庫(kù)中的基因; ag-li為提取到的郵件p∈P的特征信息;n代表郵件特征向量的維數(shù),與抗原提呈基因庫(kù)大小相等;l為抗原提呈基因庫(kù)ag-l中基因片段的大??;函數(shù)fc(p,ag-l,l)為特征信息提取操作,如式(6),即從p∈P郵件類型中提取長(zhǎng)度為l的IM字符串,然后計(jì)算IM是否在對(duì)應(yīng)的抗原提呈基因庫(kù)中出現(xiàn),獲取郵件的特征信息。函數(shù)fe(p,j,l)表示從郵件中提取長(zhǎng)度為l的IM。用特定的抗原提呈基因庫(kù)對(duì)郵件進(jìn)行特征提取,從而組成了郵件特征向量,公式如下:

        經(jīng)抗原提呈后,在模型記憶庫(kù)中到的郵件特征是一個(gè)長(zhǎng)度與基因庫(kù)大小相同的計(jì)算機(jī)可識(shí)別的二進(jìn)制串,這樣就完成了程序的抗原提呈的過(guò)程。滿足條件的抗原對(duì)其進(jìn)行提呈,符合條的加入到自體庫(kù)中,否則加入到非自體庫(kù)中,從而保證了選擇的特件征向量對(duì)郵件內(nèi)容的代表意義。

        3 仿真實(shí)驗(yàn)

        測(cè)試環(huán)境為:內(nèi)存8GB,操作系統(tǒng)為Windows 7。在模型的郵件傳輸中,因?yàn)镴AMES(Java Apache Mail Enterprise Server)性能較為穩(wěn)定,可配置性強(qiáng),選用JAMES開(kāi)源郵件服務(wù)器。在測(cè)試中使用CCERT中文郵件2006年7月份的樣本集,其中包含正常郵件(Ham)9308封,垃圾郵件(Spam)20042封,數(shù)值實(shí)驗(yàn)環(huán)境為MATLAB 2014a。

        將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,選擇3062封郵件(1024封正常郵件和2038垃圾郵件樣本)作為訓(xùn)練集。實(shí)驗(yàn)起始階段選取自體集合大小為50,每次訓(xùn)練生成10個(gè)未成熟檢測(cè)器。郵件過(guò)濾模型每次輸入200個(gè)抗原,其中自體與非自體比例為8:2,即郵件過(guò)濾模型所發(fā)的10個(gè)包中有2個(gè)非自體包,得到初始檢測(cè)樣本,保存在免疫記憶庫(kù)中。然后將剩余的8000封正常郵件和18000封垃圾郵件平均分為10組,組成測(cè)試集進(jìn)行測(cè)試。

        4 實(shí)驗(yàn)結(jié)果分析

        實(shí)驗(yàn)結(jié)果取10次的平均值作為評(píng)判該模型的最后實(shí)驗(yàn)數(shù)據(jù),計(jì)算出來(lái)的平均值即為模型的效率結(jié)果。

        該垃圾郵件過(guò)濾模型主要的評(píng)價(jià)標(biāo)準(zhǔn):(1)召回率:即垃圾郵件檢出率;(2)正確率:反映過(guò)濾模型檢測(cè)出垃圾郵件的能力;(3)精確率:模型對(duì)所有郵件的判斷正確的概率;(4)虛報(bào)率:模型系統(tǒng)將正常郵件錯(cuò)誤地判斷為垃圾郵件的概率。該模型統(tǒng)計(jì)數(shù)據(jù)主要為正確率、精確率、召回率、虛報(bào)率四個(gè)指標(biāo),橫坐標(biāo)(X軸)為實(shí)驗(yàn)次數(shù),縱坐標(biāo)為(Y軸)百分比指標(biāo)值。如圖3所示:

        圖3 郵件過(guò)濾指標(biāo)曲線圖

        從圖3中可以看出,該模型的正確率比較穩(wěn)定,正確率呈先呈上升趨勢(shì),后部分基本保持穩(wěn)定,正確率都能達(dá)到90%以上,說(shuō)明該模型可以很好地判別出垃圾郵件,穩(wěn)定性較高;精準(zhǔn)率在檢測(cè)過(guò)程亦呈上升趨勢(shì),說(shuō)明隨著模型中抗體的自我學(xué)習(xí),模型能夠正確判斷垃圾郵件與合法郵件的能力在上升;在召回率方面,當(dāng)郵件出現(xiàn)新的信息特征時(shí),模型具有較好的學(xué)習(xí)和記憶識(shí)別能力,對(duì)于判斷垃圾郵件的能力有所提升;虛報(bào)率比較低較穩(wěn)定,在這種情況下,由于具有多Agent機(jī)制及免疫記憶庫(kù),信息之間可以及時(shí)交互,郵件很少被誤刪,該模型具有較高的可靠性。

        5 結(jié)語(yǔ)

        本文給出了基于免疫多Agent的垃圾郵件過(guò)濾模型并利用MATLAB實(shí)現(xiàn)了該過(guò)濾模型的仿真實(shí)驗(yàn),該模型實(shí)現(xiàn)各個(gè)Agent的信息交互,并有效的提取垃圾郵件的信息和變異特征。該模型具有較高的召回率和準(zhǔn)確率,并且在性能上具有一定的提升,如何再進(jìn)一步的提升模型的效率,是以后研究的重點(diǎn)方向。

        參考文獻(xiàn):

        [1]Clark,J.;Koprinska,I.;Poon,J. A Neural Network Based Approach to Automated E-Mail Classification[C]. Web Intelligence:Proceedings of the 2003 IEEE/WICInternational Conference on Web Intelligence. 2003:13-17.

        [2]Qing J J,Mao R L,Bie R F,et al. An AIS-Based E-mail Classification Method[C]. The 2009 International Conference on Intelligent Computing,Ulsan,Korea,2009:492-499.

        [3]李濤.基于免疫的網(wǎng)絡(luò)監(jiān)控模型[J].計(jì)算機(jī)學(xué)報(bào),2006,29(9):1515-1522.

        [4]梁剛,劉曉潔,李濤,蔣亞平,楊進(jìn),龔勛. NSC:一種新型的垃圾郵件過(guò)濾器[J].小型微型計(jì)算機(jī)系統(tǒng),2008,29(1):158-161.

        [5]秦逸.基于行為的垃圾郵件檢測(cè)技術(shù)[J].計(jì)算機(jī)科學(xué),2012,39(11):86-89.

        [6]劉海韜,陽(yáng)潔.云計(jì)算平臺(tái)下一種新型反垃圾郵件系統(tǒng)的研究[J].中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,44(5):1869-1874.

        梅驍(1990-)男,河南南陽(yáng)人,碩士研究生,研究方向?yàn)樾畔踩?/p>

        A Spam Filtering Model of Immune Based on Multi-Agent

        JIANG Ya-ping,MEI Xiao
        (College of Computer and Communication Engineering,Zhengzhou Institute of Light Industry,Zhengzhou 450000)

        Abstract:According to the traditional spam filtering method effectively identify unknown characteristics and variability of the ability is not strong,according to the basic principle of biological immune system and multi agent technology proposed based on immune multi-agent spam filtering model. The model can realize the information exchange of each Agent,enhance the whole model "memory" mechanism,and effectively extract the information and variation characteristics of spam. Spam experimental simulation results show that the model and other models compared has better performance,can effectively improve the correct rate of spam model characteristics and reduce the false alarm rate.

        Keywords:Artificial Immune; Spam; Antigen Presentation; Multi-Agent

        收稿日期:2016-01-15修稿日期:2016-02-26

        作者簡(jiǎn)介:蔣亞平(1970-)男,河南永城人,博士副教授,碩士研究生導(dǎo)師,研究方向?yàn)榫W(wǎng)絡(luò)技術(shù)、信息安全

        文章編號(hào):1007-1423(2016)10-0017-04

        DOI:10.3969/j.issn.1007-1423.2016.10.004

        猜你喜歡
        垃圾郵件
        從“scientist(科學(xué)家)”到“spam(垃圾郵件)”,英語(yǔ)單詞的起源出人意料地有趣 精讀
        一種基于SMOTE和隨機(jī)森林的垃圾郵件檢測(cè)算法
        垃圾郵件會(huì)在2020年消失嗎
        剖析垃圾郵件程序
        基于支持向量機(jī)與人工免疫系統(tǒng)的垃圾郵件過(guò)濾模型
        卡巴斯基發(fā)布第三季度垃圾郵件和釣魚(yú)攻擊報(bào)告
        如何杜絕垃圾郵件的“入侵”
        石器部落
        基于貝葉斯算法的垃圾郵件過(guò)濾器的模擬實(shí)現(xiàn)
        東方國(guó)家垃圾郵件輸出日益嚴(yán)重
        插入日本少妇一区二区三区 | 日本少妇高潮喷水视频| 老熟妇仑乱视频一区二区| 欧美精品久久久久久久久| 日本一区二区三区看片| 日本精品免费看99久久| 51看片免费视频在观看| 少妇高潮喷水正在播放| 国产一区二区在线观看我不卡| 日本a爱视频二区三区| 手机福利视频| 国内精品视频一区二区三区| 精品人妻av一区二区三区不卡| 在线免费观看蜜桃视频| 高清偷自拍亚洲精品三区| 一个人看的www免费视频中文| 亚洲精品天堂在线观看| 日韩有码在线观看视频| 亚洲av永久无码精品放毛片| 久久免费看黄a级毛片| 中文字幕一区二区人妻性色| 欧美国产亚洲精品成人a v| 麻豆激情视频在线观看| 熟女体下毛荫荫黑森林| 日日碰狠狠躁久久躁9| 亚洲va欧美va人人爽夜夜嗨 | 人妻少妇精品视频专区vr| 中文亚洲欧美日韩无线码| 亚洲高清在线不卡中文字幕网| 精品一区2区3区4区| 成人a级视频在线播放| 日韩精品一区二区三区视频| 中文字幕日韩熟女av| 蜜桃tv在线免费观看| 四虎国产精品免费久久| 精品视频专区| 在线观看一区二区蜜桃| 怡红院av一区二区三区| 97久久精品人人妻人人| 日本一区二区午夜视频| 国产中文三级全黄|