魏 丹,楊春琴,李國元,賈文龍,于興忠
(1.中國石油化工股份有限公司西北油田分公司,新疆烏魯木齊 830011;2.南京天技通信技術實業(yè)有限公司,江蘇南京 210019)
遺傳算法不具備直接處理問題空間參數的能力,因此,在求解過程中,需要轉化待求解問題為既定遺傳空間內的獨立個體,而該轉換操作常被稱為數據信息編碼。與其他執(zhí)行算法不同,遺傳算法具備完備性、健全性與非冗余性。完備性是問題空間可以將所有候選解完全包含在內[1];健全性是每一個候選解能在原問題空間中找到與之相關的編碼節(jié)點的關鍵;非冗余性是任何一個編碼節(jié)點只能與一個候選解保持對應關系。為準確編碼問題空間內的信息節(jié)點,在執(zhí)行遺傳算法時,建立完整的適應度函數,一方面判斷編碼個體與候選解之間的數值對應關系,另一方面按需評估求取目標函數[2]。
在互聯(lián)網環(huán)境中,由初始節(jié)點指向目標節(jié)點的數據反饋行為可稱為數據傳輸,而隨著網絡運行時間的延長,會出現(xiàn)一些表現(xiàn)行為明顯異于標準數據的異常信息參量[3]。網絡傳輸異常數據與標準數據之間存在一定的相對誤差,該誤差影響網絡主機對于傳輸異常數據的精準檢測能力,并且導致數據信息的傳輸完整性下降。
為避免上述情況的發(fā)生,基于改進生成式對抗網絡的識別方法在分析異常數據與標準數據之間差異性的同時,分別統(tǒng)計兩種不同信息參量的目標傳輸節(jié)點,并通過實時對比的方式,突出兩者之間的相對誤差水平[4]。但是該方法的實用能力有限,并不能完全滿足精準檢測網絡傳輸異常數據的實際應用需求。
為解決上述問題,以遺傳算法為基礎,結合相關性檢測閾值等,設計一種新型的網絡傳輸異常數據檢測方法。以期提高網絡傳輸的性能,為網絡的發(fā)展做出貢獻。
網絡傳輸異常數據處理始終以遺傳網絡為基礎,在遺傳適應度函數條件的支持下,定義數據編碼標簽,具體操作流程如下。
遺傳網絡負責處理傳輸異常信息參量,并通過過渡節(jié)點將數據信息整合成滿足網絡應用需求的輸出形式。為準確檢測傳輸異常數據信息,在布置遺傳網絡時,選取過渡節(jié)點、輸出節(jié)點[5-6]。完整的遺傳網絡布局形式如圖1 所示。
為避免其他傳輸節(jié)點消耗網絡傳輸異常數據,在部署遺傳網絡時,將過渡節(jié)點直接連接到輸出節(jié)點。
遺傳適應度函數決定了遺傳算法的應用進化方向,主要作用是評估網絡環(huán)境中數據信息個體的優(yōu)劣程度。在遺傳網絡中,適應度函數的選取影響網絡主機檢測和判別傳輸異常信息參量的能力[7-8]。
設計遺傳適應度函數,計算遺傳算法中網絡傳輸各個個體的概率:
式中,fi表示網絡傳輸數據個體i的適應度;N表示網絡傳輸數據種群的規(guī)模;計算各個體的累計概率為:
選擇操作后網絡數據群體中的最差個體,交叉操作其與最優(yōu)個體的副本,從而加速尋優(yōu)的速度,保證了設計算法的收斂性。設Q1和Q2為準備交叉的兩個網絡傳輸數據個體,在Q1和Q2的第i位進行交叉,則兩個體交叉運算后所產生的新個體的第i位分別為:
式中,λ表示[0,1]之間的隨機數。
設J1、J2表示兩個隨機選取的網絡傳輸異常數據定標值,且J1≠J2的不等式條件恒成立。a表示遺傳適應系數的初始值,ΔS表示遺傳應用網絡在單位時間內承載的數據信息傳輸總量,β表示遺傳算法的數據判別系數。聯(lián)立上述物理量,可將遺傳網絡的適應度函數定義為:
在遺傳網絡中,以遺傳適應度函數為基礎判別條件,定義傳輸異常數據編碼標簽。
對于網絡傳輸異常數據而言,數據編碼標簽的定義需要同時具備信息編碼特征、數據篩選系數兩項物理條件[9-10]。信息編碼特征常表示為f,該項物理量的實際取值越大,表示定義標簽的延伸能力越強。數據篩選系數表示為χ,該項物理量的最小取值始終大于自然數“1”。在上述物理量的支持下,聯(lián)立上述公式,定義遺傳算法的傳輸異常數據編碼標簽為:
式中,δ表示網絡傳輸異常數據的編碼常值;dδ表示與δ相關的標簽項目指標;d0表示標簽項目指標的初始值表示待編碼的網絡異常數據傳輸均值。為實現(xiàn)對于網絡傳輸異常數據的精準檢測,在提取傳輸異常數據參量時,需要遵循編碼標簽定義原則。
在遺傳算法的支持下,按照異常簇點定義、數據傳輸密度確定、相關性檢測閾值計算的處理流程,完成網絡傳輸異常數據檢測方法的設計與應用。
異常簇點定義了傳輸異常數據在遺傳網絡所處的存儲位置。遺傳網絡異常簇點的分布密度水平越小,消耗的時間越長[11-12]。設l1、l2表示兩個不相等的網絡傳輸異常數據遺傳特征向量,?表示遺傳網絡的異常數據信息參量差值,表示網絡傳輸異常數據的檢測校正系數,g表示網絡傳輸異常數據的實時排列系數。在上述物理量的支持下,聯(lián)立公式(5),可定義遺傳算法的異常簇點的表達式為:
規(guī)定在遺傳網絡中,異常簇點定義的表達式直接影響異常數據信息參量的實時傳輸密度水平。
待執(zhí)行檢測指令與信息參量一一對應,因此,控制數據傳輸密度指標的數值水平在既定標準區(qū)間內[13-14]。設φ表示檢測指令的初始執(zhí)行頻率,w表示網絡異常數據的傳輸定義系數,uw表示w條件下的數據信息檢測標量,umax表示數據信息檢測標量最大值,η表示網絡主機對于傳輸異常數據的感應系數。聯(lián)立上述物理量,可定義網絡異常數據的傳輸密度表達式為:
在遺傳算法的作用下,數據傳輸密度指標的取值始終處于(0,1] 的物理區(qū)間。
式中,R表示既定檢測向量;表示遺傳應用網絡對于傳輸異常數據的干預向量;表示遺傳應用網絡對于傳輸異常數據的檢測向量。在遺傳應用網絡中,相關性檢測閾值將異常數據與標準數據間的相對誤差控制在既定數值標準之內,以此保障網絡主機檢測傳輸異常數據的精準度。
在Windows 10 系統(tǒng)中,利用Linux 虛擬機分流處理網絡傳輸數據。首先,輸入混合信息參量至網絡應用主機;其次,分別分流處理異常傳輸數據、常規(guī)傳輸數據;然后,分別存儲異常傳輸數據、常規(guī)傳輸數據于不同的數據庫主機;最后,屏蔽常規(guī)傳輸信息存儲數據庫,將異常數據庫主機中存儲的傳輸信息參量作為該次實驗的研究對象。
表1 記錄了該次實驗過程中采用主機元件的設備名稱。
表1 實驗用主機元件
為保證實驗結果的公平性,除采用檢測方法不同外,實驗組(基于遺傳算法的網絡傳輸異常數據檢測方法)、對照組(改進生成式對抗網絡的識別方法)其他參數配置情況始終保持一致。具體實驗流程如下:
步驟一:按需連接網絡主機、CPU 設備、外存設備、內存設備等多個實驗元件;
步驟二:提取存儲于數據庫主機的網絡傳輸異常數據,作為實驗待檢信息參量;
步驟三:將遺傳算法指令輸入實驗主機中,并定義實驗數據為實驗組變量;
步驟四:輸入改進生成式對抗網絡識別算法至實驗主機,并定義實驗數據為對照組變量。
異常數據校正誤差指標的數值水平,能夠反映網絡主機檢測異常性傳輸數據的能力。異常數據校正誤差與標準數據校正誤差之間的物理差值越小,表示網絡主機對于異常性傳輸數據的檢測準確性越強。
幾個周末過去后,一個中午,阿花在車上甩給我一個紅包,一千塊。我明白她的意思,卻裝著不懂,問什么意思。阿花說有付出就有回報,你每次來作指導,這是你的勞動所得。我開廠也是賺錢的,不能讓你白幫。我把紅包放在車上,我說我只做你的朋友,收了錢,我就成你的員工了。她佯裝生了氣,說你不收錢,以后就別來幫我了。她的眸子里流露幽怨的光。
圖2 反映了實驗組、對照組異常數據校正誤差指標的數值變化情況。
圖2 異常數據校正誤差
實驗組:對于實驗組異常數據信息參量而言,校正誤差指標數值呈現(xiàn)出先增大,再減小,最后來回波動的變化情況。在數據傳輸量等于3.0 MB 時,實驗組校正誤差指標達到最大值1.87×10-3MB。整個實驗過程,實驗組異常數據校正誤差與標準數據校正誤差之間的物理數值差的最大值達到了0.25×10-3MB。
對照組:對于對照組異常數據信息參量而言,校正誤差指標數值呈現(xiàn)先上升再下降,然后連續(xù)上升,最后呈現(xiàn)小幅下降的變化狀態(tài)。在數據傳輸量等于7.0 MB 時,對照組校正誤差指標達到其最大值2.42×10-3MB。整個實驗過程中,對照組異常數據校正誤差與標準數據校正誤差之間的物理數值差的最大值為0.80×10-3MB,與實驗組極值差相比,上升了0.55×10-3MB。
綜合上述實驗研究結果,可知該次實驗結論如下:
1)標準數據校正誤差指標呈現(xiàn)出明顯波動的數值變化狀態(tài);
2)在基于改進生成式對抗網絡的識別方法的作用下,異常數據校正誤差指標數值的變化趨勢并不能與標準數據校正誤差指標數值的變化趨勢保持一致,且前者的均值水平明顯更高,不符合精準檢測網絡傳輸異常數據的實際應用需求;
3)在基于遺傳算法的網絡傳輸異常數據檢測方法的作用下,異常數據校正誤差指標數值的變化趨勢大體上與標準數據校正誤差指標數值的變化趨勢保持一致,且二者均值水平相差較小,提高了網絡主機對異常性傳輸數據的檢測精度。
新型網絡傳輸異常數據檢測方法,在基于改進生成式對抗網絡的識別方法的基礎上,聯(lián)合遺傳算法理論,建立完整的適應度函數條件,通過數據編碼標簽結構,計算數據傳輸密度指標的具體數值。驗證可知,該方法有效控制了異常數據校正誤差指標的數值水平,并且對于網絡主機而言,有效提高了異常性傳輸數據的精準檢測能力。