亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于特征圖像生成的Android惡意軟件檢測方法

2023-06-15 09:27:12曹曉梅王少輝

計算機(jī)技術(shù)與發(fā)展 2023年6期

陳非,曹曉梅,王少輝

(南京郵電大學(xué) 計算機(jī)學(xué)院、軟件學(xué)院、網(wǎng)絡(luò)空間安全學(xué)院,江蘇南京 210003)

0 引言

近年來,Android操作系統(tǒng)在中國的市場份額不斷提高,其在2021年第四季度的市場份額已經(jīng)達(dá)到78%[1]。然而,Android操作系統(tǒng)的飛速發(fā)展不僅帶來市場份額的提高,也帶來許多安全問題。360發(fā)布的《2021年度中國手機(jī)安全狀況報告》[2]顯示,360安全大腦在2021年共截獲移動端新增惡意軟件樣本約943.1萬個,平均每天截獲新增手機(jī)惡意軟件樣本約2.6萬個。不法分子利用Android應(yīng)用植入廣告、竊取隱私,嚴(yán)重威脅用戶的財產(chǎn)和隱私安全,設(shè)計合理可行的Android惡意軟件檢測方法至關(guān)重要。

傳統(tǒng)的Android惡意軟件檢測方法包括三種：基于靜態(tài)分析、動態(tài)分析以及機(jī)器學(xué)習(xí)的檢測方法?；陟o態(tài)分析的方法[3-5]通過提取簽名、權(quán)限、組件等特征,生成特征匹配字典,將未知應(yīng)用的特征與字典進(jìn)行匹配,根據(jù)得到的相似度判定是否屬于惡意軟件。靜態(tài)分析方法操作簡單,但檢測類型單一、誤報率較高?；趧討B(tài)分析的方法[6-9]是指在沙盒或虛擬機(jī)運(yùn)行Android應(yīng)用程序,通過監(jiān)聽和分析應(yīng)用程序在運(yùn)行過程中行為和運(yùn)行狀態(tài)的變化,如系統(tǒng)調(diào)用事件、潛在的劫持行為、數(shù)據(jù)流等,判斷是否屬于惡意軟件。動態(tài)分析方法準(zhǔn)確率高于靜態(tài)分析方法,但動態(tài)分析方法需要運(yùn)行應(yīng)用程序,分析所需要的時間較長?；跈C(jī)器學(xué)習(xí)的檢測方法通過對大量的樣本提取特征和訓(xùn)練,生成分類模型,從而實現(xiàn)對惡意軟件的檢測。SVM、KNN、隨機(jī)森林、Stacking等傳統(tǒng)機(jī)器學(xué)習(xí)算法已經(jīng)被應(yīng)用到Android惡意軟件的檢測中[10-13],并且檢測準(zhǔn)確率相較于基于靜態(tài)分析和動態(tài)分析的方法有了較大提高,但基于機(jī)器學(xué)習(xí)的檢測方法存在特征分布不平衡、難以挖掘特征之間深層聯(lián)系等問題,限制了其準(zhǔn)確率的進(jìn)一步提高。

相比于傳統(tǒng)機(jī)器學(xué)習(xí),深度學(xué)習(xí)具有自適應(yīng)提取特征和挖掘特征深層聯(lián)系的優(yōu)勢,此優(yōu)勢也是深度學(xué)習(xí)能夠在圖像分類、文本預(yù)測等方面成功實踐的原因所在。針對傳統(tǒng)機(jī)器學(xué)習(xí)檢測Android惡意軟件存在的問題,結(jié)合深度學(xué)習(xí)的優(yōu)勢和成功實踐,深度學(xué)習(xí)應(yīng)用到Android惡意軟件檢測可以取得較好的結(jié)果。目前,深度學(xué)習(xí)算法[14-19]在Android惡意軟件檢測中已有應(yīng)用,且取得了一定成果,但仍存在不足：(1)用于分類模型訓(xùn)練的數(shù)據(jù)表征能力偏弱,制約模型的收斂速度和檢測精度;(2)檢測不同類別相似度較高的樣本時,存在較大的漏報數(shù)和誤報數(shù),導(dǎo)致算法最終的檢測準(zhǔn)確率降低。

針對不足之處,該文提出一種基于特征圖像生成的Android惡意軟件檢測方法(Android Malware Detection Method Based on Feature Image Generation,FIG-AMD)。FIG-AMD方法針對訓(xùn)練數(shù)據(jù)表征能力偏弱的問題,提取APK文件的權(quán)限、API、操作碼作為特征,挖掘各自的頻繁特征項集,使用降噪自編碼器(Denoising Autoencoder,DAE)抽取信息和轉(zhuǎn)換維度,將經(jīng)過DAE處理的各特征進(jìn)行融合,生成RGB特征圖像。該方法生成的特征圖像融合了多種特征,具有更好的表征能力。針對難以檢測相似度較高樣本的問題,該文設(shè)計了BaggingCNN分類算法,BaggingCNN使用 Bootstrap抽樣構(gòu)造子訓(xùn)練集,并訓(xùn)練基于Bagging的多個CNN分類器用于檢測Android惡意軟件。實驗證明,FIG-AMD方法可以有效對Android惡意軟件進(jìn)行檢測,且有著較低的誤報率。

1 相關(guān)工作

Imtiaz等人[14]提出DeepAMD惡意軟件檢測模型,該模型主要使用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)構(gòu)建,選取權(quán)限、API、Intent Filter作為特征,盡管實驗表明該模型的檢測性能優(yōu)于多數(shù)機(jī)器學(xué)習(xí)模型,但文中取得的二分類的準(zhǔn)確率(93.40%)仍然偏低,主要原因是ANN存在梯度消失或梯度爆炸的問題,降低了檢測模型的擬合程度。超凡等人[15]提取APK文件應(yīng)用組件、Intent Filter、權(quán)限等特征,并使用遺傳算法進(jìn)行特征選擇以降低維度,最后使用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)進(jìn)行分類檢測,該方法提取的特征很充分,但提取的特征維度較高,增加了特征篩選的時間開銷。Elayan等人[16]使用API調(diào)用和權(quán)限作為特征,使用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)中的門控循環(huán)單元(Gated Recurrent Unit,GRU)進(jìn)行分類檢測,該方法雖然準(zhǔn)確率等指標(biāo)很高,但訓(xùn)練模型使用的數(shù)據(jù)集數(shù)目較少,存在泛化能力弱的問題。孫志強(qiáng)等人[17]提出一種基于深度收縮降噪自編碼網(wǎng)絡(luò)的檢測方法,使用權(quán)限、API 等作為特征,使用貪婪算法自底向上訓(xùn)練每個收縮降噪自編碼網(wǎng)絡(luò),以抽取原始特征信息,最后使用反向傳播算法進(jìn)行訓(xùn)練和分類,該方法檢測效果優(yōu)異,但缺少對重要特征的篩選,會增加分類模型的訓(xùn)練時間。Xiao等人[18]針對現(xiàn)有檢測方法存在的數(shù)據(jù)模糊、代碼覆蓋范圍有限的問題,直接從Dalvik字節(jié)碼(classes.dex)中學(xué)習(xí)惡意軟件的特征,生成RGB圖片并使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)進(jìn)行分類檢測,該方法檢測時間遠(yuǎn)低于其它方法,但缺少對敏感特征的關(guān)注,導(dǎo)致圖像的表征能力偏弱,進(jìn)而影響了CNN 模型的收斂速度和檢測精度。Yen等人[19]提出基于代碼重要性和可視化深度學(xué)習(xí)的檢測方法,該方法根據(jù)TF-IDF計算APK文件源代碼每個單詞的重要值,經(jīng)過分組和排序,使用Simhash和Djb2算法生成RGB圖片,并使用CNN進(jìn)行訓(xùn)練和分類,該方法特征單一且存在特征信息丟失,降低了CNN的分類性能。

與同類工作相比,該文的主要貢獻(xiàn)和創(chuàng)新點(diǎn)體現(xiàn)在以下三點(diǎn)：(1)在特征預(yù)處理方面,對APK文件的多種特征進(jìn)行提取,使用改進(jìn)的FPGrowth算法對提取到的特征進(jìn)行挖掘,有效過濾了低頻特征,提高了特征組合的合理性;(2)使用DAE抽取特征數(shù)據(jù)深層次信息和轉(zhuǎn)換特征向量維度,將經(jīng)過DAE處理的權(quán)限、API、操作碼對應(yīng)的特征向量合成為三維RGB圖片作為特征圖像。該方法生成的特征圖像具有較好的表征能力,分類算法可以很好地從中學(xué)習(xí)到不同類別Android應(yīng)用的行為特征,進(jìn)而有效的識別出惡意軟件;(3)分類算法對多個CNN分類器進(jìn)行集成,并將Bagging算法的Bootstrap抽樣方法和多數(shù)投票機(jī)制遷移到該算法,設(shè)計出BaggingCNN分類算法。該算法通過多分類器集成提升了算法的分類能力,可以有效檢測出不同類別相似度較高的樣本,進(jìn)而算法的檢測準(zhǔn)確率、召回率、精準(zhǔn)率均有提高。

2 FIG-AMD方法

FIG-AMD流程如圖1所示,包括特征預(yù)處理、特征圖像生成、BaggingCNN訓(xùn)練和分類三個階段。

圖1 FIG-AMD流程

特征預(yù)處理階段提取APK文件的多種特征并對特征進(jìn)行挖掘;特征圖像生成階段,生成RGB特征圖像用于訓(xùn)練和分類;BaggingCNN訓(xùn)練和分類階段,對生成的特征圖像進(jìn)行訓(xùn)練,調(diào)整優(yōu)化算法參數(shù),并對算法進(jìn)行測試。

2.1 特征提取

該文使用特征匹配的方法對APK文件的權(quán)限、API、操作碼進(jìn)行提取,其流程如圖2所示。使用Google提供的開源工具apktool反編譯APK文件得到兩種類型的文件,從Xml文件提取權(quán)限特征,從Smali文件提取API特征和操作碼特征,各特征提取步驟如下所述：

圖2 特征提取方法基本流程

(1)權(quán)限：首先將文獻(xiàn)[20]提供的權(quán)限列表構(gòu)造成權(quán)限匹配字典;再利用AXMLPrinter2.jar靜態(tài)工具反編譯Xml文件得到txt文件;最后使用權(quán)限匹配字典對txt文件的內(nèi)容進(jìn)行匹配,得到相應(yīng)的權(quán)限特征。

(2)API：首先將文獻(xiàn)[20]提供的API調(diào)用列表構(gòu)造成API匹配字典;再使用API匹配字典對Smali文件對應(yīng)的每行語句進(jìn)行匹配,得到相應(yīng)的API特征。

(3)操作碼：Dalvik定義了256個指令,這些指令包含move、return、invoke等基本操作碼,該文根據(jù)這些指令的功能進(jìn)行分類(如：move/from16、move-object/16歸為M指令;goto/16、goto/32歸為G指令),得到指令匹配字典。由于指令之間存在序列關(guān)系,假設(shè)其遵循馬爾可夫性質(zhì)并引入3-gram操作碼序列。針對反編譯得到的Smali文件,首先使用指令匹配字典對Smali文件的.method部分進(jìn)行匹配,并將得到的指令轉(zhuǎn)為相應(yīng)的M、G等指令名,加入到操作碼序列中;文件遍歷完成后,再以3作為滑動窗口的長度提取3-gram操作碼,如：{M,G,L,V}→{MGL,GLV},即得到操作碼特征。

2.2 特征挖掘

FPGrowth[21]算法挖掘相關(guān)性較高的特征組合,即頻繁特征項集。由于特征集合的樣本個數(shù)和維度均較大,而FPGrowth算法僅適合于小規(guī)模數(shù)據(jù)集,直接使用FPGrowth算法挖掘頻繁特征項集會較為耗時。因此,該文設(shè)計了基于FPGrowth算法的局部頻繁特征項集挖掘方法FPGrowth-r,其實現(xiàn)步驟如下：

(1)將特征集合S分成k組,前k-1組每組n個特征,第k組num-n*(k-1)個特征,記第i組特征集合為Si,其中num為S的特征個數(shù),且0

(2)使用FPGrowth算法挖掘Si的頻繁特征項集(FPGrowth算法的支持度大小設(shè)置為support),得到若干個不同的頻繁特征項集,取特征個數(shù)最多的項集作為Si的局部頻繁特征項集,記為Gi。

(3)對k組特征集合按步驟(1)(2)進(jìn)行局部頻繁特征項集挖掘,得到G1,G2,…,Gk,計算Global=G1∪G2∪…∪Gk,即得到全局頻繁特征項集Global。

(4)對權(quán)限、API、操作碼按步驟(1)(2)(3)進(jìn)行挖掘,得到各自的Global并進(jìn)行過濾,最后將過濾完成的特征轉(zhuǎn)為01型特征向量(1表示包含某特征項,0表示不包含)。

2.3 特征圖像生成

降噪自編碼器[22]在輸入數(shù)據(jù)中加入了一定比例的噪聲數(shù)據(jù),從而使得DAE網(wǎng)絡(luò)的反向傳播過程迫使隱藏層學(xué)習(xí)到的特征數(shù)據(jù)具有更強(qiáng)的魯棒性,進(jìn)而增強(qiáng)了隱藏層輸出數(shù)據(jù)的表征能力。因此,該文使用DAE對特征信息進(jìn)行抽取和轉(zhuǎn)換特征向量維度。

生成的特征圖像大小為[3,w,w],即經(jīng)過DAE處理后的特征向量長度為w*w,則隱藏層最后一層神經(jīng)元的個數(shù)應(yīng)設(shè)置為w*w。為避免DAE處理后的特征向量過于稀疏化而影響特征圖像的表征能力,使用式(1)對最佳的w進(jìn)行計算,即w取使得式(1)中value最小的正整數(shù)。分別對權(quán)限、API、操作碼的特征向量使用DAE進(jìn)行處理,DAE經(jīng)過訓(xùn)練,損失函數(shù)值達(dá)到最小,使用式(2)計算DAE處理后的特征向量,即得到大小為w*w的特征向量。

value=|3w2-(npermission+napi+nopcode)|

(1)

(2)

RGB特征圖像生成的流程如圖3所示。DAE對權(quán)限、API、操作碼對應(yīng)的特征向量進(jìn)行信息抽取和維度處理,對于同一個APK文件,其對應(yīng)3個大小為w*w的線性特征向量。首先將線性特征向量轉(zhuǎn)換成大小為[w,w]二維特征向量,再對各二維特征向量增加一個通道,轉(zhuǎn)換成單通道圖像,維度變成[1,w,w],最后將3個二維特征向量在新增的維度進(jìn)行拼接,即三個特征向量分別作為RGB圖片的R、G、B三個通道,其維度變成[3,w,w],得到最終的RGB特征圖像。

圖3 RGB特征圖像生成流程

2.4 BaggingCNN分類算法

針對單一分類算法魯棒性偏差、檢測不同類別相似度較高樣本誤差較大的問題,設(shè)計BaggingCNN分類算法,如圖4所示。BaggingCNN分類算法將不同的CNN算法根據(jù)特征圖像大小重新配置網(wǎng)絡(luò)參數(shù)和網(wǎng)絡(luò)深度,并將這些CNN算法作為子分類器進(jìn)行集成,子分類器對不同的子訓(xùn)練集進(jìn)行訓(xùn)練和分類,得到若干個分類結(jié)果,根據(jù)多數(shù)投票機(jī)制得到最終的分類結(jié)果。BaggingCNN分類算法的具體實現(xiàn)步驟如下所述：

圖4 BaggingCNN分類算法設(shè)計

(1)對于特征優(yōu)化模塊生成的n個RGB特征圖像,該文按照一定比例將其劃分成a個訓(xùn)練樣本和n-a個測試樣本,a個訓(xùn)練樣本中包括a1個正常樣本,a-a1個惡意樣本。為防止隨機(jī)抽取出現(xiàn)樣本分布不平衡的問題,采用Bootstrap抽樣(有放回的均勻抽樣)方法,分別從正常樣本中隨機(jī)抽取a1/a*m個樣本,從惡意樣本中隨機(jī)抽取(a-a1)/a*m個樣本,共計m個樣本。抽取共進(jìn)行k輪,得到k組子訓(xùn)練集,每組子訓(xùn)練集均使用t個不同的CNN算法進(jìn)行訓(xùn)練。

(2)t個CNN算法分別對k個子訓(xùn)練集進(jìn)行訓(xùn)練,經(jīng)過一定輪次的迭代更新算法參數(shù),其分類性能達(dá)到最優(yōu),得到t*k個子CNN分類器。t*k個子CNN分類器分別對b個測試樣本進(jìn)行預(yù)測,每個子分類器均得到b個關(guān)于測試樣本的預(yù)測結(jié)果和b個預(yù)測結(jié)果對應(yīng)的概率大小。

(3)分別對t*k個CNN分類器得到的結(jié)果進(jìn)行投票,1為惡意軟件,0為正常軟件。對于同一個測試樣本得到的t*k個分類結(jié)果,若sum(CNNi[j]) ≥ceil(t*k/2),則認(rèn)為該樣本為惡意軟件,反之則認(rèn)為是正常軟件。若出現(xiàn)票數(shù)相等的情況,則比較P1和P2的大小,P1大則認(rèn)為是惡意樣本,反之則為正常樣本。其中,sum表示求和;CNNi[j]為第i個CNN分類器預(yù)測第j個樣本的結(jié)果;ceil(t*k/2)表示CNN子分類器個數(shù)k除以2并向上取整,P1表示預(yù)測為惡意樣本的平均概率,P2表示預(yù)測為正常樣本的平均概率。

3 實驗結(jié)果與分析

3.1 實驗準(zhǔn)備

實驗環(huán)境為：Windows10操作系統(tǒng),8 GB運(yùn)行內(nèi)存,CPU為lntel i7-7500U,GPU為NVIDIA GeForce 940MX;深度學(xué)習(xí)框架為Pytorch1.6,編程語言為Python3.7。

FIG-AMD方法的數(shù)據(jù)集分為良性樣本和惡意樣本。惡意樣本共4 000個,其中426個來自CIC數(shù)據(jù)集、2 825個來自Drebin數(shù)據(jù)集、749個來自VirusShare數(shù)據(jù)集。良性樣本共4 000個,其中1 168個來自CIC數(shù)據(jù)集,另外2 832個為筆者使用爬蟲爬取的APK文件,其均經(jīng)過病毒檢測網(wǎng)站VirusTotal檢測,均未發(fā)現(xiàn)存在風(fēng)險,故標(biāo)記為良性。該文將訓(xùn)練集和測試集按照7∶3劃分,即訓(xùn)練集5 600個,測試集2 400個。

3.2 評估指標(biāo)

針對FIG-AMD方法的評估,主要包括檢測能力、學(xué)習(xí)能力和泛化能力等方面。檢測能力的評估指標(biāo)包括如下5個指標(biāo),其中TP、TN、FP、FN分別表示良性軟件分類成良性軟件、惡意軟件分類成惡意軟件、惡意軟件分類成良性軟件、良性軟件分類成惡意軟件的數(shù)目。

(1)準(zhǔn)確率(Accuracy,ACC)：正確檢測出來的正常軟件個數(shù)和惡意軟件個數(shù)總和占所有軟件個數(shù)的比例。

(3)

(2)良性召回率(Benign Recall,BR)：正確檢測出來的正常軟件個數(shù)占所有良性軟件個數(shù)的比例。

(4)

(3)惡意召回率(Malicious Recall,MR)：正確檢測出來的惡意軟件個數(shù)占所有惡意軟件個數(shù)的比例。

(5)

(4)誤報率(False Alarm,FA)：誤報為良性軟件的惡意軟件的個數(shù)占所有惡意軟件個數(shù)的比例。

(6)

(5)綜合評價指標(biāo)(F1)：精確率(Precision)和召回率(Recall)的加權(quán)調(diào)和平均值。

良性軟件的精確率：

(7)

良性軟件的F1值：

(8)

惡意軟件的精確率：

(9)

惡意軟件的F1值：

(10)

3.3 特征預(yù)處理

將第2.2節(jié)中FPGrowth-r的n設(shè)置為10,support設(shè)置為10,表1展示了特征預(yù)處理階段各特征的數(shù)目和不同特征挖掘方法對應(yīng)的耗時情況。

表1 特征數(shù)目及特征挖掘耗時

由表1可見,使用FPGrowth和FPGrowth-r挖掘后的特征數(shù)目較為接近,兩者均能對特征進(jìn)行有效挖掘,但FPGrowth-r的耗時遠(yuǎn)低于FPGrowth,因此該文設(shè)計的特征預(yù)處理方法是有效的。

3.4 BaggingCNN參數(shù)

根據(jù)式(1)和表1中FPGrowth-r挖掘的特征數(shù)目,經(jīng)過計算,最佳的w為16,則DAE隱藏層最后一層的神經(jīng)元個數(shù)設(shè)置為256。該文使用5層的DAE網(wǎng)絡(luò)對特征向量進(jìn)行處理,最后生成大小為[3,16,16]的特征圖像用于BaggingCNN訓(xùn)練和分類。

不同CNN算法對生成的特性圖像進(jìn)行分類的結(jié)果如圖5所示,圖中算法均根據(jù)特征圖像大小調(diào)整了參數(shù)和深度,算法經(jīng)過訓(xùn)練達(dá)到最優(yōu)。BaggingCNN抽取子訓(xùn)練集樣本個數(shù)m設(shè)置為5 600(等于訓(xùn)練集樣本個數(shù)),為確定BaggingCNN的最優(yōu)參數(shù)t和k,使用圖5準(zhǔn)確率前t的算法,在不同的抽樣次數(shù)k下進(jìn)行實驗,結(jié)果如圖6所示。

圖5 不同CNN算法準(zhǔn)確率對比

圖6 t和k在不同數(shù)值下的準(zhǔn)確率變化情況

由圖6可以看到,隨著t和k的增大,算法的準(zhǔn)確率也在提高,當(dāng)t=3和k=3,算法的準(zhǔn)確率趨于平穩(wěn)。因此,選擇t=3和k=3作為BaggingCNN的最優(yōu)參數(shù),即子訓(xùn)練集個數(shù)為3,選取準(zhǔn)確率前3的GoogLeNet[23]、ResNet[24]、DenseNet[25]作為子分類器,其具體參數(shù)如表2所示。

表2 子分類器具體參數(shù)

3.5 FIG-AMD方法有效性

在檢測能力、學(xué)習(xí)能力和泛化能力方面進(jìn)行對比實驗,對FIG-AMD方法的有效性進(jìn)行驗證：

(1)檢測能力。

為了驗證FIG-AMD方法具備更好的檢測能力,利用GoogLeNet、ResNet、DenseNet和多種機(jī)器學(xué)習(xí)算法設(shè)計惡意軟件檢測方法,并與FIG-AMD方法進(jìn)行對比。其中,GoogLeNet、ResNet、DenseNet的輸入為生成的特征圖像,機(jī)器學(xué)習(xí)算法的輸入為特征預(yù)處理階段多特征融合的線性特征向量,各算法均經(jīng)過參數(shù)調(diào)整優(yōu)化,算法分類性能達(dá)到最佳,實驗對比結(jié)果如表3所示。

表3 不同方法各項評估指標(biāo)對比 %

從表3可以看到,GoogLeNet、ResNet、DenseNet的檢測效果優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法,但檢測效果仍不及該文提出的FIG-AMD方法。因此,FIG-AMD方法相比較于其它方法,具備更好的檢測能力。

(2)學(xué)習(xí)能力。

為測試FIG-AMD方法的學(xué)習(xí)能力,改變FIG-AMD方法特征圖像生成階段生成的圖像數(shù)目以及正常樣本與惡意樣本的比例,并使用BaggingCNN分類算法對生成的特征圖像進(jìn)行訓(xùn)練和分類,實驗結(jié)果如圖7所示。

圖7 不同比例和數(shù)目樣本對FIG-AMD方法學(xué)習(xí)能力影響

從圖7中可以看到,在樣本分布不平衡或者樣本數(shù)目較少時,FIG-AMD方法可以保持較高的檢測準(zhǔn)確率。當(dāng)樣本比例保持在1∶1時,FIG-AMD方法的良性召回率和正常召回率較為接近,隨著樣本總數(shù)的增加,其各項檢測指標(biāo)均在提高,說明FIG-AMD方法的學(xué)習(xí)能力在不斷提高。因此,提出的FIG-AMD方法具有較強(qiáng)的學(xué)習(xí)能力,其可以有效地從少量樣本或不平衡樣本中學(xué)習(xí)到不同類別樣本的特征。

(3)泛化能力。

在泛化能力測試方面,首先將文獻(xiàn)[13,15,17,18]提出的方法和該文提出的FIG-AMD方法使用相同的數(shù)據(jù)集進(jìn)行訓(xùn)練,再選用不同于該文訓(xùn)練集和測試集的600個樣本(正常樣本300個,惡意樣本300個)進(jìn)行測試。其中,文獻(xiàn)[13]為使用APK文件動態(tài)行為特征構(gòu)造的特征向量經(jīng)過Stacking訓(xùn)練得到的分類結(jié)果;文獻(xiàn)[15]為組件、Intent Filter等特征經(jīng)過遺傳算法篩選特征,使用DNN分類得到的結(jié)果;文獻(xiàn)[17]為使用深度收縮自編碼網(wǎng)絡(luò)對多特征融合的特征向量分類的結(jié)果;文獻(xiàn)[18]為dex文件轉(zhuǎn)換成RGB圖片,使用CNN分類的結(jié)果。此外,還將文獻(xiàn)[18]的分類算法替換成BaggingCNN進(jìn)行了實驗,準(zhǔn)確率得到了一定提升,說明BaggingCNN具有更好的分類性能,所有方法對比結(jié)果如表4所示,由表中對比結(jié)果可以看到：提出的FIG-AMD方法在準(zhǔn)確率、誤報率等指標(biāo)方面,均優(yōu)于其它檢測方法,因此,可以認(rèn)為FIG-AMD方法具備較強(qiáng)的泛化能力。

表4 不同方法檢測性能對比 %

4 結(jié)束語

設(shè)計了FIG-AMD方法對Android惡意軟件進(jìn)行檢測,該方法側(cè)重于特征圖像的生成,提取APK文件多種特征并挖掘相關(guān)性高的特征組合,引入降噪自編碼器挖掘特征的深層信息和轉(zhuǎn)換特征維度,生成特征圖像用于訓(xùn)練和分類,解決了訓(xùn)練數(shù)據(jù)表征能力不足,影響分類算法收斂速度和檢測精度的問題。在分類算法方面,將多個CNN分類器調(diào)整后集成在一起,基于Bagging算法思想,設(shè)計BaggingCNN分類算法,該算法解決了單一分類算法魯棒性偏差的問題。經(jīng)過實驗證明,提出的FIG-AMD方法可以對Android惡意軟件進(jìn)行準(zhǔn)確檢測,并在誤報率方面有著較大的降低,且該方法具有較好的學(xué)習(xí)能力和泛化能力。

在未來工作中,計劃在檢測方法中加入Android對抗樣本檢測機(jī)制,力求對設(shè)計的方法進(jìn)行完善,從而可以準(zhǔn)確檢測普通Android樣本以及Android對抗樣本。