亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于注意力機(jī)制優(yōu)化的WGAN?BiLSTM信用卡欺詐檢測(cè)方法

        2024-09-16 00:00:00劉汝欣徐洪珍
        現(xiàn)代電子技術(shù) 2024年10期
        關(guān)鍵詞:欺詐信用卡注意力

        摘" 要: 信用卡欺詐是銀行操作風(fēng)險(xiǎn)的主要來(lái)源之一,對(duì)信用卡詐騙交易進(jìn)行準(zhǔn)確的檢測(cè)對(duì)于減少銀行經(jīng)濟(jì)損失具有重要意義。針對(duì)信用卡欺詐檢測(cè)中存在的數(shù)據(jù)類(lèi)別不平衡和數(shù)據(jù)漂移的問(wèn)題,提出一種基于注意力機(jī)制優(yōu)化的WGAN?BiLSTM信用卡欺詐檢測(cè)方法。首先引入Wasserstein距離改進(jìn)生成對(duì)抗網(wǎng)絡(luò)(GAN),將信用卡數(shù)據(jù)輸入至WGAN(Wasserstein GAN)中,在生成器和判別器相互博弈訓(xùn)練下,得到符合目標(biāo)分布的欺詐樣本;然后,構(gòu)建結(jié)合注意力機(jī)制的雙向長(zhǎng)短期記憶(BiLSTM)網(wǎng)絡(luò),在正反兩個(gè)方向上提取信用卡數(shù)據(jù)的長(zhǎng)時(shí)依賴關(guān)系;最后,通過(guò)Softmax層輸出分類(lèi)結(jié)果。在歐洲持卡人數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,所提方法能有效提升信用卡欺詐檢測(cè)效果。

        關(guān)鍵詞: 信用卡欺詐檢測(cè); 過(guò)采樣技術(shù); 注意力機(jī)制; 不平衡分類(lèi); Wasserstein距離; 生成對(duì)抗網(wǎng)絡(luò); 雙向長(zhǎng)短期記憶網(wǎng)絡(luò); 信息提取

        中圖分類(lèi)號(hào): TN919?34; TP391" " " " " " " " " "文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " " 文章編號(hào): 1004?373X(2024)10?0073?06

        Method of WGAN?BiLSTM credit card fraud detection based on attention

        mechanism optimization

        Abstract: Credit card fraud is one of the main sources of bank operational risk. The accurate detection of credit card fraud transactions is of great significance for reducing bank economic losses. In allusion to the problems of data category imbalance and data drift in credit card fraud detection, a WGAN?BiLSTM credit card fraud detection method based on attention mechanism optimization is proposed. The Wasserstein distance is introduced to improve the generative adversarial network (GAN), and the credit card data is input into the Wasserstein GAN (WGAN). Under the mutual game training between the generator and the discriminator, the fraud samples that meet the target distribution are obtained. The bi?directional long short?term memory (BiLSTM) with attention mechanism is constructed to extract the long?term dependence of credit card data in both positive and negative directions. The classification results are output by means of the Softmax layer. The experimental results on the European cardholder dataset show that the proposed method can effectively improve the effect of credit card fraud detection.

        Keywords: credit card fraud detection; over?sampling technology; attention mechanism; imbalanced classification; Wasserstein distance; GAN; BiLSTM; inforamation extraction

        0" 引" 言

        隨著網(wǎng)絡(luò)購(gòu)物規(guī)模的持續(xù)增加,信用卡交易已無(wú)處不在[1],人們?cè)絹?lái)越傾向于提前消費(fèi)。然而,人們?cè)趯⑿庞玫盅航o銀行以提前消費(fèi)時(shí),往往缺乏理智的思考,高估了自己及時(shí)償還信用卡貸款的能力,擴(kuò)大了銀行的放款風(fēng)險(xiǎn)。根據(jù)央行發(fā)布的《2022年第四季度支付體系運(yùn)行總體情況》數(shù)據(jù)顯示,截至2022年末,信用卡和借貸合一卡共發(fā)卡7.98億張,銀行卡授信總額為22.14萬(wàn)億元,授信使用率為39.25%;信用卡逾期半年未償信貸總額為865.8億元,占信用卡應(yīng)償信貸余額的1%。在發(fā)卡規(guī)模和授信額度穩(wěn)步增長(zhǎng)的同時(shí),信用卡違約現(xiàn)象層出不窮。盡管銀行對(duì)不良貸款進(jìn)行了針對(duì)性處理以及加大了催收力度,但逾期風(fēng)險(xiǎn)仍然不容小覷。信用卡欺詐交易能給銀行造成經(jīng)濟(jì)損失[2],也能影響銀行的聲譽(yù)。因此,金融機(jī)構(gòu)應(yīng)持續(xù)建立一個(gè)智能欺詐檢測(cè)機(jī)制,以檢測(cè)潛在高風(fēng)險(xiǎn)賬戶,在欺詐發(fā)生之前防止欺詐,營(yíng)造良好的金融秩序,促進(jìn)金融產(chǎn)業(yè)的健康發(fā)展。

        信用卡欺詐檢測(cè)一般通過(guò)學(xué)習(xí)交易歷史數(shù)據(jù)中的規(guī)律生成經(jīng)驗(yàn)?zāi)P?,利用模型預(yù)測(cè)未來(lái)的交易數(shù)據(jù)是否存在欺詐交易行為。與正常還款的交易相比,欺詐交易占極少數(shù)[3],可供模型學(xué)習(xí)的欺詐交易樣本數(shù)量非常稀少。并且,信用卡用戶消費(fèi)行為的趨勢(shì)隨著時(shí)間呈現(xiàn)一定的規(guī)律性,例如在節(jié)假日人們的消費(fèi)意愿更加沖動(dòng)強(qiáng)烈,這種潛在的數(shù)據(jù)分布變化可能會(huì)導(dǎo)致模型的預(yù)測(cè)性能降低[4]。

        近年來(lái),研究人員在信用卡欺詐檢測(cè)上做了大量的工作。在類(lèi)別不平衡問(wèn)題上,一般采取過(guò)采樣[5]和欠采樣[6]的方式處理,例如N. Rtayli等人采用SMOTE算法生成欺詐樣本來(lái)克服數(shù)據(jù)的不平衡[7]。Chen Ying等人通過(guò)K?Means聚類(lèi)算法改進(jìn)SMOTE算法,僅在安全區(qū)域內(nèi)生成欺詐樣本[8]。E. Esenogho等人通過(guò)結(jié)合SMOTE過(guò)采樣算法和欠采樣相結(jié)合的方式進(jìn)行混合采樣,從而改善信用卡數(shù)據(jù)的整體分布[9]。在數(shù)據(jù)漂移問(wèn)題上,一般采用基于長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)[10]的深度模型,例如Gao J等人采用LSTM提取信用卡數(shù)據(jù)中潛在的時(shí)序信息,最后通過(guò)XGBoost完成信息識(shí)別和欺詐分類(lèi)[11]。I. Benchaji等人提出一種結(jié)合注意力機(jī)制的LSTM信用卡欺詐檢測(cè)模型,通過(guò)注意力機(jī)制選擇性地關(guān)注特征,能夠提高模型的檢測(cè)效率[12]。J. Forough等人以LSTM作為初步預(yù)測(cè)層、CRF作為最終預(yù)測(cè)層的方式構(gòu)建信用卡欺詐檢測(cè)模型[13]。

        傳統(tǒng)的SMOTE過(guò)采樣算法生成的欺詐樣本存在較多的噪聲,欠采樣算法可能會(huì)丟失關(guān)鍵信息,最終影響模型的訓(xùn)練效果。另一方面,LSTM只能正向地學(xué)習(xí)信用卡數(shù)據(jù)的分布,無(wú)法結(jié)合前后兩個(gè)方向輸出欺詐檢測(cè)的綜合表達(dá)。針對(duì)以上問(wèn)題,本文提出一種基于注意力機(jī)制優(yōu)化的WGAN?BiLSTM信用卡欺詐檢測(cè)方法。首先,引入Wasserstein距離代替生成對(duì)抗網(wǎng)絡(luò)(GAN)中原有的JS散度來(lái)度量生成數(shù)據(jù)和真實(shí)數(shù)據(jù)之間的距離,更加穩(wěn)定地生成符合原始分布的欺詐樣本,平衡信用卡數(shù)據(jù)類(lèi)別的分布;然后,構(gòu)建雙向長(zhǎng)短期記憶(BiLSTM)網(wǎng)絡(luò),從正反兩個(gè)方向提取信用卡數(shù)據(jù)內(nèi)潛在的時(shí)序信息,并結(jié)合注意力機(jī)制對(duì)特征進(jìn)行選擇性地關(guān)注;最后,通過(guò)Softmax層輸出欺詐檢測(cè)結(jié)果。

        1" 研究方法

        1.1" Wasserstein GAN

        生成對(duì)抗網(wǎng)絡(luò)(GAN)[14]是一種無(wú)監(jiān)督的神經(jīng)網(wǎng)絡(luò),包含兩個(gè)網(wǎng)絡(luò)進(jìn)行對(duì)抗訓(xùn)練。其中,生成器的目標(biāo)是合成出判別器難以分辨的樣本,判別器的目標(biāo)是盡可能地區(qū)分生成器生成的樣本是否為真實(shí)樣本。當(dāng)GAN的生成器收斂至最優(yōu)時(shí),其目標(biāo)就會(huì)轉(zhuǎn)為最小化生成數(shù)據(jù)和真實(shí)數(shù)據(jù)分布之間的JS散度。然而,當(dāng)生成數(shù)據(jù)和真實(shí)數(shù)據(jù)間不存在重疊分布時(shí),會(huì)導(dǎo)致JS散度始終為一個(gè)常數(shù),無(wú)法再反映兩個(gè)分布之間的距離,進(jìn)而導(dǎo)致GAN存在訓(xùn)練不穩(wěn)定的現(xiàn)象。

        本文采用Wasserstein距離[15]代替GAN的JS散度來(lái)度量人工欺詐樣本和真實(shí)樣本之間的距離,以解決GAN穩(wěn)定性較差的問(wèn)題。WGAN(Wasserstein GAN)的優(yōu)勢(shì)在于,即便兩個(gè)分布之間沒(méi)有重疊或者重疊情況非常少的時(shí)候,Wasserstein距離仍然能夠反映兩個(gè)分布之間的遠(yuǎn)近程度,數(shù)值越小表示兩個(gè)分布越相似,這樣可以有效減少訓(xùn)練過(guò)程中不穩(wěn)定的情況。Wasserstein距離公式如下:

        1.2" WGAN平衡信用卡數(shù)據(jù)集

        假設(shè)信用卡數(shù)據(jù)集為[X=Xmin,Xmax],其中[Xmax]表示多數(shù)類(lèi)的正常樣本,[Xmin]表示少數(shù)類(lèi)的欺詐樣本,需要生成的欺詐樣本數(shù)量為[Xmax]和[Xmin]的差值。WGAN對(duì)欺詐樣本進(jìn)行過(guò)采樣的具體步驟如下:

        1) 初始化WGAN的生成器和判別器。均設(shè)置為具有3層全連接層的神經(jīng)網(wǎng)絡(luò),使用RMSprop優(yōu)化器更新網(wǎng)絡(luò)權(quán)重,生成器的輸出維度設(shè)置為信用卡特征總數(shù),判別器的輸出維度設(shè)置為1。

        2) 生成符合高斯分布的隨機(jī)噪聲[z],將噪聲輸入至生成器[G]中得到生成的欺詐樣本[XG]。

        3) 將原始樣本[X]和生成樣本[XG]輸入至判別器[D]中訓(xùn)練得到判別器誤差,計(jì)算判別器誤差的損失函數(shù)如下:

        式中:[pdata]和[pz]分別為噪聲和真實(shí)樣本的概率分布;[E(?)]為計(jì)算期望的函數(shù);[G(?)]為生成器的可微函數(shù);[D(?)]為判別器的可微函數(shù)。得到[D]的誤差后,通過(guò)反向傳播梯度下降算法對(duì)[D]進(jìn)行網(wǎng)絡(luò)權(quán)重的更新。

        4) 更新后的判別器重新對(duì)生成樣本[XG]進(jìn)行判別,得到生成器誤差,計(jì)算生成器誤差的損失函數(shù)如下:

        得到[G]的誤差后,通過(guò)反向傳播梯度下降算法對(duì)[G]進(jìn)行網(wǎng)絡(luò)權(quán)重的更新。

        5) 重復(fù)執(zhí)行步驟2)~步驟4),在生成器和判別器不斷博弈訓(xùn)練下,判別器最終再也無(wú)法區(qū)分欺詐樣本的來(lái)源,此時(shí)達(dá)到納什均衡[16]。結(jié)合式(2)與式(3)建立WGAN網(wǎng)絡(luò)的目標(biāo)函數(shù),公式如下:

        6) 生成數(shù)量為[Xmax]和[Xmin]的差值的隨機(jī)噪聲,標(biāo)簽設(shè)置為1。將其輸入至訓(xùn)練好的生成器中得到人工欺詐樣本,合并原始信用卡數(shù)據(jù)樣本和人工欺詐樣本,此時(shí)得到一個(gè)類(lèi)別平衡的數(shù)據(jù)集[X']。

        1.3" 雙向長(zhǎng)短期記憶網(wǎng)絡(luò)

        雙向長(zhǎng)短期記憶(BiLSTM)網(wǎng)絡(luò)是基于LSTM的拓展網(wǎng)絡(luò)模型,主要用于解決時(shí)序相關(guān)的問(wèn)題。BiLSTM由正向LSTM和反向LSTM構(gòu)成,其基本結(jié)構(gòu)如圖1所示。相較于單一的LSTM,BiLSTM有更強(qiáng)的非線性表達(dá)能力,能夠綜合考慮序列數(shù)據(jù)的正向特征和反向特征[17],可以改善模型對(duì)長(zhǎng)期依賴關(guān)系的學(xué)習(xí)狀況。

        假設(shè)由WGAN過(guò)采樣得到的信用卡平衡數(shù)據(jù)集為[X'=x0,x1,x2,…,xT],即存在從0時(shí)刻到[T]時(shí)刻的數(shù)據(jù),且有[0≤t≤T]。本文利用BiLSTM提取信用卡數(shù)據(jù)中的時(shí)序信息的步驟如下:

        式中[ht]為BiLSTM在[t]時(shí)刻的輸出序列。

        1.4" BiLSTM嵌入注意力機(jī)制

        由于信用卡數(shù)據(jù)數(shù)量龐大,當(dāng)輸入的序列較長(zhǎng),可能導(dǎo)致信息丟失的問(wèn)題。本文在BiLSTM的隱層末端嵌入注意力機(jī)制(Attention)來(lái)改善BiLSTM的整體記憶[18]狀況,通過(guò)捕獲關(guān)鍵時(shí)序特征對(duì)欺詐檢測(cè)結(jié)果的影響,從而篩選出關(guān)鍵信息,提高模型的學(xué)習(xí)效率和檢測(cè)效果。BiLSTM結(jié)合注意力層計(jì)算注意力值的步驟如下。

        1) 將由BiLSTM訓(xùn)練好的隱層序列輸入至注意力層,計(jì)算每個(gè)時(shí)刻的輸入序列和目標(biāo)序列之間的相關(guān)程度得到注意力分?jǐn)?shù),計(jì)算公式如下:

        [St=tanhwhht+Ch] (8)

        式中:[St]為[t]時(shí)刻的注意力分?jǐn)?shù);[ht]為BiLSTM在[t]時(shí)刻的輸出序列;[wh]為注意力權(quán)重;[Ch]為注意力偏置。

        2) 利用Softmax函數(shù)對(duì)[St]進(jìn)行轉(zhuǎn)換得到注意力權(quán)重值[α],并根據(jù)[α]對(duì)BiLSTM的隱層輸出加權(quán)求和,計(jì)算出經(jīng)注意力機(jī)制優(yōu)化后的輸出,公式如下:

        式中:[αt]為[ht]的注意力權(quán)重值;[h't]為[t]時(shí)刻經(jīng)過(guò)注意力機(jī)制優(yōu)化的輸出。

        3) 使用Softmax歸一化函數(shù)層將步驟2)的輸出以概率的形式呈現(xiàn),即樣本被判定為欺詐樣本的概率,具體計(jì)算公式如下:

        式中[yt]為模型的最終輸出。

        1.5" WGAN?BiLSTM?Attention模型結(jié)構(gòu)

        針對(duì)信用卡欺詐檢測(cè)領(lǐng)域存在類(lèi)別不平衡和數(shù)據(jù)漂移的問(wèn)題,本文提出一種基于注意力機(jī)制優(yōu)化的WGAN?BiLSTM信用卡欺詐檢測(cè)方法,其模型結(jié)構(gòu)如圖2所示。

        將標(biāo)準(zhǔn)化后的信用卡數(shù)據(jù)輸入WGAN中進(jìn)行迭代訓(xùn)練,得到符合原始分布的平衡數(shù)據(jù)集;利用BiLSTM提取數(shù)據(jù)中的時(shí)序信息并將隱層輸出傳遞至注意力層,通過(guò)注意力機(jī)制使得模型關(guān)注更重要的特征;最后,利用Softmax函數(shù)層計(jì)算出模型的最終輸出。

        2" 實(shí)驗(yàn)設(shè)計(jì)與分析

        2.1" 實(shí)驗(yàn)環(huán)境

        本文的實(shí)驗(yàn)采用Windows 11系統(tǒng),AMD Ryzen 7 5800H CPU,內(nèi)存16 GB,顯卡NVIDIA GeForce RTX 3060。在構(gòu)建模型的過(guò)程中,采用Python編程語(yǔ)言的Sklearn工具包和Keras工具包實(shí)現(xiàn)。

        2.2" 數(shù)據(jù)集描述

        本文使用的數(shù)據(jù)集來(lái)源于Kaggle平臺(tái)的公開(kāi)數(shù)據(jù)集,由Worldline和ULB的機(jī)器學(xué)習(xí)小組在進(jìn)行欺詐檢測(cè)有關(guān)的大數(shù)據(jù)挖掘期間收集的。該數(shù)據(jù)集包含了歐洲持卡人于2013年9月2天內(nèi)的信用卡交易記錄,共有284 807條交易數(shù)據(jù)。其中具有欺詐行為的交易數(shù)據(jù)僅有492條,欺詐比例為0.172%。

        該數(shù)據(jù)集一共有31個(gè)特征變量,沒(méi)有缺失值。特征V1,V2,…,V28是通過(guò)PCA降維后的結(jié)果,出于保護(hù)持卡人隱私的目的,它們的原始特征和背景信息沒(méi)有被提供。特征Time表示每條交易與第一條交易相差的秒數(shù);特征Amount表示交易金額;特征Class表示欺詐類(lèi)型,當(dāng)其為欺詐交易時(shí)取值為1,否則取值為0。

        2.3" 數(shù)據(jù)預(yù)處理

        由于特征Time僅存儲(chǔ)序列信息,本文首先對(duì)其進(jìn)行剔除;接著對(duì)剩余特征進(jìn)行標(biāo)準(zhǔn)化處理,消除特征之間的量綱關(guān)系,使得特征之間具有可比性。標(biāo)準(zhǔn)化后數(shù)據(jù)將被映射至一個(gè)較小的范圍之內(nèi),起到平滑梯度的作用,有助于提高模型的訓(xùn)練速度和分類(lèi)性能。本文采用Z?Score算法對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化操作,計(jì)算公式如下:

        式中:[v]為原始特征數(shù)值;[μ]為所有特征的平均值;[σ]為所有特征的標(biāo)準(zhǔn)差;[v']為標(biāo)準(zhǔn)化后的特征數(shù)值。

        2.4" 評(píng)價(jià)指標(biāo)

        本文采用的評(píng)價(jià)指標(biāo)包括準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1值(F1?Score),具體的計(jì)算公式如下:

        在解釋這些指標(biāo)之前,需要引入混淆矩陣,如表1所示。其中,TP表示將正例預(yù)測(cè)為正例的樣本;FP表示為將反例預(yù)測(cè)為正例的樣本;FN表示為將正例預(yù)測(cè)為反例的樣本;TN表示將反例預(yù)測(cè)為反例的樣本。

        在研究模型的泛化能力時(shí),按照預(yù)測(cè)結(jié)果的順序逐個(gè)將樣本作為正例進(jìn)行輸出,可以畫(huà)出ROC曲線和PR曲線,兩者皆能用于評(píng)價(jià)二分類(lèi)器的性能。但是ROC曲線無(wú)法有效地體現(xiàn)出樣本類(lèi)別不平衡時(shí)對(duì)模型產(chǎn)生的影響,容易呈現(xiàn)一個(gè)較為樂(lè)觀的結(jié)果;而PR曲線對(duì)于極度不平衡的數(shù)據(jù)集更為敏感。所以,本文采用PR曲線來(lái)直觀地展示不同模型之間的分類(lèi)性能。此外,PR曲線涉及一個(gè)重要指標(biāo),即AUPRC值。AUPRC的值為PR曲線下方的面積,當(dāng)PR曲線越靠近右上方或曲線下方面積越大時(shí),說(shuō)明模型分類(lèi)性能越好。

        2.5" 實(shí)驗(yàn)設(shè)置及結(jié)果分析

        為驗(yàn)證BiLSTM提取信用卡數(shù)據(jù)時(shí)序信息的有效性,本文比較了多個(gè)神經(jīng)網(wǎng)絡(luò)模型,如BP神經(jīng)網(wǎng)絡(luò)(BPNN)、長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)和門(mén)控循環(huán)單元(GRU)。以上模型都加入丟失率為0.1的Dropout層防止過(guò)擬合,使用二元交叉熵BinaryCrossentropy函數(shù)作為損失函數(shù),采用Adam優(yōu)化器更新網(wǎng)絡(luò)權(quán)重。為了提高評(píng)估結(jié)果的魯棒性和準(zhǔn)確性,在每個(gè)參數(shù)條件下均獨(dú)立進(jìn)行10次實(shí)驗(yàn),最終結(jié)果以10次實(shí)驗(yàn)的均值展現(xiàn)。將數(shù)據(jù)集按照7∶3的比例劃分為訓(xùn)練集和測(cè)試集,從準(zhǔn)確率、F1值和AUPRC值這三個(gè)評(píng)估指標(biāo)進(jìn)行對(duì)比,評(píng)價(jià)結(jié)果如表2所示。

        由于模型在訓(xùn)練集學(xué)習(xí)到了大量多數(shù)類(lèi)樣本的分布,對(duì)測(cè)試集中大量的多數(shù)類(lèi)樣本進(jìn)行了準(zhǔn)確的預(yù)測(cè),上述模型的準(zhǔn)確率都達(dá)到99.9%以上。然而,對(duì)于信用卡欺詐檢測(cè)問(wèn)題而言,檢測(cè)出欺詐交易要比檢測(cè)出正常交易更有價(jià)值,所以本文更加關(guān)注除準(zhǔn)確率之外的分類(lèi)評(píng)價(jià)指標(biāo)。從實(shí)驗(yàn)結(jié)果中可以發(fā)現(xiàn),BPNN的各項(xiàng)評(píng)價(jià)指標(biāo)最低,作為較為基礎(chǔ)的模型并不具備利用數(shù)據(jù)中潛在時(shí)序規(guī)律的能力。LSTM和GRU表現(xiàn)出了比BPNN更顯著的優(yōu)越性,但都不如具備雙向提取能力的BiLSTM。因此,本文將BiLSTM設(shè)置為信用卡欺詐檢測(cè)的基礎(chǔ)分類(lèi)器。從表2中還能看出,在結(jié)合了注意力機(jī)制后模型的性能得到提升,說(shuō)明利用注意力機(jī)制對(duì)信用卡欺詐進(jìn)行檢測(cè)是有效的。

        本文使用的數(shù)據(jù)集類(lèi)別分布十分不均勻,如果直接訓(xùn)練數(shù)據(jù)會(huì)導(dǎo)致模型泛化能力差,容易對(duì)多數(shù)類(lèi)樣本產(chǎn)生過(guò)擬合。雖然準(zhǔn)確率較高,但模型并沒(méi)有真正學(xué)習(xí)到如何分辨欺詐樣本。為解決上述問(wèn)題,需要對(duì)原始數(shù)據(jù)進(jìn)行過(guò)采樣操作。本文以BiLSTM?Attention為基礎(chǔ)模型,比較SMOTE算法、ADASYN算法、K?MeansSMOTE算法和WGAN算法過(guò)采樣對(duì)模型影響的差異,分別表示為Model1、Model2、Model3和Model4。其中SMOTE算法和ADASYN算法的K近鄰值設(shè)置為5,K?MeansSMOTE算法的簇?cái)?shù)量設(shè)置為27,WGAN算法的優(yōu)化器學(xué)習(xí)率和Dropout層神經(jīng)元丟失率分別設(shè)置為0.000 2和0.1,過(guò)采樣后的欺詐樣本與正常樣本的數(shù)量持平。基于過(guò)采樣方法的模型PR曲線如圖3所示。

        從圖3可以看出,基于WGAN過(guò)采樣的模型PR曲線基本處于其他曲線的最上方,即曲面下方的面積最大,表明其分類(lèi)性能為最優(yōu)。為詳細(xì)探究WGAN過(guò)采樣算法的優(yōu)越性,本文給出了具體的分類(lèi)評(píng)價(jià)結(jié)果,如表3所示。

        基于SMOTE算法和ADASYN算法過(guò)采樣的模型在精確率和F1指標(biāo)上都表現(xiàn)較差,表明其在過(guò)采樣過(guò)程中產(chǎn)生了過(guò)多的噪聲,致使模型學(xué)習(xí)到了不必要的數(shù)據(jù)分布。K?MeansSMOTE算法因其先聚類(lèi)再過(guò)采樣的特性,相較于前兩者來(lái)說(shuō),模型的綜合性能有著顯著提升,但仍遜于基于WGAN算法過(guò)采樣的模型。除了召回率略低于基于其他過(guò)采樣算法的模型外,WGAN?BiLSTM?Attention模型的其他分類(lèi)評(píng)價(jià)指標(biāo)都達(dá)到了最高,尤其是在評(píng)價(jià)不平衡分類(lèi)中更具意義的F1指標(biāo)和AUPRC指標(biāo)上。

        3" 結(jié)" 語(yǔ)

        隨著信用卡支付方式的廣泛普及,以及客戶群體中存在提前消費(fèi)的觀念,擴(kuò)大了信用卡欺詐違約交易的風(fēng)險(xiǎn)。為降低該風(fēng)險(xiǎn),本文提出了一種基于注意力機(jī)制優(yōu)化的WGAN?BiLSTM信用卡欺詐檢測(cè)方法。引入Wasserstein距離代替GAN的JS散度,增加對(duì)抗訓(xùn)練的穩(wěn)定性,通過(guò)WGAN生成符合目標(biāo)分布的欺詐樣本使得數(shù)據(jù)集達(dá)到平衡;利用BiLSTM對(duì)信用卡數(shù)據(jù)進(jìn)行雙向提取,充分捕捉其中的時(shí)序信息;結(jié)合注意力機(jī)制篩選關(guān)鍵特征,改善BiLSTM的整體記憶狀況。

        在歐洲持卡人數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文方法具有較高的準(zhǔn)確性,優(yōu)于其他對(duì)比模型,能夠勝任信用卡欺詐檢測(cè)任務(wù)。

        參考文獻(xiàn)

        [1] THENNAKOON A, BHAGYANI C, PREMADASA S, et al. Real?time credit card fraud detection using machine learning [C]// International Conference on Cloud Computing, Data Science amp; Engineering (Confluence). Noida, India: IEEE, 2019: 488?493.

        [2] WANG D S, CHEN B T, CHEN J. Credit card fraud detection strategies with consumer incentives [J]. Omega?international journal of management science, 2019, 88: 179?195.

        [3] MAKKI S, ASSAGHIR Z, TAHER Y, et al. An experimental study with imbalanced classification approaches for credit card fraud detection [J]. IEEE access, 2019, 7: 93010?93022.

        [4] BECKER A, BECKER J. Dataset shift assessment measures in monitoring predictive models [J]. Procedia computer science, 2021, 192: 3391?3402.

        [5] CHAWLA N V, BOWYER K W, HALL L O, et al. SMOTE: synthetic minority over?sampling technique [J]. Journal of artificial intelligence research, 2002, 16(1): 321?357.

        [6] YEN S J, LEE Y S. Under?sampling approaches for improving prediction of the minority class in an imbalanced dataset [J]. Lecture notes in control amp; information ences, 2006, 344(2): 731?740.

        [7] RTAYLI N, ENNEYA N. Enhanced credit card fraud detection based on SVM?recursive feature elimination and hyper?parameters optimization [J]. Journal of information security and applications, 2020, 55: 102596.

        [8] CHEN Ying, ZHANG Ruirui. Research on credit card default prediction based on K?Means SMOTE and BP neural network [J]. Complexity, 2021: 6618841.

        [9] ESENOGHO E, MIENYE I D, SWART T G, et al. A neural network ensemble with feature engineering for improved credit card fraud detection [J]. IEEE access, 2022, 10: 16400?16407.

        [10] HOCHREITER S, SCHMIDHUBER J. Long short?term memory [J]. Neural computation, 1997, 9(8): 1735?1780.

        [11] GAO J, SUN W J, SUI X. Research on default prediction for credit card users based on XGBoost?LSTM model [J]. Discrete dynamics in nature and society, 2021(2): 5080472.

        [12] BENCHAJI I, DOUZI S, EL OUAHIDI B, et al. Enhanced credit card fraud detection based on attention mechanism and LSTM deep model [J]. Journal of big data, 2021, 8(1): 151.

        [13] FOROUGH J, MOMTAZI S. Sequential credit card fraud detection: A joint deep neural network and probabilistic graphical model approach [J]. Expert systems, 2022, 39(1): e12795.

        [14] GOODFELLOW I, POUGET?ABADIE J, MIRZA M, et al. Generative adversarial nets [C]// Conference on Neural Information Processing Systems. Montreal, Canada: ACM, 2014: 2672?2680.

        [15] ARJOVSKY M, CHINTALA S, BOTTOU L. Wasserstein generative adversarial networks [C]// Proceeding of the 34th International Conference on Machine Learning. Sydney, Australia: ACM, 2017: 214?223.

        [16] NASH J F. Equilibrium points in N?Person games [J]. Proceedings of the national academy of sciences, 1950, 36(1): 48?49.

        [17] TRIPATHI B, SHARMA R K. EEG?based emotion classification in financial trading using deep learning: effects of risk control measures [J]. Sensors, 2023, 23(7): 3474.

        [18] CHENG X J. An attention embedded DUAL?LSTM method for financial risk early warning of the three new board?listed companies [J]. Peerj computer science, 2023(2): e1271.

        猜你喜歡
        欺詐信用卡注意力
        關(guān)于假冒網(wǎng)站及欺詐行為的識(shí)別
        關(guān)于假冒網(wǎng)站及欺詐行為的識(shí)別
        讓注意力“飛”回來(lái)
        警惕國(guó)際貿(mào)易欺詐
        信用卡資深用戶
        “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
        信用卡詐騙
        A Beautiful Way Of Looking At Things
        網(wǎng)購(gòu)遭欺詐 維權(quán)有種法
        辦信用卡透支還債夫妻均獲刑10年
        公民與法治(2016年6期)2016-05-17 04:10:39
        老熟女重囗味hdxx70星空| 日本办公室三级在线观看| 亚洲综合自拍偷拍一区| 色一情一乱一伦一视频免费看| 欧美巨大巨粗黑人性aaaaaa| 国产短视频精品区第一页| 国产视频一区二区三区在线看| 99久久免费中文字幕精品| 精品国产一区二区三区性色| 人妻少妇精品视频专区| 人妻无码中文字幕免费视频蜜桃 | 亚洲人成综合网站在线| 亚洲AV伊人久久综合密臀性色| 中文字幕亚洲精品第一页| 日韩精品极品免费视频观看 | 成人免费看吃奶视频网站| 中文字幕一区二区三区四区在线 | 亚洲国产天堂av成人在线播放| 粗大猛烈进出高潮视频大全| 国产青草视频在线观看| 99国产精品丝袜久久久久| 97超碰国产一区二区三区| 午夜精品久久久久久久| 久久精品国产亚洲av麻| 人人爽亚洲aⅴ人人爽av人人片| 国产三级不卡视频在线观看| 黄桃av无码免费一区二区三区 | 国产小屁孩cao大人免费视频| 国产一区二区不卡av| 国产精品无码无卡无需播放器| 香蕉久久人人97超碰caoproen | 日本一级三级在线观看| 在教室伦流澡到高潮hgl动漫 | 亚洲熟妇大图综合色区| 尤物蜜桃视频一区二区三区| 国产在线精品一区二区三区直播| 亚洲成aⅴ人在线观看| 国产一区二区三区av香蕉| 亚洲 欧美 偷自乱 图片| 亚洲精品中文字幕无码蜜桃| 亚洲熟妇中文字幕日产无码|