亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于殘差連接與自注意力機制的圖卷積神經(jīng)網(wǎng)絡(luò)在詐騙用戶檢測中的應(yīng)用

        2025-03-05 00:00:00斯彬洲孫海春
        電腦知識與技術(shù) 2025年3期

        關(guān)鍵詞:電信詐騙;圖神經(jīng)網(wǎng)絡(luò);殘差連接;自注意力機制;用戶檢測

        中圖分類號:TP391 文獻標識碼:A

        文章編號:1009-3044(2025)03-0001-05 開放科學(資源服務(wù)) 標識碼(OSID) :

        0引言

        隨著互聯(lián)網(wǎng)絡(luò)的快速發(fā)展,網(wǎng)絡(luò)犯罪呈現(xiàn)增長趨勢且形式多樣化,其中電信網(wǎng)絡(luò)詐騙已成為近年來嚴重的社會問題。詐騙分子的手段不斷升級,涉及范圍廣泛,嚴重侵害了公眾的財產(chǎn)安全和社會穩(wěn)定[1]。盡管詐騙活動隱匿于網(wǎng)絡(luò)之中,但在與受害者交涉的過程中,不可避免地會在通信網(wǎng)絡(luò)中留下痕跡。這些痕跡包含了移動設(shè)備終端基本的通信網(wǎng)絡(luò)記錄,即CDR數(shù)據(jù)。利用這些數(shù)據(jù)識別潛在的詐騙分子,從而打擊電信詐騙犯罪,是一個行之有效的途徑。

        傳統(tǒng)的機器學習和深度學習算法能夠從大量的電信數(shù)據(jù)中學習復(fù)雜的模式和規(guī)律,從電信流層面識別潛在的欺詐行為。其中,圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Networks,GNN) 因其能夠同時融合節(jié)點實體屬性以及節(jié)點之間的拓撲結(jié)構(gòu),而在圖欺詐檢測領(lǐng)域得到了廣泛應(yīng)用[2-5]。然而,現(xiàn)有研究仍面臨一些挑戰(zhàn),例如數(shù)據(jù)稀疏性導致的網(wǎng)絡(luò)結(jié)構(gòu)不完整、節(jié)點關(guān)系不明確以及模型過度平滑等問題[6-7],這些問題影響了最終的檢測效果。為此,本文提出了一種融合殘差連接和自注意力機制的圖卷積神經(jīng)網(wǎng)絡(luò)模型,用于電信詐騙用戶的檢測。

        本文的主要貢獻如下:

        1)提出了一種結(jié)合殘差連接和自注意力機制的圖卷積神經(jīng)網(wǎng)絡(luò)模型,增強了模型的穩(wěn)定性和特征表示能力,適用于電信詐騙用戶檢測任務(wù)。

        2)設(shè)計了特征提取和鏈路預(yù)測方法,對原始稀疏數(shù)據(jù)進行圖重建,充分利用了圖神經(jīng)網(wǎng)絡(luò)的優(yōu)勢。

        3)在真實的運營商CDR數(shù)據(jù)集上進行了實驗,結(jié)果表明所提模型在各項指標上均優(yōu)于現(xiàn)有基線模型,驗證了方法的有效性和優(yōu)越性。

        1 基于殘差連接和自注意力機制的詐騙用戶檢測模型

        如圖1所示,提出的詐騙用戶檢測模型主要包含4個模塊:輸入層、特征提取層、鏈路預(yù)測層以及DNN 網(wǎng)絡(luò)層??傮w來說,需要對收集到的CDR元數(shù)據(jù)首先進行特征提取,然后通過特征轉(zhuǎn)換和縮放得到每個用戶,即圖神經(jīng)網(wǎng)絡(luò)中每個節(jié)點的特征矩陣。在鏈路預(yù)測層中,選擇多個特征計算不同節(jié)點的整體相似度,設(shè)置相似度閾值進行鏈路預(yù)測,預(yù)測結(jié)果輸出為圖神經(jīng)網(wǎng)絡(luò)節(jié)點之間的邊。最后,將節(jié)點特征和節(jié)點之間的拓撲結(jié)構(gòu)輸入到DNN模塊中,完成對用戶節(jié)點的分類。接下來對主要模塊進行詳細說明。

        1.1 特征提取模塊

        在CDR元數(shù)據(jù)中,包含電信用戶通訊行為的原始字段數(shù)據(jù)。這些數(shù)據(jù)離散程度較高,無法直接用于分析和建模,因此需要進行特征工程提取。然而,特征提取過程中存在兩個主要問題:

        1)不同維度的數(shù)據(jù)量級可能不一致,可能導致數(shù)據(jù)的偏態(tài)分布問題,從而影響分類檢測的魯棒性。

        2)同一維度的數(shù)據(jù)可能不服從正態(tài)分布,數(shù)據(jù)之間差異較大。

        為了解決上述問題,本文首先對數(shù)據(jù)進行特征變換,采用Yeo-Johnson變換以提高數(shù)據(jù)的正態(tài)性、對稱性和方差一致性。隨后,對數(shù)據(jù)進行歸一化處理,將每一維度的數(shù)據(jù)縮放到相同的尺度,避免極端值的影響,從而提高模型性能并降低計算成本。

        本文將元數(shù)據(jù)的特征提取過程分為兩大類:

        1)用戶行為特征:直接從數(shù)據(jù)集中提取用戶的消費行為、App使用流量、呼叫行為、通話偏好等,共計24維特征。具體字段名稱見2.1實驗部分。

        2)統(tǒng)計特征:對每個維度的行為特征進行統(tǒng)計分析,計算中位數(shù)、平均數(shù)、總和、方差、偏度、標準差和分位數(shù)等,生成額外的特征維度。對于包含M個維度的元數(shù)據(jù)集D,可以統(tǒng)計每一個節(jié)點在第K 維度上的統(tǒng)計特征,生成特征向量,其表示公式為:

        2 實驗及分析

        2.1 實驗數(shù)據(jù)

        本文實驗采用了2020年四川省大數(shù)據(jù)中心組織的首屆四川省人工智能創(chuàng)新大賽發(fā)布的關(guān)于電信詐騙用戶檢測的公開數(shù)據(jù)集,由運營商進行脫敏處理后發(fā)布。數(shù)據(jù)集包含了四川23個城市的 6106個電信用戶在 2019年8月至2020年3月期間的真實CDR數(shù)據(jù),其中包括4144個正常用戶和1962 個涉詐用戶。

        數(shù)據(jù)集包含 4個子集:應(yīng)用使用記錄(App) 、短信記錄(SMS) 、語音記錄(VOC)和消費記錄(USER) 。各類數(shù)據(jù)字段不同,以語音記錄(VOC)為例,包含用戶的語音通信對象、呼叫類型、通話時長、對方市縣以及設(shè)備的國際移動設(shè)備識別碼。

        數(shù)據(jù)集中包含的數(shù)據(jù)字段如表1所示。

        上述內(nèi)容均為用戶的行為特征,對這些元素字段進行統(tǒng)計后生成用戶的統(tǒng)計特征。本文對每一個節(jié)點最終使用了55維的特征表示。

        2.2實驗設(shè)置

        實驗環(huán)境:操作系統(tǒng)為 Ubuntu 20.04,編程語言為 Python 3.8,深度學習框架為 PyTorch 1.11.0。硬件配置包括 RTX 3090顯卡和14核 Intel Xeon Platinum8362 CPU @ 2.80GHz的服務(wù)器。

        模型參數(shù)設(shè)置:在模型訓練過程中,設(shè)置了兩個Res-Attention GCN模塊,每個模塊包含 2層GCN,節(jié)點嵌入維度設(shè)為 16。學習率設(shè)定為0.01,dropout率為0.01,優(yōu)化器采用 Adam 算法。對特征選擇進行了優(yōu)化,從 55維特征中選取了與詐騙檢測最相關(guān)的8類主要特征,用于圖的重建。相似度閾值設(shè)置為0.2,該值通過多次實驗驗證,能夠在保持圖連通性的同時避免過多噪聲邊的引入。最終構(gòu)建的圖包含6106個節(jié)點,平均節(jié)點度為136.33。

        2.3基線對比方法

        對比的基線方法主要是目前使用較為廣泛的圖神經(jīng)網(wǎng)絡(luò)方法,包括 Play2vec、Care-GNN、GCN、GAT和BTG。

        基線模型一:Care-GNN[10]:與強化學習相結(jié)合的圖神經(jīng)網(wǎng)絡(luò)模型。

        基線模型二:Play2vec[11]:基于元路徑的異質(zhì)圖神經(jīng)網(wǎng)絡(luò)。

        基線模型三:BTG:一種端到端的稀疏圖分類模型。

        基線模型四:GCN:基礎(chǔ)的圖卷積神經(jīng)網(wǎng)絡(luò),采用三層網(wǎng)絡(luò)架構(gòu)。

        基線模型五:GAT[12]:基于圖注意力的圖神經(jīng)網(wǎng)絡(luò)。

        2.4實驗結(jié)果

        評價指標:本文采用了5個評價指標用于實驗效果評價,分別是AUC、精度、召回率、準確率以及F1值。主要公式表示如下:

        式中:FP為負樣本中被分類器錯誤預(yù)測為正樣本的個數(shù);TN為正樣本中被分類器正確預(yù)測為負樣本的個數(shù);FN為負樣本中被分類器正確預(yù)測為負樣本的個數(shù);TP為正樣本中被分類器正確預(yù)測為正樣本的個數(shù)。為了更加全面地評估本文所采用的模型框架,實驗采用了訓練集比例分別為 10%、20%、40%、60%時的模型測試結(jié)果,最終的實驗結(jié)果見表2。

        從表2可以看出,本文提出的模型在不同訓練集比例下的各項指標均優(yōu)于對比模型。在訓練集比例為60%時,本文方法的AUC達到0.9442,F(xiàn)1值達到0.8842,表明模型具有較高的檢測準確率和較好的穩(wěn)定性。

        與其他基線模型相比,本方法的優(yōu)勢主要體現(xiàn)在以下方面:

        1)殘差連接的引入:增強了模型的深度學習能力,緩解了過度平滑問題。

        2)自注意力機制的應(yīng)用:提高了特征聚合的精確性,能夠自適應(yīng)地分配鄰居節(jié)點的權(quán)重。

        同時也注意到,所有模型的召回率相對較低,這可能是由于數(shù)據(jù)集中類別不平衡所致。未來可以考慮采用數(shù)據(jù)平衡技術(shù)或代價敏感的學習方法來進一步提高召回率。

        2.5消融實驗

        為了評估殘差模塊和自注意力模塊對模型性能的影響,分別將這兩個模塊從原始模型中移除,進行了兩組消融實驗,并與原始模型進行了比較。實驗均采用訓練集60%比例進行訓練,實驗結(jié)果如圖3所示。

        實驗結(jié)果顯示,移除這兩個模塊后,模型的整體性能下降較為明顯。去除殘差模塊后,準確率、召回率、精確率和F1值分別下降了2.06%、2.54%、1.71%、2.04%。這說明保留節(jié)點原始的特征信息流的確是必要的,沒有殘差連接,網(wǎng)絡(luò)的特征傳播會受到一定限制,且在圖卷積層數(shù)增加后表現(xiàn)不夠穩(wěn)定。同時,去除注意力模塊后,指標分別下降了1.76%、3.37%、1.58%、2.33%。這表明圖注意力機制能夠考慮不同鄰居節(jié)點特征對中心節(jié)點檢測的重要性差異,從而提高特征聚合的精度。

        3 結(jié)束語

        本文提出了一種基于殘差連接和自注意力機制相結(jié)合的圖卷積神經(jīng)網(wǎng)絡(luò)模型,用于電信網(wǎng)絡(luò)詐騙用戶的檢測。通過特征提取和鏈路預(yù)測,構(gòu)建了稠密的圖結(jié)構(gòu),成功解決了原始數(shù)據(jù)稀疏的問題。引入殘差連接增強了模型的穩(wěn)定性,結(jié)合自注意力機制提升了特征聚合的精度。實驗結(jié)果表明,所提方法在F1值等指標上均優(yōu)于多個基線模型,驗證了模型的有效性和優(yōu)越性。

        該模型在電信詐騙檢測任務(wù)中的表現(xiàn),尤其在高維稀疏數(shù)據(jù)場景下,展示了出色的識別潛在詐騙用戶的能力,具有較強的實際應(yīng)用價值。同時,模型設(shè)計合理,具備進一步推廣應(yīng)用的潛力。

        未來的研究中,可以針對數(shù)據(jù)的稀疏性和類別不平衡性,進一步優(yōu)化模型,例如:

        1)數(shù)據(jù)增強:通過生成合成樣本或使用數(shù)據(jù)重采樣技術(shù),增加正負樣本的數(shù)量,提升模型的泛化能力和魯棒性。

        2)模型結(jié)構(gòu)優(yōu)化:探索更復(fù)雜的圖神經(jīng)網(wǎng)絡(luò)架構(gòu),如引入圖自編碼器或變分圖自動編碼器,提升模型的表達能力。

        3)實時應(yīng)用:研究模型在實際公安系統(tǒng)中的應(yīng)用,結(jié)合用戶行為的實時數(shù)據(jù)進行動態(tài)更新和預(yù)警,提高對新型網(wǎng)絡(luò)詐騙的檢測能力。

        日本最大色倩网站www| 国产精品福利小视频| 精品国产你懂的在线观看| 精品一区二区三区不老少妇| 亚洲成人免费久久av| 国产3p一区二区三区精品| 99国产精品99久久久久久| 女人被弄到高潮的免费视频| 国产亚洲人成a在线v网站| 精品无码久久久久久久动漫| 2021av在线| 人妻精品久久久一区二区| 男女上床免费视频网站| 欲女在线一区二区三区| 无码一区二区三区亚洲人妻| 亚洲乱码日产精品bd在线观看 | 男ji大巴进入女人的视频小说| 欧美aⅴ在线| 国产九九在线观看播放| 国产精品不卡在线视频| 青青草在线免费视频播放| 潮喷失禁大喷水aⅴ无码| 免费人成在线观看视频播放| 少妇太爽了在线观看免费视频| 亚洲黄色在线看| 国产女主播视频一区二区三区| 国产精品一区久久综合| 成人丝袜激情一区二区| 日本又黄又爽gif动态图| 国产午夜亚洲精品不卡福利| 亚洲亚洲亚洲亚洲亚洲天堂| 亚洲av香蕉一区二区三区av| 色综合久久88色综合天天| 精品人体无码一区二区三区| 亚洲三级香港三级久久| 亚洲视频一区二区三区免费| 极品尤物人妻堕落沉沦| 国产特级毛片aaaaaa高清| 亚洲精品乱码久久久久99| 人妻熟女中文字幕av| 日韩精品成人区中文字幕|