亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于圖數(shù)據(jù)庫與機器學習的業(yè)務安全風控平臺

        2020-03-07 06:44:10
        網(wǎng)絡安全技術與應用 2020年2期
        關鍵詞:黑產(chǎn)高斯分布分值

        (中國移動通信集團浙江有限公司 浙江 310000)

        1 引言

        隨著互聯(lián)網(wǎng)服務的快速發(fā)展,越來越多的業(yè)務服務從傳統(tǒng)的線下渠道遷移到在線、實時的平臺上。業(yè)務方為了培育市場,在運營和推廣方投入大量資金,取得巨大的經(jīng)濟效益和用戶體驗。但是,這也給互聯(lián)網(wǎng)“黑色產(chǎn)業(yè)”提供了滋生的土壤,各類風險問題層出不窮。不法分子不僅批量在線申請?zhí)柨ā⒁詧F伙形式進行薅羊毛行為,同時利用辦理的號碼進行套利、詐騙等危害社會行為。此類行為對中國移動造成營銷資金的損失,也對企業(yè)形象產(chǎn)生不良影響。

        2 用戶業(yè)務行為數(shù)據(jù)處理

        首先將對用戶的屬性信息及歷史行為數(shù)據(jù),利用規(guī)則匹配、統(tǒng)計分析等方法進行用戶業(yè)務行為特征刻畫,形成高度概括的自然特征和行為特征,為異常行為識別和基于圖數(shù)據(jù)庫異?!昂诋a(chǎn)”群體識別分析提供基礎數(shù)據(jù)支撐。其次,將用戶行為數(shù)據(jù)、標簽、特征等數(shù)據(jù),輸入到多模型融合的異常識別評分模型中計算用戶風險評分,通過分值將用戶的風險進行量化,為實時風控平臺和業(yè)務系統(tǒng)提供風險判斷依據(jù),同時根據(jù)風險評分表中的異常用戶,基于圖數(shù)據(jù)庫異?!昂诋a(chǎn)”群體識別分析。

        3 基于機器學習的異常行為識別

        提取上述所有用戶信息特征,采用算法模型計算各業(yè)務行為的異常分值,業(yè)務行為分值會遠遠高于正常頁面的分值。分別使用如下算法模型進行計算:GMM(高斯混合模型)、Local Outlier Factor(局部異常因子算法)、Isolation Forest(孤立森林),生成最終異常用戶業(yè)務行為分值表。通過添加閾值使每一個算法都有決策權,最終通過組合模型管用的投票機制選擇異常。

        3.1 高斯混合模型(Gaussian Mixed Model,GMM)

        高斯混合模型也是一種常見的聚類算法,與kmeans 算法類似,同樣是使用了EM 算法進行迭代計算。高斯混合模型假設每個簇的數(shù)據(jù)都是符合高斯分布(通常稱為正態(tài)分布)的當前數(shù)據(jù)呈現(xiàn)的分布就是各個簇的高斯分布疊加在一起的結果。如果只用一個高斯分布來擬合圖中的數(shù)據(jù),就會出現(xiàn)一個橢圓(二倍標準差的高斯分布)。但是可以直觀的來看,數(shù)據(jù)明顯分為兩簇,因此只用一個高斯分布來擬合是不合理的,需要推廣到多個高斯分布的疊加來對數(shù)據(jù)進行擬合。

        3.2 局部異常因子檢測(Local Outlier Factor )

        局部離群因子通過計算一個數(shù)值score來反映一個樣本的異常程度。一個樣本點周圍的樣本點所處位置的平均密度比上該樣本點所在位置的密度。

        (1)設定k值,對指定點A找到最鄰近k個點;

        (2)計算A點到這些點的歐式距離記為,其中最大距離為A點可探測距離:

        (3)求出局部可達密度:

        (4)同樣的方法對其他點的進行計算,算出局部異常因子:

        (5)最終設定閾值,輸出異常點。

        3.3 Isolation Forest(孤立森林算法模型)

        孤立森林屬于一種無參數(shù)的非監(jiān)督算法,他是一種偵測異常十分有效的組合算法,底層用的是決策樹。

        (1)建立n個決策樹模型;

        (2)隨機抽取樣本數(shù)據(jù)輸入這n個模型進行訓練(隨機按最大最小切割),切到指定異常數(shù)據(jù)比例為止;

        (3)利用n個決策樹進行投票,求出異常系數(shù);

        (4)Isolation Forest 結果如圖1。

        圖1 孤立森林算法結果

        3.4 多模型融合機器學習算法利用上面三個模型做組合模型處理

        通過GMM、Local Outlier Factor、Isolation Forest 算法構建多模型融合的一種無監(jiān)督機器學習模型。這種多模型融合的機器學習算法,綜合了GMM、Local Outlier Factor、Isolation Forest 算法模型之間的優(yōu)點,具有以下優(yōu)點:首先,從統(tǒng)計的方面來看,由于學習任務的假設空間往往很大,可能有多個假設在訓練集上達到同等性能,此時若使用單學習器可能因誤選而導致泛化性能不佳,結合多個學習器則會減小這一風險;第二,從計算的方面來看,GMM 算法往往會陷入局部極小,有的局部極小點所對應的泛化性能可能很糟糕,而通過GMM、Local Outlier Factor、Isolation Forest 多次運行之后進行結合,可降低陷入糟糕局部極小點的風險,特別是Isolation Forest對內存要求低,且處理速度快,具有線性時間復雜度,因為是ensemble的方法,所以可以用在含有海量數(shù)據(jù)的數(shù)據(jù)集上面;第三,從表示的方面來看,某些學習任務的真實假設可能不在當前學習算法所考慮的假設空間中,此時若使用單學習器則肯定無效,而通過結合多個學習器,由于相應的假設空間有所擴大,有可能學得更好的近似。本文通過GMM、Local Outlier Factor、Isolation Forest 算法構建多模型融合。

        4 基于圖數(shù)據(jù)庫的群體識別模型

        基于某次注冊業(yè)務推廣活動的相關數(shù)據(jù),注冊推廣頁面,出現(xiàn)多個賬號推廣注冊并獲取積分成功后,向同一手機號碼兌換積分的現(xiàn)象,疑似出現(xiàn)黑產(chǎn)薅羊毛現(xiàn)象。為了明確目前面臨的安全風險,并在此基礎上,尋求整體、可靠和完善的解決方案,基礎架構組對注冊頁面進行了安全檢測,并根據(jù)電子渠道后臺的數(shù)據(jù)信息進行多維度分析,同時利用外部黑產(chǎn)情報庫進行數(shù)據(jù)比對,發(fā)現(xiàn)此次活動推廣,存在明顯的黑產(chǎn)“薅羊毛”特征:攻擊者利用(或者偽造)大量終端和代理IP,在活動中注冊大量的賬號,借此獲取積分后兌換優(yōu)惠券。

        基于此次注冊業(yè)務推廣活動的相關數(shù)據(jù),我們發(fā)現(xiàn)本次營銷活動,存在明顯的黑產(chǎn)薅羊毛特征:攻擊者利用(或者偽造)大量終端(利用IMEI標識)和代理IP,在活動注冊大量的賬號,然后獲取積分后兌換優(yōu)惠券。設計圖數(shù)據(jù)庫的Schema 與數(shù)據(jù)導入。

        5 總結

        本文分析了電子渠道存在的業(yè)務安全風險問題,尤其是從事“黑產(chǎn)”活動的用戶行為,不僅損害了電子渠道本身的利益,同時也危害了正常用戶的業(yè)務活動體驗以及正常市場秩序。就上述問題,本文創(chuàng)新性地提出一種基于圖數(shù)據(jù)庫與機器學習的業(yè)務安全風控平臺,可以很好地保障電子渠道中的業(yè)務安全,一方面通過使用GMM、Local Outlier Factor、Isolation Forest算法構建多模型融合的一種無監(jiān)督機器學習模型,有效識別電子渠道中存在的異常“黑產(chǎn)”行為用戶;另一方面,基于圖數(shù)據(jù)庫識別出異?!昂诋a(chǎn)”群體,以群體的視角發(fā)現(xiàn)異?!昂诋a(chǎn)”,可以發(fā)現(xiàn)更多從事異?;顒拥馁~戶,做到以點帶面的效果。

        猜你喜歡
        黑產(chǎn)高斯分布分值
        一起來看看交通違法記分分值有什么變化
        工會博覽(2022年8期)2022-06-30 12:19:30
        利用Box-Cox變換對移動通信中小區(qū)級業(yè)務流量分布的研究
        2種非對稱廣義高斯分布模型的構造
        養(yǎng)號黑產(chǎn)愈演愈烈
        騰訊發(fā)布:《2018上半年互聯(lián)網(wǎng)黑產(chǎn)研究報告》
        150萬網(wǎng)絡黑產(chǎn)從業(yè)者 正盯著你的個人隱私
        新技術能幫助消滅黑產(chǎn)嗎?
        一種基于改進混合高斯模型的前景檢測
        宿遷城鎮(zhèn)居民醫(yī)保按病種分值結算初探
        病種分值結算模式下的醫(yī)療監(jiān)管之實踐與啟示
        91尤物视频在线观看| 亚洲精品国产成人久久av盗摄 | 能看不卡视频网站在线| 亚洲av成人一区二区三区本码| 又大又长粗又爽又黄少妇视频| 成人片黄网站色大片免费观看cn | 抖射在线免费观看视频网站| 东京热加勒比久久精品| 精品亚洲国产成人| 99re热视频这里只精品| 国内无遮码无码| 国产在线观看精品一区二区三区| 日韩激情av不卡在线| 成人影院在线观看视频免费| 久久精品国产亚洲7777| 欧美gv在线观看| 国产91一区二这在线播放| av在线男人的免费天堂| 一区二区三区av在线| 激情内射亚洲一区二区三区| 免费看泡妞视频app| av一区二区三区亚洲| 极品少妇在线观看视频| 白白在线视频免费观看嘛| 女人色熟女乱| 欧美aa大片免费观看视频| 无码高潮久久一级一级喷水| 成年男女免费视频网站点播| 97se色综合一区二区二区| 日日碰狠狠躁久久躁9| 熟妇无码AV| 日韩av不卡一二三区| 亚洲第一区二区精品三区在线| 欲求不満の人妻松下纱荣子| 99久久99久久精品国产片果冻| 亚洲无码中文字幕日韩无码| 国产视频一区二区三区久久亚洲| 日韩午夜福利无码专区a| 日韩亚洲av无码一区二区三区| 中文字幕人成人乱码亚洲| av毛片亚洲高清一区二区|