亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電子商務(wù)平臺(tái)用戶信用消費(fèi)風(fēng)險(xiǎn)評(píng)估方法

        2019-05-22 10:29:16陳浩
        商場(chǎng)現(xiàn)代化 2019年3期
        關(guān)鍵詞:風(fēng)險(xiǎn)評(píng)估電子商務(wù)

        摘 要:本文基于國(guó)內(nèi)某電子商務(wù)平臺(tái)的用戶購(gòu)買行為數(shù)據(jù),分別利用邏輯回歸、支持向量機(jī)、隨機(jī)森林和Xgboost建立信用評(píng)估模型,通過(guò)AUC值和F1得分比較各個(gè)模型的優(yōu)劣,最終對(duì)表現(xiàn)優(yōu)異的模型進(jìn)行再次融合,從而提高電子商務(wù)平臺(tái)風(fēng)險(xiǎn)評(píng)估效率。

        關(guān)鍵詞:電子商務(wù);信用消費(fèi);風(fēng)險(xiǎn)評(píng)估;Xgboost;模型融合

        一、引言

        基于信息技術(shù)誕生的電子商務(wù),極大地豐富了人們的消費(fèi)方式。電子商務(wù)平臺(tái)的出現(xiàn)打破了傳統(tǒng)商務(wù)模式中區(qū)域以及國(guó)界的各種壁壘,與三方支付平臺(tái)的有效結(jié)合將傳統(tǒng)商務(wù)模式的購(gòu)買行為變得更加高效便捷,還產(chǎn)生了像“花唄”這樣的信用消費(fèi)產(chǎn)品。與此同時(shí)也產(chǎn)生了一些問(wèn)題,電子商務(wù)的虛擬化雖然令各類信息更加易得,但各種虛假信息摻雜其中,尤其在信用消費(fèi)中,不少用戶忽視規(guī)則使用信用消費(fèi)導(dǎo)致不能按時(shí)還款,甚至給了一些不法分子惡意消費(fèi)的機(jī)會(huì)。因此本文基于電子商務(wù)平臺(tái)用戶消費(fèi)行為數(shù)據(jù)構(gòu)建信用評(píng)估模型給用戶提供合理信用消費(fèi)權(quán)限。

        二、模型選擇

        本文分別利用邏輯回歸、支持向量機(jī)、隨機(jī)森林建立信用評(píng)估模型,通過(guò)AUC值和F1得分比較各個(gè)模型的優(yōu)劣,最終對(duì)表現(xiàn)優(yōu)異的模型進(jìn)行再次融合,從而提高互聯(lián)網(wǎng)金融用戶風(fēng)險(xiǎn)評(píng)估效率。

        三、數(shù)據(jù)處理和模型評(píng)價(jià)

        1.數(shù)據(jù)描述

        本文選取了國(guó)內(nèi)某電子商務(wù)平臺(tái)的用戶購(gòu)買和支付行為數(shù)據(jù)作為研究目標(biāo)。數(shù)據(jù)集包括Master、Log_Info、Userupdate_Info三個(gè)部分。Master表中包含了用戶的學(xué)歷學(xué)籍、社交行為等字段,Log_Info表中主要有用戶終端日常操作行為字段,Userupdate_Info表里存儲(chǔ)了用戶修改相關(guān)信息的行為字段,三部分基礎(chǔ)數(shù)據(jù)集共包含228個(gè)特征信息。

        2.數(shù)據(jù)處理

        對(duì)缺失值的處理,總的來(lái)說(shuō)分為刪除法和插補(bǔ)法。在征信領(lǐng)域,用戶信息的完整程度可能會(huì)影響該用戶的評(píng)級(jí)。本文分別從用戶屬性缺失率(按行)和特征缺失率(按列)兩個(gè)角度對(duì)缺失數(shù)據(jù)進(jìn)行了處理。

        特征缺失率是指對(duì)于某個(gè)特定屬性,缺失樣本數(shù)占總樣本數(shù)的比率。圖1顯示的是存在缺失的屬性及對(duì)應(yīng)的缺失比率。指標(biāo)WeblogInfo_3及WeblogInfo_1變量的缺失率為0.967,這兩列屬性能夠提供的信息量極少,可以直接剔除。UserInfor_11、UserInfor_12、UserInfor_13三個(gè)變量的缺失率為0.63,這三個(gè)變量均為分類變量,這種情況下可以將缺失值用當(dāng)作分類變量的一個(gè)類別處理。

        用戶屬性缺失率指的是對(duì)于某個(gè)具體用戶而言其所有指標(biāo)中缺失指標(biāo)數(shù)占總指標(biāo)數(shù)的比率。本文統(tǒng)計(jì)了訓(xùn)練樣本及測(cè)試樣本中每個(gè)用戶的缺失屬性個(gè)數(shù),并且按照缺失個(gè)數(shù)進(jìn)行排序,以排序序號(hào)為橫軸缺失個(gè)數(shù)為縱軸,畫出圖2,從圖中可以看出,屬性缺失個(gè)數(shù)呈現(xiàn)階梯裝上升的特點(diǎn),說(shuō)明缺失個(gè)數(shù)這個(gè)特征可以有效的將用戶群體區(qū)分開(kāi)。本文將缺失個(gè)數(shù)作為一個(gè)離散變量加入到訓(xùn)練集中。

        其中x是原始數(shù)據(jù),μ是x的均值,μ是x的標(biāo)準(zhǔn)差,歸一化之后的數(shù)據(jù)由于對(duì)方差進(jìn)行了統(tǒng)一,這時(shí)候每個(gè)維度的量綱其實(shí)已經(jīng)等價(jià)了,避免了不同量綱的選取對(duì)距離計(jì)算產(chǎn)生的巨大影響。本文對(duì)分類變量采用獨(dú)熱編碼處理。

        數(shù)據(jù)挖掘算法需要基于豐富的特征空間才能發(fā)揮良好的性能,單用原始數(shù)據(jù)的特征空間進(jìn)行建模往往達(dá)不到理想的效果。本文針對(duì)Log_Info、Userupdate_Info兩表,從中提取用戶修改個(gè)人信息的特征以及登陸狀態(tài)特征如:修改次數(shù)、修改時(shí)間、登陸天數(shù)等。特征提取完成之后又對(duì)數(shù)據(jù)特征進(jìn)行了組合。

        3.分類模型評(píng)價(jià)

        精確率、召回率、AUC、F1等都是用來(lái)評(píng)價(jià)二分類模型好壞的指標(biāo),參照表1,精確率的計(jì)算方式為TP/(TP+FP),即為在預(yù)測(cè)為壞人的人中,預(yù)測(cè)正確的人占比。召回率的計(jì)算方式為TP/(TP+FN),即為在實(shí)際為壞人的人中,預(yù)測(cè)正確的人占比。F1值是精確率和召回率的調(diào)和均值,即F1=2PR/(P+R),相當(dāng)于精確率和召回率的綜合評(píng)價(jià)指標(biāo)。

        四、實(shí)驗(yàn)結(jié)果和分析

        實(shí)驗(yàn)利用python語(yǔ)言實(shí)現(xiàn),模型的表現(xiàn)采用AUC值和F1分?jǐn)?shù)來(lái)衡量。其中LR、SVM、RF模型借助Scikit-Learn機(jī)器學(xué)習(xí)庫(kù)進(jìn)行訓(xùn)練,Xgboost模型是借助xgboost庫(kù)進(jìn)行訓(xùn)練。其中在訓(xùn)練Xgboost模型時(shí),先通過(guò)網(wǎng)格尋參法確定一組良好的參數(shù)得到模型XGB_1,接著結(jié)合bagging思想,對(duì)這組參數(shù)施加一個(gè)小范圍的隨機(jī)干擾,得到另外兩組模型XGB_2、XGB_3。最終將LR、SVM、RF、XGB_1、XGB_2、XGB_3六組模型進(jìn)行融合得到Model_all。從下表中模型表現(xiàn)來(lái)看,集成學(xué)習(xí)方法和模型融合方法對(duì)信用評(píng)估效果有顯著的提高。

        五、結(jié)束語(yǔ)

        本文基于電子商務(wù)平臺(tái)用戶消費(fèi)和支付行為數(shù)據(jù),使用單個(gè)模型、集成模型、模型融合三種方式對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行擬合得到6組模型,并計(jì)算了每個(gè)模型的AUC值和F1得分,對(duì)比實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn):集成學(xué)習(xí)算法的信用評(píng)估效果要優(yōu)于單個(gè)模型;對(duì)模型進(jìn)行再次融合能進(jìn)一步提高預(yù)測(cè)的效果。

        參考文獻(xiàn):

        [1]朱曉明,劉治國(guó).信用評(píng)分模型綜述[J].統(tǒng)計(jì)與決策,2007(2):103-105.

        [2]Altman E I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy[J].The Journal of Finance,1968,23(4):589-609.

        [3]WIGINTON J C. A note on the comparison of logic and discriminate models of consumer credit Behavior[J].Journal of Financial & Quantitative Analysis,1980,15(3):757-770.

        作者簡(jiǎn)介:陳浩(1993- ),男,漢族,江蘇南通人,單位:南京郵電大學(xué)經(jīng)濟(jì)學(xué)院,2016級(jí)研究生,應(yīng)用統(tǒng)計(jì)專業(yè)

        猜你喜歡
        風(fēng)險(xiǎn)評(píng)估電子商務(wù)
        2025年我國(guó)農(nóng)村電子商務(wù)交易額達(dá)到2.8萬(wàn)億元
        《電子商務(wù)法》如何助力直銷
        電子商務(wù)
        網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估的關(guān)鍵技術(shù)
        鉛銻冶煉污染場(chǎng)地周邊土壤鉛污染特征及潛在生態(tài)危害評(píng)價(jià)
        我國(guó)養(yǎng)老保險(xiǎn)基金投資運(yùn)營(yíng)的風(fēng)險(xiǎn)評(píng)估
        天然氣開(kāi)采危險(xiǎn)有害因素辨識(shí)及風(fēng)險(xiǎn)評(píng)估管理
        現(xiàn)代風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)局限性及其對(duì)策研究
        中小企業(yè)財(cái)務(wù)管理問(wèn)題研究
        關(guān)于加快制定電子商務(wù)法的議案
        91久久偷偷做嫩模影院| 色窝窝免费播放视频在线| 亚洲色偷偷色噜噜狠狠99| 色综合999| 蜜桃成人精品一区二区三区| 91麻豆精品国产91久久麻豆| 日本熟妇人妻xxxx| 亚洲av无码之国产精品网址蜜芽| 草莓视频成人| 久久久精品人妻一区二区三区日本| 亚洲精品自产拍在线观看| 亚洲AV乱码毛片在线播放| 中文字幕一区二区三区四区久久| 亚洲伊人伊成久久人综合| 亚洲中文av中文字幕艳妇| 精品久久久久久无码中文野结衣| 中国人妻被两个老外三p| 四川丰满少妇被弄到高潮| 亚洲国产欧美另类va在线观看| 国产大学生自拍三级视频| 精品三级国产一区二区三| 99久久99久久久精品齐齐| 欧美人与动牲猛交xxxxbbbb| 国产精品香蕉在线观看| 久久精品视频中文字幕无码| 国产一区二区三区四区在线视频 | 夜夜爽妓女8888888视频| 亚洲精品无码久久久久| 玩弄放荡人妻一区二区三区| 亚洲AV专区一专区二专区三| 隔壁的日本人妻bd高清中字| 精品香蕉99久久久久网站| 少妇被猛男粗大的猛进出| 国产日韩欧美911在线观看| 精品av一区二区在线| 亚洲高清三区二区一区| 国产在线 | 中文| 亚洲国产欧美在线成人| 少妇被日到高潮的视频| 久久久国产精品首页免费| 亚洲tv精品一区二区三区|