亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關于金融機構個人貸款的需求預測

        2020-09-10 10:37:28陳方圓
        商業(yè)2.0-市場與監(jiān)管 2020年2期
        關鍵詞:線性回歸信用貸款互聯(lián)網(wǎng)金融

        摘要:金融機構小額信用貸款產(chǎn)品是個人金融業(yè)務的一種,以其方便、快捷的特性深受用戶喜愛。該產(chǎn)品通過預審批機制為用戶提供特定額度的貸款服務,金融機構除了要評估用戶的風險之外,還需要預測用戶的借款需求,以此來準備合適的額度,降低資金占用成本,同時提升用戶使用體驗。本文借助于大數(shù)據(jù)的專業(yè)技術手段,通過引入一些數(shù)據(jù)挖掘算法,嘗試對用戶的信貸需求進行準確的預測,旨在用互聯(lián)網(wǎng)金融的思路為上述問題提供理性地判斷和一種科學解決方案。

        關鍵詞:個人貸款;信用貸款;互聯(lián)網(wǎng)金融;大數(shù)據(jù);線性回歸;GBDT

        1.研究背景

        近年來,針對個人用戶的小額信用貸款已成為一項成熟的業(yè)務,目前發(fā)展勢頭良好。此類業(yè)務多通過手機客戶端來進行操作,一些金融機構,如銀行、互聯(lián)網(wǎng)金融機構利用個人用戶預留的基本信息和一些歷史信息等來對用戶的個人征信及貸款額度進行評估,自動生成貸款方案,多數(shù)情況下不需要人為介入。此項業(yè)務由于辦理快捷、流程簡單,深受廣大用戶特別是年輕用戶的青睞。其業(yè)務規(guī)模不斷擴大,同時競爭亦日益加深。

        “某借”是某金融機構旗下的一款小額信用貸款產(chǎn)品,該產(chǎn)品使用起來簡單、快捷,申請人只需要經(jīng)過少量的操作即可進行在線貸款申請。在開展這類信貸業(yè)務的時候,除了要評估用戶的信貸風險之外,還需要預測用戶的借款需求。只有盡可能的給有借款需求的用戶分配合適的額度,才能最大限度的增加資金利用率,降低成本并增加收益。精準的對目標客戶進行匹配,預測用戶的信貸需求是此類產(chǎn)品運營的核心問題之一。

        本文將通過對“某借”中用戶的基本信息和歷史操作等信息進行整合,運用線性回歸、決策樹、提升算法等數(shù)據(jù)挖掘方法,建立有效的模型,對未來一個月內(nèi)該平臺用戶的借款總金額進行預測,并將預測結果同真實值進行比較,確定模型的效果。

        2.數(shù)據(jù)描述及特征建立

        本文的目的是基于可獲取的客戶信息,如基本信息、歷史信息等,來對未來短時間內(nèi)不確定的需求進行預測。本文的數(shù)據(jù)從某金融平臺獲取,包含用戶的基本信息和部分其他信息。本文的目的是預測下個月每個用戶的借款總額,由于目標是數(shù)量型特征,使用均方誤差(MSE)作為模型效果的評估標準。通過對數(shù)據(jù)的整理,構建了如表1所示的特征。其中用戶ID和次月借款合計不參與模型構建,用戶ID僅用于標識客戶,次月借款合計用于評估模型效果。

        3.利用線性回歸構建模型

        在本文中,因變量為次月借款合計,由于因變量為數(shù)量型特征,可以考慮從較為簡單的回歸模型入手。線性回歸模型是一種基礎的統(tǒng)計模型,模型要求數(shù)據(jù)必須滿足基本假設,即因變量符合正態(tài)性、等方差性及獨立性。另外線性回歸模型受異常值和多重共線性影響較大,建模之前需要先去掉異常值點及多重共線性變量。

        經(jīng)檢查,數(shù)據(jù)基本符合正態(tài)分布鐘形曲線的形狀,可使嘗試使用線性回歸模型進行分析。直接將特征數(shù)據(jù)帶入逐步線性回歸模型。第一次回歸后,去掉性別特征后AIC下降最多,因此去掉該特征繼續(xù)計算回歸系數(shù)。同理依次去掉歷史借款中值、年齡段2項特征,待AIC不再下降時,得到最終的回歸方程。

        在結果中,回歸系數(shù)基本都通過了檢驗,總體p值接近于0,模型效果尚可。其中初始額度、歷史借款合計、歷史消費合計和頁面點擊次數(shù)對因變量是正相關的,其余特征都為負相關。對此的理解是直觀的,用戶的額度越高、歷史借款量越大、歷史消費越多、相關頁面瀏覽次數(shù)越多,可能發(fā)生的借款金額就會越大。

        接下來對線性回歸模型的基本假設做一些分析,如圖1所示。數(shù)據(jù)中的異常點幾乎緊靠數(shù)據(jù)的主體部分,因此可以認為這些只是數(shù)據(jù)中的一些極端數(shù)值,并未達到異常的水平??梢钥闯瞿P偷臍埐钣幸粋€明顯的旋轉,若無旋轉,殘差是基本滿足正態(tài)性、同方差性和獨立性的。這主要是因為數(shù)據(jù)中借款合計為0的用戶比較多,約占總數(shù)據(jù)量的2/3,在建模時這部分數(shù)據(jù)對回歸直線有很明顯的下拉作用,導致回歸直線發(fā)生旋轉,進而造成殘差旋轉。并且模型對這部分用戶的預測值基本上都大于0,因此殘差都為負數(shù),這就造成了其余殘差基本都大于0,形成了圖2中左邊兩幅圖細線條和粗線段帶分離的情況。

        通過計算,得到線性回歸模型的MSE=3.343997。處理類似本文中帶偏折的數(shù)據(jù)時,采用分位數(shù)回歸一般可改善效果,但經(jīng)過建模得到分位數(shù)回歸模型的MSE=3.694761,效果不如線性回歸模型。這可能是因為借款總額為0的用戶占更大部分,在分位數(shù)回歸扭正殘差的同時,擴大了這部分用戶預測的殘差。面對如此復雜的數(shù)據(jù),線性回歸模型肯定達不到最好的效果,繼續(xù)嘗試改進模型。

        4.利用GBDT建立模型

        GBDT模型是此類問題的一個優(yōu)良的解決方案。GBDT模型有迭代次數(shù)和優(yōu)化步長兩個比較重要的參數(shù)。迭代次數(shù)表示模型繼續(xù)計算的最大次數(shù)M,優(yōu)化步長表示模型每次擬合時對殘差擬合的細度。一般情況下先設定一個比較大的迭代次數(shù)和比較小的優(yōu)化步長,通過觀察殘差的變化來選擇最合適的參數(shù)數(shù)值。

        無論優(yōu)化步長取何值,殘差都是隨著迭代次數(shù)的增加先下降后上升的,存在最低點。隨著優(yōu)化步長的減少,殘差達到最低點需要的迭代次數(shù)越來越多,并且殘差能達到的最小值也在逐漸下降。隨著模型的迭代次數(shù)繼續(xù)增加及優(yōu)化步長繼續(xù)減少,殘差的最小值會不斷下降,但下降的幅度越來越少,并且計算代價呈平方關系上升。實踐中會選取殘差、迭代次數(shù)和優(yōu)化步長都在可接受范圍內(nèi)的數(shù)值建立模型,使得模型可在有限時間內(nèi)計算出結果,殘差也較為接近理論最小值。

        設定迭代次數(shù)為3000,優(yōu)化步長為0.01建立GBDT模型。當?shù)螖?shù)達到2095次時,模型殘差達到最小。由于優(yōu)化步長已設置為較小的數(shù),且計算時間可以接受,本文就使用2095的迭代次數(shù)和0.01的優(yōu)化步長建立模型。生成模型后,帶入特征數(shù)據(jù)計算所有用戶次月借款合計預測值,與實際值進行比較,計算MSE=3.20099,效果較回歸模型有所提高。

        5.總結

        本文從小額信用貸款這樣一個具體的、實際的業(yè)務出發(fā),對產(chǎn)品運營中客戶需求這個核心問題進行研究,目的在于利用已有的基本信息和歷史信息,對用戶將來潛在的需求進行預測。本文根據(jù)數(shù)據(jù)的特征,首先采用了較為簡單的線性回歸模型,并通過GBDT模型進行優(yōu)化,使得預測效果得到提高,取得了良好的效果。

        隨著金融市場化的不斷推進,依托大數(shù)據(jù)和互聯(lián)網(wǎng)金融的發(fā)展,傳統(tǒng)的人工作業(yè)模式越來越被市場所淘汰,取而代之的是更精準、更高效的客戶營銷機制。本文通過對一系列數(shù)據(jù)挖掘算法的引入,既考慮到大數(shù)據(jù)的應用,通過智能算法精準定制產(chǎn)品,提升用戶的使用體驗,同時也展現(xiàn)了理論模型在實際數(shù)據(jù)中的表現(xiàn)。更重要的是,本文為金融機構關心的增加資金利用率、降低成本并增加收益等問題,提供了一個解決問題的思路。

        參考文獻:

        [1]L.I.Breiman,J.H.Friedman,R.A.Olshen,and C.J. Stone. Classification and Regression Trees (CART). Encyclopedia of Ecology,40(3):582-588, 1984.

        [2]Mayo Foundation Terry M.Therneau, Elizabeth J. Atkinson.An Introduction to Recursive Partitioning Using the RPART Routines. CRAN, 2018.

        [3]Jerome H.Friedman. Greedy Function Approximation: A Gra- dient Boosting Machine. Annals of Statistics, 29(5):1189-1232,2001.

        [4]Greg Ridgeway.Generalized Boosted Models:A guide to the gbm package.CRAN,2018.

        [5]Tianqi Chen and Carlos Guestrin.XGBoost: A Scalable Tree Boosting System. pages 785-794,2016.

        [6]Guolin Ke,Qi Meng,Thomas Finely, Taifeng Wang, Wei Chen, Weidong Ma,Qiwei Ye,and Tie-Yan Liu.LightGBM:A Highly Efficient Gradient Boosting Decision Tree.2017.

        [7]張瀟,韋增欣,楊天山.GBDT組合模型在股票預測中的應用. 海南師范大學學報,(1),2018.

        [8]馬曉君,沙靖嵐,牛雪琪.基于LightGBM 算法的 P2P 項目信用評級模型的設計及應用.數(shù)量經(jīng)濟技術經(jīng)濟研究,(5), 2018.

        作者簡介:陳方圓(1989.6-),女,研究生,研究方向:金融學。

        猜你喜歡
        線性回歸信用貸款互聯(lián)網(wǎng)金融
        互聯(lián)網(wǎng)消費金融的風險管理研究
        時代金融(2017年18期)2017-07-31 00:23:01
        中小企業(yè)信用貸款困難問題分析
        商業(yè)銀行中小額信用貸款全流程外包研究
        國道公路養(yǎng)護管理與規(guī)劃研究
        互聯(lián)網(wǎng)金融的風險分析與管理
        互聯(lián)網(wǎng)金融理財產(chǎn)品分析
        互聯(lián)網(wǎng)金融對傳統(tǒng)金融的影響
        影響上市公司股票價格的微觀因素分析
        商(2016年13期)2016-05-20 09:12:44
        企業(yè)退休金收支平衡的研究
        科技視界(2016年9期)2016-04-26 12:16:25
        企業(yè)退休金收支平衡的模型分析
        科技視界(2016年1期)2016-03-30 09:21:51
        乱码1乱码2美美哒| 日本在线播放不卡免费一区二区| 欧美亚洲午夜| 日产乱码一区二区国产内射| 内射爆草少妇精品视频| 高潮内射双龙视频| 亚洲人成人影院在线观看| 亚洲一区二区情侣| 精品一区二区av在线| 免费不卡在线观看av| 国产偷国产偷亚洲清高| 国产精品亚洲一区二区杨幂| 国产成人高清精品亚洲一区| 久久国内精品自在自线| 少妇久久久久久被弄到高潮| 国内大量揄拍人妻在线视频| 任你躁欧美一级在线精品免费| 国产精品午夜高潮呻吟久久av| 狠狠躁夜夜躁人人爽超碰97香蕉| 亚洲精品aa片在线观看国产| 亚洲综合日韩中文字幕| 亚洲高清自偷揄拍自拍| 久久精品中文字幕有码| 国产狂喷潮在线观看| 99国产精品视频无码免费| 日本国产一区二区三区在线观看| 亚洲国产精品自拍成人| 无码av天天av天天爽| 亚洲综合无码无在线观看| 熟女人妻丰满熟妇啪啪| 91亚洲免费在线观看视频| 无码中文亚洲av影音先锋| 精品国产高清a毛片无毒不卡| 日本成人免费一区二区三区| 69精品国产乱码久久久| 无码一区二区三区| 无码人妻少妇色欲av一区二区 | 亚洲精品一区二在线观看| 日韩少妇内射免费播放18禁裸乳| 国产精品高潮呻吟av久久无吗| 啪啪视频免费看一区二区|