亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        信用評(píng)分基本理論及其應(yīng)用

        2017-04-07 03:14:19石勇孟凡
        大數(shù)據(jù) 2017年1期
        關(guān)鍵詞:數(shù)據(jù)挖掘信用評(píng)分

        石勇,孟凡

        1. 中國科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室,北京 100190;2. 中國科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心,北京 100190;3. 中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 100190

        信用評(píng)分基本理論及其應(yīng)用

        石勇1,2,3,孟凡1,2,3

        1. 中國科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室,北京 100190;2. 中國科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心,北京 100190;3. 中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 100190

        信用評(píng)分是市場(chǎng)交易的基礎(chǔ),以大數(shù)據(jù)分析與挖掘?yàn)橹蔚默F(xiàn)代信用評(píng)分系統(tǒng)在當(dāng)今全球經(jīng)濟(jì)發(fā)展中起著不可估量的作用。各行業(yè)與領(lǐng)域的信用評(píng)分系統(tǒng)將成為實(shí)現(xiàn)我國“十三五”規(guī)劃中國家大數(shù)據(jù)戰(zhàn)略的首要目標(biāo)。主要介紹了金融信用評(píng)分系統(tǒng)的發(fā)展、相關(guān)技術(shù)、應(yīng)用案例,并對(duì)大數(shù)據(jù)信用評(píng)分的發(fā)展進(jìn)行了展望。

        信用評(píng)分系統(tǒng);數(shù)據(jù)挖掘;大數(shù)據(jù)評(píng)分

        1 引言

        對(duì)于現(xiàn)代市場(chǎng)交易環(huán)境而言,信用(credit)是一種建立在信任基礎(chǔ)上的能力,不用立即付款就可以獲取資金、物資、服務(wù)的能力。接受信任的一方(受信方)與授予信任的一方(授信方)達(dá)成約定:在約定的時(shí)間期限內(nèi),受信方為獲得的資金、物資、服務(wù)向授信方付款。信用的存在與踐行,為市場(chǎng)經(jīng)濟(jì)帶來了秩序,促使市場(chǎng)經(jīng)濟(jì)健康發(fā)展。在一個(gè)社會(huì)信用體系健全的國家,公正、權(quán)威的信用產(chǎn)品和信用服務(wù)已全面普及,信用交易已成為其市場(chǎng)經(jīng)濟(jì)的主要交易手段,企業(yè)和個(gè)人的信用意識(shí)強(qiáng)烈,注重維護(hù)信用,有著明確的信用市場(chǎng)需求;在信用體系的保障下,市場(chǎng)參與者更加理性,行為更加規(guī)范,市場(chǎng)效率得到了大幅提高。

        作為信用體系的重要組成部分,信用評(píng)分系統(tǒng)的發(fā)展對(duì)整體信用評(píng)分體系的進(jìn)步起到關(guān)鍵作用,隨著大數(shù)據(jù)技術(shù)的快速發(fā)展和普及,基于大數(shù)據(jù)的信用評(píng)分受到了廣泛的關(guān)注,并產(chǎn)生了一系列基于大數(shù)據(jù)的信用評(píng)分應(yīng)用。首先介紹信用評(píng)分系統(tǒng)的發(fā)展歷史,明確信用評(píng)分系統(tǒng)的重要性;隨后介紹在信用評(píng)分系統(tǒng)中常用的技術(shù);接著介紹信用評(píng)分的案例,特別是近年來出現(xiàn)的基于大數(shù)據(jù)的信用評(píng)分案例;最后,對(duì)基于大數(shù)據(jù)技術(shù)的信用評(píng)分的前景進(jìn)行展望。

        2 信用評(píng)分系統(tǒng)的發(fā)展

        信用評(píng)分系統(tǒng)的出現(xiàn),最早可以追溯到1801年英國布魯林克成立的征信局,經(jīng)過200多年的發(fā)展,征信行業(yè)已經(jīng)相當(dāng)成熟,并在社會(huì)經(jīng)濟(jì)活動(dòng)中起著不可或缺的作用。經(jīng)典的信用評(píng)分系統(tǒng)(credit scoring system)指根據(jù)借款方的借款與還債歷史、信用狀況等信息給予不同的分?jǐn)?shù),用來決定是否核準(zhǔn)貸款或進(jìn)行信用額度的統(tǒng)計(jì)和評(píng)估,這一模式現(xiàn)在仍然廣泛應(yīng)用在傳統(tǒng)金融行業(yè)的信貸管理活動(dòng)中。

        西方發(fā)達(dá)國家的信用評(píng)估行業(yè)處于領(lǐng)先地位,從歷史的角度,以第二次世界大戰(zhàn)為界將西方發(fā)達(dá)國家的信用評(píng)估行業(yè)劃分為兩個(gè)發(fā)展階段。在第二次世界大戰(zhàn)以前,包括美國在內(nèi)的西方發(fā)達(dá)國家的資信評(píng)級(jí)行業(yè)發(fā)展緩慢。1910年的摩利斯計(jì)劃銀行率先開始提供消費(fèi)信貸。1916年,一個(gè)名為Russell Sage的慈善機(jī)構(gòu)制定出“小型貸款統(tǒng)一法”,提出了第一個(gè)針對(duì)消費(fèi)貸款者的信貸框架。但由于信用的價(jià)值和風(fēng)險(xiǎn)還未被深入地研究和識(shí)別,通信設(shè)施和設(shè)備未能提供有效的支持,信用銷售在當(dāng)時(shí)并未能普及開來。

        第二次世界大戰(zhàn)結(jié)束后,一方面,科學(xué)技術(shù)快速發(fā)展,生產(chǎn)力得到極大程度的提高,促進(jìn)了消費(fèi)者對(duì)產(chǎn)品、服務(wù)的需求;另一方面,計(jì)算機(jī)技術(shù)的快速發(fā)展,為信用交易提供了堅(jiān)實(shí)的基礎(chǔ),信用交易成為在市場(chǎng)發(fā)達(dá)國家中非常重要的促銷手段,隨著信用交易額的猛增,征信公司的業(yè)務(wù)規(guī)模也迅速擴(kuò)大。1970年美國頒布《公平信用報(bào)告法(Fair Credit Reporting Act)》和《平等信用機(jī)會(huì)法(Equal Credit Opportunity Act)》,隨著這兩個(gè)法案被廣泛接受,信用管理行業(yè)步入了現(xiàn)代信用管理階段,并取得了快速發(fā)展。目前,美國有3家主要的信用服務(wù)公司:Equifax、Experian和Trans Union,主要的信用風(fēng)險(xiǎn)模型生產(chǎn)公司則為Fair Issac和First Data Corporation。

        由于起步較晚,我國社會(huì)信用體系發(fā)展相對(duì)于發(fā)達(dá)國家處于落后地位。中國共產(chǎn)黨第十八次全國代表大會(huì)以來,我國社會(huì)信用體系的建設(shè)進(jìn)入全面推進(jìn)階段。黨的第十八次全國代表大會(huì)提出“加強(qiáng)政務(wù)誠信、商務(wù)誠信、社會(huì)誠信和司法公信建設(shè)”,黨的第十八屆中央委員會(huì)第三次全體會(huì)議提出“建立健全社會(huì)征信體系,褒揚(yáng)誠信,懲戒失信”,中共中央國務(wù)院在《關(guān)于加強(qiáng)和創(chuàng)新社會(huì)管理的意見》中提出“建立健全社會(huì)誠信制度”以及《中華人民共和國國民經(jīng)濟(jì)和社會(huì)發(fā)展第十二個(gè)五年規(guī)劃綱要》(以下簡(jiǎn)稱“十二五”規(guī)劃綱要)提出“加快社會(huì)信用體系建設(shè)”的總體要求。2014年6月,國務(wù)院發(fā)布《社會(huì)信用體系建設(shè)規(guī)劃綱要(2014—2020年)》,明確了我國社會(huì)信用體系建設(shè)的指導(dǎo)思想、基本原則、主要目標(biāo)、重點(diǎn)任務(wù)和保障措施。

        2.1 信用的分類

        根據(jù)授信人的身份,通常信用可劃分為公共信用(public credit)和私人信用(private credit)兩大類。其中,公共信用就是政府信用,是指社會(huì)為了幫助政府成功實(shí)現(xiàn)其各項(xiàng)職能而授予政府的信用,其核心是政府的公債。私人信用包括企業(yè)信用(business credit)和個(gè)人信用(personal credit)。企業(yè)信用也叫商業(yè)信用,個(gè)人信用也叫消費(fèi)者信用。

        2.2 信用評(píng)分系統(tǒng)的結(jié)構(gòu)

        信用評(píng)分系統(tǒng)包括信用報(bào)告和信用評(píng)分兩部分。信用報(bào)告是指受信人的歷史信用記錄,一旦有不良記錄,在7年之內(nèi)無法從信用記錄中抹去。它在法律允許的范圍內(nèi),可以有償?shù)靥峁┙o銀行、公司等授信方。授信方可以根據(jù)此報(bào)告來決定是否向受款人提供貸款及貸款額度。信用評(píng)分是將有關(guān)個(gè)人信用的信息轉(zhuǎn)換成信用評(píng)分?jǐn)?shù)的過程。它包括授信方的兩部分行為:準(zhǔn)確地預(yù)測(cè)個(gè)人有關(guān)的信用風(fēng)險(xiǎn);產(chǎn)生相對(duì)應(yīng)的商業(yè)決策。

        在建立信用評(píng)分系統(tǒng)時(shí),考慮5個(gè)方面的前提:一是評(píng)分系統(tǒng)考慮各種信用信息,而不是單一的因素;二是每個(gè)因素的重要性取決于所有其他因素的相關(guān)性;三是評(píng)分的信息直接來源于個(gè)人信用歷史報(bào)表;四是評(píng)分同時(shí)考慮正面和負(fù)面的信息;五是評(píng)分不考慮人種、宗教、性別、婚姻狀況和國籍。

        基于過去大量的信用歷史數(shù)據(jù),數(shù)據(jù)分析公司運(yùn)用數(shù)據(jù)挖掘技術(shù)建立可靠的評(píng)分系統(tǒng)。評(píng)分系統(tǒng)將信用卡顧客分為不同的模式(如“好”與“壞”)。在評(píng)分系統(tǒng)應(yīng)用時(shí),給定一個(gè)顧客作為評(píng)判對(duì)象,評(píng)分系統(tǒng)將根據(jù)該顧客的信用歷史計(jì)算起評(píng)分。其基本原則是制造“黑名單”,盡可能地尋找將要發(fā)生壞賬記錄的嫌疑者。

        2.3 信用評(píng)分系統(tǒng)的重要性

        信用評(píng)分系統(tǒng)不僅能為授信人(銀行)帶來巨大的價(jià)值,同時(shí)也對(duì)受信人(顧客)和社會(huì)有著重要的作用。具體而言,對(duì)于授信人,信用評(píng)分系統(tǒng)可以用來確定市場(chǎng)和開拓新顧客,使授信人更加懂得顧客的消費(fèi)行為和購買力,有利于與顧客建立良好信譽(yù)關(guān)系,促進(jìn)內(nèi)部金融管理質(zhì)量的提高。對(duì)于受信人(顧客),信用評(píng)分系統(tǒng)可以使得受信人能夠更快地申請(qǐng)到應(yīng)有的貸款,評(píng)分將促使其改進(jìn)償債能力,進(jìn)一步提高被選為“自動(dòng)信用批準(zhǔn)”的機(jī)率。對(duì)社會(huì)而言,信用評(píng)分系統(tǒng)可以降低借款方申請(qǐng)成本,出借方信用利息下降,整個(gè)社會(huì)的貸款利息(包括住房貸款率)將下降,經(jīng)濟(jì)效率將提高。

        3 信用評(píng)分系統(tǒng)的主要技術(shù)

        在已掌握的數(shù)據(jù)的基礎(chǔ)上,設(shè)計(jì)出準(zhǔn)確、高效、有較強(qiáng)拓展能力的模型一直是信用評(píng)分領(lǐng)域的研究熱點(diǎn)。最早的信用評(píng)分采用的是打分卡的方式;隨著數(shù)據(jù)的不斷積累和應(yīng)用,到20世紀(jì)90年代,判別分析、邏輯回歸等方法開始被應(yīng)用于信用評(píng)分領(lǐng)域;此后,計(jì)算機(jī)技術(shù)和數(shù)據(jù)挖掘得到迅速發(fā)展,相關(guān)進(jìn)展也在信用評(píng)分領(lǐng)域得到了廣泛的應(yīng)用,尤其以支持向量機(jī)、決策樹、多目標(biāo)數(shù)學(xué)規(guī)劃為代表的數(shù)據(jù)挖掘算法取得了很好的評(píng)分效果。本節(jié)對(duì)信用評(píng)分系統(tǒng)采用的主要技術(shù)進(jìn)行總結(jié)和梳理。

        3.1 傳統(tǒng)信用評(píng)分技術(shù)

        傳統(tǒng)信用評(píng)分技術(shù)主要包括信用評(píng)分卡、判別分析和邏輯回歸等,這些技術(shù)便于實(shí)現(xiàn)和推廣,提高了信用評(píng)分的科學(xué)性和可靠性,在早期的信用評(píng)分應(yīng)用中起到了重要作用。直到現(xiàn)在,這些模型仍然被廣泛應(yīng)用在眾多現(xiàn)代信用評(píng)分系統(tǒng)中。

        信用評(píng)分卡是最傳統(tǒng)的信用評(píng)分方法,其主要實(shí)現(xiàn)方式為,以業(yè)務(wù)理解為基礎(chǔ)提出描述用戶行為的指標(biāo),根據(jù)各個(gè)指標(biāo)具體評(píng)分細(xì)則進(jìn)行評(píng)分,依據(jù)預(yù)先設(shè)定好的指標(biāo)權(quán)重進(jìn)行加權(quán)匯總,得到最終的信用評(píng)分。信用評(píng)分卡的發(fā)展主要經(jīng)歷了3個(gè)階段[1]:第一階段,以對(duì)客戶細(xì)分和對(duì)客戶行為的刻畫為主要目的構(gòu)建分析方法;第二階段,以預(yù)測(cè)用戶行為為目的構(gòu)建模型;第三階段,根據(jù)業(yè)務(wù)細(xì)分和應(yīng)用場(chǎng)景的不同,信用評(píng)分卡進(jìn)一步細(xì)分,并最終形成面向決策支持的信用評(píng)分卡。總體上,根據(jù)對(duì)數(shù)據(jù)的依賴程度不同,可以分為專家型數(shù)據(jù)評(píng)分卡、數(shù)據(jù)型信用評(píng)分卡和混合型信用評(píng)分卡。在應(yīng)用時(shí)應(yīng)考慮具體的數(shù)據(jù)條件進(jìn)行選擇和構(gòu)建。

        判別分析是早期就被引入信用評(píng)分的統(tǒng)計(jì)模型,從統(tǒng)計(jì)的角度,判別分析的原則是在判斷“好人”“壞人”的過程中,使第Ⅰ類錯(cuò)誤和第Ⅱ類錯(cuò)誤帶來的總損失最小[2]。在信用評(píng)分問題中,第Ⅰ類錯(cuò)誤是指將不會(huì)違約的申請(qǐng)者判斷為違約者,這類錯(cuò)誤將降低貸款機(jī)構(gòu)的業(yè)務(wù)規(guī)模;第Ⅱ類錯(cuò)誤是指將會(huì)違約的申請(qǐng)者判斷為非違約者,這類錯(cuò)誤將帶來壞賬率的提高。判別模型有很多種具體的方法,包括貝葉斯判別、費(fèi)舍爾判別等,在信用評(píng)分領(lǐng)域應(yīng)用最為廣泛的是貝葉斯判別。貝葉斯判別對(duì)特征的獨(dú)立性有著較強(qiáng)的假設(shè),但這些假設(shè)在實(shí)際數(shù)據(jù)中往往難以保證,因而貝葉斯判別模型在應(yīng)用中的實(shí)際效果會(huì)受到一定的限制。

        邏輯回歸模型最早于1970年被應(yīng)用于信用評(píng)分[3],該模型的形式與線性回歸模型相似,區(qū)別在于在線性模型的輸出上,增加了一步Logit變換,將實(shí)數(shù)域上的輸出映射到了[0,1]上,由此便能進(jìn)行分類和概率的預(yù)測(cè)。該模型形式簡(jiǎn)潔,便于求解,而且具有很強(qiáng)的可解釋性,因而被廣泛應(yīng)用在信用評(píng)分模型中。

        3.2 數(shù)據(jù)挖掘技術(shù)

        決策樹(decision tree)作為一種經(jīng)典的數(shù)據(jù)挖掘方法,以一種自動(dòng)生成判斷規(guī)則的方式進(jìn)行建模。目前較為流行的決策樹算法主要包括使用信息增益進(jìn)行劃分準(zhǔn)則的ID3、使用信息增益率進(jìn)行節(jié)點(diǎn)劃分的C4.5以及以Gini指數(shù)作為節(jié)點(diǎn)純度度量的分類回歸樹(classification and regression tree,CART)。這些算法都能應(yīng)用于信用評(píng)分系統(tǒng),并能產(chǎn)生容易理解和直接應(yīng)用的判別規(guī)則。但是由于容易產(chǎn)生過擬合、變量增多后規(guī)則復(fù)雜、穩(wěn)健性較低等問題,決策樹并沒有在信用評(píng)分領(lǐng)域得到廣泛的應(yīng)用。

        支持向量機(jī)(support vector machine, SVM)[4]由Vapnik提出,它是一種分類算法,通過尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小來提高學(xué)習(xí)機(jī)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化,從而達(dá)到在統(tǒng)計(jì)樣本量較少的情況下,也能獲得良好統(tǒng)計(jì)規(guī)律的目的。具體地講,它是一種二分類模型,其基本模型定義為特征空間上間隔最大的線性分類器,即支持向量機(jī)的學(xué)習(xí)策略便是間隔最大化,最終可轉(zhuǎn)化為一個(gè)凸二次規(guī)劃問題的求解。支持向量機(jī)具有良好的學(xué)習(xí)能力,并成功應(yīng)用于信用評(píng)分領(lǐng)域[5-7]。與此同時(shí),各種改進(jìn)的SVM模型也在信用評(píng)分領(lǐng)域進(jìn)行了嘗試,并取得了成功,其中有代表性的成果為最小二乘支持向量機(jī)[8,9]。

        多目標(biāo)線性規(guī)劃(multiple-criteria linear programming,MCLP)模型[10,11]也在信用評(píng)分領(lǐng)域取得了一定的競(jìng)爭(zhēng)力[12]。該模型給定一組類別和一組評(píng)價(jià)變量,用一些相關(guān)的邊界變量區(qū)分類別。最簡(jiǎn)單的多目標(biāo)描述為既求分類重疊的最小化,又求類別之間距離的最大化,其結(jié)果為最滿意解。在此模型框架下開發(fā)出的多目標(biāo)二次規(guī)劃(multiple-criteria quadratic programming,MCQP)等模型也取得了較好結(jié)果[13]。MCLP模型和MCQP模型在中國人民銀行信用評(píng)分中取得了很好的效果,并被應(yīng)用于最終的評(píng)分模型中,創(chuàng)造了巨大的商業(yè)價(jià)值。

        基于數(shù)據(jù)挖掘方法的信用評(píng)分模型,通常能夠取得較為準(zhǔn)確的預(yù)測(cè)結(jié)果,但是由于多數(shù)模型(SVM、神經(jīng)網(wǎng)絡(luò)等)的黑箱的性質(zhì),模型的可解釋性不強(qiáng),在進(jìn)行決策支持和客戶管理的時(shí)候,往往難以得到更具體細(xì)致的分析結(jié)果。這些劣勢(shì)在一定程度上影響了數(shù)據(jù)挖掘技術(shù)在具體業(yè)務(wù)場(chǎng)景下的應(yīng)用。

        4 大數(shù)據(jù)信用評(píng)分案例

        隨著大數(shù)據(jù)時(shí)代的到來,大數(shù)據(jù)技術(shù)為信用評(píng)分帶來了新的機(jī)遇。傳統(tǒng)信用評(píng)分系統(tǒng)利用的數(shù)據(jù)主要包括客戶向金融機(jī)構(gòu)提交的個(gè)人申請(qǐng)信息、金融機(jī)構(gòu)內(nèi)部積累的客戶歷史數(shù)據(jù)、中國人民銀行征信中心等外部機(jī)構(gòu)提供的數(shù)據(jù)。這些數(shù)據(jù)價(jià)值密度高、維度相對(duì)較低、質(zhì)量相對(duì)較高。而基于大數(shù)據(jù)的信用評(píng)分會(huì)考察更加多元化的客戶信息數(shù)據(jù),主要包括各互聯(lián)網(wǎng)金融機(jī)構(gòu)掌控的生態(tài)體系內(nèi)積累的客戶信息以及通過外部各種渠道采集的客戶信息。以互聯(lián)網(wǎng)交易數(shù)據(jù)以及社交網(wǎng)絡(luò)的數(shù)據(jù)為代表,互聯(lián)網(wǎng)數(shù)據(jù)往往較為稀疏、價(jià)值密度較低、單變量區(qū)分能力較弱,但覆蓋范圍廣泛。因而在基于大數(shù)據(jù)的信用評(píng)分系統(tǒng)中,需要采用先進(jìn)的數(shù)據(jù)挖掘工具進(jìn)行更加復(fù)雜的信用評(píng)分。

        目前國內(nèi)外已經(jīng)出現(xiàn)眾多成功的信用評(píng)分案例,在國外最具代表性的信用評(píng)分包括基于傳統(tǒng)評(píng)分方法的FICO評(píng)分①http://www. fico.com/、基于手機(jī)數(shù)據(jù)源的First Access評(píng)分②http://www. firstaccessmarket. com/、基于豐富數(shù)據(jù)源的YODLEE③https://www. yodlee.com/、利用心理學(xué)分析VisualDNA④https://www. visualdna.com/、將非結(jié)構(gòu)化數(shù)據(jù)融入模型的ZestFinance⑤https://www. zestfinance.com/。國內(nèi)互聯(lián)網(wǎng)金融和大數(shù)據(jù)征信發(fā)展迅速,芝麻信用、騰訊信用、聚立信、51信用卡、Wecash閃銀等眾多公司已經(jīng)基于所能獲取的數(shù)據(jù),開發(fā)出大數(shù)據(jù)信用評(píng)分模型,并成功應(yīng)用于眾多互聯(lián)網(wǎng)金融的各個(gè)領(lǐng)域。

        中國科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心、中國科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室作為國內(nèi)信用評(píng)分的先驅(qū),在近10年中與業(yè)界合作,在信用評(píng)分領(lǐng)域取得了多項(xiàng)成功的案例,具有代表性的項(xiàng)目包括:國內(nèi)第一個(gè)全國個(gè)人信用評(píng)分決策系統(tǒng)——中國人民銀行信用評(píng)分、1號(hào)店在線信用評(píng)分模型、考拉征信小微商戶信用評(píng)分。

        4.1 中國人民銀行信用評(píng)分

        2003—2006年,中國人民銀行征信中心積累了全國各大金融機(jī)構(gòu)的所有個(gè)人信貸賬戶的信息,活躍自然人數(shù)超過1億,已經(jīng)具備了研制和開發(fā)信用局風(fēng)險(xiǎn)評(píng)分的條件。中國科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心與中國人民銀行正式合作,2006—2009年開展了《中國人民銀行個(gè)人信用局評(píng)分項(xiàng)目》科研,建立了中國評(píng)分(China score)。

        該項(xiàng)目運(yùn)用先進(jìn)的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù),利用中國人民銀行征信中心全國各大金融機(jī)構(gòu)的消費(fèi)者的住房貸款、汽車貸款、信用卡等歷史信息,通過對(duì)消費(fèi)者的人口特征、信用歷史記錄、行為記錄、交易記錄等大量數(shù)據(jù)進(jìn)行系統(tǒng)的分析,挖掘出蘊(yùn)含在數(shù)據(jù)中的行為模式,找出歷史信息與未來信用表現(xiàn)之間的關(guān)系,建立預(yù)測(cè)性的模型,預(yù)測(cè)出每個(gè)自然人在未來某個(gè)時(shí)期內(nèi)發(fā)生“信貸違約”的概率,并以一個(gè)分?jǐn)?shù)來表示,這個(gè)分?jǐn)?shù)將對(duì)各信貸機(jī)構(gòu)的各項(xiàng)信貸決策有重大的指導(dǎo)意義。在評(píng)分系統(tǒng)的建立過程中,選取了MCLP、MCQP、邏輯回歸模型、SVM、神經(jīng)網(wǎng)絡(luò)、線性回歸、決策分析、判別分析等大量模型進(jìn)行細(xì)致的分析和對(duì)比,最終發(fā)現(xiàn)MCLP、MCQP、邏輯回歸模型能夠取得較好的結(jié)果,其中MCLP和MCQP是筆者獨(dú)創(chuàng)的基于最優(yōu)化的數(shù)據(jù)挖掘方法。采用該模型得到的信用評(píng)分分布展現(xiàn)出和美國、澳大利亞等國家信用評(píng)分分布相似的模式。前中國人民銀行副行長、國際貨幣基金組織副主席朱民博士對(duì)模型結(jié)果給予了高度評(píng)價(jià),認(rèn)為“項(xiàng)目所開發(fā)的全國個(gè)人信用評(píng)分系統(tǒng)遠(yuǎn)遠(yuǎn)超過國際水平”⑥http://www. chinanews. com/gn/ news/2010/02-25/2137072.shtml。

        以上幾種病毒除PVX外,都可通過蚜蟲及汁液摩擦傳毒。田間管理?xiàng)l件差,蚜蟲發(fā)生量大發(fā)病重。此外,25℃以上高溫會(huì)降低寄主對(duì)病毒的抵抗力,也有利于傳毒媒介蚜蟲的繁殖、遷飛或傳病,從而利于該病擴(kuò)展,加重受害程度,故一般冷涼山區(qū)栽植的馬鈴薯發(fā)病輕。品種抗病性及栽培措施都會(huì)影響本病的發(fā)生程度。

        項(xiàng)目完成后,最終的模型被應(yīng)用在中國人民銀行信用評(píng)分系統(tǒng)中,成為中國第一個(gè)針對(duì)全國個(gè)人的信用評(píng)分模型。從2008年起,中國所有商業(yè)銀行開始采用“中國評(píng)分”,并將其用于貸款審批發(fā)放、信用卡申請(qǐng)審批等經(jīng)濟(jì)金融活動(dòng)中,創(chuàng)造了巨大的商業(yè)價(jià)值。比如,僅在2008年,該評(píng)分模型使得國內(nèi)7家主要商業(yè)銀行大幅降低壞賬風(fēng)險(xiǎn),共節(jié)約1 500億元,創(chuàng)造了巨大的商業(yè)價(jià)值,并極大地推動(dòng)了我國信用體系的建設(shè)和發(fā)展。

        4.2 1號(hào)店在線信用評(píng)分模型

        1號(hào)店作為一家規(guī)模、品類均占行業(yè)領(lǐng)先地位的B2C電子商務(wù)企業(yè),其商業(yè)鏈包括3部分:供應(yīng)商、商戶和客戶。作為國內(nèi)領(lǐng)先的電子商務(wù)企業(yè),1號(hào)店積累了海量的信息數(shù)據(jù),這些數(shù)據(jù)不僅包括自身運(yùn)營過程中產(chǎn)生的業(yè)務(wù)數(shù)據(jù),還保留了大量的網(wǎng)站日志數(shù)據(jù)。流量是電商存活的關(guān)鍵,金融行業(yè)的競(jìng)爭(zhēng)將緊緊圍繞著客戶,尤其是優(yōu)質(zhì)客戶這一稀缺資源。對(duì)用戶的價(jià)值進(jìn)行評(píng)分,并以此作為客戶關(guān)系管理的重要基礎(chǔ),具有重要的商業(yè)價(jià)值。另外,依賴所掌握的交易行為的數(shù)據(jù),對(duì)商戶和客戶的信用進(jìn)行建模,相關(guān)結(jié)果可以直接支持供應(yīng)鏈金融以及客戶的信用消費(fèi)等方面。

        2013—2014年,中國科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心與1號(hào)店合作,共同開發(fā)針對(duì)商業(yè)的信用評(píng)分模型以及針對(duì)客戶的信用評(píng)分和價(jià)值評(píng)分模型。根據(jù)數(shù)據(jù)情況和業(yè)務(wù)需求,在具體建模過程中,通過對(duì)1號(hào)店客戶和供應(yīng)商的海量歷史數(shù)據(jù)(包括交易數(shù)據(jù)、網(wǎng)站行為數(shù)據(jù)等)以及在線數(shù)據(jù)進(jìn)行分析和挖掘,最終形成相關(guān)評(píng)分。項(xiàng)目的成果提高了1號(hào)店的資金流動(dòng)性,降低了風(fēng)險(xiǎn),并提高了整個(gè)商業(yè)鏈的運(yùn)行效率。

        4.3 考拉征信小微商戶信用評(píng)分

        考拉征信服務(wù)有限公司是一家第三方的信用評(píng)估及征信管理服務(wù)商,其推出的考拉信用是面向政務(wù)、商務(wù)、社會(huì)、法務(wù)全方位的信用服務(wù)體系,運(yùn)用大數(shù)據(jù)及云計(jì)算技術(shù)客觀呈現(xiàn)機(jī)構(gòu)和個(gè)人的信用狀況。2015年中國科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室與考拉征信服務(wù)有限公司正式合作,建立聯(lián)合實(shí)驗(yàn)室“考拉征信·中國科學(xué)院大學(xué)征信模型實(shí)驗(yàn)室”,開展大數(shù)據(jù)征信模型研究。在合作過程中,已經(jīng)成功建立了基于大數(shù)據(jù)的小微商戶信用評(píng)分模型。

        小微商戶評(píng)分的應(yīng)用場(chǎng)景主要包括:將考拉商戶信用分嵌入“考拉征信應(yīng)用”,小微商戶可以通過考拉征信應(yīng)用查詢信用評(píng)分,方便用戶了解自己的信用,并且線上就可以申請(qǐng)貸款讓信用創(chuàng)造價(jià)值;與光大銀行合作推出“信盈聯(lián)名信用卡”,作為大數(shù)據(jù)征信平臺(tái)下針對(duì)小微商戶推出的專屬金融服務(wù),根據(jù)小微商戶的信用分,創(chuàng)新性地推出以“考拉商戶信用分”換取“個(gè)人信用額度”的金融模式,為小微商戶提供信貸支持;推出考拉征信的“信用借”產(chǎn)品,基于信用評(píng)分的綜合金融服務(wù)平臺(tái),提供多款借貸產(chǎn)品、信用卡等服務(wù),為小微商戶、個(gè)人用戶和信用卡機(jī)構(gòu)、貸款公司之間搭起一座信用橋梁。目前,光大銀行、拉卡拉、卡得萬利等多家銀行及小貸機(jī)構(gòu)已將考拉商戶信用分應(yīng)用在貸款審核中,其中光大銀行累積授信額度已過億元。

        5 結(jié)束語

        經(jīng)過多年的努力與發(fā)展,信用評(píng)分模型和系統(tǒng)的科研與應(yīng)用已經(jīng)取得了巨大的進(jìn)展,為信貸行業(yè)以及社會(huì)經(jīng)濟(jì)發(fā)展創(chuàng)造了巨大的價(jià)值。隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)的大體量、來源的多樣性和數(shù)據(jù)異構(gòu)性為傳統(tǒng)的信用評(píng)分技術(shù)帶來了挑戰(zhàn)。與此同時(shí),描述用戶特征的角度越來越多,為更精確地刻畫用戶行為提供了更豐富的數(shù)據(jù)基礎(chǔ)。盡管國內(nèi)外眾多信用評(píng)分機(jī)構(gòu)都已經(jīng)在大數(shù)據(jù)信用評(píng)分領(lǐng)域取得了一定的進(jìn)展,但是在實(shí)踐中采用的模型和學(xué)習(xí)方法還未能充分利用包括深度學(xué)習(xí)在內(nèi)的最先進(jìn)的大數(shù)據(jù)挖掘技術(shù)。此外,各評(píng)分結(jié)構(gòu)掌握和利用的數(shù)據(jù)仍然只是大數(shù)據(jù)中的一小部分,許多數(shù)據(jù)源,特別是分散在網(wǎng)絡(luò)空間的社會(huì)數(shù)據(jù)沒有得到充分應(yīng)用。如何促進(jìn)各評(píng)分結(jié)構(gòu)間的數(shù)據(jù)共享和交換,將成為大數(shù)據(jù)信用評(píng)分取得突破性進(jìn)展的重要條件,這也將成為信用評(píng)分系統(tǒng)進(jìn)一步發(fā)展的重要方向。

        [1] 李延?xùn)|,鄭小娟. 信用評(píng)分卡體系的發(fā)展及應(yīng)用[J]. 甘肅金融, 2016(3): 43-45. LI Y D, ZHENG X J. Credit scoring card system: advances and applications [J]. Gansu Finance, 2016(3): 43-45.

        [2] 朱曉明, 劉治國. 信用評(píng)分模型綜述[J]. 統(tǒng)計(jì)與決策, 2007(2): 103-105. ZHU X M, LIU Z G. Reviews on credit scoring models[J]. Statistics and Decision, 2007(2): 103-105.

        [3] ORGLER Y E. A credit scoring model for commercial loans [J]. Journal of Money, Credit and Banking, 1970, 2(4): 435-445. [4] VAPNIK V N. Statistical learning theory [M]. New York: Wiley, 1998.

        [5] HUANG C L, CHEN M C, WANG C J. Credit scoring with a data mining approach based on support vector machines[J]. Expert Systems with Applications, 2007, 33(4): 847-856.

        [6] MARTENS D, BAESENS B, GESTEL T V, et al. Comprehensible credit scoring models using rule extraction from support vector machines [J]. European Journal of Operational Research, 2007, 183(3): 1466-1476.

        [7] BELLOTTI T, CROOK J. Support vector machines for credit scoring and discovery of significant features[J]. Expert Systems with Applications, 2009, 36(2): 3302-3308.

        [8] ZHOU L, LAI K K, YU L. Least squares support vector machines ensemble models for credit scoring [J]. Expert Systems with Applications, 2010, 37(1): 127-133.

        [9] LAI K K, YU L, ZHOU L, et al. Credit risk evaluation with least square support vector machine[C]//International Conference on Rough Sets and Knowledge Technology, July 24-26, Chongqing, China. Berlin Heidelberg: Springer, 2006: 490-495.

        [10] KOU G, LIU X, PENG Y, et al. Multiple criteria linear programming approach to data mining: models, algorithm designs and software development[J]. Optimization Methods and Software, 2003, 18(4): 453-473.

        [11] SHI Y, TIAN Y, KOU G, et al. Multiple criteria linear programming[M]// Optimization based data mining: theory and applications. London: Springer London, 2011: 119-132.

        [12] SHI Y, PENG Y, XU W, et al. Data mining via multiple criteria linear programming: applications in credit card portfolio management [J]. International Journal of Information Technology & Decision Making, 2002, 1(1): 131-151.

        [13] SHI Y, PENG Y, KOU G, et al. Classifying credit card accounts for business intelligence and decision making: a multiple-criteria quadratic programming approach [J]. International Journal of Information Technology & Decision Making, 2005, 4(4): 581-599.

        Credit scoring: basic theory and applications

        SHI Yong1,2,3, MENG Fan1,2,3
        1. Key Laboratory of Big Data Mining and Knowledge Management, Chinese Academy of Sciences, Beijing 100190, China 2. Research Center on Fictitious Economy and Data Science, Chinese Academy of Sciences, Beijing 100190, China 3. School of Economy and Management, University of Chinese Academy of Sciences, Beijing 100190, China

        Credit scoring is the foundation of market transactions all over the world. Big data analysis based credit scoring plays an immeasurable role in global economics. In the 13th Five-Year Plan of China, it has been proposed as strategic developmental goal to develop and accomplish credit scoring system in all the industries and economic departments. The development of credit scoring system, the advanced techniques in credit scoring and cases of big data based on credit scoring systems were outlined. Suggestions and prospects on big data scoring systems were concluded.

        credit scoring system, data mining, big data credit

        F069

        A

        10.11959/j.issn.2096-0271.2017003

        石勇(1956-),男,中國科學(xué)院大學(xué)經(jīng)濟(jì)管理學(xué)院教授、博士生導(dǎo)師,發(fā)展中國家科學(xué)院院士,國務(wù)院參事,中國科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心主任,中國科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室主任。被列為Elsevier發(fā)布2014/2015中國高被引學(xué)者榜單之一、入選湯普生路透(Thomson Reuters)2016全球高被引作者(計(jì)算機(jī)科學(xué)領(lǐng)域)。現(xiàn)在擔(dān)任《國際信息技術(shù)和決策雜志(IJITDM)》《國際數(shù)據(jù)科學(xué)年鑒(Annals of Data Science)》創(chuàng)立主編。先后榮獲以集合論創(chuàng)始人命名的康拓學(xué)術(shù)獎(jiǎng)、中國復(fù)旦管理學(xué)杰出貢獻(xiàn)獎(jiǎng)、教育部自然科學(xué)獎(jiǎng)一等獎(jiǎng)(2012年、2016年)。中國科學(xué)院百人計(jì)劃學(xué)者、國家杰出青年科學(xué)基金獲得者。

        孟凡(1989-),男,中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院、中國科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室博士生,主要研究方向?yàn)榇髷?shù)據(jù)信用評(píng)分、量化投資、大數(shù)據(jù)圖像挖掘、弱標(biāo)簽學(xué)習(xí)問題等。

        2016-12-22

        國家自然科學(xué)基金資助項(xiàng)目(No.91546201,No.71331005,No. 71110107026)

        Foundation Items:The National Natural Science Foundation of China(No.91546201,No.71331005,No. 71110107026)

        猜你喜歡
        數(shù)據(jù)挖掘信用評(píng)分
        Disorders of the brain-gut interaction and eating disorders
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        為食品安全加把“信用鎖”
        我給爸爸評(píng)分
        信用收縮是否結(jié)束
        中國外匯(2019年9期)2019-07-13 05:46:30
        A2DS2評(píng)分與AIS-APS評(píng)分在預(yù)測(cè)卒中相關(guān)肺炎中的表現(xiàn)
        Castleman disease in the hepatic-gastric space: A case report
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        信用中國網(wǎng)
        信用消費(fèi)有多爽?
        玩弄放荡人妻少妇系列视频| 亚洲中文字幕高清在线视频一区| 熟女人妻一区二区三区| 边添小泬边狠狠躁视频| 性欧美牲交xxxxx视频欧美| 国产91网址| 亚洲免费人成网站在线观看| 手机在线看片国产人妻| 亚洲精品一品区二品区三品区| 高潮毛片无遮挡高清免费| 亚洲电影久久久久久久9999| 综合久久一区二区三区| 亚洲av综合av一区二区三区 | 2021国产精品一区二区在线| 青青草绿色华人播放在线视频| 欧美精品无码一区二区三区| 婷婷亚洲久悠悠色悠在线播放| 熟妇无码AV| 国产精品午夜福利天堂| 曰批免费视频播放免费| 精品无码一区在线观看| 成人片99久久精品国产桃花岛| 日本高清一区二区三区不卡| 成熟人妻换xxxx| 国产色秀视频在线播放| 亚洲中文欧美日韩在线| 日本免费一区二区久久久| 国模冰莲自慰肥美胞极品人体图 | 亚洲综合久久1区2区3区| 国产激情综合五月久久| 秘书边打电话边被躁bd视频| 可以免费观看的毛片| 国产肥熟女视频一区二区三区| 国产人成精品免费久久久| 俺去俺来也在线www色官网| 欧洲日韩视频二区在线| 久久亚洲精品一区二区三区| 国产综合色在线视频区| 免费一区二区三区久久| 亚洲一区二区视频蜜桃| 国产精品日日做人人爱|