亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        考慮文本情感特征的電商小微企業(yè)信用風(fēng)險(xiǎn)預(yù)警

        2023-02-22 03:08:14鮑新中
        運(yùn)籌與管理 2023年12期
        關(guān)鍵詞:模型企業(yè)

        徐 鯤, 李 瑩, 鮑新中

        (北京聯(lián)合大學(xué) 管理學(xué)院,北京 100101)

        0 引言

        目前以電商小微企業(yè)為研究對(duì)象的信用風(fēng)險(xiǎn)預(yù)警指標(biāo)體系初具雛形,但并未形成定論。學(xué)者們進(jìn)一步強(qiáng)調(diào)了定性指標(biāo)對(duì)小企業(yè)信用風(fēng)險(xiǎn)評(píng)估的重要性[1,2],這意味著構(gòu)建電商小微企業(yè)信用風(fēng)險(xiǎn)的指標(biāo)體系必須契合電商小微企業(yè)特性。隨著云計(jì)算、大數(shù)據(jù)在信息采集、智能決策等方面為互聯(lián)網(wǎng)融資賦能,信用風(fēng)險(xiǎn)評(píng)估視角得以擴(kuò)展:通過(guò)挖掘云計(jì)算庫(kù)中儲(chǔ)存的多層次、多維度、時(shí)效性強(qiáng)的結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)[3],以多維度動(dòng)態(tài)數(shù)據(jù)分析小微企業(yè)的經(jīng)營(yíng)流水、營(yíng)收趨勢(shì)、交易網(wǎng)絡(luò)[4]、客戶交易行為[5]等。在形式多元化的數(shù)據(jù)中,學(xué)者們逐漸聚焦蘊(yùn)含豐富信息的文本,李成剛等[6]指出上市公司信息披露文本的可讀性、相似度、情感語(yǔ)調(diào)能深度反應(yīng)公司信用風(fēng)險(xiǎn)。而對(duì)于電商小微企業(yè)而言,最具特點(diǎn)的非結(jié)構(gòu)化數(shù)據(jù)莫過(guò)于平臺(tái)上公開(kāi)的消費(fèi)者在線評(píng)論文本,在線評(píng)論文本中所隱含的消費(fèi)者主觀情緒會(huì)潛移默化的影響后來(lái)消費(fèi)者對(duì)產(chǎn)品的態(tài)度、對(duì)企業(yè)的偏好[7],進(jìn)而影響其風(fēng)險(xiǎn)感知程度[8],這會(huì)對(duì)電商小微企業(yè)的信用產(chǎn)生極大的影響。因此深度挖掘在線評(píng)論數(shù)據(jù)可以有效補(bǔ)充電商小微企業(yè)信用相關(guān)信息,提升信用風(fēng)險(xiǎn)預(yù)警的效果。

        本文收集生鮮行業(yè)電商小微企業(yè)在線評(píng)論文本數(shù)據(jù),運(yùn)用LDA法提取在線評(píng)論的文本特征,采用情感分析量化電商小微企業(yè)信用風(fēng)險(xiǎn)指標(biāo),并結(jié)合電商小微企業(yè)相關(guān)的資質(zhì)指標(biāo)、經(jīng)營(yíng)指標(biāo)構(gòu)建契合電商小微企業(yè)的信用風(fēng)險(xiǎn)預(yù)警指標(biāo)體系,以此為基礎(chǔ)對(duì)生鮮行業(yè)電商小微企業(yè)信用風(fēng)險(xiǎn)進(jìn)行預(yù)警分析。考慮到預(yù)警模型的優(yōu)化,本文將“兩步法”優(yōu)化網(wǎng)格搜索算法與隨機(jī)森林算法結(jié)合搜尋最優(yōu)參數(shù)點(diǎn),在保證效率的同時(shí)構(gòu)建合理、精準(zhǔn)的隨機(jī)森林模型。

        1 主客觀兩維度信用風(fēng)險(xiǎn)指標(biāo)體系設(shè)計(jì)

        1.1 理論基礎(chǔ)、樣本選擇、數(shù)據(jù)來(lái)源與處理

        本文結(jié)合LI和QIAO[9]、CAI等[10]、王冬一等[11]的相關(guān)研究,并考慮電商小微企業(yè)本身特質(zhì),選擇最為權(quán)威的5C要素理論作為基礎(chǔ),搭建電商小微企業(yè)信用風(fēng)險(xiǎn)評(píng)級(jí)指標(biāo)體系的框架。研究對(duì)象為淘寶平臺(tái)上C2C生鮮行業(yè)小微企業(yè),研究樣本來(lái)源于淘寶電商平臺(tái),使用Python語(yǔ)言編程采集相關(guān)數(shù)據(jù),于2021年7月31日共爬取1000條店鋪數(shù)據(jù),經(jīng)篩選后獲得822家樣本數(shù)據(jù)。收集數(shù)據(jù)后對(duì)在線評(píng)論文本進(jìn)行預(yù)處理,刪除系統(tǒng)自動(dòng)評(píng)論、去除重復(fù)評(píng)論、人工剔除無(wú)關(guān)評(píng)論、篩去過(guò)短無(wú)實(shí)際分析意義的評(píng)論后,共篩選出淘寶生鮮行業(yè)店鋪822家,獲取在線評(píng)論33756條。

        1.2 電商小微企業(yè)信用風(fēng)險(xiǎn)指標(biāo)體系形成

        本文的指標(biāo)體系分為客觀指標(biāo)和主觀指標(biāo)。指標(biāo)體系形成的步驟如下:

        Step1通過(guò)查閱文獻(xiàn)、歸納總結(jié),初步獲取指標(biāo)體系中的各指標(biāo)。

        Step2利用Python編碼構(gòu)建LDA主題模型,輸出主題、特征詞、權(quán)重,對(duì)LDA主題模型提取的特征詞進(jìn)行分析、歸納、凝練、總結(jié)后,得到4個(gè)主觀指標(biāo),分別為產(chǎn)品品質(zhì)評(píng)論情感(A8)、物流包裝評(píng)價(jià)情感(B11)、性價(jià)比評(píng)價(jià)情感(B12)、店鋪服務(wù)評(píng)價(jià)情感(C5)。

        Step3采用構(gòu)建情感詞典的方式對(duì)指標(biāo)體系中的主觀指標(biāo)進(jìn)行情感量化。

        Step4調(diào)用Python中的sklearn包實(shí)現(xiàn)隨機(jī)森林輸出特征重要程度,并據(jù)此對(duì)前文獲取的25個(gè)指標(biāo)進(jìn)行篩選剔除,形成最終的指標(biāo)體系,篩選后指標(biāo)體系共有21個(gè)二級(jí)指標(biāo)。

        基于主客觀維度的電商小微企業(yè)信用風(fēng)險(xiǎn)預(yù)警指標(biāo)體系見(jiàn)表1。

        表1 基于主客觀維度的電商小微企業(yè)信用風(fēng)險(xiǎn)預(yù)警指標(biāo)體系

        2 信用風(fēng)險(xiǎn)預(yù)警模型設(shè)計(jì)

        2.1 預(yù)警閾值確定

        將電商小微企業(yè)信用風(fēng)險(xiǎn)劃分為無(wú)風(fēng)險(xiǎn)、輕度風(fēng)險(xiǎn)、中度風(fēng)險(xiǎn)、重度風(fēng)險(xiǎn)4個(gè)類別,首先計(jì)算RWIt值,公式為:

        (1)

        其次以正態(tài)分布的原理在95%的置信概率下設(shè)定風(fēng)險(xiǎn)類別的閾值,作為劃分電商小微企業(yè)信用風(fēng)險(xiǎn)的分界線,據(jù)此設(shè)定界定電商小微企業(yè)信用風(fēng)險(xiǎn)類別閾值(ηi),設(shè)計(jì)四段式電商小微企業(yè)信用風(fēng)險(xiǎn)程度判定區(qū)間。電商小微企業(yè)信用風(fēng)險(xiǎn)綜合預(yù)警指標(biāo)閾值具體計(jì)算公式如下所示,式(2)至式(4)分別表示三個(gè)閾值η0,η1,η2。

        (2)

        (3)

        η1=1/2[η2+1/2(η0+η2)]

        (4)

        若RWIt值小于閾值η2,則說(shuō)明該企業(yè)處于重度信用風(fēng)險(xiǎn)階段;若RWIt值大于η2小于η1,則定義該企業(yè)處于中度信用風(fēng)險(xiǎn)階段;若RWIt值大于η1小于η0,則定義該企業(yè)處于輕度信用風(fēng)險(xiǎn)階段;若RWIt值大于η0,則定義該企業(yè)的信用非常好,無(wú)信用風(fēng)險(xiǎn)。

        2.2 隨機(jī)森林預(yù)警模型設(shè)計(jì)與優(yōu)化

        隨機(jī)森林預(yù)警模型的設(shè)計(jì)與優(yōu)化步驟如下:

        Step1SMOTE算法處理不平衡數(shù)據(jù)。SMOTE算法的實(shí)現(xiàn)公式見(jiàn)式(5)。

        xnew=x0+random( )(x0i-x0)

        (5)

        其中random( )∈[0,1],代表[0,1]內(nèi)的一個(gè)隨機(jī)數(shù),xnew代表新合成的樣本,x0則是代表少數(shù)類中的原始樣本,x0i代表每次隨機(jī)選擇的x0的第i個(gè)最近臨近樣本。

        Step2構(gòu)建標(biāo)準(zhǔn)RF模型。設(shè)由n棵樹(shù)h1(x),h2(x),…,hn(x)構(gòu)成一片隨機(jī)森林,設(shè)訓(xùn)練樣本集合為D(X,Y),其中X為樣本所具有的特征屬性,Y為每個(gè)樣本對(duì)應(yīng)的類別屬性。式(6)表示模型正確分類票數(shù)超過(guò)不正確分類最大票數(shù)的程度,該值越大,表明模型的分類效果越好。

        (6)

        泛化誤差的表達(dá)式如式(7)所示,其中Px,y表示概率值,PX,Y(mg(X,Y)<0)表示間隔函數(shù)小于0的概率,即預(yù)測(cè)誤判概率,泛化誤差越低,模型的分類性能越好。

        PE*=PX,Y(mg(X,Y)<0)

        (7)

        隨機(jī)森林具有收斂性,假設(shè)θk,存在隨機(jī)森林hk(X)=hk(X,θk),當(dāng)森林中的決策樹(shù)增加到一定程度后,式(7)將服從強(qiáng)大數(shù)定律,序列θk將收斂至式(8),該式說(shuō)明RF不會(huì)因決策樹(shù)變多而出現(xiàn)過(guò)擬合,存在一個(gè)有限的泛化誤差值。

        (8)

        (9)

        Step3運(yùn)用“兩步法”網(wǎng)格搜索算法優(yōu)化。第一步在較大范圍內(nèi)劃分大網(wǎng)格,通過(guò)粗搜索的思想篩選出最優(yōu)參數(shù)可能的范圍;第二步在最優(yōu)范圍附近以小步長(zhǎng)進(jìn)行精細(xì)搜索,劃分出更為密集的網(wǎng)絡(luò),在該網(wǎng)絡(luò)上選擇出最優(yōu)點(diǎn)。

        Step4使用最優(yōu)參數(shù)構(gòu)建RF模型。

        3 實(shí)證研究

        3.1 實(shí)證過(guò)程分析

        本文的實(shí)證步驟如下:(1)使用SMOTE和ADASYN兩種隨機(jī)過(guò)采樣算法進(jìn)行平衡處理,對(duì)比分析處理后構(gòu)建的標(biāo)準(zhǔn)隨機(jī)森林模型性能,驗(yàn)證使用SMOTE算法的合理性;(2)對(duì)比Logistic模型、CART模型和標(biāo)準(zhǔn)隨機(jī)森林模型在平衡與非平衡數(shù)據(jù)集上性能,驗(yàn)證使用平衡數(shù)據(jù)集的必要性;(3)基于平衡數(shù)據(jù)集進(jìn)行模型對(duì)照試驗(yàn),驗(yàn)證隨機(jī)森林模型的優(yōu)越性;(4)構(gòu)建“兩步法”網(wǎng)絡(luò)搜索算法優(yōu)化隨機(jī)森林組合預(yù)測(cè)模型,對(duì)標(biāo)準(zhǔn)隨機(jī)森林模型進(jìn)行參數(shù)優(yōu)化;(5)隨機(jī)選取時(shí)點(diǎn)和樣本進(jìn)行對(duì)比分析,驗(yàn)證預(yù)警模型的可推廣性和說(shuō)服力。本部分模型驗(yàn)證時(shí)使用最常用的準(zhǔn)確率(ACC)、精確率(P)、召回率(R)和F值。

        3.2 不同不平衡數(shù)據(jù)處理方法的比較分析

        分別采用SMOTE和ADASYN進(jìn)行處理,生成平衡數(shù)據(jù)集,并將得到的平衡數(shù)據(jù)集按照2:8劃分測(cè)試集與訓(xùn)練集,對(duì)比構(gòu)建的標(biāo)準(zhǔn)隨機(jī)森林模型的性能。兩種不平衡數(shù)據(jù)處理方法處理后的數(shù)據(jù)情況見(jiàn)表2,標(biāo)準(zhǔn)隨機(jī)森林模型的性能對(duì)比見(jiàn)表3。

        表2 SMOTE和ADASYN平衡處理前后的數(shù)據(jù)情況

        表3 基于SMOTE和ADASYN平衡處理的標(biāo)準(zhǔn)RF模型

        表2的結(jié)果顯示,平衡處理前,無(wú)風(fēng)險(xiǎn)、輕度風(fēng)險(xiǎn)、中度風(fēng)險(xiǎn)和重度風(fēng)險(xiǎn)樣本分別占總樣本的1.946%,85.888%,11.192%和0.973%,分布十分不均衡。處理后的平衡數(shù)據(jù)集中,四類風(fēng)險(xiǎn)樣本各占25%,樣本達(dá)到平衡。表3的結(jié)果顯示,基于SMOTE平衡處理后形成的平衡數(shù)據(jù)集構(gòu)建的標(biāo)準(zhǔn)隨機(jī)森林模型,輸出的測(cè)試集準(zhǔn)確率(ACC)、精確率(P)和F值為97.30%,召回率(R)為97.40%。與ADASYN平衡處理后的模型相比性能更高,故本文使用SMOTE算法處理數(shù)據(jù)集,進(jìn)行后續(xù)的模型構(gòu)建是合理可行的。

        3.3 平衡數(shù)據(jù)集與非平衡數(shù)據(jù)集上模型性能比較分析

        分別將邏輯回歸(Logistic)、決策樹(shù)(CART)、隨機(jī)森林(RF)三種預(yù)警模型在平衡數(shù)據(jù)集和非平衡數(shù)據(jù)集上輸出的評(píng)估值進(jìn)行對(duì)比,詳見(jiàn)表4。

        表4 基于非平衡與平衡數(shù)據(jù)集的模型對(duì)比

        結(jié)果顯示,平衡數(shù)據(jù)集上Logistic模型正確預(yù)測(cè)電商小微企業(yè)風(fēng)險(xiǎn)類別的概率提高了0.87%。而精確率(P)和召回率(R)則出現(xiàn)了極大幅度的變化,探究這種現(xiàn)象產(chǎn)生的根源應(yīng)從混淆矩陣入手。式(10)和式(11)分別代表非平衡數(shù)據(jù)集上和平衡數(shù)據(jù)集上的混淆矩陣,在式(10)的混淆矩陣中,實(shí)際為重度風(fēng)險(xiǎn)樣本僅有一個(gè),這一樣本一旦被錯(cuò)分,會(huì)極大幅度拉低整體預(yù)測(cè)精度,也間接使非平衡數(shù)據(jù)集輸出的精確度和召回率受到較大影響;在平衡數(shù)據(jù)集輸出的混淆矩陣式(11)中,各樣本量較均衡,不會(huì)出現(xiàn)較為極端的情況,更能如實(shí)反映模型真實(shí)狀態(tài)。這也印證了處理不平衡數(shù)據(jù)集的必要性。

        (10)

        (11)

        對(duì)于CART模型,相較于非平衡數(shù)據(jù)集,平衡數(shù)據(jù)集上四個(gè)指標(biāo)均達(dá)到了百分之九十以上,且優(yōu)化后的指標(biāo)整體高于Logistic模型輸出的指標(biāo),說(shuō)明決策樹(shù)易產(chǎn)生局部最優(yōu)解的特性導(dǎo)致其預(yù)測(cè)結(jié)果并不穩(wěn)定,受到不平衡數(shù)據(jù)的影響更大。

        對(duì)于RF模型,在非平衡數(shù)據(jù)集中,RF模型的整體準(zhǔn)確率(ACC)和精確率(P)明顯小于在非平衡樣本集中的Logistic模型和CART模型,從混淆矩陣入手尋找產(chǎn)生這種極度差異的原因,在RF模型輸出的混淆矩陣中(見(jiàn)式(12)),重度風(fēng)險(xiǎn)類樣本僅有一個(gè)被劃分至測(cè)試集,且該樣本被誤判,這拉低了RF模型整體的精確率(P),致使其表現(xiàn)效果不佳,同樣也降低了作為精確率和召回率調(diào)和均值F1的輸出值。

        (12)

        通過(guò)上述對(duì)比進(jìn)一步分析可知,無(wú)論是在單個(gè)模型還是在集成模型上,數(shù)據(jù)平衡與否均會(huì)對(duì)模型精度產(chǎn)生較大的影響。通過(guò)CART模型與RF模型的對(duì)比更能說(shuō)明集成模型在抗干擾性稍優(yōu)于單個(gè)模型,但與之對(duì)應(yīng)的是二者所受數(shù)據(jù)集不平衡影響均較大,這也印證了如果不考慮樣本的平衡性可能會(huì)產(chǎn)生較為嚴(yán)重的誤判。

        3.4 平衡數(shù)據(jù)集上不同模型性能比較分析

        在平衡數(shù)據(jù)集上驗(yàn)證不同預(yù)警模型,首先通過(guò)十折交叉驗(yàn)證,可以明顯看出RF遠(yuǎn)優(yōu)于Logistic和CART。

        在平衡數(shù)據(jù)集上,輸出Logistic、CART、標(biāo)準(zhǔn)RF、經(jīng)參數(shù)調(diào)優(yōu)的隨機(jī)森林四個(gè)模型的預(yù)測(cè)準(zhǔn)確率如表5所示。結(jié)果顯示經(jīng)參數(shù)調(diào)優(yōu)的隨機(jī)森林模型準(zhǔn)確率達(dá)到了98%以上。因此調(diào)參后的隨機(jī)森林模型可以更為準(zhǔn)確的幫助貸款方辨別電商小微企業(yè)所處的信用風(fēng)險(xiǎn)階段,從而輔助其對(duì)是否放貸做出決策。

        除此之外,平衡數(shù)據(jù)集上Logistic模型的召回率為92.67%,CART模型的召回率為94.07%,隨機(jī)森林模型的召回率為97.9%,調(diào)參后的隨機(jī)森林模型召回率為98.417%,說(shuō)明在調(diào)參后的隨機(jī)森林模型中,每類預(yù)測(cè)結(jié)果的樣本中真正為該類的樣本占全部樣本的比例較高。也說(shuō)明了本文的模型具有更高的預(yù)測(cè)精度。對(duì)比標(biāo)準(zhǔn)隨機(jī)森林模型與調(diào)參的隨機(jī)森林模型輸出的指標(biāo)也以看出,調(diào)參后隨機(jī)森林模型的各個(gè)評(píng)價(jià)指標(biāo)均優(yōu)于未調(diào)參的隨機(jī)森林模型。

        表5 Logistic、CART、標(biāo)準(zhǔn)RF、經(jīng)參數(shù)調(diào)優(yōu)的隨機(jī)森林四個(gè)模型的預(yù)測(cè)準(zhǔn)確率對(duì)比

        綜合評(píng)價(jià)指標(biāo)結(jié)果、進(jìn)行模型對(duì)比后發(fā)現(xiàn),調(diào)參后的隨機(jī)森林算法各方面的預(yù)測(cè)精度均高于其余對(duì)照組,即該模型對(duì)電商小微企業(yè)信用風(fēng)險(xiǎn)的預(yù)測(cè)最為準(zhǔn)確,最能準(zhǔn)確判斷電商小微企業(yè)信用風(fēng)險(xiǎn)所處的階段,能更好的協(xié)助電商小微企業(yè)辨別自身信用風(fēng)險(xiǎn),為貸款機(jī)構(gòu)是否融資提供依據(jù)。

        3.5 基于“兩步法”網(wǎng)格搜索算法的隨機(jī)森林參數(shù)優(yōu)化

        進(jìn)行參數(shù)優(yōu)化的過(guò)程中主要關(guān)注tree與features兩個(gè)參數(shù)??紤]到該參數(shù)的特性,首先,繪制tree的成長(zhǎng)曲線尋找森林中決策子樹(shù)數(shù)量的波動(dòng)閾值,通過(guò)tree成長(zhǎng)曲線的初步判斷,當(dāng)森林中決策子樹(shù)的棵數(shù)在(50,200)范圍內(nèi)時(shí),隨機(jī)森林模型的精度平穩(wěn)波動(dòng),即存在一個(gè)最優(yōu)值確保模型的精度最高,因此可先將該參數(shù)的值粗略劃分在(50,210)之間。

        其次,運(yùn)用“兩步法”網(wǎng)格搜索算法尋找構(gòu)建森林的最優(yōu)子樹(shù)數(shù)量。設(shè)定森林中決策子樹(shù)的數(shù)量k取值為(50,210),步長(zhǎng)設(shè)定為20,使得參數(shù)在全局尋優(yōu)的過(guò)程中按照大網(wǎng)格進(jìn)行搜索,輸出結(jié)果當(dāng)tree參數(shù)為190時(shí),隨機(jī)森林模型的預(yù)測(cè)準(zhǔn)確率達(dá)到97.43%;考慮到大步長(zhǎng)設(shè)定為20,沒(méi)有考慮到190前后各20的網(wǎng)格,因此,進(jìn)一步細(xì)化網(wǎng)格步長(zhǎng),設(shè)定k的取值為(170,210),步長(zhǎng)為10,輸出當(dāng)tree參數(shù)為200時(shí),隨機(jī)森林在測(cè)試集上的預(yù)測(cè)準(zhǔn)確率達(dá)到97.47%;再次采用“兩步法”的思想,進(jìn)一步縮小參數(shù)最優(yōu)值可能的范圍,設(shè)定k的取值為(190,210),步長(zhǎng)為1,最終輸出tree參數(shù)為206時(shí),隨機(jī)森林在測(cè)試集上的預(yù)測(cè)準(zhǔn)確率達(dá)到最優(yōu)值97.52%,為進(jìn)一步驗(yàn)證在(190,210)區(qū)間內(nèi),tree參數(shù)為206時(shí)模型最優(yōu),繪制隨機(jī)森林模型泛化誤差與森林中決策子樹(shù)個(gè)數(shù)的關(guān)系圖(詳見(jiàn)圖1),可以看出tree在206,207之間某一點(diǎn),模型的泛化誤差最小,因此本文經(jīng)過(guò)優(yōu)化后取tree的參數(shù)為206,基本上使得隨機(jī)森林模型精度最大化。

        圖1 泛化誤差與決策子樹(shù)個(gè)數(shù)關(guān)系

        由于參數(shù)features取值范圍固定,與tree參數(shù)有所不同,因此在此對(duì)“兩步法”思路進(jìn)行調(diào)整,先輸出參數(shù)features不同取值所對(duì)應(yīng)的模型泛化誤差,從整體上觀察隨機(jī)森林模型泛化誤差與參數(shù)features的關(guān)系(輸出的關(guān)系見(jiàn)圖2),可以看出features參數(shù)在(5,8)區(qū)間內(nèi)存在泛化誤差最小值,但是難以直觀確定何處最優(yōu),因此運(yùn)用“兩步法”優(yōu)化的思想,首先設(shè)定features的取值為(5,8),設(shè)置步長(zhǎng)為1,進(jìn)行全局搜索,最終得到features最優(yōu)值為6。

        圖2 泛化誤差與隨機(jī)選擇特征變量個(gè)數(shù)關(guān)系

        將tree=206,features=6帶入原始標(biāo)準(zhǔn)隨機(jī)森林模型中,得到模型精度為98.41%,較之原始隨機(jī)森林模型精度97.88%提升了0.53%的精度,較之僅優(yōu)化tree參數(shù)的隨機(jī)森林模型提升了0.18%的精度,說(shuō)明該參數(shù)的優(yōu)化使得模型泛化錯(cuò)誤向最低點(diǎn)移動(dòng),優(yōu)化有效。故最終確定建立的隨機(jī)森林模型中tree=206,features=6。

        3.6 不同數(shù)據(jù)時(shí)點(diǎn)平衡數(shù)據(jù)集上模型結(jié)果比較分析

        為驗(yàn)證本文構(gòu)建的電商小微企業(yè)信用風(fēng)險(xiǎn)預(yù)警模型的可推廣性和說(shuō)服力,本文隨機(jī)選取2021年7月31日、2021年8月15日、2021年8月30日和2021年9月15日四個(gè)時(shí)點(diǎn),隨機(jī)抽取樣本電商小微企業(yè)中的40%進(jìn)行驗(yàn)證。

        結(jié)果顯示,在隨機(jī)抽取的樣本中,不同時(shí)點(diǎn)采用本文構(gòu)建的信用風(fēng)險(xiǎn)預(yù)警模型預(yù)測(cè)的結(jié)果均與店鋪所屬的信用風(fēng)險(xiǎn)預(yù)警閾值一致或相近,故從整體來(lái)看,本文構(gòu)建的預(yù)警模型是具有可推廣性和說(shuō)服力的。以店鋪1和店鋪10為例。店鋪1的預(yù)警閾值是1,表明店鋪的起始風(fēng)險(xiǎn)程度是輕風(fēng)險(xiǎn),隨機(jī)選取的四個(gè)時(shí)點(diǎn)的風(fēng)險(xiǎn)預(yù)警結(jié)果顯示,店鋪1也屬于輕風(fēng)險(xiǎn)范圍,說(shuō)明模型預(yù)警結(jié)果準(zhǔn)確;店鋪10的起始風(fēng)險(xiǎn)屬于無(wú)風(fēng)險(xiǎn)類型,而隨機(jī)選取的四個(gè)時(shí)點(diǎn)的風(fēng)險(xiǎn)預(yù)警結(jié)果中,2021年7月31日依舊為無(wú)風(fēng)險(xiǎn),其余三個(gè)時(shí)點(diǎn)均為輕風(fēng)險(xiǎn),表明店鋪10的風(fēng)險(xiǎn)水平發(fā)生了輕微波動(dòng),但波動(dòng)幅度不大,預(yù)測(cè)結(jié)果與預(yù)警閾值的這種差異可能與電商小微企業(yè)本身經(jīng)營(yíng)不穩(wěn)定、波動(dòng)性大有關(guān)。

        4 結(jié)束語(yǔ)

        文章考慮多場(chǎng)景電商小微企業(yè)信用風(fēng)險(xiǎn)影響因素,從主觀維度和客觀維度兩方面構(gòu)建符合電商小微企業(yè)的信用風(fēng)險(xiǎn)預(yù)警指標(biāo)體系;劃分四級(jí)風(fēng)險(xiǎn)類別閾值,并通過(guò)優(yōu)化參數(shù)構(gòu)建隨機(jī)森林模型;通過(guò)真實(shí)樣本數(shù)據(jù)驗(yàn)證預(yù)警模型的可行性,得到結(jié)論如下:

        (1)構(gòu)建了考慮文本情感特征因素的電商小微企業(yè)信用風(fēng)險(xiǎn)預(yù)警指標(biāo)體系,并通過(guò)實(shí)證研究檢驗(yàn)了指標(biāo)體系的有效性。

        (2)使用SMOTE算法對(duì)不平衡數(shù)據(jù)集進(jìn)行處理,并通過(guò)實(shí)證研究發(fā)現(xiàn)平衡數(shù)據(jù)集無(wú)論對(duì)單一模型還是集成預(yù)警模型均十分重要。

        (3)構(gòu)建了“兩步法”網(wǎng)絡(luò)搜索算法優(yōu)化隨機(jī)森林組合預(yù)測(cè)模型。并結(jié)合實(shí)證分析驗(yàn)證了本文所構(gòu)建的電商小微企業(yè)信用風(fēng)險(xiǎn)預(yù)警模型的適用性與精準(zhǔn)性。本研究既為大數(shù)據(jù)背景下運(yùn)用非結(jié)構(gòu)化數(shù)據(jù)探究信用風(fēng)險(xiǎn)預(yù)警模型、科學(xué)預(yù)測(cè)電商小微企業(yè)信用風(fēng)險(xiǎn)提供新思路,也有助于推動(dòng)電商小微企業(yè)信用風(fēng)險(xiǎn)預(yù)警與時(shí)俱進(jìn)。

        猜你喜歡
        模型企業(yè)
        一半模型
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        重要模型『一線三等角』
        敢為人先的企業(yè)——超惠投不動(dòng)產(chǎn)
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        91乱码亚洲精品中文字幕| 欧美人与动人物牲交免费观看| 中文字幕不卡高清免费| 青青草免费在线视频导航 | 日韩精品人妻中文字幕有码| 国产自拍91精品视频| 无码人妻丰满熟妇区bbbbxxxx| 亚洲av无码精品色午夜果冻不卡 | 在线亚洲人成电影网站色www| 日韩av一区二区三区四区av| 中文字幕中文字幕三区| 国产成人无码a在线观看不卡| 黄色视频免费在线观看| 亚洲精品中文字幕观看| 91乱码亚洲精品中文字幕| 久久精品国产亚洲av香蕉| 国产人澡人澡澡澡人碰视频| aⅴ色综合久久天堂av色综合 | 国产老熟女狂叫对白| 亚洲色www无码| 粉嫩的极品女神尤物在线| 97日日碰曰曰摸日日澡| chinese国产乱在线观看| 一区二区久久精品66国产精品| 国产在线观看自拍av| 欧美另类高清zo欧美| 亚洲精品无码永久在线观看你懂的 | 午夜亚洲国产理论片亚洲2020| 亚洲精品国产第一区三区| 337p日本欧洲亚洲大胆色噜噜| 日本护士吞精囗交gif| 亚洲成aⅴ人片在线观看天堂无码| 亚洲成人一区二区av| 免费a级毛片无码免费视频120软件| 亚洲欧洲日本精品| 国产三级三级精品久久| 亚洲人成网站18禁止| 熟妇人妻中文av无码| 日本一区二区三区专区| 97精品一区二区三区| 精品人妻少妇一区二区三区不卡|