亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        貝葉斯分類器在農(nóng)村金融數(shù)據(jù)分類中的應(yīng)用研究

        2018-07-09 08:32:38蒲京京蘇巧榮張朝瑜肖振東吳養(yǎng)會(huì)
        安徽農(nóng)學(xué)通報(bào) 2018年11期

        蒲京京 蘇巧榮 張朝瑜 肖振東 吳養(yǎng)會(huì)

        摘 要:針對(duì)農(nóng)戶產(chǎn)權(quán)抵押貸款信用問(wèn)題,利用陜西高陵、臨潼、楊陵3個(gè)地區(qū)農(nóng)村金融抵押貸款的有關(guān)調(diào)研數(shù)據(jù),運(yùn)用貝葉斯網(wǎng)絡(luò)分類模型進(jìn)行分類研究,以農(nóng)戶所在地區(qū)、家庭類型、教育程度等10個(gè)因素作為自變量,以產(chǎn)權(quán)抵押貸款的意愿作為分類依據(jù),結(jié)果表明,采用十折交叉驗(yàn)證的貝葉斯網(wǎng)絡(luò)分類器對(duì)解決此類問(wèn)題具有良好的分類效果,其分類結(jié)果可以為農(nóng)戶抵押貸款研究提供理論參考。

        關(guān)鍵詞:農(nóng)村金融;貝葉斯網(wǎng)絡(luò)分類器;ROC曲線;交叉驗(yàn)證

        中圖分類號(hào) F832 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1007-7731(2018)11-0002-04

        Abstract:According to the problem of farmers' property mortgage credit,the Bayes Network classification model was constructed which based on the investigation data related to the property mortgage in Gaoling,Lingtong and Yangling.We chosed the region,family type,level of education and other 7 factors as the independent variables,the property mortgage loan willingness as the independent variables.The analysis results show that Bayes Network classification model which used ten-fold cross validation has good effect in solving these problems.Besides,the classification results provided the certain reference role in the household mortgage policy.

        Key words:Rural finance;Bayes network;ROC curve;K-fold cross validation

        1 引言

        當(dāng)前中國(guó)經(jīng)濟(jì)正在飛速發(fā)展,這其中金融業(yè)起著至關(guān)重要的作用,然而我國(guó)農(nóng)村金融行業(yè)的創(chuàng)新能力仍然明顯不足。圍繞農(nóng)村產(chǎn)權(quán)抵押貸款,國(guó)內(nèi)學(xué)者展開(kāi)了大量的研究,現(xiàn)有研究大多局限在對(duì)農(nóng)村產(chǎn)權(quán)抵押貸款發(fā)展意義、現(xiàn)狀、制約因素及其制度中存在的問(wèn)題等方面上的定性分析,而基于農(nóng)戶微觀數(shù)據(jù)的定量研究則相對(duì)偏少。曾慶芬[1]以成都試點(diǎn)為例,利用二項(xiàng)logit模型分析了影響農(nóng)戶參與土地使用權(quán)和宅基地使用權(quán)融資意愿的影響因素,并提出了相關(guān)政策建議;美國(guó)耶魯大學(xué)經(jīng)濟(jì)學(xué)家Hugh T.Patrick研究中,強(qiáng)調(diào)農(nóng)村經(jīng)濟(jì)主體的金融服務(wù)需求以及農(nóng)村金融組織及相關(guān)服務(wù)的供給先于農(nóng)村經(jīng)濟(jì)主體的需求。值得我們借鑒的還有像孟加拉國(guó)那樣的農(nóng)村金融機(jī)構(gòu),孟加拉國(guó)鄉(xiāng)村銀行模式調(diào)動(dòng)了農(nóng)村的發(fā)展積極性,不僅充分發(fā)揮了鄉(xiāng)村銀行對(duì)農(nóng)村經(jīng)濟(jì)發(fā)展的作用,而且提高了農(nóng)村銀行自身的發(fā)展效率。對(duì)于中國(guó)農(nóng)村現(xiàn)狀,孟加拉國(guó)的小額扶貧貸款模式適用于我國(guó)如此之多的農(nóng)村人口數(shù)量,能有效地帶動(dòng)銀行資金的流動(dòng),促進(jìn)農(nóng)村銀行的發(fā)展。從以上研究方法可以看出,對(duì)農(nóng)村產(chǎn)權(quán)抵押貸款的研究更多的集中于制度研究,少有的實(shí)證分析也僅局限與二項(xiàng)logit模型或二項(xiàng)logistic回歸模型,受限于模型同性質(zhì)和獨(dú)立同分布等理想化假設(shè)的影響,所得到的結(jié)論難以全面、客觀地反映出農(nóng)戶融資的實(shí)際需求。

        李旭升[2]在個(gè)人信用評(píng)估中使用樸素貝葉斯分類器(Neive Bayesian,NB)建立分類模型,對(duì)數(shù)據(jù)類型進(jìn)行細(xì)致分類,實(shí)驗(yàn)表明,NB進(jìn)行信用分類可以取得更好的效果,由于NB作為一種概率型分類,各類概率以及各屬性的條件概率有明顯的物理意義,具有較好的解釋性??登f[3]在納稅評(píng)估方面建立貝葉斯分類納稅評(píng)估模型,有效地發(fā)現(xiàn)稅法執(zhí)行偏差,能夠較為準(zhǔn)確地發(fā)現(xiàn)稅收?qǐng)?zhí)行偏差者;吳陳和張明華[4]研究分析了樸素貝葉斯分類算法在個(gè)人信用預(yù)測(cè)方面的應(yīng)用,實(shí)驗(yàn)表明,基于最大后驗(yàn)概率熵的最優(yōu)樸素貝葉斯算法在個(gè)人信用預(yù)測(cè)方面顯著提高了預(yù)測(cè)的準(zhǔn)確性。唐爐亮[5]在針對(duì)浮動(dòng)車數(shù)據(jù)的城市車道數(shù)量信息調(diào)查采用樸素貝葉斯分類方法確定目標(biāo)路段的車道數(shù)量,最終結(jié)果表明其提取的精度高達(dá)76.3%。作為一種良好的分類器,樸素貝葉斯分類器受到越來(lái)越多的研究者的關(guān)注,在各個(gè)研究領(lǐng)域都得到了廣泛的應(yīng)用。

        為研究我國(guó)西部農(nóng)戶產(chǎn)權(quán)抵押貸款中的農(nóng)戶分類問(wèn)題,本文利用貝葉斯網(wǎng)絡(luò)具有較高的分類精度和優(yōu)良準(zhǔn)確性的特征,以農(nóng)戶抵押貸款的預(yù)期為分類指標(biāo),建立影響農(nóng)戶類型的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),以為金融機(jī)構(gòu)提供有價(jià)值的信用參考。

        2 貝葉斯網(wǎng)絡(luò)分類器

        貝葉斯網(wǎng)絡(luò)[6](Bayesian Network)是一種概率網(wǎng)絡(luò),是基于概率推理的圖形網(wǎng),而貝葉斯公式則是這個(gè)概率網(wǎng)絡(luò)的基礎(chǔ)。貝葉斯網(wǎng)絡(luò)又稱為信用網(wǎng)絡(luò)(Belief Networks),是用來(lái)表示變量之間連接關(guān)系與概率關(guān)系的一種圖形模型,是目前不確定知識(shí)表達(dá)和推理領(lǐng)域最有效的理論模型之一。貝葉斯網(wǎng)絡(luò)是貝葉斯方法的拓展,提供了一種表示因果信息的方法,適用于不確定性和概率性事件的表達(dá)和分析,可以從不完全性、不精確或不確定的知識(shí)或信息中進(jìn)行推理,主要處理人工智能中的不確定性信息,在計(jì)算機(jī)智能科學(xué)、工業(yè)控制、醫(yī)療診斷等領(lǐng)域等許多智能化系統(tǒng)中得到了重要應(yīng)用。

        貝葉斯網(wǎng)絡(luò)采用一個(gè)DAG(Directed Acyclic Graph,有向無(wú)環(huán)圖)表示,由代表變量的節(jié)點(diǎn)和連接這些節(jié)點(diǎn)的郵箱邊構(gòu)成。節(jié)點(diǎn)代表隨機(jī)變量,節(jié)點(diǎn)間的有向邊代表了節(jié)點(diǎn)間的相互關(guān)系(由父節(jié)點(diǎn)指向其子節(jié)點(diǎn))。如果變量是離散型,可以采用表的形式表示,稱為條件概率表,列出子節(jié)點(diǎn)與其父節(jié)點(diǎn)的每一種值的祝賀所對(duì)應(yīng)的概率。有父節(jié)點(diǎn)的節(jié)點(diǎn)用條件概率表示關(guān)系強(qiáng)度,沒(méi)有父節(jié)點(diǎn)的節(jié)點(diǎn)使用先驗(yàn)概率。貝葉斯分類器的分類原理是經(jīng)過(guò)實(shí)驗(yàn)中某樣本對(duì)象的先驗(yàn)概率,使用貝葉斯公式計(jì)算出其相應(yīng)的后驗(yàn)概率,從最大的后驗(yàn)概率的類中進(jìn)行選擇。貝葉斯分類基于貝葉斯原理,以貝葉斯公式為中心。貝葉斯公式如下:

        樸素貝葉斯分類假定所有屬性變量是“類條件下相互獨(dú)立”的,即每個(gè)屬性變量[Xi]只與類變量[ti]相關(guān)。拓?fù)浣Y(jié)構(gòu)圖如圖1所示。

        估計(jì)每個(gè)類的先驗(yàn)概率,一般可以按照[P(t=ti)=Ni/N]進(jìn)行估算,其中:[Ni]為子數(shù)據(jù)集中[t=ti]的樣本數(shù),[N]為訓(xùn)練集樣本總數(shù),之后按照最大似然估計(jì)準(zhǔn)則,在每個(gè)由[ti]標(biāo)定的子集,對(duì)類條件下屬性變量的概率進(jìn)行估計(jì)。

        3 數(shù)據(jù)來(lái)源、變量選擇及數(shù)據(jù)處理

        3.1 數(shù)據(jù)來(lái)源 本文使用的數(shù)據(jù)是西北農(nóng)林科技大學(xué)經(jīng)管學(xué)院學(xué)生采用調(diào)查問(wèn)卷的方式走訪陜西高陵、臨潼、楊陵3個(gè)地區(qū)所獲取的。問(wèn)卷主要分為5個(gè)部分,即農(nóng)戶基本信息、貸款經(jīng)歷與評(píng)價(jià)、產(chǎn)權(quán)抵押政策的落實(shí)情況、未來(lái)融資的需要與意見(jiàn)和建議。數(shù)據(jù)樣本容量為349。

        3.2 變量選擇 產(chǎn)權(quán)抵押貸款一般是根據(jù)個(gè)人信用評(píng)估的指標(biāo)進(jìn)行的。個(gè)人信用評(píng)估的指標(biāo)是綜合反映個(gè)人本身和環(huán)境所共同作用產(chǎn)生的復(fù)雜系統(tǒng)的不同屬性的指標(biāo),按照隸屬關(guān)系、層次結(jié)構(gòu)可將影響個(gè)人信用評(píng)估的因素加以分類和綜合,使個(gè)人信用的特征劃分為5個(gè)部分:品行、償付能力、資金。抵押擔(dān)保和條件,即常用的“5C評(píng)估法”[7]。參考“5C評(píng)估法”,最終選取所在地區(qū)、家庭規(guī)模、家庭經(jīng)營(yíng)類型、文化程度、近6年年均收入、近六年年均支出、家庭土地經(jīng)營(yíng)面積、當(dāng)?shù)剞r(nóng)信社信譽(yù)情況、工作人員服務(wù)態(tài)度、政策了解程度等10個(gè)因素作為本文研究的自變量,并以對(duì)產(chǎn)權(quán)抵押貸款意愿作為因變量來(lái)進(jìn)行研究。

        3.3 數(shù)據(jù)處理

        3.3.1 數(shù)據(jù)清洗 數(shù)據(jù)處理旨在清除掉與分類無(wú)關(guān)的數(shù)據(jù),對(duì)與本分類無(wú)關(guān)的數(shù)據(jù)進(jìn)行清除。同時(shí)還應(yīng)清除與分類無(wú)關(guān)的指標(biāo)以及重復(fù)指標(biāo),減少計(jì)算中帶來(lái)的不必要工作。

        3.3.2 數(shù)據(jù)集成 將多個(gè)數(shù)據(jù)按照格式統(tǒng)一起來(lái)存儲(chǔ),并建立信用數(shù)據(jù)庫(kù)。

        3.3.3 數(shù)據(jù)轉(zhuǎn)換 主要是對(duì)數(shù)據(jù)進(jìn)行離散化。不同的算法對(duì)輸入數(shù)據(jù)的要求不同,而且獲取的數(shù)據(jù)較為原始,計(jì)算時(shí)需要對(duì)數(shù)據(jù)進(jìn)行相應(yīng)轉(zhuǎn)換。本文所使用數(shù)據(jù)經(jīng)過(guò)預(yù)處理后,各變量屬性及編碼如表1所示。

        4 農(nóng)戶分類研究

        利用Weka軟件[8]建立貝葉斯網(wǎng)絡(luò)模型,利用模型進(jìn)行預(yù)測(cè)及檢驗(yàn)?zāi)P偷挠行约罢鎸?shí)性。該貝葉斯網(wǎng)絡(luò)分類模型是以對(duì)產(chǎn)權(quán)抵押貸款意愿(Class)為因變量,利用349條數(shù)據(jù)的訓(xùn)練集建立貝葉斯網(wǎng)絡(luò)模型。

        采用BayesNet下的local TAN模型構(gòu)建方法,并采用交叉驗(yàn)證方法,通過(guò)weka軟件分析得到模型。圖2為建立所獲得的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖。

        從圖2可以看出,家庭規(guī)模、文化程度、家庭經(jīng)驗(yàn)類型、近6年的平均收入、工作人員服務(wù)態(tài)度以及當(dāng)?shù)剞r(nóng)信社信譽(yù)情況作為子節(jié)點(diǎn)時(shí),它們的父節(jié)點(diǎn)同時(shí)是所在地區(qū)和對(duì)產(chǎn)權(quán)抵押貸款意愿。所在地區(qū)作為子節(jié)點(diǎn)時(shí),相應(yīng)的父節(jié)點(diǎn)是近6年的平均支出和對(duì)產(chǎn)權(quán)抵押貸款意愿,近6年的支出作為子節(jié)點(diǎn)時(shí),其父節(jié)點(diǎn)為政策了解程度和對(duì)產(chǎn)權(quán)抵押貸款意愿,政策了解程度作為子節(jié)點(diǎn)時(shí)只有一個(gè)相應(yīng)的父節(jié)點(diǎn)為對(duì)產(chǎn)權(quán)抵押貸款意愿。其中正確分類的實(shí)例到達(dá)58.7%,Kappa統(tǒng)計(jì)為0.3178,案例的覆蓋程度(0.95 level)為99.4269%,表現(xiàn)出較好的分類效果。

        ROC曲線指受試者工作特征曲線,是反映敏感性和特異性連續(xù)變量的綜合指標(biāo),是用構(gòu)圖法揭示敏感性和特異性的相互關(guān)系,它通過(guò)將連續(xù)變量設(shè)定出多個(gè)不同的臨界值,從而計(jì)算出一系列敏感性和特異性,再以敏感性為縱坐標(biāo)、(1-特異性)為橫坐標(biāo)繪制成曲線,曲線下面積越大,診斷準(zhǔn)確性越高。在ROC曲線上,最靠近坐標(biāo)圖左上方的點(diǎn)為敏感性和特異性均較高的臨界值。針對(duì)上述網(wǎng)絡(luò)結(jié)構(gòu)圖分類結(jié)果,利用weka軟件構(gòu)造roc曲線,對(duì)貝葉斯網(wǎng)絡(luò)分類結(jié)果進(jìn)行分類效果評(píng)價(jià)。

        圖3~5分別表示對(duì)應(yīng)分類結(jié)果為a、b及c,根據(jù)貝葉斯分類器所獲得結(jié)果分類準(zhǔn)確性比較,其曲線下對(duì)應(yīng)的圖形面積分別為0.692,0.6902和0.701。可以看出,本次建立的貝葉斯網(wǎng)絡(luò)分類模型對(duì)金融農(nóng)村具有較高的正確性及可靠性。在此基礎(chǔ)上,為了改進(jìn)并提高分類效果,在交叉驗(yàn)證上進(jìn)行參數(shù)修改,將Cross-validation Fold原定參數(shù)15改為10,即采用十折交叉驗(yàn)證(表2)。通過(guò)交叉驗(yàn)證的參數(shù)改變,貝葉斯網(wǎng)絡(luò)分類效果,有明顯的提高。

        5 結(jié)論

        本文針對(duì)農(nóng)戶產(chǎn)權(quán)抵押貸款,對(duì)農(nóng)村金融數(shù)據(jù)進(jìn)行貝葉斯網(wǎng)絡(luò)分類研究。在對(duì)調(diào)查數(shù)據(jù)進(jìn)行數(shù)據(jù)處理后,通過(guò)利用“5C評(píng)估法”,將大量的數(shù)據(jù)變量進(jìn)行篩選,選出了10個(gè)有顯著影響的數(shù)據(jù)變量,并將對(duì)產(chǎn)權(quán)抵押貸款的意愿作為數(shù)據(jù)類進(jìn)行分類研究。分類結(jié)果表明,采取十折交叉驗(yàn)證方法的貝葉斯網(wǎng)絡(luò)分類模型中,在農(nóng)村金融數(shù)據(jù)中有較高的正確性和覆蓋性。同時(shí),構(gòu)建反映各因素間相關(guān)關(guān)系的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖,能更進(jìn)一步解釋影響農(nóng)戶抵押貸款的各因素及其作用大小,對(duì)于農(nóng)村金融機(jī)構(gòu)進(jìn)行貸款決策起到了一定的積極作用。由于本研究所獲得數(shù)據(jù)容量較小,在后續(xù)的研究中,將擴(kuò)大調(diào)查范圍,以擴(kuò)大樣本容量,更進(jìn)一步提高分類的準(zhǔn)確性,為農(nóng)村金融改革提供有價(jià)值的參考。

        參考文獻(xiàn)

        [1]曾慶芬.產(chǎn)權(quán)改革背景下農(nóng)村居民產(chǎn)權(quán)融資意愿的實(shí)證研究——以成都“試驗(yàn)區(qū)”為個(gè)案[J].中央財(cái)經(jīng)大學(xué)學(xué)報(bào),2010(11):63-68.

        [2]李旭升,郭耀煌.基于樸素貝葉斯分類器的個(gè)人信用評(píng)估模型[J].計(jì)算機(jī)工程與應(yīng)用,2006,30:197-202.

        [3]康莊,余元全.基于貝葉斯分類器的納稅評(píng)估模型研究[J].經(jīng)濟(jì)問(wèn)題,2009(06):124-126.

        [4]吳陳,張明華.基于最優(yōu)樸素貝葉斯分類器的個(gè)人信用預(yù)測(cè)[J].江蘇科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,26(04):376-380.

        [5]唐爐亮,楊雪,闞子涵,等.一種基于樸素貝葉斯分類的車道數(shù)量探測(cè)[J].中國(guó)公路學(xué)報(bào),2016,29(03):116-123.

        [6]吳養(yǎng)會(huì),羅劍朝.農(nóng)村金融計(jì)量研究方法及應(yīng)用[M].北京:中國(guó)金融出版社,2015:244.

        [7]王夢(mèng)琪.應(yīng)收賬款管理的“5C評(píng)估法”及補(bǔ)充[J/OL].經(jīng)營(yíng)與管理,2017(07):29-32[2018-05-01].https://doi.org/10.16517/j.cnki.cn12-1034/f.2017.07.012.

        [8]袁梅宇.數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)-WEKA應(yīng)用技術(shù)與實(shí)踐[M].北京:清華大學(xué)出版社,2014.

        (責(zé)編:張宏民)

        精品国产一区二区三区av 性色| 亚洲国产人成综合网站| 国产自拍精品视频免费| 少妇内射兰兰久久| 亚洲成aⅴ人在线观看| 久久亚洲精彩无码天堂| 一区二区三区日韩蜜桃| 人妻精品久久久久中文字幕| 一本之道高清无码视频| 白色橄榄树在线免费观看| 精品亚洲一区二区在线观看| 妺妺窝人体色www婷婷| 成年午夜无码av片在线观看 | 2021久久精品国产99国产精品| 国产一毛片| 亚洲一区二区三区高清视频| 青春草免费在线观看视频| 欧美精品中文字幕亚洲专区| 国产免费看网站v片不遮挡| 日本97色视频日本熟妇视频| 精品久久久久久亚洲综合网| 欧美性狂猛xxxxx深喉| 欧美1区二区三区公司| 一区二区三区四区亚洲免费| 亚洲av日韩aⅴ无码色老头| 国产乱子伦露脸在线| 亚洲视频综合在线第一页| 婷婷色国产精品视频二区| 亚洲av无码国产精品色午夜洪| 亚洲国产另类久久久精品小说| 中文字幕视频一区懂色| 真实国产乱子伦精品视频| 欧美老妇与禽交| 美女扒开内裤露黑毛无遮挡| 国产精品国产三级国产密月| 国产成人国产三级国产精品| 欧美成妇人吹潮在线播放| 中文字幕日韩一区二区三区不卡| 免费观看久久精品日本视频| 精品亚洲一区二区三洲| 99精品人妻无码专区在线视频区|