亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘技術(shù)的個人信用的研究與分析

        2016-02-02 13:07:10
        山東工業(yè)技術(shù) 2016年22期
        關(guān)鍵詞:平方和項(xiàng)集數(shù)據(jù)挖掘

        董 婷

        (榆林學(xué)院信息工程學(xué)院,陜西 榆林 719000)

        基于數(shù)據(jù)挖掘技術(shù)的個人信用的研究與分析

        董 婷

        (榆林學(xué)院信息工程學(xué)院,陜西 榆林 719000)

        本文使用國內(nèi)頂尖的在線數(shù)據(jù)挖掘平臺(TipDM),找出對分類預(yù)測影響較大的屬性進(jìn)行建模,分別通過基于k-means的聚類分析和Aporiori關(guān)聯(lián)規(guī)則分析等方法對樣本數(shù)據(jù)進(jìn)行分析預(yù)測,找到了一條最后的規(guī)則。

        數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;個人信用

        0 引言

        本文使用國內(nèi)頂尖的在線數(shù)據(jù)挖掘平臺(TipDM),找出對分類預(yù)測影響較大的變量進(jìn)行建模,分別通過k-means的聚類分析、Aporiori關(guān)聯(lián)規(guī)則分析等方法對樣本數(shù)據(jù)進(jìn)行分析預(yù)測。

        1 方法

        1.1 K-means聚類算法

        K-means聚類算法是把數(shù)據(jù)點(diǎn)到原模型的某種距離作為優(yōu)化的目標(biāo)函數(shù),利用函數(shù)求極值的方法得到迭代運(yùn)算的調(diào)整規(guī)則。K-means算法以歐式距離作為相似度測度,它是求對應(yīng)某一初始聚類中心向量V最優(yōu)分類,使得評價指標(biāo)J最小[1]。算法采用誤差平方和準(zhǔn)則函數(shù)作為聚類準(zhǔn)則函數(shù)。

        (1)K-means聚類算法的目標(biāo)函數(shù)。對于給定的一個包含n個 S維數(shù)據(jù)點(diǎn)的數(shù)據(jù)集,以及要生成的數(shù)據(jù)子集的數(shù)目K,K-means聚類算法將數(shù)據(jù)對象組織為K個劃分。每個劃分代表一個類,每個類有一個類別中心。計(jì)算該類內(nèi)各點(diǎn)到聚類中心的距離平方和,聚類目標(biāo)是使各類總的距離平方和最小[2]。

        (2)K-means算法的算法流程。K-means算法是一個反復(fù)迭代過程,目的是使聚類域中所有的樣品到聚類中心距離的平方和最小,算法流程如下:第一步:選定數(shù)據(jù)空間中K個對象作為初始聚類中心;第二步:根據(jù)歐氏距離最近原則分別將它們分配給與其最相似的聚類中心所代表的類;第三步:計(jì)算每個類別中所有對象的均值作為該類別的新聚類中心,計(jì)算所有樣本到其所在類,并判斷聚類中心和值是否發(fā)生改變,若不改變則結(jié)束,若改變則繼續(xù)循環(huán)操作,直到聚類中心和值不發(fā)生改變?yōu)橹筟3]。

        1.2 關(guān)聯(lián)規(guī)則

        兩個或兩個以上變量的取值之間存在某種規(guī)律性,就是關(guān)聯(lián)。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。Apriori algorithm是關(guān)聯(lián)規(guī)則里一項(xiàng)基本算法。關(guān)聯(lián)規(guī)則的目的就是在一個數(shù)據(jù)集中找出項(xiàng)與項(xiàng)之間的關(guān)系,也被稱為購物藍(lán)分析。Apriori核心算法過程如下: 第一步:掃描數(shù)據(jù)庫計(jì)算出各個項(xiàng)集的支持度,得到頻繁項(xiàng)集的集合;第二步:做一個(k-2)JOIN運(yùn)算得到 2個只有一個項(xiàng)不同的屬于的頻集;第三步:通過掃描數(shù)據(jù)庫,計(jì)算中各個項(xiàng)集的支持度,將中不滿足支持度的項(xiàng)集去掉[4]。

        2 試驗(yàn)數(shù)據(jù)

        本文通過對300條樣本數(shù)據(jù)的年齡、姓名、地區(qū)、收入、是否結(jié)婚、是否有孩子、是否有汽車、是否有抵押等參數(shù)進(jìn)行分析,通過關(guān)聯(lián)規(guī)則對樣本中的某些變量進(jìn)行分析,找到了一條最優(yōu)規(guī)則;通過聚類分析算法對樣本整體和某一變量進(jìn)行聚類分析,分析出各簇中的樣本數(shù)與百分比。

        3 試驗(yàn)結(jié)果

        3.1 利用K-means算法對樣本數(shù)據(jù)進(jìn)行分析評估

        k均值聚類迭代次數(shù)為3,集群內(nèi)誤差平方和為775.1756576878267,用均值替代的全局缺省值,得到各簇分析統(tǒng)計(jì)結(jié)果如表1。

        表1

        3.2 利用Apriori關(guān)聯(lián)規(guī)則算法對樣本數(shù)據(jù)進(jìn)行分析評估

        樣本的最小支持度為0.1,置信度為0.9,產(chǎn)生的項(xiàng)集和其樣本數(shù)量如表2。

        表2

        Apriori關(guān)聯(lián)規(guī)則分析結(jié)果如下:

        children=NO mortgage=NO pep=NO 49 ==> married=YES 48<conf:(0.98)> lift:(1.45) lev:(0.05) [15] conv:(8

        4 試驗(yàn)總結(jié)

        現(xiàn)階段,信貸業(yè)務(wù)的發(fā)展迅速,針對企業(yè)的信用評級已逐步完善,然而,針對個人的信用評級卻相對欠缺。本次試驗(yàn)是使用國內(nèi)頂尖的數(shù)據(jù)挖掘平臺(tipdm)主要是針對個人信用評價的樣本數(shù)據(jù)的某些變量進(jìn)行了k-means聚類分析和關(guān)聯(lián)規(guī)則分析,通過這次試驗(yàn)我認(rèn)為k-means聚類算法是一個NP難優(yōu)化問題,無法獲得全局最優(yōu)。

        通過對樣本數(shù)據(jù)分析評估發(fā)現(xiàn),在個人信用評級中信用最好的一條規(guī)則是沒有孩子、沒有抵押或負(fù)債,并且已經(jīng)結(jié)婚。

        [1]杜廣龍.面向多自由度機(jī)器人的非受限智能人機(jī)交互的研究[D].華南理工大學(xué),2013.

        [2]安璐.異構(gòu)蜂窩網(wǎng)絡(luò)高能效節(jié)點(diǎn)部署研究[D].北京郵電大學(xué),2015.

        [3]任超.基于智能計(jì)算的預(yù)測模型研究及其在公共危機(jī)管理中的應(yīng)用[D].蘭州大學(xué),2013.

        [4]陳雪萍.數(shù)據(jù)挖掘技術(shù)在高校教務(wù)管理中的應(yīng)用研究[D].廣西師范大學(xué),2014.

        項(xiàng)目:2014榆林科技局項(xiàng)目(2014cxy-09-6)

        10.16640/j.cnki.37-1222/t.2016.22.129

        猜你喜歡
        平方和項(xiàng)集數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        費(fèi)馬—?dú)W拉兩平方和定理
        利用平方和方法證明不等式賽題
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        勾股定理的擴(kuò)展
        關(guān)于四奇數(shù)平方和問題
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        一種頻繁核心項(xiàng)集的快速挖掘算法
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        国产无遮挡又爽又刺激的视频老师| 东京道一本热码加勒比小泽| 亚洲综合中文日韩字幕| 无码少妇丰满熟妇一区二区| 777午夜精品免费观看| 欧美视频第一页| 丰满多毛少妇做爰视频| 午夜无码熟熟妇丰满人妻| 中文字幕高清视频婷婷| 亚洲av无码码潮喷在线观看| 骚小妹影院| 东京热久久综合久久88| 久久久久无码精品国| 日本一级二级三级不卡| 国产一区二区三区精品免费av| 国产av丝袜旗袍无码网站| 国产综合自拍| 国内激情一区二区视频| 色欲色香天天天综合网www| 国内精品久久久久影院一蜜桃| 国产激情视频在线观看首页| 日本一区免费喷水| 91九色熟女潮喷露脸合集| 三a级做爰片免费观看| 国产欧美VA欧美VA香蕉在| 国产高跟丝袜在线诱惑| 白白发在线视频免费观看2| 粗大的内捧猛烈进出看视频| 国产av无码专区亚洲av| 亚洲无码美韩综合| 人妻制服丝袜中文字幕| 97夜夜澡人人双人人人喊| 一本一道波多野结衣av中文| 日本超骚少妇熟妇视频| 98色婷婷在线| 久久丫精品国产亚洲av| 厕所极品偷拍一区二区三区视频 | 91免费国产| 日韩一区二区三区人妻免费观看| 中文字幕久久久人妻无码| 男人的天堂在线无码视频|