矯世全
遼寧錦州渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院
基于Java的信用卡數(shù)據(jù)挖掘系統(tǒng)
矯世全
遼寧錦州渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院
隨著銀行信用卡市場在全球普及,信用卡在消費(fèi)中占主導(dǎo)地位,大多數(shù)銀行信用卡業(yè)務(wù)都能為本行增加經(jīng)濟(jì)收益,銀行嘗試在信用卡業(yè)務(wù)上創(chuàng)新或者優(yōu)化信用卡管理,銀行信用卡原始數(shù)據(jù)量巨大,通過分析原始數(shù)據(jù)挖掘潛在的商機(jī),本文基于決策樹算法實(shí)現(xiàn)銀行信用卡數(shù)據(jù)挖掘的功能,實(shí)現(xiàn)決策信用卡業(yè)務(wù)功能。信用卡的數(shù)據(jù)庫中存在大量數(shù)據(jù)記錄,通過數(shù)據(jù)挖掘建立信用卡客戶、業(yè)務(wù)功能模型,統(tǒng)計(jì)分析信用卡的業(yè)務(wù)模型以降低銀行信用卡的運(yùn)營風(fēng)險(xiǎn),該系統(tǒng)構(gòu)建以業(yè)績統(tǒng)計(jì)分析、銀行收益分析、重點(diǎn)業(yè)務(wù)領(lǐng)域分析等綜合性數(shù)據(jù)挖掘管理系統(tǒng),促進(jìn)銀行信用卡業(yè)務(wù)良性發(fā)展。本系統(tǒng)因信用卡實(shí)現(xiàn)數(shù)據(jù)挖掘具有可行性,針對(duì)于信用卡的數(shù)據(jù)挖掘建立挖掘模型,信用卡數(shù)據(jù)挖掘分析系統(tǒng)的設(shè)計(jì)對(duì)銀行經(jīng)濟(jì)收益具有實(shí)際應(yīng)用意義。
Java 銀行 信息卡 數(shù)據(jù)挖掘 決策樹算法
銀行信用卡業(yè)務(wù)量不斷增長,基于數(shù)據(jù)庫統(tǒng)計(jì)分析、存儲(chǔ)錄入、業(yè)務(wù)辦理等功能,由于信用卡數(shù)據(jù)量大,數(shù)據(jù)組織存儲(chǔ)凌亂,根本無法預(yù)測或者挖掘數(shù)據(jù)之間關(guān)聯(lián),更不可能根據(jù)某種規(guī)則挖掘信用卡未來業(yè)務(wù)的發(fā)展趨勢。信用卡管理缺乏基于原始數(shù)據(jù)挖掘數(shù)據(jù)之間的關(guān)聯(lián),銀行信用卡業(yè)務(wù)為了奪得客戶和市場,實(shí)現(xiàn)銀行信用卡業(yè)務(wù)長遠(yuǎn)的發(fā)展。銀行通過數(shù)據(jù)挖掘系統(tǒng)深入分析不同信用卡客戶的實(shí)際需求,尋找潛在客戶源,為其提供有針對(duì)性的信用卡業(yè)務(wù)服務(wù),是銀行提高市場占有率的關(guān)鍵,因此,基于數(shù)據(jù)挖掘方式實(shí)現(xiàn)客戶關(guān)系挖掘、重點(diǎn)業(yè)務(wù)挖掘等便成為銀行研究的重點(diǎn)問題。
信用卡成為現(xiàn)今普遍的支付方式,代表著信用憑證。信用卡業(yè)務(wù)集成了“存、貸、消”三種常用的功能,這是實(shí)現(xiàn)無紙無現(xiàn)鈔時(shí)代,它促進(jìn)社會(huì)經(jīng)濟(jì)發(fā)展和各類商品銷售,拉動(dòng)國內(nèi)經(jīng)濟(jì)增長,對(duì)社會(huì)發(fā)展起到促進(jìn)作用。
由于信用卡性質(zhì),需要實(shí)施基于數(shù)據(jù)挖掘手段整合信用卡業(yè)務(wù)需求。另外,銀行信用卡業(yè)務(wù)種類繁多,可能存在信用卡種類與客戶群不對(duì)稱的現(xiàn)象,務(wù)必會(huì)影響到信用卡發(fā)展趨勢,銀行使用信用卡業(yè)務(wù)的風(fēng)險(xiǎn)和獲取利潤并存。因此,銀行有必要對(duì)數(shù)據(jù)庫中的原始數(shù)據(jù)進(jìn)行整合,實(shí)施有效地?cái)?shù)據(jù)組織操作,將數(shù)據(jù)挖掘后的原始數(shù)據(jù)進(jìn)行分析和歸類操作,可以幫助銀行推行信用業(yè)務(wù),同時(shí)能夠準(zhǔn)確地預(yù)測未來發(fā)展。
2.1 系統(tǒng)功能性需求分析
本系統(tǒng)劃分為一級(jí)功能模塊和二級(jí)功能子模塊兩種。其中一級(jí)功能模塊賬戶管理、信用卡管理、數(shù)據(jù)挖掘管理、信用卡激活管理;二級(jí)功能模塊申請(qǐng)開卡業(yè)務(wù)、賬戶管理、開戶管理、信用卡管理、統(tǒng)計(jì)交易類型、統(tǒng)計(jì)交易金額、統(tǒng)計(jì)交易次數(shù)、統(tǒng)計(jì)客戶分布、統(tǒng)計(jì)查詢和激活功能。
①申請(qǐng)開卡:客戶通過銀行信用卡系統(tǒng)實(shí)現(xiàn)客戶資料填寫,完成信用卡開卡操作;
②賬戶管理:系統(tǒng)管理員實(shí)現(xiàn)對(duì)賬戶進(jìn)行管理,修改信用卡狀態(tài)、管理信用卡業(yè)務(wù);
③信用卡管理:實(shí)現(xiàn)對(duì)信用卡類型、額度、狀態(tài)等進(jìn)行綜合性管理操作;
④數(shù)據(jù)挖掘管理:統(tǒng)計(jì)交易類型,實(shí)現(xiàn)信用卡不同類型的統(tǒng)計(jì)操作;統(tǒng)計(jì)交易類型,統(tǒng)計(jì)信用卡交易類型;統(tǒng)計(jì)交易額度,統(tǒng)計(jì)某個(gè)用戶一段時(shí)間內(nèi)的交易額度;統(tǒng)計(jì)交易次數(shù),統(tǒng)計(jì)銀行信用卡用戶表在一定時(shí)間內(nèi)的交易次數(shù);
⑤信用卡激活操作:系統(tǒng)的管理人員通過信用卡賬戶或者身份證號(hào)查詢或者激活操作,當(dāng)信用卡開通之后必須進(jìn)行激活才能進(jìn)行后期的使用,包括:“存、貸、消”三種常用的功能。
2.2 系統(tǒng)非功能性需求分析
本文研究的信用卡數(shù)據(jù)挖掘管理系統(tǒng)的非功能性需求:
2.2.1 界面要求
要求該系統(tǒng)的功能界面按照統(tǒng)一界面風(fēng)格設(shè)計(jì),追求系統(tǒng)界面中控件布局合理、風(fēng)格一致。
2.2.2 功能擴(kuò)展性要求
系統(tǒng)的新功能擴(kuò)展要求采用遠(yuǎn)程服務(wù)器端進(jìn)行功能擴(kuò)展升級(jí)設(shè)計(jì)方案,其目的是當(dāng)信用卡需求變更為新功能時(shí),只在遠(yuǎn)程的服務(wù)器端更新即可實(shí)現(xiàn)異步更新,使得系統(tǒng)新功能擴(kuò)展的需求。
2.2.3 安全性能要求
為了保障系統(tǒng)安全性,避免系統(tǒng)在運(yùn)行過程中受黑客惡意攻擊,當(dāng)前的網(wǎng)絡(luò)環(huán)境下傳輸數(shù)據(jù)并不安全,如果對(duì)傳輸數(shù)據(jù)進(jìn)行安全性保障,需要對(duì)傳輸?shù)臄?shù)據(jù)進(jìn)行加密和解密操作。
3.1 系統(tǒng)的總體設(shè)計(jì)目標(biāo)
信用卡數(shù)據(jù)挖掘系統(tǒng)實(shí)現(xiàn)的設(shè)計(jì)目標(biāo):
①系統(tǒng)資源整合操作,整合信用卡中心的原始業(yè)務(wù)數(shù)據(jù),實(shí)現(xiàn)原始數(shù)據(jù)實(shí)時(shí)共享。
②方便辦理銀行信用卡業(yè)務(wù)。
③信用卡數(shù)據(jù)挖掘系統(tǒng)并不是直接傳輸數(shù)據(jù),而需要對(duì)原始數(shù)據(jù)進(jìn)行加密和解密操作,數(shù)據(jù)保密性較好。
④系統(tǒng)的新務(wù)功能進(jìn)行擴(kuò)展操作,例如:網(wǎng)上自助查詢與服務(wù)管理功能等。
⑤軟件界面簡單快捷,有利于客戶和管理者在實(shí)際信用卡管理過程中投入使用。
3.2 基于決策樹算法信用卡數(shù)據(jù)挖掘算法描述
本文基于決策樹算法來實(shí)現(xiàn)對(duì)銀行信用卡的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘操作,決策樹一度是數(shù)據(jù)挖掘?qū)崿F(xiàn)的經(jīng)典算法。算法巧妙的通過對(duì)已知訓(xùn)練原始數(shù)據(jù)建立決策關(guān)系,再根據(jù)建好的決策樹模型實(shí)現(xiàn)對(duì)原始數(shù)據(jù)分析和歸類操作。建立決策過程可視為原始數(shù)據(jù)規(guī)則分類過程。
本文的基于決策樹構(gòu)建數(shù)據(jù)挖掘系統(tǒng)的模型步驟如下:
①選擇經(jīng)典的決策樹算法將銀行信用卡原始數(shù)據(jù)進(jìn)行初步的分類與分析;
②經(jīng)過預(yù)處理原始數(shù)據(jù),由于銀行領(lǐng)域的數(shù)據(jù)特殊性和系統(tǒng)中存在大量的原始信用卡數(shù)據(jù),如果想要通過對(duì)原始數(shù)據(jù)進(jìn)行挖掘和應(yīng)用,根據(jù)決策數(shù)據(jù)模型發(fā)現(xiàn)潛在原始數(shù)據(jù)匯總的重要的價(jià)值信息;
③基于決策樹算法訓(xùn)練信用卡原始數(shù)據(jù)樣本,構(gòu)建信用卡數(shù)據(jù)挖掘管理模型,而基于決策樹算法訓(xùn)練獲取決策樹應(yīng)用模型,更易于對(duì)數(shù)據(jù)挖掘的理解;
④根據(jù)應(yīng)用模型獲取的關(guān)于原始數(shù)據(jù)分類結(jié)果,在本文的系統(tǒng)中存在功能模塊實(shí)現(xiàn)對(duì)原始數(shù)據(jù)的分類與評(píng)估操作,對(duì)信用卡的原始數(shù)據(jù)挖掘過程和挖掘結(jié)果進(jìn)行排序,銀行信用卡中心工作人員根據(jù)數(shù)據(jù)挖掘模型所獲取關(guān)數(shù)數(shù)據(jù)集合;
⑤最后將數(shù)據(jù)挖掘得到的整合數(shù)據(jù)采用圖或者表或者圖標(biāo)結(jié)合的方式展現(xiàn)給銀行信用卡中心管理人員,以一種直觀可視化的方法便于對(duì)現(xiàn)在的業(yè)務(wù)分析和對(duì)未來信用卡業(yè)務(wù)發(fā)展動(dòng)向進(jìn)行預(yù)測。
3.3 基于決策樹算法信用卡數(shù)據(jù)挖掘算法實(shí)現(xiàn)
在設(shè)計(jì)數(shù)據(jù)挖掘過程中,決策樹的決策路徑表示信用卡原始分類的路徑,對(duì)于給定的某個(gè)信用卡原始數(shù)據(jù)集合D而言,對(duì)于已經(jīng)輸入的變量I值,表示輸入變量值表示要選擇的數(shù)據(jù)挖掘算法序號(hào)值,如果在原始數(shù)據(jù)中要獲取到N個(gè)數(shù)據(jù)分類路徑,由于管理人員輸入的變量存在不確定性,如果給定樣本數(shù)據(jù)集合D存在多種分類結(jié)果時(shí),當(dāng)分類結(jié)果視為數(shù)據(jù)增長的決定性因素,根據(jù)決策樹的路徑實(shí)現(xiàn)的對(duì)給定的樣本D進(jìn)行數(shù)據(jù)分類,其評(píng)價(jià)值作為熵,為了下一步數(shù)據(jù)N的分類,定義分類函數(shù)F,其輸入?yún)?shù)為給定樣本數(shù)據(jù)集合D和表示數(shù)據(jù)挖掘算法序號(hào)I值,函數(shù)公式記作:F(Di,I),函數(shù)公式1表示為:
公式1中:i為n個(gè)數(shù)據(jù)樣本的第i個(gè)數(shù)據(jù)集合,n為總的數(shù)據(jù)集合總數(shù),I表示序號(hào),D給定樣本原始數(shù)據(jù)集合。
算法1 基于決策樹算法的信用卡數(shù)據(jù)挖掘過程input: D,I; //輸入D樣本原始數(shù)據(jù)和I序號(hào),存在系統(tǒng)中的數(shù)據(jù)挖掘分類算法序號(hào)output: G//輸出對(duì)原始數(shù)據(jù)樣本的數(shù)據(jù)挖掘分類關(guān)系圖; 1:初始化 G←null,T←null; //初始化數(shù)據(jù)挖掘的分類圖和空值決策樹2:switch(I);//根據(jù)參數(shù)I值判斷使用數(shù)據(jù)挖掘算法,本文定義I=1為決策樹3:for i←0 to D.length;//根據(jù)循環(huán)預(yù)處理原始數(shù)據(jù)樣本4: D←P(D);//根據(jù)預(yù)處理函數(shù)還原給原始樣本數(shù)據(jù)5:end for; 6:T←decisionFunction(D,I);//構(gòu)建一個(gè)以原始數(shù)據(jù)為準(zhǔn)的決策樹7:List list←select data node and path on decision tree; //從決策樹的數(shù)據(jù)節(jié)點(diǎn)上選擇路徑作為本次挖掘數(shù)據(jù)結(jié)果8:for i←0 to list.size;//根據(jù)循環(huán)取出本次挖掘數(shù)據(jù)結(jié)果9: G←list.get(i)//獲取數(shù)據(jù)節(jié)點(diǎn),將此節(jié)點(diǎn)添加到數(shù)據(jù)挖掘分類圖中10:end for 11:end switch 12:return G;//返回一個(gè)原始數(shù)據(jù)挖掘后的關(guān)系圖
算法1關(guān)于決策樹應(yīng)用過程和算法偽代碼實(shí)現(xiàn)設(shè)計(jì),實(shí)現(xiàn)了從樣本原始數(shù)據(jù)的構(gòu)建信用卡決策分類數(shù)據(jù),并將分類數(shù)據(jù)節(jié)點(diǎn)的路徑以圖或者表或者二者結(jié)合的形式表示,形成的數(shù)據(jù)關(guān)聯(lián)圖即直觀觀察,又便于信用卡中心對(duì)信用卡業(yè)務(wù)做出決策。
4.1 系統(tǒng)測試目標(biāo)與測試原則
針對(duì)數(shù)據(jù)挖掘系統(tǒng),可使用相關(guān)測試工具完成系統(tǒng)的測試工作,預(yù)期目標(biāo)如下:
4.1.1 整體測試目標(biāo)
系統(tǒng)業(yè)務(wù)功能按照最終的需求分析設(shè)計(jì),無嚴(yán)重缺陷即可,系統(tǒng)性能指標(biāo)核系統(tǒng)響應(yīng)時(shí)間在允許的范圍內(nèi)。
4.1.2 功能測試
功能基本實(shí)現(xiàn),每個(gè)功能之間完整通暢。
4.1.3 性能測試
多用戶、高并發(fā)、多任務(wù)訪問服務(wù)器均能符合相關(guān)要求,并支持較大大數(shù)據(jù)并發(fā)量查詢性能,性能測試在允許的范圍內(nèi)。
4.2 系統(tǒng)測試結(jié)論
4.2.1 系統(tǒng)優(yōu)點(diǎn)
通過上面測試可以發(fā)現(xiàn)數(shù)據(jù)挖掘系統(tǒng)功能上符合前期需求,為信用卡中心提供了良好應(yīng)用平臺(tái),一是能夠?qū)崿F(xiàn)信用卡數(shù)據(jù)挖掘管理,二是為信用卡業(yè)務(wù)提供科學(xué)決策依據(jù)。
4.2.2 系統(tǒng)不足
系統(tǒng)對(duì)外接口未實(shí)現(xiàn)預(yù)留,隨著銀行信用卡業(yè)務(wù)不斷增多,信用卡數(shù)據(jù)挖掘會(huì)帶來巨大方便,該系統(tǒng)某些實(shí)用性的功能還需進(jìn)一步擴(kuò)展,更好的為信用卡中心服務(wù)。
本文研究的主要工作:
①做出符合銀行信用卡管理的需求分析。
②通過研究信用卡數(shù)據(jù)挖掘的成功案例,再加上前人論文的借鑒基礎(chǔ)上,熟悉Java編程語言的開發(fā)工作,熟練掌握了關(guān)于面向?qū)ο缶幊袒舅枷搿?/p>
③分析本文所開發(fā)系統(tǒng)涉及到的關(guān)鍵技術(shù)與軟件設(shè)計(jì)思想,其中包括:編程技術(shù)和數(shù)據(jù)庫技術(shù)。詳細(xì)設(shè)計(jì)完成了系統(tǒng)的基本功能模塊實(shí)現(xiàn),并為未來的信用卡業(yè)務(wù)發(fā)展預(yù)留部分待功能擴(kuò)展接口,方便該系統(tǒng)擴(kuò)展升級(jí)操作。
信用卡數(shù)據(jù)挖掘的需求會(huì)隨銀行信用卡業(yè)務(wù)進(jìn)行不斷更新,有變更需求的系統(tǒng)軟件功能也隨著發(fā)生改變,信用卡功能內(nèi)容也隨著不斷豐富。信用卡數(shù)據(jù)挖掘管仍然存在一些不足之處,這些待改進(jìn)的地方有望在今后研究中加以著重改進(jìn)和完善的方面。
[1]沈阿強(qiáng),陳潔,秦娟.大客戶關(guān)系管理流程與實(shí)務(wù)[M].北京:人民郵電出版社,2007
[2]杜麗英,趙秀菊.基于數(shù)據(jù)挖掘的銀行客戶關(guān)系管理系統(tǒng)的研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2014,1:18-19