【摘 要】本文論述了住房公積金管理系統(tǒng)的研究設(shè)計(jì)過(guò)程。運(yùn)用數(shù)據(jù)庫(kù)原理設(shè)計(jì)實(shí)現(xiàn)了住房公積金管理中心的單位開(kāi)戶(hù)、個(gè)人開(kāi)戶(hù)、繳存基數(shù)調(diào)整等業(yè)務(wù)需求。分析了FP_growth算法原理與實(shí)現(xiàn)的過(guò)程并應(yīng)用到公積金管理中,實(shí)現(xiàn)有效地幫助公積金管理中心以及相關(guān)部門(mén)對(duì)公積金業(yè)務(wù)的管理,對(duì)歸集資金的控制與分配,提高公積金業(yè)務(wù)辦理效率。
【關(guān)鍵詞】公積金 數(shù)據(jù)挖掘 關(guān)聯(lián)規(guī)則 FP_growth算法
一、研究背景
目前公積金業(yè)務(wù)的信息化已成為一種必然的趨勢(shì)。建立完善的信息化平臺(tái),有效的提高業(yè)務(wù)的流程操作,通過(guò)規(guī)范住房公積金管理運(yùn)作、促進(jìn)住房公積金事業(yè)健康發(fā)展的需要,最終達(dá)到提高業(yè)務(wù)工作效率和優(yōu)質(zhì)服務(wù)的目標(biāo)。
現(xiàn)在我國(guó)各地住房公積金行業(yè)數(shù)據(jù)化構(gòu)建較為落后,處于原始數(shù)據(jù)階段。對(duì)信息數(shù)據(jù)的處理、業(yè)務(wù)需求的預(yù)測(cè)分析、住房公積金發(fā)展趨勢(shì)和狀況相應(yīng)的分析與預(yù)測(cè),從而不能準(zhǔn)確尋找目標(biāo)顧客群以提高資金使用率,這就要求住房問(wèn)題迫切的需求改變。
二、技術(shù)概述
本文設(shè)計(jì)一種UniEAP平臺(tái),基于UniEAP平臺(tái)實(shí)現(xiàn)公積金核心業(yè)務(wù)系統(tǒng)。首先要形成模型,在平臺(tái)中提取出可實(shí)現(xiàn)配置單元,建立組件庫(kù)或方法庫(kù),然后通過(guò)UniEAP的管理和配置,使它適應(yīng)各種紛繁復(fù)雜的業(yè)務(wù)和公積金算法。
基于UniEAP平臺(tái)的應(yīng)用
(一)做出系統(tǒng)分析,抽取出原子對(duì)象;
(二)整合公積金業(yè)務(wù)流程,抽取關(guān)鍵對(duì)象,
(三)從原子因素分析,找出相應(yīng)的屬性和操作方法。
這樣,就能在以后的應(yīng)用中實(shí)現(xiàn)各種復(fù)雜的業(yè)務(wù)流程,適應(yīng)靈活多變的政策變更。
三、系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
住房公積金的產(chǎn)生就是為了籌集資金進(jìn)行合理化分配。業(yè)務(wù)管理涉及職工個(gè)人、職工單位、受委托銀行和住房公積金管理中心等多個(gè)法律關(guān)系主體。
公積金核心業(yè)務(wù)有很多,本文中主要對(duì)三個(gè)核心業(yè)務(wù)模塊進(jìn)行分析。即單位賬戶(hù)管理模塊、個(gè)人賬戶(hù)管理模塊、繳存基數(shù)管理模塊。系統(tǒng)功能層次圖如下所示。
四、FP_growth算法
通過(guò)對(duì)數(shù)據(jù)挖掘技術(shù)的分析,并根據(jù)當(dāng)前對(duì)住房公積金管理系統(tǒng)的數(shù)據(jù)挖掘需求,確定使用FP_growth算法進(jìn)行住房公積金管理系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)。
(一)FP_growth算法步驟
FP的全稱(chēng)是Frequent Pattern,在算法中使用了一種稱(chēng)為頻繁模式樹(shù)(Frequent Pattern Tree)的數(shù)據(jù)結(jié)構(gòu)。FP-growth算法的步驟:
1.掃描數(shù)據(jù)庫(kù),生成的FP-tree,得到支持度降序排列的L1;
2.通過(guò)這種排序,構(gòu)建最初的FP—tree;
3.對(duì)FP-tree進(jìn)行升序的挖掘,出現(xiàn)頻繁的項(xiàng)更可能被共享。
(二)FP-growth算法實(shí)現(xiàn)方法
通過(guò)對(duì)數(shù)據(jù)庫(kù)進(jìn)行一次掃描生成單頻繁項(xiàng)集,計(jì)算所有單個(gè)項(xiàng)目的支持度,生成長(zhǎng)度為l的頻繁項(xiàng)目集L。降序排列項(xiàng)目集L。刪除非頻繁項(xiàng),生成單頻繁項(xiàng)集FP-1,算法如下:
Algorithm FP-I
Input: 事務(wù)數(shù)據(jù)庫(kù)TD,最小支持度min_sup
Output:TD中的頻繁1項(xiàng)集Ll和排序后的TD
Method:Call FP-1(TD,min_sup)
Procedure FP-1(TD,min_sup)
{ L1={largel-itemsets};
for all transactions t∈TD
L1[ti]++;
for(k=l;k<=n;k++)
if(L1[k] L1[k]=0; 降序排列L。: for all transactions t∈TD 按L1順序排列t中屬性; return 重新排列過(guò)的TD與L1;} 并且構(gòu)建最初的FP_tree在第二趟掃描中,生成FP_tree。生成FP_tree算法FP-2如下: Algorithm FP-2 Input: 事務(wù)數(shù)據(jù)庫(kù)TD,Ll Output: FP_tree的根T和頻繁l項(xiàng)集Ll的FH Method:Call FP-2(TD,L1) Procedure FP-2(TD,LI) {T=Φ; for all transactions ti∈TD 將ti中的頻繁單項(xiàng)按L1中順序排列成[x|X]; call Insert-Tree([x|X],T); return T與FH;} (三)基本思路 不斷地迭代FP-tree的構(gòu)造和投影過(guò)程。 構(gòu)建各單頻繁項(xiàng)的條件模式基對(duì)L1中各單頻繁項(xiàng),對(duì)于每個(gè)頻繁項(xiàng),構(gòu)造它的條件投影數(shù)據(jù)庫(kù)和投影FP-tree。對(duì)每個(gè)新構(gòu)建的FP-tree重復(fù)這個(gè)過(guò)程,直到構(gòu)造的新FP-tree為空,或者只包含一條路徑。當(dāng)構(gòu)造的FP-tree為空時(shí),其前綴即為頻繁模式;當(dāng)只包含一條路徑時(shí),通過(guò)枚舉所有可能組合并與此樹(shù)的前綴連接即可得到頻繁模式。 本文對(duì)住房公積金決策支持系統(tǒng)的設(shè)計(jì)理念是將現(xiàn)有的公積金核心業(yè)務(wù)系統(tǒng)改造成為一個(gè)安全、可靠、易于管理、易于維護(hù)、技術(shù)先進(jìn)的應(yīng)用系統(tǒng)。將關(guān)聯(lián)規(guī)則挖掘算法應(yīng)用現(xiàn)實(shí)的住房公積金管理系統(tǒng)中,為群眾提供更加優(yōu)質(zhì)、方便的服務(wù)。輔助各部門(mén)進(jìn)行收繳公積金、銀行存款投資和規(guī)劃商品住房的建設(shè)等決策。 參考文獻(xiàn): [1]陳旭輝.HIS構(gòu)架及基于HIS的數(shù)據(jù)挖掘.安徽理工大學(xué)碩士學(xué)位論文.2009 [2]胡文瑜,孫志揮.數(shù)據(jù)挖掘取樣方法研究.計(jì)算機(jī)研究與發(fā)展,2011.(1) [3]王愛(ài)平,王占鳳.數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法.計(jì)算機(jī)技術(shù)與發(fā)展,2010.(4) [4]陳永當(dāng),王鈺鑫.基于用戶(hù)訪(fǎng)問(wèn)信息的數(shù)據(jù)挖掘方法及其算法.計(jì)算機(jī)工程與應(yīng)用,2012.(15)