摘要:隨著我國金融行業(yè)的快速發(fā)展,傳統(tǒng)的金融信息系統(tǒng)已經(jīng)無法滿足銀行在經(jīng)營過程中的各種需求。因此眾多銀行開始構(gòu)建數(shù)據(jù)倉庫,并基于此技術(shù)進行業(yè)務(wù)運作、經(jīng)營管理、客戶關(guān)系管理、銀行產(chǎn)品推廣等各種分析,在激烈的競爭中掌握主動、獲得更大的發(fā)展空間。
關(guān)鍵詞:數(shù)據(jù)倉庫;銀行信息化;應(yīng)用
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9599 (2012) 17-0000-02
1 引言
近些年我國經(jīng)濟取得了快速的發(fā)展,金融信息化程度也隨之得以大幅的提升。金融行業(yè)是我國國民經(jīng)濟的重要組成部分之一,也是市場經(jīng)濟的核心行業(yè),因此重點發(fā)展金融信息化、提高金融信息化水平是我國信息化戰(zhàn)略中一項不能或缺的內(nèi)容。金融信息化的發(fā)展促進金融市場逐步聯(lián)合成一個整體,大大提高了各類相關(guān)信息的收集、處理和發(fā)布從而提高金融企業(yè)的競爭能力。
2 數(shù)據(jù)倉庫的設(shè)計要求
傳統(tǒng)的金融信息管理系統(tǒng)大多采用c/s結(jié)構(gòu),客戶直接訪問生產(chǎn)數(shù)據(jù)庫,完成信息的查詢、更新、管理。但這就存在很多缺陷,例如系統(tǒng)安全性不夠、系統(tǒng)僅僅是信息的存儲容器而無法達到分析預(yù)測的高度等等。隨著數(shù)據(jù)庫的發(fā)展以及數(shù)據(jù)倉庫技術(shù)的出現(xiàn),越來越多的金融企業(yè)開始構(gòu)建自己的數(shù)據(jù)倉庫。
與傳統(tǒng)的金融信息管理系統(tǒng)不同的是,基于數(shù)據(jù)倉庫技術(shù)構(gòu)建的系統(tǒng)不僅保留了原有系統(tǒng)的各種業(yè)務(wù)功能,同時在金融結(jié)構(gòu)多年累積的數(shù)據(jù)的基礎(chǔ)上,進一步加強信息查詢分析預(yù)測以及報表的功能,使用戶數(shù)據(jù)得以最大的利用。數(shù)據(jù)倉庫的設(shè)計應(yīng)滿足如下一些要求:
3 建立數(shù)據(jù)倉庫的基礎(chǔ)
目前投入使用的金融信息管理系統(tǒng)大部分是基于關(guān)系數(shù)據(jù)庫(Relational Database Service,RDS)技術(shù),因為關(guān)系數(shù)據(jù)庫起步較早,發(fā)展較成熟,使用復(fù)雜性較低。關(guān)系型數(shù)據(jù)庫是構(gòu)建數(shù)據(jù)倉庫的基礎(chǔ),但僅僅是使用關(guān)系數(shù)據(jù)庫也不能完全構(gòu)建符合用戶需求的數(shù)據(jù)倉庫,還需要使用其他的數(shù)據(jù)庫技術(shù),例如,優(yōu)化查詢、位圖索引、動態(tài)分區(qū)等,在大型數(shù)據(jù)倉庫應(yīng)用環(huán)境中,通過上述幾項技術(shù)使關(guān)系數(shù)據(jù)庫管理系統(tǒng)的性能極大的優(yōu)化和提升。
4 建立數(shù)據(jù)倉庫的過程
基于用戶的需求構(gòu)建數(shù)據(jù)倉庫,通常由以下三個步驟組成:設(shè)計、數(shù)據(jù)抽取、數(shù)據(jù)管理。
4.1 數(shù)據(jù)倉庫設(shè)計。系統(tǒng)設(shè)計師基于用戶的需求和企業(yè)的數(shù)據(jù)設(shè)計數(shù)據(jù)倉庫的結(jié)構(gòu)。常用的結(jié)構(gòu)包括星型模型和雪花模型,在星型模型中事實表居中,多個維表分布在事實表周圍與其連接。在星型模型的基礎(chǔ)上發(fā)展出雪花模型。具體的構(gòu)建過程包括如下三個部分:
(1)確定用戶數(shù)據(jù)庫涉及的各個數(shù)據(jù)源的細節(jié),這些細節(jié)包括使用數(shù)據(jù)源的方式、用戶數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)更新頻率、數(shù)據(jù)擁有者等。(2)確定從用戶數(shù)據(jù)源抽取數(shù)據(jù)的方式。設(shè)計師需要制定計劃如何從各個用戶數(shù)據(jù)源抽取數(shù)據(jù),并對數(shù)據(jù)進行恰當?shù)母袷睫D(zhuǎn)換并儲存在當前庫。(3)設(shè)計師應(yīng)該將用戶數(shù)據(jù)細分成數(shù)個業(yè)務(wù)主題,并基于這些業(yè)務(wù)主題構(gòu)建業(yè)務(wù)主題表。這些業(yè)務(wù)主題表就是基于用戶數(shù)據(jù)的數(shù)據(jù)子集,即數(shù)據(jù)集市(DataMart)。一般來說,數(shù)據(jù)集市往往針對部分用戶數(shù)據(jù)(例如某一部門的用戶數(shù)據(jù)、某一類特定產(chǎn)品的等),因此,它的規(guī)模通常較小,開發(fā)成本較低,開發(fā)周期較短。在實際的數(shù)據(jù)倉庫構(gòu)建過程中,設(shè)計師通常首先基于用戶核心數(shù)據(jù)構(gòu)建若干個數(shù)據(jù)集市,在基于數(shù)據(jù)集市構(gòu)建企業(yè)級數(shù)據(jù)倉庫。
4.2 數(shù)據(jù)抽取模塊。再完成數(shù)據(jù)倉庫的設(shè)計后,需要構(gòu)建數(shù)據(jù)抽取模塊。數(shù)據(jù)抽取模塊基于之前設(shè)計的數(shù)據(jù)抽取規(guī)則對各類數(shù)據(jù)源(包括各類數(shù)據(jù)庫、文本數(shù)據(jù)、各類用戶知識庫等)中的數(shù)據(jù)進行轉(zhuǎn)換、清洗并儲存到目標庫中。在從數(shù)據(jù)源轉(zhuǎn)換和清洗數(shù)據(jù)時,通常需要將數(shù)據(jù)先暫存為一個中間模式,并將數(shù)據(jù)存儲在數(shù)據(jù)庫臨時區(qū),這樣是為了保證數(shù)據(jù)的安全性以及一致性。舉例來說,存在兩個存儲人員基本信息的數(shù)據(jù)源,在確定數(shù)據(jù)源中人員的某些屬性編碼時,可能采用完全不同的編碼形式。例如一個是整型、另一個是字符型。在確定人員性別這屬性的編碼時,可以采用2字節(jié)長度字符型,其中存貯的值為中文“男”和“女”,也可以采用1字節(jié)長度字符型,其中存貯的值為“M”和“F\"。這兩個數(shù)據(jù)源使用的這兩種數(shù)據(jù)編碼表達的內(nèi)容是一致的,但這兩個數(shù)據(jù)源對目標數(shù)據(jù)來說,這些數(shù)據(jù)必須被轉(zhuǎn)換成一種統(tǒng)一的數(shù)據(jù)表述方法,并且由用戶進行確認,這樣才能保證數(shù)據(jù)源的質(zhì)量。因此設(shè)計師需要基于用戶的需求才能實現(xiàn)用戶數(shù)據(jù)的統(tǒng)一。較早的技術(shù),開發(fā)人員使用程序生成器和建立手工規(guī)則的方式來抽取數(shù)據(jù),隨著技術(shù)的進步目前市場上出現(xiàn)的專業(yè)的抽取工具,如SAS的數(shù)據(jù)倉庫產(chǎn)品SAS/WA (Warehouse Administrator)、Ardent公司的Infomoter產(chǎn)品。
4.3 數(shù)據(jù)維護模塊。數(shù)據(jù)維護模塊主要由元數(shù)據(jù)維護和目標數(shù)據(jù)維護兩個部分組成。其中目標數(shù)據(jù)維護基于元數(shù)據(jù)庫,并根據(jù)設(shè)計師制定的更新頻率,更新數(shù)據(jù)等策略去更新數(shù)據(jù)倉庫。這些操作都與時間高度相關(guān),反映了用戶數(shù)據(jù)源的數(shù)據(jù)變化。更新操作包括兩個類型:一、生成一個新的時間集合數(shù)據(jù),因為數(shù)據(jù)倉庫中的數(shù)據(jù)與匯總數(shù)據(jù)有關(guān)系,必需全部匯總,這樣才能確保信息的一致性;二、在數(shù)據(jù)倉庫的數(shù)據(jù)表中進行部分數(shù)據(jù)的更新。
5 數(shù)據(jù)倉庫在金融信息系統(tǒng)的應(yīng)用
數(shù)據(jù)倉庫體建設(shè)屬于企業(yè)的基礎(chǔ)信息建設(shè),一般建立了穩(wěn)定的數(shù)據(jù)倉庫體系才能支撐各種企業(yè)級的數(shù)據(jù)方面的應(yīng)用。在我國的銀行業(yè),數(shù)據(jù)倉庫技術(shù)應(yīng)用非常普遍,基本上涉及銀行業(yè)務(wù)運作、經(jīng)營管理等等各方面。以下就舉例一些基礎(chǔ)的應(yīng)用:
5.1 銀行收入與經(jīng)營成本分析。隨著外資銀行、小額貸款公司等各種金融企業(yè)進入市場,銀行業(yè)面臨越來越大的競爭和挑戰(zhàn)。銀行作為金融企業(yè),運作的核心目標之一毫無疑問是獲取最大的經(jīng)濟效益,當然在此之余還應(yīng)兼顧客戶服務(wù)和社會效益等各方面。收入與經(jīng)營成本分析就是對銀行企業(yè)的各種日常經(jīng)濟活動進行成本核算,分析相應(yīng)的業(yè)務(wù)收入(中間業(yè)務(wù)收入、存貸款利息差、其他收益)與各種費用(稅收、管理費用、業(yè)務(wù)成本、其他支出)之間的收支差額,分析經(jīng)營情況的情況,得到相應(yīng)的經(jīng)營方針,從而減少企業(yè)開支,降低運營成本、提高經(jīng)營收入。
5.2 銀行卡用卡行為分析。信用卡市場也是銀行也競爭非常激烈的領(lǐng)域,許多銀行為了擴展市場往往投放了大量的信用卡,這也必然導(dǎo)致了市場中大量“睡眠卡”的存在,這些“睡眠卡”浪費銀行的資源提高了經(jīng)驗成本。基于數(shù)據(jù)倉庫技術(shù),銀行可以對自身客戶的金融交易數(shù)據(jù)進行關(guān)聯(lián)分析,從而產(chǎn)生信用卡客戶的分類,從消費周期、消費能力、消費習(xí)慣等各個方面對客戶金融消費行為進行分析預(yù)測,這樣就能分析出哪些用戶具有較強的消費能力,具有成為信用卡大客戶的資質(zhì),基于這些分析結(jié)果,銀行可以針對性地提供一些貴賓服務(wù)。對于那些長期不使用信用卡的客戶,可以定期郵寄一些優(yōu)惠措施,這樣可以提高銀行客戶的信用卡消費的熱情,從而改善大量“睡眠卡”的問題。
5.3 優(yōu)惠預(yù)測仿真。銀行往往會定期推出一些銀行卡的優(yōu)惠措施,以此鼓勵客戶更多的使用銀行卡,增加銀行卡消費額。這些優(yōu)惠策略方便了持卡客戶的使用,同時也增加了銀行的利潤額。銀行固然可以通過銀行卡的優(yōu)惠拓展市場,但優(yōu)惠策略設(shè)置不恰當,其結(jié)果很可能會適得其反。利用數(shù)據(jù)倉庫基于歷史數(shù)據(jù)建立優(yōu)惠消費模型,在此模型基礎(chǔ)上進行優(yōu)惠措施的仿真,其仿真結(jié)果能夠提示當前制定的優(yōu)惠策略的效果,并可按情況進行優(yōu)化和調(diào)整,使促銷優(yōu)惠策略取得預(yù)期的成效。
參考文獻:
[1]李嶶,李宛州.基于數(shù)據(jù)倉庫技術(shù)的進銷存系統(tǒng)的設(shè)計與實現(xiàn).2001(10):93-94.
[2]W.H.Inmon.數(shù)據(jù)倉庫.機械工業(yè)出版社2000,5.
[3]林字等編著.數(shù)據(jù)倉庫原理與實踐.北京:人民郵電出版社,2003.
[4]陳京民等.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:電子工業(yè)出版社,2002.
[作者簡介]
吳建(1978-),男,浙江省杭州市人,中級職稱,碩士學(xué)位,主要研究方向為軟件工程與數(shù)據(jù)庫。