張杰
摘 要 商業(yè)銀行的數(shù)據(jù)是商業(yè)銀行寶貴的財富,這些未經(jīng)加工的數(shù)據(jù)并不能滿足商業(yè)銀行的需要。因此,通過數(shù)據(jù)倉庫技術(shù)對商業(yè)銀行的數(shù)據(jù)進(jìn)行有效的整合是一項重大的系統(tǒng)工程。本文以作者參與的中國建設(shè)銀行數(shù)據(jù)倉庫系統(tǒng)為依據(jù),探討了數(shù)據(jù)倉庫的實施流程、模型,總結(jié)了實施時要注意的問題,積累了倉庫建設(shè)的一些經(jīng)驗。利用數(shù)據(jù)倉庫技術(shù)成功整合商業(yè)銀行數(shù)據(jù)成功的關(guān)鍵是要做好基礎(chǔ)數(shù)據(jù)的準(zhǔn)備工作。基礎(chǔ)數(shù)據(jù)的質(zhì)量好壞直接決定了數(shù)據(jù)倉庫系統(tǒng)工程的成敗。另外還要做好后續(xù)的管理工作。
關(guān)鍵詞 商業(yè)銀行 數(shù)據(jù)倉庫 數(shù)據(jù)模型
中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A
1實施策略
2003年中國建設(shè)銀行制定了《中國建設(shè)銀行科技應(yīng)用總體規(guī)劃》,確定了項目群實施規(guī)劃、數(shù)據(jù)倉庫和管理信息系統(tǒng)實施規(guī)劃。規(guī)劃中明確了建設(shè)銀行的目標(biāo)應(yīng)用體系架構(gòu)、技術(shù)架構(gòu)以及項目實施路徑等,規(guī)劃出未來5-10年建設(shè)銀行信息化發(fā)展戰(zhàn)略。規(guī)劃旨在為建設(shè)銀行業(yè)務(wù)新一輪改革發(fā)展提供有力支撐,不斷提高建設(shè)銀行的盈利能力。
為實現(xiàn)這一戰(zhàn)略目標(biāo),建設(shè)銀行以數(shù)據(jù)集中為前提,通過數(shù)據(jù)倉庫為基礎(chǔ),通過信息管理平臺持續(xù)開發(fā)客戶分析管理、資產(chǎn)負(fù)債管理等應(yīng)用,使建設(shè)銀行信息化水平和內(nèi)部管理水平走上新臺階。其中數(shù)據(jù)集中和數(shù)據(jù)倉庫的建設(shè)是關(guān)鍵步驟。
2Teradata FSLDM客戶化
2.1 FSLDM簡介
Teradata FSLDM是預(yù)先構(gòu)建的邏輯數(shù)據(jù)模型,利用它可以直接開始數(shù)據(jù)倉庫模型設(shè)計。它是一個純粹的邏輯數(shù)據(jù)模型,可以運行在任何數(shù)據(jù)庫和平臺上,與Teradata數(shù)據(jù)庫無關(guān)。
2.2客戶化策略
客戶化方法論可以概括為自底向上、從頂至下以及自底向上和從頂至下的聯(lián)合使用。下面我們簡要對這幾種方法進(jìn)行一下對比和分析,主要從策略、過程等方面的特點來決定到底采用何種方法進(jìn)行開發(fā)。
首先,自底向上法是指先從較下層設(shè)計開始,也就是說去解決問題的各個不同的小部分,然后把這些部分組合成為完整的應(yīng)用。這種設(shè)計方法主要是要根據(jù)系統(tǒng)功能要求,從具體的邏輯部件或者相似系統(tǒng)開始,憑借設(shè)計者熟練的技巧和豐富的經(jīng)驗,通過對其進(jìn)行相互連接、修改和擴(kuò)大,構(gòu)成所要求的系統(tǒng)并保證系統(tǒng)功能的實現(xiàn)。從設(shè)計成本和開發(fā)周期來講,自底向上法一般優(yōu)于自頂向下法,但是由于其設(shè)計是從最底層開始的,所以也存在難以保證總體設(shè)計的最佳性的問題,一般適用于探索性的開發(fā)項目。在銀行建設(shè)數(shù)據(jù)倉庫,自底向上策略一般是從某個數(shù)據(jù)倉庫原型開始,選擇一些特定的為企業(yè)管理人員所熟知的管理問題作為數(shù)據(jù)倉庫建設(shè)目標(biāo)。該策略的主要優(yōu)點在于能夠以較小的投入在短時間內(nèi)取得局部成果。
結(jié)合銀行業(yè)務(wù)特點,一般來講,按照數(shù)據(jù)倉庫的思路建設(shè)信息決策系統(tǒng)已經(jīng)有一定的先例和成功經(jīng)驗可以借鑒,不應(yīng)該算作探索性嘗試,而是目標(biāo)明確、長期規(guī)劃的建設(shè)過程,所以應(yīng)該采用從頂至下的方法進(jìn)行。也就是說,在開發(fā)前就已經(jīng)具備數(shù)據(jù)倉庫的系統(tǒng)定位、實現(xiàn)目標(biāo)、應(yīng)用范圍等內(nèi)容,這種策略對開發(fā)人員的開發(fā)經(jīng)驗要求和管理層、建設(shè)者的預(yù)期目標(biāo)明確程度都有非常高的要求。
實際上,在許多數(shù)據(jù)倉庫設(shè)計過程中,是混合使用從頂至下法和自底向上法的,因為這樣可能會取得更好的效果。從銀行來講,主體策略采用從頂至下法,在一些局部的、不熟悉的領(lǐng)域,采用自底向上的方法進(jìn)行一些探索性的嘗試,以積累經(jīng)驗、規(guī)避風(fēng)險,這樣的組合應(yīng)該是理想而明智的選擇。
2.3 FS-LDM主體結(jié)構(gòu)
Teradata FS-LDM在某銀行客戶化改造覆蓋了11大主題區(qū)域,包括團(tuán)隊、資產(chǎn)、財務(wù)、營銷活動、協(xié)議、渠道、事件、內(nèi)部結(jié)構(gòu)、產(chǎn)品和地域等。
3具體實施策略
在某銀行Teradata FS-LDM客戶化的具體實施過程中,采取的是分重點設(shè)計主題、自主設(shè)計主題、簡化設(shè)計主題等不同類別,根據(jù)每種類別的特點和目標(biāo)來分別制定有針對性實施策略的原則。
4在某銀行的BANK-LDM 管理界面
某銀行建立了專門的平臺管理LDM,在這個平臺界面上可以對LDM進(jìn)行詞法分析、關(guān)聯(lián)實體分析、父子實體分析等操作,LDM的開發(fā)和維護(hù)人員可以通過IE瀏覽器改元數(shù)據(jù)管理平臺,對自己負(fù)責(zé)的相關(guān)模型進(jìn)行查詢和分析。
數(shù)據(jù)倉庫在初期建設(shè)時還沒有到考慮模式優(yōu)化問題的時候,因為此時不僅數(shù)據(jù)量少,而且加載的應(yīng)用也少。但是,隨著應(yīng)用的推廣,數(shù)據(jù)量不斷加大,應(yīng)用不斷增多,不斷會爆出空間效率等問題,必須后期進(jìn)行調(diào)整優(yōu)化,可以優(yōu)化邏輯模型,也可以針對物理模型優(yōu)化。在實踐中,我們發(fā)現(xiàn)充分事前的設(shè)計和實施中的不斷改進(jìn),邏輯模型在項目完成時可優(yōu)化的范圍小,通常集中于協(xié)議、事件等主體。后期我們已物理模型優(yōu)化為主。
物理模型優(yōu)化的原則主要是一要結(jié)構(gòu)層次一致性、二要結(jié)合具體運行環(huán)境、三要針對Teradata的特點。
邏輯模型設(shè)計是基于三范式的分層結(jié)構(gòu),這樣可以保證模型的靈活性和穩(wěn)定性,但與此同時可能產(chǎn)生大量關(guān)聯(lián)表,優(yōu)化時需要考慮精簡。另外通過腳本相關(guān)算法的優(yōu)化以及調(diào)度機(jī)制的優(yōu)化,提高運行效率,從整體上縮短倉庫運行的時間窗口。
據(jù)上述目標(biāo)原則,物理模型優(yōu)化主要通過數(shù)據(jù)冗余和數(shù)據(jù)清理、拆分以及針對Teradata性能優(yōu)化來實現(xiàn)。在進(jìn)行腳本優(yōu)化時要先優(yōu)化關(guān)鍵腳本,腳本優(yōu)化要注意與物理表結(jié)合。優(yōu)化完成后需要進(jìn)行測試工作,保證優(yōu)化不改變應(yīng)用正常應(yīng)用,也可以驗證優(yōu)化效果。優(yōu)化盡量選擇在倉庫的非主要運行日進(jìn)行,避免資源緊張對正常運行造成干擾。
參考文獻(xiàn)
[1] 鄭承滿.數(shù)據(jù)倉庫技術(shù)在商業(yè)銀行中的應(yīng)用與發(fā)展趨勢[J].中國金融電腦, 2012(07).
[2] 馮健文,林璇.基于ODS的數(shù)據(jù)倉庫模型研究[J]. 微計算機(jī)應(yīng)用,2012(04).
[3] 楊俊生.淺議商業(yè)銀行數(shù)據(jù)倉庫的邏輯數(shù)據(jù)模型設(shè)計[J].華南金融電腦,2011 (06).
[4] 宋衛(wèi)林,徐惠民.數(shù)據(jù)倉庫的樣本模型[J]. 計算機(jī)工程與設(shè)計,2012(02).