范建華 張肖
摘要:本文的研究的主要目的是將數(shù)據(jù)挖掘技術作為一種信息保護手段引入到信息安全體系之中,從全新的視角來找到一種信息保護方法。數(shù)據(jù)挖掘在當代信息爆炸時代可以說是一種的信息價值增值手段,但是同時它也是一種必要的信息保護方法。信息的泄露或者對所存在的有價值信息視而不見被競爭者利用就會是造成一定的損失甚至是災難性的后果。特別是對于銀行業(yè),其信息具有真實性、實時性等特點,對于信息安全有特別高的要求,因此不能無視隱性風險隱患的存在,應該積極開發(fā)和利用數(shù)據(jù)挖掘技術來進一步完善信息安全風險防控體系。
關鍵詞:信息安全數(shù)據(jù)挖掘流程
1.引言
從上世紀90年代中后期,我國各大商業(yè)銀行都進入了數(shù)據(jù)化大集中的時代,數(shù)據(jù)集中是銀行界對技術支持系統(tǒng)的一個改造,同時也是對傳統(tǒng)銀行業(yè)的整體管理理念的徹底再造。銀行業(yè)經(jīng)歷了金融電子化時代,幾乎各項業(yè)務都實現(xiàn)了數(shù)字化。多數(shù)的數(shù)據(jù)我們無法處理,因此可以說它是垃圾信息,但是并不能肯定它是沒有價值的信息。那么許多有用的信息就被我們忽視或者丟棄在那些我們所認為的垃圾數(shù)據(jù)之中,這就給信息保護埋下了安全隱患。要保護大型數(shù)據(jù)和信息就有必要將數(shù)據(jù)挖掘作為信息安全策略的一個方面來進一步維護信息安全。
2.銀行業(yè)需要重視和保護的信息內(nèi)容
銀行業(yè)信息可以認為是在銀行的一系列業(yè)務發(fā)展過程中產(chǎn)生、應用和搜集的各類信息,這些信息是銀行業(yè)經(jīng)營和發(fā)展的基礎。在銀行業(yè)發(fā)展過程中信息安全情況決定其生存和發(fā)展的命脈,因此信息保護就成為各類銀行發(fā)展中所必須重視的一項內(nèi)容更。銀行業(yè)信息可以劃分為兩大類:
2.1顯性信息
顯性數(shù)據(jù)主要包括由各類存儲媒介保存的數(shù)據(jù),包括軟盤、硬盤、紙質(zhì)等保存的文件,這部分資料可以占道銀行信息的20%。這類是數(shù)據(jù)是業(yè)務發(fā)展所產(chǎn)生和存儲的數(shù)據(jù),包括賬戶的開立信息、個人儲蓄記錄、對公存款記錄、貸款資料、貸款合同、還款記錄等等。這些信息是可以隨時調(diào)閱和查找使用的信息。
2.2隱性信息
隱性數(shù)據(jù)是相對于顯性數(shù)據(jù)而言的,它沒有具體的存儲介質(zhì),比較抽象的但是實在存在的數(shù)據(jù)。這一類數(shù)據(jù)主要是柜員、客戶經(jīng)理、中層領導在日常工作中所掌握的隱性的沒有量化的信息,這部分資料根據(jù)二八原則可占到銀行信息的80%。柜員在儲蓄柜臺辦理日常的業(yè)務過程中會直接接觸到客戶,柜員能夠掌握經(jīng)常辦理業(yè)務的客戶對不同產(chǎn)品的青睞和喜好,這也是一類重要的信息。
3.海量數(shù)據(jù)所造成的信息安全隱患
金融數(shù)據(jù)大集中之后,數(shù)據(jù)量增幅很大,以人民銀行2009年對銀行業(yè)務量統(tǒng)計作數(shù)據(jù)參考:
存儲和保護所有數(shù)據(jù),因此會有所刪減和側重。數(shù)據(jù)和信息的概念是不同的,數(shù)據(jù)是無規(guī)則、全描述性的、無具體指向的;而信息是有內(nèi)容的可為做出經(jīng)營決策提供參考的資源。銀行業(yè)擁有的數(shù)據(jù)資源非常龐大,但是并不都是有用的信息,因此在處理和保存過程中就不會也不可能特別的保護所有的數(shù)據(jù),大量的數(shù)據(jù)就會造成信息安全保護障礙。
3.1數(shù)據(jù)銷毀不完全造成信息泄露
由于銀行業(yè)的業(yè)務量非常大,同時每個工作日結束都會產(chǎn)生大量的垃圾文件及影印資料,在處理這些資料時就會有不同的處理方式,但多數(shù)是不會集中銷毀。紙質(zhì)資料是銀行業(yè)務中必然會使用和產(chǎn)生的資料,在這些丟棄的廢品中包含著大量的信息,有客戶的存款賬號以及存款金額、廢棄客戶資料、銀行廢棄報表資料等等。這些資料多數(shù)并不是錯誤的信息,相反這些是一些真實性相當高的信息,因此廢棄資料的銷毀和處理就有必要加以重視。事實上,通過對許多商業(yè)銀行的調(diào)查與統(tǒng)計許多商業(yè)銀行并沒有制定具體處理措施規(guī)章制度,也沒有指派專人負責處理,而是較隨意的丟棄。從這些丟棄的資料中我們不難找到客戶的存款資料,對公賬戶的基本信息,甚至是銀行內(nèi)部的經(jīng)營狀況等等。此類信息是銀行非常機密的信息,泄露的損失會非常的嚴重。
3.2錯誤判斷數(shù)據(jù)價值造成的信息安全威脅
在競爭如此激烈的銀行業(yè),當沒有發(fā)展和改革是就相當于在退步,在失去競爭力。隨著經(jīng)濟全球化和信息技術的發(fā)展,金融數(shù)據(jù)正在以空前的速度產(chǎn)生和累積。因此,迫切需要找到一種有效的方法從海量的金融數(shù)據(jù)中提取有用的信息以在銀行制定戰(zhàn)略性計劃和投資時給予支持。由于銀行業(yè)接觸到的信息量相當大,因此會讓領導人員對已有的數(shù)據(jù)視而不見。然而這些數(shù)據(jù)會提供很有用的決策支持,在擁有數(shù)據(jù)而不去利用就會造成利益的損失。由于貸款系統(tǒng)并不可能融入如此復雜的數(shù)據(jù)量,這些信息就容易被忽略,這樣就容易造成錯誤判斷,最終流失一個良好客戶,也有可能會增加高風險客戶。
3.3隱性信息價值帶來的安全隱患
由于權限等級劃分帶來了權利和責任的高度集中,在多數(shù)銀行都以授權與代辦關系存在。往往代辦員只是在辦理業(yè)務過程中的操作者,而多數(shù)的信息是掌握在授權者手中。這些授權者一般屬于銀行的中層管理者,他們掌握的信息包括:大額存款戶資料、貸款戶的資信狀況、營業(yè)網(wǎng)點的經(jīng)營狀況等等。這些都是整個營業(yè)網(wǎng)點經(jīng)營命脈。根據(jù)二八原則的劃分,20%的信息是組織運營中的存檔信息,而大量的80%的信息是各個經(jīng)營者所掌握的隱形的信息。這80%的信息安全就只能依靠職業(yè)道德規(guī)范和職業(yè)行為規(guī)范等制度對中層領導的約束來保證,存在著嚴重的安全隱患。
3.4金融欺詐
隨著經(jīng)濟的發(fā)展,在金融領域的欺詐行為已經(jīng)越來越多,形式也多種多樣,有貸款、存款、銀行卡等等。例如在銀行業(yè)務發(fā)展過程中會考核信用卡的發(fā)卡量,為達到發(fā)卡規(guī)模就會盲目的發(fā)卡、放松發(fā)卡條件等等,大量的信用卡申請信息就會造成信息核實的時間和人力困難。調(diào)查表明[2]金融機構每年的欺詐損失占其年收入的6%,相當于美國每年的GDP損失數(shù)千億美元。英國欺詐損失總額每年也達到了140億英鎊。欺詐行為會給銀行帶來巨大的經(jīng)濟損失,同時也會造成信譽和形象上的重大負面影響。欺詐行為也是多種多樣的,主要類型有以下三種:一是由于業(yè)務量大而忽略銀行柜員對信息的訪問控制和跟蹤,銀行內(nèi)部職員會利用系統(tǒng)漏洞,非法進入銀行交易系統(tǒng),直接獲取不正當利益,或者為以后的作案做準備;二是由于信用卡等信用貸款量大,無法具體核實貸款人資信狀況的真實性,造成以虛假的承諾和虛假的保證來騙取貸款額度;三是隱瞞重要的資信信息,避重就輕,造成銀行的錯誤判斷。銀行可以通過建立自己的數(shù)據(jù)庫,來跟蹤核實此類信息,在大量的處理業(yè)務數(shù)據(jù)中對數(shù)據(jù)進行挖掘分析并找出相應的規(guī)則、規(guī)律、論斷,再結合人工分析,達到有效檢測金融欺詐的效果。
4.數(shù)據(jù)挖掘技術在銀行業(yè)信息保護中的應用
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘,在人工智能領域,習慣上又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KDD),也有人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識發(fā)現(xiàn)過程的一個基本步驟。
金融機構收集到的金融數(shù)據(jù)通常相對完整、可靠并具有高質(zhì)量,方便了系統(tǒng)化的數(shù)據(jù)分析和數(shù)據(jù)挖掘。同樣數(shù)據(jù)挖掘也可以作為銀行信息保護的一種方法為銀行發(fā)展做出貢獻。為保護銀行信息安全,數(shù)據(jù)挖掘通常包含以下四個部分的應用分析情況。
4.1應用數(shù)據(jù)挖掘技術管理銀行報表
銀行報表是每天都會產(chǎn)生的報表,管理者會通過報表的數(shù)據(jù)來進行日常業(yè)務決策。根據(jù)調(diào)查顯示,銀行報表基本是由銀行主管會計打印、輸出、整理報送銀行主管人員。在報送過程中就產(chǎn)生了多個信息安全的風險點:首先紙質(zhì)打印就會有錯誤和多余打印的廢棄資料;其次會計主管必然會掌握和了解各類數(shù)據(jù);再次是整理好的數(shù)據(jù)資料的管理也十分必要。銀行報表上的數(shù)據(jù)是銀行需要保密的經(jīng)營數(shù)據(jù),它關系到一家銀行的生存和發(fā)展,只有決策層和領導層有權限和有必要掌握和了解。因此要從根本上杜絕信息安全隱患就必須從報表的形式和報表訪問權限上來加以控制。據(jù)分析階段對銀行業(yè)務中產(chǎn)生的龐大數(shù)據(jù)進行分類、識別、篩選和初步分析。從大量數(shù)據(jù)中挖掘出適合銀行業(yè)務人員使用的信息模式和知識,從而產(chǎn)生出報表,以指導銀行營銷和競爭。
4.2數(shù)據(jù)挖掘提升客戶關系管理
銀行根據(jù)多個方面的數(shù)據(jù)內(nèi)容建立客戶資料數(shù)據(jù)庫,來維護客戶,全方位的描述和統(tǒng)計該客戶的資金流量、信用度等。建立該客戶的信息由有商業(yè)銀行實施客戶關系管理(CRM)的目標是充分掌握客戶的需求,找出能盈利的客戶。數(shù)據(jù)挖掘技術在商業(yè)銀行CRM中具有廣泛用途,它首先有助于銀行客戶資源的開發(fā),有助于集成客戶的各種信息,有助于銀行進行市場細分、開發(fā)新產(chǎn)品、拓展新市場。從數(shù)據(jù)挖掘技術在CRM系統(tǒng)中的具體應用來看,可以分為以下五個階段。第一階段:建立客戶信息數(shù)據(jù)庫。數(shù)據(jù)庫是數(shù)據(jù)挖掘的基礎,這一階段主要是進行數(shù)據(jù)清理,消除現(xiàn)有業(yè)務系統(tǒng)中數(shù)據(jù)不一致的現(xiàn)象,通過關聯(lián)將有聯(lián)系相互作用的數(shù)據(jù)建立索引,將其整合到信息庫,建立以客戶為中心的數(shù)據(jù)倉庫基礎環(huán)境。第二階段:記錄、更新客戶交易信息。這一階段主要是把客戶與銀行的所有歷史交易數(shù)據(jù)加載到客戶信息庫。第三階段:建立評估模型。為客戶的每一個賬號建立利潤評測模型,以便了解客戶對銀行的利潤貢獻度,同時掌握模型的利潤貢獻。第四階段:維護和優(yōu)化客戶關系。銀行可以通過掌握客戶在生活、職業(yè)等方面的變化及外部環(huán)境的變化,抓住推銷新產(chǎn)品和服務的時機。這需要將賬號每次發(fā)生的交易明細數(shù)據(jù),加載到數(shù)據(jù)倉庫,核對客戶行為的變化。第五階段:風險評估和管理。銀行風險管理的對象主要是與資產(chǎn)和負債有關的風險,因此與資產(chǎn)負債有關文章都各自占一張表,并把所有論題表放入統(tǒng)一數(shù)據(jù)庫中。
4.3建立員工工作日志,量化隱性信息
從上述的銀行信息分類可以看出銀行的80%的信息是隱性信息,是由一線員工掌握的。在銀行內(nèi)部網(wǎng)站中可以創(chuàng)立一個員工工作日志板塊,它可以設置和微博一般,記錄員工的日常工作中的點滴細節(jié)。當然這類信息只有管理層和本人有訪問權限,這樣員工掌握的信息就不會隨著他的離職而帶走。許多商業(yè)銀行開辟一個新的市場所采取的策略之中都會考慮雇傭一位當?shù)劂y行的中層領導,這樣對于迅速打開當?shù)厥袌鰰蟹浅:玫男?,因為當?shù)劂y行老員工對于當?shù)厥袌觥數(shù)仡櫩投急容^了解。這樣一位員工的流失會給原商業(yè)銀行帶來巨大的損失,為了減少這方面的損失就需要將一線員工掌握的信息進行量化,變?yōu)殂y行內(nèi)部可共享的資源。員工可以在工作日志中記錄重要客戶的生日、家庭住址、家庭成員等等,這對客戶維護是非常有必要的。建立員工工作日志可以通過以下三個步驟實現(xiàn):首先,開辟工作日志板塊和服務后臺;其次將工作日志平臺作為信息發(fā)布、交流平臺,促使員工習慣使用;最后對日志記錄優(yōu)秀者加以獎勵。
4.4金融欺詐檢測
金融欺詐的形式和主體都具有多樣性,但是都是有規(guī)律可循的,針對上述出現(xiàn)的三種類型的金融欺詐,可利用數(shù)據(jù)挖掘技術進行欺詐檢測。欺詐檢測的基本流程包括數(shù)據(jù)比對和清理,數(shù)據(jù)預處理和轉換,數(shù)據(jù)的模型套用和計算,人工判斷等四個步驟,流程圖如圖2第一階段,數(shù)據(jù)比對和清理。應用數(shù)據(jù)挖掘進行金融欺詐檢測,首先要選擇的是哪些數(shù)據(jù)是有用的,以及從獲得這些數(shù)據(jù)的來源。也就是說在合適的地方選擇合適的數(shù)據(jù)。第二階段,數(shù)據(jù)預處理和數(shù)據(jù)轉換。數(shù)據(jù)挖掘通常處理的是海量的原始數(shù)據(jù)。數(shù)據(jù)的預處理是指對原始數(shù)據(jù)進行同性化處理,使各項指標同趨勢化。第三階段,數(shù)據(jù)的模型套用和計算。這一過程,是通過運用數(shù)據(jù)挖掘對收集到的數(shù)據(jù)進行實時的欺詐檢測,對欺詐的潛在進行定位,并找出隱藏的欺詐模式。第四階段,人工判斷。這一過程主要是人工核對生成的挖掘報告,對檢測的結果做進一步的比對和判斷,消除誤判,對系統(tǒng)模型進行調(diào)整改進。這一步就是確認欺詐行為的對于金融欺詐檢測來說是一個不可或缺的步驟。通過這一步驟可以提高數(shù)據(jù)挖掘的有效性和準確率。以上四個步驟是個循環(huán)反復的動態(tài)過程,只有在動態(tài)運行過程中,才有可能對數(shù)據(jù),挖掘模式進行動態(tài)調(diào)整,從而有可能實現(xiàn)對不斷變化的金融欺詐模式的預警。
5.結束語
商業(yè)銀行的信息是其經(jīng)營的主要內(nèi)容,信息安全就成為其核心競爭力主要決定力量。根據(jù)數(shù)據(jù)挖掘的性質(zhì)和特點,從信息保護角度出發(fā),將數(shù)據(jù)挖掘急速引入銀行日常管理之中,通過以上四個流程應用,改善信息形式、挖掘有價值信息、防止金融詐騙,達到更好的信息保護效果。數(shù)據(jù)挖掘是信息化的最高層次,是信息化最高應用點的價值所在,它可以將分散的信息變成集中的信息,使孤立的信息變成相互聯(lián)系的信息,使無價值的數(shù)據(jù)變成有價值的信息,我國銀行業(yè)要在激烈的同業(yè)競爭中立于不敗之地,必須堅定不移采用數(shù)據(jù)挖掘技術,提高自己的核心競爭力。
參考文獻:
① http://www.datamining.com.cn.
②張國榮.淺析數(shù)據(jù)挖掘中的隱私保護[J].福建電腦,2005(11).
③王越,曹長修.KDD方法在金融欺詐檢測中的應用[J].計算機工程與設計.2002.(5).
④王實.銀行業(yè)CRM理論與實務[M].北京:電子工業(yè)出版社,2005. ⑤中華人民共和國國家統(tǒng)計局.中國統(tǒng)計年鑒(2009)[M].北京:中國統(tǒng)計出版社,2010.
⑥李強.數(shù)據(jù)挖掘在金融業(yè)CRM中的應用[J].今日湖北理論版.2007.1(4):21-22.
⑦田小丹.數(shù)據(jù)挖掘在銀行CRM管理中的應用研究【J】.商業(yè)科技,2006.
⑧丁寧,劉富星.數(shù)據(jù)挖掘在金融中的應用【J】.經(jīng)濟與管理,2009(7).
⑨胡,張徽燕.數(shù)據(jù)挖掘在銀行業(yè)中的應用【J】.長春師范學院學報,2006(2).