崔四帥 王子偉
摘 要:當(dāng)前,隨著社會(huì)經(jīng)濟(jì)和人們生活質(zhì)量水平的提高,自助服務(wù)設(shè)備已經(jīng)成為銀行為持卡人提供金融服務(wù)的重要渠道。隨著ATM的網(wǎng)絡(luò)規(guī)模和復(fù)雜性的日益增加,如今銀行都面臨著如何管理ATM機(jī)的巨大挑戰(zhàn)。本案例考察對(duì)大數(shù)據(jù)的處理與分析能力,對(duì)于問(wèn)題我們先利用Excel的函數(shù)功能,對(duì)數(shù)據(jù)進(jìn)行了簡(jiǎn)單的數(shù)理統(tǒng)計(jì)。再利用SPSS軟件,對(duì)數(shù)據(jù)的內(nèi)在關(guān)系進(jìn)行分析,用3σ原則選取了兩個(gè)特征參數(shù)來(lái)判定ATM機(jī)的工作狀態(tài)。經(jīng)過(guò)分析,ATM機(jī)工作狀態(tài)的特征參數(shù)之間具有復(fù)雜的非線性特征,所以我們采用BP神經(jīng)網(wǎng)絡(luò)對(duì)ATM機(jī)故障進(jìn)行預(yù)測(cè)診斷。
關(guān)鍵詞:數(shù)理統(tǒng)計(jì) 3 原則 B P神經(jīng)網(wǎng)絡(luò)
一、問(wèn)題重述
通過(guò)大數(shù)據(jù)的分析來(lái)提取出可利用、分析的數(shù)據(jù)點(diǎn),并提出了以下問(wèn)題:
1.選擇,提取和分析ATM交易狀態(tài)的特征參數(shù);
2.設(shè)計(jì)一套交易狀態(tài)異常檢測(cè)方案,在對(duì)該交易系統(tǒng)的應(yīng)用可用性異常情況下做到及時(shí)報(bào)警,同時(shí)減少虛警誤報(bào);
二、問(wèn)題分析
2.1 問(wèn)題1的分析
案例中,問(wèn)題主要考察對(duì)大量數(shù)據(jù)的處理能力和統(tǒng)計(jì)數(shù)據(jù)的分析能力,要既能掌握整體,也要認(rèn)清局部。由于數(shù)據(jù)(樣本)多(約13萬(wàn)),以及初步對(duì)數(shù)據(jù)的觀測(cè),我們大膽假設(shè)業(yè)務(wù)量與交易響應(yīng)時(shí)間是連續(xù)變化的且都服從于正態(tài)分布,呈正態(tài)分布狀。我們選用Excel表格和SPSS軟件來(lái)進(jìn)行對(duì)問(wèn)題一的處理,以選擇、分析出特征參數(shù)。
2.2 問(wèn)題2的分析
案例中,問(wèn)題主要考察的是對(duì)數(shù)學(xué)模型的構(gòu)建。要在問(wèn)題1所找到的特征參數(shù)的基礎(chǔ)上,設(shè)計(jì),建立能夠偵測(cè)出故障點(diǎn)并報(bào)警的一套異常報(bào)警方案。同時(shí),我們還必須找到能夠減少誤報(bào)的途徑,并在我們的數(shù)學(xué)模型中有所體現(xiàn),以求做到約束作用,起到減少誤報(bào)的目的。我們選用MATLAB來(lái)完成對(duì)數(shù)學(xué)模型的建立。
三、模型的建立與求解
3.1 問(wèn)題一的解答
3.1.1 對(duì)于交易量以及交易響應(yīng)時(shí)間分析方法的確定
首先,我們運(yùn)用SPSS對(duì)畫(huà)出數(shù)據(jù)的分布圖,以找出其服從的分布函數(shù)。從圖中可以看出交易量 與交易響應(yīng)時(shí)間Y 是近似符合正態(tài)分布的,即對(duì)于每一個(gè)樣本點(diǎn)x1 ,x2 ,……,xn 或都是取自總體或這樣的正態(tài)分布中。
經(jīng)查閱資料可知[1],生產(chǎn)上,通??刂茍D是根據(jù)“3 原則”來(lái)決定上下控制界限,其廣泛的應(yīng)用在質(zhì)量檢測(cè),產(chǎn)品檢驗(yàn)與質(zhì)量控制等諸多領(lǐng)域。那么,我們可以利用“3σ 原則”,初步將μ+3σ 作為閾值來(lái)進(jìn)行對(duì)數(shù)據(jù)的分析與篩選。
3.1.2 在“3 原則”下對(duì)數(shù)據(jù)的分析與處理
利用Excel中的插入函數(shù)功能,我們計(jì)算出所需的數(shù)值。(閾值為μ+3σ)
然后,先對(duì)交易量利用閾值進(jìn)行篩選。我們發(fā)現(xiàn),在以交易量的閾值作為篩選條件時(shí)(認(rèn)為交易量大于閾值時(shí),系統(tǒng)出現(xiàn)故障),只有一月的數(shù)據(jù)被篩選出來(lái)存在這樣的“壞值點(diǎn)”。
我們發(fā)現(xiàn)數(shù)據(jù)在時(shí)間上的連續(xù)性很好,且有些“壞值點(diǎn)”的成功率低于平均成功率很多(如標(biāo)注出的成功率)。但是,依舊存在著少量時(shí)間上的間斷點(diǎn)
最終,我們分析認(rèn)為:
1.對(duì)于交易響應(yīng)時(shí)間利用“3σ 原則”作為它的控制界限,來(lái)找出壞值點(diǎn)的方法是可行的,符合了我們對(duì)于故障在時(shí)間上是連續(xù)的假設(shè);
2.對(duì)于交易響應(yīng)時(shí)間長(zhǎng)而成功率高的點(diǎn),其在時(shí)間上基本是間斷的,或者持續(xù)時(shí)間很短,我們把這些點(diǎn)當(dāng)做正常點(diǎn)來(lái)處理。
3.注意到仍存在成功率很高但也被認(rèn)為是壞值點(diǎn)的問(wèn)題,我們提出要對(duì)交易成功率也確定一個(gè)閾值,在雙重閾值之下對(duì)數(shù)據(jù)進(jìn)行篩選;
3.2 問(wèn)題二的解答
首先,利用SPSS軟件分析業(yè)務(wù)量和交易響應(yīng)時(shí)間與交易成功率的關(guān)系
但我們研究發(fā)現(xiàn),交易成功率與交易響應(yīng)時(shí)間存在很復(fù)雜的非線性關(guān)系,很難找出擬合度較好的數(shù)學(xué)表達(dá)式,針對(duì)這樣的復(fù)雜性,我們決定,準(zhǔn)備采用BP神經(jīng)網(wǎng)絡(luò)建立一套偵測(cè)交易狀態(tài)數(shù)據(jù)異常的數(shù)學(xué)模型,于是我們建立了以下模型:
第一步:利用Excel的隨機(jī)函數(shù)我們?nèi)∮昧舜罅康恼|c(diǎn)與壞值點(diǎn),作為訓(xùn)練樣本(原始數(shù)據(jù)),最終我們選取的正常點(diǎn)與壞值點(diǎn),這組數(shù)據(jù)的覆蓋性廣且具有代表性,因此滿足該問(wèn)題的要求:
第二步:初始化各種學(xué)習(xí)參數(shù),具體數(shù)據(jù)如下:最大訓(xùn)練次數(shù):50000;隱含層(中間層)神經(jīng)元數(shù)量:12;網(wǎng)絡(luò)學(xué)習(xí)速度(速率):0.05。
第三步:借于以上選的的數(shù)據(jù)和參數(shù)進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)。
結(jié)果分析:如圖所示本次學(xué)習(xí)結(jié)果陷入了局部最優(yōu)狀態(tài)無(wú)論經(jīng)過(guò)后續(xù)多少次的學(xué)習(xí),精度都成一條直線無(wú)法達(dá)到所設(shè)定的要求,而且當(dāng)把未參與訓(xùn)練的數(shù)據(jù)作為仿真預(yù)測(cè)數(shù)據(jù)輸入校驗(yàn)是,效果極差,不具備預(yù)測(cè)能力。因此我們必須修改參數(shù)繼續(xù)進(jìn)行網(wǎng)絡(luò)學(xué)習(xí),接著以該網(wǎng)絡(luò)多次學(xué)習(xí),并且多次調(diào)整隱層節(jié)點(diǎn)數(shù),取值范圍為10~20,,結(jié)果發(fā)現(xiàn)在隱層節(jié)點(diǎn)數(shù)取值12時(shí),達(dá)到訓(xùn)練精度,
結(jié)果分析:改進(jìn)后的網(wǎng)絡(luò)學(xué)習(xí)次數(shù)明顯減少只需4步就能達(dá)到問(wèn)題所需的精度要求,這樣我們可以速度快,精度高的預(yù)測(cè)ATM機(jī)的故障。
第四步:經(jīng)過(guò)以上三步的對(duì)網(wǎng)絡(luò)學(xué)習(xí)和改進(jìn),最終我們達(dá)到了速度快,精度高的預(yù)測(cè)要求,如果需要對(duì)將來(lái)某時(shí)刻的ATM機(jī)故障預(yù)測(cè),只需要將該時(shí)刻具體的二維特征數(shù)據(jù)作為輸入變量,用此模型進(jìn)行預(yù)測(cè)即可得到相應(yīng)的預(yù)測(cè)結(jié)果。
四、結(jié)果的分析與檢驗(yàn)
對(duì)于模型的檢驗(yàn),我們隨機(jī)挑選了8組數(shù)據(jù)進(jìn)行故障檢測(cè) 可以看出,該模型很好的檢驗(yàn)到了故障點(diǎn)(壞值點(diǎn)),并且也避免了將單獨(dú)的一個(gè)離散的時(shí)間點(diǎn)作為故障(如模型的建立中所提到的:響應(yīng)時(shí)間長(zhǎng),但是成功率高且時(shí)間上離散的點(diǎn)),很符合實(shí)際情況。這樣,這套利用BP神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型實(shí)現(xiàn)了以問(wèn)題一為基礎(chǔ),ATM機(jī)出現(xiàn)故障時(shí)的報(bào)警,并明顯的減少了虛報(bào)的情況。
4.1 模型的推廣
近年來(lái),人工神經(jīng)網(wǎng)絡(luò)以其獨(dú)特的結(jié)構(gòu)和處理信息的方法,在許多實(shí)際應(yīng)用領(lǐng)域中取得顯著的成效,解決了一些極難求解的問(wèn)題。人工神經(jīng)網(wǎng)絡(luò)的突出特點(diǎn)之一是它的預(yù)測(cè)功能強(qiáng)大。該神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型還可以廣泛應(yīng)用于對(duì)股票市場(chǎng)的預(yù)測(cè),交通流量預(yù)測(cè),醫(yī)學(xué)病癥預(yù)測(cè),商品銷量預(yù)測(cè),電子設(shè)備質(zhì)量檢測(cè)等諸多領(lǐng)域。
參考文獻(xiàn):
[1] 周俊林,基于數(shù)據(jù)挖掘的分布式異常檢測(cè),電子科技大學(xué)大學(xué)博士論文,2010。
[2] 卓金武,MATLAB在數(shù)學(xué)建模中的應(yīng)用(第2版),北京:北京航空航天大學(xué)出版社,2015,134-141。
[3] 朱凱等,精通MATLAB神經(jīng)網(wǎng)絡(luò),北京:電子工業(yè)出版社,2010,375-392。