張靜+廖逸文
摘 要
隨著經(jīng)濟(jì)的不斷發(fā)展,人們與銀行打交道越來(lái)越頻繁,ATM機(jī)在其中起著重要的作用,但時(shí)常有故障的產(chǎn)生,給人們生活帶來(lái)不便。針對(duì)此問(wèn)題,設(shè)計(jì)一套交易狀態(tài)異常檢驗(yàn)方案,從而實(shí)現(xiàn)對(duì)ATM機(jī)系統(tǒng)的監(jiān)測(cè)和異常檢測(cè)。針對(duì)任務(wù)和客戶位置比較密集的區(qū)域,建立基于定位系統(tǒng)ATM機(jī)的預(yù)警通用程序,使得出現(xiàn)故障的ATM機(jī)能夠及時(shí)的維修,同時(shí)使維修費(fèi)用價(jià)格盡可能地合理化。
【關(guān)鍵詞】ATM機(jī) 多元回歸模型 聚類(lèi)算法 打包 預(yù)警模型
1 引言
隨著金融電子化的發(fā)展,ATM機(jī)數(shù)量在生活中不斷增多且得到廣泛使用。但同時(shí)也出現(xiàn)了許多利用ATM機(jī)盜取合法持卡人錢(qián)款的犯罪活動(dòng)等其他交易異常的惡性事件。而通過(guò)對(duì)ATM 機(jī)的特征分析和異常檢測(cè)成為增強(qiáng)ATM機(jī)在生活中安全使用的可靠性和保護(hù)合法持卡人利益與銀行利益的重要依據(jù)。因此,如何在監(jiān)測(cè)中及時(shí)發(fā)現(xiàn)異常并準(zhǔn)確報(bào)警而避免犯罪發(fā)生,保護(hù)合法持卡人利益與銀行利益防范各種針對(duì)ATM機(jī)異常行為是一個(gè)急需解決的問(wèn)題。
經(jīng)查找文獻(xiàn)資料,李戰(zhàn)明等人[1]提出一種基于隱馬爾可夫模型(hidden markov model,HMM)的ATM機(jī)異常行為識(shí)別方法。采用Baum-Welch算法對(duì)正常行為訓(xùn)練并建立隱馬爾可夫模型,通過(guò)模型輸出測(cè)試樣本序列的概率來(lái)識(shí)別異常行為。陳敏智等人[2]提出一種基于支持向量機(jī)(Supportvector machine,SVM)的針對(duì)ATM機(jī)的異常行為檢測(cè)方法,用SVM算法對(duì)有效跟蹤軌跡信息進(jìn)行異常行為識(shí)別。在異常檢測(cè)在報(bào)警關(guān)聯(lián)分析部分,王娟等人[3]利用經(jīng)典統(tǒng)計(jì)模型即均值方差模型檢測(cè)報(bào)警流量強(qiáng)度的異常,進(jìn)而把異常的時(shí)間段提供給報(bào)警關(guān)聯(lián),僅對(duì)異常時(shí)間段內(nèi)的報(bào)警進(jìn)行關(guān)聯(lián)分析。
經(jīng)過(guò)資料分析,之前的研究主要放在了對(duì)ATM機(jī)使用者的異常行為信息的識(shí)別及報(bào)警方面。但對(duì)交易數(shù)據(jù)的信息異常此處做的研究少之甚少,太過(guò)片面,存在著漏洞。而本文利用Excel和SPSS輔助通過(guò)對(duì)某商業(yè)銀行 ATM 應(yīng)用系統(tǒng)某分行的交易統(tǒng)計(jì)數(shù)據(jù)分析,基于對(duì)數(shù)據(jù)的統(tǒng)計(jì)信息構(gòu)建ATM機(jī)系統(tǒng)的行為特征,實(shí)現(xiàn)對(duì)ATM機(jī)系統(tǒng)的監(jiān)測(cè)和發(fā)現(xiàn)異常,對(duì)基于異常情況和特征值等因素做了研究, 把ATM機(jī)系統(tǒng)的異常特征與異常檢測(cè)技術(shù)結(jié)合, 以提高ATM機(jī)交易系統(tǒng)的應(yīng)用可用性,達(dá)到及時(shí)報(bào)警并減少虛警誤報(bào)的目的。
2 建立交易狀態(tài)異常檢驗(yàn)線性回歸模型
2.1 模型的建立
首先,我們對(duì)某商業(yè)銀行在長(zhǎng)春市六大城區(qū)和四個(gè)開(kāi)發(fā)區(qū)的ATM機(jī)交易反饋情況作為實(shí)踐對(duì)象,展開(kāi)調(diào)查采集數(shù)據(jù)。ATM機(jī)失敗率指單位時(shí)間內(nèi),交易失敗量占總交易量的比重,即機(jī)器處理故障發(fā)生的概率。為設(shè)計(jì)一套交易狀態(tài)異常檢驗(yàn)方案,以平均失敗率為因變量,以傳輸信號(hào)強(qiáng)度,中心后臺(tái)處理異常率,ATM機(jī)交易時(shí)間,平均交易量和平均響應(yīng)時(shí)間作為自變量,建立交易狀態(tài)異常檢驗(yàn)線性回歸模型。
因?yàn)閿?shù)據(jù)較為龐大,為此我們把每天的時(shí)刻分為三個(gè)組成部分,step1:時(shí)間為8:00---20:00,通過(guò)EXCEL均值處理,得到高峰時(shí)期交易狀態(tài)數(shù)據(jù);step2:時(shí)間為0:00--8:00和20:00---24:00,通過(guò)EXCEL均值處理,得到低谷時(shí)期交易狀態(tài)數(shù)據(jù);step3:抽樣交易狀態(tài)數(shù)據(jù)。在這三個(gè)階段中,以半個(gè)小時(shí)為單位,對(duì)抽樣數(shù)據(jù)中平均失敗率進(jìn)行預(yù)測(cè),影響因素有傳輸信號(hào)強(qiáng)度,中心后臺(tái)處理異常率,平均陡峭率(即這一時(shí)間點(diǎn)與上一時(shí)間點(diǎn)的差值),平均交易量,平均響應(yīng)時(shí)間和響應(yīng)時(shí)間方差。
應(yīng)用多元線性回歸模型,利用軟件SPSS 22.0,對(duì)ATM機(jī)失敗率及其上述六個(gè)影響因子進(jìn)行回歸分析,建立多元線性回歸方程:
Y=k1x1+k2x2+k3x3+k4x4+k5x5+k6x6+C
其中,Y表示平均時(shí)刻失敗率,x1表示平均時(shí)刻交易量,x2表示平均時(shí)刻響應(yīng)時(shí)間,x3表示平均陡峭率,x4表示高峰響應(yīng)時(shí)間方差,x5表示傳輸信號(hào)強(qiáng)度,x6表示中心后臺(tái)處理異常率。
2.2 模型求解與結(jié)果分析
建立警示器雛形:判斷當(dāng)Y值>0.05即失敗率>0.05進(jìn)行警報(bào)。為了完善此警報(bào)器,我們對(duì)整個(gè)數(shù)據(jù)進(jìn)行了篩選,篩選出失敗率>0.2的數(shù)據(jù)進(jìn)行線性回歸。利用SPSS軟件對(duì)高峰時(shí)期ATM機(jī)失敗率及其上述六個(gè)影響因子進(jìn)行回歸分析,得到回歸方程:
Y=0.355x1-0.065x2-0.326x3-0.031x4-0.43x5-0.516x6+0.046
利用SPSS軟件對(duì)低谷時(shí)期ATM機(jī)失敗率及其上述六個(gè)影響因子進(jìn)行回歸分析,得到回歸方程:
Y=0.141x1+0.481x2-0.001x3+0.220x4-0.37x5-0.433x6+0.037
給出五組交易狀態(tài)模擬值,將五組數(shù)據(jù)代入上述方程獲得如表1。通過(guò)表可以看出,該模型的模擬值與實(shí)際值的相對(duì)誤差在5%以內(nèi),通過(guò)圖表分析,基本符合實(shí)際數(shù)值,殘差較小,說(shuō)明該模型可靠性好。
3 建立基于定位ATM機(jī)系統(tǒng)的預(yù)警通用程序
為使警報(bào)器能切身實(shí)際的便利人們的生活,提高ATM機(jī)的業(yè)務(wù)效率,我們擬做一個(gè)通用程序。該通用程序的功能如下:定位附近1KM內(nèi)所有ATM機(jī)位置,業(yè)務(wù)成功率較好的以紅色顯示,業(yè)務(wù)成功率較差的進(jìn)行隱藏,并把相關(guān)數(shù)據(jù)發(fā)送給該銀行,銀行接收到數(shù)據(jù)進(jìn)行檢查處理。若是銀行內(nèi)部通信問(wèn)題,便等待通信恢復(fù);若是ATM機(jī)的故障時(shí),便派去維修人員進(jìn)行維修處理,恢復(fù)后依然顯示在通用程序的定位上。
抽樣獲取每個(gè)ATM機(jī)數(shù)據(jù):交易成功率,經(jīng)度坐標(biāo),緯度坐標(biāo),響應(yīng)時(shí)間,與之相對(duì)應(yīng)的維修人員經(jīng)度,緯度,維修人員的業(yè)務(wù)能力,信用度。當(dāng)ATM機(jī)出現(xiàn)故障時(shí),及時(shí)維修的效率也影響著銀行業(yè)的業(yè)務(wù)質(zhì)量,所以維修人員相關(guān)問(wèn)題也起著至關(guān)重要的。但維修人員維修ATM機(jī)產(chǎn)生的費(fèi)用,也可能存在問(wèn)題。對(duì)此我們對(duì)該問(wèn)題研究。為使維修費(fèi)用價(jià)格盡可能的合理,提出了如下幾個(gè)問(wèn)題:endprint
(1)在已結(jié)束項(xiàng)目任務(wù)數(shù)據(jù)基礎(chǔ)上,建立合理的指標(biāo),并分析ATM機(jī)和維修員定價(jià)“供求匹配”程度。
(2)針對(duì)多任務(wù)多維修員爭(zhēng)相選擇的問(wèn)題,單獨(dú)選取任務(wù)和用戶位置比較密集的區(qū)域,修訂問(wèn)題一的定價(jià)模型,并評(píng)價(jià)該方案的實(shí)施效果。
Step 1:通過(guò)智能交互地圖和聚類(lèi)算法,得到綠園區(qū)、朝陽(yáng)區(qū)、寬城區(qū)、二道區(qū)、南關(guān)區(qū)和開(kāi)發(fā)區(qū)六個(gè)區(qū)域的ATM機(jī)中心位置。
Step 2:在某個(gè)區(qū)域內(nèi),進(jìn)行合理的打包過(guò)程,使得出現(xiàn)故障的ATM機(jī)能夠及時(shí)的維修,同時(shí)使維修費(fèi)用價(jià)格盡可能的合理,找到距離故障的ATM機(jī)最近的且報(bào)價(jià)合理的維修人員。此模型的算法思想如下:
(1)輸入:A數(shù)組存放的故障ATM機(jī)位置坐標(biāo)(Aio,Ai1);
(2)對(duì)A數(shù)組存放的位置坐標(biāo)進(jìn)行遍歷,for循環(huán)如下:
{int i=0;i {int j=i+1;j (3)為避免數(shù)據(jù)重復(fù)性,用數(shù)組B對(duì)A數(shù)組同步。若B(i)=i,代表該數(shù)據(jù)使用過(guò),break; (4)循環(huán)條件:(Ai0-Aj0)2+(Ai1-Aj1)2≤閾值,閾值設(shè)定為0.003; (5)每個(gè)任務(wù)包中的任務(wù)量決定維修定價(jià)的權(quán)重,權(quán)重值=(11-n)/10; (6)輸出:數(shù)組接受打包的三個(gè)任務(wù)編號(hào),并將編號(hào)存到數(shù)組中; 實(shí)驗(yàn)部分JAVA代碼及結(jié)果(如圖1所示)。 Step 3:通過(guò)MATLAB編程得到距離與任務(wù)定價(jià)的規(guī)律,其中,x表示需要維修的ATM機(jī)任務(wù)位置與維修員的距離,Y表示維修定價(jià)。我們對(duì)所有任務(wù)數(shù)據(jù)進(jìn)行3次擬合,得到六個(gè)區(qū)域的擬合方程為: 綠園區(qū):Y=0.0044x^3-0.0209x^2-0.6148x -0.0335 朝陽(yáng)區(qū):Y=0.0513x^3-0.3520x^2+0.3991x +0.2474 寬城區(qū):Y=0.1250x^3-0.0364x^2-0.1397x -0.0967 二道區(qū):Y=-0.0652x^3-0.2281x^2+0.2991x +0.1598 南關(guān)區(qū):Y=0.2412x^3-0.0506x^2-0.7349x +0.3015 開(kāi)發(fā)區(qū):Y=0.0428x^3-0.0674 x^2+0.5 953x -0.0841 4 預(yù)警通用模型檢驗(yàn) 我們應(yīng)用JAVA軟件,分別計(jì)算六區(qū)域定價(jià)與所求得的定價(jià)容錯(cuò)閾值內(nèi)的正確率,當(dāng)每個(gè)區(qū)域的閾值正確率高于70%后,則認(rèn)為任務(wù)定價(jià)方案較合理,算法思想: (1)輸入:期望值、最小距離、維修定價(jià)、擬合維修定價(jià); (2)循環(huán)條件:abs(擬合維修定價(jià)-維修定價(jià))≤ 3; (3)輸出:若滿足循環(huán)條件,輸出結(jié)果為1;若不滿足循環(huán)條件,輸出結(jié)果為0; 本文設(shè)置維修定價(jià)的容錯(cuò)率(閾值)為3。檢驗(yàn)容錯(cuò)率的部分Java代碼如圖2所示。 統(tǒng)計(jì)結(jié)果為:綠園區(qū)、朝陽(yáng)區(qū)、寬城區(qū)、二道區(qū)、南關(guān)區(qū)和開(kāi)發(fā)區(qū)六個(gè)區(qū)域的維修定價(jià)容錯(cuò)率的結(jié)果比對(duì)模型正確的概率值分別為79.31%、85.67%、90.03%、86.45%、75.48%和89.27%。 5 總結(jié)和評(píng)價(jià) 本文首先建立了交易狀態(tài)異常檢驗(yàn)線性回歸模型,設(shè)計(jì)一套交易狀態(tài)異常檢驗(yàn)方案,通過(guò)SPSS編程研究ATM機(jī)失敗率和ATM機(jī)交易時(shí)間,平均交易量,響應(yīng)時(shí)間等因素的規(guī)律。針對(duì)任務(wù)和客戶位置比較密集的區(qū)域,建立基于定位系統(tǒng)ATM機(jī)的預(yù)警通用程序,使得出現(xiàn)故障的ATM機(jī)能夠及時(shí)的維修,同時(shí)使維修費(fèi)用價(jià)格盡可能地合理化。對(duì)區(qū)域進(jìn)行合理的打包過(guò)程,找到距離故障的ATM機(jī)最近的且報(bào)價(jià)合理的維修人員,通過(guò)MATLAB編程分析發(fā)布位置與維修定價(jià)的關(guān)系。 參考文獻(xiàn) [1]李戰(zhàn)明,宋丙菊.基于隱馬爾可夫模型的ATM機(jī)用戶異常行為識(shí)別[J].蘭州理工大學(xué)學(xué)報(bào),2012(05):76-81. [2]陳敏智,湯一平.基于支持向量機(jī)的針對(duì)ATM機(jī)的異常行為識(shí)別[J].浙江工業(yè)大學(xué)學(xué)報(bào),2010(05):546-551. [3]王娟,秦志光,葉李,靳京.異常檢測(cè)在報(bào)警關(guān)聯(lián)分析中的應(yīng)用[J].解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(03):278-280. [4]張超群,孟海東.數(shù)據(jù)挖掘中聚類(lèi)分析算法及應(yīng)用研究[J].山東工業(yè)技術(shù),2017(11):159. 作者簡(jiǎn)介 張靜(1990-),女,山東省濱州市人。碩士學(xué)位。吉林建筑大學(xué)城建學(xué)院助教。主要研究方向?yàn)橛?jì)算數(shù)學(xué)。 廖逸文(1997-),男,浙江省南京市人。吉林建筑大學(xué)城建學(xué)院2015級(jí)本科學(xué)生。主要研究方向?yàn)閼?yīng)用軟件開(kāi)發(fā)。 作者單位 吉林建筑大學(xué)城建學(xué)院 吉林省長(zhǎng)春市 130111