[摘 要]本文采用聚類算法對(duì)ATM機(jī)上的日取用數(shù)量進(jìn)行聚類,之后把每日的日取用數(shù)量替換成聚類類標(biāo)號(hào),然后再通過EVIEWS軟件,對(duì)這些包含時(shí)間屬性的聚類類標(biāo)號(hào)進(jìn)行回歸,生成回歸方程式,用來預(yù)測未來的日貨幣存放量。
[關(guān)鍵詞]聚類 EVIEWS 回歸分析 預(yù)測
一、引言
聚類分析是一種重要的人類活動(dòng)。早在孩提世代,通過不斷地改進(jìn)下意識(shí)的聚類模式來學(xué)習(xí)如何區(qū)分貓和狗,或動(dòng)物和植物。聚類分析已經(jīng)廣泛的應(yīng)用于許多應(yīng)用領(lǐng)域,包括市場研究、模式識(shí)別、數(shù)據(jù)分析和圖像處理。在電子商務(wù)中,聚類分析能夠幫助市場分析人員根據(jù)購買模式從顧客庫中發(fā)現(xiàn)不同的顧客群。在生物學(xué)中,聚類能用來推到植物和動(dòng)物的分類,根據(jù)相似功能對(duì)基因進(jìn)行分類,獲得對(duì)種群中固有結(jié)構(gòu)的認(rèn)識(shí)。聚類可以定義如下:基于數(shù)據(jù)的相似性把數(shù)據(jù)集合劃分成組。相對(duì)于數(shù)據(jù)分類而言,聚類是觀察式學(xué)習(xí),他不需要事先指定,而是根據(jù)自己的觀察得出組信息。
各個(gè)銀行網(wǎng)點(diǎn)每日需要的貨幣數(shù)量是一個(gè)不確定的值,既不能在銀行存放過多貨幣,也不能讓客戶來銀行取款時(shí)無錢可取,ATM機(jī)器也是一樣。在無錢可取時(shí),銀行必須得雇用保安公司或者警察押送貨幣,如果某一天的貨幣數(shù)量不夠,那么因?yàn)檠核投嘀Ц督o保安公司或警察的錢就會(huì)增加,對(duì)于銀行來說,這是一筆很大的負(fù)擔(dān)。要非常準(zhǔn)確的預(yù)測下一天的貨幣使用量,這個(gè)將會(huì)是一個(gè)很困難的問題,但是,如果要預(yù)測下一天的貨幣使用范圍,這個(gè)還是有一定的可行性的。
本文就是首先對(duì)一個(gè)ATM機(jī)器上的日貨幣使用量進(jìn)行聚類,把日貨幣量劃分為幾個(gè)類別,例如:60萬到70萬之間為一類,70萬到80萬之間為一類。在聚類完成以后,把每日的貨幣使用量采用類標(biāo)號(hào)來代替,然后通過EVIEWS進(jìn)行回歸分析,來進(jìn)行預(yù)測下一天的貨幣使用范圍。
二、聚類分析
本文是通過K-MEANS來進(jìn)行聚類。該算法如下圖所示:
當(dāng)我們把聚類數(shù)量設(shè)置為10時(shí),簇中心為下表所示。
得到以上聚類結(jié)果后,參考了銀行專業(yè)人士的意見,每次運(yùn)鈔應(yīng)該是一個(gè)整的單位,不會(huì)是出現(xiàn)小數(shù),故在這里以50萬作為基準(zhǔn),由此可以把聚類結(jié)果分為50萬以下,50到100萬,100萬到150萬,150萬到200萬,200萬到300萬,300萬以上。
三、回歸分析
在分別用類標(biāo)號(hào)代替日需貨幣量以后,我們通過EVIEWS進(jìn)行回歸分析。拿最新的數(shù)據(jù)作為預(yù)測數(shù)據(jù),實(shí)驗(yàn)結(jié)果顯示,準(zhǔn)確率可以達(dá)到70%以上。
四、結(jié)論
在對(duì)ATM機(jī)的日貨幣量采用聚類做預(yù)處理以后,再通過EVIEWS進(jìn)行回歸分析以后,發(fā)現(xiàn)預(yù)測效果達(dá)到了70%(目前正在實(shí)施的預(yù)測方法的準(zhǔn)確率僅為50%),說明該預(yù)測方法有可行性,在一定程度上減少了因?yàn)轭A(yù)測的不準(zhǔn)確導(dǎo)致產(chǎn)生的費(fèi)用。
因?yàn)槟壳爸挥幸粋€(gè)ATM機(jī)器的數(shù)據(jù),該算法的有效性還應(yīng)根據(jù)多個(gè)ATM機(jī)器上進(jìn)行反復(fù)測試,在證明算法有效以后,真正拿去實(shí)施應(yīng)用。但這個(gè)預(yù)測的方法可以供參考,也可以采用這種方法預(yù)測其他數(shù)據(jù)。
參考文獻(xiàn):
[1]辛愛莉:聚類算法在電子商務(wù)客戶細(xì)分中的應(yīng)用[J].商場現(xiàn)代化,2008.02 p164
[2]葛繼科:數(shù)據(jù)挖掘技術(shù)在個(gè)人信用評(píng)估模型中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006.12pp172~174 p177
[3]JiaWeiHan范 明 孟曉峰:數(shù)據(jù)挖掘概念與技術(shù)[M].機(jī)械工業(yè)出版社,2006
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文