穆阿里
(中國(guó)人民銀行成都分行,成都 610041)
本文通過(guò)調(diào)查全省銀行業(yè)金融機(jī)構(gòu)對(duì)機(jī)房動(dòng)力系列標(biāo)準(zhǔn)的執(zhí)行情況,剖析我省目前存在的機(jī)房動(dòng)力和運(yùn)維現(xiàn)狀與風(fēng)險(xiǎn),提出全省金融機(jī)構(gòu)機(jī)房建設(shè)、運(yùn)維的思路,從而有效防范金融業(yè)動(dòng)力系統(tǒng)風(fēng)險(xiǎn),保障金融穩(wěn)定,主要采用K-means、主成分分析(PCA)算法等數(shù)據(jù)分析方法。
(1)k均值聚類是一種矢量量化方法,最初來(lái)自信號(hào)處理,是數(shù)據(jù)挖掘中聚類分析的常用方法。k均值聚類的目的是將n個(gè)觀測(cè)值劃分為k個(gè)聚類,其中每個(gè)觀測(cè)值屬于具有最近均值的聚類,作為聚類的原型。這導(dǎo)致數(shù)據(jù)空間劃分為Voronoi單元。這個(gè)問(wèn)題在計(jì)算上很困難(NP難);然而,有效的啟發(fā)式算法快速收斂到局部最優(yōu)。這些通常類似于通過(guò)k均值和高斯混合建模所采用的迭代細(xì)化方法的高斯分布混合的期望最大化算法。他們都使用集群中心來(lái)建模數(shù)據(jù);然而,k均值聚類傾向于找到具有可比空間范圍的聚類,而期望最大化機(jī)制允許聚類具有不同的形狀。該算法與k-最近鄰分類器具有松散的關(guān)系,這是一種流行的分類機(jī)器學(xué)習(xí)技術(shù),由于名稱,常常與k-means混淆。將1最近鄰分類器應(yīng)用于通過(guò)k均值獲得的聚類中心將新數(shù)據(jù)分類到現(xiàn)有聚類中。這被稱為最近的質(zhì)心分類器或Rocchio算法。
(2)主成分分析(PCA)是一種統(tǒng)計(jì)過(guò)程,它使用正交變換將可能相關(guān)變量的一組觀察值(每個(gè)實(shí)體都采用各種數(shù)值)轉(zhuǎn)換為一組稱為主成分的線性不相關(guān)變量值這種轉(zhuǎn)換的定義方式是第一主成分具有盡可能大的方差(即,盡可能多地考慮數(shù)據(jù)的可變性),并且每個(gè)后續(xù)成分依次在約束下具有最高的方差。它與前面的組件正交。得到的矢量(每個(gè)是變量的線性組合并包含n個(gè)觀測(cè)值)是不相關(guān)的正交基組。PCA對(duì)原始變量的相對(duì)縮放敏感。
通過(guò)PCA方法,將原有金融機(jī)構(gòu)調(diào)查問(wèn)卷中55個(gè)指標(biāo)個(gè)指標(biāo)壓縮到二維平面,以實(shí)現(xiàn)原有調(diào)查問(wèn)卷中高維度數(shù)據(jù)在二維平面上的展示,并且?guī)в性紨?shù)據(jù)的主要特征。
本文通過(guò)調(diào)查問(wèn)卷和現(xiàn)場(chǎng)調(diào)研的方式對(duì)省內(nèi)部分金融機(jī)構(gòu)開展摸底調(diào)查,共獲取117家機(jī)構(gòu)機(jī)房數(shù)據(jù)。對(duì)獲取的機(jī)房動(dòng)力情況數(shù)據(jù)與機(jī)房基礎(chǔ)設(shè)施運(yùn)行維護(hù)數(shù)據(jù)采用了K-means聚類算法和主成分分析等方法進(jìn)行分析,力求能得到當(dāng)前準(zhǔn)確現(xiàn)狀。
調(diào)查數(shù)據(jù)顯示,被調(diào)查銀行業(yè)金融機(jī)構(gòu)中符合A級(jí)動(dòng)力系統(tǒng)的機(jī)構(gòu)數(shù)量為3家,占比23.07%,符合B級(jí)動(dòng)力系統(tǒng)的機(jī)構(gòu)數(shù)量為6家,占比46.15%,符合C級(jí)動(dòng)力系統(tǒng)的機(jī)構(gòu)數(shù)量為4家,占比30.77%,復(fù)合型動(dòng)力系統(tǒng)(部分指標(biāo)分別符合A、B、C級(jí)動(dòng)力系統(tǒng)指標(biāo)要求)按照最低級(jí)別進(jìn)行歸類。
對(duì)被調(diào)查機(jī)構(gòu)機(jī)房動(dòng)力情況調(diào)查問(wèn)卷數(shù)據(jù)采用K-means算法進(jìn)行聚類分析,聚類分布情況通過(guò)PCA壓縮變換后如圖一所示:
圖1 銀行業(yè)金融機(jī)構(gòu)機(jī)房動(dòng)力聚類分布圖
圖1顯示被調(diào)查銀行業(yè)金融機(jī)構(gòu)機(jī)房動(dòng)力情況大致可分為三類,其中第一類、第三類分布區(qū)域比較集中,第二類區(qū)域相對(duì)分散,而對(duì)于第二類中方差較大的原因是由于聚類后使用PCA壓縮算法將原有55維度空間壓縮到2維空間存在一定的數(shù)據(jù)丟失。而聚類分析各類數(shù)量上第二類數(shù)量占比較大,第一類、第三類數(shù)量占比較小,具體情況見圖2:
圖2 銀行業(yè)金融機(jī)構(gòu)機(jī)房動(dòng)力聚類數(shù)量占比圖
聚類后對(duì)各項(xiàng)指標(biāo)符合值進(jìn)行統(tǒng)計(jì)匯總,生成各類機(jī)構(gòu)機(jī)房動(dòng)力整體符合率,其中第二類符合率最高,第三類符合率最低,具體情況見表1:
表1 銀行業(yè)金融機(jī)構(gòu)機(jī)房動(dòng)力聚類符合率情況表
通過(guò)圖2、表1分析顯示被調(diào)查銀行業(yè)金融機(jī)構(gòu)絕大部分機(jī)房動(dòng)力情況良好,技術(shù)指標(biāo)符合率較高,整體水平較好,其中數(shù)量占比69%的機(jī)房屬于第二類,其符合率為94.55%。為了解被調(diào)查機(jī)構(gòu)機(jī)房動(dòng)力具體情況,本課題對(duì)機(jī)房動(dòng)力各分項(xiàng)指標(biāo)符合率進(jìn)行聚類統(tǒng)計(jì),結(jié)果如圖3所示:
圖3 銀行業(yè)金融機(jī)構(gòu)機(jī)房動(dòng)力分項(xiàng)符合率聚類統(tǒng)計(jì)表
圖3顯示第一類和第三類較第二類的差距主要表現(xiàn)在:第一類機(jī)構(gòu)機(jī)房動(dòng)力監(jiān)控系統(tǒng)符合率最低,其值低于50%,第三類機(jī)構(gòu)機(jī)房供配電、動(dòng)力監(jiān)控及供配電設(shè)備符合率較低,第一類和第三類在不同的維度上出現(xiàn)了區(qū)別。
總體結(jié)論:通過(guò)收集到的13份調(diào)查問(wèn)卷,采用聚類分析,全省地方性銀行業(yè)金融機(jī)構(gòu)機(jī)房動(dòng)力情況總體情況較好,其中最好一類機(jī)構(gòu)占69%,平均符合率為94.55%;次好類機(jī)構(gòu)占15%,平均符合率為83.64%,其主要差距表現(xiàn)在動(dòng)力監(jiān)控;最后一類機(jī)構(gòu)占16%,平均符合率為80.91%,其主要差距表現(xiàn)在機(jī)構(gòu)機(jī)房供配電、動(dòng)力監(jiān)控及供配電設(shè)備。
綜上所述,有9家銀行機(jī)房運(yùn)行情況較好;有2家銀行需要改進(jìn)動(dòng)力監(jiān)控系統(tǒng);有2家銀行需要改進(jìn)機(jī)房供配電、動(dòng)力監(jiān)控及供配電設(shè)備。