薛瑾
摘? ?要:在人民幣匯率雙向波動幅度進一步加大的背景下,傳統(tǒng)的個人外匯管理“總量分析+結構分析”模式,已難以摸清復雜數據背后的真實規(guī)律。因此,本文借助SAS軟件的“ward聚類算法”,著重對陜西省個人購付匯重點關注主體進行聚類分析,從而為個人外匯業(yè)務形勢分析及監(jiān)測管理提供有效參考。
關鍵詞:外匯管理;個人外匯業(yè)務;聚類算法
中圖分類號:F832.7? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-0017-2020(8)-0056-05
一、引言
我國自2007年開始,為規(guī)范和便利銀行及個人的外匯業(yè)務操作,對個人結匯和境內個人購匯實行年度總額管理,年度總額分別為每人每年等值5萬美元。個人年度總額內的結匯和購匯,憑本人有效身份證件在銀行辦理。超過年度總額的,經常項目項下憑本人有效身份證件和規(guī)定的證明材料在銀行辦理;資本項下相關交易須經外匯局核準。個人外匯管理政策的開放和進一步便利化,使得個人外匯管理模式由“事前審批”轉變?yōu)椤笆轮小⑹潞蟊O(jiān)測核查”。
目前,對于個人外匯業(yè)務的分析及研究主要局限于傳統(tǒng)的“總量分析+結構分析”層面。本文運用“大數據”分析理念,在傳統(tǒng)的宏觀分析的基礎上,聚焦個人主體微觀行為。通過SAS統(tǒng)計分析軟件(以下簡稱SAS)中的“Enterprise Guide”對個人外匯數據進行基礎加工,運用SAS軟件“Enterprise Miner ”(以下簡稱EM)中的“ward聚類算法”設立模型,對個人外匯業(yè)務主體進行聚類,分析各類個人購付匯主體行為特征,從而提出針對性的建議。
二、運用SAS“ward聚類算法”對個人外匯主體進行聚類分析
聚類分析是一種探索性數據挖掘方法,以整體為視角,在所選變量中按一定的規(guī)則對其中樣本進行聚類。SAS“ward聚類算法”主要以同類事物的內部差異高低作為集群聚類、輔助分區(qū)的決策依據。本文對陜西省個人購付匯主體數據開展聚類分析,根據聚類變量間的距離及重要性等對多個變量指標進行篩選,并以SAS算法的自動分類為原則,根據優(yōu)選后的變量指標,對個人購付匯主體聚類后形成分析結果。
(一)變量優(yōu)選:9個指標的聚類結果更顯著
指標變量共11個,其中包括3個分類變量,8個數值型變量。運用SAS EM 中的“變量聚類”功能,通過重復組合及變量訓練,對數值型變量的距離進行分析,同時對部分變量的重要性進行分析,通過對各聚類中貢獻值較小、重復性較高的變量逐一進行刪減,從而選出有效變量。
1.聚類變量間的距離分析。在變量的聚類距離中,變量聚類1:付款總金額、購付匯率、購匯總金額、購匯提鈔總金額四個變量的聚類成分R方數值依次減小;變量聚類2:購匯首尾相差天數、購匯次數、購匯幣種個數的聚類成分R方數值依次減小;年齡在變量距離中單成1類聚類3(見圖1)。
2.聚類變量的重要性分析。通過SAS軟件的聚類變量重要性篩選功能,對聚類變量進行分析。從分析結果看,當前個人主體分類狀態(tài)、付款總金額、購匯總金額、購匯次數、購匯首尾相差天數五個變量對聚類結果的影響較大,購匯幣種個數、交易主體類型對聚類結果的影響居中,有3個變量:購匯提鈔總金額、性別、年齡對聚類結果幾乎沒有影響。
3.聚類變量選取結果。綜合考慮變量間的距離及重要性,同時結合對結果的解釋性以及業(yè)務實際需要,去掉變量中購付匯率、性別指標,最終選取了9個指標變量進行下一步聚類分析,包括:年齡、當前個人主體分類狀態(tài)、交易主體類型、購匯總金額、購匯次數、付匯總金額、購匯提鈔總金額、購匯首尾相差天數、購匯幣種個數。
(二)聚類分析結果:優(yōu)化提煉17個主體類別
在SAS EM中創(chuàng)建數據源與流程圖,運行聚類算法,結果顯示個人購付匯主體分為17類,各類數據包括了個人主體數及各指標的數據均值(見表2)。其中,第2、4、16類個人主體最多,占比達到87.38%。
(三)段剖面剖析:分類后個人主體購付匯行為的主要特征
運用SAS軟件中的段剖面工具,得出個人購付匯主體分類后的數據剖面圖。根據段剖面圖顯示,有顯著特征的分類有以下8類:
1.第2類個人占比37.61%,付匯總金額較小,購匯總金額居中,付匯金額遠小于購匯金額。個人付匯平均金額9176美元,其中1萬美元以下的主體占70%;購匯平均金額處于中間值2.36萬美元,其中2.75萬美元以下的占78.38%;購匯次數在2次以下的占比77%;購匯提鈔金額較小,平均值僅有216美元;購匯幣種集中在1-2個(見圖2)。
2.第4類個人占比28.33%,購匯、付匯總金額均較大。第4類個人與第一類個人段剖面的指標一致,兩者的區(qū)別主要為購匯總金額與付匯總金額,第4類個人購匯總金額的平均值為4.58萬美元,是第2類的1.83倍,付匯總金額的平均值為4.43萬美元,是第二類的4.83倍,其他值差異性不大(見圖3)。
3.第16類個人占比21.44%,購匯、付匯總金額居中,購匯次數較多。此類個人購匯、付匯金額平均值分別為3.19、2.12萬美元,但購匯的次數明顯高于第2類、第4類個人,購匯次數平均值為5.84次,同時購匯首尾相差天數較大;另外此類個人是這幾類個人中唯一年齡占重要變量指標的類別,其中年齡在46-54歲上下的個人遠高于平均值,占比68.1%(見圖4)。
4.第7類個人占比5.5%,購匯總金額、購匯次數均無明顯差別,差別的變量主要集中在購匯提鈔金額及付款總金額兩個變量上,且購匯提鈔總金額數值遠高于其他類別、付款總金額遠低于其他類別(見圖5)。
5.第19、8、9、17類個人,表現出單個指標特征明顯。四類個人均為單一特征分類,分別為:購匯幣種個數、當前個人主體分類狀態(tài)、付款總金額、購匯次數。其中第19類,購匯幣種為4個以上的占比98.05%;第8類,全部為“預關注”個人;第9類主體付匯總金額的平均值是購匯總金額的兩倍,付款金額在20萬美元以上的占比較高;第17類主體購匯次數在100次以上的占比較高(見圖6)。
三、聚類結果對個人外匯業(yè)務管理的指導意義
基于SAS運行出的上述聚類結果,本文將上述個人購付匯主體歸納為五大類型,并在個人外匯管理中重點施策。
一是對“額度內購匯、付匯觀望型主體”,加強預期管理,引導實需用匯。主要對應于聚類結果中的“第2類”主體,該類主體購匯時,在短時期內并未有實際的用匯需求,購匯主要用于滿足長期的用匯需求或者基于資產保值、增值類需求,此類主體購匯心理主要為預防性或防御性。因此,對此類別的個人,重點開展預期管理,引導個人根據實需購匯。
二是對“大額購付匯主體”,細分不同類型,分別側重于便利性與防風險。主要對應于聚類結果中的“第4類”主體,此類主體購匯的同時存在大額的付匯行為。其中一類情況為真實的留學等經常項目項下購付匯行為,另一類大額的因私旅游項下的匯出,應為不真實申報或資金的異常違規(guī)流出。因此,對于該類主體應具體細分真實性需求或異常數據類型。對于真實性購匯需求,應引導銀行繼續(xù)創(chuàng)新業(yè)務辦理模式,使得個人購付匯更加便利。對于異常數據,在日常個人外匯管理工作中應開展重點核查。
三是對“多次購匯型主體”,關注匯率波動與購付匯行為間的關聯性。主要對應于聚類結果中的“第16類”主體。該類主體購匯以及匯出的累計金額均較大、購匯較為頻繁,同時購匯的幣種較為單一。初步分析此類主體中個人有長期用匯需求,在日常操作中在不同匯率時點,通過多次購匯來平衡人民幣匯率波動造成的損失。此類主體對匯率波動的敏感性較大,因此對該類主體應重點關注匯率波動對個人購付匯行為的關聯性影響,分析匯率大幅波動下的個人購匯心理預期與購付匯行為結果。
四是對“大額購匯提鈔型”主體,引導個人合規(guī)提鈔、攜帶出境。主要對應于聚類結果中的“第7類”主體,目前我國境內禁止外幣計價結算,特殊情況下需要攜帶10000美金以上出境的,還須經外匯局進行核準。因此,對于購匯后大額提鈔主體,應結合“三反”要求,加大個人外匯政策宣傳,引導個人減少大額外幣現鈔提取,合規(guī)攜帶外幣出境。
五是對“異常數據主體”,加強日常及專項的監(jiān)測核查。主要對應于聚類結果中的第8、11、12、13、15、17、18、19類主體,其中第8類主體主要為參與個人分拆購付匯被外匯局納入“關注名單”類主體,對于此類主體還應重點分析銀行在辦理此類業(yè)務中的內部控制措施是否完善,如果該類主體的主要購付匯行為集中在某家銀行,則證明該行的內部控制措施較弱,應采取多種管理手段要求銀行強化內部管理;第12、19類購匯幣種較多以及第13、15類購匯次數全年累計超過100次的主體,此類主體行為較為異常,一類通過外匯實盤操作來進行外匯買賣,達到賺取匯率差價的目的,另一類多幣種之間高頻操作購匯以及存取的,還原數據甄別后可作為非法倒賣外匯的重點核查對象;第11、18類購付匯金額特別大的主體,從業(yè)務邏輯判斷上應屬于不占用額度的購付匯,可重點核查個人在銀行辦理業(yè)務時提供資料的真實性、合規(guī)性。
(一)通過對個人外匯業(yè)務主體及行為數據的特征刻畫,為風險分類管理、異常數據挖掘提供有效手段
個人外匯業(yè)務日常監(jiān)測管理應在微觀監(jiān)測單筆數據的基礎上以及大數據分析的框架下,整體分析業(yè)務數據變化的規(guī)律。針對不同的個人外匯業(yè)務群體,準確描述高風險主體及高風險行為特征,為個人外匯業(yè)務和主體畫像,從而為個人外匯管理政策制定和監(jiān)測管理提供有效手段。
(二)個人外匯管理方式應關口前移,由“事后監(jiān)管”變?yōu)檫\用“大數據”倒逼銀行“事前+事中”控制
目前現行個人外匯管理方式中,外匯局會對分拆購付匯匯異常主體采取列入“關注名單”的方式。從SAS聚類分析的結果看,此類主體整體占比較少,用在聚類中指標較為單一,對業(yè)務風險的識別作用有限,且個人異常違規(guī)行為往往會由內部控制嚴格的銀行向內部控制松散的銀行轉移。因此,應充分運用“大數據”,在分析個人主體特征的基礎上,著重向銀行異常數據集群轉變。將銀行作為個人外匯業(yè)務風險識別與阻斷的第一道防火墻,倒逼銀行將強化“事前+事中”、“網銀+人工”的全渠道內部控制措施作為日常管理新常態(tài)。
(三)加強個人主體數據的持續(xù)監(jiān)測,為個人外匯形勢分析和研判提供有效參考
本文在分析時采用了一段時期內的個人購付匯數據,用于個人聚類分析,從一定層面上反映了各類別個人購付匯主體的行為特征,但較短時間段范圍的數據選取無法刻畫個人用匯的長期性、復雜性的變化特點。因此,應將個人外匯主體行為特征的聚類分析,在一定區(qū)域、一定時間段內進行連續(xù)跟蹤,深入分析其變化過程和發(fā)展規(guī)模,進而為個人外匯業(yè)務分析和研判提供有效參考。
(四)在現有大數據環(huán)境下,探索建立匯率公眾預期與個人購付匯行為相關聯的監(jiān)測分析方法
個人主體在不實輿論傳播影響下,易出現“羊群效應”,導致個人群體大規(guī)模集中購付匯。因此,應充分運用大數據分析,在掌握主體特征的前提下,針對特殊群體、特定業(yè)務采取具有針對性的預期引導措施,特別是在人民幣匯率劇烈波動、市場情緒不穩(wěn)時,針對不同群體個人開展分類指導,持續(xù)監(jiān)測市場結售匯情緒變化,在保證個人真實用匯需求的同時,主動擠出虛假泡沫數據,有效防范個人跨境資金異常波動。
參考文獻
[1]郭振玉.基于聚類分析和關聯規(guī)則的數據庫用戶行為模式分析的研究[D].武漢:武漢理工大學,2016.
[2]國家外匯管理局江西省分局經常項目管理處課題組[J].從法律角度論個人外匯管理改進之必要,金融與經濟,2015,(01):84-87.
[3]牧人.大數據時代的外匯監(jiān)管.中國外匯,2014,(11):64-65.
[4]謝康,吳記,肖靜華,基于大數據平臺的用戶畫像與用戶行為分析[J].中國信息化,2018,(03):100-104.
[5]張濤,陳慶玲,吳濤,董玉婷.個人購匯行為的影響因素研究[J].中國外匯.2017,(01):38-41.
Research on the Characteristics of Individuals Purchase and
Payment of Foreign Exchange
——Based on the "ward clustering algorithm" of SAS software
XUE Jin
(Xian Sub-branch PBC, Xian Shannxi 700075)
Abstract:Under the background of the two-way volatility of the RMB exchange rate, the traditional model of individual foreign exchange management based on “volume analysis + structural analysis” has been facing challenges, which is unable to discover the true patterns behind complex data. To this end, by using SAS software tools, this paper uses the "ward clustering algorithm" of SAS software to analyze and characterize the main subjects of purchase and payment in shaanxi province, therefore, provides an effective reference for analysis and regulation.
Keywords: subject characteristics, big data, clustering algorithm, SAS software
責任編輯、校對:李美嬋
收稿日期:2020-06
作者簡介:薛? ?瑾(1984.03-),女,陜西韓城人,碩士,會計師,現供職于中國人民銀行西安分行。
注:本文為作者觀點,文責自負。