張紫云(公誠管理咨詢有限公司第五分公司 湖北武漢 430000)
在大數(shù)據(jù)環(huán)境下,人們可獲取的數(shù)據(jù)規(guī)模不斷增加、數(shù)據(jù)更新的速度不斷提高、數(shù)據(jù)類型呈現(xiàn)多樣性,隨著數(shù)據(jù)體量和維度增加,信息的可讀性隨之降低[1]。一般而言,人們很難直觀快速理解三維及更高維度數(shù)據(jù),面對海量信息,人們理解、分析并運用數(shù)據(jù)中有價值的信息做出決策的傳統(tǒng)方法面臨著很大的考驗[2]。在財務數(shù)據(jù)分析中,財務報表是重要的數(shù)據(jù)來源,從數(shù)據(jù)分析和可視化角度來說,財務報表是一個包含著高維度數(shù)據(jù)的集合,涵蓋了多個會計期間的資產(chǎn)、負債、現(xiàn)金流量等多個報表項目,各個報表科目最終構成了多個數(shù)據(jù)維度,如何挖掘這些高維財務數(shù)據(jù)信息是當前財務人員面臨的重要挑戰(zhàn)。
數(shù)據(jù)可視化本質上是數(shù)據(jù)分析和數(shù)據(jù)挖掘過程和結果的視覺呈現(xiàn),其過程離不開數(shù)據(jù)預處理和對數(shù)據(jù)的統(tǒng)計、計算,因此數(shù)據(jù)可視化的工具與數(shù)據(jù)分析的工具密不可分,以數(shù)據(jù)分析編程語言Python 為例[3][4],可使用Requests、Scra?py 完成數(shù)據(jù)的爬取,采用Pandas、Statsmodels、SciPy 等模塊用于數(shù)據(jù)處理和統(tǒng)計分析,數(shù)據(jù)可視化模塊可選擇Matplot?lib、Seaborn、Pyecharts等,這些工具為財務數(shù)據(jù)的分析和理解提供了新的途徑,采用這些數(shù)據(jù)分析工具改進傳統(tǒng)的財務分析方法是十分必要的。目前財務人員在數(shù)據(jù)可視化工具使用上,多采用Excel等傳統(tǒng)工具或商業(yè)分析軟件如Tab?leau、Crystal Xcelsius 水晶報表、Power BI 等,對Python、R 等編程語言的使用不夠普及,企業(yè)財務報告多以數(shù)值和表格的形式呈現(xiàn),圖形呈現(xiàn)方式上以傳統(tǒng)的餅圖、折線以及直方圖等為主,數(shù)據(jù)信息可讀性較差,不能很好地提煉其中的關鍵信息[4][5]。
本文以高維財務數(shù)據(jù)的可視化為研究重點,首先分析了高維數(shù)據(jù)可視化的基本方法,然后以財務管理中的杜邦分析法為例,分析了該方法在可視性上的局限性,設計了一個層次化的融合多種圖形的改進方法,并采用切爾諾夫臉譜和平行坐標的可視化方法對杜邦分析法中的財務數(shù)據(jù)進行了多角度分析。
數(shù)據(jù)可視化將數(shù)據(jù)或信息編碼成圖形或圖像,通過對圖形圖像處理、建模、顯示,對數(shù)據(jù)進行可視化解釋,其處理過程包括數(shù)據(jù)處理、視覺編碼、可視化生成,其過程同時伴隨數(shù)據(jù)分析、數(shù)據(jù)挖掘或機器學習[6],如圖1所示。
圖1 數(shù)據(jù)可視化在數(shù)據(jù)分析中的地位
隨著需要分析的數(shù)據(jù)體量的不斷增大,描述數(shù)據(jù)屬性的維度也越來越高,需要對傳統(tǒng)數(shù)據(jù)可視化方法進行改進。目前高維度數(shù)據(jù)的可視化方法主要分為降維和非降維方法。常見的降維方法有主成分分析法(PCA)、多維度分析(Muiti-Dimensional Scaling,MDS)和t分布隨機鄰域嵌入T-SNE(T-Disistributed Stochastic neighber embedding)等[7][8],這些方法通過數(shù)學計算將高維數(shù)據(jù)投影到低維空間,通常來說數(shù)據(jù)在高維空間中的距離越近,在投影中的兩點距離也越近,因此高維度數(shù)據(jù)間的相似度和聚類情況在低維度上的投影圖仍然可以部分保留[8]。但降維方法的不利之處在于會損失數(shù)據(jù)在原始維度上的細節(jié)信息,不能明晰地表示維度間的關系。非降維方法保留了高維數(shù)據(jù)在每個維度上的信息,可以展示所有維度[9],常見的有采用顏色、形狀、圖符等多種視覺元素相結合的方式對高維數(shù)據(jù)進行編碼,過程如下:
設D={d1,d2,…,dn},V={v1,v2,…,vm}
這里D是具有n維數(shù)據(jù)維度的數(shù)據(jù)集合,di表示該數(shù)據(jù)集的第i維屬性值,V是具備m維視覺屬性或元素的視覺空間,vj表示該視覺空間的第j維值,編碼函數(shù)為:
Fi=di→vi(i=1,2,3,…,n)
視覺屬性元素可以是點、線、面、顏色等構成的二維、三維圖形或圖符形式。其中基于圖符形式的可視化方法近年來日益受到重視,切爾諾夫臉譜圖、m_Arm Glyph就是圖符形式可視化方法的表現(xiàn)形式[10]。
杜邦分析法是財務數(shù)據(jù)分析中常用的一種方法,該分析法的提出已有將近100 年的時間,結合當前的數(shù)據(jù)分析方法和工具對其進行改進是十分必要的。
杜邦分析法以權益凈利率為核心,以資產(chǎn)凈利率和權益乘數(shù)為分解因子,揭示了企業(yè)盈利能力及杠桿水平對權益凈利率的影響和各指標之間的相關關系,該方法中幾種主要的財務指標關系為:
權益凈利率=資產(chǎn)凈利率×權益乘數(shù)
資產(chǎn)凈利率=營業(yè)凈利率(凈利潤/收入)×資產(chǎn)周轉率(收入/資產(chǎn))
圖2給出了一個杜邦分析的實例。
由圖2 可知,杜邦分析體系是一個多層次的財務指標分解體系。其使用者可以對各層級的財務指標結合企業(yè)歷史財務指標進行縱向比較,或者與同期行業(yè)內其他企業(yè)財務指標進行橫向比較,并向下一級繼續(xù)分解。逐級分解過程中,隨著指標的細化,逐步覆蓋了公司經(jīng)營活動的每個環(huán)節(jié)和財務報表上資產(chǎn)、負債、所有者權益中的多個項目,以實現(xiàn)系統(tǒng)、全面評價公司經(jīng)營成果和財務狀況的目的。
圖2 一個杜邦分析實例(單位:萬元)
從數(shù)據(jù)降維的角度而言,杜邦分析體系將收入、成本、費用、流動資產(chǎn)、非流動資產(chǎn)等多個報表項目及其關系匯總成三個財務指標,并最終形成一個財務指標,體現(xiàn)了高維數(shù)據(jù)降維的思想。但是,傳統(tǒng)杜邦分析法主要采用數(shù)值和算術運算的形式表示財務數(shù)據(jù)間的關系,在可視化呈現(xiàn)上存在以下不足:(1)營業(yè)凈利率、資產(chǎn)周轉率、權益乘數(shù)之間的勾稽關系、歷年的動態(tài)變化的呈現(xiàn)不夠直觀,無法把握指標的變化趨勢或者找到利潤增長的突破點,不便為信息使用者的決策提供充分的信息。(2)除了專業(yè)的財務人員、機構投資者之外,杜邦分析法的使用者還有小股東、廣大股民、參與企事業(yè)單位財務系統(tǒng)軟件開發(fā)的技術人員等其他非財務從業(yè)人員,他們對于企業(yè)和經(jīng)濟活動知識的了解有限,無法充分理解以數(shù)值呈現(xiàn)的、含有高密度信息且具有專業(yè)性的杜邦分析法及其中的指標。
杜邦分析法中的財務數(shù)據(jù)包含利潤、資產(chǎn)、負債等多個屬性,數(shù)據(jù)維度高,本文采用分層方法,針對不同的數(shù)據(jù)特征,借助不同的圖形元素對數(shù)據(jù)進行可視化,根據(jù)圖2給出的杜邦分析實例,本文給出了對應的可視化改進方案,如下頁圖3所示。
圖3 對杜邦分析的可視化改進
該方案將數(shù)據(jù)逐級劃分為5層:第一層:采用餅圖顯示成本、期間費用、資產(chǎn)等指標的構成比例關系。第二層:采用橫向柱狀圖顯示收入、成本、利潤、所得稅、資產(chǎn)總額之間的運算關系以及數(shù)量關系。第三層:采用橫向柱狀圖顯示利潤、收入、資產(chǎn)總額之間的運算關系以及數(shù)量關系;運算的結果為營業(yè)凈利率和資產(chǎn)周轉率,采用豎向柱狀圖表示。第四層:采用豎向柱狀圖顯示營業(yè)凈利率和資產(chǎn)周轉率之間的運算關系以及數(shù)量關系。第五層:顯示總資產(chǎn)凈利率與權益乘數(shù)的運算關系,運算結果為權益凈利率,采用豎向柱狀圖表示。
層次結構間的組成元素包括:(1)運算符號:包括+、-、×、÷,用于表示數(shù)據(jù)間的運算;(2)數(shù)據(jù)線:采用數(shù)據(jù)線代表數(shù)據(jù)的流向,數(shù)據(jù)的流向為從底層向高層,數(shù)據(jù)的流動過程中有數(shù)據(jù)的運算;(3)圖形的單位長度和計量單位:第3、4、5 層中的豎向柱狀圖計量單位為百分比,選取1為單位長度。第2、3層中的橫向柱狀圖計量單位可為元、千元、萬元、億元等,單位長度大小可根據(jù)實際情況調整。
上文提出的改進方案呈現(xiàn)的是一個財務實體在某個時間段的財務狀況,為了將多維數(shù)據(jù)指標當作一個整體來觀察,并能比較數(shù)據(jù)對象之間的差別,本文采用切爾諾夫臉譜圖(Chernoff faces)來滿足這種需求,如圖4所示。
圖4 切爾諾夫臉譜中可表示的數(shù)據(jù)維度
切爾諾夫臉譜圖可把包含多個變量的多維數(shù)據(jù)通過卡通人物的臉顯示出來,有助于揭示數(shù)據(jù)間的差異。臉的要素有眼、耳、口和鼻等,用其形狀、大小、位置和方向表示數(shù)據(jù)維度的值。切爾諾夫臉譜可以將大型數(shù)據(jù)表進行濃縮,利用的是人具備快速識別面部特征微小差異的能力。圖5 是采用該方法虛擬的某行業(yè)分布在各地區(qū)的企業(yè)財務畫像,可直觀比較不同企業(yè)關鍵財務指標的差異。
圖5 基于切爾諾夫臉譜圖的杜邦財務畫像比較
切爾諾夫臉譜圖能夠體現(xiàn)實體對象與同類之間的差異,但很難描述群組或各變量之間的關系。本文采用平行坐標圖(Parallel Coordinates Plot)來解決這個問題。平行坐標圖將多條軸平行放置,每條軸的頂端表示該變量的最大值,底端表示最小值。對于每個實體對象來說,會出現(xiàn)一條由左到右的線條,根據(jù)各個變量數(shù)值的不同而上下浮動。圖6顯示的是針對20 家上市公司財報選取稅后利潤、同比利潤、賬面凈值、凈資產(chǎn)收益率、現(xiàn)金流量、凈利潤、凈利潤同比增長率這7 個參數(shù)的平行坐標圖,該坐標圖基于Pyecharts 類庫采用Python 繪制,可直觀顯示數(shù)據(jù)的各維度數(shù)值主要的分布區(qū)間、變化趨勢,有助于挖掘數(shù)據(jù)間的相互關系。
圖6 包含7維財務數(shù)據(jù)的平行坐標圖
在大數(shù)據(jù)環(huán)境下,以往不可量化的信息變得容易獲取,數(shù)據(jù)的維數(shù)越來越高,金融財務數(shù)據(jù)的計量屬性和貨幣計量在呈現(xiàn)多樣化趨勢的同時也提高了財務信息的相關性并擴展了財務報告的內容,這必然會促進財務報告的呈現(xiàn)和分析模式的變化。本文以財務分析中的傳統(tǒng)杜邦分析法為例,采用分層方法,將數(shù)據(jù)維度劃分為多個子集,結合餅圖、柱狀圖,并融入運算符號、數(shù)據(jù)線等元素對傳統(tǒng)杜邦分析法的可視化進行了改進,并采用切爾諾夫臉譜和平行坐標圖呈現(xiàn)了不同財務實體在杜邦分析法中關鍵數(shù)據(jù)的差異性,改進后的方法有助于決策者和投資人直觀了解企業(yè)的財務政策、經(jīng)營戰(zhàn)略和各項財務指標的時序變化趨勢。