李 帥
隨著經濟發(fā)展對會計信息化的新的需求,如何通過科學、有效的手段,對行業(yè)會計報表數據進行高效的收集與利用,以此來掌握企業(yè)的經營和管理現(xiàn)狀,發(fā)現(xiàn)企業(yè)經營管理中存在的問題,預測企業(yè)未來的發(fā)展前景,已受到了社會各界的普遍關注。有關行業(yè)會計報表的信息化問題,采用何種技術,利用何種方法,能夠對這些報表數據進行收集并對歷史數據進行集成,以便進一步進會計報表數據進行分析利用。
將會計報表數據構建入數據倉庫,不僅可以將行業(yè)會計報表數據統(tǒng)一管理起來,還可以在此基礎上進一步對報表數據進行OLAP(聯(lián)機分析處理,On-line AnalyticalProcessing)和DM(數據挖掘,Data Mining),從多角度、多側面觀察和分析數據。本文就構建行業(yè)會計報表數據倉庫模型進行探討。
鑒于行業(yè)組織構架和數據倉庫應用的復雜性,本研究采用雪花型模型來設計數據倉庫模型,相對于星型模型,可以更準確地反映出各實體之間的邏輯關系,并依據實體的重要程度,將這種關系詳細地表示出來。由于目前數據倉庫一般都建立在關系數據庫基礎上,因此,本模型設計過程中所采用的邏輯模型主要是關系模型。利用關系模型不但可以創(chuàng)建指標實體的關系模型,還可以創(chuàng)建概念模型中的維度實體關系模型。
雪花型模型是一種多維的數據關系,它由一個事實表(Fact Table)和一組維表(Dimension Table)組成。每個維表都有一個維作為主鍵,所有這些維則組合成事實表的主鍵,換言之,事實表主鍵的每個元素都是維表的外鍵。事實表的非主鍵屬性稱為事實(Fact),它們一般都是數值或其他可以進行計算的數據;而維大都是文字、時間等類型的數據。雪花型邏輯模型設計如圖1所示。
事實表是雪花型模型結構的核心。事實表中一般要包含兩個部分:一部分是有主鍵和外鍵組成的鍵部分,另一部分是用戶希望在數據倉庫中所了解的數值指標。事實表是數據倉庫中的最大表,因為它包含了大量的基本業(yè)務詳細信息。在設計時要注意使事實表盡可能地小,因為過于龐大的事實表在表的處理、備份和恢復、用戶的查詢等方面需要較長的時間。在實際設計時,可以利用減少列的數量、降低每一列的大小、把歷史數據歸檔到單獨的事實表中等多種方法來降低事實表的大小。
圖1 行業(yè)會計報表雪花型邏輯模型
本文所設計的集團企業(yè)會計報表數據倉庫邏輯模型,如圖1所示,涉及多級主題,而每級主題成員又具有多個,所以在雪花型模型設計中,采用多事實表設計,如資產負債表事實表、損益表事實表、現(xiàn)金流量表事實表、股東權益表事實表和財務分析指標事實表等,而每個事實表采用統(tǒng)一的內部行業(yè)編碼相關聯(lián),組成一個整體,這樣的設計,更清晰,更便于對行業(yè)會計報表數據倉庫的后續(xù)研究與應用。而每個事實表中,主鍵為時間維時間關鍵字、企業(yè)維企業(yè)關鍵字、指標維指標關鍵字。
行業(yè)會計報表數據倉庫的邏輯模型設計中,確定了事實表模型后,還需要確定其維表模型。維度表是會影響到決策的因子。如不同企業(yè)、時間、指標類別都是影響決策的大因子,通過這些因子決策者可以按照不同企業(yè)不同時間不同指標類別進行決策評價。
(1)時間維
時間維模型是許多數據倉庫應用中的常用維度,其設計方式與其他多數維表模型有差別,企業(yè)集團會計報表的時間因素相對于其他應用的數據倉庫較為特殊,非上市公司的會計報表一般編制月報、季報和年報,上市公司必須提供半年報和年報。具體設計時,日期維可以存放以日期表示的5-10年的數據行,也可以將3-4年的數據行作為時間維的內容,時間維設計字屬性列為:日期年度、半年度、季度、月等。
(2)企業(yè)維
企業(yè)是行業(yè)或集團企業(yè)的基本元素,也是企業(yè)集團會計報表應用的基本匯總單位和比較單位。企業(yè)維中應包括企業(yè)名稱、所屬行業(yè)、所在地、電話、法定代表人、企業(yè)性質等。
行業(yè)維是對行業(yè)企業(yè)性質的進一步說明,應包括行業(yè)編號和行業(yè)名稱等。
(3)指標維
指標維是對指標事實表中指標數據的詳細說明,在事實表設計時,共設計了五個事實表:資產負債表事實表、損益表事實表、現(xiàn)金流量表事實表、股東權益變動表事實表和財務分析指標事實表等,對這些事實表的指標維度表設計,做統(tǒng)一設計,包括指標名稱、指標類型、指標描述、指標類別等。
粒度是指數據倉庫的數據單位中保存數據的細化或綜合程度的級別。細化程度越高,綜合程度越低,粒度級就越?。幌喾?,細化程度越低,綜合程度越高。粒度劃分的適當與否直接影響到數據倉庫中的數據量和信息查詢以及更進一步進行OLAP和數據挖掘的效果。通過粒度的劃分,決定了數據倉庫是采用單一粒度還是多重粒度,以及粒度的劃分層次。如果主題的數據量、信息量較多,對主題數據分析細化程度要求較高,就要采用多重粒度進行數據劃分,否則采用單一粒度進行劃分。
在會計報表數據倉庫設計中,由于企業(yè)集團會計報表系統(tǒng)主題的復雜性,根據用戶對數據倉庫應用的需求,我們采用多重粒度劃分的策略,用低粒度(細化到月)數據保存近期的會計報表及財務分析指標數據,對時間較遠的會計報表及財務分析指標數據只保存粒度較大(細化到年)數據。這樣既可以對財務近況進行細節(jié)分析,又可以利用粒度較大的數據對財務趨勢進行分析。
1.本模型適用于集團企業(yè)或行業(yè)主管部門,適合集團財務智能化決策的綜合應用。
2.本模型采用雪花型模型,傳統(tǒng)的星型設計更能適合集團企業(yè)組織架構和會計報表元素應用的復雜性。
3.本模型采用多事實表設計,事實表之間采用統(tǒng)一的內部企業(yè)編碼相關聯(lián),組成一個整體,這樣的設計,更清晰,將會計報表和財務分析指標同時納入數據倉庫,不但可以在數據倉庫中對傳統(tǒng)的財務分析方法進行研究,還可以直接通過數據挖掘直接研究會計報表各元素,從而為對傳統(tǒng)的財務分析方法進行突破打下基礎,更便于對行業(yè)會計報表數據倉庫的后續(xù)研究與應用。