周雅瑩 周文琪,2 郭瑤瑤 玉英碩
(1.韓國國立釜慶大學技術(shù)經(jīng)營專門大學院,韓國 釜山 48547;2.嘉興南湖學院商貿(mào)管理學院,浙江 嘉興 314001)
基于大數(shù)據(jù)技術(shù)的企業(yè)數(shù)字化智慧財務服務平臺建設研究旨在探索如何充分利用大數(shù)據(jù)技術(shù),構(gòu)建高效、智能的財務管理平臺,將其應用于企業(yè)的日常運營與決策過程中[1]。通過結(jié)合大數(shù)據(jù)分析、人工智能等先進技術(shù)手段,企業(yè)數(shù)字化智慧財務服務平臺能夠?qū)A控攧諗?shù)據(jù)進行智能挖掘、分析和預測,為企業(yè)提供全面的財務視圖和決策支持[2]。該研究充分考慮到實際需求和技術(shù)特點,重點關注了平臺的應用設計,通過對財務數(shù)據(jù)進行挖掘與分析,提取有價值的財務數(shù)據(jù),嚴格控制財務數(shù)據(jù)管理權(quán)限,設置財務數(shù)據(jù)監(jiān)控預警等功能,保證企業(yè)數(shù)字化智慧財務服務平臺構(gòu)建過程的有效性[3]。通過對比2 種存儲系統(tǒng)的協(xié)同處理效果,驗證了系統(tǒng)運行的有效性,通過設計基于大數(shù)據(jù)技術(shù)的企業(yè)數(shù)字化智慧財務服務平臺為財務系統(tǒng)后續(xù)的優(yōu)化提供參考。
基于大數(shù)據(jù)技術(shù)的企業(yè)數(shù)字化智慧財務服務平臺由數(shù)據(jù)服務層、應用層以及展示層構(gòu)成。平臺應用架構(gòu)設計如圖1所示。
圖1 基于大數(shù)據(jù)技術(shù)的企業(yè)數(shù)字化智慧財務服務平臺應用架構(gòu)設計
數(shù)據(jù)服務層是基于大數(shù)據(jù)技術(shù)的企業(yè)數(shù)字化智慧財務服務平臺建設的基礎,負責數(shù)據(jù)的采集、存儲、處理和管理[4]。在該層中,通過對數(shù)據(jù)進行讀取、操作及統(tǒng)計,以滿足企業(yè)大規(guī)模財務數(shù)據(jù)的處理和存儲需求。應用層是企業(yè)數(shù)字化智慧財務服務平臺的核心部分,該層基于數(shù)據(jù)服務層提供各種財務管理功能和分析工具。在該層中,能夠?qū)崿F(xiàn)權(quán)限控制、管理審計以及數(shù)據(jù)監(jiān)控等功能,并通過大數(shù)據(jù)技術(shù)實現(xiàn)高效率和智能化的應用處理[5]。設計展示層是為了方便用戶使用和交互,展示層通過可視化界面展示企業(yè)財務報表、圖表及分析結(jié)果等,便于用戶可以直接了解公司財務狀況,并對其進行可視化的數(shù)據(jù)分析。
為處理和存儲大規(guī)模的財務數(shù)據(jù),選擇了內(nèi)存為256GB DDR4 ECC RDIMM 的Dell EMC PowerEdge R740xd 高性能服務器,并配置8×1.92TB SAS SSD 作為存儲設備(采用RAID 配置),以滿足長期保存和高效訪問財務數(shù)據(jù)的需求。同時,應用Honeywell HIH6130-021-001 溫度傳感器對設備進行實時監(jiān)測,并通過連接無線網(wǎng)絡與平臺建立連接,采集企業(yè)的銷售額、成本和收入等財務數(shù)據(jù)。為建立穩(wěn)定可靠、高速傳輸?shù)木W(wǎng)絡環(huán)境,平臺還加裝了Cisco ISR 4000 Series 路由器、HP Aruba 2930M Series 交換機、Fortinet FortiGate 300E 防火墻等硬件設備,確保平臺能夠快速且安全地傳輸大規(guī)模財務數(shù)據(jù)。
使用API 接口對企業(yè)財務數(shù)據(jù)進行采集。在確定目標企業(yè)財務數(shù)據(jù)來源后,與數(shù)據(jù)提供方協(xié)商并獲得相應的訪問權(quán)限。根據(jù)API 接口的要求,導入所需的Java 庫,并發(fā)送HTTP 請求處理響應?;诖髷?shù)據(jù)技術(shù)的企業(yè)數(shù)字化智慧財務服務平臺財務數(shù)據(jù)挖掘及分析流程如圖2所示。
圖2 財務數(shù)據(jù)挖掘及分析流程圖
在確定目標企業(yè)財務數(shù)據(jù)的來源后,與數(shù)據(jù)提供方協(xié)商并獲得相應的訪問權(quán)限。通過詳細了解API 接口的文檔和規(guī)范,使用Java 編寫代碼實現(xiàn)向目標API 發(fā)送請求,并獲取響應數(shù)據(jù)。若采集的數(shù)據(jù)符合需求,則對接收到的財務數(shù)據(jù)進行清洗、轉(zhuǎn)換和整理,并將其存儲到存儲介質(zhì)中;若采集的數(shù)據(jù)不符合需求,則同步更新數(shù)據(jù)并記錄日志,直至異常情況消失即可完成任務。
為提取有效財務數(shù)據(jù),系統(tǒng)采用AdaBoost(Adaptive Boosting)集成學習算法,提高分類準確性[6]。在訓練過程中,每個弱分類器根據(jù)加權(quán)樣本集的錯誤率可確定自身的權(quán)重。同時,通過調(diào)整樣本權(quán)重,對錯分樣本能夠給予更高的關注度,對各弱分類器結(jié)果進行加權(quán)投票或平均,可生成最終的預測結(jié)果。在計算錯誤率的過程中,對于當前輪次的弱分類器,可計算其對應的分類錯誤率。錯誤率越低表示該弱分類器的性能越好。根據(jù)錯誤率可計算當前弱分類器在最終模型中所占的權(quán)重。錯誤率越低的弱分類器則具有更高的權(quán)重。當更新樣本權(quán)重時,根據(jù)當前輪次弱分類器對每個樣本是否被正確分類進行更新。被錯誤分類的樣本會被賦予更高的權(quán)重,以便在下一輪訓練中得到更多關注。最終的強分類器預測公式如公式(1)所示。
式中:Δ為預測結(jié)果;ai和hi(x)分別為第i個基本分類器的權(quán)重和預測結(jié)果。sign函數(shù)用于將結(jié)果轉(zhuǎn)化為二分類輸出。使用測試數(shù)據(jù)集評估訓練好的AdaBoost 模型在財務數(shù)據(jù)提取任務上的性能,可以使用準確率、召回率、F1 分數(shù)等指標進行評估。在驗證模型達到預期性能后,將訓練好的AdaBoost模型部署到實際使用場景中,可提取具體的財務數(shù)據(jù)。
根據(jù)不同角色的職責和需要,企業(yè)數(shù)字化智慧財務服務平臺須劃分用戶群體并定義相應權(quán)限[7]。系統(tǒng)用戶角色包括高級管理人員、財務部門員工以及審計人員等。系統(tǒng)遵循最小權(quán)限原則,每個用戶只被授予完成其工作所需的最低權(quán)限級別,以減少潛在風險[8]。企業(yè)數(shù)字化智慧財務服務平臺數(shù)據(jù)權(quán)限控制流程如圖3所示。
圖3 數(shù)據(jù)權(quán)限控制流程圖
基于最小權(quán)限原則,可以采取以下措施進一步實現(xiàn)。首先,對于不同的角色或用戶,定義相應的權(quán)限級別。其次,為每個角色分配特定的權(quán)限,確保每個角色只被授予完成其工作所需的最低權(quán)限級別。根據(jù)不同的角色和權(quán)限級別,建立訪問控制規(guī)則,以限制用戶對不同數(shù)據(jù)和操作的訪問能力。當分配用戶特定權(quán)限時,可以通過使用繼承機制,確保用戶繼承其角色所擁有的權(quán)限。最后,在確定最小權(quán)限的同時,可以引入負責人授權(quán)機制,在某些特定情況下,具備更高級別操作權(quán)限的用戶可對其進行授權(quán)確認。
根據(jù)企業(yè)財務具體業(yè)務需求,設定利潤率、現(xiàn)金流以及營業(yè)收入等一系列關鍵指標以及相應的預警閾值,用于監(jiān)控財務情況[9]。設定指標及閾值數(shù)據(jù)見表1。
表1 企業(yè)財務數(shù)據(jù)監(jiān)控預警閾值范圍
以上閾值為系統(tǒng)初始設定值,財務專業(yè)人員和管理層可根據(jù)實際情況定期對以上數(shù)據(jù)進行評估,并與相關部門共同制定合適的預警閾值。系統(tǒng)預警流程如圖4所示。
圖4 企業(yè)財務數(shù)據(jù)監(jiān)控預警實現(xiàn)流程圖
待數(shù)據(jù)清洗后,根據(jù)企業(yè)需求和具體業(yè)務情況,設定關鍵指標及其對應的預警閾值。系統(tǒng)對經(jīng)過預處理的數(shù)據(jù)進行實時監(jiān)控,與設定的指標和閾值進行比較,判斷當前數(shù)據(jù)是否觸發(fā)設定的預警閾值。如果達到或超過預警閾值,則觸發(fā)預警判斷。如果沒有超出閾值范圍,則直接記錄監(jiān)控報告。根據(jù)觸發(fā)的預警條件,系統(tǒng)將自動發(fā)送預警通知給企業(yè)財務管理人員,企業(yè)財務管理人員可以通過短信、郵件、手機應用等方式獲取通知信息。接收到財務預警通知以后,企業(yè)財務相關管理人員應針對問題進行及時地處理和反饋,進一步調(diào)查和分析企業(yè)具體財務情況,并采取適當措施以應對問題。
在測試環(huán)境的配置中,數(shù)據(jù)庫服務器采用Dell PowerEdge R740xd 用于承載數(shù)據(jù)庫服務并提供高性能和可靠性;本地編譯器采用JetBrains IntelliJ IDEA對Java進行開發(fā)和編譯,以提高開發(fā)效率和代碼質(zhì)量。Java 版本為Java SE 6,其具備基本的Java 編程功能和API 庫支持;系統(tǒng)使用的服務器發(fā)行版本為Windows Server 2016,其作為Microsoft 發(fā)布的服務器操作系統(tǒng),能夠提供豐富的功能和工具支持,適用于構(gòu)建和管理企業(yè)級應用和服務。在測試過程中,選擇了S 企業(yè)真實的局域網(wǎng)環(huán)境進行測試,為確保本次測試對企業(yè)的利益不造成任何負面影響,因此在測試中經(jīng)過匿名化和脫敏處理,確保不泄露該企業(yè)任何相關的敏感信息。
為驗證系統(tǒng)的實際應用效果,筆者對傳統(tǒng)的EMC VNX5200 存儲系統(tǒng)和采用的數(shù)據(jù)庫服務器Dell PowerEdge R740xd 進行對比。在測試過程中,選擇word count 任務作為測試數(shù)據(jù),并對數(shù)據(jù)進行了統(tǒng)一處理,其中,總數(shù)據(jù)量為5GB,格式為Homelib 文件格式。在測試過程中,兩種存儲形式均以120Mb/s 的速度進行接入,并采用相同的C2G (Cables to Go)收發(fā)裝置進行測試。通過對比兩種存儲系統(tǒng)的協(xié)同處理效果,可評估現(xiàn)有裝置在識別率方面的表現(xiàn)情況,識別率如公式(2)所示。
式中:γ為Dell EMC PowerEdge R740xd 存儲系統(tǒng)在存儲數(shù)據(jù)時的識別率,即能夠正確識別數(shù)據(jù)性質(zhì)的概率;si為存儲系統(tǒng)第i次存儲過程中,能夠正確識別的數(shù)據(jù)量;N為系統(tǒng)需要進行存儲期間的財務信息數(shù)據(jù)總量。
根據(jù)公式(2),計算2 組存儲系統(tǒng)的識別率并記錄結(jié)果,見表2。
表2 識別率測試結(jié)果對比記錄
由表2 可知,測試組的識別率均在99%以上,而傳統(tǒng)組的平均識別率為64.98%。因此,從平均值角度來看,測試組比傳統(tǒng)組表現(xiàn)更好。觀察每個數(shù)據(jù)點上測試組和傳統(tǒng)組的識別率,發(fā)現(xiàn)測試組在每個測試次數(shù)上的識別率都明顯高于傳統(tǒng)組。表明在測試過程中,測試組在處理任務時具有更高的準確性和可靠性。
通過構(gòu)建智慧財務服務平臺,企業(yè)可以從海量財務數(shù)據(jù)中挖掘有價值的信息,實現(xiàn)更準確、及時的財務分析和預測。有助于提升企業(yè)對經(jīng)營狀況和風險的把握能力,為決策者提供更可靠的依據(jù),并推動企業(yè)在競爭激烈的市場中取得優(yōu)勢。通過設計平臺應用架構(gòu)測試存儲系統(tǒng)的識別率。然而,該研究仍存在一定的局限性,對于平臺設計的財務報警閾值及評估方式受限于特定領域。因此,企業(yè)在實際應用中,需要考慮具體需求,對數(shù)據(jù)進行整理。未來可以進一步對財務數(shù)據(jù)分析、人工智能應用和用戶體驗等方面進行深化,不斷提升平臺性能,為企業(yè)提供更智能化、高效的財務服務,實現(xiàn)企業(yè)數(shù)字化轉(zhuǎn)型的目標。