朱碧琴
(湖南環(huán)境生物職業(yè)技術(shù)學(xué)院,湖南 衡陽 421005)
云計(jì)算技術(shù)已成為未來社會(huì)金融發(fā)展的必然趨勢(shì)[1]。隨著社會(huì)信息化水平的提高,Python 的數(shù)據(jù)分析與解讀功能已經(jīng)成為財(cái)務(wù)數(shù)據(jù)分析的有力支持,大部分企業(yè)都會(huì)使用Python 軟件,并對(duì)其進(jìn)行約束管理,以實(shí)現(xiàn)為財(cái)務(wù)分析提供商業(yè)支撐和數(shù)據(jù)管理的目的。對(duì)企業(yè)的發(fā)展而言,大數(shù)據(jù)已成為一個(gè)重要的研究方向,Python 作為一種可移植性和易讀性強(qiáng)的軟件具有明顯的優(yōu)勢(shì)[2]。Python 擁有豐富的第三方庫和工具,可以輕松地?cái)U(kuò)展功能和添加新的數(shù)據(jù)源。例如相關(guān)人員可以使用第三方API 或爬蟲程序來獲取更多的財(cái)務(wù)數(shù)據(jù),以支持更廣泛的財(cái)務(wù)分析需求[3]。從市場(chǎng)上的衍生品和大數(shù)據(jù)的角度來看,Python 可以與其他數(shù)據(jù)平臺(tái)實(shí)現(xiàn)無縫對(duì)接,提高財(cái)務(wù)報(bào)表的處理效率[4]。該文建設(shè)的框架通過搭建表示層、業(yè)務(wù)邏輯層及數(shù)據(jù)層進(jìn)行信息調(diào)度,對(duì)決策支持過程進(jìn)行優(yōu)化,得到最優(yōu)決策支持的特征量。金融數(shù)據(jù)的隨機(jī)性和復(fù)雜性比較突出,數(shù)據(jù)背后的規(guī)律較為復(fù)雜,基于Python 語言的財(cái)務(wù)分析框架能夠解決財(cái)務(wù)數(shù)據(jù)分析所面臨的巨大挑戰(zhàn)。Python 是高效的動(dòng)態(tài)語言,具備清晰的結(jié)構(gòu)及簡潔的語法,可為財(cái)務(wù)數(shù)據(jù)挖掘分析工作提供有力支持。
該系統(tǒng)的總體架構(gòu)分為表示層、業(yè)務(wù)層和數(shù)據(jù)層,由Django Web 框架和Django Admin 框架實(shí)現(xiàn)。根據(jù)系統(tǒng)功能需求和數(shù)據(jù)采集系統(tǒng)的架構(gòu)設(shè)計(jì),該文將系統(tǒng)劃分為5 個(gè)部分,即數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、系統(tǒng)登錄、后臺(tái)管理和數(shù)據(jù)可視化交互,而這5 個(gè)部分的內(nèi)容被總結(jié)成3 個(gè)具體的層級(jí),分別是數(shù)據(jù)層、業(yè)務(wù)邏輯層和表示層,這些層級(jí)有各自的工作模式及構(gòu)建組成,從而形成了一個(gè)完整的總體框架,以方便Python 語言對(duì)財(cái)務(wù)數(shù)據(jù)的分析及合理調(diào)度。因此,基于Python 語言的財(cái)務(wù)分析框架如圖1 所示。
圖1 財(cái)務(wù)分析總框架
業(yè)務(wù)邏輯層主要由Django 和Scrapy 框架組成[5]。Django Web 用于實(shí)現(xiàn)業(yè)務(wù)邏輯,從后臺(tái)獲取數(shù)據(jù),進(jìn)行統(tǒng)計(jì)分析,最終展示到前端。后臺(tái)的數(shù)據(jù)來自數(shù)據(jù)庫,可通過后臺(tái)數(shù)據(jù)管理請(qǐng)求進(jìn)行增刪改查。Scrapy 框架用于數(shù)據(jù)采集,包括URL 獲取、數(shù)據(jù)響應(yīng)內(nèi)容、數(shù)據(jù)提取、數(shù)據(jù)清洗和數(shù)據(jù)持久化等模塊功能。數(shù)據(jù)層主要將MySQL 作為傳統(tǒng)關(guān)系型數(shù)據(jù)庫,用于數(shù)據(jù)持久化。
表示層主要使用Python 語言對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行全面的采集和挖掘。使用“requests+BeautifulSoup+re”結(jié)構(gòu)實(shí)現(xiàn)采集,利用requests 庫自動(dòng)向HTML 網(wǎng)頁提交和爬行,通過BeautifulSoup 庫和re 規(guī)則表達(dá)式完成HTML 網(wǎng)頁解析和關(guān)鍵信息抽取。數(shù)據(jù)采集的具體流程如圖2 所示。
圖2 數(shù)據(jù)采集流程
為了在財(cái)務(wù)分析框架中實(shí)現(xiàn)數(shù)據(jù)挖掘和信息管理,需要建立大數(shù)據(jù)統(tǒng)計(jì)分析模型,并引入模糊相關(guān)約束方法以支持?jǐn)?shù)據(jù)優(yōu)化決策。還需要建立模糊數(shù)據(jù)參數(shù)模型,限制數(shù)據(jù)相關(guān)性,并引入關(guān)聯(lián)規(guī)則挖掘方法[6]。運(yùn)用統(tǒng)計(jì)分析方法,可以得到優(yōu)化決策支持的模糊函數(shù),優(yōu)化決策支持的約束指標(biāo)參數(shù)集為W,樣本集如公式(1)所示。式中:vi為離散點(diǎn)值為i時(shí)隸屬函數(shù)V的所在位置;Pq為離散點(diǎn)值為q時(shí)隸屬函數(shù)P的所在位置;m為挖掘模型中的離散閾值。
通過提取財(cái)務(wù)信息框架中的采集數(shù)據(jù)內(nèi)容,并結(jié)合模糊信息調(diào)度技術(shù)對(duì)決策支持過程進(jìn)行優(yōu)化,可以得到最優(yōu)決策支持的特征量。這樣一來便可充分挖掘數(shù)據(jù),獲取重要的信息內(nèi)容,并為相關(guān)人員對(duì)財(cái)務(wù)信息進(jìn)行深度分析提供便利。
在財(cái)務(wù)數(shù)據(jù)分析的初級(jí)階段,采用的常規(guī)工具是Excel,主要問題是Excel 技術(shù),例如Vlookup、數(shù)據(jù)透視表和跟蹤參考單元格等。然而,當(dāng)需要處理大量數(shù)據(jù)和復(fù)雜功能時(shí),使用Excel 往往會(huì)耗費(fèi)大量時(shí)間和精力,因此應(yīng)采用更復(fù)雜的金融模型和統(tǒng)計(jì)方法。隨著人工智能技術(shù)的創(chuàng)新和發(fā)展,Python 與金融領(lǐng)域的實(shí)際應(yīng)用相結(jié)合能讓財(cái)務(wù)分析者充分掌握數(shù)據(jù),并通過模塊化的方式構(gòu)建多維模型,幫助投資者做出正確的投資決策。在財(cái)務(wù)方面,Python 能夠通過企業(yè)數(shù)據(jù)對(duì)企業(yè)的經(jīng)營決策和需求進(jìn)行分析。模塊功能如圖3 所示。
圖3 數(shù)據(jù)分析功能模塊
Python 軟件是企業(yè)發(fā)展的關(guān)鍵支持,大部分公司對(duì)大數(shù)據(jù)模型的約束管理都是基于Python 進(jìn)行開發(fā)的。Python軟件不但是一種較好的業(yè)務(wù)支撐和數(shù)據(jù)管理工具,同時(shí)其運(yùn)行方式也相對(duì)簡單,易于掌握。Python 語言是一種可移植和易讀的語言,與其他語言軟件相比具有較大的優(yōu)越性。對(duì)企業(yè)財(cái)務(wù)資料進(jìn)行管理與分析時(shí),運(yùn)用以多元回歸分析法對(duì)企業(yè)進(jìn)行信息管理的信息庫模式和最優(yōu)決策的統(tǒng)計(jì)分析模式。在此基礎(chǔ)上,從最優(yōu)決策中抽取相關(guān)特征量,并利用模糊關(guān)聯(lián)特征檢測(cè)技術(shù)實(shí)現(xiàn)財(cái)務(wù)信息的分布。進(jìn)而提出基于信息融合模型的決策優(yōu)化方法,并將其與微分函數(shù)相結(jié)合,以求出適合度函數(shù),然后提出基于分布式信息編碼技術(shù)的分布式特征提取算法,并利用智能數(shù)據(jù)融合技術(shù)實(shí)現(xiàn)基于業(yè)務(wù)邏輯的優(yōu)化決策。Python 軟件在數(shù)據(jù)分析、數(shù)據(jù)集成等領(lǐng)域中扮演著舉足輕重的角色并且能夠與其他金融信息平臺(tái)進(jìn)行無縫對(duì)接。此外,Python 軟件還可以讓財(cái)務(wù)報(bào)表的圖形更加清楚,提高了數(shù)據(jù)的運(yùn)行和處理效率。
后臺(tái)管理針對(duì)管理員用戶進(jìn)行設(shè)計(jì),并通過數(shù)據(jù)采集和清洗模塊將數(shù)據(jù)進(jìn)行持久化存儲(chǔ)[7]。MySQL 數(shù)據(jù)庫用于數(shù)據(jù)層設(shè)計(jì),可實(shí)現(xiàn)后臺(tái)對(duì)財(cái)務(wù)數(shù)據(jù)的管理和維護(hù)操作[8]。正序和倒序排列可以快速查找財(cái)務(wù)數(shù)據(jù),同時(shí)還可以進(jìn)行用戶認(rèn)證和授權(quán)管理操作,包括對(duì)普通用戶授權(quán)和管理用戶資料等。系統(tǒng)以信息包的形式進(jìn)行交互,包括提交、存檔和分發(fā)信息包?;赑ython 語言的財(cái)務(wù)分析框架在長期保存過程中的數(shù)據(jù)流向如圖4 所示。
圖4 長期保存系統(tǒng)中的數(shù)據(jù)流向
從圖4 可以看出,在長時(shí)間保存系統(tǒng)中,數(shù)據(jù)提供者必須將會(huì)話初始協(xié)議(Session Initialization Protocol,SIP)引入數(shù)據(jù)攝入中,以保證長期保存系統(tǒng)能夠保存所攝入的財(cái)務(wù)數(shù)據(jù)內(nèi)容,并保證用戶或數(shù)據(jù)提交者能夠訪問、理解和使用保存的內(nèi)容。收到SIP 之后,該存儲(chǔ)系統(tǒng)會(huì)將其轉(zhuǎn)化為一套適合于數(shù)據(jù)存檔和數(shù)據(jù)管理的AIP,并對(duì)該AIP進(jìn)行歸類,確定各對(duì)象的歸屬。在AIP 存檔結(jié)束后,生成一條消息用于更新該集合的情況說明。數(shù)據(jù)歸檔函數(shù)實(shí)體接收由攝取過程產(chǎn)生的AIP,并將其加入長期保存系統(tǒng)的數(shù)據(jù)資料庫中。
為了避免技術(shù)、媒體、數(shù)據(jù)格式、數(shù)據(jù)類型以及用戶群等因素的影響,數(shù)據(jù)的歸檔和管理都要進(jìn)行媒體更新、糾錯(cuò)、數(shù)據(jù)庫維護(hù)等工作。數(shù)據(jù)管理功能要對(duì)數(shù)據(jù)攝取階段產(chǎn)生的數(shù)據(jù)庫進(jìn)行描述,并對(duì)已有數(shù)據(jù)采集后的信息進(jìn)行擴(kuò)充,以保持?jǐn)?shù)據(jù)的完整可靠。數(shù)據(jù)存取與數(shù)據(jù)管理互動(dòng),以回應(yīng)數(shù)據(jù)使用者的數(shù)據(jù)存取要求、互動(dòng)DIP 對(duì)應(yīng)的AIP 及相關(guān)資訊資料。資料存檔及資料管理在暫時(shí)儲(chǔ)存區(qū)中建立了一個(gè)要求物件的復(fù)本,數(shù)據(jù)存取將這套AIP 及相關(guān)封包說明轉(zhuǎn)變成一套DIP,并儲(chǔ)存在一個(gè)物理分布媒體上,供數(shù)據(jù)提交者使用。在此基礎(chǔ)上,該文建立了基于這種數(shù)據(jù)流向的長期存儲(chǔ)體系,能夠保證所存儲(chǔ)數(shù)據(jù)的完整性和可靠性,從而滿足用戶的需要。
為測(cè)試財(cái)務(wù)管理視角下基于Python 語言的財(cái)務(wù)分析框架是否有效,該文試驗(yàn)選擇的計(jì)算機(jī)需要具有良好的處理器和內(nèi)存足夠大的計(jì)算機(jī)系統(tǒng)。試驗(yàn)采用的計(jì)算機(jī)為AMD Ryzen 7 處理器,16GB 內(nèi)存,存儲(chǔ)器為512GB SSD。Python 可以在多種操作系統(tǒng)上運(yùn)行,例如Windows、Linux 和MacOS。試驗(yàn)系統(tǒng)為Windows 10 操作系統(tǒng)。使用Python 3.10.2 版本的CPython 解釋器進(jìn)行財(cái)務(wù)分析,系統(tǒng)可以使用pip 命令安裝最新版本的數(shù)據(jù)包。數(shù)據(jù)庫為MySQL 8.0,數(shù)據(jù)來源可以根據(jù)具體需求而定。使用雅虎財(cái)經(jīng)或谷歌財(cái)經(jīng)API 獲取市場(chǎng)數(shù)據(jù),使用爬蟲技術(shù)從財(cái)務(wù)報(bào)表和交易數(shù)據(jù)中提取數(shù)據(jù),并使用Visual Studio Code 編輯器來編寫和調(diào)試Python 代碼。所選用的工具均能提供豐富的功能和插件,可提高開發(fā)效率和代碼質(zhì)量,保證該文試驗(yàn)的質(zhì)量。
該文試驗(yàn)旨在基于Python 語言構(gòu)建一個(gè)財(cái)務(wù)分析框架,以分析某公司的財(cái)務(wù)狀況。具體步驟如下:使用Python 爬蟲從某財(cái)務(wù)數(shù)據(jù)網(wǎng)站獲取該公司的財(cái)務(wù)報(bào)表數(shù)據(jù),包括資產(chǎn)負(fù)債表、利潤表和現(xiàn)金流量表。使用Pandas 對(duì)數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換,去除無效數(shù)據(jù)和重復(fù)數(shù)據(jù),并將數(shù)據(jù)轉(zhuǎn)換為適合計(jì)算的格式。根據(jù)5 個(gè)月內(nèi)的財(cái)務(wù)報(bào)表數(shù)據(jù)總結(jié)該公司2022 年9 月~2023 年1 月的各項(xiàng)財(cái)務(wù)比率,包括資產(chǎn)負(fù)債率、流動(dòng)比率和營業(yè)利潤率等,具體見表1。
表1 試驗(yàn)結(jié)果
從表1 中可以看出該公司的財(cái)務(wù)狀況比較穩(wěn)定,各項(xiàng)財(cái)務(wù)比率在過去3 年中基本保持不變。其中,資產(chǎn)負(fù)債率在2022年10 月略有上升,但在2022 年12 月又回落至歷史最低水平;營業(yè)利潤率在過去保持穩(wěn)定,均在0.10%左右,總體利潤率在過去3 個(gè)月有所提高,在2023 年的1 月達(dá)到最高值。由此可見,構(gòu)建基于Python 語言的財(cái)務(wù)分析框架有利于管理者更加準(zhǔn)確高效地進(jìn)行企業(yè)內(nèi)部的財(cái)務(wù)管理,對(duì)企業(yè)經(jīng)濟(jì)涉及的各個(gè)方面均有幫助,不僅可以清晰呈現(xiàn)近幾個(gè)月的內(nèi)容,還可從本質(zhì)上解決財(cái)務(wù)問題。
綜上所述,隨著社會(huì)經(jīng)濟(jì)的發(fā)展和市場(chǎng)的日漸上行,企業(yè)如果得到大數(shù)據(jù)優(yōu)勢(shì)的支撐,便可在市場(chǎng)中占據(jù)領(lǐng)先地位,并能獲取更加有價(jià)值的財(cái)務(wù)信息,以此提高企業(yè)的財(cái)務(wù)管理能力。該文設(shè)計(jì)的框架通過搭建表示層、業(yè)務(wù)邏輯層及數(shù)據(jù)層進(jìn)行信息調(diào)度,對(duì)決策支持過程進(jìn)行優(yōu)化,得到最優(yōu)決策支持的特征量。數(shù)據(jù)層可以通過數(shù)據(jù)庫對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行管理、維護(hù)以及數(shù)據(jù)的長期保存和分發(fā)。該文在充分了解了Python 技術(shù)的基礎(chǔ)上,對(duì)所面臨的各種風(fēng)險(xiǎn)進(jìn)行評(píng)估,可促進(jìn)財(cái)務(wù)數(shù)據(jù)的有效挖掘與分析,并確保金融市場(chǎng)的健康、可持續(xù)發(fā)展。