班妙璇
摘?要:隨著大數(shù)據(jù)時(shí)代到來(lái),企業(yè)每天面臨海量數(shù)據(jù),如何從海量數(shù)據(jù)中篩選出有價(jià)值的財(cái)務(wù)數(shù)據(jù),并對(duì)其進(jìn)行針對(duì)性的篩選分析,最終得出有效的分析預(yù)測(cè)結(jié)果以支持企業(yè)運(yùn)營(yíng)決策成為財(cái)務(wù)部門(mén)的重點(diǎn)工作。此背景下,Python成為新型財(cái)務(wù)數(shù)據(jù)分析工具的首選,它語(yǔ)法簡(jiǎn)潔清晰,可以高效的進(jìn)行財(cái)務(wù)數(shù)據(jù)挖掘、清洗和分析,實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)自動(dòng)化和可視化。本文以Python技術(shù)為視角,研究其在財(cái)務(wù)數(shù)據(jù)分析中的具體應(yīng)用,對(duì)于優(yōu)化和提升企業(yè)財(cái)務(wù)分析能力有一定的借鑒作用。
關(guān)鍵詞:Python;財(cái)務(wù)數(shù)據(jù)分析;大數(shù)據(jù)
中圖分類號(hào):F27?????文獻(xiàn)標(biāo)識(shí)碼:A??????doi:10.19311/j.cnki.16723198.2023.12.020
0?引言
信息技術(shù)加速經(jīng)濟(jì)快速發(fā)展,同時(shí)使得各種經(jīng)濟(jì)數(shù)據(jù)呈幾何倍數(shù)增長(zhǎng),當(dāng)今社會(huì)迎來(lái)了數(shù)據(jù)大爆炸時(shí)代。而數(shù)據(jù)已然成為國(guó)家基礎(chǔ)戰(zhàn)略性資源,大數(shù)據(jù)正日益對(duì)全球生產(chǎn)、流通、分配、消費(fèi)活動(dòng)以及經(jīng)濟(jì)運(yùn)行機(jī)制和國(guó)家治理能力等產(chǎn)生重要影響。從企業(yè)財(cái)務(wù)層面來(lái)看,企業(yè)從各種渠道獲取的財(cái)務(wù)信息日漸繁雜,如何從大量未經(jīng)處理的數(shù)據(jù)中篩選出有用信息,并有效利用數(shù)據(jù)信息指導(dǎo)和提升企業(yè)運(yùn)營(yíng)效果已經(jīng)成為財(cái)務(wù)部門(mén)的重點(diǎn)工作。在眾多的數(shù)據(jù)分析工具中,Python包含了豐富而強(qiáng)大的標(biāo)準(zhǔn)庫(kù)和第三方庫(kù),能夠輕松完成財(cái)務(wù)數(shù)據(jù)挖掘、清洗,實(shí)現(xiàn)數(shù)據(jù)可視化和自動(dòng)化等功能;最為關(guān)鍵的一點(diǎn)在于Python的語(yǔ)法簡(jiǎn)潔、清晰,實(shí)現(xiàn)了無(wú)計(jì)算機(jī)背景的財(cái)務(wù)人員通過(guò)培訓(xùn)也能輕松掌握該編程語(yǔ)言的應(yīng)用,因此Python正被越來(lái)越多的應(yīng)用于財(cái)務(wù)領(lǐng)域。
1?Python在企業(yè)財(cái)務(wù)數(shù)據(jù)分析中應(yīng)用的優(yōu)勢(shì)
1.1?在處理海量數(shù)據(jù)、進(jìn)行復(fù)雜邏輯運(yùn)算方面,Python效率遠(yuǎn)高于傳統(tǒng)財(cái)務(wù)分析工具Excel
過(guò)去,對(duì)于專業(yè)的財(cái)務(wù)人員來(lái)說(shuō)Excel是必備的財(cái)務(wù)工具,可以方便實(shí)現(xiàn)數(shù)據(jù)計(jì)算和數(shù)據(jù)可視化。但Excel只適用于數(shù)據(jù)量不大、數(shù)據(jù)以數(shù)值為主,且較為簡(jiǎn)單的邏輯計(jì)算的數(shù)據(jù)處理。隨著大數(shù)據(jù)時(shí)代的到來(lái),每天海量數(shù)據(jù)紛至沓來(lái),我們需要更為強(qiáng)大的數(shù)據(jù)處理工具來(lái)進(jìn)行數(shù)據(jù)處理。Python可以對(duì)多張報(bào)表靈活切換、分組、聚合、索引和排序,并且能嵌套使用各種函數(shù),還可以通過(guò)pandas接收各種類型數(shù)據(jù),并快速進(jìn)行數(shù)據(jù)操作、實(shí)現(xiàn)數(shù)據(jù)聚合和透視,具有靈活的時(shí)間序列功能等。
1.2?Python可以輕松實(shí)現(xiàn)自動(dòng)化
運(yùn)用Python可以輕松實(shí)現(xiàn)對(duì)Excel、word、PPT、PDF的批量操作。例如運(yùn)用Python可以方便的處理Excel表格數(shù)據(jù),對(duì)表格數(shù)據(jù)進(jìn)行讀取、寫(xiě)入、批量修改格式等。同時(shí),在財(cái)務(wù)工作中我們要經(jīng)常寫(xiě)一些工作總結(jié)和分析報(bào)告等,通過(guò)Python可以對(duì)word和PPT文檔進(jìn)行批量讀寫(xiě)和生成。隨著電子發(fā)票的普及,很多企業(yè)都會(huì)涉及通過(guò)電子郵件收取發(fā)票,倘若每日發(fā)票傳送量較大,財(cái)務(wù)人員可以通過(guò)編輯Python代碼可以實(shí)現(xiàn)自動(dòng)化收取,省去大量重復(fù)的日常工作,提升工作效率。
此外,Python中的數(shù)據(jù)操作和數(shù)據(jù)分析代碼還可以保存為腳本,自動(dòng)處理重復(fù)性任務(wù)。當(dāng)財(cái)務(wù)人員寫(xiě)好一個(gè)Python腳本后,可以將其用于所有相似的Excel文檔的處理。
1.3?Python可以方便實(shí)現(xiàn)數(shù)據(jù)可視化
Python在數(shù)據(jù)可視化圖表展示方面非常靈活。數(shù)據(jù)可視化的重要作用在于通過(guò)圖表和圖形方式將數(shù)據(jù)信息以更為直觀的方式呈現(xiàn)給決策者和數(shù)據(jù)使用者,讓數(shù)據(jù)使用者能更快速準(zhǔn)確的讀取數(shù)據(jù)內(nèi)的核心信息,以進(jìn)行有效決策。Python工具在數(shù)據(jù)可視化方面有很多功能強(qiáng)大的庫(kù),比如Pyecharts。與Excel等軟件自帶現(xiàn)成的數(shù)據(jù)可視化功能相比,其最大好處在于更靈活、能更好地適應(yīng)個(gè)性化、特殊化需求。Python的其他庫(kù),如plotly和D3可以將數(shù)據(jù)可視化作成交互式圖表和圖形,這些圖表和圖形比Excel自帶的圖表和圖形更具創(chuàng)意和視覺(jué)效果。
1.4?運(yùn)用Python可以靈活創(chuàng)建個(gè)性化財(cái)務(wù)模型,進(jìn)行分析預(yù)測(cè)
雖然在傳統(tǒng)財(cái)務(wù)應(yīng)用中,Excel也可以創(chuàng)建部分財(cái)務(wù)模型,進(jìn)行財(cái)務(wù)分析、決策和預(yù)測(cè)的工作。但是Excel的財(cái)務(wù)模型數(shù)量有限,而且對(duì)于比較復(fù)雜的模型構(gòu)建是沒(méi)有辦法實(shí)現(xiàn)的。Python正好可以彌補(bǔ)傳統(tǒng)財(cái)務(wù)分析軟件的不足,首先Python是一門(mén)編程語(yǔ)言,可以根據(jù)財(cái)務(wù)工作需要構(gòu)建多數(shù)據(jù)、多維度復(fù)雜的財(cái)務(wù)分析預(yù)測(cè)模型,提高分析的精準(zhǔn)度以滿足日益激烈的市場(chǎng)競(jìng)爭(zhēng)。其次,Python的強(qiáng)大之處還在可以直接使用人工智能和機(jī)器學(xué)習(xí)的庫(kù),生成對(duì)應(yīng)的分析和預(yù)測(cè)模型,這是傳統(tǒng)財(cái)務(wù)分析軟件難以企及的方面。
2?Python在企業(yè)財(cái)務(wù)數(shù)據(jù)分析中應(yīng)用現(xiàn)狀和面臨的難點(diǎn)分析
2.1?Python在企業(yè)財(cái)務(wù)數(shù)據(jù)分析中應(yīng)用現(xiàn)狀
筆者通過(guò)問(wèn)卷調(diào)查、微信QQ訪談等方式調(diào)查了廣西區(qū)內(nèi)數(shù)十家各類型企業(yè)(包括大型國(guó)企、外資、中小民營(yíng)、小微企業(yè)等),發(fā)現(xiàn)在廣西區(qū)內(nèi)全方面應(yīng)用Python進(jìn)行財(cái)務(wù)分析決策的企業(yè)幾乎沒(méi)有,僅有極少部分企業(yè)內(nèi)部的個(gè)別財(cái)務(wù)人員自學(xué)Python后運(yùn)用該軟件進(jìn)行財(cái)務(wù)工作的改進(jìn),如編寫(xiě)Python代碼實(shí)現(xiàn)電子電子發(fā)票的自動(dòng)收取以代替人工下載;通過(guò)Python進(jìn)行多報(bào)表數(shù)據(jù)的聚合、篩選和排序,自動(dòng)生成新的目標(biāo)報(bào)表等。由此看來(lái),Python在財(cái)務(wù)領(lǐng)域的實(shí)際應(yīng)用還很少,更多的應(yīng)用在于提高工作效率的財(cái)務(wù)輔助功能,而Python的核心功能——進(jìn)行有效的財(cái)務(wù)決策和預(yù)測(cè)并未得到有效利用。
2.2?Python在企業(yè)財(cái)務(wù)數(shù)據(jù)分析中應(yīng)用面臨的難點(diǎn)和原因
通過(guò)Python在財(cái)務(wù)領(lǐng)域應(yīng)用現(xiàn)狀調(diào)查得知其應(yīng)用范圍和應(yīng)用的深度及廣度都是非常有限的,深入挖掘其應(yīng)用中面臨的難點(diǎn)和原因,主要有以下幾點(diǎn)。
2.2.1?Python學(xué)習(xí)難度大,掌握Python應(yīng)用技能的財(cái)務(wù)人員嚴(yán)重缺乏
我們都知道人才是第一生產(chǎn)力,目前財(cái)務(wù)領(lǐng)域的現(xiàn)狀是大量財(cái)務(wù)人員習(xí)慣了傳統(tǒng)的用友、金蝶等財(cái)務(wù)軟件,而不愿意跳出舒適圈學(xué)習(xí)的新的財(cái)務(wù)技能。另一方面,Python屬于編程語(yǔ)言,雖然相對(duì)于其他編程語(yǔ)言來(lái)說(shuō)更簡(jiǎn)潔、易懂,但是也要求很高的邏輯思維能力,對(duì)于非計(jì)算機(jī)背景的人員而言還是存在較大的挑戰(zhàn),因此導(dǎo)致很多財(cái)務(wù)人員因畏難情緒而不愿意主動(dòng)學(xué)習(xí)。缺乏掌握Python技能的財(cái)務(wù)人員自然沒(méi)辦法令該技術(shù)在財(cái)務(wù)領(lǐng)域中普及應(yīng)用。
2.2.2?政府、會(huì)計(jì)行業(yè)和企業(yè)層面缺乏對(duì)于Python在財(cái)務(wù)應(yīng)用的引導(dǎo)規(guī)劃和支持
目前雖然Python培訓(xùn)在社會(huì)中掀起一輪又一輪的熱潮,但更多的是培訓(xùn)機(jī)構(gòu)自我吆喝的買(mǎi)賣。Python在財(cái)會(huì)領(lǐng)域中應(yīng)用的研究和培訓(xùn)更多也是局限于高校和培訓(xùn)機(jī)構(gòu),而沒(méi)有實(shí)實(shí)在在深入企業(yè)領(lǐng)域進(jìn)行實(shí)際應(yīng)用。從政府層面和會(huì)計(jì)協(xié)會(huì)來(lái)看,在Python應(yīng)用方面也沒(méi)有有效的引導(dǎo)和支持,使得該應(yīng)用難以得到有效的普及推廣。而企業(yè)層面更傾向于用現(xiàn)有財(cái)務(wù)軟件自帶的分析工具,對(duì)新鮮事物關(guān)注度不足。因此下一步要想使得該軟件能實(shí)際應(yīng)用于企業(yè)財(cái)務(wù)分析決策,必須加強(qiáng)校企合作,掌握該技術(shù)的高校科研人員深入企業(yè)一線,將該技術(shù)實(shí)際應(yīng)用于企業(yè)財(cái)務(wù)決策,并取得良好的實(shí)踐效果才有助于該軟件的推廣應(yīng)用。
3?Python在企業(yè)財(cái)務(wù)數(shù)據(jù)分析中的應(yīng)用過(guò)程
3.1?數(shù)據(jù)導(dǎo)入
數(shù)據(jù)導(dǎo)入是財(cái)務(wù)數(shù)據(jù)分析的第一步,在進(jìn)行數(shù)據(jù)導(dǎo)入之前,需先將數(shù)據(jù)分析中最常用的工具包Numpy、Pandas、Matplotlib等先導(dǎo)入Python。Numpy是Python生態(tài)系統(tǒng)中數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和科學(xué)計(jì)算的主力軍,它可以實(shí)現(xiàn)對(duì)數(shù)組的數(shù)學(xué)運(yùn)算、邏輯判斷、排序、篩選、統(tǒng)計(jì)運(yùn)算等功能。Pandas可以接收各種數(shù)據(jù)類型——從csv文件和文本文件到Excel文件、SQL數(shù)據(jù)庫(kù)等,能快速進(jìn)行數(shù)據(jù)聚合和透視等操作。Matplotlib主要是應(yīng)用于圖表繪制,幫助實(shí)現(xiàn)數(shù)據(jù)可視化。在數(shù)據(jù)導(dǎo)入環(huán)節(jié),我們根據(jù)不同的數(shù)據(jù)特征選擇工具包,如果是數(shù)組,則選擇Numpy;若是其他數(shù)據(jù)類型則選擇Pandas。
3.2?數(shù)據(jù)提取
在數(shù)據(jù)分析工作中,我們要分析的數(shù)據(jù)可能包含大量的缺失值、大量噪聲,或者因?yàn)殇浫脲e(cuò)誤導(dǎo)致異常點(diǎn)存在,這樣就需用到數(shù)據(jù)清洗。所謂數(shù)據(jù)清洗是對(duì)各種“臟”數(shù)據(jù)進(jìn)行對(duì)應(yīng)的方式處理,得到標(biāo)準(zhǔn)、干凈的、連續(xù)的數(shù)據(jù),供統(tǒng)計(jì)分析使用。在進(jìn)行數(shù)據(jù)清洗提取過(guò)程中,常用到的工具包是Pandas,Pandas內(nèi)置的map(?)函數(shù)、apply(?)函數(shù)、applymap(?)等函數(shù)可以實(shí)現(xiàn)提取功能。
3.3?數(shù)據(jù)整理
數(shù)據(jù)整理主要是指數(shù)據(jù)的連接與合并,以及分組聚合。在利用Python處理財(cái)務(wù)數(shù)據(jù)時(shí),我們根據(jù)實(shí)際情況可能需要將多個(gè)報(bào)表合并或者連接在一起分析數(shù)據(jù),這時(shí)候可以通過(guò)Pandas的聚合函數(shù)如mean(?)、sum(?)、count(?)等函數(shù)實(shí)現(xiàn)。分組聚合主要是利用Pandas自帶的pivot_table(?)函數(shù)實(shí)現(xiàn)數(shù)據(jù)從長(zhǎng)表改成寬表。通過(guò)數(shù)據(jù)整理功能可以更好的篩選出有效數(shù)據(jù)。
3.4?數(shù)據(jù)轉(zhuǎn)換,模型選擇
這個(gè)階段是數(shù)據(jù)分析中實(shí)現(xiàn)財(cái)務(wù)分析預(yù)測(cè)的關(guān)鍵步驟,在這個(gè)階段我們要選擇合適的數(shù)學(xué)模型來(lái)完成數(shù)據(jù)轉(zhuǎn)換。在進(jìn)行模型選擇之前我們可以先導(dǎo)入Scikit-learn工具包,它包含了豐富的回歸和聚類算法,包括我們進(jìn)行財(cái)務(wù)預(yù)測(cè)銷售收入最常用到的一元回歸或者多元回歸模型;經(jīng)常用于財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的隨機(jī)森林模型等。在這個(gè)階段,我們可以通過(guò)選擇合適的模型公式或者自己構(gòu)建個(gè)性化的模型公式來(lái)實(shí)現(xiàn)對(duì)原始數(shù)據(jù)的轉(zhuǎn)換。
3.5?利用模型得出分析/預(yù)測(cè)值
在這一階段,我們通過(guò)合適的數(shù)學(xué)公式或者財(cái)務(wù)模型計(jì)算出最終的財(cái)務(wù)預(yù)測(cè)值。在這個(gè)階段,我們還需要根據(jù)市場(chǎng)的實(shí)際情況調(diào)整公式模型,以保證最后的結(jié)果盡可能準(zhǔn)確,對(duì)于企業(yè)運(yùn)營(yíng)管理和決策起到有效指導(dǎo)作用。
3.6?數(shù)據(jù)可視化
最后通過(guò)Python提供的Matplotlib工具包可以方便的創(chuàng)建可視化圖,常用的有折線圖、散點(diǎn)圖、直方圖和條形圖等??梢暬晥D用于補(bǔ)充描述分析預(yù)測(cè)結(jié)果,可以直觀的將數(shù)據(jù)變化趨勢(shì),不同組數(shù)據(jù)之間的關(guān)系表現(xiàn)出來(lái),方便信息使用者讀取和利用。
4?結(jié)束語(yǔ)
隨著大數(shù)據(jù)時(shí)代的飛速發(fā)展,Python在企業(yè)財(cái)務(wù)數(shù)據(jù)分析中的作用不容忽視,特別是海量數(shù)據(jù)充斥的背景下,財(cái)務(wù)人員善用Python可以更深入挖掘有價(jià)值的數(shù)據(jù),并對(duì)其進(jìn)行深入分析,不僅提高工作效率,更重要的是可以分析出數(shù)據(jù)背后隱含的相關(guān)關(guān)系,為企業(yè)經(jīng)營(yíng)決策提供有力支持。
參考文獻(xiàn)
[1]張文惠,張巖瑾.財(cái)務(wù)大數(shù)據(jù)基礎(chǔ)[M].立信會(huì)計(jì)出版社,2022年7月.
[2]李苗.Python在財(cái)務(wù)大數(shù)據(jù)中的應(yīng)用[J].今日財(cái)富(中國(guó)知識(shí)產(chǎn)權(quán)),2021,(11):115117.
[3]肖穎.Python在財(cái)務(wù)數(shù)據(jù)挖掘和分析中的應(yīng)用[J].今日財(cái)富,2021,(22):142144.
[4]黃文.數(shù)據(jù)在財(cái)務(wù)管理中的應(yīng)用研究:以Python技術(shù)為例[J].今日財(cái)富,2021,(14):117118.