摘要:為提高財務數(shù)據(jù)處理的自動化水平,本文設計了一種基于RPA技術的財務機器人業(yè)務數(shù)據(jù)自動化分類系統(tǒng)。該系統(tǒng)在收集財務數(shù)據(jù)后,根據(jù)分類規(guī)則進行自動化分類,并將結(jié)果存儲于數(shù)據(jù)庫中。分類規(guī)則基于財務數(shù)值、文本和業(yè)務邏輯構(gòu)成,并采用RPA技術進行參數(shù)設置,執(zhí)行邏輯編寫。數(shù)據(jù)建模使用Apriori算法挖掘數(shù)據(jù)模式,生成關聯(lián)規(guī)則,并直接應用于財務機器人的數(shù)據(jù)自動化分類系統(tǒng)中。經(jīng)測試,基于RPA技術的財務機器人數(shù)據(jù)自動化分類系統(tǒng)在高并發(fā)環(huán)境下的穩(wěn)定性良好,能夠滿足大規(guī)模數(shù)據(jù)分類的需求。
關鍵詞:RPA技術;財務機器人;數(shù)據(jù)自動化;分類系統(tǒng)設計
中圖分類號:F273""""""""" 文獻標志碼:A
隨著信息技術飛速發(fā)展,企業(yè)對財務數(shù)據(jù)處理的自動化和智能化需求日益增長。為提高財務數(shù)據(jù)的處理效率和準確性,本文設計了一種基于機器人流程自動化(Robotic Process Automation,RPA)技術的財務機器人數(shù)據(jù)自動化分類系統(tǒng)。該系統(tǒng)利用RPA技術,可實現(xiàn)財務數(shù)據(jù)的自動收集、清洗和轉(zhuǎn)換,并采用Apriori算法挖掘數(shù)據(jù)模式,生成關聯(lián)規(guī)則,從而實現(xiàn)財務數(shù)據(jù)的自動化分類。此外,除了對財務機器人數(shù)據(jù)自動化分類系統(tǒng)進流程、數(shù)據(jù)建模、應用與監(jiān)控等方法進行設計外,還對多個用戶同時向財務機器人輸入數(shù)據(jù)后的情況進行了測試分析。測試結(jié)果表明,基于RPA技術的財務機器人數(shù)據(jù)自動化分類系統(tǒng)在高并發(fā)環(huán)境下的穩(wěn)定性良好,能夠滿足大規(guī)模數(shù)據(jù)分類的需求。本文基于RPA的財務機器人數(shù)據(jù)自動化分類系統(tǒng)旨在推動企業(yè)財務管理現(xiàn)代化進程,提升企業(yè)的核心競爭力。
1流程設置
1.1數(shù)據(jù)處理
設計該系統(tǒng)時,首要任務是對財務數(shù)據(jù)進行處理。機器人會應用RPA技術自動收集、清洗和轉(zhuǎn)換各種類型的財務數(shù)據(jù),確保數(shù)據(jù)的完整性和準確性[1]。基于RPA技術的財務機器人數(shù)據(jù)自動化分類流程如圖1所示。
在確保機器人有權(quán)限訪問并連接財務數(shù)據(jù)源的情況下,機器人能夠應用RPA技術自動從會計軟件、銀行對賬單、發(fā)票、工資單等多個財務數(shù)據(jù)源中收集數(shù)據(jù),并對數(shù)據(jù)進行清洗,以消除重復、不完整、不準確或無關數(shù)據(jù)。去除重復記錄、填補缺失值、糾正錯誤和標準化數(shù)據(jù)格式后,將清洗的數(shù)據(jù)轉(zhuǎn)換為適合分類的格式。采用RPA編譯將數(shù)據(jù)轉(zhuǎn)換為適合機器學習模型的格式。轉(zhuǎn)換后,財務機器人可對數(shù)據(jù)信息進行驗證,以確保其完整性和準確性。再將不同來源的數(shù)據(jù)集成到一個統(tǒng)一的數(shù)據(jù)集中,處理數(shù)據(jù)源間的沖突和重復問題,并將數(shù)據(jù)存儲到數(shù)據(jù)庫中,以支持后續(xù)的數(shù)據(jù)分析。
1.2設置分類規(guī)則
在基于RPA技術的財務機器人業(yè)務數(shù)據(jù)自動化分類系統(tǒng)中,處理規(guī)則是保證數(shù)據(jù)正確分類的關鍵[2]。RPA數(shù)據(jù)自動化分類系統(tǒng)處理規(guī)則流程如圖2所示。
在基于RPA技術的財務機器人業(yè)務數(shù)據(jù)自動化分類系統(tǒng)中,明確財務數(shù)據(jù)分類的需求和目標可識別出具體的分類規(guī)則[3]。分類規(guī)則由具體財務數(shù)值、財務發(fā)票文本、財政年度以及其他業(yè)務邏輯構(gòu)成。設置參數(shù)時,需要根據(jù)定義好的規(guī)則編寫具體的執(zhí)行邏輯,并為每個規(guī)則設置相應的參數(shù)。參數(shù)設定為固定值——金額、變量——日期以及外部源數(shù)據(jù)——市場利率。設計數(shù)據(jù)驗證流程可保證輸入數(shù)據(jù)符合預設格式標準。對于不符合要求的數(shù)據(jù),需要記錄異常、觸發(fā)警報,并對其進行異常處理。確定規(guī)則并驗證數(shù)據(jù)后,財務機器人數(shù)據(jù)自動化分類系統(tǒng)將設計自動化分類流程,使用循環(huán)結(jié)構(gòu)遍歷所有數(shù)據(jù)并應用分類規(guī)則。最后根據(jù)配置結(jié)果輸出報告,生成詳細財務數(shù)據(jù)信息,并根據(jù)報告結(jié)果進行反饋循環(huán),以持續(xù)優(yōu)化、調(diào)整分類規(guī)則,滿足企業(yè)的財務數(shù)據(jù)分類需求。
2數(shù)據(jù)建模
2.1Apriori算法挖掘
在基于RPA的財務機器人數(shù)據(jù)自動化分類系統(tǒng)中,Apriori算法有助于識別數(shù)據(jù)中的模式和關聯(lián),從而輔助生成分類規(guī)則[4]。掃描數(shù)據(jù)集,并統(tǒng)計每個項的支持度計數(shù),可生成頻繁1-項集?;陬l繁k-1項集,可連接產(chǎn)生候選k-項集。對候選k-項集進行剪枝,即可去除不滿足最小支持度要求的候選項。計算每個候選項集在數(shù)據(jù)集中出現(xiàn)的支持度,可識別出頻繁項集,即在數(shù)據(jù)集中經(jīng)常出現(xiàn)的物品組合。支持度計算過程如公式(1)所示。
(1)
式中:x為一個物品或物品組合,即要計算支持度的項集;Sx為物品x的支持度,即物品x在所有交易中出現(xiàn)的概率;Tc為所含物品x的交易數(shù),即數(shù)據(jù)集中所含物品x的交易數(shù)量;Tt為總交易數(shù),即數(shù)據(jù)集中的總交易數(shù)量。
得到支持度后,根據(jù)最小支持度閾值篩選出頻繁k-項集,作為下一輪迭代的基礎,并重復進行連接、剪枝、計算支持度和篩選頻繁項集的步驟,直到無法生成新的頻繁k-項集為止。最后,基于挖掘到的頻繁項集生成關聯(lián)規(guī)則,并計算置信度等指標。置信度指標計算過程如公式(2)所示。
(2)
式中:(x→y)為關聯(lián)規(guī)則,其中x是規(guī)則的前提部分,y是規(guī)則的結(jié)論部分,表示在購買物品x的情況下也購買物品y;S(x,y)為同時含有物品x和y的交易數(shù),即數(shù)據(jù)集中同時含有物品x和y的交易數(shù)量;S(x)為物品x的支持度,即物品x在所有交易中出現(xiàn)的概率,在此處可用于計算購買物品x時也購買物品y的概率;Cd(x→y)為關聯(lián)規(guī)則的置信度,即在購買物品x時也購買物品y的概率,該值可衡量關聯(lián)規(guī)則的強度和可靠性。
置信度指標可評估關聯(lián)規(guī)則中前提部分與結(jié)論部分間的相關性。高置信度表明在前提條件下出現(xiàn)結(jié)論的概率較高,規(guī)則更可靠。
2.2生成關聯(lián)規(guī)則
關聯(lián)規(guī)則可由頻繁項集推導得出[5]。根據(jù)最小支持度和最小置信度閾值,從頻繁項集中選擇具有較高支持度和置信度的項集,將其作為關聯(lián)規(guī)則的候選項。對于每一個頻繁項集,生成所有可能的關聯(lián)規(guī)則。假設頻繁項集為{A,B,C},可以生成的關聯(lián)規(guī)則包括A≥B,C;B≥AC;C≥A,B;A≥B;A≥C;B≥A;B≥C;C≥A;C≥B。計算生成的每個關聯(lián)規(guī)則的置信度。如果置信度大于等于最小置信度閾值,則將該關聯(lián)規(guī)則保存下來。對于每個保存下來的關聯(lián)規(guī)則,根據(jù)規(guī)則的前置條件和結(jié)論部分進行規(guī)則命名和描述。如規(guī)則A≥B中,C可以命名為“購買A通常伴隨購買B和C”,并對其進行解釋和注釋,以便于后續(xù)理解使用。根據(jù)增加或減少頻繁項集的選擇調(diào)整最小支持度和最小置信度閾值,以獲得更符合實際需求的關聯(lián)規(guī)則。最后將生成的關聯(lián)規(guī)則應用于財務機器人的數(shù)據(jù)自動化分類系統(tǒng)中,輔助分類規(guī)則的生成和優(yōu)化。
3應用與監(jiān)控
3.1關聯(lián)規(guī)則應用
在應用過程中,利用生成的關聯(lián)規(guī)則幫助財務機器人更好地理解數(shù)據(jù)并進行自動化分類,從而提高分類系統(tǒng)的準確性、效率和智能化水平[6]。同時,計算余弦相似度可衡量2個向量間的相似程度,進而在關聯(lián)規(guī)則挖掘中評估規(guī)則間的相似性,以更好地理解數(shù)據(jù)間的關系和模式。余弦相似度是指將2個向量在空間中進行投影并計算二者間夾角的余弦值來衡量其相似程度。分子表示2個向量間的內(nèi)積,分母表示各自長度的乘積。對于任意2條關聯(lián)規(guī)則對應的向量,余弦相似度計算過程如公式(3)所示。
(3)
式中:x和y分別為2條關聯(lián)規(guī)則對應的向量;xi和yi分別為2個向量在第i個維度上的取值;Σi xi. yi為2個向量x和y中對應維度值的乘積之和,此部分計算了2個向量在每個
維度上的相似程度為2個向量各自每個維度值的平方和開根號后的乘積,此部分計算了2個向量在每個維度上的長度。
余弦相似度值范圍為[-1,1],其中1為完全相同,-1為完全不同,0為無相關性。計算余弦相似度,比較不同規(guī)則間的方向關系,從而更好地理解數(shù)據(jù)間的關系和模式。
3.2性能監(jiān)控
在完成財務數(shù)據(jù)的自動化分類流程和關聯(lián)規(guī)則的生成后,為了確保系統(tǒng)的穩(wěn)定性、準確性并適應可能的變化,需要對系統(tǒng)進行性能監(jiān)控與調(diào)優(yōu)。首先,應持續(xù)監(jiān)控數(shù)據(jù)清洗的質(zhì)量,確保數(shù)據(jù)的準確性和完整性。通過抽樣檢查或全量檢查相結(jié)合的方式,可驗證數(shù)據(jù)質(zhì)量。其次,采用交叉驗證測試來評估分類系統(tǒng)的準確率。將財務數(shù)據(jù)中的原始數(shù)據(jù)集劃分為訓練集和測試集,并使用訓練集數(shù)據(jù)訓練分類模型。將訓練集數(shù)據(jù)劃分為K個等份,每次保留一個份作為測試集,其余(K-1)份作為訓練集,重復k次,得到k個模型評估結(jié)果。最后,統(tǒng)計每次交叉驗證的分類結(jié)果,計算分類系統(tǒng)的準確率。分類系統(tǒng)的準確率計算過程如公式(4)所示。
×100%(4)
式中:Ac為準確率;Cs為模型正確預測的樣本數(shù)量;Ts為總的測試樣本數(shù)量。
將k次交叉驗證的準確率取平均值,即可得到最終準確率評估結(jié)果,計算過程如公式(5)所示。
Acyi(5)
式中:Fa為最終準確率;k為交叉驗證的折數(shù),表示數(shù)據(jù)集被劃分為子集進行驗證的子集數(shù)量;Acyi為在第i折驗證所得的準確率。
在交叉驗證過程中,對每一次驗證得到的準確率進行求和,并取平均值作為最終的準確率評估指標,由此可以綜合考慮所有折的表現(xiàn),更全面地評估分類系統(tǒng)的性能。
4測試評估
4.1測試準備
基于RPA技術的財務機器人業(yè)務數(shù)據(jù)自動化分類系統(tǒng)的集成測試以Windows Server2019為操作系統(tǒng),部署Intel Core i7-10700KF處理器,以滿足系統(tǒng)快速處理大量財務數(shù)據(jù)的基礎需求。同時,采用Corsair Vengeance LPX16GB(2×8GB)、DDR43200MHz內(nèi)存,以便系統(tǒng)能夠同時處理多個任務和數(shù)據(jù)集,并便于機器人與不同的財務系統(tǒng)快速進行數(shù)據(jù)交換。服務器還設置有Intel X550-AT210GbE SFP+Network Interface Card網(wǎng)絡接口。建立高速穩(wěn)定的網(wǎng)絡環(huán)境,以確保機器人可以無障礙地在不同系統(tǒng)間傳輸數(shù)據(jù)。完成測試環(huán)境搭建后,根據(jù)功能測試驗證財務機器人在高并發(fā)情況下的數(shù)據(jù)收集性能。模擬多個用戶同時向數(shù)據(jù)源輸入數(shù)據(jù),并運行數(shù)據(jù)收集任務,測量收集任務的響應時間和系統(tǒng)資源占用情況,從而驗證系統(tǒng)在高并發(fā)情況下能否保持性能的穩(wěn)定性。
4.2測試結(jié)果
為驗證基于RPA技術的財務機器人數(shù)據(jù)自動化分類系統(tǒng)在高并發(fā)情況下的數(shù)據(jù)收集性能,模擬多個用戶同時向數(shù)據(jù)源輸入數(shù)據(jù),并運行數(shù)據(jù)收集任務,系統(tǒng)響應時間和資源占用情況見表1。
經(jīng)測試,隨著用戶數(shù)增加,系統(tǒng)響應時間基本保持在2s左右,表明系統(tǒng)在高并發(fā)情況下仍能保持較快的數(shù)據(jù)收集速度。TC-6(60個用戶)的響應時間為2.5s,略高于其他測試用例,但仍然在可接受范圍內(nèi)。另外,CPU利用率隨著用戶數(shù)增加而逐漸上升,但利用率始終保持在60%以下,證明CPU資源沒有達到滿載,仍有余力處理更多的任務。同時,內(nèi)存利用率同樣隨著用戶數(shù)增加而上升,但總體保持在55%~63%,表明內(nèi)存利用率的增加幅度也相對平穩(wěn),系統(tǒng)內(nèi)存管理得當,表明基于RPA技術的財務機器人數(shù)據(jù)自動化分類系統(tǒng)在高并發(fā)環(huán)境下的穩(wěn)定性良好,能夠滿足大規(guī)模數(shù)據(jù)分類需求。
5結(jié)語
基于RPA技術的財務機器人數(shù)據(jù)自動化分類系統(tǒng)為企業(yè)提供了一種高效、準確的財務數(shù)據(jù)處理解決方案,有助于提升企業(yè)的財務管理水平和核心競爭力。設計了基于RPA技術的財務機器人數(shù)據(jù)自動化分類系統(tǒng),可實現(xiàn)財務數(shù)據(jù)處理的自動化和智能化,有效提高企業(yè)財務數(shù)據(jù)處理的效率和準確性。利用RPA技術,可實現(xiàn)財務數(shù)據(jù)的自動收集、清洗、轉(zhuǎn)換和分類功能,采用Apriori算法挖掘數(shù)據(jù)模式并生成關聯(lián)規(guī)則,可滿足大規(guī)模數(shù)據(jù)分類的需求。經(jīng)測試,在高并發(fā)環(huán)境下,系統(tǒng)表現(xiàn)穩(wěn)定,響應迅速,并且資源利用率在可接受范圍內(nèi)。表明基于RPA技術的財務機器人數(shù)據(jù)自動化分類系統(tǒng)具備處理大量財務數(shù)據(jù)和快速交換數(shù)據(jù)的能力,可用于企業(yè)日常財務數(shù)據(jù)處理、分析和報告。
參考文獻
[1]彭雪妍. 基于財務數(shù)字化轉(zhuǎn)型背景下的國企集團司庫管理體系建設路徑探析[J]. 國際商務財會,2023(23):49-52.
[2]徐強艷,李璐涵. 數(shù)字化轉(zhuǎn)型背景下RPA財務機器人在中小型企業(yè)財務管理中的應用探究[J]. 老字號品牌營銷,2023
(23):98-100.
[3]黃月薪,陳兵,王耀東,等. 機器人流程自動化技術驅(qū)動科技期刊數(shù)字化創(chuàng)新發(fā)展的應用路徑——出版流程轉(zhuǎn)型升級視角[J]. 科技管理研究,2023,43(23):241-246.
[4]張曉瑋,劉波,戈姍姍,等. 基于人工智能的財務管理創(chuàng)新——財務機器人在XH醫(yī)院的應用[J]. 財會月刊,2022
(23):119-126.
[5]黃成慶,董文宇. 基于RPA技術的醫(yī)院醫(yī)療收入核算流程優(yōu)化研究——以FY醫(yī)院為例[J]. 會計之友,2022(16):40-46.
[6]張媛. 基于RPA技術的財務機器人業(yè)務數(shù)據(jù)自動化分類系統(tǒng)[J]. 自動化與儀器儀表,2022(1):168-171.