亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于最鄰近算法的財(cái)政數(shù)據(jù)異常值實(shí)時(shí)監(jiān)測(cè)方法研究

        2025-07-01 00:00:00殷曼曼
        數(shù)字通信世界 2025年4期
        關(guān)鍵詞:實(shí)驗(yàn)方法

        中圖分類號(hào):TP393 文獻(xiàn)標(biāo)志碼:A

        文章編碼:1672-7274(2025)04-0013-04

        Abstract: The existing real-time monitoring methods for abnormal values in financial data have low accuracy and high 1 alarmrates,which leads to inaccurate monitoring of abnormal values in financial data and has certain limitations.This article proposes a real-time monitoring method for financial data outliers basedon nearest neighbor algorithm.Firstly,bycalculatingthelocaldensityandminimumdistance,selectingtheRBFkernelfunction,areal-time monitoring modelfor financial dataoutliers is established basedontheclustering results.Secondly,the intensityratio ofthesetreference windowand investigation window iscalculated to extract abnormal paterns in fiscal data.Finally, based on the elbow rule curve and follwing acertain process,the monitoring task of abnormal values in financial data is completed.The experimentalresultsshowedthatusing thereal-time monitoring methodforfinancialdataoutliers basedon the nearest neighbor algorithm,the monitoring accuracy was over 95% ,and its average 1alarm rate was 3.21%

        Keywords: local density; nearest neighbor algorithm; RBF kernel function; intensity ratio; elbow rule

        在財(cái)政數(shù)據(jù)管理中如何準(zhǔn)確、高效地識(shí)別和處理異常值成為保障數(shù)據(jù)質(zhì)量[1]、預(yù)防財(cái)務(wù)風(fēng)險(xiǎn)中亟待解決的問(wèn)題。

        現(xiàn)在應(yīng)用最多的孤立森林方法是首先對(duì)異常點(diǎn)特征進(jìn)行定義處理,使這些異常點(diǎn)作為離群點(diǎn)被孤立。由于其具有分布稀疏、距離較遠(yuǎn)等特點(diǎn),因而正常數(shù)據(jù)點(diǎn)不會(huì)落在該離群區(qū)域內(nèi)。在此基礎(chǔ)上,對(duì)相應(yīng)特征值和分割值進(jìn)行隨機(jī)選擇,從而孤立出這些異常點(diǎn)。但該方法的操作技術(shù)較復(fù)雜。

        針對(duì)上述情況,本文提出基于最鄰近算法的財(cái)政數(shù)據(jù)異常值實(shí)時(shí)監(jiān)測(cè)方法。該方法綜合該算法的原理和特性,結(jié)合財(cái)政數(shù)據(jù)的具體特點(diǎn),通過(guò)目標(biāo)搜索、樣本之間的相似性度量和異常得分進(jìn)行建模,從而減少監(jiān)測(cè)計(jì)算量,這種方法更為高效、準(zhǔn)確。

        財(cái)政數(shù)據(jù)異常值實(shí)時(shí)監(jiān)測(cè)方法

        1.1建立財(cái)政數(shù)據(jù)異常值實(shí)時(shí)監(jiān)測(cè)模型

        通過(guò)計(jì)算異常數(shù)據(jù)的分布函數(shù),得到相應(yīng)異常

        數(shù)據(jù)分布范圍,再通過(guò)概率密度函數(shù)計(jì)算相應(yīng)閾值范圍,實(shí)現(xiàn)對(duì)財(cái)政數(shù)據(jù)異常值狀態(tài)的實(shí)時(shí)監(jiān)測(cè),其分布公式為

        式中, s 代表異常數(shù)據(jù)變量數(shù)值; ε 代表位置參數(shù)數(shù)值; β 代表尺度參數(shù)數(shù)值; α 代表形狀參數(shù)數(shù)值。

        對(duì)式(1)計(jì)算結(jié)果進(jìn)行數(shù)據(jù)聚類處理,發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和分布狀態(tài)2。首先對(duì)各數(shù)據(jù)點(diǎn)的局部密度和最小距離進(jìn)行計(jì)算,計(jì)算公式為

        式中, ρi 代表所求數(shù)據(jù)點(diǎn)的局部密度值; j 代表所有數(shù)據(jù)點(diǎn)的索引編號(hào); ? 代表所求數(shù)據(jù)點(diǎn)的索引編號(hào); dij 代表i和j數(shù)據(jù)點(diǎn)之間的距離; dc 代表用于控制局部密度計(jì)算范圍的截?cái)嗑嚯x。

        式中, δi 代表所求數(shù)據(jù)點(diǎn)的最小距離; ρj 代表數(shù)據(jù)點(diǎn)j 的局部密度; minj 代表對(duì)所有滿足條件的 j 取最小值。同時(shí),所得局部密度和最小距離選擇相應(yīng)聚類中心,并將其他數(shù)據(jù)點(diǎn)分配到最近的聚類中心位置。然后選擇RBF核函數(shù),利用DPC聚類結(jié)果輔助SVM模型進(jìn)行異常檢測(cè)。通過(guò)參數(shù)自適應(yīng)度對(duì)模型性能進(jìn)行優(yōu)化,選擇最優(yōu)懲罰參數(shù)和RBF核的gamma參數(shù)[3],通過(guò)交叉驗(yàn)證評(píng)估模型性能,其中SVM的決策函數(shù)為

        式中, αi 為支持向量的系數(shù); yi 為數(shù)據(jù)集中每個(gè)點(diǎn)的標(biāo)簽; K(xi,x) 為兩個(gè)數(shù)據(jù)點(diǎn)之間的相似度或距離; b 為決策函數(shù)的偏置項(xiàng)。財(cái)政數(shù)據(jù)異常值實(shí)時(shí)監(jiān)測(cè)模型如圖1所示。

        圖1財(cái)政數(shù)據(jù)異常值實(shí)時(shí)監(jiān)測(cè)模型圖

        1.2提取財(cái)政數(shù)據(jù)異常模式

        在大量財(cái)政數(shù)據(jù)中將一段數(shù)據(jù)流進(jìn)行截取,得到相應(yīng)的考察窗口,利用其進(jìn)行數(shù)據(jù)的監(jiān)測(cè)。多選擇一個(gè)窗口作為對(duì)比參考窗口,對(duì)兩個(gè)參考窗口進(jìn)行強(qiáng)度比率計(jì)算和判斷[3],其計(jì)算公式為

        式中, picount 表示選擇的時(shí)序模式的支持度;

        p? count表示模型中按照時(shí)序模式的支持度; n 表示時(shí)序模式數(shù)量; W 表示窗口; freqW(p) 表示 p 在 W 中時(shí)序模式支持度。將兩個(gè)參考窗口設(shè)置為RSW和RFW,計(jì)算其強(qiáng)度比率[4,其計(jì)算過(guò)程為

        設(shè)置其閾值范圍為 [ls,hs] ,從而得出財(cái)政數(shù)據(jù)庫(kù)的異常模式判定的條件,其計(jì)算公式為

        fRSW?RFW(p)?ls|fRSW?RFW(p)?hs

        通過(guò)上述過(guò)程,使參考窗口RSW與RFW均呈現(xiàn)滿足其異常模式判定的條件的狀態(tài),從而提取相應(yīng)數(shù)值,達(dá)到對(duì)財(cái)政數(shù)據(jù)異常模式提取的目的。

        1.3實(shí)現(xiàn)財(cái)政數(shù)據(jù)異常值監(jiān)測(cè)任務(wù)

        通過(guò)上述過(guò)程,實(shí)現(xiàn)財(cái)政數(shù)據(jù)異常值的檢測(cè),在此基礎(chǔ)上,完成監(jiān)測(cè)任務(wù)?;谧钹徑惴ǖ谋O(jiān)測(cè)方法是通過(guò)不斷學(xué)習(xí)的過(guò)程,將異常值特征關(guān)聯(lián)性較強(qiáng)的數(shù)據(jù)向同一簇中進(jìn)行劃分,其監(jiān)測(cè)流程如圖2所示。

        圖2財(cái)政數(shù)據(jù)異常值識(shí)別流程圖

        對(duì)該模型通過(guò)結(jié)構(gòu)突變和粗差曲線的不同特征對(duì)財(cái)政數(shù)據(jù)異常值進(jìn)行識(shí)別和監(jiān)測(cè)。對(duì)于每個(gè)數(shù)據(jù)點(diǎn),計(jì)算它與其他所有數(shù)據(jù)點(diǎn)的距離,其計(jì)算公式為

        圖2中最鄰近算法所用肘部法則曲線[5如圖3所示。

        2 實(shí)驗(yàn)論證分析

        為驗(yàn)證本文方法是否可以應(yīng)用于實(shí)際操作中,筆者對(duì)其進(jìn)行實(shí)驗(yàn),并與常用K-均值聚類異常值監(jiān)測(cè)方法、Z-ScoreX異常值監(jiān)測(cè)方法進(jìn)行對(duì)比。本實(shí)驗(yàn)通過(guò)在財(cái)政數(shù)據(jù)庫(kù)中隨機(jī)抽取2000個(gè)、3500個(gè)和5000個(gè)數(shù)據(jù),組成三個(gè)數(shù)據(jù)集。

        圖3最鄰近算法曲線肘部法則

        通過(guò)上述實(shí)驗(yàn),可以驗(yàn)證監(jiān)測(cè)方法的識(shí)別準(zhǔn)確度,在此基礎(chǔ)上,選擇數(shù)據(jù)集2,將數(shù)據(jù)集中異常數(shù)值剔除,并隨機(jī)剔除一定數(shù)量的非異常數(shù)值,再通過(guò)人工干預(yù)增加數(shù)據(jù)庫(kù)異常值。保證數(shù)據(jù)庫(kù)總數(shù)為3500個(gè)。使用三種方法對(duì)該數(shù)據(jù)集進(jìn)行監(jiān)測(cè),監(jiān)測(cè)的數(shù)據(jù)集數(shù)量由500開(kāi)始向上增加,得出不同數(shù)量數(shù)據(jù)時(shí)所識(shí)別到的異常數(shù)據(jù)值數(shù)量,從而計(jì)算其誤報(bào)率。

        2.1實(shí)驗(yàn)數(shù)據(jù)采集

        本實(shí)驗(yàn)采用的計(jì)算機(jī)型號(hào)為AMDRyzen9,內(nèi)存為DDR38GB,256GB機(jī)械硬盤(pán)。本實(shí)驗(yàn)所使用的軟件工具參數(shù)如表1所示。

        表1實(shí)驗(yàn)軟件工具參數(shù)表

        2.2實(shí)驗(yàn)結(jié)果分析

        本實(shí)驗(yàn)對(duì)選取的三個(gè)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),通過(guò)三種方法對(duì)其異常值進(jìn)行監(jiān)測(cè),計(jì)算其識(shí)別準(zhǔn)確率。識(shí)別準(zhǔn)確率可以衡量監(jiān)測(cè)方法正確識(shí)別異常值的能力,其數(shù)值越高證明該方法的實(shí)用性越強(qiáng)。異常值識(shí)別準(zhǔn)確率數(shù)值如圖4所示。

        圖4異常值識(shí)別準(zhǔn)確率對(duì)比圖

        由圖4可知,三種方法在對(duì)三個(gè)數(shù)據(jù)集進(jìn)行監(jiān)測(cè)中,其準(zhǔn)確率均在 70% 以上,本文研究方法識(shí)別準(zhǔn)確率在三種方法中數(shù)值最高。在對(duì)三個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)時(shí),本文方法準(zhǔn)確率比其他兩種方法多 10% 以上,且其準(zhǔn)確率始終保持在 95% 以上。結(jié)果證明,本文方法在對(duì)財(cái)政數(shù)據(jù)異常值進(jìn)行監(jiān)測(cè)過(guò)程中,可以準(zhǔn)確識(shí)別異常值。

        將異常值數(shù)量與經(jīng)過(guò)三種方法所得出的異常值數(shù)量做差。其差值就是異常值的誤報(bào)數(shù)量,從而得出三種方法對(duì)異常值的判斷是否準(zhǔn)確。異常值誤報(bào)數(shù)量的變化程度如圖5所示。

        圖5異常值誤報(bào)數(shù)量變化圖

        由圖5數(shù)據(jù)可知,隨著數(shù)據(jù)集數(shù)量的增加,三種方法識(shí)別的異常值誤報(bào)數(shù)量也呈現(xiàn)增加趨勢(shì),本文方法平均誤報(bào)率為 3.21% ,而Z-ScoreX異常值監(jiān)測(cè)方法平均誤報(bào)率達(dá)到 8.43% ,孤立森林異常值監(jiān)測(cè)方法平均誤報(bào)率達(dá)到 13.42% ,因此,本文方法誤報(bào)率較低。該實(shí)驗(yàn)結(jié)果證明,本文方法在數(shù)據(jù)不斷增加情況下,可以保證較低的誤報(bào)率,其監(jiān)測(cè)結(jié)果比較準(zhǔn)確。

        3 結(jié)束語(yǔ)

        綜上所述,基于最鄰近算法的財(cái)政數(shù)據(jù)異常值實(shí)時(shí)監(jiān)測(cè)方法,實(shí)用價(jià)值較高,可以對(duì)財(cái)政數(shù)據(jù)庫(kù)異常值進(jìn)行準(zhǔn)確地識(shí)別和判斷。該方法通過(guò)計(jì)算數(shù)據(jù)點(diǎn)之間的距離或相似度來(lái)識(shí)別異常值,具有靈活性、準(zhǔn)確性和實(shí)時(shí)性等優(yōu)點(diǎn)。在未來(lái)研究中,需要進(jìn)一步對(duì)算法優(yōu)化和計(jì)算速率進(jìn)行研究,從而進(jìn)一步提升基于最鄰近算法的財(cái)政數(shù)據(jù)異常值實(shí)時(shí)監(jiān)測(cè)方法的性能和準(zhǔn)確性,使其更好地應(yīng)用于財(cái)政數(shù)據(jù)監(jiān)測(cè)中。

        參考文獻(xiàn)

        [1]張伴.基于隨機(jī)森林算法的財(cái)務(wù)異常數(shù)據(jù)監(jiān)測(cè)方法研究[J].佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版),2024,42(12):48-51.

        [2]周偉,牛譽(yù)蓉.基于K-近鄰與FOA改進(jìn)聚類的數(shù)據(jù)異常分析模型及用電行為分析[J].成都工業(yè)學(xué)院學(xué)報(bào),2024,27(5):11-16.

        [3]馮馳,張五八,劉修福,等.基于物聯(lián)網(wǎng)技術(shù)的電力調(diào)度數(shù)據(jù)異常監(jiān)測(cè)方法研究[J].自動(dòng)化技術(shù)與應(yīng)用,2024,43(8):129-132.

        [4]侯立,王健.改進(jìn)密度峰值聚類的多源數(shù)據(jù)異常值檢測(cè)算法[J].計(jì)算機(jī)仿真,2024,41(6):565-569.

        [5]張譯,魏永瑜,馬燕,等.基于最鄰近算法的數(shù)據(jù)中臺(tái)內(nèi)生性數(shù)據(jù)安全交互系統(tǒng)[J].電子設(shè)計(jì)工程,2024,32(8):121-124,129.

        猜你喜歡
        實(shí)驗(yàn)方法
        記一次有趣的實(shí)驗(yàn)
        微型實(shí)驗(yàn)里看“燃燒”
        做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
        學(xué)習(xí)方法
        可能是方法不對(duì)
        NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
        實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
        太空探索(2016年5期)2016-07-12 15:17:55
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        亚洲av无码一区二区三区人| 日韩免费一区二区三区在线| 国产高级黄区18勿进一区二区| 欧洲乱码伦视频免费| 伊人婷婷综合缴情亚洲五月| 视频在线观看国产自拍 | 日本看片一区二区三区| 人妻少妇精品视频一区二区三区l| 蜜臀av午夜一区二区三区| 日本少妇被黑人xxxxx| 视频一区精品自拍| 亚洲国产精品一区二区第一 | 成年女人免费v片| 欧美艳星nikki激情办公室| 亚洲日韩精品A∨片无码加勒比| 青青草免费激情自拍视频| 狠狠久久av一区二区三区| 久久99热国产精品综合| 18禁成人黄网站免费观看| 亚洲欧洲∨国产一区二区三区| 丁香婷婷色| 日韩激情视频一区在线观看| 国产极品视觉盛宴| 六月丁香婷婷色狠狠久久| 亚洲色偷拍一区二区三区| 精品一区二区三区女同免费 | 国产成人精品2021| 国产精品亚洲日韩欧美色窝窝色欲| 女同性恋精品一区二区三区| 国产一区二区资源在线观看| 色欲网天天无码av| 国产精品 视频一区 二区三区 | 亚洲av无码成人精品区在线观看| 久久精品—区二区三区无码伊人色 | 在线天堂av一区二区| 亚洲午夜久久久久久久久电影网| 国产真实乱人偷精品人妻| 人妻少妇av中文字幕乱码免费 | 日本久久伊人特级黄色| 青青草原精品99久久精品66| 亚洲欧美久久婷婷爱综合一区天堂|