亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        兩階段的近鄰密度投票模擬離群點(diǎn)檢測(cè)算法

        2023-10-26 08:48:38鄭忠龍劉華文
        關(guān)鍵詞:檢測(cè)方法

        鄭忠龍, 曾 心, 劉華文

        (1.浙江師范大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,浙江 金華 321004;2.紹興文理學(xué)院 計(jì)算機(jī)系,浙江 紹興 312000)

        離群點(diǎn)檢測(cè)是指從給定數(shù)據(jù)中找出或發(fā)現(xiàn)那些與其他數(shù)據(jù)存在明顯差異的數(shù)據(jù)的技術(shù)[1]。由于能夠帶來(lái)諸多潛在價(jià)值,離群點(diǎn)檢測(cè)在現(xiàn)實(shí)各領(lǐng)域有著廣泛應(yīng)用,如信用卡欺詐檢測(cè)[2]、網(wǎng)絡(luò)安全入侵檢測(cè)[3]、安全系統(tǒng)故障檢測(cè)[4]以及對(duì)敵人活動(dòng)的軍事監(jiān)視[5]等。

        近年來(lái),學(xué)者們提出了許多離群點(diǎn)檢測(cè)算法,其中以基于近鄰的檢測(cè)方法應(yīng)用較廣。該方法主要依據(jù)數(shù)據(jù)的近鄰信息,判斷其是否屬于離群點(diǎn)。由于具有較強(qiáng)的可解釋性和直觀(guān)性,基于近鄰的離群點(diǎn)檢測(cè)是目前應(yīng)用最為廣泛的離群點(diǎn)檢測(cè)方法之一。根據(jù)近鄰信息的表示方式不同,基于近鄰的離群點(diǎn)檢測(cè)可細(xì)分為基于距離的方法和基于密度的方法?;诮従嚯x的方法更關(guān)注全局離群點(diǎn),而基于近鄰密度的方法既能關(guān)注到全局離群點(diǎn),也能有效發(fā)現(xiàn)局部離群點(diǎn)[6]。

        為更好地表達(dá)現(xiàn)實(shí)生活中個(gè)體之間的復(fù)雜關(guān)系,并發(fā)現(xiàn)其中的結(jié)構(gòu)團(tuán)體,通常將社會(huì)關(guān)系描述成復(fù)雜網(wǎng)絡(luò)或圖的形式,其中每個(gè)節(jié)點(diǎn)代表一個(gè)實(shí)體,而節(jié)點(diǎn)之間的邊則表示為實(shí)體之間的社會(huì)連接關(guān)系。社區(qū)發(fā)現(xiàn)是指社會(huì)網(wǎng)絡(luò)從中發(fā)現(xiàn)那些緊密關(guān)系的節(jié)點(diǎn)的集合[7]。社區(qū)發(fā)現(xiàn)在現(xiàn)實(shí)生活中有著廣泛應(yīng)用,如在社交網(wǎng)絡(luò)中挖掘具有共同興趣或相似社會(huì)背景的群體進(jìn)行內(nèi)容推送[8];建立傳染病網(wǎng)絡(luò)動(dòng)態(tài)模型,預(yù)測(cè)疫情發(fā)展趨勢(shì)。

        本文旨在利用社區(qū)發(fā)現(xiàn)中的消息傳遞機(jī)制,度量數(shù)據(jù)的密度信息,進(jìn)而發(fā)掘數(shù)據(jù)中的離群點(diǎn)。傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法通過(guò)信息傳遞在復(fù)雜網(wǎng)絡(luò)中交互信息,根據(jù)信息量?jī)?yōu)先識(shí)別最具影響力的節(jié)點(diǎn)。這與離群點(diǎn)檢測(cè)原理一致,事實(shí)上,離群數(shù)據(jù)通常與大部分正常數(shù)據(jù)存在顯著差異。因此,位于網(wǎng)絡(luò)邊緣、且對(duì)周邊節(jié)點(diǎn)的影響力越小的節(jié)點(diǎn),被認(rèn)為是離群點(diǎn)的可能性越大?;谶@種思想,本文提出了一種兩階段的近鄰密度投票離群點(diǎn)檢測(cè)算法。

        本文主要?jiǎng)?chuàng)新點(diǎn)如下:①利用社區(qū)發(fā)現(xiàn)中節(jié)點(diǎn)之間的消息傳遞機(jī)制產(chǎn)生的影響力,提出了一種新的基于近鄰關(guān)系的投票離群點(diǎn)檢測(cè)算法;②采用隨機(jī)游走技術(shù),計(jì)算節(jié)點(diǎn)及其近鄰的密度,以反映節(jié)點(diǎn)的重要程度;③節(jié)點(diǎn)之間的信息交互只在近鄰內(nèi)部發(fā)生,從而降低了計(jì)算量,使得投票決策更具有可解釋性,相比于全局范圍內(nèi)的投票決策節(jié)省了運(yùn)算時(shí)間和空間。

        1 相關(guān)工作

        基于密度的離群點(diǎn)檢測(cè)算法核心思想是根據(jù)數(shù)據(jù)對(duì)象給出的某種合理閾值,形成每個(gè)數(shù)據(jù)點(diǎn)的鄰域范圍,若數(shù)據(jù)點(diǎn)遠(yuǎn)離各鄰域,則將該數(shù)據(jù)點(diǎn)視為離群點(diǎn)。近鄰密度方法對(duì)數(shù)據(jù)整體分布沒(méi)有要求,在局部離群點(diǎn)檢測(cè)上表現(xiàn)優(yōu)異,從而得到飛速發(fā)展,其中Chen等[9]提出的K近鄰算法理論成熟且邏輯簡(jiǎn)單,是目前使用最為廣泛的檢測(cè)算法之一。但是基于近鄰密度的方法對(duì)參數(shù)選取較為敏感,此類(lèi)方法的離群點(diǎn)檢測(cè)精確度容易受到參數(shù)的影響而產(chǎn)生較大波動(dòng)。

        影響力最大化(influence maximization,IM)[10]作為消息傳遞機(jī)制的主要研究?jī)?nèi)容之一,廣泛應(yīng)用于病毒營(yíng)銷(xiāo)、謠言控制、社交計(jì)算等實(shí)際應(yīng)用場(chǎng)景中。投票作為一種有效識(shí)別節(jié)點(diǎn)影響力的算法,能夠快速識(shí)別核心節(jié)點(diǎn)以進(jìn)行信息傳播。VoteRank算法[11]首次使用二元組表示數(shù)據(jù)節(jié)點(diǎn)的投票能力與投票得分,按照一定的策略記錄投票得分,發(fā)現(xiàn)節(jié)點(diǎn)影響力與投票得分呈正相關(guān)。WVoteRank算法[12]考慮到權(quán)重對(duì)節(jié)點(diǎn)投票能力的影響,構(gòu)建加權(quán)的一階近鄰矩陣來(lái)衡量不同相似度對(duì)節(jié)點(diǎn)投票能力的影響程度。在此基礎(chǔ)上,VoteRank++算法[13]同時(shí)引入一階、二階近鄰迭代用于表示節(jié)點(diǎn)的投票能力。由于投票進(jìn)行消息傳遞具有魯棒性強(qiáng)、容錯(cuò)率高、可解釋性強(qiáng)等優(yōu)勢(shì),廣泛應(yīng)用于社區(qū)發(fā)現(xiàn)和集群檢測(cè)中。然而,目前并沒(méi)有直接將投票算法應(yīng)用于離群點(diǎn)檢測(cè)的相關(guān)研究。

        本文受到節(jié)點(diǎn)影響力算法的啟發(fā),將投票模擬算法與傳統(tǒng)離群點(diǎn)檢測(cè)方法相結(jié)合,提出一種新穎的離群點(diǎn)檢測(cè)算法。離群點(diǎn)通常位于網(wǎng)絡(luò)邊緣,且對(duì)周邊節(jié)點(diǎn)的影響力較小,故本文選取影響力最小的數(shù)據(jù)為離群點(diǎn)。實(shí)驗(yàn)發(fā)現(xiàn),本文將投票機(jī)制嵌入到離群點(diǎn)檢測(cè)領(lǐng)域是一種新穎而有效的檢測(cè)算法。

        2 近鄰?fù)镀钡碾x群點(diǎn)檢測(cè)

        基于近鄰?fù)镀钡碾x群點(diǎn)檢測(cè)算法包括密度估計(jì)和投票模擬2個(gè)步驟:密度估計(jì)通過(guò)隨機(jī)游走進(jìn)行密度迭代,得到估計(jì)密度和節(jié)點(diǎn)重要性;投票模擬通過(guò)重要節(jié)點(diǎn)傳遞信息,得到信息平衡時(shí)節(jié)點(diǎn)的信息量,將信息量最少的點(diǎn)視為異常點(diǎn)。

        2.1 密度估計(jì)

        (1)

        根據(jù)Q(xi),設(shè)每個(gè)數(shù)據(jù)對(duì)象與其K近鄰間存在一條無(wú)向邊,由此構(gòu)成了以近鄰關(guān)系為基礎(chǔ)的無(wú)權(quán)圖G。由圖G得到鄰接矩陣A:

        (2)

        (3)

        P=M-1A。

        (4)

        基于貢獻(xiàn)均等和無(wú)后效性假設(shè),隨機(jī)游走可達(dá)平穩(wěn)狀態(tài)。具體來(lái)說(shuō),貢獻(xiàn)均等指節(jié)點(diǎn)i的K個(gè)近鄰對(duì)i的貢獻(xiàn)均等,無(wú)后效性指節(jié)點(diǎn)i在隨機(jī)游走中具有無(wú)后效性,即i在t+1時(shí)刻狀態(tài)只與t時(shí)刻狀態(tài)有關(guān)。任意節(jié)點(diǎn)i做隨機(jī)游走,如圖1所示,箭頭方向表示節(jié)點(diǎn)間的有向關(guān)系。近鄰節(jié)點(diǎn)為當(dāng)前節(jié)點(diǎn)可直達(dá)的節(jié)點(diǎn),如圖1中節(jié)點(diǎn)2的近鄰節(jié)點(diǎn)為節(jié)點(diǎn)1和節(jié)點(diǎn)3,節(jié)點(diǎn)4的近鄰節(jié)點(diǎn)為節(jié)點(diǎn)2和節(jié)點(diǎn)3。參數(shù)α表示由任意節(jié)點(diǎn)i根據(jù)箭頭所指的有向關(guān)系游走到其近鄰j的轉(zhuǎn)移概率,認(rèn)為每個(gè)節(jié)點(diǎn)i都有均等的概率轉(zhuǎn)移到其近鄰節(jié)點(diǎn),取值在[0,1]中;節(jié)點(diǎn)i直接回到自身會(huì)形成一個(gè)自環(huán),如圖1中0節(jié)點(diǎn),其概率為1-α,又稱(chēng)回退概率。

        圖1 隨機(jī)游走示意圖

        將式(3)寫(xiě)作向量形式得

        Dt+1=αPDt+(1-α)D0。

        (5)

        由P的定義可知,|P|≠0,|αP|≠0,P為標(biāo)準(zhǔn)化的矩陣,則I-αP非負(fù)定。由于P每一行中非0元的個(gè)數(shù)等于K,當(dāng)K>1且α∈[0,1]時(shí),αP至少有一個(gè)非主對(duì)角元不為0、主對(duì)角元不等于1,則|I-αP|≠0,I-αP可逆。

        Dt+1=αPDt+(1-α)D0;

        Dt=αPDt-1+(1-α)D0;

        ?

        D2=αPD1+(1-α)D0;

        D1=αPD0+(1-α)D0。

        通過(guò)迭代可得到Dt+1關(guān)于Dt,Dt-1,…,D0的表達(dá)式:

        Dt+1=αPDt+(1-α)D0

        =αP(αPDt-1+(1-α)D0)+(1-α)D0

        =α2P2Dt-1+αP(1-α)D0+(1-α)D0

        ?

        =αt+1Pt+1D0+(1+αP+α2P2+…+αtPt)(1-α)D0。 級(jí)數(shù)展開(kāi)式:

        (6)

        利用式(6)可以得到估計(jì)密度值Den,則近鄰密度估計(jì)算法的簡(jiǎn)要描述如下。

        算法1近鄰密度估計(jì)。

        輸入:數(shù)據(jù)集X,近鄰參數(shù)K,轉(zhuǎn)移概率α;

        輸出:每個(gè)數(shù)據(jù)點(diǎn)的估計(jì)密度值Den。

        Step 1 計(jì)算數(shù)據(jù)對(duì)象間的歐氏距離,標(biāo)準(zhǔn)化后得到距離矩陣Dist*;

        Step 2 獲取數(shù)據(jù)的相似性SM=I-Dist*;

        Step 3 根據(jù)相似性矩陣SM,計(jì)算每個(gè)數(shù)據(jù)對(duì)象的初始密度D0,及其K近鄰集Q(xi);

        Step 4 利用K近鄰Q(xi),根據(jù)式(2),構(gòu)造鄰接矩陣A,并獲取概率轉(zhuǎn)移矩陣P;

        Step 5 根據(jù)式(6),估計(jì)數(shù)據(jù)的密度值Den。

        算法1的時(shí)間主要花費(fèi)在計(jì)算數(shù)據(jù)對(duì)象間的距離矩陣Dist*和計(jì)算估計(jì)密度Den,其最壞情況下的時(shí)間復(fù)雜度為O(NK+logN),其中N為數(shù)據(jù)集中數(shù)據(jù)對(duì)象的數(shù)量;K為每個(gè)數(shù)據(jù)對(duì)象的近鄰個(gè)數(shù)。節(jié)點(diǎn)的估計(jì)密度和近鄰關(guān)系是進(jìn)行投票模擬的前提。

        2.2 投票模擬

        由于傳統(tǒng)的異常檢測(cè)算法對(duì)離群點(diǎn)的判別過(guò)于苛刻,易將小簇間節(jié)點(diǎn)視作異常,導(dǎo)致誤判。如圖2所示,圖2(a)中數(shù)據(jù)對(duì)象u處于兩簇間,且簇間距較小,易聚合成更大的簇,圖2(b)中數(shù)據(jù)對(duì)象u位于單個(gè)簇外,遠(yuǎn)離簇中心。事實(shí)上是只有圖2(b)中u點(diǎn)為離群點(diǎn),而傳統(tǒng)的離群點(diǎn)檢測(cè)算法會(huì)把這2種情況下的u均視為異常。投票算法通過(guò)N輪節(jié)點(diǎn)信息傳遞,寬松對(duì)待“可能異?!睌?shù)據(jù)對(duì)象,將圖2(a)中u檢測(cè)為正常節(jié)點(diǎn),是一種容錯(cuò)率高的算法。

        圖2 2種不同離群點(diǎn)情況

        高密度節(jié)點(diǎn)周?chē)h(huán)繞更多節(jié)點(diǎn),成為中心節(jié)點(diǎn)的可能性大,而中心節(jié)點(diǎn)對(duì)近鄰影響更大,故給予估計(jì)密度最大的節(jié)點(diǎn)優(yōu)先投票權(quán),每一輪投票均以當(dāng)前密度最大的節(jié)點(diǎn)為候選投票節(jié)點(diǎn),輻射更多的對(duì)象。每個(gè)數(shù)據(jù)點(diǎn)根據(jù)相似性和密度自發(fā)投票,直到每個(gè)數(shù)據(jù)點(diǎn)都完成投票,統(tǒng)計(jì)每一輪迭代的投票結(jié)果得到投票排名。在上述背景下,模擬投票算法根據(jù)以下3種原則進(jìn)行迭代:①當(dāng)u為未投票節(jié)點(diǎn)中估計(jì)密度最大的點(diǎn),且u的K近鄰集Q(u)中不存在比u估計(jì)密度更大的節(jié)點(diǎn),u投票給自己;②當(dāng)u的K近鄰Q(u)中存在比u估計(jì)密度更大的點(diǎn),記與u相似性最大的點(diǎn)為v;③若v未投票,則u投票給v,若v投票給w,則u也投票給w。

        圖3為上述3種模擬投票原則。箭頭方向表示投票方向,箭尾為投票者,箭頭記錄被投票者;點(diǎn)的大小為該點(diǎn)密度大小,正方形點(diǎn)是比u密度更大的候選節(jié)點(diǎn);圓圈范圍為u的K近鄰集Q(u)。

        圖3 模擬投票原則圖解

        如圖3(a)所示,當(dāng)u是所有未投票的節(jié)點(diǎn)中密度最大的點(diǎn)時(shí),u的影響力最大,能夠傳遞更多的信息給近鄰節(jié)點(diǎn),則u投票給自己。如圖3(b)所示,v是u的鄰域內(nèi)比u密度更大且最近的節(jié)點(diǎn),若v還未投票給其他節(jié)點(diǎn),則u投票給v。如圖3(c)所示,v的密度在u的K近鄰集Q(u)中最大,且其影響力大于u,若v投票給了其近鄰點(diǎn)w,則u投票給w。算法2為投票模擬(voting simulation outlier detection, VSOD)算法。

        算法2投票模擬算法。

        輸入:各數(shù)據(jù)點(diǎn)的估計(jì)密度值Den,近鄰點(diǎn)個(gè)數(shù)K,異常個(gè)數(shù)nns;

        輸出:離群點(diǎn)的索引。

        Step 1 利用算法1計(jì)算密度值Den,并對(duì)其降序排列,得到投票候選節(jié)點(diǎn)索引voteWho;

        Step 2 根據(jù)相似性SM計(jì)算每個(gè)候選點(diǎn)的K近鄰集Q(xi);

        Step 3 以voteWho索引為序,利用3種不同模擬投票原則在候選點(diǎn)的近鄰集Q(xi)中投票,記錄投票得分votescore;

        Step 4 完成投票的節(jié)點(diǎn)跳出voteWho,直到voteWho為空;

        Step 5 取votescore降序排列對(duì)應(yīng)的節(jié)點(diǎn)索引nodeOrder;

        Step 6 取nodeOrder后nns個(gè)索引。

        通過(guò)算法1密度估計(jì)可以得到數(shù)據(jù)點(diǎn)之間的相似性與密度信息,為算法2投票消息傳遞奠定了基礎(chǔ)。算法2中節(jié)點(diǎn)排序nodeOrder反映了節(jié)點(diǎn)重要性,當(dāng)每個(gè)數(shù)據(jù)點(diǎn)都迭代投票后,得到nodeOrder越靠前的數(shù)據(jù)點(diǎn),成為中心節(jié)點(diǎn)的可能性越大,而離群點(diǎn)往往遠(yuǎn)離中心,故選取nodeOrder靠后的節(jié)點(diǎn)為離群點(diǎn)。

        3 實(shí)驗(yàn)

        本節(jié)對(duì)所提出的投票離群點(diǎn)檢測(cè)算法進(jìn)行了實(shí)驗(yàn)分析,在11個(gè)不同類(lèi)型和大小的公共數(shù)據(jù)集上與其他9種離群點(diǎn)檢測(cè)算法進(jìn)行比較。這些數(shù)據(jù)集從實(shí)際應(yīng)用中收集得到,廣泛用于評(píng)價(jià)異常檢測(cè)方法的性能,實(shí)驗(yàn)數(shù)據(jù)來(lái)自于UCI Machine Learning Repository網(wǎng)站。

        3.1 數(shù)據(jù)集

        表1為各數(shù)據(jù)集的基本介紹。這些數(shù)據(jù)集最初應(yīng)用在分類(lèi)任務(wù)中,而離群點(diǎn)檢測(cè)是無(wú)監(jiān)督的,在實(shí)驗(yàn)中往往將更少類(lèi)標(biāo)簽對(duì)象視為異常,其余對(duì)象視為正常[15]。本文在實(shí)驗(yàn)中也遵循該原則,將較少一類(lèi)作為異常類(lèi)。例如WPBC數(shù)據(jù)集,有198條維數(shù)為33的數(shù)據(jù)記錄,其中有47條標(biāo)簽為R的異常數(shù)據(jù)記錄,WPBC數(shù)據(jù)集中異常數(shù)據(jù)量占總數(shù)據(jù)記錄的23.74%。

        表1 實(shí)驗(yàn)數(shù)據(jù)簡(jiǎn)要描述

        為驗(yàn)證本文算法的有效性,選取9種不同的離群點(diǎn)檢測(cè)方法進(jìn)行比較,實(shí)驗(yàn)在A(yíng)MD A9-9425 RADEON R5處理器(3.10 GHz)、4 GB RAM的計(jì)算機(jī)上進(jìn)行。

        3.2 評(píng)價(jià)指標(biāo)

        不同的檢測(cè)算法參數(shù)不同,算法參數(shù)的選取可能會(huì)對(duì)最終結(jié)果產(chǎn)生影響,因此,合適的參數(shù)對(duì)算法至關(guān)重要。為保證嚴(yán)謹(jǐn)性,實(shí)驗(yàn)中的每種異常檢測(cè)算法的參數(shù)都被設(shè)置為原文獻(xiàn)中建議的值或工具箱推薦的值。為便于比較各方法的檢測(cè)效果,實(shí)驗(yàn)采用常用的3個(gè)指標(biāo):Precision、max_F1和AUC。上述3個(gè)指標(biāo)值均在[0,1]中,值越大算法檢測(cè)性能越好。

        3.3 實(shí)驗(yàn)結(jié)果及分析

        表2為異常檢測(cè)算法的Precision比較??梢钥闯?本文投票模擬算法(VSOD)的平均精確度為79%,在大部分?jǐn)?shù)據(jù)集上表現(xiàn)較好。在DLBCL數(shù)據(jù)集上,其他檢測(cè)方法的精確度最高為62%,而所提的VSOD算法精確度為81%。此外,VSOD算法在少數(shù)數(shù)據(jù)上表現(xiàn)不足,但與其他傳統(tǒng)檢測(cè)算法差異不大,如在Speech數(shù)據(jù)集上,VSOD算法的精確度為90%,仍高于傳統(tǒng)檢測(cè)方法的均值89%。而Parkinson數(shù)據(jù)集更適合采用線(xiàn)性和降維方法檢測(cè)離群點(diǎn)。

        表2 VSOD算法在不同數(shù)據(jù)集上與其他算法的Precision對(duì)比

        表3為9種檢測(cè)方法與VSOD算法在11個(gè)特點(diǎn)、規(guī)模不同的數(shù)據(jù)集上的max_F1得分??梢钥闯?max_F1得分與表2中Precision具有類(lèi)似的結(jié)論。當(dāng)使用Speech數(shù)據(jù)集進(jìn)行檢測(cè)時(shí),多數(shù)算法的Precision較高,但max_F1非常低,這可能是算法出現(xiàn)了欠擬合現(xiàn)象。而與其他算法相比,VSOD算法包容性強(qiáng),通過(guò)與最近鄰的信息交互,其Precision和max_F1得分均較高。Precision與max_F1均接近1,驗(yàn)證了本文算法的有效性。在這11個(gè)數(shù)據(jù)集上,VSOD算法的max_F1得分表現(xiàn)均較好,在A(yíng)LLAML、DLBCL、HeartDisease和Lung數(shù)據(jù)集上,指標(biāo)值均在80%以上。

        表3 VSOD算法在不同數(shù)據(jù)集上與其他算法的max_F1對(duì)比

        表4給出了不同算法的AUC。在Speech數(shù)據(jù)集上,VSOD算法與ABOD算法表現(xiàn)相當(dāng),又明顯優(yōu)于其他算法。這可能是由于Speech數(shù)據(jù)集的分布不可區(qū)分,導(dǎo)致密度相近,容易聚集成為更大的簇類(lèi),需要嚴(yán)格的檢測(cè)手段加以區(qū)分。在其他數(shù)據(jù)集上,VSOD算法的性能明顯優(yōu)于其他比較檢測(cè)算法。綜上,本文提出的投票檢測(cè)算法是有效的。

        表4 VSOD算法在不同數(shù)據(jù)集上與其他算法的AUC對(duì)比

        4 結(jié)論

        本文提出了一種有效的異常檢測(cè)方法,該方法將密度估計(jì)方法與投票算法結(jié)合,在每一輪投票中寬容算法與嚴(yán)格算法結(jié)合,連貫進(jìn)行,相互平衡。通過(guò)在11個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn)得到如下結(jié)論。

        (1)本文結(jié)合近鄰密度與模擬投票的離群點(diǎn)檢測(cè)算法可以在一定程度上提高檢測(cè)的精確度。在11個(gè)真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,基于近鄰的投票模擬檢測(cè)算法平均精確度為79%。

        (2)通過(guò)鄰域內(nèi)投票迭代網(wǎng)絡(luò)信息,提高了單純采用近鄰方法進(jìn)行離群點(diǎn)檢測(cè)的算法有效性,如LOF算法和KNN算法。本文算法是一種動(dòng)態(tài)信息傳遞過(guò)程,減少了對(duì)數(shù)據(jù)點(diǎn)初密度的依賴(lài)性,通過(guò)投票不斷修正中心節(jié)點(diǎn)和離群點(diǎn)。

        本文提出的離群點(diǎn)檢測(cè)算法在小規(guī)模數(shù)據(jù)集上檢測(cè)效果較好,但需要根據(jù)數(shù)據(jù)集在一定區(qū)間內(nèi)調(diào)整K的取值才能使其達(dá)到較優(yōu)效果,故下階段將主要研究新穎的消息傳遞方式,從而降低算法對(duì)K值的敏感度。

        猜你喜歡
        檢測(cè)方法
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        “幾何圖形”檢測(cè)題
        “角”檢測(cè)題
        學(xué)習(xí)方法
        可能是方法不對(duì)
        小波變換在PCB缺陷檢測(cè)中的應(yīng)用
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        国产高清成人在线观看视频| 欧美黑人xxxx性高清版| 国产亚洲三级在线视频| 亚洲av高清不卡免费在线| 999国产精品999久久久久久| 99久久久精品免费观看国产| 国产日韩A∨无码免费播放| 日本在线中文字幕一区| 黄片小视频免费观看完整版| 99爱在线精品免费观看| 精品久久无码中文字幕| 欧洲无码一级毛片无遮挡| 久久精品国产熟女亚洲av麻豆| 人人妻人人澡人人爽欧美一区双| 人妻精品无码一区二区三区| 亚洲A∨日韩Av最新在线| 精品人妻少妇丰满久久久免| 草草地址线路①屁屁影院成人| 精品久久亚洲中文无码| 国产人妖xxxx做受视频| 国产不卡视频在线观看| 国产精品www夜色视频| 男女真实有遮挡xx00动态图| 最新国产精品精品视频| 偷拍一区二区盗摄视频| 国产乱子伦农村xxxx| 国产精品综合日韩精品第一页 | 亚洲一区二区三区一站| 亚洲成人中文字幕在线视频 | 又色又爽又高潮免费视频国产| 精品乱码一区二区三区四区| 亚洲一区二区三在线播放| 夜夜骚久久激情亚洲精品| 免费观看又色又爽又湿的视频 | 精品人妻av区乱码| 久久天天躁夜夜躁狠狠躁2022| 中日韩字幕中文字幕一区| 日本高清一区二区三区在线观看| 老少配老妇老熟女中文普通话| 国产精品无码专区综合网| 尤物蜜芽福利国产污在线观看|