徐 怡,孫小軍
(安徽大學(xué) 計(jì)算機(jī)智能與信號處理教育部重點(diǎn)實(shí)驗(yàn)室,合肥 230601)
(安徽大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,合肥 230601)
三支決策理論最初由Yao教授提出的[3],是近些年來出現(xiàn)的新的決策分析理論,可以用于處理不完整、不精確信息.三支決策模型作為傳統(tǒng)二支決策模型的重要擴(kuò)展,考慮了決策過程中的諸多不確定性因素,在處理過程中,當(dāng)信息不足以決定接受或拒絕時(shí),將延遲決策作為的第三種決策行為.目前,三支決策理論已被廣泛應(yīng)用于人臉識別[4]、醫(yī)療診斷[18]、推薦系統(tǒng)[5]等多個(gè)領(lǐng)域中.
粗糙集和決策粗糙集理論[1]是三支決策研究的起源,三支決策的正域、邊界域和負(fù)域可以通過通過粗糙集的上下近似集給出一定的語義解釋.在粗糙集理論模型中,Yao引入了 Bayes風(fēng)險(xiǎn)決策方法,依據(jù)最低風(fēng)險(xiǎn)代價(jià),把對象劃分到正域、負(fù)域和邊界區(qū)域,從而形成了三支決策的接受決策、拒絕決策和延遲決策的三支決策語義[2].近年來,許多學(xué)者研究了將樸素決策理論轉(zhuǎn)化為理論體系、信息處理模型或計(jì)算方法的問題,已取得顯著進(jìn)展的三支決策模型及其應(yīng),例如三支聚類分析[6,7],過濾垃圾郵件[8],三支決策空間[12],代價(jià)敏感三支決策[9,11],三支決策概念分析[13,14]等.許多關(guān)于三支決策理論的研究都是基于相應(yīng)的決策背景及其應(yīng)用.例如,Li和Zhou[15]結(jié)合決策者不同的風(fēng)險(xiǎn)偏好,提出了一種基于決策理論粗糙集的新決策模型.Yang和Yao[16]提出了一種多級代理三支決策模型,描述了當(dāng)不同的用戶根據(jù)自己的標(biāo)準(zhǔn)給出不同的決策集時(shí),如何制定一個(gè)全面一致的決策標(biāo)準(zhǔn).Yang和Li[20]提出一種基于三支粒計(jì)算的混合數(shù)據(jù)融合的方法.Luo[17]提出一種基于多源信息系統(tǒng)構(gòu)建三支決策的方法以及在系統(tǒng)中的應(yīng)用.
然而,對于接受區(qū)域內(nèi)的對象數(shù)量固定且實(shí)時(shí)劃分對象的情況,在目前研究領(lǐng)域中很少有人提出相關(guān)的三支決策的模型和理論.當(dāng)論域U是排序的屬性值時(shí),Zhang[10]等提出了一種基于標(biāo)準(zhǔn)差構(gòu)建最佳偏差以及動態(tài)的更新屬性值的三支決策模型,但Zhang沒有考慮屬性值更新前后的關(guān)聯(lián)性以及重要程度.本文考慮屬性值更新過程中的聯(lián)系以及重要程度,提出一種基于基尼系數(shù)來構(gòu)建離散度偏差,動態(tài)更新屬性,動態(tài)的計(jì)算一對閾值來構(gòu)建三支決策,是一種基于屬性更新的動態(tài)決策模型.
在一些在線實(shí)時(shí)評判系統(tǒng)中,需要實(shí)時(shí)的篩選出一批對象,評判的數(shù)據(jù)不是一次性都到達(dá),而是隨著時(shí)間逐漸獲取,且需要在每個(gè)時(shí)刻都要選出一批對象,現(xiàn)已如下場景為例:
假設(shè)需要實(shí)時(shí)考核,選拔k個(gè)優(yōu)秀學(xué)生,通過成績從高到低排序,每次考核選出部分學(xué)生和淘汰部分學(xué)生.運(yùn)用三支決策分類算法,每次將一批學(xué)生分類到三個(gè)不相交的區(qū)域:POS、BND和NEG,其中POS區(qū)域中是選中的學(xué)生,NEG區(qū)域中是淘汰的學(xué)生,而BND區(qū)域中是不能確定結(jié)果的學(xué)生,需要繼續(xù)考核.通過t次考核,從N個(gè)學(xué)生中選擇k個(gè) “最優(yōu)” 的學(xué)生作為最佳的分類(N>k).
對于這種實(shí)時(shí)多次的考核,如果運(yùn)用二支決策思想,直接在某次考核中把前k個(gè)最高成績的同學(xué)當(dāng)作最佳分類,如果有的學(xué)生本次考核不良,即使下次考核表現(xiàn)優(yōu)異,但也錯(cuò)失分類成優(yōu)秀學(xué)生的機(jī)會.顯然這種二支決策的方法過于直接和武斷.容錯(cuò)性較差,缺乏處理不確信性的能力.
而本文所提出的基于基尼系數(shù)構(gòu)建離散度的三支決策模型能很好的解決該問題,克服二支決策的問題,提高容錯(cuò)性和處理不確定性的能力,能夠處理實(shí)時(shí)數(shù)據(jù)的劃分問題,同時(shí)解決屬性值更新過程中的關(guān)聯(lián)性和重要程度問題.本文第一節(jié)簡要介紹了粗糙集和三支決策理論;第二節(jié)介紹了基于基尼系數(shù)構(gòu)建離散度的三支決策模型及相關(guān)定義.第三節(jié)通過對比基于標(biāo)準(zhǔn)差的三支決策算法(FEAOAV)[15]的實(shí)驗(yàn)驗(yàn)證了算法的可行性和有效性.最后總結(jié)全文.
定義1.序信息系統(tǒng)S=(U,AT,V,f)被定義為一個(gè)四元組,其中,論域U為非空有限的對象集合;AT為非空有限的屬性集合,?a∈AT;V是全體屬性的值域集合,即V=VAT=∪a∈ATVa;f表示信息函數(shù),?x∈U,定義f(x,a)表示x在屬性a上的取值,則有f(x,a)∈Va,且滿足序關(guān)系(f(x,a),≥).
定義2[1].序信息系統(tǒng)S=(U,AT,V,f),?a∈AT,?X?U,概念X的下、上近似集合分別定義為:
其中[x]a表示x在a上的等價(jià)類.
定義 3[10].根據(jù)子集X的下、上近似集合,可將論域劃分為3個(gè)互不相交的區(qū)域:正域POS(X)、邊界域BND(X)和負(fù)域NEG(X),將其分別定義如下:
由正域中元素導(dǎo)出的規(guī)則表示確定屬于X的規(guī)則,由負(fù)域中元素導(dǎo)出的規(guī)則表示確定不屬于X的規(guī)則,而由邊界域?qū)С龅囊?guī)則表示可能屬于X的規(guī)則,這體現(xiàn)了“三支決策” 的基本思想.
對于后續(xù)出現(xiàn)的對象集,如無特別說明,則默認(rèn)為:對象集U={x1,x2,…,xn}表示本次要劃分的重新降序排列后的對象集合,不包括“上次”已經(jīng)劃分到正域POS和負(fù)域NEG中的對象.對象的屬性值都為數(shù)值型.
文獻(xiàn)[10]敘述屬性動態(tài)更新的三支決策劃分過程,現(xiàn)簡要介紹:
有對象集U={x1,x2,…,xn},Zi={z1,z2,…,zm}為U中對象xi的m個(gè)屬性值的集合,現(xiàn)需要選出k個(gè)“優(yōu)秀”的對象.在第j次決策(j ·將確定為“優(yōu)秀”的對象直接劃分到POS接受區(qū)域中,然后完成所有屬性值的更新. ·那些可能是“優(yōu)秀”的對象被放入BND延遲區(qū)域,然后再次更新它們的屬性值,之后再對它們進(jìn)行劃分. ·不是“優(yōu)秀”的對象直接放入NEG拒絕區(qū)域.重復(fù)上述過程,直至POS接受區(qū)域的對象的數(shù)量等于k. 在實(shí)際操作中,如果最終更新后的對象的數(shù)量沒有達(dá)到k,直接從前面BND延遲區(qū)域(不足,則繼續(xù)從拒絕區(qū)域NEG)選擇一部分擁有更高的屬性值的對象納入到對象的POS接受區(qū)域,使POS接受區(qū)域數(shù)量等于k. 在上面的決策過程,更新的屬性值的重要程度不同且有一定的關(guān)聯(lián)性,在“理想”的決策過程中,一個(gè)對象是否是“優(yōu)秀”的對象,不能直觀地知道.在一個(gè)連續(xù)的決策過程中,決策是一個(gè)價(jià)值更新的動態(tài)過程.當(dāng)固定接受區(qū)域內(nèi)的對象個(gè)數(shù)和對象的屬性逐個(gè)獲取,本文將給出基于基尼系數(shù)的三支決策模型,利用基尼系數(shù)動態(tài)計(jì)算閾值,動態(tài)的劃分出“優(yōu)秀”的對象. 定義 4.序信息系統(tǒng)S=(U,AT,V,f),設(shè)U={x1,x2,…,xn}是第t次更新后對象集,V={v1,v2,…,vn}是U中對象的第t個(gè)屬性的值域的集合,則xi在第t次更新后(第t個(gè)屬性)的值域定義如下: (1) 給予對象xi在每次更新后的值一個(gè)權(quán)重b,能夠體現(xiàn)每次更新的重要程度,同時(shí)定義4將每次更新的值關(guān)聯(lián)起來. 定義 5.(屬性比)序信息系統(tǒng)S=(U,AT,V,f),令U={x1,x2,…,xn}是對象集,其中a∈AT,a(xi)表示m在屬性a下的值,對于一個(gè)屬性a的值為數(shù)值型,對象xi的屬性比定義如下: (2) 從屬性比的定義可以得出以下兩個(gè)結(jié)論: ·如果兩個(gè)對象屬于一個(gè)等價(jià)類,則它們具有相同屬性比.(如果兩個(gè)對象xi和xj的屬性a的值相等,則認(rèn)為在a屬性下xi和xj屬于同一個(gè)等價(jià)類,即[xi]a=[xj]a. ·對象同一屬性下值域越高,對應(yīng)的屬性比越高. 定義 6.(基于屬性比的三支決策模型)序信息系統(tǒng)S=(U,AT,V,f).對于X?U,帶有一對閾值(α,β),(0≤β≤α≤1) 的上下近似集定義分別為: (3) (4) U可以分為三個(gè)互不相交的區(qū)域,即接受區(qū)域、延遲區(qū)域和拒絕區(qū)域,如下所示. (5) (6) (7) 接受區(qū)域內(nèi)的所有對象都是“優(yōu)秀”對象,拒絕區(qū)域內(nèi)的所有對象都是“淘汰”對象,在當(dāng)前條件下,延遲區(qū)域內(nèi)的對象都不容易清晰判斷,需要進(jìn)一步觀察. 在定義6中,當(dāng)α和β的閾值確定,所有的對象可以劃分到接受區(qū)域,延遲區(qū)域,或拒絕區(qū)域.在動態(tài)決策的整個(gè)過程中,對象的屬性值和接受區(qū)域內(nèi)所需的對象數(shù)量都可能發(fā)生變化.因此,相應(yīng)的自適應(yīng)閾值α和β需要改變.因此,本文研究的下一個(gè)目標(biāo)是在給定可接受區(qū)域內(nèi)的對象數(shù)量和屬性值時(shí),尋找一對自適應(yīng)閾值. 為了確定閾值α和β,必須選擇一個(gè)適當(dāng)?shù)奶卣魈崛》椒?因此,本節(jié)根據(jù)離散集的數(shù)學(xué)特征提出一種新的偏差概念定義如下 定義 7[19].(基于基尼系數(shù)的偏差)定義U={x1,x2,…,xn}是對象集,Vn={v1,v2,…,vn}是U中對象在屬性a下值域的集合,U滿足序關(guān)系f(xi,a)≥f(xi-1,a),即vi≥vi-1,則, dn=Gn-Gn-1是對象xn的偏差. (8) Vn-1比Vn少一個(gè)元素vn,當(dāng)Vn-1中加入一個(gè)元素vn時(shí),即Vn-1變成Vn時(shí),Vn-1的離散度可能會變化,這種變化的程度可以歸結(jié)為增加了一個(gè)元素在其中,偏差的概念反應(yīng)這一動作的影響程度. ·當(dāng)dn>0時(shí),我們說元素vn的加入對集合Vn-1有一個(gè)負(fù)的影響; ·當(dāng)dn<0時(shí),我們說元素vn的加入對集合Vn-1具有正影響; ·當(dāng)dn=0時(shí),我們說元素vn的加入對集合Vn-1沒有影響. 例1.假設(shè)有兩個(gè)集合V3和V4,按值降序排序,其中V3={2,3,5}和V4={2,3,5,10},計(jì)算d4. 第1步.計(jì)算兩個(gè)集合的和: 第2步.計(jì)算G3: 第3步.計(jì)算G4: 第4步.計(jì)算出d4=G4-G3=0.125. 在上述數(shù)學(xué)分析的基礎(chǔ)上,提出一種基于基尼系數(shù)的對象屬性值偏差的算法(FEBOG),用于實(shí)際的優(yōu)化選擇過程.該算法的基本目的在一次決策中,得到一組對象的偏差值. 算法 1.計(jì)算一組更新后屬性值集合的偏差值. 輸入:更新后屬性值域的降序集合Vn={v1,v2,…,vn}; 輸出:偏差值集合D={d1,d2,d3,…,dn}. Step 1.利用Sn集合構(gòu)造序列集合 V1={v1};V2={v1,v2};V3={v1,v2,v3}…Vn={v1,v2,v3,…,vn}. Step 2.計(jì)算每個(gè)集合的基尼系數(shù). G0=0;G1=0; … Step 3.計(jì)算對象偏差序列 d1=G1-G0;d2=G2-G1; Step 4.得到離散度偏差集Dn={d1,d2,d3,…,dn}. 上述算法步驟表明,對象的特征(對象的偏差值)基于集合的基尼系數(shù)計(jì)算.對象的偏差值可以反映對象加入集合后對集合離散度的影響.因此,決策模型中對象的偏差值的意義可以重新解釋如下: 讓Xj-1={x1,x2,x3,…,xj-1}表示“優(yōu)秀”對象集.另一個(gè)對象集Xj={x1,x2,x3,…,xj-1,xj},通過FEBOG算法算得對象的屬性值特性dj. ·dj>0代表的元素xj有一個(gè)負(fù)面影響,這降低了Xj-1整體的優(yōu)秀程度; ·dj<0代表的元素xj有一個(gè)積極的效果,提高了Xj-1整體的優(yōu)秀程度; ·dj=0代表的元素xj沒有效果,對Xj-1整體的優(yōu)秀程度沒影響. 對于屬性值動態(tài)更新,文獻(xiàn)[10]提出一條規(guī)則:對象的屬性值越低(高),其增量就越大(低).并且進(jìn)一步闡述了:如果xi和xj是兩個(gè)在a屬性下具有最大偏差的對象,則xi和xj可以作為論域U的兩個(gè)分類點(diǎn),最合適的決策閾值α和β能夠被xi和xj的屬性比獲得,論域U可以被分為三個(gè)不想交的區(qū)域POS,BND,NEG. 一次決策過程是,根據(jù)屬性值由高到低的順序,依次將對象添加到“優(yōu)”對象集中.當(dāng)一個(gè)屬性值較低的對象被添加到一個(gè)“優(yōu)”對象集中時(shí),“優(yōu)”對象集的離散度降低.顯然,通過FEBOG算法可以得到集合離散度的變化,即每個(gè)對象的偏差值表示其在這個(gè)過程中的影響程度.如果一個(gè)對象的影響程度高于添加到“優(yōu)秀”對象集中的任何其他對象的影響程度,這意味著在添加此對象之前,“優(yōu)秀”對象集已經(jīng)是穩(wěn)定且集中的.因此,根據(jù)每個(gè)對象的最優(yōu)偏差,可以將域分為三個(gè)相對穩(wěn)定且集中的對象集,分別為接受區(qū)域、延遲區(qū)域和拒絕區(qū)域. 圖1 一次三支決策形成的區(qū)域Fig.1 Region formed by one time three-way decision 因此,在一次決策過程中,自適應(yīng)分類方法可以描述為:域的三個(gè)區(qū)域如圖1所示,其中k表示給定的被接受區(qū)域內(nèi)的對象數(shù)量,U={x1,x2,x3,…,xn}表示根據(jù)屬性值由高到低設(shè)置的對象集.應(yīng)用FEAOAV可獲得各目標(biāo)的最優(yōu)偏差. 首先,k是U的一個(gè)分類點(diǎn);U分為兩個(gè)不相交子集X1={x1,x2,…,xk}和X2={xk+1,xk+2,…,xn}.然后,假設(shè)1≤i≤k和k+1 POS(α,β)(X)={x1,x2,…,xi-1} (9) 因此,閾值α,β能夠通過以上分析得出: (10) (11) 該算法會出現(xiàn)以下幾種情況: 1)前m次(m 假設(shè)要在t次分類中選出k個(gè)對象,令在前0.5t次分類中,如果劃分到POS正域中的個(gè)數(shù)m大于0.5k個(gè),則每次只選出前a′個(gè)對象到POS正域,其中a′=0.5m,(0.5m 圖2 劃分次數(shù)過少的解決辦法Fig.2 Solutions for too small division times 如圖2所示,在第M次的分類點(diǎn)為xa和xb,但a>k,通過調(diào)整后分類點(diǎn)為xa′和xb,a′ 2)在規(guī)定的t次分類中選出來的對象個(gè)數(shù)m小于k,此時(shí)可以在BND邊界域中選擇前k-m個(gè)具有最大值的對象作為需要的對象,如果邊界域?qū)ο髠€(gè)數(shù)不足,則繼續(xù)從負(fù)域中選擇相應(yīng)的具有最大值的對象作為需要的對象. 圖3 接受區(qū)域?qū)ο髠€(gè)數(shù)不足的解決辦法Fig.3 Solution to the insufficient number of objects in the receiving area 如圖3所示,在第t次分類后的分類點(diǎn)為xa和xb,但a 算法 2.接受區(qū)域劃分k個(gè)對象的三支決策算法. 輸入:信息系統(tǒng)S=(U,AT,V,f),需要選出的對象個(gè)數(shù)k,預(yù)計(jì)劃分次數(shù)t; 輸出:集合POSt的k個(gè)對象. 1)初始化,POSt=?,U={x1,x2,…,xn},已選出的對象個(gè)數(shù)m=0,已劃分次數(shù)h=1,權(quán)重b=t-1; 2)對于(|POSt| (2)根據(jù)算法1計(jì)算出Dn={d1,d2,…,dn},找出兩個(gè)最大的值di和dj,對應(yīng)的對象為xi,xj; (4)根據(jù)定義6計(jì)算出: POS(X)={x1,x2,…,xi-1}; (5)If |POS(X)|>0.5 &&h<0.5: POS(X)取前0.5|POS(X)|個(gè)對象; POSt=POSt∪POS(X); (6)h=h+1,U=BND(X); 3)If(|POSt| 4)輸出:POSt集合. 文獻(xiàn)[10]中對具有屬性動態(tài)更新的三支決策模型給出了評估方法,分別衡量模型的精度性能,最優(yōu)率,與“最優(yōu)”分類結(jié)果的相似度. 代表三支決策分類結(jié)果與“最優(yōu)”分類結(jié)果的相似度,越大越好,其中POS*(X)代表最優(yōu)分類的對象集,是所有更新操作完成后,前k個(gè)最大屬性值的對象組成的集合. 代表三支決策分類的對象的屬性值總和與二支決策分類的對象的屬性值總和之差,衡量提出的模型的精度性能,其中POS(X)O表示二支決策模型接受區(qū)域的對象集. 代表最優(yōu)率,也就是說,根據(jù)搜索“最優(yōu)”分類結(jié)果過程中需要更新的對象數(shù)量,在三支決策過程中減少了更新的對象數(shù)量,其中,|NEGi(X)|代表第i層決策分到拒絕區(qū)域的對象個(gè)數(shù),N代表決策對象的總數(shù). 為了驗(yàn)證本文算法的有效性,將其與文獻(xiàn)[10]中的FEAOAV算法進(jìn)行比較.算法的仿真實(shí)驗(yàn)環(huán)境為:Windows7操作系統(tǒng),配置為Intel(R)Core(TM)i3-4170CPU@3.70GHz,內(nèi)存為8GB,使用java語言實(shí)現(xiàn)算法.算法測試使用的4個(gè)數(shù)據(jù)集均來自UCI數(shù)據(jù)庫.在進(jìn)行實(shí)驗(yàn)之前,首先對數(shù)據(jù)進(jìn)行處理,需要的數(shù)據(jù)的屬性是數(shù)值類型且值域范圍較大,所以選取數(shù)據(jù)集的部分?jǐn)?shù)值類型屬性并改造屬性值,使得新屬性值為原屬性值加上0-g之間的隨機(jī)數(shù)(g為數(shù)據(jù)集的對象數(shù)),改造后的數(shù)據(jù)集1的屬性數(shù)由23變?yōu)?,數(shù)據(jù)集2的屬性數(shù)由16變?yōu)?,數(shù)據(jù)集3的屬性數(shù)由15變?yōu)?,數(shù)據(jù)集4的屬性數(shù)由16變?yōu)?.如表1所示. 表1 實(shí)驗(yàn)中使用的UCI數(shù)據(jù)集Table 1 UCI dataset used in the experiment 表2-表5為本文算法(FEBOG)和FEAOAV算法在不同數(shù)據(jù)集上的對比實(shí)驗(yàn)結(jié)果,t為劃分次數(shù),即為改造后的屬性數(shù),N為總的對象數(shù)量,k為正域POS需要的對象個(gè)數(shù),λ,μ,ν 表2 Anneal 數(shù)據(jù)集Table 2 Anneal dataset 表3 Zoo 數(shù)據(jù)集Table 3 Zoo dataset 表4 Credit 數(shù)據(jù)集Table 4 Credit dataset 表5 Letter 數(shù)據(jù)集Table 5 Letter dataset 為3個(gè)評估指標(biāo).其中,表2設(shè)置t=5,N=693,表3設(shè)置t=5,N=101,表4設(shè)置t=8,N=690,表5設(shè)置t=8,N=1544.為了確保數(shù)據(jù)的客觀性,實(shí)驗(yàn)結(jié)果為運(yùn)行50次后取的平均值.從表2-表5中可以看出所有數(shù)據(jù)集上,在不同的k值上,本文算法大部分的λ,μ,ν指標(biāo)值大于FEAOAV算法,且隨著k的增大,λ,μ,ν值的增幅大于FEAOAV算法,說明本文算法在劃分性能優(yōu)于FEAOAV算法.λ能達(dá)到0.9714,說明本文模型有較高的可行性.ν的值在0.3632-0.3632之間,說明對比“最優(yōu)”分類結(jié)果,本文算法能夠減少0.3632-0.3632的對象的更新,表明具有較高的效率.所有的μ都大于0,表明在許多的動態(tài)決策問題上本文算法優(yōu)于二支決策模型. 在接受區(qū)域的對象個(gè)數(shù)固定的這種情形時(shí),人們通常采用二支決策的方法來解決問題的最優(yōu)解.但是,由于更新過程中忽略了不確定性和成本,結(jié)果往往不合理,同時(shí)相應(yīng)的三支決策模型沒有考慮屬性更新前后的關(guān)聯(lián)性和重要程度,且很多情況下需要實(shí)時(shí)多次的劃分,評判的數(shù)據(jù)隨著時(shí)間逐漸到來.為了解決這些問題,首先,提出屬性動態(tài)更新規(guī)則,建立更新前后的屬性的聯(lián)系和重要程度,然后根據(jù)對象的價(jià)值特征(偏差)和二支決策模型的不足,建立了一個(gè)動態(tài)的三支決策模型.然后,在給定目標(biāo)屬性值排序的條件下,提出了一種基于基尼系數(shù)的屬性值特征提取算法FEBOG.并在此基礎(chǔ)上,提出了一種自適應(yīng)劃分方法,并確定了一對閾值的計(jì)算方法,做到動態(tài)實(shí)時(shí)劃分.針對兩種分類異常情況,提出了解決方法.該模型可以在動態(tài)決策過程的最后獲得二支分類結(jié)果.最后進(jìn)行了仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,基于FEBOG算法的三支決策模型在λ,μ,ν指標(biāo)上部分優(yōu)于基于FEAOAV算法的模型.本文模型適用于非監(jiān)督學(xué)習(xí),可以應(yīng)用在一些選拔比賽中,每輪比賽選出和淘汰一批選手,直到若干輪后選出合適數(shù)量的選手.本文模型還可以應(yīng)用在一些在線學(xué)習(xí)中,及時(shí)動態(tài)的處理到來的數(shù)據(jù).3.2 自適應(yīng)閾值的計(jì)算
d3=G3-G2;…dn=Gn-Gn-1
BND(α,β)(X)={xi,xi+1,…,xj-1}
NEG(α,β)(X)={xj,xj+1,…,xn}3.3 劃分異常情況的解決
BND(X)={xi,xi+1,…,xj-1};
NEG(X)={xj,xj+1,…,xn}.
Else:POSt=POSt∪POS(X);4 仿真實(shí)驗(yàn)
4.1 模型的評估
4.2 實(shí)驗(yàn)分析
5 結(jié) 論