盧北辰,常子星,金 濤,王建民
(清華大學(xué) 軟件學(xué)院,北京 100084)
隨著信息技術(shù)的快速發(fā)展,人們發(fā)現(xiàn)問題、描述問題、解決問題的思路較以往有了很大區(qū)別,基于信息化、智能化的方法逐漸取代了傳統(tǒng)的基于經(jīng)驗(yàn)和人工的方法,成為人們對(duì)現(xiàn)實(shí)系統(tǒng)進(jìn)行觀測(cè)、分析和優(yōu)化的主要手段。在許多情況下,這一任務(wù)通過時(shí)間序列數(shù)據(jù)的形式,對(duì)現(xiàn)實(shí)世界的物理系統(tǒng)進(jìn)行表征和觀測(cè),在此基礎(chǔ)上,結(jié)合過程挖掘的手段,對(duì)系統(tǒng)的狀態(tài)(state)和運(yùn)行情況進(jìn)行建模和優(yōu)化,進(jìn)而發(fā)現(xiàn)和解決系統(tǒng)中存在的問題。
時(shí)間序列(time series)指按時(shí)間順序獲得的一系列有序觀測(cè)值,是對(duì)物理世界的待觀測(cè)系統(tǒng)進(jìn)行描述和分析的重要手段和表現(xiàn)形式,在物聯(lián)網(wǎng)、計(jì)量經(jīng)濟(jì)學(xué)、生物醫(yī)學(xué)分析、氣象研究及惡劣天氣預(yù)測(cè)等領(lǐng)域均有廣泛的應(yīng)用。隨著物聯(lián)網(wǎng)(Internet of Things, IoT)技術(shù)的發(fā)展和傳感器監(jiān)控系統(tǒng)的應(yīng)用,日志規(guī)模和數(shù)據(jù)維度均不斷增長(zhǎng),采用事件(event)的概念對(duì)時(shí)間序列進(jìn)行挖掘和抽象具有重要意義。事件是過程挖掘中的一個(gè)重要概念,記錄了一個(gè)活動(dòng)的基本屬性及其發(fā)生的時(shí)間戳。對(duì)事件日志進(jìn)行分析挖掘既可以發(fā)現(xiàn)一個(gè)業(yè)務(wù)過程,也可以將事件日志與已知過程模型進(jìn)行比較來檢驗(yàn)其合規(guī)性,或者利用實(shí)際業(yè)務(wù)過程中產(chǎn)生的事件日志來擴(kuò)展或改進(jìn)現(xiàn)有的過程模型[1]。
目前,事件日志的來源主要依賴于一個(gè)完善信息系統(tǒng)對(duì)預(yù)先規(guī)定好的事件的記錄,而在實(shí)際生產(chǎn)中,某些工業(yè)系統(tǒng)只是單純地記錄傳感器的時(shí)間序列,并不會(huì)生成可用的事件日志;另一方面,日志所記錄的事件是有限的,一些不在系統(tǒng)設(shè)計(jì)者意料之中的事件并不能被有效記錄下來。因此,對(duì)時(shí)間序列進(jìn)行事件檢測(cè)是過程挖掘的重要任務(wù)之一。
從時(shí)間序列中檢測(cè)事件的方法很多,本文基于現(xiàn)有工作[2],采用兩次抽象的方法完成時(shí)間序列數(shù)據(jù)事件發(fā)現(xiàn)的工作。
第1階段抽象過程稱為狀態(tài)劃分,按一定規(guī)則將時(shí)間序列劃分為不同的區(qū)間,相同標(biāo)簽區(qū)間內(nèi)的數(shù)據(jù)具有簡(jiǎn)單且相似的模式,將這種模式稱為數(shù)據(jù)的一個(gè)狀態(tài),將只包含數(shù)據(jù)一種狀態(tài)的時(shí)間區(qū)間稱為狀態(tài)區(qū)間;第2階段抽象過程稱為事件檢測(cè),劃分狀態(tài)區(qū)間后,將狀態(tài)區(qū)間按照一定模式組裝起來,獲得一個(gè)更復(fù)雜的數(shù)據(jù)模式,這種模式稱為時(shí)間模式(temporal pattern),頻繁的時(shí)間模式被認(rèn)為是一個(gè)可能的事件。
狀態(tài)劃分可使后續(xù)工作在更加抽象的級(jí)別上展開,用一個(gè)特定的標(biāo)簽表示這一組子序列的特征[3]能夠大大降低數(shù)據(jù)的規(guī)模和維數(shù),使后續(xù)計(jì)算更加簡(jiǎn)單高效。相比于機(jī)器學(xué)習(xí)聚類的方式[4],通過狀態(tài)組裝的事件更加直觀,具有更強(qiáng)的可解釋性。對(duì)于為子序列賦予特征標(biāo)簽的問題,目前主要有基于歸納導(dǎo)出和基于演繹導(dǎo)出兩種解決方法。
1.1.1 歸納導(dǎo)出方法
通過歸納的方法從原始的時(shí)間序列導(dǎo)出一組標(biāo)簽,采用該標(biāo)簽劃分狀態(tài)區(qū)間。為了劃分?jǐn)?shù)據(jù),常采用基于相似度判定的聚類方法,該方法將時(shí)間序列的一個(gè)子序列視為一個(gè)數(shù)據(jù)對(duì)象,劃分后的每個(gè)簇視為一個(gè)擁有相同標(biāo)簽的子序列集合[5]。
1.1.2 演繹導(dǎo)出方法
歸納方法可以得到細(xì)致劃分的時(shí)間序列,對(duì)得到的每個(gè)簇的形狀都有精準(zhǔn)的描述。缺點(diǎn)是在很多情況下計(jì)算量過于龐大,限制了其應(yīng)用范圍。因此,本文使用的方法不再試圖對(duì)曲線的形態(tài)進(jìn)行精準(zhǔn)描述,而是用一個(gè)枚舉標(biāo)簽標(biāo)記事件序列的每一個(gè)小段。例如,對(duì)一個(gè)區(qū)間的形狀描述僅限于增或減;也可以稍微深入一點(diǎn),區(qū)分凸函數(shù)和凹函數(shù)。函數(shù)近似方法和平滑方法均可用于劃分區(qū)間,每個(gè)區(qū)間被視為一個(gè)狀態(tài)。
前述的狀態(tài)是時(shí)間序列的第1階段抽象,也是人類能感知到的最小層次,如空氣里的溫度上升狀態(tài)、高濕度狀態(tài)都可以被人的感官感知到。然而,通常人類所理解的是更高級(jí)更復(fù)雜的事件,一個(gè)事件往往對(duì)應(yīng)很多個(gè)狀態(tài)改變的組合,為了描述事件或分析該事件的影響,需要將所有相關(guān)狀態(tài)組合起來,以狀態(tài)組合的變化表示一個(gè)特定的事件[6]。因此,需要采用算法進(jìn)行事件層次的第2階段抽象。
1.2.1 基于一致的時(shí)態(tài)語(yǔ)法
基于一致的時(shí)態(tài)語(yǔ)法(Unification-based Temporal Grammar, UTG)[7]是一種規(guī)則語(yǔ)言,用來描述多元時(shí)間序列數(shù)據(jù),其用一階邏輯提供時(shí)序概念的層次描述。序列是從相似的相鄰狀態(tài)中衍生出來的,當(dāng)兩個(gè)或兩個(gè)以上的狀態(tài)同時(shí)發(fā)生時(shí),認(rèn)為它們形成一個(gè)事件。當(dāng)原始的時(shí)間序列存在缺失導(dǎo)致數(shù)據(jù)不連續(xù)時(shí),UTG方法會(huì)檢測(cè)出兩個(gè)事件而不是將其合并,這樣不利于多元數(shù)據(jù)的處理。
1.2.2 時(shí)間模式識(shí)別方法
時(shí)間模式指幾個(gè)狀態(tài)特定位置關(guān)系的組合[2]。時(shí)間模式識(shí)別方法通過對(duì)時(shí)間模式進(jìn)行形式化定義,采用滑動(dòng)窗口的方式尋找區(qū)間序列里出現(xiàn)最頻繁的幾個(gè)時(shí)間模式。該方法認(rèn)為,一個(gè)時(shí)間模式出現(xiàn)得越頻繁,越有研究?jī)r(jià)值,該時(shí)間模式更可能對(duì)應(yīng)一個(gè)真實(shí)的事件。本文用此法作為第2階段抽象的方法。
算法的主要思想是預(yù)先使用平滑技術(shù)消除原始數(shù)據(jù)噪聲,然后根據(jù)平滑后的數(shù)據(jù)提取形狀特征。對(duì)于一個(gè)有意義的平滑方法,t時(shí)刻的估計(jì)值應(yīng)該與t時(shí)刻附近的觀測(cè)值有關(guān),而且根據(jù)觀測(cè)值所在的時(shí)刻與t時(shí)刻的距離,其權(quán)重也需進(jìn)行相應(yīng)調(diào)整。核函數(shù)k(u)用于描述這一權(quán)重分布的函數(shù),常用的核函數(shù)有一次核函數(shù)、二次核函數(shù)、高斯核函數(shù)等,其應(yīng)滿足質(zhì)量分布集中在0附近,當(dāng)|u|≥1時(shí),k(u)會(huì)迅速衰減或完全消失。用帶寬參數(shù)s控制核函數(shù)的平滑程度,有
在原始信號(hào)為離散的情況下,有
根據(jù)上述方法計(jì)算一個(gè)序列的標(biāo)簽,進(jìn)而將原始的時(shí)間序列數(shù)據(jù)劃分為不同的狀態(tài)區(qū)間,并為其賦予不同的標(biāo)簽,從而完成對(duì)時(shí)間序列的第一級(jí)抽象。下面給出其形式化定義:
定義1狀態(tài)區(qū)間序列。給定一個(gè)非空區(qū)間序列{[bi,fi]},每個(gè)區(qū)間包含一個(gè)標(biāo)簽si∈S,三元組(b,f,s)稱為狀態(tài)區(qū)間。如果滿足?(bi,fi,si),(bj,fj,sj),有bj≤fi≤fj?si≠sj,則稱{(bi,fi,si)}=(b1,f1,s1),(b2,f2,s2),(b3,f3,s3),…是S上的一個(gè)狀態(tài)區(qū)間序列。
定義1要求該序列中的區(qū)間是盡可能擴(kuò)張的。然而,值得關(guān)注的是,該定義既不要求這些區(qū)間之間互不重疊,也不要求對(duì)序列的劃分是完全的,相鄰兩個(gè)區(qū)間之間可以部分重疊,也可以存在間隙。因此,在此定義下,不需要區(qū)分單變量分析和多變量分析的情況,或者說算法本身就具備處理多維數(shù)據(jù)的能力。
2.2.1 概念定義
定義了狀態(tài)區(qū)間序列后,進(jìn)一步考慮區(qū)間之間的關(guān)系。對(duì)區(qū)間之間關(guān)系的描述來源于從現(xiàn)有工作得到的啟發(fā)[8],將兩個(gè)區(qū)間之間的時(shí)間關(guān)系劃分為13種,如表1所示,將這些位置關(guān)系組成的集合記為I。
給定任意n個(gè)狀態(tài)區(qū)間(bi,fi,si),其中1≤i≤n,這n個(gè)區(qū)間的相對(duì)位置關(guān)系可以由一個(gè)n×n的矩陣R描述。矩陣R第i行第j列的值R[i,j]描述第i個(gè)區(qū)間和第j個(gè)區(qū)間的位置關(guān)系,取值為上述13種之一。
表1 區(qū)間A與B的位置關(guān)系及其符號(hào)表示
令S={(bi,fi,si)}表示狀態(tài)區(qū)間的集合。(bi,fi,si)表示si在區(qū)間[bi,fi]中成立,則該三元組描述了一個(gè)變量在一段時(shí)間內(nèi)的狀態(tài),該狀態(tài)被視為對(duì)應(yīng)區(qū)間的標(biāo)簽。由此,給出時(shí)間模式的定義:
定義2時(shí)間模式。稱二元組P=(L,R)為一個(gè)n×n的時(shí)間模式,其中L=(l1,l2,…,ln)為一個(gè)標(biāo)簽序列,R∈In×n為n個(gè)區(qū)間之間相對(duì)位置關(guān)系的描述矩陣。
顯然,在一個(gè)區(qū)間序列中,可能存在很多不同的子序列可以映射到同一個(gè)時(shí)間模式上。對(duì)于一個(gè)狀態(tài)區(qū)間序列{(bi,fi,si),1≤i≤n}和時(shí)間模式(L,R),如果?i,j,1≤i,j≤n,有si=li且ir([bi,fi],[bj,fj])=R[i,j],則稱該狀態(tài)區(qū)間序列是該時(shí)間模式的一個(gè)實(shí)例,其中ir指internal relation,表示兩個(gè)區(qū)間的位置關(guān)系。
2.2.2 算法描述
根據(jù)上述定義,時(shí)間模式可以是任意幾個(gè)狀態(tài)區(qū)間的位置組合。對(duì)于一個(gè)大小為n的狀態(tài)集S,可能存在的時(shí)間模式種類為n的指數(shù)級(jí),只需考慮那些出現(xiàn)頻率更高的時(shí)間模式。因此,需要檢測(cè)給定的時(shí)間模式在狀態(tài)區(qū)間序列中出現(xiàn)的頻率。
算法1子關(guān)系檢測(cè)。
func subsection_ check(P,Q,π)
if dim(P)>dim(Q) then
return false
end if
π(·)←0;
return perm(1,1,P,Q,π)
func perm(i,j,P,Q,π)
found=false
repeat
if sP(i)=sQ(i) then
π(i)=j;ok=true
for k=1 to i do
ok=ok and RP[i,k]=RQ[j,π[k]]
end for
if ok then
if i found=perm(i+1,j+1,P,Q,π) end if end if end if j=j+1 until(j>dim(Q)) or (found) return found 算法1給出了子關(guān)系檢測(cè)方法。對(duì)于兩個(gè)模式P和Q,該算法可以檢測(cè)出P是否為Q的子模式。其中,子模式的定義為,若對(duì)于模式Q,通過刪除Q中的一些狀態(tài)s及其位置關(guān)系可以得到模式P,則P是Q的子模式。 如圖1所示,通過該算法可以檢測(cè)一個(gè)待測(cè)模式P是否位于時(shí)間序列上指定位置的窗口中。沿時(shí)間軸滑動(dòng)該窗口,即可計(jì)算出模式P在全區(qū)間序列中出現(xiàn)的次數(shù),從而獲得最頻繁出現(xiàn)的模式。 對(duì)于任意k頻繁模式,其包含的(k-1)階子模式也應(yīng)該是頻繁的。因此,從k=0開始計(jì)算,每次只保留頻繁的模式,向上即可遞推出k階頻繁模式。改進(jìn)后的算法如算法2所示。 算法2頻繁模式檢測(cè)。 func find_freq_patterns(S,(Ii)i,(Fi)i) k=1 Ck={sinS} repeat suppor_ estimation(Ck,(Ii)i) Fk=P∈Cx|supp(P)> suppmin Ck+1=candidata_ generation(Fk) k=k+1 until Ck=? 基礎(chǔ)的演繹導(dǎo)出方法存在一些問題,即平滑不僅能消除噪聲,也會(huì)在一定程度上消除時(shí)間序列的原始特征。另一方面,即使不考慮隨噪聲被消除的高頻信號(hào)特征,低頻信號(hào)的極值點(diǎn)位置也會(huì)隨平滑過程發(fā)生一定偏移。 一個(gè)典型的時(shí)間序列往往受各種來源信號(hào)分量的影響,每段信號(hào)都有可能是一些在時(shí)域和頻域上有不同行為特征的組合。在這種復(fù)雜的情況下,一般的平滑方法很難選擇一個(gè)合適的核函數(shù)f(u)和帶寬參數(shù)s,也無法將組合在一起的不同頻率的信號(hào)分量拆分開來。本文應(yīng)用基于小波分析(wavelet analysis)的多尺度分析方法,分別在不同尺度中對(duì)信號(hào)進(jìn)行分析,將存在于不同頻域中的信號(hào)區(qū)分開來。 3.1.1 小波分析 小波分析是一種信號(hào)分析技術(shù),用于描述信號(hào)中的局部現(xiàn)象。 與平滑方法的核函數(shù)類似,小波分析中也可以通過參數(shù)s和u調(diào)整母小波(mother wavelet)的尺度和位置,從而得到一系列函數(shù)。具體而言,將母小波函數(shù)ψ(t)進(jìn)行時(shí)間位移u后,再用尺度因子s進(jìn)行放縮,即可得到小波函數(shù) 將小波函數(shù)與待分析信號(hào)f(t)做內(nèi)積,即得到對(duì)信號(hào)f在u時(shí)間作尺度為s的小波變換: 通過Ws,uf得到原始函數(shù)f的方法為 3.1.2 基于小波變換進(jìn)行多尺度分析 多尺度分析方法采用一列近似函數(shù)的極限來逼近原函數(shù),每個(gè)近似函數(shù)都是原函數(shù)的一個(gè)平滑逼近,而且越來越接近原函數(shù),這些函數(shù)是原函數(shù)在不同尺度上的近似,反映了不同尺度上的特征。 對(duì)于快速離散小波變換,將參數(shù)s和u進(jìn)行離散化, s=2m,u=2mk。 頻繁時(shí)間模式發(fā)現(xiàn)方法的復(fù)雜度可以通過剪枝策略進(jìn)一步降低。對(duì)于兩個(gè)k-1維子模式P和Q,其狀態(tài)按照在模式中出現(xiàn)的先后順序排列后,前k-2維的狀態(tài)完全相同,第k-1維狀態(tài)不同,這兩個(gè)子模式中的k個(gè)狀態(tài)組成了一個(gè)k候選模式。算法3給出了上述過程的偽代碼。 算法3搜索剪枝算法。 func candidata_generation(Fk,Ck+1,(EP)P∈Ck+1) Ck+1=?;n=0 for i←1 to |Fkl do thisblock=n+1;j=Fk[i] while Fk[i]=Fk[j] do construct X from Fk[i] and Fk[j] R=r∈I|X satisfies Rx[k,k-1] for r∈R do build k-subpatterns Slof X if card(Ex>suppminin) then n=n+1;Ck+1[n]=X Ck+1[n]=thisblock end if end for end while end for 可以證明,該算法的時(shí)間復(fù)雜度為 O(k·|Fk|·|S|·(k2+log|Fk|+k·L))。 算法先在所有擁有相同k-1前綴的子模式上迭代,時(shí)間代價(jià)為O(|Fk|M),M為最大塊的大小。候選模式X的構(gòu)建時(shí)間復(fù)雜度為O(k+k2),X的k-1子串的構(gòu)建復(fù)雜度為O((k-1)(k+k2))=O(k3)。k-1子模式從Fk中搜尋,時(shí)間代價(jià)為O((k-1)log|Fk|)。 算法復(fù)雜度的主要影響因素為|Fk|和L,序列長(zhǎng)度值L取決于數(shù)據(jù)的規(guī)模。平均復(fù)雜度隨k的變化而變化,當(dāng)k=0和k=kmax時(shí),復(fù)雜度取得極小值。 4.1.1 模擬數(shù)據(jù)集 為了模擬一個(gè)多因素共同影響下的時(shí)間序列,用一個(gè)低頻正弦波模擬低頻信號(hào),一個(gè)高頻正弦波模擬噪聲信號(hào),一個(gè)脈沖信號(hào)模擬異常信號(hào)。如圖3所示,將這3個(gè)信號(hào)疊加來模擬一個(gè)一般的時(shí)序數(shù)據(jù)。 為了評(píng)估算法效果,采用Savitzky-Golay平滑方法作為基線算法進(jìn)行對(duì)照,用基線方法和多尺度分析方法對(duì)該模擬數(shù)據(jù)集進(jìn)行狀態(tài)劃分,結(jié)果如圖4所示。可見基線算法下,噪聲信號(hào)和脈沖信號(hào)均被消除;基于小波分析的方法既能通過小尺度分析發(fā)現(xiàn)脈沖信號(hào),又能通過大尺度分析消除噪聲信號(hào)、發(fā)現(xiàn)低頻信號(hào)。 4.1.2 真實(shí)數(shù)據(jù)集1——心電圖數(shù)據(jù) 使用UCR數(shù)據(jù)集[9]中的“ECG200”數(shù)據(jù),該數(shù)據(jù)為記錄的受試者心電圖數(shù)據(jù),取其訓(xùn)練集中前10個(gè)標(biāo)簽為1的心跳數(shù)據(jù)進(jìn)行拼接,得到本實(shí)驗(yàn)所用數(shù)據(jù)。 實(shí)驗(yàn)結(jié)果如圖5所示。圖5a和圖5b使用的原始數(shù)據(jù)完全相同,豎直虛線表示事件間的分割點(diǎn)(即每?jī)蓷l豎直虛線之間為一個(gè)事件)??梢娀€方法得到的事件信息比較混亂,不能很好地描述每次心跳過程;而多尺度分析方法能夠基本完整地將每次心跳發(fā)現(xiàn)為一個(gè)事件,效果較基線方法明顯提高。 4.1.3 真實(shí)數(shù)據(jù)集2——變電站數(shù)據(jù) 使用某變電站在2020年6月~2020年12月時(shí)間段站內(nèi)機(jī)組各傳感器記錄的時(shí)間序列數(shù)據(jù)集。表2所示為3個(gè)標(biāo)注數(shù)據(jù)上采用平滑方法和多尺度方法劃分的覆蓋率,可見多尺度方法的表現(xiàn)優(yōu)于平滑方法。其中,1號(hào)數(shù)據(jù)是一個(gè)非常典型的工業(yè)時(shí)間序列數(shù)據(jù),包括以天為周期的周期波動(dòng)分量、傳感器噪聲、異常值;2號(hào)數(shù)據(jù)是開關(guān)柜中的臭氧濃度值,一般比較穩(wěn)定,當(dāng)柜內(nèi)出現(xiàn)電弧時(shí),會(huì)產(chǎn)生一個(gè)短暫的異常值;3號(hào)數(shù)據(jù)是設(shè)備溫度數(shù)據(jù),其特征明顯,噪聲和干擾很少。 表2 變電站數(shù)據(jù)集上的狀態(tài)劃分覆蓋率 為了測(cè)試剪枝算法的效果,創(chuàng)建了一個(gè)測(cè)試集,對(duì)原始算法和原始算法結(jié)合剪枝算法的新算法的運(yùn)行時(shí)間進(jìn)行比較。 首先對(duì)算法的優(yōu)化結(jié)果進(jìn)行對(duì)比,表中兩列分別為原始方法和剪枝后方法在測(cè)試集上尋找k階頻繁模式(k=1,2,3,4)所需要的時(shí)間。系統(tǒng)環(huán)境為Window 10,CPU為Intel i5 9400 h,代碼使用Python編寫。測(cè)試結(jié)果如表3所示??梢妅=1,2時(shí),剪枝算法尚未生效;k=3時(shí),剪枝算法的運(yùn)行效率提升88.04%;k=4時(shí),原算法的運(yùn)行時(shí)間已經(jīng)不可接受,而剪枝算法仍然可用。 表3 事件檢測(cè)原算法與結(jié)合剪枝后算法的用時(shí)比較 s 時(shí)間模式長(zhǎng)度為1和2時(shí),剪枝方法尚未生效。對(duì)3階頻繁模式,剪枝方法能夠提升88.04%的算法運(yùn)行效率。k=4時(shí),原算法運(yùn)行時(shí)間已經(jīng)不可接受,而剪枝后的算法仍然可用。 時(shí)間序列數(shù)據(jù)的事件識(shí)別是過程挖掘的重要環(huán)節(jié)之一。從時(shí)間序列出發(fā),在已有工作基礎(chǔ)上,通過數(shù)據(jù)預(yù)處理、狀態(tài)劃分和事件識(shí)別等環(huán)節(jié),能夠從多維時(shí)間序列中提取有效的事件信息,為過程挖掘工作提供數(shù)據(jù)支持。本文在已有事件提取算法基礎(chǔ)上,主要從兩方面進(jìn)行了優(yōu)化和改進(jìn):①引入小波分析方法,在不同頻域上分解原始信號(hào),在多個(gè)尺度上劃分狀態(tài),在消除噪聲信號(hào)的同時(shí)盡可能多地保留原始信號(hào),得到了優(yōu)于函數(shù)近似和平滑算法的結(jié)果;②在頻繁模式發(fā)現(xiàn)階段,通過數(shù)據(jù)結(jié)構(gòu)的優(yōu)化和剪枝策略,在不損失精度的同時(shí)提升了事件識(shí)別的效率。最后,通過模擬數(shù)據(jù)實(shí)驗(yàn)和真實(shí)數(shù)據(jù)集實(shí)驗(yàn),驗(yàn)證了算法的有效性和執(zhí)行效率。未來的研究方向包括對(duì)時(shí)間序列事件挖掘算法進(jìn)行進(jìn)一步優(yōu)化改進(jìn),以及在時(shí)間序列事件信息的基礎(chǔ)上發(fā)展更多下游應(yīng)用(如業(yè)務(wù)流程發(fā)現(xiàn)和驗(yàn)證)等。3 優(yōu)化方案
3.1 演繹導(dǎo)出方法優(yōu)化
3.2 頻繁時(shí)間模式發(fā)現(xiàn)方法優(yōu)化
4 實(shí)驗(yàn)與分析評(píng)價(jià)
4.1 事件檢測(cè)
4.2 剪枝測(cè)試
5 結(jié)束語(yǔ)