吳虎勝?gòu)堷P鳴鐘 斌
①(空軍工程大學(xué)裝備管理與安全工程學(xué)院 西安 710051)②(武警工程大學(xué)裝備工程學(xué)院 西安 710086)
多元時(shí)間序列類型的數(shù)據(jù)在現(xiàn)實(shí)中廣泛存在,其相似性研究的應(yīng)用領(lǐng)域也十分廣泛,如水文數(shù)據(jù)分析[1],飛行質(zhì)量評(píng)估[2],圖像匹配[3],動(dòng)物行為分析[4],腦電圖分析[5]等。因此,研究MTS的相似模式匹配具有重要的現(xiàn)實(shí)意義和廣泛的應(yīng)用前景。
當(dāng)前的相關(guān)研究主要針對(duì)一元時(shí)間序列,產(chǎn)生了一些比較好的理論和方法并獲得了廣泛應(yīng)用[6,7]。多元時(shí)間序列(Multivariate Time Series, MTS)由于其高維、稀疏、變量間關(guān)系復(fù)雜等特點(diǎn),使得對(duì)其進(jìn)行相似模式匹配的研究有一定困難?,F(xiàn)常用的方法有直接歐氏距離法(Eculid Distance, ED),主成分分析法(Principal Component Analysis, PCA),基于點(diǎn)分布特征(Point Distribution, PD)的匹配方法,動(dòng)態(tài)時(shí)間彎曲距離法(Dynamic Time Warping,DTW)等。但很多研究已證明 ED方法的魯棒性不好,即對(duì)時(shí)間序列在垂直和水平方向上的波動(dòng)的魯棒性都不好,對(duì)復(fù)雜的 MTS的描述能力有限[8];PCA方法簡(jiǎn)單且無(wú)參數(shù)限制,對(duì)大規(guī)模的MTS分析具有一定優(yōu)勢(shì)[9]。但 PCA 方法的關(guān)鍵在于求取MTS的有效主成分分量,而這通常要求要有足夠的樣本點(diǎn)才行[10]。另外,PCA方法在計(jì)算兩主成分的夾角余弦2
cos β時(shí)并未考慮兩者的正負(fù)方向(例如,夾角60β=°和120β=°時(shí)將會(huì)得到相同的結(jié)果),從而導(dǎo)致誤判;PD方法從MTS的形狀特征出發(fā),通過(guò)提取MTS的極大值、極小值等9個(gè)局部重要點(diǎn)對(duì)其進(jìn)行模式表示,并借助Eculid距離實(shí)現(xiàn)了相似性度量,對(duì)于如Robot這樣的小規(guī)模數(shù)據(jù)集的匹配具有一定優(yōu)勢(shì)[11]。但該方法未考慮MTS不同變量間量綱和特征差異,且若數(shù)據(jù)集中各MTS樣本的形狀差異較小時(shí)其匹配結(jié)果也不一定可靠;DTW 距離經(jīng)擴(kuò)展后可用于MTS的相似性度量[12],可支持不同時(shí)間跨度的時(shí)間序列間的相似性度量,支持時(shí)間軸的伸縮和彎曲,但其計(jì)算復(fù)雜度較高,不能適應(yīng)大規(guī)模數(shù)據(jù)集的相似匹配[13]。文獻(xiàn)[14]基于DTW距離提出了一種將趨勢(shì)距離(Trend Distance, TD)用于MTS的相似匹配,該方法對(duì)不同規(guī)模的數(shù)據(jù)集都具有一定匹配能力且相對(duì)于DTW距離其計(jì)算效率也有所提高,但該方法計(jì)算復(fù)雜度仍然較大,實(shí)際耗時(shí)較長(zhǎng)。
本文基于2維奇異值分解構(gòu)建了MTS的低階近似特征矩陣作為MTS的模式表示,而后結(jié)合Euclid距離實(shí)現(xiàn)了序列的相似模式匹配,并通過(guò)多組實(shí)驗(yàn)對(duì)比詳細(xì)論述了該方法的有效性。
現(xiàn)實(shí)中,MTS以各種形式廣泛存在,如腦電圖數(shù)據(jù)(EEG),飛行數(shù)據(jù)等。這里將變量數(shù) n大于 1的按時(shí)間先后順序記錄的值(其中稱為 MTS。 t表示時(shí)刻,為第i個(gè)變量在t時(shí)刻的記錄值。在數(shù)據(jù)挖掘領(lǐng)域,非正則化的數(shù)據(jù)之間比較的意義不大,由于MTS各變量間量綱、特征等方面的差異尤其如此,這里給出同構(gòu)的MTS的定義以限定研究對(duì)象。
定義1 同構(gòu)的MTS 同構(gòu)的MTS需要滿足以下條件:(1)對(duì)于MTS數(shù)據(jù)集,各序列樣本的變量維數(shù)相同,變量之間一一對(duì)應(yīng)且表示相同的含義;(2)對(duì)于某一MTS樣本,各變量數(shù)值的記錄時(shí)刻對(duì)應(yīng);(3)MTS需經(jīng)正則化處理。
這里采用Max-min正則化方法將MTS各變量的值都映射到范圍內(nèi),變量i的值v轉(zhuǎn)換后得到的值V為
2維奇異值分解(2D Singular Value Decomposition, 2DSVD)是經(jīng)典奇異值分解的拓展,作為一種很好的低階近似方法,2DSVD可清楚地反應(yīng)諸如 2維圖片序列,2維衛(wèi)星云圖序列等 2維物體的本質(zhì)[15]。通過(guò) 2DSVD 所構(gòu)造的特征是 2維的矩陣而并非 1維的特征向量??衫迷?MTS樣本直接構(gòu)造其行-行,列-列協(xié)方差矩陣并計(jì)算其特征向量實(shí)現(xiàn)對(duì) MTS的特征提取。這里首先給出2DSVD的簡(jiǎn)單描述:
由上述求解過(guò)程可以看出,jM 是從數(shù)據(jù)集整體的角度所得的單個(gè)多元時(shí)間序列 Sj的特征,反應(yīng)的是Sj相對(duì)于其它MTS的特征,更能體現(xiàn)其區(qū)別于其它MTS的本質(zhì)所在。
基于2DSVD可以得到兩個(gè)多元時(shí)間序列Sp和Sq之間的距離由如式(6)所示的最佳低階近似表示。
相似性的判別主要是基于距離的思想,即依據(jù)一定的距離公式(如歐氏距離,DTW距離,最長(zhǎng)公共子串距離,編輯距離等)計(jì)算所比較兩序列之間的距離,認(rèn)為距離越小則兩時(shí)間序列越相似,反之亦然。這里采用計(jì)算簡(jiǎn)便、符合三角不等式的歐氏距離,如式(7)中表示歐氏范數(shù)。通過(guò)計(jì)算距離就可以度量?jī)尚蛄蠸p和Sq之間的距離,再借助于k-近鄰方法就可實(shí)現(xiàn)對(duì)MTS的相似匹配,具體算法流程如表1所示。
表1 基于2DSVD的MTS相似匹配算法流程
對(duì)該相似匹配算法進(jìn)行時(shí)間復(fù)雜度分析。由文獻(xiàn)[16]可知,對(duì)一個(gè)aa×的矩陣進(jìn)行奇異值分解求取其主特征向量的復(fù)雜度為由于,其中m為MTS的長(zhǎng)度或觀測(cè)值數(shù)量,n為MTS的變量數(shù),則步驟(2)~步驟(4)的時(shí)間復(fù)雜度為;步驟(5)為提取各MTS的模式表示,其復(fù)雜度為,其中c為待匹配的 MTS數(shù)據(jù)集樣本總數(shù),r為行-行協(xié)方差矩陣 F的主特征向量數(shù)目,s為列-列協(xié)方差矩陣G的主特征向量數(shù)目;步驟(6),步驟(7)執(zhí)行k-近鄰查詢找出和參考多元時(shí)間序列SR最相似的k個(gè)MTS的時(shí)間復(fù)雜度為。因此,算法的復(fù)雜度為。一般而言,n,k,r,s相對(duì) m和c而言較小,因此算法的復(fù)雜度主要取決于單個(gè)MTS的序列長(zhǎng)度m和MTS數(shù)據(jù)集樣本總數(shù)c。
為分析各方法性能,采用k-近鄰方法進(jìn)行實(shí)驗(yàn),具體描述如下:假定數(shù)據(jù)集中含有n個(gè)MTS,任意抽取一個(gè)作為輸入樣本X,找出與X最相似的“k個(gè)樣本”,一般k取10,5,1。統(tǒng)計(jì)找出的“k個(gè)樣本”中與X同類別的樣本數(shù)量0n,即可計(jì)算準(zhǔn)確率。其它序列依次作為輸入樣本,重復(fù)以上實(shí)驗(yàn),可得到n個(gè)準(zhǔn)確率。如將準(zhǔn)確率視為離散隨機(jī)變量ε,則準(zhǔn)確率的數(shù)學(xué)期望*e可按式(8)確定。
選取不同數(shù)據(jù)規(guī)模、已知分類結(jié)果的3組MTS數(shù)據(jù)集作為實(shí)驗(yàn)對(duì)象:Robot Execution Failure(記為 REF)數(shù)據(jù)集[17],Wafer(記為 WA)數(shù)據(jù)集[18]和Electroencephalography(記為 EEG)數(shù)據(jù)集[19]。
實(shí)驗(yàn)環(huán)境:Windows XP系統(tǒng),CPU 2.00 GHz,內(nèi)存2 G,算法采用Matlab 2008a平臺(tái)下的M語(yǔ)言實(shí)現(xiàn)。
運(yùn)用上述實(shí)驗(yàn)方法,采用ED, PCA, PD, TD和2DSVD共5種方法分別對(duì)REF, Wafer和EEG 3種不同規(guī)模的數(shù)據(jù)集進(jìn)行相似性匹配實(shí)驗(yàn)。
現(xiàn)先以Wafer數(shù)據(jù)集為例進(jìn)行說(shuō)明,它是一組對(duì)半導(dǎo)體加工設(shè)備實(shí)時(shí)監(jiān)控的數(shù)據(jù)集。共采用6個(gè)不同的真空傳感器采集數(shù)據(jù),整個(gè)數(shù)據(jù)集分為兩類,normal和abnormal,分別包含1067和127個(gè)樣本,隨機(jī)抽取其中200個(gè)正常和100個(gè)不正常樣本共300個(gè)樣本進(jìn)行試驗(yàn),樣本的時(shí)間跨度為104~198,屬多變量、不等時(shí)間跨度的中等規(guī)模的MTS數(shù)據(jù)集。將 300個(gè)樣本依次作為輸入樣本進(jìn)行相似模式匹配。試驗(yàn)中 PD方法的分割形式為,模式向量則以極小值,5%, 10%, 25%,50%, 75%, 90%, 95%及極大值共9個(gè)分位點(diǎn)特征來(lái)構(gòu)建[11];PCA方法提取其前3個(gè)主成分作為MTS的模式表示(3個(gè)主元的貢獻(xiàn)率Q>85%);TD方法中設(shè)各變量維度上σ和ω相等,傾斜角差異和時(shí)間跨度差異的權(quán)重值分別為0.8ε=,0.2λ=[14];2DSVD方法所涉及到的參數(shù)設(shè)置為r=33, s=4。另外,采用ED, 2DSVD和PCA方法計(jì)算時(shí),對(duì)樣本進(jìn)行截取使得MTS的時(shí)間跨度皆為104,當(dāng)然也可以采用支持向量機(jī)等方法預(yù)測(cè)使得各 MTS的時(shí)間跨度相同。執(zhí)行k近鄰查詢并統(tǒng)計(jì)不同準(zhǔn)確率上的查詢結(jié)果數(shù)量,結(jié)果如圖1所示。
總體來(lái)看,在匹配正確率為小概率事件的情況下(比如e取值為0,0.1,0.2等),2DSVD和PCA方法,尤其是 2DSVD方法所對(duì)應(yīng)次數(shù)都比其它幾種方法要少;而在正確率為大概率事件時(shí),特別當(dāng)e=1時(shí),2DSVD方法對(duì)應(yīng)的次數(shù)要比其它幾種方法要多??梢?jiàn),對(duì)此種類型的數(shù)據(jù),2DSVD方法在準(zhǔn)確率分布方面具有優(yōu)勢(shì)。其次,表2為采用5種方法依據(jù)k近鄰實(shí)驗(yàn)方法分別計(jì)算得到的相似匹配準(zhǔn)確率的數(shù)學(xué)期望和平均計(jì)算耗時(shí)。對(duì)于Wafer數(shù)據(jù)集這種中等規(guī)模的MTS數(shù)據(jù)集,2DSVD, TD和PCA,特別是 2DSVD方法能取得較好的處理效果,其中2DSVD方法的準(zhǔn)確率最高,達(dá)到了93%左右且計(jì)算耗時(shí)也相對(duì)較短。
圖1 5種模式匹配方法在Wafer數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果
表2 3種數(shù)據(jù)集的相似匹配準(zhǔn)確率的數(shù)學(xué)期望e*(%)及平均計(jì)算耗時(shí)t(ms)
而PD方法的匹配效果卻較差,準(zhǔn)確率期望僅在57%左右。為找出原因,隨機(jī)選取Wafer數(shù)據(jù)集中第90個(gè)樣本(記為WA-90)作為輸入樣本,分別使用5種方法進(jìn)行模式匹配得到最相似的樣本。如圖2所示,得到各匹配樣本與原樣本在形狀上都具有較好的相似性。筆者又對(duì)比了數(shù)據(jù)集中normal類和abnormal類多個(gè)樣本,這些樣本都具有較為相似的形狀特征,僅有一些細(xì)微差異。PD方法是從MTS的3維空間描述出發(fā),提取其極大值、極小值等共9個(gè)局部形狀重要點(diǎn)來(lái)構(gòu)建特征模式向量進(jìn)而刻畫(huà)MTS的特征,是基于MTS的形狀概貌的一種相似匹配方法。而由圖2可見(jiàn),wafer數(shù)據(jù)集中的各樣本在形狀上很相似,以至于采用PD方法進(jìn)行相似匹配時(shí)出現(xiàn)了較多誤判使得匹配效果較差。
REF數(shù)據(jù)集是對(duì) Robot進(jìn)行狀態(tài)監(jiān)測(cè)的數(shù)據(jù)集,從其5個(gè)子數(shù)據(jù)集選取LP1作為實(shí)驗(yàn)數(shù)據(jù)集,LP1共包含 6個(gè)變量,分為 nomal, collision, fr_collision和obstruction共4類,共88個(gè)樣本,時(shí)間跨度均為15,屬于變量維數(shù)低,等時(shí)間跨度的小規(guī)模數(shù)據(jù)集;試驗(yàn)中PD方法的分割形式為:,模式向量構(gòu)建同上,PCA方法提取其前2個(gè)主成分作為MTS的模式表示(前2個(gè)主元的貢獻(xiàn)率 Q>85%);TD方法涉及的參數(shù)同上;2DSVD方法所涉及到的參數(shù)r=3,s=4。如表2所示,對(duì)于LP1數(shù)據(jù)集,TD和PCA方法的處理效果不佳,匹配的準(zhǔn)確率期望值在55%左右。而2DSVD方法的處理效果雖然優(yōu)于PCA方法,卻不及PD方法。從圖3也可看出,對(duì)于此種類型的數(shù)據(jù),PD方法所得結(jié)果在準(zhǔn)確率分布方面具有優(yōu)勢(shì)。
為分析原因,隨機(jī)選取第 66個(gè)樣本(屬obstruction類,記為L(zhǎng)P1-66)作為輸入樣本,分別使用5種方法進(jìn)行模式匹配得到最相似的樣本。如圖4所示,這些MTS樣本都具有不同程度的形狀特征差異且時(shí)間序列長(zhǎng)度較短,PD方法就是基于MTS的局部形狀重要點(diǎn)的分布特性的,因此對(duì)于樣本點(diǎn)較少,突顯局部重要點(diǎn)特征的小規(guī)模MTS數(shù)據(jù)集處理效果最好;TD方法利用擬合線段的傾斜角和時(shí)間跨度作為特征,體現(xiàn)的是序列連續(xù)變化趨勢(shì)而非狀態(tài)點(diǎn)的具體數(shù)值,因而無(wú)法很好地刻畫(huà)出時(shí)間跨度較小,只體現(xiàn)某些狀態(tài)點(diǎn)的 MTS數(shù)據(jù)的特征,所以匹配效果不佳;PCA方法是基于統(tǒng)計(jì)方式的一種相似匹配方法,通常要求足夠的樣本點(diǎn)才能有效求解得到主成分向量。如圖4所示,TD和PCA方法得到的參考樣本與輸入樣本的形狀差異較大,匹配中存在一定的誤判風(fēng)險(xiǎn),特別對(duì)LP1這樣的樣本點(diǎn)數(shù)據(jù)較少的小規(guī)模 MTS數(shù)據(jù)集的相似性模式匹配已不是一種適宜的方法。而 2DSVD方法的特征提取是基于MTS的行-行和列-列協(xié)方差矩陣的主特征向量的,體現(xiàn)的是序列矩陣的2維整體內(nèi)在特征。因此,2DSVD方法對(duì)此類數(shù)據(jù)集仍具有一定刻畫(huà)能力,所得到的匹配樣本與輸入樣本在形狀上也較為相似。
圖2 Wafer數(shù)據(jù)集的相似模式匹配結(jié)果
圖3 5種模式匹配方法在LP1數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果
圖4 LP1數(shù)據(jù)集的相似模式匹配結(jié)果
EEG數(shù)據(jù)集是一組腦電圖數(shù)據(jù)。采用 256 Hz的電極同時(shí)在64個(gè)部位測(cè)得,數(shù)據(jù)來(lái)源于Alcoholic Subjects和Control Subjects兩種人群,共122個(gè)測(cè)試者,對(duì)每個(gè)測(cè)試者進(jìn)行120次測(cè)試。不失一般性,實(shí)驗(yàn)分別隨機(jī)選取編號(hào)為 co2a0000364和co2c0000337兩位實(shí)驗(yàn)者的50次測(cè)試作為實(shí)驗(yàn)數(shù)據(jù)集,共 100個(gè)樣本,時(shí)間跨度均為 256,屬變量維數(shù)高、時(shí)間跨度大的較大規(guī)模MTS數(shù)據(jù)集。試驗(yàn)中PD方法的分割形式為,模式向量構(gòu)建同上;PCA方法提取前 20個(gè)主成分作為 MTS的模式表示(20個(gè)主元的貢獻(xiàn)率Q>85%);TD方法的涉及參數(shù)同上;2DSVD方法所涉及到的參數(shù)r=26, s=5。執(zhí)行k近鄰查詢并統(tǒng)計(jì)查詢中不同準(zhǔn)確率上的查詢結(jié)果數(shù)量,結(jié)果如圖5所示??傮w來(lái)看,當(dāng)匹配正確率為小概率事件的情況下,2DSVD和TD方法,尤其是2DSVD方法所對(duì)應(yīng)次數(shù)都比其它幾種方法要少;而在正確率為大概率事件時(shí),2DSVD方法對(duì)應(yīng)的次數(shù)要比其它幾種方法要多,而ED的準(zhǔn)確率分布卻剛好相反。可見(jiàn),對(duì)此類型的數(shù)據(jù),2DSVD方法所得的結(jié)果在準(zhǔn)確率分布方面具有優(yōu)勢(shì)。
由表2可見(jiàn),對(duì)于EEG數(shù)據(jù)集,從準(zhǔn)確率期望來(lái)看,除ED和PD外,其它4種方法都能得到很好的相似模式匹配效果。由圖 6也可看出,TD,2DSVD, PCA方法匹配所得樣本與輸入樣本在形狀上比較相似,而ED和PD方法匹配所得樣本與輸入樣本在形狀上差異較大。主要由于ED逐點(diǎn)對(duì)齊匹配的方式對(duì)于EEG這樣較大規(guī)模的MTS數(shù)據(jù)集已不適用,誤差較大且耗時(shí)也相對(duì)較長(zhǎng);而PD方法的匹配效果相對(duì)另外3種方法又稍差。分析認(rèn)為EEG的數(shù)據(jù)量較大且其3維形狀特征較為復(fù)雜,僅利用極大值點(diǎn)、極小值點(diǎn)等9個(gè)局部重要點(diǎn)來(lái)描述MTS的特征已顯不足,匹配中不可避免地出現(xiàn)誤判;對(duì)于PCA方法,由于樣本點(diǎn)數(shù)量較大,能較為有效地求取MTS的主成分,因而處理效果相對(duì)處理LP1數(shù)據(jù)集時(shí)要好,準(zhǔn)確率期望稍好。TD方法能較好地體現(xiàn)序列的連續(xù)變化趨勢(shì),匹配效果較好,準(zhǔn)確率期望達(dá)到94%左右。但由于TD方法是基于DTW 的,雖進(jìn)行了優(yōu)化但計(jì)算耗時(shí)還是相對(duì)其它幾種方法要長(zhǎng)很多;2DSVD方法是從MTS數(shù)據(jù)集整體的角度,依據(jù)每個(gè)樣本矩陣的本質(zhì)特點(diǎn)計(jì)算得到其各自的低階近似,計(jì)算簡(jiǎn)明,匹配效果最好,對(duì)于 EEG數(shù)據(jù)集匹配準(zhǔn)確率期望達(dá)到 95%,以上且計(jì)算耗時(shí)也相對(duì)較短,較其它幾種方法具有明顯的優(yōu)勢(shì)。
綜上可見(jiàn),2DSVD方法對(duì)不同規(guī)模的MTS數(shù)據(jù)集都具有一定的處理能力且計(jì)算耗時(shí)相對(duì)較短,尤其對(duì)于如EEG數(shù)據(jù)集這樣的多變量,等時(shí)間跨度的較大規(guī)模的MTS數(shù)據(jù)集匹配效果最佳,綜合性能較優(yōu),優(yōu)于其它4種方法。如表3所示,本文從多個(gè)角度對(duì)5種方法進(jìn)行了詳細(xì)的對(duì)比。
圖5 5種模式匹配方法在EEG數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果
圖6 LP1數(shù)據(jù)集的相似模式匹配結(jié)果
表3 5種匹配方法對(duì)比
本文基于 2DSVD提出了一種新的,適用于MTS的相似模式匹配方法,通過(guò)從MTS數(shù)據(jù)集整體的角度分別計(jì)算MTS的行-行和列-列矩陣的協(xié)方差矩陣的主特征向量來(lái)構(gòu)建各 MTS的模式表示矩陣,并借助 Eculid距離實(shí)現(xiàn)相似性度量。通過(guò)與ED, PCA, PD, TD共4種方法對(duì)于3種不同規(guī)模的MTS數(shù)據(jù)集的仿真實(shí)驗(yàn)例證了本文方法的有效性,并在試驗(yàn)的基礎(chǔ)上從模式表示、相似性度量等4個(gè)方面總結(jié)了5種方法各自的特點(diǎn)。實(shí)驗(yàn)表明本文方法充分利用了MTS的矩陣2維本質(zhì)特征,不受數(shù)據(jù)集中 MTS樣本的形狀特征限制,對(duì)不同規(guī)模的MTS數(shù)據(jù)集均有一定的刻畫(huà)能力,且計(jì)算耗時(shí)相對(duì)較短。尤其對(duì)如EEG數(shù)據(jù)集這樣的等時(shí)間跨度的較大規(guī)模MTS數(shù)據(jù)集的匹配具有明顯優(yōu)勢(shì),準(zhǔn)確率期望達(dá)到95%左右。但如何依據(jù)本文方法構(gòu)建數(shù)據(jù)索引以利于MTS的快速檢索與查詢,將是我們接下來(lái)要著力解決的問(wèn)題和研究方向。
[1] 李士進(jìn), 朱躍龍, 張曉花, 等. 基于BORDA計(jì)數(shù)法的多元水文時(shí)間序列相似性分析[J]. 水利學(xué)報(bào), 2009, 40(3): 378-384.Li Shi-jin, Zhu Yue-long, Zhang Xiao-hua, et al.. BORDA counting method based similarity analysis of multivariate hydrological time series[J]. Journal of SHUILI, 2009, 40(3):378-384.
[2] 毛紅保, 張鳳鳴, 馮卉, 等. 多元飛行數(shù)據(jù)相似模式查詢[J].計(jì)算機(jī)工程與應(yīng)用, 2011, 47(16): 151-155.Mao Hong-bao, Zhang Feng-ming, Feng Hui, et al..Similarity-based pattern querying in multivariate flight data[J]. Computer Engineering and Application, 2011, 47(16):151-155.
[3] 周瑜, 劉俊濤, 白翔. 形狀匹配方法研究與展望[J]. 自動(dòng)化學(xué)報(bào), 2012, 38(6): 889-910.Zhou Yu, Liu Jun-tao, and Bai Xiang. Research and perspective on shape matching[J]. Acta Automatica Sinica,2012, 38(6): 889-910.
[4] 尹令, 洪添勝, 劉漢興, 等. 結(jié)構(gòu)相似子序列快速聚類算法及其在奶牛發(fā)情檢測(cè)中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2012, 28(15):107-112.Yin Ling, Hong Tian-sheng, Liu Han-xing, et al..Subsequence clustering algorithm based on structural similarity and its application in cow estrus detection[J].Transaction of the Chinese Society of Agricultural Engineering, 2012, 28(15): 107-122.
[5] Hanna G, Marek D, Leszek K, et al.. Detection of similar sequences in EEG maps series using correlation coefficients matrix[J]. Machine Graphics & Vision International Journal,2011, 20(1): 73-92.
[6] Keogh E, Li W, Xi X P, et al.. Supporting exact indexing of arbitrarily rotated shapes and periodic time series under Euclidean and warping distance measures[J]. The VLDB Journal, 2009, 18(3): 611-630.
[7] 劉博寧, 張建業(yè), 張鵬, 等. 基于曲率距離的時(shí)間序列相似性搜索方法[J]. 電子與信息學(xué)報(bào), 2012, 34(9): 2200-2207.Liu Bo-ning, Zhang Jian-ye, Zhang Peng, et al.. Similarity search method in time series based on curvature distance[J].Journal of Electronics & Information Technology, 2012, 34(9):2200-2207.
[8] Li Hai-lin, Guo Chong-hui, and Qiu Wang-ren. Similarity measure based on piecewise linear approximation and derivative dynamic time warping for time series mining[J].Expert Systems with Applications, 2011, 38(12): 14732-14743.
[9] Yang K and Shahabi C. A pca-based similarity measure for multivariate time series[C]. Proceedings of the Second ACM International workshop on Multimedia Databases,Washington DC, USA, 2004: 65-74.
[10] Singhal A and Seborg D E. Pattern matching in multivariate time series databases using a moving window approach[J].Industrial and Engineering Chemistry Research, 2002, 41(16):3822-3828.
[11] 管河山, 姜青山, 王聲瑞. 基于點(diǎn)分布特征的多元時(shí)間序列模式匹配方法[J]. 軟件學(xué)報(bào), 2009, 20(1): 67-79.Guan He-shan, Jiang Qing-shan, and Wang Sheng-rui.Pattern matching method based on point distribution for multivariate time series[J]. Journal of Software, 2009, 20(1):67-79.
[12] Zoltan B and Janos A. Correlation based dynamic time warping of multivariate time series[J]. Expert Systems with Applications, 2012, 39(17): 12814-12823.
[13] Stephan S, Brijnesh J, and Ernesto W D. Pattern recognition in multivariate time series[C]. Proceedings of the fourth workshop on workshop for Ph. D. students in information &knowledge management, Glasgow, UK, 2011: 27-34.
[14] 李正欣, 張鳳鳴, 李克武. 多元時(shí)間序列模式匹配方法研究[J].控制與決策, 2011, 26(4): 565-570.Li Zheng-xin, Zhang Feng-ming, and Li Ke-wu. Research on pattern matching method for multivariate time series[J].Control and Decision, 2011, 26(4): 565-570.
[15] Chris D and Ye J. Two-dimensional singular decomposition(2DSVD) for 2D maps and images[C]. Proceedings of the fifth IEEE International Conference on Data Mining. Houston,USA, 2005: 32-43.
[16] Brand M. Incremental singular value decomposition of uncertain data with missing values[C]. Proceedings of the 2002 European Conference on Computer Vision, Copenhagen,Denmark, 2002, 3: 1-12.
[17] Lopes L S and Camarinha L M. Robot execution failures[OL].http://kdd.ics.uci.edu/databases/robotfailure/robotfailure.html. 2012.
[18] Bobski. Wafer database [OL]. http://www.cs.cmu.edu/bobski.html. 2013.
[19] Begleiter H.EEG database [OL]. http://kdd.ics.uci.edu/databases/eeg/eeg.html. 2012.