亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于相關(guān)性密度的多變量時(shí)間序列屬性選擇

        2018-01-03 01:58:49張坤華丁立新萬(wàn)潤(rùn)澤
        關(guān)鍵詞:子集準(zhǔn)確率密度

        張坤華 丁立新 萬(wàn)潤(rùn)澤

        (武漢大學(xué)計(jì)算機(jī)學(xué)院 湖北 武漢 430072)

        基于相關(guān)性密度的多變量時(shí)間序列屬性選擇

        張坤華 丁立新 萬(wàn)潤(rùn)澤

        (武漢大學(xué)計(jì)算機(jī)學(xué)院 湖北 武漢 430072)

        屬性選擇是一種有效的數(shù)據(jù)預(yù)處理方法。為了移除多變量時(shí)間序列屬性集中的冗余屬性和噪聲屬性,選擇出包含足夠原始信息并能提高精度的屬性子集,提出一種基于相關(guān)性密度的屬性選擇算法。該算法使用相關(guān)性矩陣表示原多變量時(shí)間序列,定義每個(gè)屬性的局部密度來(lái)表示屬性的代表性,定義屬性的判別距離作為該屬性與其他屬性間的區(qū)分度。最后根據(jù)決策圖的分布來(lái)篩選具有較大代表性和區(qū)分度的屬性。使用SVM分類器對(duì)UCI數(shù)據(jù)庫(kù)中的4種不同數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明該算法相比已有算法在分類準(zhǔn)確度和時(shí)間效率上均有一定的優(yōu)越性。

        多變量時(shí)間序列 相關(guān)性矩陣 決策圖 密度 屬性選擇

        0 引 言

        時(shí)間序列是指一組按時(shí)間順序排列的數(shù)據(jù),并廣泛應(yīng)用于眾多領(lǐng)域,如金融股市預(yù)測(cè)[1]、醫(yī)療數(shù)據(jù)記錄[2]、氣象預(yù)報(bào)[3]和工業(yè)產(chǎn)品質(zhì)量控制分析[4]等。根據(jù)時(shí)間序列中記錄的變量個(gè)數(shù),時(shí)間序列又分為單變量時(shí)間序列UTS(Univariate Time Series)和多變量時(shí)間序列MTS(Multivariate Time Series)[5]。相比單變量時(shí)間序列,多變量時(shí)間序列同時(shí)具有時(shí)間維和變量維的信息,提供的數(shù)據(jù)信息更豐富,但給后續(xù)的針對(duì)多變量時(shí)間序列的挖掘研究分析和數(shù)據(jù)挖掘任務(wù)提高了難度,因此對(duì)多變量時(shí)間序列降維預(yù)處理是十分必要的。多變量時(shí)間序列的降維,主要分為特征表示和屬性選擇,特征表示將原時(shí)間序列映射到另一低維空間,并盡可能地表達(dá)原時(shí)間序列信息[6],但卻失去了與原空間特征間的一一對(duì)應(yīng)關(guān)系和實(shí)際物理意義,不便于后續(xù)理解和認(rèn)知。屬性選擇是從原時(shí)間序列的高維空間中挑選出一組最有代表性的變量屬性[7],在篩選后的屬性子集中進(jìn)行后續(xù)操作,以提高效率和精度。本文主要針對(duì)多變量時(shí)間序列的變量維數(shù)約簡(jiǎn),即屬性選擇。

        目前很多學(xué)者對(duì)多變量時(shí)間序列屬性選擇作了深入研究,并提出了一些優(yōu)化算法。文獻(xiàn)[8]提出了基于度量學(xué)習(xí)的無(wú)監(jiān)督屬性選擇算法。文獻(xiàn)[9]提出了基于分形維數(shù)計(jì)算和離散粒子群優(yōu)化的屬性選擇算法。文獻(xiàn)[10]提出了基于RFE的屬性選擇算法。相對(duì)經(jīng)典的算法是文獻(xiàn)[11]提出了基于公共主成分屬性選擇算法(CleVer)。該算法基于以下假設(shè):在所有的多變量時(shí)間序列中存在一個(gè)由正交向量構(gòu)成的公共子空間,各序列在該公共子空間上的投影能夠最大程度地體現(xiàn)出差異性,投影后獲得與所有序列主成分最接近的描述公共主成分,根據(jù)每個(gè)屬性對(duì)描述公共主成分的貢獻(xiàn)度進(jìn)行排名,從排名高的屬性集中篩選屬性子集,但在實(shí)際情況中,一個(gè)MTS數(shù)據(jù)集會(huì)存在多個(gè)不同的類別,將不同類別的子空間投影為一類,造成了信息損失[12]。文獻(xiàn)[13]提出基于互信息和類可分離性的屬性選擇算法(CSFS),由類可分離性引申出屬性可分離性,將其定義為屬性間離散矩陣和已選屬性子集離散矩陣的比值,用于評(píng)估屬性間的冗余度,使用互信息對(duì)MTS進(jìn)行特征提取后,根據(jù)冗余度降序排列進(jìn)行屬性選擇。然而利用互信息計(jì)算相關(guān)性時(shí),計(jì)算變量間的概率密度函數(shù)是十分困難的,需要借助其他函數(shù)估計(jì)互信息值,時(shí)間復(fù)雜度較高[14],且基于類可分離性是一種監(jiān)督方法,在數(shù)據(jù)缺失類標(biāo)信息時(shí),該算法得不到較好的應(yīng)用。文獻(xiàn)[15]提出一種增量互相關(guān)過(guò)濾式屬性選擇算法(ICF),該算法通過(guò)滑動(dòng)點(diǎn)積計(jì)算兩個(gè)傳感器時(shí)間序列的偏移量作為屬性間冗余度,設(shè)定冗余度閾值去除冗余屬性和噪聲屬性,最后基于迭代應(yīng)用程序中的一組選擇消除規(guī)則進(jìn)行前向式屬性選擇,但如何選取最優(yōu)的閾值尚未明確。

        基于密度的快速聚類算法[16]由Rodriguez等提出,該算法認(rèn)為聚類中心具有較高的局部密度和與其他高密度樣本較遠(yuǎn)的特點(diǎn),通過(guò)構(gòu)建樣本點(diǎn)和類之間的隸屬關(guān)系,發(fā)現(xiàn)任意維度和形狀的樣本中最大密度點(diǎn)群。Liu P等[17]使用該算法進(jìn)行文本聚類,實(shí)驗(yàn)結(jié)果表明該算法在提高文本聚類性能和降低誤報(bào)率上均取得明顯效果。Chen等[18]利用該算法實(shí)現(xiàn)纖維束的自動(dòng)分割,通過(guò)聚類圖像獲取感興趣的光纖束,聚類結(jié)果與描述纖維束顯示了高度一致性。Sun等[19]利用該算法完成高光譜圖像波段篩選,將篩選后的波段完成地物分類,并驗(yàn)證有效性。

        本文在快速聚類算法基礎(chǔ)上,提出一種有效的多變量時(shí)間序列屬性選擇算法,具有以下特點(diǎn):1) 將原多變量時(shí)間序列轉(zhuǎn)為相關(guān)性矩陣,降維同時(shí)獲取屬性間的相關(guān)關(guān)系;2) 提出基于屬性相關(guān)性密度排序的屬性子集選擇方法ACDR(attribute subset selection based on attribute correlation density ranking),定義多變量時(shí)間序列屬性的局部密度表示該屬性的代表度,定義屬性的判別距離表示與其他屬性的區(qū)分度,根據(jù)上述兩個(gè)量繪制出決策圖,根據(jù)決策圖的分布篩選出最優(yōu)屬性子集。將篩選后的屬性子集代替原屬性集,并與文獻(xiàn)[11-13]中所提算法在分類準(zhǔn)確率上和時(shí)間效率上進(jìn)行對(duì)比。

        1 多變量時(shí)間序列屬性選擇方法

        1.1 多變量時(shí)間序列表示

        一個(gè)多變量時(shí)間序列X可以使用n×m的矩陣表示,記為X=(X1,X2,…,Xm)=(xij)n×m。

        式中:m代表變量維度即屬性個(gè)數(shù),n代表時(shí)間維度,Xi表示第i維長(zhǎng)度為n的屬性序列,t=1,2,…,n,xij表示第j維屬性在第i時(shí)的記錄值,且一般情況下n?m,當(dāng)m=1時(shí),該時(shí)間序列為單變量時(shí)間序列。

        1.2 多變量時(shí)間序列相似性度量

        假設(shè)存在兩個(gè)多變量時(shí)間序列(MTS),分別為Xn1×m1和Xn2×m2。通常在同一個(gè)數(shù)據(jù)集中,這兩個(gè)MTS包含的屬性個(gè)數(shù)相同,但是時(shí)間長(zhǎng)度可能不同,即m1=m2,n1≠n2。此時(shí)計(jì)算兩個(gè)MTS之間的相似度存在以下問(wèn)題: 1) 當(dāng)兩個(gè)MTS長(zhǎng)度不相等時(shí)不能直接使用歐式距離度量公式計(jì)算其相似性,而使用DTW算法[20]雖然支持伸縮時(shí)間軸,但計(jì)算復(fù)雜度高,當(dāng)序列維度較大時(shí)適用性不強(qiáng);2) 多變量時(shí)間序列不是多個(gè)單變量時(shí)間序列的簡(jiǎn)單組合,屬性之間往往存在重要關(guān)聯(lián),若直接拼接成行向量,會(huì)造成屬性間相關(guān)信息的丟失。為克服以上問(wèn)題,本文使用相關(guān)性矩陣代替原時(shí)間序列,具體步驟如下:

        1.2.1 計(jì)算MTS屬性間相關(guān)性

        定義1Xi和Xj分別為MTS的第i維和第j維屬性,Xi=(x1i,x2i,…,xni)T,Xj=(x1j,x2j,…,xnj)T,則它們之間的相關(guān)性可表示為:

        (1)

        (2)

        (3)

        R(Xi,Xj)值取-1到1之間,正值表示兩個(gè)屬性間正相關(guān),負(fù)值表示負(fù)相關(guān),零表示無(wú)相關(guān)性,即兩個(gè)屬性是獨(dú)立的。

        1.2.2 計(jì)算相關(guān)性矩陣

        通過(guò)計(jì)算MTS中屬性間相關(guān)性,一個(gè)數(shù)據(jù)集中第j個(gè)MTS即可表示為Mj(j=1,2,…,n),即:

        通常一個(gè)有意義的多變量時(shí)間序列觀察值n?m,原多變量時(shí)間序列轉(zhuǎn)化為相關(guān)性矩陣后維度由n×m降為m×m,數(shù)據(jù)規(guī)模大大減小,且保留了屬性間相關(guān)關(guān)系信息,相關(guān)性矩陣大小只與屬性個(gè)數(shù)有關(guān),與時(shí)間長(zhǎng)度無(wú)關(guān),有利于非等長(zhǎng)MTS間相似性度量。使用相關(guān)性矩陣表示的兩個(gè)MTS間的相似度為:

        (4)

        式中:m為MTS的屬性維度,‖*‖為歐氏距離。

        1.3 屬性的代表度和區(qū)分度

        樣本間的相似度表示除了距離度量、信息度量、還有相關(guān)性度量和一致性度量[21],本文使用屬性間的相關(guān)性來(lái)衡量其相似度。

        定義2一個(gè)多變量時(shí)間序列任意兩個(gè)屬性間的相似度為:

        d(Xi,Xj)=R(Xi,Xj)

        (5)

        式中:R(Xi,Xj)為式(1)中的計(jì)算結(jié)果。

        定義3屬性Xi序列的局部密度ρi定義為:

        (6)

        (7)

        也可以用高斯核函數(shù)形式表示:

        (8)

        式中:dij表示屬性Xi到屬性Xj間的相似度距離,dc表示截?cái)嗑嚯x,Rodriguez等[16]指出dc值的選擇標(biāo)準(zhǔn)為:使每個(gè)樣本點(diǎn)近鄰數(shù)約為樣本總數(shù)的1%~2%時(shí)聚類效果較好,本文實(shí)驗(yàn)中取2%,局部密度ρi越大,表示該屬性在局部鄰域內(nèi)越稠密,屬性的代表度越高。

        定義4定義屬性Xi序列的判別距離δi為:

        (9)

        δi為該屬性到比該屬性局部密度更大屬性的最小距離,當(dāng)屬性Xi的具有最大局部密度時(shí),δi=maxj(dij),δi越大表示,該屬性與其他屬性間的區(qū)分度越大,說(shuō)明屬性Xi與屬性Xj的冗余度越小。

        1.4 決策圖

        計(jì)算出局部密度ρi和判別距離δi后,根據(jù)這兩個(gè)值繪制決策圖。選取UCI數(shù)據(jù)庫(kù)中的BCI數(shù)據(jù)集,該數(shù)據(jù)集屬性個(gè)數(shù)為28個(gè),該數(shù)據(jù)集屬性生成的決策圖如圖1所示。

        圖1 BCI數(shù)據(jù)集決策圖

        根據(jù)定義3和定義4可知,具有較高代表度、區(qū)分度的屬性,位于決策圖中的右上區(qū)域。

        定義5選擇參考指數(shù)ri

        從決策圖中可以直觀地看出重要度不同的屬性位置相差較大,我們需要的是選取同時(shí)具有較大δi值和較大ρi值的屬性作為特征屬性,如果手動(dòng)選取則會(huì)非常耗時(shí),為此,本文定義了參考指數(shù)ri,計(jì)算δi和ρi乘積作為選擇參考指數(shù),表示為:

        ri=δi×ρi

        (10)

        按照ri的降序排列,依次選取選取前k個(gè)屬性構(gòu)成屬性子集。

        圖2 BCI屬性參考指數(shù)排序圖

        通過(guò)以上分析,本文算法具有以下幾個(gè)特點(diǎn):1) 使用相關(guān)性矩陣表示原多變量時(shí)間序列,保留多變量時(shí)間序列屬性間相關(guān)關(guān)系并降低時(shí)間復(fù)雜度,提高后續(xù)計(jì)算效率;2) 該算法是無(wú)監(jiān)督屬性選擇算法,在缺少類標(biāo)信息的時(shí)間序列中也能得到應(yīng)用,克服缺少類標(biāo)簽或獲取代價(jià)較大的缺點(diǎn);3) 首次將快速聚類算法[16]應(yīng)用于多變量時(shí)間序列的屬性選擇,根據(jù)選擇參考指數(shù)排名來(lái)篩選屬性;4) 無(wú)需進(jìn)行子集搜索,可以在短時(shí)間內(nèi)完成計(jì)算,避免子集搜索引起的局部最優(yōu);5) 可以通過(guò)下降值的拐點(diǎn)來(lái)確定最優(yōu)屬性子集的個(gè)數(shù)。

        2 算法流程

        問(wèn)題描述:給定一個(gè)多變量時(shí)間序列集合X=(X1,X2,…,Xm),包含m種屬性,且每種屬性對(duì)應(yīng)一個(gè)時(shí)間序列,尋找時(shí)間序列X的屬性子集X′,使其滿足:

        X′={X1,X2,…,Xk}?X={X1,X2,…,Xm},k?m

        算法基于相關(guān)性密度的多變量時(shí)間序列屬性選擇

        輸入:多變量時(shí)間序列X

        輸出:X的屬性子集X′

        1:計(jì)算該時(shí)間序列每個(gè)屬性和其他屬性間相關(guān)性R(Xi,Xj)

        2:得到該時(shí)間序列的相關(guān)性矩陣M

        3:計(jì)算時(shí)間序列每個(gè)屬性的局部密度ρi

        4:計(jì)算時(shí)間序列每個(gè)屬性的判別距離δi

        5:計(jì)算每個(gè)屬性選擇參考指數(shù)ri=δi×ρi

        6:對(duì)ri排序,選取相關(guān)性矩陣M中前k個(gè)屬性構(gòu)成屬性子集

        3 實(shí)驗(yàn)結(jié)果和分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)

        本文使用的數(shù)據(jù)是來(lái)自UCI數(shù)據(jù)庫(kù)中的4種數(shù)據(jù)集,分別為EEG、BCI、JV、Wafer。其中EEG為一組醉酒者和正常人群通過(guò)采樣頻率為256 Hz在受試者頭部放置的64個(gè)采樣點(diǎn)采集時(shí)長(zhǎng)為1 s的腦電圖數(shù)據(jù),BCI為一組采集左右手運(yùn)動(dòng)對(duì)應(yīng)的28個(gè)皮層電位信息數(shù)據(jù),JV為一組記錄9位日本男性的12個(gè)LPC同態(tài)普數(shù)據(jù)描述的發(fā)音過(guò)程數(shù)據(jù),Wafer為一組記錄晶硅體生產(chǎn)過(guò)程放置的6個(gè)傳感器記錄的微電子序列數(shù)據(jù),表1為4種數(shù)據(jù)集的詳細(xì)信息描述。采用LIBSVM[22]程序包實(shí)現(xiàn)的線性核支持向量機(jī)(SVM)作為分類器,采用10倍交叉驗(yàn)證,將每個(gè)數(shù)據(jù)集分成訓(xùn)練和測(cè)試數(shù)據(jù)集,以準(zhǔn)確率作為分類結(jié)果評(píng)價(jià)指標(biāo)。準(zhǔn)確率定義如下:

        準(zhǔn)確率=正確分類的樣本數(shù)/總樣本數(shù)

        為消除實(shí)驗(yàn)結(jié)果的偶然性和平臺(tái)環(huán)境的不穩(wěn)定性對(duì)實(shí)驗(yàn)結(jié)果造成的影響,每次實(shí)驗(yàn)都是重復(fù)10次并取平均值,本文的所有實(shí)驗(yàn)均在表2所示的實(shí)驗(yàn)環(huán)境中完成。

        表1 數(shù)據(jù)集描述

        表2 實(shí)驗(yàn)環(huán)境及配置

        3.2 實(shí)驗(yàn)結(jié)果及分析

        將本文算法ACDR與已有的3種多變量時(shí)間序列屬性選擇算法CleVer[11]、CSFS[13]、ICF[15]在表1中4種數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),通過(guò)比較分類準(zhǔn)確率和運(yùn)行時(shí)間來(lái)評(píng)估本文算法的有效性和優(yōu)越性。4種算法在不同數(shù)據(jù)集中的分類準(zhǔn)確率結(jié)果分別如圖3-圖6所示,橫坐標(biāo)表示選擇屬性的個(gè)數(shù),縱坐標(biāo)為分類準(zhǔn)確率。4種算法的最優(yōu)分類準(zhǔn)確率和平均分類準(zhǔn)確率如表3所示,各算法的運(yùn)行時(shí)間如表4所示,其中粗體表示最優(yōu)結(jié)果。

        圖3 EEG數(shù)據(jù)集分類結(jié)果

        圖4 BCI數(shù)據(jù)集分類結(jié)果

        圖5 JV數(shù)據(jù)集分類結(jié)果

        圖6 Wafer數(shù)據(jù)集分類結(jié)果

        數(shù)據(jù)集算法最優(yōu)準(zhǔn)確率/%平均準(zhǔn)確率/%EEGACDR98.4292.43CSFS97.9692.04ICF97.5090.15CleVer95.6087.02BCIACDR78.3174.54CSFS77.2873.80ICF70.9166.78CleVer67.4759.77JVACDR72.4871.63CSFS74.1772.02ICF71.2270.10CleVer72.6069.50WaferACDR90.8776.15CSFS84.8179.11ICF85.3173.70CleVer84.8171.29

        表4 4種算法的運(yùn)行時(shí)間

        由圖3~圖6可以看出,在EEG數(shù)據(jù)集中,當(dāng)屬性維數(shù)為1~35時(shí),本文算法性能與其他3種算法相差無(wú)幾,當(dāng)屬性維數(shù)為36~64時(shí),本文算法優(yōu)勢(shì)逐漸顯著。在BCI數(shù)據(jù)集中,除個(gè)別維數(shù)外,本文算法分類準(zhǔn)確率上均高于其他3種算法。在JV數(shù)據(jù)集中,本文算法的分類效果較為平穩(wěn),分類效果整體上優(yōu)于ICF算法和CleVer算法,當(dāng)屬性個(gè)數(shù)為1~5時(shí),分類準(zhǔn)確率僅次于CSFS算法,當(dāng)屬性個(gè)數(shù)為6~12時(shí),準(zhǔn)確率和CSFS算法、CleVer算法相持平。在Wafer數(shù)據(jù)集中,本文算法性能不太穩(wěn)定,當(dāng)屬性個(gè)數(shù)為2~3時(shí),本文算法性能低于CSFS算法,屬性個(gè)數(shù)為4時(shí),分類性能低于CSFS算法和ICF算法,但當(dāng)屬性個(gè)數(shù)為5時(shí),卻達(dá)到了最優(yōu)準(zhǔn)確率,當(dāng)屬性個(gè)數(shù)為6時(shí),性能與其他3種算法趨于一致。

        由表3可知,本文算法在EEG和BCI數(shù)據(jù)集中均取得了最高的最優(yōu)分類準(zhǔn)確率和平均分類準(zhǔn)確率。在JV數(shù)據(jù)集中,分類性能僅次于CSFS算法,準(zhǔn)確率分別高出ICF算法1.26%、1.53%,平均分類性能高于CleVer算法3.13%。在Wafer數(shù)據(jù)集中,本文算法獲得了最優(yōu)分類準(zhǔn)確率,平均分類準(zhǔn)確率僅次于CSFS算法,準(zhǔn)確率分別高于ICF算法5.56%、2.45%,CleVer算法6.06%、4.86%。綜合可知,在四種算法中,本文算法和CSFS算法相對(duì)于ICF算法和CleVer算法分類性能有較明顯的優(yōu)勢(shì),并在不同數(shù)據(jù)集中分別獲得了最優(yōu)分類性能。

        由表4可知,4種算法中,CSFS算法的平均時(shí)間開(kāi)銷最大,CleVer次之,本文算法和ICF算法相差無(wú)幾。本文算法在4種數(shù)據(jù)集上的平均運(yùn)行時(shí)間分別為CSFS算法平均運(yùn)行時(shí)間的19.52%、CleVer算法平均運(yùn)行時(shí)間的43.79%,ICF算法93.02%,并在BCI數(shù)據(jù)集和Wafer數(shù)據(jù)集中取得了最優(yōu)時(shí)間效率。

        綜合以上可知,在分類準(zhǔn)確率上,本文算法和CSFS算法在不同數(shù)據(jù)集中均明顯優(yōu)于ICF算法和CleVer算法。在運(yùn)行效率上,本文算法和ICF算法明顯優(yōu)于CSFS算法和CleVer算法。由于CSFS是一種監(jiān)督的屬性選擇算法,平均分類準(zhǔn)確率雖較高,但時(shí)間開(kāi)銷大,而ICF算法運(yùn)行效率高,但在4種數(shù)據(jù)集中的準(zhǔn)確率均不如本文算法,故本文算法在綜合分類準(zhǔn)確率和時(shí)間效率整體性能上較其他3種算法更優(yōu)。

        4 結(jié) 語(yǔ)

        針對(duì)現(xiàn)有的多變量時(shí)間序列屬性選擇算法準(zhǔn)確率不高、時(shí)間復(fù)雜度高的情況,提出了一種基于相關(guān)性密度的多變量時(shí)間序列屬性選擇算法,將原多變量時(shí)間序列轉(zhuǎn)為相關(guān)性矩陣,根據(jù)屬性相關(guān)性密度進(jìn)行選擇,選擇的過(guò)程可以被看作是聚類過(guò)程,聚類中心可以作為屬性集的代表屬性,并與其他屬性具有較少的冗余度,根據(jù)定義計(jì)算出屬性的局部密度和判別距離后繪制決策圖并根據(jù)參考指數(shù)排名選擇屬性。對(duì)UCI數(shù)據(jù)庫(kù)中4種數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果分析表明,在綜合分類準(zhǔn)確率和時(shí)間效率整體性能上,本文算法是一種有效的多變量時(shí)間序列屬性選擇方法。此外,屬性參考指數(shù)排序圖中可以看出有明顯的拐點(diǎn),在接下來(lái)的工作中,將圍繞確定圖中下降值的拐點(diǎn)來(lái)選擇時(shí)間序列最優(yōu)屬性子集的個(gè)數(shù)。

        [1] Sun X,Chen H,Wu Z,et al.Multifractal analysis of Hang Seng index in Hong Kong stock market[J].Physica A Statistical Mechanics & Its Applications,2001,291(1-4):553-562.

        [2] Peng C K,Havlin S,Stanley H E,et al.Quantification of scaling exponents and crossover phenomena in nonstationary heartbeat time series[J].Chaos An Interdisciplinary Journal of Nonlinear Science,1995,5(1):82-87.

        [3] Temme C,Ebinghaus R,Einax J W,et al.Time series analysis of long-term data sets of atmospheric mercury concentrations[J].Analytical & Bioanalytical Chemistry,2004,380(3):493.

        [4] 張延華,王國(guó)剛,李朋輝.基于時(shí)間序列的挖掘算法在流程工業(yè)產(chǎn)品質(zhì)量控制模型中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2010,40(5):87-90.

        [5] Vlachos M,Hadjieleftheriou M,Gunopulos D,et al.Indexing Multidimensional Time-Series[J].The VLDB Journal,2006,15(1):1-20.

        [6] Wang X,Mueen A,Ding H,et al.Experimental comparison of representation methods and distance measures for time series data[J].Data Mining and Knowledge Discovery,2013,26(2):275-309.

        [7] Mao Y,Zhou X B,Xia Z,et al.Survey for study of feature selection algorithms[J].Pattern Recognition & Artificial Intelligence,2007,20(2):211-218.

        [8] 鄭寶芬,蘇宏業(yè),羅林.無(wú)監(jiān)督特征選擇在時(shí)間序列數(shù)據(jù)挖掘中的應(yīng)用[J].儀器儀表學(xué)報(bào),2014,35(4):834-840.

        [9] 吳虎勝,張鳳鳴,徐顯亮,等.多變量時(shí)間序列的無(wú)監(jiān)督屬性選擇算法[J].模式識(shí)別與人工智能,2013,26(10):916-923.

        [10] Lal T N,Schr?der M,Hinterberger T,et al.Support vector channel selection in BCI.[J].IEEE Transactions on Biomedical Engineering,2004,51(6):1003-1010.

        [11] Yoon H,Yang K,Shahabi C.Feature Subset Selection and Feature Ranking for Multivariate Time Series[J].IEEE Transactions on Knowledge & Data Engineering,2005,17(9):1186-1198.

        [12] Li H.Accurate and efficient classification based on common principal components analysis for multivariate time series[J].Neurocomputing,2015,171(C):744-753.

        [13] Han M,Liu X.Feature selection techniques with class separability for multivariate time series[J].Neurocomputing,2013,110(8):29-34.

        [14] Sakar C O,Kursun O.A method for combining mutual information and canonical correlation analysis:Predictive Mutual Information and its use in feature selection[J].Expert Systems with Applications,2012,39(3):3333-3344.

        [15] Bacciu D.Unsupervised feature selection for sensor time-series in pervasive computing applications[J].Neural Computing and Applications,2016,27(5):1-15.

        [16] Rodriguez A,Laio A.Clustering by fast search and find of density peaks[J].Science,2014,344(6191):1492-1496.

        [17] Liu P,Liu Y,Hou X,et al.A Text Clustering Algorithm Based on Find of Density Peaks[C]//International Conference on Information Technology in Medicine and Education,2015:348-352.

        [18] Chen P,Fan X,Liu R,et al.Fiber segmentation using a density-peaks clustering algorithm[C]//IEEE,International Symposium on Biomedical Imaging.IEEE,2015:633-637.

        [19] Sun K,Geng X,Ji L.Exemplar Component Analysis:A Fast Band Selection Method for Hyperspectral Imagery[J].IEEE Geoscience & Remote Sensing Letters,2015,12(5):998-1002.

        [20] Keogh E,Ratanamahatana C A.Exact indexing of dynamic time warping[J].Knowledge & Information Systems,2005,7(3):358-386.

        [21] 王娟,慈林林,姚康澤.特征選擇方法綜述[J].計(jì)算機(jī)工程與科學(xué),2005,27(12):68-71.

        [22] Chang C C,Lin C J.LIBSVM:A library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology,2011,2(3):1-27.

        MULTIVARIATETIMESERIESATTRIBUTESELECTIONBASEDONCORRELATIONDENSITY

        Zhang Kunhua Ding Lixin Wan Runze

        (SchoolofComputerScience,WuhanUniversity,Wuhan430072,Hubei,China)

        Attribute selection is an effective data preprocessing method. Aiming at removing redundant or noisy attributes from the multivariate time series attribute set and selecting an attribute subset containing enough original information to improve accuracy, an attribute selection algorithm based on correlation density is proposed. The algorithm employed in the correlation matrix to represent the original multivariate time series, the local density of each attribute to show its representative ability, the distance discriminant between attributes as their discriminant degree. Moreover, attributes with larger representativeness and discriminant degree were filtered according to the distribution of the decision graph. Experiments with SVM classifier on four different datasets from the UCI repository were performed. The experimental results demonstrate the great improvement of the proposed algorithm in classification accuracy and time efficiency when compared with the existing algorithms.

        Multivariate time series Correlation matrix Decision graph Density Attribute selection

        2017-02-23。湖北省自然科學(xué)基金面上項(xiàng)目(2015CFB405);湖北省教育廳科學(xué)技術(shù)研究項(xiàng)目(Q20153003)。張坤華,碩士生,主研領(lǐng)域:時(shí)間序列降維,相似度度量。丁立新,教授。萬(wàn)潤(rùn)澤,副教授。

        TP391

        A

        10.3969/j.issn.1000-386x.2017.12.052

        猜你喜歡
        子集準(zhǔn)確率密度
        由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
        『密度』知識(shí)鞏固
        密度在身邊 應(yīng)用隨處見(jiàn)
        拓?fù)淇臻g中緊致子集的性質(zhì)研究
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
        2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
        關(guān)于奇數(shù)階二元子集的分離序列
        “玩轉(zhuǎn)”密度
        密度應(yīng)用知多少
        帮老师解开蕾丝奶罩吸乳视频| 97人妻精品一区二区三区免费| 欧美日韩精品一区二区三区高清视频 | 加勒比亚洲视频在线播放| 中文字幕亚洲精品在线| 婷婷射精av这里只有精品| 99久久精品国产一区二区三区| 香蕉视频在线观看国产| 国产自产c区| 伊人影院在线观看不卡| 91亚洲国产成人精品一区.| 日韩精品无码一本二本三本色| 国产99久久精品一区二区| 日韩AV不卡六区七区| 中文字幕无码免费久久| 三级日本理论在线观看| 天天躁夜夜躁狠狠是什么心态| 鸭子tv国产在线永久播放| 在线高清精品第一区二区三区| 亚洲无线码一区在线观看| 性色av一区二区三区四区久久| 91精品国产91综合久久蜜臀| 天天躁夜夜躁狠狠是什么心态| 久久无码人妻精品一区二区三区| 99福利在线| 国产一区不卡视频在线| 少妇一级淫片中文字幕| 亚欧色一区w666天堂| 男人和女人高潮免费网站| 日日躁欧美老妇| 一区二区精品天堂亚洲av| 朋友的丰满人妻中文字幕| 成人性生交大片免费看r| 中文无码免费在线| 国产亚洲精品90在线视频| a级毛片无码久久精品免费 | 久久精品国产99精品九九| 国产在线观看免费不卡视频| 欧美伦费免费全部午夜最新| 老少交欧美另类| 国产高潮精品一区二区三区av|