劉小妹,柯 林,于俊杰
(九江學(xué)院 理學(xué)院,江西九江 332005)
灰色系統(tǒng)理論自1982年鄧聚龍創(chuàng)立以來,已廣泛應(yīng)用于社會的各個領(lǐng)域,灰色關(guān)聯(lián)分析是灰色系統(tǒng)理論研究的出發(fā)點,是灰色預(yù)測、聚類與決策的基礎(chǔ),其基本思想是根據(jù)序列曲線幾何形狀來判斷不同序列之間的聯(lián)系是否緊密,從而通過比較分析來度量系統(tǒng)多因素之間的關(guān)聯(lián)程度,并對其進行關(guān)聯(lián)排序[1]。
灰色關(guān)聯(lián)分析是灰色系統(tǒng)理論中十分活躍的一個分支,自鄧聚龍?zhí)岢龌疑P(guān)聯(lián)分析理論以來,很多學(xué)者研究并構(gòu)造了大量的灰色關(guān)聯(lián)度模型[2-4]。然而現(xiàn)實中系統(tǒng)的行為較為復(fù)雜,多種特征相互依存,難以分割,形成多元序列形態(tài)。隨著數(shù)據(jù)采集、存儲和分析工具的不斷完善和發(fā)展,以矩陣為表現(xiàn)形式的多維系統(tǒng)特征數(shù)據(jù)不斷涌現(xiàn)[5-8]。目前基于行為矩陣的幾何描述方法將灰色關(guān)聯(lián)分析推廣到三維空間的模型并不多見[9,10],具體有三維鄧氏關(guān)聯(lián)模型、三維絕對關(guān)聯(lián)模型和體積關(guān)聯(lián)模型。本文針對劉思峰(1991)的三維絕對關(guān)聯(lián)度模型在某些方面的不足,提出一些改進。
為便于進行關(guān)聯(lián)度性能比較與分析,下面引用部分已有的三維灰色關(guān)聯(lián)度模型。
定義1[1]:設(shè)系統(tǒng)行為矩陣為:
X對應(yīng)的行為曲面為:
Z={Ax+By+C|x∈[i,i+1],y∈[j,j+1],i=1,2,…,m-1;j=1,2,…,n-1},其中:
定義2[1]:設(shè)系統(tǒng)行為矩陣為X=(aij)m×n,D為矩陣算子 XD=(aijd)m×n,其中aijd=aij-ai1,則 D稱為行為矩陣的始邊零化算子,XD稱為 X的始邊零化像,且記
定義3[1]:設(shè)為系統(tǒng)中參考因素的行為矩陣,為系統(tǒng)中 L 個待比較特征因素的行為矩陣,其中:
定 義 4[1]:設(shè) 兩 個 系 統(tǒng) 行 為 矩 陣為同型矩陣,其始邊零化像為,則:
定義 5[9]:設(shè)行為矩陣 X=(ai,j)m×n的始邊零化像為,記則 稱為行為矩陣的局部體積矩陣。
定義 6[9]:設(shè)為系統(tǒng)中參考因素的行為矩陣,,k=1,2,…,L 為系統(tǒng)中 L 個待比較特征因素的行為矩陣,局部體積矩陣分別為:
改進的三維灰色絕對關(guān)聯(lián)度模型的基本思想是:依據(jù)行為矩陣之間變化的絕對體積差異來構(gòu)造一種新的矩陣絕對關(guān)聯(lián)度模型。具體建模如下:
其中三元函數(shù) f(x,y,z)的構(gòu)造見本定理的證明過程。
證明:這里詳細證明ΔSp,由于dxdy
Zp={Ax+By+C|x∈[i,i+1],y∈[j,j+1],i=1,2,…,m-1;j=1,2,…,n-1},其中:
當i+j≤x+y≤i+j+1時,
當i+j+1≤x+y≤i+j+2時,
于是:
這里:
則有:
而
這樣就將所有的積分都可以轉(zhuǎn)化為(0,1)區(qū)間的積分,大大簡化了計算過程。
z=所表示的行為曲面即位于xoy坐標面的上面,也位于xoy坐標面的下面,行為曲面的邊界既與x軸上的(0,1)區(qū)間相交,也與y軸上的(0,1)區(qū)間相交,計算過程如下:
z=所表示的行為曲面即位于xoy坐標面的上面,也位于xoy坐標面的下面,行為曲面的邊界僅僅與y軸上的(0,1)區(qū)間相交,不與x軸上的(0,1)區(qū)間相交,計算過程如下:
z=所表示的行為曲面即位于xoy坐標面的上面,也位于xoy坐標面的下面,行為曲面的邊界僅僅與x軸上的(0,1)區(qū)間相交,不與y軸上的(0,1)區(qū)間相交,計算過程如下:
z=所表示的行為曲面即位于xoy坐標面的上面,也位于xoy坐標面的下面,行為曲面的邊界僅僅與y軸上的(0,1)區(qū)間相交,不與x軸上的(0,1)區(qū)間相交,計算過程及結(jié)果同情形(3)。
z=所表示的行為曲面即位于xoy坐標面的上面,也位于xoy坐標面的下面,行為曲面的邊界僅僅與x軸上的(0,1)區(qū)間相交,不與y軸上的(0,1)區(qū)間相交,計算過程及結(jié)果同情形(4)。
z=所表示的行為曲面即位于xoy坐標面的上面,也位于xoy坐標面的下面,行為曲面的邊界與x軸上的(0,1)區(qū)間和y軸上的(0,1)區(qū)間均不相交,而與xoy坐標面內(nèi)的斜邊x+y=1相交,計算過程及結(jié)果同情形(3)或者情形(4)。
于是,引入三元函數(shù)f(x,y,z)如下:
那么有:
類似可證明 ΔSq,Δ(Sp,Sq)。
(1)(規(guī)范性,平移不變性)0<εpq≤1 ;εpq=1?Xp=Xq+c
證明 :從定 義出發(fā),εpq=1?Δ(Sp,Sq)=0 ,由 于得到:
即ai,j-ai,1=bi,j-bi,1,ai,j=bi,j+ai,1-bi,1Xp=Xq+c,c=ai,1-bi,1,證畢。
另一方面,由定理1立即得到下列性質(zhì):
(2)εpq=εqp
(3)εpq關(guān)于Sp單調(diào)遞增,關(guān)于Sq單調(diào)遞增,關(guān)于Δ(Sp,Sq)單調(diào)遞減。
(4)εpq∈(0.5,1]
下面通過具體的矩陣數(shù)據(jù)將現(xiàn)有的一些三維灰色關(guān)聯(lián)度模型和本文提出的三維灰色絕對關(guān)聯(lián)度模型進行性能比較。
設(shè)矩陣數(shù)據(jù)序列如下:
由matlab程序設(shè)計計算得到表1:
表1 模型對比結(jié)果
從矩陣數(shù)據(jù)序列看到,X1、X2與X0之間的幾何發(fā)展趨勢并非完全相同,但是原三維絕對關(guān)聯(lián)度值ε01和ε02都等于1,體積關(guān)聯(lián)度值ε02也等于1,這與實際情況不符,出現(xiàn)錯誤的原因是原三維絕對關(guān)聯(lián)度模型和體積關(guān)聯(lián)度模型都出現(xiàn)了正負抵消的情況,原三維絕對關(guān)聯(lián)度模型不僅在局部上會抵消,在整體上也會出現(xiàn)抵消;而體積關(guān)聯(lián)度模型雖然避免了整體上的抵消情況,但在局部上的抵消情形并未考慮進去。本文的關(guān)聯(lián)度模型則不會出現(xiàn)任何正負抵消的情況,較為真實地反映了矩陣序列之間的關(guān)聯(lián)程度。
Robot Execution Failure(REF)數(shù)據(jù)是小規(guī)模多元時間序列挖掘中常用的測試數(shù)據(jù)集,它是采用六個傳感器對產(chǎn)生故障的Robot進行15次連續(xù)采樣得到的狀態(tài)數(shù)據(jù)矩陣,該數(shù)據(jù)分為五個子數(shù)據(jù)集,每個子數(shù)據(jù)集包含Robot在不同狀態(tài)下的若干個數(shù)據(jù)矩陣。為進行數(shù)據(jù)矩陣之間的關(guān)聯(lián)性分析,從http://kdd.ics.uci.edu/databases/robotfailure/robotfailure.html中選取數(shù)據(jù)集作為測試對象?,F(xiàn)以第一個子數(shù)據(jù)集LP1為選取對象,LP1中含88個6×15階矩陣,分別由21個normal狀態(tài)、17個collision狀態(tài)、17個fr-collision狀態(tài)和33個obstruction狀態(tài)組成。為體現(xiàn)三維絕對關(guān)聯(lián)度模型的準確性,在選取數(shù)據(jù)時有針對性地選取,正常狀態(tài)中選取數(shù)據(jù)波動明顯的行為矩陣,而碰撞狀態(tài)、前端碰撞狀態(tài)和阻擋狀態(tài)中則選擇數(shù)據(jù)相對平穩(wěn)的行為矩陣。記X0、X1、X2、X3為正常狀態(tài)對應(yīng)的數(shù)據(jù)矩陣,X4為碰撞狀態(tài)對應(yīng)的數(shù)據(jù)矩陣,X5為前端碰撞狀態(tài)對應(yīng)的數(shù)據(jù)矩陣,X6為阻擋狀態(tài)對應(yīng)的數(shù)據(jù)矩陣。且設(shè)X0為系統(tǒng)特征行為矩陣,X1、X2、X3、X4、X5、X6為相關(guān)因素行為矩陣,現(xiàn)分別計算X1、X2、X3、X4、X5、X6與X0之間的三維灰色絕對關(guān)聯(lián)度值。X0、X1、X2、X3、X4、X5、X6的數(shù)據(jù)矩陣如下:
由matlab程序設(shè)計計算得到表2:
表2 三維絕對關(guān)聯(lián)度對比結(jié)果
事實上,正常狀態(tài)與正常狀態(tài)之間的關(guān)聯(lián)程度一定要強于正常狀態(tài)與異常狀態(tài)之間的關(guān)聯(lián)程度,即X1、X2、X3與X0之間的三維絕對關(guān)聯(lián)度值一定要大于X4、X5、X6與X0之間的三維絕對關(guān)聯(lián)度值,所以本文的三維絕對關(guān)聯(lián)度模型分析結(jié)果與樣本對應(yīng)的狀態(tài)相吻合,較好地區(qū)分了正常狀態(tài)與異常狀態(tài)。而原三維絕對關(guān)聯(lián)度模型的分析結(jié)果則出現(xiàn)了錯誤,X6為阻擋狀態(tài)對應(yīng)的數(shù)據(jù)矩陣,X0、X3為正常狀態(tài)對應(yīng)的數(shù)據(jù)矩陣,但是ε06卻大于ε03,錯誤原因也是原三維絕對關(guān)聯(lián)度模型在計算過程中出現(xiàn)了正負抵消的情況。
本文根據(jù)劉思峰在1991年提出的三維灰色絕對關(guān)聯(lián)度模型,提出了新的三維灰色絕對關(guān)聯(lián)度模型,詳細地研究了新模型的算法和性質(zhì)。本文既保持了劉思峰提出的三維灰色絕對關(guān)聯(lián)度模型的優(yōu)點,又修正了原模型在處理一類(震蕩)矩陣數(shù)據(jù)時出現(xiàn)與實際不相符的錯誤情形。最后,通過分析Robot Execution Failure(REF)部分數(shù)據(jù)矩陣之間的關(guān)聯(lián)關(guān)系,說明本文的三維灰色絕對關(guān)聯(lián)度模型能較好地應(yīng)用于現(xiàn)實影響因素方面的三維關(guān)聯(lián)分析,并且易于在計算機上操作。