陳友軍,何洪英
西華師范大學(xué) 數(shù)學(xué)與信息學(xué)院,四川 南充 637009
灰色系統(tǒng)關(guān)聯(lián)分析不僅是灰色系統(tǒng)理論的重要組成部分之一,而且是灰色系統(tǒng)分析、建模、預(yù)測、決策的基石。通過近年來的研究表明,灰色關(guān)聯(lián)理論無疑是灰色系統(tǒng)理論應(yīng)用最廣泛、最具活力的部分。正是由于所有的灰色關(guān)聯(lián)分析均是在灰色關(guān)聯(lián)度的基礎(chǔ)上進行的,灰色關(guān)聯(lián)度模型直接影響著關(guān)聯(lián)分析和應(yīng)用結(jié)果,因此研究關(guān)聯(lián)度模型及其算法具有十分重要的意義[1-9]。
現(xiàn)有的灰色關(guān)聯(lián)分析是基于思想:根據(jù)序列曲線幾何形狀的相似程度來判斷其聯(lián)系是否緊密,曲線越接近,相應(yīng)序列之間的關(guān)聯(lián)度就越大,反之就越小[1];由于其以序列曲線的相似性為研究基礎(chǔ),因此,這里所謂的曲線越接近是指曲線的相似性,并非是曲線本身的接近(貼近),所以這種關(guān)聯(lián)分析是一種相似性分析,不是接近性分析;而灰色聚類、灰色決策等實際應(yīng)用中也經(jīng)常使用各已知模式與理想模式的接近程度的關(guān)聯(lián)分析,已知模式與理想模式越接近,接近程度就越高,接近度的值就越大,也就是說這種關(guān)聯(lián)分析是一種接近性分析,不是相似性分析。接近性應(yīng)當(dāng)根據(jù)序列曲線的幾何形狀特征以及空間位置關(guān)系差異判定其關(guān)聯(lián)是否緊密,接近程度與相似程度是完全不同的兩個概念,對數(shù)據(jù)處理的要求也不相同,因而應(yīng)有不同的定義和表達式以及不同的規(guī)范性和接近性[1-5]。
對于劉思峰教授提出的廣義灰色關(guān)聯(lián)度模型,由于其計算方便,不會出現(xiàn)量化結(jié)果與定性分析結(jié)果不符等一些優(yōu)勢,因而在現(xiàn)實中已經(jīng)得到了廣泛的應(yīng)用[10-16]。但是深入研究發(fā)現(xiàn)其存在嚴重的不足之處,從某些實際例子來看,廣義灰色關(guān)聯(lián)度以及劉思峰教授在此基礎(chǔ)上提出的灰色接近性關(guān)聯(lián)度和灰色相似性關(guān)聯(lián)度都無法反映序列間的真實接近性或相似性,也就是實際上是存在量化結(jié)果與定性分析結(jié)果不一致的問題。
劉思峰教授在文獻[1]中以及前幾版的書中都給出了灰色廣義關(guān)聯(lián)度,其中包括灰色絕對關(guān)聯(lián)度和灰色相對關(guān)聯(lián)度,并在最新版的文獻[1]中根據(jù)灰色廣義關(guān)聯(lián)度的相關(guān)命題和定義給出了灰色接近性關(guān)聯(lián)度和灰色相似性關(guān)聯(lián)度。然而,正是因為這些文獻中所給命題與灰色序列關(guān)系的實際意義(接近或相似)存在不一致而導(dǎo)致了一系列的問題。
命題2.1.1設(shè)系統(tǒng)行為序列Xi=(xi(1),xi(2),…,xi(n)),記拆線 (xi(1)-xi(1),xi(2)-xi(1),…,xi(n)-xi(1))為Xi-xi(1),令
則
(1)當(dāng)Xi為增長序列時,si≥0;
(2)當(dāng)Xi為衰減序列時,si≤0;
(3)當(dāng)Xi為振蕩序列時,si符號不定。
類似地可以給出Si的符號變化情況。
定義2.1.1設(shè)系統(tǒng)行為序列Xi=(xi(1),xi(2),…,xi(n)),D為序列算子,且
其中xi(k)d=xi(k)-xi(1),k=1,2,…,n,則稱D為始點零化算子,XiD為Xi的始點零化像,記為
則
(1)當(dāng)恒在上方,si-sj≥0;
如圖 1所示,圖(a)中,恒在上方,所以si-sj≥0,圖(b)中,與相交,si-sj的符號不定。
對于Si-Sj不難得到類似的結(jié)論。
圖1 拆線關(guān)系示意圖
由上面的命題和定義知si為經(jīng)始點零化后序列拆線與時間軸所圍圖形的面積,而Si為原始序列拆線與時間軸所圍圖形的面積;當(dāng)然si-sj即為兩原始序列經(jīng)始點零化后的拆線與時間軸所圍圖形的面積之差,Si-Sj即為兩原始序列的拆線與時間軸所圍圖形的面積之差。那這些面積差是不是圖1中所示的面積差(圖中陰影部分所示)呢?
很遺憾的是,這些面積差并不表示圖中所示的陰影部分的面積,這種計算方法得到的是兩個總面積之差,并不是交叉的陰影面積。然而,現(xiàn)實中人們更關(guān)心的是圖中陰影部分的情況,也就是兩種拆線圖形的真實差異情況。
例2.1設(shè)系統(tǒng)行為序列X1=(1,3,5,7),X2=(1,5,3,7),它們經(jīng)始點零化后的序列分別為=(0,2,4,6)和=(0,4,2,6),拆線如圖2所示,試計算它們的灰色絕對關(guān)聯(lián)度、灰色相對關(guān)聯(lián)度、灰色接近性關(guān)聯(lián)度和灰色相似性關(guān)聯(lián)度。
圖2 拆線樣式
解:很明顯,兩個序列既不接近,也不相似。
利用2.1節(jié)的相關(guān)命題及定義計算數(shù)據(jù):
依據(jù)文獻[1]中所給灰色絕對關(guān)聯(lián)度、灰色相對關(guān)聯(lián)度、灰色接近性關(guān)聯(lián)度、灰色相似性關(guān)聯(lián)的計算公式計算得到的這些關(guān)聯(lián)度均為1。然而,從某種意義上說,只有當(dāng)兩序列完全重合時這些關(guān)聯(lián)度才可能為1,因此,劉思峰教授所提出灰色廣義關(guān)聯(lián)度的計算方式是不符合實際意義的,其根本原因在于對前述“面積之差”的理解有誤。
本例所給兩序列一是單調(diào)增長的,另一個是振蕩序列,根據(jù)例子的形式,還可以列舉出無窮多類似的例子。對于常見的兩個或多個序列同為單調(diào)增或單調(diào)減的,也可以找到無窮多的實例。
實際上,劉思峰教授提出的廣義灰色關(guān)聯(lián)度計算方法問題的根本原因就是忽略了圖形的本質(zhì)特征而僅考慮面積之差,這就好比如果一個三角形的面積等于一個圓的面積時,是不能說三角形和圓是相似的或接近的。雖然劉思峰教授在文獻[1-3]中給出了接近性關(guān)聯(lián)度、相似性關(guān)聯(lián)度等的新性質(zhì),但這些卻給實際應(yīng)用帶來了麻煩,特別是在進行灰色聚類分析和灰色決策分析時,到底應(yīng)該對這樣的序列怎樣歸類,他們到底是不是屬于同類行為導(dǎo)致的呢?很明顯,現(xiàn)實中是不允許這樣做的。比如某同學(xué)的成績排名從第一學(xué)期到第四學(xué)期分別是1、3、5、7,而另一個同學(xué)的成績排名是1、5、3、7,這兩個序列的幾種灰色關(guān)聯(lián)度均為1,那我們能說這兩同學(xué)的學(xué)習(xí)情況是完全相似、他們的成績是完全接近的嗎?很明顯不是的,當(dāng)然我們也無法得出結(jié)論說這兩個同學(xué)的學(xué)習(xí)能力、學(xué)習(xí)方法等是差不多的。
綜上,廣義灰色關(guān)聯(lián)度的不足之處在于對序列間存在的面積理解和計算方法有誤,因此,改進算法就從面積入手進行。
陳友軍在文獻[6]中提出了灰色面積關(guān)聯(lián)度,后來又有很多學(xué)者提出了以圖形的面積差異來計算關(guān)聯(lián)度的方法[7-9],然而這些文獻中的計算多是針對特殊例子而言的,且計算過程大多過于麻煩(使用很多的絕對值計算方式),因此本文以陳友軍提出的灰色面積關(guān)聯(lián)度來對劉思峰教授提出的灰色廣義關(guān)聯(lián)度等進行改進。
設(shè)系統(tǒng)行為序列Xi=(xi(1),xi(2),…,xi(n)),Xj=(xj(1),xj(2),…,xj(n)),且都為1-時距序列,則這兩個序列的折線圖分布的可能情況如圖1所示。對于兩序列的折線圖所圍面積的情況,總的來說有三種,但是第一種情況可看作是第三種情況的特例,即當(dāng)?shù)谌N情況的某一對端點重合時的情況,最特殊的是兩對端點都重合時的情況,這也是第三種的特例;而第二種面積,即是兩曲線段有交叉的情況。
(1)對面積①和③,此時有xi(k)≤xj(k)且xi(k-1)≤xj(k-1)或者xi(k)≥xj(k)且xi(k-1)≥xj(k-1),它們的計算可由下式得到:
(2)對面積②,它由兩條線段交叉形成,而線段的端點已知,因此可以先計算出交點坐標(biāo),再分別計算兩個三角形的面積,于是得到:
由此,可以得到兩任意灰序列Xi與Xj的拆線圖所圍成的面積Sij,其計算方式為:
其中,當(dāng)序列對應(yīng)項滿足xi(k)≤xj(k)且xi(k-1)≤xj(k-1)或者xi(k)≥xj(k)且xi(k-1)≥xj(k-1)時按式①計算,其他情況按式②計算。
實際上灰色絕對關(guān)聯(lián)度與灰色相對關(guān)聯(lián)度的差異在于是否先對序列作初值化處理,故在此只給出計算灰色絕對關(guān)聯(lián)度的算法。
步驟1計算序列的始點零化像和;
步驟2 計算|si|和|sj|;
步驟3計算sij;
若要計算灰色相對關(guān)聯(lián)度,只需在算法最前面加上一步計算原始序列的初值像即可。
根據(jù)劉思峰教授在文獻[1]中所給灰色接近性關(guān)聯(lián)度與灰色相似關(guān)聯(lián)度的計算公式,不難得出這兩種關(guān)聯(lián)度的計算新方法。
對于灰色相似性關(guān)聯(lián)度,計算方法和公式與灰色接近性關(guān)聯(lián)度類似,只不過應(yīng)當(dāng)先計算系統(tǒng)行為序列的始點零化像。后面的計算都是針對始點零化像來做的,在此不再贅述。
有了上面對各類灰色關(guān)聯(lián)度的新算法,在實際應(yīng)用中,依據(jù)序列的幾何形狀進行聚類或進行決策分析等時則選用灰色相似性關(guān)聯(lián)度;若要依據(jù)序列的空間位置關(guān)系進行聚類、決策等時則可選用灰色接近性關(guān)聯(lián)度。
例4.1序列數(shù)據(jù)如例2.1所示,計算它們的灰色絕對關(guān)聯(lián)度、灰色相對關(guān)聯(lián)度、灰色接近性關(guān)聯(lián)度和灰色相似性關(guān)聯(lián)度。
解:系統(tǒng)原始行為序列為X1=(1,3,5,7),X2=(1,5,3,7),很明顯,它們的初值化像與原始序列相同,它們經(jīng)始點零化后的序列分別為=(0,2,4,6)和=(0,4,2,6)。
因此這兩個序列間的各種關(guān)聯(lián)度分別為:
灰色絕對關(guān)聯(lián)度:
灰色相對關(guān)聯(lián)度:由于兩序列的初值化像與原始序列相同,故它們的灰色相對關(guān)聯(lián)度等于灰色絕對關(guān)聯(lián)度。
灰色接近性關(guān)聯(lián)度:
灰色相似性關(guān)聯(lián)度:
從這些結(jié)果來看,它們與例2.1的計算結(jié)果是完全不相同的。從灰色絕對關(guān)聯(lián)度大小來看,說明兩序列間存在一定的關(guān)聯(lián)性;而從灰色接近性關(guān)聯(lián)度和灰色相似性關(guān)聯(lián)度來看,則說明兩序列既不接近也不相似。因此,在實際做聚類分析、決策分析時應(yīng)當(dāng)根據(jù)實際要分析的目標(biāo)選取統(tǒng)一的關(guān)聯(lián)度來分析,不能有的選用灰色絕對關(guān)聯(lián)度,有的選擇灰色接近性關(guān)聯(lián)等。
灰色系統(tǒng)關(guān)聯(lián)分析是近幾年來灰色系統(tǒng)理論研究中最活躍的分支之一,其關(guān)聯(lián)度的計算結(jié)果直接影響到系統(tǒng)聚類、決策分析、灰色預(yù)測模型的建立等各個方面。本文對劉思峰教授提出的經(jīng)典廣義灰色關(guān)聯(lián)度及新提出的灰色接近性關(guān)聯(lián)度和灰色相似性關(guān)聯(lián)度提出了部分改進算法,通過實例分析發(fā)現(xiàn),改進算法比原算法更貼近實際應(yīng)用目的。但是這些關(guān)聯(lián)度的計算仍然還有很多工作要做。
(1)對于采用本文提出的方法計算灰色接近性關(guān)聯(lián)度和灰色相似性關(guān)聯(lián)度,由于以序列拆線所圍面積直接參與計算,可能會出現(xiàn)得到的關(guān)聯(lián)度相對偏小的情況,因此,是否可以通過對Sij和sij進行開方運算、取算術(shù)平均等方式讓計算結(jié)果更直觀,實際應(yīng)用中到底取哪種更合適。
(2)對于灰色接近性關(guān)聯(lián)度的研究,很多學(xué)者比較統(tǒng)一的觀點是接近性反映的是序列的接近程度,因此可以通過拆線所圍面積或者直接通過序列對應(yīng)點的差值(點距)來計算;然而對于相似性關(guān)聯(lián)度來說,到底什么才算相似,有學(xué)者提出:對系統(tǒng)行為序列Xi=(xi(1),xi(2),…,xi(n))和Xj=(xj(1),xj(2),…,xj(n)),若存在常數(shù)α(≠0)和β,使得xj(k)=αxi(k)+β,則認為兩序列完全相似(以絕對值方式計算,相似性關(guān)聯(lián)度為1),那如果是這樣,序列X1=(1,3,5,7)與X2=(7,5,3,1)就完全相似,因為有x2(k)=-x1(k)+8成立,同理,X1也與序列X3=(2,4,6,8)完全相似,因為有x3(k)=x1(k)+1成立;但是從實際圖形來看,這些拆線卻并不滿足有學(xué)者提出相似性關(guān)聯(lián)度的性質(zhì)。事實上,X1和X2就好比上山和下山所做的功,上山和下山雖然道路相同,但是運動效果明顯不相似。那是否有必要對關(guān)聯(lián)度引入負相關(guān)的概念值得進一步研究。
[1]劉思峰,謝乃明.灰色系統(tǒng)理論及其應(yīng)用[M].6版.北京:科學(xué)出版社,2013.
[2]劉思峰,蔡華,楊英杰,等.灰色關(guān)聯(lián)分析模型研究進展[J].系統(tǒng)工程理論與實踐,2013,33(8):2041-2046.
[3]劉思峰,謝乃明,Jeffery F.基于相似性和接近性視角的新型灰色關(guān)聯(lián)分析模型[J].系統(tǒng)工程理論與實踐,2010,30(5):881-887.
[4]謝乃明,劉思峰.幾類關(guān)聯(lián)度模型的平行性和一致性[J].系統(tǒng)工程,2007,25(8):98-103.
[5]崔杰,黨耀國,劉思峰.幾類關(guān)聯(lián)分析模型的新性質(zhì)[J].系統(tǒng)工程,2009,27(4):65-70.
[6]Chen Youjun,He Hongying,Wei Yong.By using grey area relational grade combined with NLP method to optimize GM(1,1)model[C]//Proceeding of 2008 IEEE World Congress on Computational Intelligence,Hong Kong,June1-6,2008.
[7]王靖程,諸文智,張彥斌.基于面積的改進灰關(guān)聯(lián)度算法[J].系統(tǒng)工程與電子技術(shù),2010,32(4):777-779.
[8]Zhang Ke,Zhang Yintao,Qu Pinpin.Comprehensive multivariate grey incidence degree basedon principal component analysis[J].Journal of Systems Engineering and Electronics,2014,25(5):840-847.
[9]蔣詩泉,劉思峰,劉中俠,等.基于面積的灰色關(guān)聯(lián)決策模型[J/OL].控制與決策,2014.http://www.cnki.net/kcms/doi/10.13195/j.kzyjc.2013.1649.html.
[10]孫鵬霄.灰色關(guān)聯(lián)方法的分析與應(yīng)用[J].數(shù)學(xué)的實踐與認識,2014,44(1):97-101.
[11]余步雷,周宗放,謝茂森.新灰色綜合關(guān)聯(lián)度模型及其應(yīng)用[J].技術(shù)經(jīng)濟,2013,32(1):85-89.
[12]賀翔,唐果.基于層次分析和灰色關(guān)聯(lián)分析的寧波企業(yè)自主創(chuàng)新環(huán)境評價[J].科技與管理,2014,16(3):14-19.
[13]楊芳芳,朱東升,王志巍等.利用灰色絕對關(guān)聯(lián)分析的中值濾波方法研究[J].計算機工程與應(yīng)用,2013,49(13):160-164.
[14]張健,王晉東,余定坤.基于灰關(guān)聯(lián)分析的連續(xù)值屬性約減算法[J].計算機應(yīng)用,2014,34(2):401-405.
[15]劉曉玲,謝仙斌,張家錄,等.基于灰色綜合關(guān)聯(lián)分析的網(wǎng)絡(luò)安全評估[J].集成技術(shù),2014,3(4):44-49.
[16]郭三黨,王玲玲,劉思峰,等.基于最大灰色關(guān)聯(lián)度的聚類方法分析[J].數(shù)學(xué)的實踐與認識,2013,43(6):195-201.