揭麗琳,劉衛(wèi)東+,滕沙沙,孫 政
(1.南昌大學(xué) 機(jī)電工程學(xué)院,江西 南昌 330031; 2.南昌航空大學(xué) 經(jīng)濟(jì)管理學(xué)院,江西 南昌 330063)
可靠性已經(jīng)成為衡量空調(diào)質(zhì)量屬性的核心指標(biāo)和企業(yè)獲得產(chǎn)品競爭優(yōu)勢的重要因素。不同地理區(qū)域的自然環(huán)境、用戶經(jīng)濟(jì)狀況和生活習(xí)慣等因素的差異,使產(chǎn)品所處的工作條件和使用時(shí)間不一致,導(dǎo)致其實(shí)際使用可靠性存在較大程度的區(qū)域差異[1-2]。從影響產(chǎn)品使用可靠性因素的角度,按照所處地理區(qū)域?qū)ζ涫褂每煽啃赃M(jìn)行科學(xué)合理地分類,能夠使其在同類區(qū)域的相似性和不同區(qū)域的差異性盡可能大,以準(zhǔn)確預(yù)測不同區(qū)域產(chǎn)品使用的可靠性水平,這不僅有助于提升產(chǎn)品的設(shè)計(jì)、制造和成本管理水平,還是實(shí)現(xiàn)產(chǎn)品個(gè)性化營銷策略、區(qū)域化保修管理、差異化延保服務(wù)等任務(wù)的基礎(chǔ)。
近年關(guān)于空調(diào)可靠性的研究逐漸增多,但只有少量研究成果涉及分析空調(diào)使用可靠性的區(qū)域粒度劃分。目前已從空調(diào)系統(tǒng)和零部件的失效分析[3-6]、系統(tǒng)可靠性評估[1,7-8]、系統(tǒng)可靠性分析預(yù)測與分配的模型構(gòu)建[9]以及系統(tǒng)可靠性影響因素分析[10-13]等方面對空調(diào)可靠性進(jìn)行了研究。關(guān)于空調(diào)使用可靠性影響因素分析,目前主要采用實(shí)驗(yàn)等手段研究影響空調(diào)使用可靠性的相關(guān)因素和條件,并取得了一定的成果。例如,Yau等[10]從制冷與制熱負(fù)荷、電力消耗和室外設(shè)計(jì)條件3方面分析了馬來西亞熱帶地區(qū)氣候變化對空調(diào)系統(tǒng)的性能和可靠性的影響;Li等[11-12]分別對夏熱冬冷地區(qū)的太陽能空調(diào)、熱帶地區(qū)的分體式空調(diào)系統(tǒng)進(jìn)行實(shí)驗(yàn),通過數(shù)值仿真分析了氣候變化對空調(diào)制冷制熱性能的影響;Nishida等[13]對于應(yīng)用在對溫度有嚴(yán)格要求的數(shù)據(jù)中心等場合的空調(diào)系統(tǒng),研究了從電源失效到恢復(fù)供電的間隙對其可靠性的影響。而分析可靠性影響因素與區(qū)域差異的關(guān)聯(lián)性并將其應(yīng)用于相關(guān)產(chǎn)品使用可靠性區(qū)域粒度劃分的研究極其有限,僅有劉衛(wèi)東等[1]分析了具有區(qū)域差異性的溫濕度氣候條件對空調(diào)可靠性的影響,并應(yīng)用于亞熱帶季風(fēng)氣候區(qū)省會城市的聚類。Jie等[2]在系統(tǒng)研究影響空調(diào)使用可靠性的工作環(huán)境因素和用戶使用習(xí)慣因素區(qū)域差異性的基礎(chǔ)上,構(gòu)建了區(qū)域聚類綜合評價(jià)模型,通過加權(quán)的Ward法求解實(shí)現(xiàn)空調(diào)使用可靠性的區(qū)域分類。然而該研究更多的是關(guān)注空調(diào)可靠性影響因素分析的全面性及各影響因素的量化,缺乏專門針對使用可靠性區(qū)域粒度確定方法的深入分析和探討,而且信息技術(shù)的發(fā)展和各種先進(jìn)量測設(shè)備的應(yīng)用,使得數(shù)據(jù)采集和存儲更加便捷,由此產(chǎn)生大量實(shí)時(shí)動態(tài)且結(jié)構(gòu)復(fù)雜的高維數(shù)據(jù)集,例如空調(diào)區(qū)域樣本的聚類特征多達(dá)百維以上,因此采用傳統(tǒng)聚類方法無法有效解決使用可靠性區(qū)域的粒度劃分問題。另外,在實(shí)際區(qū)域分類問題中,地域樣本之間往往缺乏明確的界限,采用傳統(tǒng)聚類算法將每個(gè)待分類區(qū)域嚴(yán)格劃分到某個(gè)類中也存在一定的不合理性。為此,馬軍杰等[14]應(yīng)用模糊C-均值(Fuzzy C-Means, FCM)聚類方法對中國31個(gè)省市專利產(chǎn)出數(shù)據(jù)進(jìn)行區(qū)域劃分,其采用的模糊劃分矩陣既具有一定的明晰性,又保持了樣本數(shù)據(jù)在空間分布的模糊性,從而提高分類的準(zhǔn)確性,但其存在對初始聚類中心敏感和易陷入局部極值等不足,直接影響了區(qū)域分類的有效性和合理性。
在解決模糊聚類問題時(shí),國際上涌現(xiàn)出了許多經(jīng)典的智能聚類算法,如將遺傳算法(Genetic Algorithm, GA)和粒子群優(yōu)化(Particle Swarm Optimization, PSO)算法等優(yōu)化技術(shù)引入聚類分析領(lǐng)域,其中典型算法有遺傳模糊聚類算法(Fuzzy Clustering Algorithm based on Genetic Algorithm, GA-FCM)[15]、粒子群優(yōu)化模糊聚類(Particle Swarm Optimization for Fuzzy Clustering, PSO-FCM)算法[16]等。近年來,Ye等[17]提出一種改進(jìn)的基于量子遺傳算法的模糊C-均值聚類算法(Fuzzy C-Means clustering algorithm based on Improved Quantum Genetic Algorithm, IQGA-FCM),并通過仿真比較驗(yàn)證了所設(shè)計(jì)的算法性能最優(yōu)。Ding等[18]將該技術(shù)與改進(jìn)的GA結(jié)合,提出一種基于遺傳算法的核模糊C-均值聚類算法(Kernel-based Fuzzy C-Means clustering algorithm based on Genetic Algorithm, GAKFCM),并與其他算法的仿真結(jié)果比較,證明了GAKFCM算法的有效性。Wikaisuksakul[19]將改進(jìn)的非支配排序遺傳算法(Non-dominated Sorting Genetic AlgorithmⅡ, NSGA-Ⅱ)與FCM有效結(jié)合起來,提出一種多目標(biāo)遺傳模糊聚類算法FCM-NSGA(non-dominated sorting genetic algorithm with fuzzy C-means for automatic data clustering), 通過在基準(zhǔn)測試數(shù)據(jù)集上的算法比較,表明所提方法非常有效。Zhang等[20]提出一種基于GA,PSO和FCM的混合聚類算法GCQPSO-FCM(chaotic particle swarm and fuzzy C-mean clustering based on genetic algorithm),并通過仿真比較,驗(yàn)證了該混合算法的性能比單一算法更優(yōu)。Chen等[21]提出一種改進(jìn)的粒子群與FCM的混合聚類算法(Hybrid clustering algorithm based on Particle Swarm Optimization and Fuzzy C-Means, HPSOFCM),并對所提算法的性能進(jìn)行了分析。Li等[22]提出一種基于混沌粒子群優(yōu)化的模糊聚類算法(Chaotic Particle Swarm optimization based Fuzzy Clustering algorithm, CPSFC),仿真結(jié)果顯示,該方法比FCM和PSO-FCM具有更好的聚類性能。Izakian等[23]將模糊粒子群優(yōu)化(Fuzzy PSO, FPSO)引入FCM中,形成一種混合聚類算法FCM-FPSO,實(shí)驗(yàn)數(shù)據(jù)顯示,該方法找到的解要比FCM和FPSO更好一些。SilvaFilho等[24]在文獻(xiàn)[23]的基礎(chǔ)上,運(yùn)用改進(jìn)的自適應(yīng)粒子群優(yōu)化算法(Improved self-adaptive Particles Swarm Optimization, IDPSO)替換FPSO,提出一種改進(jìn)的混合聚類算法FCM-IDPSO,并通過仿真比較,表明所設(shè)計(jì)的FCM-IDPSO算法在聚類精度和收斂時(shí)間方面具有比HPSOFCM,CPSFC,F(xiàn)CM-FPSO更優(yōu)越的性能。
盡管上述模糊聚類方法在解決數(shù)據(jù)聚類問題上取得了不同的效果,但是對于解決高維度復(fù)雜數(shù)據(jù)聚類問題,其聚類性能依然不盡人意,仍未克服GA或PSO算法陷入局部最優(yōu)的缺陷,而且增大了算法的復(fù)雜度,使得耗時(shí)過長,極大限制了其工程應(yīng)用范圍。Alba等提出的元胞遺傳算法(Cellular Genetic Algorithm, CGA)[25]具有規(guī)則的鄰域結(jié)構(gòu),在一定程度上降低了選擇壓力和優(yōu)勢基因的擴(kuò)散速度,能夠有效保持種群多樣性,在解決各種復(fù)雜優(yōu)化問題時(shí)的全局搜索能力比其他算法明顯提高。
因此,針對目前存在的問題,本文著眼于產(chǎn)品使用可靠性影響因素分析的全面性和聚類方法的有效性,結(jié)合CGA良好的多樣性、全局搜索能力和FCM良好的局部搜索能力,在CGA算法中引入信息熵理論[26]度量多樣性,并采用動態(tài)交叉和基于熵的兩階段變異算子,以及黃金分割優(yōu)選策略,提出一種動態(tài)優(yōu)選元胞遺傳模糊聚類算法IDCGAFCM(improved dynamic optimal-selection cellular genetic algorithm for fuzzy clustering),以達(dá)到高效求出產(chǎn)品使用可靠性區(qū)域粒度劃分問題最優(yōu)聚類結(jié)果的目的。
空調(diào)的可靠性是其具有的制冷、制熱、除濕和通風(fēng)等各項(xiàng)功能可靠性的綜合。空調(diào)使用過程中因工作負(fù)荷、自然環(huán)境因素以及安裝等服務(wù)質(zhì)量因素的影響而產(chǎn)生損耗,其可靠性隨使用時(shí)間的增長逐漸衰減;在非使用狀態(tài)下,自然環(huán)境因素的反復(fù)作用也使空調(diào)產(chǎn)生耗損,進(jìn)而影響空調(diào)的可靠性。而空調(diào)是否開機(jī)使用,既受自然環(huán)境因素影響,也取決于用戶的使用習(xí)慣。因此,可將影響空調(diào)可靠性的因素歸納為工作環(huán)境影響因素和用戶使用習(xí)慣影響因素兩大類。
一方面,空調(diào)及其零部件或元器件在溫度、濕度、日照、降水量、粉塵顆粒物和二氧化硫等自然環(huán)境因素的循環(huán)作用下,出現(xiàn)疲勞、老化、耗損或腐蝕,進(jìn)而影響空調(diào)的使用可靠性;另一方面,空調(diào)的使用情況或工作時(shí)間也與溫度、濕度、日照、降水量和風(fēng)速等自然環(huán)境因素密切相關(guān)。由于粉塵顆粒和二氧化硫的數(shù)據(jù)不完備,在此忽略其對使用可靠性的影響。
空調(diào)使用時(shí)間主要受用戶使用習(xí)慣的影響,而影響用戶使用習(xí)慣的主要因素有用戶所處地理區(qū)域的自然環(huán)境、經(jīng)濟(jì)條件和政府補(bǔ)貼等。政府補(bǔ)貼具有促進(jìn)居民消費(fèi)的作用,但由于持續(xù)時(shí)間有限,在此忽略其對用戶使用習(xí)慣的影響;經(jīng)濟(jì)條件可通過社會消費(fèi)品零售總額增長率、平均消費(fèi)傾向兩個(gè)因素反映。綜合以上分析,建立如圖1所示的產(chǎn)品使用可靠性區(qū)域聚類的物理模型。
該物理模型綜合考慮工作環(huán)境和用戶使用習(xí)慣兩類因素的影響,將使用可靠性區(qū)域粒度劃分問題分解為基于工作環(huán)境影響因素的使用可靠性區(qū)域聚類和基于用戶使用習(xí)慣影響因素的使用可靠性區(qū)域聚類兩個(gè)子問題,最后通過綜合兩個(gè)子問題的解,即二次聚類,獲得最終的使用可靠性最優(yōu)區(qū)域聚類結(jié)果。
因此,上述模型需要同時(shí)考慮兩個(gè)聚類設(shè)計(jì)目標(biāo):①使用可靠性在工作環(huán)境影響因素上具有一致性的區(qū)域分布;②使用可靠性在用戶使用習(xí)慣影響因素上具有一致性的區(qū)域分布。這兩個(gè)目標(biāo)一方面使同一類型區(qū)域的產(chǎn)品使用可靠性基于工作環(huán)境因素具有最大的相似性,另一方面使同一類型區(qū)域的產(chǎn)品使用可靠性基于用戶使用習(xí)慣因素具有最大的相似性。因此,產(chǎn)品使用可靠性區(qū)域粒度劃分是多組高維特征樣本的復(fù)雜數(shù)據(jù)聚類問題。
面板數(shù)據(jù)具有能容納多指標(biāo)、綜合考慮指標(biāo)動態(tài)發(fā)展特征等優(yōu)良的性質(zhì),為充分利用使用可靠性影響因素的動態(tài)和局部變化屬性信息,克服以往方法中數(shù)據(jù)不足和丟失問題,構(gòu)造基于工作環(huán)境影響因素和用戶使用習(xí)慣影響因素的面板數(shù)據(jù)集模型,分別表示為:
Α={Οks(t)|k=1,2,…,n;s=1,2,…,m;
t=1,2,…,T};
(1)
Β={Ωks′(t)|k=1,2,…,n;s′=1,2,…,m′;
t=1,2,…,T}。
(2)
式中:Οks(t)表示使用可靠性基于工作環(huán)境影響因素的第k個(gè)聚類樣本的第s個(gè)特征在t時(shí)刻的數(shù)值;Ωks′(t)表示使用可靠性基于用戶使用習(xí)慣影響因素的第k個(gè)聚類樣本的第s′個(gè)特征在t時(shí)刻的數(shù)值。為了直觀表示模型Α,Β的特征,下面給出其在t時(shí)刻的數(shù)據(jù)結(jié)構(gòu)。
在t時(shí)刻,產(chǎn)品使用可靠性基于工作環(huán)境因素的聚類樣本k的特征矩陣Οk(t)及基于用戶使用習(xí)慣因素的聚類樣本k的特征矩陣Ωk(t)分別為:
Οk(t)=[ΓkHkSkRk];
(3)
式中:Γk,Hk,Sk,Rk分別表示其第t年各月的平均溫度、濕度、日照、降水量特征矢量,
Γk={tkj|j=1,2,…,12},
Hk={hkj|j=1,2,…,12},
Sk={skj|j=1,2,…,12},
Rk={rkj|j=1,2,…,12};
Vk={vkj|j=1,2,…,4},
Gk={gkj|j=1,2,…,4},
Ck={ckj|j=1,2,…,4}。
因?yàn)閿?shù)據(jù)的聚類問題可以轉(zhuǎn)化為一個(gè)非線性優(yōu)化問題,所以空調(diào)使用可靠性區(qū)域粒度劃分問題實(shí)際上是一個(gè)目標(biāo)優(yōu)化問題,以上述模型Α={Οks(t)|k=1,2,…,n;s=1,2,…,m;t=1,2,…,T}為例,若n個(gè)空調(diào)地域樣本劃分為c(1 Dik=α*·dik(AQED)+β*· dik(ISED)+γ*·dik(VCED)。 (4) 滿足以下約束條件: s.t. uik∈[0,1],1≤i≤c,1≤k≤n。 (5) 式中:m為模糊指數(shù);Dik表示樣本οk到聚類中心vi的歐式距離。為減少信息損失,本文既考慮使用可靠性各影響因素的絕對水平,還分析其動態(tài)發(fā)展趨勢,采用面板數(shù)據(jù)相似性指標(biāo)對FCM中的距離進(jìn)行優(yōu)化,即Dik不再僅是以往簡單的絕對量距離dik(AQED),還涵蓋了兩者間的增速距離dik(ISED)和波動距離dik(VCED),其中α*,β*,γ*分別表示3種距離相應(yīng)的權(quán)重系數(shù),且滿足α*+β*+γ*=1。各距離的計(jì)算方法,詳見文獻(xiàn)[2]。 采用FCM算法進(jìn)行聚類,可以得到第i類聚類中心vi和空調(diào)地域樣本ok到聚類中心vi的隸屬度uik: (6) (7) 經(jīng)過上述不斷迭代,得到最終的聚類中心和隸屬度矩陣,從而確定所有樣本的劃分。然而,由于FCM算法本身存在不足以及模型Α,Β的高維度特性,很可能導(dǎo)致其只能找到局部最優(yōu)解,因此有必要設(shè)計(jì)更優(yōu)的算法以提高FCM的聚類性能。 為了求解上述空調(diào)使用可靠性區(qū)域聚類模型,提出IDCGAFCM算法。IDCGAFCM是在CGA和FCM的基礎(chǔ)上改進(jìn)的一種混合聚類算法,它在CGA中引入了信息熵理論,并采用動態(tài)交叉和基于熵的兩階段變異算子,使改進(jìn)的IDCGA較好地提升了群體多樣性,增強(qiáng)了算法的全局搜索能力;同時(shí)根據(jù)元胞遺傳群體熵的變化判斷當(dāng)前的收斂程度,確定優(yōu)選元胞個(gè)體執(zhí)行FCM的操作時(shí)機(jī),增強(qiáng)其局部搜索能力,從而在提高聚類精度的同時(shí)加快算法收斂速度。 CGA將元胞自動機(jī)理論和GA二者有機(jī)結(jié)合起來,種群中所有個(gè)體都排列在一個(gè)空間d維網(wǎng)格(d=1,2,3)中,每個(gè)個(gè)體放置在一個(gè)元胞網(wǎng)格位置內(nèi),且只與其相鄰個(gè)體進(jìn)行選擇、交叉、變異等操作[25]。本文采用二維網(wǎng)格和元胞Moore鄰域類型。CGA限定個(gè)體的遺傳操作只發(fā)生在元胞鄰域內(nèi),因此具有比GA更好的全局搜索能力,在一定程度上擺脫了GA解決復(fù)雜問題時(shí)易早熟收斂的困境,但它沒有考慮進(jìn)化過程中所有個(gè)體間的動態(tài)影響,即忽略了個(gè)體生死狀態(tài)對進(jìn)化產(chǎn)生的影響。而文獻(xiàn)[27]通過實(shí)驗(yàn)表明,演化規(guī)則的引入有利于改善群體多樣性和進(jìn)行全局探索。因此,本文引用這種中等密度分布的演化規(guī)則建立動態(tài)環(huán)境來同步更新個(gè)體的狀態(tài)。 算法采用基于聚類中心的編碼方式,即每個(gè)元胞網(wǎng)格位置上的個(gè)體由c個(gè)聚類中心組成。設(shè)樣本特征維數(shù)為d,元胞種群Q={x1,x2,…,xp,…,xM}(1≤p≤M),則每個(gè)個(gè)體基因矢量具有c×d維編碼,即xp采用如下編碼結(jié)構(gòu) xp=[xp,1xp,2…xp,dxp,d+1xp,d+2… xp,2d…xp,c×(d-1)+1xp,c×(d-1)+2…xp,c×d]。 (8) 式中:前d個(gè)量化值表示第一個(gè)d維的聚類中心,第d+1~2d個(gè)量化值表示第二個(gè)d維的聚類中心,依此類推。另外,每個(gè)個(gè)體還有一個(gè)對應(yīng)的適應(yīng)度值FIT(xp), (9) 式中:n為樣本數(shù),οk為輸入樣本。由式(9)可知,聚類目標(biāo)函數(shù)值越小,聚類效果越好,適應(yīng)度值FIT(xp)越大。經(jīng)過若干代后,當(dāng)FIT(xp)達(dá)到最大時(shí),就可以獲得最優(yōu)的劃分和聚類中心。 聚類中心初始值的選擇已被證明對聚類質(zhì)量有很大影響[28]。然而現(xiàn)有基于智能優(yōu)化算法的聚類算法大多采用隨機(jī)初始化的方法,具有一定的盲目性,可能會產(chǎn)生一些與數(shù)據(jù)集無關(guān)的簇類。因此,本文利用Arnold映射[29]具有遍歷均勻性好的特性,將其產(chǎn)生的混沌序列替代隨機(jī)初始化的聚類中心,以得到多樣性好的初始種群。Arnold映射表達(dá)式為 (10) 利用Arnold映射產(chǎn)生的初始個(gè)體表示為 xpj=xjmin+αn(xjmax-xjmin)。 (11) 式中:αn,βn∈[0,1],αn為迭代至n步時(shí)的混沌變量; mod 1表示取余運(yùn)算;xpj表示個(gè)體xp的第j維變量;[xjmin,xjmax]為第j維變量的取值范圍,且xjmin和xjmax可由給定數(shù)據(jù)集各維度特征對應(yīng)的最大值和最小值統(tǒng)計(jì)得到。重復(fù)上述迭代過程,直到產(chǎn)生群體規(guī)模為M的初始種群,從而最大程度地利用數(shù)據(jù)集的屬性信息,同時(shí)使所有個(gè)體盡可能均勻分布在整個(gè)搜索空間。 CGA中的交叉、變異等遺傳操作對其優(yōu)化性能有顯著影響,且交叉概率Pc、變異概率Pm極大程度地決定著其是否能有效地求解或收斂到最優(yōu)解。雖然已有文獻(xiàn)提出了關(guān)于Pc和Pm選擇的指導(dǎo)方針[30],但這些結(jié)論是通過一些特定問題的實(shí)證研究獲得的,只針對具體特定的問題才適用。實(shí)際上,最優(yōu)的Pc和Pm因優(yōu)化問題的不同而變化,甚至在進(jìn)化過程的不同階段也會不同。但是現(xiàn)有研究中,交叉和變異操作一般都事先設(shè)置固定的Pc和Pm,過高的概率會破壞優(yōu)勢個(gè)體,過低的概率又會導(dǎo)致算法收斂到局部極值。CGA的搜索過程是一個(gè)極其復(fù)雜的非線性過程,Pc和Pm采用固定值或簡單的線性變換均不利于找到最好解。此外,生物進(jìn)化也表明,Pc和Pm取決于進(jìn)化狀態(tài)而且應(yīng)與其相適應(yīng)[31]。因此,設(shè)計(jì)一個(gè)能夠自適應(yīng)調(diào)整Pc和Pm的動態(tài)更新策略至關(guān)重要。針對該問題,本文綜合考慮種群當(dāng)前進(jìn)化狀態(tài)以及個(gè)體與最優(yōu)個(gè)體之間的距離,從全新的角度構(gòu)建動態(tài)交叉、兩階段動態(tài)變異算子,使改進(jìn)后的IDCGA能夠避免早熟,收斂到局部最優(yōu)。 2.3.1 動態(tài)交叉 為了能夠自適應(yīng)調(diào)整IDCGA的交叉概率,首先基于S型函數(shù)模型構(gòu)建Pc的動態(tài)更新策略。設(shè)favg為第t代種群的平均適應(yīng)度值,fmax為第t代種群的最高適應(yīng)度值,f(xi)為待交叉?zhèn)€體的適應(yīng)度值,fmax-f(xi)表示待交叉?zhèn)€體與最優(yōu)個(gè)體間的距離,fmax-favg在一定程度上反映當(dāng)前種群的進(jìn)化狀態(tài),則第t代的交叉概率 (12) 2.3.2 基于熵的兩階段動態(tài)變異 由于在早期進(jìn)化階段,群體多樣性維持在較高水平;但是隨著搜索的進(jìn)行,群體在后期有可能趨于聚集,導(dǎo)致群體多樣性降低,算法收斂到局部最優(yōu)。因此,維持種群多樣性是提高IDCGA全局探索能力的有效手段,有必要分析研究IDCGA在進(jìn)化過程中群體多樣性的變化規(guī)律,并且根據(jù)群體多樣性的變化設(shè)計(jì)兩階段的動態(tài)變異操作。 為此,將信息熵[26]引入元胞群體空間,用于度量群體多樣性和指導(dǎo)搜索過程。種群熵DE(t)等于各位編碼(基因)熵DEl(t):l=1,2,…,L的均值: (13) (14) 式中:al,bl為個(gè)體x第l維編碼的最小值和最大值。 綜上所述,待變異個(gè)體xi第t代的變異概率 (15) 式中:γ用于約束變異概率,可通過實(shí)驗(yàn)分析IDCGA對參數(shù)γ的敏感度而確定;Pm(i)為自適應(yīng)概率, Pm(i)=φmax· (16) (17) 式中:N(0,1)為正態(tài)分布隨機(jī)數(shù);α(t)為自適應(yīng)調(diào)節(jié)的變異步長。由于算法在進(jìn)化初期需要以較大的步長搜索以確保全局搜索能力,進(jìn)化后期則需要以較小步長搜索以確保局部搜索能力,因此對α(t)設(shè)計(jì)如下動態(tài)調(diào)整方法: α(t)=α(0)×exp(-κt/Tmax)。 (18) 式中:α(0)為初始步長;κ為時(shí)間常數(shù);t為當(dāng)前時(shí)刻;Tmax為最大迭代次數(shù),根據(jù)具體的聚類問題設(shè)定。因此,所構(gòu)建的兩階段變異操作充分利用元胞遺傳群體的熵與S型函數(shù)模型的特性,有效克服了以往變異操作中恒定概率和固定變異步長的缺點(diǎn)。 FCM算法比IDCGA算法計(jì)算簡單、收斂速度快,但易陷入局部極值,因此本文將IDCGA和FCM有機(jī)結(jié)合形成一種混合算法IDCGAFCM,其基本原理是充分利用IDCGA與FCM的優(yōu)點(diǎn),使算法的全局探索與局部尋優(yōu)達(dá)到更精確的平衡,從而提高聚類效率和精度。 實(shí)現(xiàn)IDCGA和FCM有效結(jié)合的關(guān)鍵是確定FCM的操作時(shí)機(jī)以及如何執(zhí)行FCM操作。實(shí)際上,在早期隨機(jī)搜索階段,算法應(yīng)加強(qiáng)全局探索能力,這時(shí)只需充分利用IDCGA全局搜索能力強(qiáng)的優(yōu)點(diǎn),不需要執(zhí)行FCM;在進(jìn)入后期收斂階段后,算法應(yīng)加強(qiáng)局部尋優(yōu)能力,這時(shí)引入FCM可以充分利用其特點(diǎn),加快算法的收斂速度。 (1)首先將所有個(gè)體按照適應(yīng)度高低進(jìn)行排序,采用黃金分割法對個(gè)體進(jìn)行優(yōu)選,只對部分選中的38.2%較優(yōu)秀元胞個(gè)體進(jìn)行FCM操作。對于選中的元胞個(gè)體,按照以下FCM進(jìn)行優(yōu)化: 1)設(shè)置τ=0,最大迭代次數(shù)Gd,解碼每個(gè)個(gè)體得到聚類中心。 2)利用式(6)計(jì)算隸屬度。 3)利用式(7)計(jì)算聚類中心。 4)如果τ≤Gd,則轉(zhuǎn)2);否則,用式(9)計(jì)算適應(yīng)度值,并更新種群。 (2)其余未被選中的61.8%元胞個(gè)體不需執(zhí)行FCM,仍保持原有種群結(jié)構(gòu)進(jìn)行全局搜索,從而兼顧了算法全局探索和局部尋優(yōu)兩者的平衡。 綜上所述,IDCGAFCM算法的流程圖如圖2所示。 2.5.1 測試數(shù)據(jù)集 為了驗(yàn)證本文IDCGAFCM算法對低維數(shù)據(jù)和高維數(shù)據(jù)的分類性能,采用UCI數(shù)據(jù)庫的Iris,Heart disease,Wine,Glass,Image segmentation和Landsat Satellite[32]6組標(biāo)準(zhǔn)數(shù)據(jù)集作為測試樣本,分別利用本文提出的IDCGAFCM算法、FCM、GA-FCM[15]及FCM-IDPSO[24]對上述測試樣本進(jìn)行計(jì)算,并分析比較4種算法的聚類性能。 采用的測試數(shù)據(jù)集及主要特征如表1所示。 2.5.2 算法聚類結(jié)果及分析 從平均值、最差解、最好解、最優(yōu)值標(biāo)準(zhǔn)差和收斂時(shí)間等方面進(jìn)行100次實(shí)驗(yàn),度量算法的收斂速度和穩(wěn)定性能。仿真測試中算法的主要參數(shù)取值如表2所示。 表3所示為4種算法對低維數(shù)據(jù)的聚類結(jié)果,其中加粗?jǐn)?shù)據(jù)為最優(yōu)值。圖3所示為各算法對低維(Iris)數(shù)據(jù)聚類時(shí)的目標(biāo)函數(shù)值變化曲線。分析表3可以看出,針對同樣的低維數(shù)據(jù)樣本,本文IDCGAFCM算法找到的解比FCM,GA-FCM,F(xiàn)CM-IDPSO更好,在絕大多數(shù)情況下都能獲得最高的聚類精度,F(xiàn)CM在短時(shí)間內(nèi)陷入局部最優(yōu)。雖然對比算法在一些數(shù)據(jù)集上也可以獲得較好的性能,如GA-FCM和FCM-IDPSO優(yōu)于FCM,尤其是FCM-IDPSO在Iris和Heart上的表現(xiàn),但其不能每次都完全找到最優(yōu)解,且IDCGAFCM算法的平均值、最優(yōu)值標(biāo)準(zhǔn)差都最小,表明該方法的穩(wěn)定性優(yōu)于其他3種算法。 表3 4種算法對低維數(shù)據(jù)的聚類結(jié)果與收斂時(shí)間比較 表4所示為4種算法對Glass,Image segmentation和Landsat Satellite 3個(gè)高維數(shù)據(jù)的聚類結(jié)果,其中加粗?jǐn)?shù)據(jù)為最優(yōu)值,圖4所示為各算法對高維(Image)數(shù)據(jù)聚類時(shí)的目標(biāo)函數(shù)值曲線。從圖4可以看出,對于高維度特征數(shù)據(jù)聚類問題,IDCGAFCM能夠有效跳出局部最優(yōu),得到更好的聚類結(jié)果,其原因是IDCGAFCM的全局搜索能力優(yōu)于GA-FCM及FCM-IDPSO。正如表4所示,IDCGAFCM的各項(xiàng)數(shù)據(jù)均顯著優(yōu)于其他3種方法,表明新方法具有更好的聚類精度和穩(wěn)定性。各算法對高維數(shù)據(jù)聚類所用的時(shí)間還顯示,IDCGAFCM較FCM-IDPSO和GA-FCM減少了約60%~80%,因此在實(shí)際工程問題中更具競爭力。 表4 4種算法對高維數(shù)據(jù)的聚類結(jié)果與收斂時(shí)間比較 綜合表3和表4可知,IDCGAFCM對低維和高維數(shù)據(jù)的聚類精度、收斂速度和求解的穩(wěn)定性明顯優(yōu)于其他3種方法,而且隨著樣本維數(shù)的增大,IDCGAFCM的優(yōu)勢更為突出,原因在于該算法有效結(jié)合了IDCGA和FCM的優(yōu)點(diǎn)。因此,在解決具有高維度特征的復(fù)雜數(shù)據(jù)集聚類問題時(shí),本文算法相比FCM,GA-FCM和FCM-IDPSO具有優(yōu)勢。 采用IDCGAFCM對產(chǎn)品使用可靠性進(jìn)行區(qū)域粒度劃分,基本步驟如下: 步驟1通過分析使用可靠性影響因素分別提取工作環(huán)境和用戶使用習(xí)慣的關(guān)鍵影響因素,建立各影響因素的量化模型;選擇產(chǎn)品使用可靠性區(qū)域劃分?jǐn)?shù)目的最小值cmin和最大值cmax,面向工程實(shí)踐領(lǐng)域,劃分?jǐn)?shù)目c應(yīng)滿足cmin≤c≤cmax。 步驟2根據(jù)選取的區(qū)域樣本數(shù)量n、最大時(shí)間長度T,對所有數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,進(jìn)而構(gòu)建產(chǎn)品使用可靠性基于工作環(huán)境影響因素模型(模型A)和基于用戶使用習(xí)慣影響因素模型(模型B),從c=cmin到c=cmax進(jìn)行循環(huán)迭代。 (1)根據(jù)劃分?jǐn)?shù)目c和聚類特征的維度d確定基因編碼長度L,采用Arnold映射初始化M個(gè)代表聚類中心矩陣V={v1,v2,…,vc}的元胞個(gè)體,每個(gè)個(gè)體xp代表一種可行的區(qū)域劃分模式。 (2)按照IDCGAFCM算法的流程分別對模型A和模型B進(jìn)行聚類計(jì)算,最終獲得適應(yīng)度最優(yōu)的JACR值。由于問題的復(fù)雜性,很難找到最優(yōu)解,在保持其他參數(shù)不變的條件下,終止迭代次數(shù)設(shè)置為10 000,收斂閾值ε=10-6。 (3)對最優(yōu)JACR值對應(yīng)的個(gè)體基因編碼進(jìn)行解碼后獲得聚類中心,分配對應(yīng)的隸屬度矩陣U=(uik)c×n。比較區(qū)域樣本Οk(1≤k≤n)對每個(gè)簇類的隸屬度值,將Οk劃分到隸屬度最大的簇類中。如果c=cmax,則算法終止;否則c=c+1,轉(zhuǎn)(1)。 經(jīng)過IDCGAFCM計(jì)算后,模型A和模型B的每種粒度層次下都有一個(gè)最優(yōu)JACR值對應(yīng)的聚類結(jié)果,這時(shí)可利用本文的評價(jià)準(zhǔn)則對其進(jìn)行評價(jià),從而確定兩者的聚類數(shù)和最優(yōu)聚類結(jié)果。 步驟3綜合模型A和模型B的聚類結(jié)果,獲得產(chǎn)品使用可靠性在工作環(huán)境和使用時(shí)間上最具一致性的區(qū)域分布。 (1)將模型A和模型B的聚類結(jié)果有效結(jié)合起來,均隸屬于同一簇類的多個(gè)樣本被視為初始類,無法確定歸屬類別的樣本被視為未歸類,獨(dú)立成組的樣本被視為獨(dú)立類。 (2)將每個(gè)包含兩個(gè)及以上樣本的簇類表示成聚類中心的方式,其值通過式(6)計(jì)算得到。 (3)將計(jì)算所得的聚類中心與單個(gè)樣本一起視為總樣本,利用IDCGAFCM再次進(jìn)行聚類分析。 (4)當(dāng)IDCGAFCM收斂或達(dá)到最大迭代次數(shù)時(shí)輸出聚類結(jié)果,即為使用可靠性最優(yōu)的區(qū)域粒度劃分方案。 3.2.1 聚類評價(jià)指標(biāo) 聚類有效性指標(biāo)已被證明是度量不同聚類劃分優(yōu)劣和確定最佳聚類數(shù)的一類有效方法[33-34]。鑒于采用單一的指標(biāo)難以確定最優(yōu)聚類劃分,本文有必要采用多項(xiàng)有效指標(biāo)評價(jià)聚類質(zhì)量。因此,下面既采用僅考慮模糊劃分中隸屬度信息的分類系數(shù)PC和平均模糊熵PE兩個(gè)有效性指標(biāo)[35],也選用同時(shí)考慮數(shù)據(jù)集幾何結(jié)構(gòu)和隸屬度信息的XBI,KI和PCAESI[34]3個(gè)有效性指標(biāo)進(jìn)行使用可靠性區(qū)域粒度劃分優(yōu)劣的檢驗(yàn),并確定最佳聚類數(shù)。 (1)分類系數(shù)和平均模糊熵 PC和PE指標(biāo)僅考慮了隸屬度信息,且PC值越大,PE值越小,其聚類劃分結(jié)果越好。 (2)XBI指標(biāo) 該指標(biāo)包含了隸屬度信息和數(shù)據(jù)結(jié)構(gòu)的幾何屬性,分子用于度量緊致性,分母用于度量分離度,且XBI值越小,聚類效果越好。 (3)KI指標(biāo) KI(c)= KI指標(biāo)同時(shí)使用隸屬度和聚類劃分的幾何結(jié)構(gòu)信息,且KI值越小,聚類效果越好。 (4)PCAESI指標(biāo) 該指標(biāo)的第一項(xiàng)用來度量緊致性,第二項(xiàng)用來度量分離度。當(dāng)PCAESI值最大時(shí),聚類結(jié)果最優(yōu)。 3.2.2 優(yōu)勢劃分的確定 按上述過程對使用可靠性區(qū)域粒度劃分結(jié)果進(jìn)行檢驗(yàn),即在其他條件不變時(shí),使用不同聚類數(shù)分別運(yùn)行IDCGAFCM算法,同時(shí)利用5個(gè)有效性指標(biāo)對其進(jìn)行評價(jià)。當(dāng)指標(biāo)值達(dá)到最優(yōu)時(shí),得到的聚類結(jié)果即為最優(yōu)粒度劃分,相應(yīng)的聚類數(shù)目即為模型A或模型B下合適的c值,從而確定最優(yōu)的使用可靠性區(qū)域粒度劃分方案。每組均代表了使用可靠性水平最具一致性的優(yōu)勢區(qū)域劃分,每組包含的樣本量的大小代表了產(chǎn)品具有相同使用可靠性水平的區(qū)域覆蓋范圍。 將上述IDCGAFCM算法及其在產(chǎn)品使用可靠性區(qū)域粒度確定過程中的具體實(shí)施步驟應(yīng)用于中國省域空調(diào)使用可靠性的區(qū)域粒度劃分問題,獲得空調(diào)使用可靠性的最優(yōu)區(qū)域粒度劃分方案,以該空調(diào)使用可靠性的區(qū)域分布規(guī)律進(jìn)行分析和討論。 3.3.1 數(shù)據(jù)來源與指標(biāo)選取 按照中國區(qū)域經(jīng)濟(jì)統(tǒng)計(jì)年鑒劃分區(qū)域方法并鑒于數(shù)據(jù)的可得性,本文實(shí)例分析中所用的樣本為除香港、澳門特別行政區(qū)和臺灣省之外的中國大陸31個(gè)省級行政區(qū)劃單位。因?yàn)閲医y(tǒng)計(jì)局發(fā)布的關(guān)于城鎮(zhèn)和農(nóng)村居民家庭平均每百戶空調(diào)擁有量以及城鎮(zhèn)居民人均可支配收入和農(nóng)村居民人均收入的統(tǒng)計(jì)數(shù)據(jù)截止到2012年,中國氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)發(fā)布的氣象數(shù)據(jù)截止到2013年,所以樣本區(qū)間的跨度選擇2005~2012年。其中溫度、相對濕度、日照、降水量和風(fēng)速的數(shù)據(jù)來源于中國氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)發(fā)布的中國地面氣候資料月值數(shù)據(jù)集、中國地面氣候資料日值數(shù)據(jù)集;社會消費(fèi)品零售總額增長率、空調(diào)平均消費(fèi)傾向則根據(jù)《中國區(qū)域經(jīng)濟(jì)統(tǒng)計(jì)年鑒》(2005~2012年)的相關(guān)數(shù)據(jù)經(jīng)計(jì)算得出。至此,本文分別構(gòu)建了包括2005~2012年31個(gè)省級行政區(qū)劃單位的基于工作環(huán)境影響因素和用戶使用空調(diào)習(xí)慣影響因素的面板數(shù)據(jù)集模型A(31×8×48),B(31×8×24)。限于篇幅,表5和表6給出了部分研究數(shù)據(jù)。 表5 中國省域空調(diào)樣本工作環(huán)境聚類特征數(shù)據(jù) 表6 中國省域空調(diào)樣本用戶使用習(xí)慣聚類特征數(shù)據(jù) 續(xù)表6 3.3.2 空調(diào)使用可靠性區(qū)域粒度劃分的評價(jià)及結(jié)果分析 按照IDCGAFCM算法分別對模型A和模型B進(jìn)行計(jì)算,算法參數(shù)設(shè)置為:種群規(guī)模M=100,空調(diào)區(qū)域樣本數(shù)量n=31,終止評價(jià)次數(shù)Tmax=10 000,模型A的聚類特征維度d=384,模型B的聚類特征維度d=192,cmin=2,cmax=14。采用基于聚類中心的實(shí)數(shù)制編碼生成初始種群,根據(jù)劃分?jǐn)?shù)目c漸進(jìn)改變的實(shí)際要求,初始種群中每個(gè)個(gè)體基因矢量編碼長度c×d也隨之變化,編碼設(shè)計(jì)為{y1,y2,…,yi,…,yc},其中yi表示第i個(gè)初始聚類中心且yi=(yi1,…yij,…,yid)。以模型B為例,yij則是由用戶使用習(xí)慣第j維聚類特征對應(yīng)的最大值和最小值及Arnold映射經(jīng)式(11)計(jì)算得到的聚類中心初值,依此類推生成初始種群。 將表5和表6的數(shù)據(jù)導(dǎo)入編譯后的程序環(huán)境中,從c=2,…,14依次進(jìn)行迭代優(yōu)化,得到不同聚類數(shù)目所對應(yīng)的聚類結(jié)果。為此,同時(shí)采用5個(gè)不同的有效性指標(biāo)對cmin=2和cmax=14之間的每個(gè)粒度層次下的粒度劃分結(jié)果進(jìn)行定量評價(jià),以確定最優(yōu)的粒度劃分。各指標(biāo)取值與聚類數(shù)目c兩者的關(guān)系如圖5和圖6所示。 從圖5可以看出,除PC和PE指標(biāo)外,其余各項(xiàng)有效性指標(biāo)均表明c=10時(shí),聚類效果最佳。由圖5a和圖5b可知,對于僅考慮隸屬度信息的PC和PE指標(biāo),當(dāng)聚類數(shù)由2增加到14時(shí),隨聚類數(shù)的增大,各指標(biāo)存在單調(diào)遞增或遞減的問題,難以準(zhǔn)確辨別模型A的聚類數(shù),主要原因是這些指標(biāo)沒有使用聚類劃分的幾何結(jié)構(gòu)信息,缺少與模型A幾何結(jié)構(gòu)的直接聯(lián)系,因此在準(zhǔn)確評價(jià)基于工作環(huán)境影響因素的空調(diào)使用可靠性區(qū)域粒度劃分質(zhì)量和識別聚類數(shù)方面不太理想。而對于同時(shí)考慮模型A幾何結(jié)構(gòu)和隸屬度信息的PCAESI,XBI,KI指標(biāo)而言,由圖5e可知,當(dāng)聚類數(shù)由2增加到10時(shí),PCAESI指標(biāo)總體上處于上升的趨勢;當(dāng)c>10時(shí),PCAESI又開始下降,表明c=10是最佳聚類數(shù)。從圖5c和圖5d可以看出,當(dāng)聚類數(shù)由2增加到14時(shí),XBI和KI指標(biāo)在c=2,10處有兩個(gè)明顯的極小值點(diǎn),實(shí)際上c=10時(shí)的XBI和KI指標(biāo)僅大于c=2時(shí)的指標(biāo)值,這也表明c=10是一個(gè)較優(yōu)的聚類數(shù)目。因此,空調(diào)使用可靠性區(qū)域劃分?jǐn)?shù)目c取10是合理的,這也正是取多項(xiàng)評判指標(biāo)的原因。同理,由圖6可知,PCAESI,XBI,KI指標(biāo)能夠較全面地評價(jià)基于用戶使用習(xí)慣影響因素的空調(diào)使用可靠性區(qū)域粒度劃分的質(zhì)量,因此最佳劃分?jǐn)?shù)目c應(yīng)取8類。 依然采用GA-FCM,F(xiàn)CM-IDPSO和本文算法分別對基于工作環(huán)境影響因素和基于用戶使用習(xí)慣影響因素的空調(diào)使用可靠性區(qū)域聚類進(jìn)行運(yùn)算。3種智能聚類算法在基于工作環(huán)境影響因素的空調(diào)使用可靠性分類數(shù)取10的情況下,其聚類目標(biāo)函數(shù)的迭代過程如圖7所示;在基于用戶使用習(xí)慣影響因素的空調(diào)使用可靠性分類數(shù)取8的情況下,其聚類目標(biāo)函數(shù)的迭代過程如圖8所示。 從圖7和圖8可以看出,本文方法求解得到的聚類結(jié)果更好,且聚類時(shí)所用時(shí)間更少。為進(jìn)一步說明在產(chǎn)品使用可靠性區(qū)域粒度劃分的應(yīng)用上,本文方法較其他方法具有一定的優(yōu)越性,用上述4種方法優(yōu)化PCAESI,XBI,KI3個(gè)有效性指標(biāo),各自獨(dú)立進(jìn)行30次運(yùn)算,計(jì)算結(jié)果如表7所示。 由表7可以看出,針對同樣的模型A或模型B,本文算法所得的XBI和KI指標(biāo)值比FCM,GA-FCM,F(xiàn)CM-IDPSO更小一些,表明其聚類效果好于其他3種方法。表中數(shù)據(jù)還顯示,本文算法得到的PCAESI值最大,也表明其聚類結(jié)果最優(yōu)。因此,通過分析以上實(shí)驗(yàn)數(shù)據(jù)表明,在解決模型A和模型B的聚類問題時(shí),本文算法較其他3種方法具有更好的聚類精度。 綜合圖7和圖8及表7可知,與FCM,GA-FCM,FCM-IDPSO相比,本文算法在聚類效率和精度方面均表現(xiàn)出了一定的優(yōu)勢,因此采用本文算法求解使用可靠性區(qū)域聚類模型得到最優(yōu)解,則適應(yīng)度最優(yōu)的元胞個(gè)體基因編碼所代表的聚類中心矩陣V及對應(yīng)的隸屬度矩陣U即為最優(yōu)的聚類結(jié)果。比較每個(gè)空調(diào)地域樣本對聚類中心的隸屬度,找出最大值,便可直觀地決定該地域?qū)儆谀囊粋€(gè)簇類(限于篇幅,未列出各地域樣本所對應(yīng)的隸屬度矩陣,只列出相應(yīng)的劃分結(jié)果),空調(diào)使用可靠性單獨(dú)基于工作環(huán)境和基于用戶使用習(xí)慣因素進(jìn)行劃分的最優(yōu)聚類結(jié)果如表8第2,3列所示。最后,按照步驟3綜合兩類聚類結(jié)果,得到二次聚類后的空調(diào)使用可靠性基于雙重影響因素的最優(yōu)區(qū)域粒度劃分方案,如表8第1列所示。 表8 本文方法得到的空調(diào)使用可靠性的區(qū)域粒度劃分方案 從表8可以看出,經(jīng)過聚類后空調(diào)使用可靠性地域樣本之間的關(guān)系比較明顯,起到了良好的分類效果。從區(qū)域空調(diào)使用可靠性水平與工作環(huán)境和使用習(xí)慣的一致性等幾個(gè)方面對上述10類區(qū)域進(jìn)行考察和歸納,大致可以分為如下兩個(gè)層次: (1)第Ⅰ層 從工作環(huán)境影響因素來看,北京、內(nèi)蒙古、青海、河南、遼寧5類區(qū)域在全國排列中處于影響程度較低水平,這與基于月份的平均溫度、濕度、日照、降水量指標(biāo)考察的工作環(huán)境因素惡劣水平明顯正相關(guān)關(guān)系。從用戶使用習(xí)慣影響因素來看,北京、內(nèi)蒙古、山東、遼寧4類區(qū)域空調(diào)使用可靠性受其影響的程度更小;考察空調(diào)在各個(gè)季度開機(jī)時(shí)間特征發(fā)現(xiàn),山東、河南、陜西、云南4省的使用時(shí)間較為接近。綜合兩類影響因素來看,北京、內(nèi)蒙古、山東、遼寧、云南5類區(qū)域受二者的影響程度較低,空調(diào)使用可靠性處于相對較高水平。 (2)第Ⅱ?qū)?/p> 從工作環(huán)境影響因素來看,上海、福建、浙江、重慶5類區(qū)域的空調(diào)使用可靠性受其影響的程度較大;從用戶使用習(xí)慣影響因素來看,上海、江蘇、江西、重慶4類區(qū)域的空調(diào)使用可靠性受其影響的程度更大??傮w來說,上海、江蘇、福建、江西、重慶5類區(qū)域受工作環(huán)境和使用習(xí)慣兩類因素影響的程度在全國排列中處于中上水平,空調(diào)使用可靠性處于相對較低水平。 本文針對產(chǎn)品使用可靠性區(qū)域粒度確定問題,建立了基于工作環(huán)境和用戶使用習(xí)慣兩類因素的多變量的高維聚類目標(biāo)模型,基于CGA算法良好的多樣性和全局搜索能力,以及FCM算法良好的局部搜索能力,有效結(jié)合這兩種算法的特點(diǎn)互補(bǔ)長短,在CGA算法中引入信息熵理論和黃金分割優(yōu)選策略,并采用動態(tài)的交叉和基于熵的兩階段動態(tài)變異算子,形成了一種混合聚類算法IDCGAFCM,以使聚類結(jié)果在精度和穩(wěn)定性得到明顯提高的同時(shí)大大減少其聚類所用的時(shí)間。IDCGAFCM與GA-FCM,F(xiàn)CM-IDPSO,FCM的性能對比結(jié)果驗(yàn)證了IDCGAFCM的有效性和可行性,并給出了其在產(chǎn)品使用可靠性區(qū)域粒度確定過程中的具體實(shí)施方法。最后將4種算法分別應(yīng)用于空調(diào)使用可靠性區(qū)域聚類模型的求解,實(shí)例對比分析結(jié)果表明,本文算法比其他3種算法的效果有所改善,為解決空調(diào)使用可靠性區(qū)域粒度確定問題提供了一種新的方法。 與現(xiàn)有的空調(diào)使用可靠性區(qū)域粒度確定方法相比,本文所提方法可大幅減少設(shè)計(jì)人員的工作量及主觀性因素的影響程度,而且科學(xué)精細(xì)的使用可靠性區(qū)域粒度研究也為空調(diào)產(chǎn)品可靠性設(shè)計(jì)、開展分區(qū)保修及實(shí)現(xiàn)保修策略的最優(yōu)設(shè)計(jì)奠定了基礎(chǔ)。未來將進(jìn)一步改善該算法的性能,并將算法推廣應(yīng)用于其他類型家電產(chǎn)品的使用可靠性區(qū)域粒度的確定問題。2 動態(tài)優(yōu)選元胞遺傳模糊聚類算法
2.1 元胞遺傳算法原理
2.2 初始種群的產(chǎn)生
2.3 遺傳操作設(shè)計(jì)
2.4 IDCGAFCM算法原理
2.5 IDCGAFCM算法性能測試及結(jié)果分析
3 IDCGAFCM算法在使用可靠性區(qū)域粒度問題中的應(yīng)用
3.1 實(shí)施步驟
3.2 聚類有效性評價(jià)及優(yōu)勢劃分的確定
3.3 應(yīng)用實(shí)例
4 結(jié)束語