關(guān)珊珊 管強(qiáng) 劉艷
(青島大學(xué)附屬醫(yī)院,山東青島 266000)
基于權(quán)重優(yōu)化復(fù)合聚類的空調(diào)控制研究
關(guān)珊珊管強(qiáng)*劉艷
(青島大學(xué)附屬醫(yī)院,山東青島266000)
為解決央空調(diào)控制過程中控制參數(shù)復(fù)雜,變量維數(shù)較高,多屬性數(shù)據(jù)點(diǎn)集中包含數(shù)值型屬性、類別屬性和混合型等多屬性結(jié)構(gòu)的問題,本文針對工業(yè)環(huán)境下多屬性和多變量的特點(diǎn),將模糊聚類算法與屬性加權(quán)優(yōu)化相結(jié)合,進(jìn)而推導(dǎo)出優(yōu)化迭代公式并形成加權(quán)聚類算法,對于具體變量的相關(guān)屬性進(jìn)行數(shù)學(xué)描述。仿真結(jié)果表明,該算法可以很好的處理相關(guān)多屬性約束條件下的變量聚類,結(jié)合模糊關(guān)系優(yōu)化混合屬性集的特征權(quán)重。和傳統(tǒng)算法相比,具有良好的正確率和分類邊界處理效果。
聚類屬性權(quán)值迭代可變加權(quán)
在進(jìn)行數(shù)據(jù)挖掘分析時,對屬性權(quán)值進(jìn)行優(yōu)化一直是十分重要的。常見的分析方法有過濾法[1]和包裝法[2],前者根據(jù)一個可解析的函數(shù)子集分類判別函數(shù)尋求可行特征子集或最優(yōu)特征子集,后者將分類算法的分類正確率作為目標(biāo)子集的選擇判斷依據(jù)。
Matlin Sam uel[3]將特征選擇方法集成到分類和聚類算法中,提出了一個框架型結(jié)構(gòu)的方法,但對于具體分類準(zhǔn)則沒有界定;Xin Quan[4]對鄰域算法中的特例賦一定的權(quán)值以區(qū)分重要性,以使所構(gòu)造的分類器分類效果更佳,但針對復(fù)雜環(huán)境下的多屬性變量沒有進(jìn)行分析論述。
2.1屬性權(quán)值的自適應(yīng)配置描述
設(shè)多屬性的m維空間R的某個區(qū)域內(nèi)存在可構(gòu)造C個聚類的數(shù)據(jù)集S={X1,X2,...,Xn},其中Xi={xi1,xi2,...,xim}∈R(i=1,2,...,n)描述第i個數(shù)據(jù)點(diǎn)在樣本空間中的位置。定義一個帶權(quán)值的"聚類"度量范數(shù),表征某單一屬性對聚類子集的不同反映和數(shù)據(jù)之間的差異性。即:
其中dk(xik,xjk)由第k個屬性類型決定。若其為無序類別屬性,定義為:
2.2基于屬性權(quán)值優(yōu)化的FCM聚類算法研究分析
[5]和[6],定義一個含有模糊隸屬度的模糊準(zhǔn)則復(fù)合目標(biāo)函數(shù):
從而復(fù)合目標(biāo)函數(shù)為
可以看出,復(fù)合目標(biāo)函數(shù)含有三個變量參數(shù),下面分別對這三個變量進(jìn)行相關(guān)優(yōu)化計算。
2.2.1優(yōu)化權(quán)值因子
定義上述附加約束條件的優(yōu)化目標(biāo)拉格朗日函數(shù)為
取其偏導(dǎo)數(shù)為0,可得
從而
2.2.2優(yōu)化隸屬度因子
定義帶上述約束條件的拉格朗日函數(shù)為:
令函數(shù)對各變量的偏導(dǎo)數(shù)為0,得到:
進(jìn)而得到:
從而:
2.2.3優(yōu)化聚類中心
當(dāng)屬性是有序?qū)傩詴r,將目標(biāo)函數(shù)改寫為
令目標(biāo)函數(shù)對各變量的偏導(dǎo)數(shù)為0,得到:
從而得到:
條件:對于有序?qū)傩赃M(jìn)行合理歸一化的數(shù)據(jù)集S={X1,X2,...,Xn}和聚類子集個數(shù)c,初始化上述目標(biāo)函數(shù)的特征權(quán)重向量W=(1,...,1,...,1)T(無先驗知識)或者W=(w1,w2,...,wm)T(有先驗知識),得到初始相異性度量d=(.,.)。
結(jié)果:數(shù)據(jù)點(diǎn)集S={X1,X2,...,Xn}的最終聚類結(jié)果S=C1∪...∪CK,最終的聚類中心點(diǎn)集V(0)={V(0)1,V2(0),...,Vk(0)}和最終的相異性度量d=(.,.)。
算法分析步驟:
Step1
初始化選取復(fù)合屬性數(shù)據(jù)點(diǎn)集S={X1,X2,...,Xn}的c個中心點(diǎn)構(gòu)成初始的聚類中心集V={V1,V2,...,Vc},迭代次數(shù)t=0,隸屬度度量r設(shè)為2,特征權(quán)重度量q設(shè)為2,迭代終止參數(shù)設(shè)為ε。
Step2
Step3
對于有序?qū)傩?,聚類中心點(diǎn)更新公式為:
圖1 變量重要性分析結(jié)果
此時的時間復(fù)雜度為O(nmC)。
對于無序類別屬性,對數(shù)據(jù)子集中的所有取值進(jìn)行全域?qū)?yōu),將當(dāng)前聚類中心點(diǎn)選擇為可使復(fù)合目標(biāo)函數(shù)的最小化函數(shù)部分取得最小值時的極值,即
Step4
隸屬度更新公式為
其中,i=1,2,...,n ,j=1,2,...,C 。這一步的時間復(fù)雜度為O(nmC2)。
Step5
令t=t+1,使用下式更新屬性權(quán)值向量W=(w1,w2,...,wm)T。
其中,k= 1,2,...,m 。
這一步的時間復(fù)雜度為O(nm2C)。
Step6
4.1數(shù)據(jù)初始化
空調(diào)系統(tǒng)的精度取決于空調(diào)系統(tǒng)本身及自動控制兩個方面。空調(diào)統(tǒng)本身主要是冷、熱總量要能保證系統(tǒng)的要求,多采用集散控制裝置。中央空調(diào)集控裝置是用于監(jiān)視和控制中央空調(diào)設(shè)備及其周邊設(shè)備,如主機(jī)、空調(diào)箱、水泵、冷卻塔,各種控制閥門等設(shè)備和零件的可視化智能控制器。
表1 聚類輸入變量
本文針對主要參數(shù)對輸入變量應(yīng)用SPSS數(shù)據(jù)分析軟件,進(jìn)行神經(jīng)網(wǎng)絡(luò)和灰色關(guān)聯(lián)度算法分析,挑選重要性高的變量進(jìn)行聚類,圖1是應(yīng)用算法進(jìn)行重要性分析的結(jié)果。
最終得到如下輸入變量:(表1)
4.2仿真結(jié)果對比
通過傳統(tǒng)FCM聚類算法和基于屬性權(quán)值調(diào)整的聚類算法在正確率和迭代時間上的對比可以看出,新算法在迭代終止時間和聚類正確率方面具有相當(dāng)?shù)膬?yōu)勢。
三維空間聚類結(jié)果對比可以看出,由于新算法充分考慮了聚類子集數(shù)據(jù)在空間上的分布情況,良好的改善了聚類邊界的混疊問題。
中央空調(diào)控制的過程具有大滯后、強(qiáng)耦合、評價指標(biāo)多等特點(diǎn),控制過程往往較為復(fù)雜。
本文將模糊C均值聚類算法和屬性權(quán)值優(yōu)化相結(jié)合,給出了相應(yīng)參數(shù)的更新公式和相關(guān)算法流程,并應(yīng)用生產(chǎn)中的實(shí)際數(shù)據(jù)進(jìn)行方針對比,證明本方法的正確性和優(yōu)越性。
文中算法考慮了控制過程中的高維度多屬性數(shù)據(jù)點(diǎn)集進(jìn)行聚類分析時屬性權(quán)值對聚類結(jié)果的影響。通過仿真分析,看出新算法在迭代正確率和處理邊界混疊方面具有一定的優(yōu)勢。
[1]Koleszar G E.A Description of the Weapon Optimization and Resource Requirements Model[R]INSTITUTE FOR DEFENSE ANALYSES:Report IDA D-2360,2009.
[2]Pawlak Z.et al.Rough stes[J].Communications ofACM,2010,38(11):89-95.
[3]Matlin Samuel.Review of the Literature on the Missile Allocation Problem[J].Operations Research.2010,18(3):334-373.
[4]XIN-QUAN CHEN,HONG PENG,JING-SONG HU.An adaptive optimization method of configuring feature weight group.Proceedings of the Fifth International Conference on Machine Learning and Cybernetics,Dalian,13-16August2006.pp1281-1286.
[5]Huan Liu and Lei Yu.Toward Integrating Feature Selection Algorithms for Classification and Clustering[J].IEEE Transaction on knowledge and data engineering,Vol.17,No.4,April2005. pp491-502.
[6]宇文,劉宏,查紅彬.基于特征選擇分組加權(quán)聚類的表情識別[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2005,17(11):2394~2401.
[7]江艷君,李檸,黃道.修正初始權(quán)值的BP網(wǎng)絡(luò)在CSTR故障診斷中的應(yīng)用[J].華南理工大學(xué)學(xué)報,2004,30(2):207-210.
關(guān)珊珊(1985—),女,滿族,吉林琿春人,工程師,碩士研究生,醫(yī)療儀器設(shè)備驗收、巡檢、維修維護(hù)。
管強(qiáng)(1983—),男,本科,工程師,從事醫(yī)院暖通空調(diào)系統(tǒng)設(shè)備管理工作。