于 洋,孫成偉,張冰冰,宋建輝
(沈陽理工大學(xué),信息科學(xué)與工程學(xué)院,遼寧沈陽110159)
數(shù)據(jù)中心溫度預(yù)測是在平時(shí)采集溫度數(shù)據(jù)的基礎(chǔ)上,根據(jù)設(shè)備運(yùn)行需要對(duì)未來溫度變化做出的預(yù)先定量估計(jì),其預(yù)測精確程度將決定空調(diào)制冷效率和設(shè)備運(yùn)行好壞,它是數(shù)據(jù)中心得以正常運(yùn)行的重要依據(jù)。數(shù)據(jù)中心溫度是一個(gè)動(dòng)態(tài)的非線性系統(tǒng),不同設(shè)備工作時(shí)產(chǎn)生不同的熱量,造成數(shù)據(jù)中心機(jī)房的溫度分布不均。
用以時(shí)間為自變量的代數(shù)方程或微分方程的函數(shù)來描述溫度的分布是十分困難的。目前傳統(tǒng)的預(yù)測方法有經(jīng)驗(yàn)法、回歸分析法等。而RBF神經(jīng)網(wǎng)絡(luò)由于具有快速的學(xué)習(xí)能力和廣泛的拓?fù)潢P(guān)系而備受青瞇。更有學(xué)者將模糊理論和神經(jīng)網(wǎng)絡(luò)相結(jié)合建立出預(yù)測精度更高的模糊神經(jīng)網(wǎng)絡(luò)模型[1],但隨著影響數(shù)據(jù)中心溫度因素不斷增多,以及各影響因素影響程度比重性和評(píng)價(jià)各影響因素標(biāo)準(zhǔn)性不同,使數(shù)據(jù)的模糊性和隨機(jī)性得不到聯(lián)系和度量,模糊神經(jīng)網(wǎng)絡(luò)模型“模糊不徹底性”問題日益突出。為克服上述問題,將云模型引入到RBF神經(jīng)網(wǎng)絡(luò),使“模糊性和隨機(jī)性結(jié)合起來”用于改進(jìn)RBF神經(jīng)網(wǎng)絡(luò)算法,提出了云模型RBF神經(jīng)網(wǎng)絡(luò)。
本文將應(yīng)用云理論建立相關(guān)的云模型,通過數(shù)據(jù)的收集和分析,研究影響數(shù)據(jù)中心[2]溫度變化的不同因素及其取值的分布規(guī)律,并在此基礎(chǔ)上建立各因素的云推理規(guī)則,再結(jié)合RBF神經(jīng)網(wǎng)絡(luò)算法對(duì)數(shù)據(jù)中心溫度進(jìn)行預(yù)測。
云模型有3個(gè)數(shù)字特征期望Ex、熵En和超熵He,它們反映了定性描述的定量特性。正態(tài)云模型是最基本的云模型,它的期望曲線是一個(gè)正態(tài)特性曲線,其結(jié)構(gòu)如圖1所示。
圖1 云特征結(jié)構(gòu)圖
云分布曲線為。
云發(fā)生器可分為正逆向云發(fā)生器和X、Y條件云發(fā)生器,還可以根據(jù)單規(guī)則生成多規(guī)則云發(fā)生器[3]。
云變換[4]是一種定量數(shù)據(jù)到定性概念轉(zhuǎn)換的方法,給定論域中某個(gè)數(shù)據(jù)屬性X的頻率f(x),根據(jù)X的屬性值頻率的實(shí)際分布情況,生成若干個(gè)粒度不同的云C(Exi,Eni,Hei)的疊加,每個(gè)云代表一個(gè)離散的、定性的概念。其數(shù)學(xué)表達(dá)為
式中,ai為幅度系數(shù),n為變換后生成的離散概念的個(gè)數(shù),其擬合算法如下:
Step1統(tǒng)計(jì)出屬性定義域中個(gè)數(shù)據(jù)點(diǎn)的分布,并得到曲線gi。
Step2找出分布函數(shù)gi波峰的位置,將其定義為云的期望Exi,在此期望基礎(chǔ)上計(jì)算出云模型的熵Eni,便推出云模型的數(shù)據(jù)分布函數(shù)gi(x)。
Step3在gi數(shù)據(jù)中減去gi(x)得到新的分布函數(shù)g(x)在此基礎(chǔ)上重復(fù)step2和step3,得到諸多分布函數(shù)gi(x)。
Step4得到曲線分布函數(shù)。
RBF網(wǎng)絡(luò)基本結(jié)構(gòu)為三層,和BP網(wǎng)絡(luò)一樣,RBF網(wǎng)絡(luò)也是一種靜態(tài)前向網(wǎng)絡(luò),第一層為輸入層,由信號(hào)原結(jié)點(diǎn)組成;第二層為隱含層,其神經(jīng)元個(gè)數(shù)根據(jù)所描述問題的需要而定;第三層為輸出層,它對(duì)輸入模式的作用響用,圖2為RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖2 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
RBF神經(jīng)網(wǎng)絡(luò)[5]的映射關(guān)系由兩個(gè)部分組成(設(shè)輸入的維數(shù)為n,隱單元數(shù)為m,輸出維數(shù)為l),第一部分:從輸入空間到隱層空間的非線性變換層。
這里Φ(·)為徑向基函數(shù)(即隱含單元的變換函數(shù)),是一種局分布的對(duì)中心點(diǎn)徑向?qū)ΨQ衰減的非線性函數(shù),即高斯函數(shù)。其中:‖·‖是范數(shù),通常取2 范數(shù),X 為 n 維輸入向量,X= [x1,x2,...,xn],Ci為第i個(gè)隱含層單元的中心。
第二部分:從隱含層空間到輸出層空間的線性合并層,輸出為
式中:Wi為第i個(gè)隱層單元與輸出之間的連接權(quán);m為隱層單元數(shù)。
RBF神經(jīng)網(wǎng)絡(luò)的工作原理:原始數(shù)據(jù)經(jīng)過輸入層的線性傳遞至隱含層,隱含層的基函數(shù)為非線性的高斯函數(shù),經(jīng)過非線性變換,即將原始數(shù)據(jù)的輸入信號(hào)直接(即不通過權(quán)值連接)映射到隱含層空間,信號(hào)傳至輸出層,經(jīng)過線性變換,RBF網(wǎng)絡(luò)最終輸出。其本質(zhì)是選擇適當(dāng)?shù)幕瘮?shù)和隱含層單元數(shù)和連接權(quán)值。
應(yīng)用于RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和優(yōu)化的算法[6],如梯度算法、K-mean算法等都是圍繞確定網(wǎng)絡(luò)的權(quán)值、中心和寬度來展開的。研究表明,網(wǎng)絡(luò)的中心和寬度決定權(quán)值,因此RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和優(yōu)化的重點(diǎn)就轉(zhuǎn)化到基函數(shù)中心和寬度的確定上。
通過對(duì)云理論和RBF神經(jīng)網(wǎng)絡(luò)的研究,發(fā)現(xiàn)正態(tài)云模型與RBF神經(jīng)網(wǎng)絡(luò)的徑向基函數(shù)十分相似,因?yàn)樵颇P偷膶?shí)現(xiàn)需要三個(gè)參數(shù)(期望Ex、熵En、超熵He),而RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和學(xué)習(xí)也需確定數(shù)據(jù)中心、寬度、和連接權(quán)值。這樣就可以將云模型三維期望Ex代替數(shù)據(jù)中心,熵En代替寬度,對(duì)于連接權(quán)值仍用RBF神經(jīng)網(wǎng)絡(luò)傳統(tǒng)方法實(shí)現(xiàn),從而實(shí)現(xiàn)了二者的結(jié)合,融合后的模型既可以將云模型的模糊性和隨機(jī)性引入新算法,使其輸出結(jié)果實(shí)現(xiàn)了模糊性和隨機(jī)性的統(tǒng)一,同時(shí)又保留了RBF的學(xué)習(xí)能力和拓?fù)潢P(guān)系。改進(jìn)的RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)確定方法[7]避開了云模型在應(yīng)用中的模糊規(guī)則提取問題。
1)對(duì)影響描述對(duì)象的n個(gè)因素?cái)?shù)據(jù)進(jìn)行基于云變換的數(shù)據(jù)擬合,即將連續(xù)的數(shù)據(jù)離散成相對(duì)應(yīng)的正態(tài)云曲線[8],得到n個(gè)因素的正態(tài)云。
2)根據(jù)影響描述對(duì)象的因素因子和高維云理論,構(gòu)造n維正態(tài)云模型,用n維正態(tài)逆向云算法,從每一組正態(tài)云曲線中用最大值法取特定的數(shù)目的云來構(gòu)造高維云,通過高維云可求出RBF神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)個(gè)數(shù),n維正態(tài)云發(fā)生器算法[9]描述:
(1)根據(jù)輸入樣本的各維數(shù)據(jù)生成t個(gè)以(Ex1,Ex2,...,Exn)為期望和以(En1,En2,...,Enn)為方差 n維正態(tài)隨機(jī)數(shù) ai=(a1i,a2i...,ani),i=1,2,...,t;
(2)生成 t個(gè)以各維數(shù)據(jù)熵(En1,En2,...,Enn)為期望和以各位數(shù)據(jù)超熵(He1,He2,...,Hen)為方差的 n 維正態(tài)隨機(jī)數(shù) yi=(y1i,y2i,...,yni),i=1,2,...,t;
(3)計(jì)算隸屬度
i=1,2,...,t相應(yīng)的(ai,βi)為云滴;
(4)重復(fù)步驟(1)到(3)直至生成足夠數(shù)目的云滴;
3)將各影響因素經(jīng)云變換得到的正態(tài)云個(gè)數(shù)作為RBF神經(jīng)網(wǎng)絡(luò)隱含層個(gè)數(shù),再按照RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,訓(xùn)練樣本去觸發(fā)每一個(gè)隱含層的云節(jié)點(diǎn),同一樣本觸發(fā)同一節(jié)點(diǎn),每次都會(huì)產(chǎn)生稍有不同的,帶有隨機(jī)性但又符合正態(tài)分布的模糊結(jié)果,即會(huì)產(chǎn)生不同的隸屬度,然后取其均值作為期望。用此樣本分別觸發(fā)其它的節(jié)點(diǎn),可以得到隱層輸出矩陣,應(yīng)用最小二乘法求出其中適合模型的那個(gè)隱層節(jié)點(diǎn),至此RBF神經(jīng)網(wǎng)絡(luò)[10]完成了訓(xùn)練。
圖3為數(shù)據(jù)中心溫度預(yù)測的算法流程圖。
圖3 云模型RBF神經(jīng)網(wǎng)絡(luò)算法流程圖
影響數(shù)據(jù)中心溫度的主要因素有數(shù)據(jù)中心氣體組織形式(氣體的流速m/s)、冷風(fēng)口入口溫度(℃)、以及各出口溫度(℃)。本文用一月份實(shí)時(shí)數(shù)據(jù)預(yù)測下個(gè)月數(shù)據(jù)中心溫度的大致分布。在同一高度安置測量儀器,用18b20(溫度傳感器)將采集到的溫度送入單片機(jī),再經(jīng)過485串行總線送到上位機(jī),完成數(shù)據(jù)中心溫度的采集與傳輸[11],用氣體流量計(jì)測得不同位置處氣體的流速,共選用一個(gè)月中90組數(shù)據(jù)的溫度影響因子,表1為各影響因子數(shù)據(jù)分布表。
表1 各影響因子數(shù)據(jù)表
取用前70組數(shù)據(jù)作為訓(xùn)練學(xué)習(xí)數(shù)據(jù)(編號(hào)從1到70),選取后20組數(shù)據(jù)作為測試數(shù)據(jù)。以出口溫度、氣體流速、入口溫度作為輸入數(shù)據(jù),以數(shù)據(jù)中心溫度作為輸出數(shù)據(jù),需要構(gòu)造RBF三層神經(jīng)網(wǎng)絡(luò),其中間隱含層個(gè)數(shù)的確定步驟如下:
(1)對(duì)影響因子入口溫度進(jìn)行極大值法云變換,用FREQUENCY()函數(shù)求得本維的數(shù)據(jù)分布曲線,如圖5所示。
圖4 出口溫度數(shù)據(jù)分布曲線
(2)按照云發(fā)生器算法,將圖4的數(shù)據(jù)分布曲線合并成2朵正態(tài)云圖,如圖5所示。
圖5 合并后出口溫度的云圖
用同樣的方法將影響因子氣體流速和入口溫度做同樣的云變換,合并后的云參數(shù)和朵數(shù)如表2所示。
表2 各影響因子云變換合并后參數(shù)表
(3)按照高維云理論構(gòu)造3維影響因子的高維云模型(參照上文高維云構(gòu)造算法),共構(gòu)造2×3×2=12維云,即隱含層神經(jīng)元個(gè)數(shù)為12個(gè)。
(4)完成RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。按照 RBF的方法,以訓(xùn)練樣本觸發(fā)每一個(gè)中間隱層的云節(jié)點(diǎn)。同一樣本觸發(fā)同一節(jié)點(diǎn),每次都會(huì)得到略有不同的,帶有隨機(jī)性的而又服從正態(tài)分布的模糊結(jié)果。用同一樣本多次觸發(fā)同一節(jié)點(diǎn),得到多個(gè)不同的隸屬度,再取其均值作為期望,用此樣本觸發(fā)12個(gè)節(jié)點(diǎn),得到1×12的隱層輸出,訓(xùn)練樣本為70,則得到的是70×12的隱層輸出矩陣A,網(wǎng)絡(luò)輸出為1×70的矩陣 B,A與 B之間為線性疊加,用最小二乘法很容易求出A×B=C中的C(12×1)矩陣,基于云模型的RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練44次后結(jié)果及收斂曲線如圖6所示。
圖6 云模型的RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練曲線
本文用Matlab軟件仿真,硬件計(jì)算機(jī)內(nèi)存1.92G,486以上的處理器,運(yùn)行環(huán)境為Windows XP。
按云模型RBF神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行分析,將分析結(jié)果與傳統(tǒng)的RBF神經(jīng)網(wǎng)絡(luò)分析結(jié)果進(jìn)行比較,如圖7所示。
圖7 效果比較圖
從圖7的預(yù)測結(jié)果可以看出,傳統(tǒng)的RBF神經(jīng)網(wǎng)絡(luò)預(yù)測數(shù)據(jù)中心的預(yù)測溫度在圍繞實(shí)際溫度上下浮動(dòng),可以看作是實(shí)際溫度的均值,并且預(yù)測誤差較大,誤差精度較低。出現(xiàn)此情況的原因是由于各影響因子輸入樣本數(shù)據(jù)直接參與RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,忽視了對(duì)原始數(shù)據(jù)進(jìn)行粗糙的正態(tài)分布的約束。而基于云模型RBF神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果與實(shí)際結(jié)果趨勢一致,浮動(dòng)較小。因?yàn)樵趨⑴cRBF神經(jīng)網(wǎng)絡(luò)前進(jìn)行了原始數(shù)據(jù)的正態(tài)分布約束,提取了原始數(shù)據(jù)的中心分布,除去了對(duì)數(shù)據(jù)中心溫度預(yù)測影響的次要因子,雖存在預(yù)測誤差,但實(shí)現(xiàn)了對(duì)數(shù)據(jù)中心溫度趨勢的預(yù)測,基于云模型的RBF神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)中心溫度的預(yù)測趨勢優(yōu)于普通的神經(jīng)網(wǎng)絡(luò)。出現(xiàn)上述原因是由于在訓(xùn)練樣本輸入前,首先需要對(duì)影響因子的監(jiān)測數(shù)據(jù)進(jìn)行云變換,對(duì)數(shù)據(jù)進(jìn)行擬合得到數(shù)據(jù)分布曲線,可能在擬合過程中產(chǎn)生的誤差帶入到訓(xùn)練過程中,對(duì)輸出結(jié)果產(chǎn)生了預(yù)測精度的影響。而對(duì)分析結(jié)果中存在的預(yù)測精度問題可以從選擇更全面的影響因素因子和改變?cè)颇P偷臄M合方法二方面進(jìn)行細(xì)致研究??傊容^可看出基于云模型RBF神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)中心溫度的預(yù)測效果要強(qiáng)于傳統(tǒng)RBF神經(jīng)網(wǎng)絡(luò)。
云模型做為定性定量轉(zhuǎn)化的有力工具,將隨機(jī)性和模糊性得以關(guān)聯(lián),構(gòu)成了定性和定量相互間的映射。神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)、自適應(yīng)的能力,并且具有非線性、非局限性等特點(diǎn),使得神經(jīng)網(wǎng)絡(luò)具有較好的容錯(cuò)性和穩(wěn)定性。本文結(jié)合二者優(yōu)點(diǎn)提出了云模型RBF神經(jīng)網(wǎng)絡(luò),既結(jié)合了樣本間的相關(guān)性又體現(xiàn)了模糊性、隨機(jī)性,又根據(jù)云變換從樣本中提取網(wǎng)絡(luò)權(quán)值,大大提高神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度。通過對(duì)數(shù)據(jù)中心溫度的預(yù)測,驗(yàn)證了此模型的實(shí)用性和有效性。
[1]張乃堯.神經(jīng)網(wǎng)絡(luò)與模糊控制[M].清華大學(xué)出版社,2006.
[2]黃赟.通信機(jī)房空調(diào)設(shè)計(jì)中的幾個(gè)問題[J].通信電源技術(shù),2006,23(8):62-64.
[3]李德毅,孟海軍,史雪梅.隸屬云和隸屬云發(fā)生器[J].計(jì)算機(jī)研究和發(fā)展,1995,32(6):15-20.
[4]于少偉,曹凱,趙模.基于一維云模型的交通信息預(yù)測算法[J].山東大學(xué)學(xué)報(bào),2007,20(2):12-14.
[5]鐘洛,饒文碧,鄒承明.人工神經(jīng)網(wǎng)絡(luò)及其融合應(yīng)用技術(shù)[M].北京:科學(xué)出版社,2007.
[6]林成蔭,高大啟.改進(jìn)的RBF網(wǎng)絡(luò)及其參數(shù)優(yōu)化方法[J].計(jì)算機(jī)工程與應(yīng)用,2004,18(6):96-98.
[7]周俊武,孫傳堯,王福利.基于RBF神經(jīng)網(wǎng)絡(luò)的浮選技術(shù)指標(biāo)預(yù)報(bào)模型的研究[J].有色金屬(選礦部分),2002,12(l):39-40.
[8]李德毅,劉常昱.正態(tài)云模型的統(tǒng)計(jì)分析[J].信息與控制,2005,34(2):236-239.
[9]Li Deyi,Di Kaichang,Li Deren.Mi Ning association rules with linguistic cloud models[C].In:PAKDD'98,The Second Pacific-Asia Conference on Knowledge Discovery & Data Min-ing,Melbourne,Australia,1998.
[10]J.Barry Gomm,Ding Li Yu.Selecting radial basis function network centers with recursive orthogonal least squares training[J].IEEE Trans.Neural Networks,2000,11(2):306-314.
[11]張達(dá)敏,王旭.對(duì)基于決策論的數(shù)字信號(hào)調(diào)制識(shí)別方法的改進(jìn)[J].計(jì)算機(jī)應(yīng)用,2009,29(12):3227-3230.