張 博,廖煒鋮,李學智,王 巍,李 震,3
(1.清華大學 航天航空學院,北京 100084; 2.中國移動通信集團黑龍江有限公司,黑龍江 哈爾濱 150028;3.河北清華發(fā)展研究院,河北 廊坊 065000)
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)中心的數(shù)量和規(guī)模逐年增大。數(shù)據(jù)中心的運行特性決定了其能耗較大,而空調(diào)系統(tǒng)的能耗在數(shù)據(jù)中心總能耗中僅次于信息設(shè)備[1]。合理的氣流組織對降低數(shù)據(jù)中心的能耗,提供適宜的熱環(huán)境至關(guān)重要。實驗測試和數(shù)值模擬是研究數(shù)據(jù)中心氣流組織的主要方法。工程實測成本較高,且在實驗過程中,熱環(huán)境可能偏離信息設(shè)備的承受范圍,導致信息設(shè)備宕機。使用計算流體力學(CFD)軟件模擬數(shù)據(jù)中心的氣流組織以其成本低、風險低的優(yōu)勢逐漸受到關(guān)注。CHO等采用CFD模擬和實驗測量發(fā)現(xiàn)地板下送風頂部回風的方式優(yōu)于中側(cè)送風頂部回風、同側(cè)送回風、頂送側(cè)回和下送側(cè)回[2]。PATANKAR使用CFD模擬研究了數(shù)據(jù)中心中的氣流分布,發(fā)現(xiàn)架空地板的高度、空調(diào)的位置、多孔磚的布置、多孔磚的開孔面積和擋板對流場影響很大[3]。CHO等通過CFD模擬發(fā)現(xiàn)空氣回流發(fā)生在服務器上方2.1~2.7 m的位置,增加通道隔墻可以有效阻止空氣回流[4]。LEE等使用CFD研究了冷通道封閉的數(shù)據(jù)中心,發(fā)現(xiàn)在機架頂部安裝一個換熱器和風機可以改善熱環(huán)境[5]。XIONG等使用CFD對比了地板下送風、頂部送風和風扇墻系統(tǒng)對數(shù)據(jù)中心熱環(huán)境的影響,發(fā)現(xiàn)使用風扇墻系統(tǒng)可以降低內(nèi)部的熱點溫度[6]。MOAZAMIGOODARZI等使用CFD研究了冷卻結(jié)構(gòu)對數(shù)據(jù)中心能耗的影響,發(fā)現(xiàn)行間級冷卻和機柜級冷卻比房間級冷卻更節(jié)能[7]。YUAN等使用CFD研究了柔性擋板和服務器傾斜角度對數(shù)據(jù)中心熱環(huán)境的影響,發(fā)現(xiàn)服務器最佳的傾斜角度是30°[8-9]。TANG等使用CFD研究了數(shù)據(jù)中心的熱環(huán)境,發(fā)現(xiàn)添加盲板和關(guān)閉非必要的多孔板可以使溫度分布更均勻[10]。LU等使用CFD研究了不同結(jié)構(gòu)的數(shù)據(jù)中心,發(fā)現(xiàn)提高架空地板的高度和降低開孔百分比可以改善數(shù)據(jù)中心的熱環(huán)境[11]。NADA等使用CFD研究了空調(diào)的位置、開孔率和封閉冷通道對數(shù)據(jù)中心的影響,發(fā)現(xiàn)空調(diào)和冷通道之間的距離對空氣回流的影響不大,封閉冷通道對高密度數(shù)據(jù)中心很有必要[12]。PHAN等研究了不同湍流模型和多孔磚模型對數(shù)據(jù)中心模擬精度的影響,發(fā)現(xiàn)修正體積力模型更適合描述多孔磚,零方程模型的計算精度與標準k-ε模型相當,且計算耗時少[13]。
使用CFD模擬可以獲得數(shù)據(jù)中心的氣流組織和熱環(huán)境,但存在計算時間長、計算資源消耗大等問題。為了加快計算速度,HAN等通過簡化近壁面處的湍流黏度,提出了快速流體力學仿真模型,但是該模型需要使用GPU才能實現(xiàn)加速的目的[14]。SAMADIANI等基于本征正交分解(POD)建立了數(shù)據(jù)中心的降階模型,在重要尺度上求解降階后的能量方程,計算速度是CFD模擬的250倍[15]。ATHAVALE等使用機器學習方法預測了機柜的進風溫度,發(fā)現(xiàn)高斯過程回歸(GPR)的預測精度高于人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量回歸(SVR)[16]。SONG等基于POD和非線性主成分分析建立了預測數(shù)據(jù)中心溫度演化的簡化模型[17]。PHAN等將CFD和POD結(jié)合,研究了入口質(zhì)量流率、服務器熱負載、機柜進風溫度對熱環(huán)境的影響,基于POD的降階模型計算速度是CFD的600倍[18]。SEMPEY等在流場不變和忽略熱源項的假設(shè)下,推導了能量方程的降階模型,可以用來實時預測溫度場[19]。FANG等對比了不同神經(jīng)網(wǎng)絡(luò)預測機柜出風溫度的精度,發(fā)現(xiàn)徑向基神經(jīng)網(wǎng)絡(luò)的預測精度較高[20]。CHOI等對比了自適應ANN和非自適應ANN預測機柜進風溫度的精度,發(fā)現(xiàn)自適應ANN的預測精度更高[21]。WANG等對比了簡化的傳熱模型和數(shù)據(jù)驅(qū)動的模型預測數(shù)據(jù)中心溫度的精度,發(fā)現(xiàn)數(shù)據(jù)驅(qū)動的模型的精度高于傳熱模型,但是可解釋性不如傳熱模型[22]。PARK等比較了滑動窗口、矢量自適應和矢量增強3種再訓練技術(shù)對ANN預測精度的影響,發(fā)現(xiàn)滑動窗口方法的預測精度較高[23]。ASGARI等結(jié)合多區(qū)域模型和ANN建立了預測數(shù)據(jù)中心溫度分布的灰盒模型,比黑盒模型具有更好的外推性能[24]。LIN等對比了SVR、GPR、XGBoost、LightGBM、ANN、LSTM等6種機器學習模型預測數(shù)據(jù)中心溫度的精度,發(fā)現(xiàn)集成學習方法的預測精度較高[25]。LIU等在多區(qū)域模型的基礎(chǔ)上,建立了預測數(shù)據(jù)中心溫度的狀態(tài)空間模型,與CFD模擬結(jié)果相比,誤差小于10%[26]。GUPTA等基于多區(qū)域模型和流動網(wǎng)絡(luò)模型優(yōu)化了數(shù)據(jù)中心的功率分配[27]。HABIBI等基于勢流模型構(gòu)造了數(shù)據(jù)中心的降階模型,但由于節(jié)點數(shù)目較多,瞬態(tài)模擬時間較短[28]。
本文以某數(shù)據(jù)中心為研究對象,建立了CFD模型,使用6 SigmaRoom軟件計算了機柜的出風溫度,并基于POD建立了機柜出風溫度的降階模型,對比了回歸樹、提升樹、SVR、ANN、GPR、三次樣條插值、分段三次Hermite插值對機柜出風溫度的預測精度。
圖1是數(shù)據(jù)中心的平面圖,長33.6 m,寬13.2 m,高4.5 m,包括7臺空調(diào)和6個微模塊。每個微模塊包含22個機柜和末端的控制柜,機柜尺寸為0.6 m×1.2 m×2.2 m。機柜的發(fā)熱功率為3 kW,控制柜不發(fā)熱。架空地板高0.8 m,多孔地板的開孔面積為50%,冷通道和熱通道的尺寸均為1.2 m×2.2 m×7.8 m,并封閉冷通道。送風口面積為1.26 m2,回風口面積為1.8 m2。
圖 1 數(shù)據(jù)中心的平面圖
精密空調(diào)產(chǎn)生的冷空氣通過架空地板送至機柜附近,被機柜內(nèi)的風扇吸入機柜內(nèi)部對設(shè)備進行冷卻。由于數(shù)據(jù)中心中空氣的流速不會超過0.2倍的音速,可以忽略空氣的可壓縮性。采用不可壓縮流體假設(shè),數(shù)據(jù)中心中空氣流動換熱的通用控制方程可寫為
(1)
式中:ρ為密度;U為速度;φ為通用變量;Γφ為廣義擴散系數(shù);Sφ為廣義源項。其具體含義見表1。表中:μ為黏度;p為壓力;x為位置;β為熱膨脹系數(shù);T為溫度;g為重力加速度;κ為熱導率;cp為比熱容;ST為熱源項。
表 1 通用控制方程中相應變量的含義
式(1)描述的流動可以是層流、湍流或?qū)恿骱屯牧髦g的過渡流。湍流是一種高度復雜的三維非穩(wěn)態(tài)、帶旋轉(zhuǎn)的不規(guī)則流動,在實際工程中,求解的是Reynolds時均方程(RANS),可寫為
(2)
Gk+Gb-ρε
(3)
(4)
式中:σk、σε是湍流普朗特數(shù);Gk、Gb與湍動能有關(guān);C1ε、C2ε、C3ε是k-ε模型中的常數(shù)。在固體壁面附近的黏性底層,流動與換熱的計算采用標準壁面函數(shù)法完成。
(5)
式中:φ為一組正交基函數(shù);ai為基函數(shù)的系數(shù);N為基函數(shù)的個數(shù),且使正交投影的誤差最小,即
(6)
(7)
(8)
式中:δ為任意較小實數(shù);Ψ為除φ外其他任一空間基函數(shù)。SIROVICH引入了快照法,經(jīng)過數(shù)學推導,得到POD模態(tài)的控制方程[29],即
Rφ=λφ
(9)
(10)
POD基函數(shù)對應的譜系數(shù)通過投影得到:
(11)
為了在樣本包含的設(shè)計參數(shù)區(qū)間內(nèi),使用降階模型得到樣本外其他設(shè)計參數(shù)下的物理場,需要求出這些設(shè)計參數(shù)下對應的譜系數(shù),且要求POD基函數(shù)沒有較大改變。本文分別使用了回歸樹、提升樹、SVR、ANN、GPR、三次樣條插值和分段三次Hermite插值預測譜系數(shù)。
決策樹是將空間用超平面進行劃分,每次分割時,將當前的空間一分為二。一個回歸樹對應著輸入空間的一個劃分以及在劃分單元上的輸出值。假設(shè)將輸入空間劃分為K個單元R1,R2,…,RK,且在每個單元Ri上有一個固定的輸出值ci,則回歸樹模型可表示為
(12)
最優(yōu)輸出為
(13)
提升樹以回歸樹為基本學習器,其可以表示為回歸樹的加法模型,即
(14)
支持向量機(SVM)是在n維空間中找到一個對數(shù)據(jù)點進行明確分類的超平面。SVR的原理與SVM相同,是在n維空間中找到一個數(shù)據(jù)點數(shù)最多的超平面。給定訓練樣本D={(x1,y1),(x2,y2),…,(xm,ym)},學得形如
(15)
的回歸模型,使得fSVR(x)與y盡可能接近,其中κ(x,xi)是核函數(shù),表2列出了常用的核函數(shù)。
表 2 常用核函數(shù)
ANN(artificial neural network)是一種模仿人腦神經(jīng)網(wǎng)絡(luò)的數(shù)學模型,用于對函數(shù)進行近似。ANN包括輸入層、隱藏層和輸出層,激活函數(shù)為Sigmoid函數(shù)。一個神經(jīng)元的輸入和輸出可以用式(16)表示,即
(16)
本文分別使用了2層神經(jīng)網(wǎng)絡(luò)和3層神經(jīng)網(wǎng)絡(luò)進行預測,每層神經(jīng)網(wǎng)絡(luò)包含10個神經(jīng)元。 GPR是使用高斯過程先驗對數(shù)據(jù)進行回歸分析的非參數(shù)模型。高斯過程是一組隨機變量的集合,且該集合中任意有限個變量均服從聯(lián)合高斯分布。一個高斯過程f(x)的概率特性由它的均值m(x)和協(xié)方差函數(shù)K(x,x′)唯一決定,其中
m(x)=Ε[f(x)]
(17)
K(x,x′)=Ε{[f(x)-m(x)][f(x′)-m(x′)]}
(18)
式中:x和x′是自由變量。GPR中常用的協(xié)方差函數(shù)包括指數(shù)函數(shù)、平方指數(shù)函數(shù)、二次有理函數(shù)、馬頓函數(shù)。三次樣條曲線是通過樣本點的光滑曲線,可以通過求解三彎矩方程組得出曲線函數(shù)組。三次樣條插值就是用三次樣條曲線來進行插值。分段三次Hermite插值是在2個樣本點間使用Hermite三次多項式連接。相比于三次樣條曲線,分段三次Hermite插值不要求二階導數(shù)相等。
在小型數(shù)據(jù)中心中,機柜的功率不高,因此在網(wǎng)格獨立性驗證中,設(shè)定機柜功率為3 kW,7臺空調(diào)的風扇轉(zhuǎn)速均為80%,送風溫度為25 ℃,分別劃分了3 118 648、3 535 792、3 778 362、4 283 748和5 637 556等5套網(wǎng)格,進行網(wǎng)格獨立性驗證。圖2(a)、(b)分別展示了5套網(wǎng)格下計算的空調(diào)回風溫度和機柜出風溫度,3 118 648網(wǎng)格下的計算結(jié)果與5 637 556網(wǎng)格下的計算結(jié)果相差小于0.3 ℃,表明3 118 648網(wǎng)格已經(jīng)克服網(wǎng)格依賴性,用于后續(xù)的CFD模擬。
(a) 5套網(wǎng)格下計算的空調(diào)回風溫度
(b) 5套網(wǎng)格下計算的機柜出風溫度
數(shù)據(jù)中心在運行過程中會出現(xiàn)空調(diào)停機檢修的情況,因此使用CFD軟件,模擬了單個空調(diào)停機時的工況,機柜功率為3 kW不變,其余空調(diào)全開,并計算每個微模塊的出風溫度,結(jié)果如圖3所示。從圖3可知,微模塊每個機柜的出風溫度并不相等,遠離空調(diào)送風口的機柜出風溫度更低,靠近空調(diào)送風口的機柜出風溫度較高。由熱平衡關(guān)系可知,靠近送風口的機柜吸入的冷氣流少于遠離送風口的機柜。這是因為根據(jù)伯努利定律,當總壓一定時,風速越大,靜壓越小。在送風口附近,風速較大,使空氣被快速吹到了后端,反而不易把氣流吹入微模塊中。由圖3(a)、(b)可知,空調(diào)1對微模塊1的影響最大,其次是空調(diào)2,空調(diào)3、4、5、6、7對微模塊1的影響相似??照{(diào)對微模塊的影響顯著依賴于空調(diào)與微模塊的距離。由圖3(c)、(d)可知,對微模塊2影響最大的是空調(diào)2和3。由圖3(e)~(l)可知,微模塊3、4、5、6中遠離送風口的機柜出風溫度在空調(diào)4、5、6、7停機時較高,靠近送風口的機柜出風溫度在空調(diào)3、4、5、6停機時送風溫度較高,說明這些微模塊中遠離送風口的機柜受空調(diào)4、5、6、7的影響更大,靠近送風口的機柜受空調(diào)3、4、5、6的影響更大。由圖3可知,距離微模塊最近的2個空調(diào)對微模塊的影響最大,其余空調(diào)對微模塊的影響不大。
(a) 微模塊1左出風面
(b) 微模塊1右出風面
(c) 微模塊2左出風面
(d) 微模塊2右出風面
(e) 微模塊3左出風面
(f) 微模塊3右出風面
(g) 微模塊4左出風面
(h) 微模塊4右出風面
(i) 微模塊5左出風面
(j) 微模塊5右出風面
(k) 微模塊6左出風面
(l) 微模塊6右出風面
CFD模擬可以獲得數(shù)據(jù)中心熱環(huán)境,但是計算量大,下面使用POD對CFD模擬獲得的溫度場數(shù)據(jù)進行降維,抽取主要特征。降維得到的空間基函數(shù)也稱為POD模態(tài),在相似工況下幾乎不變。每個POD模態(tài)對應的廣義能量體現(xiàn)了該POD模態(tài)包含信息的多少。圖4展示了微模塊出風面溫度場對應的POD模態(tài)的能量占比,M代表微模塊(1~6是微模塊序號),L代表左出風面,R代表右出風面。其中低階模態(tài)的能量占比大,高階模態(tài)的能量占比小,因此低階模態(tài)比高階模態(tài)包含更多的溫度場信息,只需選取前幾階模態(tài)就可以重構(gòu)溫度場。
圖 4 POD模態(tài)的能量占比Fig.4 Energy proportion of the POD mode
GHOSH等對POD建模進行了誤差分析,認為POD建模的誤差依賴于忽略的高階模態(tài)[30]。這里選取前18階模態(tài)重構(gòu)溫度場,以平衡計算效率和精度。
圖5展示了空調(diào)1停機時,CFD計算出的微模塊1的左出風面的溫度場,使用18階POD模態(tài)重構(gòu)的微模塊1的左出風面的溫度場和二者的誤差,其中最大誤差為0.12 ℃。圖中橫縱坐標Z和Y分別代表微模塊1左出風面的長度和寬度。其余微模塊的出風溫度場重構(gòu)效果與之相同,因此使用18階POD模態(tài)可以有效重構(gòu)溫度場。
(a) CFD計算出的微模塊1左出風面 的溫度場
(b) POD重構(gòu)的微模塊1左出風面的溫度場
(c) POD重構(gòu)的溫度場誤差
為了在樣本確定的區(qū)間內(nèi)預測樣本外的其他工況下的熱環(huán)境,需要預測未知工況下POD模態(tài)對應的譜系數(shù)。圖6(a)對比了幾種機器學習模型在訓練集上的確定系數(shù)R2和均方根誤差ERMS,其分別定義為
(19)
(20)
為了測試機器學習模型的泛化性能,使用CFD軟件計算了空調(diào)1和2送風量為76%、78%、82%、84%、86%時數(shù)據(jù)中心的溫度場,抽取微模塊1的左出風面作為測試集。圖6對比了幾種機器學習模型的泛化性能,其中FTM是精細樹模型,SVR2是核函數(shù)為二次函數(shù)的SVR,SVR3是核函數(shù)為三次函數(shù)的SVR,SVRG是核函數(shù)為高斯函數(shù)的SVR,GPRQ是協(xié)方差函數(shù)為二次有理函數(shù)的GPR,GPRSE是協(xié)方差函數(shù)為平方指數(shù)的GPR,GPRM是協(xié)方差函數(shù)為馬頓函數(shù)的GPR,GPRE是協(xié)方差函數(shù)為指數(shù)函數(shù)的GPR,BTM是提升樹模型,NN2是兩層神經(jīng)網(wǎng)絡(luò)模型,NN3是三層神經(jīng)網(wǎng)絡(luò)模型,可見協(xié)方差函數(shù)為二次有理函數(shù)的GPR具有最優(yōu)的泛化性能。這是因為GPR使用高斯過程先驗對數(shù)據(jù)進行回歸分析,更適合低維和小樣本的情況。
(a) 訓練集上的確定系數(shù)和均方根誤差
(b) 測試集上的確定系數(shù)和均方根誤差
機器學習模型相當于建立一個與已知數(shù)據(jù)點距離最短的函數(shù),而插值法則可以建立一個通過數(shù)據(jù)點的函數(shù)。因此在數(shù)據(jù)點準確已知時,插值法建立的函數(shù)逼近誤差更小。下面使用三次樣條插值和分段三次Hermite插值預測未知工況下POD模態(tài)的譜系數(shù),并重構(gòu)溫度場。圖7展示了三次樣條插值和分段三次Hermtie插值預測的微模塊1的左出風面溫度場和CFD計算的溫度場的最大溫度誤差,其中k是測試樣本的序號。
圖 7 三次樣條插值和分段三次Hermite 插值的溫度誤差
可見2種插值方法的精度相似,最大誤差為0.33 ℃。使用POD與機器學習方法或插值方法相結(jié)合預測溫度場的計算時間不足60 s,使用CFD軟件預測溫度場的計算時間為2 h,計算速度提升了100多倍。
1) 本文首先使用CFD軟件計算了多種工況下數(shù)據(jù)中心的熱環(huán)境,對比了一臺空調(diào)停機時微模塊的出風溫度,發(fā)現(xiàn)對微模塊溫度場影響最大的是距離微模塊最近的空調(diào)。同一個微模塊中的機柜的風量存在差異,遠離空調(diào)的機柜的風量高于靠近空調(diào)的機柜。這是因為靠近空調(diào)處的壓力較小,遠離空調(diào)處的壓力較大。
2) 以CFD軟件計算的微模塊出風溫度為原始數(shù)據(jù),使用POD進行降維,截取18階POD模態(tài)重構(gòu)溫度場,最大誤差小于0.2 ℃,說明POD方法的低階模態(tài)包含了物理場的大部分信息,僅需截取少量低階模態(tài)便可有效重構(gòu)物理場。
3) 對比了回歸樹、提升樹、支持向量回歸、神經(jīng)網(wǎng)絡(luò)、高斯過程回歸、三次樣條插值、分段三次Hermite插值與POD結(jié)合預測相似工況下微模塊出風溫度的精度,發(fā)現(xiàn)高斯過程回歸、三次樣條插值、分段三次Hermite插值的預測精度高于回歸樹、提升樹、支持向量回歸和神經(jīng)網(wǎng)絡(luò),計算速度比CFD軟件快了100多倍,說明高斯過程回歸、三次樣條插值和分段三次Hermite插值更適合對小樣本的數(shù)據(jù)進行建模。
4) 當使用高斯過程回歸預測時,以指數(shù)函數(shù)為核函數(shù)時的預測精度高于以平方指數(shù)函數(shù)、二次有理函數(shù)或馬頓函數(shù)為核函數(shù)時的預測精度。