袁佳鋮,宗文剛,*,曾 磊,李 強(qiáng),張昊元,藺佳哲
(1.四川大學(xué) 化學(xué)工程學(xué)院,成都 610065;2.中國空氣動力研究與發(fā)展中心,綿陽 621000)
作為高超聲速飛行器面臨的主要挑戰(zhàn)之一[1],氣動熱防護(hù)一直是其設(shè)計工作的重點(diǎn)。在實(shí)際工程工作中,設(shè)計師們會對目標(biāo)飛行器的氣動熱環(huán)境進(jìn)行預(yù)測以輔助熱防護(hù)設(shè)計,為了保證飛行器能夠正常工作,通常會進(jìn)行大量的冗余設(shè)計,這樣雖然保證了飛行器的飛行安全,但也增加了成本和重量,嚴(yán)重制約了飛行器的性能。因此氣動熱環(huán)境預(yù)測的準(zhǔn)確度與速度是飛行器性能與設(shè)計效率的關(guān)鍵。目前常用的飛行器氣動熱環(huán)境預(yù)測方法有3種,分別是工程計算方法、風(fēng)洞試驗和CFD數(shù)值模擬[2-4]。其中,隨著計算機(jī)硬件技術(shù)的飛速發(fā)展,CFD數(shù)值模擬技術(shù)越來越成熟并逐漸成為獲取大量氣動熱數(shù)據(jù)的主要手段之一。
在多年的研究與工程實(shí)踐中,我們已經(jīng)積累了大量的氣動數(shù)據(jù),如何對這些數(shù)據(jù)進(jìn)行再利用,探索科學(xué)研究的“第四范式”,逐漸成為一個研究重點(diǎn)。在這一方面,美國已經(jīng)開展了大量的研究,例如由NASA資助的XAI-DAV(eXplainable AI for Design of Aerial Vehicles)項目已經(jīng)能夠在短時間內(nèi)從9000多個飛行器外形中篩選出最優(yōu)秀的設(shè)計案例,并提供合理的設(shè)計依據(jù),使設(shè)計方案更具可解釋性和可靠性。
隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,國內(nèi)外許多學(xué)者嘗試?yán)蒙疃葘W(xué)習(xí)技術(shù)構(gòu)建數(shù)據(jù)驅(qū)動的氣動特性預(yù)測方法,并取得不少成果[5]。作為深度學(xué)習(xí)的關(guān)鍵技術(shù)之一,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[6]以其對空間信息出色的處理能力,贏得了眾多學(xué)者的青睞。在航空航天領(lǐng)域,許多學(xué)者利用CNN開展了氣動特性以及流場預(yù)測方面的工作,并取得了不錯的效果[7-12],但主要應(yīng)用于二維流場。CNN在三維流場中應(yīng)用并不廣泛,主要原因是三維飛行器的幾何特征難以提取,而且普通計算機(jī)難以處理大尺寸、高維度的張量。但是,如果只考慮三維外形表面的熱流等問題,那么需要考慮的就只有飛行器的表面幾何特征,因此將CNN應(yīng)用于三維飛行器外形的氣動熱預(yù)測是可行的。
目前也有一些學(xué)者嘗試?yán)脵C(jī)器學(xué)習(xí)方法建立了數(shù)據(jù)驅(qū)動的快速氣動熱預(yù)測方法。在不考慮飛行器外形因素的條件下,許多學(xué)者采用本征正交分解(proper orthogonal decomposition, POD)建立了氣動熱代理模型[13-15],針對單個飛行器,以來流參數(shù)為輸入,實(shí)現(xiàn)氣動熱的快速預(yù)測。采用類似的思路,張智超等[16]提出了一種基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的氣動熱預(yù)測代理模型,該模型在飛行器表面的每個點(diǎn)上建立獨(dú)立的網(wǎng)絡(luò)來進(jìn)行熱流單獨(dú)預(yù)測。除此之外,還有利用氣動熱與邊界層外緣信息相關(guān)的特點(diǎn),基于支持向量機(jī)建立了當(dāng)?shù)鼗臍鈩訜峥焖兕A(yù)測方法[17]。這兩種方法由于沒有考慮外形對氣動熱分布的影響,因此無法做到不同外形飛行器在不同來流條件下的氣動熱預(yù)測。為了能夠?qū)Υ罅繗鈩訑?shù)據(jù)進(jìn)行有效地再利用,實(shí)現(xiàn)飛行器設(shè)計所需的氣動熱快速預(yù)測,建立能夠預(yù)測不同外形飛行器氣動熱分布的模型是十分必要的。Li[18]采用深度學(xué)習(xí)技術(shù)根據(jù)飛行器的整體幾何特征和局部幾何特征實(shí)現(xiàn)了不同飛行器在不同來流條件下的氣動熱快速預(yù)測。該方法的思路是可行的,但其在建模前需要獲取飛行器的多種幾何特征,且其神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)過于復(fù)雜,因此建模效率較低。
綜上,本文以不同外形飛行器在不同飛行條件下的氣動熱快速預(yù)測為目標(biāo),采用對幾何信息具有較強(qiáng)處理能力且模型參數(shù)更少的卷積神經(jīng)網(wǎng)絡(luò),建立了氣動熱快速預(yù)測模型。采用CFD數(shù)值模擬方法建立了氣動熱數(shù)據(jù)集,并用不同的神經(jīng)網(wǎng)絡(luò)模型對不同外形飛行器的氣動熱進(jìn)行了預(yù)測,探索了不同網(wǎng)絡(luò)模型的預(yù)測能力。與其他類似方法不同,本文所提方法采用了大量卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行飛行器外形特征的提取和熱流重構(gòu)工作,這使得模型參數(shù)量變少而且能夠通過GPU實(shí)現(xiàn)加速,大大提高了訓(xùn)練效率。
本節(jié)首先提出了一種三維外形幾何表達(dá)方法,然后依據(jù)該方法詳細(xì)介紹了兩種基于卷積神經(jīng)網(wǎng)絡(luò)的熱流預(yù)測模型,整個熱流預(yù)測流程如圖1所示。
圖1 建模流程Fig.1 Flowchart of the modeling process
飛行器的外形對其表面的熱流分布有著巨大影響,同一飛行器表面不同區(qū)域的熱流值不同,不同飛行器也會因為外形差異而熱流分布不同。因此,想要神經(jīng)網(wǎng)絡(luò)模型能夠準(zhǔn)確預(yù)測不同位置、不同飛行器的熱流值,如何將飛行器的外形幾何信息傳遞給神經(jīng)網(wǎng)絡(luò)是關(guān)鍵。符號距離函數(shù)(sign distance function, SDF)作為目前深度學(xué)習(xí)領(lǐng)域常用的一種幾何表達(dá)方法,廣泛應(yīng)用在空氣動力學(xué)建模領(lǐng)域,但基本上是針對二維幾何外形的。本文依據(jù)SDF原理,針對典型飛行器外形,提出了一種可用于卷積神經(jīng)網(wǎng)絡(luò)的三維外形幾何表示方法,該方法具體實(shí)施步驟如下:
1) 在飛行器表面建立大小為M×N的單塊結(jié)構(gòu)網(wǎng)格,M表示沿x軸順時針旋轉(zhuǎn)方向上的網(wǎng)格點(diǎn)數(shù),N表示沿x軸從飛行器頭部到尾部方向上的網(wǎng)格點(diǎn)數(shù)。鈍錐的重構(gòu)網(wǎng)格如圖2所示,可以看出由于外形的原因,網(wǎng)格線在n=1處坍縮為一個奇點(diǎn)。飛行器的頭部熱流通常較高,因此頭部也是氣動熱預(yù)測工作中的關(guān)鍵區(qū)域,在CFD模擬中常常會對頭部網(wǎng)格進(jìn)行加密從而實(shí)現(xiàn)關(guān)鍵位置熱流的精確模擬。本方法在建立網(wǎng)格時可以調(diào)整網(wǎng)格分布從而實(shí)現(xiàn)對頭部網(wǎng)格的加密。針對本文研究的4種外形,考慮對周向網(wǎng)格采用均勻分布,而對軸向網(wǎng)格則在頭部采用等比分布,在尾部采用均勻分布。
圖2 鈍錐重構(gòu)網(wǎng)格Fig.2 Reconstructed mesh of the blunt cone
2) 計算網(wǎng)格中的每一個點(diǎn)到x軸的距離Rm,n并進(jìn)行歸一化,可以獲得一個含有三維曲面特征信息的矩陣,如式(1)所示,并且根據(jù)這個矩陣可以還原三維外形。與SDF函數(shù)類似,這樣的矩陣也能夠轉(zhuǎn)化為圖像并作為神經(jīng)網(wǎng)絡(luò)的輸入。
3) 根據(jù)重構(gòu)的網(wǎng)格,對CFD計算得到的物面熱流數(shù)據(jù)進(jìn)行插值,獲得重構(gòu)網(wǎng)格對應(yīng)點(diǎn)位的熱流值并組成熱流值矩陣,如式(2)所示。由于重構(gòu)網(wǎng)格中n=1的點(diǎn)都對應(yīng)了網(wǎng)格前端的奇點(diǎn),因此理論上這些點(diǎn)的預(yù)測熱流值應(yīng)該相等,但事實(shí)上神經(jīng)網(wǎng)絡(luò)的輸出并不滿足這個要求,所以需要對預(yù)測熱流矩陣中該列的值求取平均值,以避免無意義的誤差。
卷積神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)的一種,廣泛用于處理圖像等有序數(shù)據(jù),與人工神經(jīng)網(wǎng)絡(luò)類似,卷積神經(jīng)網(wǎng)絡(luò)的靈感來自動物視覺皮層的組織結(jié)構(gòu)[19-20]。卷積神經(jīng)網(wǎng)絡(luò)通常由卷積塊和神經(jīng)網(wǎng)絡(luò)的一些通用層組成,其中卷積塊是由卷積層和池化層組成的,作用是提取輸入圖像的特征。CNN最重要的組成部分之一是卷積層,其主要功能是使用卷積核對矩陣進(jìn)行運(yùn)算。圖3給出了一個簡單卷積層的計算過程,可以看出一個7×7的矩陣在經(jīng)過卷積層的運(yùn)算之后變成了5×5的矩陣。
圖3 卷積層運(yùn)算過程Fig.3 Operation process on the convolution layer
由于矩陣在經(jīng)過卷積層的運(yùn)算之后尺寸會發(fā)生變化,因此為了保持輸出圖像的尺寸,通常會在矩陣邊緣填充零來消除卷積層對矩陣大小的影響。此外,輸出矩陣還受到卷積運(yùn)算步長和卷積核大小的影響,輸出矩陣大小的具體計算方法如式(3)所示:
式中:Sout和Sin表示卷積層輸出和輸入的尺寸,Spadding表示邊緣填充的層數(shù),Skernelsize表示卷積核的尺寸,Sstride表示卷積運(yùn)算步長。在此基礎(chǔ)上,為了保持矩陣的尺寸,卷積層的運(yùn)算轉(zhuǎn)變?yōu)閳D4所示的過程。
圖4 帶邊緣填充的卷積層運(yùn)算過程Fig.4 Operation process on the convolution layer with padding
目前卷積神經(jīng)網(wǎng)絡(luò)常用于圖像識別和語義分割。針對圖像識別的卷積神經(jīng)網(wǎng)絡(luò)通常是以圖片為輸入,以類別為輸出,因此一般是由一系列的卷積塊和一個全連接網(wǎng)絡(luò)組合而成的。而語義分割的卷積神經(jīng)網(wǎng)絡(luò)是以圖像為輸出,因為需要根據(jù)卷積層提取出的特征對圖像進(jìn)行還原,所以其結(jié)構(gòu)相對于前者來說更加復(fù)雜。本文采用類似語義分割的方法,以飛行器的外形特征矩陣和飛行條件為輸入,對其表面熱流進(jìn)行重構(gòu),因此選用了通常用于語義分割的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
為了探索適用于熱流預(yù)測的網(wǎng)絡(luò)模型結(jié)構(gòu),本文分別基于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的編碼器-解碼器架構(gòu)和全卷積神經(jīng)網(wǎng)絡(luò)(fully convolutional networks, FCN)的變體U-Net模型設(shè)計了兩種熱流預(yù)測模型。為了便于說明,分別用CNN模型和U-Net模型指代兩種網(wǎng)絡(luò)模型。
針對CNN模型,由于網(wǎng)絡(luò)模型的輸入不僅包括飛行器幾何信息矩陣,還包括由飛行高度、馬赫數(shù)和迎角組成的一維飛行狀態(tài)向量。因此,有必要設(shè)計兩個編碼器來處理兩種輸入信息,然后通過一個全連接神經(jīng)網(wǎng)絡(luò)將兩個編碼器的輸出進(jìn)行融合并傳遞給熱流解碼器。整個神經(jīng)網(wǎng)絡(luò)由幾何信息編碼器、飛行條件編碼器和熱流解碼器三部分組成,其整體結(jié)構(gòu)如圖5所示。其中幾何信息編碼器是由多個卷積層和池化層組成的一個卷積神經(jīng)網(wǎng)絡(luò),其輸入是二維的外形信息矩陣,輸出是一個一維的向量,主要作用是對幾何信息進(jìn)行編碼。來流條件編碼器由多個全連接層構(gòu)成,其輸入是飛行高度(H)、馬赫數(shù)(Ma)和迎角(α)組成的一維飛行條件向量,輸出是一個一維向量,主要功能是將飛行條件編碼為與幾何信息編碼器輸出維度相同的向量。熱流解碼器結(jié)構(gòu)相對較為復(fù)雜,其首先通過一個全連接神經(jīng)網(wǎng)絡(luò)對兩個編碼器的輸出進(jìn)行整合,然后通過卷積層和上采樣層對熱流矩陣進(jìn)行重構(gòu),其輸出是一個與幾何信息矩陣尺寸相同的熱流值矩陣。
圖5 CNN結(jié)構(gòu)Fig.5 Structure of CNN
FCN是Long[21]于2015年提出的一種用于語義分割的神經(jīng)網(wǎng)絡(luò)模型,與傳統(tǒng)CNN模型不同的是,該模型將全連接層全部替換為卷積層,使得整個神經(jīng)網(wǎng)絡(luò)完全是由卷積層、池化層和上采樣層組成,這使得圖像在神經(jīng)網(wǎng)絡(luò)運(yùn)算傳遞過程中僅是分辨率發(fā)生了變化。U-Net作為FCN的一種,在提出時被用于醫(yī)學(xué)圖像分割,由于效果出眾而被廣泛應(yīng)用于各個行業(yè)[22]。U-Net模型將編碼器中不同層級的特征跳躍連接到解碼器中,實(shí)現(xiàn)了編碼器和解碼器的深度耦合。
由于U-Net是全卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的一種,無法像CNN模型一樣用全連接神經(jīng)網(wǎng)絡(luò)處理飛行高度、馬赫數(shù)和迎角組成的飛行條件向量。因此考慮將飛行高度、馬赫數(shù)和迎角與飛行器外形信息矩陣組合為一個四通道的矩陣作為整個神經(jīng)網(wǎng)絡(luò)的輸入,該矩陣的第一個通道為飛行器外形信息矩陣,第二至第四個通道分別是飛行高度、馬赫數(shù)和迎角,其結(jié)構(gòu)如圖6所示。
圖6 U-Net結(jié)構(gòu)Fig.6 Structure of U-Net
在這項工作中,本文使用NNW-HyFLOW軟件模擬得到了用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的氣動熱數(shù)據(jù)。由于沒有涉及側(cè)滑角,因此采用半模計算并將計算結(jié)果處理為全模的形式用于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。為了研究CNN、U-net兩種模型在不同方面的性能,本文創(chuàng)建了以下3個不同的數(shù)據(jù)集。
數(shù)據(jù)集A:該數(shù)據(jù)集由9個不同錐角的鈍錐在不同飛行條件下的物面熱流數(shù)據(jù)組成。具體的飛行條件如表1所示。錐角為7°、8°、9°、10°、11°、12°、13°、14°、15°,飛行高度為20~60 km,馬赫數(shù)為5~20,迎角為0°~20°。采用全因子設(shè)計法,每種外形可以得到252個不同的飛行狀態(tài),9種外形共有2268個算例。
表1 飛行條件Table 1 Flight conditions
數(shù)據(jù)集B:為了考查模型在外形發(fā)生巨大變化時的熱流預(yù)測能力,按照表1所示的飛行條件采用全因子設(shè)計法,針對錐角為7°的鈍錐、雙橢球、鈍雙錐和升力體4種外形進(jìn)行CFD模擬。每種外形可得到252個樣本,整個數(shù)據(jù)集共有1008個樣本。
數(shù)據(jù)集C:數(shù)據(jù)集C是數(shù)據(jù)集A的子集,由錐角為7°的鈍錐表面熱流數(shù)據(jù)組成,用于研究不考慮飛行器外形變化時模型的熱流預(yù)測能力。
本文的4種模型外形為:不同錐角的鈍錐模型球頭半徑均為10 mm,錐身長為190 mm;鈍雙錐模型球頭半徑為10 mm,第一錐角為7°,第一錐身長為190 mm,第二錐角為12°,第二錐身長為100 mm;雙橢球模型采用文獻(xiàn)[23]中給出的數(shù)學(xué)模型并設(shè)置總長為200 mm;升力體外形是自主設(shè)計生成的,該外形球頭半徑為20 mm,后掠角為10°,總長為1350 mm,其具體外形如圖7所示。
圖7 升力體幾何示意圖Fig.7 Schematic diagram of the lifting body geometry
設(shè)置輸入輸出矩陣的尺寸為128 × 128,采用1.1節(jié)所述的幾何表達(dá)方法對數(shù)據(jù)集中的所有樣本進(jìn)行數(shù)據(jù)預(yù)處理。針對CNN模型,在數(shù)據(jù)的邊緣添加虛擬單元以降低模型對邊緣區(qū)域的預(yù)測誤差,虛擬單元的值從矩陣的內(nèi)層映射得到,具體的設(shè)置方法如圖8所示。考慮到添加了虛擬單元會影響模型的網(wǎng)絡(luò)結(jié)構(gòu),為了保證添加虛擬單元前后不影響幾何特征編碼器的輸出尺寸,設(shè)置添加6層虛擬單元,添加了虛擬單元后輸出的尺寸變?yōu)?40 × 140。
圖8 虛擬單元添加方法Fig.8 Method of adding virtual cells
根據(jù)輸入輸出的尺寸,分別對兩種模型的具體網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行設(shè)計,CNN模型3個組件的具體網(wǎng)絡(luò)參數(shù)如表2~表4所示,U-Net模型的具體參數(shù)如表5所示。
表2 幾何信息編碼器網(wǎng)絡(luò)結(jié)構(gòu)Table 2 Structure of the geometric information encoder
表3 飛行條件編碼器網(wǎng)絡(luò)結(jié)構(gòu)Table 3 Structure of the flight condition encoder
表4 熱流解碼器網(wǎng)絡(luò)結(jié)構(gòu)Table 4 Structure of the heat flux decoder
表5 U-Net網(wǎng)絡(luò)結(jié)構(gòu)Table 5 Structure of U-Net
由于CNN模型的訓(xùn)練數(shù)據(jù)是添加了虛擬單元的,而虛擬單元區(qū)域的誤差是不需要考慮的,因此在損失函數(shù)和模型評估指標(biāo)中僅統(tǒng)計其有效區(qū)域的誤差。本文選用絕對百分比誤差e(absolute percent error,APE)衡量單個樣本的預(yù)測誤差,用平均絕對百分比誤差l(mean absolute percent error, MAPE)作為損失函數(shù),二者可由式(4)~式(7)計算得到:
其中:hij和分別表示熱流矩陣中 (i,j)位置處的CFD熱流值和預(yù)測熱流值,S表示當(dāng)前數(shù)據(jù)集的樣本個數(shù)。由于不同條件下的熱流差別巨大,相對誤差更能反映模型的真實(shí)預(yù)測精度,因此本文考慮采用MAPE作為模型性能的評價指標(biāo)。為了全面考查模型對熱流的預(yù)測能力,以MAPE為基礎(chǔ)設(shè)計了全局誤差、高熱流區(qū)域誤差和最大熱流值誤差。全局誤差是指飛行器整個物面上熱流的平均絕對百分比誤差,高熱流區(qū)域誤差是指高熱流區(qū)域熱流值的平均絕對百分比誤差,最大熱流值誤差是指熱流最大值的平均絕對百分比誤差。
將數(shù)據(jù)集A以4∶1的比例分為訓(xùn)練集和測試集,采用適應(yīng)性矩估計優(yōu)化器(adaptive moment estimation optimizer, Adam),設(shè)置學(xué)習(xí)率為0.0005,設(shè)置模型每次優(yōu)化的樣本數(shù)為64,對兩種模型分別進(jìn)行訓(xùn)練。在5000次訓(xùn)練后,U-Net模型在訓(xùn)練集和測試集上的誤差分別為1.46%和1.51%,CNN模型在訓(xùn)練集和測試集上的誤差分別為2.66%和2.92%,可以看出U-Net模型的預(yù)測精度是明顯高于CNN模型的。兩種模型的學(xué)習(xí)曲線如圖9所示,同樣可以看出在5000次訓(xùn)練后U-Net的誤差明顯更低,而且U-Net模型的訓(xùn)練收斂速度也略快于CNN模型。
圖9 CNN和U-Net在數(shù)據(jù)集A上的學(xué)習(xí)曲線Fig.9 Learning curves of CNN and U-Net trained by dataset A
對于數(shù)據(jù)集A,選擇鈍錐的球頭區(qū)域作為高熱流區(qū)域。測試集的3種誤差結(jié)果見表6,結(jié)果表明,UNet不論是整體預(yù)測誤差還是局部區(qū)域的預(yù)測誤差均低于CNN模型。
表6 CNN和U-Net模型在測試集上的預(yù)測誤差Table 6 Prediction errors of CNN and U-Net on the test dataset
在測試集中隨機(jī)抽取3個錐角不同的鈍錐作為測試樣本,3個樣本的具體參數(shù)如表7所示,分別用兩個模型對其熱流分布進(jìn)行預(yù)測,將不同位置(z= 0,y= 0,x= 50)的預(yù)測結(jié)果與CFD計算得到的熱流值進(jìn)行對比,其結(jié)果如圖10所示。圖中z= 0處熱流變化曲線表示熱流沿該線由下至上的變化,y= 0處熱流變化曲線表示半模結(jié)果中熱流沿該線由頭部到身部的變化,x= 50處熱流變化曲線表示半模結(jié)果中熱流沿該線由下至上的變化。從圖中可以看出,在大面積區(qū)域兩種模型的預(yù)測結(jié)果與CFD模擬得到的結(jié)果均吻合良好,說明對不同錐角的鈍錐組成的簡單數(shù)據(jù)集,兩種模型均有較高的預(yù)測精度,但在局部區(qū)域(x=50),U-Net模型的預(yù)測結(jié)果與CFD結(jié)果吻合得更好。
表7 鈍錐測試算例參數(shù)Table 7 Parameters of the blunt cone test samples
圖10 不同錐角鈍錐局部位置熱流對比(左:z = 0,中:y = 0,右:x = 50)Fig.10 Comparison of the heat flux in different areas of the blunt cones with different cone angles (left: z = 0, middle: y = 0, right: x = 50)
兩種模型在鈍錐熱流數(shù)據(jù)集上均有較好的預(yù)測效果,但鈍錐的外形以及熱流分布較簡單,而且不同錐角的鈍錐熱流分布相似性高,因此無法體現(xiàn)模型對外形變化的感知能力。本小節(jié)考慮采用由鈍錐、雙橢球、鈍雙錐和升力體4種外形熱流數(shù)據(jù)組成的數(shù)據(jù)集B對兩種模型進(jìn)行訓(xùn)練和測試。同樣將數(shù)據(jù)集以4∶1的比例分為訓(xùn)練集和測試集,采用Adam優(yōu)化器,設(shè)置學(xué)習(xí)率為0.0005,設(shè)置模型每次優(yōu)化的樣本數(shù)為64,對兩種模型分別進(jìn)行訓(xùn)練。在10000次訓(xùn)練后,CNN模型在訓(xùn)練集和測試集上的誤差分別為4.78%和5.17%,U-Net模型在訓(xùn)練集和測試上的誤差分別為1.63%和1.94%。在數(shù)據(jù)集變復(fù)雜之后,兩種模型的預(yù)測誤差有了明顯增大,但U-Net模型仍然保持著精度上的優(yōu)勢。兩種模型的學(xué)習(xí)曲線如圖11所示,同樣可以看出在10000次訓(xùn)練后U-Net模型具有更低的預(yù)測誤差。
圖11 CNN和U-Net在數(shù)據(jù)集B上的學(xué)習(xí)曲線Fig.11 Learning curves of CNN and U-Net trained by dataset B
從測試集中隨機(jī)選取不同外形的樣本各一個,用于對模型進(jìn)行測試,4個樣本的具體參數(shù)如表8所示。分別采用兩種模型對4個樣本進(jìn)行預(yù)測,將不同位 置(z= 0,y= 0,x= 50、100、500)的 預(yù)測結(jié)果與CFD結(jié)果進(jìn)行對比,其熱流云圖與局部位置的對比如圖12~圖15所示。從算例的對比可以看出,針對稍微簡單的軸對稱外形,鈍錐和鈍雙錐兩種模型在大面積區(qū)域與CFD結(jié)果吻合較好;針對一些變化較大的外形,例如升力體和雙橢球,可以明顯看到CNN模型預(yù)測的熱流分布發(fā)生了較大的波動。尤其是在雙橢球的第二橢球區(qū)域,CNN模型的預(yù)測結(jié)果出現(xiàn)了較大的偏差,而U-Net模型的預(yù)測結(jié)果則相對較好。這說明相比于CNN模型,U-Net模型對飛行器外形的感知能力更強(qiáng),具有更高的預(yù)測精度。
表8 4類外形測試算例參數(shù)Table 8 Flight parameters for the different model geometries
圖12 鈍錐的熱流預(yù)測結(jié)果對比(左:z = 0,中:y = 0,右:x = 50)Fig.12 Comparison of the predicted heat flux of the blunt cone (left: z = 0, middle: y = 0, right: x = 50)
圖13 鈍雙錐的熱流預(yù)測結(jié)果對比(左:z = 0,中:y = 0,右:x = 50)Fig.13 Comparison of the predicted heat flux of the double cone (left: z = 0, middle: y = 0, right: x = 50)
圖15 雙橢球的熱流預(yù)測結(jié)果對比(左:z = 0,中:y = 0,右:x = 100)Fig.15 Comparison of the predicted heat flux of the double ellipsoid (left: z = 0, middle: y = 0, right: x = 100)
對雙橢球的兩個熱流峰值的預(yù)測誤差隨訓(xùn)練次數(shù)的變化趨勢進(jìn)行考查,結(jié)果如圖16所示。從圖中可以看出兩個模型對第一峰值的熱流預(yù)測效果良好,其中U-Net模型的精度略高;但對第二個熱流峰值的預(yù)測,CNN模型的預(yù)測結(jié)果明顯存在較大的偏差,而U-Net模型也需要更多次的訓(xùn)練才能獲得較好的預(yù)測效果。這是由于雙橢球相比于其他外形會多一個熱流峰值,該峰值是外形的變化造成的。圖16的結(jié)果表明U-Net模型相比于CNN模型對外形變化的感知能力更強(qiáng),因此其對熱流的預(yù)測精度更高。另一方面,模型在第二峰值的誤差在訓(xùn)練10000次時基本穩(wěn)定,因此在數(shù)據(jù)集變復(fù)雜之后,模型需要增加訓(xùn)練次數(shù)才能獲得良好的預(yù)測效果。
圖16 兩個熱流峰值預(yù)測誤差隨訓(xùn)練次數(shù)的變化趨勢Fig.16 Error variation of the two heat-flux peak values with the training times
2.5.1 與RBF方法對比
RBF方法是由張智超[16]提出的一種基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的氣動熱預(yù)測代理模型,對飛行器表面的每個點(diǎn)構(gòu)建了正則化的徑向基神經(jīng)網(wǎng)絡(luò),并同時對這些網(wǎng)絡(luò)進(jìn)行訓(xùn)練。這是一種預(yù)測在不同飛行條件下的物面熱流的方法,因為沒有考慮飛行器的外形特征,所以該方法只能對單個外形的熱流數(shù)據(jù)進(jìn)行建模。
對于不考慮外形變化的氣動熱預(yù)測模型,更重要的是如何用更少的訓(xùn)練數(shù)據(jù)來提高模型預(yù)測精度。為了研究訓(xùn)練樣本數(shù)量對模型的影響,從數(shù)據(jù)集C中選取不同數(shù)量的樣本訓(xùn)練CNN模型、U-Net模型和RBF模型,將剩余的數(shù)據(jù)作為測試集,對比結(jié)果如圖17所示。
圖17 不同訓(xùn)練樣本數(shù)時三種模型的預(yù)測誤差Fig.17 Prediction errors of the three models trained by datasets with different numbers of samples
對比結(jié)果表明,當(dāng)樣本量較大時,3種模型的預(yù)測精度相似,但隨著樣本量的減少,CNN模型和UNet模型的預(yù)測精度明顯高于RBF模型,其中UNet模型在訓(xùn)練樣本數(shù)量較少時預(yù)測誤差最低。這表明本文所采用的U-Net模型在訓(xùn)練數(shù)據(jù)較少的情況下仍具有相對較強(qiáng)的學(xué)習(xí)能力。
2.5.2 與SA-HFNet對比
Li等[18]提出的SA-HFNet是一種基于深度學(xué)習(xí)的氣動熱預(yù)測方法。為了考查本文采用的兩種模型的訓(xùn)練效率,本小節(jié)使用數(shù)據(jù)集A在配備Inter(R)Core(TM) i9-10940X CPU @ 3.30 GHz 3.31 GHz和NVIDIA GeForce RTX 3090的 計 算 機(jī) 上 對CNN、U-Net和SA-HFNet模型三個模型進(jìn)行訓(xùn)練和測試。拋開精度談效率是沒有意義的,所以在模型訓(xùn)練時設(shè)置當(dāng)測試集的平均絕對百分比誤差達(dá)到2%時即停止訓(xùn)練。
訓(xùn)練結(jié)果的對比如表9所示,可以看出,CNN模型和U-Net模型能夠用更少的訓(xùn)練時間獲得與SAHFNet相當(dāng)?shù)木?。CNN與U-Net相比,雖然時間的消耗相差不大,但是U-Net的訓(xùn)練次數(shù)遠(yuǎn)小于CNN模型,這是因為U-Net模型收斂得更快。CNN模型和U-Net模型能夠在短時間內(nèi)達(dá)到目標(biāo)精度的原因有二:一方面,權(quán)值共享是卷積神經(jīng)網(wǎng)絡(luò)最突出的特征之一,這使得其在訓(xùn)練中比全連接神經(jīng)網(wǎng)絡(luò)更高效;另一方面,與SA-HFNet不同,CNN模型和U-Net模型以整個表面的熱流為單個樣本,而SA-HFNet以單個點(diǎn)的熱流為單個樣本,這導(dǎo)致SA-HFNet的訓(xùn)練樣本數(shù)量遠(yuǎn)大于CNN模型和U-Net模型。
表9 SA-HFNet、CNN和U-Net訓(xùn)練效率對比Table 9 Comparison of the training efficiency of SA-HFNet,CNN and U-Net
本文針對氣動熱的快速預(yù)測問題,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于高超聲速飛行器的氣動熱預(yù)測,提出了一種三維曲面幾何特征表達(dá)方法,并基于該方法通過兩種不同架構(gòu)的神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)了不同外形飛行器在不同飛行條件下的表面熱流預(yù)測。通過對多種典型外形的熱流預(yù)測結(jié)果對比,以及與同類方法的對比,可以得到以下結(jié)論:
1) 基于編碼器-解碼器架構(gòu)的CNN模型與UNet模型針對簡單外形均有不錯的預(yù)測精度。但當(dāng)外形變復(fù)雜時,基于U-Net的氣動熱預(yù)測模型具有更強(qiáng)的外形感知能力,因此預(yù)測精度更高。另一方面針對更復(fù)雜的外形,模型需要更多的訓(xùn)練次數(shù)才能獲得良好的預(yù)測效果。
2) 在不考慮飛行器的外形變化時,U-Net模型具有更強(qiáng)的學(xué)習(xí)能力,能夠在訓(xùn)練數(shù)據(jù)較少的情況下獲得相對較高的預(yù)測精度。
3) 由于采用了大量的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),本文所提方法訓(xùn)練效率較高,其中U-Net模型具有更快的收斂速度,能夠在更短時間內(nèi)達(dá)到目標(biāo)精度。
本文針對提出的方法,使用了一些典型高超聲速飛行器外形進(jìn)行了仿真測試,下一步將針對更復(fù)雜、更貼近工程應(yīng)用的飛行器外形進(jìn)行研究。同時對方法的泛化性進(jìn)行深入探討,對氣動熱以外的其他氣動特性進(jìn)行建模預(yù)測。