周浩,李毅,蘭勝威,劉海
中國空氣動力研究與發(fā)展中心 超高速空氣動力研究所,綿陽 621000
人類航天活動日趨頻繁,空間碎片數(shù)量急劇增加,對航天器構(gòu)成了嚴(yán)重威脅。目前,以國際空間站為代表的長期在軌航天器一般采用Whipple 防護屏技術(shù)進行空間碎片防護,基本思想是在航天器艙壁前一定距離處設(shè)置一薄板,在空間碎片(下文統(tǒng)稱為彈丸)超高速碰撞(Hypervelocity Impact,HVI)下形成碎片云,使入射彈丸動能被高度分散,從而實現(xiàn)對航天器的有效保護。碎片云侵徹能力的影響因素包括碎片云形狀、質(zhì)量分布以及速度等。因此,為了設(shè)計更加有效的防護結(jié)構(gòu),研究彈丸超高速碰撞薄板形成碎片云的質(zhì)量分布及其隨時間變化規(guī)律具有重要意義。
對超高速碰撞碎片云進行理論研究非常困難,在二級輕氣炮上開展地面超高速碰撞試驗是更為有效的研究手段。與試驗相比,數(shù)值模擬在成本、效率、參數(shù)范圍以及數(shù)據(jù)獲取等方面存在優(yōu)勢,越來越受到研究者重視,提出了多種工程模型來快速預(yù)測碎片云形狀、質(zhì)量分布以及速度分布等特性,鄭建東、邸德寧等對此進行了較為系統(tǒng)的綜述。Sch?fer模型是較為典型的碎片云工程模型,它將碎片云簡化為1 個均勻橢球殼、1 個內(nèi)切于該橢球殼的均勻球殼以及1 個位于碎片云前端的大碎片。黃潔、馬兆俠等從碎片云每個碎片的特征量(包括質(zhì)量、速度和空間角度等)統(tǒng)計規(guī)律出發(fā),構(gòu)建了一個基于概率的碎片云工程模型。這些工程模型的計算效率非常高,但往往過度簡化、精度不高。近年來,研究者開始探索神經(jīng)網(wǎng)絡(luò)技術(shù)在空間碎片防護領(lǐng)域的應(yīng)用。Ryan 等利用人工神經(jīng)網(wǎng)絡(luò)技術(shù)預(yù)測鋁球能否擊穿鋁板,并與經(jīng)典彈道極限方程對比,結(jié)果表明人工神經(jīng)網(wǎng)絡(luò)在訓(xùn)練參數(shù)范圍內(nèi)精度較高,主要缺點在于外推能力很差。Hosseini 等采用人工神經(jīng)網(wǎng)絡(luò)技術(shù)擬合了靶板穿孔直徑與彈丸半徑、靶板厚度、彈丸質(zhì)量、碰撞角度、彈丸和靶板材料等因素之間的關(guān)系。劉源等基于測量得到的超高速碰撞聲發(fā)射信號的時域特征、頻域特征以及小波能力分?jǐn)?shù),利用人工神經(jīng)網(wǎng)絡(luò)技術(shù)自動識別損傷模式(成坑和穿孔等)。
給定一組輸入?yún)?shù),生成一幅灰度圖,條件變分自編碼器(Conditional Variation Auto Encoder,CVAE)的功能與此類似。本文研究團隊前期對采用CVAE 模型預(yù)測碎片云形狀變化過程進行了初步研究,輸入?yún)?shù)為彈丸速度、彈丸半徑、靶板厚度和觀測時間,輸出結(jié)果為一個100×100 的矩陣,表征了碎片云的二維質(zhì)量分布。初步研究結(jié)果表明CVAE 模型預(yù)測精度遠(yuǎn)高于傳統(tǒng)工程模型,且計算效率遠(yuǎn)高于數(shù)值模擬;但是CVAE 模型也存在一個嚴(yán)重問題,即模型幾乎沒有外推能力。為改善模型外推能力,本文將像素點的x 和y 坐標(biāo)也視為輸入?yún)?shù),則預(yù)測結(jié)果為一個空間點的灰度值(標(biāo)量),通過采用多層感知機模型(Multi-Layer Perceptron,MLP),根據(jù)通用近似定理可以從理論上保證預(yù)測精度,從而有可能提高模型的外推能力。此外,對于數(shù)值模擬而言,同一組輸入?yún)?shù)生成的圖像是固定的,導(dǎo)致CVAE 模型中的編碼過程并非必要,可以直接對輸入?yún)?shù)進行解碼,從而得到反卷積模型(De-Convolutional Neural Networks,DCNN)。因此,本文通過系統(tǒng)比較MLP 模型和DCNN 模型,重點考察模型的外推能力。
本文采用光滑粒子流體動力學(xué)(Smoothed Particle Hydrodynamics,SPH)數(shù)值模擬結(jié)果作為訓(xùn)練集,由PTS 軟件批量計算。以彈丸(鋁球)超高速正碰撞靶板(鋁板)作為算例。坐標(biāo)原點為彈丸與鋁板的初始接觸點,以沿著速度方向–4~10 cm、垂直速度方向–7~7 cm 的方形區(qū)域(忽略反濺碎片云后部質(zhì)量較少的區(qū)域)作為問題域,將該區(qū)域劃分為100×100 的網(wǎng)格,統(tǒng)計每個小網(wǎng)格中的總質(zhì)量m,并以這1×10個數(shù)據(jù)表征碎片云質(zhì)量分布。由于每個小網(wǎng)格中的質(zhì)量相差很大,定義質(zhì)量對數(shù)為(部分小網(wǎng)格中質(zhì)量為0,則加上一個很小的實數(shù)):
對質(zhì)量對數(shù)進行歸一化:
神經(jīng)網(wǎng)絡(luò)的輸出層采用sigmoid 激活函數(shù),因此模型預(yù)測結(jié)果是歸一化的。參考同樣的全局最小和最大網(wǎng)格質(zhì)量對數(shù),可將模型預(yù)測結(jié)果還原為真實質(zhì)量m。
數(shù)值模擬中彈丸速度v 的范圍為3~8 km/s(間隔1 km/s),彈丸半徑r 范圍為2~8 mm(間隔1 mm),靶板厚度d 范圍為1~4 mm(間隔1 mm),觀測時間t 范圍為1 ~12 μs(間隔1 μs),共2 016 個數(shù)據(jù)作為訓(xùn)練集。輸入數(shù)據(jù)同樣需要歸一化:
需要注意的是:當(dāng)輸入?yún)?shù)在訓(xùn)練集內(nèi)時,歸一化輸入?yún)?shù)在0~1 之間;若輸入?yún)?shù)大于訓(xùn)練集范圍(如測試模型外推能力時),歸一化輸入?yún)?shù)大于1。
Bhowmik 等采用CVAE 模型對蛋白質(zhì)折疊進行了模擬,解碼器包括1 個全鏈接層和4 個的反卷積層。本文借鑒該結(jié)構(gòu)設(shè)計了如圖1所示的反卷積模型。模型采用2 個全鏈接層升維,通過5 個反卷積層(filters=256,128,64,32,1)加批量歸一化層生成最后的質(zhì)量分布圖像。
圖1 反卷積模型Fig.1 De-convolutional neural networks architecture
第i 行第j 列小網(wǎng)格中的歸一化質(zhì)量對數(shù)是歸一化彈丸速度、彈丸半徑、靶板厚度以及觀測時間4 個變量的連續(xù)函數(shù):
代表像素位置信息的下標(biāo)i 和j 從離散值(1,2,···,100)擴展至連續(xù)值(0~1):
根據(jù)通用近似定理,只要神經(jīng)元數(shù)量足夠,采用包含一個隱藏層的多層感知機即可以任意精度擬合上述函數(shù)。據(jù)此設(shè)計了如圖2所示的多層感知機模型,其中有2 個包含1 000 個神經(jīng)元的隱藏層。第一層采用ReLU 激活函數(shù),第二層采用sigmoid 激活函數(shù)。此外,為了防止過擬合,增加了2 個Dropout層[19]。
圖2 多層感知機模型Fig.2 Multi-layer perceptron architecture
兩種模型實現(xiàn)都采用Keras 函數(shù)庫,后臺使用TensorFlow 深度學(xué)習(xí)框架執(zhí)行模型訓(xùn)練。損失函數(shù)統(tǒng)一采用均方誤差(Mean Square Error,MSE),模型優(yōu)化使用RMSProp 算法,兩種模型的參數(shù)數(shù)量都在10左右。對于DCNN 模型,在NVIDIA K6000 GPU 卡上訓(xùn)練400 個epochs 大約需要5 h;而對于MLP 模型,訓(xùn)練200 個epochs 大約需要11 h。加載已經(jīng)訓(xùn)練好的DCNN 模型和MLP 模型后,在i7-6700CPU、內(nèi)存8G 的臺式計算機上生成1 個碎片云圖像的平均時間分別為毫秒量級和秒量級。
本節(jié)考察模型復(fù)現(xiàn)訓(xùn)練集中數(shù)據(jù)的能力。取彈丸速度8 km/s、彈丸半徑2 mm、靶板厚度4 mm,此時彈丸半徑較小、靶板較厚,彈丸破碎比較嚴(yán)重。圖3為此參數(shù)條件下的數(shù)值模擬和模型預(yù)測結(jié)果對比。取彈丸速度8 km/s、彈丸半徑8 mm、靶板厚度1 mm,此時彈丸較大、靶板較薄,彈丸破碎不嚴(yán)重,形成了一個中心大碎片。圖4為在此參數(shù)下的數(shù)值模擬和模型預(yù)測結(jié)果對比。
圖3 數(shù)值模擬與模型預(yù)測結(jié)果對比(v=8 km/s,d=4 mm,r =2 mm)Fig.3 Comparison of numerical simulations and model predictions(v=8 km/s,d=4 mm,r =2 mm)
圖4 數(shù)值模擬與模型預(yù)測結(jié)果對比(v=8 km/s,d=1 mm,r =8 mm)Fig.4 Comparison of numerical simulations and model predictions(v=8 km/s,d=1 mm,r =8 mm)
從圖3和4 中可以看出,深度學(xué)習(xí)模型預(yù)測精度遠(yuǎn)高于傳統(tǒng)工程模型。此外,DCNN 模型能夠捕捉到碎片云中質(zhì)量分布的顆?;再|(zhì),而MLP 模型對碎片云中的質(zhì)量分布進行了均質(zhì)化處理。
考察模型在訓(xùn)練參數(shù)范圍內(nèi)的插值能力。取彈丸速度3.5、5.5 和7.5 km/s,靶板厚度1.5 mm,彈丸半徑7.5 mm 以及觀測時間7.5 μs,共3 個算例,模型預(yù)測與數(shù)值模擬結(jié)果的對比如圖5所示。可以看到,插值結(jié)果連續(xù)且穩(wěn)定,與數(shù)值模擬結(jié)果吻合。
圖5 模型內(nèi)插能力(d=1.5 mm,r =7.5 mm,t =7.5 μs)Fig.5 Interpolation capability in the velocity direction(d=1.5 mm,r =7.5 mm,t =7.5 μs)
為了定量描述模型的預(yù)測精度,定義每個網(wǎng)格內(nèi)的相對誤差。很多網(wǎng)格內(nèi)的質(zhì)量為0,而靶板內(nèi)部網(wǎng)格質(zhì)量為常數(shù),可以選為基準(zhǔn)。定義每個網(wǎng)格質(zhì)量相對百分比誤差e和總體平均誤差分別為:
式中:m為模型預(yù)測網(wǎng)格內(nèi)質(zhì)量;m為對應(yīng)網(wǎng)格內(nèi)真實的物理質(zhì)量(由數(shù)值模擬給出);m為靶板內(nèi)部網(wǎng)格真實質(zhì)量;n 為每幅圖片中的網(wǎng)格總數(shù),本文中為10 000。對于上述3 個算例,DCNN 模型的總體平均誤差約為1.86%,而MLP 模型的總體平均誤差約為0.32%。
設(shè)計如表1所示的4 組算例,分別測試模型在彈丸速度、彈丸半徑、靶板厚度和觀測時間4 個變量方向的外推能力。表中加粗?jǐn)?shù)據(jù)表示該數(shù)據(jù)在訓(xùn)練參數(shù)范圍之外。4 組算例G1、G2、G3 和G4 的數(shù)值模擬結(jié)果與對應(yīng)的模型預(yù)測結(jié)果對比如圖6~9 所示。
表1 外推算例參數(shù)設(shè)計Table 1 Input parameters design for model extrapolation
圖6 模型在彈丸速度上的外推能力Fig.6 Model extrapolation capability in the velocity direction
從圖6和7 可以看到,MLP 模型的外推能力明顯優(yōu)于DCNN 模型。從圖7還可以看到,參數(shù)r 越大,預(yù)測圖片上的穿孔直徑(圖中碎片云與靶板重合區(qū)域的橫向?qū)挾龋┮苍酱?,這說明兩種模型都學(xué)習(xí)到了參數(shù)r 與靶板穿孔直徑之間的關(guān)系,但是MLP 模型的外推能力更強。
圖7 模型在彈丸半徑上的外推能力Fig.7 Model extrapolation capability in the impactor radius direction
從圖8可以看到,MLP 模型在d 為6 mm 和8 mm 時預(yù)測的靶板不再是標(biāo)準(zhǔn)的長方形,因為預(yù)測結(jié)果具有一定誤差。但從總的趨勢來看,參數(shù)d 越大,MLP 模型預(yù)測的靶板厚度也越大,表明MLP 模型通過學(xué)習(xí)知道了參數(shù)d 與板厚之間的關(guān)系,而DCNN 模型沒有學(xué)習(xí)到這一點。
圖8 模型在靶板厚度上的外推能力Fig.8 Model extrapolation capability in the target thickness direction
從圖9可以看到,DCNN 模型在時間方向上幾乎沒有外推能力,而MLP 模型能夠從1~12 μs 的圖像中學(xué)習(xí)規(guī)律,并且以一定精度預(yù)測24 μs 時刻的圖像。表1中16 個算例的誤差分布如圖10 所示,可以看到最大平均誤差約為4%。
圖9 模型在觀測時間上的外推能力Fig.9 Model extrapolation capability in the time direction
圖10 外推算例的誤差分布Fig.10 Error distribution for model extrapolation cases
總的來說,多層感知機模型的外推能力明顯優(yōu)于反卷積模型。在圖像識別領(lǐng)域,大量研究結(jié)果表明,卷積網(wǎng)絡(luò)結(jié)構(gòu)更傾向于關(guān)注圖像的紋路等細(xì)節(jié)特征,而忽略圖像的整體形狀,這和本文的反卷積模型的表現(xiàn)類似。多層感知機模型的精度有數(shù)學(xué)定理保證,外推能力也較強。
本文系統(tǒng)比較了反卷積模型和多層感知機模型在預(yù)測超高速碰撞碎片云二維質(zhì)量分布時的優(yōu)缺點,研究結(jié)果表明:
1)在訓(xùn)練參數(shù)范圍內(nèi),反卷積模型和多層感知機兩種模型都具有較高精度。
2)反卷積模型能夠捕捉到碎片云的顆?;再|(zhì),但是外推能力較差。
3)通過將位置信息加入到標(biāo)簽數(shù)據(jù),使得多層感知機模型的精度具有數(shù)學(xué)理論保證。多層感知機模型對碎片云質(zhì)量分布進行了局部均勻化處理,外推能力較好。