駱文浩,王宜穎,莫錦軍
(桂林電子科技大學信息與通信學院,桂林 541004)
超表面由周期性的亞波長結(jié)構陣列組成,可以靈活地調(diào)控電磁波[1]。超表面對電磁波的調(diào)制不依賴于空間累積,而依賴于強共振或空間取向引起的突然相變。因此,超表面可用于控制反射或透射波的相位、振幅和偏振[2-4]。近年來,許多具有獨特功能的超表面被用于控制電磁波。由于超表面在操縱電磁波方面具有很大的自由度,因此在工程中具有很大的應用價值,并因此引起了極大關注。文獻[5]提出了“數(shù)字超材料”的概念,其單元圖案被離散化并編碼。文獻[6]提出了不同的超表面單元編碼序列,以實現(xiàn)不同的電磁響應。具有不同相位響應的元原子在設計具有聚焦、偏振轉(zhuǎn)換等功能的超表面方面具有很大的應用價值[7]。希望能夠快速預測不同編碼序列的電磁特性,以便于快速設計超表面。然而,傳統(tǒng)的超表面設計通常需要專業(yè)人員參與,并且非常耗時。需要確定基本結(jié)構、模擬掃描參數(shù)、尋找最優(yōu)結(jié)構等步驟。這些步驟都非常復雜且耗時,設計周期也很長。對此,一種更有效且易于使用的設計方法是使用人工神經(jīng)網(wǎng)絡作為逆設計方法[8-9]。但是深度學習對數(shù)據(jù)和計算能力有很大要求,并且訓練和部署模型也需要大量時間。
為了解決上述問題,本文使用ResNet34 作為預訓練模型的遷移學習網(wǎng)絡,快速完成超表面設計,并建立起超表面結(jié)構和相位之間關系。遷移學習是一種利用在其他任務上訓練得到知識,在新任務上更快地收斂,并減少訓練所需數(shù)據(jù)和計算能力的機器學習方法[10-13]。本文將該方法應用于最典型功能超表面——相位梯度超表面實現(xiàn)波束偏轉(zhuǎn)能力,驗證其可靠性,并展示該方法將其他領域知識轉(zhuǎn)移到超表面設計中可能對學術研究人員具有啟發(fā)意義。
考慮到設計圖案能更好地被計算機所理解,我們選擇了數(shù)字超表面的編碼模式,圖案由10×10 正方型的離散格子組成,圖1 表示了所設計的超表面的離散化編碼。超表面的表面金屬用編碼序列所表示,其中“1”表示金屬,“0”表示沒有金屬。中間層為間距介電層,底層為金屬底板。金屬的厚度為0.015 mm。頂層金屬圖案打印在商用介電襯底FR-4上,厚度h=1.0 mm,介電常數(shù)εr=4.4,損耗tanδ=0.025。
圖1 超表面單元結(jié)構及圖案編碼
頂層的圖案有不同的編碼序列,采用均勻分布離散隨機格作為編碼序列。二維平面上的超表面單元尺寸均為L1 = 6.0 mm。為了減小相鄰超表面單元之間的相互耦合,將超表面單元上的圖案外尺寸設為L2= 5.0 mm。我們將內(nèi)平面均勻劃分為10×10 的格,每個格為邊長u=0.5 mm 的正方形。為了設計超表面的多樣性,采用10×10編碼序列作為矩陣。
超表面單元的圖案編碼序列等于一個矩陣,我們可以計算出這個矩陣對應的相位,如圖1所示。將矩陣和相對應的相位加入到訓練數(shù)據(jù)集中。10×10 矩陣有210×10種可能的模式,約1.26 × 1030,在實踐中相當巨大。
我們使用MatlabCST 聯(lián)合仿真來準備20000個訓練數(shù)據(jù)集。首先,利用Matlab 生成均勻分布離散隨機格作為編碼序列矩陣。其次,利用CST Microwave Studio 計算該編碼序列的反射相位。然后,存儲編碼序列矩陣和相應相位,并加入到訓練數(shù)據(jù)集中。反射相位可以在[1°,360°]范圍內(nèi)歸一化。因此,這個問題可以簡化為一個分類問題,數(shù)字超表面上的拓撲結(jié)構可以看作一個圖像,超表面的相位預測也可以看作是一個360 類的分類問題。在這樣的考慮下,我們將圖像分類轉(zhuǎn)化為相位預測?;诖?,我們對ResNet 進行預訓練,并使用更少的數(shù)據(jù)傳輸模型。超表面的特征提取可以類似于圖像的特征提取。將不同類別的圖像識別轉(zhuǎn)化為[1°,360°]相位預測。這樣,可以把圖像分類的經(jīng)驗轉(zhuǎn)化為相位預測。
雙線性插值是圖像預處理方法之一,常常應用于圖像增強以提高深度學習算法的特征學習能力[14]。雙線性插值法也稱二次線性插值法,實質(zhì)是在圖像的相鄰兩個像素點行列方向各進行一次線性插值,通過利用已知像素產(chǎn)生未知像素的方法來引入不同的圖像邊緣效果,提高圖像分辨率。
設圖片像素位置在Q11=(x1,y1)、Q12=(x1,y2)、Q21=(x2,y1)以及Q22=(x2,y2)上,若想得到插值后的P=(x,y)上的位置。首先,在x軸方向上進行兩次線性插值;然后,以R1和R2為已知數(shù)據(jù),在y軸上進行一次線性插值,如圖2所示。
圖2 雙線性插值過程
超表面單元的圖案分辨率為10×10,對于預訓練模型可能無法從中學習到足夠多的有用信息,所以使用雙線性插值進行數(shù)據(jù)增強。
ResNet 是一種深度神經(jīng)網(wǎng)絡架構,主要用于圖像分類。它由He 等[15]于2015 年提出,主要用于解決深度神經(jīng)網(wǎng)絡中的梯度消失問題。ResNet 通過使用殘差連接(residual connections)來解決這個問題,這使得較深層的訓練變得容易。在ResNet 中,殘差連接直接將較淺層的輸出與較深層的輸入相加,從而使得較深層的訓練變得容易。
殘差網(wǎng)絡的核心思想是使用殘差連接(residual connection)來解決深度神經(jīng)網(wǎng)絡訓練時的梯度消失問題。如圖3 所示,在殘差網(wǎng)絡中,每一層都是一個殘差模塊,它包含一些卷積層和激活函數(shù)層。殘差模塊的輸入是上一層的輸出,輸出是殘差模塊中的輸出加上上一層的輸出。這樣,如果殘差模塊中的輸出是上一層輸出的線性變換,那么殘差模塊的輸出就是上一層的輸出。這意味著,即使在多層深度網(wǎng)絡中,梯度仍然能夠流動,從而解決了梯度消失問題。
圖3 殘差塊結(jié)構
ResNet34 架構由34 個卷積層組成,如圖4所示,并在大型圖像分類基準ImageNet 數(shù)據(jù)集上進行訓練。ResNet34 被廣泛應用于圖像分類、目標檢測和語義分割等計算機視覺任務。它能夠有效地解決梯度消失問題和在圖像識別任務中實現(xiàn)高準確率。
圖4 ResNet34的整體架構
ResNet34 的表征能力和學習能力較高目模型參數(shù)較少,是圖像分類領域研究的熱點方同,所以我們采用ResNet34 作為遷移學習的預訓練模型。在進行遷移學習時,通常會使用一個預訓練的ResNet34模型作為初始化。這個模型可以在大型數(shù)據(jù)集(ImageNet)上訓練好,然后解凍一部分參數(shù),重新訓練用于新的問題。ImageNet數(shù)據(jù)集包含1000 類約120 萬張圖片,使用在如此大的數(shù)據(jù)集上預訓練好的網(wǎng)絡模型,可以有效遷移到各種不同的圖像分類任務中,如圖5 所示。使用這種方法,可以大大減少訓練新模型所需的時間和計算資源。此外,使用預訓練的模型可以獲得更好的性能,因為這個模型已經(jīng)在大型數(shù)據(jù)集上進行了訓練,從先前任務中學到了知識,并且可以為新的問題提供有用的特征,僅需要進行微小的改動即可應用到相關的任務中,對于一些基本的規(guī)則,模型無需重新學習,大大降低了時間成本。本研究使用在ImageNet數(shù)據(jù)集上訓練好的ResNet34 殘差網(wǎng)絡進行超表面圖像的特征提取。
圖5 遷移學習與深度學習識別準確率
首先使用預訓練模型作為特征提取器,凍結(jié)所有層并且更改最后一層,只訓練最后一層,然后使用這些特征來訓練一個新的分類器。因為這是一個分類問題,我們使用softmax 函數(shù)作為激活函數(shù)。然后計算輸入數(shù)據(jù)的損失,并對網(wǎng)絡參數(shù)進行調(diào)整。softmax 函數(shù)也是將每個類別的網(wǎng)絡輸出轉(zhuǎn)換為概率值的分類器。而引入指數(shù)函數(shù)使得分類的概率更大,從而使得損失函數(shù)對網(wǎng)絡輸出更敏感,更有利于分類。
我們將遷移學習網(wǎng)絡與傳統(tǒng)深度學習網(wǎng)絡進行比較,深度學習網(wǎng)絡模型也是ResNet34,經(jīng)過200 個Epoch 訓練后,比較結(jié)果如圖5 所示。與傳統(tǒng)深度學習相比,遷移學習有效地減少了訓練數(shù)據(jù),使得在樣本較少的情況下表現(xiàn)更好。
為了探究深度學習在測試數(shù)據(jù)集上表現(xiàn)不佳的原因,圖6 給出了深度學習模型訓練過程中的損失曲線和準確率曲線。如圖6(b)所示,因為深度學習模型對訓練數(shù)據(jù)存在過擬合問題,在驗證集上的損失上升,因此深度學習的性能較差。傳統(tǒng)的深度學習模型由于樣本數(shù)量太少,需要調(diào)整的參數(shù)較多,收斂速度較慢。因為在ImageNet 中有超過1400 萬的樣本,所以深度學習模型在ImageNet 數(shù)據(jù)集上具有很好的性能。因此,如果我們想要得到更好的結(jié)果,需要更大的數(shù)據(jù)量。
圖6 深度學習訓練準確率和損失值
在相同的條件下,遷移學習模型的性能遠優(yōu)于傳統(tǒng)的深度學習模型。相比之下,遷移學習需要的數(shù)據(jù)更少,性能更好,因為遷移學習是基于大數(shù)據(jù)的ImageNet 訓練的。遷移學習方法是一種實現(xiàn)超表面單元相位預測有效的方法,可以有效減少訓練數(shù)據(jù)量。
如圖7 所示,訓練集的準確率達到99%左右。驗證集的最高準確度達到90%左右。交叉熵計算的損失值收斂到0.03,相比于傳統(tǒng)深度學習準確率提升了一倍,同時降低了對樣本數(shù)量的依賴。
圖7 遷移學習訓練準確率和損失值
我們只使用了2 萬個樣本進行訓練,但訓練結(jié)果反映了該模型具有很高的預測精度和泛化能力。我們在測試集中隨機選擇100 個樣本來驗證模型的準確率,結(jié)果如圖8 所示,模型有著較好的準確性。三角形表示預測超表面單元的相位,圓圈表示全波電磁計算得到超表面單元的相位。
圖8 隨機100個樣本的預測和實際結(jié)果
此外,為了進一步證明遷移學習模型在訓練超表面單元樣本方面的有效性,我們額外測試了一些有代表性的網(wǎng)絡,包括AlexNet 網(wǎng)絡、VGG網(wǎng)絡和MobileNet網(wǎng)絡。
從表1 可以看出,由于提取的特征不匹配導致欠擬合的情況,AlexNet網(wǎng)絡和VGG 網(wǎng)絡在測試精度上遠不及遷移學習模型。通過對比這兩個簡單模型,我們發(fā)現(xiàn)ImageNet 預訓練模型的特征提取層能夠有效地提取超表面單元圖案的特征,并能更好地擬合數(shù)據(jù)集。我們也使用了一個輕量級網(wǎng)絡MobileNet 模型作為訓練的對比。在ImageNet 的源數(shù)據(jù)集上,MobileNet 的性能稍低于ResNet。因此,在超表面單元分類方面MobileNet 也略遜于ResNet。對比表明遷移學習框架可以有效地處理超表面單元分類問題。
表1 不同神經(jīng)網(wǎng)絡的性能
為了進一步驗證訓練好的遷移學習模型,在針對復雜引用設計時,我們運用模型輔助設計了一個相位梯度超表面。利用CST Microwave Studio對超表面進行了全波電磁模擬和驗證。
相位梯度超表面是一種非均勻周期結(jié)構。如圖9 所示,當一束電磁波入射到一個不同介質(zhì)的分界面(上方是空氣,下方是介質(zhì))上時,波矢量為ki的電磁波以θi入射便會有一束反射角為θr的反射波(波矢量為kr)。當在分界面上放置相位梯度超表面時,相位梯度超表面的不同位置處的反射相位皆不相同,從而引入一個相位梯度ζ,假設該相位梯度超表面只在x方向上存在較大的相位梯度。相位梯度會產(chǎn)生一個附加波矢,使得入射波的波矢與反射波的波矢不再相同,從而改變反射波的反射方向,如圖9所示,入射角為θi的入射波會產(chǎn)生一個反射角為θar的異常反射波,異常反射波的波矢為kar,且karx=karsinθar由廣義Snell 定律:
圖9 相位梯度超表面異常反射示意圖
其中:Δφ為相位梯度超表面相鄰單元之間的相位差,L為相鄰單元的間距,在空氣中電磁波的波矢,都為已知。
設計一個異常反射角為45°的相位梯度超表面,如圖10所示。
圖10 超表面設計目標
根據(jù)廣義Snell 定律公式(1),電磁波垂直入射超表面θi= 0°,超表面的單元長度為L=6 mm,反射電磁波角度為θr= 45°,計算得Δφ=76°。所以超表面單元目標相位為0°,76°,152°,228°,304°,20°,96°,172°。隨機生成一組數(shù)字超表面單元,利用訓練好的分類網(wǎng)絡尋找所需目標相位對應數(shù)字超表面單元結(jié)構,結(jié)果如圖11所示。
圖11 相位梯度超表面結(jié)構
在設計頻率12 GHz 處,根據(jù)圖12所示。
圖12 相位梯度超表面方向圖
所設計的超表面通過表面反射系數(shù)相位補償對反射波前的調(diào)整,可在預定設計的45°觀察角度上產(chǎn)生一個明顯的散射波瓣。結(jié)果如圖12所示,仿真在45°有明顯的散射波瓣。因此,借助ResNet34 網(wǎng)絡模型和超表面設計中反射系數(shù)相位梯度的調(diào)節(jié)靈活性,對于其他的入射與反射情形,輕易地實現(xiàn)所需的反射系數(shù)相位梯度,進而將主散射波瓣重定向于預定的觀察角度上,由此達到雷達散射截面增強的設計目標。
綜上,本文提出了一種基于ResNet34 網(wǎng)絡模型遷移學習的超表面逆設計方法。我們將ResNet34 模型應用于超表面設計,并成功地將圖像識別的模型應用轉(zhuǎn)移到相位預測,準確率約為90%,相比于傳統(tǒng)深度學習模型準確率提升,同時降低了對樣本數(shù)量的依賴。為了驗證遷移學習模型,我們利用訓練模型設計了梯度超表面,并通過全波仿真驗證了該設計。在設計超表面方面提供了一種新的方法學習。