摘" 要: 針對(duì)傳統(tǒng)的天線仿真建模過程中需要的天線阻抗耗時(shí)長(zhǎng)問題,文中提出一種基于KNN?XGBOOST模型的天線阻抗預(yù)測(cè)方法?,F(xiàn)有研究大多為單一預(yù)測(cè)算法,旨在通過對(duì)比尋求預(yù)測(cè)效果更優(yōu)的算法。首先通過ANSYS仿真軟件收集大量的PCB RFID天線阻抗設(shè)計(jì)數(shù)據(jù),然后結(jié)合影響阻抗中天線長(zhǎng)度和頻率共8個(gè)有效特征,以KNN和XGBOOST兩種算法作為基模型,線性回歸作為元模型,構(gòu)建了一個(gè)堆疊集成學(xué)習(xí)模型。在實(shí)驗(yàn)過程中,通過交叉驗(yàn)證和網(wǎng)格搜索技術(shù),對(duì)模型的超參數(shù)進(jìn)行了精細(xì)調(diào)優(yōu),以確保模型能夠達(dá)到最優(yōu)的預(yù)測(cè)性能。實(shí)驗(yàn)結(jié)果顯示,與單一的KNN和XGBOOST模型相比,KNN?XGBOOST模型的均方根誤差降低了30%~70%,[R2]提高了10%。在預(yù)測(cè)PCB RFID天線的阻抗實(shí)部和虛部時(shí),KNN?XGBOOST模型具有較高的準(zhǔn)確率和較低的預(yù)測(cè)誤差,證明了其在電磁仿真設(shè)計(jì)優(yōu)化中的應(yīng)用價(jià)值。
關(guān)鍵詞: PCB RFID天線; 阻抗預(yù)測(cè); KNN算法; XGBOOST算法; 融合堆疊; 電磁仿真
中圖分類號(hào): TN821?34" " " " " " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " " " "文章編號(hào): 1004?373X(2024)19?0014?07
KNN?XGBOOST?based stacked model for PCB RFID antenna impedance prediction
JIANG Yankun1, HONG Tao2, ZHANG Jili1
(1. College of Energy Environment amp; Safety Engineering, China Jiliang University, Hangzhou 310018, China;
2. College of Quality and Standardization, China Jiliang University, Hangzhou 310018, China)
Abstract: In view of the time?consuming antenna impedance required in the traditional processes of antenna simulation and modeling, an antenna impedance prediction method on the basis of KNN?XGBOOST?based model is proposed. Most of the existing studies focus on the single prediction algorithms. These studies aim to find out the algorithms with better prediction effect by comparative analysis. Initially, a substantial data of PCB (printed circuit board) RFID (radio frequency identification) antenna impedance design is collected with simulation software ANSYS. Subsequently, leveraging eight influential features including antenna length and frequency, a stacked ensemble learning model is constructed on the basis of constructing the base model with algorithms KNN (K?nearest neighbor) and XGBOOST (eXtreme Gradient Boosting), and the meta?model with linear regression. In the experiment, fine?tuning of the model′s hyperparameters is implemented via cross?validation and grid search techniques, so as to ensure that the model can reach the optimal predictive performance. The experimental results demonstrate that the root mean square error (RMSE) of the KNN?XGBOOST?based model is reduced by 30%~70%, and its R?squared ([R2]) is increased by 10% in comparison with those of the KNN?based model and XGBOOST?based model. When predicting the real and imaginary parts of PCB RFID antenna impedance, the KNN?XGBOOST?based model exhibits higher accuracy rate and lower prediction error, which verifies its application value in the optimization of electromagnetic simulation design.
Keywords: PCB RFID antenna; impedance prediction; KNN algorithm; XGBOOST algorithm; ensemble stacking; electromagnetic simulation
0" 引" 言
隨著射頻識(shí)別(RFID)技術(shù)的廣泛應(yīng)用,特別是在PCB RFID天線設(shè)計(jì)領(lǐng)域,對(duì)高效、準(zhǔn)確的阻抗匹配方法的需求日益增長(zhǎng)[1?2]。傳統(tǒng)的RFID天線設(shè)計(jì),如彎折偶極子天線,通常依賴于計(jì)算機(jī)仿真軟件來評(píng)估不同天線樣本的阻抗匹配情況。在實(shí)際應(yīng)用中,RFID電子標(biāo)簽都對(duì)天線結(jié)構(gòu)參數(shù)提出了差異化要求,必將導(dǎo)致天線阻抗發(fā)生變化,影響阻抗匹配[3?4]。
在標(biāo)簽天線的傳統(tǒng)設(shè)計(jì)過程中,為保證天線的阻抗匹配,設(shè)計(jì)者首先會(huì)根據(jù)應(yīng)用對(duì)象尺寸與所處環(huán)境等要求隨機(jī)產(chǎn)生一批基本結(jié)構(gòu)相同、局部尺寸有差異的天線樣本,然后借助計(jì)算機(jī)仿真軟件依次計(jì)算其阻抗[5]。在計(jì)算完成后,篩選其中阻抗匹配程度最高的天線作為設(shè)計(jì)結(jié)果。若所有結(jié)果都不理想,則會(huì)按照經(jīng)驗(yàn)對(duì)天線結(jié)構(gòu)的局部尺寸進(jìn)行微調(diào),建立新一批天線樣本并重復(fù)上述步驟。在上述設(shè)計(jì)方法中,每一次微調(diào)模型后都需要大量時(shí)間等待計(jì)算機(jī)初始化天線結(jié)構(gòu)并計(jì)算阻抗,設(shè)計(jì)效率被計(jì)算機(jī)仿真次數(shù)與速度所限制,設(shè)計(jì)時(shí)間在等待仿真結(jié)果中浪費(fèi),因此如何快速獲得標(biāo)簽天線的阻抗值成為提高設(shè)計(jì)效率的研究重點(diǎn)[6]。本文通過集成多種預(yù)測(cè)算法,建立一種集成學(xué)習(xí)方法,實(shí)現(xiàn)了對(duì)天線阻抗的快速預(yù)測(cè)。
為快速獲得標(biāo)簽天線的阻抗值,應(yīng)用機(jī)器學(xué)習(xí)進(jìn)行天線阻抗預(yù)測(cè)逐漸成為研究熱點(diǎn)[7?8]。文獻(xiàn)[9]使用等效電路研究了T型匹配幾何結(jié)構(gòu)對(duì)整個(gè)天線阻抗的影響。文獻(xiàn)[10]給出了互感系數(shù)的計(jì)算公式并給出匹配環(huán)阻抗計(jì)算的方法。文獻(xiàn)[11]提出應(yīng)用DNN來確定電路中的電容值,以實(shí)現(xiàn)天線阻抗匹配,用于倒F天線設(shè)計(jì)。文獻(xiàn)[12]使用監(jiān)督回歸機(jī)器學(xué)習(xí)方法對(duì)5G Yagi天線的阻抗和增益進(jìn)行了準(zhǔn)確的預(yù)測(cè)。文獻(xiàn)[13]提出一種基于多項(xiàng)式的彎折偶極子RFID標(biāo)簽天線阻抗預(yù)測(cè)方法,雖然在標(biāo)簽天線設(shè)計(jì)的阻抗計(jì)算環(huán)節(jié)中極大地縮減了計(jì)算時(shí)間,但是預(yù)測(cè)阻抗在實(shí)部對(duì)比中僅有80%的擬合優(yōu)度。
針對(duì)上述各種研究成果進(jìn)行分析和梳理的基礎(chǔ)上,本文提出一種基于KNN?XGBOOST模型的天線阻抗預(yù)測(cè)的方法。以常用的PCB RFID彎折偶極子天線作為研究對(duì)象,選擇預(yù)測(cè)性能較好的單一算法KNN、XGBOOST(極端梯度提升)驗(yàn)證KNN?XGBOOST集成學(xué)習(xí)算法的預(yù)測(cè)性能。結(jié)果表明,基于KNN?XGBOOST集成學(xué)習(xí)模型在天線阻抗預(yù)測(cè)上具有良好的應(yīng)用效果。
1" 相關(guān)算法分析
1.1" XGBOOST算法
XGBOOST是由陳天奇于2016年開發(fā)的一種提升樹算法,它基于傳統(tǒng)梯度提升方法進(jìn)行了改進(jìn)和優(yōu)化。XGBOOST在處理大型數(shù)據(jù)集、預(yù)防過擬合以及計(jì)算速度方面表現(xiàn)出色,它具備并行處理能力,可以在多核CPU上加速計(jì)算。與其他機(jī)器學(xué)習(xí)算法相比,XGBOOST的一個(gè)顯著優(yōu)點(diǎn)是它的可擴(kuò)展性和靈活性。它通過引入正則化項(xiàng)來減少模型復(fù)雜度,這在其他提升方法中不常見,有效降低了過擬合風(fēng)險(xiǎn)。同時(shí),它還支持用戶自定義的優(yōu)化目標(biāo)和評(píng)估標(biāo)準(zhǔn),適用于各種定制化問題。
XGBOOST的目標(biāo)函數(shù)定義為實(shí)際損失函數(shù)與正則化項(xiàng)的和,具體見式(1):
[Obj(θ)=L(θ)+Ω(θ)] (1)
式中:[θ]表示模型參數(shù);[L(θ)]是損失函數(shù),衡量模型預(yù)測(cè)值與真實(shí)值之間的差異;[Ω(θ)]是正則化項(xiàng),它懲罰模型的復(fù)雜度。正則化項(xiàng)通常包含兩個(gè)部分,分別是樹的葉子節(jié)點(diǎn)的數(shù)量(控制樹的結(jié)構(gòu))和葉子節(jié)點(diǎn)權(quán)重的[L2]范數(shù)(控制葉子節(jié)點(diǎn)權(quán)重的大小),用來防止模型過于復(fù)雜而導(dǎo)致過擬合。
具體來說,正則化項(xiàng)公式見式(2):
[Ω(θ)=γT+12λj=1Tw2j] (2)
式中:[T]是樹中葉子節(jié)點(diǎn)的數(shù)量;[wj]是葉子節(jié)點(diǎn)的權(quán)重向量;[γ]和[λ]分別是控制樹結(jié)構(gòu)和葉子節(jié)點(diǎn)權(quán)重懲罰強(qiáng)度的正則化參數(shù)。
XGBOOST中的每一個(gè)基學(xué)習(xí)器是一個(gè)決策樹,整個(gè)模型是通過添加這些決策樹構(gòu)成的。對(duì)于在第[t]輪迭代中的一個(gè)決策樹[ft],目標(biāo)函數(shù)可以進(jìn)一步展開,展開式見式(3):
[Obj(t)=i=1nl(yi,y(t-1)i+ft(xi))+Ω(ft)] (3)
式中:[n]是訓(xùn)練數(shù)據(jù)的數(shù)量;[l]是損失函數(shù);[yi]是第[i]個(gè)樣本的真實(shí)值;[y(t-1)i]是模型在第[t-1]輪迭代后的預(yù)測(cè)值;[ft]是在第[t]輪迭代中添加的樹;[Ω(ft)]是第[t]輪迭代中添加的樹的正則化項(xiàng)。
XGBOOST的另一個(gè)關(guān)鍵特性是它對(duì)損失函數(shù)的二階展開,這使得模型在每一輪迭代時(shí)能夠更快地收斂。在每一步迭代中,XGBOOST為目標(biāo)函數(shù)添加一個(gè)新的決策樹,并選擇使目標(biāo)函數(shù)下降最多的樹。這個(gè)過程可以用式(4)表示:
[Obj(t)≈i=1nl(yi,y(t-1)i)+gift(xi)+12hif2t(xi)+Ω(ft)] (4)
式中:[gi]和[hi]分別表示損失函數(shù)對(duì)于第[i]個(gè)實(shí)例的一階和二階導(dǎo)數(shù)。為了選擇最優(yōu)的決策樹結(jié)構(gòu),XGBOOST使用了一種名為“分位點(diǎn)近似”的技術(shù)來處理連續(xù)特征及正則化方法的剪枝策略,并通過最大化每次分裂帶來的目標(biāo)函數(shù)減少量來選擇最優(yōu)分裂點(diǎn)。
XGBOOST參數(shù)調(diào)優(yōu)的關(guān)鍵參數(shù)包括:樹的最大深度、學(xué)習(xí)率以及用于列采樣和行采樣的比例。樹的深度越大,樹模型越復(fù)雜,擬合能力越強(qiáng),但同時(shí),模型也更容易過擬合。學(xué)習(xí)率決定了每棵樹對(duì)最終模型的貢獻(xiàn)程度。較小的學(xué)習(xí)率需要更多的樹來構(gòu)建模型,但通常能夠得到更好的泛化性能。較大的學(xué)習(xí)率會(huì)導(dǎo)致模型更快地收斂,但也容易造成過擬合。列采樣指的是在構(gòu)建每棵樹時(shí)對(duì)特征進(jìn)行采樣的比例。通過隨機(jī)選擇一部分特征,可以減少模型的方差,提高泛化能力。行采樣指的是在構(gòu)建每棵樹時(shí)對(duì)樣本進(jìn)行采樣的比例。較小的行采樣比例可以減少過擬合風(fēng)險(xiǎn),但可能會(huì)增加模型的偏差。
1.2" K?近鄰算法(KNN)
KNN算法即K最近鄰(K?Nearest Neighbor)算法,是一種基于實(shí)例的學(xué)習(xí)方法,由Cover和Hart于1967年提出,它是監(jiān)督學(xué)習(xí)中常用的分類與回歸方法。KNN工作原理是找到一個(gè)樣本的[K]個(gè)最近鄰居,并根據(jù)這些鄰居的多數(shù)投票或平均來預(yù)測(cè)樣本的標(biāo)簽或數(shù)值。KNN的主要優(yōu)點(diǎn)在于算法簡(jiǎn)單直觀,不需要建立模型或假設(shè)數(shù)據(jù)分布,這使得它對(duì)數(shù)據(jù)中的異常值不敏感。另外,它很容易適應(yīng)數(shù)據(jù)的變化,尤其在分類決策邊界復(fù)雜或不規(guī)則時(shí)效果顯著。
首先它需要定義每個(gè)觀測(cè)數(shù)據(jù)值(帶有給定特征)與帶有未知目標(biāo)的新數(shù)據(jù)值之間的距離。距離指標(biāo)可以是歐氏距離函數(shù)或曼哈頓距離函數(shù)。這一度量的數(shù)學(xué)表達(dá)式見式(5):
[d(p,q)=(p1-q1)2+…+(pn-qn)2] (5)
在[n]維空間中,兩點(diǎn)[p(p1,p2,…,pn)]和[q(q1,q2,…,qn)]之間的歐氏距離使用式(5)計(jì)算。其中,[p]和[q]是兩個(gè)點(diǎn)在[n]維特征空間中的坐標(biāo)。
此外,曼哈頓距離函數(shù)是關(guān)于點(diǎn)的絕對(duì)差值,具體公式見式(6):
[d(p,q)=i=1npi-qi] (6)
在分配任何新數(shù)據(jù)值之前,都要考慮參數(shù)[K],即相鄰點(diǎn)的數(shù)量,分配任何新數(shù)據(jù)值。參數(shù)[K]值過低可能導(dǎo)致過度擬合,而參數(shù)[K]值過高則可能導(dǎo)致訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)中的模型誤差過大。然后將[K]個(gè)最接近數(shù)據(jù)值的平均值指定為未知目標(biāo)值。網(wǎng)格搜索交叉驗(yàn)證是一種為所選模型確定最佳超參數(shù)的技術(shù),通常用于尋找最佳[K]值。下一步是找到分配的因變量值與相應(yīng)的實(shí)際因變量值(即不同觀測(cè)值的CASH值)之間的損失函數(shù)。整體損失函數(shù)在訓(xùn)練階段最小化,其結(jié)果反映在模型設(shè)置中。
算法確定距離最近的[K]個(gè)訓(xùn)練樣本,并基于這些鄰近樣本的信息來預(yù)測(cè)新樣本的類別。在分類問題中,采取多數(shù)投票規(guī)則,即新樣本將被分配到[K]個(gè)最近鄰中最常見的類別;在回歸問題中,則計(jì)算這些鄰居的輸出變量的平均值作為預(yù)測(cè)結(jié)果。此過程的關(guān)鍵在于合理選擇[K]值,這通常需要通過交叉驗(yàn)證來確定。[K]值的選擇會(huì)影響到算法的偏差與方差,進(jìn)而影響預(yù)測(cè)性能。過小的[K]值意味著模型可能會(huì)受到噪聲的干擾,過大的[K]值可能會(huì)導(dǎo)致模型無法捕捉到數(shù)據(jù)的局部特征。在實(shí)際應(yīng)用中,KNN的計(jì)算開銷可能非常大,特別是在有大量訓(xùn)練數(shù)據(jù)的情況下,因此在實(shí)踐中可能需要采取一些優(yōu)化策略,如通過KD樹或球樹等數(shù)據(jù)結(jié)構(gòu)來加快最近鄰的搜索過程。
KNN算法由于其簡(jiǎn)單性和有效性,在許多領(lǐng)域都有廣泛的應(yīng)用,它特別適用于那些模型基本假設(shè)不明確或數(shù)據(jù)分布未知的情況。XGBOOST是一個(gè)基于樹的模型,它在處理結(jié)構(gòu)化數(shù)據(jù)和特征間復(fù)雜交互時(shí)非常有效,但它可能不會(huì)捕捉到數(shù)據(jù)中的所有局部模式,尤其是在數(shù)據(jù)非常稀疏或維度非常高的情況下。此時(shí),引入KNN算法作為XGBOOST模型的一部分,以彌補(bǔ)在局部處理上的不足。KNN能夠捕捉到數(shù)據(jù)中的局部結(jié)構(gòu),而XGBOOST則更擅長(zhǎng)抓取全局結(jié)構(gòu),兩者結(jié)合可以相互補(bǔ)充,增加模型的多樣性。在堆疊模型中,KNN可以作為基學(xué)習(xí)器之一,其輸出作為元模型的輸入之一。元模型然后結(jié)合來自KNN和XGBOOST的信息,產(chǎn)生最終預(yù)測(cè)。這種結(jié)合利用了KNN的局部平滑性和XGBOOST的高度優(yōu)化性能,能夠在不同類型的數(shù)據(jù)分布上實(shí)現(xiàn)更好的預(yù)測(cè)效果。此外,因?yàn)镵NN和XGBOOST在錯(cuò)誤模式上可能有所不同,它們的集成有助于互相糾正對(duì)方的誤差,提高整體的預(yù)測(cè)準(zhǔn)確度。
2" 本文方法
2.1" KNN?XGBOOST算法設(shè)計(jì)思想
本文提出了一種基于KNN?XGBOOST模型,通過結(jié)合不同類型的學(xué)習(xí)算法來增強(qiáng)預(yù)測(cè)模型的整體性能。KNN?XGBOOST模型采用了不同學(xué)習(xí)器集成的方法,目的是通過組合不同的算法提升模型的整體性能。不同的機(jī)器學(xué)習(xí)算法能從數(shù)據(jù)的不同方面進(jìn)行學(xué)習(xí)。例如,KNN關(guān)注于捕捉數(shù)據(jù)的局部鄰域特性,而XGBOOST則在全局范圍內(nèi)通過構(gòu)建多個(gè)決策樹和引入正則化來優(yōu)化預(yù)測(cè)性能。單一算法可能在解釋性或泛化能力上有限,但將多個(gè)算法結(jié)合,尤其是彼此之間有著良好互補(bǔ)性的模型,能夠提供更為精確的預(yù)測(cè)結(jié)果。在集成學(xué)習(xí)中,既要分析每個(gè)機(jī)器學(xué)習(xí)算法單獨(dú)預(yù)測(cè)性能,也要考慮算法之間的相關(guān)關(guān)系,綜合比較集成模型和單一算法的預(yù)測(cè)效果。
在KNN?XGBOOST算法中,首先訓(xùn)練多個(gè)初級(jí)學(xué)習(xí)器(KNN和XGBOOST),然后將這些學(xué)習(xí)器的預(yù)測(cè)結(jié)果作為輸入,接著再訓(xùn)練一個(gè)元學(xué)習(xí)器,通常是一個(gè)簡(jiǎn)單模型,如線性回歸,以學(xué)習(xí)如何最有效地結(jié)合初級(jí)學(xué)習(xí)器的預(yù)測(cè)結(jié)果。在模型訓(xùn)練過程中,為了避免過擬合,通常采用交叉驗(yàn)證的方法對(duì)初級(jí)學(xué)習(xí)器進(jìn)行參數(shù)選擇和性能評(píng)估。特別是對(duì)于時(shí)間序列數(shù)據(jù),應(yīng)采用時(shí)間上的前向分割來保證模型的預(yù)測(cè)是基于“現(xiàn)在”預(yù)測(cè)“未來”,以避免信息泄露的問題。
KNN?XGBOOST算法進(jìn)一步采用嵌套交叉驗(yàn)證,它由用于調(diào)參的內(nèi)循環(huán)和用于誤差估計(jì)的外循環(huán)組成。在內(nèi)循環(huán)中,數(shù)據(jù)被分為訓(xùn)練子集和驗(yàn)證集,模型在訓(xùn)練子集上進(jìn)行訓(xùn)練,在驗(yàn)證集上進(jìn)行參數(shù)選擇;而外循環(huán)則進(jìn)一步將數(shù)據(jù)集分割為不同的訓(xùn)練集和測(cè)試集,通過對(duì)各次分割得到的誤差求平均值,提供模型誤差的魯棒估計(jì)。這種設(shè)計(jì)確保了模型的泛化能力,同時(shí)為未來的預(yù)測(cè)提供了一個(gè)可靠的性能基準(zhǔn)。KNN?XGBOOST算法流程如圖1所示,基學(xué)習(xí)器流程圖如圖2所示。
2.2" 算法步驟
KNN?XGBOOST模型算法在PCB RFID彎折偶極子天線阻抗的預(yù)測(cè)具體應(yīng)用步驟如下。
步驟1:數(shù)據(jù)獲取。首先需要在ANSYS電磁仿真軟件中對(duì)預(yù)測(cè)所用到的彎折偶極子天線進(jìn)行仿真收集阻抗數(shù)據(jù),通過大量仿真建立數(shù)據(jù)庫。數(shù)據(jù)集的構(gòu)成為:前8列作為特征([x]),第9列和10列作為目標(biāo)變量([y1]和[y2]),其中目標(biāo)變量即為預(yù)測(cè)的阻抗實(shí)部和阻抗虛部。讀取數(shù)據(jù)后,將數(shù)據(jù)分割為訓(xùn)練集和測(cè)試集,做法是保留20%的數(shù)據(jù)用于測(cè)試,這有助于后續(xù)評(píng)估模型的泛化能力。
步驟2:標(biāo)準(zhǔn)化處理。為了防止特征之間的量綱差異對(duì)模型性能造成影響,使用標(biāo)準(zhǔn)刻度函數(shù)對(duì)特征進(jìn)行標(biāo)準(zhǔn)化處理,將數(shù)據(jù)轉(zhuǎn)換為均值為0、標(biāo)準(zhǔn)差為1的分布。具體標(biāo)準(zhǔn)化處理計(jì)算公式見式(7):
[z=x-μσ] (7)
式中:[x]為數(shù)組;[μ]為數(shù)組[x]的平均值;[σ]為數(shù)組[x]的標(biāo)準(zhǔn)差。
步驟3:模型訓(xùn)練和參數(shù)調(diào)優(yōu)。通過選擇KNN模型和XGBOOST模型,使用網(wǎng)格搜索方法對(duì)這兩種模型進(jìn)行參數(shù)搜索和交叉驗(yàn)證,找到最優(yōu)的超參數(shù)組合,以期達(dá)到最佳的預(yù)測(cè)性能。對(duì)于KNN,考慮的參數(shù)包括鄰居數(shù)([k])、權(quán)重函數(shù)和距離度量;而對(duì)于XGBOOST,考慮的參數(shù)包括樹的數(shù)量、學(xué)習(xí)率、最大樹深、子樣本比例以及特征采樣比例。這些參數(shù)的組合構(gòu)成了一個(gè)超參數(shù)空間,通過交叉驗(yàn)證找到使模型性能最優(yōu)化的參數(shù)組合,其中,性能度量采用均方根誤差(RMSE)和決定系數(shù)([R2])。最優(yōu)參數(shù)如表1和表2所示。
步驟4:堆疊回歸。將KNN和XGBOOST模型結(jié)合起來進(jìn)行堆疊回歸。堆疊模型中,KNN和XGBOOST的預(yù)測(cè)結(jié)果作為新的特征輸入到元模型,元模型選用線性回歸。在此過程中,堆疊模型首先在訓(xùn)練數(shù)據(jù)上進(jìn)行擬合,然后在測(cè)試數(shù)據(jù)上進(jìn)行預(yù)測(cè),通過計(jì)算預(yù)測(cè)值和真實(shí)值之間的均方根誤差體現(xiàn)模型預(yù)測(cè)的準(zhǔn)確性,最后使用確定系數(shù)[R2]來描述各代理模型所產(chǎn)生的預(yù)測(cè)值與實(shí)際值的匹配程度和模型預(yù)測(cè)效率。
3" 實(shí)驗(yàn)與分析
3.1" 數(shù)據(jù)獲取和預(yù)處理
本文使用電能表RFID彎折偶極子天線作為設(shè)計(jì)對(duì)象。該天線蝕刻在尺寸為80 mm×230 mm×1 mm的FR?4環(huán)氧樹脂介質(zhì)基板上,結(jié)構(gòu)如圖3所示。該天線采用對(duì)稱結(jié)構(gòu),天線結(jié)構(gòu)長(zhǎng)度和頻率初始范圍如表3所示。
通過選取頻率和其余7個(gè)天線長(zhǎng)度尺寸共計(jì)8個(gè)數(shù)據(jù)作為特征輸入,仿真得出的阻抗實(shí)部和虛部數(shù)據(jù)都具有185 785組數(shù)據(jù)。通過歸一化方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,分析實(shí)部和虛部在單一算法的相關(guān)性,單一算法在阻抗實(shí)部和虛部之間的預(yù)測(cè)性能的相關(guān)性如圖4和圖5所示。
3.2" 評(píng)價(jià)指標(biāo)
為對(duì)比KNN?XGBOOST模型在RFID彎折偶極子標(biāo)簽天線阻抗預(yù)測(cè)上的效果,建立了XGBOOST代理模型、KNN代理模型,并使用訓(xùn)練組數(shù)據(jù)完成模型訓(xùn)練。
均方根誤差是實(shí)際觀測(cè)值與模型預(yù)測(cè)值之間差異的標(biāo)準(zhǔn)度量,它是均方誤差(MSE)的平方根。均方根誤差的計(jì)算公式如式(8)所示:
[RMSE=1ni=1n(yi-yi)2] (8)
式中:[n]是樣本總數(shù);[yi]是第[i]個(gè)樣本的實(shí)際值;[yi]是模型對(duì)第[i]個(gè)樣本的預(yù)測(cè)值。
為進(jìn)一步描述模型性能,除均方根誤差外,本文使用確定系數(shù)[R2]來描述各代理模型所產(chǎn)生的預(yù)測(cè)值與實(shí)際值的匹配程度和模型預(yù)測(cè)效率,計(jì)算公式見式(9):
[R2=1-i=1n(yi-yi)2i=1n(yi-yi)2] (9)
式中[y]是實(shí)際值的平均值。一個(gè)[R2]值接近1的模型具有很高的預(yù)測(cè)準(zhǔn)確性。
3.3" 預(yù)測(cè)模型結(jié)果與分析
KNN?XGBOOST集成算法中,以第一層為KNN和XGBOOST兩種算法的預(yù)測(cè)結(jié)果作為新的數(shù)據(jù)集,通過第二層元學(xué)習(xí)器為線性回歸對(duì)該數(shù)據(jù)集的回歸擬合生成最終的預(yù)測(cè)結(jié)果,總體預(yù)測(cè)結(jié)果共有185 785組數(shù)據(jù),選取前1 000組和前100組數(shù)據(jù)進(jìn)行繪圖,可以更加直觀地表達(dá)出預(yù)測(cè)效果,如圖6和圖7所示。為了驗(yàn)證KNN?XGBOOST模型的預(yù)測(cè)性能,將單一算法與KNN?XGBOOST算法的預(yù)測(cè)效果進(jìn)行對(duì)比,結(jié)果如表4所示。
從理論層面分析,KNN?XGBOOST集成算法優(yōu)于其他算法的原因是:KNN?XGBOOST在第一層集成了多種機(jī)理不同的算法,充分學(xué)習(xí)到了各個(gè)算法的優(yōu)勢(shì)。從模型優(yōu)化的角度分析,單一算法在對(duì)目標(biāo)函數(shù)優(yōu)化的過程中容易產(chǎn)生局部最優(yōu)解,多算法的融合可以降低陷入局部最優(yōu)解的風(fēng)險(xiǎn)。
通過圖6和圖7可以看出:KNN?XGBOOST模型對(duì)天線阻抗的預(yù)測(cè)效果都有了一定的改進(jìn)。通過表4的數(shù)據(jù)顯示,與單一的KNN和XGBOOST模型相比,堆疊模型的均方根誤差降低了30%~70%,[R2]提高了10%。在預(yù)測(cè)PCB RFID天線的阻抗實(shí)部和虛部時(shí),KNN?XGBOOST模型具有較高的準(zhǔn)確率和較低的預(yù)測(cè)誤差。
這表明,對(duì)KNN和XGBOOST兩種算法模型進(jìn)行集成學(xué)習(xí)的策略,在PCB RFID天線阻抗方向預(yù)測(cè)方面具有一定的實(shí)際意義,可以在天線結(jié)構(gòu)長(zhǎng)度變化對(duì)阻抗進(jìn)行仿真時(shí)提高效率。
4" 結(jié)" 論
針對(duì)傳統(tǒng)的電磁仿真軟件對(duì)標(biāo)簽天線建模過程中得出所需要的天線阻抗耗時(shí)長(zhǎng)的問題,本文提出了一種基于KNN?XGBOOST模型的天線阻抗快速預(yù)測(cè)方法,并得出如下結(jié)論與展望:
1) 相對(duì)于使用ANSYS Electronics電磁仿真軟件,通過改變天線結(jié)構(gòu)參數(shù)得出天線阻抗過程中耗時(shí)較長(zhǎng),本文提出的基于KNN和XGBOOST堆疊模型建立天線阻抗預(yù)測(cè)的方法可準(zhǔn)確得出天線阻抗的同時(shí),極大地減少了仿真時(shí)間。通過實(shí)驗(yàn)證明,該模型在預(yù)測(cè)精度和計(jì)算效率上均優(yōu)于傳統(tǒng)仿真方法,驗(yàn)證了機(jī)器學(xué)習(xí)技術(shù)在電磁仿真領(lǐng)域的應(yīng)用價(jià)值。
2) 相對(duì)于單一算法模型對(duì)于阻抗數(shù)據(jù)的預(yù)測(cè),本文提出的KNN和XGBOOST堆疊模型預(yù)測(cè)性能更好,所得出的阻抗預(yù)測(cè)值更大程度上滿足了實(shí)際仿真需求。
雖然本文提出的KNN?XGBOOST模型解決了使用ANSYS Electronics電磁仿真在通過改變天線結(jié)構(gòu)參數(shù)得出天線阻抗過程中耗時(shí)較長(zhǎng)的問題,但實(shí)際應(yīng)用過程中彎折偶極子天線阻抗還受到彎折次數(shù)的影響,因此下一步將對(duì)不同彎折次數(shù)的標(biāo)簽天線在不同頻點(diǎn)上進(jìn)行阻抗預(yù)測(cè)來證明KNN和XGBOOST堆疊模型的普適性。
參考文獻(xiàn)
[1] COLELLA R, CATARINUCCI L. Electromagnetic design of UHF RFID tags enabling a novel method to retrieve sensor data [J]. IEEE journal of radio frequency identification, 2018, 2(1): 23?30.
[2] BAEK J J, KIM S W, PARK K H, et al. Design and performance evaluation of 13.56?MHz passive RFID for E?skin sensor application [J]. IEEE microwave and wireless components letters, 2018, 28(12): 1074?1076.
[3] OMER M, TIAN G Y, GAO B, et al. Passive UHF RFID tag as a sensor for crack depths [J]. IEEE sensors journal, 2018, 18(23): 9867?9873.
[4] 劉廣,汪爽,汪井,等.基于粒子群算法的陣列天線波束賦形研究[J].微波學(xué)報(bào),2023,39(3):37?40.
[5] MARROCCO G. The art of UHF RFID antenna design: Impe?dance?matching and size?reduction techniques [J]. IEEE antennas and propagation magazine, 2008, 50(1): 66?79.
[6] LOO C H, ELMAHGOUB K, YANG F, et al. Chip impedance matching for UHF RFID tag antenna design [J]. Progress in electromagnetics research, 2008, 81: 359?370.
[7] 趙嘉偉,王安康,亓浩.基于HFSS?API和遺傳算法的波導(dǎo)縫隙陣列天線優(yōu)化設(shè)計(jì)[J].微波學(xué)報(bào),2018,34(z1):148?151.
[8] RAO K V S, NIKITIN P V, LAM S F. Impedance matching concepts in RFID transponder design [C]// Proceedings of Fourth IEEE Workshop on Automatic Identification Advanced Technologies (AutoID2005). New York: IEEE, 2005: 39?42.
[9] CHOO J, RYOO J, HONG J, et al. T?matching networks for the efficient matching of practical RFID tags [C]// 2009 European Microwave Conference. [S.l.: s.n.], 2009: 5?8.
[10] MOHAMMED N A, DEMAREST K R, DEAVOURSD D. Analysis and synthesis of UHF RFID antennas using the embedded T?match [C]// 2010 IEEE International Conference on RFID. New York: IEEE, 2010: 230?236.
[11] KIM J H, BANG J. Antenna impedance matching using deep learning [J]. Sensors (Basel), 2021, 21(20): 6766.
[12] HAQUE M A, RAHMAN M A, AL?BAWRI S S, et al. Machine learning?based technique for gain and resonance prediction of mid band 5G Yagi antenna [J]. Scientific reports, 2023, 13(1): 12590.
[13] 洪濤,賀則昊,蔣天齊,等.基于多項(xiàng)式的彎折偶極子射頻識(shí)別標(biāo)簽天線阻抗預(yù)測(cè)研究[J].電子與信息學(xué)報(bào),2021,43(4):1098?1105.
作者簡(jiǎn)介:姜延坤(2000—),男,湖北黃岡人,碩士研究生,研究方向?yàn)镽FID標(biāo)簽天線阻抗預(yù)測(cè)。
洪" 濤(1970—),男,陜西安康人,正高級(jí)工程師,研究方向?yàn)镽FID質(zhì)量追溯系統(tǒng)。
章吉麗(2000—),女,浙江紹興人,碩士研究生,研究方向?yàn)镽FID標(biāo)簽天線結(jié)構(gòu)參數(shù)優(yōu)化。
收稿日期:2024?03?01" " " " " "修回日期:2024?03?25
基金項(xiàng)目:浙江省基礎(chǔ)公益研究計(jì)劃項(xiàng)目(LGG22E050011)