岑 崗,蔡永平,岑躍峰
(浙江科技學院 信息與電子工程學院,杭州 310023)
永磁同步電機由于其優(yōu)良的功率密度、效率和初始轉矩,被廣泛用作電動汽車的核心驅動部件[1]。但高功率密度會造成電機嚴重的溫度上升,從而影響工作效率,甚至損壞電機的核心部件。因此需要探尋有效的方法來預測永磁同步電機的溫度,以保障電機的安全穩(wěn)定運行。現(xiàn)有關于永磁同步電機的溫度預測方法主要有:溫度公式法、參數(shù)辨識法和熱網絡法。溫度公式法主要使用計算流體力學中的有限元分析法進行建模,從而實現(xiàn)溫度預測[2-3];參數(shù)辨識法一般通過通量觀測和信號注入,根據(jù)磁通量和信號的變化預測溫度[4-5];熱網絡法的主要代表為集總參數(shù)熱網絡(lumped parameter thermal network,LPTN),通過將熱路等效為電路建立網絡進行計算,實現(xiàn)溫度的預測[6-7]。隨著人工智能技術的迅速發(fā)展,深度學習在永磁同步電機的溫度預測領域得到了應用。相比傳統(tǒng)方法,深度學習對永磁同步電機的溫度預測,并不需要具備大量電機發(fā)熱原理相關知識,其預測效果主要取決于數(shù)據(jù)集的可靠性和模型的性能。2017年,Wallscheid等[8]首次引入長短期記憶(long short-term memory,LSTM)[9]網絡來預測永磁同步電機核心部件的溫度,其預測精度較高。Kirchg?ssner等[10]證明了深度殘差卷積循環(huán)網絡在永磁同步電機溫度預測方面的可行性,并在試驗中加入了貝葉斯優(yōu)化法優(yōu)化了超參數(shù)。Guo等[11]建立了一種深度神經網絡模型用于定子繞組溫度的預測,為溫度預警系統(tǒng)提供一定的技術支持。在使用循環(huán)網絡對時間序列進行預測時,部分研究者會使用堆疊的結構來增加模型的深度,包括堆疊的門控循環(huán)單元(stacked gated recurrent unit,SGRU),堆疊的長短期記憶網絡(stacked LSTM,SLSTM)[12]及不同循環(huán)網絡組合的堆疊模型[13]等,這類模型包含多個相同或類似的隱藏層,相比單層的循環(huán)網絡結構具有更強的表達能力及更好的抽象特征提取能力。但是這些方法在面對復雜的時間序列預測任務時,不易確定隱藏層之間的單元數(shù),易造成算子的浪費。
針對永磁同步電機溫度預測模型精度有待提升的問題,本研究對門控循環(huán)單元(gated recurrent unit,GRU)[14]進行了改進,提出一種新型循環(huán)網絡嵌套式門控循環(huán)單元(nested gated recurrent unit,NGRU)網絡,并引入一維卷積神經網絡(1D convolutional neural networks,1D-CNN),進一步提出一種用于預測永磁同步電機核心部件溫度的深度學習模型——1D-CNN串聯(lián)NGRU(1D-CNN tandem NGRU,CNGRU)。在本研究中,使用NGRU和CNGRU及其對比模型對永磁同步電機核心部件定子軛、定子繞組和定子齒進行溫度預測,并根據(jù)試驗結果分析論證了NGRU和CNGRU預測的精度和穩(wěn)定性。
CNN是一種基于局部連接和權值共享的神經網絡[15],而1D-CNN的輸入通常為一維或二維數(shù)組,其卷積核僅在一個方向上進行滑動,在處理時間序列數(shù)據(jù)領域應用廣泛。本研究使用1D-CNN對永磁同步電機的特征進行初步提取,1D-CNN的基本工作原理如圖1所示。1D-CNN的基本運算表達式如下:
圖1 1D -CNN的基本工作原理
hk=f((Wk·x)+bk)。
(1)
式(1)中:hk為經過第k個卷積核卷積運算得到的卷積結果;f(·)為激活函數(shù);Wk為第k個卷積核的權重矩陣;x為輸入特征;bk為偏置項。1D-CNN利用卷積核在時間維度方向上滑動,對時間窗口內的元素進行加權,再通過激活函數(shù)進行非線性變換來提取特征。
在使用循環(huán)網絡對永磁同步電機進行溫度預測時,為了去除相關特征中的噪聲,并通過有限的特征探尋電機溫度變化規(guī)律,提取更高層次的抽象的溫度變化特征,本研究在GRU的基礎上,采用嵌套的方式來增加模型的深度,提出一種新型循環(huán)網絡并命名為NGRU。NGRU的記憶塊結構如圖2所示,由重置模塊、更新模塊、新記憶模塊及輸出模塊組成,且NGRU仍舊保留了GRU中的重置門與更新門。在永磁同步電機的溫度預測中,NGRU使用全連接層對提取的深層次特征降維,得到目標部件的預測溫度。
圖2 NGRU的記憶塊結構
rt=σr(Wr[xt,ht-1]+br);
(2)
nt=rt·tanh(Wn[xt,ht-1]+bn)。
(3)
式(2)~(3)中:rt為重置門;σr為sigmoid激活函數(shù);xt為當前時刻的輸入;ht-1為隱藏狀態(tài);nt為重置的隱藏狀態(tài)。rt與tanh(Wn[xt,ht-1]+bn)進行點乘,rt在此處起到重置的作用,決定nt包含多少xt和ht-1相關的信息。
NGRU的更新模塊與常規(guī)GRU的更新門相同,其定義如下:
zt=σz(Wz[xt,ht-1]+bz)。
(4)
式(4)中:zt為更新門;σz為sigmoid激活函數(shù)。zt的表達式與重置模塊中的重置門的表達式相似,但是線性變化的參數(shù)是不同的,因此它們具有不同的功能。
NGRU的新記憶模塊用于計算得到新的記憶狀態(tài)。這個模塊內部包含了一個改動的GRU,將其定義為內部GRU,其定義如下:
(5)
(6)
(7)
(8)
NGRU的輸出模塊的定義如下:
(9)
1.4 組織病理檢查 腎臟組織取材后置于甲醛中固定48 h,石蠟包埋,按8 μm厚度切片。Masson染色:腎臟組織切片脫蠟、水化,加入Bouin處理液過夜,用自來水沖洗;分別予蘇木精染色液及堿性品紅染色5~10 min,再予磷鎢酸溶液反應5~10 min,最后予苯胺藍染色。染色后在顯微鏡下(200倍)觀察腎組織病理改變。
結合NGRU與1D-CNN,本研究提出了一種用于預測永磁同步電機溫度的新型深度學習模型——CNGRU,模型結構如圖3所示。整個模型主要分為3個部分:卷積層、循環(huán)層及全連接層。在CNGRU模型中,連續(xù)5個時刻(t-4至t)的溫度相關特征被輸入模型,用來預測t時刻目標部件的溫度。永磁同步電機的基準數(shù)據(jù)集經過適當?shù)奶幚碇?首先進入卷積層,1D-CNN進行卷積運算,從多個角度對溫度變化的特征進行提取,卷積核步長為1,數(shù)量為16,相關溫度特征維度將變成16維;然后進入循環(huán)層,NGRU通過非線性變換對相關溫度特征進行進一步的噪聲過濾,這里的非線性變換主要依賴于NGRU模型中激活函數(shù)的作用,并且由于電機溫度序列中當前溫度只與當前和過去的電機狀態(tài)有關,NGRU的循環(huán)網絡結構能挖掘永磁同步電機溫度序列在時間上的聯(lián)系,從而提取更加抽象的高層次且易于神經網絡計算的溫度特征,經過循環(huán)層的運算,得到關于t時刻溫度的相關特征;最后經過全連接層進行降維提取,匯聚由NGRU提取的溫度特征中的t時刻目標部件的預測溫度。
圖3 CNGRU的模型結構
本試驗使用的數(shù)據(jù)集來自Kaggle Data Science在線競賽平臺,由一個安裝有三相永磁同步電機[16]的測試平臺測得。數(shù)據(jù)的測量和收集由德國帕德伯恩大學電力電子和電氣驅動系完成。數(shù)據(jù)集包含了130萬余條數(shù)據(jù),基準數(shù)據(jù)標簽包括:環(huán)境溫度?a、冷卻液溫度?c、電壓d坐標ud、電壓q坐標uq、電機轉速nmech、電機扭矩Tm、電流d坐標id、電流q坐標iq、永磁體表面溫度?PM、定子軛溫度?SY、定子齒溫度?ST、定子繞組溫度?SW、唯一性標識uid。
每條數(shù)據(jù)都以2 Hz采樣,唯一性標識相同的數(shù)據(jù)是在同一時間段內連續(xù)測得,并且每組標識相同的數(shù)據(jù)都可以反映永磁同步電機的整個電熱特性。為節(jié)省計算資源,本研究以適當?shù)念l率對數(shù)據(jù)集進行降采樣處理。由于每組標識相同的數(shù)據(jù)彼此獨立,降采樣操作是單獨執(zhí)行的,只使用相同的頻率。
為了更好地預測永磁同步電機的溫度,由ud、uq、id和iq衍生出以下2個特征:
(10)
(11)
式(10)~(11)中:us為d-q坐標系合成的電壓值;is為d-q坐標系合成的電流值。
選取約30 000條數(shù)據(jù)作為訓練集,300條數(shù)據(jù)作為測試集。定子軛、定子齒和定子繞組的溫度作為永磁同步電機的溫度預測目標。由于這些核心部件的溫度特性不同,因此針對每個部件分別訓練了CNGRU和對比模型。在溫度預測中,除了預測的目標溫度與唯一性標識,其余特征都被作為輸入。為了使神經網絡更好地進行學習,數(shù)據(jù)集進行了標準差標準化處理:
(12)
本研究引入回歸任務中常用的評價指標均方誤差(mean square error,MSE)yMSE、平均絕對誤差(mean absolute error,MAE)yMAE及決定系數(shù)R2,分別定義如下:
(13)
為了從其他角度評價模型表現(xiàn),能反映逼近程度的L2范數(shù)和最大偏離狀況的L∞范數(shù)也作為評價指標,它們能在一定程度上反映模型的穩(wěn)定性,分別定義如下:
(14)
(15)
式(14)~(15)中:dt為t時刻預測值和真實值之間的差值。
本研究提出的CNGRU主要基于GRU,所以GRU被作為對比模型之一,同時LSTM也被引入進行對比。為了更好地比較本模型嵌套結構的有效性,試驗中還引入了雙層堆疊結構的LSTM(SLSTM)和雙層堆疊結構的GRU(SGRU)作為對比模型。在此基礎上,線性回歸模型(linear regression,LR)也被作為對比模型。所有的深度學習模型均采用相同的時間步長5來進行永磁同步電機溫度的預測。各模型的超參數(shù)設置見表1。試驗硬件環(huán)境如下:CPU為i7-6700HQ,內存為16 GB;顯卡為GTX960M-2G。軟件環(huán)境如下:框架庫為Keras 2.2.4,Tensorflow 1.14.0;開發(fā)環(huán)境為Pycharm 2020.3.2。
表1 各模型的超參數(shù)設置
采用CNGRU、NGRU、LSTM、SLSTM、GRU、SGRU及LR模型對永磁同步電機的核心部件定子齒、定子軛及定子繞組的溫度進行了預測。由于各部件溫度特性存在差異,因此各目標部件溫度預測的訓練是分別進行的。各模型對定子軛、定子齒及定子繞組溫度的預測結果見表2~4。本研究用yMSE、yMAE、R2、L2、L∞、訓練時間共6個評價指標描述各模型的性能。
表2 各模型對定子軛溫度的預測結果
由表2可知,各深度學習模型相比LR都有一定的優(yōu)勢。SLSTM相比LSTM,yMSE降低了4.30%。SGRU和GRU相比,SGRU的yMSE也降低了7.66%。而NGRU的yMSE、yMAE值均比SLSTM和SGRU要小,yMSE分別降低了19.57%和9.14%,并且NGRU的yMSE相比GRU降低了16.11%。在定子軛的溫度預測上,采用嵌套結構增加深度的NGRU表現(xiàn)出更強的噪聲過濾能力,比其他循環(huán)網絡具有更高的預測精度。CNGRU相對NGRU而言,在yMSE上降低了4.16%,而1D-CNN的引入對NGRU性能的提升效果不明顯。觀察各模型L∞,所有深度學習模型的L∞都明顯小于LR,可見它們相對LR模型具有一定的優(yōu)勢。NGRU的L∞比其他循環(huán)網絡平均降低0.736 3,CNGRU的L∞比其他循環(huán)網絡平均降低0.823 8。這意味著在遇到電機狀態(tài)改變等導致溫度突變的情況時,NGRU和CNGRU相對其他對比模型具有更強的穩(wěn)定性,其預測效果受到的干擾更小。
由表3可知,NGRU比GRU的yMSE降低了14.68%,其yMSE、yMAE和L2要略優(yōu)于SGRU和SLSTM,但是在L∞上略差于SLSTM。綜合其余評價指標,在定子齒的溫度預測中,NGRU預測的整體精度要略微優(yōu)于SGRU和SLSTM。CNGRU的1D-CNN對特征的提取效果得到體現(xiàn),其yMSE相比NGRU降低了18.02%。結合各模型的評價指標,定子齒的預測難度相對較小,各深度學習模型的R2都接近1,表明均達到良好的預測效果。NGRU和CNGRU相比其他循環(huán)網絡,優(yōu)勢較小。
表3 各模型對定子齒溫度的預測結果
由表4可知,SLSTM相比LSTM,其預測效果并沒有提升,甚至更差。而SGRU與GRU的預測表現(xiàn)總體上是接近的。NGRU相比SGRU和SLSTM,yMSE分別降低了7.95%和24.14%。在定子繞組的溫度預測中,NGRU的嵌套結構相比SLSTM和SGRU的堆疊結構,優(yōu)勢明顯,NGRU濾除定子繞組相關溫度特征中噪聲的能力更強。CNGRU相比NGRU,其yMSE降低了17.70%,L∞降低了1.655 6,1D -CNN對NGRU性能的提升得到體現(xiàn)。CNGRU相比其他循環(huán)網絡,yMSE平均降低了27.63%,L∞平均降低了1.619 0,yMAE和R2的優(yōu)勢明顯。對于定子繞組,CNGRU比其他模型的準確性和穩(wěn)定性更高。
表4 各模型對定子繞組溫度的預測結果
CNGRU和NGRU比其他循環(huán)網絡具有更復雜的結構,但由表2~4可知,它們在提升預測精度的時候,并未大幅度增加訓練時間,并且NGRU的嵌套結構相比堆疊結構訓練時間明顯減少。結合各模型對3個目標部件溫度預測的表現(xiàn),永磁同步電機溫度預測難度由高至低依次為:定子繞組、定子軛和定子齒。對于預測難度最小的定子齒,其相關溫度特征中包含的噪聲較少,CNGRU和NGRU與對比模型相比并沒有明顯的優(yōu)勢,各模型都能較好地挖掘溫度特征中所蘊含的信息。對于預測難度最大的定子繞組,其輸入的相關溫度特征中可能包含著大量的噪聲。CNGRU和NGRU在預測精度上較對比模型都展現(xiàn)出了一定的優(yōu)勢,試驗結果能印證NGRU具有更強的噪聲過濾能力。在模型的穩(wěn)定性上,NGRU要弱于LSTM,這可能是由于LSTM的細胞狀態(tài)與隱藏狀態(tài)相比NGRU的傳遞了更多有用的信息。但是CNGRU中1D -CNN的引入,進一步提升了預測效果。1D -CNN對特征多角度的提取有利于NGRU進行深層次抽象溫度特征的提取,NGRU的隱藏狀態(tài)能傳遞更加有效的信息,從而進一步提升NGRU挖掘溫度序列在時間上的聯(lián)系的能力。
CNGRU和NGRU對比其他循環(huán)網絡基本上都有著更有效與更穩(wěn)定的預測能力,且CNGRU相比NGRU,yMSE平均降低了13.29%,L∞平均降低了0.579 6。CNGRU和NGRU對永磁同步電機的定子軛、定子齒和定子繞組的溫度預測曲線如圖4~6所示。二者對各部件溫度曲線擬合良好,但對溫度突變的預測精度還有待提高。對比各模型間的誤差曲線,CNGRU在部分情況下略微降低了溫度突變點的誤差。計算各誤差曲線的方差,NGRU依次為0.68、0.61和1.30,CNGRU依次為0.67、0.55和1.21。再結合表2~4中二者的擬合表現(xiàn),可以得到1D-CNN的引入略微提升了CNGRU預測的穩(wěn)定性,CNGRU對永磁同步電機的溫度預測在精確性和穩(wěn)定性上相比NGRU只有較小的優(yōu)勢。
圖4 NGRU和CNGRU對定子軛的溫度預測曲線
圖5 NGRU和CNGRU對定子齒的溫度預測曲線
圖6 NGRU和CNGRU對定子繞組的溫度預測曲線
本研究提出了一種基于GRU的新型循環(huán)網絡——NGRU,將其結合1D-CNN進一步提出了一種用于永磁同步電機溫度預測的深度學習模型。通過對永磁同步電機定子軛、定子齒及定子繞組的溫度預測,論證了NGRU嵌套結構相比堆疊結構的有效性;相比其他循環(huán)網絡模型,NGRU和CNGRU對永磁同步電機溫度預測具有一定的有效性和準確性。在此基礎上,進一步對比了NGRU與CNGRU的性能差異。本研究提出的CNGRU對永磁同步電機的溫度預測具有更高的精度和穩(wěn)定性,能為電機的安全穩(wěn)定運行提供技術保障。對循環(huán)網絡在永磁同步電機溫度預測上的性能比較,能為其他相關工作提供一定的參考。