李思思,杜永貴,閆 飛,閻高偉
(太原理工大學 電氣與動力工程學院,太原 030024)
球磨機是廣泛應用于電力、化工等流程工業(yè)領域的典型高能耗設備,其負荷參數(shù)的準確檢測對磨礦作業(yè)環(huán)節(jié)的優(yōu)化控制、節(jié)能降耗、安全運行具有重要的意義。
目前,球磨機的負荷參數(shù)檢測通常采用軟測量策略,即選擇與主導變量相關的輔助變量(振動或振聲信號)建立模型,得到負荷參數(shù)預測值。文獻[1]針對球磨機振動信號特征值具有散度大、隨機性強的特點提出基于云模型的建模策略。文獻[2]根據(jù)多源信號存在相關性、互補性以及冗余性的特性提出多源數(shù)據(jù)特征融合的球磨機負荷軟測量方法。然而,上述建模策略僅適用于解決單工況問題。
在實際的運行中,運行任務與設定值的變化、外界環(huán)境的改變、設備重組等,會導致運行工況、數(shù)據(jù)分布發(fā)生改變[3]。對于多工況過程,現(xiàn)有研究通常采用多模型策略。該策略主要針對全局模型抽取共同特征以達到概率同分布的技術要求。文獻[4]依據(jù)先驗知識劃分工況,然后對多個工況分別建立子模型。文獻[5]引入均值聚類的方法對工況進行劃分與識別。但是,多模型在集成過程中,由于樣本劃分不精確、部分模型數(shù)據(jù)缺失等因素導致輸出精度低,預測效果不理想。
遷移學習[6-7]是一種放寬了數(shù)據(jù)同分布要求的機器學習方法。該方法通過抽取領域間“隱含語義”或挖掘領域間“共享知識結構”,遷移源域已有的知識來解決未知但與源域相關的學習問題。目前,遷移學習應用于計算機視覺[8]、多工況故障診斷[9]等方面,并且取得了諸多成果。
綜上所述,本文引入遷移學習策略,同時考慮到球磨機振動信號不確定性的特點,研究了一種基于半監(jiān)督域適應模糊推理的軟測量方法。該方法首先通過半監(jiān)督域適應解決數(shù)據(jù)分布差異導致的模型失配問題;然后,通過模糊C均值聚類對不確定非線性系統(tǒng)的源域數(shù)據(jù)劃分規(guī)則并建立回歸模型,從而提高模型預測性能。
希爾伯特-施密特獨立標準[10]計算兩組數(shù)據(jù)集間再生核希爾伯特空間的協(xié)方差來衡量數(shù)據(jù)之間的獨立性。當且僅當兩數(shù)據(jù)集間相互獨立時,其值為零;當數(shù)據(jù)集間的依賴性越強時,其值越大。最大化數(shù)據(jù)X及標簽Y的依賴性,得到目標函數(shù)為:
max Tr(VTXHYHXTV) .
(1)
文獻[11]研究了基于流形正則化域適應濕式球磨機負荷參數(shù)軟測量方法。目標函數(shù)為:
(2)
式中:上標s、t表示為源域和目標域;L為Laplacian矩陣;Mc為擴展非參數(shù)最大均值差異矩陣。流形正則化域適應方法首先采用集成流形約束、最大方差及擴展非參數(shù)最大均值差異方法得到特征變換矩陣;然后將目標域和源域數(shù)據(jù)通過投影變換矩陣投影到公共子空間;最后應用統(tǒng)計方法建立預測模型。
球磨機是包含多種不確定性擾動的多變量對象。其運行過程中,由于環(huán)境的復雜性,即使在同一負荷參數(shù)的情況下振動信號也會存在很強的不確定性,并且隨著鋼球和襯板的磨損,振動信號存在時變性。為此,可以采用非線性的模糊推理方法建立回歸預測模型,從而利用IF-THEN模糊規(guī)則把不確定非線性系統(tǒng)的狀態(tài)空間分成不同的區(qū)域,構建容忍參數(shù)不確定性的模糊推理模型[12]。
設模糊規(guī)則把不確定非線性系統(tǒng)的狀態(tài)空間劃分為K個區(qū)域,第i∈[1,K]個規(guī)則為Ri,則模糊推理如下:
Ri:IfxisAi(x,ci), theny=L(x,pi) .
(3)
式中:Ai為模糊系統(tǒng)的模糊集;pi為模糊參數(shù);ci為隸屬中心。
工況改變時,待測數(shù)據(jù)與歷史數(shù)據(jù)分布失配,導致原模型失準。若根據(jù)少量有標簽的待測樣本建模,則難以滿足傳統(tǒng)機器學習方法需要足夠多樣本才能建立模型的前提條件。若根據(jù)歷史數(shù)據(jù)建立軟測量回歸模型,則會違背機器學習及統(tǒng)計方法建立在同分布條件的前提。
針對振動信號的不確定性及工況改變后數(shù)據(jù)分布的差異造成模型失配的問題,本文根據(jù)工況變化前后數(shù)據(jù)分布特征,建立基于半監(jiān)督域適應模糊推理模型,從而得到待測工況負荷參數(shù)預測值。
文獻[11]屬于無監(jiān)督特征映射方法,無法將標簽信息融入特征映射的過程來提高公共子空間數(shù)據(jù)的可辨識屬性。為此,將公式(1)引入公式(2)得到得到半監(jiān)督域適應方法。該方法目標函數(shù)為:
(4)
為求得特征變換矩陣V,將公式(4)最大化問題轉化為:
(5)
引入拉格朗日乘子:
(6)
式(6)對V求導得:
(7)
半監(jiān)督域適應方法具體過程:首先,根據(jù)公式(7)求得特征變換矩陣V;其次,分別將源域、目標域數(shù)據(jù)投影公共子空間。
建立前件辨識模型。設樣本個數(shù)為n,利用模糊C均值聚類方法將輸入數(shù)據(jù)X=[x1,x2,…,xn]分成若干類。模糊C均值聚類的目標函數(shù)為:
(8)
式中,m為模糊指數(shù)。聚類中心ci及其隸屬度μ可以利用拉格朗日條件極值得到:
(9)
(10)
建立后件辨識模型。對于輸入數(shù)據(jù),輸出可以表示為:
(11)
因此,給定輸入數(shù)據(jù)X=[x1,x2,…,xn],模糊推理的輸出數(shù)據(jù)為:
(12)
系數(shù)矩陣p可以通過最小化目標函數(shù)(13)求得:
J2=(Fp-Y)T(Fp-Y) .
(13)
式中,Y為真實輸出標簽。目標函數(shù)為關于p的二次函數(shù),則輸出的系數(shù)矩陣最優(yōu)解為:
p=(FTF)-1FTY.
(14)
基于半監(jiān)督域適應模糊推理方法如圖1所示。首先利用半監(jiān)督域適應方法將源域和目標域的高維數(shù)據(jù)映射到公共子空間,降低因數(shù)據(jù)分布差異造成的模型失配的影響;然后利用特征映射后源域數(shù)據(jù)進行模糊C均值聚類;最后根據(jù)聚類結果建立相應的模糊推理預測模型,并將特征映射后的目標域數(shù)據(jù)帶入模型,得到負荷參數(shù)預測值。
圖1 半監(jiān)督域適應模糊推理方法 Fig.1 Semi-supervised domain adaptive fuzzy inference
為了驗證本文所提出的半監(jiān)督域適應模糊推理方法的有效性,進行了兩組仿真實驗:第一組仿真實驗證明工況改變時,傳統(tǒng)的軟測量方法不能取得可靠結果;第二組實驗引入遷移學習策略,分別將本文所提算法與流形正則化域適應、半監(jiān)督-偏最小二乘進行對比,LX驗證算法的有效性。本文所選用的評價指標為均方根誤差(RMSE).
通過改變介質充填率(ball charge volume ratio,BCVR)的方式模擬工況突變。數(shù)據(jù)采集裝置為D602 mm×715 mm小型實驗室球磨機。利用多通道數(shù)據(jù)采集裝置,獲取5組固定BCVR的小型實驗室球磨機振動信號。為保證負荷參數(shù)的高分辨率,每組都做了充分的實驗,并對實驗進行振動信號現(xiàn)場同步采集。每組實驗通過添加物料量改變料球比、濃度、充填率。濕式球磨機實驗實施方案如表1所示。
表1 工況突變實驗情況Table 1 Experimental condition of sudden change
將每組源域數(shù)據(jù)和目標域數(shù)據(jù)的振動信號平均分為20個樣本,每個樣本覆蓋長度大于濕式球磨機旋轉一周所用時間,然后將難以建模的時域信號通過快速傅里葉變換轉換為頻域信號。
以介質充填率變化的5種工況為例,每個工況下隨機選取500個振動信號的樣本,通過鄰域保持嵌入(neighborhood preserving embedding,NPE)方法將高維頻譜特征降維至三維空間進行可視化。圖2給出了5種工況下三維空間的數(shù)據(jù)分布情況。
圖2 不同工況數(shù)據(jù)降維后的分布情況 Fig.2 Distribution of different working conditions data after dimensionality reduction
從圖2中可以看出不同工況下,數(shù)據(jù)分布存在差異性。
實驗一:傳統(tǒng)軟測量方法通常分為兩步,即特征提取與回歸模型建立。常見的特征提取有主成分分析(principal component analysis,PCA)、深度信念網(wǎng)絡(deep belief network,DBN)等。常見的建模方法有偏最小二乘回歸(partial least squares,PLS)、核模糊回歸以及極限學習機(extreme learning machine,ELM)等算法。
本文采用傳統(tǒng)方法PCA提取特征,其原因為PCA是一種多變量的統(tǒng)計學方法且對過程噪音和數(shù)據(jù)缺失具有一定的魯棒性。回歸模型采用模糊推理方法,其規(guī)則數(shù)為5。不同工況負荷參數(shù)預測的RMSE如表2所示。表中“1→2”表示工況1為訓練數(shù)據(jù),工況2的數(shù)據(jù)為測試數(shù)據(jù),其他記號同理。
表2 模糊推理方法負荷參數(shù)預測結果Table 2 Fuzzy inference method for load parameters prediction
根據(jù)表2可知,工況發(fā)生改變后,模型負荷參數(shù)預測的精度就會逐漸降低,泛化性能差。其原因為工況改變后,不同工況數(shù)據(jù)分布的差異造成模型的失配。
實驗二:當工況發(fā)生改變后,傳統(tǒng)軟測量方法不再適應,為此引入遷移學習策略中的特征映射方法。對比實驗中,流形正則化域適應采用文獻[11]中的方案。半監(jiān)督-偏最小二乘表示采用半監(jiān)督域適應將源域和目標域數(shù)據(jù)映射到公共子空間,利用偏最小二乘法建立回歸模型。半監(jiān)督域適應模糊推理建模方法如2節(jié)所述,其規(guī)則數(shù)為5.表中“1→2”表示工況1遷移到工況2,即工況1為源域數(shù)據(jù),工況2的數(shù)據(jù)為目標域數(shù)據(jù),其他記號同理。不同遷移學習方法的RMSE如表3所示。
表3 不同遷移學習方法預測結果Table 3 Prediction results of different transfer learning methods
對比表2與表3可知,通過采用遷移學習策略,負荷參數(shù)預測精度明顯提高。相對于傳統(tǒng)方法,遷移學習方法在建模的過程中,挖掘更多與球磨機負荷參數(shù)相關的特定領域信息,使預測結果與真實值更加接近,誤差減小,模型的泛化性能及預測精度有所提高。根據(jù)表3中的結果,可以看出:
1) 將希爾伯特-施密特獨立標準引入特征映射過程中對于模型預測精度的提高有一定的作用。
2) 對比半監(jiān)督-偏最小二乘建模結果與半監(jiān)督域適應模糊推理方法,后者預測精度相對較高。其原因為模糊推理是一種能容忍參數(shù)不確定性的非線性建模方法。
圖3 負荷參數(shù)預測結果 Fig.3 Prediction results of load parameters
為直觀了解參數(shù)預測情況,以工況1的數(shù)據(jù)作為源域數(shù)據(jù),工況2的數(shù)據(jù)作為目標域數(shù)據(jù),繪制了圖3。圖中模糊推理為實驗一中傳統(tǒng)方法的預測結果。
由圖3可知,半監(jiān)督域適應模糊推理方法較好地跟蹤了真實值的變化,這充分說明該方法對于預測球磨機負荷參數(shù)的有效性。
本文研究了一種基于半監(jiān)督域適應模糊推理的球磨機負荷參數(shù)軟測量方法。與其他軟測量方法相比,該方法的優(yōu)點在于:
1) 當工況發(fā)生改變后,可以充分利用歷史工況數(shù)據(jù),降低數(shù)據(jù)采集成本。
2) 可以有效避免傳統(tǒng)建模方法因數(shù)據(jù)分布差異而造成的模型失配問題。
3) 采用模糊推理建模過程簡單,具有良好的預測性能,易于在實際應用中實現(xiàn)。實驗結果表明,引入半監(jiān)督域適應模糊推理方法可以實現(xiàn)磨機負荷參數(shù)的較高精度預測。這種建模方法及思想對其他領域的參數(shù)預測有一定的參考價值。