陸榮秀, 賴路璐, 楊 輝, 朱建勇
(1.華東交通大學(xué) 電氣與自動(dòng)化工程學(xué)院,江西 南昌 330013;2.江西省先進(jìn)控制與優(yōu)化重點(diǎn)實(shí)驗(yàn)室,江西 南昌 330013)
從共生礦中分離得到的稀土產(chǎn)品是極其重要的戰(zhàn)略資源。快速獲得萃取槽體中元素組分含量分布,是實(shí)現(xiàn)稀土萃取分離過(guò)程各關(guān)鍵工藝參數(shù)實(shí)時(shí)調(diào)節(jié)的關(guān)鍵環(huán)節(jié)[1]。目前,絕大多數(shù)稀土分離企業(yè)采取“定時(shí)采樣、離線實(shí)驗(yàn)室化驗(yàn)”的方式獲取組分含量[2],不能滿足生產(chǎn)現(xiàn)場(chǎng)實(shí)時(shí)性要求。近幾年,很多稀土研究工作者將數(shù)學(xué)建模中數(shù)據(jù)驅(qū)動(dòng)建模思想應(yīng)用于稀土萃取過(guò)程的組分含量檢測(cè),如文獻(xiàn)[2,3]以HSI顏色空間的H,S,I分量為輸入,建立基于最小二乘支持向量機(jī)(least square support vector machine,LSSVM)的組分含量預(yù)測(cè)模型,實(shí)現(xiàn)稀土元素組分含量的快速測(cè)量。
鑒于稀土萃取過(guò)程數(shù)據(jù)獲取成本高、數(shù)據(jù)重復(fù)等原因,造成有效過(guò)程數(shù)據(jù)不多,易導(dǎo)致模型預(yù)測(cè)精度不高、泛化性能不佳[4]等小樣本問(wèn)題[5,6],借鑒礦冶化工過(guò)程[7]、石油化工過(guò)程[8]等領(lǐng)域研究小樣本問(wèn)題的成功案例,通過(guò)合理方法擴(kuò)充樣本數(shù)量,利用大數(shù)據(jù)技術(shù)背景下的智能建模方法提高稀土萃取過(guò)程模型的預(yù)測(cè)精度是一條有效途徑。
本文以CePr/Nd萃取過(guò)程為研究對(duì)象,利用隨機(jī)配置網(wǎng)絡(luò)(stochastic configuration network,SCN)方法具有收斂速度快、泛化能力較強(qiáng)的優(yōu)勢(shì)[9],在建立CePr/Nd溶液圖像顏色特征與Nd組分含量關(guān)系模型的基礎(chǔ)上,采用線性中點(diǎn)插值的方式生成虛擬樣本,提出一種基于虛擬樣本構(gòu)造的CePr/Nd取過(guò)程組分含量預(yù)測(cè)方法。通過(guò)CePr/Nd萃取生產(chǎn)現(xiàn)場(chǎng)的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,結(jié)果表明該方法以擴(kuò)增虛擬樣本數(shù)據(jù)集的方式,為基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)模型提供有效數(shù)據(jù),可提高組分含量預(yù)測(cè)模型的精確性和泛化能力。
圖1以CePr/Nd混合料液為例,描述了稀土分離企業(yè)的溶劑串級(jí)萃取流程工藝。
圖1 CePr/Nd萃取生產(chǎn)流程
圖1中待分離料液中包括的稀土元素為Ce,Pr和Nd,根據(jù)元素與萃取劑、洗滌劑的絡(luò)合度以及生產(chǎn)線的設(shè)定要求,Nd為易萃組分,即洗滌段出口為富含Nd離子的萃取液,相應(yīng)地,Ce,Pr為難萃組分,萃取段出口則為富含Ce,Pr離子的萃余液。由于各元素之間物理化學(xué)性質(zhì)相近、影響萃取分離效果的因素多樣,萃取分離過(guò)程的每一級(jí)均要經(jīng)過(guò)攪拌、澄清,整個(gè)萃取流程存在級(jí)數(shù)多、耗時(shí)長(zhǎng)、強(qiáng)耦合、非線性等特點(diǎn)[10],在萃取段和洗滌段各設(shè)置一個(gè)監(jiān)測(cè)點(diǎn),通過(guò)檢測(cè)監(jiān)測(cè)級(jí)萃取槽體中各元素組分含量,并據(jù)此調(diào)整萃取過(guò)程各關(guān)鍵工藝參數(shù)。
由于稀土元素具有獨(dú)特的電子結(jié)構(gòu),在圖1所示的P507-HCL萃取體系中, Pr、Nd可呈現(xiàn)不同的離子顏色特征,即Pr、Nd離子分別富集在萃取段、洗滌段并逐漸顯現(xiàn)出蘋(píng)果綠和紫紅色,其他各級(jí)萃取槽體均因Pr、Nd和無(wú)色的Ce元素組分含量不同而顯現(xiàn)出不同混合溶液顏色[11]。據(jù)此,可利用機(jī)器視覺(jué)技術(shù)采集稀土混合溶液圖像,采用智能建模方法描述溶液圖像顏色特征與組分含量之間的函數(shù)關(guān)系。鑒于HSI顏色模型可以直觀反映人的視覺(jué)系統(tǒng)感知彩色的方式,本文使用HSI顏色空間下顏色分量一階矩描述稀土混合溶液的圖像特征[12],表達(dá)式如式(1)
(1)
式中μ為圖像ic(x,y)中顏色特征分量的一階矩,ic(x,y)為圖片顏色特征分量矩陣元素值,其中,P,Q分別為顏色特征分量矩陣行元素個(gè)數(shù)和矩陣列元素個(gè)數(shù),在此,P=Q=128。圖2為CePr/Nd萃取槽體混合溶液圖像特征分量H,S,I的一階矩與Nd元素組分含量之間的關(guān)系曲線。
圖2 H,S,I分量一階矩與Nd組分含量的關(guān)系
由圖2可知,根據(jù)稀土混合溶液圖像H,S,I分量的一階矩可確定溶液中Nd組分含量,用式(2)表示稀土混合溶液圖像顏色特征分量一階矩與組分含量之間的非線性函數(shù)關(guān)系
y=f(xH,xS,xI)
(2)
式中y為Nd組分含量,xH,xS,xl分別為顏色空間的H,S,I分量一階矩。
描述式(2)所示的非線性函數(shù)的方法有多種,如神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等,但這些方法均要求歷史數(shù)據(jù)的完備性,而稀土萃取過(guò)程具有典型的小樣本特點(diǎn),要得到預(yù)測(cè)精度較高和泛化能力較強(qiáng)的組分含量預(yù)測(cè)模型,需采用虛擬樣本生成方法以補(bǔ)充生產(chǎn)現(xiàn)場(chǎng)數(shù)據(jù)的不足。
虛擬樣本生成的基本思想是依據(jù)較少的真實(shí)樣本數(shù)據(jù),通過(guò)某種變換產(chǎn)生新的、符合研究對(duì)象生產(chǎn)過(guò)程規(guī)律的樣本,其目的是通過(guò)信息間隔填充,彌補(bǔ)真實(shí)樣本數(shù)據(jù)不足致使模型精度不高、泛化能力不強(qiáng)等問(wèn)題[13~15]。實(shí)現(xiàn)虛擬樣本生成方法有多種,最常用的方法為插值法[4],基本思路是根據(jù)生產(chǎn)過(guò)程特性產(chǎn)生虛擬輸出樣本,再根據(jù)樣本間的特征信息和轉(zhuǎn)換關(guān)系得到虛擬輸入樣本,從而構(gòu)成虛擬樣本集[16]。
針對(duì)稀土萃取過(guò)程的真實(shí)小樣本數(shù)據(jù),通過(guò)SCN方法建立Nd組分含量和H,S,I分量一階矩的非線性關(guān)系,然后從小樣本數(shù)據(jù)補(bǔ)充角度分析,采用插值法對(duì)萃取過(guò)程缺失的、稀疏的數(shù)據(jù)進(jìn)行增補(bǔ)。如圖3所示為基于SCN的虛擬樣本生成原理。
由圖3可知,采用SCN生成虛擬樣本的基本思路是:在依據(jù)原始真實(shí)小樣本數(shù)據(jù)建立SCN模型的基礎(chǔ)上,根據(jù)SCN模型隱含層和輸出層之間呈線性關(guān)系,采用基于中點(diǎn)插值方法得到虛擬樣本的輸出數(shù)據(jù)值,在此基礎(chǔ)上,由輸入層與隱含層的非線性映射得到虛擬樣本的輸入數(shù)據(jù)值,最后將得到輸入、輸出數(shù)據(jù)值構(gòu)成虛擬樣本集。
圖3 基于SCN的虛擬樣本生成原理
相較于傳統(tǒng)梯度類算法,隨機(jī)算法因其具有快速性、不易陷入局部極小而常用于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。文獻(xiàn)[9]提出一種新型隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò),即隨機(jī)配置網(wǎng)絡(luò)。
SCN模型是一個(gè)由輸入層、隱含層、輸出層組成的3層前向反饋網(wǎng)絡(luò)結(jié)構(gòu)。結(jié)合式(2),給定目標(biāo)函數(shù)f︰Y∈RN×1→X={xH,xS,xI}∈RN×3,其中N為樣本數(shù)。假設(shè)SCN模型此時(shí)已有L—1個(gè)隱含層節(jié)點(diǎn),即
(3)
當(dāng)模型輸出的殘差eL-1不滿足式(4),則增加新的隱含層節(jié)點(diǎn),即新模型共有L個(gè)隱含層節(jié)點(diǎn),模型輸出如式(5)
|eL-1|=|Y-YL-1|
=|[eL-1,1eL-1,2,…,eL-1,m]|<ε
(4)
式中ε>0為系統(tǒng)的容忍誤差。式(5)如下
(5)
式中 新增節(jié)點(diǎn)的輸出權(quán)值βL表示為
(6)
若隱含層的輸出權(quán)值為β=[β1,β2,…,βL],式(5)則可以寫(xiě)成式(7)
YL=H·βL
(7)
在上述推導(dǎo)過(guò)程中可知:SCN算法最大的特點(diǎn)是隱含層節(jié)點(diǎn)的可變性,需要設(shè)置的參數(shù)為最大節(jié)點(diǎn)數(shù)量L和可容忍誤差ε,直到滿足任意一個(gè)停止條件時(shí),網(wǎng)絡(luò)停止訓(xùn)練并輸出最終模型[17],隱含層節(jié)點(diǎn)的可變性使得隨機(jī)配置網(wǎng)絡(luò)更具有靈活性。
2.2.1 插值原理
為了盡可能地簡(jiǎn)化計(jì)算,本文采用歐氏距離相似度在隱含層輸出中點(diǎn)線性插值方法,首先,確定插值位置的起始行xHq,xSq,xIq(q=1,2,…,N),然后,按式(8)計(jì)算起始行與隱含層矩陣各行間基于輸入變量的歐氏距離dq(q=1,2,…,r),基于式(9)選取最優(yōu)歐氏距離d作為插值的終點(diǎn)xHq+1,xSq+1,xIq+1。式(8)、式(9)如下
(8)
d=min{dq},q=1,2,…,r
(9)
插值過(guò)程如圖4所示,利用SCN網(wǎng)絡(luò)的映射關(guān)系,在SCN隱含層輸出矩陣中進(jìn)行線性中點(diǎn)插值,得到虛擬輸出,最后,反推求得一一對(duì)應(yīng)的虛擬輸入。
圖4 隱含層輸出在第i行和第j行線性中插過(guò)程
2.2.2 虛擬樣生成方法
基于采集到的少量真實(shí)小樣本數(shù)據(jù),依據(jù)式(2),采用SCN方法建立H,S,I一階矩分量與Nd組分含量的SCN模型。
由2.1節(jié)可知, SCN模型有3個(gè)輸入節(jié)點(diǎn),若真實(shí)樣本的訓(xùn)練集Qt={Xt,Yt}(t=1,2,…,tn),t為真實(shí)樣本個(gè)數(shù),則隱含層輸出矩陣H為
(10)
式中Hhij為H矩陣?yán)锏趇行第j列元素。
根據(jù)2.1節(jié),通過(guò)訓(xùn)練集Qt建立SCN模型,可得到隱含層輸出矩陣與模型輸出的一一對(duì)應(yīng)關(guān)系
(11)
假設(shè)隱含層輸出矩陣的第一行為插值起始行,利用SCN模型隱含層和輸出層之間呈線性關(guān)系的特點(diǎn),采用中點(diǎn)插值法求取虛擬樣本的輸出值,即
(12)
式中Y′為虛擬樣本的輸出。
假設(shè)與第一行(即起始行)最優(yōu)歐氏距離是隱含層輸出矩陣的第二行,即
根據(jù)2.2.1節(jié),采用線性中點(diǎn)插值后隱含層輸出的結(jié)果是
(13)
N次中插后,由式(11)得到隱含層與網(wǎng)絡(luò)輸出的對(duì)應(yīng)關(guān)系為
(14)
根據(jù)輸入層與隱含層之間的非線性映射關(guān)系進(jìn)行反推,得到SCN的輸入數(shù)據(jù)X′
X′=(wl)?(φ-1(H′)-bl)
(15)
式中 (wl)?為輸入權(quán)值矩陣的廣義逆,φ-1(·)為激活函數(shù)的逆,即
(16)
如果輸入權(quán)值矩陣wl是一個(gè)可逆平方陣,輸入權(quán)值矩陣可由矩陣的逆計(jì)算得到(wl)-1,反之,依據(jù)廣義逆矩陣的唯一存在性,輸入權(quán)值的廣義逆(wl)?可由下面式子計(jì)算得到
(wl)?=((wl)Twl)-1(wl)T
(17)
綜上所述,經(jīng)過(guò)Nv次隱含層輸出線性中點(diǎn)插值后可得到如式(18)的N個(gè)虛擬樣本
(18)
至此,虛擬樣本生成過(guò)程結(jié)束,虛擬樣本生成的具體流程如圖5所示。
圖5 虛擬樣本生成流程
為了驗(yàn)證本文所述方法的有效性,依托江西某稀土公司的CePr/Nd取生產(chǎn)線,不同時(shí)刻不同工況條件下在萃取段和洗滌段的監(jiān)測(cè)級(jí)萃取槽體中獲得65份樣本溶液,將混合溶液做好標(biāo)記并分成兩部分,一部分采用離線實(shí)驗(yàn)室檢測(cè)方法得到Nd組分含量,另一部分用于混合溶液圖像采集,并提取溶液圖像的H,S,I顏色特征分量,將顏色特征分量一階矩與Nd組分含量組成歷史樣本數(shù)據(jù)集。為了測(cè)試訓(xùn)練模型的有效性,隨機(jī)抽取50組原始樣本作為訓(xùn)練樣本,表示為:Ttr={Xtr,Ytr}={xHtr,xStr,xItr,ytr}∈R50×4,剩余15組原始樣本為測(cè)試樣本,表示為:Tte={Xte,Yte}={xHte,xSte,xIte,yte}∈R15×4。衡量模型性能的指標(biāo)采用:相對(duì)誤差絕對(duì)值的最大值(MRE),均方根誤差(RMSE),表達(dá)式如下
(19)
(20)
為了體現(xiàn)本文方法的優(yōu)越性,設(shè)計(jì)了兩個(gè)實(shí)驗(yàn):
實(shí)驗(yàn)一根據(jù)第2節(jié)的基于SCN的虛擬樣本生成方法,依次增加10個(gè)虛擬樣本,實(shí)驗(yàn)7次,然后采用測(cè)試集Tte對(duì)各模型進(jìn)行測(cè)試。各個(gè)組分含量SCN模型的各項(xiàng)性能值如表1所示,每一個(gè)模型的相對(duì)誤差變化如圖6所示。
表1 不同虛擬樣本的SCN模型性能
圖6 不同虛擬樣本SCN模型的相對(duì)誤差
分析表1和圖8可知,1)當(dāng)虛擬樣本數(shù)量分別從0增加50的過(guò)程中,預(yù)測(cè)模型的MRE和RMSE值在不斷降低,即采用了虛擬樣本生成技術(shù)的組分含量模型比未采用該技術(shù)的模型性能高,且隨著虛擬樣本數(shù)的增加,模型性能不斷提高;2)當(dāng)虛擬樣本數(shù)量大于訓(xùn)練樣本數(shù)量時(shí),模型的測(cè)試性能不升反降,說(shuō)明當(dāng)擴(kuò)增樣本數(shù)量等于訓(xùn)練樣本數(shù)量時(shí),組分含量SCN模型預(yù)測(cè)性能最優(yōu)。
實(shí)驗(yàn)二1)使用和實(shí)驗(yàn)一相同的訓(xùn)練集和測(cè)試集,分別采用SCN、SVM、LSSVM、WLSSVM方法建立組分含量模型,得到虛擬樣本生成前各模型的性能指標(biāo);2)以實(shí)驗(yàn)一中最佳虛擬樣本數(shù)(即50)為基準(zhǔn),將原有的65個(gè)真實(shí)樣本數(shù)據(jù)和50個(gè)虛擬樣本數(shù)據(jù)混合,隨機(jī)選擇86組數(shù)據(jù)作為訓(xùn)練樣本,剩下29組數(shù)據(jù)作為測(cè)試樣本,分別采用SCN、SVM、LSSVM、WLSSVM方法進(jìn)行建模,對(duì)比模型測(cè)試的性能指標(biāo)。數(shù)據(jù)擴(kuò)增前后,SCN的停止訓(xùn)練的參數(shù)均設(shè)置為可容忍誤差ε=0.001,最大隱含層節(jié)點(diǎn)數(shù)L=50,其他各模型參數(shù)設(shè)置如表2所示。SVM、LSSVM方法均使用交叉驗(yàn)證的方式確定最佳懲罰參數(shù)c,核函數(shù)參數(shù)g,正則化參數(shù)γ和核函數(shù)σ;WLSSVM方法的輸入權(quán)重wH,wS,wI采用互信息加權(quán)方式確定,各輸入變量和輸出變量之間的互信息為mH,mS,mI;γ和σ采用交叉驗(yàn)證法確定。得到的各模型性能指標(biāo)值如表3所示。
表2 數(shù)據(jù)擴(kuò)增前后的各模型參數(shù)
表3 數(shù)據(jù)擴(kuò)增前后各模型的測(cè)試性能指標(biāo)
分析表3可知,1)虛擬樣本生成前,組分含量SCN模型的性能比基于SVM、LSSVM和WLSSVM的組分含量模型性能更優(yōu);2)當(dāng)生成50個(gè)虛擬樣本后,各組分含量模型的性能指標(biāo)值與虛擬樣本生成前相比較均減小了很多,說(shuō)明采用基于SCN中點(diǎn)插值生成的虛擬樣本,同樣適用于SVM、LSSVM、WLSSVM等方法建模。
綜上分析,采用SCN方法生成虛擬樣本,實(shí)現(xiàn)CePr/Nd萃取過(guò)程組分含量預(yù)測(cè)的途徑是可行的,實(shí)驗(yàn)的結(jié)果表明,該方法可以滿足稀土萃取生產(chǎn)現(xiàn)場(chǎng)元素組分含量的準(zhǔn)確預(yù)測(cè)。
本文針對(duì)稀土萃取生產(chǎn)現(xiàn)場(chǎng)采集數(shù)據(jù)難,可獲得的真實(shí)樣本數(shù)據(jù)少,建立組分含量模型時(shí)易出現(xiàn)小樣本問(wèn)題,提出基于隨機(jī)配置網(wǎng)絡(luò)進(jìn)行虛擬樣本生成的組分含量預(yù)測(cè),該方法充分考慮了輸入和輸出數(shù)據(jù)的非線性特性,可以有效緩解稀土萃取過(guò)程歷史樣本數(shù)據(jù)不完備的缺陷。以CePr/Nd萃取生產(chǎn)現(xiàn)場(chǎng)數(shù)據(jù)測(cè)試為依托,通過(guò)虛擬樣本生成前后的組分含量模型測(cè)試性能對(duì)比,及將生成的虛擬樣本數(shù)據(jù)用于SVM、LSSVM、WLSSVM建模的實(shí)驗(yàn)分析,結(jié)果表明:基于SCN進(jìn)行虛擬樣本生成的組分含量模型具有較高的預(yù)測(cè)精度,生成的虛擬樣本數(shù)據(jù)也適用于其他建模方法,可為提高具有小樣本特點(diǎn)的稀土萃取過(guò)程組分含量模型預(yù)測(cè)性能提供新的思路,同時(shí),也可為其他具有小樣本特點(diǎn)的復(fù)雜工業(yè)過(guò)程建模提供參考。