陸榮秀,何權(quán)恒,楊 輝,朱建勇
(1.華東交通大學(xué) 電氣與自動化工程學(xué)院,南昌 330013;2.江西省先進控制與優(yōu)化重點實驗室,南昌 330013)
多組分稀土溶劑萃取分離流程[1]是國內(nèi)外稀土分離企業(yè)從稀土共生礦中獲取單一、高純稀土元素廣泛采用的工藝。能否快速檢測組分含量直接影響稀土萃取過程關(guān)鍵工藝參數(shù)調(diào)節(jié)的實時性,關(guān)系到萃取過程兩端出口產(chǎn)品的質(zhì)量,是稀土萃取過程優(yōu)化控制的首要條件。目前,在大多數(shù)稀土分離企業(yè)中,仍采用“定時采樣、離線實驗室化驗”[2]的方式獲取組分含量值,該方法雖然準(zhǔn)確、可靠,但嚴(yán)重滯后,不能滿足實時性的要求,易導(dǎo)致次品、廢品。現(xiàn)有基于設(shè)備改造的現(xiàn)場檢測方法,如XRF 分析法、分光光度法等[3-4],均普遍存在所需硬件裝置結(jié)構(gòu)復(fù)雜、可靠性低、使用和維護成本高的特點,不能在各稀土分離企業(yè)推廣使用。因此,研究稀土萃取分離過程組分含量快速檢測方法勢在必行。
鑒于稀土元素具有特殊的電子層結(jié)構(gòu),部分稀土離子在可見光區(qū)域能呈現(xiàn)特征顏色[5],為采用快速、準(zhǔn)確且可連續(xù)檢測的機器視覺技術(shù)[6-7]提供了可行途徑。文獻[8]以實驗室條件下采集的Pr/Nd 溶液為研究對象,在HSI 顏色空間下采用最小二乘方法建立了H 分量一階矩與組分含量之間的關(guān)系模型。文獻[9]采用實驗對比方法確定了稀土混合溶液的采集條件,并采用BP 神經(jīng)網(wǎng)絡(luò)建立了顏色特征分量與Nd 元素組分含量的數(shù)學(xué)模型。文獻[10-11]分別采用最小二乘支持向量機(LSSVM)和多RBF 神經(jīng)網(wǎng)絡(luò)研究顏色特征分量與組分含量的關(guān)系模型及其自適應(yīng)校正方法。但以上方法的研究對象為兩者均具有離子特征顏色的稀土混合溶液。在多組分稀土萃取分離體系中,具有離子顏色特征和無離子顏色特征的稀土萃取段非常普遍,目前尚未有稀土科研工作者對這種情況下的組分含量快速檢測進行系統(tǒng)研究,已有基于機器視覺技術(shù)的組分含量快速檢測方法也不能直接用于此種工況。為此,需針對具有顏色特征和無顏色特征的稀土離子共存工況下的多組分萃取體系,進一步探討既快速又能準(zhǔn)確檢測多組分含量的方法。
本文在上述研究的基礎(chǔ)上,以具有顏色特征的Pr、Nd 離子和無顏色特征的Ce 離子共存的CePr/Nd萃取溶液為研究對象,采用實驗對比的方法確定溶液圖像特性,利用具有準(zhǔn)確率高、學(xué)習(xí)速度快、泛化性能好等優(yōu)點的極限學(xué)習(xí)機(ELM)方法[12-13],建立基于顏色特征的稀土萃取過程多組分含量的預(yù)測模型。針對ELM 的輸入層到隱含層的權(quán)值及隱含層閾值具有的隨機性,本文采用遺傳算法(GA)進行優(yōu)化,并基于某稀土分離企業(yè)CePr/Nd 萃取生產(chǎn)現(xiàn)場數(shù)據(jù),從建模算法和優(yōu)化算法兩方面考慮,將本文提出的組分含量GA-ELM 模型與ELM、BP、LSSVM 以及GA-BP、PSO-ELM 算法進行仿真對比。
在廣泛采用的稀土溶劑萃取分離全流程中,雖然所有萃取段均為兩出口的流程工藝[14],但不同工藝段包含的稀土元素組分不同、含量各異,且這些稀土離子有些可以表現(xiàn)出離子特征顏色,有些則為無色,如表1 所示。
表1 稀土離子的特征顏色Table 1 Characteristic color of rare earth ions
由表1 可知,在多組分稀土萃取分離體系[15]中,從稀土共生礦中獲取單一高純的稀土元素,包含了大量有顏色特征和無顏色特征的稀土離子共存的萃取工段。為明確有顏色特征和無顏色特征的稀土離子共存的稀土混合溶液圖像特性,以CePr/Nd 萃取混合溶液為研究對象,與均具有顏色特征的Pr/Nd 混合溶液進行實驗對比。實驗方法及過程如下:
1)在兩份濃度、體積和組分含量均相同的Pr/Nd混合溶液中,按要求分別滴入濃度和體積均相同的無色溶液CeCl3和HCl,獲得濃度和體積一致的CePr/Nd 混合溶液和Pr/Nd 混合溶液。
2)在相同的圖像采集條件下,采集兩種混合溶液的圖像。
3)在HSI 顏色空間分別提取溶液圖像的H、S、I特征分量,并計算其一階距,結(jié)果對比如圖1 所示。從圖1 可以看出:(1)有顏色特征和無顏色特征的離子共存下的CePr/Nd 混合溶液圖像,與兩者均具有顏色特征的Pr/Nd 混合溶液圖像在HSI 空間下的顏色特征值均不相同,表明在有顏色特征和無顏色特征的稀土離子共存條件下,需要進一步探討組分含量快速預(yù)測方法;(2)隨著CeCl3溶液加入Pr/Nd 混合溶液的體積越來越大,混合溶液中Ce 組分的含量逐漸增大,分析圖1 中H、S、I 特征分量與CePr/Nd 混合溶液的體積變化曲線,發(fā)現(xiàn)H、S 一階矩均與組分含量Ce 呈一一對應(yīng)關(guān)系。
為確定顏色特征分量與組分含量之間的關(guān)系,整理CePr/Nd 混合溶液圖像的H、S、I 特征分量與Pr、Nd 元素組分含量之間的關(guān)系,如圖2 所示。
圖1 2 種溶液圖像的H/S/I 特征分量一階矩對比Fig.1 First-order moment comparison of H/S/I characteristic components of two solution images
圖2 H/S/I 分量一階矩與Pr、Nd 組分含量關(guān)系Fig.2 Relationship between the first moment of H/S/I components and the content of Pr and Nd components
分析圖2 可以發(fā)現(xiàn),只有H、S 分量一階矩與Pr、Nd 組分含量單調(diào)性較好。綜合圖1 和圖2,本文選擇H、S 分量作為稀土萃取過程多組分含量模型的輔助變量。鑒于CePr/Nd 混合溶液中的Ce、Pr、Nd 3 種元素的組分含量之和為100%,若得到其中兩個組分的含量,則可知第3 個組分的含量,故本文選擇Pr、Nd 元素的組分含量為模型輸出變量。
極限學(xué)習(xí)機(ELM)是一種新型單隱層前饋神經(jīng)網(wǎng)絡(luò)。ELM 算法隨機產(chǎn)生輸入層到隱含層的權(quán)值矩陣及隱含層的閾值矩陣,且在訓(xùn)練過程中無需調(diào)整,只需要確定隱含層節(jié)點個數(shù),便可以獲得唯一的最優(yōu)解。與傳統(tǒng)訓(xùn)練方法相比,ELM 具有準(zhǔn)確率高、學(xué)習(xí)速度快、泛化性能好以及參數(shù)調(diào)節(jié)少等優(yōu)點。根據(jù)第1 節(jié),稀土萃取過程多組分含量ELM 模型結(jié)構(gòu)如圖3 所示。
圖3 ELM 模型結(jié)構(gòu)Fig.3 Structure of ELM model
在圖3 中,X={xH,xS}∈?n×2,xH、xS分別為稀土混合溶液樣本圖像的H、S 分量一階矩,可表示為xH=[xH1,xH2,…,xHn]T∈?n×1,xS=[xS1,xS2,…,xSn]T∈?n×1,l=1,2,…,n表示稀土混合溶液樣本。稀土混合溶液樣本中對應(yīng)的Pr、Nd 組分含量分別為y1=[y11,y12,…,y1n]T∈?n×1,y2=[y21,y22,…,y2n]T∈?n×1,當(dāng)隱含層節(jié)點個數(shù)為L時,ELM 神經(jīng)網(wǎng)絡(luò)的輸出可以表示為:
其中,g(·)為激勵函數(shù),可選用RBF、sine 或sigmoid等函數(shù),t為輸出變量個數(shù),L為隱含層個數(shù),ω={ω1,ω2},ωj=[ωj,1,ωj,2,…,ωj,L]T,j=1,2 為輸入權(quán)重,β={β1,β2},βt=[β1,t,β2,t,…,βL,t]T,t=1,2 為隱含層到輸出層的權(quán)重,b={bi}是閾值矩陣,bi是第i個隱含層節(jié)點的閾值,ωi·xj表示ωi和xi的內(nèi)積。
通過對權(quán)值矩陣和閾值矩陣的訓(xùn)練,可實現(xiàn)模型的輸出值與組分含量實際值的誤差趨近于0,即:
其中,H={H1,H2}是隱含層節(jié)點的輸出,Y={y1,y2}為模型的組分含量輸出值。
由式(4)可知,輸入權(quán)重ω和隱含層的偏置矩陣b一旦確定,隱含層的輸出矩陣H就被唯一確定,進而ELM 模型(即式(1))的輸出值也唯一確定。
根據(jù)上述推導(dǎo)過程可知,訓(xùn)練ELM 前饋神經(jīng)網(wǎng)絡(luò)模型可以轉(zhuǎn)化為求解一個線性系統(tǒng)最小二乘的問題,此外,ELM 的輸出對權(quán)值矩陣和偏置矩陣的初值依賴性較高。
鑒于ELM 神經(jīng)網(wǎng)絡(luò)模型對權(quán)值矩陣和偏置矩陣初值的設(shè)定依賴性較強,而這些矩陣的設(shè)定具有隨機性,容易造成模型精度下降。遺傳算法(GA)作為一種隨機并行搜索算法,具有魯棒性優(yōu)良、全局索引能力強[16]等優(yōu)點,尤其針對局部最優(yōu)的問題擁有極佳的全局把控能力。因此,本文采用GA 對ELM模型權(quán)重和閾值進行優(yōu)化設(shè)定,以提高CePr/Nd 組分含量ELM 模型的預(yù)測精度?;贕A-ELM 的多組分含量模型的流程如圖4 所示。
圖4 基于GA-ELM 的多組分含量建模流程Fig.4 Multi-component content modeling procdure based on GA-ELM
圖4 對應(yīng)的具體步驟如下:
1)數(shù)據(jù)采集:將從稀土萃取生產(chǎn)現(xiàn)場采集到的混合溶液圖像,在HSI 顏色空間提取出H、S 顏色特征分量,與溶液中對應(yīng)的組分含量組成輸入輸出對數(shù)據(jù)集。
2)數(shù)據(jù)預(yù)處理:由于各特征分量以及組分含量值表示的物理含義不同,為防止各分量數(shù)量級不一致對訓(xùn)練結(jié)果造成干擾,并提高網(wǎng)絡(luò)的收斂速度[17],對數(shù)據(jù)集進行歸一化處理,所有數(shù)據(jù)均歸一化到[0~1]范圍。
3)確定ELM 模型結(jié)構(gòu)并初始化:根據(jù)數(shù)據(jù)集的特點確定模型結(jié)構(gòu),并據(jù)此初始化權(quán)值矩陣和閾值矩陣。
4)采用GA 對ELM 的權(quán)值矩陣和閾值矩陣優(yōu)化設(shè)定:
(1)設(shè)置初始值。確定種群大小、最大進化代數(shù)、交叉概率、變異概率等參數(shù),并對步驟3)中隨機產(chǎn)生的權(quán)值ω和閾值b進行二進制編碼,作為GA 的初始種群。
(2)適應(yīng)度函數(shù)。適應(yīng)度值是描述個體性能的主要指標(biāo),適應(yīng)度函數(shù)的選取直接影響到GA 的收斂速度以及是否能獲取最優(yōu)解。本文將訓(xùn)練集樣本預(yù)測的平均相對誤差作為個體適應(yīng)度函數(shù),表達式為:
其中,ytk(t=1,2)為Pr、Nd 測試樣本的模型輸出值,為Pr、Nd 測試樣本的組分含量真實值,N為測試樣本數(shù)。
(3)遺傳算法。遺傳算法操作步驟如下:
①選擇操作:選擇操作是建立在群體中個體的適應(yīng)度評估基礎(chǔ)上的。根據(jù)種群中每個個體的適應(yīng)度值,采用隨機遍歷抽樣法計算出選擇概率,按照適者生存的選擇策略從上一代種群中挑選出優(yōu)良個體,將優(yōu)秀個體的基因遺傳給下一代,組建新種群,同時淘汰劣質(zhì)個體。
②交叉操作:本文選用單點交叉算子,即通過對自然界生物雜交過程的模擬,隨機選擇一個交叉點,使兩個父代個體相互交換尾部基因,以產(chǎn)生子代新個體,達到增強遺傳算法搜索能力的目的。
③變異操作:在新種群中任選一個個體,將個體染色體編碼串中的一部分基因座上的基因值用其他等位基因來替換,進而形成新的個體。
(4)終止條件。當(dāng)?shù)螖?shù)計算到最大進化代數(shù)gmax 時,算法終止,返回當(dāng)前最優(yōu)權(quán)值和閾值組合。
5)ELM 模型確定。當(dāng)最優(yōu)權(quán)值ω與閾值b確定時,代入式(1),ELM 模型就被唯一確定,即稀土萃取過程多組分含量的ELM 預(yù)測模型確定。
至此,采用GA 優(yōu)化ELM 權(quán)值和閾值,建立稀土萃取過程多組分含量模型的過程已全部實現(xiàn)。
為驗證GA-ELM 預(yù)測模型對具有特征顏色和無特征顏色稀土離子共存的萃取混合溶液多組分含量快速檢測的有效性,從稀土萃取生產(chǎn)現(xiàn)場采集溶液樣本圖像,提取顏色特征進行模型驗證。
以某稀土分離公司為依托,在CePr/Nd 萃取槽體不同時段不同工況下采集102 個混合溶液樣品,每一個樣品分成兩份,一份萃取混合溶液送到實驗室化驗,得到Ce、Pr、Nd 元素組分含量,它們的元素組分含量分布范圍分別在0.005%~69.9%、0.019%~53.30% 和0.01%~99.965%之間,另一份用于采集CePr/Nd 混合溶液圖像,并對溶液圖像在HSI 顏色空間下提取顏色特征值。根據(jù)第1 節(jié)的描述,選取與Ce、Pr、Nd 組分含量單調(diào)性均較好的H、S 顏色特征分量一階矩作為模型的輸入變量,以Pr、Nd 元素組分含量作為模型的輸出變量,得到102 組輸入輸出原始數(shù)據(jù)對,對其進行歸一化處理后,表示為{X,Y}={xH,xs,y1,y2}∈?n×4。為驗證模型的有效性,在經(jīng)過預(yù)處理后的102 組數(shù)據(jù)對中隨機選取92 組數(shù)據(jù)作為模型訓(xùn)練樣本,其余10 組數(shù)據(jù)作為測試樣本,分別表示為:
采用遺傳算法優(yōu)化ELM 神經(jīng)網(wǎng)絡(luò)模型,首先需要確定ELM 模型的隱含層節(jié)點數(shù),然后根據(jù)確定的模型結(jié)構(gòu)優(yōu)化權(quán)值矩陣和閾值矩陣。
4.2.1 隱含層節(jié)點的確定
ELM 神經(jīng)網(wǎng)絡(luò)屬于單隱含層前饋神經(jīng)網(wǎng)絡(luò),模型的預(yù)測精度與隱含層節(jié)點[18]個數(shù)緊密相關(guān)。隱含層節(jié)點數(shù)太少會導(dǎo)致ELM 網(wǎng)絡(luò)“欠擬合”,太多會導(dǎo)致ELM 網(wǎng)絡(luò)“過擬合”,兩種情況均會造成模型預(yù)測精度降低。為此,本文借鑒“試錯法”的思想[19],為優(yōu)化測試樣本的平均相對誤差,通過連續(xù)不斷地改變系統(tǒng)的隱含節(jié)點個數(shù),獲得較優(yōu)的GA-ELM 網(wǎng)絡(luò)拓補結(jié)構(gòu)。具體方法如下:1)ELM 神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點個數(shù)測試范圍定為1~100;2)當(dāng)模型每次取不同節(jié)點個數(shù)時分別訓(xùn)練10 次,將每次訓(xùn)練得到的模型計算測試樣本最大相對誤差絕對值,進行保存并計算平均值;3)將每一個隱含層節(jié)點數(shù)與10 次訓(xùn)練得到的誤差平均值一一對應(yīng),并繪圖表示出兩者之間的變化關(guān)系,如圖5 所示。
圖5 稀土萃取中多組分含量預(yù)測模型Fig.5 Prediction model of multi-component content in rare earth extraction
由圖5 可知,當(dāng)隱含層節(jié)點個數(shù)設(shè)置為25 時,訓(xùn)練10 次得到的Pr、Nd 組分含量最大相對誤差絕對值的平均值最小,因此ELM 模型的隱含節(jié)點L=25。
4.2.2 相關(guān)參數(shù)設(shè)置
根據(jù)樣本數(shù)據(jù)特點,參考ELM 和GA 的相關(guān)文獻[20-21],GA 的相關(guān)參數(shù)設(shè)置如表2所示。由于sigmoid 函數(shù)具有嚴(yán)格遞增性,并能夠調(diào)節(jié)線性與非線性關(guān)系,因此本文選擇sigmoid 函數(shù)作為激勵函數(shù)。
表2 GA 參數(shù)設(shè)置Table 2 GA parameter setting
根據(jù)上文所述,稀土萃取過程多組分含量ELM模型的輸入輸出變量個數(shù)均為2,隱含層節(jié)點為25,則模型結(jié)構(gòu)確定為2-25-2。在4.2 節(jié)的參數(shù)設(shè)定條件下,采用GA 對組分含量ELM 預(yù)測模型的權(quán)值和閾值進行訓(xùn)練,以式(5)所示的平均相對誤差的均值為適應(yīng)度值,得到遺傳算法的進化結(jié)果,如圖6 所示。從圖6 進化過程曲線可以看出,采用遺傳算法優(yōu)化ELM 權(quán)值和閾值時具有較好的收斂性,在22 代時已基本收斂至最優(yōu)權(quán)值和最優(yōu)隱含層閾值。將優(yōu)化后的權(quán)值矩陣和閾值矩陣賦給極限學(xué)習(xí)機,可由式(1)確定稀土萃取過程多組分含量ELM 模型。
圖6 GA 優(yōu)化ELM 模型權(quán)值和閾值的進化過程Fig.6 Evolution process of GA optimized ELM model weights and thresholds
為體現(xiàn)GA-ELM 算法在CePr/Nd 萃取過程多組分含量預(yù)測方面的優(yōu)越性,將對比模型調(diào)至為最優(yōu)參數(shù)下的模型,以及在訓(xùn)練樣本和測試樣本均相同的條件下進行如下對比實驗:
1)采用常用的BP 神經(jīng)網(wǎng)絡(luò)、LSSVM、ELM 神經(jīng)網(wǎng)絡(luò)建立多組分含量模型。
2)采用GA 優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)模型與ELM 神經(jīng)網(wǎng)絡(luò)模型(即本文方法)進行仿真實驗對比。
3)采用粒子群優(yōu)化(PSO)算法優(yōu)化ELM 模型,與GA-ELM 模型進行實驗對比。其中ELM 神經(jīng)網(wǎng)絡(luò)模型采用2-25-2 結(jié)構(gòu),BP 神經(jīng)網(wǎng)絡(luò)模型采用2-20-2 結(jié)構(gòu)。模型性能以式(8)~式(10)所示的平均相對誤差(MRE)、均方根誤差(RMSE)和相對誤差3 個指標(biāo)進行衡量。采用訓(xùn)練集Tte中的測試樣本數(shù)據(jù)對6 種模型進行測試,可得到如圖7、圖8 所示的相對誤差,對應(yīng)的測試性能指標(biāo)值RMSE、MRE 和最大相對誤差絕對值如表3 所示。
圖7 6 種模型測試時Pr 元素組分含量的相對誤差Fig.7 Relative error of Pr element content in six model tests
圖8 6 種模型測試時Nd 元素組分含量的相對誤差Fig.8 Relative error of Nd element content in six model tests
表3 6 種模型測試的性能指標(biāo)值Table 3 Performance indicators for the six model tests
由圖7、圖8 和表3 可以看出:
1)ELM 模型與BP 模型測試結(jié)果比較,即對比基于ELM 網(wǎng)絡(luò)、BP 網(wǎng)絡(luò)的元素組分含量模型測試結(jié)果,從中可以發(fā)現(xiàn),組分含量ELM 模型測試得到的平均相對誤差MRE、均方根誤差RMSE 和相對誤差絕對值的最大值Max|error|3 個性能指標(biāo)值總體優(yōu)于組分含量BP 模型的性能指標(biāo)值,說明ELM 網(wǎng)絡(luò)比BP 算法更適合稀土混合溶液多組分含量預(yù)測。
2)GA 優(yōu)化性能分析,從兩個方面進行GA 優(yōu)化性能的對比分析,一方面是對比組分含量BP 和GABP 模型、ELM 和GA-ELM 模型測試結(jié)果,從中可以發(fā)現(xiàn),采用GA 優(yōu)化參數(shù)后的組分含量GA-BP 和GA-ELM 模型的3 個測試性能指標(biāo)值均較低,而組分含量BP 和ELM 模型測試性能均有很大提高,另一方面是對比GA-ELM 模型與PSO-ELM 模型測試結(jié)果,發(fā)現(xiàn)前者的性能指標(biāo)值更低,說明采用GA 進行ELM 模型參數(shù)優(yōu)化,能有效降低預(yù)測模型的誤差,提高模型的預(yù)測效果。
3)GA-ELM 模型與LSSVM 模型進行比較,前者的測試結(jié)果性能指標(biāo)值更低,說明GA-ELM 方法更適用于稀土萃取過程多組分含量預(yù)測。由表3 可知,相比于GA-BP 模型、LSSVM 和PSO-ELM,組分含量GA-ELM 模型對Pr 和Nd 元素組分含量的測試性能指標(biāo)MRE、RMSE 和Max|error| 分別降至1.761 4%、0.635 8、3.982 0% 和1.852 4%、1.146 1 和3.625 4%,這些性能參數(shù)值均相對較低,最大相對誤差都在±4%以內(nèi),低于稀土分離企業(yè)對組分含量檢測誤差在±5%的最低要求。
在稀土萃取流程中,具有顏色特征和無顏色特征的稀土離子在共存情況下稀土元素組分含量難以快速檢測。為此,本文采用實驗的方法確定混合萃取液的圖像特性,提出一種基于ELM 神經(jīng)網(wǎng)絡(luò)模型的稀土萃取過程多組分含量預(yù)測方法。運用遺傳算法對ELM輸入權(quán)值矩陣和隱含層閾值進行優(yōu)化,基于CePr/Nd 萃取分離生產(chǎn)線采集的溶液樣本數(shù)據(jù),通過對比分析BP、ELM、LSSVM、PSO-ELM、GA-BP 和GA-ELM 6 種方法建立組分含量模型。實驗結(jié)果表明,該方法具有更高的預(yù)測精度和更好的泛化能力,適用于含有顏色特征和無顏色特征離子共存的稀土萃取過程多組分含量的快速準(zhǔn)確檢測,可為稀土萃取過程各操作變量調(diào)節(jié)提供可靠的參考依據(jù)。
雖然本文方法采用的HSI 顏色空間模型貼近人類視覺對顏色的感知系統(tǒng),但不同顏色空間的顏色特征側(cè)重點不相同,為彌補單一顏色空間表征圖像顏色特征信息的缺失,下一步將嘗試在多個顏色空間尋找更適合表征具有顏色特征和無顏色特征離子共存的稀土混合溶液圖像的特征,以獲得精確度更高、泛化能力更好的多元素組分含量預(yù)測模型,同時將從稀土萃取過程機理出發(fā),研究更適合稀土萃取生產(chǎn)現(xiàn)場的多組分含量快速檢測的算法。