0 引言
在石油化工行業(yè),泵是關(guān)鍵的流體輸送設(shè)備。密封腔壓力作為泵的重要參數(shù),極大影響著密封系統(tǒng)的設(shè)計(jì)、沖洗方案的確定和沖洗壓力的計(jì)算,精準(zhǔn)預(yù)測(cè)密封腔壓力不僅對(duì)泵的密封效果、效率和壽命有著重要意義,還能防止泄漏和設(shè)備故障,從而提高整個(gè)系統(tǒng)的安全性和經(jīng)濟(jì)效益。密封腔壓力的影響因素多,且種類復(fù)雜,如何計(jì)算和預(yù)測(cè)泵密封腔壓力一直是相關(guān)領(lǐng)域?qū)<已芯康闹攸c(diǎn)課題。
API682標(biāo)準(zhǔn)最早提出了針對(duì)離心泵和回轉(zhuǎn)泵密封系統(tǒng)的密封腔壓力經(jīng)驗(yàn)公式;隨著泵設(shè)計(jì)和運(yùn)行條件的復(fù)雜化,單靠經(jīng)驗(yàn)公式已不再足夠,P.Geiger和H.Fiedler等人通過CFD技術(shù),模擬密封腔內(nèi)的流體流動(dòng),提供壓力分布預(yù)測(cè)[2];A.Khonsari和E.Booser基于現(xiàn)代密封設(shè)計(jì)理論提出先進(jìn)的設(shè)計(jì)和材料可以顯著減小密封腔內(nèi)的壓力波動(dòng),增強(qiáng)密封的可靠性[3]。近年來,人工智能(AD技術(shù),特別是機(jī)器學(xué)習(xí)和深度學(xué)習(xí),在處理復(fù)雜數(shù)據(jù)和預(yù)測(cè)模型方面展現(xiàn)出了強(qiáng)大的能力。通過學(xué)習(xí)大量的歷史運(yùn)行數(shù)據(jù),機(jī)器學(xué)習(xí)能夠捕捉到傳統(tǒng)物理模型難以表達(dá)的復(fù)雜模式和關(guān)系。在工業(yè)領(lǐng)域,機(jī)器學(xué)習(xí)已經(jīng)在許多應(yīng)用場(chǎng)景中取得了成功,例如設(shè)備故障預(yù)測(cè)、生產(chǎn)優(yōu)化和流程控制。然而,石油化工行業(yè)由于其工藝流程的復(fù)雜性和風(fēng)險(xiǎn)性,對(duì)AI技術(shù)的應(yīng)用還處于探索階段。
高速離心泵作為的明星產(chǎn)品之一,因具有流量小、揚(yáng)程高、結(jié)構(gòu)緊湊、轉(zhuǎn)速高、可靠性好等特點(diǎn),被廣泛應(yīng)用于石油化工領(lǐng)域。以高速泵為研究對(duì)象具備現(xiàn)實(shí)意義,其每年近300臺(tái)的出廠量也為研究提供了充分的數(shù)據(jù)支撐。本文旨在開發(fā)一種基于機(jī)器學(xué)習(xí)的泵密封腔壓力預(yù)測(cè)方法,以高速泵的密封腔壓力數(shù)據(jù)為載體,結(jié)合數(shù)據(jù)預(yù)處理、特征工程和模型優(yōu)化,形成一套完整的預(yù)測(cè)解決方案。本研究不僅在理論上驗(yàn)證了機(jī)器學(xué)習(xí)在工業(yè)參數(shù)預(yù)測(cè)中的可行性,還在實(shí)際應(yīng)用中展示了其顯著的優(yōu)勢(shì)。
1數(shù)據(jù)收集與預(yù)處理
1.1 系統(tǒng)流程圖
機(jī)器學(xué)習(xí)的主要要素包含數(shù)據(jù)、算法和訓(xùn)練優(yōu)化過程,通過對(duì)已知數(shù)據(jù)的智能學(xué)習(xí),獲得對(duì)未知數(shù)據(jù)決策的泛化能力是智能學(xué)習(xí)的關(guān)鍵。機(jī)器學(xué)習(xí)模型在學(xué)習(xí)數(shù)據(jù)的過程中,逐步由高誤差模型向低誤差模型迭代,這不僅依賴于算法本身,更是由梯度下降優(yōu)化器決定的,這種函數(shù)作用于真實(shí)值與預(yù)測(cè)值之間誤差的導(dǎo)數(shù),實(shí)現(xiàn)對(duì)算法參數(shù)的更新,進(jìn)而提高模型準(zhǔn)確度。本文針對(duì)密封腔壓力的研究,對(duì)關(guān)鍵步驟進(jìn)行流程設(shè)計(jì),如圖1所示。
1.2 數(shù)據(jù)收集
在任何基于人工智能的項(xiàng)目中,數(shù)據(jù)都是至關(guān)重要的,高質(zhì)量的數(shù)據(jù)是訓(xùn)練高性能模型的基礎(chǔ)。為確保預(yù)測(cè)模型的有效性和穩(wěn)定性,數(shù)據(jù)庫包含了115組泵的實(shí)驗(yàn)數(shù)據(jù),每組數(shù)據(jù)的特征都具備獨(dú)特性,覆蓋了泵的設(shè)計(jì)參數(shù)、性能參數(shù)、操作環(huán)境和密封效果等多個(gè)維度,具體包括泵型號(hào)、轉(zhuǎn)速、入口壓力、誘導(dǎo)輪參數(shù)、平衡孔參數(shù)及密封方案等13個(gè)特征項(xiàng)。
為了確保數(shù)據(jù)的質(zhì)量,對(duì)收集到的數(shù)據(jù)進(jìn)行了清洗和處理。數(shù)據(jù)清洗包括缺失值處理、異常值檢測(cè)等步驟,確保數(shù)據(jù)的完整性,并對(duì)不同格式的數(shù)據(jù)進(jìn)行處理,使其具備Python程序可識(shí)別的數(shù)字、文本格式,統(tǒng)一數(shù)據(jù)的度量單位和表示方式,最終得到如表1所示形式的數(shù)據(jù)。
1.3 數(shù)據(jù)標(biāo)準(zhǔn)化
通過對(duì)收集數(shù)據(jù)的觀察,明確了數(shù)據(jù)形式多樣、數(shù)值量級(jí)不同的特點(diǎn)。機(jī)器學(xué)習(xí)對(duì)不同特征采取無差別學(xué)習(xí),為了進(jìn)一步消除特征間的量級(jí)差異,適配數(shù)學(xué)模型,對(duì)數(shù)據(jù)進(jìn)行了歸一化和標(biāo)準(zhǔn)化處理,將數(shù)值數(shù)據(jù)縮放到[0,1]區(qū)間內(nèi),均值為0,標(biāo)準(zhǔn)差為1。這些處理使得所有的特征數(shù)值范圍相近,從而提高了模型的訓(xùn)練效率,改善了梯度下降的優(yōu)化過程和預(yù)測(cè)性能。
2 數(shù)據(jù)的特征工程
2.1 特征提取
為了讓Python編程語言識(shí)別數(shù)據(jù)內(nèi)容,使得模型能夠更好地理解和利用這些數(shù)據(jù),所有特征需以數(shù)值的形式體現(xiàn),因此對(duì)高速泵的性能、結(jié)構(gòu)、運(yùn)行數(shù)據(jù)進(jìn)行了詳細(xì)的特征提取。
1)泵模型分解:例如,“GSB-L1-8/1303\"字段中的信息分解為型號(hào)L1、流量8和揚(yáng)程1303。
②誘導(dǎo)輪參數(shù)處理:汽蝕余量為高速泵設(shè)計(jì)中重要的性能指標(biāo),為了防止汽蝕發(fā)生,部分高速泵需配備誘導(dǎo)輪增強(qiáng)汽蝕性能,通過數(shù)據(jù)輸入,可以自動(dòng)識(shí)別是否需要配備誘導(dǎo)輪并獲取誘導(dǎo)輪信息,誘導(dǎo)輪特征提取函數(shù)如圖2所示。例如,“ ?30/?19 \"字段中的信息分解為誘導(dǎo)輪外徑30和輪轂尺寸19。
3)葉輪平衡孔參數(shù)提?。豪?,“ ?55×12×?8 ”字段中的多個(gè)數(shù)值分別表示平衡孔的位置、數(shù)量和尺寸。
2.2 特征編碼
除了特征提取外,一些字符類數(shù)據(jù)無法直接用數(shù)字表示,例如密封類型有串聯(lián)、單端面、雙端面多種文字描述。鑒于數(shù)據(jù)要參與數(shù)學(xué)模型的運(yùn)算,機(jī)器學(xué)習(xí)模型可能會(huì)錯(cuò)誤地認(rèn)為這些值之間存在某種大小或順序關(guān)系,進(jìn)而在模型中會(huì)引入錯(cuò)誤的假設(shè),因而此類無實(shí)際意義的數(shù)值無法直接用數(shù)字0,1,2,表達(dá)。
為了讓模型理解和處理分類特征,對(duì)這些特征進(jìn)行了One-Hot編碼處理,將其轉(zhuǎn)換為二進(jìn)制向量,以數(shù)組的形式擴(kuò)展這類特征的空間域。其數(shù)學(xué)表達(dá)如下:假設(shè)有一個(gè)分類變量 X ,其可能取值有 n 種: ,如果 X=xi, 那么One-Hot編碼后向量為[0,0,…,1,0] ,其中第i位是1,其余為0。
例如,密封形式中的串聯(lián)可表示為[1,0,0],單端面為 [0,1,0] ,雙端面為 [0,0,1] 。采用One-Hot編碼避免了序列性假設(shè),消除了對(duì)類別間的任何順序或大小關(guān)系的錯(cuò)誤假設(shè),也對(duì)不同機(jī)器學(xué)習(xí)模型具備極強(qiáng)的兼容性,拓展的特征空間也提升了模型準(zhǔn)確度上限。
3模型選擇與優(yōu)化
3.1 模型選擇
在選擇模型時(shí),首先對(duì)機(jī)器學(xué)習(xí)算法大類進(jìn)行劃分,預(yù)測(cè)密封腔壓力輸出為連續(xù)數(shù)值,而非離散數(shù)值,明確研究課題為回歸問題。另外,考慮了數(shù)據(jù)的特性、任務(wù)的復(fù)雜度和計(jì)算資源的限制,對(duì)于密封腔壓力的預(yù)測(cè),對(duì)不同理論下產(chǎn)生的算法模型利弊分析如下:
1)多層感知器(MLP):能夠處理非線性關(guān)系,并且適合高維特征的回歸問題,模型復(fù)雜度設(shè)置靈活,可解釋性好。
2線性回歸:適用于簡(jiǎn)單的線性關(guān)系預(yù)測(cè),但在處理復(fù)雜的非線性關(guān)系時(shí),性能受到限制。
3)決策樹和隨機(jī)森林:這些模型能夠處理復(fù)雜的特征交互,在高維數(shù)據(jù)中表現(xiàn)良好。但對(duì)數(shù)據(jù)量規(guī)模小、特征空間大的數(shù)據(jù)庫,可能會(huì)面臨過擬合的問題。
4支持向量機(jī)(SVM:SVM在處理高維空間的分類和回歸任務(wù)時(shí)表現(xiàn)出色,但對(duì)于數(shù)據(jù)集的計(jì)算開銷較大,且對(duì)于存在壞點(diǎn)、異常點(diǎn)的數(shù)據(jù)存在較大方差。
基于初步分析,最終選定MLP作為本次研究的主要模型。
3.2 模型訓(xùn)練與優(yōu)化
模型的訓(xùn)練過程包括數(shù)據(jù)分割、前向傳播、損失
計(jì)算和反向傳播等步驟,每一步驟的程序設(shè)計(jì)都影響著模型預(yù)測(cè)密封腔壓力學(xué)習(xí)的準(zhǔn)確度。
3.2.1 數(shù)據(jù)分割
鑒于數(shù)據(jù)庫體量適中,將數(shù)據(jù)集分為含數(shù)據(jù)量為 90% 的訓(xùn)練集和含數(shù)據(jù)量為 10% 的測(cè)試集,并進(jìn)一步在訓(xùn)練集中進(jìn)行交叉驗(yàn)證,排除極端訓(xùn)練的情況,評(píng)估模型的平均泛化能力。
3.2.2 前向傳播
MLP由無數(shù)個(gè)神經(jīng)元組成,在前向傳播過程中,輸入數(shù)據(jù)通過神經(jīng)元的層層傳遞,經(jīng)過一系列的加權(quán)和激活函數(shù)的處理,生成最終的輸出預(yù)測(cè)值。本次采用relu激活函數(shù),實(shí)現(xiàn)非線性計(jì)算。
3.2.3 損失計(jì)算
實(shí)驗(yàn)中使用均方誤差(MSE)作為損失函數(shù),計(jì)算模型預(yù)測(cè)值與真實(shí)值之間的差異,通過差值可以計(jì)算模型預(yù)測(cè)的準(zhǔn)確度,為后續(xù)模型優(yōu)化提供評(píng)判依據(jù)。損失函數(shù)的公式為:
式中: n 是樣本的數(shù)量; yi 是第i個(gè)樣本的真實(shí)值; 是模型對(duì)第i個(gè)樣本的預(yù)測(cè)值。
3.2.4 反向傳播
根據(jù)損失函數(shù)的值,計(jì)算模型參數(shù)的梯度,并使用梯度下降的優(yōu)化算法更新模型參數(shù),以最小化損失量。模型的反向傳播通過優(yōu)化器實(shí)現(xiàn),例如實(shí)驗(yàn)中采用的Adam優(yōu)化器,具備自適應(yīng)學(xué)習(xí)率、對(duì)導(dǎo)數(shù)的偏差糾正、訓(xùn)練過程穩(wěn)定、收斂速度快等特點(diǎn),可實(shí)現(xiàn)在迭代過程中逐漸優(yōu)化參數(shù)的作用,宏觀上體現(xiàn)為模型準(zhǔn)確度提高。
3.2.5 超參數(shù)優(yōu)化
通過網(wǎng)格搜索和交叉驗(yàn)證的方法實(shí)現(xiàn)了優(yōu)化模型的超參數(shù)調(diào)節(jié),包括學(xué)習(xí)率、批量大小、訓(xùn)練輪數(shù)等。通過遍歷不同的超參數(shù)組合,選擇出最佳配置,以提高模型的性能。
4模型評(píng)估與驗(yàn)證
4.1 交叉驗(yàn)證
為了更全面地評(píng)估模型的泛化能力,采用了交叉驗(yàn)證的方法。交叉驗(yàn)證將數(shù)據(jù)分為多個(gè)子集,進(jìn)行多次訓(xùn)練和評(píng)估,最終計(jì)算出模型的平均性能。這種方法有效減少了模型性能受數(shù)據(jù)分割方式影響的風(fēng)險(xiǎn),提高了評(píng)估的穩(wěn)定性。
4.2 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)對(duì)優(yōu)化器學(xué)習(xí)率(lr)、數(shù)據(jù)批次(batch_size)、訓(xùn)練輪數(shù)(epoch)這三個(gè)超參數(shù)采用控制變量法進(jìn)行了設(shè)置,得到18組不同配置的模型,實(shí)驗(yàn)參數(shù)如表2所示。
通過對(duì)比18組數(shù)據(jù)的MSE值可以得出誤差最小的參數(shù)組合,即最優(yōu)解。最優(yōu)解下的實(shí)驗(yàn)結(jié)果如圖3所示。
4.3 結(jié)果分析
通過實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),經(jīng)過100輪的模型迭代訓(xùn)練,損失量Loss總體呈下降趨勢(shì),由最初的0.0110下降到0.0012;MSE僅為0.0003,遠(yuǎn)低于類似應(yīng)用的經(jīng)驗(yàn)誤差值0.01,證明實(shí)驗(yàn)?zāi)P鸵丫邆淞己玫姆夯芰?,用于解決高速泵密封腔壓力預(yù)測(cè)問題時(shí)精度高。最優(yōu)解結(jié)果如表3所示。
進(jìn)一步分析各超參數(shù)對(duì)預(yù)測(cè)密封腔壓力問題的影響:
1優(yōu)化器學(xué)習(xí)率lr為0.001雖然比較常見,但在本次實(shí)驗(yàn)中效果不如0.0005,表明較低的學(xué)習(xí)率在高速泵密封腔壓力的數(shù)據(jù)集上能更好地優(yōu)化模型,避免過大的梯度更新導(dǎo)致的訓(xùn)練不穩(wěn)定。
2)當(dāng)訓(xùn)練輪數(shù)epoch過低時(shí),模型訓(xùn)練不充分,無法捕捉到數(shù)據(jù)中的復(fù)雜模式,導(dǎo)致預(yù)測(cè)性能不佳;隨著epoch的增加,為100時(shí)訓(xùn)練效果有顯著提高;當(dāng)epoch為200時(shí),模型過度擬合訓(xùn)練數(shù)據(jù),反而降低了對(duì)測(cè)試集的泛化能力。
3)較大的批量大小batchsize可以加快模型訓(xùn)練的收斂速度,但由于本次研究數(shù)據(jù)體量有限,當(dāng)批量大小為12時(shí),誤差反而增加,因此8是更加合適的批量大小,兼顧了訓(xùn)練的穩(wěn)定性和收斂速度。
研究中以MSE為模型誤差的標(biāo)準(zhǔn),為了更直觀地識(shí)別密封腔壓力預(yù)測(cè)的準(zhǔn)確度,特列舉12項(xiàng)測(cè)試數(shù)據(jù)的預(yù)測(cè)值與真實(shí)值如表4所示。
通過計(jì)算誤差,發(fā)現(xiàn)大多數(shù)誤差范圍都在 4% 以內(nèi),表明用機(jī)器學(xué)習(xí)的方法不僅可以預(yù)測(cè)泵密封腔壓力,預(yù)測(cè)精度也很高,完全具備了工程應(yīng)用的條件。
5 結(jié)論與展望
5.1 結(jié)論
1本文提出了一種應(yīng)用機(jī)器學(xué)習(xí)的高速泵密封腔壓力預(yù)測(cè)方法,通過全流程的研究,系統(tǒng)地開展特征工程和超參數(shù)調(diào)優(yōu),形成了基于人工智能的新解決方案。
2)探索了針對(duì)密封腔壓力預(yù)測(cè)問題的數(shù)據(jù)特征空間及參數(shù)優(yōu)化方向,優(yōu)化后的MLP模型在測(cè)試集上的均方誤差MSE僅為0.0003,表明了該方法在實(shí)際工程應(yīng)用中的高精度和可靠性。
3傳統(tǒng)的泵密封腔壓力預(yù)測(cè)主要依賴于實(shí)際運(yùn)轉(zhuǎn)實(shí)驗(yàn),過程煩瑣且成本高昂。該模型的成功證明了機(jī)器學(xué)習(xí)在處理復(fù)雜非線性關(guān)系方面的強(qiáng)大能力,為實(shí)驗(yàn)方法的更新提供了新思路,研究結(jié)果也對(duì)石油化工領(lǐng)域的設(shè)備維護(hù)和操作優(yōu)化具有重要意義。
5.2 展望
盡管本研究的模型已展現(xiàn)出較高的精度和可靠性,但其未來仍有提升空間,包括對(duì)數(shù)據(jù)集規(guī)模和多樣性的補(bǔ)充,對(duì)特征選擇的研究;對(duì)模型架構(gòu)的探索和改進(jìn)提升;還有基于物理引導(dǎo)的機(jī)器學(xué)習(xí)技術(shù)。因此,將工程設(shè)計(jì)與人工智能結(jié)合,是值得挖掘的一個(gè)提高設(shè)計(jì)水平的方向。
[參考文獻(xiàn)]
[1]NG K B,DIAKOW S J.Pumps-Shaft Sealing Systems for Centrifugal and Rotary Pumps:API STD 682[S]. American Petroleum Institute,2014.
[2] GEIGER P,F(xiàn)IEDLER H.Numerical Simulationand Experimental Validation of Mechanical Seals[J]. Tribology International,2017(115):1-10.
[3]KHONSARI A,BOOSER E.Advances in Mechanical Seals Design and Operation[J].Springer,2019.
收稿日期:2025-05-14
作者簡(jiǎn)介:何慕 (1998-) ,男,北京人,哥倫比亞大學(xué)理學(xué)碩士,助理工程師,研究方向:流體與旋轉(zhuǎn)機(jī)械研發(fā)設(shè)計(jì)、自動(dòng)化機(jī)電技術(shù)、人工智能技術(shù)。
通信作者:陳乃鏑(1995一),女,遼寧大連人,中國運(yùn)載火箭技術(shù)研究院工學(xué)碩士,工程師,研究方向:流體與旋轉(zhuǎn)機(jī)械設(shè)計(jì)研發(fā)。