郗榮榮,趙 飛,李吉廣,侯煥娣,申海平
(中石化石油化工科學(xué)研究院有限公司,北京 100083)
全球常規(guī)原油資源日益枯竭,原油黏度、硫含量、金屬含量日益增高,呈現(xiàn)重質(zhì)化、劣質(zhì)化趨勢(shì)[1]。重質(zhì)油(特別是渣油)加工過(guò)程的清潔化和加工效率的高質(zhì)化成為煉油企業(yè)關(guān)注的焦點(diǎn)[2],也是煉油企業(yè)提高自身競(jìng)爭(zhēng)力的重要手段。漿態(tài)床渣油加氫工藝可以將重質(zhì)、劣質(zhì)渣油高效轉(zhuǎn)化為輕質(zhì)清潔燃料和化工原料,具有原料適應(yīng)性強(qiáng)、渣油轉(zhuǎn)化率高、輕油收率高等優(yōu)點(diǎn),成為現(xiàn)代煉化企業(yè)重要的重油加工技術(shù)之一。目前,浙江石油化工有限公司、中國(guó)石化茂名分公司等陸續(xù)建立了渣油漿態(tài)床加氫裝置。
多年來(lái),為了預(yù)測(cè)渣油加氫過(guò)程產(chǎn)物分布,研究人員開發(fā)了機(jī)理模型、數(shù)據(jù)驅(qū)動(dòng)模型等反應(yīng)模型。目前,渣油加氫的機(jī)理模型研究已經(jīng)趨于成熟。曹彥鍇[3]基于對(duì)渣油加氫催化劑加氫性能和失活規(guī)律的分析,提出了渣油加氫催化劑失活動(dòng)力學(xué)模型、加氫精制反應(yīng)動(dòng)力學(xué)模型和加氫裂化反應(yīng)動(dòng)力學(xué)模型。葛海龍等[4]利用兩集總一級(jí)反應(yīng)動(dòng)力學(xué)模型模擬了渣油加氫脫金屬的反應(yīng)過(guò)程,發(fā)現(xiàn)加氫產(chǎn)物脫鎳率、脫釩率的計(jì)算值與實(shí)際值的平均相對(duì)誤差分別為2.65%和2.61%。劉傳文等[5]針對(duì)鐵系催化劑作用下的孤島渣油加氫裂化體系,建立了氣體、餾分油、減壓渣油四組分(飽和分、芳香分、膠質(zhì)、瀝青質(zhì))和苯不溶物(焦)的七集總動(dòng)力學(xué)模型,模型預(yù)測(cè)結(jié)果與試驗(yàn)數(shù)據(jù)吻合性好。張萍萍等[6]針對(duì)克拉瑪依常壓渣油漿態(tài)床加氫裂化過(guò)程建立了六集總動(dòng)力學(xué)模型,該模型預(yù)測(cè)產(chǎn)物收率的誤差在5% 以內(nèi)。
渣油漿態(tài)床加氫是一個(gè)復(fù)雜的化學(xué)反應(yīng)過(guò)程,涉及的變量多且耦合度高。渣油加氫是復(fù)雜的混合物反應(yīng)體系,在復(fù)雜模型的構(gòu)建過(guò)程中常常進(jìn)行簡(jiǎn)化并設(shè)定假設(shè)條件,導(dǎo)致模型出現(xiàn)構(gòu)建難度大、計(jì)算量大、收斂速度小、預(yù)測(cè)精度低等問(wèn)題。因此,采用機(jī)理模型難以實(shí)現(xiàn)過(guò)程的精確模擬,研究人員利用計(jì)算機(jī)深度智能學(xué)習(xí)技術(shù),建立數(shù)據(jù)驅(qū)動(dòng)模型對(duì)渣油漿態(tài)床加氫過(guò)程進(jìn)行模擬研究。
神經(jīng)網(wǎng)絡(luò)模型具有強(qiáng)大的自適應(yīng)、自組織、自學(xué)習(xí)和非線性擬合能力,在復(fù)雜工業(yè)過(guò)程中得到了廣泛應(yīng)用。田水苗等[7]利用反向傳播(BP)神經(jīng)網(wǎng)絡(luò)建立了用于預(yù)測(cè)蠟油加氫產(chǎn)品的數(shù)據(jù)驅(qū)動(dòng)模型,其對(duì)產(chǎn)物分布及硫、氮含量的預(yù)測(cè)具有較高精度。Ma等[8]針對(duì)中國(guó)石化茂名分公司的渣油加氫反應(yīng)過(guò)程建立了BP神經(jīng)網(wǎng)絡(luò)模型,其對(duì)產(chǎn)物中金屬、S、N、殘?zhí)康念A(yù)測(cè)平均相對(duì)誤差在6%以內(nèi)。卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型主要應(yīng)用在石油勘探開發(fā)[9-13]、故障識(shí)別[14-15]、產(chǎn)量預(yù)測(cè)[16]、污染物排放預(yù)測(cè)[17]等方面。孫國(guó)慶[18]以加氫裂化裝置新氫流量為目標(biāo)變量,以LeNet為基準(zhǔn),建立了CNN模型,并對(duì)其進(jìn)行深層重構(gòu)訓(xùn)練。相較于普通CNN模型,該深層CNN模型預(yù)測(cè)更準(zhǔn)確,其均方誤差降低了9.11%。為了模擬工業(yè)加氫裂化過(guò)程,Song Wenjiang[19]基于自組織圖和卷積神經(jīng)網(wǎng)絡(luò)開發(fā)了一種深度學(xué)習(xí)框架SOM,將輸入變量映射為二維數(shù)據(jù)以提取數(shù)據(jù)特征,進(jìn)而進(jìn)行CNN模型訓(xùn)練。結(jié)果表明,SOM-CNN模型具有更好的擬合能力和外推能力。
為了進(jìn)一步推動(dòng)渣油漿態(tài)床加氫過(guò)程的數(shù)據(jù)化、智能化,本課題利用實(shí)驗(yàn)室小試數(shù)據(jù),基于不同神經(jīng)網(wǎng)絡(luò)建立渣油漿態(tài)床加氫產(chǎn)物分布和氫耗預(yù)測(cè)模型;鑒于試驗(yàn)數(shù)據(jù)量較少且數(shù)據(jù)不平衡,采用關(guān)聯(lián)式模型的方法進(jìn)行數(shù)據(jù)擴(kuò)充,以降低模型預(yù)測(cè)誤差;利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)模型,進(jìn)一步提高預(yù)測(cè)精度,以期為渣油漿態(tài)床加氫裝置操作優(yōu)化及原料拓展提供支持。
試驗(yàn)數(shù)據(jù)來(lái)源于中石化石油化工科學(xué)研究院有限公司(簡(jiǎn)稱石科院)渣油漿態(tài)床加氫課題組小試數(shù)據(jù)。根據(jù)渣油漿態(tài)床加氫工藝,采集數(shù)據(jù)包括輸入變量數(shù)據(jù)和輸出變量數(shù)據(jù)。輸入變量主要包括6種原料油(減渣VR-1、減渣VR-2、減渣VR-3、減渣VR-4、減渣VR-5、減渣VR-6)性質(zhì)和操作變量(催化劑用量或濃度、工藝參數(shù)),輸出變量包括裂化氣、汽油、柴油、蠟油、殘?jiān)⒉蝗芪锏氖章屎图託溥^(guò)程氫耗。其中,加氫過(guò)程氫耗是指單位質(zhì)量新鮮進(jìn)料的氫氣消耗量。
數(shù)據(jù)樣本可能存在文本數(shù)據(jù)、空值、無(wú)關(guān)數(shù)據(jù)等,需要進(jìn)行數(shù)據(jù)預(yù)處理:①刪除文本數(shù)據(jù)(如分析方法、原料名稱、添加劑名稱等);②刪除全部為空值和殘缺項(xiàng)目較多的數(shù)據(jù)樣本;③刪除無(wú)關(guān)變量(如模擬餾程與輸出目標(biāo)無(wú)關(guān));④對(duì)殘缺項(xiàng)目較少的數(shù)據(jù)樣本進(jìn)行填充處理。
填充數(shù)據(jù)的方法主要有Linear插補(bǔ)、Quadratic插補(bǔ)、Spline插補(bǔ)、Akima插補(bǔ)、最鄰近插補(bǔ)、均值/中值/眾數(shù)填充、前向/后向填充等。分析渣油漿態(tài)床加氫小試數(shù)據(jù)可知,不同樣本數(shù)據(jù)之間的差距較大且數(shù)據(jù)之間不存在特別聯(lián)系。因此,綜合不同填充方法優(yōu)缺點(diǎn)和原始數(shù)據(jù)特點(diǎn),確定采取“最鄰近插補(bǔ)”法進(jìn)行數(shù)據(jù)填充。
結(jié)合實(shí)際生產(chǎn)工藝要求,采用Min-Max法剔除不符合要求的樣本數(shù)據(jù),根據(jù)箱線圖法尋找樣本數(shù)據(jù)的異常值并利用最鄰近插值法對(duì)數(shù)據(jù)進(jìn)行插補(bǔ)處理。預(yù)處理后的原料油性質(zhì)、操作變量數(shù)據(jù)和輸出變量數(shù)據(jù)分別見(jiàn)表1~表3。
表1 預(yù)處理后的6種原料油性質(zhì)
表2 預(yù)處理后的操作變量數(shù)據(jù)
續(xù)表
由于不同變量的量綱不同,無(wú)法直接進(jìn)行分析比較,因而采用式(1)對(duì)不同變量數(shù)據(jù)進(jìn)行歸一化處理,得到0~1無(wú)量綱數(shù)據(jù)。
(1)
式中:Xmax是樣本數(shù)據(jù)的最大值;Xmin為最小值。
輸入變量的線性相關(guān)性直接影響模型的訓(xùn)練效果,需保證輸入變量間弱相關(guān)或不相關(guān)、而輸入變量與輸出變量(目標(biāo)變量)顯著相關(guān)。因此,采用Pearson相關(guān)系數(shù)法對(duì)輸入變量進(jìn)行特征選擇,不同輸入變量間的線性相關(guān)系數(shù)(r)由式(2)計(jì)算。
(2)
表4 變量相關(guān)關(guān)系與相關(guān)系數(shù)大小間的對(duì)應(yīng)性
r取值區(qū)間為-1~1,r為-1,1,0分別表示完全負(fù)相關(guān)、完全正相關(guān)、不相關(guān);|r|越接近于1,則表明變量間的相關(guān)性越強(qiáng)。已知原始樣本為22組數(shù)據(jù),因此相關(guān)性分析結(jié)果來(lái)自于少量樣本,結(jié)果可能存在偶然性。為了確定分析結(jié)果的可靠性程度,需要對(duì)相關(guān)結(jié)果r進(jìn)行顯著性檢驗(yàn)。顯著性檢驗(yàn)水平(p)一般為0.05,表示顯著性檢驗(yàn)結(jié)論錯(cuò)誤率必須低于5%。若p<0.05,則表示分析結(jié)果具有可靠性;若p>0.05,則表示結(jié)果沒(méi)有統(tǒng)計(jì)學(xué)意義,可能是偶然因素導(dǎo)致的。
輸入變量與目標(biāo)變量的相關(guān)系數(shù)如表5所示。由表5可知,部分原料油性質(zhì)變量(包括Fe含量、Ni含量、V含量、H含量、N含量、密度、殘?zhí)?、瀝青質(zhì)含量、膠質(zhì)含量、飽和分含量)和操作參數(shù)變量(包括反應(yīng)時(shí)間、氫初壓、原料油質(zhì)量、催化劑質(zhì)量、助劑質(zhì)量)與目標(biāo)變量之間的相關(guān)系數(shù)均大于0.4,說(shuō)明其與目標(biāo)變量間存在顯著線性相關(guān)關(guān)系,顯著性檢驗(yàn)p<0.05表示分析結(jié)果r能夠通過(guò)95%的顯著性檢驗(yàn),分析結(jié)果是可靠的。
進(jìn)一步采用Pearson相關(guān)系數(shù)法分析原料油性質(zhì)變量之間的相關(guān)關(guān)系,結(jié)果如圖1所示。由圖1可知,原料油殘?zhí)颗c元素Ca,Fe,Ni,V質(zhì)量分?jǐn)?shù)之間高度線性相關(guān),因而需排除Ca,Fe,Ni,V質(zhì)量分?jǐn)?shù)4個(gè)變量,但根據(jù)工業(yè)生產(chǎn)實(shí)際情況,Ni質(zhì)量分?jǐn)?shù)、V質(zhì)量分?jǐn)?shù)對(duì)渣油加氫結(jié)果影響很大,需要保留并進(jìn)行調(diào)控。因此,共保留密度、殘?zhí)亢虲、H、S、N、Ni、V、瀝青質(zhì)、膠質(zhì)、芳香分、飽和分的質(zhì)量分?jǐn)?shù)共12個(gè)原料油性質(zhì)作為輸入變量。
表5 輸入變量與目標(biāo)變量的Pearson相關(guān)系數(shù)和顯著性檢驗(yàn)
圖1 原料性質(zhì)變量間的相關(guān)關(guān)系
操作變量間的Pearson相關(guān)系數(shù)如圖2所示。由圖2可知,原料油質(zhì)量與助劑質(zhì)量間的|r|為0.73,因而去除原料油質(zhì)量而保留助劑質(zhì)量。因此,操作變量保留5個(gè):反應(yīng)溫度、反應(yīng)時(shí)間、氫初壓、助劑質(zhì)量、催化劑濃度。
綜上,基于變量間Pearson相關(guān)關(guān)系、漿態(tài)床技術(shù)特點(diǎn)、實(shí)際工業(yè)操作經(jīng)驗(yàn),確定了漿態(tài)床渣油加氫過(guò)程模擬模型包括17個(gè)輸入變量(12個(gè)原料性質(zhì)變量和5個(gè)操作變量)和7個(gè)目標(biāo)變量(6種產(chǎn)物收率和氫耗)。
基于BP神經(jīng)網(wǎng)絡(luò),構(gòu)建了渣油加氫模型的3層神經(jīng)網(wǎng)絡(luò)模型,其結(jié)構(gòu)如圖3所示。
模型的輸入層變量數(shù)為17,輸出層目標(biāo)數(shù)為7,隱含層神經(jīng)元數(shù)由式(3)確定[20]。
(3)
其中:H為隱含層神經(jīng)元數(shù);m、n分別為輸入層和輸出層變量數(shù);L為1~10。
常見(jiàn)的模型性能評(píng)價(jià)指標(biāo)主要包括:MSE、平均相對(duì)百分比誤差(MRPE)和R2。
MSE為真實(shí)值與預(yù)測(cè)值間誤差的平方和,評(píng)價(jià)預(yù)測(cè)數(shù)據(jù)變化幅度。其計(jì)算式見(jiàn)式(4)。
(4)
MRPE為真實(shí)值與預(yù)測(cè)值的絕對(duì)百分比誤差相對(duì)于樣本真實(shí)值的平均偏離程度,其值越小表示模型的預(yù)測(cè)性能越好。MRPE計(jì)算式見(jiàn)式(5)~式(6)。
(5)
(6)
R2表征模型對(duì)于數(shù)據(jù)的擬合程度,其值越接近于1,擬合效果越好。R2計(jì)算式見(jiàn)式(7)。
(7)
為了保障數(shù)據(jù)樣本的平衡性,在每種原料對(duì)應(yīng)的數(shù)據(jù)樣本中各取一組作為測(cè)試集,其余數(shù)據(jù)為訓(xùn)練集。因此測(cè)試集數(shù)據(jù)共6組,訓(xùn)練集數(shù)據(jù)共16組,測(cè)試集數(shù)據(jù)完全不參與模型的構(gòu)建和訓(xùn)練。當(dāng)原始數(shù)據(jù)樣本有限時(shí),模型容易過(guò)擬合,即模型對(duì)訓(xùn)練集數(shù)據(jù)的預(yù)測(cè)誤差很小,但在測(cè)試集上的預(yù)測(cè)誤差較大。為了避免上述問(wèn)題,引入K折驗(yàn)證法(一般取3~10折),即在訓(xùn)練集中分出一部分作為驗(yàn)證集數(shù)據(jù),用于評(píng)估模型的訓(xùn)練效果并確定模型相關(guān)參數(shù)。本實(shí)驗(yàn)選取K=10,即將訓(xùn)練集數(shù)據(jù)任意劃分為10份,其中以9組為訓(xùn)練,剩余1組數(shù)據(jù)用于驗(yàn)證,循環(huán)10次,以最終的平均評(píng)價(jià)指標(biāo)作為最終結(jié)果。
由式(3)計(jì)算得知,模型隱含層神經(jīng)元數(shù)在6~15之間?;诓煌[含層神經(jīng)元數(shù),進(jìn)行模型構(gòu)建和訓(xùn)練,通過(guò)比較驗(yàn)證集數(shù)據(jù)的均方誤差,找到最佳隱含層神經(jīng)元數(shù),結(jié)果如圖4所示。由圖4可知,當(dāng)隱含層神經(jīng)元個(gè)數(shù)為14時(shí),模型均方誤差(MSE)最小。因此,隱含層神經(jīng)元數(shù)優(yōu)選為14,所建BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)為17-14-7。
圖4 隱含層神經(jīng)元個(gè)數(shù)與模型預(yù)測(cè)均方誤差間的關(guān)系
利用測(cè)試集樣本數(shù)據(jù)進(jìn)行測(cè)試,結(jié)果表明:目標(biāo)變量(裂化氣、汽油、柴油、蠟油、殘?jiān)⒉蝗芪锏氖章始皻浜?的預(yù)測(cè)值與試驗(yàn)值間的MRPE分別為32%,30%,37%,15%,51%,66%,37%。模型預(yù)測(cè)誤差大的原因主要在于原始樣本數(shù)據(jù)不平衡,由模型構(gòu)建的基礎(chǔ)數(shù)據(jù)(表1)可知,采用的試驗(yàn)數(shù)據(jù)原料油包括減渣VR-1、減渣VR-2、減渣VR-3、減渣VR-4、減渣VR-5、減渣VR-6共6種原料,其中減渣VR-5對(duì)應(yīng)12組數(shù)據(jù)樣本,其余原料只各自對(duì)應(yīng)2組數(shù)據(jù)樣本。
針對(duì)數(shù)據(jù)樣本量少、數(shù)據(jù)不平衡的問(wèn)題,利用關(guān)聯(lián)式模型實(shí)現(xiàn)數(shù)據(jù)擴(kuò)增。其中關(guān)聯(lián)式模型法是指基于原始樣本數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)構(gòu)建關(guān)聯(lián)式模型,實(shí)現(xiàn)輸入端和輸出端數(shù)據(jù)非線性關(guān)系的構(gòu)建,而后在原始輸入數(shù)據(jù)的基礎(chǔ)上添加一個(gè)隨機(jī)擾動(dòng)并利用之前構(gòu)建的模型進(jìn)行預(yù)測(cè)得到對(duì)應(yīng)輸出,至此便獲得多個(gè)新的數(shù)據(jù)樣本?;陉P(guān)聯(lián)式模型的數(shù)據(jù)擴(kuò)充法,將原始樣本的22組數(shù)據(jù)擴(kuò)增至242組。將其分為訓(xùn)練集、測(cè)試集和驗(yàn)證集,其中訓(xùn)練集數(shù)據(jù)樣本為196組,測(cè)試集數(shù)據(jù)樣本為25組,驗(yàn)證集數(shù)據(jù)樣本為21組?;跀?shù)據(jù)擴(kuò)充后的訓(xùn)練集和驗(yàn)證集數(shù)據(jù)樣本,對(duì)包含不同隱含層神經(jīng)元數(shù)的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練對(duì)比,結(jié)果如圖5所示。
圖5 數(shù)據(jù)擴(kuò)充后隱含層神經(jīng)元個(gè)數(shù)與模型預(yù)測(cè)均方誤差間的關(guān)系
由圖5可知,當(dāng)節(jié)點(diǎn)數(shù)目為15,訓(xùn)練集的訓(xùn)練均方誤差MSE最小,為0.035%;此時(shí),驗(yàn)證集數(shù)據(jù)擬合優(yōu)度(R2)最高,為0.99。因此將BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)優(yōu)化為17-15-7。鑒于該模型在訓(xùn)練集和驗(yàn)證集數(shù)據(jù)樣本上表現(xiàn)良好,后續(xù)將利用測(cè)試集數(shù)據(jù)進(jìn)行模型測(cè)試。
數(shù)據(jù)擴(kuò)充后,改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型對(duì)測(cè)試集數(shù)據(jù)樣本的預(yù)測(cè)效果如表6所示。由表6可知,相較于17-14-7結(jié)構(gòu)的原BP模型,改進(jìn)后17-15-7結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)裂化氣、汽油、柴油、蠟油、殘?jiān)⒉蝗芪锏氖章始皻浜牡南鄬?duì)誤差分別降低了93.2%,78.1%,97.4%,88.9%,91.4%,93.8%,93.8%,MRPE均值從38.28%降至3.15%,模型預(yù)測(cè)值與試驗(yàn)值間的最大MRPE降為6.57%。這意味著利用關(guān)聯(lián)式模型實(shí)現(xiàn)數(shù)據(jù)擴(kuò)充具有可行性,數(shù)據(jù)擴(kuò)充對(duì)提高模型精度具有較好作用,同時(shí)也說(shuō)明擴(kuò)充數(shù)據(jù)具有良好的代表性。
表6 數(shù)據(jù)擴(kuò)充后改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果
數(shù)據(jù)擴(kuò)充后,改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)誤差仍較大;而且隨著模型參數(shù)增多,模擬計(jì)算量大幅增加,模型易出現(xiàn)訓(xùn)練效率低和過(guò)擬合現(xiàn)象。因此,為了進(jìn)一步提高預(yù)測(cè)精度,需要嘗試和探索構(gòu)建其他神經(jīng)網(wǎng)絡(luò)模型。卷積神經(jīng)網(wǎng)絡(luò)[21](CNN)能夠充分挖掘數(shù)據(jù)的空間相關(guān)性,通過(guò)局部感知區(qū)域提取相關(guān)特征,具有局部連接、權(quán)重共享等結(jié)構(gòu)特性,可使模型參數(shù)減少、計(jì)算效率和預(yù)測(cè)精度提高。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖6所示,可見(jiàn)其由卷積層、匯聚層、全連接層交叉堆疊而成。
圖6 卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
xwyxw
y=w*x
(8)
圖7 一維卷積層示意
匯聚層旨在通過(guò)特征選擇來(lái)減少特征數(shù)量,從而減少參數(shù)量。最大匯聚是指以區(qū)域內(nèi)所有神經(jīng)元的最大活性值作為該區(qū)域的值,如圖8所示。
圖8 匯聚層中最大匯聚過(guò)程示意
卷積神經(jīng)網(wǎng)絡(luò)中的卷積層可以提取輸入數(shù)據(jù)的相關(guān)特征,減少參數(shù)數(shù)目;匯聚層可以對(duì)特征向量進(jìn)行壓縮,增強(qiáng)了抗畸變性能。因此,卷積神經(jīng)網(wǎng)絡(luò)具有更高的計(jì)算效率。
構(gòu)建CNN模型也采取3層結(jié)構(gòu)設(shè)計(jì),其中輸入和輸出變量確定不變,匯聚層為最大匯聚,因而待定參數(shù)僅有卷積單元濾波器個(gè)數(shù)和卷積核尺寸。其中,濾波器數(shù)量通常為2的冪次,其數(shù)目越多則神經(jīng)網(wǎng)絡(luò)越強(qiáng)大,但參數(shù)數(shù)目過(guò)多易導(dǎo)致過(guò)擬合;卷積核尺寸是指卷積矩陣大小,通常一維卷積可用一個(gè)整數(shù)來(lái)表示。設(shè)定濾波器數(shù)量為4,8,16,32,64,卷積核尺寸為2,3,4,5,6,7?;跀U(kuò)充后的數(shù)據(jù)集,對(duì)新建CNN模型進(jìn)行訓(xùn)練,考察模型模擬的MSE和R2。當(dāng)驗(yàn)證集MSE不再降低時(shí),停止訓(xùn)練。訓(xùn)練結(jié)果見(jiàn)圖9和圖10。由圖9和圖10可知,所建CNN模型卷積單元的濾波器數(shù)為64,卷積核尺寸為6。
圖9 不同濾波器數(shù)量對(duì)應(yīng)的CNN模型訓(xùn)練誤差
圖10 不同卷積核尺寸對(duì)應(yīng)的CNN模型訓(xùn)練誤差
利用CNN模型對(duì)測(cè)試集數(shù)據(jù)樣本進(jìn)行預(yù)測(cè),結(jié)果如表7所示。結(jié)合表6與表7可知,CNN模型的預(yù)測(cè)性能較改進(jìn)后的BP模型有了顯著提高,其預(yù)測(cè)相對(duì)誤差均值較BP模型降低了21.58%。
表7 CNN模型的預(yù)測(cè)效果
雖然CNN模型的預(yù)測(cè)性能較改進(jìn)后的BP模型有了顯著提高,但其預(yù)測(cè)精度仍有待進(jìn)一步提升。遺傳算法(GA)是受自然界“優(yōu)勝劣汰,適者生存”進(jìn)化原理的啟發(fā)而開發(fā)的一種隨機(jī)搜索優(yōu)化方法,其可以擴(kuò)大尋找最優(yōu)解的搜索范圍。神經(jīng)網(wǎng)絡(luò)模型初始值的設(shè)定具有隨機(jī)性,若將遺傳算法與神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,利用遺傳算法的訓(xùn)練結(jié)果作為神經(jīng)網(wǎng)絡(luò)模型的初始權(quán)重和閾值,優(yōu)化神經(jīng)網(wǎng)絡(luò)模型的初始參數(shù),可以有效改善神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精準(zhǔn)度和穩(wěn)定性。
設(shè)定GA迭代次數(shù)為500,種群數(shù)為100,交叉概率為0.8,變異概率為0.1。采用GA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型和CNN神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果如表8所示。由表8可知:經(jīng)GA優(yōu)化后,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)值與試驗(yàn)值的MRPE均小于5%,比優(yōu)化前降低40.32%;經(jīng)GA優(yōu)化后,CNN模型預(yù)測(cè)值與試驗(yàn)值的MRPE均小于2%,比優(yōu)化前降低47.77%。
表8 遺傳算法優(yōu)化模型的測(cè)試結(jié)果
(1)基于實(shí)驗(yàn)室22組小試數(shù)據(jù),開展?jié){態(tài)床渣油加氫工藝變量的相關(guān)性分析。參考實(shí)際生產(chǎn)經(jīng)驗(yàn),采用Pearson相關(guān)系數(shù)法確定了工藝模型建立的17個(gè)輸入變量(包括12個(gè)原料性質(zhì)變量和5個(gè)操作變量)和7個(gè)輸出變量。進(jìn)而建立了17-14-7結(jié)構(gòu)的漿態(tài)床渣油加氫BP神經(jīng)網(wǎng)絡(luò)模型,并對(duì)其預(yù)測(cè)精度進(jìn)行了評(píng)價(jià),結(jié)果顯示該模型預(yù)測(cè)值與試驗(yàn)值間的平均相對(duì)誤差均較大(>20%)。
(2)針對(duì)數(shù)據(jù)樣本少、數(shù)據(jù)不平衡導(dǎo)致模型預(yù)測(cè)偏差大的問(wèn)題,采用關(guān)聯(lián)式模型方法進(jìn)行數(shù)據(jù)擴(kuò)充,將數(shù)據(jù)樣本由22組擴(kuò)充至242組?;跀U(kuò)充的數(shù)據(jù)樣本,建立了17-15-7結(jié)構(gòu)的漿態(tài)床渣油加氫BP神經(jīng)網(wǎng)絡(luò)模型,結(jié)果表明,數(shù)據(jù)擴(kuò)充后所建BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)準(zhǔn)確性顯著提高,預(yù)測(cè)值與試驗(yàn)值間的最大平均相對(duì)誤差降為6.57%。
(3)為了進(jìn)一步提高預(yù)測(cè)精度,基于擴(kuò)充后的數(shù)據(jù)建立了CNN模型,其預(yù)測(cè)值與試驗(yàn)值間的最大平均相對(duì)誤差降為5.38%。
(4)為了進(jìn)一步提高所建模型的預(yù)測(cè)精度,采用遺傳算法進(jìn)一步優(yōu)化神經(jīng)網(wǎng)絡(luò)模型,結(jié)果顯示,采用GA優(yōu)化后BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)值與試驗(yàn)值平均相對(duì)誤差均小于5%,CNN模型預(yù)測(cè)值與試驗(yàn)值平均相對(duì)誤差均小于2%。