曹勝昌,邢蘭昌,魏 偉2,韓維峰2,牛佳樂
(1.中國石油大學(xué)(華東)控制科學(xué)與工程學(xué)院,山東 青島 266580)(2.中國石油勘探開發(fā)研究院新能源研究所,河北 廊坊 065007)
天然氣水合物又稱為“可燃冰”,是一種新型優(yōu)質(zhì)的潛在能源,是在低溫、高壓等條件下形成的一種類冰狀、具有籠形結(jié)構(gòu)的固態(tài)化合物[1-2],通常分布在大陸永久凍土帶和海洋沉積物中,具有非常巨大的能源和經(jīng)濟(jì)價(jià)值[3-4]。天然氣水合物飽和度是水合物儲(chǔ)層評(píng)價(jià)的主要參數(shù)之一,為認(rèn)識(shí)水合物富集成藏規(guī)律、估算水合物資源量提供了必要的基礎(chǔ)參數(shù)[5-7]。
水合物飽和度是含水合物沉積物電學(xué)特性的直接影響因素之一。周錫唐等[8]研究了甲烷水合物生成與分解過程中電導(dǎo)性的變化,實(shí)驗(yàn)結(jié)果表明電阻隨石英砂中水合物生成量的增加而增大,隨水合物的分解而急速減小,通過參考溫度和壓力的同步變化特征證明了使用電導(dǎo)性來監(jiān)測甲烷水合物生成與分解過程的可靠性。陳玉鳳等[9-10]研究了南海沉積物中甲烷水合物飽和度與電阻率的關(guān)系,發(fā)現(xiàn)在水合物生成過程中,其電阻率會(huì)隨著水合物飽和度的增加而增大,而且含水合物沉積物存在非阿爾奇現(xiàn)象,其飽和度指數(shù)隨水合物飽和度的增加而增加。
基于電學(xué)特性參數(shù)計(jì)算含水合物飽和度的模型主要有阿爾奇公式、含泥質(zhì)修正的阿爾奇公式、印度尼西亞公式和雙水模型等,其中阿爾奇公式和含泥質(zhì)修正的阿爾奇公式被廣泛應(yīng)用[11-13]。Riedel等[14]通過分析不同地區(qū)的測井?dāng)?shù)據(jù),得到了不同的阿爾奇公式經(jīng)驗(yàn)參數(shù)并估算了水合物的飽和度,指出不同地區(qū)阿爾奇公式經(jīng)驗(yàn)參數(shù)的差異會(huì)導(dǎo)致水合物飽和度預(yù)測結(jié)果的不同。Spangenberg等[15-17]首先從理論上研究了水合物含量對(duì)體系電阻率性質(zhì)的影響,之后采用溶解氣在均勻玻璃珠內(nèi)開展了甲烷水合物生成實(shí)驗(yàn),測量結(jié)果顯示電阻率增大系數(shù)與含水飽和度之間的關(guān)系不能用恒定飽和度指數(shù)的阿爾奇公式來描述。含水合物沉積物的電學(xué)性質(zhì)受到沉積物孔隙結(jié)構(gòu)、孔隙水化學(xué)成分及濃度、孔隙度、飽和度、溫度等多種因素的影響,水合物飽和度與電學(xué)性質(zhì)參數(shù)呈現(xiàn)出顯著的復(fù)雜非線性、多值對(duì)應(yīng)關(guān)系,以阿爾奇公式為代表的經(jīng)驗(yàn)公式的適用性受到極大局限。
神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的處理復(fù)雜非線性問題的能力以及高度自學(xué)習(xí)和自適應(yīng)的能力,運(yùn)用神經(jīng)網(wǎng)絡(luò)來建立預(yù)測模型成為一種有潛力的水合物飽和度計(jì)算方法。呂琳[18]等人在使用地球物理測井?dāng)?shù)據(jù)預(yù)測儲(chǔ)量參數(shù)方法的基礎(chǔ)上,選用中子測井、密度測井等8種測井?dāng)?shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入量,預(yù)測了天然氣水合物的儲(chǔ)量參數(shù)(孔隙度、飽和度),結(jié)果表明該模型計(jì)算結(jié)果的精度高于傳統(tǒng)的經(jīng)驗(yàn)公式。陸敬安[19]等利用神狐海域某井的電阻率測井?dāng)?shù)據(jù)作為樣本訓(xùn)練并建立了徑向基神經(jīng)網(wǎng)絡(luò)模型,利用該模型計(jì)算出另一口井的水合物飽和度,其計(jì)算結(jié)果與現(xiàn)場孔隙水分析得到的飽和度值相吻合?,F(xiàn)有的研究存在以下問題:(1)僅僅利用單個(gè)神經(jīng)網(wǎng)絡(luò)建立天然氣水合物飽和度的計(jì)算模型,模型的可靠性有待進(jìn)一步驗(yàn)證與提高;(2)神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù)缺少必要的預(yù)處理,導(dǎo)致神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確度受到限制。
本文提出基于集成神經(jīng)網(wǎng)絡(luò)方法建立一種以電阻抗譜特性參數(shù)為特征向量的水合物飽和度軟測量模型,即將不同頻率的阻抗模值作為單個(gè)BP神經(jīng)網(wǎng)絡(luò)的輸入,通過對(duì)不同位置傳感器所對(duì)應(yīng)的子網(wǎng)絡(luò)輸出進(jìn)行集成,建立基于集成BP神經(jīng)網(wǎng)絡(luò)的水合物飽和度計(jì)算模型。
采用了自主設(shè)計(jì)的天然氣水合物電學(xué)探測實(shí)驗(yàn)裝置開展實(shí)驗(yàn)工作。實(shí)驗(yàn)裝置的總體結(jié)構(gòu)如圖1所示,該裝置分為環(huán)境模擬部分和測試部分。環(huán)境模擬部分包括耐高壓反應(yīng)釜、低溫冷卻系統(tǒng)、天然氣氣瓶、中間儲(chǔ)氣罐、軸壓系統(tǒng)等,可以模擬出天然氣水合物的生成分解所需的溫度和壓力條件、提供充足的氣源以及必要的存儲(chǔ)空間等;測試部分主要包括電學(xué)傳感器、溫度傳感器、壓力傳感器、電學(xué)測試單元、溫度測試單元、壓力測試單元、工控機(jī)及測試軟件,能夠?qū)崟r(shí)獲取反映水合物生成分解過程動(dòng)態(tài)變化的實(shí)驗(yàn)數(shù)據(jù)。
圖1 實(shí)驗(yàn)裝置總體結(jié)構(gòu)
天然氣水合物在反應(yīng)釜內(nèi)呈現(xiàn)出空間不均勻分布的特性,為了獲取水合物的空間分布信息,將電學(xué)傳感器分為上下兩層均勻安置在反應(yīng)釜壁,每一層安裝8個(gè)傳感器(如圖2所示),采用分時(shí)輪流工作模式控制各傳感器的工作狀態(tài)。
圖2 單層傳感器排列方式圖
利用上述裝置開展了甲烷水合物生成分解模擬實(shí)驗(yàn),分析了多孔介質(zhì)(粒徑50~180 μm的天然海沙)中甲烷水合物生成和分解過程中電學(xué)特性的變化規(guī)律,以及水合物飽和度對(duì)含水合物的多孔介質(zhì)的電學(xué)特性影響,在此基礎(chǔ)上利用阻抗模值等特征參數(shù)建立起特征參數(shù)與飽和度之間的軟測量模型。
實(shí)驗(yàn)獲得的阻抗譜包括了從1 Hz~10 MHz范圍內(nèi)的22個(gè)頻率點(diǎn),但由于系統(tǒng)誤差、環(huán)境干擾等因素影響,其中一些頻率點(diǎn)的數(shù)據(jù)會(huì)出現(xiàn)較大的無規(guī)律波動(dòng)和明顯偏差,經(jīng)過篩選、剔除等步驟對(duì)數(shù)據(jù)進(jìn)行選擇。最終選擇出5 Hz、10 Hz、20 Hz、100 Hz、200 Hz、500 Hz、1 kHz、2 kHz、4 kHz、10 kHz、20 kHz、40 kHz等12個(gè)頻率點(diǎn)作為特征頻率點(diǎn),以這些測試頻率點(diǎn)的阻抗模值作為備選的特征參數(shù)。
上述特征頻率點(diǎn)的原始數(shù)據(jù)中往往存在噪聲值、缺失值以及離群點(diǎn)等情況,不能直接用于軟測量模型的建立與測試,因此需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)預(yù)處理主要針對(duì)數(shù)據(jù)在數(shù)值上的各種異常情況進(jìn)行處理。本文中數(shù)據(jù)預(yù)處理所采用的步驟為:數(shù)據(jù)離群點(diǎn)修正處理、數(shù)據(jù)去噪處理和數(shù)據(jù)歸一化處理。
數(shù)據(jù)離群點(diǎn)修正處理針對(duì)原始數(shù)據(jù)中遠(yuǎn)離一般水平的極端大值和極端小值,采用均值插補(bǔ)修正法,根據(jù)數(shù)據(jù)曲線的整體趨勢對(duì)數(shù)據(jù)進(jìn)行估計(jì)值的修改,即用異常值數(shù)據(jù)所處位置左右相鄰兩個(gè)數(shù)據(jù)的平均值來替代異常值。本文采用小波去噪和滑動(dòng)平均濾波去噪相結(jié)合的方式對(duì)數(shù)據(jù)進(jìn)行去噪處理,以便獲得更好的去噪效果。數(shù)據(jù)歸一化處理將原始數(shù)據(jù)映射到0~1范圍之內(nèi),如式(1):
(1)
確定特征頻率點(diǎn)后,需要針對(duì)每組傳感器對(duì)在多頻率下的阻抗模值進(jìn)行特征提取,即降維處理。通常神經(jīng)網(wǎng)絡(luò)輸入為多維數(shù)據(jù),計(jì)算復(fù)雜度隨著數(shù)據(jù)維數(shù)的增大成指數(shù)增加[20],數(shù)據(jù)維數(shù)過大會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練時(shí)間大大增加,也會(huì)導(dǎo)致訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)性能變差。
本文采用主成分分析法(PCA)進(jìn)行降維處理,消除不同頻率間阻抗模值之間的相關(guān)性,降低網(wǎng)絡(luò)輸入的維數(shù)、精簡網(wǎng)絡(luò)的結(jié)構(gòu),采用累計(jì)貢獻(xiàn)度達(dá)到99%的主成分作為神經(jīng)網(wǎng)絡(luò)的輸入。
2.3.1 水合物飽和度計(jì)算
在甲烷水合物模擬實(shí)驗(yàn)中,基于耗氣量原理計(jì)算水合物飽和度,即利用實(shí)時(shí)采集的反應(yīng)釜內(nèi)溫度和壓力數(shù)據(jù)并結(jié)合式(2)進(jìn)行計(jì)算:
(2)
式中,Sh為水合物飽和度;P1為反應(yīng)釜內(nèi)初始?jí)毫Γ籔2為水合物生成分解過程中反應(yīng)釜內(nèi)壓力;T1為反應(yīng)釜內(nèi)初始溫度,T2為水合物生成分解過程中反應(yīng)釜內(nèi)溫度;Z1和Z2為對(duì)應(yīng)壓力溫度條件下的氣體壓縮因子;Vg為反應(yīng)釜?dú)庀囿w積;Mh為水合物摩爾質(zhì)量,122.02 g/mol;R為氣體常數(shù),8.314 J/(mol·K);ρh為水合物的密度,0.91 g/mL;Vp為多孔介質(zhì)孔隙的體積。圖3為一輪典型實(shí)驗(yàn)中水合物生成分解過程中溫度、壓力以及水合物飽和度的變化曲線。
在水合物生成分解過程中,上層1-5傳感器對(duì)在部分特征頻率點(diǎn)(20 Hz、200 Hz、2 kHz、20 kHz)下的阻抗模值隨水合物飽和度變化的關(guān)系如圖4所示。通過分析阻抗模值參數(shù)與飽和度參數(shù)之間的關(guān)系可以發(fā)現(xiàn),阻抗模值隨著飽和度的增加逐漸增大,呈現(xiàn)出顯著的非線性。
圖4 特征頻率點(diǎn)下阻抗模值隨水合物飽和度的變化圖
2.3.2 劃分樣本集
為了得到高效的神經(jīng)網(wǎng)絡(luò)模型,使之能夠有效地逼近訓(xùn)練樣本所蘊(yùn)含的內(nèi)在規(guī)律,需要將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。本文采用2/3的樣本作為訓(xùn)練樣本來訓(xùn)練網(wǎng)絡(luò),1/3的樣本作為測試樣本來測試網(wǎng)絡(luò),采用等間隔的方式從總樣本集中取出。
本文基于BP神經(jīng)網(wǎng)絡(luò)建立水合物飽和度軟測量模型。設(shè)計(jì)步驟如下:1)確定BP子神經(jīng)網(wǎng)絡(luò)最優(yōu)隱含層節(jié)點(diǎn)數(shù),進(jìn)而確定最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練參數(shù);2)訓(xùn)練并測試子神經(jīng)網(wǎng)絡(luò),根據(jù)多種誤差指標(biāo)評(píng)價(jià)網(wǎng)絡(luò)性能;3)采用平均法集成策略,建立集成BP神經(jīng)網(wǎng)絡(luò)的水合物飽和度軟測量模型。
神經(jīng)網(wǎng)絡(luò)理論證明,一個(gè)三層結(jié)構(gòu)的BP網(wǎng)絡(luò)可實(shí)現(xiàn)任意m維到n維的映射,并且通過調(diào)整隱含層神經(jīng)元的個(gè)數(shù)來調(diào)節(jié)網(wǎng)絡(luò)的精度[21]。因此,本文選用三層BP神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)的輸入為一組傳感器對(duì)在不同測試頻率下的阻抗模值,輸出為水合物飽和度。隱含層節(jié)點(diǎn)數(shù)的確定過程中參考式(3):
(3)
式中,L為隱含層節(jié)點(diǎn)數(shù),n為輸入層節(jié)點(diǎn)數(shù),m為輸出層節(jié)點(diǎn)數(shù),a為1~10內(nèi)的常數(shù)。
在分析評(píng)價(jià)網(wǎng)絡(luò)的性能時(shí)采用以下4種誤差指標(biāo)[22]:相對(duì)誤差(RE)反映測量結(jié)果偏離真值的實(shí)際大?。黄骄鄬?duì)誤差(MRE)反映誤差的相對(duì)值,效果直觀;平均絕對(duì)誤差(MAE)反映預(yù)測值誤差的實(shí)際情況;均方根誤差(RMSE)反映網(wǎng)絡(luò)預(yù)測值相對(duì)于實(shí)際值的平均離散程度。通過分析比較以上誤差,可以確定更加合理地隱含層節(jié)點(diǎn)數(shù)。
在網(wǎng)絡(luò)訓(xùn)練時(shí),本文中隱含層的激活函數(shù)采用正切Sigmoid函數(shù)(tansig),其輸入值可取任意值,輸出值在-1~+1之間;輸出層的激活函數(shù)采用線性函數(shù)(purelin),其輸入值與輸出值可取任意值;網(wǎng)絡(luò)學(xué)習(xí)方法采用動(dòng)量梯度下降法(traingdm),該方法不但具有較高收斂速度,而且通過引入一個(gè)動(dòng)量項(xiàng)可以避免局部極小問題。
以上層1-5傳感器對(duì)為例(參見圖2),將隱含層節(jié)點(diǎn)數(shù)L取值由4增加到13,分別對(duì)不同隱含層節(jié)點(diǎn)數(shù)的網(wǎng)絡(luò)進(jìn)行500次訓(xùn)練和測試,通過分析比較網(wǎng)絡(luò)誤差來獲得最優(yōu)隱含層節(jié)點(diǎn)數(shù)。表1所示為500次測試誤差的平均結(jié)果,各種誤差指標(biāo)的整體趨勢為先減小后增大,普遍存在一個(gè)最小值。當(dāng)L=9時(shí),平均相對(duì)誤差和均方根誤差兩項(xiàng)指標(biāo)達(dá)到最優(yōu)值,雖然沒有實(shí)現(xiàn)全部指標(biāo)都達(dá)到最優(yōu)值,但此時(shí)指標(biāo)取值與最優(yōu)值相差較小。綜合考慮,隱含層節(jié)點(diǎn)數(shù)設(shè)為9,從而獲得針對(duì)上層1-5傳感器對(duì)的水合物飽和度計(jì)算模型。采用同樣的方法,根據(jù)表2、表3和表4的網(wǎng)絡(luò)測試誤差來確定針對(duì)2-6、3-7、4-8等傳感器對(duì)的網(wǎng)絡(luò)模型最優(yōu)隱含層節(jié)點(diǎn)數(shù),分別為9、10和10。
表1 上層1-5傳感器對(duì)不同隱含層節(jié)點(diǎn)數(shù)網(wǎng)絡(luò)測試誤差表
表2 上層2-6傳感器對(duì)不同隱含層節(jié)點(diǎn)數(shù)網(wǎng)絡(luò)測試誤差表
表3 上層3-7傳感器對(duì)不同隱含層節(jié)點(diǎn)數(shù)網(wǎng)絡(luò)測試誤差表
表4 上層4-8傳感器對(duì)不同隱含層節(jié)點(diǎn)數(shù)網(wǎng)絡(luò)測試誤差表
將訓(xùn)練樣本和測試樣本分別輸入上文所建立的具有最優(yōu)結(jié)構(gòu)和最佳性能的4個(gè)網(wǎng)絡(luò)模型,進(jìn)行訓(xùn)練和測試后得到如5所示的測試結(jié)果,誤差統(tǒng)計(jì)列于表5。4個(gè)網(wǎng)絡(luò)模型的平均相對(duì)誤差|RE|<6%,平均絕對(duì)誤差MAE<0.004,均方根誤差RMSE<13%。
圖5 4個(gè)子網(wǎng)絡(luò)模型的輸出值與實(shí)際值比較
表5 各個(gè)子網(wǎng)絡(luò)測試誤差統(tǒng)計(jì)
集成學(xué)習(xí)是指使用多個(gè)學(xué)習(xí)器對(duì)同一個(gè)問題進(jìn)行學(xué)習(xí),再使用某種策略將各個(gè)學(xué)習(xí)器進(jìn)行集合,從而獲得更優(yōu)學(xué)習(xí)效果的機(jī)器學(xué)習(xí)方法。本文將以上所建立的4個(gè)子網(wǎng)絡(luò)進(jìn)行集成,以期獲得性能更優(yōu)的軟測量模型。
當(dāng)集成神經(jīng)網(wǎng)絡(luò)用于回歸估計(jì)時(shí),集成的輸出通常由各網(wǎng)絡(luò)的輸出通過簡單平均或者加權(quán)平均產(chǎn)生[25],即對(duì)各個(gè)學(xué)習(xí)器的輸出結(jié)果求平均值,進(jìn)而得到最終的預(yù)測結(jié)果,但是由于采用加權(quán)平均可能會(huì)導(dǎo)致過度擬合,從而使集成網(wǎng)絡(luò)模型的泛化能力降低,因此本文選用簡單平均法作為集成策略。圖6中,ZTi表示通過不同傳感器對(duì)測量得到的阻抗模值,BP-Ti表示對(duì)應(yīng)不同傳感器對(duì)的子網(wǎng)絡(luò)。
圖6 集成網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖
圖7和圖8所示為集成網(wǎng)絡(luò)模型的測試結(jié)果。與獨(dú)立的子網(wǎng)絡(luò)相比(表5所示),利用集成網(wǎng)絡(luò)模型對(duì)飽和度進(jìn)行預(yù)測時(shí)誤差更小。集成神經(jīng)網(wǎng)絡(luò)的平均相對(duì)誤差MRE為3.33%、平均絕對(duì)誤差MAE為0.001 4、均方根誤差RMSE為6.56%,三項(xiàng)誤差指標(biāo)均低于各個(gè)子網(wǎng)絡(luò)的預(yù)測誤差。集成神經(jīng)網(wǎng)絡(luò)的輸入包含了通過4對(duì)傳感器(位于4個(gè)測量方位)所獲得的阻抗值,更多的信息量以及有效的集成策略對(duì)于提升預(yù)測模型的預(yù)測準(zhǔn)確度提供了前提。
圖7 集成網(wǎng)絡(luò)模型預(yù)測輸出
圖8 集成網(wǎng)絡(luò)預(yù)測值相對(duì)誤差
針對(duì)沉積物中含天然氣水合物飽和度的計(jì)算問題,提出了一種基于電阻抗特性參數(shù)和集成神經(jīng)網(wǎng)絡(luò)的軟測量模型建立方法。開展了甲烷水合物模擬實(shí)驗(yàn)并獲取了電阻抗譜、溫度和壓力數(shù)據(jù),在對(duì)電阻抗譜數(shù)據(jù)進(jìn)行預(yù)處理、特征參數(shù)提取和選擇之后形成了樣本集,針對(duì)4對(duì)傳感器分別設(shè)計(jì)了BP神經(jīng)網(wǎng)絡(luò),繼而將4個(gè)BP網(wǎng)絡(luò)作為子網(wǎng)絡(luò)進(jìn)行集成得到集成網(wǎng)絡(luò)模型。模型測試結(jié)果表明:通過集成網(wǎng)絡(luò)模型計(jì)算得到的含水合物飽和度值平均相對(duì)誤差3.33%、平均絕對(duì)誤差0.001 4、均方根誤差為6.56%,三項(xiàng)誤差指標(biāo)均低于各個(gè)子網(wǎng)絡(luò)的計(jì)算誤差。
通過在寬頻范圍內(nèi)對(duì)含水合物沉積物進(jìn)行電阻抗譜測試,能夠獲得沉積物的頻率響應(yīng)特性以及特性描述參數(shù)(如不同頻率條件下的阻抗模值),從而能夠?yàn)樯窠?jīng)網(wǎng)絡(luò)模型提供大量的輸入信息。利用集成神經(jīng)網(wǎng)絡(luò)能夠綜合應(yīng)用位于不同測量方位的多個(gè)傳感器的測量數(shù)據(jù),通過采用適合的集成策略能夠克服水合物空間分布不均勻?qū)︼柡投扔?jì)算準(zhǔn)確度的不利影響。
基于集成神經(jīng)網(wǎng)絡(luò)的軟測量模型能夠接受多維度、豐富的輸入信息,非常適合于解決復(fù)雜沉積物中含水合物飽和度的評(píng)價(jià)問題,下一步將在擴(kuò)大飽和度范圍的基礎(chǔ)上,聯(lián)合應(yīng)用聲學(xué)特征參數(shù)和電學(xué)特征參數(shù)作為模型的輸入,以期獲得更加可靠、精確的飽和度評(píng)價(jià)結(jié)果。