顏丙峰, 王光耀, 朱肖曼, 史士東
(煤炭資源高效開采與潔凈利用國家重點實驗室,北京 100013)
煤液化的反應性能與煤種有很大關系,研究煤種各種性質與其液化性能關系,是評選液化用煤的基本方法[1]。煤的灰分、揮發(fā)分、元素組成、巖相組成(鏡質組、殼質組、惰質組、最大鏡質體反射率)等煤質特性不僅會對其液化性能、液化工藝產生重要影響[2-5],還會影響液化產品的經濟效益。一般而言,揮發(fā)分含量越高、H/C原子比越大、惰質組含量越小的煤種,其變質程度越低,越容易液化。但煤變質程度越低,其氧元素含量會越高,導致其液化水產率和氫耗提高。
煤的液化特性通常與多個煤質特性呈線性關系。Garr等[6]發(fā)現(xiàn)煤的灰分含量及C、H元素含量與煤的轉化率線性相關;Lee等[7]發(fā)現(xiàn)煤的灰分含量與煤的轉化率線性相關;李小彥等[8-9]發(fā)現(xiàn)煤的轉化率與揮發(fā)分、H/C原子比、活性組分含量分別成線性關系。然而,這些多是針對特定煤種且專注于煤質特性與其液化轉化率、產率的關系,而對煤質特性與其液化過程中水、氣產率及氫耗等關系的研究較少。
對煤質特性與煤的液化性能關系的研究多采用多元線性回歸分析方法。多元線性回歸分析過程中,回歸方程中的自變量越多、剩余標準差越小,回歸方程效果越好、精度越高,因此希望“最優(yōu)”回歸方程中包含盡可能多的自變量,特別是對因變量有顯著影響的自變量不能遺漏[10]。但是,若回歸方程包含的自變量過多,可能會導致自變量之間存在多重共線性,造成對因變量有顯著影響的自變量被判定為無顯著影響,導致有用的自變量被錯誤剔除,使模型與實際相差甚遠[11]。因此,必須采取有效方法消除自變量間多重共線性的影響。最常用的消除多重共線性的方法有主成分分析法[12-14]和逐步回歸法[15-18]。主成分分析法的目的在于降維,將原有指標進行線性組合,減少指標個數;而逐步回歸法的目的是剔除影響不顯著的指標,而保留原有指標中影響顯著的若干指標。
20世紀80~90年代,北京煤化學研究所對中國120多種煤進行篩選[19],得到16種適合液化的中國煤種,并給出其煤質分析和液化結果[3,19]。在這些實驗數據的基礎上,筆者使用SPSS 22.0軟件建立上述16種煤種(共計24組數據)煤質特性與其液化特性間的多元線性回歸模型,采用多元線性回歸與逐步回歸分析相結合的方法,篩選對其液化特性影響顯著的煤質特性,并以文獻[20-24]中的相關數據驗證逐步回歸關系式的可靠性。
為了建立多元線性回歸模型,需首先考察哪些煤質特性與其液化特性具有線性相關性,因此筆者篩選12種煤質特性與6種液化特性指標間的線性相關性。其中,煤質特性指標包括揮發(fā)分質量分數(X1),C、H、N、S、O元素的質量分數(X2~X6),H/C和O/C原子比(X7和X8),鏡質組、殼質組、惰質組體積分數(X9~X11)和最大鏡質體反射率(Rmax,X12);液化特性指標包括煤轉化率(Y1)、油產率(Y2)、水產率(Y3)、氣產率(Y4)、瀝青質產率(Y5)、氫耗(Y6)。
采用軟件SPSS 22.0進行煤質特性與液化特性間相關性的分析[25-26],結果見表1。其中,R為Pearson相關系數,R絕對值越大,說明煤質特性與液化特性的線性相關程度越高。P為確認關聯(lián)結果有效的犯錯概率(P=0.05表示有5%的變量關聯(lián)可能是偶然性造成的),P越大,則變量關聯(lián)可靠性越差。在相關性分析中,P可以用來判斷線性相關的顯著性。通常P≤0.01,表示液化特性與煤質特性線性相關很顯著;0.01
0.05,表示液化特性與煤質特性無相關性。
由表1可以看出:煤轉化率與C和O元素含量、O/C原子比、惰質組含量的P均不大于0.01,R也較大,說明其相關性很顯著;而與鏡質組含量、Rmax(X12)的P在0.01~0.05范圍內,說明其相關性較顯著。同理,油產率只與H元素含量顯著相關;水產率與C和O元素含量、O/C原子比、Rmax的相關性很顯著,而與揮發(fā)分、H元素含量,鏡質組、惰質組含量相關性較顯著;氣產率與C和O元素含量、O/C原子比、鏡質組和惰質組含量、Rmax的相關性很顯著,而與揮發(fā)分、S元素含量的相關性較顯著;瀝青質產率與揮發(fā)分含量、C和O元素含量、O/C原子比、Rmax相關性很顯著,與H/C原子比相關性較顯著。氫耗與N元素含量相關性很顯著,與C和O元素含量、O/C原子比、鏡質組含量、Rmax相關較顯著。
此外,煤轉化率、水產率、氣產率、氫耗與C元素含量、Rmax成負相關,與O元素含量、O/C原子比成正相關,而瀝青質產率則相反,與C元素含量、Rmax成正相關,與O含量、O/C原子比成負相關。
表1 煤質特性與液化特性的相關性分析結果Table 1 Correlation analysis of coal characteristics and liquefaction properties
由線性相關性分析可知,X2、X6、X8、X9、X11、X12可能是影響Y1的因素。因此以X2、X6、X8、X9、X11、X12為自變量,Y1為因變量,用SPSS 22.0軟件建立多元線性回歸模型[27-29]對其進行回歸擬合,其中置信區(qū)間為95%水平[30],結果見表2模型Z1;在多元線性回歸模型的基礎上,采用逐步回歸分析法,在顯著性水平α=0.10下剔除不符合顯著性要求的變量,得到2種逐步回歸分析模型(模型Z2和Z3)。其中F為回歸模型方差與殘差的比值,是模型的整體檢驗。F通常要與其臨界值Fα作比較,其中α為顯著性水平,取α=0.05;若F>Fα,表示模型是可靠的;反之則沒有統(tǒng)計學意義。T檢驗是對單個自變量的顯著性檢驗。B為各自變量在回歸方程中的系數,Beta為標準回歸系數。方差膨脹因子(VIF)代表各自變量的多重共線性,一般若VIF>10 則說明各自變量之間存在較強的多重共線性。
由表2可以看出,模型Z1的Pearson相關系數R=0.768,修正決定系數Adj-R2為0.444,說明模型線性擬合效果較好。模型Z1的F0.05=2.699,F(xiàn)檢驗值為4.063,因此F>Fα,說明該多元回歸模型可靠;而且,其P為0.01,表明Y1與X2、X6、X8、X9、X11、X12等6種煤質特性的線性關系很顯著。得到回歸方程為:
Y1=70.719+0.512X2-1.808X6+181.475X8-0.109X9-0.236X11-7.886X12
(1)
式(1)中不同自變量的取值范圍和量化程度是不同的。例如:C質量分數的取值范圍為0~1,O/C原子比的取值范圍為0~0.4。若C質量分數和O/C原子比均由0增至0.4,二者變化數值一樣,但增幅不同。前者增幅為40%,后者增幅達100%,從而導致無法直接用系數B判斷哪個自變量對因變量影響程度更大。因此,需要將數據標準化,即將原始數據減去相應變量的均數后再除以該變量的標準差,得到采用標準化回歸系數(Beta)的標準化回歸方程。Beta系數的絕對值越大,自變量對因變量的影響越大。由表2的Beta系數可知,影響煤轉化率從大到小的因素依次為O/C原子比、O質量分數、惰質組含量、C質量分數、Rmax、鏡質組含量。
此外,T檢驗對應各自變量的P均超過0.05,說明單自變量對煤轉化率均沒有顯著影響[31-32]。同時,除X12外,其他自變量的VIF均超過10,說明各個自變量間存在較強的多重共線性[33-34],從而導致多元線性回歸擬合模型的可靠性較差。
對逐步回歸模型Z2和Z3進行F檢驗,結果表明:其F分別為11.506和9.005,而其F0.05分別為4.301和3.467,F(xiàn)>Fα;其P分別為0.003和0.001,均小于0.01。因此,模型Z2和Z3得到的回歸方程均有統(tǒng)計學意義。由模型Z2和Z3自變量的T檢驗可知:其P<0.05,說明各自變量的影響是顯著的;其VIF<10,說明各自變量之間已不存在多重共線性。而與模型Z2相比,模型Z3的逐步回歸方程擬合度更高,相關系數R為0.679。其擬合精度雖不如多元線性回歸模型,但因消除了自變量的多重共線性,結果可靠性更高。其回歸方程為:
Y1=97.738-0.103X11-4.679X12
(2)
由模型3可以看出,煤轉化率與惰質組含量、Rmax成負相關,且惰質組含量對應Beta的絕對值大于Rmax的,說明惰質組含量對轉化率的影響高于Rmax。這與文獻[24]研究結果一致。Rmax是反映煤變質程度的重要指標,一般隨煤變質程度的加深而增加[35]。因此,對煤液化而言,煤變質程度越低,Rmax越小,越利于液化。
表2 煤質特性與轉化率回歸模型的方差分析和回歸系數Table 2 Variance analysis and regression coefficients of coal characteristics and conversion rates
為了避免自變量間的多重共線性,以Y3為因變量,X1、X2、X3、X6、X8、X9、X11、X12為自變量,直接進行逐步回歸分析,結果見表3。由表3可以看出,Y3僅受X8的影響,其回歸方程為:
Y3=5.736+53.472X8
(3)
表3 煤質特性與水產率回歸模型的方差分析和回歸系數Table 3 Variance analysis and regression coefficients of coal characteristics and water yields
該模型的相關系數R為0.906,修正決定系數Adj-R2為0.813,說明逐步回歸模型線性擬合效果很好。文獻[36]研究發(fā)現(xiàn),在煤液化過程中,煤中77.83%(質量分數,下同)的氧元素會與氫氣反應生成水,11.58%的氧會生成COx,10.73%的氧會留在液化油及殘渣中。因此,若O/C原子比增加,預示著煤的變質程度較低,更易液化。因此,液化油及殘渣中留存的氧可能會進一步轉化變成水及COx;同時由于C含量的降低,可能會減少COx的生成,從而提高水產率。
以Y4為因變量,X1、X2、X5、X6、X8、X9、X11、X12為自變量進行逐步回歸分析,得到3個逐步回歸分析模型(Q1、Q2、Q3),結果見表4。由表4可知,與模型Q1和Q2相比,模型Q3的逐步回歸方程相關系數為0.825,擬合程度最高。其回歸方程為:
Y4=-33.379+0.535X6+0.089X9+0.429X2
(4)
因此,煤液化的氣產率與C、O元素含量和鏡質組含量呈正相關。其中,O元素含量對氣產率的影響最大,C元素含量次之,鏡質組含量影響最小。這是因為O含量越高,煤的變質程度越低;鏡質組含量越高,越易液化生成液化油和氣體。文獻[36]研究表明,煤中的C元素約有12%(質量分數)會進入氣體中,因此,C元素含量的升高可能會提高氣體產率。
表4 煤質特性與氣產率的方差分析和回歸系數Table 4 Variance analysis and regression coefficients of coal characteristics and gas yields
以Y5為因變量,X1、X2、X6、X7、X8、X12為自變量進行逐步回歸分析,得到2個逐步回歸分析模型(L1、L2),結果見表5。與模型L1相比,模型L2的逐步回歸方程擬合程度更高,相關系數R為0.720,為較優(yōu)模型,其回歸方程為:
Y5=14.453+12.062X12-16.783X7
(5)
Rmax越高,煤的變質程度越高,煤越難以液化,從而導致瀝青質產量會增加;而H/C原子比越高,越易液化,瀝青質產量也越低。由模型2可以看出,瀝青質產率與Rmax呈正相關,與H/C原子比呈負相關,與理論分析是相符的,且Rmax對瀝青質產率的影響高于H/C原子比。
表5 煤質特性與瀝青質產率的方差分析和回歸系數Table 5 Variance analysis and regression coefficients of coal characteristics and asphaltene yields
以Y6為因變量,X2、X4、X6、X8、X9、X12為自變量進行逐步回歸分析,得到2個模型(H1、H2),結果見表6。與模型H1相比,模型H2的逐步回歸方程擬合程度最高,相關系數R為0.690,為較優(yōu)模型,其回歸方程為:
Y6=3.800+0.756X4+0.053X6
(6)
由式(6)可以看出,氫耗與煤中的N、O元素含量呈正相關,且N含量的影響要高于O含量的。文獻[36]研究表明,煤中的N元素和O元素經過液化反應后,有50%(質量分數)的N元素會與氫反應生成氨,有77.83%的O元素會與氫反應生成水。因此,當煤中N、O元素含量較高,會導致氫耗增加。至于N含量對氫耗的影響高于O含量的原因,目前還未有合理解釋,仍需進一步深入研究,推測可能是因樣本數偏少導致的。
表6 煤質特性與氫耗方差分析和多元線性回歸系數Table 6 Variance analysis and multiple linear regression coefficients of coal characteristics and hydrogen consumption
前文通過SPSS 22.0軟件分析煤質特性與油產率相關性發(fā)現(xiàn),Y2只與X3顯著相關。對其進行逐步線性回歸可得關系方程:
Y2=45.150+3.633X3
(7)
方程(7)的相關系數R為0.476,決定系數R2為0.227,修正決定系數Adj-R2為0.192,擬合程度較低。在煤炭直接液化試驗中,油產率是多個煤質特性綜合作用的結果,除了受X3影響外,還可能受X1、X2、X11、X12等因素影響,只是影響可能不顯著。因此,為了更好地反映油產率與煤質特性的關系,采用差減公式:Y2=Y1+Y6-Y3-Y4-Y5,可間接得到油產率與煤質特性的關系。經過計算,其擬合方程為:
Y2=114.728-0.429X2+0.756X4-
0.482X6+16.783X7-53.472X8-
0.089X9-0.103X11-16.741X12
(8)
為判斷回歸模型的預測效果,將回歸分析預測值與液化試驗值進行對比,選擇二者的標準誤差(Std. Error)、平均相對誤差(M.R.Error)、平均絕對誤差(Re.Error)作為評價指標[37],結果見圖1和表7。由圖1和表7可知:回歸分析的轉化率預測值與試驗值的標準誤差、平均相對誤差、平均絕對誤差均較小,說明回歸模型對轉化率的預測效果較好;由回歸分析得到和由差減公式計算得到的油產率預測值與試驗值的標準誤差、平均相對誤差和平均絕對誤差相近,均不超過3.50%,且后者的三項誤差更小。這說明通過差減公式計算得到的油產率與試驗值吻合度好于回歸分析,也證實了油產率不僅受氫元素含量的影響,而且受多個煤質特性綜合影響。
圖1 回歸分析結果與試驗結果對比Fig.1 Comparison of regression analysis results with experimental results(a) Conversion; (b) Oil yield; (c) Water yield; (d) Gas yield; (e) Asphaltene yield; (f) Hydrogen consumption
回歸分析得到的水產率、氣產率、氫耗的預測值與試驗值的標準誤差和平均絕對誤差很小,均不超過1.0%,但二者的平均相對誤差都較高,在4.4%~7.6%之間?;貧w分析得到的瀝青質產率預測值與試驗值的標準誤差和平均絕對誤差較低,而平均相對誤差很大,為43.39%。這是由煤液化產物的選擇性不同及物料平衡波動共同作用造成的。在煤液化過程中,為了提高油品收率,在保證煤轉化率較高的同時,必須抑制水、氣、瀝青質的生成,盡可能多地得到油品,且減少氫氣的消耗。因此,在煤液化過程中,水、氣、瀝青質、氫氣的生成或消耗數值較小。煤液化過程的油產率一般在60%以上,而瀝青質產率為1.28%~12.39%。當物料平衡的波動為±2%時,若該波動全由瀝青質產率波動造成,則瀝青質產率的相對誤差為16.14%~156.25%;若該波動全由油產率波動造成,則油產率的相對誤差不超過3.33%。可見,同等物料平衡波動下,瀝青質產率的相對誤差明顯高于油產率的,因而瀝青質產率的平均相對誤差會比較明顯。但實際水產率、氣產率、瀝青質產率及氫耗的標準誤差和平均絕對誤差均很小,均不超過2.09%,低于油產率的標準誤差和平均絕對偏差,說明逐步回歸預測的模型整體可靠性較好[38]。
表7 試驗值與預測值的誤差分析Table 7 Error analysis of experimental value and calculated value
為了驗證回歸模型適用性,選擇其他地方或者不同煤層的煤種作為驗證煤種,對其模型預測值與試驗值進行對比,結果如表8所示。由表8可知:驗證煤種的轉化率預測值與試驗值的標準誤差、平均相對誤差、平均絕對誤差均低于2.10%;差減法得到的油產率預測值與試驗值的標準誤差、平均相對誤差和平均絕對誤差均低于2.25%;預測值與試驗值吻合度較高,說明模型也可以用于其他液化煤種的評價與篩選。
表8 驗證煤種試驗值與預測值的誤差分析Table 8 Error analysis of other coals experimental value and calculated value
從平均相對誤差角度來看,回歸模型對驗證煤種水產率、氣產率、氫耗的預測值與試驗值的誤差較大,預測的可靠性較差。但從標準誤差和平均絕對誤差角度來看,以上4項參數二者的數值都很小,逐步回歸預測的模型可靠性較好。
(1)煤質特性及其液化特性的相關性分析發(fā)現(xiàn),液化特性與多種煤質特性相關性顯著。除油產率外,煤轉化率、水產率、氣產率、瀝青質產率和氫耗均受C和O元素含量、O/C原子比、Rmax等4種煤質特性的影響,其中,煤轉化率、水產率、氣產率、氫耗與C元素含量、Rmax成負相關,與O元素含量、O/C原子比成正相關;而瀝青質產率與C元素含量、Rmax成正相關。
(2)通過多元線性回歸分析與逐步回歸分析發(fā)現(xiàn),液化特性不同,受煤質特性的影響也不同。如轉化率主要受惰質組含量和Rmax的影響,其中惰質組含量對轉化率的影響要高于Rmax;瀝青質產率主要受H/C原子比和Rmax的影響,其中Rmax對瀝青質產率的影響要高于H/C原子比。
(3)對比模型預測值與液化試驗值發(fā)現(xiàn),預測值與試驗值的標準誤差不超過3.30%,平均絕對誤差不超過3.28%,完全可以用于初步評價和篩選適合液化的煤種。