石 衛(wèi),王友林,杜少少,張培棟
(陜西省水工環(huán)地質調(diào)查中心,陜西 西安 710068)
淺層地熱能是集諸多優(yōu)勢的一種清凈能源[1-2],在我國東部南部城市得到了廣泛推廣,而陜西關中地區(qū)淺層地熱能開發(fā)相對處于初級階段,區(qū)內(nèi)巖土體熱物性測試成果數(shù)據(jù)較少,但區(qū)域上各類工程的巖土勘察資料較為豐碩,因此研究巖土體的熱物性參數(shù)與物理參數(shù)間的相關關系,并試圖建立基于物理參數(shù)變量對熱物性參數(shù)的經(jīng)驗估計模型,為淺層地熱能開發(fā)利用工程的前期設計提供參考,已成為相關學者研究的熱點。孫婉等[2-7]歸納了國外研究進展,指出對土層導熱系數(shù)影響較大的物理性質參數(shù)為“土體顆粒大小、含水率、干密度、飽和度、孔隙率、硬度”。周陽等[1]總結了關中盆地巖土體熱物性特征,指出干密度對導熱系數(shù)和比熱容的影響程度最大,天然密度次之,含水率和孔隙率影響最弱。葉萬軍等[8-11]通過試驗得出黃土的導熱系數(shù)和比熱容隨含水率的增大而減小,含水率比干密度對黃土熱參數(shù)的影響程度大。黃土是由“固、液、氣”三相物質組成,簡單相關關系已不能總體描述其對熱參數(shù)的影響,而偏相關關系則是描述多變量之間關系的最科學、最合理的方法[5]。本文在以往成果基礎之上,基于偏最小二乘法,利用咸陽南部黃土塬區(qū)6個鉆孔的95組黃土室內(nèi)試驗數(shù)據(jù),選取含水率、干密度、孔隙比及導熱系數(shù)4個參數(shù)變量,分析參數(shù)變量間的相關關系,構建了導熱系數(shù)的預測模型,為咸陽南部黃土塬區(qū)淺層地熱能科學、合理的開發(fā)利用及推廣提供參考。
偏最小二乘回歸(PLS)提供一種多對多線性回歸建模的方法,在建模過程中集中了主成分分析、典型相關分析和線性回歸分析方法的特點,當觀測數(shù)據(jù)的數(shù)量(樣本量)較少時,用偏最小二乘回歸建立的模型具有傳統(tǒng)的經(jīng)典回歸分析等方法所沒有的優(yōu)點[12-15]。
也稱標準差標準化,可以消除量綱影響和變量自身變異的影響。設p個因素變量為x1,x2,…,xp,X為觀測數(shù)據(jù)矩陣,因變量為Y,記標準化后新數(shù)據(jù)矩陣E0=(x1*,x2*,…,xp*)T。
式中,i=1,2,…,n;j=1,2,…,p。
提取因素變量的第一對成分u1,使u1盡可能多的提取所在變量組的變異信息,且和因變量F0=y*的相關程度最大,u1=a11x1+…+a1pxp=ρ1TX。
若數(shù)據(jù)陣X的秩為m≤min(n-1,p),則存在m個成分u1,u2,…,um,如果殘差陣中元素的絕對值近似為0,則認為用第一個成分建立的回歸式精度滿足需要,可停止抽取成分,否則用殘差陣B1和殘差向量D1代替X、Y重復以上步驟。
按標準化逆過程,將標準化變量還原成原始變量,假設提取了k個主成分,得到最終數(shù)學模型。
y=α1x1+α2x2+…+αpxp
定義交叉有效性為:Qh2=1-PRESS(h)/SS(H-1),每一步結束前進行交叉有效性檢驗,如果在第h步有Qh2<1-0.952=9.85%,則模型達到精度要求,停止提取成分,若Qh2≥9.85%,表示第h步提取的uh成分的邊際貢獻顯著,應繼續(xù)計算。
模型的預測能力通過外部檢驗來實現(xiàn),由平均殘差(AE)、平均絕對殘差(AAE)、均方根誤差(RMSE)來表征,相關參數(shù)定義為:
本文選取了黃土的含水率、干密度、孔隙比及導熱系數(shù)4個參數(shù)變量,采用萊茵達準則對95組原始數(shù)據(jù)進行判定與剔除,對篩選后的63組樣本數(shù)據(jù)進行了統(tǒng)計分析(表1)。為了解各參數(shù)變量間的簡單相關關系,對所有樣本數(shù)據(jù)計算并獲得了各參數(shù)變量間簡單相關系數(shù)(表2)。為直觀表達不同地質年代黃土物理性質和導熱系數(shù)的變化情況,選取不同地質年代黃土的參數(shù)變量均值繪制其對比曲線圖(圖1)。
表1 黃土的物理參數(shù)與導熱系數(shù)數(shù)據(jù)描述統(tǒng)計
表2 參數(shù)變量間簡單相關系數(shù)
由表1可知,不同地質年代黃土的各參數(shù)變量數(shù)據(jù)的變異性很小,說明本次篩選后的樣本數(shù)據(jù)離散程度小,其中含水率、干密度、導熱系數(shù)呈良好的正態(tài)分布規(guī)律。由表2可知,干密度與孔隙比呈高負相關,導熱系數(shù)與干密度呈強正相關,與孔隙比呈強負相關,巖土體賦存于滲流—應力耦合作用的環(huán)境,不同地質時期黃土的含水率、干密度、孔隙比與導熱系數(shù)之間交叉影響,存在互相關性,簡單回歸系數(shù)的解釋已不適用專業(yè)上十分重要的變量,甚至是符號與實際概念相反[5]。由圖1可知,隨黃土沉積年代越久遠,干密度、導熱系數(shù)呈增大趨勢,孔隙比呈減小趨勢,含水率在中更新世早期至早更新世呈減小趨勢,晚更新世至中更新世早期呈增加趨勢,原因系隨黃土層的沉積年代越久遠,其上覆土層沉積越厚,土自重增大,土粒擠密,孔隙體積減小,干密度則增大;另外,咸陽黃土塬區(qū)潛水含水層為中更新統(tǒng)黃土層,潛水位埋深大多60 m左右,通過黃土層中的一些裂隙、孔洞及各洞穴等優(yōu)勢通道使降水快速補給潛水,但很難入滲到下更新統(tǒng)黃土中,中更新統(tǒng)黃土中部分孔隙被水充填,水的導熱性能會明顯好于孔隙中的氣體,但對于土體較致密的下更新統(tǒng)黃土而言,含水率對導熱系數(shù)影響極其微小。因此,黃土的干密度和孔隙比相對比于含水率,與導熱系數(shù)的整體規(guī)律性要明顯得多。
圖1 參數(shù)變量對比曲線
對各因素變量按不同地質年代進行共線性診斷,將結果匯總于表3,可以發(fā)現(xiàn)多個維度特征值近似為0,且各地層最大的條件指數(shù)為1 010.63~3 170.91,提示因素變量間存在嚴重的多重共線性。
表3 因素變量共線性診斷匯總
利用SPSS軟件將不同地質年代黃土的參數(shù)變量數(shù)據(jù)進行標準差標準化,并提取主成分。由表4可知,各地質年代黃土的因素變量特征根λ1值在2.12~2.75之間,λ2值均小于1,主成分U1的累計方差貢獻率達70.54%~91.80%,即涵蓋了各地層的大部分信息,可選取其進行建模。
分別對不同地質年代黃土標準化的參數(shù)變量與主成分變量構建回歸方程(表5)。
表4 因素變量主成分特征根與累計貢獻率統(tǒng)計
表5 參數(shù)變量與主成分的回歸方程
將主成分U1代入上述回歸方程,可得到標準化指標變量的PLS數(shù)學模型(表6):
分析表6中的模型結構,孔隙比(X3)對導熱系數(shù)產(chǎn)生負效應,干密度(X2)對導熱系數(shù)產(chǎn)生正效應,這與因素變量的實際影響作用是一致的。
表6 標準化指標變量的PLS數(shù)學模型
按照標準化的逆過程,將標準化參數(shù)變量y*與xj*(j=1,2,3)分別還原為原始變量y與xj,則得到最終的基于含水率、干密度、孔隙比對導熱系數(shù)的數(shù)學預測模型(表7)。分析表7中的模型結構,含水率(X1)因變量系數(shù)為0.001~0.007,對導熱系數(shù)估算影響極小,這與對圖1的分析結論相符合。此預測模型是根據(jù)對咸陽黃土塬區(qū)各沉積年代黃土的實驗數(shù)據(jù)統(tǒng)計與計算而獲取,適用于咸陽黃土塬區(qū)各沉積年代黃土的導熱系數(shù)估算,關中地區(qū)各黃土塬黃土的沉積環(huán)境演化及黃土特征類似,此預測模型對關中地區(qū)其它黃土塬區(qū)各沉積年代黃土的導熱系數(shù)估算也具有一定的參考價值。
表7 導熱系數(shù)數(shù)學預測模型
為更直觀地觀察各個因素變量在解釋指標變量時的邊際作用,可針對標準化指標變量數(shù)據(jù)的回歸方程繪制回歸系數(shù)圖(圖2)。
圖2 回歸系數(shù)的直方圖
由圖2可迅速觀察到干密度在解釋各地層的回歸方程時起到了極為重要的作用,與Qp2、Qp1黃土層回歸系數(shù)相比,Qp3黃土層的回歸方程顯然不夠理想,3個因素變量對它的解釋能力均很低。
為了檢驗各沉積年代黃土層導熱系數(shù)回歸方程的數(shù)學預測模型的預測能力,以模型的預測值與原始樣本數(shù)據(jù)為坐標值,對所有的樣本點繪制預測圖(圖3),并統(tǒng)計計算樣本值與預測值的平均殘差、平均絕對殘差、均方根誤差(表8)。
圖3 導熱系數(shù)的經(jīng)驗估計模型預測
模型名稱nAEAAERMSEQp3黃土100.010.160.28Qp2-2黃土120.000.040.16Qp2-1黃土80.140.160.27Qp1黃土12-0.040.080.21
由圖3可知,各沉積年代黃土導熱系數(shù)的所有樣本點均在預測圖的對角線附近均勻分布,說明了導熱系數(shù)的預測值與樣本值差異很小,模型所擬合的效果是滿意的。其次,均方根誤差的數(shù)理統(tǒng)計意義就是衡量模型預測值與原始值的差異大小,根據(jù)表8統(tǒng)計的檢驗結果,各沉積年代黃土導熱系數(shù)模型的均方根誤差(RMSE)值在0.16~0.28之間,值均很小,表明通過預測模型得到的結果是可信的,為黃土塬區(qū)黃土導熱系數(shù)估算提供了一種可靠新方法。
1)通過對95組黃土的室內(nèi)試驗數(shù)據(jù)進行統(tǒng)計分析,結果表明,黃土的物理參數(shù)與導熱系數(shù)相關程度高,其中黃土的干密度、孔隙比與導熱系數(shù)強相關;
2)各沉積年代黃土的物理參數(shù)變量間存在多重相關性,隨沉積年代越久遠,導熱系數(shù)呈非線性增大趨勢,中更新世晚期至早期的增幅最大,增幅為8.7%;
3)黃土的導熱系數(shù)隨干密度的增大而增大,隨孔隙比的減小而減小,在晚更新世至中更新世早期隨含水率增大而增大,在中更新世早期至早更新世隨含水率減小而呈增長趨勢;
4)對于樣本數(shù)據(jù)少的情況,選取偏最小二乘回歸原理(PLS),建立了黃土的物理參數(shù)與導熱系數(shù)間的數(shù)學預測模型,通過檢驗,預測模型得到的結果是可信的,可為咸陽南部黃土塬區(qū)淺層地熱能開發(fā)利用前期評估與工程系統(tǒng)設計提供參考。