王軍龍
(西安鐵路職業(yè)技術(shù)學院 土木工程系,西安 710600)
砂土液化是在循環(huán)往復荷載作用下,飽和砂土層孔隙水位升高,有效應力降低,造成地基承載力部分或者全部喪失,形成的一種破壞性嚴重的區(qū)域性地質(zhì)災害。20世紀60年代以來,幾次大的地震,如日本新瀉地震(1964)、美國阿拉斯加地震(1964)、中國唐山大地震(1978)以及神戶大地震(1995)、汶川特大地震(2008)等均因砂土液化導致堤防或建筑物大規(guī)模的破壞,給人類造成了巨大的經(jīng)濟損失,砂土液化問題引起了工程界的廣泛關(guān)注[1-2]??紤]單因素判定砂土液化具有一定的片面性,多因素綜合評判就成為砂土液化判別分析的一種可行方法。據(jù)此,國內(nèi)外的學者提出了多種綜合預測模型和方法,如神經(jīng)網(wǎng)絡(luò)模型、支持向量機模型、模糊綜合評價法、距離判別法、投影尋蹤模型、分形-插值模型[3-9]等。
總結(jié)上述模型和方法,可以將其分為2種類型:①以砂土液化分類標準為基礎(chǔ)采用一定的數(shù)學方法建立模型,這類模型和方法主要包括模糊綜合評價法、投影尋蹤模型和分形-插值模型,其中投影尋蹤模型和分形-插值模型將砂土分類標準直接轉(zhuǎn)化為數(shù)學表達式,易于使用,這類模型的有效性依賴于分類標準的準確性;②以一定的砂土液化樣本數(shù)據(jù)為基礎(chǔ),對已有的模型和方法進行訓練,從而建立砂土液化預測模型,模型的有效性依賴于訓練樣本的數(shù)量,這類模型和方法主要有神經(jīng)網(wǎng)絡(luò)模型、支持向量機模型和距離判別法等。
從模型的通用性和實用性考慮,具有一定數(shù)學表達式的模型更易于被理解和應用,其只需將實際數(shù)據(jù)輸入數(shù)學表達式中即可計算出預測結(jié)果。為了建立簡單實用的砂土液化預測模型,本文結(jié)合主成分分析和Logistic回歸模型來描述砂土液化等級與影響因素之間的映射關(guān)系,建立了砂土液化預測的數(shù)學表達式。根據(jù)數(shù)據(jù)樣本的不同,該模型可以實現(xiàn)上述2種類型,即砂土液化分類標準的數(shù)學表達,以及砂土液化實例數(shù)據(jù)的經(jīng)驗表達。最后,工程實例分析結(jié)果顯示,本文建立的砂土液化預測模型簡單實用,預測效果良好,可以在工程中推廣應用。
對于砂土液化預測問題,砂土液化等級為類別變量[9](不液化(Ⅰ)、輕微液化(Ⅱ)、中等液化(Ⅲ)、嚴重液化(Ⅳ)4個等級),砂土液化指標為連續(xù)變量,對于這種連續(xù)變量到類別變量之間的函數(shù)關(guān)系,可以采用Logistic回歸分析進行描述。由于砂土液化指標之間具有高度的相關(guān)性,直接建立Logistic模型,可能導致模型不穩(wěn)定、解釋上的沖突等[10]。為此,本文在建立Logistic回歸模型之前,采用主成分分析降低指標之間的相關(guān)性,將多個指標綜合為少數(shù)幾個彼此獨立的主成分,從而避免多重共線性的影響。
主成分分析是一種將多維數(shù)據(jù)進行降維處理,簡化為少數(shù)幾個不相關(guān)的綜合指標(主成分)的多元統(tǒng)計分析方法。其建模過程具體如下:
(1)數(shù)據(jù)預處理。假設(shè)有m個樣本(i=1,2,…,m),n 個指標(j=1,2,…,n),對原始數(shù)據(jù) X=進行均值化處理,可保留數(shù)據(jù)內(nèi)的變異信息[11]:
(2)計算均值化數(shù)據(jù)的協(xié)方差矩陣S=(sij)n×n。
(3)計算協(xié)方差矩陣的特征值和特征向量。S的n個特征值記為:λ1≥λ2≥…≥λn,標準化特征向量為ajj=(aj1,aj2,…,ajn),則第 i個樣本的第 j個主成分為
Logistic回歸分析的目的是建立經(jīng)驗公式,以便由自變量預測因變量概率分布。令y=1,2,3,4表示砂土液化的4個等級。令q1=p(y≤1),q2=p(y≤2),…,q3=p(y≤3),常用的 Logistic回歸模型是[12]:
式中:βi0為截距,i=1,2,…,4;β1,…,βn為斜率系數(shù);x1,…,xn為自變量。
由已有觀測值能估計出 βi0,β1,…,βn,從而砂土液化各等級的概率表達式:
這時對于給定的自變量x1,…,xn的值,由回歸方程可以預測 q1,q2,q3,再由 p(y=1)=q1,p(y=2)=q2-q1,…,p(y=3)=q3- q2,p(y=4)=1-q3可以預測各砂土液化等級概率。根據(jù)各類別的概率,由可以確定響應變量屬于類別y=l。
首先本文建立第1種類型的主成分-Logistic回歸模型,即模型的建立以砂土液化等級分類標準為基礎(chǔ),應用效果完全依賴于砂土液化等級分類標準的準確性。
3.1.1 評價指標與分類標準
影響砂土液化的因素很多,但大體上可分為3大類:第1類是砂土特性,如土的種類、顆粒組成和密實度;第2類是土層埋藏條件;第3類是地震因素或稱地震條件。參考以往研究,選擇震級M,地面加速度最大值gmax,標貫擊數(shù) N63.5,比貫入阻力 Ps,相對密度Dr,平均粒徑D50,地下水位dw7個因素作為評價指標。各指標的分類標準詳見文獻[9]。
3.1.2 生成樣本數(shù)據(jù)
由于本文模型的建立和參數(shù)的確定是由數(shù)據(jù)驅(qū)動,因此需要利用砂土液化分類標準來生成數(shù)據(jù)作為建?;A(chǔ)。由于正態(tài)分布是自然界中最常見的分布形式之一,按照各指標的分類標準,每個指標在每個等級范圍內(nèi)按照正態(tài)分布隨機產(chǎn)生20個樣本,其中分布參數(shù)均值和標準差(3σ原理)按照下式確定:
式中:Cmax和Cmin分別為等級最大值和最小值為均值,σ為標準差。
采用Matlab軟件normrnd()函數(shù)即可實現(xiàn),對于每個指標采用同一組隨機數(shù)值,共形成80個評價樣本,將不液化(Ⅰ)、輕微液化(Ⅱ)、中等液化(Ⅲ)、嚴重液化(Ⅳ)分別賦予響應值 4,3,2,1,具體如表1所示。
3.1.3 建立預測模型
首先按照本文介紹的主成分分析步驟,計算得到協(xié)方差矩陣的特征值為0.002,0.006,0.010,0.018,0.019,0.061,2.267,特征值 2.267 累計方差貢獻率為95.1%>85%,因此取其對應的特征向量a=(-0.166,-0.366,0.497,0.388,0.425,0.338,0.382)。根據(jù)式(1)和式(2)得到主成分計算公式為
表1 樣本數(shù)據(jù)Table 1 Sample data
根據(jù)式(7)可計算各樣本對應的主成分值,并用于建立Logistic回歸模型。獲得樣本的主成分值以后,采用Logistic模型建立各樣本對應的主成分與經(jīng)驗等級(響應值)之間的函數(shù)關(guān)系。以SPSS軟件實現(xiàn)Logistic模型參數(shù)的求解,具體可以參閱相關(guān)軟件的介紹資料,本文不再復述軟件求解過程,得到模型表達式如下:
將各指標實測值代入式(8)至式(11)中即可計算砂土液化屬于各等級的概率,從而確定砂土液化等級。Logistic回歸模型對上述樣本的擬合結(jié)果與實際結(jié)果完全一致,說明其可以很好地表達砂土液化等級分類標準。
上述第1種類型的主成分-Logistic回歸模型實現(xiàn)了砂土液化等級分類標準的數(shù)學表達,但是很容易發(fā)現(xiàn)砂土液化等級分類標準隨機產(chǎn)生的樣本完全滿足所有指標的分級標準,而實際工程中,許多指標數(shù)據(jù)并不可能同時屬于某個等級,并且分類標準的劃分具有主觀性。下面以砂土液化實例作為樣本數(shù)據(jù)來建立主成分-Logistic回歸模型,從理論上講這類模型應該更符合實際,但是由于樣本數(shù)量的限制,也不易達到理想的預測效果。
3.2.1 評價指標和樣本數(shù)據(jù)
同樣采用上述7個因素作為評價指標,采用文獻[13]中提供的25組數(shù)作為分析樣本,具體數(shù)據(jù)詳見文獻[13]。其中前20組數(shù)據(jù)作為建模樣本數(shù)據(jù),后5組數(shù)據(jù)則作為檢驗樣本,以檢驗模型的預測效果。
3.2.2 建立模型
以20組建模樣本數(shù)據(jù),按照本文介紹的主成分分析步驟,計算得到協(xié)方差矩陣的特征值為0.016,0.036,0.044,0.114,0.185,0.355,0.734,最大的前3個特征值累計方差貢獻率為85.8%>85%,因此取其對應的特征向量計算前3個主成分。根據(jù)式(1)和
式(2)得到主成分計算公式為
根據(jù)以上各式可計算各樣本對應的主成分值,并用于建立Logistic回歸模型。獲得了樣本的主成分值以后,采用Logistic模型建立各樣本對應的主成分與經(jīng)驗等級(響應值)之間的函數(shù)關(guān)系。以SPSS軟件實現(xiàn)Logistic模型參數(shù)的求解,得到模型表達式如下:
將各指標實測值代入式(15)至式(18)中即可計算砂土液化屬于各等級的概率,從而確定砂土液化等級。Logistic回歸模型對前20個樣本的擬合結(jié)果與實際結(jié)果完全一致,說明其可以很好地表達砂土液化等級與砂土液化指標之間的經(jīng)驗關(guān)系。
下面以實例數(shù)據(jù)驗證和比較上述2種類型的主成分-Logistic回歸模型對砂土液化等級的預測效果。由于第1種類型的主成分-Logistic回歸模型采用的是分類標準生成的數(shù)據(jù),首先以其對文獻[13]中提供的25組數(shù)據(jù)進行預測,檢驗預測效果,并與分形-插值模型[9]和可拓物元模型[13]進行對比分析。本文僅列出了3種預測結(jié)果與實際結(jié)果存在差異的樣本,見表2。
從表2的預測結(jié)果可以看出,本文所建立的主成分-Logistic回歸模型與可拓物元模型具有相同的預測效果,都僅出現(xiàn)了2處與實際不一致的地方,預測準確率92%,而分形-插值模型出現(xiàn)了3處與實際不一致的地方,預測準確率88%,稍低于主成分-Logistic回歸模型。上述結(jié)果說明了本文所建立的第一種類型的主成分-Logistic回歸模型預測效果良好,可以使用。
表2 樣本實測值和不同模型的預測結(jié)果Table 2 Measured values of samples and model-predicted results
其次,以5組檢驗樣本數(shù)據(jù)對第2種類型的主成分-Logistic回歸模型進行檢驗,并與第1種類型的主成分-Logistic回歸模型進行對比分析,結(jié)果見表3。
表3 2種類型的主成分-Logistic回歸模型預測結(jié)果Table 3 Predicted results of two types of PCA-Logistic models
從表3的結(jié)果可以看出,2種類型的主成分-Logistic回歸模型對樣本的預測等級完全一致,僅最后一個樣本與實際結(jié)果存在差異,從對各等級的概率結(jié)果來看,第2種類型的主成分-Logistic回歸模型計算樣本25屬于等級Ⅰ的概率更大(0.340>0.117),說明樣本25更偏向于等級Ⅰ,從這個角度來看,第2種類型的主成分-Logistic回歸模型預測結(jié)果確實更符合實際。如果能利用更多的實例數(shù)據(jù),相信可以得到更好的預測效果。
(1)現(xiàn)有砂土液化等級的多指標預測模型可以分為2種類型:第1類以砂土液化等級分類標準為基礎(chǔ),預測效果依賴于分類標準的準確性;第2類以實例數(shù)據(jù)為基礎(chǔ),預測效果依賴于樣本的數(shù)量。
(2)根據(jù)砂土液化分類標準生成樣本數(shù)據(jù),以主成分分析對數(shù)據(jù)進行降維處理,以Logistic模型描述砂土液化等級與影響因素之間的映射關(guān)系(分類標準),建立了第1種類型的主成分-Logistic回歸模型,工程實例分析結(jié)果顯示該模型預測效果良好,可以在實際中應用。
(3)以工程實例數(shù)據(jù)作為訓練樣本建立第2種類型的主成分-Logistic回歸模型,用于描述砂土液化等級與影響因素之間的經(jīng)驗關(guān)系,與第1種類型的主成分-Logistic回歸模型的對比結(jié)果顯示,第2種類型的主成分-Logistic回歸模型預測結(jié)果更符合實際情況,在具有較多實例數(shù)據(jù)時,其更具有應用價值。
[1]任紅梅,呂西林,李培振.飽和砂土液化研究進展[J].地震工程與工程振動,2007,27(6):166-174.(REN Hong-mei,LV Xi-lin,LI Pei-zhen.Advances in Liquefaction Research on Saturated Soils[J].Journal of Earthquake Engineering and Engineering Vibration,2007,27(6):166-174.(in Chinese))
[2]勾麗杰,劉家順.RBF神經(jīng)網(wǎng)絡(luò)模型在砂土液化判別中的應用研究[J].長江科學院院報,2013,30(4):76-81.(GOU Li-jie,LIU Jia-shun.Application of RBF Neural Network Model to Evaluating Sand Liquefaction[J].Journal of Yangtze River Scientific Research Institute,2013,30(4):76-81.(in Chinese))
[3]劉年平,王宏圖,袁志剛,等.砂土液化預測的Fisher判別模型及應用[J].巖土力學,2012,33(2):554-557.(LIU Nian-ping,WANG Hong-tu,YUAN Zhigang,et al.Fisher Discriminant Analysis Model of Sand Liquefaction and Its Application[J].Rock and Soil Mechanics,2012,33(2):554-557.(in Chinese))
[4]陳國興,李方明.基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)模型的砂土液化概率判別方法[J].巖土工程學報,2006,28(3):301- 305.(CHEN Guo-xing,LI Fang-ming.Probabilistic Estimation of Sand Liquefaction Based on Neural Network Model of Radial Basis Function[J].Chinese Journal of Geotechnical Engineering,2006,28(3):301-305.(in Chinese))
[5]陳榮淋,林建華,黃群賢.支持向量機在砂土液化預測中的應用研究[J].中國地質(zhì)災害與防治學報,2005,16(2):15-18.(CHEN Rong-lin,LIN Jianhua,HUANG Qun-xian.Application of the Support Vector Machine in Prediction of Sand Liquefaction[J].The Chinese Journal of Geological Hazard and Control,2005,16(2):15-18.(in Chinese))
[6]薛新華,張我華,劉紅軍.砂土地震液化的模糊綜合評判法[J].重慶建筑大學學報,2006,28(1):55-58.(XUE Xin-hua,ZHANG Wo-hua,LIU Hong-jun.Comprehensive Fuzzy Evaluation Method for Sand Liquefaction[J].Journal of Chongqing Jianzhu University,2006,28(1):55-58.(in Chinese))
[7]金志仁.基于距離判別分析方法的砂土液化預測模型及應用[J].巖土工程學報,2008,30(5):776-780.(JIN Zhi-ren.Prediction of Sand Liquefaction Based on Distance Discriminant Analysis and Its Application[J].Chinese Journal of Geotechnical Engineering, 2008,30(5):776-780.(in Chinese))
[8]汪明武,金菊良,李 麗.基于實碼加速遺傳算法的投影尋蹤方法在砂土液化勢評價中的應用[J].巖石力學與工程學報,2004,23(4):631-634.(WANG Ming-wu,JIN Ju-liang,LI Li.Application of PPMethod Based on RAGA to Assessment of Sand Liquefaction Potential[J].Chinese Journal of Rock Mechanics and Engineering,2004,23(4):631-634.(in Chinese))
[9]王 威,蘇經(jīng)宇,馬東輝,等.飽和砂土地震液化判別的分形插值模型[J].世界地震工程,2012,28(1):118- 124.(WANG Wei,SU Jing-yu,MA Dong-hui,et al.Fractal Interpolation Model of Seismic Liquefaction Discrimination of Saturated Sandy Soil[J].World Earthquake Engineering,2012,28(1):118-124.(in Chinese))
[10]襲炯良,郟劍寧,張 揚.主成分改進的logistic回歸模型方法在流行病學分析中的應用[J].中國熱帶醫(yī)學,2005,5(2):207-209.(QIU Jiong-liang,ZHENG Jian-ning,ZHANG Yang.Application of Modified Logistic Regression Model in the Analysis of Epidemiology[J].China Tropical Medicine,2005,5(2):207-209.(in Chinese))
[11]葉雙峰.關(guān)于主成分分析做綜合評價的改進[J].數(shù)理統(tǒng)計與管理,2001,20(2):52-61.(YE Shuangfeng.The Application and Consideration about Principal Component Analysis[J].Application of Statistics and Management,2001,20(2):52-61.(in Chinese))
[12]吳令云,吳家祺,吳誠鷗,等.MINITAB軟件入門:最易學實用的統(tǒng)計分析教程[M].北京:高等教育出版社,2012.(WU Ling-yun,WU Jia-qi,WU Cheng-ou,et al.MINITAB Software Starter Guide:The Easiest and Most Practical Course for Statistical Analysis[M].Beijing:Higher Education Press,2012.(in Chinese))
[13]陳榮淋.基于可拓學和支持向量機理論的砂土液化勢綜合評價研究[D].廈門:華僑大學,2004.(CHEN Ronglin.Research on Assessment of Sand Liquefaction Potential Based on Extenics and Support Vector Machine[D].Xiamen:Huaqiao University,2004.(in Chinese))