徐 霈,李家龍,李 聰,鄧衛(wèi)東
(1.招商局重慶交通科研設計院有限公司,重慶 400067; 2.國家山區(qū)公路工程技術研究中心,重慶 400067;3.山區(qū)道路工程與防災減災技術國家地方聯合工程實驗室,重慶 400067;4.重慶奉建高速公路有限公司,重慶 404699)
“數據豐富與知識貧乏”是當今信息時代人類面臨的突出問題,“向數據要知識”的數據挖掘與知識發(fā)現研究成為近年來人工智能AI(Artificial Intelligence)與大數據BD(Big Data)領域研究的重心與熱點。對道路結構開展全面、準確評價是有效實施智能管養(yǎng)的基礎條件,而目前行業(yè)內主流檢測(監(jiān)測)方法或手段所得數據,具有數量大、維度高、信息交叉等特點,即“富數據—貧知識”矛盾突出,這給合理評價道路結構在役技術狀況帶來了極大的挑戰(zhàn)。目前路面質量評價存在指標籠統、信息交叉失真,指標區(qū)分度不清晰,養(yǎng)護指導性不強,評價維度不全面等問題,給管養(yǎng)單位準確掌握道路結構在役狀況、制定科學養(yǎng)護方案帶來技術難題,不利于促進企業(yè)降本增效。
為了全面、準確地評價路面技術狀況,我國研究人員在路面技術狀況評價指標方面開展了大量工作,通過實測數據,采用不同的方法和模型,建立了不同的路面技術狀況評價指標體系。謝峰等[1]通過模糊神經網絡的方法建立了高速公路路面使用性能綜合評價方法,該模型與實際路況符合性較好;潘懷兵[2]通過主成分分析方法,克服了路面性能綜合評價指標權重分配的主觀影響因素,使得綜合評價指標更具有客觀性和科學性;胡霞光[3]通過遺傳算法建立了路面使用性能評價GANN模型,對權重值和閾值進行了優(yōu)化,得到了較優(yōu)的模型;陸鍵[4]通過聚類分析確定專家個體權重向量的K類劃分,引入專家個體權重向量權重系數,進而得出常權系數值,提出變權模型和分組變權模型計算評價模型權重系數值;周嵐[5]通過分析江蘇省高速公路瀝青路面損害類型,對規(guī)范確定的評價指標進行了改進,確定了江蘇省高速公路瀝青路面使用性能評價體系;劉文[6]建立了基于可拓理論的綜合評估模型,并采用江蘇京滬公路路面檢測數據對該模型進行了驗證,結果表明,基于可拓理論的評估模型能對路面使用性能進行準確評價,可驗證該評價模型的實用性;鞏建[7]利用變權原理將主觀彎沉權重和客觀彎沉權重相結合,建立了基于彎沉指標的瀝青路面使用性能評價模型,并通過工程實例對評價模型進行應用,表明新的評價模型能夠更客觀、更準確地體現路面實際狀況;劉圣潔[8]以集對分析理論為基礎,建立了路面性能指標與路面性能各等級標準之間的聯系度表達式,將集對分析聯系度表達式用于路面性能評價,評價結果與路況符合性高。
現行路面使用性能評價指標盡管已被使用多年,但在實際應用中出現的問題越來越難以滿足現今公路養(yǎng)護管理的需求,評價結果也難以為路面養(yǎng)護決策提供依據[9-11]?;谏鲜鲅芯糠治觯疚臄M采用因子分析方法,歸并影響因素,構建個數較少的潛在因子,代替原有個數較多的表觀參數(檢/監(jiān)測所得),克服原始數據相關性、重疊性顯著等弊端,保留其絕大部分信息,從而構建起通過少量潛在因子精準評價道路結構服役性態(tài)的全新體系。
因子分析是一種處理較多數據的方法,它通過對原始變量數據的相關關系及結構探索,用幾個抽象的新變量來表示原始變量中信息的結構,新變量稱之為“公因子”。原始變量是易收集的顯性變量,因子則是無法直接得到的潛在變量。當變量不多時,易處理數據,甚至直觀比較即可;當變量較多時,就需使用多元統計分析,采用專門的方法來減少變量,用個數較少的新變量來代替原始變量,且新變量能涵蓋原始變量較多的信息,要實現這種情形則原始變量之間一般來說有一定的相關性,是一定程度上的降維處理[12-14]。
因子分析法的主要步驟如下:1) 對數據樣本進行標準化處理;2) 計算樣本的相關系數矩陣;3) 求解相關系數矩陣的特征根、特征向量和方差貢獻率;4) 根據累計貢獻率確定主因子的個數;5) 計算因子載荷矩陣,并對相關因子進行命名解釋。
公因子是不可直接觀測但又客觀存在的共同影響因素,每個變量都可表示成公因子的線性函數與特殊因子之和,即
其中:F1,F2,…,Fm稱為公因子;εi稱為Xi的特殊因子。該模型可用矩陣表示為:
X=AF+ε
其中:
1)m≤p;
2)E(F)=E(ε)=0;
3)Cov(F,ε)=0,即公因子與特殊因子不相關;
4)Var(F)=Im,即各個公因子不相關,且方差為1;
5)Var(ε)=diag(σ12,σ22,…,σp2),即各個特殊因子不相關,方差可以不同。
上述矩陣可以表達為:
其中各項的含義是:
1)A為因子載荷矩陣;
2)aij為因子載荷,是第i個變量在第j個因子上的負荷,如果把Xi看成m維空間中的點,則aij表示它在坐標軸Fj上的投影。
因子得分是因子分析中比較重要的結果,是獲取綜合得分的前提。通過載荷矩陣計算各公因子在每個樣本上的具體數值,同時用因子得分代替原始變量,以達到降維效果。
假設Fj對變量X1,…,Xp的回歸方程為
因為Fm和Xi都已經被標準化,有
由因子載荷的統計意義可知:
aij=rX,Fj=E(XiFj)=E[Xi(bj1X1+…+bjpXp]=bj1E(Xi·X1)+…+bjpE(Xi·Xp)=bj1ri1+…+bjpripi=1,…,p
整理為:
Rbj=ajj=1,…,m
其中:
bj=(bj1,bj2,…,bjp)T,aj=(a1j,b2j,…,bpj)T,
所以有:
bj=R-1ajj=1,…,m
令:
有:
可得:
其中:X=(X1,X2,…,Xp)T。
1) 對現行技術狀況評定檢測數據進行KMO和Bartlett檢驗以及顯著性水平檢驗,以此分析該類數據的相關性以及因子分析的適用性;
2) 通過相關性矩陣以及因子旋轉抽取特征值大于1的因子,并根據因子載荷矩陣分析不同檢測指標數據在所抽取因子上的權重數,據此進行因子分析模型計算和命名解釋性分析。
2.1.1 路面實測指標選取
為對路面技術狀況實測數據進行因子分析,選取路面技術狀況各分項評價指標的原始檢測數據,其中路面損壞狀況指數PCI選用實際檢測數據破損率、路面跳車指數PBI選用實測縱斷面高差Δh計算每km代表值。路面實測數據采用云南某高速公路2019年公路技術狀況指標檢測數據,如表1所示。
2.1.2 相關性分析及因子分析適用性檢驗
為確定所選取的數據是否能夠進行因子分析,需要對選取數據進行相關性分析。本文采用相關系數矩陣以及KMO和Bartlett檢驗,測試該數據因子分析的適用性。經KMO和Bartlett檢驗,其中KMO值為0.549,根據統計學家Kaiser給出的KMO度量標準可知[15],選取的原始變量適合進行因子分析;Bartlett球度檢驗得出的相伴概率Sig.為0.000,小于顯著性水平0.05,因此拒絕Bartlett球度檢驗的零假設,認為變量間存在較強的相關性,適合做因子分析。相關系數矩陣如表2所示。
由表2可知,通過相關系數矩陣對所選指標X1~X6進行相關性分析,平整度X2分別與車轍深度X3和縱斷面高差X5的相關系數值為0.332和0.486,呈現出較強的相關性;路面破損率X1與實測彎沉X4相關系數值為0.580,呈現出較強的相關性;路面磨耗X6與縱斷面高差X5和實測彎沉X4相關性不顯著。
2.1.3 公因子提取
將采用的云南某高速公路實測數據經無量綱標準化處理[16]后進行因子分析,各個公因子的特征值、累計貢獻率如表3所示。
表1 云南某高速公路2019年公路技術狀況檢測數據匯總
表2 相關系數矩陣
表3 公因子的特征根、貢獻率和累計貢獻率
由表3可知,前3個因子變量的特征值均大于1,并經過最大方差旋轉后其方差貢獻率分別為26.685%、24.893%和22.029%,累計方差貢獻率為73.607%,說明這3個因子可把所選6個路面技術狀況評定指標的較大部分信息反映出來,因此可選取這3個因子作為路面技術狀況的綜合評價指標。
2.1.4 因子命名解釋
因子載荷矩陣是因子分析的核心計算結果,通過對提取的3個公因子進行載荷矩陣分析,得到各個指標的載荷矩陣,如表4所示。
表4 各指標正交旋轉后的因子載荷矩陣
由表4可知,實測彎沉X4和破損率X1在第1個因子上有較高的載荷,說明第1個因子主要解釋了該2個指標,可命名為結構性能因子SPF;平整度X2和車轍深度X3在第2個因子上有較高的載荷,說明第2個因子主要解釋了這2個指標,可命名為行駛舒適因子CSF;路面磨耗X6和縱斷面高差X5在第3個因子上有較高的載荷,說明第3個因子主要解釋了該2個指標,可命名為行駛安全因子DSF。
通過旋轉后的成分矩陣得到因子的分系數矩陣,采用回歸法計算因子的得分系數,如表5所示。
表5 因子得分系數矩陣
由表5可知,各因子得分函數如式(1)~式(3):
SPF=0.590X1+0.039X2-0.044X3+0.535X4-0.109X5-0.025X6
(1)
CSF=0.041X1+0.479X2+0.606X3-0.092X4+0.248X5-0.218X6
(2)
DSF=-0.198X1+0.109X2-0.277X3+0.097X4+0.453X5+0.693X6
(3)
為了對高速公路全線里程逐段進行綜合評價,采用計算因子加權總分的方法,以3個因子方差貢獻率為權重數。因此,綜合評價因子指數CPF如式(4)所示:
CPF=0.365SPF+0.338CSF+0.297DSF
(4)
通過對該高速公路的道路實測數據分別計算得出PQI和CPF,匯總后對比分析如圖1、表6所示。
(a) 全路段CPF與PQI指數排名對比
(b) 路段0~18CPF與PQI指數排名對比
從圖1可以看出,綜合評價因子CPF與PQI指數排名在數據點0~20范圍存在較大偏差,呈現出相反的路段綜合評價結果;在數據點20以后,2種評價指標間仍然存在一定的偏差,但趨勢基本接近,呈現出較一致性的路段綜合評價結果。
從表6可以看出,PQI得分受PCI分值影響最大。在路段0~9間,平整度值大部分超過極限值2.3,表現出平整度較差,RQI分值較低,但此段路面破損較好,PCI分值較高,PQI分值也隨之仍然較高,路段被評定為“優(yōu)”;在路段10~20間,平整度均小于2.3,表現出平整度較好,RQI分值較高,但此段路面破損較差,PCI分值較低,PQI分值也隨之降低,并且路段19因為路面破損PCI分值低,被評定為“良”。
綜合全路段評定趨勢來看,現行評價標準中以路面破損PCI為主控指標,對PQI分值和路段最終評定影響最大。但在實際養(yǎng)護運營管理中,平整度較差路段不僅對駕乘人員行駛舒適度影響較大,車輛的頻繁顛簸還會對路面造成沖擊和損傷,最終導致路面病害的發(fā)生,平整度較差路段也應根據分值評定為較差路段,從而提前進行養(yǎng)護維修。
表6 路段數1~20的分項評價指標匯總
現有路面技術狀況評價體系PQI與新構建的CPF綜合評價體系的對比如圖2所示。
從圖2可以看出,CPF綜合評價體系相比較于PQI綜合評價體系分項評價指標較少,將繁雜多維度且有交叉性的分項評價指標轉換為低緯度且獨立性較強的分項評價指標體系,使得綜合評價體系簡單易懂針對性強。
根據JTG 5210—2018《公路技術狀況評定標準》[17],路面技術狀況綜合評定指數PQI如式(5)所示:
PQI=0.35PCI+0.30RQI+0.15RDI+0.10PBI+0.10SRI/PWI
(5)
(a) PQI綜合評價體系
(b) CPF綜合評價體系
對比公式(4)、(5)可知,相較于現行路面技術狀況評價體系PQI,CPF綜合評價體系將目前各分項評價指標進行關聯性組合,并通過前文的權重分配系數計算,給出了相應的權重值,特別是將彎沉評價指標有效聯系起來,彌補了PQI評價中無法給出彎沉權重值而導致彎沉檢測被忽視的弊端。
1) 本文采用因子分析法將現有個數較多的路面技術狀況評價指標轉換為個數較少的公因子,并提出了一種新的路面技術狀況評價指標CPF體系,該評價體系由結構性能因子SPF、行駛舒適因子CSF和行駛安全因子DSF組成。
2) 通過CPF與現行PQI指標的對比分析,驗證了因子分析方法的可行性以及CPF綜合評價體系的客觀性,CPF能有效彌補現行評價指標相互重疊以及彎沉權重值缺失的情況,使得評價結果更符合路面的實際狀況。
3)CPF評價方法依靠實測路段的檢測數據間關系進行分項評價指標間的權重分配,并通過與PQI評價結果進行對比,該權重值的確定方法具有較好的可靠性。