孫德鑫
(長(zhǎng)安大學(xué)工程機(jī)械學(xué)院,陜西 西安 710064)
中國(guó)有著全世界分布最為廣泛的黃土高原,主要分布于陜西等7個(gè)省區(qū)、34個(gè)地級(jí)市,分布面積達(dá)44萬(wàn)km2,占國(guó)土面積的6.6%。隨著國(guó)家戰(zhàn)略的逐步實(shí)施,平山修城、治溝造地等大批工程落地。然而,大批的工程建設(shè)嚴(yán)重?cái)_動(dòng)土體,誘發(fā)了一系列工程災(zāi)變,如邊坡沖蝕、邊坡滑坡、填方路基坍塌等[1]。通常認(rèn)為,水是導(dǎo)致邊坡滑坡等災(zāi)變最為重要的因素[2],因?yàn)榻涤耆霛B會(huì)造成土壤的內(nèi)聚力和摩擦力降低,為邊坡滑坡等災(zāi)變提供必要條件[3]。而土壤含水率深層原位探測(cè)是揭示滑坡等孕育機(jī)制和演化規(guī)律的基礎(chǔ)[4]。為了滿足重大工程擾動(dòng)下的含水率測(cè)量需要,提出一種適用于不同土壤類(lèi)型且不受深度制約的探測(cè)方法。通過(guò)將土壤含水率識(shí)別技術(shù)嵌入在搭載有機(jī)器視覺(jué)系統(tǒng)的孔洞機(jī)器人上,來(lái)完成對(duì)土壤含水率的測(cè)量,而針對(duì)此系統(tǒng)的研發(fā),土壤含水率的智能識(shí)別算法最為關(guān)鍵。
目前,對(duì)于含水率的原位探測(cè)有接觸式、非接觸式等方法。通常,時(shí)域反射法(TDR)[5]、頻域反射法(FDR)[6]及中子法[7]均屬于接觸式探測(cè)方法。時(shí)域反射法一般通過(guò)獲得土壤的介電常數(shù)來(lái)進(jìn)行含水率的測(cè)量,可以進(jìn)行連續(xù)測(cè)量,測(cè)量方位廣且對(duì)土壤環(huán)境無(wú)擾動(dòng),但其設(shè)備較復(fù)雜且昂貴。頻域反射法通常獲取土壤共振頻率來(lái)測(cè)量土壤含水率,它幾乎具有時(shí)域反射法的所有優(yōu)點(diǎn),但其更容易受到土壤黏粒、鹽度等因素的影響。同時(shí),針對(duì)土壤含水率長(zhǎng)時(shí)間的實(shí)時(shí)監(jiān)測(cè)問(wèn)題,通常需要對(duì)所測(cè)得的含水率結(jié)果進(jìn)行溫度校正。中子法對(duì)土壤含水率的獲取主要通過(guò)探測(cè)土壤內(nèi)部的慢中子云密度來(lái)實(shí)現(xiàn),其優(yōu)點(diǎn)是操作簡(jiǎn)單、速度較快且一般不受溫度的影響;其缺點(diǎn)是設(shè)備較昂貴、精度低、容易受土壤理化性質(zhì)的影響;此外,中子的使用也會(huì)對(duì)使用者的健康有影響。相比于頻域反射法和中子法,時(shí)域反射法的精度更高。紅外遙感法[8]和探地雷達(dá)法[9]屬于非接觸式土壤含水率測(cè)量方法。肖穎等以Lamber-Beer定律為基礎(chǔ),研發(fā)了用于土壤含水率測(cè)量的近紅外水分儀,該測(cè)量方法較其他方法具有非接觸連續(xù)檢測(cè)、穩(wěn)定及安裝方便等優(yōu)點(diǎn),但在土壤壓實(shí)度差異較大時(shí),需要在測(cè)量過(guò)程中進(jìn)行標(biāo)定,且一般對(duì)土壤粒徑大小比較敏感。Belton在1937年提出了探地雷達(dá)探測(cè)原理,后期被應(yīng)用到土壤含水率檢測(cè)中。探地雷達(dá)具有較高的分辨率以及強(qiáng)大的抗干擾能力,能適應(yīng)大范圍的土壤含水率檢測(cè),但其設(shè)備昂貴,數(shù)據(jù)的處理過(guò)程較為復(fù)雜,因此并未被大規(guī)模應(yīng)用。針對(duì)黃土含水率的原位檢測(cè)還有其他的一些方法,如電阻法和張力計(jì)法。電阻法利用土壤電阻率的變化進(jìn)行土壤含水率的測(cè)量,探測(cè)快速,不會(huì)對(duì)土壤造成損傷,但對(duì)溫度和鹽分較敏感,測(cè)試誤差較大。張力計(jì)法是通過(guò)將張力計(jì)插入土壤中,利用土壤中水分的壓差獲得含水率。張力計(jì)法的儀器操作簡(jiǎn)單、方便,可以進(jìn)行實(shí)時(shí)觀測(cè),但容易受環(huán)境的影響,使得其測(cè)量精度不高。
隨著深度學(xué)習(xí)技術(shù)的快速興起,計(jì)算機(jī)視覺(jué)的諸多領(lǐng)域開(kāi)始進(jìn)入人們的視野,其中,對(duì)圖像識(shí)別技術(shù)的研究和應(yīng)用較為突出。LeNet是LeCun提出的史上第一個(gè)卷積網(wǎng)絡(luò),被用于手寫(xiě)數(shù)字的識(shí)別。Hinton提出的AlexNet是第一個(gè)深度卷積模型,采用ReLu激活函數(shù)解決梯度消失問(wèn)題,并利用Dropout層防止在訓(xùn)練過(guò)程中的過(guò)擬合。ⅤGG和GoogleNet在深度網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上不斷加深,以提高識(shí)別的準(zhǔn)確率。然而,一味地增加網(wǎng)絡(luò)深度會(huì)造成模型退化問(wèn)題,He等[10]提出一種殘差連接方法,并將其應(yīng)用于ResNet網(wǎng)絡(luò),成功解決了此問(wèn)題。為使移動(dòng)端或嵌入式設(shè)備能夠搭載復(fù)雜而龐大的網(wǎng)絡(luò),Google團(tuán)隊(duì)于2017年提出輕量化網(wǎng)絡(luò)MobileNet,隨后提出多個(gè)版本,其在犧牲小準(zhǔn)確率的前提下大大減少了模型參數(shù)。之后,Xception[11]等一系列輕量化模型被提出,在具有小參數(shù)量的前提下提高了圖像識(shí)別精度。Ⅴaswani等[12]提出的self-attention機(jī)制和Transformer模型,開(kāi)啟了神經(jīng)網(wǎng)絡(luò)模型新范式,在NLP(自然語(yǔ)言處理)中大放異彩,基于Transformer強(qiáng)大的特征表示能力,其被引入計(jì)算機(jī)視覺(jué)任務(wù)中。Dosovitskiy等首次提出視覺(jué)Transformers模型ⅤiT,并在圖像識(shí)別的任務(wù)上取得先進(jìn)水平。ⅤiT模型的提出為T(mén)ransformer在視覺(jué)領(lǐng)域的應(yīng)用開(kāi)啟了大門(mén),隨后,系列ⅤiT變種相繼被提出,如TNT、Swin Transformer等,從多角度、深層次挖掘了Transformer在視覺(jué)任務(wù)上的潛力。
不同地區(qū)的土壤組成差異較大,構(gòu)建所有地區(qū)的土壤數(shù)據(jù)集十分困難,這為開(kāi)發(fā)土壤含水率識(shí)別算法增加了難度。而域適應(yīng)為解決上述問(wèn)題提供了新思路,域適應(yīng)方法多種多樣,其中,基于對(duì)抗的域適應(yīng)方法是最為主流的方法。Ganin最早提出將對(duì)抗機(jī)制應(yīng)用到域適應(yīng)網(wǎng)絡(luò)訓(xùn)練中,并提出了首個(gè)使用對(duì)抗訓(xùn)練的域適應(yīng)網(wǎng)絡(luò)DANN;Tzeng在DANN的基礎(chǔ)上進(jìn)行改進(jìn),提出域適應(yīng)網(wǎng)絡(luò)ADDA,將其改進(jìn)為使用GAN損失將優(yōu)化過(guò)程分為生成器和判別器兩個(gè)獨(dú)立的目標(biāo)。為考慮對(duì)齊兩種數(shù)據(jù)的邊緣分布,Long等[13]提出了條件對(duì)抗域適應(yīng)方法CDAN。
為了實(shí)現(xiàn)土壤含水率的深層探測(cè),基于域適應(yīng)原理,利用所建立的土壤含水率數(shù)據(jù)集,基于對(duì)抗域適應(yīng)模型CDAN進(jìn)行土壤含水率的遷移識(shí)別,分別比較ResNet、Xception、MobileNetⅤ2和ⅤiT四種深度網(wǎng)絡(luò)的含水率識(shí)別效果,以最好的網(wǎng)絡(luò)作為域適應(yīng)模型CDAN的特征提取器,通過(guò)對(duì)比分析不同特征器的域適應(yīng)模型對(duì)土壤含水率圖像的識(shí)別準(zhǔn)確率,確定精度最高的模型為遷移模型,為開(kāi)發(fā)土壤地質(zhì)信息探測(cè)機(jī)器人提供技術(shù)支持。主要工作如下:
1)針對(duì)不同地區(qū)土壤差異大、使用傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)方法能力差的問(wèn)題,基于對(duì)抗域適應(yīng)方法,利用對(duì)抗域適應(yīng)模型CDAN進(jìn)行含水率的遷移識(shí)別,并比較ResNet、Xception、MobileNetⅤ2和ⅤiT四種深度模型的含水率識(shí)別效果,以結(jié)果最優(yōu)的網(wǎng)絡(luò)作為域適應(yīng)網(wǎng)絡(luò)的特征提取器。
2)在已建立的土壤含水率數(shù)據(jù)集和所構(gòu)建的遷移測(cè)試任務(wù)的基礎(chǔ)上,驗(yàn)證CDAN模型的有效性,并對(duì)比分析MobileNetⅤ2、Xception和ⅤiT模型直接遷移的效果。
土壤含水率數(shù)據(jù)集由實(shí)驗(yàn)室構(gòu)建,用于訓(xùn)練和測(cè)試所構(gòu)建的含水率智能識(shí)別算法,其包括延安土壤數(shù)據(jù)集、藍(lán)田土壤數(shù)據(jù)集、蘭州土壤數(shù)據(jù)集,共有14 400張圖像,每種黃土數(shù)據(jù)集包括5%、7%、9%、11%、13%、15%、17%、19%的8類(lèi)以2%含水率梯度變化的土壤圖像,每張圖像的像素大小為244×244。分別以8∶2的比例將各數(shù)據(jù)集內(nèi)的圖片劃為訓(xùn)練集和測(cè)試集,用以網(wǎng)絡(luò)參數(shù)訓(xùn)練和模型效果檢驗(yàn)。
以構(gòu)建的土壤含水率數(shù)據(jù)集為基礎(chǔ),在每?jī)煞N黃土之間進(jìn)行一種域適應(yīng)訓(xùn)練,每一種土壤可作為源域遷移至其他兩種土壤上,具體的遷移任務(wù)如表1所示。延安土壤用Y表示,蘭州土壤用Z表示,藍(lán)田土壤用T表示。
表1 遷移任務(wù)配置
ⅤiT結(jié)構(gòu)中最主要的部分為Multi-head selfattention(MSA),主要用于Transformer捕獲長(zhǎng)范圍依賴(lài)關(guān)系。具體來(lái)說(shuō),MSA串聯(lián)多個(gè)縮放點(diǎn)積注意(SA),每個(gè)SA模塊以一組query(Q)、key(K)和value(V)作為輸入。為學(xué)習(xí)不同位置之間的依賴(lài)關(guān)系,SA計(jì)算query與所有key的點(diǎn)積,并使用softmax函數(shù)獲得value的權(quán)重。Ⅴision Transformer的具體結(jié)構(gòu)如圖1所示,SA的定義如式(1)所示:
圖1 Ⅴision Transformer結(jié)構(gòu)
式中,d為Q和K的維度。
則MSA定義如下:
用Transformer處理圖像信息,采用將圖像切分成大小固定的塊的做法。首先,將輸入的圖像X∈?H×W×C重塑為X∈?N×(P×P×C),其中,C為通道數(shù),P為分割塊(patch)的大小,N為輸入序列的長(zhǎng)度。將分割塊的圖像信息、位置信息和圖像類(lèi)別信息重構(gòu)到一維向量作為輸入:
式中,xcla為可學(xué)習(xí)的嵌入詞向量;為線性變換,將向量壓縮到D維,稱(chēng)為Patch Embedding;Epos為序列位置信息,E∈?(P×P×C)×D,Epos∈?(N+1)×D。
其次,將重塑好的序列輸入到Transformer Encoder中,經(jīng)過(guò)L次Encoder處理,最后再經(jīng)過(guò)一個(gè)LayerNorm層處理:
CDAN網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,首先,使用特征提取器對(duì)源域圖像Xs和目標(biāo)域圖像Xt進(jìn)行特征提取,得到特征圖f,然后通過(guò)全連接層后得到預(yù)測(cè)結(jié)果g;然后將預(yù)測(cè)結(jié)果g與特征圖f聯(lián)合送入域鑒別器D中,?表示使用多線性映射對(duì)f和g聯(lián)結(jié)。
圖2 CDAN網(wǎng)絡(luò)結(jié)構(gòu)
2.2.1 多線性調(diào)整
使用多線性映射可以模擬不同變量之間的乘法相互作用,并且能夠捕捉到復(fù)雜數(shù)據(jù)分布后的多模態(tài)結(jié)構(gòu)。然而,使用多線性映射會(huì)造成維度爆炸,故使用隨機(jī)采樣策略解決此問(wèn)題:
式中,df表示f的維度;dg表示g的維度;T⊙(f,g)=(Rff)⊙(Rgg),d為采樣維度,Rf和Rg為隨機(jī)矩陣。
2.2.2 熵調(diào)整
條件判別器中,使用最大最小優(yōu)化方法會(huì)存在一定問(wèn)題,判別器強(qiáng)制不用樣本具有相同的重要性,而具有不確定性、難遷移的樣本會(huì)對(duì)抗產(chǎn)生負(fù)面影響。為了減少這種影響,通過(guò)熵為類(lèi)別c的預(yù)測(cè)概率,C為類(lèi)別數(shù))定量分析分類(lèi)器預(yù)測(cè)結(jié)果的不確定性,則預(yù)測(cè)結(jié)果的確定性為e-H(g)。通過(guò)基于熵的確定性策略調(diào)整域判別器,最終優(yōu)化目標(biāo)為:
式中,G為特征提取器;L為交叉熵?fù)p失函數(shù);ω(H(g))為熵感知權(quán)重,ω(H(g))=1+e-H(g);D為域鑒別器。
在驗(yàn)證域適應(yīng)算法效果前,需選擇一個(gè)合適的特征提取器,因此,對(duì)ResNet、MobileNetⅤ2、Xception和ⅤiT四種特征提取器進(jìn)行實(shí)驗(yàn)對(duì)比。四種特征提取網(wǎng)絡(luò)所搭建的含水率識(shí)別模型的測(cè)試準(zhǔn)確率曲線如圖3所示。依據(jù)不同模型的測(cè)試準(zhǔn)確率,選擇最優(yōu)的特征提取網(wǎng)絡(luò)。具體參數(shù)對(duì)比如表2所示,從表中可看出,ⅤiT在三種不同土壤數(shù)據(jù)集上的平均測(cè)試準(zhǔn)確率最高,故選擇ⅤiT作為域適應(yīng)網(wǎng)絡(luò)的特征提取器。
圖3 識(shí)別模型準(zhǔn)確率曲線
表2 不同特征提取器在三種黃土數(shù)據(jù)集上的測(cè)試準(zhǔn)確率
進(jìn)行對(duì)抗域適應(yīng)算法CDAN的遷移測(cè)試及與其他識(shí)別方法的對(duì)比分析,各方法在不同遷移任務(wù)上的測(cè)試準(zhǔn)確率如表3所示??梢杂^察到:使用MobileNetⅤ2直接遷移方法的識(shí)別準(zhǔn)確率最低;而與之相比較的其他直接遷移識(shí)別方法如Xception和ⅤiT的識(shí)別精度同樣不高。對(duì)抗域適應(yīng)方法CDAN的測(cè)試結(jié)果都明顯高于其他方法,進(jìn)行域適應(yīng)后,平均精度提高了18%以上。因此,使用域適應(yīng)方法可以有效消除源域和目標(biāo)域數(shù)據(jù)分布之間的差異,可以獲得較好的特征表示,從而具有較好的識(shí)別效果。CDAN算法在六種遷移任務(wù)中的測(cè)試準(zhǔn)確率在68%~84%之間,測(cè)試準(zhǔn)確率都優(yōu)于MobileNetⅤ2、Xception和ⅤiT,體現(xiàn)出了域適應(yīng)算法的有效性。
表3 不同識(shí)別方法在六種遷移任務(wù)中的測(cè)試準(zhǔn)確率
為了解決特定地區(qū)土壤含水率數(shù)據(jù)集訓(xùn)練出的卷積神經(jīng)網(wǎng)絡(luò)用于其他地區(qū)土壤含水率識(shí)別時(shí)的識(shí)別準(zhǔn)確率低、泛化性能差以及土壤種類(lèi)多樣、不同地區(qū)土壤顏色差別大的問(wèn)題,使用土壤含水率對(duì)抗域適應(yīng)模型,構(gòu)建了五種不同特征提取網(wǎng)絡(luò)的土壤含水率對(duì)抗域適應(yīng)模型CDAN,在所構(gòu)建的三個(gè)地區(qū)土壤含水率數(shù)據(jù)集的基礎(chǔ)上,利用ResNet、Xception、MobileNetⅤ2和ⅤiT網(wǎng)絡(luò)分別作為CDAN的特征提取器,搭建具有不同特征提取網(wǎng)絡(luò)的土壤含水率對(duì)抗域適應(yīng)模型。對(duì)比分析了不同模型性能,確定了最優(yōu)的土壤含水率識(shí)別模型。通過(guò)三種土壤含水率數(shù)據(jù)集的遷移實(shí)驗(yàn),對(duì)比四種模型在不同遷移任務(wù)上的遷移效果。結(jié)果表明:域適應(yīng)方法在六種遷移任務(wù)上均體現(xiàn)出了更好的分類(lèi)能力,且測(cè)試準(zhǔn)確率均能達(dá)到68.8%以上,其中,延安土壤向藍(lán)田土壤遷移的測(cè)試準(zhǔn)確率最高,達(dá)到84.3%。
然而,目前的土壤含水率識(shí)別算法僅適用于實(shí)驗(yàn)室條件下所搭建的土壤含水率數(shù)據(jù)集,若想實(shí)現(xiàn)實(shí)際的工程應(yīng)用,則需要進(jìn)一步完善土壤含水率圖像數(shù)據(jù)集,使室內(nèi)搭建的算法實(shí)現(xiàn)室外的原狀土壤含水率識(shí)別。