蘇 寧 葉晗鳴 王逍遙
(1.江南造船(集團(tuán))有限責(zé)任公司,上海 201913;2.北京航空航天大學(xué) 機(jī)械工程及其自動(dòng)化學(xué)院,北京 100191)
在船舶分段搭載過(guò)程中,基準(zhǔn)部段和調(diào)整部段間相對(duì)位姿的測(cè)量是進(jìn)行精確高效搭載的前提。近年來(lái),隨著傳感器技術(shù)和測(cè)量技術(shù)的進(jìn)步,大型船舶分段搭載過(guò)程部段位姿測(cè)量領(lǐng)域得到了快速發(fā)展,相關(guān)領(lǐng)域的研究人員提出了多種方法解決大部段對(duì)接位姿測(cè)量問(wèn)題。例如:岳穎[1]等采用全站儀測(cè)量系統(tǒng)解決船舶建造過(guò)程中的大尺度測(cè)量問(wèn)題;雍晟暉[2]設(shè)計(jì)了用于船舶大部段位姿測(cè)量的精密激光定位系統(tǒng),并以此為基礎(chǔ)開展了激光掃描式大空間測(cè)量場(chǎng)動(dòng)態(tài)測(cè)量定位技術(shù)的研究;吳俊生[3]等通過(guò)室內(nèi)全球定位系統(tǒng)(indoor Global Positioning System,iGPS)和激光跟蹤儀追蹤獲取大部段特征點(diǎn)坐標(biāo)信息,并根據(jù)特征點(diǎn)與分段間位姿的關(guān)聯(lián)關(guān)系解算大部段實(shí)時(shí)位姿狀態(tài)。在相關(guān)領(lǐng)域的研究中,基于機(jī)器視覺的大部段位姿測(cè)量技術(shù)憑借其智能、高效、高精度的特點(diǎn)在船舶建造領(lǐng)域的應(yīng)用日益廣泛。例如:范路生[4]等針對(duì)船舶目標(biāo)的位姿識(shí)別問(wèn)題,研究了基于合作目標(biāo)的單目視覺位姿估計(jì)技術(shù);樊洪良[5]將視覺位姿測(cè)量技術(shù)應(yīng)用到船舶分段搭載過(guò)程中,代替了定位人員的現(xiàn)場(chǎng)測(cè)量判斷工作,縮短了搭載工時(shí),降低了返工率。
在基于機(jī)器視覺的位姿測(cè)量技術(shù)中,基準(zhǔn)部段和調(diào)整部段之間的位姿關(guān)系是由視覺傳感器采集船舶分段特征點(diǎn)的圖像信息,然后在已知視覺單元與分段位姿關(guān)系的基礎(chǔ)上通過(guò)PnP解算得到的。由于視覺傳感器的測(cè)量視場(chǎng)一般難以覆蓋大部段對(duì)接端面,在進(jìn)行大部段對(duì)接相對(duì)位姿測(cè)量時(shí)往往需要設(shè)置多組測(cè)量單元監(jiān)控所有測(cè)量特征點(diǎn),并將單組視覺傳感器獲得的局部對(duì)接位姿信息融合為全局對(duì)接位姿信息。在進(jìn)行多傳感器對(duì)接位姿融合時(shí),需要解決的核心問(wèn)題是根據(jù)特征點(diǎn)在調(diào)整部段坐標(biāo)系、基準(zhǔn)部段坐標(biāo)系下的坐標(biāo),通過(guò)最小二乘法或梯度下降迭代法優(yōu)化求解調(diào)整部段坐標(biāo)系和基準(zhǔn)部段坐標(biāo)系的轉(zhuǎn)換矩陣,從而得出調(diào)整部段與基準(zhǔn)部段間的相對(duì)位姿。然而,最小二乘法要求齊次坐標(biāo)矩陣與其轉(zhuǎn)置矩陣的乘積矩陣可逆,這一條件無(wú)法保證在任意一次測(cè)量過(guò)程中完全滿足測(cè)量要求。梯度下降迭代法容易陷入局部極小值,無(wú)法在短時(shí)間內(nèi)求解出準(zhǔn)確的全局最優(yōu)值。
針對(duì)上述多傳感器對(duì)接位姿融合過(guò)程中存在的問(wèn)題,本文提出一種基于Adam優(yōu)化的多傳感器對(duì)接位姿融合算法。在對(duì)測(cè)量特征數(shù)據(jù)進(jìn)行隨機(jī)采樣的基礎(chǔ)上,通過(guò)最小二乘法構(gòu)建初始優(yōu)化權(quán)重矩陣,再結(jié)合Adam優(yōu)化算法實(shí)現(xiàn)對(duì)接位姿的快速融合求解。
基于機(jī)器視覺的大部段位姿測(cè)量技術(shù)可根據(jù)有無(wú)合作靶標(biāo)分為基于合作靶標(biāo)的視覺位姿測(cè)量技術(shù)和基于加工特征的視覺位姿測(cè)量技術(shù)。但是,無(wú)論有無(wú)合作靶標(biāo),多傳感器位姿融合的原理都是一致的。以基于合作靶標(biāo)的視覺位姿測(cè)量技術(shù)為例,其位姿測(cè)量系統(tǒng)布置如圖1所示。
在測(cè)量開始之前,需要通過(guò)全站儀、激光跟蹤儀等測(cè)量設(shè)備標(biāo)定每個(gè)合作靶標(biāo)坐標(biāo)系到調(diào)整部段坐標(biāo)系的轉(zhuǎn)換關(guān)系以及每個(gè)視覺傳感器到基準(zhǔn)部段坐標(biāo)系的轉(zhuǎn)換關(guān)系。進(jìn)行測(cè)量時(shí),由每個(gè)視覺傳感器采集分析對(duì)應(yīng)合作靶標(biāo)的圖像,通過(guò)PnP算法解算出合作靶標(biāo)坐標(biāo)系到對(duì)應(yīng)視覺傳感器坐標(biāo)系的轉(zhuǎn)換矩陣,再根據(jù)之前標(biāo)定得到的轉(zhuǎn)換關(guān)系即可計(jì)算出每一組視覺傳感器處調(diào)整部段與基準(zhǔn)部段之間的局部位姿關(guān)系。
對(duì)于多組視覺傳感器測(cè)量得到的多組局部位姿數(shù)據(jù),傳統(tǒng)的位姿融合方法是利用每組視覺傳感器獲得的局部位姿關(guān)系將其對(duì)應(yīng)調(diào)整部段坐標(biāo)系下的合作靶標(biāo)特征點(diǎn)坐標(biāo)轉(zhuǎn)化為基準(zhǔn)部段坐標(biāo)系下的坐標(biāo)[6]。利用對(duì)接端面所有特征點(diǎn)在調(diào)整段坐標(biāo)系和基準(zhǔn)段坐標(biāo)系下的坐標(biāo)數(shù)據(jù)時(shí),可使用最小二乘法或者梯度下降迭代法解算調(diào)整段坐標(biāo)系和基準(zhǔn)段坐標(biāo)系的轉(zhuǎn)換矩陣,即調(diào)整段和基準(zhǔn)段的全局位姿關(guān)系。設(shè)基準(zhǔn)段坐標(biāo)系下所有特征點(diǎn)的齊次坐標(biāo)矩陣為X,調(diào)整段坐標(biāo)系下所有特征點(diǎn)的齊次坐標(biāo)矩陣為Y,則多傳感器對(duì)接位姿融合問(wèn)題即是對(duì)下列問(wèn)題進(jìn)行優(yōu)化的過(guò)程:
式中:W為全局位姿矩陣,代表調(diào)整段和基準(zhǔn)段的全局位姿關(guān)系。
對(duì)于上述優(yōu)化問(wèn)題,最小二乘法的做法是構(gòu)建損失函數(shù),即:
對(duì)式(2)進(jìn)行求導(dǎo)可知,在損失函數(shù)最小時(shí),全局位姿矩陣W滿足:
最小二乘法無(wú)須迭代,能夠直接求出全局位姿矩陣W的最優(yōu)理論解。但是,最小二乘法要求XTX可逆,這一條件未必能得到滿足,而且當(dāng)XTX較大時(shí),求解其逆矩陣的運(yùn)算也較為耗時(shí)。在不能使用最小二乘法求解局位姿矩陣W時(shí),一般使用梯度下降迭代法,即在隨機(jī)初始化一個(gè)全局位姿矩陣W作為初始權(quán)重矩陣的基礎(chǔ)上,通過(guò)迭代逐步更新W降低損失函數(shù)的誤差,從而獲得一個(gè)較精確的全局位姿矩陣W。但是,梯度下降迭代法對(duì)初始權(quán)重矩陣的選擇非常敏感。一個(gè)較好的初始權(quán)重矩陣會(huì)加速誤差收斂,而較差的初始權(quán)重矩陣會(huì)導(dǎo)致誤差收斂的速度過(guò)慢。此外,一般梯度下降迭代法使用的隨機(jī)梯度下降優(yōu)化算法容易使優(yōu)化過(guò)程陷入局部極小值,從而導(dǎo)致無(wú)法得到最優(yōu)的全局位姿矩陣W。
針對(duì)最小二乘法和基于隨機(jī)梯度下降的梯度下降迭代法在進(jìn)行多傳感器融合求解全局位姿矩陣中存在的問(wèn)題,本文提出一種基于Adam優(yōu)化的對(duì)接位姿融合求解方法求解全局位姿矩陣W。通過(guò)隨機(jī)采樣小批量的測(cè)量數(shù)據(jù),使用最小二乘法構(gòu)建一個(gè)較好的初始權(quán)重矩陣,再由Adam優(yōu)化算法進(jìn)行梯度下降迭代。相比于隨機(jī)梯度下降算法,Adam優(yōu)化算法采用了自適應(yīng)學(xué)習(xí)率和動(dòng)量機(jī)制,能夠避免局部極小值對(duì)優(yōu)化過(guò)程的影響,從而以較少的迭代次數(shù)獲取最優(yōu)的全局位姿矩陣W。本文方法的算法流程如圖2所示。
上述基于Adam優(yōu)化的對(duì)接位姿融合算法屬于梯度下降迭代法,求解流程中,通過(guò)隨機(jī)采樣n個(gè)特征點(diǎn)在基準(zhǔn)段坐標(biāo)系和調(diào)整段坐標(biāo)系下的坐標(biāo)數(shù)據(jù),采用最小二乘法的位姿矩陣最優(yōu)解構(gòu)建一個(gè)較好的初始優(yōu)化權(quán)重矩陣,解決了梯度下降迭代法對(duì)初始權(quán)重矩陣的選擇敏感的問(wèn)題,從而加速損失函數(shù)誤差的收斂速度。使用Adam優(yōu)化算法進(jìn)行迭代優(yōu)化,避免了隨機(jī)梯度下降優(yōu)化算法容易使優(yōu)化過(guò)程陷入局部極小值的問(wèn)題。
為驗(yàn)證基于Adam優(yōu)化的對(duì)接位姿融合算法的有效性,開展了多傳感器對(duì)接位姿融合試驗(yàn),即在已知對(duì)接特征點(diǎn)位姿測(cè)量數(shù)據(jù)分布的基礎(chǔ)上,通過(guò)蒙特卡洛模擬法生成1 000個(gè)對(duì)接特征點(diǎn)在基準(zhǔn)段坐標(biāo)系、移動(dòng)段坐標(biāo)系下的坐標(biāo)數(shù)據(jù)。同時(shí),在相同的特征點(diǎn)數(shù)據(jù)條件下,對(duì)本文方法和傳統(tǒng)的基于隨機(jī)梯度下降的梯度下降迭代法在多傳感器對(duì)接位姿融合方面的效果進(jìn)行了對(duì)比試驗(yàn)。使用傳統(tǒng)梯度下降迭代法進(jìn)行位姿融合時(shí),以均方誤差函數(shù)(Mean Squared Error,MSE)作為損失函數(shù),迭代過(guò)程損失函數(shù)誤差曲線如圖3所示。
由圖3可知,傳統(tǒng)的梯度下降迭代法需要近1 000次迭代才能使損失函數(shù)誤差收斂。同理,以MSE作為損失函數(shù),本文基于Adam優(yōu)化的對(duì)接位姿融合算法設(shè)置隨機(jī)采樣數(shù)n=6進(jìn)行位姿融合試驗(yàn),迭代過(guò)程的損失函數(shù)誤差曲線如圖4所示。
由圖4可知,本文提出的基于Adam優(yōu)化的對(duì)接位姿融合算法在第46次迭代時(shí)損失函數(shù)誤差已收斂,相比于傳統(tǒng)方法收斂速度更快。對(duì)基于隨機(jī)梯度下降的傳統(tǒng)方法和本文方法進(jìn)行各項(xiàng)指標(biāo)統(tǒng)計(jì),結(jié)果如表1所示。
由表1可知,相比于傳統(tǒng)的隨機(jī)梯度下降迭代法,本文方法無(wú)論是迭代輪次、迭代耗時(shí)還是平均誤差都優(yōu)于傳統(tǒng)方法,更適合于具有較多測(cè)量特征點(diǎn)的多傳感器對(duì)接位姿融合。
此外,相比于最小二乘法,本文方法避免了求逆運(yùn)算,在XTX不可逆或者難以求逆時(shí)也能使用。同時(shí),在XTX可以較簡(jiǎn)單求逆時(shí),輸入本文方法具有精度上的優(yōu)勢(shì),而且由于最小二乘法不需要進(jìn)行迭代,其運(yùn)算耗時(shí)較本文提出的方法更短。在具體工程實(shí)踐中,可以根據(jù)位姿融合的實(shí)時(shí)性需求和對(duì)接特征點(diǎn)的數(shù)目進(jìn)行綜合考慮,從而選擇最合適的方法。
本文針對(duì)大部段對(duì)接位姿測(cè)量過(guò)程中的多傳感器對(duì)接位姿融合求解問(wèn)題,提出了一種基于Adam優(yōu)化的對(duì)接位姿融合求解方法。一方面,根據(jù)位姿融合求解最常使用的最小二乘法和基于隨機(jī)梯度下降的梯度下降迭代法的原理,分析了當(dāng)前兩種方法存在的不足,提出了基于Adam優(yōu)化的對(duì)接位姿融合求解方法,通過(guò)隨機(jī)采樣小批量的測(cè)量數(shù)據(jù),使用最小二乘法構(gòu)建一個(gè)較好的初始權(quán)重矩陣,再由Adam優(yōu)化算法進(jìn)行梯度下降迭代,從而獲得最優(yōu)的位姿融合求解結(jié)果。另一方面,通過(guò)蒙特卡洛模擬法生成對(duì)接特征點(diǎn)的坐標(biāo)數(shù)據(jù),并以此為基礎(chǔ)對(duì)本文方法和傳統(tǒng)的基于隨機(jī)梯度下降的梯度下降迭代法進(jìn)行位姿融合求解對(duì)比試驗(yàn)。試驗(yàn)結(jié)果顯示,本文方法無(wú)論是迭代輪次、迭代耗時(shí)還是平均誤差都優(yōu)于傳統(tǒng)方法,更適于具有較多測(cè)量特征點(diǎn)的多傳感器對(duì)接位姿融合。
由于本文方法需要通過(guò)采樣得到的數(shù)據(jù)點(diǎn)構(gòu)建初始優(yōu)化權(quán)重矩陣,在未來(lái)的研究中還可以探索其他更合適的權(quán)重初始化方法,從而進(jìn)一步提升誤差收斂的速度,實(shí)現(xiàn)實(shí)時(shí)性更高的多傳感器位姿融合。