張凌明,趙悅,李鵬程,劉洋,高陳強
三維牙齒模型是利用口內掃描儀對患者口腔內軟硬組織進行實時掃描和重建而得到的一種數字化三維模型,其本質是由無序的三維點云或三維網格組成的非結構化數據. 三維牙齒模型的分割任務是指從模型中準確分割出牙齒區(qū)域,其分割結果可以高效地協助醫(yī)生對患者牙齒進行移動、重排列等操作,以便可靠地模擬正畸治療后的效果. 同時,分割信息還可以為牙齒種植導板設計、3D生物打印種植體、以及患者后續(xù)治療計劃的制定提供重要參考信息. 因此,三維牙齒模型分割具有十分重要的意義.
然而,由于不同患者之間牙齒形狀存在巨大差異,三維牙齒模型的分割任務也存在許多難點,如圖1 所示. 圖1(a)所示的牙齒錯位現象通常會導致不同類別牙齒在空間上距離更近甚至存在部分區(qū)域的重疊,而圖1(b)所示的牙齒缺失現象也會造成整個模型的牙齒排列呈現更大的差異性,這都給網絡對牙齒模型整體拓撲結構的學習造成較大困難.
圖1 三維牙齒模型中牙齒錯位和缺牙示意圖
到目前為止,已經提出了一些基于深度學習的三維牙齒模型分割方法[1,4]. 一種最直接的思路就是將三維牙齒模型當成三維點云數據或者三維網格數據進行處理,因此可將其分割任務進一步細化為點云或網格的分割任務. 例如,部分學者將三維牙齒模型中的點云或網格預處理為類似于圖像領域的結構化數據形式,然后送入2D 或3D 卷積神經網絡進行牙齒分割[1,2]. 這類方法較好地解決了卷積神經網絡由于三維數據的無序性而無法直接應用于三維牙齒模型的問題. 其他學者則直接對現有的點云分割網絡進行遷移或改進[3,4],例如,Lian 等人[4]先通過構建鄰接矩陣對PointNet[5]特征提取方法進行改進,然后用于三維牙齒模型的分割任務. 這類網絡的結構往往可以很好地處理三維數據的無序性問題,因此可以避免額外的數據預處理操作.
雖然上述方法取得了一定的效果,但其中部分方法[1,2]對每個分割單位(點或網格)進行相對獨立的特征提取,忽略了局部特征信息對牙齒分割的重要性. 其他方法[3,4]雖然對局部特征進行了建模,但其提取過程沒有充分考慮局部空間內分割單位的真實分布情況,因此在牙齒邊緣區(qū)域無法提取更細節(jié)的局部形狀特征,進而導致這些區(qū)域出現較為嚴重的過分割或欠分割現象.
最近,學者們提出了一些基于局部空間分組的點云分割方法[6,7],并且在一定程度上優(yōu)化了三維數據的局部特征提取問題. 然而,這些方法依舊采用相對簡單的局部特征提取方法,例如文獻[7]直接使用最大值池化(Max Pooling)對局部區(qū)域進行特征聚合. 由于最大值池化僅能選擇性地保留部分局部特征信息,而忽略了各單位之間的深層關系(例如相對空間距離、特征相似度等). 因此,這種方式仍然會丟失部分細節(jié)信息.
為提取三維牙齒模型中更細節(jié)的局部形狀特征,提高牙齒邊緣區(qū)域的特征辨別能力,本文提出了一種基于局部注意力機制的分割網絡. 網絡首先以三維網格數據的形式對牙齒模型進行多尺度局部空間區(qū)域構建. 對于每一個局部區(qū)域,網絡先進行空間信息增強以豐富網格數據的空間特征. 在此基礎上,再根據網格的空間分布和相對特征差異自動學習注意力權重,并基于該權重進行局部特征聚合. 這種基于注意力機制的局部特征提取方式能幫助網絡自適應地去關注不同局部區(qū)域內更具有表達性的網格特征,因此能在牙齒邊緣區(qū)域提取更細節(jié)的局部形狀特征,有效解決了現有方法無法準確分割牙齒邊緣區(qū)域的問題. 本文網絡在臨床三維牙齒模型數據集上的實驗結果表明:相對于現有的分割網絡,本文方法能更準確地分割出牙齒邊緣等低特征識別度區(qū)域,且能較好克服數據中存在的缺牙、牙齒錯位等分割難點.
傳統的三維牙齒模型分割方法通常利用預定義的空間幾何特征如曲率、法向量等作為牙齒分割的參考信息. 這些方法大致可分為:(1)基于曲率的方法(curva?ture-based method)[8,12];(2)基于輪廓線的方法(contourline-based method)[13,14];(3)基于諧波場的方法(harmon?ic-field-based method)[15]. 部分學者還將三維牙齒模型先映射為歐氏空間的2D 圖像進行圖像分割[16,17]. 上述傳統方法雖然比較直觀,但由于不同人牙齒的形狀變化較大,導致這些基于幾何特征的方法魯棒性差,易出現分割結果不穩(wěn)定的情況. 同時部分傳統分割方法還需要一定的人工交互,無法實現全自動的分割.
隨著深度學習技術在自然圖像和醫(yī)學圖像分割領域取得的巨大成功[18,19],許多學者也將其應用于三維牙齒模型的分割任務中.Xu 等人[1]先手動提取三維牙齒模型中網格的幾何特征,然后將每個網格的特征向量以矩陣形式送入卷積神經網絡進行單個網格分類的分類任務.Farhad等人[3]則將牙齒模型以點云數據的形式送入PointCNN[6]網絡進行點云分割任務,并配合鑒別器網絡對分割結果進行優(yōu)化. 上述方法雖然在總體上能取得較好的分割效果,但由于沒有充分考慮局部區(qū)域內各單位之間的特征關聯性,因此無法有效提取牙齒的局部形狀信息. 而本文網絡能充分參考局部區(qū)域內各單位的空間位置和特征信息進行局部特征提取,以這種方式得到的特征信息能更好地反應牙齒的真實形狀.
此外,為能將3D 卷積神經網絡遷移至三維牙齒模型的分割任務中,Tian 等人[2]先利用稀疏八叉樹分區(qū)[20]的方式(sparse octree partitioning)將三維牙齒模型進行體素化(voxelization),然后將其送入3D 卷積神經網絡對牙齒進行分割. 但該方法同時也增加了額外的計算開銷,且在體素化階段可能會引入量化誤差.
近年來,學者們針對點云分割任務做了大量研究,如基于多視角的點云分割方法[21,24]、基于體素化的點云分割方法[25,30]等. 這些方法也為三維牙齒模型的分割任務提供了重要參考. 其中Qi等人提出的PointNet[5]是第一個可以直接將無序的三維空間數據作為輸入的網絡,有效地解決了非結構化數據的無序性問題. 鑒于PointNet[5]在點云處理上表現出的良好性能,Lian 等人[4]在此基礎上利用鄰接矩陣對PointNet[5]的特征提取過程進行改進,并提出了一種新的三維牙齒模型分割網絡MeshSegNet. 由于PointNet[5]無法提取三維數據的局部特征信息,Qi 等人又提出了PointNet++[7]. Point?Net++通過對三維空間數據進行局部區(qū)域構建的方式來提取局部特征信息,并在一定程度上提升了網絡的學習能力,但由于其僅簡單地使用最大值池化進行局部特征聚合,依舊會丟失了其他細節(jié)信息. 近年來,隨著注意力機制在各領域取得的巨大成功[31,33],本文也設計了一種基于注意力機制的局部特征聚合,相比于對使用最大值池化,這種方式能更好地保留局部區(qū)域內細節(jié)形狀信息.
本文網絡框架如圖2所示,整個網絡可分為局部特征提取階段和特征逆向傳播階段. 在局部特征提取階段,網絡首先對輸入的三維牙齒模型進行網格下采樣以構建局部空間區(qū)域,然后對每個局部空間區(qū)域進行空間信息增強和基于局部空間注意力機制的特征聚合以提取局部特征信息. 提取的局部特征信息將作為下一層網絡的輸入進行同樣的操作直至局部特征提取階段結束. 在特征逆向傳播階段,網絡以最后一次局部特征聚合模塊的輸出為起點,通過上采樣和特征逆向傳播將網格數量逐步恢復至原始牙齒模型具有的網格數量,并同時將兩個階段對應的網格特征信息進行融合學習. 最后,網絡利用多層感知器(Multi-layer Percep?tron,MLP)進行網格級別的牙齒分割預測.
圖2 本文網絡的整體結構示意圖
本文網絡的初始輸入包含三維牙齒模型中N個網格的初始特征信息和空間位置信息兩部分. 由于每個網格初始特征信息僅含有網格三個頂點坐標信息組成的向量V?R9. 若僅使用該信息作為輸入,并不利于網絡學習更細節(jié)的語義特征,且沒有充分利用三維網格具有局部拓撲連接這一優(yōu)勢. 因此本文在數據預處理部分對每個網格進行額外的空間特征提取以豐富網格的初始特征信息. 定義三維牙齒模型中所有網格的集合為M={m1,m2,…,mN},|M| =N. 對于網格mi?M,先獲取其網格的法向量信息Nmesh?R3和其三個頂點法向量信息Nvertex?R9,然后再將Nmesh、Nvertex和V共同拼接成網格mi的初始特征向量fi?R21. 而在定義每個網格的空間位置信息時,考慮到僅使用單個頂點坐標作為網格的空間位置信息并不準確,因此本文選擇網格的中心點坐標作為每個網格的空間位置信息. 對于網格mi,其中心點pi?R3的坐標為:
其中,xi,yi,zi分別表示網格mi的頂點坐標值. 在完成N個網格的數據預處理操作后,將它們的初始特征信息和空間位置信息分別拼接成矩陣F=(f1,f2,…,fN)和P=(p1,p2,…,pN),并作為網絡的初始輸入,其中F?RN×21,P?RN×3.
本文先對牙齒模型中的網格數據進行局部區(qū)域的構建,然后再進行后續(xù)的特征學習. 以第一次局部區(qū)域構建為例,網絡先利用最遠距離采樣(Farthest Point Sampling,FPS)從輸入的網格集合M中下采樣出N1(N1<N)個網格,并將這些被采樣的網格定義為中心網格(如圖2 中紅色圓點示意). 定義中心網格集合,對于任意中心網格網絡以其中心點坐標作為參考,在整個數據空間內選擇距離該點最近的k個其他網格組成mci的局部網格集合(如圖2 中藍色圓點示意). 中心網格mci和其局部網格集合便組成了一個局部空間區(qū)域(如圖2中圓形虛線框示意). 當完成所有中心網格的局部區(qū)域構建后,原始輸入的N個網格便被劃分為N1個局部空間區(qū)域(即N1個網格分組),這些局部空間區(qū)域將會被送入后續(xù)的局部特征聚合模塊進行局部特征提取.
局部信息聚合模塊整體框圖如圖3 所示. 以網絡第一個局部特征聚合模塊為例,其輸入為N1個網格分組,輸出為N1個局部特征信息. 模塊首先對所有局部網格集合進行空間信息增強,并將增強結果與網格原始特征進行融合學習以得到更豐富特征信息. 在此基礎上,模塊再根據中心網格和局部網格的真實空間分布和特征差異自動學習出局部網格的注意力權重,并基于該權重進行局部特征聚合.
圖3 局部特征聚合模塊框圖
3.3.1 局部特征聚合模塊
3.3.2 局部注意力機制
本文基于局部注意力機制對局部空間區(qū)域內的網格特征信息進行聚合. 對于局部網格mloj,其權重向量αj的學習方式為:
其中,GL表示局部空間區(qū)域L 聚合后的局部特征信息,⊙為哈達瑪乘積.
在完成N1個局部空間區(qū)域的特征聚合后,模塊會輸出N1個局部特征信息G1,G2,…,GN1,如圖3 所示. 這些局部特征信息將重新作為N1個中心網格的原始特征并進行下一次的局部特征提取的,直到局部特征提取階段結束.
特征逆向傳播階段是局部特征提取階段的逆過程,其通過上采樣和特征逆向傳播將下采樣后的網格數量逐步恢復至原始網格數量以做分割預測. 與PointNet++[7]類似,特征逆向傳播階段每一次上采樣會使網格集合從Ml恢復 至Ml-1,其中|Ml| =Nl,|Ml-1| =Nl-1(Nl<Nl-1),如圖2所示. 對于網格ml-1i?Ml-1,其特征fl-1i是由集合Ml中距離ml-1i最近的3 個其他網格進行特征加權而得,如式(6)所示:
本文所使用的實驗數據包括40例由人工精標注的數字化三維牙齒模型,數據來源均為口內掃描儀對不同的患者進行掃描而得. 由于每一例原始牙齒模型所包含的網格數量大約在10萬到30萬之間且互不相同.為減少數據的冗余以及保持網絡訓練時的數據一致性,每一例牙齒模型在保證基本拓撲結構的基礎上被統一下采樣至16000個網格用于網絡的訓練和測試(即N=16000). 本文定義的牙齒分割類別種數C=8,包括由中切牙到第2磨牙的7種牙齒類別(左右對稱)和1種牙齦類別. 本文還對訓練數據進行如下數據增強操作:(1)隨機旋轉角度ε,ε?[-π/6,π/6];(2)隨機坐標平移,平移量γ?[-10,10]. 每一例訓練數據都會進行上述兩種數據增強操作以產生60例新的訓練數據參與網絡訓練. 本文所有實驗均采用3折交叉驗證.
本文網絡是利用Pytorch 深度學習工具實現,GPU版本為NVIDIA GeForce GTX 1080,操作系統為Ubuntu 16.04 64bit. 訓練時采用的優(yōu)化器為Adma,損失函數為交叉熵損失函數(Cross-Entropy loss),初始學習率為0.001,每訓練20 輪進行0.5 倍衰減,最低學習率為0.00001,訓練過程中batch_size 設置為4. 網絡總訓練輪數為200 epoch. 實際訓練網絡結構包含4 次局部特征提取操作(局部區(qū)域構建+局部特征聚合模塊)以及4次上采樣操作. 進行局部區(qū)域構建時的下采樣的中心網格個數和局部網格個數k隨著次數的增加分別為[4000,2000,1000,500]和[32,32,16,16].
在相同的實驗環(huán)境和實驗平臺下,本文網絡的分割性能與PointCNN[6],PointNet[5],PointNet++[7]以及Li?an[4]等人提出三維牙齒模型分割網絡MeshSegNet 進行了對比. 所采用的評估指標包括分割準確率(Accura?cy)、平均交并比(mean Intersection-over-Union,mIOU)以及單個類別的交并比. 四種對比方法的相關實驗細節(jié)描述如下.
(1)PointNet:本文所采用的PointNet 與文獻[5]中的網絡結構一致. 同時,為保證對比的公平性,本文采用是N×21 的網格初始特征信息矩陣作為PointNet 的輸入,與本文網絡的輸入保持一致. 訓練過程中參數batch_size 設置為4,總訓練輪數為200 epoch,其他訓練參數設置與3.2小節(jié)一致.
(2)PointNet++:本文所采用的PointNet++與文獻[7]中的網絡結構的基本一致. 在進行局部區(qū)域劃分時采用與本文方法一樣的k近鄰算法和相關參數設置.PointNet++的輸入包含N×21的網格初始特征信息矩陣和N×3 的網格空間位置信息矩陣兩部分,輸入和本文網絡保持一致. PointNet++訓練時batch_size 設置為4,總訓練輪數為200 epoch,其他訓練參數設置與3.2小節(jié)一致.
(3)PointCNN:本文所采用的PointCNN 的網絡結構和網絡內部參數設置與文獻[6]中一致,訓練時batch_size 設置為4,總訓練輪數為200 epoch,其他訓練參數與3.2小節(jié)一致.
(4)MeshSegNet:本文所采用的MeshSegNet 的網絡結構和網絡內部參數設置與文獻[4]中一致,訓練時batch_size 設置為4,總訓練輪數為200 epoch,原文中MeshSegNet 的輸入為6000 個網格,為保證對比的公平性,本文對將其輸入擴充至16000 個網格,以達到與本文方法的輸入保持一致.
本文方法與現有四種分割網絡在3 折交叉驗證下的分割準確率指標和分割交并比指標對比分別如表1、表2所示. 表1中每一行數據表示不同分割網絡在測試集上的分割準確率. 表2 中每一行數據表示不同分割網絡在單個分割類別上的分割交并比和平均交并比,其中T0 表示牙齦類別,T1~T7 分別表示的左右對稱的中切牙至第2 磨牙7 種類別. 從分割結果可以看出,由于PointNet[5]在特征學習時缺失對局部特征提取,因此在準確率和mIoU 兩種指標上都明顯低于其他方法,這說明局部形狀信息對牙齒模型的分割具有十分重要的作用.PointNet++[7]和PointCNN[6]在兩種分割指標上相對于PointNet[4]有明顯提高,但由于它們的局部特征聚合方式相對簡單,分割準確性無法進一步提高. Mesh?SegNet[4]在四種對比方法中取得了最好的分割性能,但由于其本質上是對局部區(qū)域內網格分配相同的權重(鄰接矩陣中僅用0 和1 表示是否具有連接關系),忽略了真實的網格分布. 本文網絡根據局部網格和中心網格的內在關系自動學習出注意力權重并進行特征聚合,這樣的局部特征提取方式能更好地學習牙齒的局部形狀信息,尤其是在牙齒邊緣或相鄰牙齒區(qū)域更具有優(yōu)勢. 所以從實驗結果可以看出本文方法在準確率和IoU上都明顯優(yōu)于另外四種對比方法.
表1 本文網絡與現有方法在3折交叉驗證下的分割準確率對比(均值±標準差)
本文網絡與其他方法的分割結果可視化對比如圖4 所示. 通過對比可知,本文方法的分割明顯優(yōu)于其他四種對比方法. 例如,在第一行所示牙齒模型在側切牙區(qū)域(紅色箭頭所指處)存在較為嚴重的牙齒錯位,以及第二行所示牙齒模型兩側的尖牙區(qū)域(藍色箭頭所指)也存在明顯的缺牙現象. 其他四種分割網絡在上述的兩個區(qū)域都存在一定程度的過分割和欠分割現象.而本文網絡由于能在牙齒邊緣區(qū)域學習出更細節(jié)的特征差異,因此即使牙齒模型中存在上述分割難點,
表2 本文網絡與現有方法在3折交叉驗證下的分割交并比對比
圖4 本文網絡與四種對比網絡的分割結果可視化對比
本文網絡仍然準確地分割出較為完整的牙齒結構. 第三行展示的數據的牙齒形狀和其他模型相比具有較大的差異(紅色虛線所示),而本文網絡在此區(qū)域內的分割結果也明顯優(yōu)于其他網絡,這也說明本文網絡具有較強的泛化能力. 由第四行和第五行展示的數據在牙齒邊界分割結果可知,PointNet[5]在邊界部分存在十分嚴重的欠分割問題,這進一步證明了局部特征信息對于牙齒邊緣分割十分重要.PointCNN[6]和Point?Net++[7]雖然效果要優(yōu)于PointNet[5],但依舊存在較為嚴重的牙齒多分現象.MeshSegNet[4]在整體上取得比較準確的邊緣分割準確率,但其在磨牙部分容易出現過分割現象(如第五行藍色虛線框所示),這說明該方法在相鄰牙齒區(qū)域的分割能力還存在不足. 本文利用基于局部注意力機制的特征聚合方式能幫助網絡能提取更細節(jié)的局部形狀信息,因此在牙齒邊緣區(qū)域分割效果明顯優(yōu)于其他四種方法.
4.5.1 初始特征信息組合
本文所使用的初始特征信息除了三維牙齒模型中各網格頂點的坐標V外,還增加了網格的法向量Nmesh和網格頂點的法向量Nvertex. 為驗證這些額外的初始特征信息在提升網絡分割性能上的有效性,本文在保持其它條件不變的情況下,使用不同的初始特征信息組合作為輸入進行網絡訓練以及測試結果對比.
輸入的特征信息組合包括:(1)僅使用頂點坐標;(2)頂點坐標+網格法向量;(3)頂點坐標+頂點法向量;(4)頂點坐標+網格法向量+頂點法向量. 分割指標對比在3 折交叉驗證下如表3 所示. 由表3 可知,隨著初始特征信息逐漸豐富,網絡的分割準確率和平均交并比也相應提高. 當輸入包含所有初始特征信息時,網絡達到最好的分割性能. 通過觀察可知,在頂點坐標信息的基礎上增加頂點法向量相對于增加網格法向量,網絡分割性能提升得更為明顯. 一個可能的原因是網格法向量信息僅是針對單個網格計算而得,而每個頂點的法向量信息是包含該頂點的周圍所有網格的法向量信息,因此頂點法向量含有的空間特征更豐富.
四種輸入組合所訓練的網絡的分割結果的可視化如圖5 所示. 由于空間相鄰網格的坐標信息十分相似,所以當輸入僅含有頂點坐標信息時,網絡無法很好地學習出網格之間的特征差異,因此在牙齒邊緣等區(qū)域存在一定程度的過分割現象. 然而,位于牙齒邊緣區(qū)域的網格拓撲形狀具有較為明顯的變化,這使得網格在向量信息上具有很高的特征辨識度. 所以當輸入的特征信息包含網格法向量和頂點法向量后,可以更好地輔助網絡學習出邊緣區(qū)域的網格特征差異,因此其分割結果在牙齒邊緣區(qū)域更加準確光滑.
表3 本文網絡在不同輸入組合下的分割指標
圖5 不同輸入組合的分割結果可視化對比
4.5.2 空間信息增強和局部注意力機制
為驗證空間信息增強和局部注意力機制對提升網絡分割性能的有效性,本文分別對這兩個模型進行了消融實驗. 實驗設置如下:(1)僅使用空間信息增強,局部特征聚合方式采用最大值池化;(2)僅局部注意力機制;(3)本文完整網絡結構. 上述三種網絡結構的分割指標如表4 所示. 實驗結果表明,若只使用空間信息增強或只使用局部注意力機制,網絡都無法達到最好的分割性能. 同時通過與完整網絡結構的分割結果對比可知,在使用空間信息增強的基礎上增加局部注意力機制,網絡的分割準確率可提升3.3%,反之在使用局部注意力機制的基礎上增加空間信息增強,網絡的分割準確率可提升1.6%,實驗結果驗證了本文提出的空間信息增強和局部注意力機制都使得網絡的分割性能得到進一步提升.分割結果的可視化對比如圖6所示,通過對比僅使用局部注意力機制和僅使用空間信息增強兩種情況下網絡的分割結果可知,前者在牙齒邊緣區(qū)域的分割準確性明顯優(yōu)于后者,這也進一步說明基于局部注意力機制的特征聚合相對于最大值池化能學習牙齒更多的細節(jié)形狀信息. 但僅使用局部注意力機制的網絡結構卻在牙齒區(qū)域出現了部分錯誤分割的現象(紅色實線區(qū)域所示),其主要原因是該例牙齒模型右側缺少第二磨牙,從而導致左右部分牙齒分布不對稱. 而僅使用了空間信息增強的網絡結構雖然在牙齒邊緣區(qū)域分割性能欠佳,但其同時參考了網格的絕對位置信息和相對位置信息,因此并沒有受到因牙齒分布不均勻帶來的影響. 本文完整網絡結構同時具有上述兩個模塊的優(yōu)點,且從分割結果可知,空間信息增強對局部注意力機制具有一定的促進作用.
圖6 本文網絡使用不同模塊的分割結果可視化對比
表4 本文網絡使用不同模塊的分割指標
4.5.3 不同網格分辨率對網絡分割性能的影響
為討論網絡在輸入不同網格分辨率(即不同的輸入網格個數N)的牙齒模型時分割性能的變化,本文在網絡訓練階段對牙齒模型中的網格數量進一步隨機下采樣至N=12000、N=8000 和N=4000 進行網絡訓練,在網絡測試階段依舊保持N=16000進行網絡分割性能測試. 分割指標對比如表5 所示. 實驗結果表明,隨著牙齒模型在局部區(qū)域的網格分辨率降低,網絡的分割指標也相應降低. 其中mIoU 的下降程度最大,其原因是當三維牙齒模型所具有的網格數量越少,其局部區(qū)域所能提供的空間信息將更加粗糙,網絡難以學習出識別度高的特征用于分割預測. 然而,即使在N=12000 的網格分辨率下,本文網絡分割指標依舊優(yōu)于其他對比方法在N=16000的網格分辨率下所取得的分割指標,這也進一步證明了本文網絡的魯棒性.
表5 本文網絡在不同網格分辨率下的分割指標
針對三維牙齒模型的分割任務,本文提出一種基于局部注意力機制的端到端分割網絡. 網絡先通過對三維牙齒模型進行多尺度的局部區(qū)域構建,并利用空間信息增強模塊對三維網格進行特征豐富. 在此基礎上,網絡再根據區(qū)域內網格的真實空間分布和網格特征差異自動學習注意力權重,并基于該權重進行局部特征聚合以幫助網絡自適應地去關注不同局部區(qū)域內更具有表達性的網格特征,有效地解決了現有方法存在的局部特征提取問題. 通過在臨床數據集上的實驗表明,本文網絡相對于現有的部分方法在牙齒邊緣區(qū)域能取得更好的分割性能.