楊有,張汝薈,許鵬程,康慷,翟浩
(1.重慶國(guó)家應(yīng)用數(shù)學(xué)中心(重慶師范大學(xué)),重慶 401331;2.重慶師范大學(xué) 計(jì)算機(jī)與信息科學(xué)學(xué)院,重慶 401331)
民國(guó)檔案(Republican archives)的數(shù)字化和數(shù)據(jù)化具有重要意義。一方面,民國(guó)檔案是近代歷史活動(dòng)的客觀記錄,在國(guó)家檔案全宗中占有特殊地位,是極具價(jià)值的檔案;另一方面,數(shù)字化加工處理為人工智能的應(yīng)用提供了條件?;趦?nèi)容的圖像檢索和圖像語(yǔ)義標(biāo)注是檔案圖像處理的兩種典型應(yīng)用場(chǎng)景,而識(shí)別和分割圖像中的印章為這兩種應(yīng)用創(chuàng)造了條件。民國(guó)檔案的特殊性如下:1)時(shí)代局限性。劣質(zhì)的紙張質(zhì)量導(dǎo)致印侵問(wèn)題和過(guò)多的噪聲,而毛筆書寫導(dǎo)致字體多變、文字大小不一。2)版面的復(fù)雜結(jié)構(gòu)。民國(guó)檔案中存在僅包含印章的檔案頁(yè),也存在印章甚至多印章與表格組成的檔案頁(yè),還存在多印章重疊的檔案頁(yè)。不僅如此,文字豎排和從右至左的書寫順序也對(duì)版面分析與理解帶來(lái)挑戰(zhàn)[1]。3)印章的特殊性。印章的形狀多樣性和位置不固定性導(dǎo)致先驗(yàn)知識(shí)缺乏;黑白印章顏色導(dǎo)致顏色特征無(wú)法利用;檔案數(shù)據(jù)中印章分布不均導(dǎo)致正負(fù)樣本不均衡。因此民國(guó)檔案印章數(shù)據(jù)集的特殊性導(dǎo)致了印章分割的困難。
傳統(tǒng)的印章檢測(cè)主要針對(duì)圖像的顏色、紋理和形狀特征。基于顏色特征的方法利用印章為紅色的特點(diǎn)來(lái)確定印章的位置,實(shí)現(xiàn)印章檢測(cè)[2]。印章的紅色與紙張、文字的顏色有明顯區(qū)別,因此該方法在傳統(tǒng)方法中占據(jù)重要地位。而民國(guó)檔案均為毛筆字、黑色印章,無(wú)法采用該方法。基于紋理特征的方法使用像素鄰域的灰度空間分布規(guī)律[3],但方法需要結(jié)合其他圖像特征,并不適合手寫文字檔案的處理?;谛螤钐卣鞯姆椒梢詼?zhǔn)確表達(dá)目標(biāo)的特性,但抗干擾能力偏弱。民國(guó)檔案印章數(shù)據(jù)集噪聲大并且印章邊框斷續(xù)問(wèn)題嚴(yán)重,使用該方法難以實(shí)現(xiàn)民國(guó)檔案印章分割。
傳統(tǒng)方法不能有效地進(jìn)行民國(guó)檔案印章分割,而深度學(xué)習(xí)的出現(xiàn)為解決該問(wèn)題帶來(lái)了可能。Long等[4]將全卷積網(wǎng)絡(luò)(Fully Convolutional Network,F(xiàn)CN)用于圖像語(yǔ)義分割,在像素級(jí)水平上理解和識(shí)別圖像內(nèi)容,并根據(jù)語(yǔ)義信息實(shí)現(xiàn)分割。FCN 解決了重復(fù)存儲(chǔ)的問(wèn)題,帶來(lái)了語(yǔ)義分割的進(jìn)步。同年,Ronneberger等[5]提出基于自編碼器的U-Net。Paszke等[6]提出的輕量化網(wǎng)絡(luò)ENet(Efficient Neural Network)具有參數(shù)量小、處理速度快的優(yōu)點(diǎn),為在移動(dòng)設(shè)備上實(shí)施分割帶來(lái)了可能。Badrinayanan等[7]提出基于先驗(yàn)概率對(duì)像素點(diǎn)進(jìn)行分類的SegNet。Zhou等[8]提出UNet++,通過(guò)疊加不同層次特征并對(duì)特征進(jìn)行再利用以提高網(wǎng)絡(luò)精度;此外,還引入深度監(jiān)督使它在提升精度的前提下有效降低參數(shù)量。Li等[9]提出深度特征聚合網(wǎng)絡(luò)(Deep Feature Aggregation Network,DFANet),在保證分割精度的前提下提升了處理速度。同年,Wang等[10]提出LEDNet(Lightweight Encoder-Decoder Network),使用非對(duì)稱編解碼器結(jié)構(gòu)來(lái)解決實(shí)時(shí)語(yǔ)義分割問(wèn)題。Zhou等[11]提出SEGAN(Speech Enhancement Generative Adversarial Network),更好地融合了多尺度特征?;诰幗獯a器方法的圖像分割網(wǎng)絡(luò)具有保留圖像空間維度和像素位置信息的優(yōu)點(diǎn),避免了池化操作后特征圖分辨率降低的問(wèn)題[12]。上述圖像分割網(wǎng)絡(luò)具有較高的分割精度,但多用于醫(yī)學(xué)圖像分割與城市場(chǎng)景語(yǔ)義分割;而面對(duì)民國(guó)檔案時(shí),它們的分割精度和邊緣分割的有效性都有待提高。
U-Net 及它的改進(jìn)網(wǎng)絡(luò)具有對(duì)稱的收縮擴(kuò)張路徑的結(jié)構(gòu),有利于捕獲上下文信息并實(shí)現(xiàn)精確定位。本文提出了針對(duì)民國(guó)檔案圖像的印章分割U 型網(wǎng)絡(luò)UNet-S(U-Net for Seal)。首先設(shè)計(jì)了多尺度殘差模塊替代U-Net 原有的卷積層;在多尺度殘差模塊中將普通卷積替換為深度可分離卷積(Depthwise Separable Convolution,DSConv)[13];為防止融合后的淺層信息被稀釋[14],根據(jù)仿真實(shí)驗(yàn)結(jié)果確定恰當(dāng)?shù)木W(wǎng)絡(luò)層級(jí),使用BCEDiceLoss(Binary Cross Entropy Dice Loss)損失函數(shù),并根據(jù)仿真實(shí)驗(yàn)結(jié)果優(yōu)選權(quán)重因子。
U-Net 對(duì)稱的編解碼器結(jié)構(gòu)可以更好地提取和重建特征圖[15],在圖像分割最前沿的網(wǎng)絡(luò)中,U-Net 仍占有一席之地。U-Net 由下采樣與上采樣結(jié)合的U 型結(jié)構(gòu)構(gòu)成,下采樣、上采樣、跳躍連接三個(gè)部分在網(wǎng)絡(luò)中起主要作用。在下采樣階段對(duì)輸入進(jìn)行卷積和池化操作的交替與堆疊以提取抽象的特征[16];在上采樣階段將抽象的特征進(jìn)行反卷積;跳躍連接部分將深層的語(yǔ)義信息與淺層的位置信息按深度連接在一起,以恢復(fù)目標(biāo)對(duì)象的細(xì)粒度細(xì)節(jié)。
U-Net 由23 個(gè)卷積層、4 個(gè)反卷積層、4 個(gè)最大池化層組成。U-Net 使用兩個(gè)3×3 卷積進(jìn)行無(wú)填充卷積,每?jī)纱尉矸e之后進(jìn)行一次2×2 最大池化操作以及ReLU(Rectified Linear Unit)函數(shù)激活。編碼器階段使用多個(gè)2×2 的最大池化進(jìn)行下采樣,使圖像尺寸變?yōu)樵瓉?lái)的1/2,直至尺寸變?yōu)?2×32;解碼器階段用2×2 的反卷積層進(jìn)行上采樣,使圖像尺寸變?yōu)樵瓉?lái)的兩倍,直至尺寸變?yōu)?92×392。跳躍連接將編碼器階段對(duì)應(yīng)的高分辨率圖像裁剪后與解碼器階段對(duì)應(yīng)部分相連接,使輸出結(jié)果更為準(zhǔn)確[17]。為了更好地預(yù)測(cè)圖像邊界區(qū)域像素、推斷缺失的上下文信息,U-Net 使用鏡像策略使網(wǎng)絡(luò)輸入圖像的尺寸為572×572。這種策略可以減少邊緣像素點(diǎn)的損失,更好地處理大尺寸圖像并且降低內(nèi)存的占用。
UNet-S 總體結(jié)構(gòu)如圖1 所示。
圖1 UNet-S結(jié)構(gòu)Fig.1 UNet-S structure
編碼器階段,將輸入圖像通過(guò)3×3 普通卷積(Conv)提取特征,得到的特征圖送入改進(jìn)的殘差模塊,進(jìn)行2×2 最大池化操作,使圖像尺寸變?yōu)樵瓉?lái)的1/2;之后交替進(jìn)行殘差學(xué)習(xí)和最大池化操作,直至特征圖下采樣至16×16;最后經(jīng)過(guò)1×1普通卷積進(jìn)入解碼器階段。解碼器階段,采用2 倍放大系數(shù)的雙線性插值作為上采樣方法,使圖像尺寸擴(kuò)大一倍;然后交替進(jìn)行殘差學(xué)習(xí)與雙線性插值,直到特征圖上采樣至512×512。在UNet-S 中,依然使用U-Net 的長(zhǎng)連接來(lái)融合編解碼器不同的特征圖。圖1 中,1×1 卷積的作用是升降通道數(shù)。循環(huán)使用跳躍連接、殘差連接、1×1 卷積和上采樣直至圖像尺寸變?yōu)?12×512。由于只需要印章類別,所以經(jīng)過(guò)一個(gè)3×3 的普通卷積、輸出通道數(shù)為1 后,輸出圖像尺寸為512×512。
UNet-S 使用了普通卷積和DSCnov,分別如式(1)、(2)所示:
其中:Foutj(x,y)為該層第j張?zhí)卣鲌D輸出結(jié)果;Fini為特征圖的值;W為卷積核;σ為激活函數(shù);bj為第j張?zhí)卣鲌D的偏置。
深度可分離卷積在圖像分割領(lǐng)域、計(jì)算機(jī)視覺(jué)領(lǐng)域的底層、中層和高層任務(wù)中都可使用,它能大幅減少網(wǎng)絡(luò)的參數(shù)量。由于卷積層通道間的相關(guān)性與空間相關(guān)性可解耦合,所以深度可分離卷積成為實(shí)現(xiàn)網(wǎng)絡(luò)輕量化的關(guān)鍵模塊。
深度可分離卷積分為逐通道卷積(DepthWise Convolution,DWConv)和逐點(diǎn)卷積(PointWise Convolution,PWConv)兩個(gè)步驟。假設(shè)輸入一張通道數(shù)為C的特征圖,在普通卷積中經(jīng)過(guò)N個(gè)通道數(shù)為C的H×H卷積核后,生成N張?zhí)卣鲌D。因此普通卷積參數(shù)量為N×C×H×H;在深度可分離卷積中首先經(jīng)過(guò)C個(gè)通道數(shù)為1的H×H的逐通道卷積,生成C張?zhí)卣鲌D,逐通道卷積的參數(shù)量為C×H×H,再將C張?zhí)卣鲌D經(jīng)過(guò)1×1×N的逐點(diǎn)卷積在深度方向上加權(quán)組合生成N張?zhí)卣鲌D,逐點(diǎn)卷積參數(shù)量為1×1×C×N。深度可分離卷積總參數(shù)量為C(H×H+N)。深度可分離卷積總參數(shù)量與普通卷積的參數(shù)量比值如式(3)所示:
其中:PDSConv為深度可分離卷積;PConv為普通卷積。在一層卷積中采用深度可分離卷積與傳統(tǒng)卷積壓縮效果相同,壓縮幅度僅與輸出通道數(shù)和卷積核的尺寸有關(guān)[18]。
為解決網(wǎng)絡(luò)退化問(wèn)題,He等[19]提出了殘差網(wǎng)絡(luò)(Residual Network,ResNet)。殘差連接之間的函數(shù)為F(x)=x+H(x)。當(dāng)殘差為0 時(shí),模塊不學(xué)習(xí)新的特征,僅執(zhí)行恒等映射;當(dāng)殘差不為0 時(shí),在輸入特征的基礎(chǔ)上模塊學(xué)習(xí)新的特征,即在不改變目標(biāo)函數(shù)的情況下,將網(wǎng)絡(luò)結(jié)構(gòu)分成殘差映射和恒等映射兩部分,使學(xué)習(xí)恒等映射變得更加容易,可以緩解梯度消失等問(wèn)題。
在殘差模塊中加入多尺度特征提取塊,使它能夠有效提取圖像的多尺度特征,提升網(wǎng)絡(luò)性能;同時(shí),模塊中的卷積層被替換為DSConv,減少網(wǎng)絡(luò)的參數(shù)量。多尺度殘差模塊結(jié)構(gòu)如圖2 所示。
圖2 多尺度殘差塊結(jié)構(gòu)Fig.2 Multi-scale residual block structure
在每一個(gè)多尺度殘差模塊中,首先對(duì)輸入特征圖進(jìn)行3× 3 深度可 分離卷 積+批歸一 化(Batch Normalization,BN)+ReLU,獲得感受野為3×3 的特征圖;再將它與輸入特征圖沿通道維度級(jí)聯(lián)(concat);然后將級(jí)聯(lián)后的特征圖進(jìn)行一次3×3 的深度可分離卷積+BN+ReLU。由于兩個(gè)3×3 卷積的感受野與一個(gè)5×5 卷積相同[20],而級(jí)聯(lián)后的特征圖中包含感受野為3×3 與感受野為1×1 的特征圖,因此對(duì)它執(zhí)行3×3 卷積后即可獲得感受野為5×5 與3×3 的特征圖,實(shí)現(xiàn)多尺度特征提取。為了使輸入、輸出通道數(shù)相同,在跳躍層加入1×1卷積。模塊按照如下公式執(zhí)行:
其中:Fn-1表示輸入為第i個(gè)卷積層中尺寸為3×3 的卷積核;bi表示第i個(gè)卷積層的偏置;F'和Fn'表示模塊的中間輸出;Fn表示輸出結(jié)果;?為卷積操作;σ表示ReLU 激活函數(shù)。將Fn-1代入式(4)獲得中間輸出F';式(5)將Fn-1與F'沿通道維度級(jí)聯(lián)后更新F';將F'代入式(6)獲得多尺度特征圖Fn',通過(guò)式(7)對(duì)Fn-1執(zhí)行升降維操作,使它的通道數(shù)與F'n一致后將二者相加得到最終的輸出Fn。
綜上所述,多尺度殘差模塊在緩解梯度消失、網(wǎng)絡(luò)退化等問(wèn)題的同時(shí)可以提取多尺度特征,提升性能;此外還引入了DSConv,大幅度降低網(wǎng)絡(luò)參數(shù)量,易于部署與應(yīng)用。
UNet-S 使用的損失函數(shù)為BCEDiceLoss,并根據(jù)實(shí)驗(yàn)結(jié)果確定合適的權(quán)重因子。BCELoss(Binary Cross Entropy Loss)和BCEWithLogitsLoss(Binary Cross Entropy WithLogits Loss)作為常用的二元交叉熵?fù)p失函數(shù),常用于解決二分類問(wèn)題。BCEWithLogitsLoss 為BCELoss 與Sigmoid 函數(shù)相融合的損失函數(shù)。式(8)為BCELoss 在二分類問(wèn)題上的計(jì)算公式[21],即只考慮僅有一個(gè)類別時(shí)的情況。t為樣本的標(biāo)簽值,p為網(wǎng)絡(luò)對(duì)該類別標(biāo)簽預(yù)測(cè)的概率。式(9)為Sigmoid 函數(shù)。
BCEDiceLoss 由BCELoss 和DiceLoss組成。DiceLoss 如式(10)所示,其中:TP(True Positive)表示真陽(yáng)性;TN(True Negative)表示真陰性;FP(False Positive)表示假陽(yáng)性;FN(False Negative)表示假陰性。BCEDiceLoss 如式(11)所示,λ為損失函數(shù)權(quán)重因子,通過(guò)消融實(shí)驗(yàn)確定λ=0.9。
民國(guó)檔案數(shù)據(jù)集中,一半為無(wú)印章圖片,而另一半有印章的圖片中,印章像素占總像素比例不大,存在正負(fù)樣本不均衡的問(wèn)題。DiceLoss 同時(shí)考慮局部和全局的損失信息[22],在數(shù)據(jù)集不平衡的情況下,使用BCEDiceLoss 效果更優(yōu)。
實(shí)驗(yàn)采用自建民國(guó)檔案數(shù)據(jù)集,共11 855 張圖像,有印章與無(wú)印章圖像分別有6 636、5 219 張。將9 484 張圖像作為訓(xùn)練集,2 371 張圖像作為測(cè)試集。自建的民國(guó)檔案數(shù)據(jù)集中的圖像尺寸并不統(tǒng)一,為了方便網(wǎng)絡(luò)的運(yùn)算,預(yù)處理部分使用OpenCV 庫(kù)中的resize 函數(shù)將輸入圖像尺寸統(tǒng)一為512×512。圖3 為民國(guó)檔案印章數(shù)據(jù)集中的圖像和生成的掩碼圖像。印章區(qū)閾值為1,對(duì)應(yīng)圖3(b)中白色部分;背景區(qū)閾值為0,對(duì)應(yīng)圖3(b)中黑色部分。
圖3 民國(guó)檔案印章和掩膜圖Fig.3 Seal and mask diagrams of Republican archives
仿真實(shí)驗(yàn)的軟硬件環(huán)境為:操作系統(tǒng)Windows 10;內(nèi)存32 GB;Nvidia Tesla M40 顯卡,24 GB 顯存;CPU Intel Core i7-10700KF;Python 版本3.8.5;Cuda 版本11.1;Pytorch 版本1.8.0。實(shí)驗(yàn)設(shè)置初始學(xué)習(xí)率為0.001,學(xué)習(xí)率衰減策略采用余弦退火算法,在最后一輪時(shí)衰減到0.000 01;優(yōu)化器為Adam;總訓(xùn)練輪數(shù)為100;輸入圖像尺寸為512×512;下采樣方法為雙三次插值;每次迭代傳入8 張圖像。
Dice 相似系數(shù)(Dice Similarity Coefficient,DSC)是圖像分割領(lǐng)域常用的評(píng)價(jià)指標(biāo),用于測(cè)量類分割任務(wù)中真實(shí)值和預(yù)測(cè)值之間的重疊部分[22-23]。本文采用DSC、平均交并比(mean Intersection over Union,mIoU)、平均像素準(zhǔn)確率(Mean Pixel Accuracy,MPA)、參數(shù)量、乘加運(yùn)算(Multiplication and ACcumulation,MAC)和測(cè)試集中每張圖片的平均測(cè)試時(shí)間(Time)對(duì)各網(wǎng)絡(luò)性能進(jìn)行評(píng)價(jià)。
3.3.1 對(duì)比實(shí)驗(yàn)
在民國(guó)檔案印章數(shù)據(jù)集上訓(xùn)練UNet-S 與U-Net[5]、DeepLab v2[24]網(wǎng)絡(luò)、UNet++[8]、DFANet[9]、DDRNet(Deep Dual-Resolution Network)[25]并進(jìn)行對(duì)比,不同網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果如表1 所示。由于該數(shù)據(jù)集為二分類問(wèn)題,所以均采用BCEWithLogits 損失函數(shù)。實(shí)驗(yàn)中其余參數(shù)設(shè)置均采用原始論文中的參數(shù)。
從表1 可以看出,UNet-S 的DSC、mIoU 和MPA 取得了最優(yōu)結(jié)果,最多提高了17.38%、32.68%和0.6%,參數(shù)量最多下降了76.64%。相較于次優(yōu)的編解碼器結(jié)構(gòu)UNet++,UNet-S 的DSC 提升了3.2%。
表1 不同網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果對(duì)比Tab.1 Comparison of experimental results of different networks
表2 為網(wǎng)絡(luò)復(fù)雜度對(duì)比,可以看出UNet-S 的參數(shù)量、MAC、時(shí)間大幅度降低。雖然輕量化網(wǎng)絡(luò)DFANet 的參數(shù)量和MAC 更小,但是它的DSC、mIoU 和MPA 均不如UNet-S。而實(shí)際應(yīng)用中使用的都是訓(xùn)練后的網(wǎng)絡(luò),所以時(shí)間并不是最重要的因素,測(cè)試速度和實(shí)驗(yàn)精度更重要。
表2 不同網(wǎng)絡(luò)的復(fù)雜度對(duì)比Tab.2 Complexity comparison of different networks
各網(wǎng)絡(luò)的分割結(jié)果如圖4 所示,其中,Ground Truth 為人工標(biāo)注圖像。圖4(c)中U-Net 存在印章邊上表格誤判、分割不全等問(wèn)題;圖4(d)中DeepLab v2 網(wǎng)絡(luò)存在部分印章無(wú)法識(shí)別、印章邊界分割模糊等問(wèn)題;圖4(e)中UNet++存在部分印章無(wú)法準(zhǔn)確識(shí)別與背景誤判等問(wèn)題;圖4(f)中DFANet 存在部分印章無(wú)法準(zhǔn)確識(shí)別等問(wèn)題,印章四周邊緣存在參差不齊的毛刺,平滑性不如UNet-S;圖4(g)中DDRNet 存在印章邊界分割模糊等問(wèn)題;圖4(h)為UNet-S 分割效果??梢钥闯鯱Net-S 平衡了精度、訓(xùn)練速度、測(cè)試速度、參數(shù)量等各項(xiàng)指標(biāo),針對(duì)印章數(shù)據(jù)集的效果最佳。
圖4 測(cè)試集分割結(jié)果示例Fig.4 Example of test set segmentation results
3.3.2 消融實(shí)驗(yàn)
為了選取更適合民國(guó)檔案印章數(shù)據(jù)集的網(wǎng)絡(luò)層數(shù),分別針對(duì)1~6 層網(wǎng)絡(luò)進(jìn)行了實(shí)驗(yàn),結(jié)果如表3 所示。6 層網(wǎng)絡(luò)的DSC 不如5 層網(wǎng)絡(luò),參數(shù)量卻為5 層網(wǎng)絡(luò)的4 倍,所以最終選擇5 層網(wǎng)絡(luò)作為UNet-S 的網(wǎng)絡(luò)結(jié)構(gòu)。
表3 不同層數(shù)的實(shí)驗(yàn)結(jié)果對(duì)比Tab.3 Comparison of experimental results with different layers
如表4 所示,為了更好地?cái)M合民國(guó)檔案印章數(shù)據(jù)集,進(jìn)行了一系列對(duì)比以確定損失函數(shù)的權(quán)重因子的取值。當(dāng)λ=0.9 時(shí),mIoU 和DSC 最優(yōu),因此使用λ=0.9 進(jìn)行仿真實(shí)驗(yàn)。
表4 不同權(quán)重因子的結(jié)果對(duì)比Tab.4 Comparison of results with different weighting factors
為了驗(yàn)證不同模塊的有效性,針對(duì)不同模塊進(jìn)行了消融實(shí)驗(yàn),結(jié)果如表5 所示。可以看出:1)DSConv 的使用和網(wǎng)絡(luò)通道數(shù)的降低,使網(wǎng)絡(luò)參數(shù)量降低了76.6%;2)加入多尺度殘差模塊后,DSC、mIoU 提高4.2%和8.1%,表明多尺度殘差模塊可以有效提高網(wǎng)絡(luò)的準(zhǔn)確率;3)相較于BCEWithLogitsLoss,使用BCEDiceLoss 后DSC、mIoU 提高了3.9%、7.2%,表明BCEDiceLoss 能較好地解決民國(guó)檔案印章數(shù)據(jù)集中數(shù)據(jù)不均衡所帶來(lái)的問(wèn)題;4)相較于原始網(wǎng)絡(luò),UNet-S 的通道數(shù)減半并且使用了DSConv,參數(shù)量?jī)H為原始網(wǎng)絡(luò)的23.4%,但是結(jié)合其他模塊后DSC 提升了6.8%。
表5 不同模塊實(shí)驗(yàn)結(jié)果對(duì)比Tab.5 Comparison of experimental results of different modules
圖5 為UNet-S 與U-Net 的DSC、mIoU 和MPA 在不同Epoch 的曲線,可以看出,相較于U-Net,UNet-S 收斂更快、曲線更平滑。
圖5 不同Epoch下的結(jié)果Fig.5 Results in different Epoch
針對(duì)傳統(tǒng)印章檢測(cè)方法不適合民國(guó)檔案印章數(shù)據(jù)集,而U-Net 分割精度不高、邊緣細(xì)節(jié)分割不夠細(xì)膩等問(wèn)題,本文提出基于U-Net 的改進(jìn)網(wǎng)絡(luò)UNet-S。UNet-S 使用深度可分離卷積降低網(wǎng)絡(luò)參數(shù)量;使用改進(jìn)后的多尺度殘差模塊、損失函數(shù)和5 層網(wǎng)絡(luò)結(jié)構(gòu)提高網(wǎng)絡(luò)準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明,UNet-S取得了更好的性能。雖然作出了如上改進(jìn),但是在實(shí)驗(yàn)過(guò)程中,依然存在著數(shù)據(jù)集的噪聲干擾過(guò)大等問(wèn)題,下一步將解決以上問(wèn)題并在民國(guó)檔案印章數(shù)據(jù)集上進(jìn)行印章文字檢測(cè)。