亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        水印去除文字識(shí)別技術(shù)研究

        2023-09-03 14:45:35董浪李發(fā)海魏孟濤
        客聯(lián) 2023年5期
        關(guān)鍵詞:標(biāo)簽卷積文字

        董浪 李發(fā)?!∥好蠞?/p>

        摘 要:為維護(hù)用戶版權(quán),提高圖片文字的輸入速度,本文提出了“GAN+CTPN+CRNN+CTC”的水印去除文字識(shí)別技術(shù),經(jīng)過GAN去除圖片中的水印,然后通過CTPN對(duì)圖片中的文字進(jìn)行檢測(cè),最后通過CRNN和CTC進(jìn)行文字的預(yù)測(cè)和識(shí)別。實(shí)踐證明,該研究提高了帶水印圖片的文字識(shí)別效率。

        關(guān)鍵詞:水印去除;文字識(shí)別技術(shù)

        隨著互聯(lián)網(wǎng)的快速發(fā)展,人們選擇網(wǎng)絡(luò)辦公逐步成為主流,時(shí)長會(huì)涉及到圖片的發(fā)送,因?yàn)榘鏅?quán)和原創(chuàng)性的原因,這些圖片被賦予了水印。隨著水印技術(shù)的廣泛應(yīng)用,各種去水印技術(shù)在網(wǎng)上魚龍混雜,如何準(zhǔn)確有效的提取水印下的文字內(nèi)容,正在成為越來越多學(xué)者的研究方向,受到學(xué)術(shù)界和工業(yè)界的普遍重視[1]。

        本文研究了一種以生成對(duì)抗網(wǎng)絡(luò)(GAN)、文字檢測(cè)(CTPN)和(CRNN+CTC)模型來針對(duì)水印環(huán)境情況下如何進(jìn)行文字提取的技術(shù)。

        一、總體設(shè)計(jì)與實(shí)現(xiàn)

        文字識(shí)別技術(shù)是計(jì)算機(jī)視覺研究領(lǐng)域的一個(gè)重要分支,被廣泛應(yīng)用于票據(jù)的提取,證件的識(shí)別以及人工智能等領(lǐng)域。然而識(shí)別環(huán)境的復(fù)雜多變導(dǎo)致了識(shí)別的文字?jǐn)?shù)據(jù)往往不可靠,圖片水印就是其中之一。

        應(yīng)對(duì)水印下的文字識(shí)別采用GAN網(wǎng)絡(luò)來達(dá)到去水印的目的。相對(duì)于普通的神經(jīng)網(wǎng)絡(luò)而言GAN采用兩個(gè)不同網(wǎng)絡(luò)模型進(jìn)行對(duì)抗性訓(xùn)練,而且G的梯度的信息來自于判別器而并非數(shù)據(jù)的樣本集。再將去除水印的圖片利用CTPN定位文字的位置達(dá)到文字檢測(cè)的效果,最終使用CRNN模型端對(duì)端的識(shí)別文字的序列。CRNN模型是一種簡單高效的文字識(shí)別模型,該模型由圖片特征提取層(CNN)提取圖像卷積特征,然后序列化建模層(RNN)使用BiLSTM進(jìn)一步預(yù)測(cè)圖像卷積特征中的序列特征,最后引入解碼層(CTC)對(duì)齊輸出的文本。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,它可以直接從序列標(biāo)簽中學(xué)習(xí),而無需詳細(xì)標(biāo)記;不再需要預(yù)處理步驟和手工特征;易于部署,結(jié)構(gòu)簡單,適用于文本長度變化較大的生產(chǎn)環(huán)境。CRNN模型是目前流行的圖形識(shí)別模型,可以識(shí)別較長的文章序列。它使用諸如BLSTM和CTC之類的組件來理解文章圖形中的上下文,從而有效地提高了文章識(shí)別的準(zhǔn)確性,并使建模更加健壯。CRNN是一種卷積循環(huán)神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu),一般用于處理基于圖像的序列信息識(shí)別問題,但更多地用作場(chǎng)景文本識(shí)別問題。

        輸入的圖片通過GAN層進(jìn)行水印的去除,將所得到的去除水印后的圖片作為CTPN層的輸入,在CTPN中輸入的圖像進(jìn)行文字的檢測(cè),將所得到的序列特征信息作為CRNN層的輸入,在CRNN層對(duì)特征序列信息進(jìn)行識(shí)別,并在CTC中找到概率最高的一組組合標(biāo)簽序列并將其進(jìn)行預(yù)測(cè)輸出,實(shí)現(xiàn)原理圖如圖1所示。

        (一)GAN去水印模型

        GAN是一種訓(xùn)練生成式的新的模型方法,包含兩個(gè)”對(duì)抗”模型,生成器模型和判別器模型[2]。生成器模型:用于進(jìn)行數(shù)據(jù)的捕捉分布;判別器模型:用來進(jìn)行判別樣本來自真實(shí)數(shù)據(jù)而并非生成的樣本的概率。

        在GAN中輸入一張帶有水印的圖片,輸出則為不帶水印的圖片。判別器(D)用于判別是原始無水印圖片還是生成器(G)生成無水印圖片。在兩者不斷地對(duì)抗訓(xùn)練的過程中,可以使得生成器(G)產(chǎn)生的無水印的圖片達(dá)到以假亂真的效果,從而達(dá)到去除水印的效果。對(duì)GAN生成器(G)和判別器(D)增加額外信息(y)并作為輸入層的一部分。對(duì)生成器(G)中將輸入噪聲p(z)和條件信息(y)聯(lián)合組和形成聯(lián)合隱層表征。

        (二)CRNN+CTC文字識(shí)別

        CRNN作為一種新型的神經(jīng)網(wǎng)絡(luò)模型,它結(jié)合了CNN、RNN和CTC三個(gè)網(wǎng)絡(luò)模型,主要用于對(duì)可變長度文本序列進(jìn)行端到端的識(shí)別。CNN用于對(duì)輸入圖像的卷積特征提取并得到特征圖;雙向的RNN(BLSTM)用于對(duì)CNN輸出的特征序列進(jìn)行預(yù)測(cè),得到特征向量的標(biāo)簽分布;CTC用于將RNN所獲得的標(biāo)簽進(jìn)行轉(zhuǎn)化,并確定最終的結(jié)果。

        1、CTC卷積層。CRNN卷積層由標(biāo)準(zhǔn)CNN和最大池化層兩部分所組成,能夠?qū)斎雸D像的特征序列進(jìn)行自動(dòng)提取。與標(biāo)準(zhǔn)CNN不同的是,CRNN卷積層會(huì)保證圖像的寬度不變。

        在卷積層中一共有四個(gè)最大池化層,其中最后兩個(gè)池化層窗口為1×2。也就是將圖像的高度減半4次,而寬度減半2次。由于大多數(shù)圖像高度較小而寬度較長,因此feature map也是一個(gè)與之相對(duì)應(yīng)的矩形。同時(shí)隨著Batch Normalization模塊的加入使得模型快速進(jìn)行收斂,從而減少模型的訓(xùn)練過程。

        2、CTC。CTC負(fù)責(zé)每一幀的預(yù)測(cè),從而找到概率最高的一組標(biāo)簽序列。端到端OCR的難點(diǎn)在于對(duì)不定長序列的處理的。RNN識(shí)別后輸出的定長序列,在對(duì)該序列進(jìn)行識(shí)別時(shí)可能出現(xiàn)信息的冗余和信息的丟失。所以我們需要一套行之有效的方法來解決識(shí)別過程的冗余機(jī)制,而CTC的blank機(jī)制恰好能夠較好的解決此問題。

        二、實(shí)驗(yàn)

        本次實(shí)驗(yàn)的數(shù)據(jù)集是通過人工手動(dòng)添加水印進(jìn)行制作的100張帶有水印的照片,其中70張圖像作為訓(xùn)練集,30張圖片作為測(cè)試集,實(shí)驗(yàn)最終準(zhǔn)確率可達(dá)到76.67%。

        在實(shí)驗(yàn)的過程中將原始圖片作為輸入,經(jīng)過GAN進(jìn)行照片水印的去除,然后在通過CTPN進(jìn)行文字的檢測(cè),最終通過CRNN和CTC進(jìn)行文字的識(shí)別輸出,如下圖3所示.

        三、結(jié)語

        本實(shí)驗(yàn)采用自制的100張數(shù)據(jù)集進(jìn)行訓(xùn)練,通過GAN、CTPN、CRNN以及CTC從而實(shí)現(xiàn)端到端的圖片文字識(shí)別,將圖片中不定長度的文字作為一個(gè)整體,對(duì)改區(qū)域進(jìn)行文字的預(yù)測(cè)識(shí)別,并返回該該區(qū)域文字的內(nèi)容。在訓(xùn)練后該模型的識(shí)別率可以較為穩(wěn)定的達(dá)到76.67%。在后續(xù)我們將進(jìn)一步對(duì)該模型的參數(shù)進(jìn)行調(diào)整以及訓(xùn)練數(shù)據(jù)集的豐富,從而達(dá)到更好的識(shí)別效果。

        參考文獻(xiàn):

        [1] 張婷婷, 馬明棟, 王得玉. OCR文字識(shí)別技術(shù)的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展, 2020, 30(4):4.

        [2] 曹仰杰, 賈麗麗, 陳永霞,等. 生成式對(duì)抗網(wǎng)絡(luò)及其計(jì)算機(jī)視覺應(yīng)用研究綜述[J].中國圖象圖形學(xué)報(bào), 2018, 23(10):17.

        作者簡介:董浪(2000-),男,漢族,湖北省大冶市人,本科,研究方向:人工智能、深度學(xué)習(xí)。

        資助項(xiàng)目:2022年湖北省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(編號(hào)DC2022032)

        猜你喜歡
        標(biāo)簽卷積文字
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        文字的前世今生
        熱愛與堅(jiān)持
        當(dāng)我在文字中投宿
        文苑(2020年12期)2020-04-13 00:55:10
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        無懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        標(biāo)簽化傷害了誰
        基于多進(jìn)制查詢樹的多標(biāo)簽識(shí)別方法
        免费在线日韩| 无码人妻精品一区二区三区9厂| 精品久久中文字幕系列| 日本饥渴人妻欲求不满| 边添小泬边狠狠躁视频| 国产人妻丰满熟妇嗷嗷叫| 人人爽久久涩噜噜噜av| 无码国产精品一区二区免费16| 亚洲国产AⅤ精品一区二区久| 久久午夜一区二区三区| 与漂亮的女邻居少妇好爽 | av免费在线免费观看| 色综合久久久久综合99| 久久精品国产色蜜蜜麻豆| 97人妻熟女成人免费视频| 无码专区无码专区视频网址| 久久国产精品精品国产色| 精品人妻少妇av中文字幕| 少妇aaa级久久久无码精品片| 老熟女多次高潮露脸视频| 中文字幕亚洲精品第一页| 水蜜桃在线观看一区二区国产 | 亚洲精品suv精品一区二区| 熟妇无码AV| 国产美女高潮流的白浆久久| 日韩在线精品视频一区| 亚洲性无码一区二区三区| 久久久久久久无码高潮| 中文字幕亚洲精品码专区| av在线免费观看男人天堂| 亚洲字幕中文综合久久| 十四以下岁毛片带血a级| 国产成人无码区免费内射一片色欲| 两个人看的www中文在线观看| 人妻精品一区二区免费| 丝袜美足在线视频国产在线看| 免费国产a国产片高清网站| 欧美成人免费全部| 99热国产在线| 白白在线免费观看视频| 激情综合婷婷色五月蜜桃|