亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于圖像處理和卷積神經(jīng)網(wǎng)絡(luò)的文本驗(yàn)證碼識(shí)別方案

        2020-09-10 06:50:56陳振昂黃星期秦中元
        網(wǎng)絡(luò)空間安全 2020年8期
        關(guān)鍵詞:效果圖滴水字符

        陳振昂,黃星期,秦中元

        〔1.東南大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,江蘇南京 211189;2.網(wǎng)絡(luò)空間國(guó)際治理研究基地(東南大學(xué)),江蘇南京211189〕

        1 引言

        驗(yàn)證碼技術(shù)的全稱(chēng)是“全自動(dòng)區(qū)分計(jì)算機(jī)和人類(lèi)的圖靈測(cè)試”(Completely Automated Public Test to tell Computer and Humans Apart,CAPTCHA),基本思想:根據(jù)預(yù)先人為制定的規(guī)則,由計(jì)算機(jī)系統(tǒng)自動(dòng)生成一個(gè)用戶可以很容易解決但是計(jì)算機(jī)系統(tǒng)卻很難或者根本無(wú)法解決的問(wèn)題。其中文本驗(yàn)證碼是使用最廣泛的驗(yàn)證碼技術(shù)之一,目前對(duì)于它的識(shí)別研究已經(jīng)成為了一個(gè)比較熱門(mén)的領(lǐng)域[1]。

        George D等人[2]根據(jù)神經(jīng)科學(xué)基礎(chǔ)—人體記憶物體時(shí)總是同時(shí)記憶該物體的輪廓和表面特征,提出了遞歸皮層網(wǎng)絡(luò)(Recursive Cortical Network,RCN),將驗(yàn)證碼的識(shí)別過(guò)程分為表征、推理和學(xué)習(xí)三個(gè)步驟。盡管該方案能獲得較好的識(shí)別準(zhǔn)確率,對(duì)訓(xùn)練集樣本數(shù)量要求要較低,但計(jì)算量龐大,需要較好的硬件設(shè)備。Dazhen Lin等人[3]針對(duì)基于漢字的驗(yàn)證碼提出了新的卷積神經(jīng)網(wǎng)絡(luò)模型,對(duì)混合干擾的驗(yàn)證碼進(jìn)行測(cè)試,識(shí)別準(zhǔn)確率均達(dá)到85%以上。但實(shí)驗(yàn)樣本字符間有明顯間隔,且反分割手段較差。Xing Wu等人[4]對(duì)帶有噪聲的可變長(zhǎng)的基于漢字的文本驗(yàn)證碼進(jìn)行了研究,實(shí)驗(yàn)結(jié)果表明,所提出的方法能夠有效地識(shí)別出帶有噪聲的可變長(zhǎng)漢字驗(yàn)證碼。但該方法受數(shù)據(jù)集影響明顯,并且字符分割方案不適用于具有復(fù)雜反分割手段的驗(yàn)證碼。

        基于國(guó)內(nèi)外學(xué)者的研究,本文提出了一種基于圖像處理和卷積神經(jīng)網(wǎng)絡(luò)的文本驗(yàn)證碼識(shí)別方案,本文設(shè)計(jì)的圖像分割算法具有較好的通用性,能夠有效提取出字符并且識(shí)別具有較高的準(zhǔn)確率。

        2 相關(guān)工作

        2.1 預(yù)處理

        原始驗(yàn)證碼圖片一般為RGB彩色圖片,并且?guī)в性肼暬【€等干擾。預(yù)處理階段的主要目的是去除驗(yàn)證碼圖片中的冗余信息(如背景顏色、噪聲弧線等)。此階段的流程如圖1所示。其中,二值化過(guò)程采用最大類(lèi)間方差法,采用3×3的中值濾波去除噪聲。經(jīng)過(guò)預(yù)處理的圖像如圖2所示。

        圖1 預(yù)處理流程圖

        圖2 預(yù)處理效果圖

        2.2 腐蝕

        形態(tài)學(xué)腐蝕[5]可以細(xì)化字符,從而進(jìn)一步減少噪聲,并去除毛刺,腐蝕后的效果圖如圖3所示。

        2.3 顏色填充算法

        顏色填充算法(Color Filling Segmentation,CFS)[6]是一種連通域分割算法,其基本思想是以某一像素點(diǎn)為起始點(diǎn)遍歷其所在的連通域。但是此方法的缺陷在于無(wú)法將斷裂的字符識(shí)別為同一連通域,因此本文將對(duì)其改進(jìn)。

        圖3 形態(tài)學(xué)腐蝕效果圖

        2.4 滴水算法

        滴水算法是一種用于分割手寫(xiě)粘連字符的算法,它模擬水滴的滾動(dòng),通過(guò)水滴的滾動(dòng)路徑來(lái)分割字符,可以解決直線切割造成的過(guò)分分割問(wèn)題。但該方法無(wú)法處理圖中的水平線條遇到邊界導(dǎo)致算法異常結(jié)束,因此本文將對(duì)其改進(jìn)。

        3 字符分割

        3.1 改進(jìn)顏色填充算法

        本文研究方案對(duì)顏色填充算法做三個(gè)方面的修改:

        (1)去除像素個(gè)數(shù)小于6的連通域;

        (2)合并邊界重合率達(dá)到70%以上的連通域;

        (3)計(jì)算保留連通域的平均像素個(gè)數(shù),設(shè)為T(mén),去除像素個(gè)數(shù)小于T的四分之一的連通域。

        值得說(shuō)明的是,邊界重合率是兩個(gè)不同連通域的位置重合程度指標(biāo)。設(shè)連通域1的橫坐標(biāo)范圍為[a,b],連通域2的橫坐標(biāo)范圍為[c,d](其中a

        算法效果如圖4所示。

        圖4 改進(jìn)顏色填充算法效果

        3.2 改進(jìn)的滴水算法

        為更好分割字符,本文對(duì)滴水算法做出的修改為:

        (1)水滴水平滾動(dòng)時(shí),記錄其左右邊界,當(dāng)邊界距離超過(guò)8像素或再次到達(dá)邊界時(shí),取中心位置為下一滴落點(diǎn);

        (2)水滴到達(dá)底部時(shí),若距離其左側(cè)邊界過(guò)近(小于右側(cè)三分之一)或過(guò)遠(yuǎn)(大于右側(cè)的3倍),則將水滴起始位置分別向右或向左移動(dòng)1像素,重新開(kāi)始算法,校正次數(shù)超過(guò)8次,便判定為分割失敗。

        滴水算法效果圖如圖5所示。

        圖5 改進(jìn)的滴水算法效果圖

        3.3 提取字符

        對(duì)于已經(jīng)預(yù)處理完畢的圖片,如果顏色填充算法所得連通域個(gè)數(shù)正好等于實(shí)際字符個(gè)數(shù),則直接使用連通域分割,否則,使用滴水算法分割。

        如圖6所示為提取的字符效果圖,為降低后續(xù)計(jì)算量,將其壓縮到32×32。

        圖6 提取字符效果圖

        4 字符識(shí)別

        本文利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)構(gòu)建了一個(gè)模型,并使用字符信息對(duì)其進(jìn)行訓(xùn)練。

        4.1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

        本文設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)包含三個(gè)卷積層、三個(gè)池化層、兩個(gè)全連接層等,具體架構(gòu)參數(shù)如表1所示。

        表1 CNN模型架構(gòu)參數(shù)列表

        4.2 中心損失

        中心損失(Center Loss)函數(shù)是由Wen Y等人[7]針對(duì)人臉識(shí)別任務(wù)提出的一種可以增強(qiáng)深度學(xué)習(xí)模型判別力的損失函數(shù)。中心損失會(huì)學(xué)習(xí)每個(gè)類(lèi)的深層特征從而得到一個(gè)類(lèi)中心,并懲罰每個(gè)深層特征與其對(duì)應(yīng)類(lèi)中心的距離,即更關(guān)注類(lèi)內(nèi)差異。

        具體實(shí)現(xiàn)過(guò)程可概括為:

        (1)初始化類(lèi)中心、學(xué)習(xí)率等參數(shù);

        表2 實(shí)驗(yàn)數(shù)據(jù)集

        (2)如果已收斂,則結(jié)束;否則根據(jù)每批次輸入數(shù)據(jù)計(jì)算中心損失,根據(jù)梯度計(jì)算反向傳播誤差,再更新每個(gè)類(lèi)的中心。

        在本文設(shè)計(jì)的方案中,類(lèi)深度特征中心的學(xué)習(xí)率η與誤差反向傳播的學(xué)習(xí)率相同,中心損失占總損失的權(quán)重λ為0.01。

        5 實(shí)驗(yàn)結(jié)果

        5.1 實(shí)驗(yàn)數(shù)據(jù)集

        本文數(shù)據(jù)集均來(lái)自生成和網(wǎng)絡(luò)采集,具體如表2所示。

        5.2 字符分割算法評(píng)估

        本文設(shè)計(jì)并實(shí)現(xiàn)的字符分割算法,聯(lián)合投影分析、顏色填充算法等多種技術(shù)進(jìn)行字符預(yù)分割操作,根據(jù)每張驗(yàn)證碼圖片中字符間的實(shí)際情況決定采用連通域分割或者修改的滴水算法分割,從而提取出獨(dú)立字符。本文對(duì)于表2中的實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行了試驗(yàn)評(píng)估,各數(shù)據(jù)集的字符分割成功率如表3所示??梢钥闯?,本文的方法在各數(shù)據(jù)集上的效果都很好。

        5.3 模型評(píng)估

        為了進(jìn)一步評(píng)估本文提出的文本驗(yàn)證碼識(shí)別算法,本文還將實(shí)驗(yàn)結(jié)果與相關(guān)研究進(jìn)行了比較。本文復(fù)現(xiàn)了引言中提到的各方案,在各數(shù)據(jù)集上識(shí)別準(zhǔn)確率的比較如表4所示,可以看出本文提出的方案在各實(shí)驗(yàn)數(shù)據(jù)集上均能表現(xiàn)出一定優(yōu)勢(shì),僅在實(shí)驗(yàn)數(shù)據(jù)集F和H略遜于RCN和FRN,這是由于本文使用了CNN作為識(shí)別網(wǎng)絡(luò),該網(wǎng)絡(luò)需要較龐大的訓(xùn)練數(shù)據(jù)集,而實(shí)驗(yàn)數(shù)據(jù)集F和H卻偏小,造成了一定的過(guò)擬合,但在實(shí)驗(yàn)數(shù)據(jù)集G和I(分別是對(duì)數(shù)據(jù)集F和H的擴(kuò)充)上,本文方案識(shí)別準(zhǔn)確率取得了明顯的提升,可以超過(guò)使用RCN和FRN的方案。值得說(shuō)明的是,表4中存在一些空缺項(xiàng),空缺原因是該算法不適用于對(duì)應(yīng)的數(shù)據(jù)集。

        總體來(lái)看,本文提出的文本驗(yàn)證碼識(shí)別方案對(duì)于字符獨(dú)立和存在字符粘連、噪聲塊與噪聲線等反分割設(shè)計(jì)的文本驗(yàn)證碼均能表現(xiàn)出更好的識(shí)別性能,當(dāng)字符訓(xùn)練數(shù)據(jù)集較小時(shí)也能通過(guò)擴(kuò)充的方式提高識(shí)別準(zhǔn)確率。

        6 結(jié)束語(yǔ)

        驗(yàn)證碼是互聯(lián)網(wǎng)業(yè)務(wù)的安全基礎(chǔ)設(shè)施之一,也是目前保障電子商務(wù)業(yè)務(wù)安全的重要環(huán)節(jié)之一。本文提出了一種通用的文本驗(yàn)證碼識(shí)別方案,即先進(jìn)行預(yù)處理,再使用改進(jìn)的顏色填充算法和滴水算法進(jìn)行字符分割,最后進(jìn)行字符識(shí)別。此外,本文構(gòu)建了一個(gè)具有三個(gè)卷積層、三個(gè)池化層、兩個(gè)全連接層的卷積神經(jīng)網(wǎng)絡(luò),并引入了中心損失來(lái)最小化類(lèi)內(nèi)差異。實(shí)驗(yàn)部分,本文復(fù)現(xiàn)了四種典型的文本驗(yàn)證碼方法,通過(guò)準(zhǔn)確率的比較發(fā)現(xiàn),本文提出的方案在各實(shí)驗(yàn)數(shù)據(jù)集上均能表現(xiàn)出一定優(yōu)勢(shì)。雖然在數(shù)據(jù)集F和H上不如RCN和FRN,但是在擴(kuò)充數(shù)據(jù)集G和I上,解決了過(guò)擬合現(xiàn)象后,實(shí)現(xiàn)了準(zhǔn)確率的明顯提升。實(shí)驗(yàn)結(jié)果表明,本文提出的方法能夠有效提取出驗(yàn)證碼字符,并且能獲得更高的識(shí)別準(zhǔn)確率。

        猜你喜歡
        效果圖滴水字符
        室內(nèi)外效果圖作品
        大眾文藝(2023年5期)2023-04-02 04:49:50
        尋找更強(qiáng)的字符映射管理器
        有趣的滴水實(shí)驗(yàn)
        《客廳效果圖》
        流行色(2020年2期)2020-04-28 06:10:06
        效果圖1
        流行色(2019年11期)2020-01-09 07:20:28
        效果圖2
        流行色(2019年11期)2020-01-09 07:20:28
        字符代表幾
        一種USB接口字符液晶控制器設(shè)計(jì)
        電子制作(2019年19期)2019-11-23 08:41:50
        消失的殖民村莊和神秘字符
        滴水能涌泉
        亚洲人成网站18男男| 日韩亚洲欧美中文在线| 久久无码高潮喷水| 精精国产xxxx视频在线播放器| 青青草久久久亚洲一区| 中文有码亚洲制服av片| 亚洲色大成网站www久久九| 美女裸体无遮挡免费视频的网站| 精品国产乱码一区二区三区| 开心五月婷婷激情综合网| 亚洲色欲色欲www在线观看| 日本一区二区不卡视频| 亚洲熟女国产熟女二区三区| av网站大全免费在线观看| 免费无码中文字幕a级毛片| 国产精品开放小视频| 国产毛片一区二区日韩| 日本中文字幕婷婷在线| 国产深夜男女无套内射| 无码一级视频在线| 亚洲天堂一二三四区在线| 天天干天天日夜夜操| 国产精品成人国产乱| 91成人午夜性a一级毛片| 粉色蜜桃视频完整版免费观看在线| 成 人色 网 站 欧美大片在线观看| 久热综合在线亚洲精品| 欧美激情国产一区在线不卡| 在线观看的a站免费完整版| 男女做爰高清免费视频网站| 国产人妖视频一区二区| 一本大道久久精品一本大道久久| 一区二区亚洲精品在线| 国产在线精品一区在线观看| 亚洲中文字幕久久精品蜜桃 | 内射少妇36p九色| 国产成人香蕉久久久久| av网站免费在线浏览| 国产精品亚洲αv天堂无码| 亚洲AV秘 无码一区二区三区臀| 日本高清在线一区二区三区 |