亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        自然場景文本信息提取關(guān)鍵技術(shù)探究

        2016-08-09 05:29:47蔡映雪蔡昭權(quán)惠州學(xué)院
        電子制作 2016年14期
        關(guān)鍵詞:算子灰度邊緣

        胡 輝 胡 松 陳 伽 蔡映雪 陳 軍 蔡昭權(quán) 惠州學(xué)院

        ?

        自然場景文本信息提取關(guān)鍵技術(shù)探究

        胡 輝 胡 松 陳 伽 蔡映雪 陳 軍 蔡昭權(quán) 惠州學(xué)院

        (11JXZ012,14JXN065),廣東省自然科學(xué)基金項目(S2013010013432,S2013010015940),廣東省教育廳項目(2013LYM00874),廣東省高校優(yōu)秀青年創(chuàng)新人才培養(yǎng)計劃資助項目(2013LYM_0087),惠州市科技計劃項目(2013B020015008,2014B020004026,2014B050013016,2014B020004023,2015B010002002)

        【文章摘要】

        【關(guān)鍵詞】

        自然場景;文本信息;圖像分割;特征提取

        引言

        視覺是人們感知世界客觀事物最為重要的一個手段,圖像是人類視覺的輸入的基礎(chǔ),也是對自然場景的描述,其可以采集自然環(huán)境的各類型信息。圖像中的問題是自然場景的描述信息,也是自然場景的重要內(nèi)容,可以為人們快速定位信息提供強大的線索,比如商店招牌、導(dǎo)航招牌、交通指示牌、大型建筑物廣告文字等,這些文字都具有較為明確的含義,也是自然場景信息的重要的表現(xiàn)形式[1]。據(jù)統(tǒng)計,文本信息對于人們具有更加明顯的吸引能力,因此利用先進的圖像處理技術(shù)識別文字內(nèi)容,具有重要的作用和意義。隨著大數(shù)據(jù)、云計算、圖形處理技術(shù)的快速發(fā)展,識別自然場景圖像中的文本信息已經(jīng)成為需對學(xué)者研究的熱點。目前,資產(chǎn)場景文本信息提取具有以下幾個方面的應(yīng)用。

        (1)車牌識別。目前,各個交通卡口都設(shè)置了測速儀和攝像機,卡口車流量非常大,為了能夠快速定位每一輛車,判斷車輛是否違法,提高車牌檢索、判別的速度和準(zhǔn)確度,以便能夠更好的保證車輛遵守交通秩序,進一步提高智能交通應(yīng)用成效[2]。

        (2)提高圖片檢索效率。目前,google、百度等瀏覽器已經(jīng)提供了圖片檢索功能,用戶輸入相關(guān)的圖片之后,系統(tǒng)自動識別圖片中的文本信息,并且在網(wǎng)絡(luò)上檢索類似的圖片信息,并且輸出檢索結(jié)果到網(wǎng)頁上[3]。

        (3)為工業(yè)生產(chǎn)提供幫助。工業(yè)生產(chǎn)過程中,可以利用文本信息識別技術(shù)提升圖像檢測效率,進一步提高工業(yè)生產(chǎn)精細化、智能化和共享化[4]。

        目前,自然場景文本信息提取已經(jīng)引入了許多先進的技術(shù),包括支持向量機、 BP神經(jīng)網(wǎng)絡(luò)、近鄰傳播、遺傳算法、 K均值等算法,進一步提高了自然場景文本信息提取的精準(zhǔn)程度。論文結(jié)合筆者多年的研究經(jīng)驗,詳細地分析了自然場景文本信息提取的關(guān)鍵技術(shù),這些技術(shù)主要包括形態(tài)學(xué)處理、文本圖像分割、文本信息特征提取等,以便為自然場景文本信息處理提供參考,改進文本信息識別準(zhǔn)確度和效率。

        1.自然場景文本信息提取關(guān)鍵技術(shù)

        1.1形態(tài)學(xué)處理

        形態(tài)學(xué)以數(shù)學(xué)形態(tài)學(xué)為基本原理,將自然場景圖像中的文字形態(tài)作為研究和描述的對象,并且能夠?qū)⑾嚓P(guān)的文字結(jié)構(gòu)和特征之間的關(guān)系,包括各類元素之間的關(guān)系和區(qū)域之間的關(guān)系等[8]。一般情況下,形態(tài)學(xué)圖像處理可以計算文字邊緣的鄰域信息,并且能夠?qū)⑧徲蛐畔⒔Y(jié)構(gòu)化,將每一個鄰域結(jié)構(gòu)化元素和相關(guān)的區(qū)域進行有效計算,并且將運算結(jié)果作為一種輸出圖像,能夠進行有效的計算[5]。二值圖像是指像素點僅僅取值0或1的兩種灰度級的圖像,灰度圖像經(jīng)過閾值判決之后,可以將一幅灰度圖像轉(zhuǎn)換為二值圖像,并且能夠?qū)⒋罅康墓铝⒃肼朁c、區(qū)域空洞和連接間斷等節(jié)能型去除干擾,并且能夠獲取更好的物體形態(tài)[9]。

        開運算在實際的應(yīng)用過程中,結(jié)構(gòu)元素B對集合A的開運算分為兩個步驟,分別是先用結(jié)構(gòu)元素對圖像的集合A進行有效的腐蝕,接著再使用結(jié)構(gòu)元素B對腐蝕之后的結(jié)果進行膨脹運算。

        1.2連通分量處理

        二值圖像經(jīng)過實施開運算之后,接著需要對圖像的連通分量進行有效的分析,可以提取出圖像中的結(jié)構(gòu)化物體[6]。連通的定義如下:假設(shè)在二值圖像中,如果兩個像素的灰度值是相等的,并且能夠滿足一定的規(guī)定條件,則表示兩個元素是連通的。在連通分量分析過程中,灰度值為1的像素表示需要等待提取的像素,則與該像素相鄰的像素還能夠滿足兩種鄰接方式,分別是四鄰接和八鄰接。四鄰接表示水平方向的像素和垂直方向的像素都相鄰,八鄰接表示水平方向、垂直方向和對角方向上的像素均為相鄰的像素。

        1.3文本圖像分割技術(shù)

        1.3.1灰度閾值分割

        1.3.2邊緣檢測方法

        邊緣檢測的主要目的是為了提取圖像中不聯(lián)系的特征內(nèi)容,根據(jù)閉合的邊緣確定相關(guān)的區(qū)域。邊緣檢測算法不需要逐個分割圖像的像素,更加適用于大圖像的分割[8]。常用的邊緣檢測算子較多,這些算子可以與圖像卷積,定位圖像邊緣的位置和方向。一階邊緣檢測算子主要包括Roberts算子和Sobel邊緣算子,具體的一階邊緣檢測算子方法詳細描述如下。Roberts算子可以利用局部差分算子尋找火焰視頻圖形邊緣,采用的理論公式如式2所示。

        其中,f(x,y)表示一個具有整數(shù)像素坐標(biāo)的輸入圖像,平方根運算可以模擬人類視覺系統(tǒng)發(fā)現(xiàn)火焰視頻圖像邊緣的整個過程。Roberts算子可以實現(xiàn)較為準(zhǔn)確的邊緣定位,但是其對于噪聲數(shù)據(jù)非常敏感,因此Roberts算子對于具有較為明顯邊緣、噪聲數(shù)據(jù)非常少的圖形進行定位具有良好的效果。

        Sobel邊緣檢測算子可以采用一個3×3的矩陣進行描述,可以分別從水平、垂直兩個方向?qū)D像進行卷積操作,計算出水平、垂直兩個方向的亮度差的近似值,比如可以使用矩陣A表示原始的圖像內(nèi)容,Gx表示垂直方向邊緣檢測的圖形,Gy表示水平方向橫向邊緣檢測圖像[9]。

        二階邊緣檢測檢測算子最具代表性的是拉普拉斯算子。拉普拉斯算子是一個線性的、移不變算子,其可以對二維函數(shù)進行二階導(dǎo)數(shù)運算,假設(shè)f (x,y)表示一個在圖像中的位置(x,y),則拉普拉斯算子可以描述為公式(3)。

        拉普拉斯算子(Laplace)充分的利用二階導(dǎo)數(shù)具有各向同性的性質(zhì),并且拉普拉斯算子與坐標(biāo)軸的方向是相互獨立的,坐標(biāo)軸旋轉(zhuǎn)之后梯度結(jié)果保持不變。圖像經(jīng)過二階微分之后,可以在文字圖像邊緣處產(chǎn)生一個較為尖銳的零交叉點,根據(jù)這個零交叉點判斷圖像的邊緣信息,拉普拉斯算子的模板如圖1所示。

        圖1 Laplace算子的模板

        圖像的文字邊緣檢測是為了能夠在圖像中尋找到具有局部最大梯度值的像素點,因此文字圖形邊緣檢測過程中必須能夠有效濾除噪聲、盡量精確定位邊緣位置[10]。Canny算子是高斯函數(shù)的一階導(dǎo)數(shù),其可以對信噪比和定位乘積進行最優(yōu)化逼近,具體的Canny算子的檢測步驟如下所述。

        第一步:使用高斯濾波器對文字圖像進行平滑操作,消除噪聲數(shù)據(jù);

        第二步:使用一階偏導(dǎo)數(shù)實施有限差分,計算文字梯度的幅值和方向;

        第三步:對文字梯度幅值實施調(diào)整,使用非極大值進行抑制操作;

        第四步:使用雙閾值算法檢測和連接圖像文字的邊緣。

        Canny算子文字圖像特征檢測算法具有以下三個方面的優(yōu)點:一是具有較低的誤碼率,可以準(zhǔn)確的判斷文字特征邊緣點;二是具有較高的特征定位精度,能夠精確的把文字邊緣點定位在灰度編號最大的像素之上;三是能夠抑制虛假邊緣點。

        1.4特征提取技術(shù)

        1.4.1幅度特征

        在圖像特征中,圖像的文字幅度度量是一種較為關(guān)鍵的特征。文字幅度度量可以有效的測量圖像點或及其鄰區(qū)做出關(guān)鍵的測量[11]。在算法執(zhí)行過程中,可以從某些線性或非線性的變換過程中構(gòu)成了新的圖像文字幅度的空間,也可以直接從圖像的灰度等級求取圖像的文字幅度特征,以便能夠分離目標(biāo)物的描述,具有十分重要的作用。

        1.4.2線條或角點的特征

        對于一幅文字圖像來講,文字線條的軌跡特征可以有效的描述圖像中的文字的凸凹狀態(tài),數(shù)學(xué)上被稱為圖像的線條的法向量。通常情況下,圖像的文字幅度是由低到高、再從高到低發(fā)生極大的變化的,因此可以使用不同的峰值檢測出圖像的文字線條,提取圖像的線條或角點之后,既可以按照相似的比例壓縮圖像的大小,減低數(shù)據(jù)存儲的信息量,并且可以對圖像進行有效的推理、描述和識別[12]。

        1.4.3灰度邊緣特征

        數(shù)字圖像文字特征處理過程中,由于圖像文字具有不連續(xù)性,灰度或紋理通常會發(fā)生改變等現(xiàn)象,因此圖像文字的特征可以有效的描述圖像中包含的各種字體,但是大范圍的不連續(xù)性容易給圖像文字造成邊界,因此如果圖像文字幅度水平具有不連續(xù)性,很容易稱為圖像的局部邊緣,一個比較理想的邊緣檢測器需要能夠檢測出圖像中目標(biāo)物體的各類邊緣,同時還能夠確定斜坡的位置。

        2.結(jié)束語

        隨著多媒體技術(shù)的快速發(fā)展和改進,圖像處理已經(jīng)得到了廣泛普及和使用,有效提升了工業(yè)生產(chǎn)、安防監(jiān)控、圖像檢索效率。自然場景文本信息提取可以與當(dāng)前實際應(yīng)用相互結(jié)合,比如車牌識別等,采用先進的形態(tài)學(xué)處理、連通分類處理、灰度閾值分割、文字邊緣檢測、幅度特征、線條或角點特征、灰度邊緣特征等處理模式進一步識別自然場景中的文本信息。

        【參考文獻】

        [1] 彭浩,陳繼鋒,劉瓊,等.一種面向聚焦爬蟲的自然場景文本定位技術(shù)[J].小型微型計算機系統(tǒng),2014,24(9):2014-2018.

        [2] 劉新瀚,錢侃,王宇飛,等.自然場景下基于連通域檢測的文字識別算法研究[J].計算機技術(shù)與發(fā)展,2015,21(5):41-45.

        [3] 黃曉明,高陳強,田陽陽.自然場景文本區(qū)域定位[J].重慶郵電大學(xué)學(xué)報:自然科學(xué)版,2015,27(5):700-705.

        [4] 楊彬,夏思宇.自然場景多方向文本檢測方法[J].華中科技大學(xué)學(xué)報:自然科學(xué)版,2015,22(S1):228-232.

        [5] 陳梓洋,王宇飛,錢侃,等.自然場景下基于區(qū)域檢測的文字識別算法[J].計算機技術(shù)與發(fā)展,2015,18(7):230-233.

        [6] 王瑾.基于局部顯著文字型區(qū)域的場景文本提取算法[J].太原師范學(xué)院學(xué)報:自然科學(xué)版,2014,16(4):33-39.

        隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和進步,多媒體應(yīng)用技術(shù)得到迅速改進和提升,取得了顯著的成效。自然場景文本信息提取是多媒體處理的關(guān)鍵技術(shù),目前已經(jīng)誕生了形態(tài)學(xué)、聯(lián)通分類、文本圖像分割、文本特征提取等多種技術(shù),有效提升了自然場景文本信息提取的成效,進一步改進了自然場景文本信息檢索的準(zhǔn)確度。

        【作者簡介】

        胡輝(1979-),女,江蘇鹽城,碩士,惠州學(xué)院,講師,研究方向為計算機軟件

        猜你喜歡
        算子灰度邊緣
        采用改進導(dǎo)重法的拓撲結(jié)構(gòu)灰度單元過濾技術(shù)
        擬微分算子在Hp(ω)上的有界性
        基于灰度拉伸的圖像水位識別方法研究
        各向異性次Laplace算子和擬p-次Laplace算子的Picone恒等式及其應(yīng)用
        一類Markov模算子半群與相應(yīng)的算子值Dirichlet型刻畫
        基于最大加權(quán)投影求解的彩色圖像灰度化對比度保留算法
        一張圖看懂邊緣計算
        Roper-Suffridge延拓算子與Loewner鏈
        基于灰度線性建模的亞像素圖像抖動量計算
        在邊緣尋找自我
        雕塑(1999年2期)1999-06-28 05:01:42
        av中文字幕在线资源网| 男人一插就想射的原因| 久久er99热精品一区二区| 无码人妻视频一区二区三区99久久| 华人免费网站在线观看| 北岛玲中文字幕人妻系列 | 亚洲av一二三又爽又爽又色| 国产一女三男3p免费视频 | 久久成人精品国产免费网站| 国产国拍精品av在线观看按摩 | 日本在线一区二区三区观看| 2022Av天堂在线无码| 人与禽交av在线播放| 国产一区二区精品亚洲| 伊在人亚洲香蕉精品区麻豆 | 久久深夜中文字幕高清中文| 99久久99久久精品国产片果冻| 国产自拍精品视频免费| 久久久国产精品粉嫩av| 国产高潮国产高潮久久久| 亚洲国产精品高清一区| 亚洲成片在线看一区二区| 国产成人综合久久精品免费| 久久久精品国产免大香伊| 亚洲国产精品一区亚洲国产| 奇米影视久久777中文字幕| 精品国产综合区久久久久久| 激情在线视频一区二区三区| 亚洲美腿丝袜综合一区| 精品无码国产自产拍在线观看| 女主播啪啪大秀免费观看| 亚洲成人av一区二区麻豆蜜桃| 亚洲暴爽av天天爽日日碰| 免费人成在线观看视频高潮| 午夜在线观看一区二区三区四区| 久久天天爽夜夜摸| 蜜臀av午夜一区二区三区| 可以直接在线看国产在线片网址 | 人妻少妇偷人精品一区二区三区| 男女性搞视频网站免费| 国产福利97精品一区二区|