亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于顯著性檢測(cè)的接觸網(wǎng)標(biāo)識(shí)牌識(shí)別研究

2020-03-18 01:39:08蔣麗潔柴曉冬李立明鄭樹(shù)彬

智能計(jì)算機(jī)與應(yīng)用 2020年9期

蔣麗潔，柴曉冬，李立明，鄭樹(shù)彬

(上海工程技術(shù)大學(xué) 城市軌道交通學(xué)院，上海 201620)

0 引言

隨著科技的進(jìn)步，提出將圖像處理與機(jī)械化鐵路巡檢結(jié)合起來(lái)，通過(guò)研究接觸網(wǎng)立柱信息，完成對(duì)接觸網(wǎng)立柱或標(biāo)識(shí)牌數(shù)字信息的識(shí)別，最終達(dá)到軌道區(qū)間定位的目的。武翔宇等應(yīng)用Hough直線(xiàn)檢測(cè)的接觸網(wǎng)支柱定位方法，利用HOG特征和SVM分類(lèi)器結(jié)合的方式成功完成支柱號(hào)碼牌識(shí)別[1]，其缺點(diǎn)是需要大量的正負(fù)樣本來(lái)收集特征；徐可佳將4C系統(tǒng)所拍攝接觸網(wǎng)支柱號(hào)作為研究對(duì)象，設(shè)計(jì)了基于Faster R-CNN的深度學(xué)習(xí)算法[2]，但圖像分辨率不高；劉華春等采用視覺(jué)顯著性檢測(cè)算法定位車(chē)牌[3]；陳曦等利用顯著性檢測(cè)算法自動(dòng)過(guò)濾不感興趣區(qū)域的干擾，高效的計(jì)算方式減少計(jì)算資源的浪費(fèi)[4]；姜博文等將馬爾可夫鏈與先驗(yàn)知識(shí)融合，擺脫前景區(qū)域的影響[5]。

對(duì)圖像簡(jiǎn)單線(xiàn)性迭代(simple linear iterative cluster ,SLIC)超像素分割后，本文提出利用吸收馬爾可夫鏈的顯著性檢測(cè)，對(duì)接觸網(wǎng)立柱區(qū)域初步定位，將接觸網(wǎng)區(qū)域進(jìn)行前景分割后，排除一切背景的干擾，利用基于MLP分類(lèi)器的算法對(duì)接觸網(wǎng)標(biāo)識(shí)牌信息進(jìn)行識(shí)別，為地鐵線(xiàn)路的軌道區(qū)間定位提供新思路，識(shí)別過(guò)程算法如圖1所示。

1 基于顯著性檢測(cè)的接觸網(wǎng)立柱定位算法

為了構(gòu)造吸收馬爾可夫鏈的顯著性檢測(cè)模型，首先利用強(qiáng)健的背景先驗(yàn)的算法來(lái)選擇吸收節(jié)點(diǎn)，以吸收馬爾科夫鏈中的轉(zhuǎn)移節(jié)點(diǎn)到吸收節(jié)點(diǎn)的被吸收時(shí)間作為轉(zhuǎn)移節(jié)點(diǎn)的顯著值。

1.1 強(qiáng)健背景先驗(yàn)的吸收節(jié)點(diǎn)選擇

邊界連通性是衡量圖像中區(qū)域連接到邊界程度的標(biāo)準(zhǔn)。由于SLIC超像素分割是在CIELAB顏色空間內(nèi)進(jìn)行的，節(jié)點(diǎn)間的權(quán)重dapp(p,q)以歐氏距離算法來(lái)計(jì)算。相應(yīng)的，根據(jù)節(jié)點(diǎn)間沿最短路徑累積邊界權(quán)重來(lái)計(jì)算兩節(jié)點(diǎn)的測(cè)地線(xiàn)距離公式(1)：

(1)

其中，n代表最短路徑經(jīng)過(guò)的節(jié)點(diǎn)個(gè)數(shù)，定義該式中dgeo(p,p)=0。

圖1 識(shí)別過(guò)程算法

邊界連通性定義公式為式(2)、式(3)，N是擴(kuò)展的超像素?cái)?shù)目，圖像邊界的像素塊δ(·)=1，σclr=10。

(2)

(3)

(4)

判斷邊界中像素節(jié)點(diǎn)是否為背景的不等式(5)，記寬度為d個(gè)像素的邊界中超像素的個(gè)數(shù)為K。本文取β=0.8。

(5)

根據(jù)邊界節(jié)點(diǎn)選擇方式，對(duì)超像素?cái)?shù)目為625和200圖像做邊界選擇，選出的背景集合，如圖2所示。在原圖(a)中，接觸網(wǎng)立柱區(qū)域處在圖像邊界，通過(guò)該方法很好的把立柱篩選出來(lái)。

圖2 基于強(qiáng)健的背景先驗(yàn)的邊界選擇

1.2 吸收馬爾可夫鏈的顯著性檢測(cè)

設(shè)吸收馬爾可夫鏈的狀態(tài)集合S={s1,s2,…,sn}中，吸收狀態(tài)與轉(zhuǎn)移狀態(tài)的數(shù)目分別為k和m，將轉(zhuǎn)移狀態(tài)放在吸收狀態(tài)之前，則矩陣P的標(biāo)準(zhǔn)形式如式(6)所示：

(6)

其中，轉(zhuǎn)移狀態(tài)間、轉(zhuǎn)移狀態(tài)與吸收狀態(tài)間的概率轉(zhuǎn)移矩陣分別為Q∈[0,1]m*m，R∈[0,1]m*k。

該鏈的基本矩陣N，計(jì)算公式如式(7)所示：

N=(I-Q)-1=I+Q+Q2+….

(7)

元素nij(nij∈N)描述的是起始狀態(tài)為si，被吸收之前經(jīng)歷過(guò)轉(zhuǎn)移狀態(tài)sj的期望時(shí)間，行和∑jnij揭示了被吸收之前，從狀態(tài)si出發(fā)經(jīng)歷所有轉(zhuǎn)移狀態(tài)的期望時(shí)間。每個(gè)轉(zhuǎn)移狀態(tài)的期望吸收時(shí)間組成向量為式(8)：

y=N×c.

(8)

其中，c為m維的單位列向量。

為了確保邊界節(jié)點(diǎn)的顯著值能夠計(jì)算，復(fù)制圖像的邊界節(jié)點(diǎn)作為虛擬吸收節(jié)點(diǎn)，圖3為復(fù)制邊界后建立的包含虛擬吸收節(jié)點(diǎn)的圖模型G=(V,E)，無(wú)向邊構(gòu)成集合E，超像素作為節(jié)點(diǎn)V。

圖3 吸收馬爾可夫鏈的虛擬吸收節(jié)點(diǎn)

邊的權(quán)重wi,j的計(jì)算公式為式(9)：

(9)

其中ci，cj分別表示節(jié)點(diǎn)在CIELAB顏色空間的均值，權(quán)重的控制力度由常數(shù)σ=0.05來(lái)把握。

重新排列新的圖模型對(duì)應(yīng)的關(guān)聯(lián)矩陣A=(aij)，使得在矩陣A中t個(gè)轉(zhuǎn)移節(jié)點(diǎn)在前，r個(gè)吸收節(jié)點(diǎn)在后，aij為新圖模型中相鄰節(jié)點(diǎn)之間的相關(guān)性，i相鄰節(jié)點(diǎn)集合N(i)。

(10)

對(duì)角矩陣D=diag(∑jaij)表示連接到每個(gè)節(jié)點(diǎn)的權(quán)重之和。

在該圖模型下吸收馬爾可夫鏈的概率轉(zhuǎn)移矩陣P的計(jì)算公式為式(11)：

P=D-1×A.

(11)

已知轉(zhuǎn)移節(jié)點(diǎn)與吸收節(jié)點(diǎn)的個(gè)數(shù)分別為t和r，依據(jù)公式(8)可以提取矩陣Q，進(jìn)一步得到基本矩陣N=(I-Q)-1，利用公式(10)計(jì)算每個(gè)節(jié)點(diǎn)被不同吸收節(jié)點(diǎn)的吸收時(shí)間y，最后對(duì)時(shí)間y進(jìn)行歸一化處理得到每個(gè)節(jié)點(diǎn)的顯著值，式(12)：

(12)

實(shí)驗(yàn)結(jié)果顯示排除包括樹(shù)木在內(nèi)的背景的干擾，完成立柱定位檢測(cè)，如圖4所示。

圖4 顯著性檢測(cè)結(jié)果

對(duì)顯著圖通過(guò)立柱標(biāo)識(shí)牌的幾何特征包括區(qū)域面積、周長(zhǎng)、矩形度和致密程度在內(nèi)的特征值，進(jìn)一步分割得到標(biāo)識(shí)牌區(qū)域，如圖5所示。

圖5 標(biāo)識(shí)牌區(qū)域分割

1.3 基于像素垂直投影的字符分割

獲取標(biāo)識(shí)牌區(qū)域之后，需要對(duì)單個(gè)字符進(jìn)行分割，像素投影法算法簡(jiǎn)單、速率快，能夠達(dá)到本文快速識(shí)別算法的要求。首先，二值化標(biāo)識(shí)牌區(qū)域，使得數(shù)字區(qū)域轉(zhuǎn)化為白色像素點(diǎn)，其余區(qū)域?yàn)楹谏?。垂直投影是統(tǒng)計(jì)二值圖中每列的白色像素，將投影曲線(xiàn)用函數(shù)的形式表示出來(lái)，函數(shù)圖像會(huì)出現(xiàn)明顯的波峰波谷，波谷代表白色像素為0的某列，即數(shù)字的分割點(diǎn)。垂直投影得到的函數(shù)圖像如圖6所示。

從圖6可以看出，標(biāo)識(shí)牌中3個(gè)數(shù)字區(qū)域?qū)?yīng)像素投影函數(shù)圖中3個(gè)連續(xù)的波形區(qū)域，數(shù)字間隔對(duì)應(yīng)像素投影函數(shù)圖的波谷。以垂直投影圖中波谷對(duì)應(yīng)的列數(shù)對(duì)標(biāo)識(shí)牌進(jìn)行分割，分割結(jié)果如圖7所示。

2 基于MLP分類(lèi)器的標(biāo)識(shí)牌字符識(shí)別

為了規(guī)避標(biāo)識(shí)牌區(qū)域小、像素值不高的問(wèn)題，通過(guò)多層感知機(jī)神經(jīng)網(wǎng)絡(luò)(Multi-Layer Perceptron, MLP)分類(lèi)器，將每個(gè)標(biāo)識(shí)牌區(qū)域的紋理特征作為訓(xùn)練樣本，合理的選擇神經(jīng)網(wǎng)絡(luò)模型的參數(shù)，最終輸出識(shí)別結(jié)果。

(a) 標(biāo)識(shí)牌“111”

(b) 標(biāo)識(shí)牌“194”

圖7 數(shù)字分割結(jié)果

2.1 標(biāo)識(shí)牌紋理特征提取

提取圖像局部紋理特征，可以用局部二值模式(Local Binary Pattern，LBP)描述子來(lái)描述。LBP模式的基本操作單元是小鄰域內(nèi)的圖像紋理，具有計(jì)算量小、旋轉(zhuǎn)不變性和灰度不變性等優(yōu)點(diǎn)[6]。

(13)

(14)

旋轉(zhuǎn)不變統(tǒng)一模式的計(jì)算公式為式(15)：

(15)

將提取得到的特征值轉(zhuǎn)化為L(zhǎng)BP直方圖，數(shù)字“1”、“9”、“4”的標(biāo)識(shí)牌樣本圖的LBP圖譜如圖8所示，降維處理之后的特征直方圖維數(shù)為32。

圖8 LBP特征圖譜

2.2 字符識(shí)別算法

多層感知器(MLP)層間連接方式是全連接。輸入特征向量X、層與層之間的權(quán)重W與偏置b、激勵(lì)函數(shù)是MLP神經(jīng)網(wǎng)絡(luò)最主要的參數(shù)，通過(guò)公式(16)可了解基本MLP模型的數(shù)學(xué)關(guān)系，Softmax(·)代表輸出層的邏輯回歸函數(shù)。

y(x)=Softmax(b2+W2(f(W1X+b1))).

(16)

在MLP神經(jīng)網(wǎng)絡(luò)模型中，為了改變線(xiàn)性規(guī)則需要添加激活函數(shù)(Activation Function)，使得輸出結(jié)果與特征存在非線(xiàn)性相關(guān)，本文采用Sigmod (S型) 激活函數(shù)。該激活函數(shù)與其導(dǎo)函數(shù)可表示為式(17)：

(17)

MLP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程就是調(diào)整邊界權(quán)重與偏置參數(shù)的過(guò)程，最終結(jié)果是使得總均方誤差盡可能小。本文所用BP算法是最經(jīng)典的訓(xùn)練算法，以輸入層到隱含層為代表，參數(shù)更新如下：

將輸入層、隱含層的節(jié)點(diǎn)分別定義為xi，hj，層間節(jié)點(diǎn)的權(quán)值定義為wxi,hj，層與層之間權(quán)重更新如(18)：

(18)

其中，隱藏層的學(xué)習(xí)率為ηxi,hj。

將隱含層偏置定義為bh，則輸入到隱含層的偏置的更新為公式(19)：

(19)

其中，該層偏置的學(xué)習(xí)率為ηh。

本文采用均方誤差(Mean Squared Error, MSE)作為誤差估計(jì)的方法，用來(lái)測(cè)試網(wǎng)絡(luò)的訓(xùn)練性能，MSE的數(shù)學(xué)計(jì)算公式如(20)所示：

(20)

其中，h(x)、outoi分別為輸出層的輸出數(shù)據(jù)與期望輸出數(shù)據(jù)，則N類(lèi)輸出的總均方誤差公式為式(21)：

(21)

3 實(shí)驗(yàn)結(jié)果及分析

本實(shí)驗(yàn)研究對(duì)象為一段基于接觸網(wǎng)立柱的短視頻，將數(shù)字圖像尺寸統(tǒng)一調(diào)整到50×120的像素大小，經(jīng)過(guò)對(duì)各類(lèi)數(shù)字的紋理特征提取，輸入層特征向量維度為10×32，輸出層即為“0-9”十類(lèi)。

神經(jīng)網(wǎng)絡(luò)模型搭建完成后，對(duì)標(biāo)識(shí)牌區(qū)域測(cè)試集和樣本集進(jìn)行特征提取，訓(xùn)練得到的特征，其訓(xùn)練誤差曲線(xiàn)如圖9所示。將誤差目標(biāo)設(shè)定為0.001，經(jīng)過(guò)168次迭代后，誤差小于設(shè)置的目標(biāo)值，MLP分類(lèi)器訓(xùn)練截止，輸入測(cè)試集對(duì)標(biāo)識(shí)牌信息識(shí)別。

圖9 誤差曲線(xiàn)

為了解決圖像數(shù)據(jù)集過(guò)少的問(wèn)題，標(biāo)識(shí)牌區(qū)域旋轉(zhuǎn)合并到數(shù)據(jù)集中，最終得到200張標(biāo)識(shí)牌圖像，分割數(shù)字字符后，基于MLP神經(jīng)網(wǎng)絡(luò)的標(biāo)識(shí)牌識(shí)別最終結(jié)果如圖10所示。在標(biāo)識(shí)牌區(qū)域有接觸網(wǎng)線(xiàn)的干擾下，仍能準(zhǔn)確識(shí)別數(shù)字信息。

本章算法從基于視覺(jué)顯著性的研究出發(fā)，在將接觸網(wǎng)立柱區(qū)域前景分割后，根據(jù)標(biāo)識(shí)牌區(qū)域的特征對(duì)其進(jìn)行下一步的分割，利用像素投影完成單個(gè)字符的提取，最終通過(guò)基于MLP分類(lèi)器算法完成標(biāo)識(shí)牌信息識(shí)別，如圖11所示。該算法最終的識(shí)別準(zhǔn)確率達(dá)到了93.5%。

圖10 標(biāo)識(shí)牌識(shí)別結(jié)果

(a) 接觸網(wǎng)立柱顯著圖

(b) 標(biāo)識(shí)牌信息識(shí)別

4 結(jié)束語(yǔ)

由于立柱區(qū)域與背景樹(shù)木顏色及灰度值太過(guò)相近，傳統(tǒng)分割效果并不明顯。受視覺(jué)顯著性檢測(cè)的啟發(fā)，本文提出以強(qiáng)健的背景先驗(yàn)與吸收馬爾可夫鏈結(jié)合的方式提取立柱顯著圖，為了提高檢測(cè)效率，以SLIC超像素算法對(duì)圖像進(jìn)行預(yù)處理；利用標(biāo)識(shí)牌的底層特征對(duì)標(biāo)識(shí)牌區(qū)域精定位。該算法的提出很好的定位了接觸網(wǎng)立柱及標(biāo)識(shí)牌區(qū)域。搭建MLP神經(jīng)網(wǎng)絡(luò)分類(lèi)器，輸入標(biāo)識(shí)牌紋理特征并訓(xùn)練該模型，使得該神經(jīng)網(wǎng)絡(luò)模型參數(shù)達(dá)到最優(yōu)，對(duì)標(biāo)識(shí)牌的識(shí)別準(zhǔn)確率達(dá)到93.5%。因此該算法基本達(dá)到了對(duì)接觸網(wǎng)標(biāo)識(shí)牌識(shí)別定位的要求，為智能化軌道巡檢提供了新思路。