亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種針對于行人及車輛圖片的自動彩色化模型

        2018-03-06 04:28:03曾勇李楠盧賢票
        汽車實用技術(shù) 2018年3期
        關(guān)鍵詞:特征模型

        曾勇,李楠,盧賢票

        (1.燕山大學 車輛與能源學院,河北 秦皇島 066004;

        2.清華大學蘇州汽車研究院 智能汽車技術(shù)研究所,江蘇 蘇州 215200)

        引言

        行人檢測是目前智能車輛研究的一個熱點,許多的研究機構(gòu)、高校以及汽車廠商目前已經(jīng)做了大量研究。研究行人檢測可以減少行人和車輛碰撞造成的傷亡數(shù)量和事故等級,并在危險狀況下警告駕駛員和自動減速;同時行人檢測也是實現(xiàn)低速自動駕駛重要的一步[1-2]。行人檢測通過傳感器獲取目標行人的信息特征,由于顏色特征可增強圖像識別的準確率,為了提高行人檢測的效率,本文提出了一種自動彩色化灰度圖像模型?;叶葓D像彩色化的算法主要有基于優(yōu)化拓展的彩色化算法、基于最短距離和色度混合的彩色化算法以及基于顏色轉(zhuǎn)移的彩色化算法[3-5]。

        CNN的基本結(jié)構(gòu)包括兩層,其一為特征提取層,每個神經(jīng)元的輸入與前一層的局部接受域相連,并提取該局部的特征[6-11]。一旦該局部特征被提取后,它與其它特征間的位置關(guān)系也隨之確定下來;其二是特征映射層,網(wǎng)絡(luò)的每個計算層由多個特征映射組成,每個特征映射是一個平面,平面上所有神經(jīng)元的權(quán)值相等。由于 CNN的特征檢測層通過訓練數(shù)據(jù)進行學習,所以在使用 CNN時,避免了顯示的特征抽取,而隱式地從訓練數(shù)據(jù)中進行學習;再者由于同一特征映射面上的神經(jīng)元權(quán)值相同,所以網(wǎng)絡(luò)可以并行學習,這也是卷積網(wǎng)絡(luò)相對于神經(jīng)元彼此相連網(wǎng)絡(luò)的一大優(yōu)勢。卷積神經(jīng)網(wǎng)絡(luò)以其局部權(quán)值共享的特殊結(jié)構(gòu)在語音識別和圖像處理方面有著獨特的優(yōu)越性,其布局更接近于實際的生物神經(jīng)網(wǎng)絡(luò),權(quán)值共享降低了網(wǎng)絡(luò)的復雜性,特別是多維輸入向量的圖像可以直接輸入網(wǎng)絡(luò)這一特點避免了特征提取和分類過程中數(shù)據(jù)重建的復雜度。

        在經(jīng)典彩色化灰度圖像方法及卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,本文提出了:

        ·無用戶干擾的灰度圖像彩色化方法;

        ·一種新的端到端的網(wǎng)絡(luò),學習圖像的全局及局部特征;

        ·利用分類標簽來提高學習性能;

        ·深度評估我們用戶學習的模型及許多不同的例子。

        1 全局和局部結(jié)合模型

        本文基于卷積神經(jīng)網(wǎng)絡(luò)理論,從大量的訓練數(shù)據(jù)中訓練檢測模型。本文的網(wǎng)絡(luò)由形成有向無環(huán)圖(DAG)的幾個子部分組成,并包括了與廣泛使用的標準模型的重要差異,尤其該模型可以處理任何分辨率的圖像,可結(jié)合全局圖像先驗進行局部預測及將其轉(zhuǎn)換為另一種顏色的圖像。模型及子部分的描述見圖 1。由圖可知,模型由四個主要部分組成:底層特征網(wǎng)絡(luò)、中層特征網(wǎng)絡(luò)、全局特征網(wǎng)絡(luò)及彩色化網(wǎng)絡(luò)。

        1.1 深度網(wǎng)絡(luò)

        深度神經(jīng)網(wǎng)絡(luò)具有多層結(jié)構(gòu)。給定一個輸入即可預測連續(xù)值,函數(shù)形式如下所示:

        卷積神經(jīng)網(wǎng)絡(luò)具有權(quán)值共享的特性,權(quán)值共享降低了網(wǎng)絡(luò)的復雜性,特別是多維輸入向量的圖像可以直接輸入網(wǎng)絡(luò)這一特點避免了特征提取和分類過程中數(shù)據(jù)重建的復雜度。一般來說,向量x、y的分量是通過笛卡爾坐標以及通道號被像素檢索的,一層是由多個通道的2D圖像組成。矩陣w為圖像與一組濾波器的卷積,若2D層圖像是C通道h×w,則下一層C通道圖像為h×w,即n=h·w·C,m=h·w·C。綜上,公式(1)可變?yōu)槿缦滦问剑?/p>

        其中,kh和 kw分別代表內(nèi)核的高度與寬度(奇數(shù)),yu,v為輸入的像素分量,yu,v為該層的輸出,為非線性傳遞函數(shù),b為偏置。由以上公式可以看出,權(quán)值W可以在神經(jīng)元之間互相傳遞,實現(xiàn)共享。

        圖1 自動彩色化灰度圖像模型

        該模型中,層與層之間是連續(xù)的連接,大多數(shù)分類網(wǎng)絡(luò)最初使用卷積層,最后使用常規(guī)的全連接層來使輸出為一個特定尺寸的向量,但這樣的網(wǎng)絡(luò)只能處理固定大小的圖像,為了解決此問題,本文提出了自動彩色化灰度圖像模型,可處理任何分辨率大小的圖像。

        1.2 全局與局部特征彩色化融合

        將全局特征與局部特征進行融合,全局特征可確定輸入圖像的類型。假設(shè)輸入圖像尺寸為W,卷積核尺寸為F,步幅(stride)為S(卷積核移動的步幅),Padding使用P(用于填充輸入圖像的邊界,一般填充0),那么經(jīng)過該卷積層后輸出的圖像尺寸為(W-F+2P)/S+1。在本文中,使用3×3卷積內(nèi)核及1×1的空隙作為輸入來保證輸出圖像是同等的尺寸大?。ㄈ舨椒鶠?,則輸出圖像尺寸減半)。共享功能的結(jié)構(gòu)如表1所示。

        表1 底層特征網(wǎng)絡(luò)

        1.2.1 全局圖像特征

        全局圖像特征是通過四個卷積層進一步處理底層特征,再通過三個全連接層獲得,其詳細內(nèi)容如表2所示。

        由于該網(wǎng)絡(luò)中線性層的性質(zhì),底層特征的輸入固定尺寸為224×224像素。

        表2 全局特征網(wǎng)絡(luò)

        1.2.2 中層特征

        中層特征是通過兩個卷積層進一步處理底層特征得到的。輸出從底層特征的512通道數(shù)變?yōu)橹袑犹卣鞯?56通道數(shù),與全局圖像特征不同的是,底層特征與中層特征均為全卷積網(wǎng)絡(luò),中層特征網(wǎng)絡(luò)的輸出尺寸大小為(H/8)×(W/8)×256,H、W為原始圖像的高度與寬度,具體如下表所示:

        表3 中層特征網(wǎng)絡(luò)

        1.2.3 全局與局部特征融合

        為了結(jié)合全局圖像的256維向量特征與局部(中層)圖像特征,本文介紹了一種融合層,該層用于將全局特征融入局部特征,融合方式如下:

        1.2.4 彩色化網(wǎng)絡(luò)

        全局特征與局部特征融合后,再經(jīng)過一組卷積層和上采樣層,上采樣層,為跨度轉(zhuǎn)置卷積(Strided Transposed Convolutions),跨度為 S,即上采樣層將為該層的每個輸入產(chǎn)生S個輸出。在輸出是原始輸入的一半大小之前,這些層是交替出現(xiàn)的。彩色化網(wǎng)絡(luò)的輸出層有具有Sigmoid傳遞函數(shù)的卷積層組成,輸出為輸入灰度圖像的色度,具體如下表所示:

        表4 彩色化網(wǎng)絡(luò)

        本文采用均方誤差(MSE)標準來訓練網(wǎng)絡(luò),給定一張彩色圖像作為訓練樣本,將其轉(zhuǎn)換為灰度和CIE L*a*b*顏色空間。模型的輸入是灰度圖像而目標輸出是CIE L*a*b顏色空間的 a*b*分量,a*b*分量被全局歸一化,因此它們在Sigmoid函數(shù)的[0,1]范圍內(nèi),然后,我們將目標輸出縮放至彩色化網(wǎng)絡(luò)輸出的大小,并計算輸出與目標輸出之間的MSE作為損失,最后將通過所有網(wǎng)絡(luò)(全局特征、中層特征、底層特征)將此損失反向傳播,更新模型中的參數(shù)。

        1.3 優(yōu)化與學習

        該模型能處理任何大小的圖像,當輸入圖像為 224×224像素時,效率最高,若輸入圖像具有不同的分辨率,底層特征的權(quán)重共享時,需要重新調(diào)節(jié)全局特征網(wǎng)絡(luò)圖像大小為224×224像素。這需要通過底層特征網(wǎng)絡(luò)出了原始圖像及重新縮放圖像,增加了內(nèi)存消耗與計算時間,在學習過程中必須多次處理數(shù)百上千張圖像,尤其在訓練階段,節(jié)省時間變得至關(guān)重要。因此,本文僅僅采用尺寸為224×224像素的圖像來訓練模型。

        本文在訓練階段對整個網(wǎng)絡(luò)使用批量歸一化處理,一旦網(wǎng)絡(luò)被訓練,批量標準化的平均值和標準偏差就可以被并入到每層的權(quán)重和偏置中。

        2 實驗結(jié)果與討論

        車輛的顏色相對來說比較單一,在彩色化車輛圖像時無須考慮太多顏色過渡區(qū)域的細節(jié)處理,但一般行人的著裝具有多樣性,衣服顏色比較復雜,在進行彩色化時需要處理很多顏色過渡區(qū)域,為了測試本文所提出的自動彩色化灰度圖像模型的性能,采集各種不同類型的行人及其他圖片,評估包括黑白圖像及特寫圖像在內(nèi)的大量不同圖像,同時本文還闡述了如何通過利用在不同圖像上計算的全局特征,直接使用模型進行樣式轉(zhuǎn)換。在訓練階段開始前,我們需要預先過濾一遍圖像來濾除灰度圖像及具有較小顏色差異的圖像。對訓練圖像進行隨機的分類并將其用于優(yōu)化我們模型的參數(shù)。

        2.1 彩色化結(jié)果

        本文的彩色化模型利用全局特征與局部特征的融合,使其能夠正確地對行人、車輛等進行彩色化,所有這些結(jié)果均為自動生成,無須人為干預,具體彩色化結(jié)果如圖2所示。

        2.2 對比分析

        通常情況下,我們無法對圖像的重點區(qū)域進行顏色處理,如圖3縮放區(qū)域所示,尤其是在顏色變化區(qū)域,由于行人衣著以及環(huán)境顏色的多樣化,我們在進行彩色化的時候要將行人和環(huán)境的顏色進行比較好的融合處理。本文采用一致的方式對所有圖像進行彩色化,譬如在圖3中,最左邊為灰度圖像,中間的為采用基準的方法彩色化的圖片,最右邊為采用本文的模型進行彩色化的圖片。由圖中對比可以看到,第一幅圖斑馬線處的藍色線條,采用傳統(tǒng)的基準的方法并沒有將其彩色化,將其忽略;警察的制服顏色彩色化的程度也不太明顯,還有后邊車輛的車牌處也沒有達到比較好的彩色化效果;同樣,在第二幅圖中,黃色的斑馬線沒有被彩色化,最前面女孩的衣服和背包也沒有達到很好的彩色化效果。

        圖2 部分彩色化圖像

        由以上結(jié)果,我們可以看出,采用傳統(tǒng)的彩色化方法不能很好的處理顏色過渡區(qū)域,只能較好的處理比較單一的顏色區(qū)域,而在我們現(xiàn)實生活中,行人的著裝、發(fā)色、裝飾以及所處的環(huán)境的顏色具有多樣性,此時采用本文的自動彩色化模型可以達到較為理想的彩色化效果。

        圖3 彩色化模型對比

        全局特征值是基于灰度像素值的描述,可以分為直方圖特征、顏色特征及輪廓特征。由于采用基準的方法進行彩色化時不包含全局特征,(RGB為非均勻的顏色空間,而基準為L,a、b的均勻顏色空間)所以在采用基準彩色化灰度圖像時,圖片處理時會有誤差,可能達不到理想的效果。而本文所提出的自動彩色化灰度圖像的模型是將全局特征及局部特征進行融合,可以更好的提取圖片的顯著特征,經(jīng)過統(tǒng)計計算,在真實場景的自然度為 97.7%時,采用基線與本模型的自然度分別為69.8%與92.6%。

        表5 CPU與GPU運行時間對比

        本文在不同分辨率的圖像上運行自動彩色化灰度圖像模型,并將其在CPU和GPU上平均運行時間做了對比,通過對比,可以得到使用 GPU,速率提高了接近 5倍,并且在GPU中能在短時間內(nèi)處理大圖像,詳細內(nèi)容見表5。

        3 結(jié)論

        針對于車輛及行人圖片,通過融合全局及局部特征,本文提出了一種新的彩色化灰度圖像的模型。首先,該模型基于卷積神經(jīng)網(wǎng)絡(luò)的理論,無需任何干預,可以自動進行彩色化。其次,在訓練模型階段,本文采用端到端的方式訓練網(wǎng)絡(luò),采用隨機梯度下降法更新權(quán)值,能夠處理任何分辨率的圖像。最后在評估模型時,收集了大量室內(nèi)與室外的圖像,并產(chǎn)生了較好的實驗結(jié)果,證明了此模型的可信性與優(yōu)越性。

        [1] 蘇松志,李紹滋,陳淑媛,等.行人檢測技術(shù)綜述[J].電子學報,2012,40(4): 814-820.

        [2] 劉威,段成偉,遇冰,等.基于后驗 HOG 特征的多姿態(tài)行人檢測[J].電子學報, 2015, 43(2): 217-224.

        [3] Everingham M, Van Gool L, Williams C K I, et al. The pascal visual object classes (voc) challenge[J]. International journal of computer vision, 2010, 88(2): 303-338.

        [4] Russakovsky O, Deng J, Su H, et al. ImageNet Large Scale Visual Recognition Challenge[J]. International Journal of Computer Vision,2015, 115(3): 211-252.

        [5] Krizhevsky A, Sutskever I, Hinton G E. ImageNet Classification with Deep Convolutional Neural Networks[C]// International Conference on Neural Information Processing Systems. Curran Associates Inc. 2012: 1097-1105.

        [6] He K, Zhang X, Ren S, et al. Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition[C]//European Con-ference on Computer Vision. Springer, Cham, 2014: 346-361.

        [7] Simonyan K, Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition[J]. arXiv preprint arXiv:1409.1556,2014.

        [8] Szegedy C, Liu W, Jia Y, et al. Going Deeper with Convolutions[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2015: 1-9.

        [9] He K, Zhang X, Ren S, et al. Delving deep into rectifiers: Surpassing Human-Level Performance on Imagenet Classification[C]// Proceed-ings of the IEEE International Conference on Computer Vision.2015: 1026-1034.

        [10] Girshick R, Donahue J, Darrell T, et al. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]// Procee-dings of IEEE Conference on Computer Vision and Pattern Recog-nition, 2014: 580-587.

        [11] Girshick R. Fast R-CNN[C]//Proceedings of the IEEE International Conference on Computer Vision. 2015: 1440-1448.

        猜你喜歡
        特征模型
        一半模型
        抓住特征巧觀察
        重要模型『一線三等角』
        新型冠狀病毒及其流行病學特征認識
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        抓住特征巧觀察
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        日本最新一区二区三区视频观看| 国产综合精品久久久久成人| 亚洲天堂免费成人av| 不卡一本av天堂专区| 久久亚洲综合亚洲综合| 久久精品国产亚洲av网| 国产女人水真多18毛片18精品| 亚洲欧美精品91| 天堂av在线一区二区| 精品一区二区av在线| 亚洲中文字幕无码不卡电影| ā片在线观看| 中文字幕有码在线视频| 亚洲成人精品在线一区二区| 牛牛在线视频| 国产成人精品三级麻豆| 香蕉久久夜色精品国产| 五月激情四射开心久久久| 在线播放免费人成毛片乱码| 婷婷综合缴情亚洲| 丝袜人妻无码中文字幕综合网| 杨幂一区二区系列在线| 国产精品国产三级国产专播| 色一乱一伦一图一区二区精品| 久久精品国产亚洲AV高清y w| 99久久精品国产91| av综合网男人的天堂| 中文字幕福利视频| 人妻精品一区二区三区视频| 麻豆成年人视频在线观看| 一区二区三区视频在线观看| 极品少妇一区二区三区四区| 亚洲天堂成人在线| 精品久久一区二区av| 无码精品国产一区二区三区免费| 热re99久久精品国产99热| 亚洲国产福利成人一区二区| 国产三级av大全在线爽| 国产精品女人呻吟在线观看| 成人久久免费视频| 女女同性av一区二区三区|