亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別綜述

        2023-04-26 07:55:38張松蘭
        西安航空學(xué)院學(xué)報 2023年1期
        關(guān)鍵詞:池化圖像識別卷積

        張松蘭

        (蕪湖職業(yè)技術(shù)學(xué)院 電氣與自動化學(xué)院,安徽 蕪湖 241006)

        0 引言

        隨著信息化和人工智能的高速發(fā)展,包含文字、圖像及視頻的大量信息紛至沓來,而在靜態(tài)信息中圖像載體涵蓋的信息量大,如何在眾多的圖像中快速精準地識別出目標圖像需要運用圖像識別技術(shù)。圖像識別是根據(jù)圖像本身所體現(xiàn)出的特征,利用計算機對圖像進行分析處理,把目標圖像區(qū)分出來,從而識別出目標對象的技術(shù)。傳統(tǒng)的圖像識別流程有圖像預(yù)處理→特征提取→圖像識別三個步驟[1],圖像預(yù)處理部分[2]涉及圖像濾波(中值濾波[3]、均值濾波[4]、高斯濾波[5]等)和歸一化等處理,其作用是減小圖像中的噪聲,方便圖像的后續(xù)處理。圖像識別的三個步驟中每個環(huán)節(jié)都會影響識別結(jié)果,但圖像特征提取是圖像識別的重要環(huán)節(jié),合理選取圖像中最合適、有效的特征是關(guān)鍵因素。常用的傳統(tǒng)特征提取方法有色彩、紋理、形狀、空間關(guān)系等底層視覺特征。

        1 特征提取方法

        1.1 基于色彩特征的索引技術(shù)

        色彩是物體呈現(xiàn)出的一種較為直觀的視覺特征,自然界中每類物體都有其獨特的顏色分布特點,在圖像處理時,各種顏色的像素值互不相同,由于顏色直方圖表示簡單明了,受圖像的尺寸大小、視覺或旋轉(zhuǎn)角度的影響較小,因此可利用顏色直方圖特性來識別物體。

        1.2 基于紋理的圖像識別技術(shù)

        紋理特征也是圖像的重要特征之一,它反映了物體表面結(jié)構(gòu)的排列方式及像素在周圍領(lǐng)域的分布規(guī)則,與顏色特征一樣,可應(yīng)用于模式識別和計算機視覺等領(lǐng)域的圖像識別中。利用紋理所表現(xiàn)的不同屬性,不同學(xué)者采用抽取各異的屬性作紋理的特征。從結(jié)構(gòu)的排列方式出發(fā)著眼于紋理區(qū)域的距離和方向特性,侯群群等[6]提出灰度共生矩陣表示法來區(qū)分圖像。從對紋理的視覺感知出發(fā),候玉婷[7]提出粒度、對比度、粗糙度、方向性、均勻性和線型6個視覺屬性作為紋理特征來識別圖像。從紋理區(qū)域的分布統(tǒng)計特點出發(fā),有學(xué)者提出取圖像小波變換后的方差和平均值為紋理特征[8]。唐波等[9]結(jié)合圖像的色彩模型和紋理兩個特征,針對輸電線路圖像在色彩模型中設(shè)置顏色閾值分割出背景區(qū)域,再利用數(shù)學(xué)形態(tài)學(xué)和紋理特征得到最小外接水平的目標區(qū)域,最后進行紋理特征識別,定位出絕緣子串區(qū)域。

        1.3 基于形狀的圖像識別技術(shù)

        形狀反映了圖像中各物體或圖形所包圍的區(qū)域,突出了輪廓邊界特征,因此圖像識別可從形狀的輪廓和區(qū)域特征或兩個特征相結(jié)合采用sobel、Roberts等算子[10]進行圖像的邊緣檢測。如有學(xué)者用線段和圓弧表達圖像的形狀輪廓,用不同的函數(shù)來定義形狀的邊界信息和區(qū)域信息,計算每個區(qū)域的質(zhì)心、周長或面積值及整個形狀的位置特征,比較其異同,并對這些差異采用相應(yīng)的函數(shù)進行加權(quán)求和[11]。

        1.4 基于空間關(guān)系的圖像識別技術(shù)

        圖像中包含了豐富的信息,其內(nèi)部存在不同數(shù)量的子對象,各對象均有各自的空間位置,因此可以利用空間位置關(guān)系作為圖像識別的特征。不同的學(xué)者采用不同的表示形式來表述空間關(guān)系。美國匹茲堡大學(xué)常采用二維符號串2D-String表示圖像空間關(guān)系[12-13],但2D-String空間關(guān)系太簡單,實際中的空間關(guān)系遠比二維圖復(fù)雜得多,不能根據(jù)其2D-String重構(gòu)其符號圖;由于圖像投射在平面圖上,在x或y軸上存在投影區(qū)間,Jungert用圖像的平面投影區(qū)來表示空間關(guān)系[13],實際圖像中存在多個物體;隨后,又有人提出圖像分割的方法來表示空間關(guān)系[14],這種表示法適用于圖像中物體數(shù)量較少的情況,但當圖像蘊含了豐富的信息或子對象比較多時,需要分割出的子對象較多,存儲容量大,難以確切地表述出復(fù)雜的圖像關(guān)系;張偉[15]針對圖像識別中的特征提取與描述問題,利用鄰接矩陣的特征值分解方法構(gòu)造圖像邊界和空間關(guān)系,與傳統(tǒng)算法相比可有效地減少計算量。

        圖像識別就是按照所選取的特征來對目標圖像進行識別的一種算法,特征提取的準確與否會影響識別性能優(yōu)劣。常見的傳統(tǒng)識別器包括K近鄰[16]、支持向量機[17]等分類器,對于一些簡單圖像,這些分類器實現(xiàn)方法較簡單效果較好,但對于復(fù)雜圖像或圖像干擾嚴重,其識別精度有待提高。隨著計算機技術(shù)的快速發(fā)展和計算性能的提高,深度學(xué)習(xí)技術(shù)應(yīng)運而生,它能夠從大量的圖像數(shù)據(jù)中自動學(xué)習(xí)特征,并能將學(xué)習(xí)到的特征與分類器相關(guān)聯(lián),完成圖像的識別任務(wù)。在深度學(xué)習(xí)技術(shù)中,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)已成為眾多學(xué)科領(lǐng)域的研究熱點之一,在圖像處理方面尤為突出[2],由于它對原始圖像預(yù)處理要求不高,直接輸入原始圖像通過卷積操作提取圖像特征即可完成圖像識別,因而得到了更為廣泛的應(yīng)用。

        2 卷積神經(jīng)網(wǎng)絡(luò)

        2.1 神經(jīng)網(wǎng)絡(luò)

        神經(jīng)元是生物神經(jīng)系統(tǒng)的生物基礎(chǔ),大量的神經(jīng)元相互連接組成了神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)具有感知和學(xué)習(xí)能力。為了建模需要,將神經(jīng)元的功能數(shù)學(xué)化,建立神經(jīng)元的數(shù)學(xué)模型,在神經(jīng)元上作用非線性激活函數(shù)組成非線性網(wǎng)絡(luò)系統(tǒng),整體上具有模仿動物神經(jīng)網(wǎng)絡(luò)的行為特征。在網(wǎng)絡(luò)的訓(xùn)練過程中通過調(diào)整神經(jīng)元節(jié)點之間連接關(guān)系,使之具備學(xué)習(xí)輸入樣本和自適應(yīng)的能力,從而實現(xiàn)對外部信息的感知能力,達到處理信息的目的。

        經(jīng)典的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)一般包含輸入層、中間層(或隱藏層)和輸出層,隱藏層可根據(jù)實際情況設(shè)置多個。兩層間的節(jié)點以權(quán)重相連,代表兩節(jié)點間的輕重關(guān)系,每個神經(jīng)元節(jié)點通過一種特定的激勵函數(shù)映射后輸出。代表性的神經(jīng)網(wǎng)絡(luò)模型有BP網(wǎng)絡(luò)[18]、RBF網(wǎng)絡(luò)[19]、Hopfield網(wǎng)絡(luò)[20]等,運用這些網(wǎng)絡(luò)模型可實現(xiàn)函數(shù)擬合、優(yōu)化處理、模式識別、目標分類等功能,因此,神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于工業(yè)生產(chǎn)過程、人工智能、機器人等領(lǐng)域的信息處理中。

        2.2 卷積神經(jīng)網(wǎng)絡(luò)

        卷積神經(jīng)網(wǎng)絡(luò)是網(wǎng)絡(luò)中含有卷積操作并具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)[21],本質(zhì)上是多層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),具有輸入層、中間層(層次較多的隱藏層)和輸出層[22]。網(wǎng)絡(luò)中的神經(jīng)元響應(yīng)一定范圍內(nèi)的領(lǐng)域神經(jīng)元,在圖像處理中表現(xiàn)尤為突出,多層網(wǎng)絡(luò)結(jié)構(gòu)將圖像的底層特征通過卷積操作逐漸組合形成高層特征,由局部信息抽取出高層語義信息,形成一個多層傳遞、逐步融合的過程,將特征提取與分類識別連聯(lián)在一起,從而實現(xiàn)圖像的識別任務(wù)。

        2.2.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

        卷積神經(jīng)網(wǎng)絡(luò)[23]的中間層可細化成卷積層、激活層、池化層和全連接層,是在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展起來的,其與普通神經(jīng)網(wǎng)絡(luò)的區(qū)別在于卷積層的卷積操作。輸入的圖像通過卷積層提取圖像的底層特征后,經(jīng)池化層降低圖像的維度,中間的卷積層和池化層可有多次重復(fù)堆疊,逐層傳遞輸入圖像信息,再到全連接層綜合圖像特征最后輸出結(jié)果。

        2.2.2 卷積層

        在卷積層中,卷積操作由一個或者多個卷積核(也稱過濾器)在前層圖像上選擇相應(yīng)的圖像區(qū)域做卷積運算,然后按一定的步長作滑動運算,依次提取圖像的像素級特征,圖像特征綜合后經(jīng)過激活函數(shù)激活,完成一次輸入到輸出的特征提取過程,卷積后的特征圖反映了前層圖像的融合特征。實際的圖像處理任務(wù)中卷積神經(jīng)網(wǎng)絡(luò)可以設(shè)計多層,逐層抽取前層的圖像信息,刻畫原始圖像的特征,直至傳遞到全連接層,實現(xiàn)特征提取過程。

        2.2.3 激活層

        早期的人工神經(jīng)網(wǎng)絡(luò)的非線性關(guān)系是通過神經(jīng)節(jié)點間的激活函數(shù)來實現(xiàn)的,同樣卷積神經(jīng)網(wǎng)絡(luò)在卷積操作后作用非線性激活函數(shù),實現(xiàn)對輸入信息的非線性變換,使網(wǎng)絡(luò)的輸入輸出產(chǎn)生非線性映射關(guān)系,激活層對卷積后的逐元素作用激活函數(shù),實現(xiàn)輸入和輸出信息的同維。常用的激活函數(shù)有以下幾種,激活函數(shù)圖形如圖1所示。

        (1)sigmoid函數(shù)。常用的sigmoid函數(shù)[13]有兩種,Logistic-Sigmoid函數(shù)和Tanh-Sigmoid函數(shù),表達式分別如式(1)和式(2)所示。式(1)為回歸S函數(shù),式(2)為雙曲正切S函數(shù),兩個S函數(shù)均為非線性函數(shù),在零值附近雙曲正切S函數(shù)比回歸S函數(shù)曲線的斜率更大,因而在任務(wù)實現(xiàn)時其收斂速度更快。兩個激活函數(shù)里都含有冪指數(shù),會增加網(wǎng)絡(luò)的計算量;由于兩個激活函數(shù)都呈飽和現(xiàn)象,在反向傳播計算過程中會出現(xiàn)梯度消失,降低模型的訓(xùn)練速度,在深度神經(jīng)網(wǎng)絡(luò)中逐漸被淘汰。

        (1)

        (2)

        (2)ReLU函數(shù)。由于S函數(shù)在卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練中存在梯度消失或彌散現(xiàn)象,為克服此問題引入了線性校正單元ReLU,在x≥0時其值為x,它能有效解決S函數(shù)帶來的梯度消失問題,加快模型收斂,減少模型訓(xùn)練時間[24]。ReLU函數(shù)在時,導(dǎo)數(shù)值為0,在網(wǎng)絡(luò)訓(xùn)練時會產(chǎn)生神經(jīng)元的消亡,因此在ReLU函數(shù)的基礎(chǔ)上進行了改進[24],其函數(shù)形式如式(3),當α為0時即為ReLU激活函數(shù),α為固定參數(shù)時為Leaky ReLU函數(shù),當α為可調(diào)參數(shù)時為PReLU函數(shù)。

        (3)

        (3)ELU函數(shù)。在ReLU 函數(shù)基礎(chǔ)上,為解決 ReLU的問題提出了ELU函數(shù)[24]。在x≥0時其值為x,為線性函數(shù);而在x<0時其值為一指數(shù)函數(shù),使輸出對輸入信號的變化具有更強的魯棒性,其函數(shù)形式為:

        (4)

        2.2.4 池化層

        池化層又稱下采樣層,對卷積后的特征圖用選定的步長依次對一定大小的圖像區(qū)域進行降采樣操作,取出該區(qū)域的典型特征值,特征值的選取通常有三種:最大值、平均值和隨機值[23]。對應(yīng)的池化方法分別為最大化池化、平均池化和隨機池化,隨機池化方法具有隨機性,按照概率矩陣依大小隨機選擇。池化操作將池化區(qū)域內(nèi)的多個值變?yōu)橐粋€值,特征圖的寬度和高度均降為原來的幾分之一,減少了卷積層輸出的特征向量,極大地減少了參數(shù)數(shù)量和卷積網(wǎng)絡(luò)中的計算量,同時能保證數(shù)據(jù)的平移不變性,經(jīng)池化操作后特征圖的通道數(shù)保持不變。

        2.2.5 全連接層

        全連接層是一種傳統(tǒng)的多層感知器,出現(xiàn)在網(wǎng)絡(luò)結(jié)構(gòu)的最后,層中每一個神經(jīng)元與前一層的神經(jīng)元均有連接關(guān)系,將輸入層圖像特征經(jīng)多層特征提取再經(jīng)高度融合后,得到圖像的高層表示,最后經(jīng)回歸分類模型計算得到相應(yīng)的響應(yīng)值送到輸出層。

        2.3 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練

        對于有監(jiān)督的學(xué)習(xí)過程,在卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,網(wǎng)絡(luò)會自動學(xué)習(xí)各層網(wǎng)絡(luò)中的參數(shù)值,一次訓(xùn)練過程包含有從輸入層到輸出層的信息提取學(xué)習(xí)過程和從輸出到輸入的誤差反向傳播實現(xiàn)參數(shù)更新過程。前向傳遞過程主要介紹卷積層的卷積運算,誤差反向傳播見傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的BP過程。卷積操作的運算式如式(5)所示:

        (5)

        3 圖像識別中常用的卷積神經(jīng)網(wǎng)絡(luò)模型

        在圖像識別中常用的卷積神經(jīng)網(wǎng)絡(luò)模型有LeNet[25]、AleXNet[26]、GoogLeNet[27]、VGGNet[28]、ResNet等模型。

        3.1 LeNet模型

        LeNet模型由YAN L C于1998年首先提出[29],奠定了卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ),LeNet網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,由兩個卷積層、兩個全連接層和一個輸出層組成,又稱LeNet-5,基本模型結(jié)構(gòu)為input->conv1->pool1->conv2->pool2->fc1->fc2->output,中間有兩個卷積池化的堆疊,卷積核的大小均為55。卷積層用于提取圖像的空間特征,激活函數(shù)使用softmax;池化層采用平均池化,進行下采樣降低圖像數(shù)據(jù)的維度;全連接層中每個節(jié)點與其輸入層的各節(jié)點均有連接關(guān)系,匯聚前面多層卷積圖提取的綜合特征信息。該模型早期主要用于手寫字符的識別與分類。

        圖2 LeNet網(wǎng)絡(luò)結(jié)構(gòu)

        3.2 AlexNet模型

        Hinton和他的學(xué)生Alex提出AlexNet網(wǎng)絡(luò)模型[30],在2012年的ImageNet挑戰(zhàn)賽中獲得冠軍,它是在LeNet基礎(chǔ)上改進得到的復(fù)雜網(wǎng)絡(luò),由5個卷積層、2個全連接層及1個輸出層組成的卷積神經(jīng)網(wǎng)絡(luò)。由于ImageNet中大多數(shù)圖像像素多,第一層的卷積塊較大,尺寸大小為11×11,通道數(shù)也較LeNet通道數(shù)多。AlexNet與LeNet的顯者區(qū)別在于:池化操作方面,全部使用最大池化方法,有效避免了平均池化的均化作用;激活函數(shù)方面,使用簡單的分段線性ReLU函數(shù)作為激活函數(shù),減少了冪函數(shù)運算,改善了S形函數(shù)在深度網(wǎng)絡(luò)產(chǎn)生的梯度彌散和消失問題。

        3.3 GoogLeNet模型

        Szegedy提出多層串并聯(lián)結(jié)構(gòu)的GoogLeNet網(wǎng)絡(luò)[31],獲得2014年ImageNet大賽的冠軍。GoogLeNet主體卷積部分中使用5個模塊,每個模塊間使用大小為3×3,步長為2的最大池化層來降低輸出維度。在GoogLeNet中基礎(chǔ)卷積塊稱為Inception塊,Inception塊結(jié)構(gòu)如圖3所示,在網(wǎng)絡(luò)結(jié)構(gòu)上已明顯區(qū)別于LeNet。Inception塊由4種卷積方式合并而成,第1種方式為1×1的卷積核卷積;中間2種方式都先經(jīng)1×1的卷積,再分別經(jīng)3×3和5×5的卷積來抽取輸入層的信息;第4種方式則是先經(jīng)3×3最大池化層后,再接1×1卷積層。4種卷積方式都使用適當?shù)奶畛浞绞绞馆敵龃笮”3忠恢?最后形成合并層,并輸入到下一層。Inception塊的引入能增強卷積模塊功能,可以在增加網(wǎng)絡(luò)深度和寬度的同時減少訓(xùn)練參數(shù)。

        圖3 Inception塊結(jié)構(gòu)

        3.4 VGGNet模型

        DeepMind公司和牛津大學(xué)研發(fā)的VGGNet網(wǎng)絡(luò)[30]在2014年lmagenet比賽獲得亞軍。VGG版本常用的有VGG16和VGG19網(wǎng)絡(luò)。這里以VGG16為例,其基本結(jié)構(gòu)與AlexNet和LeNet一樣,但它由多個卷積層構(gòu)成卷積塊,包括五組卷積塊和3個全連接層,前2個卷積塊由兩個卷積層組成,而后3個卷積塊使用三個卷積層,一共有16個卷積層。五組卷積塊深度依次為64、128、256、512和512,每組卷積塊的深度相同。每個卷積塊由2~3個卷積層組成,能使網(wǎng)絡(luò)有更大感受野,同時能降低網(wǎng)絡(luò)參數(shù)。卷積核的大小為3×3,池化層使用大小為2×2,步長為2的最大池化。

        3.5 ResNet模型

        何愷明等針對訓(xùn)練誤差并不隨網(wǎng)絡(luò)層數(shù)過多的增加而下降的問題,提出了殘差網(wǎng)絡(luò)ResNet[31],在2015年的ImageNet比賽中摘得冠軍。ResNet的前兩層與GoogLeNet一樣,不同之處在于GoogLeNet網(wǎng)絡(luò)中使用了Inception塊,而ResNet引入了殘差塊結(jié)構(gòu)。殘差塊中有2條通道,一條通道將輸入層經(jīng)2個3×3卷積后與另一個輸入層通道直接相加(輸入層經(jīng)兩個卷積層的輸出與輸入層大小一樣),最后作用ReLU激活函數(shù)。

        4 卷積神經(jīng)網(wǎng)絡(luò)在圖像識別上的應(yīng)用

        4.1 手寫數(shù)字識別

        手寫數(shù)字識別是CNN在圖像識別中最早的應(yīng)用之一, LeNet網(wǎng)絡(luò)用在手寫字符的識別上準確率可達到98%,并在實際系統(tǒng)中投入應(yīng)用。劉瀚駿等[32]用GoogLeNet模型的Inception設(shè)計卷積網(wǎng)絡(luò)模型,在MNIST數(shù)據(jù)集上驗證,準確率可以達到99.66%。呂浩等[33]結(jié)合SIP技術(shù)和FPGA技術(shù)采用卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)了微系統(tǒng)設(shè)計,采用HLS來設(shè)計CNN中的卷積層和池化層,生成IP核分時復(fù)用構(gòu)建微系統(tǒng),實現(xiàn)了MicroVGGNet輕量化模型,在MNIST手寫數(shù)字數(shù)據(jù)集識別準確率達到98.1%。

        4.2 人臉識別

        卷積神經(jīng)網(wǎng)絡(luò)在人臉檢測中的運用也是隨處可見,如門禁系統(tǒng)考勤管理系統(tǒng)等眾多場景中均有應(yīng)用。胡佳玲等[34]針對CNN訓(xùn)練參數(shù)多、計算量大等突出問題,在人臉識別算法上提出了輕量級MobileNet卷積神經(jīng)網(wǎng)絡(luò)模型,將改進的MobileNet網(wǎng)絡(luò)和區(qū)域生成網(wǎng)絡(luò)RPN融合,在LFW人臉數(shù)據(jù)庫和自建的小型數(shù)據(jù)庫上訓(xùn)練測試,識別準確率達到97.54%,較之前增加了0.2%,運行速度提高了21.3%,模型的參數(shù)減少了88%。張鵬等[35]針對傳統(tǒng)CNN在臉部表情識別過程中存在的問題,提出一種基于多尺度特征注意力機制的人臉表情識別方法,在Inception基礎(chǔ)上并行加入空洞卷積,用來提取人臉表情的多尺度特征信息,引入通道注意力機制,提升模型對重要特征信息的表示能力,通過在公開數(shù)據(jù)集FER2013和CK+上進行仿真實驗,分別取得了68.8%和96.04%的識別準確率。

        4.3 交通運輸

        卷積神經(jīng)網(wǎng)絡(luò)在交通運輸方面的圖像識別中也有廣泛應(yīng)用。李祥鵬等[36]使用深度學(xué)習(xí)Faster R-CNN 算法對特定自然場景下的車牌完成車牌定位,采用增強的AlexNet-L卷積神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)車牌字符的端對端識別,有效地提高車牌定位和車牌字符識別的準確度和效率。李訥等[37]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)在道路行駛車輛車標識別中引入殘差網(wǎng)絡(luò)YOLOV4進行車標的一步定位,檢測算法的精度和速度有了較大的提高。廖光鍇等[38]將卷積神經(jīng)網(wǎng)絡(luò)和小波變換相結(jié)合對車輛重識別方法進行了研究,在ResNet-50中增加小波分解層數(shù),整體模型的平均精度達到了63.90%,能有效提高車輛檢索精度。

        4.4 醫(yī)學(xué)診斷

        卷積神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)圖像診斷病理特征分析中也有大量的應(yīng)用。趙科甫等[39]在甲狀腺結(jié)節(jié)超聲檢查上采用U-Net主干網(wǎng)絡(luò)提取不同層的圖像特征并加入了SE注意力機制算法,實現(xiàn)了甲狀腺結(jié)節(jié)的圖像分割,并達到了0.798 7的Dice系數(shù)。黃江珊等[40]則在甲狀腺結(jié)節(jié)B超影像中采用卷積神經(jīng)網(wǎng)絡(luò)融入LSTM網(wǎng)絡(luò),提取高維特征,生成特征序列,將高維度深層次的醫(yī)學(xué)影像轉(zhuǎn)化為影像的文本診斷數(shù)據(jù)。馬巧梅等[41]在肺結(jié)節(jié)檢測上采用三維卷積神經(jīng)網(wǎng)絡(luò)3DCNN,融合殘差模塊獲取結(jié)節(jié)的空間信息,用于候選結(jié)節(jié)分類,有效地完成分割和檢測任務(wù)。

        4.5 農(nóng)作物檢測

        水果及農(nóng)作物檢測機器視覺方面也有卷積神經(jīng)網(wǎng)絡(luò)的大量應(yīng)用。傅隆生等[42]在多簇獼猴桃果實識別上采用LeNet網(wǎng)絡(luò)模型進行圖像識別研究。周勝安等[43]使用MobileNetV3的輕量化卷積神經(jīng)網(wǎng)絡(luò)模型對水果中小缺陷塊進行檢測,實驗結(jié)果表明在訓(xùn)練時間、檢測速度和準確率方面均衡性較好。周宏威等[44]在蘋果樹葉片病蟲害識別上構(gòu)建VGG16、ResNet50和Inception V3三種神經(jīng)網(wǎng)絡(luò)模型進行試驗,使用遷移學(xué)習(xí)能夠提升模型的收斂速度以及準確率。

        5 結(jié)論

        本文首先介紹了傳統(tǒng)圖像識別技術(shù)及存在的問題,引入了卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法。卷積神經(jīng)網(wǎng)絡(luò)源于人工神經(jīng)網(wǎng)絡(luò),重點說明了中間層的結(jié)構(gòu)和特點,然后介紹了經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)模型及相互間的區(qū)別,最后簡要綜述卷積神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用。卷積神經(jīng)網(wǎng)絡(luò)在有監(jiān)督的學(xué)習(xí)中已有廣泛的應(yīng)用,但有監(jiān)督的學(xué)習(xí)需要大量的圖像標注,耗費工作量大,如何在這此工作上提升效率還有待研究[30]。然而,將無監(jiān)督的強化學(xué)習(xí)應(yīng)用到圖像識別還在研究中[2]。對于原始圖像中含有一定噪聲的圖片,進一步提高模型的抗噪能力及泛化能力,也是亟待解決的問題。對于快速性要求較高的任務(wù)及提高圖像識別的速度(如疫情檢測)場景,需要增加卷積神經(jīng)網(wǎng)絡(luò)的實時性能,設(shè)計出滿足實時性高的輕量級卷積神經(jīng)網(wǎng)絡(luò),同時兼顧模型準確性能。

        猜你喜歡
        池化圖像識別卷積
        基于緊湊型雙線性網(wǎng)絡(luò)的野生茵識別方法研究
        無線電工程(2024年8期)2024-09-16 00:00:00
        基于Sobel算子的池化算法設(shè)計
        卷積神經(jīng)網(wǎng)絡(luò)中的自適應(yīng)加權(quán)池化
        基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
        基于Resnet-50的貓狗圖像識別
        電子制作(2019年16期)2019-09-27 09:34:50
        高速公路圖像識別技術(shù)應(yīng)用探討
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于卷積神經(jīng)網(wǎng)絡(luò)和池化算法的表情識別研究
        圖像識別在物聯(lián)網(wǎng)上的應(yīng)用
        電子制作(2018年19期)2018-11-14 02:37:04
        圖像識別在水質(zhì)檢測中的應(yīng)用
        電子制作(2018年14期)2018-08-21 01:38:16
        色综合久久精品中文字幕| 蜜桃麻豆www久久囤产精品| 中文字幕一区二区三区精华液| 女性自慰网站免费看ww| 亚洲一区二区成人在线视频| 精品日韩一区二区三区av| 精品国产高清a毛片| 亚洲视频中文字幕更新| 亚洲精品国产av日韩专区| 不卡一本av天堂专区| 99久久精品免费看国产| 精品无码日韩一区二区三区不卡| 品色堂永远的免费论坛| 青青草极品视频在线播放| 国产av一区二区网站| 无码专区人妻系列日韩精品| 曰韩人妻无码一区二区三区综合部| 亚洲av理论在线电影网| 亚洲免费观看一区二区三区| 美女一区二区三区在线视频| 欧美精品无码一区二区三区| 亚洲裸男gv网站| 精品欧美一区二区在线观看 | av无码精品一区二区三区四区| 高跟丝袜一区二区三区| 亚洲高清一区二区精品| 国产精品高清一区二区三区不卡| 免费观看又色又爽又黄的| 99热成人精品国产免| 日本一二三区在线视频观看| av熟妇一区二区三区| 色窝窝无码一区二区三区| 天干天干天啪啪夜爽爽av| 久久频精品99香蕉国产| 亚洲综合天堂一二三区| 少妇连续高潮爽到抽搐| 国产男女猛烈无遮挡免费网站| 亚洲伊人久久成人综合网| 一本色道久久88综合亚精品| 亚洲色图视频在线免费看| 天堂8在线天堂资源bt|