張 丹
咸陽職業(yè)技術(shù)學(xué)院,陜西 咸陽 712000
圖像識別技術(shù)是人工智能的重要領(lǐng)域之一,是指對圖像進行對象識別,以識別各種不同模式的目標和對象的技術(shù)。圖像識別技術(shù)是立體視覺、運動分析、數(shù)據(jù)融合等實用技術(shù)的基礎(chǔ),在導(dǎo)航、地圖與地形配準、自然資源分析、天氣預(yù)報、環(huán)境監(jiān)測、生理病變研究等多個領(lǐng)域具有重要的應(yīng)用價值。為此,文章在大數(shù)據(jù)背景下對數(shù)字圖像識別技術(shù)進行了研究。
數(shù)字圖像識別技術(shù)可以說是計算機技術(shù)的一種深入應(yīng)用,具體是將圖像信息先轉(zhuǎn)化為數(shù)字信號,然后借助計算機技術(shù)實現(xiàn)圖像的去噪、增強、復(fù)原、特征分割和提取等多個操作[1-2]。數(shù)字圖像識別技術(shù)發(fā)展至今共經(jīng)歷了文字識別階段、數(shù)字圖像處理與識別階段、物體識別階段三個階段。目前數(shù)字圖像處理技術(shù)已經(jīng)被廣泛應(yīng)用到了醫(yī)學(xué)、農(nóng)林業(yè)、軍事和工業(yè)等多個領(lǐng)域,相關(guān)技術(shù)也在不斷發(fā)展[3]。
數(shù)字圖像識別的過程主要分為信息獲取、預(yù)處理、特征抽取和選擇、分類器設(shè)計和分類決策等過程。
(1)信息的獲取是指通過傳感器將聲或光信息轉(zhuǎn)化為電信息,即將研究對象的基本信息轉(zhuǎn)為機器可以通過某種方式理解的信息,在圖像處理中便是將圖像轉(zhuǎn)化為計算機可以識別的數(shù)字信號。
(2)圖像預(yù)處理指的是通過在圖像處理過程中對圖像進行去噪、平滑和變化等多個操作,增強圖像的重要特征。
(3)圖像特征抽取和選擇指的是在模式識別中進行特征的提取和選擇。利用某種方法將研究的圖像針對其本身特征進行區(qū)分,獲取特征的過程即為圖像特征提取,對提取到的特征中的有用信息進行提取即為圖像特征選擇,該過程是數(shù)字圖像識別技術(shù)中的重要技術(shù)之一,也是圖像識別中的重點環(huán)節(jié)。
(4)分類器設(shè)計指的是通過訓(xùn)練獲得一種識別規(guī)則,通過這個規(guī)則得到特征分類,從而使圖像識別技術(shù)得到一個較高的識別率。
(5)分類決策是在特征空間中對目標進行分類,以便更好地識別研究對象的隸屬類型[4]。
在系統(tǒng)識別和發(fā)展過程中,數(shù)字圖像技術(shù)在完成識別工作的基礎(chǔ)上還可以極大提升識別效率與質(zhì)量,避免人為失誤造成的損失。在數(shù)字圖像處理過程中,對原始質(zhì)量差或受到損壞的圖像進行處理和糾正增強圖像的質(zhì)量尤為重要,可以避免人為工作疏漏。因此,若想發(fā)揮數(shù)字圖像識別技術(shù)的優(yōu)勢,則需充分滿足圖像處理的需求,加強灰度增強工作[5]。
例如,連續(xù)圖像f(x,y)經(jīng)過圖像數(shù)字化處理后可得到新圖像f(a,b),新生成的圖像由于所產(chǎn)生的灰度值會導(dǎo)致與原圖像的像素存在一定差異。若灰度值大于圖像處理前的原始值,像素數(shù)會得到提升,使新圖像更為明亮;若灰度值小于圖像處理前的原始值,像素數(shù)會相應(yīng)降低,新圖像比原圖像略微暗淡。因此,當灰度值增加時,會改變這種關(guān)系,呈現(xiàn)反比例,以便調(diào)整圖像中灰度值的比例。若需要更改未處理圖像的灰度值,可以用如下表達式:
圖像進行處理后灰度值為
通過充分利用這些數(shù)值變化,合理地進行圖像處理。
數(shù)字圖像識別技術(shù)目前已經(jīng)在多個領(lǐng)域得到廣泛的應(yīng)用,比如在警務(wù)方面可以完成犯罪嫌疑人的指紋識別;在遙感目標識別方面可以進行地形勘探、地勢查探、監(jiān)測環(huán)境災(zāi)害、實現(xiàn)自然災(zāi)害預(yù)測等;在天然氣輸送方面,可以實現(xiàn)對管道焊口的無損檢測、底片的快速識別與檢測,保證管道的穩(wěn)定運行。文章以大數(shù)據(jù)背景下的數(shù)字圖像識別技術(shù)實現(xiàn)對糧倉庫存糧食數(shù)量的智能監(jiān)管,通過研究結(jié)果證明了數(shù)字圖像識別技術(shù)的應(yīng)用可行性[6]。
(1)圖像預(yù)處理。首先,在圖像預(yù)處理環(huán)節(jié)對圖像進行灰度化處理,將采集的糧食彩色圖像轉(zhuǎn)換為灰度圖像,通常采用單分量法、極大值法、平均值法、加權(quán)平均數(shù)法等方法,以減少處理數(shù)據(jù)量,提高圖像處理速度。文章采用一種簡單的平均值法計算彩色圖像三通道分量的平均值。其次,對圖像進行二值化處理,利用二值化對糧食圖像進行處理,更方便地顯示目標區(qū)域和提取糧食形狀。文章采用大津律法進行二值化處理,便于后續(xù)的計算。最后,對圖像進行銳化處理,補償圖像輪廓,使圖像更清晰,采用Sobel算子完成圖像銳化[7]。
(2)圖像三維變換。文章提出一種基于AKAZE算法的多視圖幾何三維重建方法,采用非線性尺度分解算法,通過非線性擴散濾波構(gòu)造尺度空間。該算法的基本步驟如圖1所示。
圖1 圖像三維變化算法步驟
在算法步驟中,借助AKAZE算法提取研究圖像的特征點;通過上一步驟得出可靠性較高的二視圖關(guān)系,完成矩陣計算;三維點云稀疏重建與集束調(diào)整是通過研究對象圖像的特征點與幾何約束關(guān)系,重新構(gòu)建云模型,并借助集束調(diào)整對結(jié)果進行優(yōu)化;MPVS算法擴散稀疏點數(shù)據(jù)是剔除圖像灰度一致性較弱的點,從而得出稠密點云模型;最后通過模型網(wǎng)格化與紋理映射,對所得稠密點云模型進行三角網(wǎng)格化,再將獲得的無紋理點云模型進行映射得出包含紋理的目標三維模型。
通過對糧食圖像進行處理后得出三維圖像。在此基礎(chǔ)上,通過分析得出糧倉的形狀、空間分布等信息,然后通過計算得出糧食體積。常見的糧倉有平方倉、淺圓倉、散堆倉,不同糧倉的具體計算步驟如下。
(1)平方倉體積測量。根據(jù)上述操作后得出的三維圖像,可得糧倉的長寬高,再利用公式計算出糧食體積,表達式為
式中:V1為糧倉體積;a、b、c分別為糧倉的長、寬、高。
(2)淺圓倉體積測量。淺圓倉的形狀近似規(guī)則圓柱體,可借助圓柱體公式進行計算出糧食體積,表達式為
式中:V2為糧倉體積;s為糧倉底面積;h為糧倉高度。
(3)散堆倉體積測量。散堆倉形狀相對不規(guī)則,可近似看作棱臺體,借助棱臺體公式進行計算出糧食體積,表達式為
式中:V3為糧倉體積;Si為截面面積,i=1,2,…,n;di,i+1為截面間距。
因為用于計算的三維圖像由最初的二維圖像轉(zhuǎn)換而來,所以輪廓提取存在一定誤差,相應(yīng)的計算量也存在一定誤差,但誤差較小,不會對結(jié)果產(chǎn)生較大影響。通過數(shù)字圖像識別技術(shù)測量出糧食體積后,選定時間作為比對周期,對糧食體積的變化進行監(jiān)測,當糧食數(shù)量減少時,可以通過手機應(yīng)用程序立即自動向糧倉管理人員發(fā)送警報,以便及時采取應(yīng)對措施。
大數(shù)據(jù)背景下數(shù)字圖像識別技術(shù)的糧食圖像識別技術(shù)可以通過對糧食體積的實時監(jiān)測,實現(xiàn)糧食庫存數(shù)量的監(jiān)測,具體是通過將原始二維糧食圖像進行圖像預(yù)處理與三維轉(zhuǎn)換后獲得三維信息,以此進行糧食體積的測算,最后對糧食體積進行周期性對比,完成對糧倉糧食庫存的監(jiān)管。體積測量雖存在誤差,但具有一定的可信度,驗證了該技術(shù)方法的可行性。
數(shù)字圖像處理技術(shù)的應(yīng)用使工業(yè)檢測、農(nóng)林業(yè)檢測、警務(wù)偵查工作等逐漸向智能化轉(zhuǎn)變。作為高新技術(shù),數(shù)字圖像處理技術(shù)已經(jīng)得到廣泛應(yīng)用與推廣,可以實現(xiàn)諸多領(lǐng)域的智能監(jiān)測與數(shù)據(jù)比對。作為計算機視覺系統(tǒng)的重要技術(shù),三維重建、虛擬現(xiàn)實技術(shù)、圖像壓縮技術(shù)等都是數(shù)字圖像識別技術(shù)的未來發(fā)展方向與趨勢。