李 赫
(遼寧機(jī)電職業(yè)技術(shù)學(xué)院,遼寧 丹東 118000)
隨著人工智能技術(shù)的不斷發(fā)展,圖像識(shí)別技術(shù)也不斷朝著智能化的方向發(fā)展。特別是在一些識(shí)別難度較大的環(huán)境中,這種技術(shù)可以取代傳統(tǒng)的圖像識(shí)別方式,客觀且準(zhǔn)確地完成圖像識(shí)別。因此,本課題研究具有十分重要的意義。
人工智能中的圖像識(shí)別技術(shù),其原理復(fù)雜程度不高,與肉眼識(shí)別相比,二者并無(wú)明顯的差異,僅在過(guò)程上有所差別。圖像識(shí)別技術(shù)在識(shí)別圖片時(shí),會(huì)通過(guò)掃描的方式運(yùn)用人工智能、虛擬現(xiàn)實(shí)技術(shù)提取圖像特點(diǎn),然后在數(shù)據(jù)庫(kù)中找出與之類似的圖像,最終完成對(duì)圖像的識(shí)別和處理。目前,圖像識(shí)別技術(shù)的應(yīng)用領(lǐng)域十分廣泛,在電力、醫(yī)療、工業(yè)等領(lǐng)域的應(yīng)用較為普遍,主要負(fù)責(zé)圖像處理和識(shí)別等任務(wù)。人工智能中的圖像識(shí)別技術(shù)的原理:通過(guò)對(duì)不同類型處理方式的使用,不斷積累數(shù)據(jù),以實(shí)現(xiàn)分析圖片和實(shí)際事物的目的。在此基礎(chǔ)上,結(jié)合智能技術(shù)可以將二維平面圖形轉(zhuǎn)化為三維模型。正因如此,圖像識(shí)別技術(shù)在醫(yī)療行業(yè)領(lǐng)域取得了良好的應(yīng)用效果。比如:患者在生病后通過(guò)拍片的方式,即可明確發(fā)生病情的身體部位和原因[1]。
1.2.1 圖像預(yù)處理
在圖像識(shí)別技術(shù)中,圖像預(yù)處理工作是首要步驟,其作用為獲取信息,是圖像識(shí)別的前提。圖像預(yù)處理可以使圖像識(shí)別系統(tǒng)更精準(zhǔn)地找出圖片特征,為后續(xù)識(shí)別創(chuàng)造有利條件,有利于縮短圖片識(shí)別時(shí)間,降低圖片處理難度。目前,圖片預(yù)處理方式主要包括兩種,分別是降噪和去霧。一般情況下,工作人員利用圖像識(shí)別系統(tǒng)自帶的預(yù)處理功能,即可將圖片還原為高質(zhì)量的圖片。
1.2.2 圖像特征提取
圖像特征提取環(huán)節(jié)可分為兩個(gè)步驟,主要是提取和選擇。通常情況下,目標(biāo)圖像的特征點(diǎn)有多個(gè),且各特征點(diǎn)對(duì)應(yīng)的特征子集不同,選擇合適的特征點(diǎn),有利于提高圖像識(shí)別的效率和質(zhì)量。圖像特征點(diǎn)主要包括顏色、紋理、形狀和空間關(guān)系。其中,顏色屬于第一捕捉特征點(diǎn),但在進(jìn)行局部特征捕捉時(shí),紋理特征會(huì)取代顏色成為第一特征點(diǎn)。由此可見(jiàn),在促進(jìn)圖像識(shí)別技術(shù)發(fā)展過(guò)程中,需要將其應(yīng)用領(lǐng)域和識(shí)別需求作為依據(jù),合理設(shè)計(jì)提取和選擇方式??傮w而言,圖片中含有大量的信息,在運(yùn)用圖像識(shí)別技術(shù)識(shí)別圖像信息時(shí),需要對(duì)圖片特征進(jìn)行準(zhǔn)確分析。比如:在電力領(lǐng)域應(yīng)用圖像識(shí)別技術(shù)進(jìn)行輸電線路巡檢時(shí),所提取的第一特征不能為顏色,應(yīng)該是電線紋理特征,從而更好地發(fā)現(xiàn)線路存在的質(zhì)量缺陷。
1.2.3 圖像匹配分類
在圖像識(shí)別技術(shù)中,圖像匹配分類屬于最后一個(gè)工作環(huán)節(jié)。將上述環(huán)節(jié)完成后獲得的結(jié)果作為依據(jù),從數(shù)據(jù)庫(kù)中調(diào)取與之相似的圖片信息,即可實(shí)現(xiàn)對(duì)圖像特征的準(zhǔn)確分析。比如:在電力巡檢中應(yīng)用圖像識(shí)別技術(shù),系統(tǒng)會(huì)將圖片實(shí)際情況作為依據(jù),從數(shù)據(jù)庫(kù)中調(diào)取與之相匹配的故障處理信息,為研究人員制定故障解決方案提供支持[2]。
模式識(shí)別是人工智能算法下圖像識(shí)別技術(shù)的重要模式,這種模型的基礎(chǔ)為海量的數(shù)據(jù),也可以將圖像識(shí)別技術(shù)在模式識(shí)別中的應(yīng)用,視為對(duì)圖像識(shí)別技術(shù)的認(rèn)知程度提升和數(shù)據(jù)積累后的必然結(jié)果。該模式可以使計(jì)算機(jī)的分析和數(shù)學(xué)算法有機(jī)融合,從而實(shí)現(xiàn)對(duì)圖像特征的自動(dòng)識(shí)別,并且還能在識(shí)別的同時(shí),準(zhǔn)確評(píng)價(jià)數(shù)據(jù)信息。學(xué)習(xí)和實(shí)現(xiàn)是模式識(shí)別的流程。學(xué)習(xí)過(guò)程的本質(zhì)為儲(chǔ)存數(shù)據(jù)信息,學(xué)習(xí)前,系統(tǒng)會(huì)采集圖像信息,然后利用計(jì)算機(jī)分類和識(shí)別圖像信息。識(shí)別效率和儲(chǔ)存能力會(huì)被識(shí)別算法設(shè)計(jì)所影響,在學(xué)習(xí)后便可明確圖像信息關(guān)鍵點(diǎn)。而實(shí)現(xiàn)過(guò)程的本質(zhì)為判定圖像信息與模板之間的匹配程度,因此這個(gè)過(guò)程也被稱為對(duì)比過(guò)程。在實(shí)際應(yīng)用階段,計(jì)算機(jī)可以將原有記憶數(shù)據(jù)和信息作為依據(jù),自動(dòng)匹配和捕捉圖像信息,最終達(dá)成圖像識(shí)別的目的。但受技術(shù)條件限制,圖像識(shí)別還存在一定的不足,具體表現(xiàn)為在識(shí)別特征極為相似的圖像時(shí),產(chǎn)生誤差的概率較高。目前,這種圖像識(shí)別技術(shù)在醫(yī)療領(lǐng)域取得了良好的應(yīng)用效果,比如:醫(yī)療器械檢測(cè)、核磁共振、實(shí)驗(yàn)室檢測(cè)等,其應(yīng)用有助于醫(yī)生依據(jù)圖像分析結(jié)果,確定病因,并制定治療方案。
在大數(shù)據(jù)時(shí)代下,圖像識(shí)別技術(shù)在發(fā)展的過(guò)程中與多項(xiàng)技術(shù)相融合,其中神經(jīng)網(wǎng)絡(luò)技術(shù)便是代表性技術(shù)。其應(yīng)用方式為集傳統(tǒng)圖像識(shí)別技術(shù)和神經(jīng)網(wǎng)絡(luò)算法于一體的新型圖像識(shí)別技術(shù)。神經(jīng)網(wǎng)絡(luò)技術(shù)是人工智能技術(shù)的重要組成部分,與圖像識(shí)別技術(shù)相融合,可以使兩種技術(shù)的優(yōu)勢(shì)充分發(fā)揮。以人工神經(jīng)網(wǎng)絡(luò)為例,人工神經(jīng)網(wǎng)絡(luò)可以對(duì)人類神經(jīng)網(wǎng)絡(luò)進(jìn)行模擬,具備學(xué)習(xí)能力,在經(jīng)過(guò)大量的訓(xùn)練后,其識(shí)別率會(huì)直線上升,如表1所示。
表1 神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)目不同時(shí)的識(shí)別精度
與傳統(tǒng)圖像識(shí)別技術(shù)相比,基于神經(jīng)網(wǎng)絡(luò)算法的圖像識(shí)別技術(shù),在識(shí)別復(fù)雜圖像時(shí)可以取得良好的效果,但技術(shù)應(yīng)用成本卻有所增加。這項(xiàng)技術(shù)的圖像識(shí)別過(guò)程與傳統(tǒng)圖像識(shí)別技術(shù)相同,其優(yōu)勢(shì)主要表現(xiàn)為識(shí)別效率高和精度高,能夠?qū)崿F(xiàn)對(duì)圖像的快速識(shí)別,同時(shí)還能依據(jù)圖像特征進(jìn)行分類處理。比如:目前在交通領(lǐng)域廣泛應(yīng)用的視頻采集系統(tǒng),所應(yīng)用的技術(shù)就是基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù),其算法如圖1所示。該技術(shù)的應(yīng)用,可以使系統(tǒng)對(duì)車輛行駛信息高效識(shí)別,以促進(jìn)交通管理效率和質(zhì)量的提升。在智慧交通不斷發(fā)展的背景下,使圖像識(shí)別技術(shù)與智能機(jī)器人相融合,有利于推動(dòng)交通管理方式的改革和發(fā)展[3]。
圖1 交通領(lǐng)域圖像識(shí)別算法
人工智能中的圖像識(shí)別技術(shù)還包括非線性降維,這種技術(shù)屬于高維識(shí)別技術(shù),與上述兩種圖像識(shí)別技術(shù)相比,它可以在分辨率不高的情況下對(duì)圖像進(jìn)行識(shí)別。此類技術(shù)的處理方式為非線性處理,所產(chǎn)生的數(shù)據(jù)具有多維性特點(diǎn),因此,在技術(shù)研究時(shí)需要解決的難點(diǎn)較多。具體表現(xiàn)為利用非線性降維技術(shù)識(shí)別圖像,在短時(shí)內(nèi)完成的計(jì)算量較大。降維主要包括兩類,分別為線性降維和非線性降維。其中,較為常用的線性降維方法為主成分分析和線性奇異分析。雖然線性降維具有理解難度低的優(yōu)點(diǎn),但在實(shí)際應(yīng)用階段發(fā)現(xiàn)這種技術(shù)的運(yùn)算過(guò)程復(fù)雜,且占據(jù)空間面積較大,識(shí)別圖像需要耗費(fèi)大量的時(shí)間。而非線性降維是在線性降維基礎(chǔ)上發(fā)展的圖像識(shí)別技術(shù),該技術(shù)可以發(fā)現(xiàn)圖像中的非線性結(jié)構(gòu),在降維的同時(shí),不會(huì)對(duì)基本結(jié)構(gòu)造成破壞,有利于圖像識(shí)別速率的提升。因此非線性降維技術(shù)在農(nóng)業(yè)生物環(huán)境、能源工程和人臉識(shí)別等領(lǐng)域的應(yīng)用較為普遍,究其原因,主要是這些領(lǐng)域的圖像識(shí)別難度較大,應(yīng)用普通圖像識(shí)別技術(shù)無(wú)法保證識(shí)別效率和精度,而非線性降維技術(shù)的應(yīng)用,能夠解決傳統(tǒng)技術(shù)的缺陷。
綜上所述,基于人工智能的圖像識(shí)別技術(shù),作為一種新興技術(shù),其研究和應(yīng)用受到了世界各國(guó)的高度重視。目前,在交通領(lǐng)域、醫(yī)療領(lǐng)域、農(nóng)業(yè)領(lǐng)域、工業(yè)領(lǐng)域,圖像識(shí)別技術(shù)發(fā)揮了重要作用。隨著智能技術(shù)的不斷發(fā)展,圖像識(shí)別技術(shù)會(huì)實(shí)現(xiàn)高分辨率、高傳輸率和多維度的發(fā)展,從而滿足社會(huì)生活需求,為社會(huì)經(jīng)濟(jì)發(fā)展提供技術(shù)支持和保障。