曾光華,肖洋
銅仁職業(yè)技術(shù)學(xué)院,貴州銅仁,554300
21世紀(jì)是處在信息時(shí)代的世紀(jì),計(jì)算機(jī)信息技術(shù)日新月異,被廣泛應(yīng)用于各行各業(yè)中,與人們的生活、生產(chǎn)密不可分。人工智能算法是人們基于自身行為特點(diǎn)和思維模式,對已經(jīng)總結(jié)出的自然界規(guī)律進(jìn)行模仿,以便處理一些問題,其拓展了計(jì)算機(jī)的運(yùn)算功能,是計(jì)算機(jī)先進(jìn)性的體現(xiàn)。圖像處理是人們當(dāng)前所要面對的問題之一,人工方式的圖像處理任務(wù)量較大,處理效率偏低,為改變這種情況,可將人工智能算法引入到圖像處理中,利用對人工智能算法的研究和應(yīng)用,來完成復(fù)雜而繁復(fù)的圖像處理工作,這有利于解放勞動力,促進(jìn)人們工作效率的提升,保障圖像處理質(zhì)量。因此,應(yīng)當(dāng)在圖像處理過程中充分發(fā)揮人工智能算法的作用,選擇適宜的方式,從而取得較好的處理效果。
人工智能是計(jì)算機(jī)科學(xué)的分支,屬于邊緣學(xué)科,是自然科學(xué)和社會科學(xué)的交叉,包含了多個(gè)領(lǐng)域的內(nèi)容,涉及多個(gè)學(xué)科,有神經(jīng)生理學(xué)、計(jì)算機(jī)科學(xué)、信息論、哲學(xué)與認(rèn)知科學(xué)等,是當(dāng)前科學(xué)研究的重要課題之一,其實(shí)際應(yīng)用包括但不限于智能控制、機(jī)器人學(xué)、遺傳編程、語言和圖像理解等。
人工智能算法在圖像處理中有一定的優(yōu)勢,主要體現(xiàn)在以下幾個(gè)方面:①可替代人工作業(yè),縮短工作時(shí)間,降低人工勞動成本,促進(jìn)圖像處理技術(shù)水平和效果的提升;②有利于解決傳統(tǒng)圖像處理技術(shù)中圖像切分不到位的問題,提高圖像識別能力,使圖像處理更加精準(zhǔn);③可對圖像信息進(jìn)行預(yù)處理,具備良好的圖像自我分析能力[1]。
圖像處理是指利用計(jì)算機(jī)來處理圖像信息,包括但不限于圖像增強(qiáng)、圖像恢復(fù)、圖像分類和識別、圖像分割等。圖像處理分為兩種類別:①模擬圖像處理,如遙感圖像處理、電視信號處理等,其優(yōu)勢在于處理速度較快,具有實(shí)時(shí)性,不足之處是精度不高,不具備良好的靈活性;②數(shù)字圖像處理,主要是利用計(jì)算機(jī)、實(shí)時(shí)硬件來進(jìn)行處理,其優(yōu)勢在于精度較高,可處理內(nèi)容較為豐富,且具有較好的靈活性,能夠應(yīng)對復(fù)雜的非線性處理,不足之處是處理速度有待提升,對分辨率有一定的限制[2]。圖像處理應(yīng)用于人們生活中的各個(gè)領(lǐng)域,必須予以高度重視。
自20世紀(jì)80年代,人工神經(jīng)網(wǎng)絡(luò)就已經(jīng)成為人工智能研究領(lǐng)域中的熱門研究話題,其從信息角度出發(fā),將人腦神經(jīng)元網(wǎng)絡(luò)抽象化,以此來創(chuàng)建簡單的模型,通過不同的方式進(jìn)行連接,組合成不同的網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)是一種全新的智能算法模型,能夠科學(xué)分析各個(gè)數(shù)據(jù)節(jié)點(diǎn),并對其進(jìn)行有效的處理,篩選出高價(jià)值的數(shù)據(jù)。人工神經(jīng)網(wǎng)絡(luò)在圖像處理中有著良好的應(yīng)用,主要體現(xiàn)在以下幾個(gè)方面。
(1)圖像數(shù)據(jù)壓縮中的應(yīng)用。在進(jìn)行大量的圖片傳輸、儲存時(shí),為了提高效率,常常通過壓縮大容量圖像信息的方式來儲存、傳輸圖像,傳輸終端接收或提取圖像時(shí),可根據(jù)相應(yīng)的規(guī)則恢復(fù)圖像,從壓縮圖像信息中提取原始圖像信息。人工神經(jīng)網(wǎng)絡(luò)在圖像數(shù)據(jù)壓縮中應(yīng)用,形成了專門的壓縮系統(tǒng),主要由壓縮網(wǎng)絡(luò)、傳輸通道、再生網(wǎng)絡(luò)等部分組成,還涉及輸入層的學(xué)習(xí)模式,以及輸出層的教師模式,網(wǎng)絡(luò)學(xué)習(xí)中這兩者使用的圖像信號一致。中間層的單元數(shù)比輸入層、輸出層的單元數(shù)要少得多,學(xué)習(xí)后的網(wǎng)絡(luò)能夠用少量的中間層單元進(jìn)行圖像的傳輸和儲存[3]。
(2)圖像分割中的應(yīng)用。早期視覺中,圖像分割有一定的難度,其指的是將圖像分為不同的部分,并且這些部分沒有相交,其目的在于只提取用戶感興趣的內(nèi)容,去除不需要的部分。人工神經(jīng)網(wǎng)絡(luò)在圖像分割中也有著不錯(cuò)的應(yīng)用,如可以使用三層前饋網(wǎng)絡(luò)來分割圖像,可根據(jù)每一個(gè)像素的輸入特征,來確定輸入層的神經(jīng)元數(shù),利用多層BP網(wǎng)絡(luò)來獲取圖像的閾值。在實(shí)際應(yīng)用過程中,輸入是圖像的直方圖,輸出則是期望閾值,可形成二值化圖像。
(3)圖像分類與識別中的應(yīng)用。在進(jìn)行圖像處理時(shí),圖像分類和識別是其中的重要內(nèi)容之一,若是圖像模式較為簡單、類別較少,并且不同類別之間有明顯的區(qū)別,那么很容易完成分類和分割的任務(wù);但如果正好相反,則需要通過科學(xué)識別來進(jìn)行圖像分類。人工神經(jīng)網(wǎng)絡(luò)在圖像分類中應(yīng)用時(shí),需將原始圖像作為輸入,再利用中間隱層提取特征。這種方式的優(yōu)勢在于具有直觀性、操作便捷,但不足在于所處理的圖像分辨率不可過高,以免增加輸入單元,導(dǎo)致計(jì)算量成倍遞增;但如果圖像分辨率過低,則難以準(zhǔn)確區(qū)分圖像類別?;诖耍谶M(jìn)行圖像分類時(shí),需要對原始圖像進(jìn)行預(yù)處理,針對圖像的實(shí)際情況來提取其特征,并輸入到適宜的網(wǎng)絡(luò)模型中,以獲得準(zhǔn)確的圖像分類結(jié)果。
(4)圖像增強(qiáng)中的應(yīng)用。其作用在于處理完圖像之后,使之達(dá)到所需要的特定效果。對于不同類型的圖像,應(yīng)采取不同的處理方式,并沒有標(biāo)準(zhǔn)公式,可通過人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)、自組織能力來完成這一工作[4]。與此同時(shí),人工神經(jīng)網(wǎng)絡(luò)還被廣泛應(yīng)用于圖像恢復(fù)、圖像目標(biāo)識別等方面。
遺傳算法最早由美國學(xué)者在20世紀(jì)70年代提出,其以大自然規(guī)律為依據(jù)來進(jìn)行設(shè)計(jì),基于達(dá)爾文生物進(jìn)化論的自然選擇和遺傳學(xué)機(jī)理,形成了一種模擬自然進(jìn)化過程的計(jì)算模型,并以此來尋找最優(yōu)解。遺傳算法在圖像處理中應(yīng)用,具有操作便捷的優(yōu)勢,可以直接處理圖像并尋求最佳處理方案,獲取最佳效果,能夠規(guī)避許多問題。遺傳算法具有一定的綜合性,涉及多方面內(nèi)容,在進(jìn)行圖像處理時(shí),應(yīng)當(dāng)按照相關(guān)流程來執(zhí)行,如開始后,會產(chǎn)生初始種群,計(jì)算適應(yīng)度判斷其是否變異。檢驗(yàn)代次數(shù)是否達(dá)到最大值、適應(yīng)度是否滿足期望值,如果是則處理結(jié)束;如果不是,那么要再進(jìn)行選擇、交叉,重新計(jì)算適應(yīng)度,然后再次進(jìn)行判斷;如果代次數(shù)、適應(yīng)度仍然未達(dá)到最大值和期望值,則判斷為變異;若達(dá)到,則處理結(jié)束。遺傳算法在圖像處理中的具體應(yīng)用主要體現(xiàn)在以下幾個(gè)方面。
(1)在圖像增強(qiáng)中的應(yīng)用。為了將變清楚的圖像變得更加清晰,或是突出圖像中的某些特征,以便對圖像進(jìn)行有效處理,就需要實(shí)施圖像增強(qiáng)技術(shù)。常見的方式有兩種:①空域法,直接通過灰度變換、平滑濾波等方式來處理原始圖像;②頻域法,變換原始圖像,并在變換域中對其進(jìn)行處理。遺傳算法在圖像增強(qiáng)中的應(yīng)用,是尋求控制參數(shù)最優(yōu)化的過程。需要根據(jù)需求選擇適宜的參數(shù)模型,然后將問題轉(zhuǎn)化為另一個(gè)模型,通過確定不同的參數(shù),來實(shí)現(xiàn)統(tǒng)一的目標(biāo)[5]。在模糊增強(qiáng)處理圖像之后,創(chuàng)建出新的模型,通過遺傳算法來選擇灰度閾值。在設(shè)計(jì)應(yīng)用過程中,可有效結(jié)合二進(jìn)制編碼和十進(jìn)制編碼的優(yōu)勢,提高搜索性,使種群更加穩(wěn)定。遺傳算法的應(yīng)用優(yōu)勢在于能夠提高處理效率,縮短處理時(shí)間,可對大圖像庫進(jìn)行自動化處理,而且能保證對圖像良好的增強(qiáng)效果。
(2)在圖像恢復(fù)中的應(yīng)用。所謂圖像恢復(fù),指的是將已經(jīng)退化的圖像恢復(fù)到原狀。目前關(guān)于圖像恢復(fù)的方法較多,常見的有維納濾波法、最大熵恢復(fù)法。但由于圖像退化的原因并不能直接使用函數(shù)來表達(dá),導(dǎo)致在處理時(shí)面臨著較大的計(jì)算量,難以確定退化函數(shù)。遺傳算法對于灰度圖像的恢復(fù)有著不錯(cuò)的效果,其能夠編碼一般染色體,形成二維矩陣,以各像素灰度值為元素,每一個(gè)染色體都代表著一幅圖,對應(yīng)著一個(gè)像素,這就能夠列出個(gè)體的適應(yīng)度函數(shù)并進(jìn)行計(jì)算。采用遺傳算法來進(jìn)行圖像恢復(fù),有利于降低噪聲影響,保證圖像的平滑性,還能夠防止其邊緣出現(xiàn)條紋效應(yīng),保持良好的視覺效果,具有較強(qiáng)的全局搜索能力[6]。
(3)在圖像重建中的應(yīng)用。圖像重建指的是基于某種觀測背景下,通過恢復(fù)攜帶圖像信息的數(shù)據(jù)來獲取原始圖像。將遺傳算法應(yīng)用于圖像重建中,能夠恢復(fù)有噪聲的投影數(shù)據(jù)圖像,隨機(jī)抽取初始種群的染色體,列出適應(yīng)度函數(shù)進(jìn)行計(jì)算。另外,部分學(xué)者提供了遺傳松弛迭代傅里葉變換算法,其能夠處理圖像重建過程中的停滯問題。目前這部分的應(yīng)用還在進(jìn)一步研究中,有待加強(qiáng)。
(4)在圖像分形壓縮中的應(yīng)用。在進(jìn)行圖像分形壓縮的時(shí)候,可用簡單的代數(shù)關(guān)系式來表達(dá),這組代數(shù)關(guān)系式中的各元素應(yīng)當(dāng)是具有相似性的幾何體,以迭代函數(shù)系統(tǒng)、拼貼定理為理論。在處理過程中所合計(jì)到的值域塊這一概念,指的是相互不重疊的圖像小塊,同時(shí)對應(yīng)的概念是定義域塊,指的是重疊較大尺寸的圖像塊。在編碼值域塊的時(shí)候,要尋找一個(gè)定義域塊、一個(gè)仿射變換,找到定義域塊和值域塊兩者之間的映射關(guān)系,然后利用遺傳算法來尋找最優(yōu)匹配方案。在圖像分形壓縮中使用遺傳算法的優(yōu)勢在于大大提升了壓縮比,使圖像壓縮精度更高,而且改善了信噪比,對于處理低比特率的圖像壓縮也有著不錯(cuò)的效果,而且能夠縮短分形計(jì)算時(shí)間,但需要把控多個(gè)參數(shù)。
(5)在圖像分割中的應(yīng)用。圖像分割需要將目標(biāo)圖像與其背景相分離,以便后續(xù)進(jìn)行圖像分類和識別工作。在使用遺傳算法進(jìn)行處理時(shí),會遇到兩種情況:一種是與當(dāng)前常見的圖像分割方法結(jié)合使用,搜索這些方法中的最佳計(jì)算參數(shù);另一種則是在候選的分割空間內(nèi),搜尋最佳的分割方案。
(6)在內(nèi)容圖像檢索中的應(yīng)用。基于內(nèi)容的圖像檢索,指的是基于圖像中包含的色彩信息、形狀信息、紋理信息、對象空間關(guān)系信息等,來創(chuàng)建圖像的特征矢量,以此為圖像索引來進(jìn)行檢索??刹扇〗换ナ竭z傳算法來處理圖像檢索問題,從交互過程中了解用戶對染色體的評價(jià),然后將用戶評價(jià)作為適應(yīng)度,來選擇相應(yīng)的圖像。遺傳算法在內(nèi)容圖像檢索中的作用主要在于提取圖像特征向量,找到圖像本質(zhì)信息,使圖像檢索更加方便、精確。
蟻群算法最早出現(xiàn)于1992年,其是一種用于尋找優(yōu)化路徑的概率型算法,具有分布計(jì)算特征,能夠開展啟發(fā)式搜索,獲取信息正反饋。這一算法的靈感來自螞蟻尋找食物、發(fā)現(xiàn)路徑,用螞蟻的行走路徑表示等待優(yōu)化問題的可行解決方案,螞蟻群體的所有路徑,組成了待優(yōu)化問題的解空間。蟻群算法的優(yōu)勢在于具有較好的適用性,能夠獲取圖像處理的最優(yōu)值,高效切分圖像,于最短時(shí)間內(nèi)找到最佳的處理方案。蟻群算法在圖像處理中的應(yīng)用主要體現(xiàn)在以下幾個(gè)方面。
(1)在圖像分割中的應(yīng)用。由于蟻群算法具有正反饋性、并行性和較好的離散性,因此將其應(yīng)用于圖像分割中能夠取得不錯(cuò)的處理效果??蓜?chuàng)設(shè)啟發(fā)式引導(dǎo)函數(shù),利用初始聚類中心解決計(jì)算量較大的問題,能夠快速分割圖像,尋找到目標(biāo)。可在實(shí)施二維最大熵法的時(shí)候,使用蟻群算法,與之前的窮盡搜索方式相比,解答速率更高,而且精確度也比較好[7]。另外,還有部分學(xué)者在研究蟻群算法在圖像分割中的應(yīng)用時(shí),提出了模糊C均值聚類圖像分割算法,其優(yōu)勢在于能夠精準(zhǔn)確定聚類的個(gè)數(shù),并且可搜索出最優(yōu)值。
(2)在圖像邊緣檢測中的應(yīng)用。圖像的邊緣中存在著大量的圖像信息,局部特征具有不連續(xù)性,而且灰度變化比相較于其他地方更為劇烈一些,邊緣便是指代灰度急劇變化的圖像邊界區(qū)域。一般情況下有兩種類型,一種是屋頂狀邊緣,另一種則是階躍狀邊緣。傳統(tǒng)的邊緣檢測方法主要有Canny算子、Sobel算子、基于灰度直方圖的邊緣檢測等,蟻群算法同樣可以用于邊緣檢測中,主要是利用該算法良好的局部極值處理能力,來確定FCM算法聚類數(shù)目,然后再據(jù)此來處理蟻群聚類,得到有效的處理結(jié)果。
(3)在圖像分類中的應(yīng)用。部分學(xué)者在研究過程中認(rèn)為,在處理圖像分類時(shí),可以基于其特點(diǎn)引入分類蟻群模型,通過隨機(jī)識別螞蟻統(tǒng)計(jì)圖像類別,然后據(jù)此來確定聚類中心。智能螞蟻可以通過搜索前進(jìn)策略,來對圖像進(jìn)行分類。這種圖像分類方式的優(yōu)點(diǎn)在于能夠?qū)崿F(xiàn)自動化分類,而且所需要的時(shí)間比較短,圖像自動分類算法也更具通用性。與此同時(shí),也有學(xué)者認(rèn)為可以基于蟻群優(yōu)化分類規(guī)則,來進(jìn)行遙感圖像分類,不需要統(tǒng)計(jì)分布參數(shù),有利于提升遙感數(shù)據(jù)處理水平。
(4)在圖像匹配中的應(yīng)用。在進(jìn)行圖像匹配處理的時(shí)候,可以通過引入動態(tài)融合蟻群遺傳算法來進(jìn)行處理,尤其適用于多模醫(yī)學(xué)圖像配準(zhǔn)中。其優(yōu)勢在于可尋找到最優(yōu)變換參數(shù),避免進(jìn)行大量的重復(fù)性計(jì)算,配準(zhǔn)率較高,而且具有不錯(cuò)的穩(wěn)定性。
總而言之,在圖像處理過程中,應(yīng)當(dāng)充分利用人工智能算法,需針對圖像處理的特點(diǎn),來對不同的人工智能算法進(jìn)行研究,使之有效運(yùn)用于圖像處理工作中,從而提高圖像處理技術(shù)水平,保障圖像處理效果。人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、蟻群算法都被廣泛應(yīng)用于圖像增強(qiáng)、圖像分類和識別、圖像恢復(fù)、圖像分割等方面,經(jīng)過實(shí)踐證明,取得了不錯(cuò)的成效,但還需要進(jìn)一步加強(qiáng)研究。