鐘彩
摘要人體細胞直接關(guān)系到身體各項指標的性能,在圖像特征的研究過程中,顯微細胞圖像數(shù)據(jù)非常復(fù)雜,這些數(shù)據(jù)對下一步的研究將會受到很大的影響。為了提高圖像的識別效果,文章以尿液中紅細胞圖像分析研究為例,采用LDA算法,對細胞圖像的主要特征進行變換,提取數(shù)據(jù)的主要特征,以達到提取圖像特征的目的。
關(guān)鍵詞LDA算法;圖像分析;特征識別
中圖分類號:TP391 文獻標識碼:A 文章編號:1671-7597(2014)12-0067-01
Study of LDA algorithm in image feature extraction
Zhong Cai
(Changde Vocational Technical College Hunan ChangDe 415000)
Abstract: The cells of the body is directly related to the performance indexes of the body,In the process of the image feature;Microscopic cell image data is very complex;These data have great influence on the study will be the next step. In order to improve the recognition effect, In this paper, red blood cells in the urine image analysis as an example, Using LDA algorithm; The main feature of the cell image transform, Feature extraction of data;In order to achieve the purpose of image feature extraction.
Key words: LDA algorithm; Image analysis; Feature recognition
尿液中的紅細胞經(jīng)過分割后,我們可以確定一個圓,但這類圓的形狀、大小都是不規(guī)則的,其中還有一些雜質(zhì),我們將這些特征統(tǒng)稱為非紅細胞。細胞特征研究是辨別紅細胞和非紅細胞研究最重要的理論參考依據(jù),而其中的特征提取是目前研究中最主要的課題之一。
1LDA算法原理
線性判別式分析是模式識別和人工智能領(lǐng)域中應(yīng)用最為廣泛而且是最為經(jīng)典的算法之一。通過將高維的模式樣本利用一定的技術(shù)手段投影到相關(guān)的最佳鑒別矢量空間,通過一系列分析之后抽取相關(guān)的分類信息以及壓縮特征空間維數(shù)的相關(guān)數(shù)據(jù),從而計算出樣本的max類間距和min類間距,作為空間有效分離性的基本數(shù)據(jù)。線性判別式分析是LDA算法的理論基礎(chǔ),從建立起到現(xiàn)在已經(jīng)成為LDA最主要的算法之一。
樣本類內(nèi)離散度矩陣可以定義為:
可以定義為:
,
其中,是先驗概率,是類的均值。樣本的類間離散度矩陣可定義為
是所有樣本的均值。由上面公式可以推導(dǎo)出,如果是非異性矩陣的話,投影效果可以得出,各類樣本的效果與分散度以及類內(nèi)離散度有著相當大的關(guān)系,通常離散度越大,投影效果越明顯;類內(nèi)離散度越小,投影效果越理想??偠灾?,如果想要獲得最優(yōu)的投影方向,可以讓樣本之間的“類離散度矩陣/樣本類內(nèi)樣本類內(nèi)離散度矩陣的行列式”比值最大,得出其中的正交特征向量,以便達到理想的投影效果。
具體可以定義Fisher準則函數(shù)如下:
求出,取最大值時對應(yīng)的特征向量,通過數(shù)學(xué)變換可以得出,滿足如下等式的解:,,由公式可以看出是由之間的較大特征值所決定的。
如果非奇異,就是求的本征值問題,其中該矩陣最多有非零特征值,是類別數(shù)目。但是在LDA成像具體操作過程中,有時也會出現(xiàn)一些偏差,其中最主要的是樣本內(nèi)一般情況下呈現(xiàn)為奇異性的狀態(tài)。這是因由細胞圖像特出的數(shù)據(jù)是高維數(shù)據(jù),這些數(shù)據(jù)本身的維數(shù)就明顯大于樣本數(shù),因此,,理論上呈現(xiàn)的是不可逆的狀態(tài)。這就使得即廣義特征值在求值過程中會出現(xiàn)一些問題,即小樣本的問題。對于此類的問題,我們首先要對高維數(shù)據(jù)進行充分分析,然后根據(jù)具體情況研究分析,的特性空間,再次就是轉(zhuǎn)換角度,讓LDA對圖像分析進行降維處理,從而使得呈現(xiàn)為可逆狀態(tài)。
通過LDA算法一些測算,可以有效地將特征子空間進行融合,從而獲取融合后的特征空間。其次將訓(xùn)練樣本以及測試樣本在此空間進行投影,將識別特征進行記錄。將識別樣本和訓(xùn)練樣本進行規(guī)范化處理,然后對其向特征子空間進行投影,獲得一組投影向量,(A為以前規(guī)范化的樣本)。通過公式帶入可以得出一組投影向量。通過對一組投影向量進行分析和整理,列出維的列向量,即每個投影向量。然后將這組投影向量組成一個矩陣如下:,式中,為大小的矩陣,該矩陣稱為細胞圖像樣本的特征矩陣,此矩陣即為所要提取的細胞樣本的特征。
2實驗結(jié)果
本文通過對LDA算法的實驗研究,能有效地將尿液中紅細胞高維圖像降低為低維圖像,生成低維細胞空間,這樣有利于圖像特征的提取,從而達到研究的目的。但在研究過程中,我們發(fā)現(xiàn)LDA算法還是存在某些局限性,如對那些形體不規(guī)則的細胞不能很好的提取特征,在以后的研究中,我們還將進一步完善該算法,繼續(xù)挖掘紅細胞的新特征,爭取達到更好的實驗效果。同時,在人體尿沉渣中,存在更小的紅細胞與小結(jié)晶,有形成分中目標比較復(fù)雜、類型較多,即使同一類細胞在形態(tài)及紋理上都有不同的特征,還有其它成分尚未進行識別,而且有些成分與已識別的成分非常相近,很容易造成誤識,這些都是我們應(yīng)該做更深入的研究。本文實驗結(jié)果是在windows XP/Matlab7.0.1環(huán)境下運行得到。
通過以上研究可以得知,LDA算法對于人體細胞圖像特征中的應(yīng)用有十分重要的作用,對于人類細胞的研究方法提供了更加清晰地解析。同時LDA算法對于人類醫(yī)學(xué)研究方面提供了豐富的數(shù)據(jù)參考。盡管這種算法還有待完善,但我們相信,隨著技術(shù)的改進和算法的完善,LDA算法對于細胞成像的相互之間的轉(zhuǎn)化以及特征研究必將發(fā)揮它關(guān)鍵性的作用。
參考文獻
[1]雷松澤.基于k-means聚類的快速LDA算法在語音識別上的應(yīng)用[J].科技通報,2013.
[2]許伯熹,胡寧,陳文斌,等.LDA算法在Mahout下的高效實現(xiàn) [J].華東師范大學(xué)學(xué)報,2013.
[3]黃軒宇.基于KL投影LDA人臉識別及正交辨識分析[A].江蘇省通信學(xué)會論文集[C].南京:2004.
[4]雷赟,龔葵花.基于線性矩和小波變換的醫(yī)學(xué)圖像特征提取[J].科技信息,2010(03).
[5]韓爭勝,李映,張艷寧.基于LDA算法的人臉識別方法的比較研究[J].微電子學(xué)與計算機,2005(07).
endprint