胡永恒 杜鴻
摘 要:隨著圖像識(shí)別技術(shù)的發(fā)展,利用醫(yī)學(xué)成像、圖像識(shí)別和數(shù)據(jù)處理來(lái)分析尿樣試紙也是未來(lái)的一個(gè)發(fā)展方向。針對(duì)尿樣試紙被檢測(cè)顏色塊有效面積小、受光照條件影響嚴(yán)重、直方圖匹配可行性差、采樣數(shù)據(jù)有限等不足,提出了基于QDA(Quadratic discriminant analysis)和LDA(Linear discriminant analysis)相結(jié)合的判別分析算法。該算法通過(guò)對(duì)采集的圖像直接進(jìn)行數(shù)據(jù)采樣,可減少顏色空間轉(zhuǎn)換帶來(lái)的的誤差;考慮sRGB顏色空間的相關(guān)性和采樣數(shù)據(jù)構(gòu)成的協(xié)方差矩陣的差異做判別分析。通過(guò)實(shí)驗(yàn)驗(yàn)證,該算法能夠有效提升識(shí)別效率。
關(guān)鍵詞:圖像識(shí)別;協(xié)方差;二次判別分析法;直方圖匹配
現(xiàn)實(shí)生活中,高血壓、血脂稠、糖尿病等疾病患者越來(lái)越多,而這些疾病都可以通過(guò)尿液檢測(cè)判斷病情,但是市場(chǎng)上使用人工比對(duì)試紙或者傳感器的方法不僅成本高,而且效率極低,不同人的眼睛由于視力等因素的影響,觀察的誤差也非常大,測(cè)試有很大的局限性,并且對(duì)于老年癡呆和小孩子等這類(lèi)病人尿液采樣也是一件不容易的事情。因此找到一種能夠快速、經(jīng)濟(jì)、便捷的尿液測(cè)試方法成為一個(gè)亟待解決的問(wèn)題。
隨著智能手機(jī)和圖像拍攝設(shè)備的更新?lián)Q代,現(xiàn)在的智能手機(jī)像素已經(jīng)能夠滿(mǎn)足圖像識(shí)別所要求的性能。使用智能相機(jī)把與尿液反應(yīng)后的試紙拍攝下來(lái),通過(guò)計(jì)算機(jī)程序自動(dòng)的識(shí)別反應(yīng)后的顏色與標(biāo)準(zhǔn)的參考顏色對(duì)比,進(jìn)而做出定量性判斷,這樣的判斷不僅節(jié)省時(shí)間,而且也會(huì)克服人眼被環(huán)境、視力等因素的影響造成的誤差。
1 建立模型
試紙物理結(jié)構(gòu)。整個(gè)算法研究過(guò)程是建立在如圖1所示的專(zhuān)用醫(yī)療試紙上,試紙一共有兩部分,黑色三角符號(hào)的左邊是參考顏色,右邊是反應(yīng)顏色塊,該顏色塊遇到尿液以后會(huì)發(fā)生顏色變化,通過(guò)采集與尿液反應(yīng)后的圖片,進(jìn)行下一步的圖像處理。
實(shí)際圖片為彩色圖片,參考顏色的每一個(gè)方塊代表一種不同顏色,下文中所用圖片與該圖片一樣。
2 QDA和LDA算法原理
判別分析法的基本原理是按照一定的判別準(zhǔn)則,建立一個(gè)或者多個(gè)判別函數(shù),用研究對(duì)象的大量資料確定判別函數(shù)中待定系數(shù)并且和判別指標(biāo)作對(duì)比,據(jù)此就可以判斷某一樣本屬于哪一類(lèi)。貝葉斯判別原理就是根據(jù)已掌握的每個(gè)類(lèi)的樣本信息,總結(jié)出事物的分類(lèi)規(guī)律建立判別函數(shù),然后就可以根據(jù)這個(gè)判別函數(shù)判斷樣本屬于哪一類(lèi)。
2.1 QDA原理
在測(cè)試點(diǎn)取51*51個(gè)像素作為樣本,每一個(gè)參考色也取同樣的像素點(diǎn)數(shù),計(jì)算出每一個(gè)參考點(diǎn)對(duì)應(yīng)的均值向量、協(xié)方差矩陣和協(xié)方差矩陣的逆矩陣,將測(cè)試樣本計(jì)代入公式計(jì)該樣本點(diǎn)判別系數(shù),依次循環(huán)計(jì)算出所有樣本的判別系數(shù)并求平均,對(duì)比每個(gè)參考色平均判別系數(shù)并求出最大值,該值所對(duì)應(yīng)顏色就是測(cè)試顏色最接近的。
2.2 LDA算法原理
3 實(shí)驗(yàn)與結(jié)果分析
3.1 實(shí)驗(yàn)方案和步驟
為了驗(yàn)證識(shí)別率與樣本容量的關(guān)系,實(shí)驗(yàn)分為A、B、C、D四組進(jìn)行,分別在不同的光照條件下獲取5、10、20、40張圖片,用于測(cè)量人體比重(SG):
實(shí)驗(yàn)步驟:
1)測(cè)試點(diǎn)和參考點(diǎn)都獲取51*51個(gè)像素點(diǎn);
2)計(jì)算參考點(diǎn)的均值向量和協(xié)方差矩陣;
3)判斷協(xié)方差矩陣是否相等并求逆矩陣;
4)將參考點(diǎn)代入QDA或者LDA判別公式;
5)將所有參考點(diǎn)計(jì)算的判別系數(shù)相加,求所有測(cè)試樣本點(diǎn)相對(duì)于每個(gè)參考色的平均判別系數(shù);
6)獲取平均判別系數(shù)最大的參考色序號(hào);
7)測(cè)試顏色就和6)所獲得的序號(hào)對(duì)應(yīng)的顏色最相近;
3.2 Matlab仿真
驗(yàn)證性實(shí)驗(yàn)需要事先設(shè)置測(cè)試顏色與某種參考顏色最相近,本實(shí)驗(yàn)將A組、B組、C組和D組測(cè)試顏色設(shè)置分別與第2、3,、5和6個(gè)參考色最接近,然后隨機(jī)獲取圖片,在Matlab中按照上述實(shí)驗(yàn)步驟進(jìn)行仿真,仿真結(jié)果如下圖:
設(shè)置測(cè)試顏色和第三個(gè)參考顏色塊顏色最相近然后隨機(jī)獲取10張圖片進(jìn)行仿真測(cè)試,仿真結(jié)果如下:
對(duì)C組照片設(shè)置測(cè)試顏色和參考顏色5接近,仿真結(jié)果如下:
從圖2、圖3,可以看出,隨意設(shè)定一種測(cè)試顏色,最終的測(cè)試結(jié)果都是在該參考色處折線(xiàn)獲取最大值,例如:A組設(shè)置測(cè)試色為第2個(gè)參考色,曲線(xiàn)在第二個(gè)參考色處經(jīng)過(guò)QDA判別獲取最大值,同理圖4在三號(hào)色獲取最大值,圖5在5號(hào)色獲取最大值,在D組試驗(yàn)中6號(hào)色獲取最大值,但是判別有兩條曲線(xiàn)出現(xiàn)誤差??偟膩?lái)說(shuō),QDA判別的整體分布是合乎理論要求,判別率比較高。
4 結(jié)語(yǔ)
通過(guò)對(duì)醫(yī)用試紙的研究,提出了基于QDA和LDA在sRGB顏色空間直接進(jìn)行圖像識(shí)別的算法,該算法可以克服樣本數(shù)量小、環(huán)境因素對(duì)圖片的影響,能夠做出快速判斷。但是由于JPEG格式局限性,對(duì)于小樣本數(shù)據(jù)分析協(xié)相關(guān)性強(qiáng),影響判別分析,因此,研究如何通過(guò)小樣本做正確快速的識(shí)別并將此算法能夠在一般的硬件產(chǎn)品上運(yùn)行是下一步研究的重點(diǎn)。
參考文獻(xiàn):
[1] Fisher R A.The use of multiple measurements in taxonomic problems[J].Annals of eugenics,1936,7(2):176-188.
[2] Pastrana J C,Rath T.Novel image processing approach for solving the overlapping problem in agriculture[J].Biosystems Engineering,2013,115(1):106~115.
[3] 陳紅文.植被滲流溝在洞庭湖區(qū)的推廣應(yīng)用[J].湖南文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2014,26(1):61-63.
[4] 曹斌芳,彭光含,彭元杰,et al.一種分層閾值優(yōu)化的語(yǔ)音感知小波去噪方法[J].湖南文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2014,26(2):35-39.
[5] 王文山,柳平增,臧官勝,et al.基于物聯(lián)網(wǎng)的果園環(huán)境信息監(jiān)測(cè)系統(tǒng)的設(shè)計(jì)[J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,43(2):239-243.
[6] Weidong W.Optimizing regularized discriminant analysis in virtual training samples[J].JOURNAL OF COMPUTER AIDED DESIGN AND COMPUTER GRAPHICS,2006,18(9):1327.