蔣昭穎,郝福珍
(華北計算技術研究所后勤信息化事業(yè)部,北京100083)
傷票是醫(yī)療單位記錄傷員受傷信息和統(tǒng)計傷員出現(xiàn)的病情,救治傷員過程的記錄承載方式,是衛(wèi)生機構醫(yī)療單位做統(tǒng)計匯總信息的主要參考樣本,也是后勤單位保障工作經驗總結與醫(yī)學研究的重要資料和數(shù)據(jù)[1]。伴隨著我國軍事化改革的浪潮不斷興起以及后勤單位醫(yī)護保障系統(tǒng)的階段性革新,紙質化傷票逐漸采用電子化手段進行保存和使用,電子化、信息化、網(wǎng)絡化、智能化成為了傷病員管理方式的新趨勢[2]。采用圖像識別技術,將紙質傷票的信息提取并存入后臺數(shù)據(jù)庫中。經過這一系列的操作,既保證了醫(yī)護人員在緊急情況下對傷病員信息的處理,又可以實現(xiàn)高效的后勤保障服務。由此可見,紙質傷票的電子化管理在傷病員信息化管理方面占有舉足輕重的地位。
文中主要研究傷票圖像識別定位算法,該算法的復雜性在于傷票圖像的廣泛差異性。這種差異來自于光照條件、拍照角度以及破損情況等。而且圖像中的傷票往往嵌入在混亂的場景和背景中,鏡頭本身的抖動也會對處理結果產生影響。文中通過模板匹配的方法對傷票進行識別粗定位,并且對其中的相關系數(shù)法進行改進,提升算法速度及準確率,采用數(shù)學形態(tài)學方法對傷票邊緣集合特征進行精確定位,并與模板圖片進行匹配度驗證。
傷票識別的匹配策略分為兩種,一種是完全匹配,即兩幅圖像的特征完全相同,另一種是按照相關性匹配,即兩幅樣本的感興趣部分之間的距離小于某一個設定好的數(shù)值,這兩種辦法是當今時代圖像辨識范疇內最常用的算法。
在匹配算法中,歸一化互相關匹配算法是應用非常多的一種方法,非常典型。在該方法中,我們需要計算出兩幅圖片的互相關程度,從而得到采集的傷票圖像與模板的樣本二者的匹配關系。歸一化互相關值的計算與選擇的二維數(shù)組模板有關,不同的位置將會在該范圍內計算出不同的互相關值,從而決定該位置是否為最佳位置?;ハ嚓P有兩種定義形式,分別為:
歸一化互相關算法具有高精度和適應性,在互相關計算中,圖像的自相關值相對較大,相似度形成相對于模板的真實位置相對平緩的峰值,但是不能精確地檢測峰值位置。換句話說,當模板劃痕圖像偏離真實位置時,圖像相關值較大,這使得難以確定模板圖像在實際損傷圖像中的精確位置。歸一化互相關算法的缺點是計算復雜度高,計算時間長。
在160×160的滑動窗口內,首先計算模板的均值,然后計算樣本的均值。模板像素值與均值做差,同時樣本像素值與樣本均值做差,二者相乘,將窗口內每一位置處的該數(shù)值進行累加,這個累加值就是歸一化相關系數(shù)法的分子。分母的計算如下:模板像素值與均值做差,然后將該差值做平方運算,累加窗口內的每一位置處的平方值。同時按相同的方法計算樣本像素值與均值做差,并平方之后累加。二者相乘然后進行開方運算,得到的就是該位置處的歸一化相關系數(shù)。歸一化相關系數(shù)匹配效果圖,如圖1所示。
圖1 歸一化相關系數(shù)匹配效果圖
我們將每一位置處的歸一化相關系數(shù)以及行值和列值用一張三維圖來形象的表示,能夠發(fā)現(xiàn)歸一化相關系數(shù)的值均在0~1范圍內,且能夠發(fā)現(xiàn)最大的歸一化相關系數(shù)就是最佳的匹配位置。歸一化相關系數(shù)匹配法各坐標點處的相關系數(shù)三維圖,如圖2所示。
通過歸一化相關系數(shù)圖,我們可以得到在傷票采集圖像中的最大歸一化相關系數(shù)的位置,從而可以得到最佳匹配位置。
圖2 歸一化相關系數(shù)匹配法相關系數(shù)圖
表1 歸一化相關系數(shù)匹配算法分析
對式(2)進行化簡,得式(3)
在不影響相似性度量的前提下,對(3)式進行相關系數(shù)近似計算。本文從兩方面對相關系數(shù)計算進行改進,一方面從公式的近似和化簡,另一方面從計算量和搜索位置進行改進。
該算法結合順序相似性檢測算法(SSDA)算法的思想進行改進。SSDA是基于匹配操作的思想,然后給出一種閾值計算方法。閾值可以隨著匹配操作的進行而被調整,并且它可以反映匹配操作是否可能超過閾值結果。因此,可以在每個匹配操作的過程期間的任何時間檢測匹配操作是否繼續(xù)。歸一化互相關匹配方法在計算上較大的原因是搜索窗口在捕獲的票圖像上跳過并且每次滑動執(zhí)行匹配相關計算。而且,除匹配點外,其他非匹配點并不需要進行運算,但是歸一化相關匹配在每一點都進行了相關計算,這就導致了圖像匹配算法的計算耗費大量增加,對實際的匹配影響卻并沒有很大。綜上所述,SSDA的思想就是如果找到模板定位的目標像素點為非準確像素點就果斷丟掉,停止計算,立即換到新的像素點位置計算,采用這樣的思路,能夠大幅度提高算法的實時性。
具體實現(xiàn)該算法的過程如下:我們利用SSDA的思想改進歸一化相關系數(shù)匹配算法,需要明確SSDA選擇開關值的算法策略。選擇二維數(shù)組窗口,利用該窗口內的像素值依次計算該位置的歸一化相關系數(shù),同時每經過一次計算需要與SSDA的開關值進行比較,如果計算完的數(shù)值超過了開關值,則認為該位置處的二維窗口的歸一化相關系數(shù)與開關值不一致,即該位置的二維窗口為無效窗口,停止接下來的計算,進行下一個位置處搜索窗口的計算,該思想能夠完成匹配算法的加速。
文中,模板的大小為420×420,采集圖片大小為640×480,針對模板與采集圖片大小,我們對搜索位置進行優(yōu)化。由于在掃描傷票過程中,傷票位置均處于屏幕的中間區(qū)域,所以,搜索的位置我們從圖片的1/3處開始搜索,直至圖片的2/3處結束。兩條紅線為搜索范圍,藍色矩形為起始模板位置,黃色矩形為終止模板位置。我們只需要搜索1/3圖片區(qū)域即可找到是否有匹配的區(qū)域,通過該算法,可以將匹配運算時間提高2/3。
由于文中在場景中只需要尋找傷票,所以,為了提高運算效率,不需要每個點都進行計算,文中采取的方法是隔一個點進行一次運算,這樣只需要進行(M×N)/4次加法運算,運算效率可以大幅提高。
圖3 改進算法各坐標相關系數(shù)
通過改進相關系數(shù)法我們發(fā)現(xiàn),通過門限值的設定,該算法只需搜索120個點的位置,即可找到最佳匹配位置。而傳統(tǒng)的匹配算法需要搜索3 744個點,通過處理時間的分析,我們也可以發(fā)現(xiàn)改進的算法大大減少了匹配處理時間,79 ms的處理時間也滿足傷票的實時檢測需求。
表2 改進的匹配算法分析
在粗定位前,首先進行模板匹配,判斷場景中是否存在傷票,并且獲取模板位置。對采集的傷票分別采用傳統(tǒng)相關系數(shù)匹配與改進的相關系數(shù)匹配法,其實驗結果如圖4所示,算法耗時比較如表2所示。
表3 兩種算法耗時比較
模板匹配能夠得到復雜場景中傷票的大體位置,該區(qū)域可以作為ROI區(qū)域,由于傷票最終的目的是要提取出選中信息,所以需要精確定位傷票并且將其每點坐標映射到二維直角坐標系中,便于定位選中點信息。所以,本文給出基于邊緣幾何特征的數(shù)學形態(tài)學算法進行傷票的精確定位。
數(shù)學形態(tài)學最早由Martin提出,并廣泛應用于圖像處理領域[7]。所提出的基于邊緣幾何特征的數(shù)學形態(tài)學算法依據(jù)ROI區(qū)域中傷票的大小和結構,利用開操作和閉操作將不含有傷票信息的候選區(qū)域濾除并最終得到傷票精確定位點。綜合考慮影響傷票精確定位的主要因素,主要包括在拍攝傷票過程中可能出現(xiàn)的外界干擾因素:例如曝光過度、陰影遮擋等。使用自適應閾值算法,能夠獲得穩(wěn)定的傷票定位結構。
為了解決陰影和光照條件下會造成閾值的誤分割這一問題,我們需要采用自適應局部閾值分割方法。本文采用中值濾波和加權平均法實現(xiàn)自適應閾值的計算實現(xiàn)圖像的二值化。
自適應局部閾值的原理是在需要確定門限值的位置選取一個模板窗口,根據(jù)模板窗口內的所有灰度值,動態(tài)計算出一個閾值作為該位置處的門限值。這種方法能夠避免全局閾值法單一門限值的缺陷,特別適用于在圖片各點光照不均勻的情況使用。即用規(guī)范之后的像素亮度值來進行圖片的光照補償,根據(jù)規(guī)范化的像素值決定該點是黑色像素還是白色像素。文中采用該方法進行陰影區(qū)域的消除以及曝光過度區(qū)域的補償。第一步,將圖片分塊,計算每個區(qū)域的灰度像素直方圖。然后,計算每一個區(qū)域的門限值,所求位置處的門限值需要結合相鄰區(qū)域的門限值進行插值獲取。
對采集的圖片進行固定閾值分析以及自適應閾值分析,結果如圖4所示??梢园l(fā)現(xiàn),固定閾值無法兼顧光照和陰影的補償,左下角部分受陰影的影響,導致選取的閾值過高,右上角部分受光照的影響,導致選取的閾值過低,無法得到清晰完整的二值圖片。而自適應閾值可以很好的補償光照和陰影的缺陷,恢復完整圖像。
圖4 固定閾值與自適應閾值對比圖
在文中研究的傷票中,我們人為指定的標志塊為矩形,所以本文對閉合邊緣曲線進行矩形擬合。對于二維平面內的任意矩形,可以用5個參數(shù)對其進行唯一定位和描述,重心位置(x,y),矩形4個頂點坐標P1(x,y),P2(x,y),P3(x,y),P4(x,y)。
首先,采用矩的方法對擬合矩形的重心位置(x,y)進行估算,公式如下[35]:
其中,f(x,y)為權值,當統(tǒng)計點 (x,y)在閉合曲線所圍區(qū)域內時取1,否則取0,M、N為閉合曲線所圍區(qū)域的最小外接矩形的長和寬,可以通過各輪廓點坐標得到,S為閉合區(qū)域面積,mij為矩形區(qū)域內像素點位置(i+j)階原點矩,其中(m01,m10)為閉合區(qū)域的重心位置。
得到矩形重心位置后,遍歷輪廓邊緣坐標,計算重心與每一個邊緣坐標的絕對距離,選取距離最大的 4 個點,分別為P1(x,y),P2(x,y),P3(x,y),P4(x,y)。再對其4個頂點坐標進行排序,令其按照左上、左下、右上、右下的順序進行存儲。
對數(shù)學形態(tài)學處理后的圖片進行矩形擬合,我們將閉合曲線所圍區(qū)域用實心表示,然后對其進行矩形擬合,選取左上角、右上角和下方擬合矩形結果,處理結果如圖5所示。
圖5 提取輪廓效果圖和矩形擬合效果圖
得到擬合矩形后,提取左上角點坐標、右上角點坐標、左下角點坐標、右下角點坐標進行透視變換,將其映射到二維平面上,對其進行提取信息操作。
文中采集各種場景下的傷票進行傷票自動識別實驗。傷票自動識別檢測是在手持機Android4.2系統(tǒng)中運行,結合Opencv2.4.9所實現(xiàn)的。通過檢測傷票的邊緣幾何特征,基于改進模板匹配算法的傷票識別與定位的方法,精確度高,魯棒性強,適用于各種復雜場景中識別并定位傷票。算法對相關系數(shù)匹配法進行改進,針對其速度慢的缺點進行算法上的優(yōu)化,優(yōu)化效果明顯,速度可以大幅提高。采用自適應閾值的方法消除曝光過度和陰影對傷票檢測影響,實驗表明,自適應閾值能夠完全補償曝光和陰影。采用數(shù)學形態(tài)學的方法對傷票邊緣進行封閉連接,保證傷票的3個標記塊位置處的區(qū)域時閉合的。采用基于邊緣特征的矩形擬合方法,對標記塊進行矩形擬合,精確得出傷票的4個角點,從而定位傷票位置,便于后續(xù)研究。
圖6 傷票標記區(qū)域提取效果圖
表4 標記區(qū)域提取信息表
參考文獻:
[1]張樹華.戰(zhàn)時衛(wèi)生勤務學[M].北京:解放軍出版社,2006.
[2]師廷偉,金長江.基于FPGA的并行全比較排序算法[J].數(shù)字技術與應用,2013(10):126-127.
[3]岡薩雷斯.數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2011.
[4]廖春生.基于數(shù)學形態(tài)學車牌定位算法仿真研究[J].計算機仿真,2011,28(12):353-356.
[5]陳鑫元.自適應閾值圖像二值化及形態(tài)學處理的FPGA實現(xiàn)[J].電子測量技術,2016,39(7):68-71.
[6]劉紫燕,祁佳.實時圖像邊緣檢測形態(tài)學優(yōu)化設計及FPGA實現(xiàn)[J].計算機技術與應用,2013,39(9):132-134.
[7]鄧俊俊.基于內容的圖像檢索技術研究[D].南京:南京理工大學,2012.
[8]謝季峰.基于霍夫變換的劃痕檢測算法應用[J].電腦知識與技術,2012(20):4957-4958,4961.
[9]張明慧,盧振泰,張娟.基于多圖譜活動輪廓模型的腦部圖像分割[J].計算機學報,2016:39(7):1491-1500.
[10]SONG Xin-hang,JIANG Shu-qiang,Herranz L.Joint multifeature spatial context for scene recognition in the semantic manifold[C]//Proc of the IEEE Conf on Computer Vision and Pattern Recognition.Piscataway,NJ:IEEE,2015:1312-1320.
[11]胡永強,宋良圖,張潔,等.基于稀疏表示的多特征融合害蟲圖像識別[J].模式識別與人工智能,2014,27(11):985-992.
[12]劉紫燕,祁佳.實時圖像邊緣檢測形態(tài)學優(yōu)化設計及FPGA實現(xiàn)[J].計算機技術與應用,2013,39(9):132-134.
[13]余江.基于輪廓的形狀匹配方法研究[D].安徽:安徽大學,2013.
[14]王宇新.基于特征分布的圖像識別方法研究與應用[D].大連:大連理工大學,2012.
[15]Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[C]//Proc of the 26th Annual Conf on Neural Information Processing Systems.Cambridge,MA:MIT Press,2012:1097-1105.
[16]XIAO Jian-xiong,Hays J,Ehinger K,et al.Sun database:Large-scale scene recognition from abbeytozoo[C]//ProcoftheIEEE Confon Computer Vision and Pattern Recognition.Piscataway,NJ:IEEE,2015:3485-3492.