劉嬋
摘 要:隨著計(jì)算機(jī)技術(shù)的發(fā)展,人們?cè)噲D開(kāi)發(fā)碎紙片的自動(dòng)拼接技術(shù),以提高拼接復(fù)原效率。本文基于相似度比較的原理在解決來(lái)自同一頁(yè)印刷文字文件的碎紙機(jī)僅縱切的破碎紙片自動(dòng)拼接修復(fù)技術(shù)的前提下,對(duì)來(lái)自同一頁(yè)印刷圖像文件的碎紙機(jī)僅縱切的破碎紙片進(jìn)行了自動(dòng)拼接,得到了較好的效果。
關(guān)鍵詞:相似度比較 文檔碎片拼接 圖像碎片拼接
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2014)02(a)-0063-02
破碎文件的拼接在司法物證復(fù)原、歷史文獻(xiàn)修復(fù)以及軍事情報(bào)獲取等領(lǐng)域都有著重要的應(yīng)用。本文在解決了來(lái)自同一頁(yè)印刷文字文件的碎紙機(jī)僅縱切的破碎紙片自動(dòng)拼接修復(fù)技術(shù)的前提下,對(duì)來(lái)自同一頁(yè)印刷圖像文件的碎紙機(jī)僅縱切的破碎紙片進(jìn)行了自動(dòng)拼接。
1 基于相似度比較的碎片拼接算法
圖像在計(jì)算機(jī)中是以矩陣形式存儲(chǔ)的,圖片上不同的顏色是以像素值來(lái)區(qū)別的,比如黑色是“0”,白色是“255”,其他顏色介于“0:255”之間,選擇像素值作為特征匹配[1]的元素,通過(guò)相似度函數(shù):
可以衡量序列和序列的相似度,值越大兩個(gè)序列越相似。將圖像某行后某列的像素值作為序列,就可以實(shí)現(xiàn)像素值的相似度比較。
讀取圖片的像素值,提取每個(gè)圖片的左右邊界值,形成左右邊界矩陣和,然后用右邊界矩陣中的每一個(gè)列向量分別與左邊界矩陣中的列向量進(jìn)行比較,得到每個(gè)值,取這些數(shù)中最大值所對(duì)應(yīng)的列向量就是應(yīng)該和中列向量相匹配的向量,也就是說(shuō),如果與中第個(gè)向量匹配得到值最大的是中第個(gè)向量,那么第個(gè)向量應(yīng)該放在第個(gè)向量之后。
該問(wèn)題的求解通過(guò)MATLAB編程實(shí)現(xiàn),軟件實(shí)現(xiàn)算法流程圖如圖1。
2 實(shí)驗(yàn)與結(jié)果分析
2.1 文檔拼接實(shí)驗(yàn)與結(jié)果分析
文檔拼接以2013年數(shù)學(xué)建模B題中附件1和附件2中給出的中、英文各一頁(yè)文件的碎片數(shù)據(jù)進(jìn)行拼接復(fù)原。
2.1.1 數(shù)據(jù)預(yù)處理
首先讀取19個(gè)大小為的文檔碎片的像素值,形成一個(gè)的三維矩陣,然后提取每個(gè)碎片的左右邊界值,形成左右邊界矩陣和,然后用這兩個(gè)矩陣中的數(shù)據(jù)進(jìn)行相似度比較。
2.1.2 邊緣檢測(cè)與相似度比較
比較和中的各個(gè)列向量如果中的第個(gè)列向量的像素值和中的第個(gè)列向量的像素值完全相同,則第個(gè)向量所對(duì)應(yīng)的文檔碎片應(yīng)該處于文檔的最左邊,第個(gè)向量所對(duì)應(yīng)的文檔碎片應(yīng)該處于文檔的最右邊。如此即可確定出文檔的邊緣。
然后用右邊界矩陣中的每一個(gè)列向量分別與左邊界矩陣中的列向量進(jìn)行比較,得到19個(gè)值,取這19個(gè)數(shù)中最大值所對(duì)應(yīng)的列向量就是應(yīng)該和中列向量相匹配的向量,也就是說(shuō),如果與中第個(gè)向量匹配得到值最大的是中第個(gè)向量,那么第個(gè)向量應(yīng)該放在第個(gè)向量之后。
2.1.3 實(shí)驗(yàn)結(jié)果
在Matlab7.0環(huán)境下進(jìn)行編程,在整個(gè)過(guò)程中不需要人工干預(yù)該程序可以實(shí)現(xiàn)自動(dòng)拼接得到完整的拼接結(jié)果,正確率100%,得到文檔復(fù)原拼接順序見(jiàn)表1。
2.2 圖像拼接實(shí)驗(yàn)
由于文檔碎片和一般的圖片一樣,在軟件中以矩陣形式存儲(chǔ),因此,文檔的拼接方法可以運(yùn)用到一般圖片的拼接上去。然而在文檔拼接過(guò)程中因?yàn)榘准埡谧郑卣鬏^明顯,因此,邊緣文檔的確定較為簡(jiǎn)單,而圖片拼接過(guò)程中,由于圖像本身顏色變化較多,邊緣特征不明顯而使得邊緣圖像的確定比較復(fù)雜。
本文中在對(duì)邊緣提取進(jìn)行多種嘗試之后確定了,利用缺省值提取的方法進(jìn)行確定。以的Lena圖像的碎片拼接為例。
首先,將Lena圖像進(jìn)行分割,分成16個(gè)的小圖像,然后按照相似度比較的方法得到與每一幅小圖相似度最高的圖像,結(jié)果如表2。
從表2可以看出沒(méi)有一幅圖像后面該接10號(hào)圖,因此,10號(hào)圖應(yīng)該是最左邊的圖片,確定了最左邊的圖像,依次相連就可以得到正確的拼接順序,如表3。
此外13號(hào)圖和16號(hào)圖后面都接14號(hào)圖,因此,13號(hào)圖和16號(hào)圖中有一幅圖應(yīng)該是最后一幅圖,此結(jié)論也可以對(duì)拼接的正確性進(jìn)行一定的判別。
為了驗(yàn)證算法的正確性,又對(duì)Baboon,Bridge等經(jīng)典圖像進(jìn)行了拼接,均能實(shí)現(xiàn)自動(dòng)正確拼接。
3 結(jié)語(yǔ)
本文提出的是一種簡(jiǎn)單的基于相似度比較的圖像拼接算法,該算法中運(yùn)用的模型簡(jiǎn)單易懂,使用方便,特征匹配效果良好,是一種很簡(jiǎn)易的拼接方式。
參考文獻(xiàn)
[1] 龔冷方.基于SIFT特征匹配的圖像拼接技術(shù)研究[D].云南大學(xué).
[2] 劉立.基于多尺度特征的圖像匹配與目標(biāo)定位研究[D].華中科技大學(xué).