陳實(shí) 長(zhǎng)沙醫(yī)學(xué)院
隨著信息化技術(shù)的不斷發(fā)展進(jìn)步,計(jì)算機(jī)在我們?nèi)粘I钪械玫搅藦V泛應(yīng)用,在運(yùn)用計(jì)算機(jī)技術(shù)進(jìn)行碎片拼接復(fù)原的過(guò)程中,一般的原理是利用碎紙片二維化的特征進(jìn)行匹配。在對(duì)碎紙片進(jìn)行拼接復(fù)原的過(guò)程中,可以運(yùn)用現(xiàn)代先進(jìn)的技術(shù)進(jìn)行拼接復(fù)原工作,從而能夠提高碎片拼接復(fù)原的工作效率。
2.1.1 問(wèn)題分析
在文件出現(xiàn)破碎的時(shí)候,其破碎的方式是縱切的情況下,文件的碎片切割線上的信息量相對(duì)來(lái)說(shuō)對(duì)比較充足的時(shí)候,通過(guò)運(yùn)用邊緣線灰度矩陣之間的歐氏距離進(jìn)行碎拼的拼接工作。
2.1.2 模型建立
在運(yùn)用MATLAB 軟件生成碎片的灰度矩陣的過(guò)程中,碎片的數(shù)量是在19 片的情況下,其灰度矩陣是:
其次,我們有建立了目標(biāo)函數(shù),其公式為:
算法為:
(1)我們首先需要找出文件的基準(zhǔn)碎片,其公式為:
一般情況下,對(duì)文件進(jìn)行打印的過(guò)程中,文件中會(huì)存留一定的頁(yè)面邊距。在找取第一張基準(zhǔn)碎片的過(guò)程中,可以根據(jù)文件縱切碎片的特點(diǎn)來(lái)利用文件破碎左側(cè)的空白來(lái)進(jìn)行第一張基準(zhǔn)碎片的找取。在空白部分會(huì)生成一定的灰度矩陣,其空白處灰度矩陣的元素是最大的,數(shù)值為255。因此,我們可以采取每一個(gè)碎片的最左側(cè)一列,來(lái)對(duì)這些碎片的矩陣元素進(jìn)行求和,其中求和最大值的碎片就是我們所需要的,其公式為:
通過(guò)公式的計(jì)算,我們可以得到基準(zhǔn)碎片的序號(hào),其序號(hào)為9。
(2)我們還需要找出文件的后續(xù)碎片,其公式為:
在對(duì)文件后續(xù)碎片進(jìn)行找取的過(guò)程中,其文件相鄰碎片的碎片邊緣是非常相似的,并且他們的灰度矩陣基本上也是一樣的。因此,我們需要根據(jù)基準(zhǔn)碎片的特點(diǎn)來(lái)進(jìn)行后續(xù)碎片的查找,將剩余碎片的灰度矩陣與基準(zhǔn)碎片的灰度矩陣進(jìn)行對(duì)比,其相似值越高,碎片的匹配程度就越高。在對(duì)碎片進(jìn)行匹配的過(guò)程中,其運(yùn)用碎片匹配的方式是歐式距離法。
在數(shù)學(xué)中,歐幾里得距離是歐幾里得空間中兩個(gè)直線之間點(diǎn)的距離。在運(yùn)用這個(gè)距離的過(guò)程中,把歐式空間稱作度量空間。在進(jìn)行實(shí)驗(yàn)的過(guò)程中,來(lái)辨識(shí)歐式距離的方式是運(yùn)用文件碎片邊緣的相似程度,其歐氏距離就是代表碎片邊緣的相似程度,因此,距離越短,碎片的匹配程度越高。我們?cè)谶\(yùn)用歐時(shí)力局公式來(lái)計(jì)算碎片邊緣相似程度的過(guò)程中,在對(duì)碎片左右兩個(gè)列向量相對(duì)應(yīng)灰度矩陣的距離來(lái)求取平方差之和的過(guò)程中,需要滿足下列公式:
其碎片灰度矩陣的匹配結(jié)果是:8、14、12、15、3、10、2、16、1、4、5、9、13、18、11、7、17、0、6。
2.2.1 問(wèn)題分析
在文件破碎的過(guò)程中,其破碎的方式為橫向切割和縱向切割,因此我們得到碎片的信息量是非常少的。在我們對(duì)文件縱切模型進(jìn)行匹配的過(guò)程中,得到的匹配結(jié)果是非?;靵y的。因此我們首先需要對(duì)文件破碎的碎片進(jìn)行分類工作,然后再對(duì)文件碎片進(jìn)行拼接工作,從而能夠提高碎片拼接的工作效率。
2.2.2 模型建立
在建立文件縱切模型的過(guò)程中,首先需要對(duì)縱切模型的基準(zhǔn)碎片進(jìn)行分類。在選取碎片左側(cè)灰度矩陣的過(guò)程中,可以利用文件打印的規(guī)律進(jìn)行選取,其中左側(cè)的前10列灰度矩陣的數(shù)值是為255的碎片,這些碎片就是文件的基準(zhǔn)碎片,我可以得出基準(zhǔn)碎片的第一列的編號(hào)是168、125、094、089、071、061、049、038、029、014、007。在對(duì)這些基準(zhǔn)碎片進(jìn)行匹配的過(guò)程中,其運(yùn)用的匹配方式是格線匹配。
其次,我們需要對(duì)文件剩余的碎片進(jìn)行分類,按照基準(zhǔn)碎片進(jìn)行分類的情況下,可以將剩余碎片分為11 類。通常情況系啊,請(qǐng)我們對(duì)文字進(jìn)行打印的過(guò)程中,打印的方式都是文字會(huì)在同一水平線,因此,我們需要對(duì)文字的上下框線進(jìn)行劃出,從而能夠提升碎片匹配的準(zhǔn)確度。
在對(duì)剩余碎片的灰度矩陣進(jìn)行行求和的過(guò)程中,碎片的數(shù)量是209 的情況下,在對(duì)和進(jìn)行行記的過(guò)程中,分為了1 和0,其將碎片灰度矩陣和為19*255=4854 的行記為1,其余碎片灰度矩陣的行記為0,這樣我們就可以對(duì)全部碎片灰度矩陣的格線位置進(jìn)行記錄。
然后在制定基準(zhǔn)碎片格線高度標(biāo)準(zhǔn)的過(guò)程中,是以11 張的基準(zhǔn)碎片來(lái)作為基準(zhǔn),將文件的圖片分為了11 行。在對(duì)每一行碎片進(jìn)行橫向拼接的過(guò)程中,其運(yùn)用的方式是歐氏距離進(jìn)行碎片的拼接工作。但是,碎片邊緣的信息量是比較少的,在進(jìn)行碎片匹配的過(guò)程中,會(huì)出現(xiàn)碎片亂序的現(xiàn)象。因此,我們需要對(duì)文件最右側(cè)的一列碎片進(jìn)行提取工作,以最右側(cè)碎片來(lái)作為基準(zhǔn),在此運(yùn)用歐氏距離的方式進(jìn)行碎片的匹配工資,對(duì)這兩次的結(jié)果進(jìn)行有效的結(jié)合,在運(yùn)用人工對(duì)碎片的位置進(jìn)行調(diào)整,就會(huì)得到一個(gè)完整的碎片行。最后,我們還需要對(duì)完整成行的碎片進(jìn)行拼接工作。在確定基準(zhǔn)碎片的過(guò)程中,是以提取11張碎片邊緣灰度矩陣的首行碎片來(lái)作為基準(zhǔn),在進(jìn)行拼接的過(guò)程中,是利用歐式距離的方式將11 張碎片的完全匹配拼接工作,從而就能得到一個(gè)完整的文件,就完成了文件復(fù)原的工作。
(1)文件碎片的模型整體的結(jié)構(gòu)較為簡(jiǎn)單,容易操作;
(2)在對(duì)碎片模型中每一個(gè)元素的特點(diǎn)值進(jìn)行加強(qiáng)的過(guò)程中,可以運(yùn)用碎片分類的方式來(lái)進(jìn)行整合,提高碎片匹配的準(zhǔn)確度,促進(jìn)文件復(fù)原工作的順利。
碎片模型
(3)文件碎片模型的基礎(chǔ)性較強(qiáng),有利于模型的推廣工作。其模型的總體思路是根據(jù)每一個(gè)碎片特點(diǎn)的數(shù)值來(lái)進(jìn)行分類工作,能夠?qū)Υ蠓秶募钠唇庸ぷ鬟M(jìn)行轉(zhuǎn)化,轉(zhuǎn)化為小范圍拼接的篩選,在一定程度上降低了碎片匹配工作的難度。在問(wèn)題變得更復(fù)雜的時(shí)候,我們可以運(yùn)用碎片其他的特點(diǎn)值進(jìn)行一定的限制,從而能夠在一定程度上提高碎片拼接的準(zhǔn)確度。
(1)在應(yīng)用碎片模型的過(guò)程中,缺乏一定的靈活程度。當(dāng)碎片的內(nèi)容跑那個(gè)不是規(guī)整的情況,會(huì)大大的降低碎片模型的準(zhǔn)確度。
(2)當(dāng)文件碎片的面積太小的情況下,留給碎片邊緣的信息量是極少的,這就會(huì)降低運(yùn)用歐氏距離法進(jìn)行碎片匹配的準(zhǔn)確率。
隨著我國(guó)經(jīng)濟(jì)實(shí)力和人們生活水平的不斷提高,信息化技術(shù)在我們?nèi)粘I钪械玫搅藦V泛應(yīng)用,在運(yùn)用信息化技術(shù)的過(guò)程中,其計(jì)算機(jī)占據(jù)著重要的地位。在文件破碎的過(guò)程中,我們想把文件復(fù)原的情況下,就需要運(yùn)用計(jì)算機(jī)開(kāi)進(jìn)行文件碎片的復(fù)原。在對(duì)碎片進(jìn)行拼接工作的過(guò)程中,歐氏距離法在拼接碎片中發(fā)揮著重要的作用,在利用歐式距離法進(jìn)行碎片拼接的時(shí)候,需要建立一定的碎片模型,為了能夠提高運(yùn)用歐式距離法進(jìn)行碎片拼接的準(zhǔn)確率,首先需要對(duì)碎片進(jìn)行分類工作,然后在運(yùn)用歐式距離法進(jìn)行碎片的拼接工作,從而能夠在一定程度上提高碎拼匹配的準(zhǔn)確度。