(湖北大學知行學院,武漢 430011)
現(xiàn)代計算機的發(fā)展越來越智能,對于文字、圖像、聲音的各種信息都能夠快速的識別與處理[1-3]。隨著多媒體技術的迅速發(fā)展,圖像信息所占的資源也在不斷的擴充,大容量的、高速的遠程分布式數(shù)據(jù)庫的建立為海量的動態(tài)圖像提供了最基礎的保障,在各行各業(yè)中的應用越來越廣泛,人們對動態(tài)圖像信息的管理與檢索就更加的重視[4-5]。動態(tài)圖像的檢索一直是我國研究的技術問題,無論是理論、方法還是技術都需要根據(jù)不同領域用戶提供的圖像來尋找一種適用于該領域圖像的檢索技術手段?,F(xiàn)在圖像數(shù)據(jù)庫研究的中心就是對圖像進行檢索,這是最具有本質性的研究領域,已經(jīng)成為國內外學者研究的熱點,這也成為了必須攻克的目標[6-7]。近幾年,隨著大量文獻的出現(xiàn)帶動了人們對于過去研究成果總結的動力,對于圖像檢索的產(chǎn)生與歷史背景都是促進檢索功能進步的基礎。傳統(tǒng)的圖像信息檢索系統(tǒng)存在檢驗圖像完好率與檢索圖像準確率方面較差、檢索的速度較慢等問題,已經(jīng)不能滿足當下人們對圖像信息檢索的需求。
文獻[8]中提出了一種基于內容的圖像檢索系統(tǒng)的設計,該系統(tǒng)設計的方法就是利用圖像的紋理、形狀以及顏色對圖像的特征提取、描述以及相似性度量,雖然檢索的信息比較全面,但是在理論上還存在許多問題等待解決;文獻[9]中提出了一種基于小波動態(tài)圖像檢索的系統(tǒng)設計,該系統(tǒng)設計的方法就是利用小波分析圖像的分辨率,用二維動態(tài)時間的方法進行計算,雖然能夠對相關的程序進行匹配與識別,但是在檢索技術的方面尚不成熟。文獻[10]中提出了一種基于動態(tài)圖像信息互動的特征檢索系統(tǒng)的設計,該系統(tǒng)設計的方法就是將動態(tài)的圖像信息互動為基礎,將圖像信息的特征進行分類,采用迭代的算法對動態(tài)圖像進行檢索。
針對上述的觀點,我提出了一種遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)設計。首先根據(jù)遠程分布式數(shù)據(jù)庫的特點,設計出了動態(tài)圖像的檢索硬件系統(tǒng)框圖;然后基于動態(tài)圖像特征檢索算法對軟件進行了設計;最后進行了對比的實驗。實驗結果證明,遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)的設計能夠改善傳統(tǒng)圖像信息檢索系統(tǒng)檢驗圖像完好率與檢索圖像準確率較差的問題,并且在檢索速度的方面也有較大的提升,具有分布性廣、通信良好以及穩(wěn)健性較強等優(yōu)點,為我國未來的圖像檢索技術奠定了堅實的基礎。
遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)硬件設計需要對整個系統(tǒng)從上至下進行分層,分別是:遠程分布式數(shù)據(jù)層、公共服務層、主業(yè)務層、支撐系統(tǒng)層。遠程分布式數(shù)據(jù)層的設計主要包括整個系統(tǒng)中會用到的數(shù)據(jù),通過對特征的處理得到模型的數(shù)據(jù),而圖片的特征主要用于模型的訓練,進行索引特征的建立與處理;公共服務層主要是提取圖片中最原始的特征,并對特征處理,這其中就包括了利用訓練模型得到的數(shù)據(jù);主業(yè)務層主要就是用Web服務技術的設計來服務普通的用戶;支撐系統(tǒng)層為整個系統(tǒng)的存儲提供支撐的作用。而每個層次主要包括管理員與普通用戶這兩個角色,管理員是對硬件系統(tǒng)的管理與維護;用戶是系統(tǒng)檢索服務的使用者。為了能夠應對遠程分布式數(shù)據(jù)庫的動態(tài)圖像的需求,在硬件設計的時候應該使用FastDFS的系統(tǒng)對圖片進行儲存,該系統(tǒng)能夠直接的使用OS對計算機的管理與控制。對于圖片的上傳與下載需要將存儲的服務器按照原來的路徑進行返回,但是直接在瀏覽器上就對圖片的傳輸協(xié)議請求進行系統(tǒng)上的支持,這種效果并不好,為此,應該對每臺存儲服務器進行重新的配置,并安裝上具有軟件開發(fā)和高性能的反向代理服務器如圖1所示。
圖1 圖片儲存的系統(tǒng)架構設計
對于Web服務設計采用的是Java EE應用程序的技術,框架為MVC的分層模型,主要包括:業(yè)務的邏輯層、控制層和視圖層,如圖2所示。
圖2 Web服務技術的架構
由圖2可知:業(yè)務的邏輯層主要是對圖片的屬性進行解析,然后向檢索的服務模塊發(fā)出相應的請求,并歸納多個檢索服務模塊所接收到的結果信息;控制層主要是對圖片的上傳、參數(shù)的處理、返回的信息以及接收的請求進行處理,一定的情況下可以調用業(yè)務的邏輯層輔助完成工作;視圖層用戶界面(UI)的模塊,主要通過JSP的負責來完成相應的程序。
框架為MVC的分層模型能夠降低Web服務技術架構之間的模塊耦合程度,并使數(shù)據(jù)的顯示情況與業(yè)務之間的邏輯相互分離,并且可以方便的對視圖層和業(yè)務邏輯層進行擴充或修改,后續(xù)的相應工作也可以精心的維護。
結合遠程分布式數(shù)據(jù)庫優(yōu)點與比較成熟的Web服務技術建立了動態(tài)圖像的檢索系統(tǒng),該系統(tǒng)的模塊主要包括:查詢的引擎、特征的提取、特征的對比、特征的圖像庫、查詢的反饋與滿意程度、圖像信息的參數(shù)以及數(shù)據(jù)庫的管理,具體結構如圖3所示。
圖3 動態(tài)圖像的檢索硬件系統(tǒng)框圖
從圖3可以看出,交界口能夠接收用戶提供的圖像,等待查詢,設置相應的特征進行提取并對參數(shù)對比,即可顯示查詢的結果,并通過接口對查詢的結果進行評價,將特征修改后能夠重新對信息進行查詢。根據(jù)用戶對查詢結果的滿意程度對參數(shù)進行修正,通過調整可更新圖像的數(shù)據(jù)庫,從而提高查詢的精準度。而特征的對比就是利用提取的圖像特征進行對比,篩選出符合規(guī)定的數(shù)據(jù)提供給用戶,該模塊可根據(jù)具體的情況進行控制與調整。
整個系統(tǒng)的設計是在Linux的平臺上進行的,并且使用的軟件系統(tǒng)環(huán)境都是在64位以桌面應用為主的Ubuntu17.04券商提供的自由交易系統(tǒng)版本,并且在該系統(tǒng)中的語言開發(fā)環(huán)境主要是Java和C++為主體的腳本語言,而Web服務的結構與Hadoop的集群為主要計算的部分,并用Java進行語言的開發(fā)。
基于動態(tài)圖像特征檢索算法的軟件設計:
軟件設計采用的是直接面對檢索對象的一種算法,將動態(tài)圖像的處理分成圖像人工的注釋、圖像內容的特征、圖像基本的屬性以及圖像的數(shù)據(jù)源。圖像人工的注釋是對整個遠程分布式數(shù)據(jù)庫動態(tài)圖像的內容以文字的形式進行描述;圖像內容的特征是對原始圖像進行處理,并進行相應的匹配運算;圖像基本的屬性是將文件的種類、所占的內存、處理的日期以及一些其他的屬性信息存放在檢索對象的變量之中,通過指定的程序進行初始化的編輯;圖像的數(shù)據(jù)源指的是最原始的圖像,通過遠程分布式數(shù)據(jù)庫的建立,進行相應字段的索引。遠程分布式數(shù)據(jù)庫動態(tài)圖像信息加載的流程如圖3所示。
圖4 動態(tài)圖像信息加載的流程
由圖4可知:動態(tài)圖像的信息加載是一個重要的環(huán)節(jié)。檢索系統(tǒng)主要是對具有顏色模型的不同分量來對人類視覺感知的情況進行非均勻的量化,并有效的對維數(shù)進行矢量的壓縮,然后采用主元的分析方法將整個圖像進行降維,并研究通過主分量來解決多變量的方差結構的檢索方法。
1)顏色分量的方法。
顏色分量的方法是將顏色的數(shù)值對圖像的信息進行索引的方法,這種方法又被稱為拉普拉斯或者方向導數(shù)的方法,得出的結果就是與之相鄰的變化率,具體方法如下所示:
首先確定顏色數(shù)值的對數(shù):
i(a,b)=ln(r(a,b))
(1)
公式(1)中(a,b)為給定的點的對數(shù);r(a,b)為點(a,b)的L值。然后計算不同的卷積:
①拉普拉斯卷積:
i(a,b)Δ2?c(a,b)
Δ2={[p(a+1,b)-p(a,b)]-[p(a,b)-p(a-1,b)]}
+{[p(a,b+1)-p(a,b)]-[p(a,b)-p(a,b-1)]}
(2)
②方向導數(shù):
i(a,b)Δn=cn(a,b)
(3)
最后構造直方圖:
①拉普拉斯卷積:
(4)
②方向導數(shù)
(5)
2)主元的分析方法。
由上述(1)中得出的圖像特征的準確率還是比較高的,但是同時也產(chǎn)生了較高的維數(shù),為此,必須采用PCA的方法對圖像降維。首先設置{ai}ci=1作為一個圖像的集合,其中c為圖像集合中的若干個圖像的個數(shù),ai為圖像特征的向量。從整個集合中隨機的抽取出若干個樣本組成{ai1,ai2,…,aim}的訓練集合,那么樣本的平均值n以及協(xié)方差Q的表達式如下所示:
(6)
(7)
(8)
設yi,i=1,2,…,m作為協(xié)方差Q的特征向量,對應的特征值為βi,因此可得:
Q=AATyi=βiyi
(9)
根據(jù)上述的計算步驟得出協(xié)方差Q的特征數(shù)值與特征的向量,那么計算出來的特征向量就是根據(jù)相應的特征值按照大小的降序順序進行排列,并將得出的特征值按照組列的形式變換成矩陣:
yi=QTai
(10)
公式(10)中的yi即為動態(tài)圖像檢索的特征向量。
為了驗證遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)設計的合理性,進行了如下的實驗。隨著社會的不斷發(fā)展,多元化的社會環(huán)境也逐漸成熟,人們對于數(shù)據(jù)庫的動態(tài)圖像信息檢索的性能要求也越來越嚴格。對于檢索性能的驗證主要從兩個方面進行實驗,分別是檢索的速度與檢索的精準程度。數(shù)據(jù)庫的動態(tài)圖像信息檢索的速度主要是由圖像的特征提取的匹配復雜程度所決定的;而動態(tài)圖像信息檢索的精準程度主要是由圖像的特征區(qū)分與匹配的算法所決定的。檢驗圖像完好率與檢索圖像準確率是目前檢驗數(shù)據(jù)庫的動態(tài)圖像信息檢索性能的主要指標,具體表達式如公式所示:
(11)
選取兩幅人臉表情的動態(tài)圖像、兩幅人體運動的圖像作為圖像信息檢索實驗的樣本,這些圖像均具有紋理譜特征,這種特征對圖像信息檢索實驗的影響如表5所示。
表5 紋理譜特征對圖像信息檢索實驗的影響
由表5可知:該特征并沒有影響動態(tài)圖像信息檢索的完好率與準確率,為此可以將特征忽略不計。
由上述的實驗過程,可以知道選取的圖像樣本可以忽略圖像的檢索的特征,因此,也不會對檢索的過程造成影響。傳統(tǒng)的數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)與遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)在檢驗圖像完好率與檢索圖像準確率方面進行了對比,如表5所示。
表6 傳統(tǒng)檢索系統(tǒng)與遠程分布式的檢索系統(tǒng)之間的對比
由表6可知:傳統(tǒng)的檢索系統(tǒng)在檢驗圖像完好率與檢索圖像準確率都比較差,人們對色彩感知相互一致,但是在對色彩的判定上具有一定的差距,傳統(tǒng)的圖像索引主要存在的問題就是對色彩特征的感知能力仍然不夠。
而檢索速度的方面兩個系統(tǒng)之間的對比情況如圖5所示。
由圖5可知,遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)與傳統(tǒng)的數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)相比,檢索的速度較快。
實驗結果證明:遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)具有分布性廣、通信良好以及穩(wěn)健性較強的優(yōu)點,作為具有完整的數(shù)據(jù)庫能夠將分布在各個結點上的圖像信息進行匯集,在邏輯上統(tǒng)一。該系統(tǒng)結構的檢驗圖像完好率與檢索圖像準確率較高,速度較快,適應分布式的管理模式對機構進行控制,在經(jīng)濟上的性能也比較優(yōu)越,可靠性與可用性較強,擴展性能極好,有益于多圖像的共同檢索。
動態(tài)圖像的檢索一直是我國研究的技術問題,無論是理論、方法還是技術都需要根據(jù)不同領域用戶提供的圖像來尋找一種適用于該領域圖像的檢索技術手段。由于圖像信息的多變,不能僅僅根據(jù)圖像的特征頻率就直接對圖像進行檢索,還需要通過經(jīng)驗的知識來判定圖像的大小,遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)正是綜合了上述的特點,并結合自身的分布式數(shù)據(jù)的優(yōu)勢進行圖像的檢索。
總之,遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)所涉及的領域較廣,發(fā)展的速度較快,不會受到時間與文獻的束縛,通過不斷的優(yōu)化,能夠將圖像數(shù)據(jù)庫分成3種主要的領域,分別是圖像的識別、圖像的處理以及數(shù)據(jù)庫,將三者的技術成果有效的結合起來,是未來的一個發(fā)展趨勢。遠程分布式數(shù)據(jù)庫動態(tài)圖像信息檢索系統(tǒng)擴展了傳統(tǒng)數(shù)據(jù)庫中技術的應用,為未來的圖像處理提供了有力的技術手段。
[1] 李 應, 陳秋菊. 基于優(yōu)化的正交匹配追蹤聲音事件識別[J]. 電子與信息學報, 2017, 39(1):183-190.
[2] 呂其兵, 張 曦, 駱德陽,等. 基于閃光聲音信息的鋼軌焊接接頭質量分析[J]. 焊接學報, 2016, 37(9):105-109.
[3] 張艷博, 于光遠, 田寶柱,等. 花崗巖破裂過程聲發(fā)射主頻多元前兆信息識別[J]. 采礦與安全工程學報, 2017(2):355-362.
[4] 李晴晴, 周長勝, 呂學強,等. 基于動態(tài)紋理基元的外觀設計專利檢索[J]. 微電子學與計算機, 2016, 33(3):25-31.
[5] 孫 震. 信息與技術的利用:創(chuàng)新知識與提升生活水平——從ASIS&T 2016年會論文看信息科學研究當前熱點與動態(tài)[J]. 圖書情報知識, 2017(3) :24-32.
[6] 韓正彪. 基于分布式認知的文獻數(shù)據(jù)庫用戶心智模型演進驅動因素研究[J]. 情報學報, 2017, 36(1):79-88.
[7] 陳小莉. 基于大數(shù)據(jù)的計算機數(shù)據(jù)挖掘技術在檔案管理系統(tǒng)中的研究應用[J]. 激光雜志, 2017(2):142-145.
[8] 陳 倩, 潘中良. 基于內容的服裝檢索系統(tǒng)中顏色特征提取算法的研究和改進[J]. 激光雜志, 2016(4):62-68.
[9] 翟奧博, 溫顯斌, 張 鑫. 基于改進雙樹復小波和灰度-梯度共生矩陣的紋理圖像檢索算法[J]. 計算機科學, 2017, 44(6):274-277.
[10] 劉 晙, 劉 丹. 基于組合特征檢索策略的圖像檢索技術研究[J]. 合肥工業(yè)大學學報:自然科學版, 2015(7):918-922.