楊 萍, 李軼鯤, 胡玉璽, 楊樹文,4
(1.蘭州交通大學(xué)測繪與地理信息學(xué)院,蘭州 730070; 2.甘肅省地理國情監(jiān)測工程實(shí)驗(yàn)室,蘭州 730070;3.中煤地西安地圖制印有限公司,西安 710054; 4.甘肅省遙感重點(diǎn)實(shí)驗(yàn)室,蘭州 730000)
融合相容粒理論的遙感圖像檢索
楊 萍1,2, 李軼鯤1,2, 胡玉璽3, 楊樹文1,2,4
(1.蘭州交通大學(xué)測繪與地理信息學(xué)院,蘭州 730070; 2.甘肅省地理國情監(jiān)測工程實(shí)驗(yàn)室,蘭州 730070;3.中煤地西安地圖制印有限公司,西安 710054; 4.甘肅省遙感重點(diǎn)實(shí)驗(yàn)室,蘭州 730000)
為了提高遙感圖像檢索的效率和準(zhǔn)確性,提出了一種融合相容粒計(jì)算模型的遙感圖像檢索方法。首先,根據(jù)相容粒理論定義了區(qū)域相容粒、圖像相容粒和區(qū)域相容粒信息表等相關(guān)概念,將遙感圖像?;?; 然后,計(jì)算出圖像區(qū)域相容粒的相似度; 最后,結(jié)合綜合區(qū)域匹配算法,提出融合相容粒理論的遙感圖像相似性度量算法,并利用IKONOS影像進(jìn)行對比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,融合相容粒理論的檢索算法能夠提高遙感圖像檢索的查準(zhǔn)率,與綜合區(qū)域匹配算法相比,本文算法查準(zhǔn)率提高了12.08%,基本滿足用戶需求。
遙感圖像檢索; 相容粒理論; 綜合區(qū)域匹配算法; 相似性度量模型; 查準(zhǔn)率
近年來,隨著對地觀測系統(tǒng)的發(fā)展,遙感數(shù)據(jù)量快速增長,形成GB級,TB級和PB級的發(fā)展趨勢,常規(guī)遙感圖像的存儲、管理以及檢索方式已經(jīng)不能滿足需要,導(dǎo)致用戶無法快速、準(zhǔn)確查找到所需的遙感圖像,遙感圖像檢索成為國內(nèi)外研究的熱點(diǎn)。傳統(tǒng)基于文本的圖像檢索方法主要是通過圖片的名稱、關(guān)鍵字來實(shí)現(xiàn)查詢功能[1],把對圖像的檢索轉(zhuǎn)化為對文本的檢索,目前已經(jīng)發(fā)展得相對成熟,但此方法需要耗費(fèi)大量的人力資源對圖像進(jìn)行人工標(biāo)注,并且?guī)в幸欢ǖ闹饔^性,無法滿足用戶的需求。20世紀(jì)90年代,Smeulders等[2]提出了基于內(nèi)容的圖像檢索技術(shù)(content-based image retrieval,CBIR),允許用戶給出示例圖像或目標(biāo)的形狀、顏色和紋理等視覺特征,自動(dòng)提取圖像庫的特征與之匹配進(jìn)行檢索,成為了圖像檢索技術(shù)研究的重點(diǎn)。本研究提出的基于內(nèi)容的圖像檢索算法擬依據(jù)粒計(jì)算相容粒理論來設(shè)計(jì)一個(gè)全新的相似性度量模型。
粒計(jì)算是人工智能領(lǐng)域興起的一種智能算法,是當(dāng)前計(jì)算智能研究領(lǐng)域中模擬人類思維和解決復(fù)雜問題的新方法。國內(nèi)外學(xué)者已利用該方法在圖像檢索領(lǐng)域進(jìn)行了大量的研究,杜根遠(yuǎn)[3]提出一種基于粒計(jì)算的相似性度量模型,為圖像檢索在粒計(jì)算理論中提供新思路; 李雙群等[4]結(jié)合Canny邊緣檢測算子提出一種基于相容粒模型的彩色圖像檢索算法,具有良好的檢索精度; Xu等[5]提出利用粒計(jì)算商空間理論對顏色特征進(jìn)行多粒度劃分,實(shí)現(xiàn)圖像檢索,檢索效果比單特征檢索有明顯的提升; Ma等[6]利用粒計(jì)算貼近度理論提出一種基于顏色特征的圖像檢索算法,相比較于傳統(tǒng)的顏色直方圖算法更接近于人類的視覺要求; Fei等[7]利用粒計(jì)算商空間理論,提出一種分層的多粒度的唐卡圖像檢索方法,該方法有效地提高了檢索效率。但上述算法都是針對自然圖像,由于遙感圖像具有尺度大、主題不明確、多時(shí)相、語義豐富和海量存儲等特點(diǎn),導(dǎo)致針對自然圖像的研究成果不能被直接應(yīng)用于遙感圖像檢索中。
由于綜合區(qū)域匹配算法(integrated region matching,IRM)[8]具有旋轉(zhuǎn)和平移不變性,能夠有效地彌補(bǔ)圖像不準(zhǔn)確分割造成的檢索錯(cuò)誤。本文通過研究遙感圖像區(qū)域相容粒的相似度并結(jié)合IRM算法來構(gòu)建融合相容粒理論模型的遙感圖像相似性度量算法,為遙感數(shù)據(jù)庫檢索提供一種基于粒計(jì)算的新方法,并利用同一幅影像進(jìn)行對比實(shí)驗(yàn),驗(yàn)證2種算法的檢索效果。
1)定義1: 集合上的相容函數(shù)τ[9-10]為
τ:U×U→[0,1],
(1)
式中相容函數(shù)τ滿足下面性質(zhì)
?x,y∈Uτ(x,x)=1且τ(x,y)=τ(y,x) 。
(2)
2)定義2: 對于一個(gè)閾值為p∈[0,1]的相容函數(shù)τ定義為[9-10]
τp={〈x,y〉|τ(x,y)≥p},
(3)
式中τp稱為參數(shù)化的相容關(guān)系。
3)定義3: 與τp相關(guān)的領(lǐng)域函數(shù)[9-10]定義為
nτp(u)={u′∈Uτp(u,u′)成立} 。
(4)
4)定義4: 一個(gè)相容粒度空間TS[9-10]定義為一個(gè)三元組,即
TS=〈U,τ,p〉,
(5)
式中:U為一個(gè)非空集,稱為TS的域;τ為集合U上的相容函數(shù);p為相容參數(shù),p∈[0,1]。
5)定義5: 相容粒度空間模型中的粒稱為相容粒,用一個(gè)三元組來描述[9-10],即
G=(IG,EG,FG),
(6)
式中:IG為相容粒G的內(nèi)涵;EG為相容粒G的外延;FG為內(nèi)涵和外延之間的轉(zhuǎn)換函數(shù)。
采用相容粒的粒化與粒的計(jì)算2大特征,將其應(yīng)用到遙感圖像檢索領(lǐng)域,提出一種融合相容粒模型[11]的遙感圖像檢索算法。該算法包括2部分內(nèi)容: ①定義了圖像的相容粒?;嚓P(guān)概念,主要包括基本粒、區(qū)域相容粒、圖像相容粒、相容粒知識庫、區(qū)域相容粒信息表和區(qū)域相容粒相似度等; ②構(gòu)建圖像相容粒的相似性度量模型,在該模型中,首先根據(jù)區(qū)域相容粒等相關(guān)定義計(jì)算區(qū)域相容粒的相似度,然后結(jié)合IRM算法,計(jì)算出圖像相容粒的相似度,從而獲得最終的檢索結(jié)果。
定義遙感圖像規(guī)則分割之后的子圖像為不可分割的最小粒子,稱為基本粒; 根據(jù)子圖像提取的顏色特征進(jìn)行聚類,聚類結(jié)果形成的區(qū)域粒子,稱為區(qū)域粒; 通過區(qū)域粒構(gòu)成的整幅圖像為圖像粒。結(jié)合?;^程的相容粒理論定義如下。
1)定義6: 區(qū)域相容粒RG表示為
RG={IG,EG,FG},
(7)
IG=∪{vi},
(8)
EG=O,
(9)
式中:IG為RG內(nèi)涵;vi為基本粒;EG為RG外延;O表示圖像區(qū)域;FG為IG與EG之間的轉(zhuǎn)換函數(shù),為非負(fù)整數(shù)值,其含義為vi在區(qū)域O中所占的面積比例。
2)定義7: 圖像相容粒DG表示為
(10)
(11)
(12)
3)定義8: 相容粒知識庫P[12]定義為三元組,即
P=(S,DS,RDS),
(13)
S={d1,d2,…,di,…dm},
(14)
DS={DG1,DG2,…,DGi,…,DGm},
(15)
(16)
4)定義9: 區(qū)域相容粒信息表RS,給定圖像集合S,則RS定義為四元組,即
RS=(X,Y,U,f),
(17)
X={x1,x2,…,xN},
(18)
Y=∪ai,(i=1,2,…,M),
(19)
式中:X為所有區(qū)域相容粒外延的非空集合;xi(1≤i≤N)為圖像區(qū)域;N為區(qū)域相容粒外延的總數(shù);Y為屬性集合;ai(ai∈Y)為一個(gè)基本粒;M為所有屬性的總數(shù);U為屬性值的集合,表示某區(qū)域相容粒中近似擁有某屬性ai的程度;f為X×Y→U的映射函數(shù),為一個(gè)數(shù)值函數(shù)。定義某特定基本粒ai(ai∈Y)在區(qū)域相容粒RG中的面積比例大小記為Val(RGi,ai)。
5)定義10: 區(qū)域相容粒的相似度SinRG計(jì)算公式表示為
(20)
式中:RG1和RG2分別為2個(gè)區(qū)域相容粒;Val(x1,ai)和Val(x2,ai)分別為在RS中區(qū)域RG1和RG2在屬性上ai的取值,i=1…M。
為了計(jì)算圖像相容粒的相似性,首先根據(jù)RS屬性值,計(jì)算出SinRG,再結(jié)合IRM算法,得出圖像相容粒的相似度,從而獲得最終的檢索結(jié)果。
2.2.1 IRM算法
IRM算法通過綜合計(jì)算圖像中所有區(qū)域的相似度來確定圖像的整體相似度,該算法優(yōu)勢在于對圖像可能存在的錯(cuò)誤分割具有很強(qiáng)的魯棒性[8]。假設(shè)圖像1和圖像2分別由集合R1=(r1,r2,…,rl)和R2=(r′1,r′2,…,r′w)來表示,rz和r′v分別表示圖像的分割區(qū)域z和v的特征向量,1≤z≤l,1≤v≤w。記rz和r′v之間的距離為d(rz,r′v),簡寫為dz,v。
計(jì)算區(qū)域集合R1和R2之間的距離d(R1,R2)時(shí),先匹配2幅圖像中的所有區(qū)域,計(jì)算出所有區(qū)域之間的距離dz,v,并根據(jù)區(qū)域之間的顯著性因子Sz,v,給予相應(yīng)的權(quán)重。Sz,v表示區(qū)域rz和r′v之間的匹配程度,則顯著性矩陣為
S={Sz,v,1≤z≤l,1≤v≤w},
(21)
故2幅圖像之間的距離定義為
(22)
關(guān)于Sz,v及IRM算法的具體計(jì)算流程請參考文獻(xiàn)[8]。
2.2.2 基于圖像相容粒遙感圖像相似性度量算法
由于2幅圖像的相似度越大,距離越小,反之,相似度越小,距離越大,可將IRM算法與圖像相容粒理論融合構(gòu)建遙感圖像相似性度量。設(shè)DG′和RG′i(i=1,2,…,N)分別為圖像d′的圖像相容粒和區(qū)域相容粒,DG和RGj(j=1,2,…,M)分別為知識庫中圖像d的圖像相容粒和區(qū)域相容粒,RG′i和RGj之間的距離DisRG(RG′i,RGj)表達(dá)式為
DisRG(RG′i,RGj)=1-SinRG(RG′i,RGj) 。
(23)
在IRM算法中,2幅遙感圖像之間的距離是由顯著性因子和區(qū)域之間的距離來確定的。根據(jù)式(22),圖像相容粒的距離可表示為
(24)
為了驗(yàn)證本文算法的可行性,利用MATLAB語言編寫原型系統(tǒng)進(jìn)行實(shí)驗(yàn)。使用28張IKONOS多光譜衛(wèi)星圖像,用藍(lán)光、綠光和紅光3個(gè)波段合成標(biāo)準(zhǔn)真彩色圖像,每一幅圖像被分割成256像素×256像素的子圖像,2幅子圖像的最大重復(fù)度為50%,數(shù)據(jù)庫中共保留12 000幅子圖像,共覆蓋近4萬km2的各種地表覆蓋類型,包含農(nóng)田、巖石、城市、植被、水體和裸土等。
在對圖像進(jìn)行粒化時(shí),借鑒文獻(xiàn)[13]的研究方法,首先把遙感圖像分割成32像素×32像素的子圖像,即本文定義的基本粒,以子圖像的64維顏色直方圖作為低層特征向量,利用K-means算法依據(jù)顏色特征向量對子圖像進(jìn)行聚類,形成區(qū)域粒,并將聚類結(jié)果作為特征數(shù)據(jù)存入特征數(shù)據(jù)庫。在檢索過程中,用戶提交一幅查詢圖像,系統(tǒng)會自動(dòng)對查詢圖像進(jìn)行相應(yīng)的處理,獲得圖像的特征數(shù)據(jù)。然后,根據(jù)圖像相容粒相似性度量算法計(jì)算相似性,獲取檢索結(jié)果。檢索模型流程如圖1所示。
圖1 檢索模型流程Fig.1 Flow chart of retrieval model
數(shù)據(jù)庫中包含6種語義的圖像,對每種語義分別選取10幅查詢圖像進(jìn)行檢索,取檢索結(jié)果的前10幅圖像計(jì)算準(zhǔn)確率,以10次實(shí)驗(yàn)的準(zhǔn)確率平均值作為該語義最終檢索的查準(zhǔn)率,并和IRM算法檢索結(jié)果進(jìn)行對比。
2種檢索算法的查準(zhǔn)率如表1所示。在不同語義下,本文算法的查準(zhǔn)率都高于IRM算法,并且本文算法平均查準(zhǔn)率為0.79,比IRM算法提高了12.08%,由此可見,本文算法在遙感圖像檢索中查準(zhǔn)率有了顯著提高。
表1 2種算法檢索結(jié)果查準(zhǔn)率Tab.1 Precision of two retrieve algorithms (%)
以一幅植被影像為例,分別利用2種檢索算法,獲取相似度前10的檢索影像,如表2所示。
(a)查詢影像 (b)前10幅IRM算法檢索影像(c)前10幅本文算法檢索影像
圖22種檢索算法比較
Fig.2Comparisonoftworetrievalalgorithms
圖2中檢索結(jié)果按照相似度從左往右,從上往下排序。根據(jù)檢索結(jié)果可以發(fā)現(xiàn),一幅植被影像的前10幅檢索結(jié)果中,雖然第一幅檢索結(jié)果均為正確影像,但在IRM算法檢索的其他9幅影像效果明顯差于本文算法,其檢索出了含有城市的錯(cuò)誤影像,使得IRM算法的平均查準(zhǔn)率較低,而本文算法較高。
本文通過對相容粒理論與綜合區(qū)域匹配算法的研究,提出了一種融合相容粒模型的遙感圖像檢索算法。該算法首先定義了相容粒的有關(guān)概念并對遙感圖像的?;^程進(jìn)行闡述,然后在區(qū)域相容粒相似度計(jì)算的基礎(chǔ)上,結(jié)合綜合區(qū)域匹配算法,得到了圖像相容粒相似性度量算法,并通過實(shí)驗(yàn)驗(yàn)證,得出如下結(jié)論:
1)本文算法將相容粒理論成功地應(yīng)用到遙感圖像檢索領(lǐng)域并取得了理想的效果,實(shí)驗(yàn)結(jié)果也證明了該算法的有效性。
2)將相容粒理論和綜合區(qū)域匹配算法相結(jié)合,相較于綜合區(qū)域匹配算法,其檢索精度得到了明顯提高,平均查準(zhǔn)率提升了12.08%。
3)本文算法也存在一定的局限性,僅對IKONOS遙感圖像庫進(jìn)行了實(shí)驗(yàn)驗(yàn)證,若數(shù)據(jù)庫有其他空間分辨率不同、輻射特征不同的衛(wèi)星圖像數(shù)據(jù),查準(zhǔn)率會不會有如此大的提升,還有待進(jìn)一步驗(yàn)證。在下一步工作中,將尋找其他高空間分辨率的衛(wèi)星數(shù)據(jù)庫以及混合衛(wèi)星數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn)驗(yàn)證,以進(jìn)一步評價(jià)本文算法的檢索效果。
[1] Wang M,Song T Y.Remote sensing image retrieval by scene semantic matching[J].IEEE Transactions on Geoscience and Remote Sensing,2013,51(5):2874-2886.
[2] Smeulders A W M,Worring M,Santini S,et al.Content-based image retrieval at the end of the early years[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(12):1349-1380.
[3] 杜根遠(yuǎn).海量遙感圖像內(nèi)容檢索關(guān)鍵技術(shù)研究[D].成都:成都理工大學(xué),2011.
Du G Y.Study on the Key Technology of Large-Scale Content Based Remote Sensing Image Retrieval[D].Chengdu:Chengdu University of Technology,2011.
[4] 李雙群,徐久成,張靈均,等.基于相容粒的彩色圖像檢索算法[J].廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,29(3):173-178.
Li S Q,Xu J C,Zhang J L,et al.Color image retrieval based on tolerance granules[J].Journal of Guangxi Normal University(Natural Science Edition),2011,29(3):173-178.
[5] Xu X L,Zhang L B,Yu Z Z,et al.Image retrieval using multi-granularity color features[C]//Proceedings of International Conference on Audio,Language and Image Processing.Shanghai:IEEE,2008:1584-1589.
[6] Ma Y Y,Wang C,Xu J C.Image retrieval system based on color feature of granular computing[C]//Proceedings of the 2010 2nd International Workshop on Intelligent Systems and Applications.Wuhan:IEEE,2010:1-3.
[7] Fei X,Liu C S.Multi-granular method for retrieving Thangka images[C]//Proceedings of 2014 International Conference on Progress in Informatics and Computing(PIC).Shanghai:IEEE,2014:46-50.
[8] Wang J Z,Li J,Wiederhold G.SIMPLIcity:Semantics-sensitive integrated matching for picture libraries[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,23(9):947-963
[10] 孟 軍.相容粒計(jì)算模型及其數(shù)據(jù)挖掘研究[D].大連:大連理工大學(xué),2012.
Meng J.Tolerance Granular Computing Model and Its Research on Data Mining[D].Dalian:Dalian University of Technology,2012.
[11] 鄭 征.相容粒度空間模型及其應(yīng)用研究[D].北京:中國科學(xué)院研究生院(計(jì)算技術(shù)研究所),2006.
Zheng Z.Tolerance Granular Space and Its Applications[D].Beijing:Chinese Academy of Science(Institute of Computing Technology),2006.
[12] 劉 韜,李向軍,邱桃榮,等.一種基于相容粒計(jì)算模型的文章相似度計(jì)算方法[J].廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,28(3):135-139.
Liu T,Li X J,Qiu T R.An approach to computing similarity degree between Chinese articles based on tolerance granular computing model[J].Journal of Guangxi Normal University(Natural Science Edition),2010,28(3):135-139.
[13] Li Y K,Bretschneider T R.Semantic-sensitive satellite image retrieval[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(4):853-860.
Remotesensingimageretrievalbasedontolerancegranularcomputingtheory
YANG Ping1,2, LI Yikun1,2, HU Yuxi3, YANG Shuwen1,2,4
(1.FacultyofGeomatics,LanzhouJiaotongUniversity,Lanzhou730070,China; 2.GansuProvincialEngineeringLaboratoryforNationalGeographicStateMonitoring,Lanzhou730070,China; 3.Xi’anMappingandPrintingCompanyofARSC,Xi’an710054,China; 4.GansuProvinceKeyLaboratoryofRemoteSensing,Lanzhou730000,China)
In order to improve efficiency and accuracy of remote sensing image retrieval, this paper proposes a remote sensing image retrieval approach based on granular computing model. Firstly, according to the tolerance granular computing theory, a series of concepts are defined, such as region tolerance granule, image tolerance granule and regional tolerance granular information table, and remote sensing images are granulated. Secondly, the region tolerance granular similarity is calculated. Finally, the remote sensing image similarity model is built combining tolerance granular computing and image integrated region matching algorithm. Using IKONOS data, the authors verified the two retrieval algorithms. The experimental results show that the precision of proposed approach is increased by 12.08% in comparison with original integrated region matching algorithm. Therefore, it can be concluded that the proposed approach can meet the users’ requirements.
remote sensing image retrieval; tolerance granular computing; integrated region matching; similarity measure model; precision
10.6046/gtzyyg.2017.04.08
楊萍,李軼鯤,胡玉璽,等.融合相容粒理論的遙感圖像檢索[J].國土資源遙感,2017,29(4):43-47.(Yang P,Li Y K,Hu Y X,et al.Remote sensing image retrieval based on tolerance granular computing theory[J].Remote Sensing for Land and Resources,2017,29(4):43-47.)
TP 751.1
A
1001-070X(2017)04-0043-05
2016-04-12;
2016-06-16
甘肅省高等學(xué)校基本科研業(yè)務(wù)費(fèi)項(xiàng)目“基于空間關(guān)系敏感的高分辨率衛(wèi)星圖像檢索技術(shù)研究”(編號: 213049)、甘肅省科技計(jì)劃項(xiàng)目“面向?qū)ο蟮母叻直媛蔬b感影像滑坡自動(dòng)提取方法研究”(編號: 1506RJZA070)、“基于GIS和RS的城市土地利用動(dòng)態(tài)演化與模擬研究”(編號: 148RJZA028)、甘肅省高等學(xué)??蒲许?xiàng)目“國產(chǎn)高分辨率遙感影像高大地物陰影檢測算法研究”(編號: 2015A-049)、甘肅省遙感重點(diǎn)實(shí)驗(yàn)室(寒旱所)開放基金項(xiàng)目“中國高分系列影像地物陰影檢測與補(bǔ)償算法研究”和蘭州市人才創(chuàng)新創(chuàng)業(yè)項(xiàng)目“蘭州市降雨誘發(fā)滑坡預(yù)警系統(tǒng)”(編號: 2015-RC-28)共同資助。
楊 萍(1993-),女,碩士研究生,主要從事遙感圖像檢索技術(shù)研究。Email: 1480319601@qq.com。
李軼鯤(1978-),男,博士,副教授,主要從事衛(wèi)星圖像檢索領(lǐng)域的研究。Email: liyikun2003@hotmail.com。
(責(zé)任編輯:陳理)