滕沖 王穎
摘 要:數(shù)字圖像的數(shù)量在飛速增長,如何通過搜索引擎從海量的圖像中準(zhǔn)確、快速地搜索到所需圖像,已成為領(lǐng)域內(nèi)迫切需要解決的問題?;趦?nèi)容的圖像檢索近年來已成為圖像檢索領(lǐng)域的研究熱點(diǎn),本文將從CBIR主要技術(shù)分支、全球?qū)@暾埩?地域分布、國內(nèi)申請人分布及基于IPC分類號的國內(nèi)CBIR技術(shù)研究方向分析幾個(gè)方面對CBIR技術(shù)發(fā)展態(tài)勢進(jìn)行淺析。
關(guān)鍵詞:CBIR;圖像檢索;專利
1 CBIR主要技術(shù)分支及技術(shù)演變
1.1 基于內(nèi)容的圖像檢索
基于內(nèi)容的圖像檢索(Content-Based Image Retrieval,CBIR),其研究涉及認(rèn)知科學(xué)、人工智能、模式識別、圖像處理、信息檢索等多個(gè)領(lǐng)域,簡化的圖像內(nèi)容的層次模型一般分為三層:第一層為原始數(shù)據(jù)層,即圖像的原始像素點(diǎn);第二層為物理特征層,反應(yīng)了圖像內(nèi)容的底層物理特征,如顏色、紋理、形狀和輪廓等;第三層為語義特征層,是人們對圖像內(nèi)容概念級的反應(yīng),一般是對圖像內(nèi)容的文字性描述。為便于用戶更靈活、更有效地表達(dá)檢索要求、提高檢索準(zhǔn)確率,提出采用組合特征檢索,即可以在顏色、紋理、形狀等集中查詢特征中選擇兩種或兩種以上的特征進(jìn)行組合檢索。該檢索方法可分為兩種情況,一種是異步組合檢索,另一種是同步組合檢索。
1.2 基于語義的圖像檢索
基于內(nèi)容的圖像主要僅利用了圖像的底層視覺特征(如顏色、紋理、形狀)進(jìn)行檢索,但人們判斷圖像的相似度更多的是根據(jù)圖像的含義。為了克服基于簡單視覺特征的圖像檢索方法的不足,人們提出了基于語義的圖像檢索方法?;谡Z義的圖像檢索需要解決兩個(gè)主要問題:一是必須提供高層語義的描述方式;二是必須有將底層圖像視覺特征映射到高層語義的方法。語義圖像檢索中的關(guān)鍵技術(shù)是如何獲取圖像的語義信息。圖像語義獲取方法大致分為3種:(1)利用系統(tǒng)知識的語義提?。唬?)基于系統(tǒng)交互的語義生成;(3)基于外部信息的語義提取。
1.3 基于知識的圖像檢索系統(tǒng)
基于知識的圖像檢索系統(tǒng),將人工智能領(lǐng)域的基于知識的處理方法引入到圖像處理領(lǐng)域,通過對圖像理解、知識表達(dá)、機(jī)器學(xué)習(xí),并結(jié)合專家和用戶的先驗(yàn)知識,建立圖像知識庫實(shí)現(xiàn)對圖像數(shù)據(jù)庫的智能檢索?;谥R的圖像檢索方法主要涉及自然語言理解、專家系統(tǒng)、知識表達(dá)和機(jī)器學(xué)習(xí)等人工智能的主要研究領(lǐng)域。
2 全球?qū)@暾埩?地域分布
通過在中外文專利庫中檢索到的數(shù)據(jù),基于CBIR相關(guān)專利在全球?qū)@暾埩亢椭饕暾埖赜蚍植嫉姆治觥?/p>
2.1 全球申請量趨勢分析
下圖1所示是1999~2015年基于內(nèi)容的圖像檢索領(lǐng)域申請量趨勢統(tǒng)計(jì)數(shù)據(jù),其中紅色線表示國內(nèi)申請量的變化情況,藍(lán)色線表示國際申請量的變化情況。從顯示的數(shù)據(jù)看,不論是在國際還是國內(nèi),該領(lǐng)域的申請量都是逐年增長,且繼續(xù)呈現(xiàn)增長態(tài)勢。從2006年,該技術(shù)領(lǐng)域的申請量開始有快速的增長,說明此段時(shí)間,在基于內(nèi)容的圖像檢索領(lǐng)域相關(guān)技術(shù)得到了快速的發(fā)展,相關(guān)技術(shù)手段和算法日趨成熟。對于國內(nèi)申請來說,申請量也是穩(wěn)步增長,預(yù)計(jì)未來幾年的申請量仍處于增長趨勢,但增長率會有所下降,這與相關(guān)技術(shù)的日趨成熟和難度的增加一定關(guān)系。
2.2 全球?qū)@暾埖赜蚍植?/p>
由下圖2柱狀圖所示,截止到2015年,美國、日本、中國在這一技術(shù)領(lǐng)域的申請量位居前三位,其申請量分別為1345、1110、806,美國仍舊是該領(lǐng)域的技術(shù)強(qiáng)國,他們在該領(lǐng)域起步較早,且申請人大部分是大公司如IBM、Virage等企業(yè),其對圖像檢索的系統(tǒng)設(shè)計(jì)較成熟和深入。日本緊隨其后,對該領(lǐng)域也有較多的申請,中國在國際申請量中排名第三,超過韓國、歐洲等國家。雖然中國在該領(lǐng)域起步晚于美國,但在2000之后,中國開始在該領(lǐng)域的申請量逐年增加,得益于國家政策及科技專項(xiàng)的扶持,高校和科研院所對圖像檢索領(lǐng)域中涉及的算法有著深入的研究,由前圖1的曲線也可以看出,中國申請量還處于增長態(tài)勢,說明還有大量的申請人對該領(lǐng)域的技術(shù)進(jìn)行進(jìn)一步的研究和探索。
3 國內(nèi)重要申請人分布
如下圖3所示為該技術(shù)領(lǐng)域中申請量排名前十位的申請人。
由上圖3的統(tǒng)計(jì)數(shù)據(jù)顯示,在前十位申請人中,國內(nèi)申請人提交的申請數(shù)量最多,高校申請占7位,外國企業(yè)占2位,科研機(jī)構(gòu)占一位,其中排名靠前的主要是高校和科研院所,包括有浙江大學(xué)、中國科學(xué)院、上海交通大學(xué)、北京大學(xué)等等。由此可見,該技術(shù)在國內(nèi)高校、研究院研究較為廣泛,較多是從算法改進(jìn)角度增強(qiáng)檢索的準(zhǔn)確性和效率。
4 基于IPC分類號的國內(nèi)CBIR技術(shù)研究方向分析
為了進(jìn)一步了解基于內(nèi)容的圖像檢索技術(shù)分布,對于檢索到的專利文獻(xiàn)按照IPC分類進(jìn)行整理,統(tǒng)計(jì)得出出現(xiàn)頻次前5位的IPC分類號,分布如下圖4所示。
基于內(nèi)容的圖像檢索專利申請中,G06F17/30分類號的申請量最大,說明對于圖像的檢索技術(shù)是該領(lǐng)域的關(guān)鍵技術(shù),對于檢索相關(guān)技術(shù)的研究是很是活躍,位于第二、三位的是G06K9/46圖像特征或特性的抽取和G06K9/62應(yīng)用電子設(shè)備進(jìn)行識別的方法或裝置,可見對圖像特征的選取、提取、處理是圖像檢索是否準(zhǔn)確的核心所在;同時(shí),隨之研究通過電子設(shè)備實(shí)現(xiàn)圖像的識別方法或裝置也是本領(lǐng)域的研究重點(diǎn),還有一部分是對電子設(shè)備中的識別基準(zhǔn)的研究,涉及分類號G06K9/64和G06K9/66。
5 總結(jié)
雖然CBIR技術(shù)的諸多研究已經(jīng)取得了很大進(jìn)展,但仍存在很多不完善的地方,仍需要進(jìn)一步研究。對于CBIR的未來發(fā)展,如何進(jìn)一步提高圖像語義學(xué)習(xí)的準(zhǔn)確度,如何提高圖像檢索的速度,如何融合不同語義層次的圖像信息進(jìn)行檢索以及融合多種圖像特征以實(shí)現(xiàn)基于內(nèi)容的圖像檢索以滿足使用這的需求,仍將是圖像檢索領(lǐng)域的一個(gè)研究熱點(diǎn)。
參考文獻(xiàn)
[1]陳劍雄,張蓓.簡析圖像檢索系統(tǒng)中的CBIR技術(shù)[J].貴州學(xué)刊,2010,(2):47-48.
[2]黃祥林,沈蘭蓀.基于內(nèi)容的圖像檢索技術(shù)研究[J].電子學(xué)報(bào),2012,(7):1065-1071.
(作者單位:國家知識產(chǎn)權(quán)局專利局專利審查協(xié)作天津中心)