胡皓勇
摘? 要:圖像搜索通常包含基于文本的搜索和基于圖像內(nèi)容的搜索,兩種圖像搜索技術(shù)各有優(yōu)劣。基于文本的圖像搜索技術(shù)的信息準(zhǔn)確性有待改進(jìn),而基于圖片內(nèi)容的圖像搜索技術(shù)無(wú)法有效保證信息的全面性。另外一方面,相比純文本,圖像處理算法具有較大的差異性,其更加復(fù)雜多變,使得圖像搜索過(guò)程更加復(fù)雜。為了解決兩個(gè)算法的不足,作者提出一種解決方案,即采取基于文本搜索為主,同時(shí)結(jié)合基于圖像內(nèi)容的混合搜索方式,吸納兩者的優(yōu)勢(shì),一方面使圖像搜索過(guò)程高效、迅速,另一方面也使搜索結(jié)果更加全面、準(zhǔn)確,并在此基礎(chǔ)上作進(jìn)一步研究和探索。
關(guān)鍵詞:文本;內(nèi)容;圖像;混合;搜索系統(tǒng)
中圖分類號(hào):TP75? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號(hào):2095-2945(2019)07-0121-02
Abstract: Image search usually includes text-based search and image-content-based search. the two image search technologies have their own advantages and disadvantages. The information accuracy of text-based image search technology needs to be improved, but the image search technology based on picture content cannot effectively ensure the comprehensiveness of information. On the other hand, compared with plain text, image processing algorithm has great differences, which is more complex and changeable, which makes the image search process more complex. In order to solve the shortcomings of the two algorithms, the author proposes a solution, that is, text-based search is adopted, and the hybrid search method based on image content is combined to absorb the advantages of the two. On the one hand, the image search process is efficient and rapid. On the other hand, it also makes the search results more comprehensive and accurate, and makes further research and exploration on this basis.
Keywords: text; content; image; mixing; search system
2018年8月,我國(guó)互聯(lián)網(wǎng)信息中心發(fā)布了第42次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,其對(duì)國(guó)內(nèi)互聯(lián)網(wǎng)行業(yè)發(fā)展作出了全面評(píng)估,數(shù)據(jù)顯示:截至2018年6月,我國(guó)網(wǎng)民規(guī)模為8.02億,上半年新增網(wǎng)民2968萬(wàn)人,較2017年末增加3.8%,互聯(lián)網(wǎng)普及率達(dá)57.7%。并且這一態(tài)勢(shì)仍在擴(kuò)張。
目前來(lái)看,網(wǎng)絡(luò)在現(xiàn)實(shí)生活中已變得觸手可及,人們可以借助互聯(lián)網(wǎng)與全球用戶進(jìn)行信息交流。在信息化時(shí)代,交互環(huán)節(jié)增多的同時(shí),數(shù)據(jù)量也爆發(fā)式增長(zhǎng),這使得信息搜索變得異常復(fù)雜。在該背景下,憑借列表查找的方式查找所需的內(nèi)容變得幾乎不可能,因此搜索引擎技術(shù)應(yīng)運(yùn)而生,并不斷發(fā)展。當(dāng)前,文本數(shù)據(jù)作為一種信息傳遞的載體,其優(yōu)勢(shì)性逐漸減弱,越來(lái)越多的數(shù)字圖像信息開始為人所用[1]。
近年來(lái),人們的信息交互方式更加多樣,各類影視、圖像信息也大幅增長(zhǎng),用戶如何有效定位到自己需要的信息,值得進(jìn)入深入研究。盡管影視、音頻等多媒體信息泛濫,但無(wú)法否認(rèn)的是,圖像和文字在信息傳遞過(guò)程中仍然是主要載體。圖像可以直觀形象地向人們傳遞其內(nèi)在含義,并且圖像內(nèi)容易于理解,用戶接收信息速度快,效率高。為有效緩解這一困境,我們引進(jìn)了圖像搜索引擎,它均有不同于文本搜索的搜索技術(shù)和多樣化的標(biāo)注方式,能夠幫助人們迅速找到所需的網(wǎng)頁(yè)圖像[2]。
隨著網(wǎng)絡(luò)科技的深入推進(jìn),圖像的信息交流作用將逐漸增強(qiáng),優(yōu)化圖像搜索技術(shù)也將推動(dòng)我國(guó)互聯(lián)網(wǎng)的縱深發(fā)展。近年來(lái),諸多學(xué)者紛紛投入到該領(lǐng)域研究中,并取得了豐碩成果。國(guó)內(nèi)外關(guān)于該方向的研究現(xiàn)狀如下:
1 基于文本的圖像搜索技術(shù)研究現(xiàn)狀
在各類文本信息的標(biāo)注方面,許多學(xué)者也提出了不同的觀點(diǎn)。圖像上下文信息主要包括以下幾種類型:網(wǎng)頁(yè)標(biāo)題、標(biāo)題文本、圖像標(biāo)題、圖像名、標(biāo)題標(biāo)記、圖像標(biāo)記等。對(duì)于各類文本信息的標(biāo)注,學(xué)者們提出了以下主要研究思路:
(1)在進(jìn)行文本數(shù)據(jù)的候選詞選取時(shí),應(yīng)遵循規(guī)則策略。通常而言,若某一詞語(yǔ)在文章主題表達(dá)中的作用越大,其在文本出現(xiàn)的次數(shù)就越多,權(quán)重就越大。
(2)對(duì)不同的文本類型進(jìn)行分析時(shí),應(yīng)考慮到圖像所處位置和其標(biāo)簽的干擾。
(3)當(dāng)借助DOMTree技術(shù)進(jìn)行文本信息的獲取時(shí),應(yīng)結(jié)合候選詞權(quán)重及類型有所區(qū)分,并進(jìn)一步構(gòu)建加權(quán)回歸模型。
現(xiàn)有的研究成果主要集中于對(duì)圖像信息標(biāo)注的研究。在進(jìn)行圖像文本分析時(shí),許多學(xué)者僅考慮到圖像關(guān)聯(lián)信息所處位置的影響,而鮮有考慮這些信息的權(quán)重大小以及其在文本中的重要程度。