亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于文本的圖片搜索引擎的研究

        2014-06-20 05:59:34李超
        無線互聯(lián)科技 2014年2期
        關鍵詞:系統(tǒng)評價搜索引擎

        李超

        摘 要:當前圖片應用及其搜索技術越來越成熟,圖片檢索系統(tǒng)也隨之得到了廣泛的應用。文中基于上述背景首先對圖片信息的技術、文本圖片檢索系統(tǒng)進行了探討,接著對文本的圖片搜索引擎系統(tǒng)的評價完成了簡要概述,最后對組成系統(tǒng)架構以及系統(tǒng)應用測試進行了闡述,這一研究對信息檢索技術具有一定的參考價值。

        關鍵詞:圖片應用;搜索技術;文本圖片;搜索引擎;系統(tǒng)評價

        目前的Internet應用已經(jīng)取得了長足的發(fā)展,隨著網(wǎng)絡帶寬和終端計算能力的不斷增強,圖片被越來越多的應用于內容的表達和信息的承載。圖片的信息是指圖片的內容所表征的意義,這種的信息承載方式與傳統(tǒng)的文本的信息是不一樣的。由于文本的直觀性和簡單性,文本的信息即包含于本身;而圖片的信息可以通過圖片本身的內容傳達出來,也可以通過相關文字的描述傳達出來,于是圖片便有了雙重的信息載體。本文基于這一方向,對文本的圖片搜索引擎完成了探討,這一研究對信息檢索技術具有一定的參考價值。

        1 圖片信息的技術

        獲取圖片信息的技術可根據(jù)其來源的載體類型劃分為基于內容與基于文本這兩大類。前者是將單純的圖片內容作為分析與查找對象,而后者則是對與圖片有關的文字信息進行分析,其工作方式與以往的文本查找方式差不多。

        由于互聯(lián)網(wǎng)具有邊緣化這一特點,其信息組織相當自由,許多圖片資料根據(jù)方式與風格的差異被組織到各不相同的地方??筛鶕?jù)各種方式自由的對文字與圖片進行安排。然而統(tǒng)計數(shù)據(jù)顯示,許多組織方式存在著一些共同點,這些共同點也反應了我們在獲取信息方面的習慣。從而無限制的信息提取框架就有可能實現(xiàn)了?;ヂ?lián)網(wǎng)上的圖片與文本通常都是以組合的形式出現(xiàn)的,其中,HTML網(wǎng)頁是我們見的最多的一種組織形式,因此,許多與圖片相關的信息于可利用HTML挖掘來獲取。

        在網(wǎng)頁中,HTML網(wǎng)頁的應用是最為廣泛的,對搜索引擎而言,它也是一個最重要的信息獲取途徑。互聯(lián)網(wǎng)上擁有大量的HTML網(wǎng)頁和多媒體資源。

        在互聯(lián)網(wǎng)上,Web搜索引擎技術已得到了廣泛的引用,每日需抓取不計其數(shù)的HTML網(wǎng)頁,這是一個非常有價值的資源庫,然而,現(xiàn)在只有文本信息被用于Web搜索。若將資源庫中的價值充分挖掘出來,則可實現(xiàn)圖片、MP3以及Flash等多個搜索系統(tǒng)的建立。所以,我們就從通過對HTML網(wǎng)頁的充分利用來創(chuàng)建Web圖片搜索引擎開始。

        2 文本圖片檢索系統(tǒng)探析

        2.1 檢索系統(tǒng)應用涉及領域

        如今,圖片應用及其搜索技術越來越成熟,圖片檢索系統(tǒng)也隨之得到了廣泛的應用。Google圖片搜索等通用Web圖片搜索引擎是現(xiàn)在應用最為的廣泛的,它的服務對象是所有通用領域的用戶。不僅如此,圖片檢索還被應用于許多專業(yè)領域,常見的有:

        醫(yī)藥領域。大部分的醫(yī)學及相關專業(yè)由于要進行診斷和疾病檢查,故會涉及到可視信息資料,如:X光、掃描影像等。在相關信息的分析、傳輸以及存儲方面,圖片檢索技術發(fā)揮了重要作用,圖像處理是目前這個領域的研究重點,如:在腫瘤生長跟蹤方面采用了特征檢測。應用于這個領域的系統(tǒng)中已有成功的案例。

        圖形設計領域。重要現(xiàn)有的設計,對于這個領域的從業(yè)者而言,可獲得許多素材與靈感,而圖片檢索系統(tǒng)可方便工作的開展,此外,還便于用戶找到有特殊要求的作品。

        出版領域。圖片對于出版社、雜志社等單位十分重要,由于需求量較大,它們大多都有自己的圖片庫,傳統(tǒng)的存儲與查找所采取的歸類方式較多。這個領域的工作人員在查找和選擇圖片方面所需時間較長,而圖片檢索系統(tǒng)則可提高圖片查找和挑選的效率。

        此外,圖片檢索還被應用于建筑設計、天文地理以及犯罪取證等領域。

        2.2 用戶檢索方式技術

        與網(wǎng)頁檢索相比,圖片檢索在檢索方式上有較大區(qū)別。目前基本上只有關鍵字查詢這種網(wǎng)頁檢索系統(tǒng),因為在現(xiàn)有的考慮范圍內只有文字可以描述網(wǎng)頁內容。而用于描述圖片的除了文字之外,還有圖片自身。所以,圖片的檢索方式一般比較多,站在用戶檢索的角度來看,主要有目錄式檢索、關鍵字查詢、實例式檢索以及屬性式檢索四類。

        ⑴目錄式檢索。yahoo網(wǎng)頁搜索的特點也體現(xiàn)在了其圖片搜索上,對圖片實行了分類,用戶根據(jù)分類結構對查詢范圍進行細化。這種檢索方式下的很多分類工作需要人工完成,所以,其代價也是很大的。

        ⑵關鍵字查詢。目前,關鍵字檢索方式適用于大型圖片搜索引擎。用戶輸入與所需圖片有關的文字,系統(tǒng)根據(jù)文字與圖片的匹配度對與查詢詞相對應的圖片進行查找。具有較快的檢索速度是該檢索方式的最大優(yōu)勢,且基于文本的索引技術已發(fā)展到成熟階段。人工標引和自動提取是匹配信息與文字的兩種方法。

        人工標引在信息檢索方面具有較高的準確度。不足的是人工標引的工作量較大,對于海量系統(tǒng)而言很難實現(xiàn);另外,該方法具有較強的主觀性,幾乎無法將完整的信息反映出來,且有時所反映的圖片信息有誤。

        自動提取方法的準確度則沒有人工標引方法高。因為信息具有多種組織形式,且具體組織形式的確定存在較大難度,對與圖片相匹配的信息很難確定。該方法下的信息提取所采取的是啟發(fā)式規(guī)則,信息獲取所采用的是使用較多的模式,同時,信息的準確性可通過無用信息過濾等技術來加強。

        ⑶實例式檢索?,F(xiàn)在基于內容的圖片搜索引擎基本上都是實例式檢索。系統(tǒng)根據(jù)所提供的圖片或用戶所畫的基本形狀特征對類似的圖片進行查找。較為容易找到類似圖片是該方式的優(yōu)勢,而需要用戶提供圖片則是它的不足之處,因為這樣對系統(tǒng)不利?;趦热莸臋z索系統(tǒng)所提供的分類信息一般具有較大的粒度,如:風景、人物等。

        ⑷屬性式檢索。屬性式檢索方式常被用于規(guī)模較小的攝影等專業(yè)的圖片數(shù)據(jù)庫,用戶的檢索依據(jù)可以是圖片的某些外在特征,如:作者、拍攝日期等。這類數(shù)據(jù)庫的特點就是管理的統(tǒng)一性,信息通常很規(guī)范,可通過當前的關系數(shù)據(jù)庫來創(chuàng)建索引與檢索,過程比較簡單。

        3 檢索系統(tǒng)評價

        在檢索系統(tǒng)中,評價系統(tǒng)有兩個非常重要的指標,即查準率與查全率。查準率指的是查詢結果中有關文檔數(shù)與文檔總數(shù)之比;查全率指的是查找到的有關文檔數(shù)與所有文檔集合中有關文檔總數(shù)之比。若在特定的查詢中,D+、R、R+分別代表所有文檔集合中有關文檔數(shù)、查詢結果文檔集合以及結果文檔中有關文檔集合,那么,查準率與查全率則有以下定義:

        查準率:

        查全率:

        查準率與查全率在圖片檢索系統(tǒng)中是很難度量的,由于圖片和文本的有關評價帶有較強的主觀意識,故幾乎無法得到比較具體的統(tǒng)計結果。

        4 組成系統(tǒng)架構

        組成系統(tǒng)架構的組件較多,一個系統(tǒng)的功能流量也因此得到了體現(xiàn)。第一步就是由用戶將圖像名稱與上下文輸入到系統(tǒng),這樣有關列表圖像就生成了。各部分細節(jié)見下圖1。

        輸入界面前端應用程序設計:Eclipse編譯器為用戶提供了一個友好的界面,以便于用戶進行搜索與選擇,可通過部分上下文對人格圖片進行瀏覽,此外,還可查看一個或多個視圖模式的圖片。

        耶拿框架:集成本體和用戶界面已采用了耶拿框架l。許多上下文已通過本體語言查詢建立。以上查詢會由耶拿向推理機傳遞。完成推理后, Jena會將結果被發(fā)送回輸出接口。

        圖像庫和輸出接口:存儲庫中已保存了全部選定的圖片,檢索查詢結果輸出所對應的圖像的名稱是一樣的。用戶在主屏幕對所要查找的上下文進行輸入,圖像最后將在多個Windows操作系統(tǒng)中出現(xiàn)。

        5 文本圖片系統(tǒng)應用測試和結果

        我們對測試中采用本體的效果進行了評估。通過谷歌搜索引擎及測試關鍵字方法將個性各異的名字輸入到搜索框中,出現(xiàn)的結果很多,而大部分結果的關聯(lián)性并不大。我們在該系統(tǒng)中對同一查詢進行了測試,結果顯示效果要好于前者。采用精度、措施以及回憶等不同的方法對結果的進行比較,在不同的場景中,以語義為基礎的結果地位最高??偟膩碚f,在本文的實驗中,與關鍵字搜索相比,語義文本搜索更加便于操作。

        [參考文獻]

        [1]徐靜.圖像搜索引擎的進步與應用現(xiàn)狀分析[J].電子商務,2011,04:61-62.

        [2]吳江.多媒體搜索引擎創(chuàng)新比較研究[J].圖書館學研究,2012,05:75-79+70.

        [3]焦蕾,殷鋒社.圖像搜索引擎檢索模式分析與研究[J].電子設計工程,2012,05:132-134.

        [4]王晟,趙壁芳.基于內容的圖片搜索引擎研究[J].長沙大學學報,2012,02:40-42.

        [5]張俊,石志寒,郭新鵬.基于用戶的批量圖像元搜索引擎設計[J].科學技術與工程,2013,21:6290-6293+6298.

        [6]圖片搜索引擎巨無霸系列——一搜”5.5億圖片搜索“讀圖時代”[J].電腦愛好者,2004,20:73.

        [7]王遷.搜索引擎提供“快照”服務的著作權侵權問題研究[J].東方法學,2010,03:126-139.

        猜你喜歡
        系統(tǒng)評價搜索引擎
        中藥注射劑治療冠心病的系統(tǒng)評價再評價
        高壓氧治療血管性癡呆隨機對照試驗的Meta分析
        利卡汀聯(lián)合肝動脈栓塞化療治療中晚期肝癌的效果及安全性的系統(tǒng)評價
        細辛腦注射液治療慢性阻塞性肺疾病急性加重期療效的Meta分析
        丹紅注射液治療特發(fā)性肺纖維化臨床療效及安全性的Meta分析
        網(wǎng)絡搜索引擎亟待規(guī)范
        銀杏葉注射液治療急性腦梗死隨機對照試驗的系統(tǒng)評價
        Nutch搜索引擎在網(wǎng)絡輿情管控中的應用
        警察技術(2015年3期)2015-02-27 15:37:09
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        廣告主與搜索引擎的雙向博弈分析
        久久AⅤ无码精品色午麻豆| 欧美饥渴熟妇高潮喷水水 | 日韩精品中文一区二区三区在线 | 国产精品亚洲欧美天海翼| 看全色黄大黄大色免费久久| 免费播放成人大片视频| 青青青爽在线视频观看| 丰满少妇人妻无码专区| 亚洲熟女国产熟女二区三区| 亚洲av无一区二区三区| 人人妻人人爽人人澡欧美一区| av中文字幕综合在线| 国产精品很黄很色很爽的网站| 一区二区三区字幕中文| 在线观看免费人成视频| 国产福利小视频在线观看| 91久久国产露脸国语对白| 波多野结衣在线播放| 蜜臀久久99精品久久久久久小说| 国产精品激情综合久久| 亚洲一区二区三区在线看| 国产乡下三级全黄三级| 青青操国产在线| 国产精品国产三级国产专区51区 | 日本公与熄乱理在线播放| 国产免费专区| 国产一级自拍av播放| 久久99亚洲精品久久久久 | 日本二区三区视频免费观看| 国产精品内射久久一级二| 18分钟处破好疼哭视频在线观看| 日韩av二区三区一区| 国产极品大秀在线性色| 成午夜精品一区二区三区| 五月激情婷婷丁香| 亚洲小少妇一区二区三区| 国产欧美精品一区二区三区四区 | 国产亚洲日韩一区二区三区| 久久亚洲精品国产精品婷婷| 国产三级精品视频2021| 性xxxx视频播放免费|