亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于文本的圖片搜索引擎的研究

        2014-06-20 05:59:34李超
        無線互聯(lián)科技 2014年2期
        關(guān)鍵詞:搜索引擎

        李超

        摘 要:當(dāng)前圖片應(yīng)用及其搜索技術(shù)越來越成熟,圖片檢索系統(tǒng)也隨之得到了廣泛的應(yīng)用。文中基于上述背景首先對圖片信息的技術(shù)、文本圖片檢索系統(tǒng)進行了探討,接著對文本的圖片搜索引擎系統(tǒng)的評價完成了簡要概述,最后對組成系統(tǒng)架構(gòu)以及系統(tǒng)應(yīng)用測試進行了闡述,這一研究對信息檢索技術(shù)具有一定的參考價值。

        關(guān)鍵詞:圖片應(yīng)用;搜索技術(shù);文本圖片;搜索引擎;系統(tǒng)評價

        目前的Internet應(yīng)用已經(jīng)取得了長足的發(fā)展,隨著網(wǎng)絡(luò)帶寬和終端計算能力的不斷增強,圖片被越來越多的應(yīng)用于內(nèi)容的表達和信息的承載。圖片的信息是指圖片的內(nèi)容所表征的意義,這種的信息承載方式與傳統(tǒng)的文本的信息是不一樣的。由于文本的直觀性和簡單性,文本的信息即包含于本身;而圖片的信息可以通過圖片本身的內(nèi)容傳達出來,也可以通過相關(guān)文字的描述傳達出來,于是圖片便有了雙重的信息載體。本文基于這一方向,對文本的圖片搜索引擎完成了探討,這一研究對信息檢索技術(shù)具有一定的參考價值。

        1 圖片信息的技術(shù)

        獲取圖片信息的技術(shù)可根據(jù)其來源的載體類型劃分為基于內(nèi)容與基于文本這兩大類。前者是將單純的圖片內(nèi)容作為分析與查找對象,而后者則是對與圖片有關(guān)的文字信息進行分析,其工作方式與以往的文本查找方式差不多。

        由于互聯(lián)網(wǎng)具有邊緣化這一特點,其信息組織相當(dāng)自由,許多圖片資料根據(jù)方式與風(fēng)格的差異被組織到各不相同的地方。可根據(jù)各種方式自由的對文字與圖片進行安排。然而統(tǒng)計數(shù)據(jù)顯示,許多組織方式存在著一些共同點,這些共同點也反應(yīng)了我們在獲取信息方面的習(xí)慣。從而無限制的信息提取框架就有可能實現(xiàn)了?;ヂ?lián)網(wǎng)上的圖片與文本通常都是以組合的形式出現(xiàn)的,其中,HTML網(wǎng)頁是我們見的最多的一種組織形式,因此,許多與圖片相關(guān)的信息于可利用HTML挖掘來獲取。

        在網(wǎng)頁中,HTML網(wǎng)頁的應(yīng)用是最為廣泛的,對搜索引擎而言,它也是一個最重要的信息獲取途徑?;ヂ?lián)網(wǎng)上擁有大量的HTML網(wǎng)頁和多媒體資源。

        在互聯(lián)網(wǎng)上,Web搜索引擎技術(shù)已得到了廣泛的引用,每日需抓取不計其數(shù)的HTML網(wǎng)頁,這是一個非常有價值的資源庫,然而,現(xiàn)在只有文本信息被用于Web搜索。若將資源庫中的價值充分挖掘出來,則可實現(xiàn)圖片、MP3以及Flash等多個搜索系統(tǒng)的建立。所以,我們就從通過對HTML網(wǎng)頁的充分利用來創(chuàng)建Web圖片搜索引擎開始。

        2 文本圖片檢索系統(tǒng)探析

        2.1 檢索系統(tǒng)應(yīng)用涉及領(lǐng)域

        如今,圖片應(yīng)用及其搜索技術(shù)越來越成熟,圖片檢索系統(tǒng)也隨之得到了廣泛的應(yīng)用。Google圖片搜索等通用Web圖片搜索引擎是現(xiàn)在應(yīng)用最為的廣泛的,它的服務(wù)對象是所有通用領(lǐng)域的用戶。不僅如此,圖片檢索還被應(yīng)用于許多專業(yè)領(lǐng)域,常見的有:

        醫(yī)藥領(lǐng)域。大部分的醫(yī)學(xué)及相關(guān)專業(yè)由于要進行診斷和疾病檢查,故會涉及到可視信息資料,如:X光、掃描影像等。在相關(guān)信息的分析、傳輸以及存儲方面,圖片檢索技術(shù)發(fā)揮了重要作用,圖像處理是目前這個領(lǐng)域的研究重點,如:在腫瘤生長跟蹤方面采用了特征檢測。應(yīng)用于這個領(lǐng)域的系統(tǒng)中已有成功的案例。

        圖形設(shè)計領(lǐng)域。重要現(xiàn)有的設(shè)計,對于這個領(lǐng)域的從業(yè)者而言,可獲得許多素材與靈感,而圖片檢索系統(tǒng)可方便工作的開展,此外,還便于用戶找到有特殊要求的作品。

        出版領(lǐng)域。圖片對于出版社、雜志社等單位十分重要,由于需求量較大,它們大多都有自己的圖片庫,傳統(tǒng)的存儲與查找所采取的歸類方式較多。這個領(lǐng)域的工作人員在查找和選擇圖片方面所需時間較長,而圖片檢索系統(tǒng)則可提高圖片查找和挑選的效率。

        此外,圖片檢索還被應(yīng)用于建筑設(shè)計、天文地理以及犯罪取證等領(lǐng)域。

        2.2 用戶檢索方式技術(shù)

        與網(wǎng)頁檢索相比,圖片檢索在檢索方式上有較大區(qū)別。目前基本上只有關(guān)鍵字查詢這種網(wǎng)頁檢索系統(tǒng),因為在現(xiàn)有的考慮范圍內(nèi)只有文字可以描述網(wǎng)頁內(nèi)容。而用于描述圖片的除了文字之外,還有圖片自身。所以,圖片的檢索方式一般比較多,站在用戶檢索的角度來看,主要有目錄式檢索、關(guān)鍵字查詢、實例式檢索以及屬性式檢索四類。

        ⑴目錄式檢索。yahoo網(wǎng)頁搜索的特點也體現(xiàn)在了其圖片搜索上,對圖片實行了分類,用戶根據(jù)分類結(jié)構(gòu)對查詢范圍進行細化。這種檢索方式下的很多分類工作需要人工完成,所以,其代價也是很大的。

        ⑵關(guān)鍵字查詢。目前,關(guān)鍵字檢索方式適用于大型圖片搜索引擎。用戶輸入與所需圖片有關(guān)的文字,系統(tǒng)根據(jù)文字與圖片的匹配度對與查詢詞相對應(yīng)的圖片進行查找。具有較快的檢索速度是該檢索方式的最大優(yōu)勢,且基于文本的索引技術(shù)已發(fā)展到成熟階段。人工標(biāo)引和自動提取是匹配信息與文字的兩種方法。

        人工標(biāo)引在信息檢索方面具有較高的準(zhǔn)確度。不足的是人工標(biāo)引的工作量較大,對于海量系統(tǒng)而言很難實現(xiàn);另外,該方法具有較強的主觀性,幾乎無法將完整的信息反映出來,且有時所反映的圖片信息有誤。

        自動提取方法的準(zhǔn)確度則沒有人工標(biāo)引方法高。因為信息具有多種組織形式,且具體組織形式的確定存在較大難度,對與圖片相匹配的信息很難確定。該方法下的信息提取所采取的是啟發(fā)式規(guī)則,信息獲取所采用的是使用較多的模式,同時,信息的準(zhǔn)確性可通過無用信息過濾等技術(shù)來加強。

        ⑶實例式檢索?,F(xiàn)在基于內(nèi)容的圖片搜索引擎基本上都是實例式檢索。系統(tǒng)根據(jù)所提供的圖片或用戶所畫的基本形狀特征對類似的圖片進行查找。較為容易找到類似圖片是該方式的優(yōu)勢,而需要用戶提供圖片則是它的不足之處,因為這樣對系統(tǒng)不利?;趦?nèi)容的檢索系統(tǒng)所提供的分類信息一般具有較大的粒度,如:風(fēng)景、人物等。

        ⑷屬性式檢索。屬性式檢索方式常被用于規(guī)模較小的攝影等專業(yè)的圖片數(shù)據(jù)庫,用戶的檢索依據(jù)可以是圖片的某些外在特征,如:作者、拍攝日期等。這類數(shù)據(jù)庫的特點就是管理的統(tǒng)一性,信息通常很規(guī)范,可通過當(dāng)前的關(guān)系數(shù)據(jù)庫來創(chuàng)建索引與檢索,過程比較簡單。

        3 檢索系統(tǒng)評價

        在檢索系統(tǒng)中,評價系統(tǒng)有兩個非常重要的指標(biāo),即查準(zhǔn)率與查全率。查準(zhǔn)率指的是查詢結(jié)果中有關(guān)文檔數(shù)與文檔總數(shù)之比;查全率指的是查找到的有關(guān)文檔數(shù)與所有文檔集合中有關(guān)文檔總數(shù)之比。若在特定的查詢中,D+、R、R+分別代表所有文檔集合中有關(guān)文檔數(shù)、查詢結(jié)果文檔集合以及結(jié)果文檔中有關(guān)文檔集合,那么,查準(zhǔn)率與查全率則有以下定義:

        查準(zhǔn)率:

        查全率:

        查準(zhǔn)率與查全率在圖片檢索系統(tǒng)中是很難度量的,由于圖片和文本的有關(guān)評價帶有較強的主觀意識,故幾乎無法得到比較具體的統(tǒng)計結(jié)果。

        4 組成系統(tǒng)架構(gòu)

        組成系統(tǒng)架構(gòu)的組件較多,一個系統(tǒng)的功能流量也因此得到了體現(xiàn)。第一步就是由用戶將圖像名稱與上下文輸入到系統(tǒng),這樣有關(guān)列表圖像就生成了。各部分細節(jié)見下圖1。

        輸入界面前端應(yīng)用程序設(shè)計:Eclipse編譯器為用戶提供了一個友好的界面,以便于用戶進行搜索與選擇,可通過部分上下文對人格圖片進行瀏覽,此外,還可查看一個或多個視圖模式的圖片。

        耶拿框架:集成本體和用戶界面已采用了耶拿框架l。許多上下文已通過本體語言查詢建立。以上查詢會由耶拿向推理機傳遞。完成推理后, Jena會將結(jié)果被發(fā)送回輸出接口。

        圖像庫和輸出接口:存儲庫中已保存了全部選定的圖片,檢索查詢結(jié)果輸出所對應(yīng)的圖像的名稱是一樣的。用戶在主屏幕對所要查找的上下文進行輸入,圖像最后將在多個Windows操作系統(tǒng)中出現(xiàn)。

        5 文本圖片系統(tǒng)應(yīng)用測試和結(jié)果

        我們對測試中采用本體的效果進行了評估。通過谷歌搜索引擎及測試關(guān)鍵字方法將個性各異的名字輸入到搜索框中,出現(xiàn)的結(jié)果很多,而大部分結(jié)果的關(guān)聯(lián)性并不大。我們在該系統(tǒng)中對同一查詢進行了測試,結(jié)果顯示效果要好于前者。采用精度、措施以及回憶等不同的方法對結(jié)果的進行比較,在不同的場景中,以語義為基礎(chǔ)的結(jié)果地位最高??偟膩碚f,在本文的實驗中,與關(guān)鍵字搜索相比,語義文本搜索更加便于操作。

        [參考文獻]

        [1]徐靜.圖像搜索引擎的進步與應(yīng)用現(xiàn)狀分析[J].電子商務(wù),2011,04:61-62.

        [2]吳江.多媒體搜索引擎創(chuàng)新比較研究[J].圖書館學(xué)研究,2012,05:75-79+70.

        [3]焦蕾,殷鋒社.圖像搜索引擎檢索模式分析與研究[J].電子設(shè)計工程,2012,05:132-134.

        [4]王晟,趙壁芳.基于內(nèi)容的圖片搜索引擎研究[J].長沙大學(xué)學(xué)報,2012,02:40-42.

        [5]張俊,石志寒,郭新鵬.基于用戶的批量圖像元搜索引擎設(shè)計[J].科學(xué)技術(shù)與工程,2013,21:6290-6293+6298.

        [6]圖片搜索引擎巨無霸系列——一搜”5.5億圖片搜索“讀圖時代”[J].電腦愛好者,2004,20:73.

        [7]王遷.搜索引擎提供“快照”服務(wù)的著作權(quán)侵權(quán)問題研究[J].東方法學(xué),2010,03:126-139.

        猜你喜歡
        搜索引擎
        Chrome 99 Canary恢復(fù)可移除預(yù)置搜索引擎選項
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        Nutch搜索引擎在網(wǎng)絡(luò)輿情管控中的應(yīng)用
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        廣告主與搜索引擎的雙向博弈分析
        基于Lucene搜索引擎的研究
        知識漫畫
        百科知識(2012年11期)2012-04-29 08:30:15
        一種自反饋式元搜索系統(tǒng)的設(shè)計
        搜索引擎,不止有百度與谷歌
        搜索,也要“深搜熟濾”
        久久国产综合精品欧美| 亚洲最大av网站在线观看| 久久成人国产精品| 在线精品免费观看| 日韩不卡无码三区| 激情五月天色婷婷久久| 国产极品女主播国产区| 中文字幕乱码人妻一区二区三区| 国产亚洲欧洲AⅤ综合一区| 人妖与人妖免费黄色片| 本道天堂成在人线av无码免费| 国产成人无码一区二区在线播放| 乱伦一区二| 亚洲av一二三四又爽又色又色| 国产99一区二区三区四区| 熟女无套内射线观56| 一本色道久久综合亚洲精品小说| 91精品国产色综合久久不| 亚洲人不卡另类日韩精品| 麻豆成人精品国产免费| 久久精品—区二区三区无码伊人色| 国产精品午夜福利天堂| 男人的天堂av高清在线| 九九99久久精品国产| 国产精品美女黄色av| 国产色视频在线观看了| 日日摸天天碰中文字幕你懂的| 国产精品麻豆aⅴ人妻| 热re99久久精品国产66热6| 国产饥渴的富婆一凶二区| 国产乱子伦农村xxxx| 免费人成在线观看播放国产| 亚洲日本国产一区二区三区| 精品卡一卡二卡3卡高清乱码| 无码中文字幕人妻在线一区二区三区| 久久久国产精品ⅤA麻豆百度| 国产精品老熟女乱一区二区| 国精产品一区一区三区有限公司杨| 欧美日韩亚洲国产千人斩| 久久久国产精品三级av| 久久精品国产亚洲av久|