亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        圖片購(gòu)物檢索研究

        2012-08-06 07:59:04王召義
        關(guān)鍵詞:特征文本內(nèi)容

        王召義

        (安徽商貿(mào)職業(yè)技術(shù)學(xué)院,安徽蕪湖,241002)

        隨著電子商務(wù)和計(jì)算機(jī)視覺(jué)技術(shù)的高速發(fā)展,電子商務(wù)網(wǎng)站上的圖片信息量已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了文本信息量。然而,這些圖片是無(wú)序地分布在各個(gè)電子商務(wù)網(wǎng)站中的,圖片中所包含的商務(wù)信息無(wú)法被有效地訪問(wèn)和充分地利用。對(duì)于消費(fèi)者來(lái)說(shuō),在眾多的電子商務(wù)圖片購(gòu)物網(wǎng)站中尋找滿意的商品,無(wú)異于大海撈針,此時(shí)此刻,傳統(tǒng)關(guān)鍵字搜索已經(jīng)越來(lái)越不適應(yīng)電子商務(wù)的發(fā)展了,特別是圖片購(gòu)物檢索領(lǐng)域。對(duì)于電子商務(wù)企業(yè)來(lái)說(shuō),需要提供一種能夠快速而且準(zhǔn)確地檢索圖片的技術(shù),即圖片檢索技術(shù)。

        圖片檢索技術(shù)是一種根據(jù)用戶的興趣使用圖片特征從數(shù)據(jù)庫(kù)搜索圖片的技術(shù),圖片特征是圖片檢索技術(shù)的核心要素之一。從廣義角度來(lái)講,圖片特征主要有兩種類型,即圖片的外部特征和內(nèi)容特征。外部特征主要包括圖片的標(biāo)題、作者、創(chuàng)建日期、尺寸、流派等,也有學(xué)者稱其為圖片的語(yǔ)義內(nèi)容;內(nèi)容特征主要包括圖片的顏色、紋理、形狀和空間布局等,也有學(xué)者稱其為圖片的可視化內(nèi)容。其中,圖片的外部特征是基于文本的關(guān)鍵字進(jìn)行描述的;圖片的內(nèi)容特征是基于顏色、紋理、形狀和空間關(guān)系等特征進(jìn)行描述的,即基于內(nèi)容進(jìn)行描述的。

        根據(jù)圖片特征可以把圖片購(gòu)物檢索分為兩種類型:基于文本的圖片購(gòu)物檢索和基于內(nèi)容的圖片購(gòu)物檢索。

        一、基于文本的圖片購(gòu)物檢索

        基于文本的圖片購(gòu)物檢索沿用了傳統(tǒng)關(guān)鍵字檢索技術(shù),回避對(duì)圖片內(nèi)容特征的分析,而使用文本標(biāo)注圖片的外部特征,且對(duì)圖片的查詢是通過(guò)對(duì)圖片的外部特征檢索來(lái)實(shí)現(xiàn)的。為了實(shí)現(xiàn)檢索,需要對(duì)圖片的外部特征進(jìn)行文字或數(shù)字標(biāo)簽的描述,這樣,對(duì)圖片的查詢就轉(zhuǎn)換成了基于文字或數(shù)字標(biāo)簽的查詢。

        基于文本的圖片購(gòu)物檢索的基本思想是:采用文本對(duì)圖片的外部特征進(jìn)行描述,建立圖片外部特征的索引數(shù)據(jù)庫(kù),這樣圖片的存儲(chǔ)地址和文本之間就建立了聯(lián)系,而圖片本身還是以外部的方式存儲(chǔ)。[1]對(duì)圖片外部特征的檢索一般都是通過(guò)分類目錄瀏覽和關(guān)鍵字提問(wèn)的方式進(jìn)行,查詢操作本質(zhì)上是對(duì)文字內(nèi)容描述的精確匹配或概率匹配,盡管有些檢索模型還有數(shù)據(jù)字典支持,但我們檢索的只是圖片外部特征的人工描述信息,與圖片的內(nèi)容特征沒(méi)有多大關(guān)系。在電子商務(wù)領(lǐng)域中,很多比較購(gòu)物網(wǎng)站采用的圖片購(gòu)物搜索也是基于這種檢索技術(shù),此外使用百度和Google查詢圖片也是如此。

        基于文本的圖片購(gòu)物檢索對(duì)檢索技術(shù)的要求不是很高,操作較方便,也便于標(biāo)注人員和普通用戶理解與掌握。但是,由于圖片資源的增長(zhǎng)速度非???,所以對(duì)圖片進(jìn)行文本描述的方式已經(jīng)滿足不了電子商務(wù)的要求了。

        首先,圖片包含的信息內(nèi)容很難用文本完全標(biāo)注。盡管基于文本的描述方法利用文字來(lái)對(duì)圖片特征進(jìn)行描述,但由于圖片特征具有豐富的內(nèi)涵,并且其中有一些難以用字符和數(shù)字符號(hào)描述的特征線索,例如:圖片的顏色、紋理和形狀等特征。因此,當(dāng)圖片中包含多個(gè)物體時(shí),就難以用簡(jiǎn)短的描述信息來(lái)全面體現(xiàn)它的含義,并且作為關(guān)鍵字的圖片特征的選取具有很強(qiáng)的主觀性,不同的標(biāo)注者或同一標(biāo)注者在不同環(huán)境下對(duì)同一幅商品圖片可能給出不同的描述,很難表達(dá)圖片的空間關(guān)系。這使得在很多情況下文本標(biāo)注難以滿足電子商務(wù)實(shí)際需求,例如,電子商務(wù)企業(yè)要注冊(cè)新的商標(biāo)時(shí)需要對(duì)已經(jīng)注冊(cè)商標(biāo)進(jìn)行檢索,看是否雷同,此時(shí)僅靠對(duì)商標(biāo)進(jìn)行文本標(biāo)注是難以解決的。

        其次,人工對(duì)圖片內(nèi)容進(jìn)行標(biāo)注十分費(fèi)力費(fèi)時(shí)。因?yàn)閷?duì)于廣泛的圖片自動(dòng)地生成描述性的文本是不可行的,大部分基于文本的圖片購(gòu)物檢索系統(tǒng)需要對(duì)圖片進(jìn)行人工標(biāo)注。很顯然,人工標(biāo)注圖片對(duì)于大型圖片數(shù)據(jù)庫(kù)來(lái)說(shuō)是一項(xiàng)棘手和昂貴的任務(wù),并且經(jīng)常是主觀的、上下文敏感的和不完整的。例如,同一款商品,有不同角度、不同款式、不同顏色的圖片,僅依靠人工進(jìn)行圖片描述,是達(dá)不到電子商務(wù)企業(yè)要求的。

        由此可見(jiàn),對(duì)圖片檢索需要借助計(jì)算機(jī)技術(shù)從圖片的語(yǔ)義內(nèi)容到可視化內(nèi)容進(jìn)行處理、分析和理解以有效獲取其內(nèi)容特征,并根據(jù)圖片內(nèi)容特征實(shí)現(xiàn)快捷準(zhǔn)確的檢索。

        二、基于內(nèi)容的圖片購(gòu)物檢索

        (一)基于內(nèi)容的圖片購(gòu)物檢索概述

        隨著圖片信息資源的普及,人們?cè)陔娮由虅?wù)應(yīng)用中不僅要對(duì)圖片進(jìn)行基于關(guān)鍵字的檢索,而且要對(duì)圖片進(jìn)行語(yǔ)義內(nèi)容的分析和理解,以便達(dá)到更深的檢索層次。于是,基于內(nèi)容的購(gòu)物搜索便應(yīng)運(yùn)而生。

        基于內(nèi)容的圖片購(gòu)物檢索的主要思想是:首先,根據(jù)圖片的索引來(lái)計(jì)算查詢圖片和目標(biāo)圖片的相似距離;然后,按照相似性匹配來(lái)進(jìn)行檢索。[2]如圖1所示:

        圖1 工作原理示意圖

        從圖1中可以看出:其工作原理主要包括圖片檢索與圖片索引兩個(gè)子系統(tǒng)。在圖片索引子系統(tǒng)中,通過(guò)對(duì)圖片進(jìn)行自動(dòng)分析,提取圖片的內(nèi)容特征,如顏色、紋理、形狀等,以及這些特征的組合,作為特征向量存入圖片特征庫(kù);在圖片檢索子系統(tǒng)中,對(duì)用戶提交的每一幅檢索樣圖進(jìn)行圖片分析提取特征向量,利用相似匹配算法計(jì)算查詢示例圖片與圖片特征庫(kù)中圖片特征向量的相似度,根據(jù)相似度大小輸出檢索結(jié)果。

        與基于文本的圖片購(gòu)物檢索,它有如下特點(diǎn):[3]

        (1)從圖片內(nèi)容中提取信息線索?;趦?nèi)容的圖片購(gòu)物檢索突破了傳統(tǒng)的基于關(guān)鍵字檢索的局限,直接對(duì)圖片進(jìn)行分析,抽取特征,使得檢索更接近于圖片對(duì)象。

        (2)提取特征的方法多種多樣。可以提取形狀、顏色、紋理和輪廓等多種特征。

        (3)人機(jī)交互。一般來(lái)說(shuō),用戶對(duì)特征比較敏感,能夠迅速分辨出圖片的顏色、形狀等。如果圖片很多,則用戶很難記住這些特征,從大量數(shù)據(jù)中查找目標(biāo)的效率也非常低,但計(jì)算機(jī)能夠輕松做到這一點(diǎn)。因此,在使用基于內(nèi)容的圖片購(gòu)物檢索時(shí),用戶與計(jì)算機(jī)配合進(jìn)行檢索。

        (4)近似匹配。在檢索過(guò)程中,采用逐步求精的辦法,每一層的中間結(jié)果是一個(gè)集合,不斷地減小該集合的范圍,直到定位到目標(biāo)時(shí)為止。這一特點(diǎn)與數(shù)據(jù)庫(kù)檢索的精確匹配算法顯然不一樣。

        (二)基于內(nèi)容的圖片購(gòu)物檢索應(yīng)用實(shí)例——淘淘搜

        基于內(nèi)容的圖片購(gòu)物檢索,通俗來(lái)講就是“以圖搜圖”。所謂“以圖搜圖”,顧名思義,用戶可以通過(guò)上傳本地圖片或輸入網(wǎng)絡(luò)圖片的URL地址來(lái)搜索相同或相似的圖形圖像。

        淘淘搜(http://www.taotaosou.com/)就是典型的“以圖搜圖”、“想圖購(gòu)物”的電子商務(wù)網(wǎng)站,即基于內(nèi)容的圖片購(gòu)物檢索網(wǎng)站。它是國(guó)內(nèi)最大的圖片購(gòu)物搜索引擎,只需一張圖片,淘淘搜就能通過(guò)強(qiáng)大的視覺(jué)計(jì)算技術(shù)幫你在海量的商品中快速找到心儀的寶貝,讓購(gòu)物變得更快捷、更輕松。淘淘搜和淘寶網(wǎng)合作的“圖想”(http://imagine.taobao.com/)是全球第一個(gè)大規(guī)模商業(yè)化運(yùn)營(yíng)的圖片搜索產(chǎn)品,面向淘寶網(wǎng)用戶提供便捷的圖片搜索服務(wù),解決了用戶不能和不愿用文字進(jìn)行搜索的困難,得到了用戶的高度評(píng)價(jià)。

        淘淘搜的服務(wù)主要有:(1)同款比價(jià)和服務(wù):通過(guò)上傳圖片或使用商品地址搜索,用戶能夠用最快的時(shí)間搜索到全網(wǎng)同款商品進(jìn)行比價(jià),用戶可以在結(jié)果中輕松地比較產(chǎn)品質(zhì)量、價(jià)格、服務(wù)和商城信息。在上千萬(wàn)家商店的同款商品中挑選出最滿意結(jié)果,淘淘搜的服務(wù)能讓用戶在微笑愉快中享受購(gòu)物花的每一分錢是物有所值。(2)相似搜索和服務(wù):通過(guò)圖片搜索,用戶選擇搜索的類目后,淘淘搜系統(tǒng)根據(jù)上傳的圖片特征值,為用戶搜索出指定類目下最相關(guān)的相似商品和最相關(guān)的最熱門搜索。當(dāng)網(wǎng)絡(luò)上沒(méi)有同款商品時(shí),用戶能夠找到最相似的商品進(jìn)行選擇。(3)搜索商品和服務(wù):關(guān)鍵詞、類目搜索功能讓用戶迅速找到相關(guān)的商品的價(jià)格、運(yùn)費(fèi)、折扣、銷售信息等。點(diǎn)擊圖片即可全網(wǎng)同款比價(jià),實(shí)現(xiàn)一站式輕松比價(jià)。

        淘淘搜為客戶提供了三種以圖片搜商品的方法。如圖2所示:

        圖2 淘淘搜查詢接口

        第一,上傳本地圖片。在圖2上,選擇“本地圖片”,點(diǎn)擊“從本地上傳圖片”按鈕,將您電腦中的商品圖片上傳后,按照需要框出要搜索的商品(排除背景),選擇要搜索的商品類目,然后點(diǎn)擊“搜索相似商品”按鈕就能找到與您上傳圖片相似的商品了。如圖3所示:

        圖3 上傳本地圖片

        圖4 粘貼圖片地址

        第二,粘貼圖片地址。在網(wǎng)絡(luò)上看到了一件商品,想購(gòu)買,怎么辦?右鍵點(diǎn)擊圖片復(fù)制圖片地址,然后在圖2上,選擇“網(wǎng)絡(luò)圖片”,在輸入框粘貼圖片地址就可以找到與圖片相似的商品了。如圖4所示。

        第三,粘貼商品地址。網(wǎng)上購(gòu)物時(shí),相中了心儀商品,想看看這款商品相同款,怎么辦?復(fù)制商品地址,在圖2上,選擇“商品搜索”,在輸入框粘貼商品地址就可以找到心儀商品的相同了。如圖5所示:

        圖5 粘貼商品地址

        通過(guò)以上分析,我們可以發(fā)現(xiàn)二者的實(shí)現(xiàn)原理是相同的,主要體現(xiàn)在以下三方面:一方面對(duì)用戶檢索需求的分析和轉(zhuǎn)化,形成可以檢索索引數(shù)據(jù)庫(kù)的提問(wèn);另一方面,收集和加工圖片資源,提取圖片特征,分析并進(jìn)行標(biāo)注,建立圖片的索引數(shù)據(jù)庫(kù);最后是根據(jù)相似度算法,計(jì)算用戶的提問(wèn)與索引數(shù)據(jù)庫(kù)中記錄的相似度大小,提取出滿足閾值的記錄作為結(jié)果,按照相似度降序的方式輸出。兩者的區(qū)別主要體現(xiàn)在圖片特征上,基于文本的圖片購(gòu)物檢索是借助傳統(tǒng)文本信息檢索技術(shù)來(lái)實(shí)現(xiàn)圖片信息檢索,采用文本的形式標(biāo)注圖片外部特征;基于內(nèi)容的圖片購(gòu)物檢索是從圖片中自動(dòng)提取內(nèi)容特征,如色彩、紋理、形狀等,這些客觀特征是前者無(wú)法精確描述的。

        基于文本與內(nèi)容的圖片購(gòu)物檢索有著各自的優(yōu)勢(shì)和不足,在電子商務(wù)應(yīng)用背景下,基于文本的圖片購(gòu)物搜索一定程度上回避了對(duì)復(fù)雜的可視化元素的識(shí)別難題,符合人們熟悉的檢索習(xí)慣,充分利用了網(wǎng)頁(yè)上下文和超文本結(jié)構(gòu)信息,實(shí)現(xiàn)簡(jiǎn)單,但是因?yàn)槿耘f局限在文本檢索的范圍下,通過(guò)受控詞匯來(lái)描述圖片,因此容易出現(xiàn)主題歧義、標(biāo)注不一、無(wú)法對(duì)圖片內(nèi)容理解等問(wèn)題。基于內(nèi)容的圖片購(gòu)物搜索恰恰相反,主要利用對(duì)直觀形象的特征元素的分析來(lái)標(biāo)注圖片,具有一定的客觀性,但是其算法復(fù)雜,實(shí)現(xiàn)成本高。[4]

        基于文本和基于內(nèi)容是圖片購(gòu)物檢索發(fā)展的兩個(gè)分支,不過(guò)從目前圖片購(gòu)物檢索研究的趨勢(shì)而言,應(yīng)結(jié)合文本和內(nèi)容,進(jìn)行融合性研究。發(fā)揮各自的優(yōu)勢(shì)促進(jìn)圖片的高效、簡(jiǎn)單檢索方式的實(shí)現(xiàn),尤其是網(wǎng)絡(luò)環(huán)境下,結(jié)合圖片所在Web文檔的特征分析,推斷圖片的外部特征,同時(shí)結(jié)合對(duì)圖片的內(nèi)容特征分析,共同標(biāo)注達(dá)到對(duì)圖片的分析和檢索。

        [1]張帆.信息存儲(chǔ)于檢索[M].北京:高等教育出版社,2007.

        [2]肖明.基于內(nèi)容的多媒體信息索引與檢索概論[M].北京:人民郵電出版社,2009.

        [3]多媒體信息檢索與管理[M].劉曉冬,譯.北京:清華大學(xué)出版社,2009.

        [4]張騫.基于文本的與基于內(nèi)容的圖像檢索技術(shù)比較研究[J].情報(bào)探索,2012(1).

        猜你喜歡
        特征文本內(nèi)容
        內(nèi)容回顧溫故知新
        如何表達(dá)“特征”
        在808DA上文本顯示的改善
        不忠誠(chéng)的四個(gè)特征
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        抓住特征巧觀察
        主要內(nèi)容
        臺(tái)聲(2016年2期)2016-09-16 01:06:53
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        如何快速走進(jìn)文本
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        老熟妇高潮av一区二区三区啪啪 | 黑色丝袜秘书夹住巨龙摩擦| 特级毛片a级毛片在线播放www| avtt一区| 日本女优久久精品久久| 久久久久亚洲av综合波多野结衣| 国产欧美一区二区精品仙草咪| 中文字幕人妻中文| 亚洲无人区一码二码国产内射| 美女视频黄是免费| 国精无码欧精品亚洲一区| 午夜视频网址| 日本在线一区二区免费| 夜夜躁狠狠躁日日躁视频| 永久免费的av在线电影网无码| 一本一道AⅤ无码中文字幕| 国产免费网站在线观看不卡| 国产色系视频在线观看| 国产成人久久777777| 大胸美女吃奶爽死视频| 青青草好吊色在线观看| 欧美人与禽zozzo性伦交| 国内免费AV网站在线观看| 日本精品人妻一区二区三区| 精品国产一区二区三区18p| 国产精品一区二区久久乐下载 | 国产成人免费一区二区三区| 亚洲精品女人天堂av麻| 中文字幕无线码一区二区| 久久99精品久久久久久hb无码| 亚洲欧美国产成人综合不卡| 婷婷久久av综合一区二区三区| 亚洲国产天堂久久综合| 国产亚洲精品自在久久蜜tv| 亚洲女同恋中文一区二区| 久久久久99人妻一区二区三区| 国内揄拍国内精品人妻浪潮av| 欧美日本国产亚洲网站免费一区二区 | 一区二区在线观看日本视频| 黄桃av无码免费一区二区三区| 抽搐一进一出试看60秒体验区|