亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于圖片內(nèi)容的商品信息檢索系統(tǒng)*

        2015-12-05 08:53:38黎浩宏浙江工貿(mào)職業(yè)技術(shù)學(xué)院浙江溫州325003
        關(guān)鍵詞:商品信息爬蟲特征值

        黎浩宏(浙江工貿(mào)職業(yè)技術(shù)學(xué)院,浙江溫州325003)

        基于圖片內(nèi)容的商品信息檢索系統(tǒng)*

        黎浩宏
        (浙江工貿(mào)職業(yè)技術(shù)學(xué)院,浙江溫州325003)

        介紹了使用基于圖片內(nèi)容進行商品信息檢索的算法和實現(xiàn)原型系統(tǒng),用戶提交待查詢商品圖片后,系統(tǒng)對商品圖像進行提取關(guān)鍵特征值,再和系統(tǒng)數(shù)據(jù)庫中的圖像特征值比較,縮小了檢索得到的圖片集合,提高了查全率和查準(zhǔn)率。

        商品;圖像;檢索;NET Framework

        當(dāng)前的大部分電子商務(wù)網(wǎng)站,如京東、淘寶、當(dāng)當(dāng)、亞馬遜等提供了種類繁多的海量商品,一般電子商務(wù)網(wǎng)站只提供文字進行查找,通過這種傳統(tǒng)的關(guān)鍵字搜索商品,返回給用戶的往往是大量的商品,搜索到的商品多達幾十頁甚至上百頁,而用戶購買商品時,特別是對于穿著的衣服、鞋、帽、褲子等,不但主要考慮商品的質(zhì)量,同時商品的外形也是用戶購買商品的關(guān)鍵因素,然而通過文字搜索到的大多數(shù)商品都不是用戶所需的商品,這樣往往浪費了用戶的大量時間進行選擇商品,實際上用戶在購買商品時只查看前幾頁,如果沒有查到想要的商品,也不會再往下查看商品了,存在較大的局限性。

        1 相關(guān)技術(shù)

        1.1圖片內(nèi)容檢索技術(shù)

        要進行圖片內(nèi)容的檢索,首先要根據(jù)待查圖片進行圖像特征提取,根據(jù)待查圖像特征到被查圖像特征庫中進行查找,將小于閥值的備查圖像顯示出來即可,所以關(guān)鍵技術(shù)是提取圖像特征。圖像的特征包括基于文本特征和視覺特征兩類。主要使用視覺特征來進行圖片內(nèi)容的檢索。

        圖像特征通常可以從顏色、紋理和形狀特征三方面進行獲取。顏色直方圖[1]是描述圖像的視覺特征的一種廣泛使用的技術(shù)。該技術(shù)用于統(tǒng)計不同色彩在整幅圖像中所占用的比例,不考慮每種色彩在圖像中所處的位置。紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺特征[2],它是所有物體表面共有的內(nèi)在特性,例如云彩、樹木、磚、織物等都有各自的紋理特征。形狀特征的提取要對圖像中物體或區(qū)域進行劃分,圖像檢索中的形狀特征只能用于某些特殊應(yīng)用,在這些應(yīng)用中圖像包含的物體或區(qū)域可以直接獲得[3]。

        1.2網(wǎng)絡(luò)爬蟲

        網(wǎng)絡(luò)爬蟲是一個自動提取網(wǎng)頁的程序,它為搜索引擎從萬維網(wǎng)上下載網(wǎng)頁,是搜索引擎的重要組成。傳統(tǒng)爬蟲從一個或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程中,不斷從當(dāng)前頁面上抽取新的URL放入隊列,直到滿足系統(tǒng)的一定停止條件[4]。由于系統(tǒng)中的網(wǎng)絡(luò)爬蟲需要獲取當(dāng)前的URL所包含的圖片鏈接以及抓取往后的URL,故本網(wǎng)絡(luò)爬蟲系統(tǒng)主要是獲取圖片同時保存在指定的位置,還要對圖片進行特征提取,保存到系統(tǒng)的備查數(shù)據(jù)庫中。

        2 系統(tǒng)設(shè)計與實現(xiàn)

        2.1圖片內(nèi)容檢索關(guān)鍵技術(shù)

        針對圖片內(nèi)容進行檢索時,先進行采集圖片特征,主要提取圖片的顏色直方圖特征,如果有能夠提取形狀,則將圖片形狀特征提取出來,分別將特征值保存到數(shù)據(jù)庫中??梢詻]有形狀特征。如果有形狀特征,則為兩者設(shè)定一定的權(quán)重值。進行圖片檢索時,先將要檢索的圖片進行特征提取,然后和服務(wù)器端的圖片特征集合進行檢索匹配,最后顯示出符合檢索條件的圖片。

        2.2總體結(jié)構(gòu)設(shè)計

        用戶選擇不同的圖片搜索方式搜索,如果選擇基于文本的搜索。則輸入關(guān)鍵字后,系統(tǒng)根據(jù)用戶提交的關(guān)鍵字進行關(guān)鍵字搜索。若用戶選擇基于內(nèi)容的搜索方式,那么當(dāng)用戶上傳一張圖片后,客戶端對上傳的商品圖片進行特征提取并上傳到服務(wù)器,與服務(wù)器中的已提取特征的商品圖片特征集進行匹配,由系統(tǒng)查找與用戶上傳商品圖片特征相似的商品圖片,將查找到的圖片集返回給客戶端。本系統(tǒng)總體框架結(jié)構(gòu)如圖1所示。

        圖1 系統(tǒng)總體框架圖

        2.3開發(fā)環(huán)境

        本系統(tǒng)在.net framework 4.5平臺下,采用Microsoft Visual studio2012開發(fā)工具,數(shù)據(jù)庫使用sql server 2005,采用asp.net web form技術(shù),使用c#語言進行開發(fā)的。

        2.4數(shù)據(jù)庫設(shè)計

        根據(jù)商品圖片檢索需求,系統(tǒng)有10多個表,由于比較復(fù)雜,為便于描述,這里只列出了關(guān)鍵的5個表的內(nèi)容和其關(guān)系圖,包括商品種類表(tb_Kinds),商品信息表(GoodsInfo),商品特征表(tb_feature),用戶表(tb_Usser)以及用戶關(guān)注商品表(tb_Matching),其具體字段和關(guān)系如圖2所示。

        圖2 表的關(guān)系圖

        2.5系統(tǒng)功能

        本系統(tǒng)依據(jù)淘寶網(wǎng)的手機淘寶網(wǎng)站,將其作為初始的URL(http://a.m.taobao.com/),根據(jù)網(wǎng)絡(luò)爬蟲進行自動搜索和下載圖片,同時提取下載的圖片的具體特征值并且保存到數(shù)據(jù)庫中。

        本系統(tǒng)分為前臺和后臺,其中前臺主要有以下3個功能。

        查詢功能:能夠根據(jù)文字關(guān)鍵字進行查詢商品,也能通過提交商品圖片進行查詢商品信息,查詢到商品信息后,點擊相應(yīng)的商品圖片,能夠顯示商品的具體信息。

        用戶管理:具有用戶注冊和登錄功能。

        定制和推送商品:用戶可以注冊成為會員后,才能定制商品,定制好具體商品后,用戶只要登錄本系統(tǒng)網(wǎng)站后,就能自動查看到定制的商品信息。

        后臺功能主要有以下4項功能。

        商品信息采集:輸入初始的網(wǎng)址后,網(wǎng)絡(luò)爬蟲會自動識別和下載相應(yīng)的圖片,提取圖片的特征值,由于手機淘寶網(wǎng)站具有統(tǒng)一的商品設(shè)計格式,分析該格式,同時將商品的相應(yīng)信息,如商品標(biāo)題,商品價格、類型等信息保存到數(shù)據(jù)庫中,本模塊需要花費較長時間進行采集商品信息。

        商品維護:可以對商品信息進行增刪改查等常規(guī)功能的實現(xiàn)。

        會員管理:對前臺注冊的客戶進行日常增刪改查等管理。

        商品推送:設(shè)置商品推送后,前臺登錄的用戶能夠接受到推送的商品信息。

        前臺主界面如圖3所示:

        圖3 圖片檢索網(wǎng)頁

        其中對圖片內(nèi)容的特征值比較的關(guān)鍵代碼如下:protected void ButtonImage_Click(object sender,EventArgs e)

        {

        …….

        if(this.uplPhoto.HasFile==false)

        {

        SmallScript.MessageBox(this,"請選擇圖片!");

        }

        else

        {

        string path=Server.MapPath(@".uploadPhoto");

        dataOperate.UpPhoto(this.uplPhoto,ImageMyPic, path);

        string imgPathAndName=path+uplPhoto.FileName;

        stringfeatureStr=ImageObject.GetImageFeature (imgPathAndName);//得到圖片特征值

        int goodKind=Convert.ToInt32(DropDownListGood-Kind.SelectedValue);

        DataSet ds=Engine.getImageFeatureInfoBygoodkind (goodKind);

        imageFeatureEntity[]imageFeatureEntitys=image-FeatureEntity.DataSetToimageFeatureEntity(ds);//數(shù) 據(jù) 集中的數(shù)據(jù)插入到goodEntity數(shù)組中

        string strIdList="";

        Boolean GoodIdisNull=true;

        foreach(imageFeatureEntity iFE in imageFeatureEntitys)

        {

        float similar=ImageObject.CompreFromFeature(featureStr,iFE.feature);//比較圖片的特征值

        mySimilar=similar;

        if(similar>=0.75)

        {

        GoodIdisNull=false;

        strIdList+=iFE.goodId.ToString()+",";

        }

        }

        if(GoodIdisNull==false)//找到符合條件的圖片

        {

        strIdList=strIdList.Substring(0,strIdList.LastIndexOf (","));

        rs=Engine.getGoodInfoInIdList(strIdList);

        Session.Add("rs",rs);

        lbPageImage.Text="1";

        bindDataListImage();

        Labellbl=(Label)this.DataListImage.Controls[0]. FindControl("lblTotalImage");

        if(lbl!=null)

        {

        lbl.Text="共找到"+rs.Tables[0].Rows.Count.To-String()+"件商品";

        }

        }

        else

        SmallScript.MessageBox(this,"沒有匹配的商品");

        }

        }3結(jié)束語

        本文介紹的基于圖片內(nèi)容的商品信息檢索系統(tǒng),能夠通過商品類別和提交要購買的商品圖片,根據(jù)商品的內(nèi)容(如商品形狀、顏色)在商品庫進行查找,查找到的商品結(jié)果明顯大幅減少,能更符合用戶的查找要求,能夠提高商品查找的查準(zhǔn)率和查全率。由于對商品進行提取圖像特征要耗費大量的時間,存放海量圖片也要占用大量的存儲空間,服務(wù)器進行圖像特征值比較也要占用較長的時間,本文所使用的圖片例子大約10 000個,離實際商業(yè)使用還有差距,隨著技術(shù)的飛速發(fā)展,將來必能實現(xiàn)海量圖片內(nèi)容查詢商業(yè)使用。

        [1]竇建軍,文俊,劉重慶.基于顏色直方圖的圖像檢索技術(shù)[J].紅外與激光工程,2005,34(1):84-87.

        [2]周支元,周素萍.一種基于圖像內(nèi)容檢索技術(shù)的數(shù)字視頻水印算法[J].計算技術(shù)與自動化,2011,30(3):100-104.

        [3]王彤,魏成光.數(shù)字圖像信息的組織和檢索[J].情報科學(xué),2005,23(11):1708-1713.

        [4]周立柱,林玲.聚焦爬蟲技術(shù)研究綜述[J].計算機應(yīng)用,2005,25(9):1965-1969.

        (責(zé)任編輯:潘修強)

        Commodity Information Retrievable System Based On Image Content

        LI Hao-hong
        (College of Information and Communications,Zhejiang Industry&Trade Vocation al College,Wenzhou,325003,China)

        The paper introduces the retrievable algorithm and prototype system based on image content.After users submit image file,the system can abstract the submitted image's key features,then compare them with all image's features in system database, which reduces the retrieval image result set and improves the retrieve all ratio and the retrieve accurate ratio.

        commodity;image;retrieve;.NET Framework

        TP317.4

        A

        1672-0105(2015)03-0046-04

        10.3969/j.issn.1672-0105.2015.04.012

        2015-09-08

        基于圖片內(nèi)容的商品信息檢索系統(tǒng)(X140104)

        黎浩宏,碩士,浙江工貿(mào)職業(yè)技術(shù)學(xué)院副教授,研究方向:數(shù)據(jù)庫、圖形圖像、計算機應(yīng)用等。

        猜你喜歡
        商品信息爬蟲特征值
        中國商品信息服務(wù)平臺
        商品信息
        軍事文摘(2023年18期)2023-10-31 08:11:40
        利用網(wǎng)絡(luò)爬蟲技術(shù)驗證房地產(chǎn)灰犀牛之說
        一類帶強制位勢的p-Laplace特征值問題
        基于Python的網(wǎng)絡(luò)爬蟲和反爬蟲技術(shù)研究
        單圈圖關(guān)聯(lián)矩陣的特征值
        備戰(zhàn)雙十一
        利用爬蟲技術(shù)的Geo-Gnutel la VANET流量采集
        電子測試(2018年1期)2018-04-18 11:53:04
        大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)
        電子制作(2017年9期)2017-04-17 03:00:46
        商品信息標(biāo)準(zhǔn)化助力電子商務(wù)健康發(fā)展
        久久视频在线视频精品| 9 9久热re在线精品视频| 欧美激情内射喷水高潮| 性做久久久久久久| 亚洲中文字幕国产剧情| 日日碰狠狠添天天爽超碰97久久| 婷婷亚洲久悠悠色悠在线播放| 99ri国产在线观看| 日韩一二三四区免费观看| 日本一区二区在线高清观看| 色一情一区二区三区四区| 欧美中文字幕在线| 亚洲成av在线免费不卡| 日本一区二区三区人妻| 亚洲欧美国产国产综合一区| 亚洲国产麻豆综合一区| 日本熟妇免费一区二区三区| 亚洲国产a∨无码中文777| 东北寡妇特级毛片免费| 日韩爱爱视频| 国产自拍一区二区三区| 欧美不卡一区二区三区| 国产精品免费久久久久影院| 麻豆AV无码久久精品蜜桃久久 | 亚洲精品午夜无码专区| 亚洲va欧美va| 人妻av中文字幕精品久久| 精品无码久久久久久久久水蜜桃| 中文字幕一区二区人妻| 99久久这里只精品国产免费| 日韩女优视频网站一区二区三区 | 久久精品不卡一区二区三区| 99热这里有精品| 国产精品18久久久久网站| 一区二区三区一片黄理论片| a级国产乱理伦片| 狠狠色婷婷久久一区二区| 国产高清精品在线二区| 职场出轨的人妻中文字幕| 亚洲av日韩av综合| 男女高潮免费观看无遮挡|