周力恒 金陽 康軼澤 王彬 趙連啟
摘 要:隨著智能移動終端的普及,以其便捷性、便攜性、實時性等特點,顛覆了傳統(tǒng)PC電子商務(wù)模式。移動電子商務(wù)成為了電子商務(wù)發(fā)展的未來趨勢,以其空前無限生命力推動著部門經(jīng)濟(jì)、區(qū)域經(jīng)濟(jì)、國民經(jīng)濟(jì)和世界經(jīng)濟(jì)躍上了一個新的臺階。隨著移動電子商務(wù)在全球迅速普及,并形成爆炸性增長,購物搜索將成為互聯(lián)網(wǎng)搜索中的重要分支。基于圖像搜索的購物方式,或利用拍照后直接搜索呈現(xiàn)出拍照商品的方式,將更高效、更便捷地獲取到目標(biāo)商品,帶來了全新的搜索模式,極佳的用戶體驗。
關(guān)鍵詞:圖形圖像搜索 以圖搜圖 移動電子商務(wù)
中圖分類號:G350 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2016)04(a)-0090-04
1 基于移動電子商務(wù)的圖形圖像搜索
移動電子商務(wù),移動設(shè)備輕便易攜、碎片化、娛樂化特征明顯,可隨時隨地滿足用戶的即時性消費需求,由此,移動終端日漸成為用戶網(wǎng)上購物的重要選擇。同時,移動購物和生活場景相互交融,偶發(fā)性和沖動型消費快速滋長,電商情境化趨勢日益彰顯;另一方面,智能移動終端對音頻、視頻、圖像等各類信息采集方便,以圖片為例,其中適合圖像搜索的圖片為20%,假設(shè)0.5%人次成功轉(zhuǎn)移,1%平均購買轉(zhuǎn)化率,平均購物單價為200元,如,按平均10%的傭金計算,那么一年產(chǎn)業(yè)規(guī)模也超過220億元。加上其他收入,比如:廣告、手機(jī)搜索等,總體市場規(guī)模不低于600億元。
隨著移動電子商務(wù)日益興起,圖形圖像搜索已能為客戶帶來全新的用戶體驗。在購物領(lǐng)域,非常典型的就是服裝服飾等非標(biāo)類產(chǎn)品,占到整個電子商務(wù)的55%市場份額。淘寶用戶只要看到了目標(biāo)商品,就可以使用圖片搜索功能對比同款產(chǎn)品的市場價格,也能找到更多相似款。這是移動電子商務(wù)能帶來的極致便捷體驗。圖形圖像搜索技術(shù)一直受到巨頭們的青睞,百度為深入研究“深度學(xué)習(xí)”算法,特地設(shè)立了IDL(Institute of Deep Learning)研究院。谷歌更是在短短幾年內(nèi),陸續(xù)收購了七八家涉足圖像識別的技術(shù)公司,并試圖以谷歌眼鏡搶占智能移動終端的場景入口。圖圖搜利用微信公眾號,以微信拍照購物搜索功能,率先成為第一家接入微信的圖像搜索引擎網(wǎng)站。谷歌、騰訊、百度等大公司也都在圖片搜索領(lǐng)域有資源投入,為圖片購物搜索發(fā)展帶來了壓力的同時,更為市場帶來了各大圖像技術(shù)競相追逐的動力。
2 典型應(yīng)用舉例
2.1 手機(jī)購物網(wǎng)站相似商品搜索
可以是用戶上傳圖片搜索,也可以是站內(nèi)圖片點擊搜索。(如圖1所示)
2.2 移動拍照購物
隨手拍照—— 準(zhǔn)確搜到相關(guān)商品。(如圖2所示)
2.3 區(qū)域搜索
給定一張時尚或明星圖片,根據(jù)自主的圖片選定區(qū)域,能夠識別與圖片選定區(qū)域內(nèi)容相似的其他商品圖片,然后根據(jù)相似度排序。(如圖3所示)
3 關(guān)鍵技術(shù)總結(jié)
3.1 圖像搜索系統(tǒng)結(jié)構(gòu)
基于移動電子商務(wù)的圖形圖像搜索技術(shù),通常的做法包括IEEE的標(biāo)準(zhǔn),都是用圖像特征值來實現(xiàn)的。搜索引擎將目標(biāo)圖片進(jìn)行特征提取,形成一組特征描述或特征向量。當(dāng)用戶搜索時,將查詢圖像的特征描述與數(shù)據(jù)庫中其他圖像的特征描述進(jìn)行自動匹配,并返回匹配結(jié)果。(如圖4所示)
3.2 核心技術(shù)
上述圖像搜索系統(tǒng)的技術(shù)核心就是對圖像特征的提取,特征提取是計算機(jī)視覺和圖像處理中的一個概念。它指的是使用計算機(jī)提取圖像信息,決定每個圖像的點是否屬于一個圖像特征。特征被檢測后它可以從圖像中被抽取出來,這個過程可能需要許多圖像處理的計算機(jī),其結(jié)果被稱為特征描述或者特征向量。
常用的圖像特征有顏色(Color)、紋理(Texture)、形狀(Shape)、空間(Space)關(guān)系等。
(1)顏色特征:顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對應(yīng)的景物的表面性質(zhì)。一般顏色特征是基于像素點的特征,此時所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻(xiàn)。顏色直方圖是最常用的表達(dá)顏色特征的方法,其優(yōu)點是不受圖像旋轉(zhuǎn)和平移變化的影響,進(jìn)一步借助歸一化還可不受圖像尺度變化的影響,其缺點是沒有表達(dá)出顏色空間分布的信息。此外,顏色特征提取還有顏色集、顏色矩、顏色聚合向量、顏色相關(guān)圖等方法。
(2)紋理特征:紋理特征也是一種全局特征,它與顏色特征不同,紋理特征不是基于像素點的特征,它需要在包含多個像素點的區(qū)域中進(jìn)行統(tǒng)計計算。在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會由于局部的偏差而無法匹配成功。在檢索具有粗細(xì)、疏密等方面較大差別的紋理圖像時,利用紋理特征是一種有效的方法。常用的紋理特征提取與匹配方法有灰度共生矩陣、Voronio棋盤格特征法和結(jié)構(gòu)法、隨機(jī)場模型法、Tamura紋理特征、自回歸紋理模型、小波變換等。
(3)形狀特征:各種基于形狀特征的檢索方法都可以比較有效地利用圖像中感興趣的目標(biāo)來進(jìn)行檢索。通常情況下,形狀特征有兩類表示方法:一類是輪廓特征;另一類是區(qū)域特征。圖像的輪廓特征主要針對物體的外邊界,而圖像的區(qū)域特征則關(guān)系到整個形狀區(qū)域。典型的形狀特征描述方法有傅里葉形狀描述符法、Hough變換檢測平行直線方法、有限元法(Finite Element Method或FEM)、旋轉(zhuǎn)函數(shù)(Turning)和小波描述符(Wavelet Deor)等方法。
(4)空間關(guān)系特征:所謂空間關(guān)系,是指圖像中分割出來的多個目標(biāo)之間的相互的空間位置或相對方向關(guān)系,這些關(guān)系也可分為連接/鄰接關(guān)系、交疊/重疊關(guān)系和包含/包容關(guān)系等,空間關(guān)系特征的使用可加強(qiáng)對圖像內(nèi)容的描述區(qū)分能力。提取圖像空間關(guān)系特征可以有兩種方法:一種方法是首先對圖像進(jìn)行自動分割,劃分出圖像中所包含的對象或顏色區(qū)域,然后根據(jù)這些區(qū)域提取圖像特征;另一種方法則簡單地將圖像均勻地劃分為若干規(guī)則子塊,然后對每個圖像子塊提取特征。
自從Hinton在2012年將深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)帶入到圖像分類領(lǐng)域后,深度學(xué)習(xí)在圖像處理相關(guān)領(lǐng)域的研究一下子變得異?;馃崞饋?。基于深度學(xué)習(xí)原理的圖像檢索,更多的是從一種圖像理解的角度來進(jìn)行的,得到的是一種更加抽象的描述,也可以理解為“語義”,它更多的是在解釋這個圖像描繪的是什么物體或者什么場景之類的。這種仿照人腦的識別過程而設(shè)計的深度神經(jīng)網(wǎng)絡(luò)能夠自動提取圖片中的語義信息,彌補(bǔ)了其他傳統(tǒng)算法在這方面的不足。(如圖5所示)
3.3 應(yīng)用集成設(shè)計
應(yīng)用集成設(shè)計如圖6所示。
3.4 系統(tǒng)關(guān)鍵技術(shù)指標(biāo)
(1)該平臺表現(xiàn)出良好的用戶服務(wù)支持能力。經(jīng)系統(tǒng)實際運行測試,目前平臺已入駐企業(yè)近萬家,平臺運行平穩(wěn),響應(yīng)速度快,具有良好的用戶體驗。(2)項目自上線以來,該平臺運行平穩(wěn),在高性能單服務(wù)器上支持并發(fā)搜索5 000以上。(3)擁有的圖像算法,搜索結(jié)果效率高,核心算法庫搜索響應(yīng)速度<1 s。(4)高效的海量數(shù)據(jù)檢索,準(zhǔn)確的復(fù)雜場景提取,兼容對多元化信息數(shù)據(jù),平均提取海量數(shù)據(jù)響應(yīng)速度<1 s。(5)可視化索引技術(shù),采用高度并行的多核心圖形處理單元(Graphics Processing Unit),模仿人腦細(xì)胞進(jìn)行并行高速特征提取和目標(biāo)分類,搜索準(zhǔn)確率高達(dá)98%以上。(6)通過基于云的信息架構(gòu)和數(shù)據(jù)管理模型來取代傳統(tǒng)模型,動態(tài)擴(kuò)展服務(wù)集群時間<1 s。(7)通過這個基于云的數(shù)據(jù)存儲模式,節(jié)點間的信息共享和信息整合變得更加有效。支持TB級數(shù)據(jù)存儲。目前可視化商品搜索數(shù)據(jù)庫,收錄產(chǎn)品百萬以上。
4 產(chǎn)業(yè)機(jī)遇與面臨問題
圖像搜索,可以簡單地認(rèn)為是“以圖搜圖”,但又不只是圖像識別這么簡單。如果把圖像搜索等同于圖片識別,它并不算什么高超的技術(shù),不同領(lǐng)域的圖像識別技術(shù)已經(jīng)趨于成熟。識別只是圖像搜索的第一步,第二步是理解,第三步是檢索,每一步都存在著技術(shù)難點。在移動互聯(lián)網(wǎng)時代,圖片已逐漸替代文字成為了移動終端的主要信息載體,圖形圖像搜索以圖搜圖的產(chǎn)品特點,天然貫通了移動終端到電子商務(wù)平臺圖片信息傳遞的過程,利用圖像搜索服務(wù)來引導(dǎo)移動電子商務(wù)消費已成為趨勢。
5 圖形圖像搜索的發(fā)展方向
在移動電子商務(wù)領(lǐng)域內(nèi),對比其他搜索產(chǎn)品,將對以下三點技術(shù)指標(biāo)進(jìn)行重點研究和提升:(1)實現(xiàn)“所見即所得”,讓圖像搜索由被動到主動;(2)實現(xiàn)動態(tài)圖像搜索,手機(jī)網(wǎng)絡(luò)視頻購物;(3)實現(xiàn)移動場景下對“線下實體”的搜索,成為用戶的第三只眼。
參考文獻(xiàn)
[1]余飛.基于HTML5的圖形圖像協(xié)同處理技術(shù)研究與實現(xiàn)[D].長江大學(xué),2015.
[2]陳微微.基于顏色特征提取的圖像搜索引擎研究[D].重慶理工大學(xué),2012.
[3]夏定元.基于內(nèi)容的圖像檢索通用技術(shù)研究及應(yīng)用[D].華中科技大學(xué),2004.
[4]周力恒.圖像的搜索在電商領(lǐng)域的發(fā)展與實現(xiàn)[C]//中國報業(yè)協(xié)會電子技術(shù)工作委員會編.全國報社新聞工作會議暨2015中國報業(yè)技術(shù)年會論文集.北京:中國報業(yè)協(xié)會電子技術(shù)工作委員會.2015.