黃 輝,張 濤,談 璽,楊德利
(1.中國電信股份有限公司廣東研究院 廣州 510630;2.廣州必視谷信息技術(shù)有限公司 廣州 510640)
基于可視化搜索技術(shù)的新一代3G移動電子商務(wù)
黃 輝1,張 濤1,談 璽2,楊德利1
(1.中國電信股份有限公司廣東研究院 廣州 510630;2.廣州必視谷信息技術(shù)有限公司 廣州 510640)
論述了可視化搜索技術(shù)的基本原理及其在3G互聯(lián)網(wǎng)電子商務(wù)中的應(yīng)用。通過把可視化搜索技術(shù)與3G電子商務(wù)結(jié)合起來,形成嶄新的移動可視化電子商務(wù)模式,該模式利用了3G網(wǎng)絡(luò)的優(yōu)點,同時也充分利用了手機及其攝像頭這一信息獲取方式,是對傳統(tǒng)無線電子商務(wù)的突破性擴展。
可視化搜索;移動電子商務(wù);移動互聯(lián)網(wǎng)
目前,依托寬帶互聯(lián)網(wǎng)的電子商務(wù)模式,在3G市場移動數(shù)據(jù)傳輸速度達到一定水平的情況下,將會衍生出新的基于3G網(wǎng)絡(luò)的手機電子商務(wù)的商業(yè)模式。相比于現(xiàn)有的電子商務(wù)模式,基于移動通信網(wǎng)絡(luò)的手機電子商務(wù),能讓用戶隨時隨地地進行電子商務(wù)活動,能最大程度地抓住人們沖動性消費的商機,也就能創(chuàng)造更多的電子商務(wù)效益。
當(dāng)然,對于手機這種便攜性較強的設(shè)備,用戶操作受到諸多限制,如何采用有別于傳統(tǒng)有線互聯(lián)網(wǎng)的用戶人機交互方式,是形成完整無線3G電子商務(wù)的關(guān)鍵。針對這一關(guān)鍵問題,可視化搜索技術(shù)的出現(xiàn),將大大改善手機電子商務(wù)的整體環(huán)境。
可視化搜索技術(shù)基于圖像檢索技術(shù),從基本原理上講,圖像檢索技術(shù)主要分為兩大類:基于文本的圖像檢索技術(shù)和基于內(nèi)容的圖像檢索技術(shù)。
基于文本的圖像檢索技術(shù)始于20世紀(jì)70年代,即利用文本描述的方式表示圖像的特征,并利用相應(yīng)的文字檢索引擎對圖片進行檢索。這種技術(shù)的特點是簡單、易于理解,但是很難找到客觀描述圖像的關(guān)鍵字。自20世紀(jì)90年代以來,基于內(nèi)容的圖像檢索技術(shù)得到了長足發(fā)展[1,2],該技術(shù)利用圖像的顏色、形狀、紋理、輪廓、對象的空間關(guān)系等基本視覺特征進行匹配、查找(即檢索)。目前一些著名的圖像檢索系統(tǒng)相繼被推出,有IBM的QBIC系統(tǒng)[3]、哥倫比亞大學(xué)開發(fā)的Visual-SEEK[4,5]、MIT多媒體實驗室開發(fā)的Photo-Book[6]和 UC Berkeley開發(fā)的Chabot[7]系統(tǒng)等。
隨著計算機技術(shù)和國際互聯(lián)網(wǎng)的飛速發(fā)展,圖像數(shù)量正以驚人的速度增長,并且互聯(lián)網(wǎng)上海量圖像的數(shù)量和來源途徑均不確定,如何對這些圖片進行檢索是一個關(guān)鍵和迫切的問題。目前,國際IT業(yè)巨擎都在這一新興領(lǐng)域投入了大量資金展開研究及商業(yè)活動。美國谷歌(Google)、微軟(Microsoft)、雅虎(Yahoo)等提供的圖像檢索服務(wù),采用的都是文本標(biāo)注的方式,即建立文字與網(wǎng)頁中圖像的標(biāo)注和索引。
近年來,谷歌、微軟、諾基亞等國內(nèi)外IT企業(yè)都在開展基于圖像內(nèi)容的圖像檢索技術(shù)研究,在一定地區(qū)范圍內(nèi)推出了有限的圖像搜索服務(wù),并嘗試著讓本技術(shù)服務(wù)于電子商務(wù)。谷歌于2009年12月份推出基于可視化搜索技術(shù)的手機拍照搜索服務(wù)應(yīng)用“Goggles”,可同時進行圖像和文字識別搜索服務(wù)。2009年6月美國電子商務(wù)巨擎亞馬遜(Amazon)收購圖像搜索技術(shù)公司SnapTell,并將其可視化搜索技術(shù)整合應(yīng)用到電子商務(wù)平臺。
基于以上對圖像搜索技術(shù)的介紹,綜合現(xiàn)在手機平臺傳感器及機器性能的特點,利用手機攝像頭結(jié)合可視化搜索技術(shù),實現(xiàn)用戶對感興趣物體的一鍵拍照搜索,從而進一步導(dǎo)引電子商務(wù)活動。整體的移動可視化電子商務(wù)系統(tǒng)業(yè)務(wù)流程如圖1所示。
通過在手機客戶端引入可視化搜索功能,把舊有的移動電子商務(wù)平臺,升級為具有視覺感知能力的、更貼近用戶使用體驗的新一代電子商務(wù)平臺,完全有能力實現(xiàn)對用戶全天候移動終端的電子商務(wù)活動。
基于圖1的技術(shù)架構(gòu),移動可視化電子商務(wù)的技術(shù)架構(gòu)如圖2所示,需要集中解決以下系統(tǒng)環(huán)節(jié)。
系統(tǒng)的核心功能單元可視化搜索引擎及相關(guān)技術(shù),在整個可視化電子商務(wù)領(lǐng)域里都屬于最核心的部分,它是一切業(yè)務(wù)的基礎(chǔ),在此基礎(chǔ)上,形成一套完整的可視化搜索引擎體系??梢暬阉饕嬗蓤D像精確識別和圖像語義相似度匹配技術(shù)組成,圖像精確識別功能單元可以通過形狀、紋理、輪廓等來對圖像進行精確匹配與識別,從而開展相關(guān)的電子商務(wù)活動;而圖像語義相似度匹配,則通過顏色、紋理、模板等方面,通過模糊匹配技術(shù),尋找最接近于原圖像的目標(biāo)圖像。
通過第三方技術(shù)授權(quán)的合作方式,與第三方合作伙伴進行合作,提供可視化搜索服務(wù)。通過此服務(wù),達到推廣使用可視化搜索服務(wù)的目的;同時,通過這樣的實際應(yīng)用,完善自有互聯(lián)網(wǎng)圖片數(shù)據(jù)自動采集與分析的機制。
在可視化搜索引擎的基礎(chǔ)上,構(gòu)建可視化電子商務(wù)平臺,在業(yè)務(wù)層面為各種電子商務(wù)模式提供定制搜索系統(tǒng)。
可視化搜索引擎需要對用戶數(shù)據(jù)分析與挖掘環(huán)節(jié)做大量的研究工作。在前兩個階段里,可視化搜索引擎及電子商務(wù)平臺將采集到大量的用戶點擊數(shù)據(jù),通過分析這些第一手的用戶數(shù)據(jù),輔以專家的分類訓(xùn)練,可以得到更接近人類思維的可視化搜索結(jié)果。
下面就對其中涉及的關(guān)鍵環(huán)節(jié)給予進一步的論述。
可視化搜索技術(shù)的目的是對圖片庫進行圖像檢索,即核心技術(shù)是圖像檢索算法,主要涉及的技術(shù)包括圖像匹配識別、圖像檢索、大規(guī)模并行處理等技術(shù)。圖像檢索技術(shù)必定是以提高圖像的查準(zhǔn)率、查全率和查詢速度為目標(biāo)。
圖1 移動可視化搜索系統(tǒng)架構(gòu)
圖2 移動可視化電子商務(wù)技術(shù)架構(gòu)
從目前的可視化搜索技術(shù)及電子商務(wù)的發(fā)展現(xiàn)狀來看,主要面臨幾大關(guān)鍵技術(shù)需要著重解決。
3.3.1 圖像檢索算法里提取特征值的方法
互聯(lián)網(wǎng)上的圖像數(shù)量和圖像來源途徑均具有不確定性,捕獲圖像的共同點十分困難。用傳統(tǒng)的圖像檢索方法對這些圖像進行檢索,其效果遠(yuǎn)不能令人滿意,主要的瓶頸介紹如下。
(1)關(guān)鍵點的提取、存儲、匹配
在關(guān)鍵點的處理上,目前通常采用大維向量、結(jié)構(gòu)存儲、逐一匹配,這直接導(dǎo)致圖片庫的容量受限和搜索效率的低下。
(2)圖像語義層的信息描述缺失
在圖像識別的技術(shù)層面上,目前的解決方案更多的是僅僅考慮了圖像顏色、紋理、形狀和輪廓等低層物理特征,沒有考慮到圖像內(nèi)容的塊狀特征、形狀特征、對比度特征等更多維豐富信息在圖像識別中的作用。
(3)缺乏有效的用戶反饋機制
現(xiàn)有的圖像檢索技術(shù),并沒有充分利用用戶參與圖像分析,沒有使用數(shù)據(jù)挖掘技術(shù)客觀分析與學(xué)習(xí)圖像信息與所處搜索結(jié)果的相關(guān)性。
(4)現(xiàn)有圖像檢索算法難以適應(yīng)互聯(lián)網(wǎng)電子商務(wù)的應(yīng)用需求
隨著互聯(lián)網(wǎng)圖像數(shù)量越來越多、來源途徑越來越復(fù)雜,基于顏色和紋理的傳統(tǒng)圖像檢索算法將無法滿足檢索需要,必須從圖像的形狀、塊狀、對比度、空間關(guān)系等特征著手,建立新的圖像檢索算法。
3.3.2 對圖像多維特征進行存儲與快速搜索的技術(shù)
不管使用何種算法來對圖像進行特征提取,最后都面臨一個圖像特征庫保存與搜索的問題。當(dāng)一個圖像用多維特征來進行描述后,如何對這個特征庫進行快速的搜索與匹配,成了圖像檢索技術(shù)的瓶頸問題。
搜索速度對于可視化搜索電子商務(wù)的影響尤其重要。在電子商務(wù)的應(yīng)用領(lǐng)域內(nèi),更加強調(diào)用戶體驗,如何提供更加符合用戶搜索習(xí)慣與使用習(xí)慣的可視化搜索方案,是當(dāng)前可視化搜索需要解決的主要問題。
有效的圖像特征讀寫機制,可以為特征的快速搜索提供有力的支撐,尤其是在電子商務(wù)應(yīng)用擴大后,圖像數(shù)量與日俱增,更加需要有效的圖像特征讀寫機制。這個機制有別于傳統(tǒng)數(shù)據(jù)庫,需要專門進行設(shè)計。
上述實現(xiàn)的可視化搜索技術(shù),具有傳統(tǒng)文本關(guān)鍵字搜索所不可比擬的優(yōu)勢,應(yīng)用于手機領(lǐng)域,不僅能大大減少用戶在手機端的輸入,還能大大避免文字描述圖像內(nèi)容帶來的不準(zhǔn)確性。應(yīng)用這種可視化移動搜索技術(shù),同樣面臨以下幾大難題。
(1)無線圖片傳輸?shù)乃俣葐栴}
用戶查詢的圖片以及結(jié)果圖片,在無線網(wǎng)絡(luò)傳輸,都需要耗費大量的帶寬,尤其是在需要用戶反復(fù)地搜索與查找的應(yīng)用場景里,無線網(wǎng)絡(luò)的速度及穩(wěn)定性將是挑戰(zhàn)。為從根本上解決圖片內(nèi)容傳輸?shù)膯栴},需要把更多圖片預(yù)處理的功能放在手機終端,實現(xiàn)圖片采集終端更加智能化的實現(xiàn)。
(2)結(jié)果內(nèi)容的展示方式
在無線終端上的電子商務(wù)展示形式,需要專門進行研究與定制,以適應(yīng)手機用戶的使用習(xí)慣。結(jié)合現(xiàn)在的電子商務(wù)形式,可以綜合考慮用多角度的圖片、立體模型以及增強現(xiàn)實技術(shù)來多角度展示電子商務(wù)內(nèi)容。
(3)適配無線終端的電子商務(wù)操作方式
移動可視化搜索電子商務(wù)的最終產(chǎn)品設(shè)想,將有別于其他形式:手機用戶通過安裝移動可視化搜索手機客戶端,在看到了有興趣深入了解的圖片時,可以對該圖片進行拍攝,并顯示后臺服務(wù)器返回的相關(guān)搜索信息。通過使用可視化移動搜索系統(tǒng),手機用戶可以靈活、快速、準(zhǔn)確地搜索與視覺信息相關(guān)的產(chǎn)品數(shù)據(jù),顛覆傳統(tǒng)的以關(guān)鍵字為核心的搜索技術(shù),以最直觀的影像表達方式來實現(xiàn)信息搜索。
基于移動可視化搜索技術(shù)帶來的高用戶流量以及信息的高度關(guān)聯(lián),完全可以打造一個完整的可視化搜索電子商務(wù)平臺。電信運營商可以通過手機客戶端,方便用戶調(diào)用攝像頭進行圖像采集并上傳的工作,在后臺服務(wù)器通過可視化搜索技術(shù)進行圖像識別,通過識別出來的目標(biāo)物體為移動用戶提供完整的可視化搜索電子商務(wù)服務(wù)。
根據(jù)可視化搜索引擎的技術(shù)特點,可以實現(xiàn)圖像精確匹配與識別、圖像語義相擬度匹配等兩種類型的可視化搜索引擎,對應(yīng)于這兩種技術(shù),可以實現(xiàn)不同類型的電子商務(wù)平臺。
對于一些具有標(biāo)準(zhǔn)圖像的產(chǎn)品,可采用圖像精確識別算法和標(biāo)準(zhǔn)圖像庫的形式,來打造可視化搜索引擎,從而提供基于精確識別的可視化搜索電子商務(wù)。對于這一模式,用戶只需要拍攝標(biāo)準(zhǔn)圖像,可視化搜索引擎就可以準(zhǔn)確地知道用戶希望獲得的產(chǎn)品信息。這一技術(shù),主要可以應(yīng)用在以下場景。
(1)訂票
通過可視化搜索技術(shù),對電影海報、音樂會海報進行拍攝、搜索,從而進行購票和確認(rèn),還可以提供團體訂票等服務(wù)。移動電子商務(wù)使用戶能在票價優(yōu)惠或取消時立即得到通知,借助可視化搜索技術(shù),用戶可以以最簡單的接入方式瀏覽電影剪輯、閱讀評論,然后訂購鄰近電影院的電影票。
(2)購物
通過可視化搜索客戶端,用戶能夠通過其移動通信設(shè)備進行網(wǎng)上購物。即興購物會是一大增長點,如看到友好提示的商標(biāo)、物品標(biāo)志,拍照搜索后即可直接訂購該商品。傳統(tǒng)購物也可通過可視化搜索技術(shù)來進行商品搜索。
(3)娛樂
移動可視化電子商務(wù)將帶來一系列娛樂服務(wù)。用戶不僅可以從他們的移動設(shè)備上收聽音樂,還可以拍照搜索感興趣的唱片封面、演唱會海報等,訂購、下載或支付特定的曲目,并且可以在網(wǎng)上與朋友們玩交互式游戲,還可以游戲付費,并進行快速、安全的博彩和游戲。
據(jù)分析,用戶很大一部分的購物消費,是通過類比的方式來產(chǎn)生的。例如,當(dāng)用戶看到好友穿了一件好看的襯衣,他也希望能購買類似風(fēng)格的襯衣,但是又不希望與好友的衣服完全類似。這時,通過圖像的語義相似度匹配技術(shù),可以打造基于圖像語義相似度匹配的可視化搜索電子商務(wù)模式,實現(xiàn)以下幾種類型的電子商務(wù)。
(1)服飾購買
通過讓用戶拍攝樣板衣服,可視化搜索引擎可通過模板匹配、紋理、特征等語義匹配,有根據(jù)地輸出同樣風(fēng)格、類型的衣服搜索結(jié)果給用戶挑選,從而方便地實現(xiàn)購買、好友推薦等電子商務(wù)活動。此種類型的電子商務(wù)有很廣闊的適用場景,最重要的是,它提供給用戶一種用非語言的方式來描述想購買商品的途徑,讓商家以更直觀的方式對用戶進行導(dǎo)購等。
(2)輪廓性商品描述及商品購買
很多情況下,用戶可能只保留了對以前見過的某種商品的模糊記憶,或者只是單純地想找某一種輪廓、外形的商品,但是對這一商品并不具備更具體的印象,很難用語言來對該商品進行描述。這個時候,通過輪廓識別打造可視化搜索引擎,可讓用戶畫出商品的簡筆畫,通過可視化客戶端拍攝并進行商品搜索,從而找到類似形狀的商品。這一操作,可大大縮短用戶操作,也免去了用戶用語言來進行商品外觀描述。最重要的是,本模式提供給用戶從最基本的信息發(fā)散尋找商品的機會,盡最大努力去挖掘潛在商機。這一功能為智能程度更高的電子商務(wù)模式,需要更加豐富的商品數(shù)據(jù)庫、更加智能化的可視化搜索技術(shù)進行支撐。
針對現(xiàn)有高端智能手機默認(rèn)搭載了越來越多的傳感器(如GPS定位傳感器、重力傳感器、電子羅盤等),移動可視化電子商務(wù)完全可以針對這一部分高端用戶,來進行顯示模型的特殊化定制,以期提供更友好的電子商務(wù)界面。
利用 GPS定位,結(jié)合電子羅盤、重力傳感器等,利用增強現(xiàn)實來實現(xiàn)實景和虛擬景物的疊加,可以更加直觀的方式來提供物品導(dǎo)購、簽到優(yōu)惠,甚至于以增強現(xiàn)實的形式來提供游戲的功能,形成社會化應(yīng)用,從而提供團購、會員等多樣化電子商務(wù)功能。
目前,移動電子商務(wù)在我國已經(jīng)完成了起步階段,正在進入大規(guī)模爆炸式增長的階段,移動電子商務(wù)模式和平臺技術(shù)還在摸索中前進。移動可視化電子商務(wù)作為一種新型的電子商務(wù)模式,利用了移動無線網(wǎng)絡(luò)的優(yōu)點,同時也充分利用了手機及其攝像頭這一信息獲取方式,是對傳統(tǒng)無線電子商務(wù)的突破性擴展。盡管目前移動可視化電子商務(wù)的開展還存在安全與帶寬等很多問題,但是與傳統(tǒng)的無線電子商務(wù)方式相比,通過可視化搜索技術(shù)能帶給用戶全新的電子商務(wù)體驗,將成為移動電子商務(wù)突破的一個新方向。
1 黃祥林,沈蘭蓀.基于內(nèi)容的圖像檢索技術(shù)研究.電子學(xué)報,2002,30(7)
2 徐杰,施鵬飛.基于內(nèi)容的圖像檢索技術(shù).中國圖像圖形學(xué)報,2003,8(A9)
3 FL I M,Sawhney H,Niblackw,et al.Query by image and video content:the QBIC system.IEEE Comp uter,1995,28(9)
4 Smith J R,Chan G.Visual Seek:a fully automated content2based image query system.http://citeseer.ist.psu.edu/smith96visual seek.htm1
5 Smith J R,Chan G.Local color and text ure ext raction and spatial query.http://iee2explore.ieee.org/ie13/4140/12210/00560998.pdf?arnumber=560998
6 Pen Tland A,Picard R W,Sclaroffs.Photobook:content2Based manipulation of image databases.International Journal of Computer Vision,1996,18(3)
7 Stonebra K M.Chabot:retrieval from a relational database of images.IEEE Computer,1995,28(9)
8 肖志輝.移動互聯(lián)網(wǎng)研究綜述.電信科學(xué),2009,25(10)
9 羅志強,沈軍.移動電子商務(wù)用戶溯源認(rèn)證技術(shù)研究與應(yīng)用.電信科學(xué),2009,25(6)
10 金鐸,徐雄,梁冰,李云.號百電子商務(wù)平臺架構(gòu)建設(shè)探討.電信科學(xué),2010,26(8)
A New Generation of 3G Mobile e-Commerce Based on Visual Search Technology
Huang Hui1,Zhang Tao1,Tan Xi2,Yang Deli1
(1.Guangdong Research Institute of China Telecom Co.,Ltd.,Guangzhou 510630,China;2.Guangzhou PixCoo Information Technologies Co.,Ltd.,Guangzhou 510640,China)
The paper presents the basic theory of visual search technology,and discusses its application over 3G mobile Internet.By integrating 3G and e-commerce with visual search technology,we can create a brand new mobile visual e-commerce business model.This business model breaks through the limitation of traditional mobile e-commerce while it gives us the chance to make full use of the high speed advantage of 3G mobile network,and maximizes the human-computer interaction benefit of cellular phone’s camera to snap the image of an object to further do understanding and shopping.
visual search,mobile e-commerce,mobile Internet
2011-04-28)