亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        新型海淘購物比價引擎方案設(shè)計

        2016-12-15 02:47:14馬龍飛
        軟件 2016年11期
        關(guān)鍵詞:商品信息比價引擎

        馬龍飛

        (北京郵電大學(xué)網(wǎng)絡(luò)技術(shù)研究院寬帶網(wǎng)研究中心,北京 100876)

        新型海淘購物比價引擎方案設(shè)計

        馬龍飛

        (北京郵電大學(xué)網(wǎng)絡(luò)技術(shù)研究院寬帶網(wǎng)研究中心,北京 100876)

        海淘在經(jīng)過最近幾年的發(fā)展,已經(jīng)成為很多中國消費(fèi)者的購物方式之一。除了商家選擇、商品購買、商品轉(zhuǎn)運(yùn)外,消費(fèi)者最看重的環(huán)節(jié)之一便是價格比對。但是,目前大多數(shù)比價引擎僅支持英文或中文表述的網(wǎng)站,極少可以把對應(yīng)的跨境商品進(jìn)行價格比較。因此,本文提出一種能進(jìn)行國內(nèi)外相同商品比價的方案,通過以美中兩國Amazon購物網(wǎng)站進(jìn)行比價搜索,實現(xiàn)更好的比價效果。系統(tǒng)會結(jié)合翻譯模塊,能夠讓用戶用中文或英文進(jìn)行商品搜索。在收到用戶搜索請求之后,會優(yōu)先審查本地數(shù)據(jù)庫是否包含用戶之前的搜索記錄,如果有則反饋本地記錄,如果沒有則實時抓取美中兩國Amazon相應(yīng)商品信息。另外,雖然很多比價引擎能夠識別中文搜索,但識別精準(zhǔn)度和范圍都不是很好。為了提高搜索精度,系統(tǒng)將網(wǎng)上翻譯API和本地電商詞匯中英對照表結(jié)合,對用戶輸入的中英文進(jìn)行實時翻譯。為減少商業(yè)利益影響,不同于Amazon原始的商品排序,系統(tǒng)在Amazon原始排序算法基礎(chǔ)上,對排序做了改進(jìn)來實現(xiàn)關(guān)鍵字的排序優(yōu)化。

        計算機(jī)應(yīng)用技術(shù);海淘;在線比價;中英文搜索;排序優(yōu)化

        本文著錄格式:馬龍飛. 新型海淘購物比價引擎方案設(shè)計[J]. 軟件,2016,37(11):73-83

        0 引言

        近年來,新的跨境電商模式——海淘的蓬勃發(fā)展,為消費(fèi)者帶來了新的購物體驗。消費(fèi)者可以在海淘網(wǎng)站上購買特定商品,并由轉(zhuǎn)運(yùn)公司將其寄回國內(nèi)。

        但是,海外商品是否真的比國內(nèi)便宜很多,不同國家銷售的商品其屬性是否一致,導(dǎo)致消費(fèi)者不免要做國內(nèi)外商品的比較。在這種情況下,消費(fèi)者面臨三個問題:

        1. 消費(fèi)者必須在各種國內(nèi)外購物網(wǎng)站中搜索相應(yīng)的商品,記錄商品價格,重復(fù)操作,浪費(fèi)大量時間;

        2. 海外電商網(wǎng)站對中文識別性差,通過測試,美國Amazon只能識別一小部分用中文描述的品牌。消費(fèi)者最好在海外網(wǎng)站上輸入商品相應(yīng)的英文名稱,以確保搜索的準(zhǔn)確性,但這對英語不好的人來說很不方便;

        3. 雖然現(xiàn)有比價服務(wù)相對成熟,但大多數(shù)都只關(guān)注自己國家的商品。此外,他們無法滿足多語言搜索需求。這種比價引擎在跨境比價方面具有低適應(yīng)性,特別是對海淘。

        為解決這些問題,需要一種能夠提供實時比價,支持中英文輸入和簡化操作過程的系統(tǒng)。以美中兩國Amazon購物網(wǎng)站比價為例,本文提出一種新型海淘購物比價引擎的設(shè)計方案,該系統(tǒng)由幾個核心功能組成:

        1. 允許英語和中文輸入,甚至混合搜索輸入,并提供類別選項;

        2. 按匹配度、價格或商品品牌排序,支持用戶過濾美國Amazon和中國Amazon的商品;

        3. 向用戶展示每個商品的名稱、屬性、圖片、當(dāng)前和歷史價格等信息;

        4. 定期插入和更新數(shù)據(jù)庫中的所有美國Amazon和中國Amazon商品信息,這有助于提取有用的歷史數(shù)據(jù),以便進(jìn)行歷史價格比較。

        1 方案設(shè)計

        1.1 系統(tǒng)設(shè)計

        系統(tǒng)流程由兩個過程組成,一個是接收用戶輸入并返回搜索結(jié)果,另一個是周期性過程,從數(shù)據(jù)庫中讀取用戶歷史記錄,并插入和更新數(shù)據(jù)庫中的信息。

        1.1.1 系統(tǒng)流程圖

        如圖1所示,左側(cè)是用戶搜索,負(fù)責(zé)與瀏覽器和用戶輸入交互;右側(cè)的數(shù)據(jù)更新是定期更新系統(tǒng)后臺的信息。

        圖1 系統(tǒng)流程圖

        1. 用戶搜索

        · 接收用戶輸入

        當(dāng)消費(fèi)者想要比較特定商品時,會輸入商品名稱、品牌或其他屬性用于搜索。瀏覽器搜索欄允許用戶輸入信息,用戶點擊搜索按鈕后,服務(wù)器將接收來自瀏覽器的用戶請求。

        · 確定用戶輸入是否已存在于本地數(shù)據(jù)庫中

        在接收到用戶輸入后,服務(wù)器將檢查本地數(shù)據(jù)庫是否包含此歷史搜索記錄。如果是,服務(wù)器向數(shù)據(jù)庫發(fā)送請求并等待信息返回;如果沒有,服務(wù)器將做實時信息爬取。

        · 實時信息從兩個Amazon爬取

        由于數(shù)據(jù)庫不包含相關(guān)的搜索輸入,服務(wù)器必須向兩個Amazon發(fā)送新的請求以抓取商品信息。該過程涉及DOM樹過濾不相關(guān)信息并提取商品信息的技術(shù)。

        · 將新的用戶輸入和商品信息保存到數(shù)據(jù)庫

        當(dāng)用戶輸入是新的時,服務(wù)器將該特定用戶輸入與從Amazon爬取到數(shù)據(jù)庫的相應(yīng)商品信息綁定。同時,Amazon中每個商品的初始排序也將保存。

        · 從數(shù)據(jù)庫提取商品信息,并返回給用戶

        如果數(shù)據(jù)庫包含用戶輸入,它將返回所有匹配的商品信息到服務(wù)器。然后服務(wù)器將這些信息插入到HTML模板并渲染一個頁面來向用戶顯示結(jié)果。

        2. 數(shù)據(jù)更新

        讀取保存在數(shù)據(jù)庫中的歷史用戶輸入

        系統(tǒng)先讀取數(shù)據(jù)庫中包含的所有用戶搜索記錄的文檔列表。然后這些歷史數(shù)據(jù)將被視為搜索請求,分別發(fā)送給美中Amazon用于信息爬取。

        · 從Amazon抓取新商品和現(xiàn)有商品的最新價格

        根據(jù)歷史搜索記錄,服務(wù)器將從美國Amazon和中國Amazon遍歷信息。這個過程旨在獲得在Amazon銷售的新商品和保存在數(shù)據(jù)庫中的商品最新價格。

        · 更新數(shù)據(jù)庫商品信息

        現(xiàn)有商品和新商品的價格等信息將添加到數(shù)據(jù)庫中。

        1.1.2 系統(tǒng)流程圖

        如圖2所示,左側(cè)系統(tǒng)設(shè)計的整個框架取決于MVC架構(gòu)。M-Model,在價格引擎中,數(shù)據(jù)庫存儲可以被商品搜索模塊訪問的商品對象。V-View,結(jié)果反饋模塊包含渲染模板引擎。項目應(yīng)用EJS模板引擎做頁面呈現(xiàn),它將數(shù)據(jù)和頁面模板作為輸入,然后生成HTML頁面,由瀏覽器再解析。C-Controller,路由控制器將根據(jù)用戶請求將過程引導(dǎo)到特定路由。

        在框架的右邊是Web爬取模塊和信息提取模塊。Web爬取模塊負(fù)責(zé)從美國Amazon和中國Amazon抓取商品信息。之后,獲取的數(shù)據(jù)將被發(fā)送到信息提取模塊進(jìn)行信息過濾、提取和結(jié)構(gòu)化。最后,所有有用和處理過的信息被保存到數(shù)據(jù)庫中。

        圖2 系統(tǒng)架構(gòu)圖

        中間的是數(shù)據(jù)庫。一方面,當(dāng)用戶的輸入已經(jīng)記錄在數(shù)據(jù)庫中時,商品搜索模塊直接從數(shù)據(jù)庫中提取商品信息;另一方面,數(shù)據(jù)庫維護(hù)商品信息,更新的商品數(shù)據(jù)會被添加到數(shù)據(jù)庫中。存儲在數(shù)據(jù)庫中的數(shù)據(jù)類型為JSON。

        助手組件幫助一些模塊實現(xiàn)特定功能,這也是價格引擎的新穎性之一。

        1.2 系統(tǒng)模塊和組件

        1.2.1 中英翻譯模塊

        在美國Amazon,如果只輸入中文的一些品牌,美國Amazon能夠識別他們,但如果輸入更多的單詞,美國亞馬遜無法識別輸入。

        如圖3進(jìn)行美國Amazon中文單詞識別測試。首先輸入全中文“華碩筆記本”,Amazon返回通知——您的搜索沒有匹配任何商品。然后輸入“華碩notebook”,美國Amazon成功完成搜索請求??傊绹鳤mazon只能支持一些品牌翻譯,不能處理更長的句子翻譯。此外,用戶通常使用中文和英文的混合搜索,如“Samsung手機(jī)”、“蘋果MacBook Air”等,這對翻譯帶來了更多的挑戰(zhàn)。

        為了提高搜索效果,本文采用的翻譯機(jī)制基本原理如下:

        1. 從用戶輸入中分離中文和英文,并且僅對中文序列進(jìn)行中文分割,以便生成具有語義的分割單詞列表;[1]

        2. 如果用戶的輸入包含專門的詞,則本地詞匯表將優(yōu)先翻譯它,如果單詞不匹配本地專用表中的任何信息,在線翻譯服務(wù)將接管并完成其余的翻譯工作;

        3. 在完成整個輸入翻譯之后,處理后的用戶輸入將被發(fā)送以進(jìn)行搜索。[2]

        圖3 美國Amazon中文識別測試

        1.2.2 商品搜索模塊

        · 商品排名優(yōu)化算法

        出于商業(yè)利益考慮,當(dāng)用戶搜索一些特定的商品,一些不太相關(guān)的商品會被商家置頂。如圖4測試中輸入“HTC One S”,搜索結(jié)果顯示第三個商品“HTC One X”排在包含“HTC One S”關(guān)鍵字的第五和第六個商品之前。顯然這不符合消費(fèi)者的檢索目的。

        圖4 商品排名測試

        在這種情況下,基于美國Amazon的初始排名算法,本文嘗試設(shè)置匹配度作為排名索引。如果商品名稱包含用戶輸入,則索引將增加,反之亦然。

        第一步,系統(tǒng)將過濾掉那些不相關(guān)的標(biāo)點符號,并根據(jù)特定的標(biāo)點符號分割整個用戶輸入。然后系統(tǒng)確定用戶輸入是否包括在一個商品名稱中。如圖5,e是一個商品的排名指數(shù),searchingNameArr是已經(jīng)被分段的用戶輸入的數(shù)組,然后對于循環(huán)將做匹配確定。如果商品名稱包含用戶輸入的第i個單詞,則排名索引分配為0,否則e將減去某個數(shù)。

        圖5 分段輸入的偽代碼和輸入存在的確定

        第二步,系統(tǒng)將為用戶輸入中的每個分段字分配不同的權(quán)重。對于用戶輸入,單詞排名更高,則單詞將獲得更大的權(quán)重。例如,用戶的輸入是“三星Galaxy S7”,則“三星”可以獲得比“Galaxy” 更大的權(quán)重,等等。

        圖6 將不同權(quán)重分配給不同輸入的偽代碼

        第三步,系統(tǒng)確定每個分段輸入是否是商品名稱中的獨立詞。如果是,排名指數(shù)將增加(獨立意味著這個詞不被其他不相關(guān)的詞包裹或鏈接)。例如,用戶輸入中的“S”分割詞和“HTC ONE S320”是特定商品名稱。在這種情況下,“S”在商品名稱中不是獨立的,因為它后面跟著“320”,并且“ONE”、“HTC”是獨立詞。

        更重要的是,用戶輸入有時存在于商品屬性中,所以需要額外做屬性和用戶輸入之間的匹配,這也影響最后的排名指數(shù)。

        圖7 確定獨立詞的偽代碼

        如果在中國Amazon,系統(tǒng)必須在第一步做中文分詞。其余的排名指數(shù)比較與美國Amazon的操作相同。

        1.2.3 網(wǎng)站爬取模塊

        網(wǎng)站傳輸由HTTP協(xié)議實現(xiàn)。瀏覽器將根據(jù)HTTP規(guī)定格式對請求進(jìn)行編碼,然后將其發(fā)送到服務(wù)器。接收請求后,服務(wù)器將根據(jù)相同的格式返回相應(yīng)的信息到瀏覽器。

        在系統(tǒng)中,網(wǎng)站爬取模塊遍歷美國Amazon和中國Amazon的商品信息。通過分析Amazon網(wǎng)址請求,發(fā)現(xiàn)像http://www.amazon.cn/s/ref=nb_sb_noss? page=PageNumber&keywords=SearchName這樣的網(wǎng)址請求可以訪問Amazon中具有所需搜索名稱的特定網(wǎng)頁。如圖8所示,在瀏覽器中輸入http://www. amazon.cn/s/ref= nb_sb_noss?page=2&keywords=Samsung,Amazon將直接在第2頁中搜索“三星”。

        因此,根據(jù)這個規(guī)則,從服務(wù)器發(fā)送特定URL的請求,系統(tǒng)可以在Amazon中廢棄無關(guān)商品信息。兩個函數(shù)requestUS()和requestCN()分別從美國Amazon和中國Amazon抓取商品列表。

        圖8 請求Amazon搜索

        在圖8中可以看出,請求Amazon搜索,商品頁面列表不包含商品屬性詳細(xì)信息。因此需要進(jìn)一步抓取屬性,即向Amazon服務(wù)器發(fā)送另一個URL請求,并獲取每個商品的詳細(xì)頁面。

        通過分析,PC端Amazon在商品詳細(xì)信息頁面中有太多不相關(guān)的信息,而一些海淘應(yīng)用選擇爬取移動端Amazon頁面,會有較少不相關(guān)的屬性信息。本文借鑒此方法,通過Amazon移動網(wǎng)頁抓取商品詳細(xì)信息,如圖9。由于手機(jī)頁面渲染效果較差,也大大提高了系統(tǒng)抓取速度。

        與壓縮軟件相同,網(wǎng)頁也采用壓縮技術(shù)來加速訪問速度。[3]在系統(tǒng)中,函數(shù)requestUS()和requestCN()中添加了支持gzip和deflate的代碼。與沒有壓縮編碼的設(shè)計相比,增加了數(shù)據(jù)爬取速度并提高了系統(tǒng)性能。

        1.2.4 信息提取模塊

        由于商品信息是結(jié)構(gòu)化數(shù)據(jù),因此會在特定模板中顯示。為了獲得有用商品信息,應(yīng)提取商品模

        板。HTML中描述的頁面可以轉(zhuǎn)換為DOM樹,以便于分析頁面結(jié)構(gòu)和進(jìn)行遍歷工作。由于美中兩國Amazon的DOM樹幾乎相同,以美國Amazon為例,圖10顯示了美國Amazon的商品列表模板。紅色框中的部分是商品列表的HTML代碼。15個商品信息通過紅色框中的HTML標(biāo)簽顯示,即表單標(biāo)簽至

        。除了每個商品具有不同圖片和字詞,至幾乎具有相同的結(jié)構(gòu)。

        圖9 商品詳細(xì)信息頁

        圖10 商品列表頁面的HTML

        在商品列表頁面中,系統(tǒng)提取數(shù)據(jù),包括商品圖片、名稱、價格、品牌并過濾掉不相關(guān)的噪音。所以本文抽象一個特定的來生成DOM樹。下圖顯示了的DOM樹,可以看出商品圖像在第三層,名稱在第四層,價格在DOM樹的底層,如圖11所示。

        美國Amazon使用美元作為貨幣單位,系統(tǒng)提取商品價格后,通過匯率轉(zhuǎn)換換算成人民幣。相同的操作可以從商品詳細(xì)信息頁面提取商品屬性等其它信息。

        1.2.5 其他模塊和組件

        · 用戶輸入模塊

        這個模塊與視圖進(jìn)行交互,當(dāng)用戶在瀏覽器中輸入搜索請求,用戶輸入將通過HTTP協(xié)議傳送到用戶輸入模塊,然后該模塊將用戶輸入分配給不同的商品搜索模塊。

        · 結(jié)果反饋模塊

        當(dāng)從數(shù)據(jù)庫中找到所有搜索的商品時,結(jié)果反饋模塊將使用商品信息呈現(xiàn)相應(yīng)的EJS模板,EJS將被解析為HTML并顯示在最終的結(jié)果頁面。

        圖11 result0的DOM樹商品

        · 匯率轉(zhuǎn)換

        此組件會從某銀行網(wǎng)站中抓取美元匯率,然后將其保存在文件中。在將美國Amazon商品價格插入數(shù)據(jù)庫之前,所有價格都從美元兌換成人民幣。在固定的時間間隔后,組件將更新此匯率。

        · 數(shù)據(jù)庫

        數(shù)據(jù)庫負(fù)責(zé)保存商品信息。在數(shù)據(jù)庫中構(gòu)建了四個表:usAmazon,cnAmazon,usSearchedName和cnSearchedName。usAmazon和cnAmazon分別用于存儲美國Amazon和中國Amazon的商品信息。usSearchedName和cnSearchedName保存用戶的歷史搜索輸入,這有助于定期更新信息。

        2 測試和效果展示

        2.1 中英翻譯輸入支持

        與美國Amazon相比,本文設(shè)計的系統(tǒng)中英翻譯模塊對支持多語言搜索請求有較好的效果。下圖12是本文系統(tǒng)的頁面,圖13是美國Amazon的頁面。例如,當(dāng)輸入“華碩筆記本”時,本文系統(tǒng)成功地從美國Amazon搜索到相應(yīng)的商品,而美國Amazon本身無法完成搜索任務(wù)。

        事實上,在本文系統(tǒng)中,“華碩筆記本”已被翻譯成“Asus notebook”并被送到美國Amazon進(jìn)行搜索。如果在美國亞馬遜中輸入“the Asus notebook”,則發(fā)現(xiàn)圖14右側(cè)的美國Amazon返回了與左側(cè)系統(tǒng)相同的結(jié)果。

        圖12 用戶在本文系統(tǒng)中輸入中文

        圖13 美國Amazon用戶輸入中文

        與現(xiàn)有價格引擎相比,例如在中國最好的價格引擎之一的Yitao.com,如果嘗試以一淘的“海

        淘”模式搜索海外商品,會發(fā)現(xiàn)這個價格引擎中顯示的商品主要由采購代理提供,這些代理向消費(fèi)者提供較少的選擇。為測試,搜索“華碩筆記本”,Yitao.com只顯示8個商品。如果搜索“Asus notebook”,Yitao.com可以找到大約100頁的商品。這意味著Yitao.com也是低水平多語言識別。但是,無論在本文系統(tǒng)中搜索的是“華碩筆記本”還是“Asus notebook”,來自美國Amazon的商品內(nèi)容都一樣。

        圖14 證明翻譯效果

        圖15 使用本文系統(tǒng)比較現(xiàn)有價格引擎

        通過幾個測試,本文系統(tǒng)、美國Amazon和

        Yitao.com之間的翻譯能力和返回商品比較如下:

        表1 翻譯能力和返回結(jié)果比較

        與美國Amazon和現(xiàn)有價格引擎相比,本文系統(tǒng)實現(xiàn)了高度適應(yīng)性的多語言搜索,彌補(bǔ)了跨境價格引擎的一個不足。

        2.2 通過匹配度和價格進(jìn)行商品分揀

        本文系統(tǒng)提供三個商品分類選項——默認(rèn)、匹配和價格。默認(rèn)是初始Amazon排序,匹配是應(yīng)用本文的優(yōu)化排名算法,價格意味著商品按價格排序。

        · 匹配

        如圖16所示,當(dāng)輸入“HTC ONE S”時,比較搜索結(jié)果可以看出,一些不太相關(guān)(不包含“HTC ONE S”)商品出現(xiàn)在默認(rèn)Amazon排序的列表中。而本文系統(tǒng)應(yīng)用優(yōu)化排名算法,所有顯示均匹配目標(biāo)商品。這個比較證明本文系統(tǒng)的優(yōu)化排名算法有很大的效果,過濾掉了很多不相關(guān)的商品。

        此外,本文系統(tǒng)提供商品品牌和類別過濾選項,如圖17所示。

        如果組合匹配與商品品牌和類別過濾,效果會更好。

        圖16 使用優(yōu)化算法排序(左)與Amazon默認(rèn)排序(右)

        圖17 商品品牌和類別過濾

        · 價格

        在本文系統(tǒng)中選擇“按價格高低”選項時,所有來自國內(nèi)外的商品根據(jù)價格從高到低重新排序,反之亦然,如圖18所示。

        2.3 商品詳情查看

        現(xiàn)有的購物網(wǎng)站,如Amazon和價格引擎,網(wǎng)頁包含太多不相關(guān)的信息,并且肯定會影響用戶對關(guān)鍵內(nèi)容的查看。不同于現(xiàn)有設(shè)計風(fēng)格,本文系統(tǒng)設(shè)計了一個頁面來顯示所有的商品細(xì)節(jié)。頁面樣式應(yīng)用平展設(shè)計,刪除除了商品信息之外的冗余信息。此外,當(dāng)單擊商品詳細(xì)信息和品牌詳細(xì)信息按鈕時,可以隱藏商品屬性和商品品牌,如圖19所示。

        將本文系統(tǒng)與Amazon和現(xiàn)有價格引擎進(jìn)行比較,如表2所示。

        圖18 按價格排序的商品

        圖19 商品詳細(xì)信息顯示

        表2 Amazon現(xiàn)有價格引擎和本文系統(tǒng)的比較

        本文系統(tǒng)可以覆蓋所有功能,并且在個別地方比Amazon和其它價格引擎更好。此外,系統(tǒng)扁平化設(shè)計風(fēng)格與清晰的內(nèi)容顯示為用戶帶來更好的購物體驗。

        3 總結(jié)展望

        隨著電子商務(wù)產(chǎn)業(yè)的快速發(fā)展,網(wǎng)上購物新模式海淘已進(jìn)入市場。為支持這種新模式,可以提供跨境商品比價的價格引擎成為一種需求。

        然而,現(xiàn)有海外電商網(wǎng)站和比價引擎還存在種種不足,為解決這些問題,本文提出一種新的海淘購物引擎設(shè)計方案,支持中文和英文搜索輸入并提供類別選項,基于Amazon重新優(yōu)化了排名算法,以提高商品匹配度,并允許根據(jù)匹配度和價格對商品進(jìn)行排序。本文系統(tǒng)可以在頁面中向用戶顯示每個商品的名稱、屬性、圖像、當(dāng)前價格、歷史價格等,并且能夠定期更新數(shù)據(jù)庫中的信息。這些設(shè)計都大大提高的用戶的購物體驗。

        還有一些地方可以進(jìn)一步擴(kuò)展:

        1. 到目前為止,本地專業(yè)詞匯還沒有大到足以覆蓋更專業(yè)化的單詞翻譯,在下一步中,可以通過更好的方法更新和擴(kuò)大詞匯,例如爬取在主流電商網(wǎng)站中的新搜索熱詞;

        2. 本文系統(tǒng)只通過比較搜索的關(guān)鍵詞和商品名稱進(jìn)行匹配,更理想的方法是分析和提取每個商品的特征詞,這就涉及更多的研究處理語義分析和分詞。

        [1] 陳平, 劉曉霞, 李亞軍. 基于字典和統(tǒng)計的分詞方法. 計算機(jī)工程與應(yīng)用, 2008, 44(10): 144-146. CHEN P, LIU X X, LI Y J. Word Segmentation Method Based on Dictionary and Statistics. Computer Engineering and Application, 2008, 44(10): 144-146.

        [2] Youdao Translation API. Data Access API. Retrieved on May, 2014. Web Site: http://fanyi.youdao.com/openapi? path=data-mode.

        [3] L. Peter Deutsch. DEFLATE Compressed Data Format Specification. Retrieved on May 2014. Web site: http://www. gzip.org/zlib/rfc-deflate.html.

        New Design of Cross-border Online Shopping Price Comparison Engine

        MA Long-fei
        (Beijing University of Posts and Telecommunications (Beijing) Broadband Network Research Center, Beijing 100876, China)

        After the development in recent years, cross-border online shopping has become a shopping way of many Chinese consumers. In addition to merchant choosing, goods purchasing, goods transferring, what consumers care most is the price comparison. However, most comparison engines only support English or Chinese web sites, few can compare corresponding cross-border commodity prices. Therefore, this paper proposes a design that can compare price of same commodity in home and abroad. Through the United States and China Amazon shopping sites, to achieve better result. The system will be combined with the translation module to allow users to use Chinese or English goods searching. After receiving user’s search request, system will review whether local database has user's search records at first. If it has, then local records will feedback, if not, then real-time access to the United States and China Amazon’s corresponding commodity information will be done. In addition, although many comparison engines can identify Chinese search, but recognition accuracy and scope is not good enough. In order to improve search accuracy, system will combine online translation API with local electronic business terms table, to do real-time translation. In order to reduce impact of commercial interests, unlike Amazon original product ranking, system has improved sorting algorithm based on Amazon original sorting algorithm, to achieve keyword sorting optimization.

        Computer application technology; Cross-border online Shopping; Online price comparison; English and Chinese searching; Sorting optimization

        TP393.09

        A

        10.3969/j.issn.1003-6970.2016.11.017

        猜你喜歡
        商品信息比價引擎
        中國商品信息服務(wù)平臺
        商品信息
        軍事文摘(2023年18期)2023-10-31 08:11:40
        備戰(zhàn)雙十一
        藍(lán)谷: “涉藍(lán)”新引擎
        商周刊(2017年22期)2017-11-09 05:08:31
        公式調(diào)整法和基準(zhǔn)比價法結(jié)合的PPP項目調(diào)價研究
        國際能源比價分析
        比價的江湖
        法人(2016年5期)2016-05-28 02:33:10
        商品信息標(biāo)準(zhǔn)化助力電子商務(wù)健康發(fā)展
        無形的引擎
        河南電力(2015年5期)2015-06-08 06:01:46
        基于Cocos2d引擎的PuzzleGame開發(fā)
        国产高跟黑色丝袜在线| 在线观看黄片在线播放视频| 亚洲国产大胸一区二区三区| 国产免费三级av在线| 国产午夜福利片| 视频一区二区在线播放| 视频一区视频二区亚洲免费观看| 区一区二区三区四视频在线观看| 无码小电影在线观看网站免费| 无码精品国产va在线观看| 免费一级黄色大片久久久| 日韩黄色大片免费网站| 亚洲色偷偷综合亚洲avyp| 九九精品国产亚洲av日韩| 国产农村三片免费网站| 国产av精品一区二区三区不卡| 人妻熟妇乱又伦精品视频| 品色永久免费| 日韩无码电影| 亚洲欧美日韩国产综合一区二区| 亚洲欧洲日产国码久在线观看| 精品亚洲av一区二区| 无码 人妻 在线 视频| 国产成人久久精品77777综合| 精品日韩国产欧美在线观看| 国产不卡一区二区三区视频| 久久精品女人av一区二区| 日韩人妻无码精品久久| 久久青青草原亚洲AV无码麻豆 | 四虎影视永久地址www成人| 久久精品国产亚洲不av麻豆| 亚洲一区二区三区最新视频| 蜜臀av在线观看| 在线永久看片免费的视频| 亚洲成人av一区二区麻豆蜜桃| 日本中文一区二区在线| 真多人做人爱视频高清免费| 2022国内精品免费福利视频| 国内偷拍精品一区二区| 亚洲成a人片在线观看无码3d| 日韩在线免费|