吳曉燕 鄧小清 成淑萍
摘 要:隨著電子商務事業(yè)的快速發(fā)展,越來越多的人們開始進行網上購物等一系列線上活動,但由于搜索系統(tǒng)的滯后,導致了網絡交易成功率的下降。交互式遺傳算法可根據用戶輸入的初始關鍵字進行多層遞階編碼,通過不斷的解碼、變異和交叉算子實現滿意解的搜索,具有較為顯著的運用效果。本文從交互式遺傳算法的操作入手,分析和研究了交互式遺傳算法在電子商務平臺中的搜索應用。
關鍵詞:遺傳算法;交互式遺傳算法;電子購物;商品搜索
在數字化時代的發(fā)展背景下,電子商務正以蓬勃的速度崛起并發(fā)展,但在其發(fā)展過程中,也出現了較多問題?,F階段的網絡信息資源較大,其以幾何級數的速度增長,越來越多的商品信息進入人們的視野。也正因為網絡信息的繁雜,導致用戶在找尋所需商品時猶如大海撈針。電子商務所面臨的首要問題是如何讓用戶方便快捷的尋找到自己所需的商品。
1 交互式遺傳算法
用戶在交互式遺傳算法中可根據自身需求和偏好,評價進化后的個體表現型,然后計算機便可榮國遺傳算子實現個體的變異和交叉操作。計算機會不斷重復此項操作,直到尋求到符合用戶需求的解。該算法在長時間的發(fā)展中已經運用于數據挖掘、語音處理、人臉識別、樂曲創(chuàng)作、知識獲取、韻律控制和服裝設計等領域。該算法較傳統(tǒng)遺傳算法而言,具有個性化的特點,其需要用戶的參與,而用戶的不斷參與也決定了該算法的適應值。用戶在長時間的人機交互的作用下容易產生疲倦,故該算法的進化代數和種群規(guī)模都較小,使算法在復雜的優(yōu)化問題中難以應用,限制了該算法的發(fā)展。以用戶評價為基礎的個體信息通過適當的機器學習方式,實現用戶認知模型的構建。
2 交互式遺傳算法因子操作
以交互式遺傳算法為基礎的個性化商品搜索就是在電子商務系統(tǒng)中引入交互式遺傳算法,系統(tǒng)可根據用戶的流浪的相關商品信息,縮小用戶所需商品的范圍,以便更好、更快、更全的尋求用戶所需商品。系統(tǒng)在搜索用戶所需數商品時,會對適應度函數進行動態(tài)調整,在多次進化操作的情況下尋求用戶所需信息資源。
2.1 個體編碼
交互式遺傳算法時以種群搜索為基礎而進行的,在解決系統(tǒng)的實際優(yōu)化問題時,需將問題明確的轉換為進化個體。當用戶在電子商務系統(tǒng)中輸入某些關鍵字時,系統(tǒng)會以現存數據為基礎進行挖掘和尋找,便可快速準確的獲取與關鍵詞相關連的信息內容。本文對系統(tǒng)接收的關鍵字入手,編碼其相關的關聯詞,實現進化個體的構建。
當用戶在電子商務系統(tǒng)中輸入所需商品的關鍵字時,系統(tǒng)內統(tǒng)計數據會挖掘之前獲取的相關信息,根據關聯程度將關聯詞關聯信息導入至數據庫內。二進制編碼具有便于操作和簡單直觀等特點,故本文采用二進制編碼的方式對信息內容技術進行編碼:“1”代表系統(tǒng)選用此關鍵詞;“0”代表系統(tǒng)不選用此關鍵詞。在電子商務系統(tǒng)中,四級關鍵詞入微便可將信息內容細致準確的表述出來。本文模擬的電子商務系統(tǒng)為四級及以下關聯詞情況。因為各級級關鍵詞都是緊密相連的,所以上層關聯詞決定了下層關聯詞的選擇。假設一級關聯詞為N1個,則第n個一級關聯詞包含 個二級關聯詞,而該二級關聯詞下共有 個三級關聯詞,向下延伸可知三級關聯詞下共有 個四級關聯詞。
2.2 解碼
各級關聯詞的排列序號決定了該層二進制碼的所處位置,在本文圖2中,“1”第一層中關聯詞的第一位,代表了“該結構中第一層關聯詞對應的相關信息”,例如上述范文中的“女裝外套”。
排列該結構中各層二進制編碼所顯示的關鍵詞序號,系統(tǒng)便可得到呈現給用戶的最終信息。圖1中,個體表現型解碼后表現為:“1 1 1 1”/“1 2 2 1 ”/“1 2 2 2”,整合解碼后的信息內容,便可得到該商品的對應的關鍵詞組合。
將進化種群規(guī)模設置為M,用戶在系統(tǒng)中輸入關鍵詞時,上述編碼結構便會對該關鍵字進行隨機初始化得到初始化種群。系統(tǒng)解碼該初始化種群,用圖片的形式將解碼后內容發(fā)送給用戶,用戶再根據自身需求選擇所需商品,以用戶選擇為基礎的系統(tǒng)結構可調整合適的個體適應值,便于遺傳操作的實施。
2.3 進化個體適應值估計
遺傳算法系統(tǒng)中的算子選擇是以進化個體適應值為基礎進行實施的,故遺傳操作正常進行的先決條件是得到進化個體適應值。以往的交互式遺傳算法主要通過用戶對個體表現的評分狀況得到進化個體適應值,而在現如今的電子商務系統(tǒng)中,用戶并不會直接對該模板進行評分,而是通過點擊其感興趣的內容實現進化個體適應值的調整。
這里選取用戶的關注程度、訪問次數和收藏/保存這三種交互進行進行分析,當用戶將所需商品加入購物車便提示為購物成功。在第m個進化個體Xm表現型所對應的商品上進行關注程度、訪問次數和收藏/保存三種交互行為,分別表示為It(Xm),In(Xm)和Is(Xm)。其中In(Xm)是用戶點擊該商品的次數,該次數取整數值,即為In(Xm);Is(Xm)為此用戶潛在的感興趣內容,此數據由用戶的保存/收藏操作所決定,即為 ?,F有研究對 It(Xm)考慮為此用戶對該商品的關注事件,并未考慮該用戶對各商品關注的先后順序,以下為本文中對It(Xm)的計算方式。
系統(tǒng)以用戶初始關鍵詞為基礎進行信息相關度的匹配,將匹配后的數據提交給用戶。數據信息提交成功后,其內部智能匹配功能可基于該信息實現后續(xù)智能搜索功能。假設用戶在舒適化呈現信息的t時刻點擊進入了第m個進化個體Xm所對應的商品表現型,則點擊后關注的時間為 (秒)。用戶在瀏覽相關信息時,會優(yōu)先關注其感興趣內容,并點擊進入該商品表現型,而由于點擊時間的優(yōu)先則導致該商品表現型的訪問時間較長。故第m個進化個體在該情況下的關注度為 。
2.4 進化操作
以已得到的進化個體適應值為基礎,遺傳操作該進化種群,實現變異、交叉和選擇操作。本文通過2規(guī)模的聯賽選擇方式進行綜合操作。因遞階結構中的二進制串為進化個體編碼,故在進行變異和交叉操作時需進行分層展開,而分層分布的交叉操作可保證其在同層間的有效性,換句話說,遞階結構的編碼可使變異和交叉操作有意義。
首先,隨機配對進化種群中的個體,假設個體對配對后為 。單點交叉操作該個體集合中 N1層的編碼串,獲取新的2個編碼串后交叉操作該編碼串對應的 (激活后),在不斷的類推和交叉后達到最后一層。當數據達到最后一層時,按照合適的概率單點變異N1層的基因,進而變異選擇后的被激活下層基因。
當用戶選擇“刷新”、“返回”或“下一頁”時,系統(tǒng)會將最新生成的信息內容推送給用戶。用戶通過不斷重復的遺傳操作、適應值估計和點擊操作便可尋找到自身所需信息。
3 交互式遺傳算法在電子商務平臺中的搜索應用
3.1 參數設置
設置本系統(tǒng)中第一層關聯詞為自動化控制類、電子信息類及計算機科學與技術類;第二層的關聯詞則為具體化的圖書名;第三層關聯詞則為各為各個圖書的價格;第四層關聯詞則為隱含的潛在關鍵詞。本文采用 實現個體適應值的估算,故本文算法種群可包含較大規(guī)模,在此設置為200,將交叉概率設置為85%,變異概率設置為2%。
3.2 實驗與仿真
本系統(tǒng)中查找的最終書目代表了用戶的最終查找意圖,在此系統(tǒng)中,用戶可根據進化環(huán)境選取符合需求的優(yōu)化目標,進而得到滿意的搜索結果。在不斷的人機交互過程中,最符合用戶需求的個體被稱為滿意解,系統(tǒng)在不斷的深化并增加滿意解數量,并將其推送給用戶。本系統(tǒng)中設置的關鍵字為:計算機類,圖書名為:《Web應用程序設計基礎》,參考價格為:30元。
分別采用傳統(tǒng)搜索方式和本文方式進行搜索對比,傳統(tǒng)搜索方式僅采用關鍵字匹配技術,本文搜索方式在關鍵字匹配的基礎上再引入交互式進化優(yōu)化算法。對兩組搜索方式尋找目標的成功率進行比較。經對比分析發(fā)現,傳統(tǒng)搜索方式的獲取滿意解的幾率僅為55%,顯著低于本文方法獲取的滿意解幾率(85%)。故在有限時間內,本文算法可快速有效的獲取用戶所需的滿意解。
4 結語
交互式遺傳算法的出現結合了遺傳算法的優(yōu)化能力和用戶的認知能力,以實現未能用顯式性能指標函數描述完成的優(yōu)化問題,對遺傳算法的運用范圍具有較大的擴寬作用。電子商務系統(tǒng)中引入交互式遺傳算法,可降低用戶的搜索耗時,提高系統(tǒng)內的搜索成功率,在網絡交易成功率的提高上具有積極意義。
[參考文獻]
[1]齊巖,盧德唐.交互式遺傳算法在基于內容的圖像檢索中的應用[J].中國圖象圖形學報,2004,9(1):46-55.
[2]鄒木春.基于交互式遺傳算法和粗糙集的圖像檢索方法[J].計算機工程與設計,2007,28(9):2086-2088.