羅 亞
(貴州財(cái)經(jīng)大學(xué),貴陽(yáng) 550004)
專家系統(tǒng)與電子商務(wù)個(gè)性化推薦系統(tǒng)之間存在相似之處,從整體上都包括輸入模塊、數(shù)據(jù)處理模塊和輸出模塊,利用專家系統(tǒng)的專家診斷功能可以識(shí)別客戶、分析客戶需求,并為客戶提供推薦結(jié)果,以此解決復(fù)雜的電子商務(wù)個(gè)性化推薦問題。
個(gè)性化推薦系統(tǒng)是指利用電子商務(wù)網(wǎng)站向客戶提供商品信息和建議,幫助用戶決定該購(gòu)買什么產(chǎn)品,模擬銷售人員幫助用戶完成購(gòu)買過程。個(gè)性化推薦系統(tǒng)主要分為三個(gè)模塊:用戶輸入模塊、推薦方法模塊和輸出功能模塊。
關(guān)于個(gè)性化推薦系統(tǒng)的研究主要包括網(wǎng)站系統(tǒng)設(shè)計(jì)、推薦算法設(shè)計(jì)和網(wǎng)絡(luò)購(gòu)物流程設(shè)計(jì)。在這些研究中,主要技術(shù)是協(xié)同推薦技術(shù)、關(guān)聯(lián)推薦技術(shù)和數(shù)據(jù)挖掘技術(shù),應(yīng)用專家系統(tǒng)推薦技術(shù)的較少。
科學(xué)技術(shù)的發(fā)展使得專業(yè)化加強(qiáng),人們的吃穿住用行都有專家進(jìn)行研究,將專家系統(tǒng)引入到電子商務(wù)個(gè)性化推薦中,有利于幫助消費(fèi)者進(jìn)行科學(xué)合理的消費(fèi)決策。
當(dāng)引入專家時(shí),消費(fèi)者購(gòu)物過程為:
1)消費(fèi)者表述自己需求特征;
2)專家分析消費(fèi)者需求特征;
3)專家判斷哪些商品可以滿足消費(fèi)者需求;
4專家推薦最適合的商品。
在這套系統(tǒng)中需要靜態(tài)數(shù)據(jù)庫(kù)(規(guī)則、信息)和動(dòng)態(tài)數(shù)據(jù)庫(kù)(用戶數(shù)據(jù)庫(kù)、商品數(shù)據(jù)庫(kù)),需要
咨詢子系統(tǒng)、規(guī)則子系統(tǒng)和結(jié)果子系統(tǒng),設(shè)本文中設(shè)計(jì)的系統(tǒng)名稱為MYG,則MYG系統(tǒng)結(jié)構(gòu)圖如圖1所示。
圖1 MYG 電子商務(wù)個(gè)性化推薦系統(tǒng)結(jié)構(gòu)
在咨詢過程中,MYG根據(jù)消費(fèi)者的一般情況,將用戶信息歸類到相應(yīng)的上下文中,所得到的結(jié)果以分層樹的形式組織數(shù)據(jù)結(jié)構(gòu),如圖2所示。
每組上下文類型都由一組購(gòu)物參數(shù)描述,例如描述Consumer上下文的參數(shù)稱為CSM,其中包 括 Name、Age、Sex、Salary等, 描 述 Goods上下文的參數(shù)稱為GSM,包括Brand、Number、Size、Weight、Price等。追蹤參數(shù)獲得參數(shù)的值,每一個(gè)值都有一個(gè)從-1到1的可信度,應(yīng)用產(chǎn)生式規(guī)則把專家知識(shí)表示成IF……THEN 語(yǔ)句。
示例規(guī)則1: IF PREMISE :[$AND (CONSUMER IS FEMALE)
(NOT BOUGHT EVER)
(CONSUMER LIKES RED)
(CONSUMER LIKES SWEET)(CONSUMER LIKES CHEAP)]
THEN ACTION:( SUGGEST GOODS1 TALLY 0.4)
圖2 MYG數(shù)據(jù)結(jié)構(gòu)圖示例
MYG系統(tǒng)的靜態(tài)數(shù)據(jù)庫(kù)用來存放所有產(chǎn)生式規(guī)則和所有咨詢需要的信息,由若干參數(shù)來描述,這個(gè)數(shù)據(jù)庫(kù)其實(shí)就是專家系統(tǒng)的知識(shí)庫(kù)。
1)規(guī)則特性
每個(gè)規(guī)則都包括四個(gè)特性:
PREMISE 規(guī)則的前提部分;
ACTION 規(guī)則的操作部分;
CATEGORY 規(guī)則按上下文分類,每條規(guī)則只能用于某幾個(gè)上下文,以便于調(diào)用;
SELFREF 規(guī)則是否自我引用,如是則為1,否則為0。
2)參數(shù)
對(duì)于每個(gè)參數(shù),各存一組屬性,以便咨詢和解釋程序調(diào)用。
MEMBEROF 相應(yīng)參數(shù)組名稱
VALUTYPE 參數(shù)類型
EXPECT 參數(shù)取值范圍
3)函數(shù)
函數(shù)分為三部分,用于規(guī)則前提部分、知識(shí)表示和用于操作部分。在前提部分,應(yīng)用許多簡(jiǎn)單函數(shù)求關(guān)于消費(fèi)者的值,建立函數(shù)KNOWN()、SAME()、THOUGHTOUT()等,回答真假,判斷參數(shù)是否已知。在知識(shí)表中,利用專門函數(shù)建立可被規(guī)則前提利用的數(shù)據(jù)結(jié)構(gòu),建立GRID()函數(shù),從動(dòng)態(tài)數(shù)據(jù)庫(kù)檢索可信度最高的值。操作函數(shù)根據(jù)前提規(guī)則計(jì)算值進(jìn)行操作,建立函數(shù)CONCLUDE( ),把用戶數(shù)據(jù)三元組連同前提可信度存入動(dòng)態(tài)數(shù)據(jù)庫(kù),再計(jì)算此操作的可信度。
4)上下文特性
上下文特性表示數(shù)據(jù)結(jié)構(gòu)之間的關(guān)系,包括這些特性:
ASSOCWITH 父輩節(jié)點(diǎn)的上下文類型。每一種上下文只可能是另一種類型上下文的直接后代。
TYPE 某種類型上下文詞干
PROPTYPE 參數(shù)分類
SUBJECT 用于某類上下文規(guī)則的分類表
MAINPROPS 跟蹤某種類型上下文的參數(shù)表
每次咨詢,動(dòng)態(tài)數(shù)據(jù)庫(kù)都要重新建立一次。動(dòng)態(tài)數(shù)據(jù)庫(kù)都以對(duì)象-屬性-值的三元組形式儲(chǔ)存,其中,值包括三項(xiàng)內(nèi)容, 值、取此值的可信度、參數(shù)被跟蹤次數(shù)。動(dòng)態(tài)數(shù)據(jù)庫(kù)包括消費(fèi)者即用戶數(shù)據(jù),動(dòng)態(tài)數(shù)據(jù)即每次咨詢記錄,商品數(shù)據(jù)以及上下文特性。
1)用戶數(shù)據(jù)庫(kù)
根據(jù)消費(fèi)者個(gè)人統(tǒng)計(jì)特征, 用戶屬性包括性別、年齡、行業(yè)、收入、偏好、購(gòu)物經(jīng)歷等信息,建立表1。
表1 用戶數(shù)據(jù)庫(kù)表
2)商品數(shù)據(jù)庫(kù)
消費(fèi)者在購(gòu)物過程中最關(guān)注的商品信息包括商品名稱、品牌、價(jià)格、尺寸、重量、功能、材料、生產(chǎn)日期、保質(zhì)期、售后服務(wù)、產(chǎn)地等,建立表2。
表2 商品數(shù)據(jù)庫(kù)表
3)隨機(jī)數(shù)據(jù)庫(kù)
隨機(jī)數(shù)據(jù)庫(kù)記錄在咨詢過程中產(chǎn)生的參數(shù)及其得到方式,得到方式包括推理獲得、用戶回答兩種,在回答問題時(shí),要記錄回答問題的次序,以進(jìn)行推理和解釋推理。
推理規(guī)則1:?jiǎn)巫C據(jù)模糊推理
消費(fèi)者在咨詢時(shí)的提問和操作都有可信度,根據(jù)主管概率理論,專家的先驗(yàn)概率P(h)反映專家在不出現(xiàn)證據(jù)e的條件下相信假設(shè)h 的程度為P(h|0),即1-P(h)可認(rèn)為是在此條件下專家不相信該假設(shè)成立的程度。如果P(h|e)大于P(h),說明由于證據(jù)e的出現(xiàn)使專家相信h成立的可能性增加了,或者說不相信h成立的可能性減少了。
設(shè)MB為可信度增加量,MD為可信度減少量,則
把MB和MD合為一個(gè),定義可信度CF為:
當(dāng)有幾種可能的情況時(shí),為了方便地比較它們的證據(jù)的強(qiáng)度,需要可信度把相信和不相信組合成一個(gè)數(shù)。由于MB和MD的值在0~1之間,所以CF的值在-1~1之間。如果CF大于零,則系統(tǒng)相信成立,反之,則不成立。
推理規(guī)則2:多證據(jù)模糊推理
如果顧客在咨詢時(shí),同時(shí)有兩個(gè)或以上的證據(jù),則推理公式為:
如果肯定地不相信h,則對(duì)h 的相信程度為零;否則,給定兩個(gè)觀察時(shí)對(duì)h 的相信程度可以是只有一個(gè)證據(jù)時(shí)的相信程度加上由于第二個(gè)證據(jù)所增加的相信程度。為計(jì)算此增加的相信程度首先取可信度與只有第一個(gè)證據(jù)時(shí)的相信程度之差,這個(gè)差是第二個(gè)觀察所能增加的相信程度的最大值。所以要按第二個(gè)證據(jù)對(duì)h的相信程度進(jìn)行調(diào)節(jié)。這個(gè)公式滿足交換律,即計(jì)算結(jié)果與證據(jù)順序無關(guān)。
MYG系統(tǒng)采用逆向推理過程。在咨詢開始時(shí),例示結(jié)構(gòu)樹中的根節(jié)點(diǎn),先賦予上下文名稱,把這個(gè)上下文加入到結(jié)構(gòu)樹中,跟蹤這類上下文數(shù)據(jù)表中的參數(shù),如果所有參數(shù)值都已獲得,則咨詢過程結(jié)束。
示例規(guī)則2 IF 30歲男性顧客欲購(gòu)買筆記本,年收入3萬左右,公務(wù)員
THEN 尋找價(jià)位在3000元左右,品質(zhì)較好,配置適中筆記本
ELSE 推薦上網(wǎng)本
在這個(gè)過程中,數(shù)據(jù)結(jié)構(gòu)可能為:
為了盡快找到可推薦商品,采用啟發(fā)式搜索算法,尋找由推理規(guī)則得到的可信度最高節(jié)點(diǎn)。設(shè)OPEN為數(shù)據(jù)結(jié)構(gòu)表,s、n、m為節(jié)點(diǎn),i、j、k為節(jié)點(diǎn)序號(hào),函數(shù) F( )=CF( )、G( )=MB( )、 H()=MD( )為可信度函數(shù),F(xiàn)()=G( )-H( ),則:
1)OPEN=(s) F(s)=G(s)-H(s)
2)Loop: IF OPEN=( ) THEN EXIT(FAIL)
3)N=FIRST(OPEN)
4)IF GOAL(n) THEN EXIT(SUCCESS)
5)REMOVE(n,OPEN) ADD(n,CLOSED)
6)EXPAND(n) 到 {mi} 計(jì)算 F(n, mi) =g(n, mi)-h(mi)
7)ADD(mj,OPEN)
8)IF f(n,mk)>f(mk) THEN f(mk)=f(n mk,)
9)IF f(n, mi)>f(mi) THEN f(mi)=f(n, mi)
10)OPEN中節(jié)點(diǎn)按可信度從大到小排列
GO Loop
在推薦顯示結(jié)果中,按 TOP… N序列模式排列, 將可信度最高的商品排列在最前,依次次之,讓消費(fèi)者自行選擇。
專家系統(tǒng)技術(shù)引入到電子商務(wù)個(gè)性化推薦技術(shù)中,采用啟發(fā)式搜索提高推薦速率,提高了商品成交量。由于專家系統(tǒng)需要應(yīng)用人工智能技術(shù),可能包含不同于本文的模塊,各模塊的實(shí)現(xiàn)方法也存在多樣性,在這些方面可以開展進(jìn)一步研究。
[1] 趙永梅, 基于用戶瀏覽路徑的協(xié)同過濾推薦技術(shù)研究[D], 西安建筑科技大學(xué), 2008. 6.
[2] J.Ben Schafer,Joseph Konstan, John Riedl,Recommender Systems in E-Commerce, In ACM.
[3] 韓慧俊, 電子商務(wù)個(gè)性化推薦系統(tǒng)的研究[D]. 上海交通大學(xué), 2007. 1.