[摘 要] 銷售過程中大量的重復(fù)性工作是開發(fā)系統(tǒng)的前提,但銷售也具有很高的靈活性和技巧,尤其是客戶識別和促銷過程。因此,高性能的銷售系統(tǒng)需要更好的知識源的支持。我們從分析系統(tǒng)的需求開始,結(jié)合國際上一些系統(tǒng)的特點(diǎn),為此設(shè)計(jì)了四種內(nèi)容三類形式的知識源:客戶關(guān)系管理數(shù)據(jù)、企業(yè)銷售政策、常問問答對和背景知識內(nèi)容;問答對、自然文本和結(jié)構(gòu)化信息三種形式。并探討了它們之間的關(guān)系和實(shí)現(xiàn)流程。
[關(guān)鍵詞] 問答系統(tǒng) 在線銷售 知識源
一、引言
1.在線銷售問答系統(tǒng)
隨著B2C和C2C類型電子商務(wù)的快速發(fā)展,針對個(gè)人客戶的網(wǎng)上銷售變得日益繁忙。自動(dòng)在線銷售問答代理系統(tǒng)可以有效的降低交易費(fèi)用,促進(jìn)社會(huì)進(jìn)步,因此具有較高的現(xiàn)實(shí)價(jià)值,是自然語言處理系統(tǒng)的一個(gè)有效運(yùn)用方向(王波, 2009)。統(tǒng)通過自然語言傳遞信息,客戶目標(biāo)有一定范圍限制,屬于受限范圍內(nèi)的問答系統(tǒng)。考慮到目前自然語言理解和問答技術(shù)的進(jìn)展,綜合使用TREC QA Track中的factoid 和list類型,構(gòu)建一個(gè)銷售問答系統(tǒng)具有理論上的可行性(Hoa Trang Dang, Diane Kelly, and Jimmy Lin, 2008)。
然而,高水平的銷售系統(tǒng)不止于問答的一般性提取,還包括更多。例如,高性能在線銷售問答系統(tǒng)要求不僅僅只是千人一面的一問一答,還應(yīng)該包含態(tài)度、期望、情感聯(lián)系等其他因素,這才符合人類進(jìn)行更深層次的營銷的特點(diǎn)。這就要求系統(tǒng)能夠識別場景,擁有期望,形成策略(Bruce, B. C., 1975)。
形成這些行為需要一個(gè)強(qiáng)有力的知識庫的支持。這個(gè)知識庫內(nèi)容應(yīng)包括:(1)通用知識:產(chǎn)品、企業(yè)、渠道、價(jià)格方面的知識;(2)針對性的知識:能夠使用客戶數(shù)據(jù)針進(jìn)行有針對性銷售政策回答;(3)創(chuàng)造性的知識:根據(jù)客戶信息識別客戶潛在需求,進(jìn)行新品推薦、缺貨產(chǎn)品替換等創(chuàng)造性的促銷活動(dòng)。
2.問答系統(tǒng)的知識源構(gòu)成
1999年開始,TREC設(shè)立QA測試,目標(biāo)是促進(jìn)各國在問答系統(tǒng)方面的研究。早期的TREC QA測試中,曾經(jīng)使用過問句相似度計(jì)算的方法,例如芝加哥大學(xué)的FAQ Finder(Robin D. Burke, 1996)。系統(tǒng)接受自然語言提問,然后去尋找數(shù)據(jù)庫中的常問問題問答對。如果找到與提問相似的問答對,就提取對應(yīng)的答案,然后返回給用戶。這種系統(tǒng)多采用統(tǒng)計(jì)學(xué)和語義學(xué)的方法計(jì)算句子相似度,知識源是一個(gè)盡可能齊全、詳細(xì)的常問問答對集合。
隨著QA測試的發(fā)展,近年來則更多的使用了文本提取的方式。系統(tǒng)的主要知識來源是一系列的英文新聞材料(newswire)。在factoid類型的提問中,問題被聚合成不同的主題。一般來說,系統(tǒng)先使用通用的檢索工具從新聞報(bào)道中檢索出若干文檔,然后進(jìn)一步提取相關(guān)的句子,通過統(tǒng)計(jì)學(xué)、句法、語義學(xué)方法最后選擇得分最高的幾個(gè)句子作為回答。
結(jié)構(gòu)化的知識源也被用于支持QA系統(tǒng)。 IBM的PIQUANT系統(tǒng)除了使用文本提取外,構(gòu)建了KSP代理,這個(gè)代理就是從一個(gè)結(jié)構(gòu)化的知識源中尋找答案(Jennifer Chu-carroll, 2006)。
從TREC2007開始,QA測試進(jìn)一步引入了博客(blog)作為基礎(chǔ)的知識來源,相對于新聞來說,博客語言的不規(guī)范性和信息的低可靠性引入構(gòu)成了對問答系統(tǒng)更大的挑戰(zhàn)。要求QA系統(tǒng)不僅能處理不規(guī)范的語言,而且要能夠?qū)ο嗷_突的知識源信息做出判斷和選擇。
二、系統(tǒng)基本結(jié)構(gòu)
1.銷售問答系統(tǒng)的知識需求
通常的在線銷售流程包含售前、售中和售后三個(gè)基本過程。一個(gè)典型的流程如圖1。
在這個(gè)過程中,客戶需要的信息包括:產(chǎn)品信息、價(jià)格信息、促銷信息、渠道信息(4P,Product, Price, Promotion, Place)。
那么在企業(yè)中,銷售人員如何滿足客戶的信息需求呢?銷售人員的信息來源包括:(1)背景知識的學(xué)習(xí),主要是企業(yè)的基本情況;(2)企業(yè)的銷售政策,如價(jià)格、折扣、陪送、服務(wù)等;(3)常問問答,即通過觀察其他有經(jīng)驗(yàn)的銷售人員的問答,可以彌補(bǔ)銷售政策不能覆蓋到的細(xì)節(jié),從而促進(jìn)銷售。
從分類上看,(1)包含產(chǎn)品信息;(2)包含價(jià)格信息、促銷信息和渠道信息;(3)則包含全部4P信息;(4)客戶信息則屬于客戶關(guān)系管理范疇。
因此,在線銷售問答系統(tǒng)的知識源涵蓋了以下三種形式:常問問答對、自然文本(背景知識)和結(jié)構(gòu)化信息(銷售政策)。
2.銷售問答系統(tǒng)的知識源流程
系統(tǒng)知識來自多個(gè)源。采用常問問答形式快捷,自然,但主要的問題是如果企業(yè)銷售政策改變,會(huì)導(dǎo)致常問問答對需要不斷的相應(yīng)修改;另外,針對不同類型的客戶,也需要系統(tǒng)有針對性的回答。因此我們需要分別從銷售政策和常問問答系統(tǒng)中獲得不同的答案,并參照客戶關(guān)系數(shù)據(jù)進(jìn)行一致性比較,對不符合現(xiàn)在銷售政策的常問問答進(jìn)行修改。基本的流程如圖2。
三、更好性能的系統(tǒng)結(jié)構(gòu)
1.在線銷售系統(tǒng)的BDI模型
銷售人員往往會(huì)根據(jù)用戶的特點(diǎn)進(jìn)行促銷。系統(tǒng)要做到這一點(diǎn),就需要客戶關(guān)系(CRM)知識的支持。系統(tǒng)使用CRM知識,感知用戶,并進(jìn)行銷售政策選擇。這是達(dá)到銷售期望的一個(gè)規(guī)劃和落實(shí)的過程,是具有一定智能行為的表現(xiàn)。網(wǎng)上銷售系統(tǒng)的智能行為包括四個(gè)過程和三個(gè)狀態(tài),BDI模型如圖3。
使用客戶關(guān)系數(shù)據(jù)進(jìn)行推理限定在一個(gè)有限的領(lǐng)域,這是一個(gè)前提和有利條件。這個(gè)領(lǐng)域的推理可以使用客戶關(guān)系(CRM)管理的框架體系來完成。在CRM體系中,按顧客生命周期客戶關(guān)系的發(fā)展可分為開發(fā)期、考察期、形成期、穩(wěn)定期、衰退期五個(gè)階段,為五階段模型。按照客戶處于不同的生命周期可分為5類:潛在型、夭折型、中途退出型、重新選擇型、完美型。不同類型客戶分別適用于不同的銷售政策(比如折扣、建議等)。這種數(shù)據(jù)多是結(jié)構(gòu)化的。
2.提高性能的系統(tǒng)體系
綜上,構(gòu)建如下體系如圖4。
系統(tǒng)包含4種3類知識源。如果是背景知識類的問題,直接分別從常問問答對和背景知識文本中提取答案,然后進(jìn)行一致性對比,最終生成輸出;對于非背景內(nèi)容提問,先從常問問答對中,使用基于統(tǒng)計(jì)學(xué)和語義學(xué)的方法計(jì)算句子相似度來提取答案;然后從企業(yè)銷售政策文本中,使用檢索和命名實(shí)體的方法提取答案;再使用判定規(guī)則進(jìn)行一致性比較,篩選出排列前面的答案;最后查詢客戶數(shù)據(jù),通過人工智能推理,做最后篩選。
四、結(jié)論
隨著電子商務(wù)的發(fā)展,在線銷售問答系統(tǒng)日益具有價(jià)值。這種系統(tǒng)基于問答系統(tǒng),但卻提出了更高的要求。銷售過程具有大量的重復(fù)性工作,這也正是開發(fā)系統(tǒng)的前提。但它也具有很高的靈活性和技巧,尤其是客戶識別和促銷,提出了不同于一般問答系統(tǒng)的更高要求。高性能的銷售系統(tǒng)需要更好的知識源的支持。從分析系統(tǒng)的需求開始,分析國際上一些系統(tǒng)的特點(diǎn),為此設(shè)計(jì)了4種內(nèi)容3類形式的知識源,包括:客戶關(guān)系管理數(shù)據(jù)、企業(yè)銷售政策、常問問答對和背景知識。他們分別屬于三種形式:問答對、自然文本和結(jié)構(gòu)化信息。針對不同類別和形式的知識源需要使用不同的方式提取備選答案,并對來源不同的答案進(jìn)行一致性比較和推理,從而得到最終答案。
參考文獻(xiàn):
[1]Hoa Trang Dang, Diane Kelly, and Jimmy Lin . Overview of the TREC 2007 Question Answering Track[C].In Proceeding of the Sixteenth Text Retrieval Conference(TREC 2007), Gaithersburg, Maryland, USA: NIST, 2008
[2]Robin D. Burke, Kristian J. Hamond, Vladimir A, Kulyukin. Question Answering for Frequently-asked Question Files: Experience with the FAQ Finder Systme[J].AI Magazine ,1996
[3]Jennifer Chu-Carroll, Krzysztof Czuba,Pablo Duboue, John Prager. IBM’s PIQUANT Ⅱin TREC2005, In Proceeding of the Fourthteen Text Retrieval Conference(TREC 2005), Gaithersburg, Maryland, USA: NIST, 2006
[4]Bruce, B. C. Generation as a social action. Proc[C]. Theoretical Issue in Natural Language Processing(ACL), 64~67. Reprinted in RNLP, 1975
[5]Philip Kotler. Marketing Management(Ninth Edition)[M]. Prentice-Hall Internatioal, Inc. 1997
[6]王 波 薛媛媚:網(wǎng)上銷售常問問答系統(tǒng)的構(gòu)建[J].軟件導(dǎo)刊, 2009,2:112~113
[7]陳明亮:客戶生命周期模式研究[J].浙江大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2002,11:66~60
[8]James Allen:自然語言理解(第二版)[M].北京:電子工業(yè)出版社,2005
[9]蔡自興:人工智能及其應(yīng)用(第三版)[M].北京:清華大學(xué)出版社,2004