余以勝
(廣東女子職業(yè)技術(shù)學(xué)院,廣東 廣州 511450)
隨著技術(shù)的進(jìn)步,當(dāng)今移動設(shè)備要求提供互聯(lián)網(wǎng)服務(wù)的需求有不斷增長的趨勢。當(dāng)服務(wù)提供商和產(chǎn)品供應(yīng)商在互聯(lián)網(wǎng)上提供市場和核心業(yè)務(wù)服務(wù)的同時,還提供客戶服務(wù)。參考文獻(xiàn)[1]提出了基于人工智能技術(shù)(即稱為最優(yōu)-第一搜索)的構(gòu)架,討論了能擁有建立其中的搜索技術(shù)的代理程序。本文提出有全文搜索能力的獨立應(yīng)用構(gòu)架,可以在計算機(jī)、移動電話上通過Web瀏覽,或通過固定電話語音交互,該構(gòu)架稱為交互式客戶服務(wù)代理ICSA(Interactive Customer Service Agent)。
WWW運(yùn)行在HTTP協(xié)議上,它是客戶/服務(wù)器體系結(jié)構(gòu),服務(wù)器位于一端且給體系結(jié)構(gòu)另一端的客戶提供Web頁服務(wù)。圖1所示為集成的體系結(jié)構(gòu),包含Web、WAP和Voice網(wǎng)絡(luò)。PC機(jī)對HTTP請求/響應(yīng)直接解釋;移動設(shè)備使用稱為WAP的輕量級協(xié)議,以編譯的或二進(jìn)制格式表現(xiàn)信息。語音交互使用的語音網(wǎng)關(guān)可以由電信服務(wù)器、ASR服務(wù)器、TTS(Text To Speech)服務(wù)器和VoiceXML解釋器組成。
在Web體系結(jié)構(gòu)中,瀏覽器位于客戶端且用來解釋由服務(wù)器傳送來的HTML代碼。移動設(shè)備要訪問互聯(lián)網(wǎng),需要包交換網(wǎng)絡(luò),隨著GPRS(General Packet Radio Service)、EDGE(Enhanced Data for GSM Environment)和很多其他技術(shù)的出現(xiàn),條件現(xiàn)已具備。對這樣一個包交換網(wǎng)絡(luò),則要求通過WAP網(wǎng)關(guān)接入現(xiàn)有互聯(lián)網(wǎng)。WAP網(wǎng)關(guān)也連接到BTS(Base Transceiver Station),它為客戶端的移動設(shè)備提供無線連接。
在Voice體系結(jié)構(gòu)中,由自動話語識別器ASR(Automatic Speech Recognition)服務(wù)器執(zhí)行語音識別,由文本-話語 (TTS)服務(wù)器執(zhí)行文本到話語的轉(zhuǎn)換。一個VoiceXML解釋器根據(jù)VoiceXML規(guī)格[2]執(zhí)行應(yīng)用程序。實現(xiàn)語音交互的常用方法有直接對話和混合交互語音響應(yīng)(IVR)兩種。其中直接對話較為流行,用戶與給出語音格式指令集的系統(tǒng)或應(yīng)用進(jìn)行交互。IVR應(yīng)用是基于程序設(shè)計語言,如VXML(VoiceExtensibleMark-up Language)和 SALT(Speech Application Language Tags)。
圖1 Web、WAP和Voice集成的體系結(jié)構(gòu)
一個多通道應(yīng)用系統(tǒng)將其內(nèi)容展示給終端用戶,是基于用戶代理實現(xiàn)的。在多通道訪問中,企業(yè)數(shù)據(jù)和應(yīng)用系統(tǒng)可通過多個通道進(jìn)行訪問。與多通道訪問方式不同,多模態(tài)訪問將多個通道組合形成同一個交互活動或會話。X+V(XML+VXML)和SALT是開發(fā)多模態(tài)應(yīng)用[3]的常用工具?;趩我恢髂J?Single Authoring)[4]的多模態(tài)應(yīng)用能夠使用SALT開發(fā),而基于多著作模式(Multiple Authoring)的多模態(tài)應(yīng)用要求使用X+V。
多通道應(yīng)用也可以是單一著作模式或多著作模式。單一著作模式多通道應(yīng)用使用程序語言或標(biāo)注語言開發(fā),該語言能夠為各種接口或設(shè)備重新生成具有可讀性的輸出。多著作模式多通道應(yīng)用將要求不止一種的程序語言或標(biāo)注語言為各種接口或設(shè)備產(chǎn)生可讀性輸出。XML(Extensible Mark-up Language)是一種標(biāo)注語言,可以使用XSLT(Extensible Stylesheet Language Translation)開發(fā)單一著作模式多通道應(yīng)用。多著作模式多通道應(yīng)用將共享一個或多個部件,通常是數(shù)據(jù)庫的Web、WAP和Voice應(yīng)用的集成。
全文搜索技術(shù)在通用企業(yè)數(shù)據(jù)庫引擎中均有很好的支持。 Oracle、MySQL、Sybase、SQL Server和 PostgreSQL等是支持FTS(Full-Text Search)的主要數(shù)據(jù)庫引擎。FTS是一種索引搜索方法,它對數(shù)據(jù)庫表中的詞建立了索引,索引創(chuàng)建在由4個或更多個字符組成的詞上[5]。全文搜索的SQL實現(xiàn)隨著選用的數(shù)據(jù)庫引擎的不同而不同。
開發(fā)單一著作模式的多通道應(yīng)用系統(tǒng)要求語言轉(zhuǎn)換。轉(zhuǎn)換最好與過濾代理(即FTS)執(zhí)行的其他進(jìn)程相分離,因此在應(yīng)用設(shè)計中,使用五層體系結(jié)構(gòu)的模型。另外,應(yīng)用系統(tǒng)獨立于數(shù)據(jù)庫引擎,也是五層模型優(yōu)于三層模型之處。
XML是元標(biāo)注語言,是一個為數(shù)據(jù)描述創(chuàng)建語義標(biāo)簽的規(guī)則集合,而HTML用來指定Web頁的布局。XSL(Extensible Stylesheet Language)是基于XML的語言,用來操作、分類和過濾XML數(shù)據(jù)。XSLT樣式表定義一個規(guī)則或模板的集合。當(dāng)模板與源文檔中的節(jié)點相匹配時,它在新文檔中存儲按模板產(chǎn)生的輸出結(jié)構(gòu)。多通道應(yīng)用給基于其連接設(shè)備的終端用戶表現(xiàn)其內(nèi)容,并且XSL是一個將內(nèi)容與表現(xiàn)分離的理想工具。通過取決于連接設(shè)備或用戶代理的XSLT處理器將XML/XSL轉(zhuǎn)換成 HTML、WML和 VXML,如圖 2所示。
N-層模型指全部數(shù)據(jù)包或應(yīng)用系統(tǒng)能夠劃分的分類層數(shù),也指層數(shù)N≥2的客戶-服務(wù)器模型。
如果使用五層模型開發(fā),不用傳統(tǒng)的三層模型,Web應(yīng)用的執(zhí)行性能會更好。應(yīng)用5層模型的重要優(yōu)勢在于,處理未來流量的伸縮性和性能需求的適應(yīng)性、良好的結(jié)構(gòu)化設(shè)計、靈活的以銷售商為中心的應(yīng)用及其易維護(hù)性。
本文提出的ICSA多通道應(yīng)用構(gòu)架基于一個五層模型,如圖3所示。
圖2XML/XSL轉(zhuǎn)換為HTML、WML和VXML
圖3 ICSA構(gòu)架
數(shù)據(jù)層指數(shù)據(jù)庫服務(wù)器的內(nèi)容。在此情況下,數(shù)據(jù)庫服務(wù)器包含帶索引的關(guān)鍵詞,這些關(guān)鍵詞來自預(yù)設(shè)的已知問題和回答、與用戶提出的問題類似的問題以及給出的可能回答。
數(shù)據(jù)訪問層包括服務(wù)器端(SSI)文件或連接到數(shù)據(jù)庫的腳本。它建立一個連接到數(shù)據(jù)庫并為提供查詢目的的連接標(biāo)識符。將完全的數(shù)據(jù)庫轉(zhuǎn)換成XML文件的應(yīng)用程序接口(API)也在該層上操作。
應(yīng)用層負(fù)責(zé)系統(tǒng)執(zhí)行的算術(shù)和邏輯操作,包括查找關(guān)鍵詞,在沒有回答提供時存儲新的問題集合。用全文搜索技術(shù)來查詢數(shù)據(jù)庫。其XML文件表示數(shù)據(jù)庫,XPATH可用來定位XML文件中的回答。此外,也可用第三方API來執(zhí)行查找XML文件。然后,服務(wù)器端腳本產(chǎn)生XML文件,并存儲查詢結(jié)果。
表現(xiàn)層包含擴(kuò)展樣式表文件,取決于設(shè)備或訪問系統(tǒng)的瀏覽器,它能夠?qū)⒅虚g文檔格式化轉(zhuǎn)成WML、HTML和VXML文件。具體的格式可以由檢查瀏覽器發(fā)出的HTTP請求來確定。此處可選的是,如HAWXY等第三程序可以充當(dāng)代理,檢查用戶的連接設(shè)備或瀏覽器,并給其傳遞合適的信息。
用戶接口層以不同的瀏覽器或不同的連接設(shè)備為特征。當(dāng)使用固定電話或移動電話時,應(yīng)用系統(tǒng)在TTS服務(wù)器協(xié)助下將消息轉(zhuǎn)換成語音;當(dāng)使用電話上網(wǎng)時,瀏覽器傳入WML文件;當(dāng)使用Web瀏覽時,PC機(jī)傳入HTML文件,并可以選擇由CSS將其格式化。
本文提出的ICSA(Interactive Customer Service Agent)構(gòu)架的處理流程如圖3下方所示。當(dāng)客戶通過撥電話號碼或鍵入URL連接到應(yīng)用系統(tǒng)時,Web服務(wù)器上索引文件被傳遞。在執(zhí)行期間,客戶端或連接設(shè)備的頭部請求決定使用哪個XSL文件將選擇出的XML文件轉(zhuǎn)換成HTML表單、WML表單或Voice對話。在提交過程中,腳本查詢數(shù)據(jù)庫,并產(chǎn)生一個XML中間文檔,該XML文檔由一個XSL文件轉(zhuǎn)換,在Web瀏覽器下、將響應(yīng)表現(xiàn)給客戶之前,可選用CSS文件將其格式化。
ICSA構(gòu)架需要很少量的XML文件,需要與Web、WAP和Voice表現(xiàn)相關(guān)的獨立XSL文件,需要求執(zhí)行轉(zhuǎn)換用的服務(wù)器端腳本或應(yīng)用文件;并以其內(nèi)容管理的簡易性提供健壯的Web應(yīng)用。另外,ICSA使用XSL文件極易操作XML文件。為了增加新特征或擴(kuò)展功能,該構(gòu)架在伸縮性方面留有很大的空間。
圖4所示為用例圖,明確地指出回答ICSA查詢涉及的五個步驟。在問題提交過程中,代理程序過濾關(guān)鍵詞,查詢數(shù)據(jù)庫,為客戶列舉類似問題,從而讓客戶選擇出與其問題最為類似的問題,進(jìn)而提交關(guān)鍵詞(稱為水平域排序的過程)。一個確認(rèn)消息等待客戶發(fā)出,這要么通過客戶點擊超鏈接(即最為類似的問題)實現(xiàn),要么通過語音響應(yīng)[7]實現(xiàn)。然后再執(zhí)行一個完全搜索(稱為垂直域排序),最后給出最適合的回答。如果在數(shù)據(jù)庫中不存在回答,將問題存儲起來需要由人響應(yīng)。
圖4 應(yīng)用程序的用例圖
所提出的構(gòu)架的性能將基于它對使用大量的移動電話和模擬器的可訪問性。對人們而言,它的可用性也應(yīng)考慮到??稍L問性指的是用戶使用URL從事Web和WAP瀏覽的能力和通過用移動電話、固定電話和軟件撥電話號碼語音上網(wǎng)的能力。它的可用性決定于在代理上是否有信息可獲取,以及它在檢索信息時是否有效??捎眯砸紤]的因素,包括每一段時間內(nèi)日志(或向前)查詢和回答查詢的頻度。
本文提出的ICSA是一個以銷售商為中心的、與平臺無關(guān)的和基于五層模型的應(yīng)用構(gòu)架,有很大的伸縮性。它是使用XML的單一著作模式程序,并能通過支持XSLT服務(wù)器端的任何Web語言編寫程序代碼實現(xiàn)。其內(nèi)容管理變得更容易,能夠像在模擬電話網(wǎng)上的DTMF應(yīng)用或在基于取決于編碼的IP的電話網(wǎng)上的IVR應(yīng)用一樣操作。實質(zhì)上,對要求24/7/365通過前述三種通道提供其重要客戶服務(wù)的任何行業(yè)或公司,它都將有助于改進(jìn)客戶關(guān)系管理(CRM)。
[1]ADEYEYE O M,ATAYERO A A.A multi-channel application framework for customer care services using bestfirst search technique[C].Proceedings of Third Generation(3G)GSM and Mobile Computing(3GSMc2007)–Intermational Conference and Workshop, Covenant University, Nigeria,2007.
[2]ATAYERO A A, OLUGBARA O O, AYO C K, et al.Design, developmentand deploymentofan automated speech-controlled customer care service system [C].Proceedings of the GSPx 2004-The International Embedded Solutions Event,Santa Clara, CA, 2004.
[3]CHANG S E.The design ofa secure and pervasive multimodal Web system[C].19th International Conference on Advanced Information Networking and Applications,2005,2:683-688.
[4]http://www.metc.pku.edu.cn/keie/courses//ucsweb2004-old/pdf/chapt04-1.pdf,2008-08.
[5] http://dev.mysql.com/doc/refman/5.0/en/fulltextsearch. html,2008-10.
[6]HONG O O.VoiceXML application development life cycle:Building usable voice user interface [EB/OL]. http://devresource.hp.com/drc/resources/vxusability/vx_devlifecycle.pdf,2008-5.
[7]庾錫昌,劉偉平,武晉,等.基于 VoiceXML的語音交互平臺的設(shè)計與實現(xiàn)[J].計算機(jī)工程與設(shè)計,2007,28(8).