廖美紅(廣西工商職業(yè)技術(shù)學(xué)院)
在互聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)、物聯(lián)網(wǎng)技術(shù)飛速發(fā)展的今天,電子商務(wù)越來越成熟,人們對于電子商務(wù)也要求也越來越高。隨著應(yīng)用電子商務(wù)平臺(tái)的人群數(shù)量快速增長,傳統(tǒng)的人工客服已經(jīng)無法滿足當(dāng)前的電商客戶服務(wù)需求,所以自動(dòng)問答客服系統(tǒng)因此產(chǎn)生,利用人工智能客服為客戶提供更加快速優(yōu)質(zhì)的服務(wù),例如京東的JIMI、阿里的旺旺機(jī)器人、蘇寧的自主服務(wù)機(jī)器人等。電商客服機(jī)器人開發(fā)過程中,除了保證能夠正常應(yīng)對客戶的問題以外,還應(yīng)該積極開發(fā)能夠識(shí)別客戶意圖的功能,進(jìn)而為客戶提供更加優(yōu)質(zhì)的服務(wù),減少不必要的時(shí)間,直接找到客戶想要的商品。
我國自1996年開始互聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)了蓬勃發(fā)展的狀態(tài),互聯(lián)網(wǎng)能夠?yàn)槿藗兲峁└鞣N服務(wù)和產(chǎn)品,更新人們的網(wǎng)絡(luò)生活方式。進(jìn)入到21世紀(jì)以后,電子商務(wù)技術(shù)實(shí)現(xiàn)了跨越式的發(fā)展,網(wǎng)絡(luò)購物已經(jīng)實(shí)現(xiàn)了全民普及。網(wǎng)絡(luò)技術(shù)將商品和消費(fèi)者有機(jī)聯(lián)系到一起,在網(wǎng)絡(luò)上完成消費(fèi)行為,選擇性和快速性都得了有效實(shí)現(xiàn),電子商務(wù)發(fā)展越來越快。對比傳統(tǒng)購物方式,網(wǎng)絡(luò)購物更加方便、快速、選擇廣、無地域限制、價(jià)格更低,具有諸多優(yōu)勢,而且消費(fèi)者和商家通過網(wǎng)絡(luò)都能夠獲取更高的利益。商家能夠利用網(wǎng)絡(luò)簡化購物流程,節(jié)省人力物力,降低成本,提升利潤,打破地域限制,獲得更多的商機(jī)。消費(fèi)者能夠擴(kuò)大選擇空間,多個(gè)商家對比,不用出家門就能夠完成購物。而且消費(fèi)者進(jìn)行網(wǎng)絡(luò)購物的時(shí)候,能夠通過和客服溝通獲取更多的信息,完成售后服務(wù),這就需要電子商務(wù)客服人員隨時(shí)在線為客戶提供服務(wù)。
電子商務(wù)在線人員為客戶提供客服服務(wù)這種方式非常方便,但是有時(shí)候也會(huì)產(chǎn)生負(fù)面影響,例如網(wǎng)絡(luò)商城相對較大,想要滿足客戶的服務(wù)需求,必須設(shè)計(jì)非常多的客服人員,這必然會(huì)導(dǎo)致成本大幅度上漲;再如網(wǎng)絡(luò)購物客戶咨詢的問題很多事基本一致的,重復(fù)性的問題非常多,設(shè)置在線服務(wù)人員會(huì)造成明顯的資源浪費(fèi);此外,在線客服人員也不是所有的都符合職業(yè)道德要求,綜合素質(zhì)良莠不齊。上述問題都可能導(dǎo)致電商平臺(tái)上的商家遭到客戶投訴,降低自身的信譽(yù)度。
隨著人工智能技術(shù)不斷發(fā)展進(jìn)步,未來電子商務(wù)領(lǐng)域中的人工客服必然會(huì)被自動(dòng)問答客服系統(tǒng)所取代,特別是簡單重復(fù)性的工作,人工客服僅僅用于處理復(fù)雜敏感的問題,全面提升服務(wù)質(zhì)量。而自動(dòng)問答客服系統(tǒng)如何提升自身的服務(wù)水平,就需要有效識(shí)別客戶的意圖,從聊天中散碎的信息中獲取有效信息整合處理,更準(zhǔn)確快速的理解人類語言。
中文分詞,指的是將一個(gè)句子或是文章分成獨(dú)立的詞語。自然語言處理中,中文分詞技術(shù)是其中的基礎(chǔ),也是挖掘文本關(guān)系的基礎(chǔ),漢語這種語言本身存在著較為明顯的復(fù)雜性、籠統(tǒng)性,所以分詞技術(shù)存在著一定的難度。
漢語分詞技術(shù)有多種方法,其中較常見的有詞典分詞方法、統(tǒng)計(jì)分詞方法、混合分詞方法。其中,詞典分詞,指的是通過文本和詞典進(jìn)行對照,二者匹配獲得分詞,這種方法簡單、精確,但是機(jī)器的匹配原則、詞條數(shù)量以及掃描順序互懟分詞精度造成影響;統(tǒng)計(jì)分詞,通過統(tǒng)計(jì)語料庫中的信息制定模型,通過字與字之間的共現(xiàn)信息表示緊密程度,計(jì)算兩個(gè)字同時(shí)出現(xiàn)的頻率,這種方法應(yīng)用更廣,不需要指定詞典,但是需要大量的訓(xùn)練庫和參數(shù),需要大量的基礎(chǔ)數(shù)據(jù);混合分詞,指的是將詞典分詞和統(tǒng)計(jì)分詞結(jié)合到一起,混合兩種方法的優(yōu)勢,解決分詞中遇見的問題。但是目前分詞仍然存在很多問題,還沒有找到合適的方法解決。
自動(dòng)問答客服系統(tǒng)在消費(fèi)領(lǐng)域中,想要識(shí)別客戶意圖,自動(dòng)分詞的好壞將直接影響后續(xù)的詞向量訓(xùn)練工作。中文分詞技術(shù)從上個(gè)世紀(jì)70年代開始就已經(jīng)投入了研究,而且是該領(lǐng)域的研究重點(diǎn),發(fā)展至今已經(jīng)開發(fā)出了多種分詞系統(tǒng),目前使用較多的分詞系統(tǒng)是NLPIR系統(tǒng)。
詞語相似度計(jì)算,該技術(shù)也是文本處理領(lǐng)域中的基礎(chǔ)技術(shù),應(yīng)用范圍非常廣,例如檢索中,詞語相似度計(jì)算可以幫助查找衡量和檢索目標(biāo)相似的程度。應(yīng)用在自動(dòng)問答客服系統(tǒng)中,詞語相似度計(jì)算能夠用于推薦答案語義的相似度計(jì)算。計(jì)算詞語相似度有多種方法,按照類型區(qū)分可以分成兩種類型,即語料庫計(jì)算方法和語義詞典計(jì)算方法。
語義詞典計(jì)算方法。參考語義詞典計(jì)算相似度,需要參考兩個(gè)詞匯在詞典中的相關(guān)性,兩個(gè)詞語在詞典概念網(wǎng)絡(luò)上的聯(lián)通路徑距離可以計(jì)算二者的相似程度,如果只有一條通路,那么二者之間是存在語義方面的相關(guān)性的。
關(guān)鍵詞,指的是從文本中提取主要思想,能夠概括文本的詞語,提取關(guān)鍵詞的準(zhǔn)確性將直接影響到意圖識(shí)別的準(zhǔn)確性。關(guān)鍵詞提取要求自動(dòng)問答客服系統(tǒng)將每個(gè)人的聊天語句集合到一起進(jìn)行文本整理,從文本的總數(shù)量確定表達(dá)文本主題的關(guān)鍵詞提取數(shù)量。關(guān)鍵詞提取需要基于兩個(gè)條件:第一,所有的聊天詞語關(guān)鍵詞都是圍繞著商品主題開展的,用戶具有購買意圖的商品;第二,聊天中的語句大部分都和主題詞相近,不相干的詞匯非常少。
關(guān)鍵詞提取最早使用的方式是通過統(tǒng)計(jì)詞語的出現(xiàn)次數(shù)進(jìn)行詞頻權(quán)重計(jì)算,也就是詞頻更高的詞語更容易成為關(guān)鍵詞。但是這種方法準(zhǔn)確度十分有限,需要在詞頻的基礎(chǔ)上加入詞長、詞共現(xiàn)、逆向文件頻率等因素,綜合提取關(guān)鍵詞。例如TF-IDF關(guān)鍵詞提取方法,就是通過分析詞頻和逆文檔頻率的方式提取關(guān)鍵詞。這種方法的思想為:詞語的重要性不能單單考慮某個(gè)詞語出現(xiàn)的次數(shù),同時(shí)還需要考慮該詞語在其它領(lǐng)域出現(xiàn)的次數(shù),如果不同領(lǐng)域中的頻率不同,差異較大,在本文檔中的頻率較高,說明該詞語重要性更高。除了統(tǒng)計(jì)方法以外,關(guān)鍵詞提取還可以采用基于語義的方法,這種方法需要參考語義詞典和詞語鏈?;谡Z義的關(guān)鍵詞提取方法能夠更符合自然語言的邏輯,準(zhǔn)確度和語義信息質(zhì)量都高于統(tǒng)計(jì)方法,但是這種方法對于詞庫的依賴性較高。基于機(jī)器學(xué)習(xí)的關(guān)鍵詞提取方法是當(dāng)前研究較多的方法,分成有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)兩種方法,有監(jiān)督學(xué)習(xí)的方法代表有樸素貝葉斯、SVM等方法,無監(jiān)督學(xué)習(xí)方法代表有層次聚類、kmeans方法等等?;跈C(jī)器學(xué)習(xí)的方法對比統(tǒng)計(jì)方法和語義方法能夠更好地利用數(shù)據(jù)集信息,但是沒有考慮語義的聯(lián)系,例如同義詞和反義詞,所以工作效果并不理想。所以,關(guān)鍵詞提取技術(shù)目前仍然在進(jìn)一步深入開發(fā)。
隨著通信技術(shù)不斷發(fā)展,智能手機(jī)不斷普及,網(wǎng)絡(luò)交友購物已經(jīng)成為了普遍現(xiàn)象,互聯(lián)網(wǎng)能夠通過用戶信息記錄海量的生活日志。所以用戶在網(wǎng)絡(luò)上的信息中會(huì)包括商品的購買傾向,商家如果能夠充分利用此類信息,必然能夠更好的完成客戶意圖識(shí)別。目前應(yīng)用的技術(shù)具有代表性的就是情感分析技術(shù),這種技術(shù)能夠?qū)τ脩粼诰W(wǎng)絡(luò)上記錄的具有主觀性的意見進(jìn)行歸納總結(jié),挖掘情感。學(xué)者們可以通過分析用戶在網(wǎng)絡(luò)上留下的信息分析用戶的情緒,采用的方法包括語義分析方法和機(jī)器學(xué)習(xí)方法兩種。語義分析是通過已有的詞典進(jìn)行情感匹配,機(jī)器學(xué)習(xí)是通過訓(xùn)練好的語言模型分類器進(jìn)行文本情緒分類。情感分析技術(shù)如果發(fā)展得當(dāng),未來不僅僅能夠用于電商平臺(tái),同時(shí)也能夠應(yīng)用到警方的輿論監(jiān)督、重大事件的網(wǎng)絡(luò)監(jiān)控等,幫助維護(hù)良好的社會(huì)環(huán)境。
綜上所述,網(wǎng)絡(luò)購物發(fā)展越來越快,未來人工客服必然會(huì)被自動(dòng)問答客服系統(tǒng)所取代,所以當(dāng)前相關(guān)工作者的研究重點(diǎn)應(yīng)該是提升自動(dòng)問答客服系統(tǒng)對于客戶意圖識(shí)別的準(zhǔn)確度,改善客戶的網(wǎng)絡(luò)購物體驗(yàn)。