談立
摘要:人工智能領(lǐng)域中的語義分析技術(shù)近年來發(fā)展迅猛,已經(jīng)在自動(dòng)駕駛、影像識(shí)別等多個(gè)領(lǐng)域取得了突破性進(jìn)展。我們開創(chuàng)性地將語義分析技術(shù)應(yīng)用于滿意度測(cè)評(píng)研究,以汽車4S店服務(wù)質(zhì)量作為樣品樣本進(jìn)行研究,經(jīng)過數(shù)據(jù)采集與預(yù)處理、語義分析、分析和統(tǒng)計(jì)三個(gè)階段,在水軍過濾、主題發(fā)現(xiàn)、知識(shí)圖譜搭建、文本細(xì)粒度分析等關(guān)鍵環(huán)節(jié)應(yīng)用TML語義分析技術(shù),快速地分析出汽車4S店服務(wù)行業(yè)中消費(fèi)者關(guān)注的重點(diǎn),驗(yàn)證了語義分析技術(shù)在滿意度測(cè)評(píng)領(lǐng)域應(yīng)用的可行性,為滿意度測(cè)評(píng)的前期行業(yè)分析提供了一種新的思路。
關(guān)鍵詞:語義分析技術(shù) 滿意度測(cè)評(píng) 4S店 知識(shí)圖譜
Abstract: Semantic analysis technology in the artificial intelligence field has developed rapidly in recent years, and has made breakthroughs in many fields such as autonomous driving and image recognition. We apply semantic analysis techniques in satisfaction measurement studies, using the 4S shop service quality as a sample.
Through three stages of data collection and pretreatment, semantic analysis, analysis and statistics, HTML semantic analysis technology is applied in the key links of hydraulic filtering, subject discovery, knowledge map construction and text fine granularity analysis, it analyzes the focus of consumers concerned in the service industry of 4s shop quickly, validates the feasibility of the application of semantic analysis in the field of satisfaction evaluation the measurement. It provides a new idea for the early industrial analysis of satisfaction evaluation.
Key words: semantic analysis technology, satisfaction evaluation, 4S shop, knowledge map
語義分析(Semantic Analysis)是人工智能的一個(gè)分支,是自然語言處理技術(shù)的幾個(gè)核心任務(wù),涉及語言學(xué)、計(jì)算語言學(xué)、機(jī)器學(xué)習(xí),以及認(rèn)知語言等多個(gè)學(xué)科。人工智能中的語義分析技術(shù),特別是深度學(xué)習(xí)技術(shù)近年來發(fā)展迅猛,已經(jīng)在圍棋對(duì)弈、自動(dòng)駕駛、影像識(shí)別、語音識(shí)別等多個(gè)領(lǐng)域取得了突破性進(jìn)展。我們開創(chuàng)性地將語義分析技術(shù)應(yīng)用于滿意度測(cè)評(píng)研究,經(jīng)過半年的探索,這一研究現(xiàn)在已經(jīng)取得初步的成果。現(xiàn)將我們研究的思路和具體做法做一個(gè)分享,希望能對(duì)中國人工智能技術(shù)的應(yīng)用場(chǎng)景拓展提供有益的經(jīng)驗(yàn),同時(shí)推動(dòng)滿意度測(cè)評(píng)技術(shù)的發(fā)展。
1 研究背景
2016年初,武漢市標(biāo)準(zhǔn)化研究院開始涉足滿意度測(cè)評(píng)領(lǐng)域,前期主要涉及各級(jí)政府、職能部門的服務(wù)質(zhì)量測(cè)評(píng)。從2017年開始,測(cè)評(píng)的領(lǐng)域逐步擴(kuò)展到服務(wù)業(yè)領(lǐng)域。隨著業(yè)務(wù)的拓展,我們面臨一個(gè)重要挑戰(zhàn)是:如何在有限的時(shí)間里面深入了解特定目標(biāo)行業(yè)的痛點(diǎn)。畢竟服務(wù)業(yè)細(xì)分領(lǐng)域眾多,不可能對(duì)每個(gè)領(lǐng)域都有深入的研究,而沒有深入的研究,就不可能拿出高質(zhì)量的滿意度測(cè)評(píng)問卷,進(jìn)而嚴(yán)重影響測(cè)評(píng)質(zhì)量。直接通過互聯(lián)網(wǎng)搜索相關(guān)信息,會(huì)發(fā)現(xiàn)有價(jià)值的信息散落在浩如煙海的大數(shù)據(jù)之中,收集整理的工作量十分巨大,同時(shí)還受到大量水軍數(shù)據(jù)的干擾。因此,能不能通過人工智能技術(shù)來輔助滿意度測(cè)評(píng),是我們思考的重點(diǎn)問題。帶著這個(gè)需求,我們接觸了多家人工智能領(lǐng)域公司,最終選擇南京網(wǎng)感至查科技公司作為合作單位,同時(shí)雙方商定本次合作的研究樣本為汽車4S店服務(wù)質(zhì)量。在本次合作中,我們應(yīng)用語義分析技術(shù)對(duì)網(wǎng)上汽車4S店服務(wù)質(zhì)量口碑?dāng)?shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,并進(jìn)行正負(fù)面情感、投訴問題類別等多維度分析歸類。通過這樣的一種手段,快速地了解在為汽車4S店服務(wù)行業(yè)中消費(fèi)者關(guān)注的重點(diǎn),為開展該行業(yè)的消費(fèi)者滿意度調(diào)查提供重要參考。
2 技術(shù)路徑
2.1 數(shù)據(jù)采集與預(yù)處理
第一階段是數(shù)據(jù)采集與預(yù)處理階段。根據(jù)需求,運(yùn)用爬蟲技術(shù)從主流媒體、社交平臺(tái)、汽車專業(yè)論壇等渠道全面深入地搜集4S店行業(yè)信息、用戶評(píng)論。為避免大量的垃圾數(shù)據(jù),嚴(yán)格控制采集的范圍,聚焦關(guān)注主體,重點(diǎn)采集所有4S店相關(guān)的認(rèn)證用戶,認(rèn)證用戶的問題及回答,同時(shí)需要過濾宣傳貼等無效數(shù)據(jù)。
下面以知乎為例,簡(jiǎn)要說明數(shù)據(jù)采集的過程(見圖1)。
1)選定范圍:知乎有專欄和話題,此類評(píng)論和主題具有可信度高、內(nèi)容深入、真實(shí)性高的特點(diǎn),是我們采集的重點(diǎn)。首先從所有有關(guān)“4S店”、4S店別稱(汽車維修、代理店、四兒子店等)的知乎問題為入口,深度采集問題回答者,以及回答者信息。
2)采集元數(shù)據(jù):從回答的評(píng)論進(jìn)行二級(jí)采集,收集有關(guān)4S店關(guān)注用戶的元數(shù)據(jù),再以元數(shù)據(jù)為中心,廣泛采集關(guān)注的問題及回答。
3)采集權(quán)重賦值:定制每個(gè)平臺(tái)的采集信息來源的權(quán)重,以此作為信息預(yù)處理的一個(gè)基礎(chǔ),在知乎平臺(tái),專欄>話題>定制搜索,相同內(nèi)容下以權(quán)重作為過濾條件,提升采集的質(zhì)量和準(zhǔn)確度。
4)數(shù)據(jù)過濾:收集完數(shù)據(jù),過濾非關(guān)注主題的問題、評(píng)論、回答,去除重復(fù)評(píng)論、與主題無關(guān)的評(píng)論。
5)獲取數(shù)據(jù):采集策略和過濾策略搭建完成后,進(jìn)行分布式爬蟲獲取數(shù)據(jù),同時(shí)為避免觸發(fā)社交平臺(tái)的反爬策略,我們進(jìn)行模擬用戶爬蟲策略,盡可能避免出現(xiàn)臟數(shù)據(jù)的可能。
前四個(gè)階段,可以被稱為預(yù)處理階段,其中數(shù)據(jù)過濾的工作量最大,涉及的情況也最為復(fù)雜,其中高效地進(jìn)行水軍貼的過濾是后續(xù)工作的基石,也是整個(gè)工作的難點(diǎn)和亮點(diǎn)。
如圖2所示,針對(duì)內(nèi)容水軍過濾我們主要采用了三個(gè)策略:
1)關(guān)鍵詞過濾。定義好廣告詞庫,通過水軍關(guān)鍵詞匹配,簡(jiǎn)單過濾低端水軍、刷好評(píng)等的評(píng)論,將大量重復(fù)的水軍貼、無用貼進(jìn)行過濾。
2)文本規(guī)則過濾。深入分析水軍文本所具備的特點(diǎn),對(duì)此類特點(diǎn)進(jìn)行特征化、規(guī)則化,如:重復(fù)使用大量無實(shí)義的形容詞、語言多具有重復(fù)部分等,先對(duì)文本進(jìn)行依存句法分析,再根據(jù)依存句法分析結(jié)果,用總結(jié)的水軍規(guī)則進(jìn)行識(shí)別、過濾。先對(duì)文本進(jìn)行分詞,再使用句法分析算法,最后使用規(guī)則引擎過濾水軍文本。
3)機(jī)器學(xué)習(xí)過濾。這里應(yīng)用到了網(wǎng)感至查公司的核心技術(shù)(TML),TML是擁有自主知識(shí)產(chǎn)權(quán)的編程語言,可以用來提升計(jì)算機(jī)系統(tǒng)對(duì)復(fù)雜的語言表述的理解能力。 由于中文表述的復(fù)雜性,只從句法和詞性上的分析是不夠的。TML充分發(fā)揮了其在自然語言處理上的技術(shù)優(yōu)勢(shì),以及對(duì)來自不同來源內(nèi)容的深入了解,結(jié)合規(guī)則和詞性過濾,使用貝葉斯分類算法從信息特征、用戶行為、多角度、多方式進(jìn)行全面的信息過濾,數(shù)據(jù)清洗,保障最終分析結(jié)果的高精度。
經(jīng)過兩個(gè)多月的數(shù)據(jù)挖掘和預(yù)處理,獲取了本次研究的基礎(chǔ)數(shù)據(jù),數(shù)據(jù)的基本情況如下:共采集評(píng)論50余萬條,相關(guān)帖子22783篇,知乎用戶54389名,微博認(rèn)證4S店用戶1000名。其中微博和知乎用戶可信度高,回復(fù)內(nèi)容豐富,內(nèi)容信息量大。是本次采集的重點(diǎn),所占的比例也最大。按數(shù)據(jù)量來統(tǒng)計(jì):知乎占比40%、微博占比45%,汽車之家占比5%,其他新聞媒體占比10%。
2.2 基于TML的語義分析
在獲取了大量的原始數(shù)據(jù)后,還需要對(duì)數(shù)據(jù)進(jìn)行深入分析,從中提煉出消費(fèi)者真正關(guān)注的重點(diǎn)。由于獲取的數(shù)據(jù)都來自互聯(lián)網(wǎng)上的帖子,是非結(jié)構(gòu)化數(shù)據(jù),如何了解發(fā)帖人的本意并對(duì)其進(jìn)行分類,這就需要再次用到基于TML的語義分析技術(shù)。
2.2.1 基于人工智能下的主題發(fā)現(xiàn)
首先需要從海量的數(shù)據(jù)中智能分析出100個(gè)主題,使用機(jī)器學(xué)習(xí)主題發(fā)現(xiàn)模型,利用TML技術(shù)在自然語言領(lǐng)域的技術(shù)積累,智能發(fā)現(xiàn)用戶評(píng)論的焦點(diǎn),用戶所關(guān)注的方面。
基于條件隨機(jī)的實(shí)體發(fā)現(xiàn),結(jié)合LDA主題模型和CRF算法,TML能夠通過數(shù)據(jù)訓(xùn)練,迭代出用戶發(fā)表的主要主題。同時(shí)可以解決冷啟動(dòng)問題,使用規(guī)則引擎大范圍提升標(biāo)注性能,使用標(biāo)注后的詞序列充分訓(xùn)練模型,讓機(jī)器學(xué)會(huì)實(shí)體識(shí)別前后的文本規(guī)則,例如,當(dāng)文本中出現(xiàn)了百家姓、機(jī)構(gòu)名稱時(shí),模型能夠提取出命名實(shí)體的精度達(dá)到90%以上。經(jīng)過訓(xùn)練后,精度還能實(shí)現(xiàn)較大提升。
通過改進(jìn)訓(xùn)練方法,來優(yōu)化主題發(fā)現(xiàn)。具體步驟為:
1)選取初始訓(xùn)練主題數(shù)量值,得到初始模型,計(jì)算各主題之間的相似度。
2)減少設(shè)定主題數(shù)量的值,重新訓(xùn)練得到模型,再次計(jì)算主題之間的相似度。
3)重復(fù)第二步直至得到最優(yōu)的主題數(shù)量。將主題初始值設(shè)置為30,通過主題模型訓(xùn)練出30個(gè)主題,使用文本相似度計(jì)算,合并相似的文本,將得到新的主題數(shù)量。重新更改算法模型主題數(shù)量,將訓(xùn)練得到的主題,進(jìn)一步進(jìn)行相似度計(jì)算、同義詞計(jì)算,重復(fù)迭代,最后我們得到一組30個(gè)的文本主題名詞,通過對(duì)名詞進(jìn)行初步校驗(yàn),得到一個(gè)簡(jiǎn)單的詞云圖。文本主題包括:電話預(yù)約、試駕服務(wù)、接待服務(wù)、提車時(shí)間、維修保養(yǎng)價(jià)格等。
2.2.2 專家校驗(yàn)
主題與主題之間是具有關(guān)聯(lián)關(guān)系的,使用主題發(fā)現(xiàn)可以基本確認(rèn)用戶所發(fā)表的主要對(duì)象,但實(shí)體對(duì)象之間的關(guān)系,與行業(yè)有著很高的聯(lián)系,實(shí)際應(yīng)用中不能直接根據(jù)技術(shù)所提取的主題,直接進(jìn)行主題下的數(shù)據(jù)訓(xùn)練,文本挖掘。因此,我們邀請(qǐng)了汽車4S行業(yè)專家,利用專家對(duì)4S店的深入了解,使用專業(yè)詞匯修正網(wǎng)絡(luò)用戶隨意表達(dá)的主題,同時(shí)將主題進(jìn)行類別劃分。通過對(duì)機(jī)器自動(dòng)識(shí)別的30個(gè)4S店主題進(jìn)行校驗(yàn),列出主題之間的關(guān)聯(lián)關(guān)系,將生成的主題與實(shí)際領(lǐng)域信息進(jìn)行合并與分離,建立具有層級(jí)關(guān)聯(lián)的知識(shí)體系。最終將主題歸納成13個(gè)大類:售前服務(wù)、費(fèi)用解釋、售前配件、提車環(huán)節(jié)、新車核對(duì)、承諾兌現(xiàn)、新車掛牌、新車貸款、售后保養(yǎng)、霸王條款、售后維修、投訴處理、保險(xiǎn)等。同時(shí)將各個(gè)主題細(xì)分至大類下,完善整個(gè)類別關(guān)系。
2.2.3 基于TML的4S店知識(shí)圖譜搭建、文本細(xì)粒度分析
關(guān)于4S店服務(wù),網(wǎng)絡(luò)上的表達(dá)各式各樣,既有正規(guī)語言,也有大量網(wǎng)絡(luò)用語。網(wǎng)絡(luò)用語日新月異,如果沒有可迭代、可持續(xù)發(fā)展的知識(shí)圖譜技術(shù),就無法勝任當(dāng)前大數(shù)據(jù)環(huán)境下的語義分析。4S店、四兒子店、汽車、奔馳、機(jī)動(dòng)車輛等這些詞匯都是人類可快速識(shí)別并進(jìn)行歸類分析的,但計(jì)算機(jī)處理需要進(jìn)行實(shí)體識(shí)別、關(guān)系關(guān)聯(lián)、文本分類等一系列處理,尤其是文本的邏輯推理是技術(shù)的關(guān)鍵。例如,人類一看到“SUV”這幾個(gè)字母,即可推導(dǎo)出背后的汽車,甚至是汽車的廠商、產(chǎn)地、價(jià)格范圍等。同樣,如何讓計(jì)算機(jī)也能擁有此等處理能力才是關(guān)鍵,所以TML知識(shí)圖譜在此充當(dāng)推理的邏輯基礎(chǔ),擁有完備的領(lǐng)域知識(shí)圖譜才能讓機(jī)器有更高的推理精度,更準(zhǔn)確地實(shí)體識(shí)別,文本分類。
TML的誕生就是為了解決目前從海量數(shù)據(jù)中提煉、發(fā)掘信息存在的難題,同時(shí)深入企業(yè)、客戶業(yè)務(wù),將人類復(fù)雜語言表達(dá)成文字,解析成計(jì)算機(jī)可統(tǒng)計(jì)、可識(shí)別的語料。通過學(xué)習(xí)人類關(guān)聯(lián)事物的思維模式,將文本中抽取的概念,用龐大的知識(shí)體系建立網(wǎng)絡(luò)狀聯(lián)系,讓枯燥的文本之間,搭建成相互依存的關(guān)聯(lián)關(guān)系。
例如,用TML技術(shù)來分析“我喜歡這輛SUV”這句話,可以提煉出文本中的概念要素“我”“SUV”,同時(shí)利用網(wǎng)絡(luò)狀的知識(shí)圖譜體系,可以讓計(jì)算機(jī)理解和關(guān)聯(lián)到SUV→汽車,我和SUV汽車之間提取情感傾向:“喜歡”。
知識(shí)圖譜的搭建是整個(gè)文本處理的關(guān)鍵,有了知識(shí)圖譜關(guān)系,將得到文本背后的關(guān)聯(lián),文本之間不再只是文字上的差異而是擁有了聯(lián)系,讓機(jī)器擁有了實(shí)際生活中人類的知識(shí)體系。4S店服務(wù)構(gòu)成較為復(fù)雜,傳統(tǒng)的文本匹配挖掘算法無法很好地解決關(guān)系實(shí)體發(fā)現(xiàn),每一個(gè)主題之間都擁有復(fù)雜的內(nèi)在關(guān)系,如何分析出用戶的評(píng)論到底屬于哪一個(gè)細(xì)分領(lǐng)域是技術(shù)關(guān)鍵。具體來說就是利用TML技術(shù),提取出每一條評(píng)論的具體實(shí)際意義,再運(yùn)用TML知識(shí)圖譜,將分析提取出概念背后的關(guān)聯(lián)關(guān)系,根據(jù)網(wǎng)絡(luò)狀的實(shí)體關(guān)系圖,推理出網(wǎng)絡(luò)用戶隨意性的文字下所代表的準(zhǔn)確含義。
以13個(gè)服務(wù)分類為基礎(chǔ)搭建4S店知識(shí)圖譜,利用TML規(guī)則引擎快速訓(xùn)練和迭代出初步的知識(shí)體系,再利用機(jī)器學(xué)習(xí)算法深化知識(shí)圖譜結(jié)構(gòu)。4S店行業(yè)知識(shí)圖譜搭建完成后,接著進(jìn)行評(píng)論的文本結(jié)構(gòu)化處理、文本細(xì)粒度分類處理。將抓取并處理后的評(píng)論,使用TML引擎進(jìn)行處理,TML引擎會(huì)根據(jù)定義的13種大類、27小類進(jìn)行評(píng)論的分類。同時(shí),TML引擎會(huì)匹配出該類別下的關(guān)鍵實(shí)體,匹配分析出實(shí)體關(guān)系,并通過計(jì)算機(jī)存儲(chǔ)技術(shù),將分析后的結(jié)構(gòu)化數(shù)據(jù)結(jié)果存儲(chǔ)下來。
至此,整個(gè)數(shù)據(jù)處理流程結(jié)束。最后將結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)運(yùn)算,統(tǒng)計(jì)每個(gè)類別下評(píng)論所占的比例,由此推測(cè)出該主題在4S店服務(wù)中的熱度。統(tǒng)計(jì)每個(gè)大類別中小類別的具體數(shù)據(jù),由此推測(cè)出小類出現(xiàn)的熱度。
2.3 數(shù)據(jù)統(tǒng)計(jì)和分析
2.3.1 4S店各服務(wù)環(huán)節(jié)用戶關(guān)注占比分析
我們對(duì)用戶在4S店的服務(wù)環(huán)節(jié)的關(guān)注度,共計(jì)13個(gè)服務(wù)類別進(jìn)行了統(tǒng)計(jì)分析。這13個(gè)環(huán)節(jié)類別包括了4S店的整個(gè)服務(wù)流程,包括:售前服務(wù)、費(fèi)用解釋、售前配件、提車環(huán)節(jié)、新車核對(duì)、承諾兌現(xiàn)、新車掛牌、新車貸款、售后保養(yǎng)、霸王條款、售后維修、投訴處理和保險(xiǎn)等。針對(duì)這13個(gè)類別選出最受關(guān)注服務(wù)前5類、較受關(guān)注的4類、關(guān)注度較低的4類。
4S店每環(huán)節(jié)服務(wù)所受關(guān)注占比分析結(jié)果,如圖3所示。
圖3 4S服務(wù)環(huán)節(jié)用戶關(guān)注占比
最受消費(fèi)者關(guān)注的服務(wù)前5類分別是:售前服務(wù)占33.67%、售后保養(yǎng)17.71%、新車核對(duì)占15.05%、提車環(huán)節(jié)占10.13%、售后維修占6.65% ;其次,比較受消費(fèi)者關(guān)注的服務(wù)環(huán)節(jié)的4類分別是:投訴處理5.06%、車輛保險(xiǎn)4.82%、費(fèi)用解釋3.26%、售前配件2.24%。
整體服務(wù)類別受關(guān)注的占比結(jié)果反映了從看車、選車、購車到售后保養(yǎng)、售后維修等整個(gè)與4S店往來過程中,消費(fèi)者最在意的是哪些環(huán)節(jié)、最關(guān)注的是哪些服務(wù)或品質(zhì)。
2.3.2 4S店最受關(guān)注服務(wù)的關(guān)注點(diǎn)分析
在所有的服務(wù)環(huán)節(jié)中一共設(shè)置分析了27個(gè)相關(guān)關(guān)注點(diǎn)。分別是:接待服務(wù)、預(yù)約咨詢服務(wù)、產(chǎn)品介紹服務(wù)、試駕服務(wù)、講價(jià)態(tài)度、售前服務(wù)費(fèi)用解釋說明、維修保養(yǎng)費(fèi)用解釋說明、配件價(jià)值、原廠配件供應(yīng)、提車時(shí)間拖延、合同上提車日期缺失、提車加價(jià)、口頭承諾兌現(xiàn)、新車質(zhì)量及相關(guān)證件核對(duì)問題、上牌困難、強(qiáng)制保險(xiǎn)、保險(xiǎn)理賠、新車貸款及利息、保養(yǎng)里程提前、保養(yǎng)服務(wù)項(xiàng)目、維修保養(yǎng)價(jià)格、維修等待時(shí)間、維修一次修復(fù)率、維修質(zhì)量預(yù)期、維修偷換零件、售后霸王條款、投訴處理態(tài)度等。
通過對(duì)每個(gè)服務(wù)環(huán)節(jié)進(jìn)行熱點(diǎn)分析,所有的關(guān)注熱點(diǎn)占比排列結(jié)果如圖4所示。
通過以上的數(shù)據(jù),我們還可以對(duì)每個(gè)環(huán)節(jié)中消費(fèi)者具體關(guān)注點(diǎn)的關(guān)注度進(jìn)行數(shù)據(jù)分析。由于篇幅所限,僅選取一個(gè)關(guān)注點(diǎn)做示例。
售前服務(wù)環(huán)節(jié)在4S店服務(wù)流程中占比33.67%,位居最受關(guān)注第1名。此環(huán)節(jié)中,消費(fèi)者比較關(guān)注的具體服務(wù)內(nèi)容包括門店的接待服務(wù)、電話預(yù)約咨詢、產(chǎn)品介紹服務(wù)、車輛試駕服務(wù)、講價(jià)還價(jià)的態(tài)度這五個(gè)關(guān)注點(diǎn)。我們通過采集的數(shù)據(jù)做了分析統(tǒng)計(jì),可以得出每一個(gè)關(guān)注點(diǎn)在售前服務(wù)這一環(huán)節(jié)所占的比重。
分析結(jié)果顯示,在售前服務(wù)環(huán)節(jié),門店的接待服務(wù)比例90.7%,所占比重最大,消費(fèi)者買車或看車時(shí)進(jìn)店的第一印象尤為重要;其次是試駕服務(wù)所占比例4.37%,試駕是對(duì)這輛車最直觀的感受,消費(fèi)者對(duì)試駕的良好體驗(yàn)也比較看重;然后是產(chǎn)品的介紹服務(wù)所占比例2.40%,大多數(shù)消費(fèi)者都很在意是否得到銷售員熱情的服務(wù),而較懂車的消費(fèi)者不僅要求服務(wù)人員的態(tài)度,而且對(duì)產(chǎn)品介紹的專業(yè)度也很在意;最后是講價(jià)的態(tài)度所占比例1.77%,部分消費(fèi)者在意與銷售員講價(jià)或咨詢買車優(yōu)惠時(shí)其表現(xiàn)的態(tài)度,這讓消費(fèi)者感覺是否受到對(duì)方的尊重;也有極少數(shù)的消費(fèi)者會(huì)在電話預(yù)約咨詢時(shí)在意服務(wù)的質(zhì)量問題,在售前服務(wù)環(huán)節(jié)中占0.72%。
3 總結(jié)與展望
通過對(duì)4S店消費(fèi)者信息進(jìn)行挖掘和處理,我們清楚地了解到消費(fèi)者在接受4S店服務(wù)全流程中的主要關(guān)注點(diǎn),可以對(duì)關(guān)注度實(shí)現(xiàn)量化分析。這是以往的技術(shù)手段無法達(dá)到的效果。給滿意度調(diào)查問卷的編制提供了非常有價(jià)值的數(shù)據(jù)。
這類工作在大數(shù)據(jù)行業(yè)中屬于典型的用戶輿情發(fā)現(xiàn),通過對(duì)海量的網(wǎng)上用戶評(píng)論的深度分析,洞察用戶對(duì)行業(yè)的不滿和建議,通過語義分析技術(shù)對(duì)互聯(lián)網(wǎng)信息的整合分析,消除行業(yè)與消費(fèi)者之間的信息鴻溝。對(duì)于專業(yè)的滿意度調(diào)查公司來說,也是快速了解行業(yè)的重要輔助手段。
TML技術(shù)在整個(gè)數(shù)據(jù)洞察過程中,充分體現(xiàn)了其優(yōu)勢(shì)。能夠?qū)崿F(xiàn)對(duì)消費(fèi)者不同關(guān)注點(diǎn)的定量分析,對(duì)于準(zhǔn)確把握消費(fèi)者的實(shí)際關(guān)注點(diǎn),具有極為重要的參考價(jià)值。
對(duì)本次人工智能進(jìn)行的分類結(jié)果進(jìn)行核查,準(zhǔn)確性達(dá)到了95%左右,我們的結(jié)論是現(xiàn)有的人工智能技術(shù)在用戶輿情發(fā)現(xiàn)方面,已經(jīng)具備了實(shí)用的價(jià)值,其準(zhǔn)確性已經(jīng)達(dá)到了較高的水平,完全滿足滿意度調(diào)查工作的需要。
另外一方面,知識(shí)圖譜的建立和數(shù)據(jù)的訓(xùn)練相對(duì)成本較高,整個(gè)工作的周期仍然較長(zhǎng),如果想要在滿意度調(diào)查中大面積推廣該項(xiàng)技術(shù),下一步還應(yīng)不斷完善數(shù)據(jù)過濾及文本分析技術(shù),對(duì)重要的行業(yè)提前建立行業(yè)的知識(shí)圖譜,確保行業(yè)應(yīng)用的效率。構(gòu)建云服務(wù)平臺(tái),共享知識(shí)圖譜,共享訓(xùn)練成果,其服務(wù)效率將大幅提高,成本也會(huì)逐步降低。在可以預(yù)見的將來,人工智能技術(shù)將成為滿意度測(cè)評(píng)領(lǐng)域的重要技術(shù)手段,并應(yīng)用于質(zhì)量研究的更多領(lǐng)域。
參考文獻(xiàn)
[1] 李佳靜, 李曉明, 孟濤. TML:一種通用高效的文本挖掘語言[J]. 計(jì)算機(jī)研究與發(fā)展, 2015, 52(3):553-560.
[2] 車海燕, 馮鐵, 張家晨,等. 面向中文自然語言文檔的自動(dòng)知識(shí)抽取方法[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(4):834-842.