亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于關(guān)鍵詞挖掘的客戶細(xì)分方法

        2017-06-15 18:52:34陳星宇黃俊文
        關(guān)鍵詞:分類(lèi)特征用戶

        陳星宇,周 展,黃俊文,陶 達(dá)

        1) 深圳大學(xué)管理學(xué)院,廣東深圳 518060;2) 深圳大學(xué)人因工程研究所,廣東深圳 518060

        【電子與信息科學(xué) / Electronic and Information Science】

        基于關(guān)鍵詞挖掘的客戶細(xì)分方法

        陳星宇1,周 展1,黃俊文1,陶 達(dá)2

        1) 深圳大學(xué)管理學(xué)院,廣東深圳 518060;2) 深圳大學(xué)人因工程研究所,廣東深圳 518060

        提出一種基于關(guān)鍵詞的數(shù)據(jù)挖掘方法對(duì)客戶群進(jìn)行細(xì)分,采用自然語(yǔ)義處理的方法從原始客戶信息文本中提取客戶特征關(guān)鍵詞.再通過(guò)人工標(biāo)記一些與內(nèi)在特征維度相關(guān)的關(guān)鍵詞,基于這些關(guān)鍵詞找到特征客戶.最后以特征客戶作為訓(xùn)練集,獲得更多關(guān)于某個(gè)維度內(nèi)客戶特征的關(guān)鍵詞,再進(jìn)行新一輪的客戶細(xì)分.經(jīng)此模式學(xué)習(xí)過(guò)程,得到基于內(nèi)在特征維度的客戶細(xì)分群體.通過(guò)與采用隨機(jī)選擇特征關(guān)鍵詞的基準(zhǔn)化方法進(jìn)行自動(dòng)客戶細(xì)分結(jié)果對(duì)比,發(fā)現(xiàn)采用基于關(guān)鍵詞數(shù)據(jù)挖掘的自動(dòng)客戶細(xì)分結(jié)果得到的準(zhǔn)確度更高,結(jié)果更穩(wěn)?。?/p>

        人工智能;自然語(yǔ)言處理;知識(shí)工程;客戶細(xì)分;關(guān)鍵詞挖掘;客戶特征;數(shù)據(jù)挖掘

        對(duì)企業(yè)來(lái)說(shuō),單純地滿足客戶需求,強(qiáng)調(diào)為所有客戶提供同樣優(yōu)質(zhì)的服務(wù),可能使企業(yè)不能將有限的資源恰當(dāng)?shù)剡\(yùn)用到有價(jià)值的客戶身上,企業(yè)的努力很可能事倍功半.因此,企業(yè)需要區(qū)別對(duì)待客戶,客戶細(xì)分是客戶關(guān)系管理中基礎(chǔ)性的重要內(nèi)容[1].

        客戶細(xì)分指根據(jù)行為和偏好等因素從群體中識(shí)別出特定客戶的建模方法.在概念上,客戶細(xì)分是將客戶分為有相似行為方式或需求的客戶子集的過(guò)程[2].不同于傳統(tǒng)的市場(chǎng)細(xì)分理論[3],客戶細(xì)分方法可管理大量的客戶特征屬性,并且基于特定數(shù)據(jù)維度進(jìn)行細(xì)分.細(xì)分方法的選擇取決于研究的具體目標(biāo)[4].

        客戶細(xì)分方法通常包括以下步驟[5]:① 數(shù)據(jù)確定與收集;② 不同來(lái)源數(shù)據(jù)的整合及預(yù)處理;③ 開(kāi)發(fā)細(xì)分的數(shù)據(jù)分析方法;④ 建立關(guān)于細(xì)分的相關(guān)業(yè)務(wù)部門(mén)(如市場(chǎng)營(yíng)銷(xiāo)和客戶服務(wù))之間的有效溝通;⑤ 利用應(yīng)用程序處理數(shù)據(jù),并為程序提供的信息作出反饋等.

        以往關(guān)于客戶細(xì)分技術(shù)可分為監(jiān)督和無(wú)監(jiān)督兩種.聚類(lèi)分析法是常見(jiàn)的無(wú)監(jiān)督客戶細(xì)分技術(shù),它包括一組不同的技術(shù).給定一組選定的細(xì)分變量,利用這些技術(shù)將個(gè)體匯總成群體.每個(gè)群體中包含著最相似的個(gè)體,且這些個(gè)體與其他群體并無(wú)關(guān)聯(lián).基于客戶數(shù)據(jù)之間模糊距離的聚類(lèi)客戶數(shù)據(jù)分析可得到比其他方法更有效的市場(chǎng)細(xì)分結(jié)果[6].另一種常見(jiàn)的無(wú)監(jiān)督方法是聯(lián)合分析[7],它通過(guò)評(píng)估擁有不同屬性層面的替代品的秩或者總價(jià)值進(jìn)行整體信息判斷,并通過(guò)回歸、層次貝葉斯模型或線性規(guī)劃來(lái)估計(jì)單屬性值函數(shù)的離散水平來(lái)實(shí)現(xiàn)細(xì)分[8].此外,科霍南映射或者自組織映射也被廣泛用于降維和聚類(lèi),同時(shí)也用于多維數(shù)據(jù)的各種應(yīng)用[9].其他人工智能技術(shù),包括模擬退火算法[10]、神經(jīng)網(wǎng)絡(luò)[11]和遺傳算法[12]也被用到無(wú)監(jiān)督客戶細(xì)分方法中.相比無(wú)監(jiān)督聚類(lèi)方法,監(jiān)督分類(lèi)方法要求在進(jìn)行分類(lèi)前為每一類(lèi)生成代表性的參數(shù),而無(wú)監(jiān)督方法會(huì)自動(dòng)從數(shù)據(jù)集中識(shí)別集群.常見(jiàn)的監(jiān)督分類(lèi)方法有線性判別分析(linear discriminant analysis, LDA)[13]、k鄰近法[14]和決策樹(shù)法[15]等.無(wú)監(jiān)督方法在進(jìn)行數(shù)據(jù)分類(lèi)時(shí)只有少量的先驗(yàn)知識(shí),或者在分類(lèi)過(guò)程中需要避免主觀性時(shí)才非常實(shí)用[16].若監(jiān)督條件可被滿足,也就是說(shuō),導(dǎo)出分類(lèi)規(guī)則所需要數(shù)據(jù)點(diǎn)的成員能夠闡明集群的一般結(jié)構(gòu),則監(jiān)督數(shù)據(jù)更加準(zhǔn)確[17].

        然而,上述監(jiān)督和無(wú)監(jiān)督客戶細(xì)分技術(shù)都不能很好的基于客戶內(nèi)在特征做細(xì)分.因?yàn)榭蛻舻膬?nèi)在特征通常是抽象模糊的,通過(guò)準(zhǔn)確的詞語(yǔ)(特征)來(lái)描述客戶的內(nèi)在特征(如客戶的生活方式、價(jià)值觀和個(gè)性等)也非常困難.同時(shí),網(wǎng)絡(luò)傳播語(yǔ)言的抽象性[18]也使這些數(shù)據(jù)更加難以處理.此外,基于這些抽象維度將客戶手動(dòng)劃分為不同群體更是一項(xiàng)繁冗的工作.為此,本研究提出一種基于關(guān)鍵詞的數(shù)據(jù)挖掘方法,針對(duì)客戶的內(nèi)在特征對(duì)客戶進(jìn)行細(xì)分,既避免了無(wú)監(jiān)督分類(lèi)方法準(zhǔn)確度欠佳的問(wèn)題,又解決了監(jiān)督分類(lèi)方法對(duì)數(shù)據(jù)要求較高的問(wèn)題,且保證了低成本和高準(zhǔn)確率.

        1 方法及范例

        本研究提出的模型包含數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、基于關(guān)鍵詞挖掘的客戶分類(lèi)及方法評(píng)估4部分,如圖1.

        圖1 基于關(guān)鍵詞的客戶細(xì)分框架Fig.1 Keyword-based customer segmentation framework

        1.1 客戶數(shù)據(jù)收集

        由于在線數(shù)據(jù)中包含了大量客戶信息,因此本研究選取亞馬遜購(gòu)物網(wǎng)站(https://www.amazon.cn)用戶數(shù)據(jù)作為輸入.首先從此網(wǎng)站的注冊(cè)用戶中,選取在近3個(gè)月中進(jìn)行過(guò)交易的1萬(wàn)名中國(guó)用戶,再?gòu)倪@1萬(wàn)個(gè)用戶中隨機(jī)篩選出600名用戶作為樣本用戶,最后從這600名用戶的個(gè)人資料里提取出自我描述部分的文本數(shù)據(jù),組成本研究的樣本數(shù)據(jù)集.對(duì)于這600個(gè)樣本數(shù)據(jù),取其中500名用戶的數(shù)據(jù),利用本研究提出的模型進(jìn)行分類(lèi),其余100名用戶的數(shù)據(jù)則用作測(cè)試數(shù)據(jù).

        1.2 數(shù)據(jù)預(yù)處理

        預(yù)處理階段,本研究應(yīng)用自然語(yǔ)言處理將整個(gè)文本按照名詞、動(dòng)詞和形容詞標(biāo)簽分割成小的詞匯單位[19].例如,某客戶自我描述是:“我是一個(gè)家庭主婦.我的享受生活的方式是成為饑餓的浪漫讀者,所以我癡迷于亞馬遜網(wǎng)站.我非常享受安靜的時(shí)間,閱讀是我最喜歡的愛(ài)好之一.”通過(guò)基于自然語(yǔ)言處理的預(yù)處理分析,則變成了下面的語(yǔ)法單元:((主語(yǔ)(名詞性物主代詞“我”))(謂語(yǔ)(系動(dòng)詞“是”))(賓語(yǔ)(定冠詞“一個(gè)”)(名詞“家庭主婦”))(主語(yǔ)(形容詞性物主代詞“我的”)(名詞“享受生活的方式”))(謂語(yǔ)(情態(tài)動(dòng)詞“是”)(動(dòng)詞“成為”))(狀語(yǔ)(形容詞“饑餓的”))(賓語(yǔ)(名詞“浪漫”)(名詞“讀者”))(狀語(yǔ)(連接詞“所以”)(主語(yǔ)(名詞性物主代詞“我”))(狀語(yǔ)(介詞短語(yǔ)“當(dāng)然”))(謂語(yǔ)(動(dòng)詞短語(yǔ)“癡迷于”))(賓語(yǔ)(名詞“亞馬遜網(wǎng)站”))(主語(yǔ)(名詞性物主代詞“我”))(狀語(yǔ)(副詞“非?!?)(謂語(yǔ)(動(dòng)詞“享受”))(狀語(yǔ)(形容詞“安靜的”))(賓語(yǔ)(名詞“時(shí)間”))(主語(yǔ)(動(dòng)名詞“閱讀”))(謂語(yǔ)(系動(dòng)詞“是”))(賓語(yǔ)(名詞性物主代詞“我”)(形容詞“最喜歡的”)(名詞“愛(ài)好”)(介詞短語(yǔ)“之一”))))僅帶有名詞、動(dòng)詞和形容詞標(biāo)簽的詞匯單元才被收集為關(guān)鍵詞.冠詞和描述性的形容詞,如“一個(gè)”、“許多”和“幾個(gè)”都被刪除.基于與特定領(lǐng)域相關(guān)的候選關(guān)鍵詞,從客戶數(shù)據(jù)中生成關(guān)鍵詞,如“家庭主婦”、“享受”、“饑餓的”、“浪漫”、“讀者”、“癡迷”、“亞馬遜”、“享受”、“安靜”、“時(shí)間”、“閱讀”、“最喜歡”和“愛(ài)好”等.

        1.3 基于關(guān)鍵詞挖掘分類(lèi)的4個(gè)步驟

        1.3.1 關(guān)鍵詞定義

        根據(jù)客戶樣本數(shù)據(jù)中生成的關(guān)鍵詞,基于客戶內(nèi)在特征的角度,從客戶的參與(使用頻率和使用時(shí)間等)、客戶的認(rèn)知(職業(yè)和經(jīng)歷等)以及客戶的情感(熱愛(ài)和好奇等)3個(gè)方面將關(guān)于客戶內(nèi)在特征的關(guān)鍵詞分為3個(gè)維度.分別選取3位網(wǎng)站管理者(在亞馬遜中國(guó)區(qū)客戶經(jīng)理職位上有3年以上工作經(jīng)歷)、3位網(wǎng)站老用戶(在亞馬遜網(wǎng)站使用時(shí)間3年以上,同時(shí)使用亞馬遜頻率很高且經(jīng)常有反饋的用戶),以及3位數(shù)據(jù)挖掘?qū)<?在亞馬遜網(wǎng)站從事文本數(shù)據(jù)挖掘工作3年以上的工程師)作為領(lǐng)域?qū)<?,從上?個(gè)維度手動(dòng)預(yù)定義相關(guān)關(guān)鍵詞,最后確定了如表1的40個(gè)預(yù)定義關(guān)鍵詞.

        表1 每個(gè)客戶特征維度的特征關(guān)鍵詞

        1.3.2 定義代表客戶

        定義代表客戶為在客戶的自我描述數(shù)據(jù)中某一維度的關(guān)鍵詞詞頻大于1的客戶.通過(guò)此定義,500名客戶中有158人被選為代表客戶,這些代表客戶相當(dāng)于自我描述中出現(xiàn)第1步中預(yù)定義的特征關(guān)鍵詞頻率較高的人.同時(shí),發(fā)現(xiàn)在大多數(shù)的代表客戶中,出現(xiàn)關(guān)鍵詞的詞頻大于3,說(shuō)明基于上述定義的識(shí)別代表客戶的標(biāo)準(zhǔn),識(shí)別準(zhǔn)確率較高.

        1.3.3 標(biāo)識(shí)代表客戶數(shù)據(jù)

        找出代表客戶后,通過(guò)標(biāo)識(shí)代表客戶數(shù)據(jù)中的預(yù)定義特征關(guān)鍵詞進(jìn)行關(guān)鍵詞挖掘.具體操作為:

        1) 在代表客戶數(shù)據(jù)中標(biāo)識(shí)出相應(yīng)維度的預(yù)定義關(guān)鍵詞.首先,分別確定用于區(qū)分不同維度的相應(yīng)標(biāo)識(shí)(本研究通過(guò)不同顏色來(lái)標(biāo)識(shí),紅色為維度1;藍(lán)色為維度2;黃色為維度3).然后,在代表客戶的自我描述數(shù)據(jù)中將相應(yīng)維度的預(yù)定義關(guān)鍵詞標(biāo)識(shí)出來(lái),作為下一步進(jìn)行機(jī)器學(xué)習(xí)的范例.

        3)在挖掘出的關(guān)鍵詞數(shù)據(jù)集中選擇出至少出現(xiàn)3次的關(guān)鍵詞.初步選出相應(yīng)維度的數(shù)據(jù)集后,在每個(gè)數(shù)據(jù)集中進(jìn)行詞頻分析,剔除出現(xiàn)頻率少于3次的關(guān)鍵詞后,得到更精確的數(shù)據(jù)集.

        此關(guān)鍵詞挖掘過(guò)程,既通過(guò)預(yù)定義關(guān)鍵詞保證了挖掘的準(zhǔn)確性,又利用了機(jī)器學(xué)習(xí)的自動(dòng)化過(guò)程實(shí)現(xiàn)快速高效地挖掘出大量關(guān)鍵詞.經(jīng)此過(guò)程,更多的關(guān)鍵詞被挖掘出來(lái),如表2.

        表2 每個(gè)維度中挖掘出的特征關(guān)鍵詞

        1.3.4 運(yùn)用特征關(guān)鍵詞進(jìn)行客戶分類(lèi)

        基于近鄰法和客戶特征指數(shù)(客戶自我描述數(shù)據(jù)與3個(gè)維度的特征關(guān)鍵詞的匹配程度),利用第1步和第3步提取的關(guān)鍵詞,將500個(gè)客戶分為8類(lèi),分別歸類(lèi)為不同創(chuàng)新程度的用戶,具體為:

        1)自我描述與特征關(guān)鍵詞完全不匹配的客戶(有1類(lèi)客戶,記為類(lèi)型A),此類(lèi)型為最不具創(chuàng)新特征的用戶.

        2)自我描述只與一個(gè)維度的特征關(guān)鍵詞匹配的客戶(有3類(lèi)客戶,記為類(lèi)型B、C和D),其創(chuàng)新性較低.

        3)自我描述與兩個(gè)維度的特征關(guān)鍵詞匹配的客戶(有3類(lèi)客戶,記為類(lèi)型E、F和G),屬于創(chuàng)新性較好的用戶.

        4)自我描述與3個(gè)維度的特征關(guān)鍵詞均匹配的客戶(有1類(lèi)客戶,記為類(lèi)型H),則屬于創(chuàng)新用戶.

        實(shí)際上,在此分類(lèi)中可以將用戶的某一特點(diǎn)(如創(chuàng)新性)進(jìn)行更精細(xì)的分類(lèi),而非簡(jiǎn)單的是與否分類(lèi),從而使企業(yè)在客戶細(xì)分時(shí)可更靈活地根據(jù)需求來(lái)選取細(xì)分類(lèi)別.同時(shí),該方法應(yīng)用性強(qiáng),只要確定細(xì)分依據(jù)(創(chuàng)新、活躍和忠誠(chéng)等),并選取相應(yīng)的刻畫(huà)維度,即可按照上述過(guò)程進(jìn)行細(xì)分.

        1.4 方法評(píng)估

        方法評(píng)估有2個(gè)步驟:

        第1步:檢驗(yàn)自動(dòng)分類(lèi)法準(zhǔn)確度和特征關(guān)鍵詞數(shù)量的關(guān)系.提供一組預(yù)定義的關(guān)鍵詞.然后,根據(jù)這組關(guān)鍵詞,利用本研究提出的自動(dòng)分類(lèi)方法生成不同的客戶分類(lèi).用自動(dòng)分類(lèi)的客戶類(lèi)別數(shù)量與相應(yīng)的手動(dòng)分類(lèi)的客戶類(lèi)別數(shù)量的匹配百分比來(lái)表示自動(dòng)分類(lèi)方法的準(zhǔn)確度,比較自動(dòng)分類(lèi)和按同一標(biāo)準(zhǔn)進(jìn)行手動(dòng)分類(lèi)的結(jié)果.關(guān)鍵詞挖掘的過(guò)程旨在發(fā)現(xiàn)更多關(guān)鍵詞,而自動(dòng)分類(lèi)法是通過(guò)關(guān)鍵詞挖掘產(chǎn)生新一組關(guān)鍵詞.所以,可通過(guò)計(jì)算新一組關(guān)鍵詞進(jìn)行自動(dòng)分類(lèi)的準(zhǔn)確度,再次比較自動(dòng)分類(lèi)的結(jié)果與手動(dòng)分類(lèi)結(jié)果,此過(guò)程一直持續(xù)到準(zhǔn)確度值不再變化為止.這樣就可以得到以自動(dòng)分類(lèi)方法的準(zhǔn)確度為縱軸,相應(yīng)的特征關(guān)鍵詞數(shù)量為橫軸的關(guān)系曲線,由此確定自動(dòng)分類(lèi)法準(zhǔn)確度和特征關(guān)鍵詞數(shù)量的關(guān)系.若兩者正相關(guān),說(shuō)明所提方法有助于提高自動(dòng)分類(lèi)的準(zhǔn)確度.

        第2步:比較自動(dòng)分類(lèi)和基準(zhǔn)化方法[21]分類(lèi)的結(jié)果.在關(guān)鍵詞挖掘過(guò)程中,把使用自動(dòng)分類(lèi)方法進(jìn)行客戶細(xì)分的結(jié)果與使用基準(zhǔn)化方法進(jìn)行客戶細(xì)分的結(jié)果進(jìn)行比較.基準(zhǔn)化方法并未在分類(lèi)開(kāi)始就手動(dòng)定義關(guān)鍵詞,也無(wú)關(guān)鍵詞挖掘過(guò)程,它對(duì)特征關(guān)鍵詞的選擇是隨意的.通過(guò)比較在不同數(shù)量的關(guān)鍵詞的情況下兩種分類(lèi)方法的準(zhǔn)確度,驗(yàn)證基于關(guān)鍵詞挖掘方法的自動(dòng)分類(lèi)的效率.

        2 結(jié)果與討論

        本研究通過(guò)對(duì)手動(dòng)分類(lèi)(測(cè)試組)和系統(tǒng)自動(dòng)分類(lèi)的結(jié)果進(jìn)行對(duì)比來(lái)檢驗(yàn)本研究中客戶細(xì)分方法的可行性.隨機(jī)選定500個(gè)用戶,通過(guò)系統(tǒng)自動(dòng)進(jìn)行細(xì)分,而另外隨機(jī)選定100個(gè)用戶,通過(guò)同樣的細(xì)分標(biāo)準(zhǔn)進(jìn)行手動(dòng)分類(lèi),結(jié)果見(jiàn)表3.其中,匹配用戶數(shù)為在500位用戶自動(dòng)分成8類(lèi)以后,每一類(lèi)中的用戶與手動(dòng)分類(lèi)出來(lái)的對(duì)應(yīng)類(lèi)別中的用戶相匹配的數(shù)目;準(zhǔn)確率即為匹配用戶數(shù)與手動(dòng)分類(lèi)的用戶數(shù)的比值.

        由表3可見(jiàn),不同客戶群體的平均精度達(dá)77.0%,表明大部分采用特征關(guān)鍵詞自動(dòng)分類(lèi)算法具有較高準(zhǔn)確率,且與先前的只將用戶分為普通用戶和領(lǐng)先用戶的領(lǐng)先用戶理論相比,該客戶細(xì)分模型分類(lèi)結(jié)果精確.此外,分類(lèi)準(zhǔn)確率隨著特征關(guān)鍵詞數(shù)量增加而上升,這進(jìn)一步驗(yàn)證本研究提出的分類(lèi)方法的可行性和穩(wěn)健性.這項(xiàng)試驗(yàn)從40個(gè)已定義的關(guān)鍵詞(表1)開(kāi)始,在通過(guò)機(jī)器學(xué)習(xí)挖掘關(guān)鍵詞的過(guò)程中,分別選定含有60、80、100和120個(gè)關(guān)鍵詞的4組關(guān)鍵詞,并用這5組關(guān)鍵詞為測(cè)試組的100個(gè)用戶做客戶分類(lèi).客戶分類(lèi)結(jié)果與手動(dòng)分類(lèi)結(jié)果比較如圖2.

        表3 自動(dòng)分類(lèi)中每種客戶類(lèi)型的準(zhǔn)確率

        圖2 關(guān)鍵詞挖掘和隨機(jī)選擇之間的結(jié)果比較Fig.2 Comparison of results from keyword mining and random selection

        圖2展示了分別采用機(jī)器學(xué)習(xí)的關(guān)鍵詞挖掘方法和采用隨機(jī)選擇特征關(guān)鍵詞的基準(zhǔn)化方法進(jìn)行自動(dòng)客戶細(xì)分結(jié)果.其中,采用隨機(jī)選擇特征關(guān)鍵詞的基準(zhǔn)化方法的客戶細(xì)分方法的準(zhǔn)確率計(jì)算過(guò)程為:通過(guò)基準(zhǔn)化方法隨機(jī)選取出與關(guān)鍵詞挖掘方法數(shù)量一樣的關(guān)鍵詞;再使用與同樣的步驟計(jì)算出基于不同數(shù)量關(guān)鍵詞的分類(lèi)結(jié)果的準(zhǔn)確率,并將這一準(zhǔn)確率作成折線圖.

        由圖2實(shí)線可見(jiàn),隨著從代表性客戶中學(xué)習(xí)的特征關(guān)鍵詞數(shù)量增加,采用自動(dòng)分類(lèi)方法的準(zhǔn)確度亦明顯增加,未采用機(jī)器學(xué)習(xí)挖掘時(shí)準(zhǔn)確度僅39%,而采用機(jī)器學(xué)習(xí)挖掘關(guān)鍵詞后最終的準(zhǔn)確度達(dá)77%.結(jié)果表明,采用機(jī)器學(xué)習(xí)的關(guān)鍵詞挖掘方法較采用隨機(jī)選擇特征關(guān)鍵詞的基準(zhǔn)化方法進(jìn)行客戶細(xì)分結(jié)果更準(zhǔn)確.

        實(shí)證研究還表明,該模型能夠識(shí)別更多的創(chuàng)新客戶.在之前的研究中,領(lǐng)先用戶是通過(guò)那些已經(jīng)從相關(guān)角度所定義好的領(lǐng)先用戶特征來(lái)確定的.而在研究中,在所列出的3個(gè)內(nèi)在特征中有任意兩個(gè)顯示是高水平的話就將被確定為創(chuàng)新用戶.在所選客戶樣品中所識(shí)別的創(chuàng)新客戶的25%,高于基于傳統(tǒng)的問(wèn)卷調(diào)查的研究提供的數(shù)據(jù)[22].此外,基于關(guān)鍵詞挖掘的客戶細(xì)分方法因所有數(shù)據(jù)均采集自互聯(lián)網(wǎng),可以非常低的成本找到狂熱的創(chuàng)新者(或領(lǐng)先用戶、創(chuàng)新用戶).

        需要指出的是,本研究方法對(duì)非創(chuàng)新客戶識(shí)別的準(zhǔn)確度僅為54.5%.這是因?yàn)楸狙芯績(jī)H關(guān)注創(chuàng)新用戶的識(shí)別,對(duì)創(chuàng)新用戶識(shí)別的總準(zhǔn)確率達(dá)86.8%,基本滿足相關(guān)公司選取創(chuàng)新用戶的需求.因此,依然可認(rèn)為該細(xì)分模型在客戶細(xì)分和創(chuàng)新用戶識(shí)別上是成功的.下一步,將針對(duì)非創(chuàng)新用戶識(shí)別作深入探索,以進(jìn)一步提高分類(lèi)方法的準(zhǔn)確性.

        結(jié) 語(yǔ)

        本研究提出一種基于關(guān)鍵詞的數(shù)據(jù)挖掘方法對(duì)客戶進(jìn)行細(xì)分,通過(guò)對(duì)比采用關(guān)鍵詞數(shù)據(jù)挖掘分類(lèi)方法的結(jié)果與采用人工分類(lèi)及標(biāo)桿進(jìn)行分類(lèi)的結(jié)果,發(fā)現(xiàn)所提方法能夠更準(zhǔn)確地細(xì)分基于不同內(nèi)在特征的客戶群體.研究可供企業(yè)單位通過(guò)分析網(wǎng)上客戶數(shù)據(jù),定位潛在客戶群體,制定相應(yīng)的市場(chǎng)與新產(chǎn)品開(kāi)發(fā)策略.

        / References:

        [1] 王扶東,馬玉芳.基于數(shù)據(jù)挖掘的客戶細(xì)分方法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(4): 215-218. Wang Fudong, Ma Yufang. Research of method for customer segment based on data mining[J]. Computer Engineering and Application, 2011, 47(4): 215-218.(in Chinese)

        [2] Foedermayr E K, Diamantopoulos A. Market segmentation in practice: review of empirical studies, methodological assessment, and agenda for future research[J]. Journal of Strategic Marketing, 2008, 16(3): 223-265.

        [3] Saliba S J, Turner R E. Marketing management: analysis, planning, implementation and control[M]. 8th ed. Philip K, Ronald E T. Scarborough, Canadian: Prentice-Hall, 1995.

        [4] Tsiptsis K, Chorianopoulos A. Data mining techniques in CRM: inside customer segmentation[M]. Hoboken, USA: John Wiley & Sons, 2011.

        [5] Liang Daolei, Chen Haibo. An online mall CRM model based on data mining[C]// Quantitative Logic and Soft Computing. Hangzhou, China: Springer International Publishing, 2017, 510: 599-606.

        [6] Chan K Y, Kwong C K, Hu B Q. Market segmentation and ideal point identification for new product design using fuzzy data compression and fuzzy clustering methods[J]. Applied Soft Computing, 2012, 12(4): 1371-1378.

        [7] Green P E, Carroll J D, Goldberg S M. A general approach to product design optimization via conjoint analysis[J]. The Journal of Marketing, 1981, 45(3): 17-37.

        [8] Butler J C, Dyer J S, Jia Jianmin, et al. Enabling e-transactions with multi-attribute preference models[J]. European Journal of Operational Research, 2008, 186(2): 748-765.

        [9] Rojanavasu P, Dam H H, Abbass H A, et al. A self-organized, distributed, and adaptive rule-based induction system[J]. IEEE Transactions on Neural Networks, 2009, 20(3): 446-459.

        [10] Brusco M J, Cradit J D, Stahl S. A simulated annealing heuristic for a bicriterion partitioning problem in market segmentation[J]. Journal of Marketing Research, 2002, 39(1): 99-109.

        [11] Ayoubi M. Customer segmentation based on CLV model and neural network[J]. International Journal of Computer Science Issues, 2016, 13(2): 31.

        [12] Liu H-H, Ong C-S. Variable selection in clustering for marketing segmentation using genetic algorithms[J]. Expert Systems with Applications: an international Journal, 2008, 34(1): 502-510.

        [13] Lee E-K, Cook D, Klinke S, et al. Projection pursuit for exploratory supervised classification[J]. Journal of Computational and Graphical Statistics, 2012, 14(4): 831-846.

        [14] Duda R O, Hart P E. Pattern classification and scene analysis[M]. New York, USA: Wiley, 1973.

        [15] Swain P H, Hauska H. The decision tree classifier: design and potential[J]. IEEE Transactions on Geoscience Electronics, 1977, 15(3): 142-147.

        [16] Zou K H, Warfield S K, Bharatha A, et al. Statistical validation of image segmentation quality based on a spatial overlap index 1[J]. Academic radiology, 2004, 11(2): 178-189.

        [17] Budayan C, Dikmen I, Birgonul M T. Comparing the performance of traditional cluster analysis, self-organizing maps and fuzzy c-means method for strategic grouping[J]. Expert Systems with Applications, 2009, 36(9): 11772-11781.

        [18] 袁 兵,黃 靜, 曾一帆.網(wǎng)絡(luò)評(píng)論語(yǔ)言的抽象性對(duì)消費(fèi)者品牌態(tài)度與購(gòu)買(mǎi)意愿的影響——一項(xiàng)基于語(yǔ)言類(lèi)別模型 (LCM) 的實(shí)證研究[J].營(yíng)銷(xiāo)科學(xué)學(xué)報(bào),2013(3):17-30. Yuan Bing, Huang Jing, Zeng Yifan. The effect of language abstraction in online reviews on consumer’s brand attitude and buying intention: an empirical research based on the linguistic category model (LCM)[J]. Journal of Marketing Science, 2013, 9(3): 17-30.(in Chinese)

        [19] 陳星宇,黃俊文,周 展,等. 基于本體論的大數(shù)據(jù)下用戶需求表征[J]. 深圳大學(xué)學(xué)報(bào)理工版,2017,34(2):173-180. Chen Xingyu, Huang Junwen, Zhou Zhan, et al. Ontology-based user requirements representation in the context of big data[J]. Journal of Shenzhen University Science and Engineering, 2017,34(2): 173-180.(in Chinese)

        [20] 張 潤(rùn),王永濱.機(jī)器學(xué)習(xí)及其算法和發(fā)展研究[J].中國(guó)傳媒大學(xué)學(xué)報(bào)自然科學(xué)版,2016,23(2):10-18. Zhang Run, Wang Yongbin. Research on machine learning with algorithms and development[J]. Journal of Communication University of China Science and Technology, 2016, 23(2): 10-18.(in Chinese)

        [21] Davies J, Sure Y, Grobelnik M, et al. Automated knowledge discovery in advanced knowledge management[J]. Journal of Knowledge Management, 2005, 9(5):132-149.

        [22] Lüthje C. Characteristics of innovating users in a consumer goods field: an empirical study of sport-related product consumers[J]. Technovation, 2004, 24(9): 683-695.

        【中文責(zé)編:英 子;英文責(zé)編:子 蘭】

        2016-11-30;Accepted:2017-03-18

        Lecturer Tao Da. E-mail: taoda@szu.edu.cn

        A keyword-based mining method for customer segmentation

        Chen Xingyu1, Zhou Zhan1, Huang Junwen1, and Tao Da2

        1) College of Management, Shenzhen University, Shenzhen 518060, Guangdong Province, P.R.China2) Institute of Human Factors and Ergonomics, Shenzhen University, Shenzhen 518060, Guangdong Province, P.R.China

        We propose a novel customer segmentation method using keyword-based data mining approach. First, keywords about customer characteristics from original customer information are extracted by natural semantic processing. Then, keywords related to intrinsic characteristics are tagged. Based on the keywords, customers with the specific characteristics are identified. Finally, we use the identified customers as the training samples to obtain more keywords about the customer characteristics, and conduct a new round of customer segmentation. After the learning process, customer segmentation groups based on intrinsic characteristics are obtained. Compared with the benchmarking method of random selection of feature keywords for customer segmentation, the feasibility and validity of the proposed method are verified by a case study where a high level of accuracy rate and robustness is observed in the customer segmentation results.

        artificial intelligence; natural language processing; knowledge engineering; customer segmentation; keyword mining; customer characteristics; data mining

        :Chen Xingyu, Zhou Zhan, Huang Junwen, et al. A keyword-based mining method for customer segmentation[J]. Journal of Shenzhen University Science and Engineering, 2017, 34(3): 300-305.(in Chinese)

        國(guó)家自然科學(xué)基金資助項(xiàng)目(71502111)

        陳星宇 (1983—),女,深圳大學(xué)講師、博士.研究方向:新產(chǎn)品體驗(yàn)及客戶需求管理.E-mail:celine@szu.edu.cn

        TP 311

        A

        10.3724/SP.J.1249.2017.03300

        Foundation:National Natural Science Foundation of China (71502111)

        引 文:陳星宇,周 展,黃俊文,等.基于關(guān)鍵詞挖掘的客戶細(xì)分方法[J]. 深圳大學(xué)學(xué)報(bào)理工版,2017,34(3):300-305.

        猜你喜歡
        分類(lèi)特征用戶
        分類(lèi)算一算
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        分類(lèi)討論求坐標(biāo)
        數(shù)據(jù)分析中的分類(lèi)討論
        教你一招:數(shù)的分類(lèi)
        抓住特征巧觀察
        關(guān)注用戶
        關(guān)注用戶
        關(guān)注用戶
        日本av一级视频在线观看| 四虎影视国产在线观看精品| 久久中文字幕久久久久| 日本激情久久精品人妻热| 中国人在线观看免费的视频播放| 国产无吗一区二区三区在线欢| 美女高潮无遮挡免费视频| 麻豆久久久国内精品| 午夜少妇高潮在线观看视频| 强开少妇嫩苞又嫩又紧九色 | 国产真实强被迫伦姧女在线观看| 久久精品片| 国产不卡一区在线视频| 久久av不卡人妻出轨一区二区 | 成人片黄网站色大片免费观看cn| 久久国产成人亚洲精品影院老金| 91久久精品一二三区色| 无码少妇丰满熟妇一区二区| 久青草久青草视频在线观看| 二区久久国产乱子伦免费精品| 国产激情视频在线观看首页 | 天天狠狠综合精品视频一二三区| 富婆叫鸭一区二区三区| 男女av一区二区三区| 色噜噜狠狠一区二区三区果冻| 亚洲日韩精品久久久久久| 国产91久久精品成人看网站| 久久精品国产99国产精偷| 久久欧美与黑人双交男男| 美女极度色诱视频国产免费| 人妻夜夜爽天天爽三区麻豆av| 中国老熟女重囗味hdxx| 欧美一欧美一区二三区性| 一本色道久久综合亚州精品 | 日本特黄特色特爽大片| 亚洲欧美日韩激情在线观看| 大屁股流白浆一区二区| 久久无码潮喷a片无码高潮| 中文人妻av久久人妻18| 成人无码激情视频在线观看| 国产tv不卡免费在线观看|