亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LDA主題的改進(jìn)TFIDF95598工單智能分類研究

        2020-04-22 20:27:38武光華李洪宇劉二剛柳長發(fā)李倩
        微型電腦應(yīng)用 2020年3期
        關(guān)鍵詞:特征詞工單準(zhǔn)確率

        武光華 李洪宇 劉二剛 柳長發(fā) 李倩

        摘 要:為了提高95595工單智能分類的準(zhǔn)確率,提出了基于LDA (Latent Dirichlet Allocation)的改進(jìn)TFIDF算法。先對文本提取特征詞,然后采用K-means算法進(jìn)行聚類處理。構(gòu)建LDA模型,獲得概率分布函數(shù)θ和φ,求取語義影響力SI(semantic influence, SI) 作為特征詞的權(quán)重,該改進(jìn)算法記作SI-TFIDF(semantic influence-term frequency inverse document frequency, SI-TFIDF)。將SI-TFIDF算法與傳統(tǒng)的TFIDF算法在sougou的數(shù)據(jù)庫進(jìn)行特征詞提取,并采用K-means算進(jìn)行聚類,對比結(jié)果顯示,采用SI-TFIDF算法提取的特征詞聚類效果優(yōu)于TFIDF,驗(yàn)證了所提出方法的可靠性。在95598投訴工單上進(jìn)行仿真實(shí)驗(yàn),SI-TFIDF算法的投訴工單聚類準(zhǔn)確率高于傳統(tǒng)的TFIDF算法,驗(yàn)證了SI-TFIDF更適用于處理工單投訴的分類研究。

        關(guān)鍵詞:95598; 投訴工單; Latent dirichlet allocation; term frequency inverse document frequency

        中圖分類號(hào): TM73

        文獻(xiàn)標(biāo)志碼: A

        Abstract:In order to improve the accuracy of intelligent classification of 95595 work order, an improved TFIDF algorithm based on LDA (Latent Dirichlet allocation) is proposed. The text feature words are extracted and then the K-means algorithm is used for clustering processing. The probability distribution functions θ and φ are obtained by constructing the LDA, and semantic influence (SI) is obtained as the weight of feature words. The improved algorithm is denoted as the semantic influence-term frequency inverse document frequency (SI-TFIDF). SI-TFIDF algorithm and the traditional TFIDF algorithm are used to extract feature words in Sougou database, and K-means algorithm is used for clustering. The comparison results show that the feature words extracted by SI-TFIDF algorithm is better than TFIDF, which verifies the reliability of the method proposed in this paper. Simulation experiments on 95598 complaint work order shows that the clustering accuracy of the complaint work order of SI-TFIDF algorithm is higher than that of the traditional TFIDF algorithm, which verifies that SI-TFIDF is more suitable for the classification research of handling complaint work order.

        Key words:95598; Complaint sheets; Latent Dirichlet allocation; Term frequency inverse document frequency

        0 引言

        隨著人們對電的需求量越來越大,人們對電的質(zhì)和量兩方面的關(guān)注也越來越高,相關(guān)監(jiān)管部門在此背景下迫切需要提升居民用電服務(wù)質(zhì)量,要充分了解用電消費(fèi)者對電力的各方面需求[1]。電力客戶服務(wù)熱線95598是架設(shè)在電力企業(yè)和電力客戶之間的一個(gè)很好溝通的橋梁,通過95598工單受理內(nèi)容,電力企業(yè)可以了解用戶的訴求,更加接近民生民意[2]。同時(shí),通過95598客服人員,又能解決用戶訴求,提升用戶用電感知與電力企業(yè)的效益。但難點(diǎn)在于95598工單量巨大,用戶的訴求又存在差異性和重復(fù)訴求,無法快速查詢到每個(gè)用戶的訴求和訴求熱點(diǎn)。面對大量的客戶訴求,需要運(yùn)用合理的數(shù)據(jù)分析方法來完善和閉環(huán)各項(xiàng)工單的處理工作,聚焦用戶的熱點(diǎn)問題,以保證用戶的訴求能夠及時(shí)有效的解決[3]?;诖髷?shù)據(jù)挖掘分析技術(shù),可對95598工單受理內(nèi)容短文本數(shù)據(jù)提取主題,進(jìn)而實(shí)現(xiàn)自動(dòng)分類,工作人員可快速查詢用戶的不同訴求類型及共同的訴求熱點(diǎn),從而能夠有針對、有重點(diǎn)的提出解決辦法[4]。

        如何提高投訴工單處理水平,提高客戶服務(wù)水平,針對95598的工單分類問題的研究還比較少。文獻(xiàn)[5]采用TF-IDF方法提取工單的關(guān)鍵詞,再將詞匯擴(kuò)展到情感測點(diǎn),實(shí)現(xiàn)本文分類,該方法的工單分析方法具有更高的準(zhǔn)確率[5]。文獻(xiàn)[6]對95598的投訴工單采用自動(dòng)分類方法,建立快速精準(zhǔn)的分類模型,實(shí)現(xiàn)了電力工單的分析挖掘[6]。文獻(xiàn)[7]將成本矩陣引入到C4.5,結(jié)合Adaboost方法建立95598工單分類模型,提高了質(zhì)檢效率,降低了漏檢率[7]。文獻(xiàn)[8]采用LDA方法對投訴工單進(jìn)行數(shù)據(jù)挖掘,實(shí)現(xiàn)了電力工單的分類篩選,便簽判斷和初步歸因[8]。

        上述研究都是采用傳統(tǒng)的語義聚類方法,聚類效果不盡人意,本文基于LDA的主題概念,對TFIDF算法進(jìn)行了改進(jìn),提高了算法的聚類效果,最終實(shí)現(xiàn)95598工單的智能分類。

        1 基于LDA的改進(jìn)TFIDF

        1.1 LDA算法

        LDA (Latent Dirichlet Allocation, LDA) 模型是由Blei D M在2003年提出的,是一種概率生成模型,能夠?qū)φZ料庫進(jìn)行建模,達(dá)到對文檔降維的效果[9]。LDA的概率模型圖如圖1所示。

        從圖3和表4的對比結(jié)果可以看出,SI-TFIDF提取的關(guān)鍵詞聚類的時(shí)候效果優(yōu)于TFIDF。查全率R提高了20%;查準(zhǔn)率P提高了17%。F值由0.601上升到了0.783 7。上述仿真結(jié)果驗(yàn)證了SI-TFIDF提取的特征詞更利于文本分類。SI-TFIDF比TFIDF算法聚類效果更好,證明了本文所提方法的有效性。

        從表6可以看出,SI-TFIDF算法比TFIDF算法提取的特征詞具有更好的聚類結(jié)果,驗(yàn)證了本文所提的SI-TFIDF算法更適用于95598工單聚類分析。

        從圖4可以看出,采用IS-TFIDF提取特征詞的平均聚類準(zhǔn)確率為0.997 9,而采用TFIDF方法提取特征詞的平均聚類準(zhǔn)確率為0.953 6,驗(yàn)證了改進(jìn)后的TFIDF算法提取的特征詞更適用于95598工單分類處理。SI-TFIDF算法提高了分類器的準(zhǔn)確性。

        3 總結(jié)

        增加了SI(semantic influence,SI)語義影響力對TFIDF算法進(jìn)行了改進(jìn),實(shí)驗(yàn)對比結(jié)果驗(yàn)證了SI-TFIDF算法比傳統(tǒng)的TFIDF算法提取的特征詞具有更高的分類效果。在處理95598工單時(shí),SI-TFIDF算法具有更高的聚類效果及投訴工單聚類準(zhǔn)確率,驗(yàn)證了本文所提方法的有效性。

        參考文獻(xiàn)

        [1] 朱君,程雅夢.電力工單文本數(shù)據(jù)分析挖掘模型研究[J].電力需求側(cè)管理,2017,19(S1):87-89.

        [2] 楊鵬,劉揚(yáng),楊青.基于層次語義理解的電力系統(tǒng)客服工單分類[J].計(jì)算機(jī)應(yīng)用與軟件,2019,36(7):231-235.

        [3] 吳剛勇,張千斌,吳恒超,等.基于自然語言處理技術(shù)的電力客戶投訴工單文本挖掘分析[J].電力大數(shù)據(jù),2018,21(10):68-73.

        [4] 林溪橋,嚴(yán)旭,黃蔚.基于主成分分析法的95598客戶服務(wù)工單分類優(yōu)化[J].廣西電力,2017,40(4):10-12

        [5] 顧斌,彭濤,車偉.基于詞典擴(kuò)充的電力客服工單情感傾向性分析[J].現(xiàn)代電子技術(shù),2017,40(11):163-166.

        [6] 鄒云峰,何維民,趙洪瑩,等.文本挖掘技術(shù)在電力工單數(shù)據(jù)分析中的應(yīng)用[J].現(xiàn)代電子技術(shù),2016,39(17):149-152.

        [7] 劉建,趙加奎,楊維,等.電力95598客戶服務(wù)質(zhì)檢抽樣算法研究[J].電網(wǎng)技術(shù),2015,39(11):3163-3168.

        [8] 劉興平,章曉明,沈然,等.電力企業(yè)投訴工單文本挖掘模型[J].電力需求側(cè)管理,2016,18(2):57-60.

        [9] 路榮.基于隱主題分析和文本聚類的微博客中新聞話題發(fā)現(xiàn)[J].模式識(shí)別與人工智能,2012,25(3):382-387.

        [10] 張建娥.基于TFIDF和詞語關(guān)聯(lián)度的中文關(guān)鍵詞提取方法[J].情報(bào)科學(xué),2012,30(10):1542-1544.

        [11] 孫鴻飛,侯偉.改進(jìn)TFIDF算法在潛在合作關(guān)系挖掘中的應(yīng)用研究[J].現(xiàn)代圖書情報(bào)技術(shù),2014(10):84-92.

        (收稿日期: 2019.10.21)

        猜你喜歡
        特征詞工單準(zhǔn)確率
        基于量化考核的基層班組管理系統(tǒng)的設(shè)計(jì)與應(yīng)用
        電子測試(2022年7期)2022-04-22 00:13:16
        基于transformer的工單智能判責(zé)方法研究
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
        2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
        高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
        基于改進(jìn)TFIDF算法的郵件分類技術(shù)
        產(chǎn)品評(píng)論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
        基于HANA的工單備件采購聯(lián)合報(bào)表的研究與實(shí)現(xiàn)
        中國核電(2017年1期)2017-05-17 06:09:55
        電力95598熱線全業(yè)務(wù)集中后的工單預(yù)警機(jī)制
        亚洲成av人片女在线观看| 亚洲av成人精品日韩一区| 国产福利酱国产一区二区| 97中文字幕一区二区| 久久精品国产精品亚洲艾| 精品无码国产一区二区三区麻豆| 免费少妇a级毛片人成网| 精品性高朝久久久久久久| 久久综合给合久久狠狠狠9| 在线观看二区视频网站二区| 亚洲中字幕日产av片在线| 免费人成视频x8x8入口| 国产一品道av在线一二三区| 日本一区二区三区激情视频| 男子把美女裙子脱了摸她内裤| 男女啪啪在线视频网站| 日本a片大尺度高潮无码| 黄色视频在线免费观看 | 东京热人妻一区二区三区| 澳门毛片精品一区二区三区| 日韩av最新在线地址| 狠狠综合久久av一区二区蜜桃| 国产伦久视频免费观看视频| 精品无码久久久久久久动漫| 亚洲精品国产精品av| 少妇人妻字幕精品毛片专区| 国产私人尤物无码不卡| 少妇人妻真实偷人精品视频| 国产成人综合久久精品推荐免费| 一本久道久久丁香狠狠躁| 成人免费直播| 最新国产乱视频伦在线| 国产精品农村妇女一区二区三区 | 中文字幕亚洲综合久久菠萝蜜| 窝窝影院午夜看片| 日韩av在线不卡观看| 国偷自拍av一区二区三区| 无码av免费一区二区三区试看| 久久久久久久国产精品电影| 精品国精品自拍自在线| 一边摸一边做爽的视频17国产|