亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于卷積神經(jīng)網(wǎng)絡(luò)的群眾留言分類

        2020-09-03 02:25:54代耀彬朱燕燕黃雙華
        無線互聯(lián)科技 2020年12期
        關(guān)鍵詞:分類群眾文本

        代耀彬,朱燕燕,黃雙華

        (河海大學(xué),江蘇 南京 210098)

        網(wǎng)絡(luò)問政平臺是互聯(lián)網(wǎng)時代下政府為群眾提供服務(wù)的主要平臺,也是政府與群眾信息交流的主要方式。目前,大部分電子政務(wù)系統(tǒng)仍是依靠人工進(jìn)行數(shù)據(jù)整理,不斷攀升的文本數(shù)據(jù)量對相關(guān)部門的工作帶來了極大的挑戰(zhàn),如何快速對群眾的留言進(jìn)行分類成為當(dāng)前的熱點(diǎn)問題。深度學(xué)習(xí)在圖像分類上有著較好的分類效果,不少學(xué)者開始研究深度學(xué)習(xí)算法在短文本分類上的應(yīng)用[1]。本文擬通過使用卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)對于群眾留言信息的快速分類。

        1 模型架構(gòu)與診斷結(jié)果

        本文所設(shè)計的基于卷積神經(jīng)網(wǎng)絡(luò)群眾留言分類模型主要包括3個方面:數(shù)據(jù)的預(yù)處理、建立模型、結(jié)果診斷,整個模型架構(gòu)流程如圖1所示。

        圖1 模型架構(gòu)流程

        1.1 數(shù)據(jù)預(yù)處理

        本文實(shí)驗所用到的數(shù)據(jù)集來自相關(guān)政務(wù)網(wǎng)站上的群眾留言,數(shù)據(jù)集主要包括群眾的留言信息和工作人員對留言進(jìn)行的分類。留言主要分為勞動與社會保障、環(huán)境保護(hù)、商貿(mào)旅游、城鄉(xiāng)建設(shè)、衛(wèi)生計生、教育文體、交通運(yùn)輸7大類。

        首先,采用簡易數(shù)據(jù)增強(qiáng)(Easy Data Augmentation,EDA)技術(shù)[2]對文本進(jìn)行數(shù)據(jù)增強(qiáng),減少類別分布不均衡的影響。得到了82 872條留言數(shù)據(jù)。其次,對增強(qiáng)后的數(shù)據(jù)集進(jìn)行分詞與停用詞處理。最后,通過TF-IDF算法提取留言文本的關(guān)鍵詞,形成關(guān)鍵詞庫。TF和IDF的計算公式如(1—2):

        其中,f(t,d)表示詞條t在文檔中出現(xiàn)d出現(xiàn)的次數(shù),dft表示語料庫中包含詞條t的文檔數(shù)量,N表示語料庫中全部的文檔數(shù)量。

        通過token詞典將關(guān)鍵詞列表轉(zhuǎn)換為數(shù)字列表。對文本中單詞出現(xiàn)的次數(shù)做統(tǒng)計并排序,從而將每一條留言的文本分詞列表替換成數(shù)字列表,截長補(bǔ)短,使得所有記錄的關(guān)鍵詞序列的長度為50。針對82 872條留言記錄,最終得到一個82 872×50的數(shù)組,為模型做數(shù)據(jù)準(zhǔn)備。最后,利用分層抽樣的方法,抽取70%數(shù)據(jù)作為訓(xùn)練集,30%作為測試集。

        1.2 模型建立

        卷積神經(jīng)網(wǎng)絡(luò)是一種帶有卷積結(jié)構(gòu)的深度神經(jīng)網(wǎng)絡(luò),卷積結(jié)構(gòu)大大減少了深層網(wǎng)絡(luò)占用的內(nèi)存量,全值共享有效減少了網(wǎng)絡(luò)的參數(shù)個數(shù),緩解了過擬合問題。本文使用基于Tensorflow的keras深度學(xué)習(xí)框架,搭建了兩層卷積神經(jīng)網(wǎng)絡(luò),提高了神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率。卷積層和池化層是卷積神經(jīng)網(wǎng)絡(luò)特征提取的核心模塊,采用自適應(yīng)矩估計算法(Adaptive moment estimation,Adam)對網(wǎng)絡(luò)中的權(quán)重參數(shù)逐層反向調(diào)節(jié)[3],使得損失函數(shù)值最小,通過不斷迭代訓(xùn)練提高神經(jīng)網(wǎng)絡(luò)的精度。模型的流程如圖2所示。

        圖2 模型建立流程

        (1)embedding層。直接初始化embeddings,基于語料通過訓(xùn)練模型網(wǎng)絡(luò)來對embeddings進(jìn)行更新和學(xué)習(xí),從而將輸入的數(shù)字列表轉(zhuǎn)換為詞向量。

        (2)卷積層。經(jīng)過embedding層之后,每一條留言記錄(留言詳情)由高質(zhì)量特征線性表示,將其輸入卷積層,對輸入數(shù)據(jù)進(jìn)行特征提取。實(shí)驗過程中,第一層的卷積核大小為3,第二層卷積核的大小為4。采取relu函數(shù)作為激勵函數(shù)不斷迭代。

        (3)池化層。進(jìn)行降維操作,降低文本的向量維度,也是一層特征選取和信息過濾,由池化大小、步長和填充控制來確定池化區(qū)域,實(shí)驗過程中,針對兩層池化層,取池化大小pol_size=3,步長stride=3,填充控制padding=same。

        (4)全連接層。神經(jīng)網(wǎng)絡(luò)的最后一層,采用全連接層的方式,第二層K_max池化層處理后的文本特征向量經(jīng)過矩陣的concat和reshape之后變成一維數(shù)組,送入Softmax分類器,計算類別概率,預(yù)測輸出分類標(biāo)簽。

        2 評測標(biāo)準(zhǔn)及實(shí)驗結(jié)果分析

        本文采用F-score方法對模型進(jìn)行評價,根據(jù)分類結(jié)果建立混淆矩陣(見表1)。針對該模型,計算出各分類的精確率、召回率、F1值如表2所示。

        表1 分類結(jié)果混淆矩陣

        表2 模型分類效果評價

        可知,模型的綜合預(yù)測效果達(dá)到了95%以上,而一般傳統(tǒng)的機(jī)器學(xué)習(xí)模型的準(zhǔn)確率在85%以下,對于數(shù)據(jù)量大、特征難以提取的文本數(shù)據(jù),用深度學(xué)習(xí)的算法更為合適。用測試集中的數(shù)據(jù)進(jìn)行預(yù)測,隨機(jī)選取5個類別,從實(shí)驗結(jié)果可知,原始數(shù)據(jù)集的標(biāo)簽和預(yù)測標(biāo)簽的結(jié)果一致。

        3 結(jié)語

        通過對群眾留言的研究,本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的群眾留言分類模型,并利用大量的文本數(shù)據(jù)進(jìn)行驗證,經(jīng)驗證取得了很好的分類效果。

        猜你喜歡
        分類群眾文本
        始終和群眾融為一體
        分類算一算
        多讓群眾咧嘴笑
        在808DA上文本顯示的改善
        分類討論求坐標(biāo)
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        數(shù)據(jù)分析中的分類討論
        “群眾來求助”等十六則
        為群眾美好生活執(zhí)著追求
        教你一招:數(shù)的分類
        亚洲欧洲精品国产二码| 国产麻豆精品久久一二三| 国产精品一区二区久久精品| 国产一精品一aⅴ一免费| 精品国产a毛片久久久av| 熟女体下毛荫荫黑森林| 国产丝袜无码一区二区三区视频| 专区亚洲欧洲日产国码AV| 尤物成av人片在线观看| 中文字幕亚洲综合久久天堂av| 亚洲熟女一区二区三区| 久久亚洲道色宗和久久| 中文字幕一区二区三区四区久久| 麻豆精品国产专区在线观看| 国产青草视频在线观看| 久久久久亚洲精品天堂| 女同另类一区二区三区| 人妻丝袜中文无码av影音先锋专区| 中文字幕无码av激情不卡| 欧美日韩激情在线一区二区| 99蜜桃在线观看免费视频| 少妇伦子伦精品无吗| 少妇太爽了在线观看| 亚洲日本精品一区久久精品| 偷拍美女上厕所一区二区三区| 久久天天躁狠狠躁夜夜2020一| 国产乱人视频在线看| 国产一区二区三区经典| 日本道免费一区二区三区日韩精品| 免费人成视频在线| 欧美三级超在线视频| 日韩av一区二区蜜桃| 亚洲欧美乱日韩乱国产| 国产美女白浆| 色婷婷精品国产一区二区三区 | 欧美怡春院一区二区三区| 激情 人妻 制服 丝袜| 国产亚洲精选美女久久久久| 日韩av一区二区不卡| 国产精成人品日日拍夜夜免费| 中文字幕Aⅴ人妻一区二区苍井空|