亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種公共法律服務(wù)智能語音數(shù)據(jù)管理系統(tǒng)的設(shè)計(jì)

        2021-04-20 02:36:56占善華張永平
        電子技術(shù)與軟件工程 2021年1期
        關(guān)鍵詞:法律文本智能

        占善華 張永平

        (廣東司法警官職業(yè)學(xué)院信息管理系 廣東省廣州市 510520)

        1 引言

        公共法律服務(wù)是政府公共服務(wù)體系的重要組成部分,是司法行政機(jī)關(guān)的基本職責(zé)任務(wù)。近年來隨著公共法律服務(wù)平臺(tái)建設(shè),語音數(shù)據(jù)快速增長(zhǎng),但這些數(shù)據(jù)并未進(jìn)行深入的數(shù)據(jù)分析和挖掘,因此,為了更精確地分析人民群眾的法律服務(wù)需求,提高法律服務(wù)的質(zhì)量以及輿情數(shù)據(jù)的分析,擬引入智能語音技術(shù)對(duì)語音數(shù)據(jù)進(jìn)行轉(zhuǎn)寫以及對(duì)轉(zhuǎn)寫后的內(nèi)容進(jìn)行分析、挖掘,提供可融入日常工作的公共法律服務(wù)智能語言數(shù)據(jù)管理系統(tǒng),實(shí)現(xiàn)對(duì)語音數(shù)據(jù)價(jià)值最大化。

        2 相關(guān)工作介紹

        在智能語音領(lǐng)域,對(duì)于如何將利用好司法行政系統(tǒng)內(nèi)的法律服務(wù)平臺(tái)的海量語音數(shù)據(jù),如何做到識(shí)別和轉(zhuǎn)換后的語義分析,國(guó)內(nèi)外研究和實(shí)現(xiàn)很少,語音識(shí)別的聲學(xué)建模主要用于建模語音信號(hào)與音素之間的關(guān)系,業(yè)界相繼提出了前饋型序列記憶網(wǎng)絡(luò)(FSMN,Feed-forwardSequential Memory Network)[1]作為聲學(xué)建??蚣芤约吧疃热蛄芯矸e神經(jīng)網(wǎng)絡(luò)(DFCNN,Deep Fully Convolutional Neural Network)[2][3]。針對(duì)目前最好的語音識(shí)別系統(tǒng)采用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM,Long Short Term Memory)[4-7]訓(xùn)練復(fù)雜度高、解碼延時(shí)高等缺陷,一般來說可以使用深度全序列卷積神經(jīng)網(wǎng)絡(luò)來克服雙向 LSTM 的缺陷,從而提高識(shí)別正確率。

        3 本文系統(tǒng)設(shè)計(jì)

        3.1 構(gòu)建法律服務(wù)語音數(shù)據(jù)統(tǒng)一管理系統(tǒng)

        公共法律服務(wù)平臺(tái)包括電話,網(wǎng)絡(luò)平臺(tái),實(shí)體大廳,數(shù)據(jù)分散,需要建立一個(gè)統(tǒng)一的語音數(shù)據(jù)管理系統(tǒng),對(duì)語音數(shù)據(jù)和文本數(shù)據(jù)以及業(yè)務(wù)關(guān)聯(lián)數(shù)據(jù)進(jìn)行統(tǒng)一存儲(chǔ)、管理、應(yīng)用,并建設(shè)可視化數(shù)據(jù)管理平臺(tái),開放接口。

        3.2 構(gòu)建智能法律服務(wù)語音能力平臺(tái)

        語音聽寫能夠把用戶說的任意語音轉(zhuǎn)換成對(duì)應(yīng)的文字信息,配合語義理解后,語音聽寫就能夠聽懂人說話,和語音合成構(gòu)成“能聽會(huì)說” 的語音交互模式。圖1為系統(tǒng)的整體技術(shù)架構(gòu)圖,其主要包括以下一些功能點(diǎn)。

        3.2.1 端點(diǎn)檢測(cè)

        圖1:公共法律服務(wù)智能語音數(shù)據(jù)管理系統(tǒng)技術(shù)架構(gòu)圖

        端點(diǎn)檢測(cè),業(yè)界也稱之為語音活動(dòng)檢測(cè),即Voice Activity Detection,簡(jiǎn)稱VAD[8-10],VAD 的目的就是為了對(duì)一段數(shù)據(jù)進(jìn)行語音和非語音的分離判別。簡(jiǎn)單來說,就是如果給定有一段語音,該語音具有一定的噪聲污染,那么如何對(duì)該語音數(shù)據(jù)進(jìn)行語音起點(diǎn)、語音結(jié)束點(diǎn)進(jìn)行準(zhǔn)確定位和識(shí)別,并同時(shí)可以去除噪聲的部分,從而完整找到該語音數(shù)據(jù)真正對(duì)我們有效的內(nèi)容。學(xué)術(shù)界對(duì)端點(diǎn)檢測(cè)有準(zhǔn)確的定義,即是對(duì)輸入的音頻流進(jìn)行分析,確定用戶說話的起始和終止的處理過程。

        常見的技術(shù)方法有三種:基于閾值的 VAD、作為分類器的VAD、模型 VAD。在本系統(tǒng)中,可以綜合使用。

        3.2.2 噪音抑制

        背景噪聲對(duì)于語音識(shí)別應(yīng)用是一個(gè)現(xiàn)實(shí)的挑戰(zhàn),對(duì)于研究者來說,如何對(duì)噪聲進(jìn)行抑制可以追溯到上世紀(jì)70年代。其實(shí)從字面意義去理解,大家會(huì)認(rèn)為這非常簡(jiǎn)單,無非就是對(duì)于一段語音數(shù)據(jù)首先進(jìn)行嘈雜信號(hào)的采取,然后盡可能的去除噪聲,并盡最大程度保留原語音的語義。但最大程度保留語義確是一個(gè)大挑戰(zhàn),需要我們?cè)谠O(shè)計(jì)算法的時(shí)候非常仔細(xì)的調(diào)整參數(shù),同時(shí)需要進(jìn)行大量的測(cè)試。利用speexdsp 庫[11,12]可以實(shí)現(xiàn)一定程度的噪音處理工作,但對(duì)整個(gè)噪音抑制器效果并不是非常好。本文擬利用深度學(xué)習(xí)的思想處理,對(duì)語音數(shù)據(jù)設(shè)計(jì)深度學(xué)習(xí)模型,該模型可以使用具有數(shù)千個(gè)神經(jīng)元和數(shù)千萬個(gè)權(quán)重的層來執(zhí)行噪聲抑制。該方法可以提高精準(zhǔn)度,缺點(diǎn)是對(duì)于計(jì)算成本要求較高,畢竟這需要存儲(chǔ)數(shù)千行代碼以及幾十兆字節(jié)的神經(jīng)元權(quán)重,但這對(duì)于一個(gè)服務(wù)于全省的平臺(tái)來說,這點(diǎn)投入是值得的。確保系統(tǒng)應(yīng)具備高效的噪音抑制能力,以提高用戶在千差萬別的環(huán)境中識(shí)別效果才是首要的。

        3.2.3 支持中文常見語句聽寫

        語音識(shí)別對(duì)于日常使用的常用對(duì)話有較高的識(shí)別率。這利用各大公司開放的SDK 或者開源系統(tǒng)進(jìn)行中文常見語句的聽寫,需要有意識(shí)的加入法律服務(wù)領(lǐng)域的專業(yè)語句庫,提高準(zhǔn)確率。

        3.2.4 支持中文標(biāo)點(diǎn)智能預(yù)測(cè)

        使用超大規(guī)模的語言模型,對(duì)識(shí)別結(jié)果語句智能預(yù)測(cè)其對(duì)話語境,提供斷句和標(biāo)點(diǎn)符號(hào)的預(yù)測(cè)。

        3.2.5 熱詞識(shí)別

        語音識(shí)別服務(wù)系統(tǒng)支持應(yīng)用和用戶自定義熱詞集。

        3.2.6 個(gè)性化識(shí)別

        應(yīng)用級(jí)個(gè)性化是面向應(yīng)用的個(gè)性化定制,既包括應(yīng)用開發(fā)者通過構(gòu)熱詞集提升識(shí)別效果, 又包括應(yīng)用開發(fā)者根據(jù)自己應(yīng)用的定位; 用戶級(jí)個(gè)性化是面向終端用戶的個(gè)性化定制,既包括用戶上傳自己的熱詞集來優(yōu)化識(shí)別效果,又包括語音識(shí)別引擎針對(duì)用戶提取聲學(xué)模型;語音合成服務(wù),采用中文文本、韻律分析和大語料庫的方法合成語音。

        3.3 構(gòu)建服務(wù)管理平臺(tái)

        3.3.1 服務(wù)管理

        為 SDK 分配唯一的身份標(biāo)識(shí) APPID,并通過此標(biāo)識(shí),控制為第三方開放的服務(wù)。

        3.3.2 終端管理

        從應(yīng)用終端層面進(jìn)一步細(xì)化管理,為每個(gè)終端分配其可訪問的應(yīng)用。

        3.3.3 應(yīng)用管理

        管理各個(gè)應(yīng)用所需的基礎(chǔ)信息資源,如詞庫、快捷短語、翻譯句對(duì)、語義資源等,同時(shí),提供應(yīng)用的升級(jí)管理。

        3.3.4 運(yùn)營(yíng)管理收集用戶的建議反饋;并多維度對(duì)客戶、應(yīng)用、服務(wù)的使用情況進(jìn)行細(xì)致的統(tǒng)計(jì)分析,指導(dǎo)產(chǎn)品優(yōu)化

        4 可解決的問題

        通過上述法律服務(wù)數(shù)據(jù)管理系統(tǒng)的設(shè)計(jì),并基于該設(shè)計(jì)對(duì)語音數(shù)據(jù)進(jìn)行深入的數(shù)據(jù)挖掘和分析,可以解決以下問題:

        (1)各大法律服務(wù)平臺(tái)收集的音頻轉(zhuǎn)寫成文本,通過對(duì)文本進(jìn)行數(shù)據(jù)分析和挖掘,發(fā)現(xiàn)法律服務(wù)的熱點(diǎn)問題;

        (2)問法律服務(wù)的人員配比及制定服務(wù)策略提供數(shù)據(jù)支撐;

        (3)為輿情的發(fā)現(xiàn)和管控等提供數(shù)據(jù)支撐;

        (4)通過分析文本內(nèi)容,對(duì)法律服務(wù)的質(zhì)量進(jìn)行檢查,分析法律服務(wù)咨詢的內(nèi)容和目的,挖掘出隱藏的案件。

        5 結(jié)論

        本文設(shè)計(jì)了一種公共法律服務(wù)智能語音數(shù)據(jù)管理系統(tǒng),該系統(tǒng)開源實(shí)現(xiàn)音頻語音識(shí)別轉(zhuǎn)寫,將各大法律服務(wù)平臺(tái)收集的音頻數(shù)據(jù)利用智能語音技術(shù)轉(zhuǎn)寫成文本,同時(shí)開發(fā)數(shù)據(jù)分析功能,對(duì)轉(zhuǎn)寫后的文本進(jìn)行挖掘,包括服務(wù)質(zhì)量和隱藏案件的挖掘,最后通過對(duì)轉(zhuǎn)寫后的文本內(nèi)容進(jìn)行整體挖掘和統(tǒng)計(jì)分析,從法律服務(wù)分析輿情數(shù)據(jù)。最終實(shí)現(xiàn)對(duì)法律服務(wù)的熱點(diǎn)問題追蹤,為制定服務(wù)策略提供數(shù)據(jù)支撐,同時(shí)也可以為輿情的發(fā)現(xiàn)和管控提供數(shù)據(jù)支撐,實(shí)現(xiàn)對(duì)語音數(shù)據(jù)的價(jià)值最大化。

        猜你喜歡
        法律文本智能
        法律解釋與自然法
        法律方法(2021年3期)2021-03-16 05:57:02
        在808DA上文本顯示的改善
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        智能前沿
        文苑(2018年21期)2018-11-09 01:22:32
        讓人死亡的法律
        山東青年(2016年1期)2016-02-28 14:25:30
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        “互助獻(xiàn)血”質(zhì)疑聲背后的法律困惑
        亚洲熟少妇在线播放999| 男人天堂插插综合搜索| 国产色视频一区二区三区不卡| 色综合av综合无码综合网站 | 人妻少妇艳情视频中文字幕| 强开少妇嫩苞又嫩又紧九色| 午夜精品久久久久久中宇| 999久久66久6只有精品| 中文字幕一区二区三区亚洲| 熟女一区二区三区在线观看| 曰韩无码二三区中文字幕| 99re这里只有热视频| 久久久精品亚洲懂色av| 亚洲av乱码二区三区涩涩屋| 欧洲vat一区二区三区| 久久精品国产夜色| 久久高潮少妇视频免费| 亚洲一区二区三区精品| 亚洲av永久无码精品网址| 欧美日韩亚洲成人| 亚洲av永久综合网站美女| 精品一区二区av天堂色偷偷| 国产精品制服| 亚洲AV无码久久精品成人| 性色国产成人久久久精品二区三区| 日韩精品人妻中文字幕有码| 国产suv精品一区二人妻| 91精品国产91热久久p| 新视觉亚洲三区二区一区理伦 | 亚洲av日韩av无码污污网站| 天天躁日日躁狠狠躁一区| 亚洲国产丝袜美女在线| 久久久久久人妻无码| 国产三级在线观看播放视频| 美女裸体无遮挡免费视频国产| 女优av一区二区在线观看| 色哟哟精品视频在线观看| 北条麻妃在线视频观看| 一区二区三区日本久久| 久久亚洲精品情侣| 综合久久给合久久狠狠狠97色|