亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于語音識別的騷擾電話撥測系統(tǒng)

        2013-05-15 12:47:02中國移動通信集團江蘇有限公司網(wǎng)絡(luò)部王玉申
        江蘇通信 2013年6期
        關(guān)鍵詞:測系統(tǒng)騷擾電話號碼

        中國移動通信集團江蘇有限公司網(wǎng)絡(luò)部 王玉申

        現(xiàn)有騷擾電話治理中,存在的主要問題是:識別的號碼數(shù)量多與客服撥測人員工作量大之間的矛盾。相比于目前通常采用的人工撥測方式,計算機自動處理有著速度快、效率高、誤差率低等特點,尤其是針對重復(fù)內(nèi)容的自動撥測和處理技術(shù)更是具有不可替代的作用。近年來,語音識別技術(shù)已經(jīng)得到了長足的發(fā)展,通過引入語音識別技術(shù)對錄音文件進行甄別,可以極大提高騷擾電話的撥測效率。

        1 騷擾電話自動撥測系統(tǒng)構(gòu)建

        通過新增1套騷擾電話撥測識別系統(tǒng),實現(xiàn)騷擾電話的自動撥測、識別、錄音和取證功能。該系統(tǒng)與現(xiàn)有騷擾電話治理各系統(tǒng)間的關(guān)系如圖1所示。

        該系統(tǒng)通過文件接口從騷擾電話識別系統(tǒng)采集需要撥測的號碼清單,對號碼進行撥測、錄音、語音識別,撥測結(jié)果輸出到攔截系統(tǒng)和客服系統(tǒng)進行后續(xù)處理。通過騷擾電話自動撥測識別系統(tǒng)代替客服的人工撥測和審核,提升騷擾電話人工審核的效率和準確度,提高騷擾電話治理效果。

        1.1 騷擾電話撥測系統(tǒng)處理流程

        騷擾電話撥測系統(tǒng)的處理流程見圖2。

        騷擾電話自動撥測識別系統(tǒng)的業(yè)務(wù)流程主要分為4步,分別是:待撥測號碼的采集分析、對號碼進行撥打呼叫、對騷擾電話的識別和判斷、結(jié)果輸出。

        1.2 撥測系統(tǒng)構(gòu)建

        撥測錄音模塊設(shè)計了2個方案供選擇:測試卡方案或模擬主叫號碼方案。測試卡方案:利用自動撥測系統(tǒng)的撥測儀進行撥打。模擬主叫號碼方案:利用自動撥測系統(tǒng),采用PBX(專用小交換機)撥測設(shè)備進行撥打。

        1.2.1 方案一 測試卡方案

        為滿足多張本省和外省測試卡在撥測儀上進行測試,設(shè)計采用自動撥測系統(tǒng)上已配備的SUM(服務(wù)器集中監(jiān)控管理)設(shè)備集中插放SIM(用戶識別模塊)卡,通過遠程調(diào)用的方式實現(xiàn)SIM卡自動切換撥測,以達到測試的目的。系統(tǒng)構(gòu)架圖見圖3。

        1.2.2 方案二 模擬主叫號碼方案

        在現(xiàn)有自動撥測系統(tǒng)基礎(chǔ)上,使用PBX中繼撥測儀實現(xiàn)自動撥測與錄音功能,以達到測試的目的。保持現(xiàn)網(wǎng)自動撥測系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)不變,新增的專業(yè)撥測儀采用IP方式接入,接受自動撥測系統(tǒng)管理。組成拓撲見圖4。

        本方案中新增1臺(PBX)中繼撥測儀,通過TCP/IP(傳輸控制協(xié)議/網(wǎng)際協(xié)議)方式接入自動撥測系統(tǒng),接受CMS(內(nèi)容管理系統(tǒng))的管理和維護。中繼撥測設(shè)備通過E1中繼專線方式連接匯接局或MSC(移動交換中心)、且與STP(信令轉(zhuǎn)接點)間開鏈路。使中繼撥測儀成為移動MSC下的一個專用PBX用戶端局。通過匯接局或MSC可以實現(xiàn)與MSC、GMSC(網(wǎng)關(guān)移動交換中心)以及其他運營商網(wǎng)絡(luò)的用戶通信。為專用的E1(2.048 Mb/s數(shù)字同步傳輸)中繼電路配置專用OPC(源信令點編碼),并設(shè)置為免費,解決計費問題。

        2 自動識別算法

        為了提高騷擾電話撥測系統(tǒng)的識別準確率,降低騷擾電話誤識別率,我們采用了多種組合算法進行騷擾電話的識別。具體的算法說明如下。

        1)先進行較小文件過濾。通過對騷擾電話的錄音分析,發(fā)現(xiàn)騷擾電話都有較長的通話時長(約30~100 s),錄音文件也都比較大(起碼大于800KB)。因此先將一部分較小的文件過濾掉(都是關(guān)機、停機、暫時無法接通等),這些小文件的幾乎都可以確定都是非騷擾電話。獲得較小文件大小的經(jīng)驗值為450KB,小于450KB的認為是非騷擾電話。

        2)騷擾電話號碼識別庫過濾。騷擾電話號碼識別庫可以通過歷史的自動撥測系統(tǒng)平臺全國共享,避免同一個號碼重復(fù)識別,節(jié)約系統(tǒng)資源,提高騷擾電話的判斷效率和準確性。

        3)PESQ(語音質(zhì)量的感覺評定)過濾(過濾掉長時間的振鈴、無人接聽和來電提醒等)。參考文件為常見的非騷擾電話,score(ITU-TP.862)speech分數(shù)大于2,認為評估文件是非騷擾電話。

        PESQ語音評估軟件其本質(zhì)就是一個相似度比對系統(tǒng),原理是把無法自動判斷的錄音文件,比如怪異的接聽?wèi)?yīng)答音,先通過人為判定是否是騷擾電話,然后設(shè)取比對值,作為一個文件藍本庫保存。當(dāng)下次撥測產(chǎn)生與之相似度高的錄音文件時,自動判斷成藍本庫所屬內(nèi)容,確定是不是騷擾電話。因此,隨著不斷的開展撥測工作,樣本庫文件會不斷的豐富,最終的識別率也會不斷提高。

        4)語音識別。使用一系列常見的騷擾電話關(guān)鍵字進行識別,同時對正常帶彩鈴的號碼進行識別。語音識別系統(tǒng)其本質(zhì)是一套通過對錄音文件中的關(guān)鍵字匹配來確認是否是騷擾電話的系統(tǒng)。關(guān)鍵字如“公證處”“抽獎”“中獎”“獎金”等,其內(nèi)容庫可以通過語音訓(xùn)練不斷豐富,以提高最終的識別率。

        語音識別軟件采用定制的InterReco語音識別系統(tǒng),是一款與說話人無關(guān)的語音識別系統(tǒng),能夠完成電話應(yīng)用環(huán)境下的語音識別功能。定制的語音識別系統(tǒng)采用了ASR(自動語音識別)技術(shù)。它是一種使計算機能夠識別人通過麥克風(fēng)或者電話輸入的詞語或語句的技術(shù)。簡單地說,就是能夠讓計算機聽懂人說話。它的最終目標是使得計算機在不受詞匯量限制,在各種噪聲環(huán)境、語音信道下,能夠?qū)崟r、準確地識別不同方言、口音等特點的說話人的語句。包含了騷擾電話特征詞,如:中獎、公證處、賭博、六合彩等。

        由語音識別模塊對經(jīng)過“騷擾電話號碼庫”過濾的錄音文件進行自動識別,判斷出具有騷擾電話特征的錄音文件,并判斷為騷擾電話,隨錄音文件一起送至輸出接口模塊。語音識別中不符合騷擾電話特征的錄音文件繼續(xù)轉(zhuǎn)交下一步處理。

        5)PESQ語音再評估(語音識別的識別率只有70%~80%,還有20%~30%的疑似騷擾電話沒有被識別出來)。我們對這些沒有被識別出來的20%~30%的疑似騷擾電話進行PESQ語音評估,目的是提高被降低的語音識別漏判率。

        3 應(yīng)用情況

        3.1 試點情況

        騷擾電話撥測系統(tǒng)于2013年3月底完成平臺的搭建,實現(xiàn)了對騷擾電話的撥測測試。撥測系統(tǒng)初期對江蘇移動提供過的三批共計2 758個騷擾電話樣本做了識別判斷,具體測試情況見表1。

        ?

        采用基于語音識別的騷擾電話撥測系統(tǒng)對1 000個號碼進行撥測和識別,需要的時間約為20min,存儲空間約為12GB,大大提升了騷擾電話的人工審核效率。同時,對于無法確認的號碼輸出撥測錄音,供客服人員人工判斷,有效解決了部分號碼無法通過系統(tǒng)進行識別的問題。

        我們把完成1~5項步驟的判斷機制定義為“模式一”,把僅完成1~3項步驟的判斷機制定義為“模式二”。模式一是對模式二識別出來的疑似騷擾電話號碼再進行一次語音識別和PESQ再評估,目的是降低誤判率,而語音識別和PESQ再評估沒有100%地將騷擾電話識別出來,因此,漏判率增加了。

        模式二的思路是排除非騷擾電話,剩下的認為是騷擾電話;模式一的思路是排除非騷擾電話,剩下的進行語音識別和PESQ再評估,識別出來的是騷擾電話,沒有識別出來的是非騷擾電話。因此,模式一比模式二誤判率低,漏判率高。

        在實際使用中,可能還會存在正常帶彩鈴的錄音文件,這個必須要借助語音識別系統(tǒng)來判斷,所以說必須要用模式一的判斷機制來進行撥測。當(dāng)然模式二的測試結(jié)果給了我們一些參考,比如在測試當(dāng)中發(fā)現(xiàn)和論證了這樣一個問題:模式一比模式二誤判率低,漏判率高。如果不使用語音識別軟件(即模式二),漏判率反倒有明顯的降低。結(jié)合上述三批測試,模式二測試情況見表2。

        ?

        經(jīng)過反復(fù)比對和論證,查明的原因是:第三方的語音識別軟件本身也存在一定的不足,語音識別率只有70%~80%,即使我們已經(jīng)通過PESQ語音評估進行補漏,也不能達到100%的識別率,會漏掉很多的騷擾電話,只能不斷來優(yōu)化完善它,后續(xù)需不斷進行改進。

        3.2 試點結(jié)論

        從理論上分析,使用語音識別后可以減少誤判的發(fā)生,隨著語音識別軟件的日益完善,這方面的效果會越來越得到體現(xiàn)。本著盡可能減低騷擾電話誤判率(為此可以犧牲部分的漏判)的原則,體現(xiàn)真實的判斷效果,且正確判斷正常帶彩鈴的號碼,建議繼續(xù)使用語音識別系統(tǒng),即模式一這樣的全程判斷機制來做騷擾電話撥測。

        4 其他應(yīng)用領(lǐng)域

        基于語音識別的騷擾電話撥測系統(tǒng),除了能夠準確識別騷擾電話外,還可以廣泛應(yīng)用于基于語音識別的語音撥測系統(tǒng),如:來電提醒系統(tǒng)的撥測、10086客服系統(tǒng)的撥測等,從而極大地提升系統(tǒng)撥測的效率,提高系統(tǒng)的運行穩(wěn)定性。 ◆

        猜你喜歡
        測系統(tǒng)騷擾電話號碼
        說號碼 知顏色
        一個號碼,一個故事
        猜出新號碼
        陜西綜合治理騷擾電話
        13部門聯(lián)手重拳整治騷擾電話
        婦女生活(2018年12期)2018-12-14 06:43:30
        瘋狂編輯部之騷擾電話
        遇到騷擾電話怎么辦?
        防洪非工程措施設(shè)計實例——嘉興市水文巡測系統(tǒng)項目設(shè)計
        電快速瞬變脈沖群對核測系統(tǒng)的影響及對策
        基于廣域量測系統(tǒng)的電力系統(tǒng)綜合負荷辨識模型的研究
        電測與儀表(2015年8期)2015-04-09 11:50:12
        日本一区二区三区高清视 | 精品国产一区二区三区三级| 人妻制服丝袜中文字幕| 一本久道竹内纱里奈中文字幕| 在线观看国产成人av天堂野外| 亚洲av综合国产av日韩| 久久不见久久见免费视频6 | 国产一区二区av在线观看| 又黄又爽的成人免费视频| 99久久免费看少妇高潮a片特黄| 国内揄拍国内精品| 中文亚洲爆乳av无码专区| 人妻中出精品久久久一区二| 亚洲VR永久无码一区| 好爽~又到高潮了毛片视频| 国产美女三级视频网站| 精品国产亚洲av成人一区| 亚洲一区二区一区二区免费视频| 国产自拍三级黄片视频| 国产美腿丝袜一区二区| 国产亚洲午夜精品久久久| 久久综网色亚洲美女亚洲av| 777国产偷窥盗摄精品品在线| 久久99精品九九九久久婷婷| 亚洲av无码潮喷在线观看| 亚洲国产精品特色大片观看完整版 | 免费网站内射红桃视频| 一二区成人影院电影网| 蜜桃av抽搐高潮一区二区| 日韩激情无码免费毛片 | 精品亚洲一区二区三区四| 亚洲第一狼人天堂网亚洲av | 亚洲国产成人片在线观看无码| 好男人日本社区www| 狠狠躁夜夜躁无码中文字幕| 国产自产av一区二区三区性色| 国产精品美女自在线观看| 国产毛女同一区二区三区| 在线精品亚洲一区二区动态图| 久久只精品99品免费久23| 日本50岁丰满熟妇xxxx|