亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語音識別技術(shù)在軌道交通 AFC系統(tǒng)中的應(yīng)用研究

        2022-04-16 08:49:46徐秋平樊璽炫王義華
        現(xiàn)代城市軌道交通 2022年4期
        關(guān)鍵詞:售票機購票車站

        徐秋平,任 玲,樊璽炫,王義華

        (青島地鐵集團(tuán)有限公司,山東青島 266000)

        1 引言

        語音識別技術(shù),又稱為語音人機交互技術(shù),是以語音作為主要信息載體,使機器具備能說會聽、學(xué)習(xí)思考的能力,實現(xiàn)人類與機器之間類似人類互相之間的自然語音交互過程。隨著城市軌道交通線網(wǎng)規(guī)模的不斷增大,乘客購選票時間會延長,尤其對于不熟悉自己出行路徑和設(shè)備操作的乘客,購選票花費時間則更長。另外,由于存在車站乘客的問詢量大,問詢內(nèi)容涉及站內(nèi)外信息、票務(wù)政策等業(yè)務(wù)知識廣等問題,站務(wù)人員需承擔(dān)高負(fù)荷、高強度的問詢答疑工作。因此,將語音識別技術(shù)應(yīng)用于城市軌道交通,對實現(xiàn)車站服務(wù)的自助化、智能化、人性化,具有重要意義。目前,國內(nèi)部分城市軌道交通已將語音識別技術(shù)應(yīng)用于自動售檢票(AFC)系統(tǒng)中,如上海、合肥、南京和深圳等城市軌道交通對原有自動售票機進(jìn)行改造實現(xiàn)語音購票功能;深圳、青島、寧波和西安等城市軌道交通上線集票務(wù)服務(wù)、語音問詢、車站信息資訊于一體的智能客服中心。由于語音識別技術(shù)可實現(xiàn)無接觸式交互,特別在受新冠肺炎疫情影響的情況下,更加體現(xiàn)出其優(yōu)勢價值。隨著語音識別技術(shù)在城市軌道交通AFC系統(tǒng)中的應(yīng)用推廣,傳統(tǒng)AFC系統(tǒng)設(shè)備業(yè)務(wù)流程和系統(tǒng)架構(gòu)將隨之改變。

        2 AFC 系統(tǒng)中的應(yīng)用

        語音識別技術(shù)在城市軌道交通AFC系統(tǒng)中的應(yīng)用包括語音購票和語音問詢2類業(yè)務(wù)。

        2.1 語音購票

        語音購票功能是在傳統(tǒng)自動售票機上增加語音處理模塊,支持乘客通過語音對話來完成車票的購買,從而替代傳統(tǒng)觸摸式購票操作,避免因不熟悉自動售票機而導(dǎo)致的車票購買困難,有效縮短原本需點選屏幕選站、售票的時間。語音購票實現(xiàn)的重點和難點在于嘈雜環(huán)境下的自動語音識別,當(dāng)乘客走近自動售票機,攝像頭自動喚醒語音處理模塊,準(zhǔn)確接收和識別乘客語音輸入的目的地信息,進(jìn)而完成人機互動。對于部分乘客只知目的地而不知具體車站名的問題,可在語音識別技術(shù)的基礎(chǔ)上應(yīng)用模糊地點搜索,將單一的購票行為升級為問路、路徑選擇、購票相結(jié)合的復(fù)合行為。語音購票業(yè)務(wù)流程如圖1所示。

        圖1 語音購票業(yè)務(wù)流程圖

        語音購票的功能需求包括:在強噪聲環(huán)境下準(zhǔn)確識別并顯示乘客語音;能完全屏蔽左右兩旁自動售票機使用者對中間售票機的影響;能完全屏蔽當(dāng)前乘客背后排隊者的語音干擾;理解乘客意圖,判斷出乘客的目的地名稱,支持車站外各種地點的查詢,例如小區(qū)、大樓等;結(jié)合云端地圖數(shù)據(jù)搜索出距離乘客目的地最近的車站;提供從當(dāng)前站點到目的地的詳細(xì)換乘路徑信息;具備人臉識別能力,能判斷使用者數(shù)量,無需乘客喚醒或者手動激活語音;乘客可進(jìn)行語音購票與觸摸購票2種方式的自由切換。

        2.2 語音問詢

        乘客通過語音識別終端設(shè)備可自助語音查詢站內(nèi)服務(wù)設(shè)施、出入口、導(dǎo)航、運行時間、票務(wù)政策等信息;也可選擇人工服務(wù),與遠(yuǎn)程坐席客服進(jìn)行語音交互,實現(xiàn)在線問詢,解決知識盲點及投訴問題,以及突發(fā)狀況時的緊急求助。語音問詢業(yè)務(wù)流程如圖2所示。

        圖2 語音問詢業(yè)務(wù)流程圖

        語音問詢功能需求包括:乘客可轉(zhuǎn)人工服務(wù),與后臺客服人員進(jìn)行實時語音問詢;具有完善的知識庫系統(tǒng),涵蓋地鐵出行所涉及的各種業(yè)務(wù)知識;具備后臺運維管理功能,可對乘客的問詢內(nèi)容進(jìn)行統(tǒng)計、分析,并針對知識盲點補充知識庫系統(tǒng)。

        3 關(guān)鍵技術(shù)研究

        語音識別技術(shù)的關(guān)鍵在于在強噪聲環(huán)境下通過攝像頭和麥克風(fēng)陣列檢測目標(biāo)乘客,并能準(zhǔn)確接收和識別乘客語音信息,精準(zhǔn)理解乘客意圖,對獲取的目的地信息做模糊地點搜索,推薦距離目的地最近的地鐵站并提供相關(guān)的換乘信息;或者對乘客咨詢的問題進(jìn)行知識圖譜庫檢索,以文字、圖片、聲音、動畫等形式輸出答案。實現(xiàn)上述功能涉及的關(guān)鍵技術(shù)包括:人臉唇動檢測、定向語音增強、模糊地點搜索及知識庫系統(tǒng)。

        3.1 人臉唇動檢測

        城市軌道交通車站環(huán)境嘈雜,人臉唇動檢測技術(shù)可有效監(jiān)測、捕獲需進(jìn)行語音交互的乘客,實現(xiàn)免喚醒語音輸入。設(shè)備前端安裝高清攝像頭,支持不同身高乘客的場景需求。根據(jù)攝像頭檢測到的人臉尺寸,系統(tǒng)自動判斷乘客與設(shè)備間的距離,當(dāng)距離值在系統(tǒng)定義的允許測距范圍內(nèi)則可喚醒語音服務(wù)進(jìn)行語音采集。

        為避免受周圍人聲、環(huán)境背景聲、乘客長時間滯留等因素的影響,需要唇動檢測來提高語音識別質(zhì)量。攝像頭通過持續(xù)采集圖像獲取乘客唇部狀態(tài)變化,再經(jīng)唇動檢測算法,得出乘客開始說話和結(jié)束說話的時間階段,在乘客嘴唇活動的時間段內(nèi),進(jìn)行語音采集;反之,乘客嘴唇未動的情況下不進(jìn)行采集。

        3 .2 定向語音增強

        大客流車站人群密集,語音購票和乘客問詢會受到全方位語音干擾,多人操作聲音、車站廣播、各種聲音產(chǎn)生的混響均會導(dǎo)致設(shè)備收到的語音信息嘈雜,導(dǎo)致語音識別的效果難以保證。語音增強是指當(dāng)語音信號被各種各樣的噪聲干擾甚至淹沒后,從含噪聲的語音信號中提取純凈語音的過程。

        定向語音增強的麥克風(fēng)陣列可實現(xiàn)對設(shè)備前方某個固定扇形區(qū)域的人聲增強,而對其他方向的人聲和噪聲進(jìn)行抑制。

        3.3 模糊地點搜索

        傳統(tǒng)模式只能通過選擇具體車站名稱來進(jìn)行購票。語音識別技術(shù)搭載地圖軟件可實現(xiàn)模糊地點搜索,可覆蓋到景點、地標(biāo)、樓宇、小區(qū)和道路等各種非車站名稱。語音識別乘客所述的地點信息后,若為車站名稱,則直接進(jìn)入購票界面,并提供換乘路徑、距離等信息;若非車站名稱,則訪問地圖軟件查詢附近的地點站名,返回對應(yīng)的車站名稱引導(dǎo)乘客購票。當(dāng)檢索到多個候選目的車站時,提供多個目的車站名稱供乘客選擇。

        3.4 知識庫系統(tǒng)

        知識庫系統(tǒng)是向乘客提供語音咨詢各項服務(wù)的核心,可通過對文字、圖片、視頻等信息進(jìn)行錄入、管理和加工,為乘客提供智能化顯示。乘客可通過智能客服中心、智能咨詢機等語音咨詢終端,對運營線路、首末班車、票價、票務(wù)政策、站內(nèi)設(shè)施、站外路線、車站出入口等城市軌道交通常見信息進(jìn)行語音自助查詢。

        4 系統(tǒng)總體架構(gòu)

        4.1 設(shè)備硬件架構(gòu)

        語音識別硬件包括攝像頭、錄音分壓板、線性麥克風(fēng)陣列、語音識別模組,其中,語音識別模組可集成人臉檢測、唇動檢測、麥克風(fēng)陣列降噪、語音交互算法。語音終端設(shè)備架構(gòu)圖如圖3所示。

        圖3 語音終端硬件架構(gòu)圖

        攝像頭感知到乘客后,發(fā)送信號給語音識別模組,控制錄音分壓板和線性麥克風(fēng)陣列工作,麥克風(fēng)陣列降噪算法對兩側(cè)噪聲進(jìn)行抑制、回聲消除等降噪處理,確保錄音音頻的質(zhì)量。語音識別模組將錄音通過語音交互算法發(fā)送到語音云平臺進(jìn)行處理,獲取語義理解結(jié)果;語音識別模組在獲取語義理解結(jié)果后通過串口傳給工控機;工控機在接收到語義結(jié)果后,根據(jù)業(yè)務(wù)類型、意圖、關(guān)鍵詞判斷是否執(zhí)行操作,即可快速實現(xiàn)語音交互功能。

        4.2 AFC 系統(tǒng)架構(gòu)

        嵌入語音識別功能后的AFC系統(tǒng)架構(gòu)如圖4所示。

        圖4 嵌入語音識別的AFC系統(tǒng)架構(gòu)圖

        自動售票機、票務(wù)處理終端、智能客服中心等設(shè)備通過有線網(wǎng)絡(luò),智能咨詢機、智能機器人和智能手持終端通過無線網(wǎng)絡(luò)接入AFC系統(tǒng)專網(wǎng),并通過互聯(lián)網(wǎng)票務(wù)平臺的安全接口連接外網(wǎng)接入語音云平臺實現(xiàn)終端設(shè)備的語音交互功能。購票、票卡處理交易依次上傳至車站計算機系統(tǒng)、線路中央計算機系統(tǒng)、清分系統(tǒng),由清分系統(tǒng)與城市一卡通、金融IC卡等外部系統(tǒng)進(jìn)行清分結(jié)算,由互聯(lián)網(wǎng)票務(wù)平臺統(tǒng)一接入微信、支付寶、銀聯(lián)等第三方支付系統(tǒng)完成互聯(lián)網(wǎng)支付功能。

        4.3 語音平臺架構(gòu)

        針對城市軌道交通語音業(yè)務(wù),全線網(wǎng)建設(shè)統(tǒng)一的語音處理平臺,具體系統(tǒng)架構(gòu)如圖5所示,整個系統(tǒng)劃分為4層,從下到上分別為硬件層、算法層、接入層、應(yīng)用層。

        圖5 語音云平臺系統(tǒng)架構(gòu)圖

        4.3.1 硬件層

        硬件層在機房搭載部署語音交互引擎、人工智能(AI)語義結(jié)構(gòu)化可視化開發(fā)平臺所需的圖形處理服務(wù)器(GPU)、中央處理服務(wù)器(CPU),并部署引擎及平臺運行所需的服務(wù)組件,包括但不限于調(diào)度服務(wù)、消息中間件、數(shù)據(jù)庫。

        4.3.2 算法層

        算法層部署語音交互所需的語音識別、語義理解、語音合成引擎,并部署AI語義結(jié)構(gòu)化可視化開發(fā)平臺,使終端設(shè)備具備“聽”“懂”“說”這3項能力。同時支持購票、線網(wǎng)圖查詢、站內(nèi)導(dǎo)航等語義技能的可視化開發(fā),滿足持續(xù)優(yōu)化語義理解效果的需求,從而不斷提升自動售票機、智能客服中心等語音交互的智能度。

        語音識別好比“機器的聽覺系統(tǒng)”,它讓機器通過識別和理解,把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令。語音識別的效果直接影響系統(tǒng)設(shè)備能否獲取乘客真實的需求,應(yīng)特別關(guān)注語音識別的準(zhǔn)確率,以及支持所在服務(wù)地區(qū)方言語種的需求。語音識別應(yīng)支持線網(wǎng)所有語音終端設(shè)備接入的需求,語音識別準(zhǔn)確率至少達(dá)98%,語音輸入速度至少180 字/min,并實時返回識別結(jié)果,達(dá)到邊錄入邊識別的效果。

        語義理解最大的挑戰(zhàn)是如何理解乘客同一個意圖的不同問法。系統(tǒng)應(yīng)支持詞槽抽取,以及乘客模糊表達(dá)、斷句、多音字的容錯理解,采用多輪會話、上下文語義理解。為提高語義理解效果,需要不斷積累城市軌道交通行業(yè)語料。

        語音合成解決的主要問題是將文字轉(zhuǎn)換為聲音,語音的自然度取決于發(fā)音聲調(diào)的變化,而在連續(xù)語音流中,字的發(fā)音不僅與這個字本身發(fā)音有關(guān),還受到前后相鄰字的發(fā)音以及語氣表達(dá)的影響。基于城市軌道交通應(yīng)用場景,調(diào)整合成的語速、音色、音量以及各種發(fā)音細(xì)節(jié),極大提升合成音的“擬人度”,從而讓語言終端設(shè)備提供親切自然的服務(wù)。

        4.3.3 接入層

        接入層是通過語音識別模組、軟件開發(fā)工具包(SDK)等接入方式,實現(xiàn)硬件采集音頻,軟件通過SDK上傳到算法層進(jìn)行語音識別、語義理解處理,并進(jìn)行業(yè)務(wù)結(jié)果回答播報的語音交互接入方案。

        4.3.4 應(yīng)用層

        應(yīng)用層包含自動售票機、智能客服終端、智能機器人等語音交互設(shè)備。自動售票機在原有觸屏購票的基礎(chǔ)上增加語音購票功能,實現(xiàn)語音購票與觸屏交互的結(jié)合;智能客服終端、智能機器人為乘客提供線網(wǎng)圖查詢、乘車路線查詢、票價查詢、站內(nèi)導(dǎo)航等業(yè)務(wù)咨詢服務(wù)。后期可接入城市軌道交通app、微信公眾號和小程序等,滿足乘客隨時隨地語音問詢的需求。

        5 結(jié)論

        語音識別技術(shù)作為一項高度智能的科技手段,應(yīng)用于城市軌道交通,可實現(xiàn)無接觸式交互,為乘客提供購票、問詢等業(yè)務(wù)功能,實現(xiàn)車站服務(wù)的自助化、智能化、人性化。通過對語音識別技術(shù)在城市軌道交通AFC系統(tǒng)應(yīng)用的全方位整體規(guī)劃,極大推動語音識別技術(shù)在城市軌道交通智慧乘客服務(wù)領(lǐng)域的應(yīng)用,促進(jìn)城市軌道交通智能化轉(zhuǎn)型升級。

        猜你喜歡
        售票機購票車站
        不同的購票方法
        自動售票機拆移的必要性及施工注意事項分析
        直擊痛點的“候補購票”可多來一些
        售票機取現(xiàn)
        基于重慶軌道自動售票機充值模塊的技改設(shè)計
        電子制作(2019年23期)2019-02-23 13:21:22
        鐵路候補購票服務(wù)擴大到全部列車
        車站一角
        熱鬧的車站
        幼兒畫刊(2016年9期)2016-02-28 21:01:10
        熱鬧的車站
        啟蒙(3-7歲)(2016年10期)2016-02-28 12:27:06
        淺析自動售票機創(chuàng)新的設(shè)計
        午夜少妇高潮在线观看| 在线视频青青草猎艳自拍69| 吃下面吃胸在线看无码| 亚洲av乱码国产精品观看麻豆| 亚洲最新精品一区二区| 在线亚洲高清揄拍自拍一品区| 一本色综合久久| 中文字幕久热精品视频免费| 国产偷拍盗摄一区二区| 男女做羞羞事的视频网站| 国产熟妇与子伦hd| 亚洲欧洲∨国产一区二区三区| AV成人午夜无码一区二区| 综合激情中文字幕一区二区| 二区三区日本高清视频| 国产无套粉嫩白浆在线| 免费无码午夜福利片69| 亚洲欧洲AV综合色无码| 午夜视频手机在线免费观看| 国产视频自拍一区在线观看| 边喂奶边中出的人妻| 国产美女在线精品亚洲二区| 日韩av一区二区三区精品| av成人一区二区三区| 性生交片免费无码看人| 亚洲综合久久成人a片| 亚洲综合色婷婷七月丁香| 久久精品亚洲国产av网站| 国产精品亚洲色婷婷99久久精品| 人妻暴雨中被强制侵犯在线| 岛国熟女一区二区三区| 亚洲中文字幕高清在线视频一区 | 亚洲av一区二区三区色多多| 三a级做爰片免费观看| 中文字幕人妻偷伦在线视频| 亲少妇摸少妇和少妇啪啪| 国产三级精品av在线| 18禁成人黄网站免费观看| 精品国精品国产自在久国产应用| av一区二区不卡久久| 亚洲天堂av中文字幕在线观看|