鐘如秀 民航中南空管局 廣東廣州市 510545
管制模擬機培訓作為航空安全前移的一道關口,在管制員培養(yǎng)中有著非常重要的作用,通過模擬機真實的環(huán)境,管制學員與模擬機機長通話,模擬機機長在獲取管制口令后,在機長操作軟件中輸入相應的指令來控制對應的飛機,實現(xiàn)對飛機的調(diào)度,使得學員能夠體驗真實的管制工作。目前模擬機機長主要靠人工來模擬,但存在多種弊端:
(一) 入職后做簡單培訓即上崗,本身沒有專業(yè)基礎,不熟悉機艙設備操作,對管制知識理解不深,對管制意圖把握不到位。
(二) 培訓周期長,至少半年才能放單。隨著模擬機數(shù)量的增加,需要配備的模擬機機長數(shù)量也按比例增加,經(jīng)濟性較差。
(三) 每位模擬機機長要控制多達幾十架航空器,做不到模擬機多種發(fā)音的效果,不能貼近實際場景。
(四) 做不了對管制學員包括通話標準、語速、語調(diào)等方面的語音評測。
上述問題的存在嚴重地影響了管制培訓的質(zhì)量。因此,非常有必要設計基于語音識別的模擬機長語音處理系統(tǒng)來解決實際管制培訓工作中的問題。
模擬機長語音處理系統(tǒng)應包含語音識別、語音合成、語義理解等核心技術,以局域網(wǎng)內(nèi)提供服務形式,為每個管制學員席位提供模擬機長的服務,應具備以下功能:
(一) 語種識別。自動區(qū)分中文和英文管制指令,準確率≥95%。;
(二) 語音識別。1)支持連續(xù)語音識別;(2)支持常規(guī)讀法數(shù)字串、航空管制讀法數(shù)字串等數(shù)字語音指令語音識別;(3)支持非特定人語音識別,使用前無需對用戶發(fā)音人進行錄音定制;(4)中文指令字識別率≥95%;英文指令字識別率≥93%;
(三) 語義理解。按照管制指令的語法規(guī)則對識別后的文本結果進行語義分析,格式化輸出語義關鍵信息;可根據(jù)復述的要求,可以進行語義重組。語義輸出準確率≥95%,句平均識別響應時間≤1秒。
(四) 語音合成。(1)提供四個發(fā)音人(中文、英文男、女聲各兩個);(2)支持中文、英文兩種語種的語音合成;(3)支持對合成音量、語速的調(diào)整;(4)合成語音自然度≥4分(五分制)。;
(五) 自動操作。語音處理系統(tǒng)通過預先建立好的操作指令規(guī)則庫識別出來操作指令,并在模擬機機長軟件中輸入操作指令進行控制飛行目標,正確率達≥95%。
本文以川大智勝ATCSIM-DRS型雷達模擬機為基礎,設計了一個基于科大訊飛語音識別引擎的智能管制模擬機機長系統(tǒng)。
圖1 智能管制模擬機機長系統(tǒng)原理圖
即在原有管制模擬機系統(tǒng)的基礎上,在模擬機機長端增加一個智能語音處理系統(tǒng),該系統(tǒng)利用語音識別引擎和預先建立好的業(yè)務知識庫對管制席位發(fā)送過來的語音指令進行語義理解、語義分析,識別出管制意圖后,根據(jù)已經(jīng)提前獲取的管制模擬機通訊包數(shù)據(jù)格式,利用模塊控制川大智勝模擬機機長軟件完成指令的自動輸入和執(zhí)行,再利用語音合成技術復誦管制席位的意圖,完成一個管制流程。
例如,該系統(tǒng)在收到來自管制學員的一條指令“海南 7854,上升到5100米保持,調(diào)速到叁洞洞”后的處理流程具體表現(xiàn)為:
(一) 對該指令進行語音識別后的基礎分析,包括詞庫及關系、知識庫及關系、詞向量模型、句法分析模型。得到目標:海南7854,目標高度是5100米,速度是300節(jié)。
(二) 對話理解,與對話規(guī)則邏輯進行比對,理解該指令。得到意圖:上升高度和調(diào)節(jié)速度。
(三) 語義理解,在已建立好的業(yè)務知識庫中根據(jù)規(guī)則特征模型、深度特征模型搜索出理解好的指令,識別出語義。得到意圖:海南7854,上升到5100米,調(diào)速至300節(jié)。
(四) 語音合成,將識別出來的語義,利用語音合成技術通過中英文復述反饋給管制席位。得到結果:上升到5100米保持,調(diào)速至叁洞洞,海南7854。
(五) 自動操作,利用識別出來的語義關鍵字,比對操作指令規(guī)則庫,自動在機長軟件界面輸入指令,得到結果:LVL 0510;SPD 300。
(一)業(yè)務知識庫的建立
業(yè)務知識庫的建立需收集川大ATCSIM-DRS雷達管制模擬機上管制員中、英文通話各約500小時語料,語料需要涵蓋所有管制員培訓中的常用說法,且應是管制員培訓時實際使用的通話信道下的。通過收集到的語料進行標注、詞庫建設、知識點挖掘、句式挖掘等把所有可能出現(xiàn)的空管專用術語、數(shù)字、航班號、航空公司、英文代號等建立起知識庫,比如管制中的“1”念“幺”,“2”念“兩”,“7”念“拐”,很多英文字母也有獨特的讀法,每個練習劇本還存在很多導航臺、過臺點等內(nèi)容,所有這些內(nèi)容都要進行詞庫建設,且需要遵循如下程序:(1)資源獲取。收集雷達管制培訓現(xiàn)場語料;(2)詞庫建設。發(fā)現(xiàn)新的詞、短語;(3)知識點挖掘。發(fā)現(xiàn)未覆蓋的知識點;(4)句式挖掘。確認需優(yōu)化知識點,挖掘新句式;(5)驗證上線。新知識效果優(yōu)化、入庫、上線。并將上述五個步驟不斷進行迭代優(yōu)化。
(二)操作指令規(guī)則庫的建立
智能機長語音處理系統(tǒng)識別出管制意圖后,除了復誦給管制席位,還要通過操作指令規(guī)則庫識判斷出相應的操作指令,形成相應的操作命令在機長操作界面的輸入框上輸入并通知模擬機服務器執(zhí)行,從而控制航空器的飛行姿態(tài)。這就需要語音系統(tǒng)識別出語義后,根據(jù)語義去讀取操作指令規(guī)則庫的對應關系。該規(guī)則庫的建立需參考川大ATCSIM-DRS型雷達模擬的操作指令和格式建立,操作指令主要包括高度、速度、航向、建立盲降等共33個指令。
本文就目前空管管制模擬機培訓中人工機長存在的問題進入了深入分析,在此基礎上,提出了一種替代目前人工模擬機機長的智能語音處理系統(tǒng)設計方案,并對系統(tǒng)實現(xiàn)的關鍵技術進行了研究分析。分析表明,智能模擬機機長系統(tǒng)能夠帶來更真實的模擬機培訓效果,極大地降低人力成本,提升培訓質(zhì)量,具有廣闊的應用前景和推廣價值。