孫 禾
(中國民航大學 空中交通管理學院, 天津 300300)
管制員是空中交通管制工作的決策主體,其自身認知水平與技能水平的優(yōu)劣,直接影響到整個空中交通的安全水平。但由于管制工作的特殊性,其與航空安全緊密相連,管制人才的培養(yǎng)和訓練只能采取理論學習結合模擬仿真的方式。一方面,學生需要學習空中交通管制基本理論,包括管制指揮規(guī)則、陸空通話規(guī)范等,主要通過課堂教授的方式進行; 另一方面,學生通過虛擬仿真實驗,鍛煉綜合的管制技能,主要通過管制模擬機進行[1-2]。但從目前的教學環(huán)境來講,除了模擬機以外的實驗教學資源非常少,理論和實際應用脫節(jié),學生很難將自己置身于一種虛擬的管制環(huán)境當中。為了能夠建立一種虛擬仿真的實驗教學環(huán)境,本文基于理性Agent方法建立了管制員認知模型,提出了一種管制實驗教學方案,并開發(fā)了相關的教學資源。
管制員的工作即是通過對情景意識的加工,以及對管制規(guī)則的理解,對空中交通進行管理,以保證飛行的間隔和效率[3-4]。而管制員的認知過程,就是管制員認識外界管制場景和事物的過程,或者說是對作用于管制員的感覺器官的外界管制場景和事物進行信息加工的過程[5-6]。因此可以理解為,管制指揮過程即是管制員認知的集中體現(xiàn),而在這一過程中因為錯、忘、漏等認知差錯造成可能的不良后果,統(tǒng)稱為認知風險[7-11]。因此可以用理性Agent方法,模擬管制員的認知過程,建立的模型如圖1所示。
圖1 基于理性Agent的管制員認知模型
理性Agent包括信念(belief)、愿望(desire)和意圖(intention),即BDI三個部分[12]。其中,信念代表管制員個體素質(zhì)、基本知識、認知能力等; 愿望代表管制員需要完成的任務,例如指揮飛機進行沖突解脫、高度層調(diào)整、機動繞飛等; 意圖代表管制員為了完成任務而需要做的事,即通過陸空通話對飛行員下達相關的管制指令。在模型中,管制員為主體,信念為基礎,愿望為目標,他們共同驅(qū)使管制員個體完成每一項意圖。
在認知模型的基礎上,設計了如圖2所示的管制實驗教學框架。根據(jù)“學習—訓練—仿真”層層深入的設計思想,學生首先通過理論學習部分,掌握管制員所需的基本素質(zhì)和能力,鞏固管制基礎; 之后通過情景練習,掌握在不同指揮任務中,管制員與飛行員常用的陸空通話,了解管制目標; 最后通過模擬的管制場景,將自己置身于雷達屏幕前,指揮飛機完成相應的任務,訓練管制行動。若指揮成功,系統(tǒng)還將輸出計算得到的量化風險值,來評判此次指揮的優(yōu)劣程度。
通過軟件獲得管制員錄入的音頻信號,之后通過語音處理模塊采集相關的時域和頻域信息,即通過程序提取出語音信號的時長、振幅等時域特征,之后提取出MEL倒譜系數(shù)[13-14]。
圖2 管制實驗教學框架
倒譜系數(shù)提取步驟為:(1)預加重部分,采用高通濾波器對語音高頻的部分進行加強,設輸入信號為x(n),輸出信號為y(n)=x(n)-ax(n-1),其中a=0.9375; (2)分幀和加窗部分,根據(jù)語音的短時平穩(wěn)特性,設計采樣頻率為22 050 Hz,每幀長度為23 ms。使用海明窗進行加窗,以減小吉布斯效應; (3)端點檢測部分,計算語音信號的短時能量和過零率。分別設置高低2個閥值,使用雙門限聯(lián)合判決的方法來檢測語音的端點,進而提取出有效的語音片段; (4)最后在語音段的基礎上,進行快速傅里葉變換,將每幀的頻譜參數(shù)通過一組30個三角形帶通濾波器所組成的濾波器,對輸出做對數(shù)運算,求出其對數(shù)能量,再將此30個參數(shù)進行離散余弦變換,即可得到MEL倒譜系數(shù)(MFCC)。
以字母A為例,讀作單詞ALPHA,語音信號處理前后的對比如圖3所示。
圖3 語音信號處理前后對比
2.2.1 語音正確性分析
由于陸空通話英語的用語基本固定,單詞和短句的變化很少,適合建立孤立語音模板,因此在語音處理的基礎上,本文采用DTW算法(dynamic time warping,動態(tài)時間歸整)進行語音識別和打分,以評判語音的正確性。
為了比較客觀地對語音的標準性進行打分,通過DTW方法得到的結果越大,說明與標準語音模板的差距越大。本文采集了100位管制員的語音,經(jīng)過統(tǒng)計發(fā)現(xiàn),DTW輸出值最大為32,因此本文提出用公式(1)對發(fā)音進行評分:
(1)
其中,S為發(fā)音標準性評分,SDTW為算法得到的結果,經(jīng)過處理后,發(fā)音最好的一個樣本其得分為最高的100分,發(fā)音標準性越差,其得分也就越低。
2.2.2 語音準確性分析
采用通話時間和平均振幅的差異性,計算得到語音的準確性情況,如公式(2)、(3)所示:
(2)
(3)
其中,Ti為輸入語音時長,Tt為模板標準時長,T為時長差異性評分;Ai為輸入語音振幅,At為模板標準振幅,A為振幅差異性評分。這2個數(shù)值越大說明與模板越接近,即越符合正常情況。
最后通過加權得到綜合風險值R,如公式(4)所示。
R=100-(w1S+w2T+w3A)
(4)
其中,w1、w2、w3為比例權值,根據(jù)實驗統(tǒng)計,本文給定w1=0.7、w2=0.2、w3=0.1。
為了方便使用,簡化實驗系統(tǒng)所需的硬件要求,系統(tǒng)采用了Eclipse+Android-Sdk的方式進行開發(fā)[15],支持Android 5.1以上的操作系統(tǒng)。本文從管制教材[16]中提取實例,設計了典型的空管指揮場景,并將其中的錄音文件制作成標準的語音模板。虛擬仿真部分的測試數(shù)據(jù)及結果如表1所示,軟件系統(tǒng)功能圖如圖4所示。
表1 測試數(shù)據(jù)及結果
圖4 系統(tǒng)功能圖
以輸出的量化風險值作為參考,可以從一個側面評價學生的管制能力。系統(tǒng)將管制能力的測試融入到風險水平測量當中,改變了以往管制訓練的方式,學生需要使用系統(tǒng)不斷學習和訓練,實驗目的更加明確。同時系統(tǒng)打分相對客觀,避免了人為因素的影響。
本文針對行業(yè)實際需求,提出了一種基于理性Agent方法的管制實驗教學設計方案,并通過Android系統(tǒng)進行了實現(xiàn)。系統(tǒng)的應用可以帶來如下幾方面益處:
(1) 結合理性Agent方法,采用層層深入的設計思路,包含了各類理論基礎知識學習及模擬場景訓練,可以滿足各種水平學生的學習和訓練需求。
(2) 在傳統(tǒng)的管制訓練中,需要一名學生扮演管制員發(fā)布管制指令,另一名學生扮演飛行員,配合管制指令對飛機進行操縱。本方法的虛擬仿真階段,將模擬簡單的雷達管制環(huán)境,通過語音識別自動改變飛機狀態(tài),學生可以獨立進行練習,在節(jié)約學生時間的同時,效率大大提高。
(3) 系統(tǒng)基于Android環(huán)境進行開發(fā),可在手機等智能電子設備上運行,無需耳機、話筒等硬件環(huán)境,提供了更加便捷和高效的使用體驗,很大程度上突破了教學環(huán)境的限制。