張 瓊
(1.南京航空航天大學(xué),江蘇 南京210000;2.春秋航空股份有限公司,上海200000)
管制部門是保證民航安全高效運(yùn)行的基礎(chǔ)。為保證航空安全績(jī)效水平,對(duì)管制員的工作量和工作質(zhì)量進(jìn)行有效的評(píng)估具有重要意義,通過(guò)對(duì)管制負(fù)荷的有效評(píng)估,進(jìn)而可以得出對(duì)應(yīng)扇區(qū)的容量值,當(dāng)扇區(qū)容量過(guò)大時(shí),對(duì)一定時(shí)間內(nèi)扇區(qū)的航空器數(shù)量進(jìn)行有效的控制,從而確保民航在空管這一環(huán)的安全性和高效性。
國(guó)內(nèi)外用于空域容量負(fù)荷評(píng)估的方法較多,包括有建立數(shù)學(xué)模型、快速模擬、動(dòng)態(tài)模擬等等。目前最常用管制負(fù)荷評(píng)估方法包括英國(guó)研究的DORATASK 法,DORATASK 將管制員的工作負(fù)荷分為語(yǔ)音通話負(fù)荷,操作負(fù)荷和思考負(fù)荷,將這幾個(gè)負(fù)荷相加即得管制負(fù)荷。斯坦福研究中心研發(fā)的相對(duì)容量評(píng)估過(guò)程[1](The Relative Capacity Estimating Process,RECEP),它將管制員所有可以考慮的管制行為都進(jìn)行量化,包括通話時(shí)間、飛行進(jìn)程單時(shí)間、集中于雷達(dá)屏幕上監(jiān)視的時(shí)間以及沖突解決的時(shí)間,從而得出一個(gè)小時(shí)內(nèi)總的工作時(shí)間,RECEP 模型將空域容量定義為每小時(shí)內(nèi)空域內(nèi)的航空器架次,并且認(rèn)為管制負(fù)荷的極限值極大決定了空域容量的大小,他們研究得出工作時(shí)間與每小時(shí)的航空器架次之間呈平方關(guān)系。2006 年,美國(guó)的Arthur P.Smith,Anand D.Mundra[2]等人對(duì)加裝ADS-B(Automatic Dependent Surveillance-Broadcast,廣播式自動(dòng)相關(guān)監(jiān)視)設(shè)備對(duì)管制員工作負(fù)荷的影響。Peng Wei,Chittayong Surakitbanbarn 等人[3]利用動(dòng)態(tài)密度對(duì)管制負(fù)荷進(jìn)行評(píng)估,動(dòng)態(tài)密度是指影響空中交通管制復(fù)雜度和難度的各種因素或者說(shuō)各種變量。本文主要研究通過(guò)對(duì)管制員的語(yǔ)音負(fù)荷進(jìn)行定量評(píng)估,利用得到的管制員負(fù)荷進(jìn)一步得出該空域的容量,得到更加科學(xué)的空域容量評(píng)估后,有利于空域的安全和管制員的身心健康。
語(yǔ)音信號(hào)分析,是為了從收集到的語(yǔ)音信號(hào)中提取出研究所需要的特征參數(shù),從而可以找出各變量與指標(biāo)之間的關(guān)系,進(jìn)行后續(xù)的研究。
首先要對(duì)原始語(yǔ)音信號(hào)進(jìn)行讀入,把音頻信號(hào)轉(zhuǎn)化為計(jì)算機(jī)可以處理的數(shù)字信號(hào),在MATLAB 中通常用wavread 函數(shù)完成,得到的數(shù)字化音頻信號(hào)通常存貯在列向量中。對(duì)語(yǔ)音信號(hào)的預(yù)處理,通常包含兩步:分幀和加窗。
語(yǔ)音信號(hào)進(jìn)行分幀處理就是基于語(yǔ)音信號(hào)的“準(zhǔn)穩(wěn)態(tài)”特征,將其在分割成極短時(shí)間的多個(gè)語(yǔ)音片段,在穩(wěn)定狀態(tài)下逐幀提取出特征參數(shù)。同時(shí)為了使各幀之間可以平穩(wěn)過(guò)渡,防止由于超過(guò)能保持穩(wěn)定狀態(tài)的極短時(shí)間,導(dǎo)致參數(shù)發(fā)生變化,通常分幀技術(shù)會(huì)引入幀移的概念(inc),使相鄰兩幀之間部分重疊,幀移圖如圖1 所示。
圖1 幀移圖
幀移是指[4]后一幀對(duì)前一幀的位移量(inc),而相鄰兩幀之間的重疊部分overlap=wlen-inc。對(duì)于長(zhǎng)為N 的語(yǔ)音信號(hào),分幀公式為:
其 中,N 為 信 號(hào) 長(zhǎng) 度,wlen 為 幀 長(zhǎng),inc 為 幀 移,overlap 為相鄰幀重疊部分,該長(zhǎng)為N 的語(yǔ)音信號(hào)將被分為fn 幀。本文中,分幀的實(shí)現(xiàn)主要是:首先調(diào)用wavread函數(shù),將格式為.wav 的音頻文件讀入轉(zhuǎn)化為數(shù)字信號(hào)。分幀主要利用enframe 函數(shù),每一幀的數(shù)據(jù)順序儲(chǔ)存在數(shù)組的每一列中,列數(shù)即為幀數(shù)。加窗則是加在設(shè)定的幀長(zhǎng)wlen 上,hamming(wlen)。
特征參數(shù)提取主要運(yùn)用語(yǔ)音信號(hào)單參數(shù)雙門限端點(diǎn)檢測(cè)法檢測(cè)出是否有話音部分,因此,需要提前設(shè)定區(qū)分背景噪音和實(shí)際話音的閾值,以及判斷靜默段是否為短暫停頓以及話音段長(zhǎng)度是否足以構(gòu)成一句話的參數(shù)。
閾值設(shè)定:根據(jù)前導(dǎo)無(wú)話段的短時(shí)平均能量也就是背景噪音的能量設(shè)置出兩個(gè)門限值,一個(gè)較大為T2,一個(gè)較小為T1。噪聲的估計(jì)通常依據(jù)前導(dǎo)無(wú)話段來(lái)實(shí)現(xiàn)。根據(jù)波形圖估計(jì)出前導(dǎo)無(wú)話段的時(shí)長(zhǎng)IS(單位:s),則前導(dǎo)無(wú)話段的幀數(shù)NIS 為公式2 所示[4]:
其中,IS 為前導(dǎo)無(wú)話段時(shí)長(zhǎng)。由于管制員工作環(huán)境的特殊性,本文將其閾值看為定值。本文閾值的確定是先取前導(dǎo)無(wú)話段長(zhǎng)度IS 為0.25 秒,根據(jù)式(2)得出前導(dǎo)無(wú)話段的幀數(shù)NIS,對(duì)無(wú)話段逐幀求短時(shí)平均能量,存入矩陣eis 中,顯示eis 中各幀的能量,根據(jù)這些能量值取T1,T2。本文選取塔臺(tái)通話錄音的前導(dǎo)無(wú)話段短時(shí)平均能量大小設(shè)定T1 和T2 分別為0.0001 和0.05。然后對(duì)語(yǔ)音信號(hào)特征參數(shù)進(jìn)行提取(提取的語(yǔ)音信號(hào)特征參數(shù)為短時(shí)能量、短時(shí)平均過(guò)零率、通話次數(shù)和時(shí)長(zhǎng)以及飽和度)。
分幀后的語(yǔ)音信號(hào),按列存儲(chǔ)在數(shù)組中,幀數(shù)為fn,按照求過(guò)零率的思路,求每幀的過(guò)零率。首先對(duì)分幀后的矩陣逐列調(diào)用,讀取每列的數(shù)據(jù),即得到每幀的所有采樣點(diǎn)信息,按幀長(zhǎng)循環(huán),判斷相鄰取樣點(diǎn)之間的符號(hào)變化情況,當(dāng)相鄰取樣點(diǎn)乘積為負(fù),則說(shuō)明信號(hào)過(guò)零一次,計(jì)數(shù)加一,繼續(xù)循環(huán),一幀循環(huán)完后將該幀過(guò)零情況存入行向量中。最終求和可得該段語(yǔ)音信號(hào)的過(guò)零率。對(duì)數(shù)字化音頻信號(hào)求列向量長(zhǎng)度,得到采樣點(diǎn)數(shù)N,結(jié)合采樣頻率可求得信號(hào)的時(shí)間坐標(biāo)time,在繪制語(yǔ)音波形圖和后續(xù)求飽和度時(shí)會(huì)用上。對(duì)分幀后的信號(hào)逐幀點(diǎn)平方求和,分別得到每幀的短時(shí)平均能量etemp,求和可得語(yǔ)音信號(hào)能量setemp。
最后基于短時(shí)平均能量的單參數(shù)雙門限端點(diǎn)檢測(cè)法,檢測(cè)出該段語(yǔ)音中的通話次數(shù)并得到voiceseg 結(jié)構(gòu)數(shù)據(jù)??傻玫酵ㄔ捳Z(yǔ)音次數(shù),通話時(shí)長(zhǎng)和飽和度。流程圖2 為本文語(yǔ)音信號(hào)分析程序?qū)崿F(xiàn)的整體思路。
本文選擇使用SPSS 軟件進(jìn)行因子分析,找出各參數(shù)之間的內(nèi)在聯(lián)系,最終實(shí)現(xiàn)用語(yǔ)音參數(shù)表示出管制負(fù)荷的大小,用少數(shù)幾個(gè)因子去描述原資料的大部分信息[5]。
因子分析是將有內(nèi)在聯(lián)系的幾個(gè)變量,找到支撐它們相互關(guān)系的公共因子,使變量能用公共因子和特殊因子這兩部分來(lái)表示的多變量統(tǒng)計(jì)分析方法。本文的思路是將語(yǔ)音分析得到的五項(xiàng)特征參數(shù)(通話語(yǔ)音的次數(shù)、能量、時(shí)長(zhǎng)、飽和度、過(guò)零率)用SPSS 進(jìn)行因子分析,設(shè)它們分別為x1,x2,x3,x4,x5作為五個(gè)隨機(jī)變量。
關(guān)系式3 就是因子模型,表示各變量之間的關(guān)系,fi為公共因子,ei為特殊因子,bij(i=1,2,…,5,j=1,2,…,m)為因子的載荷,表示變量xi對(duì)公共因子fi的影響。其中,公共因子和特殊因子各自內(nèi)部之間以及兩者之間都是互不相關(guān),相互獨(dú)立的。特殊因子與各自對(duì)應(yīng)的變量有關(guān),用于補(bǔ)齊公共因子無(wú)法完全表示出來(lái)的部分。
提取9 段不同繁忙時(shí)刻的管制錄音,每段3 分鐘,分別提取特征參數(shù),進(jìn)行因子分析。在SPSS 軟件上的操作步驟具體如下:
圖2 語(yǔ)音信號(hào)分析流程
(1)數(shù)據(jù)的輸入,在軟件中分別輸入9 段管制語(yǔ)音的特征參數(shù)。
(2)按順序點(diǎn)擊分析→降維→因子分析→選擇要分析的變量→在“描述”中選擇KMO 和Bartlett 球度檢驗(yàn)→在“抽取”中選擇“主要成分提取法”→在“旋轉(zhuǎn)”中選擇“最大方差法(varimax)”→開始分析。
(3)得到分析結(jié)果。
分析結(jié)果如表1,2,3 所示:
表1 結(jié)構(gòu)效度分析結(jié)果
表2 因子載荷矩陣
根據(jù)結(jié)構(gòu)效度分析結(jié)果看出,KMO 值大于0.7,根據(jù)Kaiser 的觀點(diǎn),屬于中等,KMO 值越大表明越適合進(jìn)行因子分析。
結(jié)合式3 中描述的因子模型,可以因子載荷矩陣表示出因子模型,如式4 所示:
其中,f1為公共因子,e1~e5為特殊因子。利用主要成分提取法抽取出因子得分系數(shù)矩陣,將公共因子表示為各變量的線性組合。
所以可得到
其中,x1~x5為選取的變量。語(yǔ)音信號(hào)的通話次數(shù)、時(shí)長(zhǎng)等特征的變化是受語(yǔ)音負(fù)荷的變化而相應(yīng)變化影響的,因此語(yǔ)音負(fù)荷就是這五項(xiàng)特征參數(shù)的公共因子。語(yǔ)音負(fù)荷因此依據(jù)表3 可得語(yǔ)音負(fù)荷的表達(dá)式為:
表3 因子得分系數(shù)矩陣
表4 為提取的不同通話錄音提取參數(shù),并計(jì)算負(fù)荷所得結(jié)果。
由表4 可以看出,不同特征參數(shù)大小,語(yǔ)音負(fù)荷的大小有明顯差異。
根據(jù)《空中交通服務(wù)規(guī)劃手冊(cè)》(DOC.9426)DORATASK 法所指出的:當(dāng)航班量達(dá)到該扇區(qū)的容量值時(shí),管制員的平均工作負(fù)荷不得超過(guò)工作負(fù)荷峰值的80%,并且工作負(fù)荷超過(guò)最大值的90%的時(shí)間不得超過(guò)總工作時(shí)間的2.5%。那么說(shuō)明當(dāng)負(fù)荷達(dá)到峰值的80%時(shí),此時(shí)扇區(qū)內(nèi)的航班量即為該扇區(qū)的容量。
為了得到負(fù)荷峰值80%時(shí)的航空器數(shù)量,需要得到管制負(fù)荷與航空器數(shù)量之間的關(guān)系式。因此,選用最小二乘法回歸分析,將多個(gè)管制負(fù)荷與航空器數(shù)量一一對(duì)應(yīng)的散點(diǎn)擬合成方程。如式7 所示:
表4 語(yǔ)音段的特征參數(shù)及管制負(fù)荷
表5 不同飛機(jī)架次與對(duì)應(yīng)語(yǔ)音負(fù)荷
其中的a,b 使F(a,b)最小,即函數(shù)F 分別對(duì)a,b 求偏導(dǎo),令偏導(dǎo)等于零,得到方程組可求出a,b,得出的該條擬合函數(shù)就是最接近散點(diǎn)圖的直線,得到最小二乘法擬合的函數(shù)。
本文空域容量評(píng)估主要的依據(jù)是國(guó)際民航組織《空中交通服務(wù)規(guī)劃手冊(cè)》(DOC.9426)[7]中的DORATASK 法所指出的:當(dāng)航班量達(dá)到該扇區(qū)的容量值時(shí),管制員的工作負(fù)荷不得超過(guò)負(fù)荷最大值的80%,并且工作負(fù)荷超過(guò)最大值的90%的時(shí)間不得超過(guò)總工作時(shí)間的2.5%。因此可以基本確定空域容量的評(píng)估方法。
基于話音負(fù)荷的空域容量評(píng)估過(guò)程基本如下:
(1)計(jì)算出多個(gè)時(shí)間片管制員的話音負(fù)荷。
(2)統(tǒng)計(jì)每個(gè)時(shí)間片對(duì)應(yīng)的航空器架次。
(3)根據(jù)第(1)、(2)步的結(jié)果,做出散點(diǎn)圖,判斷負(fù)荷與航空器架次的大致關(guān)系。
(4)利用MATLAB 進(jìn)行函數(shù)擬合,得到話音負(fù)荷與航空器架次之間的對(duì)應(yīng)函數(shù)關(guān)系。
(5)由于目前大多使用雷達(dá)管制,管制員的通話相比程序管制有所減少,因此當(dāng)平均工作負(fù)荷達(dá)到峰值的70%時(shí)對(duì)應(yīng)的航空器架次即是空域容量[6]。
根據(jù)上述原理,收集某塔臺(tái)管制單位話音數(shù)據(jù),首先計(jì)算管制員的22 個(gè)10 分鐘時(shí)間片的話音負(fù)荷,并統(tǒng)計(jì)相應(yīng)航空器架次,得到飛機(jī)架次與話音負(fù)荷一一對(duì)應(yīng)的多個(gè)散點(diǎn),對(duì)應(yīng)關(guān)系如表5 所示。
利用MATLAB 的polyfit 函數(shù)對(duì)散點(diǎn)圖進(jìn)行回歸分析,由此得到擬合結(jié)果:
其中,N 為航空器架次。
由于本文選取的是塔臺(tái)席通話錄音,因此仍以峰值的80%進(jìn)行計(jì)算,即工作負(fù)荷達(dá)到峰值的80%時(shí),此時(shí)航空器的流量N 為扇區(qū)的容量值[7]。根據(jù)函數(shù)可以求得管制負(fù)荷的峰值和對(duì)應(yīng)的航空器數(shù)量。可以得到采集語(yǔ)音數(shù)據(jù)的該塔臺(tái)管制單位塔臺(tái)席的語(yǔ)音負(fù)荷峰值Wmax為810107.6871,那么峰值80%時(shí)對(duì)應(yīng)的航空器架數(shù)約為3 架,說(shuō)明該管制單位塔臺(tái)席較合理的安排是10 分鐘的時(shí)間片內(nèi)同時(shí)掌控的航空器架次不超過(guò)3 架。
本文從管制話音特征參數(shù)入手,對(duì)一線通話錄音進(jìn)行語(yǔ)音分析,提取出特征參數(shù)。為了使特征參數(shù)具體量化出語(yǔ)音負(fù)荷的大小,利用因子分析的方法對(duì)數(shù)據(jù)進(jìn)行分析,求出本文所確立的語(yǔ)音負(fù)荷。最后利用MATLAB 進(jìn)行擬合可得到語(yǔ)音負(fù)荷與航空器架次之間關(guān)系的方程式,根據(jù)國(guó)際民航組織9426 號(hào)文件要求,確定對(duì)應(yīng)的航空器架次即為空域容量,能夠有效提高空域容量評(píng)估的效率。