鄭 磊,池 宏,邵雪焱
(1.中國科學院科技戰(zhàn)略咨詢研究院,北京 100190;2.中國科學院大學,北京 100049)
基于QAR數(shù)據(jù)的飛行操作模式及其風險分析
鄭 磊1,2,池 宏1,邵雪焱1
(1.中國科學院科技戰(zhàn)略咨詢研究院,北京 100190;2.中國科學院大學,北京 100049)
QAR海量數(shù)據(jù)分析是航空安全管理的一個重要課題,準確而高效地挖掘其中蘊含的飛行操作模式、評估其風險水平,是切實提高飛行操作品質(zhì)的關(guān)鍵。然而,飛行過程中飛行員需要根據(jù)動態(tài)變化的環(huán)境條件、飛機狀態(tài),對油門、桿、盤、舵等設(shè)備進行操作,是一個需要不斷調(diào)整、相互配合的過程,這增加了對飛行操作模式及其風險進行分析的難度。本文從飛行參數(shù)多元時間序列數(shù)據(jù)的特征提取及相似性度量入手,通過聚類挖掘蘊含的飛行操作模式,進而,通過分析飛行操作模式與QAR監(jiān)控指標值之間的關(guān)聯(lián)關(guān)系,量化不同飛行操作模式的風險水平。最后,本文以首都機場特定機型著陸階段QAR實際數(shù)據(jù)為例,驗證了模型的有效性。
QAR;多元時間序列;操作模式;風險分析
伴隨飛行數(shù)據(jù)記錄設(shè)備的不斷更新升級,飛行數(shù)據(jù)的采集數(shù)量與質(zhì)量都有很大提高??焖俅嫒∮涗浧?Quick access recorder,QAR)記錄了飛行全過程發(fā)動機等設(shè)備狀況、外部環(huán)境狀況,以及飛行員的操作狀況,對QAR海量數(shù)據(jù)的深入挖掘分析日益受到航空監(jiān)管機構(gòu)及航空運營商的高度重視,成為事故調(diào)查、機務維修、飛行品質(zhì)監(jiān)控等多項工作的有力支撐。NASA支持研發(fā)的航空性能測量系統(tǒng)(Aviation Performance Measuring System,APMS)主要圍繞飛行數(shù)據(jù)分析的先進理念和軟件原型開展工作。
運用QAR數(shù)據(jù)進行飛行品質(zhì)分析也受到國內(nèi)外學者的關(guān)注,曹海鵬等[1]利用神經(jīng)網(wǎng)絡(luò)對QAR超限事件進行診斷分析,并以某航空公司B737機型實際數(shù)據(jù)對模型進行驗證,結(jié)果顯示基于神經(jīng)網(wǎng)絡(luò)的模型不僅能夠判斷航空器是否重著陸,還能夠分析導致重著陸的原因,同時訓練好的網(wǎng)絡(luò)執(zhí)行速度快,可以滿足實時診斷的需求。祁明亮等[2]和Shao Xueyan等[3]以著陸階段的一類QAR超限事件為研究對象,建立數(shù)學規(guī)劃模型,對操作參數(shù)的風險區(qū)域進行分析。曹海鵬[4]研究了使用灰色預測模型對某超限事件進行時間序列預測,此外,還與運用指數(shù)平滑法的計算結(jié)果進行了對比。結(jié)果顯示,灰色預測的效果好于指數(shù)平滑。張榮家等[5]利用QAR數(shù)據(jù)研究了A321型飛機在著陸階段易引發(fā)超限事件的原因,并提出安全操作建議。孫瑞山和韓文律[6]利用差異檢驗對QAR超限事件及其飛行記錄數(shù)據(jù)進行分析,通過對爬升速度大(35-1000ft),下降率大(2000-1000ft)及接地點遠三類超限事件的分析,得到K-W檢驗能夠用于分析飛行參數(shù)之間的分布差異。孫瑞山和肖亞兵[7]結(jié)合QAR飛行記錄,從人的行為特征出發(fā),確定了描述飛行員操作的完整性、平穩(wěn)性、準確性、及時性的操作特征向量指標。Li Lishuai[8]運用主成分分析對起飛和降落階段的多元時間序列飛行參數(shù)先進行降維,再進行分析。文章將時間序列中的變量視為隨機變量,是一種統(tǒng)計意義上的度量方法,忽略了觀察值的時序關(guān)系。綜上,目前利用QAR數(shù)據(jù)進行飛行品質(zhì)研究主要使用的是截面數(shù)據(jù),即飛行參數(shù)的某些狀態(tài)值,對于飛行參數(shù)多元時序數(shù)據(jù)隱含規(guī)律的挖掘亟待加強。
多元時序數(shù)據(jù)挖掘也是數(shù)據(jù)挖掘領(lǐng)域的研究熱點,其中的多元時間序列相似性研究方面積累了相當數(shù)量的成果,包括基于統(tǒng)計特征的方法、基于符號的表示方法、動態(tài)時間規(guī)整方法(Dynamic Time Warping,DTW)、奇異值分解方法(Singular Value Decomposition,SVD)、基于點分布特征的方法,以及集成方法等。閆相斌等[9]和Cai Qinglin等[10]提出使用時間序列的統(tǒng)計特征如趨勢、平均值、方差等作為聚類特征向量,該方法對序列的間隔與長度無特殊的要求,具有較好的適應性,但由于采用的都是全局特征描述變量,難以細致刻畫時間序列的局部特征。徐梅和黃超[11]引入符號時間序列分析方法,將收益時間序列轉(zhuǎn)化為符號序列,由符號序列中不同的字代表不同的收益變化模式,該方法可以極大的減小數(shù)據(jù)的規(guī)模,但是產(chǎn)生的序列值比較離散,無法精確比較序列的相似性。李正欣等[12]、吳虎勝等[13]和Keogh等[14]都是基于動態(tài)時間規(guī)整提出的時間序列數(shù)據(jù)分析模型,都采用了對時間序列數(shù)據(jù)進行分段擬合,并基于擬合后的分段計算DTW距離進行相似性分析。李正欣等[12]采用自下而上的分段方式,將長度為n的多元時間序列分成n/2段,遞歸地合并擬合誤差最小的相鄰段,直至任意兩相鄰段合并的擬合誤差都大于給定的最大誤差閾值。在定義相似性分析的距離時,時間跨度和角度的差異均作為權(quán)重進行計算。吳虎勝等[13]采用滑窗的分段方式,從初始時刻開始,每次加入一個時間單位跨度的數(shù)據(jù)點,計算窗口內(nèi)數(shù)據(jù)點的直線擬合誤差,當誤差大于某個閾值時進行切分。在定義相似性分析的距離時,以時間跨度作為權(quán)重進行計算。Keogh等[14]較早的提出使用分段擬合后的時間序列來計算DTW距離。毛紅保等[15]引入奇異值分解(Singular Value Decomposition,SVD)方法,采用相關(guān)系數(shù)矩陣作為特征提取的基礎(chǔ),依據(jù)線性空間中坐標變換原理構(gòu)造模式匹配模型。該方法僅使用提取的奇異值信息,未使用特征矩陣信息,存在誤判風險且計算復雜度較高。管河山等[16]使用基于點分布(Point Distribution,PD)特征的方法抽取局部重要點刻畫多元時間序列特征,并根據(jù)重要點的分布特征構(gòu)建模式匹配模型,該方法處理小規(guī)模多元時間序列性能較好。ten Holt等[17]提出MD-DTW距離,將動態(tài)時間規(guī)整方法擴展到多元時間序列的相似性研究中。DTW方法適用于時間軸的伸縮,定義了一種允許對時間軸進行伸縮下的最佳相似關(guān)系,但其計算復雜度高,在用于海量時間序列數(shù)據(jù)分析時存在困難。Bankó等[18]提出將基于均值的DTW距離和基于角度的DTW距離結(jié)合起來的混合DTW距離,可以較好的提升DTW算法的效率,減少運算時間,同時可以獲得滿意的運算結(jié)果。綜上,圍繞具體分析問題,在多元時序數(shù)據(jù)的特征提取,以及相似性度量方面,需要研究有針對性的方法。
在飛行過程中,飛行員需要根據(jù)動態(tài)的環(huán)境條件、飛機狀態(tài),綜合操作油門、桿位等設(shè)備,實現(xiàn)對飛機高度、速度、姿態(tài)等的控制。QAR記錄了飛行全過程的環(huán)境條件參數(shù)、飛機狀態(tài)參數(shù),以及飛行員的操作參數(shù),是一類多元時間序列,可以表示為時間序列X=[x1,x2,…,xn],每個元素xi是由m個飛行參數(shù)組成的向量,長度為n的時間序列記為矩陣X(X∈Rm×n)。
通過監(jiān)控QAR數(shù)據(jù),可以發(fā)現(xiàn)飛行員何時加油門、何時收襟翼、何時收輪,進而與規(guī)章、手冊的要求進行比對。對于飛行員操作中存在的共性特征,譬如,“抬頭慢”、“人工干預自動油門”,還需要進一步對此時的重點安全監(jiān)控參數(shù),如飛機的著陸垂直載荷等數(shù)值進行分析,從而量化飛行操作模式的風險大小。
綜上,本文主要研究兩方面問題:一是,飛行參數(shù)多元時間序列數(shù)據(jù)的相似性度量,即從多元時序數(shù)據(jù)中挖掘相似的飛行操作模式;二是,分析飛行操作模式與QAR監(jiān)控事件之間的關(guān)聯(lián)關(guān)系,量化不同操作特征的風險水平。
研究飛行操作模式,目的是發(fā)現(xiàn)具有代表性的飛行員操作手法,即對油門、桿位、盤、舵等設(shè)備的操作,是進一步針對該類操作手法進行安全風險分析的基礎(chǔ),這里,有代表性的操作手法是指具有一定數(shù)量的飛行過程中出現(xiàn)的相似操作,因此,我們將飛行操作模式的分析歸結(jié)為對飛行參數(shù)多元時間序列數(shù)據(jù)相似性的研究。分析多元時間序列的相似性需要解決兩個關(guān)鍵問題:一是,如何抽象和概括時間序列的特征;二是,如何度量時間序列的相似性。
3.1飛行參數(shù)多元時序數(shù)據(jù)的特征提取
QAR可記錄幾十甚至上百飛行小時的數(shù)據(jù),以波音747飛機ARINC717(128WPS)為例,其QAR原始代碼的幀結(jié)構(gòu)為1幀4秒,1幀包括4副幀,每副幀1秒,包括128個數(shù)據(jù)字[19],因此,QAR的數(shù)據(jù)量是非常龐大的,對QAR數(shù)據(jù)的挖掘技術(shù)提出了很高的要求。時間序列一般具有趨勢性、季節(jié)性、周期性等特征,針對本文所要研究的飛行操作模式,重點關(guān)注QAR數(shù)據(jù)的趨勢性特征。由于QAR數(shù)據(jù)的海量性、復雜性和噪音干擾等特點,直接在原始數(shù)據(jù)上進行分析計算量大,還可能影響算法的準確性和可靠性,因此,可采用時間序列模式表示方法對飛行參數(shù)進行處理,不僅可大大壓縮數(shù)據(jù)量,還可有效剔除原始參數(shù)序列中的噪聲干擾[20]。
常用的序列模式表示方法有離散傅立葉變換、離散小波變換、奇異值分解,以及分段線性,考慮本文在研究飛行操作模式時,希望直觀反映時間軸上飛行參數(shù)的趨勢特征,故采用分段線性的方法,研究飛行參數(shù)時序數(shù)據(jù)的特征提取。在對飛行參數(shù)多元時序數(shù)據(jù)進行分段線性擬合時,選取滑動時間窗算法,該算法的基本思想是用一段直線擬合同一窗口內(nèi)的數(shù)據(jù)點,當窗口內(nèi)數(shù)據(jù)的擬合誤差小于給定閾值時,將新數(shù)據(jù)加入,增加窗口寬度,直到累積的擬合誤差大于給定閾值時,開啟新的窗口。
在分段基礎(chǔ)上,采用擬合線段的傾斜角與窗口的時間跨度刻畫時序數(shù)據(jù)的趨勢特征,定義Aij表示飛行參數(shù)i在窗口j內(nèi)擬合線段的傾斜角,tj表示窗口j的時間跨度,則對于包含m個飛行參數(shù),時間長度為n的多元時間序列,可采用如下矩陣表示:
(1)
其中,i=1,2,…m;j=1,2,…,Q,Q為分段后的時間窗數(shù)目。
3.2飛行參數(shù)多元時序數(shù)據(jù)的相似性度量
如前所述,在多元時間序列相似性研究方面形成了動態(tài)時間規(guī)整、奇異值分解、主成分分析,以及基于點分布特征等方法。本文所要研究的飛行操作模式,重點關(guān)注QAR數(shù)據(jù)的趨勢特征,故采用動態(tài)時間規(guī)整(DTW)方法進行研究。該方法被廣泛應用于在語音識別、手勢識別等問題。設(shè)有時間序列C和Q,如圖1(a),DTW方法的處理結(jié)果如圖1(b)所示,即找到兩條時間序列曲線上每個點的對應點,使得C和Q上對應點對之間距離的和最小。
圖1 動態(tài)時間規(guī)整方法原理示意
設(shè)時間序列X=[x1,x2,…,xn]和Y=[y1,y2,…,yn],則兩個序列的DTW距離Ddtw(X,Y)定義如下式,其中,Dbase(xi,yj)表示向量點xi和yj之間的基距離,可以根據(jù)情況選擇不同的距離度量。
Ddtw(X,Y)=Dbase(x1,y1)+
(2)
本文中對于飛行參數(shù)時序數(shù)據(jù)進行分段線性擬合,并提取擬合線段的傾斜角角度及時間跨度刻畫時序數(shù)據(jù)特征,因此,在采用DTW方法進行飛行參數(shù)多元時序數(shù)據(jù)相似性分析時借鑒文章[13],定義基距離如下:
(3)
其中,Dbase(xp,yq)表示列向量xp和yq之間的基距離,tX和tY分別為多元時間序列X和Y的時間跨度。通過定義Dbase(xp,yq)將多維時間序列降為一維時間序列。
3.3飛行操作多元時序數(shù)據(jù)的聚類分析
在飛行參數(shù)多元時序數(shù)據(jù)的相似性度量基礎(chǔ)上,本文采用聚類的方法挖掘有代表性的飛行操作手法,即有代表性的飛行操作模式。由于本文對于飛行員操作模式的分析,并沒有關(guān)于模式個數(shù)的經(jīng)驗信息,故采用系統(tǒng)聚類進行研究,類間距的計算選取類平均法。
(4)
3.4案例分析
根據(jù)波音公司2006-2015年的統(tǒng)計數(shù)據(jù)[21],著陸階段雖然在時間上只占整個航程的1%左右,但發(fā)生的重大事故占全部航段重大事故的20%左右,因此,本文采集著陸前20秒的飛行參數(shù)數(shù)據(jù),并以油門(單位,%RPM)、桿位(單位,DEG)兩項參數(shù)QAR記錄為例進行研究。
圖變化情況
表1 系統(tǒng)聚類結(jié)果
考慮到擬合后的軌跡較好地展現(xiàn)了整體趨勢,本文采用擬合后的軌跡對類操作特征進行研究,如圖3。本文主要以油門和桿的操作進行分析,在數(shù)據(jù)篩選時盡可能排除風速、風向?qū)︼w機著陸操作的影響。飛機著陸過程需要收油門減速,飛機的高度和速度不斷下降,飛行員根據(jù)飛機速度和高度的變化情況控制操縱桿。當飛機下降到特定高度標準時,就要開始拉桿,即開始拉平,使飛機下降的速度逐漸變緩,再達到特定高度標準后拉平,飛機平飄,之后速度降低飛機慢慢著陸。
在本文樣本機型的《飛行訓練手冊》中,對于著陸階段的操作有如下描述:1)3度進近下滑軌跡;2)拉平距離跑道頭大約1000-2000英尺;3)典型的著陸拉平時間范圍在4-8秒,并且隨進近速度而變化;4)飛機機身姿態(tài)基于典型的著陸重量,襟翼30,VREF30+5節(jié)(進近)和VREF30+0節(jié)(接地),每高于此速度5節(jié)應減小1度;5)主起落架的跑道入口高度和飛行員的目視高度參考兩排桿/三排桿VASI著陸幾何圖。
在圖3中,(a)表示在落地前約7-8秒開始收油門,先緩慢拉桿,在落地前約6秒開始推桿;(b)表示在落地前約4-9秒開始收油門,先緩慢拉桿,在落地前10秒左右加速拉桿,在落地前1秒左右快速推桿;(c)表示在落地前約5秒開始收油門,先緩慢拉桿,在落地前13秒左右加速拉桿,在落地前8秒左右快速推桿,最后在落地前3秒左右再次拉桿;(d)表示在落地前約7秒開始收油門,先緩慢拉桿,在落地前3秒左右推桿;(e)表示在落地前約9秒開始收油門,先緩慢拉桿,在落地前12秒左右加速拉桿,在落地前4秒左右緩慢推桿;(f)表示在落地前約7秒開始收油門,先緩慢拉桿,在落地前1秒左右快速推桿;(g)表示在落地前約6秒開始收油門,持續(xù)緩慢拉桿;(h)表示在落地前約6秒開始收油門,持續(xù)緩慢拉桿;(i)表示緩慢收油門,持續(xù)緩慢拉桿。綜上,第七、八、九類關(guān)于桿的操作和訓練手冊描述較為吻合,在著陸階段持續(xù)拉平,但是第九類的油門操作與第七、八類有較大差異,收油門持續(xù)時間較長。
4.1分析方法
在本文研究工作中,以QAR監(jiān)控標準作為飛行操作模式風險高低的判斷依據(jù),采用Kolmogorov-Smirnov檢驗(K-S檢驗),對不同飛行操作模式的監(jiān)控指標分布情況的差異性進行檢驗,進一步做出風險評判。K-S檢驗用于驗證一個經(jīng)驗分布是否符合某種理論分布,或用于比較兩個經(jīng)驗分布是否有顯著性差異。兩樣本K-S檢驗對于兩樣本經(jīng)驗分布函數(shù)的位置和形狀參數(shù)的差異都較為敏感,且不依賴于累積分布函數(shù)。
4.2案例分析
針對如前所述特定月份首都機場1210次降落的QAR記錄,統(tǒng)計落地G值的分布情況,G值范圍在[1.1445,1.8867]。對于樣本機型,著陸垂直載荷(G值)的監(jiān)控標準為1.6,飛行操作模式G值的分布如圖4所示。
飛行操作模式G值描述性統(tǒng)計見表2。
為驗證以G值超過監(jiān)控標準樣本的占比為依據(jù)進行的風險劃分是否合理,采用K-S檢驗對不同飛行操作模式下G值分布的差異性進行檢驗,結(jié)果見表3。
圖4 G值分布圖
類別類樣本數(shù)類均值類標準差G值<1.6的樣本數(shù)G值≥1.6的樣本數(shù)G值≥1.6樣本占比第一類281.270.082800.00%第二類421.320.114112.38%第三類321.300.093200.00%第四類541.280.095400.00%第五類351.290.133412.86%第六類461.280.104512.17%第七類1971.290.0919431.52%第八類2071.290.0920520.97%第九類481.310.094712.08%其他521--51110-總計12101.300.101191191.57%
4.3方法對比
接下來采用神經(jīng)網(wǎng)絡(luò)和支持向量機(SVM)來分析QAR監(jiān)控事件著陸垂直載荷大。本文采用BP神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)包含輸入層、隱藏層和輸出層共三層,輸入層2個單元、隱藏層20個單元、輸出層2個單元,后向傳播學習率2.5;支持向量機采用LIBSVM,使用默認的C-SVC分類機,采用RBF核函數(shù),參數(shù)設(shè)置c=1000,gamma=10。
表3 K-S檢驗結(jié)果
采用的數(shù)據(jù)同上,使用落地時刻的油門(單位,%RPM)、桿位(單位,DEG)兩項參數(shù)的QAR記錄作為模型的輸入,將落地時刻的G值是否不小于1.6作為模型的輸出。訓練集、測試集數(shù)據(jù)情況如表4。
表4 數(shù)據(jù)情況
分類結(jié)果如下:
表5 BP神經(jīng)網(wǎng)絡(luò)分類的混淆矩陣
表6 LIBSVM分類的混淆矩陣
以G值≥1.6的樣本為研究對象(正例),由表5、6可知,神經(jīng)網(wǎng)絡(luò)的分類準確率為98.4%,支持向量機的分類準確率為96.9%,準確率都很高;考慮到存在類不平衡的情況,考察兩個分類器的靈敏度(真正例率)和特效性(真負例率),神經(jīng)網(wǎng)絡(luò)和支持向量機的靈敏度均為0,神經(jīng)網(wǎng)絡(luò)特效性為100%,支持向量機特效性為98.4%。著陸垂直載荷大這一事件本身發(fā)生概率很低,(1210個樣本中G值≥1.6的樣本僅有19個,占比1.57%),即使將所有樣本均判定為G值<1.6,最終的準確率也很高。在這種類不平衡的情況下,應更關(guān)注靈敏度和特效性指標,但兩個分類器靈敏度表現(xiàn)都很差,因此兩個分類器正確標記稀有類(正例)的能力較差。此外,兩種分類器除了最終判斷結(jié)果外,提供的其他有用信息較少。神經(jīng)網(wǎng)絡(luò)用于分類預測時,解釋性較弱;支持向量機由于需要空間維度轉(zhuǎn)換處理,同樣存在解釋性較弱的問題。
本文研究落地前一段時間內(nèi)關(guān)鍵參數(shù)的變化特征,不僅可以根據(jù)關(guān)鍵參數(shù)特征變化的相似性確定操作模式,而且可以進一步分析操作模式的風險高低,本文從參數(shù)曲線的相似性出發(fā)研究飛行操作模式,直觀、解釋性強。
本文圍繞QAR記錄的飛行員對油門、桿位等設(shè)備的操作參數(shù)數(shù)據(jù),從操作參數(shù)多元時間序列的特征提取入手,進而分析飛行操作的相似性,挖掘蘊含的飛行操作模式。針對不同的飛行操作模式,研究相關(guān)QAR監(jiān)控指標值的分布情況,量化不同飛行操作模式的風險水平。通過對首都機場特定機型在特定季節(jié)的著陸階段QAR記錄的分析,對模型的有效性進行了驗證。
在本文的研究工作中,對于多元時序數(shù)據(jù)進行特征提取時主要考慮了其中的趨勢信息,后續(xù)將結(jié)合實際問題,研究時序數(shù)據(jù)所含其他信息的提取方法對飛行操作進行聚類分析的終止條件也有待進一步研究。此外,飛行過程是對飛機高度、速度、姿態(tài)等的復雜控制過程,并受到地理條件、氣象條件等不確定性因素的影響,對飛行操作模式及其風險的分析離不開對專家經(jīng)驗深入運用。
本文的研究工作可拓展至對其他交通工具操作模式的研究,比如汽車駕駛員根據(jù)傳感器記錄的駕駛員對方向盤、剎車和油門等設(shè)備的操作數(shù)據(jù),采用本文方法,可對駕駛員的操作模式進行挖掘,并對風險率水平進行評估,有助于提高安全駕駛水平。
[1] 曹海鵬, 舒平, 黃圣國. 基于神經(jīng)網(wǎng)絡(luò)的民用飛機重著陸診斷技術(shù)研究[J]. 計算機測量與控制, 2008, 16(7): 906-908.
[2] 祁明亮, 邵雪焱, 池宏. QAR超限事件飛行操作風險診斷方法[J]. 北京航空航天大學學報, 2011, 37(10): 1207-1210.
[3] Shao Xueyan, Qi Mingliang, Gao Mingang. A risk analysis model of flight operations based on region partition. Kybernetes, 2012, 41(10): 1497-1508.
[4] 曹海鵬. B737重著陸診斷技術(shù)研究[D]. 南京:南京航空航天大學, 2008.
[5] 張榮家, 鐘力生. A321機型大過載著陸的QAR數(shù)據(jù)分析和探討[J]. 中國民航飛行學院學報, 2012, 23(1): 49-53.
[6] 孫瑞山, 韓文律. 基于差異檢驗的飛行超限事件參數(shù)特征分析[J]. 中國安全生產(chǎn)科學技術(shù), 2011, 7(2): 22-27.
[7] 孫瑞山, 肖亞兵. 基于QAR記錄數(shù)據(jù)的民航飛行員操作特征指標結(jié)構(gòu)研究[J]. 中國安全生產(chǎn)科學技術(shù), 2012, 8(11): 49-54.
[8] Li Lishuai. Anomaly detection in airline routine operations using flight data recorder data [D]. Cambridge: MIT, 2013.
[9] 閆相斌, 李一軍, 鄒鵬, 等. 動靜態(tài)屬性數(shù)據(jù)相結(jié)合的客戶分類方法研究[J]. 中國管理科學, 2005, 13(2): 95-100.
[10] Cai Qinglin, Chen Ling, Sun Jianling. Piecewise statistic approximation based similarity measure for time series[J] Knowledge-Based Systems,2015,85:181-195.
[11] 徐梅, 黃超. 基于符號時間序列方法的金融收益分析與預測[J]. 中國管理科學, 2011, 19(5): 1-9.
[12] 李正欣,張鳳鳴,李克武. 多元時間序列模式匹配方法研究[J]. 控制與決策,2011,26(4):565-570.
[13] 吳虎勝, 張鳳鳴, 張超, 等. 多元時間序列的相似性匹配[J]. 應用科學學報, 2013, 31(6): 643-649.
[14] Keogh E J, Pazzani M J. Scaling up dynamic time warping to massive datasets[C]//Proceedings of the Third European Conference on Principles and Practice of Knowledge Discovery in Databases,Prague,Czech Republic,September 15-18,1999.
[15] 毛紅保,張鳳鳴,馮卉. 基于奇異值分解的飛行動作評價方法研究[J].計算機工程與應用,2008,44(32):240-245.
[16] 管河山,姜青山,王聲瑞. 基于點分布特征的多元時間序列模式匹配方法[J]. 軟件學報,2009, 20(1): 67-79.
[17] ten Holt G A, Reinders M J T, Hendriksa E A. Multi-dimensional dynamic time warping for gesture recognition[C]//Proceedings of the 13th Annual Conference of the Advanced School for Computing and Imaging,2007.
[18] Bankó Z, Abonyi J. Mixed dissimilarity measure for piecewise linear approximation based time series applications[J].Expert Systems with Applications,2015,42(21): 7664-7675.
[19] 曹惠玲, 張浩, 王立鑫. QAR譯碼技術(shù)研究與自動譯碼系統(tǒng)的建立[J]. 航空維修與工程, 2016,(5): 74-77.
[20] 劉陶, 李曉白, 郞榮玲, 等. 飛行參數(shù)的分段線性表示及其應用[J]. 微計算機信息, 2010, 26(5-1): 199-201.
[21] Boeing Commercial Airplanes. Statistical summary of commercial jet airplane accidents worldwide operations 1959-2015[R]. Seattle, WA: Boeing Commercial Airplanes, 2015.
PatternRecognitionandRiskAnalysisforFlightOperations
ZHENGLei1,2,CHIHong1,SHAOXue-yan1
(1.Institutes of Science and Development, Chinese Academy of Sciences, Beijing 100190, China;2.University of Chinese Academy of Sciences, Beijing 100049, China)
The analysis of QAR data is important to continuously improving the quality of flight operations. During the flight, the pilot controls the equipment, such as the rod, the plate, the rudder according to the dynamic changes of environmental conditions and the state of the aircraft. It is a process of constant adjustment and coordination, which increases the difficulty of data analysis. So whether pilots have similar operation patterns and what effects these operations hase on the QAR monitoring indexare of great interest to us.
1003-207(2017)10-0109-10
10.16381/j.cnki.issn1003-207x.2017.10.012
V328.1;C931
A
2016-06-30;
2017-03-27
邵雪焱(1978-),女(漢族),山東巨野人,中國科學院科技戰(zhàn)略咨詢研究院助理研究員,研究方向:風險管理、數(shù)據(jù)挖掘;E-mail: xyshao@casipm.ac.cn.
In this paper, by studying the feature extraction method of the multivariate time series data of flight parameters, the definition of similarities of flight operations is analyzed.The piecewise linear fitting based multivariate Dynamic Time Warping distance is employed to depict the similarities of flight operations.The hierarchical clustering analysis is used to recognize the similar patterns of flight operations. And then, the descriptive statistics and the Kolmogorov-Smirnov test is adopted to quantify the relations between flight patterns and the QAR monitoring index. The judgement of risk levels is obtained. Finally, the validity of the model is verified by using the actual QAR data recorded during the landing stage of a specific aircraft.Other classifiers like BP Neural Networks and Support Vector Machine are used to compare with the proposed method.It turns out that the raised method provides an effective way to analyze flight operationsand the relationship between flight patterns and the QAR monitoring index.
In the future studies,focus will be put on the better description of multivariate time series and clustering methods for multivariate time series. The proposed approach could also be applied in the analysis of other vehicle driving, for example the monitoring of car driving. The method advocated couldhelp tofind the recurring patterns of drivers and how they affectsafety.
Keywords: QAR; multivariate time series; operation pattern; risk analysis