邢志偉,李正鋒,羅 謙+,夏 歡,張 濤
(1.中國民航大學(xué) 電子信息與自動化學(xué)院,天津 300300;2.中國民用航空局第二研究所 工程技術(shù)研究中心,四川 成都 610041)
航班地面保障(flight ground service,F(xiàn)GS)是民航機(jī)場航班進(jìn)離港之間的重要組成部分。多年來,由FGS造成的航班延誤一直難以解決。效率低下的FGS事件可能對機(jī)場運(yùn)營造成嚴(yán)重?fù)p害。2019年中國民航發(fā)展公報(bào)[1]與歐洲航空延誤報(bào)告[2]中表明由航班地面保障所引起的航班離港延誤達(dá)18%,平均延誤同比僅減少了0.14(3.55→3.41)分鐘。因此,對影響FGS事件執(zhí)行效率變化的關(guān)聯(lián)因素進(jìn)行因果發(fā)現(xiàn),確定具有因果關(guān)系的因素將有助于減少低效率事件的發(fā)生,維持機(jī)場空側(cè)區(qū)的正常運(yùn)行。
因果發(fā)現(xiàn)是為了回答“通過修改哪些變量的值可以改變另一個(gè)變量的值?”。事物之間的關(guān)聯(lián)關(guān)系不意味著具有因果關(guān)系[3],關(guān)聯(lián)關(guān)系表示事物發(fā)生概率變化之間的關(guān)系,僅使用關(guān)聯(lián)性分析如簡單的業(yè)務(wù)邏輯分析無法準(zhǔn)確描述事物變化的機(jī)理。
為了解決FGS影響因素的因果發(fā)現(xiàn)問題,本文首先分析了以往的研究,給出了關(guān)聯(lián)與因果的統(tǒng)一定義以及量化各影響因素的時(shí)間參考量。隨后提出了一種基于增剪邊規(guī)則的強(qiáng)化因果發(fā)現(xiàn)算法(reinforcement causal discovery,RCD)以分析和識別FGS事件影響因素的因果關(guān)系,該算法以經(jīng)獨(dú)立性檢驗(yàn)后的元因果矩陣與滿因果矩陣為輸入,以增剪邊規(guī)則為行為,由評分函數(shù)計(jì)算每次增剪邊后的獎勵分?jǐn)?shù),經(jīng)過多次迭代得到代表因果邊存在的參數(shù)θ,最終給出FGS影響因素的最優(yōu)因果圖,整體流程如圖1所示。
圖1 變更因果有向邊的因果發(fā)現(xiàn)
目前FGS的研究主要集中在過程模擬、設(shè)施優(yōu)化和特種車輛的運(yùn)行效率方面。文獻(xiàn)[4]提出了基于博弈樹理論的航班地面保障過程動態(tài)控制方法,減少了航班的平均調(diào)度時(shí)間,但選擇的保障事件較少,實(shí)驗(yàn)廣泛度不足。文獻(xiàn)[5,6]都是針對保障流程的研究,采用AOE網(wǎng)和“關(guān)鍵路徑”法,得出保障事件與航班延誤之間的關(guān)聯(lián)關(guān)系,并對保障工作給出建議。
在國外的研究中Jin等[7]提出了一種基于理論FGS過程模型的使用離散事件模擬來恢復(fù)和模擬現(xiàn)實(shí)的方法,用于研究設(shè)備數(shù)量,以發(fā)展其操作能力。它以飛機(jī)(數(shù)量、類型、起飛時(shí)間等)、地面車輛(數(shù)量、位置等)和機(jī)場(登機(jī)口等)為輸入,以準(zhǔn)時(shí)航班數(shù)為輸出,克服了地面車輛設(shè)備工作過程的低效性。文獻(xiàn)[8]提出了一種獲得最佳車輛設(shè)備數(shù)量并最大限度縮短機(jī)場周轉(zhuǎn)時(shí)間的方法,其仿真、參數(shù)分析和優(yōu)化算法改善了機(jī)場運(yùn)營周轉(zhuǎn)時(shí)間。Mota等[9]為萊利斯塔德機(jī)場航班保障操作開發(fā)了詳細(xì)的離散事件模擬(DES)模型,更側(cè)重于單個(gè)服務(wù)過程。但國內(nèi)關(guān)于航班保障與航班延誤離港間的關(guān)系及其背后的因果機(jī)理卻鮮有研究。
因果關(guān)系在解釋、預(yù)測、決策和控制中起著至關(guān)重要的作用[10,11]。發(fā)現(xiàn)因果關(guān)系被認(rèn)為是表征人類智能水平的一個(gè)重要元素,還可作為人工智能的基礎(chǔ)[12],發(fā)現(xiàn)因果關(guān)系也被簡稱為因果發(fā)現(xiàn),由因果關(guān)系組成的有向無環(huán)圖稱為因果圖[13,14]。
因果發(fā)現(xiàn)有3類算法:基于約束(CB)、基于分?jǐn)?shù)(SB)和基于功能因果模型(FCMs)[15]。前兩種方法依靠統(tǒng)計(jì)測試找到候選因果圖,第三種方法通過估計(jì)結(jié)構(gòu)方程中的系數(shù)來學(xué)習(xí)因果關(guān)系。在最近的研究中,文獻(xiàn)[16]提出了一種基于約束的異構(gòu)/非平穩(wěn)數(shù)據(jù)因果發(fā)現(xiàn)框架,用于找到因果骨架并估計(jì)機(jī)制變化的性質(zhì)。文獻(xiàn)[17]首次將強(qiáng)化學(xué)習(xí)和因果發(fā)現(xiàn)結(jié)合起來,將因果圖搜索問題轉(zhuǎn)化為追求局部獎勵最大化問題。
然而為何使用注意機(jī)制(Transformer)[17]即可獲得因果關(guān)系并未得到解答。同時(shí)現(xiàn)有的方法也無法確定因果圖搜索的方向。為了在將因果發(fā)現(xiàn)與強(qiáng)化學(xué)習(xí)結(jié)合的同時(shí)使因果發(fā)現(xiàn)更具解釋性,以及避免局部最優(yōu)確定因果圖的搜索方向。本文使用改進(jìn)的貝葉斯信息準(zhǔn)則(BIC)評分函數(shù)提高因果關(guān)系的可解釋性;并提出基于增剪邊規(guī)則的強(qiáng)化因果發(fā)現(xiàn)方法,融合強(qiáng)化學(xué)習(xí)理念,在增邊和剪邊方向上同時(shí)搜索和比較,以確定因果圖的搜索方向。
學(xué)習(xí)數(shù)據(jù)的因果關(guān)系需要了解統(tǒng)計(jì)相關(guān)性和因果關(guān)系之間的差異?!瓣P(guān)聯(lián)不意味著因果”這句話廣為流傳,然而什么是關(guān)聯(lián),什么是因果,自古以來便困擾著無數(shù)學(xué)者。本文依據(jù)貝葉斯網(wǎng)絡(luò)之父Judea. Pearl所提出的因果推理理論詳細(xì)論述因果科學(xué)下的關(guān)聯(lián)與因果。“關(guān)聯(lián)”是科學(xué)和統(tǒng)計(jì)學(xué)中經(jīng)常要強(qiáng)調(diào)和注意的概念。它指的是兩個(gè)事物之間的聯(lián)系關(guān)系,聯(lián)系程度用相關(guān)系數(shù)來表示,相關(guān)系數(shù)的范圍是-1~1,相關(guān)系數(shù)絕對數(shù)越大,說明兩個(gè)事物聯(lián)系越緊密。相關(guān)系數(shù)再大,也不能說明因果關(guān)系,只能說明可能存在因果。在關(guān)聯(lián)關(guān)系當(dāng)中,其中一個(gè)事物可能是因,也可能是果,比如《新英格蘭醫(yī)學(xué)雜志》中一項(xiàng)調(diào)查顯示吃巧克力越多的國家獲諾獎則越多,而真正的原因則是該國學(xué)術(shù)的發(fā)達(dá)、收入水平高所帶來的巧克力消費(fèi)量大,即它只是真正原因表面眾多有關(guān)現(xiàn)象的一種,從而計(jì)算兩個(gè)變量間的相關(guān)系數(shù)并不能解釋兩者發(fā)生關(guān)聯(lián)的原因,只能評估關(guān)聯(lián)的強(qiáng)度。
狹義上講,因果關(guān)系指一個(gè)事件導(dǎo)致了另外一個(gè)事件,比如我劃動火柴,火柴被點(diǎn)燃,我的劃動是原因,而火柴的燃燒是結(jié)果。在廣義上,因果關(guān)系是描述原因與結(jié)果之間的一種關(guān)系,比如有很多原因可以引發(fā)肺癌,吸煙僅是其多種原因之一。事實(shí)上,相關(guān)性是對稱的,而因果關(guān)系是不對稱的。如果A是B的原因,那么B是A的結(jié)果,但是絕不會有“事件A是事件B的原因,事件A也是事件B的結(jié)果”這一類表示。
圖2給出了因果性和關(guān)聯(lián)性之間的可視化表示。關(guān)聯(lián)性表明,當(dāng)現(xiàn)象A發(fā)生變化時(shí),現(xiàn)象B也發(fā)生變化,反之亦然。另一方面,因果性表明,原因A作用于結(jié)果B,而B不能作用于A。定義1和定義2中用數(shù)學(xué)術(shù)語描述了這兩種關(guān)系。
圖2 關(guān)聯(lián)與因果
定義1 關(guān)聯(lián)性:給定一組變量集Data={a1,b2,c3,…,xr}, 其中每個(gè)子變量a1,b2,c3,…,xr,r=1,2,3,…都不同。當(dāng)關(guān)注一個(gè)變量(例如a1)和其它變量之間的關(guān)聯(lián)性時(shí),分析其中每個(gè)變量a1,b2,c3,…的變化方向(趨勢)。如果它們具有相同的變化趨勢,則它們是正關(guān)聯(lián);如果不是,它們則是負(fù)關(guān)聯(lián)的。
定義2 因果性:如果變量Y可以隨變量X的變化而變化,或X出現(xiàn)在以Y為因變量的函數(shù)f中,則稱變量X是變量Y變化的原因。給定一組變量Data={a1,b2,c3,…,xc}, 其中每個(gè)變量a1,b2,c3,…,xc,c=1,2,3,…都不相同。在以目標(biāo)變量y,y∈Data為因變量的分析中,如果將一些變量 {xc}c=1,2,…更改為自變量,發(fā)現(xiàn)目標(biāo)變量發(fā)生了變化,而改變其余變量 {xr}r=1,2,…并沒有引起目標(biāo)變量的變化;而后,將自變量與因變量交換,并重復(fù)上述過程,如果改變自變量未能引起因變量的改變,則表明變量集 {xc}c=1,2,…與y之間存在因果關(guān)系,并且 {xc}c=1,2,…是導(dǎo)致y的原因。
航班地面保障是機(jī)場運(yùn)營的基本部分,描述了飛機(jī)飛行準(zhǔn)備的所有過程[18]。一般來說,保障時(shí)間或保障效率取決于飛機(jī)類型、保障人員的效率、車輛的準(zhǔn)時(shí)性、乘客上下機(jī)、貨物裝卸以及航司的策略。FGS子過程遵循嚴(yán)格的時(shí)間順序,并具有時(shí)間相關(guān)性。然而,某些事件可以同時(shí)執(zhí)行,而其它事件只能按順序執(zhí)行。圖3說明了FGS中關(guān)鍵的空側(cè)區(qū)保障事件,通常分為翼上和翼下的保障事件。
圖3 航班地面保障過程關(guān)鍵事件
“翼上”事件:進(jìn)離港旅客的登機(jī)和下機(jī)、餐飲的供應(yīng)、客艙清潔、必要的安全和安保檢查、客梯車對接、廊橋?qū)拥取?/p>
“翼下”事件,即貨物的卸載和裝載以及其它坡道活動如加油、行李/貨物處理、廢物清理、飲用水補(bǔ)充等。
“翼上”和“翼下”事件之間存在不同的執(zhí)行邏輯關(guān)系。這些邏輯關(guān)系的強(qiáng)度是影響FGS事件效率的不同因素。本文參考國際航空運(yùn)輸協(xié)會發(fā)布的《IATA機(jī)場操作手冊》和中國民航局發(fā)布的《飛行安全運(yùn)行服務(wù)標(biāo)準(zhǔn)》等文件,給出了航班保障中4個(gè)FGS事件的影響因素,分別見表1~表4。本文使用分層的方法對影響航班地面保障事件關(guān)聯(lián)因素間的因果關(guān)系展開研究,以圖3中的關(guān)鍵事件作為目標(biāo)層目標(biāo)事件,其對應(yīng)的可能影響因素為影響層,量化和計(jì)算影響因素之間關(guān)系的時(shí)間參考量為參考層。
表1 開客艙門事件影響因素
表2 客艙清潔事件影響因素
表3 關(guān)客艙門事件影響因素
表4 行李卸載和裝載事件影響因素
因果圖是一個(gè)有向無環(huán)圖(directed acyclic graph),用于可視化可能的因果關(guān)系。它通常由許多父子節(jié)點(diǎn)和有向線邊緣組成。節(jié)點(diǎn)通常表示事件和因素;有向邊的方向表示由原因指向結(jié)果的方向。
圖鄰接矩陣是描述因果圖的數(shù)學(xué)語言。圖鄰接矩陣的行和列由FGS各種影響因素組成,每個(gè)元素的值為0或1。圖4顯示了因果圖和相應(yīng)的鄰接矩陣。
圖4 一種因果圖與其圖鄰接矩陣
例如,n階矩陣Mn×n。 當(dāng)元素 (i,j)=1時(shí),這意味著行i中表示的因素對列j中表示的因素具有因果關(guān)系,并且它們之間存在因果關(guān)系的有向邊。當(dāng)元素 (i,j)=0時(shí),表示行i和列j表示的因素之間沒有因果關(guān)系。
強(qiáng)化學(xué)習(xí)是一種學(xué)習(xí)如何從自身狀態(tài)映射到行為以使得獲取的獎勵最大的學(xué)習(xí)機(jī)制。其基本要素包括策略、獎勵、行為和智能體。其中智能體是一種可以執(zhí)行策略達(dá)成目標(biāo)的實(shí)體,在本文中指強(qiáng)化因果發(fā)現(xiàn)程序;策略定義了智能體對于給定狀態(tài)所做出的行為,強(qiáng)化因果發(fā)現(xiàn)中的策略為增剪邊規(guī)則;獎勵則代表了智能體的目標(biāo)——使因果圖分?jǐn)?shù)最大。
本算法依賴于以下兩種假設(shè):
假設(shè)1:求解目標(biāo)為最大化評分函數(shù)計(jì)算的獎勵。
假設(shè)2:智能體的數(shù)據(jù)環(huán)境為FGS的影響因素。所有可見的影響因素都在第2.2節(jié)中,且沒有未觀察到的潛在變量。
找到真實(shí)的因果關(guān)系不是一蹴而就的,因此,本文引入了強(qiáng)化學(xué)習(xí)特有的連續(xù)試錯的理念。將強(qiáng)化學(xué)習(xí)中的獎勵描述為每個(gè)可能的因果圖得分,數(shù)據(jù)環(huán)境是FGS事件數(shù)據(jù)集,智能體是算法的主體,其采取的行為是增剪邊過程。強(qiáng)化因果發(fā)現(xiàn)算法流程如圖5所示。
圖5 強(qiáng)化因果發(fā)現(xiàn)過程
首先,通過先驗(yàn)知識和條件獨(dú)立性測試添加現(xiàn)有的表示因果關(guān)系的有向邊。此時(shí),因果圖被稱為元因果圖,通過添加可能的因果關(guān)系有向邊得到的因果圖被稱作滿因果圖。其對應(yīng)的圖鄰接矩陣稱為元鄰接矩陣和滿鄰接矩陣。
其次,將上述兩個(gè)因果圖對應(yīng)的鄰接矩陣作為輸入,開始搜索。將可能的因果關(guān)系有向邊添加到元因果圖中,同時(shí)在滿因果圖中剪掉有向邊。之后使用基于信息論的評分函數(shù)對一系列可能的因果圖進(jìn)行評分,并比較兩種變化路徑下的分?jǐn)?shù)。
評分函數(shù)如式(1)所示
(1)
(2)
NClinear(same): 數(shù)據(jù)集中相同航班案例影響因素參考量之間線性變化的案例數(shù)。
NCcase:數(shù)據(jù)集中所有航班案例的數(shù)量
(3)
在因果圖搜索的過程中分?jǐn)?shù)相對較大的路線PA將暫停增邊,另一條路線PB將單獨(dú)變更。相反,當(dāng)PB路線計(jì)算出更大的分?jǐn)?shù)時(shí),PB路線暫停PA路線繼續(xù)搜索。這為因果圖的搜索指明了方向,不再依賴于隨機(jī)性。由于評分函數(shù)的一一映射,兩種路徑方法最終收斂到一個(gè)具有相同評分和相同結(jié)構(gòu)的因果圖。此時(shí)有
S(MPA,增邊)=S(MPB,剪邊)
(4)
這一過程是使用圖鄰接矩陣來實(shí)現(xiàn)的,將圖鄰接陣轉(zhuǎn)換為因果圖作為輸出。上述RCD過程的相關(guān)算法見表5。
表5 強(qiáng)化因果發(fā)現(xiàn)算法偽代碼
此次實(shí)驗(yàn)給出了2018年7月至2018年8月中國某民用機(jī)場的FGS數(shù)據(jù)集示例。此外給出了實(shí)驗(yàn)部分的第三個(gè)假設(shè)。最后使用因果圖表示了上述篩選的3個(gè)保障事件的影響因素間的因果關(guān)系,并與注意力機(jī)制的因果發(fā)現(xiàn)方法所得到的因果圖對比。實(shí)驗(yàn)中使用的數(shù)據(jù)見表6。
表6 部分實(shí)驗(yàn)數(shù)據(jù)
其中第一列表示航班案例數(shù),第二列和第三列是第2節(jié)中提到的時(shí)間差參考量。
為了更好地將FGS過程與因果理論結(jié)合起來分析影響因素參考量節(jié)點(diǎn)之間的因果關(guān)系,本節(jié)給出假設(shè)三:見表1~表4,任何已知事件節(jié)點(diǎn)組對目標(biāo)節(jié)點(diǎn)都有一定程度的因果關(guān)系,其由先驗(yàn)或?qū)<抑R獲得。各影響因素節(jié)點(diǎn)之間的關(guān)系未知,由RCD算法求解。
圖6表示判斷因果關(guān)系方向和計(jì)算表1中事件p(G|D) 的可視化圖。分別將時(shí)間參考量a1和b1作為原因和結(jié)果,然后更改因果順序以進(jìn)行對稱分析。黑色實(shí)線表示Y軸變量與X軸變量的變化趨勢,虛線表示黑色實(shí)線的移動平均曲線。從圖中可以看出,當(dāng)a1是原因而b1是結(jié)果時(shí),a1在 (-18,-12)∪(10,18) 的區(qū)間內(nèi)具有顯著的線性性質(zhì)。相反,對稱分析圖中沒有類似的性質(zhì)。
圖6 計(jì)算懲罰因子的可視化
圖7 開客艙門事件影響因素參考量間趨勢
圖8 通過兩種算法獲得的表1~表4中事件的最佳因果
以圖8(a)中的第一個(gè)因果圖為例,在開客艙門事件中,地服人員到位(B1)對廊橋?qū)訙?zhǔn)時(shí)性(A1)有因果影響。當(dāng)A1的準(zhǔn)點(diǎn)率較低時(shí),也會影響廊橋/客梯車對接的準(zhǔn)時(shí)性。廊橋?qū)邮欠癜磿r(shí)開始影響廊橋?qū)舆^程的效率。然而,B1和C1之間沒有直接的因果關(guān)系,這是因?yàn)锳1的作用使它們之間產(chǎn)生了相關(guān)性。因此,我們可以通過調(diào)節(jié)事件B1來改善事件A1。對于第四項(xiàng)保障事件因果關(guān)系為B4-D4,C4-D4,A4-C4。其中D4是工作總效率,是受人員單位準(zhǔn)時(shí)性影響的。從A4-C4之間的因果關(guān)系是意料之外的,推測是由于當(dāng)前機(jī)場車輛資源的有限,行李設(shè)備車的指派需要在貨艙門確定開啟的條件下進(jìn)行,從而產(chǎn)生了這一人為規(guī)定導(dǎo)致的因果關(guān)系。而當(dāng)機(jī)場在不繁忙時(shí)間段資源充足的情況下需及時(shí)調(diào)整規(guī)定,提高行李設(shè)備車的抵達(dá)效率,以優(yōu)化航班地面保障過程。
再來看圖8(b)中對應(yīng)的因果圖,注意力機(jī)制算法給出了錯誤的方向關(guān)系A(chǔ)1-B1,C2-B2,D4-B4。由于A1在時(shí)間上落后于B1,C2明顯出現(xiàn)在B2之后,所以因果關(guān)系方向不可能從A1到B1和C2到B2;對于D4與B4而言,裝卸效率并不會反向作用于人員的準(zhǔn)時(shí)性。另外沒有發(fā)現(xiàn)A4與C4間存在的人為因果關(guān)系,這也證實(shí)了使用注意力機(jī)制發(fā)現(xiàn)的因果關(guān)系是有缺陷的,因?yàn)樽⒁饬C(jī)制實(shí)際上是局部選擇的最優(yōu)化,且在文獻(xiàn)[17]中作者也未給出使用注意力機(jī)制的理由。而本文提出的方法在結(jié)果上更加合理,更能解釋其中的因果關(guān)系。
應(yīng)用因果關(guān)系理論分析FGS影響因素之間的關(guān)系在民航領(lǐng)域尚屬首次。為了評估驗(yàn)證方法的優(yōu)越性和指標(biāo),比較了PC和RCD兩種算法的錯誤發(fā)現(xiàn)率(FDR)、真陽性率(TPR)和結(jié)構(gòu)漢明距離(SHD)。并針對樣本量(航班數(shù))分別為1000、5000和10 000的FGS數(shù)據(jù)調(diào)用了兩種算法。其對應(yīng)的計(jì)算指標(biāo)見表7。
表7 兩類算法指標(biāo)對比
本研究提出了一種新的方法來尋找航班地面保障影響因素之間的因果關(guān)系。為了提高因果圖的準(zhǔn)確性,該方法使用帶有懲罰因子的評分函數(shù)來評價(jià)生成的因果圖。其優(yōu)點(diǎn)是結(jié)合了強(qiáng)化學(xué)習(xí)來最大化獎勵以及增剪邊方法用于指定因果圖的搜索方向。
在航班保障領(lǐng)域首次將因果發(fā)現(xiàn)和強(qiáng)化學(xué)習(xí)相結(jié)合。與以往的研究相比,本研究方法在因果水平上確定了事件執(zhí)行效率的變化機(jī)制。當(dāng)要改變某一保障事件執(zhí)行效率時(shí),可以更明確地指定需要調(diào)整的資源和因素,以避免非因果目標(biāo)的無效調(diào)整可能造成人力物力的浪費(fèi)。未來的工作將進(jìn)一步擴(kuò)展實(shí)驗(yàn)數(shù)據(jù),并確定剩余事件的因果圖。此外,將逐步放寬假設(shè),并分析各種事件的不同影響因素之間的因果關(guān)系。