靳慧斌,洪 遠,蔡亞敏
(中國民航大學國家空管運行安全技術(shù)重點實驗室,天津 300300)
空中交通管制員在確保空中交通管制安全和效率中扮演重要角色,管制員的工作負荷是影響航空安全和管制效率的重要因素之一[1]。隨著航空業(yè)的快速發(fā)展,空中交通流量不斷增大,空客公司調(diào)查報告[2]顯示,自1970至2030年空中交通流量會以每15年翻一番的速度遞增。管轄區(qū)域內(nèi)的航空器數(shù)量不斷增加,使得管制員的工作強度隨之增加,管制員所肩負的責任和工作壓力亦不斷增長。超負荷工作給航空安全帶來了巨大的安全隱患,由管制員工作負荷過大造成的空中交通不安全事件有不斷增加的趨勢[3-4]。因此,為了確??罩薪煌ò踩行虻剡\行,需要對管制員工作負荷進行科學的分析和評價,以及有效的實時監(jiān)控,合理規(guī)劃空域流量,降低運行風險[5]。
傳統(tǒng)的空中交通管制員工作負荷測量方法主要有三大類:主觀測量法、任務(wù)績效測量法、生理測量法。主觀測量法根據(jù)被試在工作過程中產(chǎn)生的主觀感受與體驗來評價工作負荷,如利用NASA-TLX量表[6]、ATWIT(空中交通負荷輸入技術(shù))評價管制員工作負荷。任務(wù)績效測量法通過測定被試完成指定任務(wù)的績效來判斷該任務(wù)給被試帶來的工作負荷,如Brünken等[7]曾使用次任務(wù)準確率、次任務(wù)反應(yīng)時變化等指標對管制員工作負荷進行雙任務(wù)測量。生理測量法通過測定被試工作過程中出現(xiàn)的生理反應(yīng)來評價被試工作負荷,如Weilang[8]等運用腦電圖技術(shù)實時測量管制員工作負荷。
然而,主觀測量法需要被試在工作過程中或工作結(jié)束后報告自己的狀態(tài),工作過程中報告會對被試工作造成干擾,工作結(jié)束后報告無法實時監(jiān)控被試工作負荷。任務(wù)績效測量法往往是在控制的實驗室環(huán)境中進行的,這影響了其結(jié)果的生態(tài)效度和外推效度[9]。一些學者研究表明,僅依靠測量身體指標無法有效描述管制員工作的復(fù)雜性[10],生理指標很難反映任務(wù)的工作負荷[11]。
現(xiàn)代航空管制系統(tǒng)是一個人機交互系統(tǒng),管制員通過接收雷達數(shù)據(jù)終端提供的信息,實時掌握空中交通動態(tài),并使用語音設(shè)備向飛行員發(fā)布指令或與相鄰扇區(qū)管制員溝通協(xié)調(diào)。在整個管制過程中,視覺觀察和語音通話是管制員使用最頻繁的兩種交互手段,與之相對應(yīng)的兩類交互指標即眼動指標和語音指標能直接反映管制員工作量的大??;同時,這兩類交互指標和生理指標一樣,具有實時性和無干擾性。因此,本文以眼動指標和語音指標為輸入變量,構(gòu)建空中交通管制員工作負荷測量模型,以期能夠?qū)崟r、無干擾性、有效地測量管制員工作負荷。
眼動指標指反映眼睛動態(tài)變化的指標,主要包括注視指標、掃視指標、眨眼指標和瞳孔指標四類[12]。Gomer等[13]研究得出:被試注視次數(shù)和注視時間變化與其工作負荷變化呈正比;Takahashi等[14]設(shè)計三組實驗,各實驗組任務(wù)之間負荷大小迥異,觀測被試執(zhí)行任務(wù)過程中眼動指標變化,數(shù)據(jù)顯示任務(wù)負荷增大時,掃視時間、掃視幅度、掃視頻率等眼動指標亦呈增大趨勢;Bauer等研究發(fā)現(xiàn)被試在處理較復(fù)雜視覺任務(wù)時,會發(fā)生眨眼抑制現(xiàn)象[15],且被試眨眼率和眨眼持續(xù)時間隨著所承擔工作負荷增大而減?。?6-17];瞳孔大小變化是一個重要的眼動指標,它與知覺、記憶、思維活動、語言加工等心理活動緊密相關(guān)[18-19],能有效反映工作負荷變化[20-22]。
語音指標指反映被試一定時間內(nèi)通話情況的指標,通常包括通話次數(shù)、通話時長、通話內(nèi)容,該指標因其有效性及測量的便利性,常被用于測量管制員工作負荷。Manning等[23]研究發(fā)現(xiàn)管制員語音交流次數(shù)、時間與工作負荷顯著相關(guān);Porterfield[24]通過實驗得出管制員4min內(nèi)持續(xù)通話時間與其主觀負荷之間相關(guān)系數(shù)是0.88;裴成功等[25]使用DORATASK 方法對管制員語音通話進行分析,以測量管制員工作負荷。
結(jié)合國內(nèi)外管制員工作負荷研究成果和管制工作特點,本實驗選擇可以反映管制員常態(tài)行為的兩類交互指標作為測量指標,即眼動指標和語音指標。其中所使用眼動指標包括平均注視持續(xù)時間、注視頻率、掃視頻率、平均掃視持續(xù)時間、平均眼跳距離、眨眼頻率、平均眨眼持續(xù)時間和瞳孔直徑大小;語音指標包括通話次數(shù)和平均通話時間。
本次設(shè)計的模擬管制實驗,根據(jù)管制飛機數(shù)量不同(3架、6架、9架)分為三組,被試依次完成三組實驗,實驗任務(wù)是保證管制空域內(nèi)飛機安全有序飛行,每組實驗完成后填寫NASA-TLX 表格。每組實驗持續(xù)15min,被試在執(zhí)行不同實驗任務(wù)之間休息10min。利用眼動儀記錄被試眼動數(shù)據(jù)和語音數(shù)據(jù),并在實驗結(jié)束后對數(shù)據(jù)進行處理。
實驗選取10名在校管制學員作為實驗被試,被試均能熟練進行模擬管制操作,年齡在20 歲至25歲之間,視力正常。
實驗眼動儀采用TobiiX120眼動儀,該眼動儀使用無屏幕式眼動追蹤,裝置允許較大頭動范圍,提供了一個不受任何干擾的環(huán)境,讓被試在自然狀態(tài)下進行實驗。實驗操作平臺使用培訓(xùn)管制學員所用雷達管制模擬機,該設(shè)備是在我國原有雷達管制模擬仿真系統(tǒng)技術(shù)的基礎(chǔ)上,跟蹤國際空管自動化系統(tǒng)技術(shù),開發(fā)出的一套面向新一代的空管自動化應(yīng)用模擬培訓(xùn)系統(tǒng)。兩者結(jié)合使用保證了獲得數(shù)據(jù)的可靠性。
實驗中管制員工作負荷的主觀評分使用NASA-TLX 量表,該量表由美國國家航空航天局研發(fā),由心理需求、體力需求、時間需求、作業(yè)績效、努力程度、挫折水平六個維度組成,目前被廣泛用于評價空中交通管制員主觀負荷。
實驗對每個被試單獨進行,每位被試均執(zhí)行相同實驗程序。實驗前,主試向被試講解實驗研究背景及流程,安排被試閱讀NASA-TLX 量表操作方法,然后讓被試進行眼動儀標定程序;實驗過程中,被試需要依次完成三組不同任務(wù)難度實驗;每組實驗完成后,被試需要填寫NASA-TLX 量表,以對被試該段時間工作負荷大小做出主觀評定。
統(tǒng)計被試執(zhí)行任務(wù)過程中眼動數(shù)據(jù)和語音數(shù)據(jù),并計算完成任務(wù)后所填寫的NASA-TLX 量表值以得出主觀負荷值。最后將各指標數(shù)據(jù)與主觀負荷值大小進行相關(guān)分析,以篩選出與被試工作負荷變化顯著相關(guān)的測量指標。各指標與主觀負荷的相關(guān)系數(shù)以及不同任務(wù)難度下測量指標均值見表1。
表1 各指標與主觀負荷的相關(guān)系數(shù)Table 1 Correlation coefficient between indexes and subjective workload
由表1可知,除平均眼跳距離外,其他9種測量指標均與主觀工作負荷顯著相關(guān),因此可以使用這9種指標對管制員工作負荷進行綜合評價。
工作負荷是一個復(fù)雜多維的概念,綜合多種指標評定工作負荷比使用單一指標測量更為有效,更能全面反映不同維度的工作負荷[26]。但是,使用9種指標構(gòu)建評價模型必然會導(dǎo)致模型異常復(fù)雜,因此本文利用眼動指標之間的共線性,使用因子分析方法建立綜合評價因子以降低評價維度,這樣既保證了評價指標的全面性,又最大限度地降低了評價指標的數(shù)量。
對7 種眼動指標(x1~x7)進行KMO 檢驗和Bartlett球度檢驗,KMO 檢驗結(jié)果為0.814,Bartlett球度檢驗P 值小于0.05,檢驗結(jié)果顯示眼動指標結(jié)構(gòu)效度良好,可以進行因子分析。眼動指標因子分析結(jié)果見表2。
表2 眼動指標因子分析結(jié)果Table 2 Eigenvalue and cumulative contribution rate
以特征值大于1為因子選擇標準,因此選擇主成分1作為因子并將其命名為眼動指標F1,F(xiàn)1包含了全部7 種指標信息,其累計方差貢獻率為81.428%,信息損失量為18.572%。
利用Thomson估計法[27]估計因子得分系數(shù),可得F1的計算公式為
F1=-0.164x1+0.159x2-0.158x3+0.160x4+0.149x5+0.152x6-0.165x7
為了能夠建立管制員工作負荷實時測量模型,以NASA-TLX量表所得主觀工作負荷值為因變量,眼動指標F1、通話次數(shù)x8、平均通話時間x9為自變量,建立回歸模型的建立,回歸模型分析結(jié)果見表3。
由于是多元線性回歸分析,因此宜選擇調(diào)整R2作為擬合優(yōu)度檢驗指標,以更準確地反映回歸方程對樣本數(shù)據(jù)的擬合程度[28]。P 值反映回歸方程的顯著性程度,通常規(guī)定P 值小于0.05 時回歸模型顯著,即回歸模型可以解釋自變量變化。表3中P值大小顯示各回歸模型均顯著,然而模型2的調(diào)整R2最大,能更準確地擬合樣本數(shù)據(jù),因此選擇模型2作為管制員工作負荷測量回歸模型,其表達式如下:
管制員工作負荷值=19.945-7.815×F1+10.445×通話次數(shù)=19.945-7.815×(-0.164×平均注視持續(xù)時間+0.159×注視頻率-0.158×平均掃視持續(xù)時間+0.160×掃視頻率+0.149×平均眨眼持續(xù)時間+0.152×眨眼頻率-0.165×瞳孔直徑大小)+10.445×通話次數(shù)。
表3 管制員工作負荷測量回歸模型分析結(jié)果Table 3 Regression analysis result of ATC workload measurement
確定回歸模型之后需要進行殘差分析,以確定數(shù)據(jù)滿足回歸模型適用條件。模型對應(yīng)Durbin-Watson指數(shù)為1.638,因此可以認為殘差間相互獨立。同時,利用Spss軟件繪制標準化殘差P-P 圖,見圖1。由圖1可以看出:回歸模型殘差服從正態(tài)分布;以標準化殘差為Y 軸,標準化預(yù)測值為X 軸繪制殘差散點圖,結(jié)果顯示殘差方差齊次。通過以上分析,可以確定數(shù)據(jù)滿足獨立性、正態(tài)性、方差齊次的特點,符合回歸模型適用條件。
(1)管制員工作負荷影響著空中交通的安全和效率,視覺觀察和語音通話作為管制員使用最頻繁的兩類交互手段,與管制員工作負荷大小息息相關(guān)。本文將各種交互指標與管制員主觀負荷進行相關(guān)分析,得到9種與管制員工作負荷密切相關(guān)的交互指標,這些指標均可以被實時客觀記錄。
(2)管制員工作負荷是一個復(fù)雜多維的概念,一種交互指標往往只能反映其工作負荷的某一層次,利用多指標評價不但可以在內(nèi)涵上互補綜合評價管制員工作負荷,同時在測量手段上也可以互補。例如瞳孔指標反映眼睛睜開時的狀態(tài),而眨眼指標則反映眼睛閉合的狀態(tài),將兩者結(jié)合起來便可以反映整個眼動過程的狀態(tài)。本文利用指標之間的共線性,對眼動指標進行因子分析并建立綜合評價因子,以在保證信息盡量完整的前提下,極大降低評價指標維度,最后以被廣泛認可的NASA-TLX 量表所得主觀負荷值為因變量,綜合因子和通話次數(shù)為自變量,建立管制員工作負荷測量回歸分析模型,保證了測量模型的有效性。
[1]Chatterji G B,Sridhar B.Measures for air traffic controller workload prediction[C]//Proceedings of the First AIAA Aircraft Technology,Integration,and Operations Forum.Los Angeles:American Institute of Aeronautics & Astronautics,2001:30-41.
[2]Norden C.Airbus Pilot Instructor Course:What's New in the Instructors'Course?[R].Toulouse:Airbus,F(xiàn)light Operations &Training regional seminars,2013.
[3]陳亞青,孫宏.進近管制員工作進程分類及工作負荷研究[J].中國安全科學學報,2006,16(2):65-68.
[4]韓松臣,胡明華,蔣兵,等.扇區(qū)容量與管制員工作負荷的關(guān)系研究[J].空中交通管理,2000,6(1):42-45.
[5]汪磊,孫瑞山.空中交通管制員疲勞狀態(tài)實時監(jiān)測方法的實現(xiàn)[J].安全環(huán)境與工程,2013,20(4):87-91.
[6]Pant R,Taukari A,Sharma K.Cognitive workload of air traffic controllers in area control center of mumbai enroute airspace[J].Journal of Psychosocial Research,2012,7(2):345-355.
[7]Brünken R,Plass J L,Leutner D.Direct measurement of cognitive load in multimedia learning[J].Educational Psychologist,2003,38(1):53-61.
[8]Weiland M,Roberts D,Caywood M,et al.Real-time EEG-based prediction of mental workload in a multitasking environment[C]//20th Annual Meeting of the Cognitive-Neuroscience-Society.San Francisco:MIT PRESS,2013:103-113.
[9]Gwizdka J.Distribution of cognitive load in Web search[J].Journal of the American Society for Information Science and Technology,2010,61(11):2167-2187.
[10]Pawlak W S,Brinton C R,Crouch K,et al.A framework for the evaluation of air traffic control complexity[C]//Proceedings of the AIAA Guidance Navigation and Control Conference.San Diego:AIAA,1996:20-28.
[11]Manning C,Mills S,F(xiàn)ox C,et al.The relationship between air traffic control communication events and measures of controller taskload and workload[J].Air Traffic Control Quarterly,2002,10(2):69-83.
[12]Halverson T,Estepp J,Christensen J,et al.Classifying workload with eye movements in a complex task[C]//Proceedings of the Human Factors and Ergonomics Society Annual Meeting.Beijing:Sage Publications,2012:168-172.
[13]Gomer J,Walker A,Gilles F,et al.Eye-tracking in a dual-task design:Investigating eye-movements,mental workload and performance[C]//Proceedings of the Human Factors and Ergonomics Society Annual Meeting.SAGE Publications,2008:1589-1593.
[14]Takahashi K,Nakayama M,Shimizu Y.The response of eyemovement and pupil size to audio instruction while viewing a moving target[C]//Proceedings of the Eye Tracking Research and Applications Symposium.Boston:Association for Computing Machinery,2000:131-138.
[15]Bauer L O,Strock B D,Goldstein R,et al.Auditory discrimination and the eye blink[J].Psychophysiology,1985,22(1):629-635.
[16]Petkar H,Dande S,Yadav R,et al.A pilot study to assess designer’s mental stress using eye gaze system and electroencephalogram[C]//ASME 2009 International Design Engineering Technical Conferences and Computers and Information in Engineering Conference.Palm Beach Gardens:American Society of Mechanical Engineers,2009:899-909.
[17]Zheng B,Jiang X,Tien G,et al.Workload assessment of surgeons:Correlation between NASA TLX and blinks[J].Surgical Endoscopy,2012,26(10):2746-2750.
[18]閆國利,白學軍.眼動研究心理學導(dǎo)論:揭開心靈之窗奧秘的神奇科學[M].北京:科學出版社,2012.
[19]Müller A,Petru R,Seitz L,et al.The relation of cognitive load and pupillary unrest[J].International Archives of Occupational and Environmental Health,2011,84(5):561-567.
[20]He X,Wang L,Gao X,et al.The eye activity measurement of mental workload based on basic flight task[C]//IEEE10th International Conference on Industrial Informatics.Piscataway:IEEE Press,2012:502-507.
[21]de Greef T,Lafeber H,van Oostendorp H,et al.Eye movement as indicators of mental workload to trigger adaptive automation[C]//5th International Conference on Foundations of Augmented Cognition.Heidelberg:Springer Berlin,2009:219-228.
[22]Ishii M,Minochi A,Yamanaka K,et al.Evaluation of mental workload based on pursuit eye movement[C]//2013 International Conference on Biometrics and Kansei Engineering.Washington:IEEE Computer Society,2013:121-124.
[23]Manning C A,Mills S H,F(xiàn)ox C M,et al.Using Air Traffic Control Taskload Measures and Communication Events to Predict Subjective Workload[R].Oklahoma City,USA:Civil Aeromedical,2002.
[24]Porterfield D H.Evaluating controller communication time as a measure of workload[J].The International Journal of Aviation Psychology,1997,7(2):171-182.
[25]裴成功,韓松臣,劉星.管制員工作負荷評估的回歸分析法[J].南京航空航天大學學報,2007,39(1):107-112.
[26]柳忠起,袁修干,劉偉,等.基于模擬飛行任務(wù)下的眼動指標分析[J].中國安全科學學報,2006,16(2):47-51.
[27]宋健.基于AHP和因子分析的地區(qū)信用環(huán)境指標體系構(gòu)建的實證研究[J].中國軟科學,2006,6(1):111-119.
[28]薛薇.統(tǒng)計分析與SPSS的應(yīng)用[M].北京:中國人民大學出版社,2011.