袁 晶,謝克斌
(1.上海民航職業(yè)技術(shù)學(xué)院,上海200232;2.九洲空管科技有限責(zé)任公司,四川 綿陽(yáng)621000)
基于案例搜索的飛機(jī)事故數(shù)據(jù)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)
袁晶1,謝克斌2
(1.上海民航職業(yè)技術(shù)學(xué)院,上海200232;2.九洲空管科技有限責(zé)任公司,四川 綿陽(yáng)621000)
為便于分析及總結(jié)航空事故原因,通過(guò)整理國(guó)內(nèi)外的航空事故案例,進(jìn)行信息和數(shù)據(jù)分析,以事故成因主次等因素為依托,建立一個(gè)分層結(jié)構(gòu)的飛機(jī)事故案例數(shù)據(jù)庫(kù)。同時(shí),建立數(shù)據(jù)庫(kù)的搜索查詢機(jī)制,在該數(shù)據(jù)庫(kù)中可實(shí)現(xiàn)飛行事故的關(guān)鍵詞檢索和相似度匹配,進(jìn)而查詢相關(guān)航空事故進(jìn)行案例。并且,此數(shù)據(jù)庫(kù)可更新,新的飛機(jī)事故信息和數(shù)據(jù)可以隨時(shí)加入。最后將該數(shù)據(jù)庫(kù)應(yīng)用到《人為因素與航空法規(guī)》等課程的教學(xué)中,網(wǎng)頁(yè)版查詢航空數(shù)據(jù)庫(kù)簡(jiǎn)單易操作。
航空事故;人為因素;分層結(jié)構(gòu);模糊匹配;數(shù)據(jù)庫(kù)
對(duì)于民航業(yè)來(lái)講,安全可以說(shuō)是永恒的主題,飛機(jī)事故發(fā)生的概率很低,但因其特殊性,只要出現(xiàn)事故,全世界對(duì)其關(guān)注度都非常高。2014年3月8日馬航MH370失聯(lián)更是讓航空安全得到前所未有的關(guān)注度。民航事故會(huì)造成生命、經(jīng)濟(jì)以及生活等各個(gè)方面的重大損失,怎樣去盡量降低事故發(fā)生是民航人一直努力的方向。而對(duì)過(guò)往發(fā)生的大量具備特征性的事故進(jìn)行總結(jié)分析,歸類事故發(fā)生原因,增加飛行駕駛員和機(jī)務(wù)維修人員的培訓(xùn),在錯(cuò)誤中學(xué)習(xí)。
對(duì)航空事故原因分析及相關(guān)統(tǒng)計(jì)的文獻(xiàn)很多,大部分都是針對(duì)事故原因統(tǒng)計(jì)總結(jié)事故癥候,或是進(jìn)行結(jié)論性的事故原因概率說(shuō)明。例如文獻(xiàn)[1]對(duì)民航事故進(jìn)行了模型分析,并未進(jìn)行相應(yīng)數(shù)據(jù)庫(kù)的建立。而中國(guó)民航大學(xué)民航安全科學(xué)研究所開(kāi)發(fā)的人為因素?cái)?shù)據(jù)庫(kù)[2],僅僅是對(duì)全球所有航空安全事故的羅列,只能依次點(diǎn)開(kāi)查閱,而非對(duì)事故人為因素原因的歸類分析。但對(duì)于民航機(jī)務(wù)或是學(xué)習(xí)民航專業(yè)的學(xué)生來(lái)說(shuō),在培訓(xùn)“人為因素對(duì)安全的影響”時(shí),很多時(shí)候需要進(jìn)行實(shí)例直觀的講解。這就需要定位原因,搜索到具體相應(yīng)示例進(jìn)行講解。
基于此,本文將“人為因素”引起的航空事故進(jìn)行總結(jié)歸類,運(yùn)用事件分析模型分析整理出事故原因,建立分層結(jié)構(gòu)的查詢飛機(jī)事故數(shù)據(jù)庫(kù)。運(yùn)用關(guān)鍵詞查詢,可迅速定位查閱該事故的原因、經(jīng)過(guò)及總結(jié)分析等。同時(shí),在關(guān)鍵詞檢索中運(yùn)用模糊搜索機(jī)制,從而達(dá)到更好的模糊匹配。
國(guó)際航空運(yùn)輸協(xié)會(huì)(IATA)的統(tǒng)計(jì)資料顯示,現(xiàn)階段飛行事故的80%都與人的不安全行為有關(guān)。
基于這一情況,國(guó)際民航組織(ICAO)專門設(shè)立了“航空人為因素與航空法規(guī)”為一項(xiàng)專門的研究?jī)?nèi)容。范圍廣闊,包括:人的身體特征、心理狀態(tài)、環(huán)境因素;感官知覺(jué)、運(yùn)動(dòng)特點(diǎn)、作業(yè)姿態(tài);操縱和顯示設(shè)計(jì)、人機(jī)系統(tǒng)控制;人際交往、團(tuán)隊(duì)合作、組織管理等等[3]。
這里對(duì)所有航空事故進(jìn)行總結(jié)分析,抽離出所有不安全因素影響,總結(jié)歸類,建立航空事故模型。
運(yùn)用基元事件分析方法對(duì)各事故影響因子進(jìn)行編排[4],對(duì)事故進(jìn)行分層管理。模型事故因子分為人體機(jī)能、社會(huì)心理、物理環(huán)境和違規(guī)操作四個(gè)層次,如圖1所示。
圖1 航空事故模型
其中,對(duì)于事故涉及到的四大部分再次進(jìn)行各種情況的細(xì)分。
(1)人體機(jī)能
包含人的生理所有相關(guān)狀態(tài),這里將人身體是否健康(有無(wú)生病、亞健康狀態(tài)等)、睡眠質(zhì)量好壞、眼睛、耳朵等感覺(jué)器官是否在最佳狀態(tài)、人腦記憶強(qiáng)度、神經(jīng)系統(tǒng)分析問(wèn)題的能力等都?xì)w類于此分層系統(tǒng)中。
(2)社會(huì)心理
主要包含人在所處社會(huì)環(huán)境中的心理狀態(tài),包括工作、學(xué)習(xí)及生活等方面。在工作過(guò)程中涉及到的內(nèi)容是影響心理波動(dòng)的一個(gè)主要成因,其中包含工作量帶來(lái)的負(fù)荷、壓力或者焦慮;工作過(guò)程中的組員合作、溝通引起的各類問(wèn)題;所在公司的人文關(guān)懷、企業(yè)文化、企業(yè)管理和監(jiān)督的規(guī)章等等。生活方面的心理影響主要是家庭組成或者家庭成員的特殊情況(如疾病等)引起的某些時(shí)間段內(nèi)的壓力感。
(3)物理環(huán)境
物理環(huán)境對(duì)飛機(jī)維修工作的影響是不容忽視的。例如維護(hù)所處的季節(jié),在炎熱的夏天和寒冷的冬天都會(huì)使事故率增加。還有維護(hù)工作中的大噪音和振動(dòng)(發(fā)動(dòng)機(jī)工作或鈑金作業(yè)時(shí))都會(huì)影響維護(hù)工作的完整性和精神集中度。
(4)違規(guī)操作
飛機(jī)維護(hù)工作中存在很多重復(fù)性工作和目視檢查等內(nèi)容,在完成這部分工作時(shí),機(jī)務(wù)工作者容易產(chǎn)生倦怠情緒,主觀認(rèn)為此類工作簡(jiǎn)單,且發(fā)生事故的可能性一般非常低,工作的期待值不高,在這一過(guò)程中,很容易造成漏檢、忽略等違規(guī)行為。
基于以上的分類可涵蓋所有的事故可能形成原因,對(duì)所有事件歸類,邏輯存儲(chǔ),然后進(jìn)行數(shù)據(jù)庫(kù)的物理設(shè)計(jì),依據(jù)事故分層原因完成數(shù)據(jù)庫(kù)的邏輯編排,完成數(shù)據(jù)庫(kù)文件的物理存儲(chǔ)結(jié)構(gòu)、各種存取路徑、存儲(chǔ)空間的分配、記錄的存儲(chǔ)格式等[5]。在這部分中,需要關(guān)注的是搜索功能的完成及相關(guān)的限制條件。
提取航空事故案例,通過(guò)輸入關(guān)鍵詞搜索完成。由于關(guān)鍵詞表達(dá)的形式存在差異,對(duì)此,本數(shù)據(jù)庫(kù)中采用基于釋義的模糊匹配關(guān)鍵詞搜索機(jī)制。通過(guò)計(jì)算輸入的關(guān)鍵詞與設(shè)定的關(guān)鍵詞之間的匹配系數(shù),得到語(yǔ)句間的相關(guān)度,系統(tǒng)通過(guò)對(duì)語(yǔ)句相關(guān)度的比較從而確定是否為相同查詢,進(jìn)而判斷是否響應(yīng)搜索。
2.1知網(wǎng)和義原的說(shuō)明
知網(wǎng)是發(fā)布出來(lái)的一個(gè)知識(shí)資源,以漢語(yǔ)和英語(yǔ)的詞語(yǔ)所代表的概念為資源描述對(duì)象。系統(tǒng)中知識(shí)單元內(nèi)容以網(wǎng)狀結(jié)構(gòu)分布,可通過(guò)計(jì)算機(jī)處理。其中義原是最基本的、不易于再分割的意義的最小單位,描述了概念與概念之間以及概念具備的所有特性之間的關(guān)系,這些關(guān)系都隱含在知網(wǎng)的知識(shí)詞典和義原的特征文件中[6]。
義原之間的聯(lián)系及相關(guān)關(guān)系是通過(guò)義原分類樹(shù)的形式體現(xiàn)的,這是進(jìn)行語(yǔ)義相似度計(jì)算的基礎(chǔ)。在知網(wǎng)中,包含一些特征文件,通過(guò)它們來(lái)描述義原(primitive)之間的關(guān)系。各個(gè)義原之間的關(guān)系一般比較復(fù)雜,常見(jiàn)的關(guān)系描述有上下位關(guān)系、所屬關(guān)系、同級(jí)關(guān)系、同義關(guān)系、反義關(guān)系等等。
大部分義原之間的表達(dá)并非運(yùn)用某一種單一的關(guān)系描述就能完成的,通常會(huì)存在重復(fù)和交叉情況,為了描述方便,將研究過(guò)程簡(jiǎn)單化。此處,將關(guān)系描述中最重要的上下位關(guān)系作為基礎(chǔ),以樹(shù)狀結(jié)構(gòu)的義原層次來(lái)說(shuō)明語(yǔ)義間的關(guān)系,如圖2所示?;诖耍M(jìn)行關(guān)鍵詞匹配系數(shù)和釋義相似度的計(jì)算。
圖2 義原的特征結(jié)構(gòu)
2.2義原相似度的計(jì)算[7]
由于所有的概念都最終歸結(jié)于基本意義單元——義原(個(gè)別地方用具體詞),所以語(yǔ)句或者關(guān)鍵詞的相似度判別最終都是歸結(jié)到知網(wǎng)的最小意義單元——義原相似度大小的計(jì)算。這里對(duì)義原的相似度計(jì)算做相應(yīng)規(guī)定。
規(guī)定義原b1和b2的語(yǔ)義相似度計(jì)算如下式:
式中,b1和b2表示兩個(gè)基本義原;s表示和在義原層次結(jié)構(gòu)體系中的路徑長(zhǎng)度,是一個(gè)大于零的數(shù)值;β是相似度關(guān)系系數(shù),可人為規(guī)定參數(shù)值(大小按用戶計(jì)算需求調(diào)整)。在描述的各種關(guān)系中,根據(jù)式(1)的計(jì)算主要利用義原的上下位關(guān)系。
從式(1)中可以看到,相似度與義原語(yǔ)義間距離成反比,義原在關(guān)系樹(shù)種所處的位置越遠(yuǎn),表明它們之間的語(yǔ)義的相似度越低。當(dāng)兩個(gè)義原歸屬于不同的類別體中,它們之間相當(dāng)于隔著屏障,不可到達(dá),距離趨近于無(wú)窮大。
在知網(wǎng)的知識(shí)描述語(yǔ)言中,在一些義原出現(xiàn)的位置出現(xiàn)的不是原語(yǔ)義,而是一個(gè)具體詞(概念),通常會(huì)用圓括號(hào)()括起來(lái)。
這里認(rèn)為具體詞和義原歸屬于不同類別,距離也為無(wú)窮大,相似度為零。只有具體詞完全相同,才認(rèn)為是同一個(gè)詞。
2.3關(guān)鍵詞模糊匹配
本文的飛機(jī)案例數(shù)據(jù)庫(kù)中對(duì)案例的搜索是通過(guò)輸入關(guān)鍵詞來(lái)實(shí)現(xiàn)的。為了更好的查詢出相關(guān)事故,將詞語(yǔ)表達(dá)上的差異性忽略,達(dá)到關(guān)鍵詞的模糊匹配,即能對(duì)詞語(yǔ)釋義相似但表述不同的關(guān)鍵詞語(yǔ)達(dá)到同一搜索結(jié)果的顯示。詞語(yǔ)的釋義表述一般存在多個(gè)。這里先完成釋義相似度的計(jì)算,然后推算出關(guān)鍵詞的模糊匹配。
知網(wǎng)中釋義的基本組成單元即為義原,規(guī)定兩個(gè)釋義的相似度計(jì)算如下:
式中,x表示釋義包含的義原個(gè)數(shù);simi(b1,b2)表示第i個(gè)義原表達(dá)式的相似度值。
完成釋義相似度計(jì)算后,進(jìn)行搜索關(guān)鍵詞的模糊匹配算法。
以w1和w2表示鍵入的兩個(gè)搜索關(guān)鍵詞,假設(shè)w1有m個(gè)釋義表達(dá):e11,e12,…,e1m,w2有n個(gè)釋義表達(dá):e11,e12,…,e1n.此處,對(duì)w1和w2的各個(gè)釋義進(jìn)行相似度大小比較,取釋義相似度中的最大值作為兩個(gè)關(guān)鍵詞的匹配系數(shù):
兩個(gè)關(guān)鍵詞的匹配系數(shù)決定了兩個(gè)關(guān)鍵詞是否為相似含義,是否能搜索出同一航空事故。本數(shù)據(jù)庫(kù)中規(guī)定:
(1)匹配系數(shù)φ≥0.7時(shí),兩個(gè)關(guān)鍵詞釋義相同,可相互替換,做出同樣的響應(yīng)(即在本數(shù)據(jù)庫(kù)搜索中顯示相應(yīng)航空事故信息)。
(2)匹配系數(shù)0.3<φ<0.7時(shí),兩個(gè)關(guān)鍵詞釋義存在模糊區(qū)間,系統(tǒng)提示“輸入更精確的關(guān)鍵詞,查找合適信息”。
(3)匹配系數(shù)0.3≤φ時(shí),兩個(gè)關(guān)鍵詞釋義不相同,無(wú)法查找相關(guān)條件,系統(tǒng)提示“無(wú)相應(yīng)搜索結(jié)果”。
航空事故數(shù)據(jù)庫(kù)建立以航空事故案例的事故形成原因?yàn)橐罁?jù),建立具有事件邏輯層次結(jié)構(gòu)和數(shù)據(jù)信息的案例庫(kù),建立良好的檢索機(jī)制,能根據(jù)用戶輸入的關(guān)鍵詞匹配出其對(duì)應(yīng)的飛機(jī)事故的詳細(xì)信息。
數(shù)據(jù)庫(kù)為了方便應(yīng)用,采用網(wǎng)頁(yè)形式設(shè)計(jì),界面如圖3所示。
圖3 事故顯示界面
數(shù)據(jù)庫(kù)中關(guān)鍵詞模糊匹配,能完成文字表達(dá)差異的容度,“同義詞”設(shè)計(jì)如圖4所示。
圖4 關(guān)鍵詞模糊匹配
為方便實(shí)時(shí)更新該數(shù)據(jù)庫(kù),設(shè)置了數(shù)據(jù)更新部分,如圖5所示??赏瓿勺钚潞娇帐鹿实奶砑樱菏鹿拭Q、關(guān)鍵詞、事件經(jīng)過(guò)描述、事件發(fā)生的原因以及事故相關(guān)圖片。
圖5 數(shù)據(jù)庫(kù)添加界面
本文將飛機(jī)事故案例以事故形成原因?yàn)橐罁?jù),運(yùn)用基元事件分析法建立具有層次結(jié)構(gòu)的事故案例庫(kù)。同時(shí),建立了良好的檢索機(jī)制,能根據(jù)用戶輸入的關(guān)鍵詞進(jìn)行模糊匹配,忽略差異,找出其對(duì)應(yīng)的飛機(jī)事故的詳細(xì)信息。本查詢數(shù)據(jù)庫(kù)以網(wǎng)頁(yè)形式呈現(xiàn),使用方便,并且能隨時(shí)更新事故庫(kù),有一定的實(shí)用價(jià)值。但本數(shù)據(jù)庫(kù)只單一針對(duì)維護(hù)中涉及到的機(jī)務(wù)工作者的人為因素影響,如何增加數(shù)據(jù)這一塊是需要進(jìn)一步研究的內(nèi)容,例如,數(shù)據(jù)庫(kù)中加上事故飛機(jī)的航班信息、航材信息、引發(fā)事故的零部件信息等等。
[1]孫瑞山,趙青.航空人為差錯(cuò)事故/事件分析(ECAR)模型研究[J].中國(guó)安全科學(xué)學(xué)報(bào),2012,22(2):17-22.
[2]人為因素研究小組.人為因素總數(shù)據(jù)庫(kù)研究報(bào)告[R].2003.
[3]溫濤.基于人為因素的安全航空研究[D].西安:西南交通大學(xué).2001:25.
[4]卜小敏.航空人為因素事故/事件分析模型研究[D].天津:中國(guó)民航大學(xué),2008.
[5]張露,馬麗.數(shù)據(jù)庫(kù)設(shè)計(jì)[J].安陽(yáng)工學(xué)院學(xué)報(bào),2007,(4):66-69.
[6]Zhou Qiang,F(xiàn)eng Songyan.Building a rela-tion network representation for how-net[C].Proceedings of 2000 Interna tional Conference on Multilingual Information,Urumqi,China,200:139-145
[7]程莉,盧正鼎,文坤梅,等.基于語(yǔ)義的模糊匹配探索與應(yīng)用[J].華中科技大學(xué)學(xué)報(bào):自然科學(xué)版,2003,31(2):23-25.
Design and Implementation of an Aircraft Accident Database Based on Case Searching
YUAN Jing1,XIE Ke-bin2
(1.Shanghai Civil Aviation College,Shanghai 200232,China;(2.Jiuzhou Aerocont Technologies Co.,Ltd,Mianyang Sichuan 621000,China)
To facilitate the analysis and summary of the causes of aviation accidents,through the consolidation of domestic and foreign aviation accident cases,information and data analysis,causes of accidents factors,we established a hierarchical structure of aircraft accident case database.At the same time,we set up a database searching mechanism which can achieve a similarity key words matching.This makes the location of a relative flight accident more accurate and easy.Then,this database can be updated,the new aircraft accident information and data can be added at any time.Finally,the database is applied to the teaching of human factors and aviation regulations and other courses.And web page query database is simple and easy to operate.
aviation accident;human factor;layered structure;fuzzy matching;data base
TP392
A
1672-545X(2016)07-0215-04
2016-04-20
袁晶(1987-),女,湖北麻城人,碩士研究生,助教,研究方向?yàn)槊窈綑C(jī)務(wù)維護(hù),智能診斷與仿真;謝克斌(1987-),男,山東濰坊人,碩士研究生,工程師,研究方向?yàn)榭展芡ㄐ?,空管信息化?/p>