方漪 王羲翰 于海霞 ( 中國空間技術研究院, 北京空間科技信息研究所)
航天是高風險的科學探索活動,在各類航天活動中,對太陽系及更遠太空的探索任務難度大,風險高,面臨來自技術、政策、人員、環(huán)境、資源等很多不確定因素的影響。以月球探測為例,截至2019年底,全球共實施月球探測任務122 次,其中任務成功或部分成功63 次,任務失敗59 次;2019年,印度的月船-2(Chandrayaan-2)任務落月失敗,再一次說明在探索宇宙的活動中,必須將風險管理作為核心要素。美國國家航空航天局(NASA)在長期的空間探測任務中,開展了大量研究與實踐,成功將風險管理的理念、方法和工具應用在空間探索任務的全過程之中,為保障任務成功提供關鍵支撐[1]。
NASA 通過長期任務實踐發(fā)現(xiàn),一項空間探測任務面臨的主要風險包括四個方面:一是設備故障導致探測器功能降級或失效;二是外部環(huán)境和事件影響,例如地震、洪水等自然災害對研制任務的影響;三是人員失誤風險,主要是操作失誤、判斷失誤、消極怠工;四是組織機構風險,如內部溝通不暢,責任界面不清、管理維度缺失、整體員工士氣不足,員工專業(yè)技能和培訓不足等。
為有效應對這些風險,NASA 制定了面向航天項目管理的一套成熟的風險管理系統(tǒng),從研制進度、人力資源、技術、機構配置、安全、環(huán)境、成本預算這七個方面開展風險管理,使風險管理系統(tǒng)成為航天項目控制、系統(tǒng)工程和安全與任務保障的有機組成部分[2]。
在航天項目風險管理中,NASA 在項目全生命周期各階段按照分級分類的方式進行風險識別和管理,對風險進行優(yōu)先級排序,定期評估風險和風險管理控制的有效性,強化風險管理信息溝通的軟硬件,從而提高NASA 風險管理的決策質量,確保航天項目的目標任務實現(xiàn)。
具體而言,NASA 風險管理系統(tǒng)包括基于風險信息的決策(RIDM)和持續(xù)風險管理(CRM)?;陲L險信息的決策分三步:識別航天項目的備選方案;對備選方案進行風險分析;對基于風險信息的備選方案進行選擇[3]。
NASA 的持續(xù)風險管理由風險識別、風險分析、風險緩釋計劃、風險跟蹤、風險控制、溝通和記錄六大模塊構成,具體流程形成一個類似“計劃-執(zhí)行-檢查-處理”(PDCA)的閉環(huán)管理:
NASA 風險管理的主要領域和流程
1)制定風險管理計劃。執(zhí)行成功的風險管理所必需的前期活動,需要根據(jù)航天項目的目標、任務特點、過程控制需求以及風險管理策略、資源和方法來制定風險管理計劃。
2)開展風險識別。對發(fā)現(xiàn)的風險進行持續(xù)的識別和記錄。通過研究歷史數(shù)據(jù),采訪專家,對比目標和現(xiàn)有能力,判斷指標趨勢等方法來識別風險。
3)進行風險評估和分析。對風險發(fā)生的概率、影響和時間表進行評估,并對相關風險進行分類和優(yōu)先級排序。需要確定風險的原因、條件、可能性、后果、風險敞口等;評估中使用風險矩陣、風險指標評估、多屬性決策等定性或定量分析評估方法。
4)實施風險應對。根據(jù)項目目標、資源和風險評估結果,制定風險應對計劃。首先指定風險責任人,然后選擇或重新設計風險應對備選方案,通過評估和權衡,確定最佳解決方案,制定風險應對計劃。
5)跟蹤和控制風險。跟蹤風險變化情況及風險應對計劃的實施狀態(tài),并根據(jù)需要采取糾正措施來控制風險。
6)風險管理溝通和記錄。在風險管理全流程持續(xù)記錄風險變化和管理實施情況,為管理決策提供支持;主要通過表格等方式將風險管理活動中的風險、分析、處理/行動數(shù)據(jù)進行記錄整理,輸出風險管理數(shù)據(jù)庫報告、狀態(tài)報告、跟蹤日志等[4]。
在管理工具層面,NASA 的風險管理工具分為定量和定性兩類,定量分析工具包括基于統(tǒng)計分析的風險評估模型和風險分析技術,例如概率風險評價(PRA);基于原因和影響的風險分析,例如影響和關鍵性分析(FMECA)以及基于系統(tǒng)工程的風險識別與分析等。定性分析工具包括失效模型與影響分析(FMEA),故障樹分析(FTA)、風險評估分類(RAC)、頭腦風暴法、危險程度分析法、關聯(lián)度分析法、過程映射分析法、基于分類的問卷調查法、帕累托分析法等[5]。
NASA 在空間探測任務中,注重分析與航天器設計、生產、測試和驗證相關的典型風險因素對多階段項目的影響,確保每個里程碑按進度和質量完成。
以NASA 的獵戶座探測任務為例,該任務要完成“三步走”:第一步是無人飛行測試-1(EFT-1),將開展繞地軌道5800km 高度飛行并再入返回;第二步是探測任務-1(EM-1),將開展為期25天的無人繞月往返任務;第三步是探測任務-2(EM-2),計劃在2021年實現(xiàn)近地小行星的載人探測任務。獵戶座探測任務階段多時間跨度長,風險管理難度大,NASA 在項目中運用風險矩陣和風險分析軟件實現(xiàn)綜合風險識別和分析。
風險矩陣是常用的風險評估工具,通過風險發(fā)生概率和風險影響兩個指標來描述風險。風險發(fā)生概率評級從1 到5 不斷提高,概率小于10-6幾乎不會發(fā)生的風險評級為1,概率大于0.1 很有可能發(fā)生的概率評級為5。風險影響評級從1 到5 不斷上升,對人身安全、設備、人員健康、探測環(huán)境、任務成果、成本、進度等幾乎無影響的可忽略風險影響評級為1,對人身安全、設備、人員健康和自然環(huán)境產生重大威脅、任務失敗、成本過高導致任務取消、里程碑延期5 個多月或任務取消的關鍵風險影響評級為5。識別的風險、發(fā)生概率和風險影響評級來自于過去40年中NASA 空間探測任務的歷史數(shù)據(jù)和經驗,以及本次任務中工程師和項目管理人員的意見。
NASA 的工程設計人員完成這兩個指標的評級后,可以建立一個發(fā)生概率和風險影響的風險矩陣,得到各個風險的級別。文中例舉的風險矩陣中,每個方框代表一個風險級別(例如:低、中、高),有時使用顏色表示(例如:綠色、黃色、紅色),風險級別越高,解決這個問題就越緊迫和重要。在此基礎上進行風險等級排序,判斷哪些是高等級風險,據(jù)此開展資源的配置。
在風險評估過程中,NASA 還使用量化風險分析軟件,建立風險模型,有效提升定量分析效率,如創(chuàng)建綜合進度時間表,為每個子任務分配一個風險評分,預估完成各個里程碑最小、最大和最可能的時間,建立進度風險評估模型,計算對具體任務進度風險的連續(xù)分布,還可以計算不同風險級別任務的比例和數(shù)量[6]。
NASA 確定的空間探測任務風險等級
國際合作是空間探測任務的常見模式,共享資源、共擔風險,但國際合作也面臨多方管理協(xié)作溝通等方面的要求和挑戰(zhàn),處理不好,可能引入新的風險,甚至影響任務成敗。因此,國際合作開展的空間探測任務中,風險管理的協(xié)同就非常重要。
以“卡西尼- 惠更斯”(Cassini-Huygens)土衛(wèi)六探測任務為例,該任務是NASA 和歐洲航天局(ESA)的國際合作探索項目,將探測土星、土星環(huán)及其衛(wèi)星,參與該項目的專家來自美國和歐洲的16 個國家?!翱ㄎ髂帷避壍捞綔y器由NASA 研制,承擔環(huán)繞土星飛行和中繼通信任務;“惠更斯”著陸器由ESA 研制,在飛到土衛(wèi)六時脫離“卡西尼”軌道探測器并在其表面著陸。
NASA 的風險管理工作集中在“卡西尼-惠更斯”整體飛行器的發(fā)射和軌道調整上;ESA 主要關注處理“惠更斯”著陸器所特有的風險。兩個機構都在積極開展任務全過程的風險管理,并通過國際合作形成風險管理協(xié)作,從而主動識別、評估和管理任務風險。
NASA 和ESA 的風險管理協(xié)作首先是在風險識別與評估領域。NASA 和ESA 聯(lián)合組建風險管理小組,定期對現(xiàn)有和潛在的風險跟蹤評估。NASA 每季度安排風險小組會議,全面評估系統(tǒng)中的風險和優(yōu)先級并討論風險緩釋方案。ESA 協(xié)同主承包商、每個分系統(tǒng)小組的專家對任務的風險進行評估。兩者共同識別和評估“惠更斯”著陸器脫離“卡西尼”軌道探測器和信號中繼的風險。
其次是風險分析的協(xié)同。NASA 每季度記錄風險指標的變化趨勢,開發(fā)了一個3×4 的風險矩陣。ESA 開發(fā)了一個5×5 風險矩陣,結合NASA 已確定的風險,基于ESA 標準重新評估并將其納入ESA 風險管理工作。NASA 和ESA 團隊定期同步項目計劃,NASA 每季度記錄風險指標并同步給ESA,將其納入ESA 風險管理數(shù)據(jù)庫,實現(xiàn)雙方信息無縫鏈接和風險評估標準的互通協(xié)同。
NASA 和ESA 的風險量化標準
NASA 和ESA 還制訂了“卡西尼-惠更斯”項目行動計劃協(xié)調機制(MOP)。該機制可以讓兩個團隊的成員隨時獲得操作計劃狀態(tài)和結果并進行溝通和審查,還通過對任務需求和研制活動的清晰定義減少了誤解的風險。通過制定聯(lián)合時間表和行動計劃,消除機構間的方案偏差,緊急情況下可以按約定的行動計劃執(zhí)行。MOP 作為風險評估和風險緩解方面的指導性文件,有效地促進了兩個機構協(xié)作風險的管理。[7]
空間探測是航天活動中風險比較高的一類,做好風險管理工作更為重要。美國和歐洲國家在空間探測領域風險管理積累了大量經驗和數(shù)據(jù),建立了覆蓋探測任務全周期的風險管理方法,很多做法值得我們研究、學習和借鑒。這些管理方法主要集中在四個方面:一是風險管理有機融入宇航研制項目管理流程,已經與項目管理、系統(tǒng)工程和任務安全保證等管理有效對接,嵌入到項目進度、成本預算、技術攻關、系統(tǒng)研制、人員隊伍等各類要素的管理和控制之中;二是關注深空環(huán)境、航天員安全等方面的特有風險因素的影響;三是建立基于歷史經驗數(shù)據(jù)建模和量化分析的風險識別、風險分析、風險應對策劃、風險實施與跟蹤,效果評估與控制閉環(huán)管理;四是注重多國別、多機構的風險信息溝通與管理協(xié)同方法開發(fā)與應用。