古 強,寇驕子,李文濤
(中核四川環(huán)保工程有限責任公司,四川 廣元 628017)
全球已有140 多座核電反應堆永久關(guān)閉,開始或等待退役。在運行的反應堆中,有部分也已超出設(shè)計壽期。除核電反應堆外,一些國家還有大量的遺留軍用核設(shè)施需要退役,這些工作均面臨不同程度的難題和挑戰(zhàn),尤其是在退役策略選擇、輻射安全和成本預算方面存在很大的不確定性,需要大量的準備工作,以達到方案最優(yōu)化。
消除這種不確定性的有效方法之一是利用仿真技術(shù)。利用仿真技術(shù)可為退役策略和方案的選定、操作順序的優(yōu)化、退役廢物數(shù)量的估算和形狀的判斷、輻射劑量的估計以及退役操作前人員的培訓等多項工作提供有效的支持,使整個退役過程從放射性廢物產(chǎn)生到成本盡量低等多個方面真正符合合理可行原則。
近年來,我國對于核設(shè)施退役監(jiān)管要求越來越嚴。同時,加大了核設(shè)施退役投入,并在部分退役技術(shù)方面取得了一定的突破。但在具體的退役實踐經(jīng)驗還較為欠缺,對于在退役活動中操作人員的安全和健康的保障具體措施的研究應用還較少。因此,本課題是對核設(shè)施數(shù)字化仿真中人員行走的最優(yōu)路徑進行研究,基于推導計算出的輻射場分布,按照在相同工作時間,人體受照劑量的累計值最低,采用A-Star 算法進行兩點間最優(yōu)路徑的計算,將最優(yōu)路徑轉(zhuǎn)換為數(shù)字化仿真模型中的尋路模型進行呈現(xiàn),這是在核設(shè)施數(shù)字化仿真退役中一次重要的嘗試,將為核設(shè)施真實退役提供重要參考。
圖論研究中的一個經(jīng)典算法是最短路徑算法,即在圖中找到2 個結(jié)點之間最短的路徑。
計算最短路徑的算法即“最短路徑算法”。常用最短路徑算法包括:迪杰斯特拉算法,即Dijkstra 算法;SPFA 算法Bellman-Ford 算法,即隊列優(yōu)化算法;弗洛伊德算法(Floyd)Floyd-Warshall 算法;Johnson 算法;A-Star 算法。
本項目主要采用A-Star 算法進行研究。該算法是基于啟發(fā)式搜索,即在狀態(tài)空間中對每個搜索的位置進行評估,以確定最好的位置,再從這個位置搜索直至到達目標。這樣省略了搜索大量沒有作用的路徑,使得效率得到了提升。在啟發(fā)式搜索中,位置的估價是極其重要的方面,不同的估價可能到達不同的效果,其缺點是在長路徑上的速度呈現(xiàn)幾何級數(shù)地提升。
本項研究以待退役核設(shè)施為原型,采用3dMax、Unity 等三維仿真工具和平臺,對待退役核設(shè)施的主要建筑、設(shè)備、管線等進行了三維模型構(gòu)建。同時,利用蒙特卡洛程序?qū)椛鋱鲞M行計算,基于有限的輻射場數(shù)據(jù),采用神經(jīng)網(wǎng)絡(luò)插值的方法重構(gòu)了輻射場。采用虛擬現(xiàn)實技術(shù)的核輻射可視化方法,將輻射場與設(shè)施疊加,用以分析和處理輻射信息,解決實時對輻射場進行渲染呈現(xiàn)的問題,并以多種圖形化的方式直觀地顯示核輻射劑量場的分布情況。
采用柵格路徑對設(shè)施內(nèi)部空間進行了分隔。柵格路徑是搜索算法基于柵格地圖得到的一個柵格序列(數(shù)組),是本項目研究在路徑算法的實踐之一。柵格法的使用與障礙物柵格的生成,進而將實際三維仿真地圖轉(zhuǎn)換為柵格地圖,柵格路徑無法直接應用于實際地圖中,需要將其進行處理,將柵格路徑轉(zhuǎn)換為直角坐標系下的路徑。在項目研究中,將核設(shè)施內(nèi)部的空間按照標準的大小進行柵格繪制,形成了地理柵格內(nèi)部空間結(jié)構(gòu),用于與輻射場進行耦合計算,采用A-Star 算法進行路徑尋址,最終找到最優(yōu)路徑。
設(shè)從A 點移動到B 點,但是這兩點之間被一堵墻(不可走區(qū)域)隔開,首先把搜索區(qū)域簡化為了二維數(shù)組,數(shù)組的每一項代表一個格子柵格被定義成2 個狀態(tài),即可走(walkable)和不可走(unwalkable)。通過計算出從A 到B 需要走過哪些節(jié)點,就找到了路徑。一旦路徑找到了,便可以從一個節(jié)點的中心移動到另一個節(jié)點的中心,直至到達目的地。
A-Star 算法核心公式就是F 值的計算
F=G+H,
式中:F 為總移動代價;G 為開始點到當前節(jié)點的移動代價;H 為當前節(jié)點到結(jié)束點的預估移動代價。
3.1.1 G 值的計算
假設(shè)當前A 節(jié)點,鄰近有8 個格子可走(上、下、左、右、右上、右下、左上、左下),當往上、下、左、右這4個格子走時,移動代價為10;當往左上、左下、右上、右下這4 個格子走時,移動代價為14。(等腰直角三角形勾股定理:斜邊2=2×直角邊2)。
基本公式為
G=移動代價。
根據(jù)環(huán)境應用的需要,G 值的計算可以進行拓展。如加上柵格不同輻射場量因素對尋路的影響,可以給不同柵格賦予不同代價因子,來體現(xiàn)出G 值的差異。由于輻射場估算已經(jīng)給每一個柵格賦予了輻射場值,可以利用該數(shù)值轉(zhuǎn)換為代價因子,在移動代價相同情況下,低場量的G 值更低,算法就會傾向選擇G 值更小的低場量柵格。
拓展公式為
G=移動代價×代價因子。
3.1.2 H 值的計算
19世紀,赫爾曼·閔可夫斯基創(chuàng)造了曼哈頓距離(Manhattan Distance)一詞,其是一種幾何用語。在幾何度量空間里,用于標明在標準坐標系上2 個點的絕對軸距的總和,即兩點在南北方向上的距離加上在東西方向上的距離之和。
二維平面兩點a(x1,y1)與b(x2,y2)間的曼哈頓距離為
n 維空間點a(x11,x12,…x1n)與b(x21,x22…x2n)的曼哈頓距離為
A-Star 算法之所以被認為是具有啟發(fā)策略的算法,在于其可通過預估H 值,降低走彎路的可能性,更容易找到一條更短的路徑。其他不具有啟發(fā)策略的算法,沒有做預估處理,只是窮舉出所有可通行路徑,然后從中挑選一條最短的路徑。這也是A-Star 算法效率更高的原因。
3.1.3 開始搜索
開放列表(open list)用于記錄所有可考慮選擇的格子。
封閉列表(close list)用于記錄所有不再考慮的格子。
(1)算法開始,首先搜索A 相鄰的所有可能的移動位置,每個節(jié)點左上角的值G 表示該點到A 的距離,這里的H 就取其到B 的曼哈頓距離。最后,還要計算一個F 值,F(xiàn)=H+G。
(2)此時的起點A,將其加入由節(jié)點組成的開放列表之中,開放列表即是一個待檢查的節(jié)點列表。
(3)查看與起點A 相鄰的節(jié)點,把其中可走的(walkable)或可到達的(reachable)節(jié)點也加入到開放列表(open list)中。隨后把A 從開放列表(open list)中移除,加入到封閉列表(close list)中,封閉列表(close list)中的每個節(jié)點都是現(xiàn)在不需要再關(guān)注的。
(4)從開放列表(open list)中選一個與起點A 相鄰的節(jié)點,選擇具有最小F 值的那個節(jié)點。
3.1.4 再次搜索
(1)接著把當前節(jié)點A1 從開放列表(open list)移到封閉列表(close list)中,搜索當前節(jié)點相鄰的所有可能的移動位置,并且都加入到開放列表(open list)。
(2)把找到最小F 值的節(jié)點A2 從開放列表(open list)移到封閉列表(close list)中,然后檢查與其相鄰的節(jié)點。其右邊的節(jié)點是墻壁(不可走unwalkable),進行忽略。左邊的節(jié)點是父節(jié)點,在封閉列表(close list)中,也進行忽略。其他相鄰的節(jié)點均在開放列表(open list)中,所以A2 節(jié)點尋路失敗,選擇開放列表(open list)中最小F 值的節(jié)點(列表中如果有多個最小F 值的情況,隨機獲取一個最小F 值節(jié)點進行下一次循環(huán))。
(3)繼續(xù)把找到最小F 值的節(jié)點A3 從開放列表(open list)移到封閉列表(close list)中,然后檢查與其相鄰的節(jié)點。按照如此循環(huán)直到移動到目標點B。最終過程結(jié)果如圖1所示。
圖1 路徑搜索
3.1.5 補充
(1)最佳路線可能有多條,比如本文的示例,這取決于當開放列表(open list)存在多個F 值最小的節(jié)點時,先選取哪一個進行搜索。
(2)曼哈頓距離只是估算H 值最簡單的一種方法,常用的方法還有歐幾里德距離、切比雪夫距離等。
(3)實際應用中,為提高效率,還可以進行雙向搜索。從起點和終點分別發(fā)起搜索,一方搜索到另一方的已檢查節(jié)點時,即找到最佳路線。地圖較復雜時,雙向搜索可以顯著減少尋路過程中檢查的節(jié)點數(shù)量。
3.1.6 輻射場與代價因子
前文提到的“G=移動代價×代價因子”,如何將當前柵格輻射場量轉(zhuǎn)化為合理的代價因子是核退役數(shù)字化仿真中人員行走路徑最優(yōu)化研究項目中的應用特殊性。
在理論上,通過源項調(diào)查獲取的輻射場數(shù)值范圍不常在一個數(shù)量級單位波動,需要使其數(shù)據(jù)標準化,將其限定在需要的一定的范圍之內(nèi)。將數(shù)據(jù)進行標準化就是將數(shù)據(jù)按照一定的比例進行縮放,讓數(shù)據(jù)落入小范圍的特定區(qū)間內(nèi)。采用比較和評價進行指標處理時會經(jīng)常用到,讓數(shù)據(jù)不再受單位的限制,而將其轉(zhuǎn)化純數(shù)字,這種純數(shù)值是無量綱的,這樣對不同單位或量級的數(shù)據(jù)指標就能夠進行加權(quán)和比較。在分析數(shù)據(jù)之前,應將數(shù)據(jù)進行標準化,并分析標準化后的數(shù)據(jù)。數(shù)據(jù)標準化即將統(tǒng)計的數(shù)據(jù)指數(shù)化。數(shù)據(jù)無量綱處理和同趨化處理是數(shù)據(jù)標準化處理的兩個方面。數(shù)據(jù)無量綱化處理主要用于解決數(shù)據(jù)的可比性問題。數(shù)據(jù)同趨化處理主要解決不同性質(zhì)的數(shù)據(jù)問題,即對不同性質(zhì)指標加總不能正確反映不同作用力的綜合結(jié)果,首先應考慮改變逆指標數(shù)據(jù)的性質(zhì),使所有指標對測評方案的作用力同趨化,再加總以得到正確的結(jié)果。經(jīng)過以上所述的標準化處理,將原始數(shù)據(jù)轉(zhuǎn)換為無量綱化指標測評值,這樣原始數(shù)據(jù)通過轉(zhuǎn)換已經(jīng)處于同一數(shù)量級別,再進行綜合測評分析。
經(jīng)常使用的方法包含如下幾種。
(1)簡單縮放。
(2)逐樣本均值消減(也稱為移除直流分量)。
(3)特征標準化(使數(shù)據(jù)集中所有特征都具有零均值和單位方差)。
其目的都是在于加快梯度下降求最優(yōu)解的速度,有可能提高精度。
通常的方法:
(1)線性標準化,即min-max 標準化或離差標準化,就是對原始數(shù)據(jù)進行線性變換,最終結(jié)果值映射到[0,1]區(qū)間之間。采用以下函數(shù)進行轉(zhuǎn)換
以上方法更適用于數(shù)值較為集中的情況。另外,這種方法也有明顯的缺陷,即一旦max 和min 不穩(wěn)定,結(jié)果很可能也不穩(wěn)定,這將直接影響使用效果。
(2)Z-score 標準化,或者稱為標準差歸一化,這種方法將原始數(shù)據(jù)的均值(mean,μ)和標準差(standard deviation,σ)進行數(shù)據(jù)標準化。數(shù)據(jù)處理后符合標準的正態(tài)分布,即均值為0,標準差為1,轉(zhuǎn)化函數(shù)為
(3)非線性歸一化,一般應用于數(shù)據(jù)分析較大的場景,采用數(shù)學函數(shù)將原始值進行映射。這經(jīng)常使用到log、指數(shù)、正切等函數(shù),最終將根據(jù)數(shù)據(jù)分布的具體情況決定非線性函數(shù)的曲線。
采用虛擬現(xiàn)實技術(shù)對核設(shè)施退役過程中三維輻射場進行計算和評估,給定核設(shè)施退役作業(yè)過程場景,以此為基礎(chǔ)構(gòu)建目標問題動態(tài)三維輻射場模型,并對輻射劑量場采用蒙特卡洛數(shù)值模擬計算以及全范圍的可視化呈現(xiàn),既在人員的安全性上有足夠的保障,又在經(jīng)濟性和可靠性上具有顯著優(yōu)勢。
基于構(gòu)建的核設(shè)施退役環(huán)境中的三維輻射場,進行核設(shè)施退役作業(yè)過程的建模并完成路線規(guī)劃,如圖2所示。
圖2 輻射場中路線規(guī)劃實現(xiàn)
基于虛擬仿真平臺構(gòu)建輻射場的三維仿真模型,將三維模型轉(zhuǎn)化為基本的幾何體,識別基本幾何體的基本信息,為快速計算輻射場,利用蒙特卡洛程序進行核輻射場計算。利用有限的輻射場數(shù)據(jù),采用神經(jīng)網(wǎng)絡(luò)插值的方法對輻射場進行重構(gòu),并采用虛擬現(xiàn)實技術(shù)實現(xiàn)核輻射可視化的方法,對輻射數(shù)據(jù)進行分析和處理,再將核設(shè)施與輻射場進行疊加,同時實現(xiàn)核輻射場實時渲染,進而以更直觀高效的圖形化方式呈現(xiàn)輻射劑量場的分布情況。
根據(jù)待退役核設(shè)施前期源項調(diào)查選取的4 000 個點位數(shù)據(jù),選擇其中2 000 個點的數(shù)據(jù)作為輸入,在已知源項幾何大小、活度、產(chǎn)生射線的種類和射線能量等基礎(chǔ)信息上,利用蒙特卡洛程序及神經(jīng)網(wǎng)絡(luò)插值進行三維輻射場劑量分布情況進行可視化建模與分析。通過建立的算法進行仿真模擬,并用其余2 000 個點的數(shù)據(jù)對仿真結(jié)果和實際數(shù)據(jù)進行相對誤差分析,不斷調(diào)整算法模型參數(shù),直到模擬輻射場與實際數(shù)字誤差達到最小,最終確定輻射場模擬算法,實現(xiàn)了輻射場仿真分布誤差小于30%的指標。
使用柵格法將核設(shè)施結(jié)構(gòu)和輻射場離散化,進而對人員行走路徑進行不斷優(yōu)化。在處于二維環(huán)境下時,建立了基于柵格的路徑評估方法,用于評價路徑選擇的各種因素,并且基于圖論算法設(shè)計了受到最小輻照的路徑搜索方法,最終用于人員受照劑量最小的路徑的選擇。
在復雜的輻射環(huán)境下,采用組合優(yōu)化的方法得到最小輻照路徑的最優(yōu)解。本次開發(fā)的人員行走路徑優(yōu)化方法和虛擬仿真技術(shù)相結(jié)合,不僅實現(xiàn)了核輻射場中人員行走路徑仿真,還能夠提供工作人員行走路徑規(guī)劃設(shè)計、優(yōu)化、演練和評估等多種服務(wù)。
在核退役數(shù)字化仿真中研究人員行走最優(yōu)路徑,完成了輻射場量和A-Star 最優(yōu)路徑的耦合功能,并利用鼠標鍵盤等設(shè)備在核設(shè)施退役場景仿真系統(tǒng)動態(tài)交互起止點,可以滿足核設(shè)施退役三維場景任意兩點最優(yōu)路徑的計算。此項研究在核設(shè)施退役人員輻射防護方案設(shè)計中有重要的參考價值。