胡創(chuàng)業(yè),何高魁,陳福龍,劉 威
(1.中國原子能科學研究院 核技術應用研究所,北京 102413;2.南華大學 核科學技術學院,湖南 衡陽 421001)
目前n/γ甄別的主流方法是數(shù)字脈沖波形甄別方法(DPSD),其主要包括基于時間域特征的上升時間[1]、過零時間[2]、電荷比較[2]和脈沖梯度分析法[3];基于頻率域特征的頻率比較和梯度法[4];基于時間和頻域局部特征的小波變換甄別法[5];基于支持向量機(SVM)[6]和BP神經(jīng)網(wǎng)絡[7]等機器學習甄別方法等。模式識別是人類的一項基本智能,計算機模式識別在20世紀60年代初迅速發(fā)展并成為一門新學科。模式識別是指對表征事物或現(xiàn)象的各種形式(數(shù)值的、文字的和邏輯關系的)信息進行處理和分析,以對事物或現(xiàn)象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。數(shù)字相關模式識別(DCPR)法已被應用于文本數(shù)據(jù)挖掘與分類、信息檢索、信息過濾、機器翻譯和文本查重等文字識別、語音識別、指紋識別和生物認證、遙感圖像識別和醫(yī)學診斷等領域,取得較好的人工智能分類效果。
近幾年來,國內外學者開展了基于DCPR法的n/γ甄別相關方法研究。文獻[8]在2011年最早開展此方法用于n/γ甄別研究,得到的結論是低能區(qū)品質因子(FOM)小于1;文獻[9]在2015年在討論數(shù)字化儀采用不同采樣率和垂直分辨率對甄別方法FOM影響時提到了DCPR法,其采用BC501液閃探測器和241Am-9Be源,但并未對DCPR法作重點介紹;文獻[10]在2018年對該方法進行了相關研究得到低能區(qū)FOM在0.82左右。文獻[8]的散點圖隨n和γ射線能量增加發(fā)生明顯彎曲現(xiàn)象,夾角弧度先減小后增大;文獻[10]的散點圖也有彎曲現(xiàn)象,夾角弧度隨n和γ射線能量的增加也是先減小后增大;文獻[9]的樣本數(shù)例相對較少,散點圖亦發(fā)生了輕微彎曲。通過對文獻[8-10]分析發(fā)現(xiàn),三者對DCPR法進行研究時均采用的是以γ射線作為參考脈沖計算的夾角余弦和弧度,能否采用n作為參考脈沖進行夾角相似度計算,目前國內外學者尚未見研究,本文開展以n作為參考脈沖的DCPR法研究,探討采用n作為參考脈沖后FOM的大小及FOM的影響因素。
本文的數(shù)據(jù)獲取框圖如圖1所示,采用241Am-9Be放射源、美國ELJEN公司φ5×2 inch的EJ301液體閃爍體探測器、CAEN公司的數(shù)字化儀DT5751和PC機,獲得的脈沖波形數(shù)據(jù)采用數(shù)據(jù)平滑、歸一化和最大值對齊等方法進行預處理。
圖1 數(shù)據(jù)獲取框圖Fig.1 Schematic view of data acquisition system
EJ301液體閃爍體探測器主要由C和H等低原子序數(shù)物質組成,γ射線與液體閃爍體探測器發(fā)生相互作用主要是康普頓效應,因此只能利用康普頓邊緣進行能量刻度,本工作能量刻度采用137Cs和60Co源,結合241Am-9Be的12C*第一激發(fā)態(tài)退激γ射線能量為4.439 MeV,最終確定探測器高壓為-1 750 V。
相關模式識別是通過特征向量提取和相似度計算將數(shù)據(jù)區(qū)分成不同類別的聚類行為。相似度計算法有基于歐式、余弦、杰卡德、海明和最小編輯距離等。目前n/γ甄別采用的是余弦相似度計算法,假設兩個向量為a(x1,y1)和b(x2,y2),由余弦定理可得:
(1)
cosθ=
(2)
余弦相似度計算法中兩個向量夾角余弦值作為衡量兩個向量之間差異的大小。余弦值越接近1,表明兩個向量越相似;余弦值越接近于0,表明兩個向量越不相似。
多維空間向量X(Xistart,Xistart+1,…,Xistop)和Y(Yistart,Yistart+1,…,Yistop)的余弦函數(shù)為:
(3)
式中,istart、istop為空間向量維數(shù)的起點和終點。在本文中istart和istop分別代表參與運算的n和γ脈沖信號空間向量維數(shù)的起點和終點(圖2)。
圖2 參與運算的脈沖信號起點和終點Fig.2 istart and istop of pulse signal involved in calculation
DCPR法中參考脈沖的選擇對FOM有較大影響,首先取上升沿最大值10%作為起點,下降沿10%作為終點計算脈沖寬度。選擇參考脈沖時依據(jù)脈沖寬度的直方圖進行篩選,窄的脈沖是γ,寬的脈沖是n。DCPR法計算時分別挑選出1個n和1個γ作為參考峰。20萬個樣本中n和γ的脈沖寬度分布如圖3所示。
本文參考脈沖選擇采用以下2種方案。
1) 方案1
選擇圖3中γ和n脈沖寬度頻率最大、脈沖寬度為24 ns的γ和36 ns的n作為參考脈沖,選取istart=36 ns、istop=181 ns計算出相對n和γ參考脈沖的余弦值直方圖,如圖4所示。由圖4a可看出,余弦值在0.97附近存在一高斯分布,它是γ脈沖和36 ns中子參考脈沖夾角余弦值分布直方圖;余弦值在1附近的直方圖是高斯分布的一半,是由于36 ns參考脈沖附近的中子利用余弦值在利用式(3)計算時并無正負區(qū)別,故造成此分布。
圖3 脈沖寬度分布Fig.3 Histogram of pulse width
a——以36 ns的n作為參考脈沖;b——以24 ns的γ作為參考脈沖圖4 方案1余弦值直方圖Fig.4 Histogram of cosine for case 1
2) 方案2
選擇脈沖寬度較窄的γ和較寬的n作參考脈沖,它們與脈沖寬度頻率較大處的γ和n信號夾角余弦值會減小,將出現(xiàn)雙高斯峰分布。本文選擇脈沖寬度為13 ns的γ和為61 ns的n作為參考信號,選取istart=36 ns、istop=181 ns進行計算得到的余弦值直方圖如圖5所示。圖5中出現(xiàn)兩個高斯脈沖,且圖5b的情況優(yōu)于圖5a,這表明當選取脈沖寬度61 ns的n作為參考脈沖時,其FOM優(yōu)于選取脈沖寬度13 ns的γ作為參考脈沖。因此,本文最終選取方案2中脈沖寬度為61 ns的n作為參考脈沖。
本文依據(jù)方案2通過將多組61 ns的n信號取平均作為參考脈沖,istart和istop分別取36 ns和181 ns,其n/γ的FOM計算公式為:
(4)
式中:μn和μγ分別為n峰和γ峰的均值;FWHMn、FWHMγ分別為n峰和γ峰的半高全寬。FOM越大,表明甄別效果越理想,通過高斯擬合計算得到FOM=1.03(圖6)。
a——以13 ns的γ作為參考脈沖;b——以61 ns的n作為參考脈沖圖5 方案2余弦值直方圖Fig.5 Histogram of cosine for case 2
圖6 計算的品質因子Fig.6 Calculation quality factor
1) istart對FOM的影響
從圖2可看出,n/γ在上升沿和最大值附近差異不大,主要差異在下降沿部分。本文將istop固定為181 ns,計算出取不同istart時的FOM,如圖7所示。當istart太小時,信號的上升沿和最大值均參與計算,由于脈沖信號上升階段和最大值附近差異小但對整個余弦值計算貢獻大,此時FOM并不是最好;當istart太大時,γ脈沖信號參與余弦值計算的空間向量維數(shù)太小,不能很好地將γ信號區(qū)分開。因此,istart的取值對FOM影響較大,當istop取181 ns、istart取32 ns時FOM最大。
圖7 不同istart的品質因子Fig.7 FOM of different istarts
2) istop對FOM影響
將istart固定為32 ns,改變istop大小計算得到對應的FOM,結果如圖8所示??煽闯?,istop的取值對FOM的影響較小,當istop取150~180 ns之間時效果相對較好,在161 ns時FOM取得最大值1.137。
圖8 不同istop的品質因子Fig.8 FOM of different istops
通過上述討論可知,F(xiàn)OM對istart的依賴性很大而對istop的依賴性較小,依據(jù)最佳參數(shù)做出余弦值和脈沖積分(電荷量)的散點圖和熱度圖,如圖9所示,可看出,散點圖隨能量升高并未出現(xiàn)彎曲情況。
本文研究結果表明數(shù)字相關模式識別法可用于甄別n和γ,脈沖寬度較窄的γ和較寬的n作參考脈沖較脈沖寬度頻率最大的γ和n作參考脈沖效果好,且將n作為參考脈沖較文獻[8-10]選取γ作為參考脈沖的效果更好。istart的取值對FOM影響較大,應選取在32 ns最為合適,istop的取值對FOM的影響不大,取150~180 ns的效果相對較好。本文以脈沖寬度為61 ns的n作為參考脈沖,取istart=32 ns、istop=161 ns得到241Am-9Be源最高FOM為1.137,取得了較好的甄別效果。
a——散點圖;b——熱度圖圖9 電荷量和余弦值的散點圖和熱度圖Fig.9 Scatte plot and heatmap plot for charge vs cosine