何博文, 關(guān) 群
(1.范德堡大學(xué) 土木與環(huán)境工程系,田納西 納什維爾 37212; 2.合肥工業(yè)大學(xué) 土木與水利工程學(xué)院,安徽 合肥 230009)
核泄漏是一種可對(duì)人類以及周邊環(huán)境造成巨大破壞的工程事故,通??煞譃楹诵就耆廴诤秃诵静糠秩廴赱1],具體表現(xiàn)為反應(yīng)堆內(nèi)部由于溫度超過(guò)設(shè)定溫度所導(dǎo)致的核芯和燃料棒的融化及放射性物質(zhì)的泄漏[2]。歷史上曾出現(xiàn)過(guò)多次舉世聞名的重大核泄漏災(zāi)害事故,例如,2011年的日本福島事件,1986年的切爾諾貝利事件及1977年的美國(guó)三里島事件[3]。因此,核泄漏被認(rèn)為是當(dāng)代最危險(xiǎn)的工業(yè)事故之一,其重要性值得業(yè)內(nèi)工程師以及科學(xué)家投入大量精力來(lái)研究。
本文基于統(tǒng)計(jì)分析的角度,探究核泄漏事故的發(fā)生與反應(yīng)堆自身的設(shè)計(jì)因素和外部影響因素之間存在的聯(lián)系,為核反應(yīng)堆工程師在未來(lái)反應(yīng)堆的選址、設(shè)計(jì)及相關(guān)建設(shè)運(yùn)營(yíng)方面提供參考。
本文重點(diǎn)選取在全球范圍內(nèi)具有核泄漏事故記錄的核反應(yīng)堆和從未發(fā)生過(guò)核泄漏事故的核反應(yīng)堆進(jìn)行研究。對(duì)于具有核泄漏記錄的核反應(yīng)堆,不僅采取具有全球重要影響的核泄漏記錄的核反應(yīng)堆,同時(shí)也采取一些具有不著名核泄漏歷史記錄的核反應(yīng)堆來(lái)組成研究樣本。為了擴(kuò)充樣本容量, 本文不僅選取大型商用核反應(yīng)堆(例如切爾諾貝利核反應(yīng)堆),同時(shí)也采取小型還未商用的反應(yīng)堆(例如實(shí)驗(yàn)與科研反應(yīng)堆)來(lái)組成研究樣本。對(duì)于未發(fā)生過(guò)核泄漏事故的核反應(yīng)堆樣本,其樣本個(gè)例均來(lái)自全球正在商用運(yùn)行的核反應(yīng)堆機(jī)組。
本文在全球范圍內(nèi)選取50個(gè)核反應(yīng)堆組成研究樣本。樣本反應(yīng)堆的特征參數(shù)來(lái)自世界核協(xié)會(huì)與國(guó)際原子能機(jī)構(gòu)[4-5]。通過(guò)確定核反應(yīng)堆的設(shè)計(jì)類型,確定其設(shè)計(jì)公司并查找該公司該產(chǎn)品的技術(shù)報(bào)告和設(shè)計(jì)手冊(cè)的方法來(lái)最終確定該反應(yīng)堆的所有相關(guān)設(shè)計(jì)參數(shù)。同時(shí),采取大量來(lái)自研究文獻(xiàn)的信息來(lái)評(píng)估樣本反應(yīng)堆是否建造在一個(gè)易發(fā)生地震與海嘯的位置。例如,在樣本反應(yīng)堆中,有一個(gè)是由關(guān)西電力公司建造運(yùn)營(yíng)的三濱核反應(yīng)堆。文獻(xiàn)[6]研究發(fā)現(xiàn)建造的三濱核反應(yīng)堆位置下有劇烈的地殼運(yùn)動(dòng)痕跡,顯示其位置具有很大的發(fā)生7.4級(jí)及以上地震的可能性,從而影響三濱核反應(yīng)堆的運(yùn)營(yíng)。同時(shí),由于日本是一個(gè)狹長(zhǎng)的島國(guó),對(duì)于地震之后接連發(fā)生海嘯有極大的可能性,而海嘯對(duì)臨近海岸線的建筑物包括核電站會(huì)造成巨大的破壞和影響?;谶@些信息,三濱核反應(yīng)堆的建造地址是一個(gè)不夠理想且易于發(fā)生核泄漏事故的地理位置。同樣采取大量來(lái)自研究文獻(xiàn)的信息判斷在核泄漏事故中是否存在人為操作上的失誤。例如,歷史上著名的三里島核泄漏事件中,一位核電站操作人員誤判了閥門(mén)的開(kāi)關(guān)狀態(tài)這一重大關(guān)鍵性的人為操作失誤,直接導(dǎo)致了美國(guó)核工業(yè)歷史上無(wú)可挽回的結(jié)果[7]。
本研究把可能與核泄漏事故發(fā)生相關(guān)聯(lián)的因素分為內(nèi)部因素和外部因素。內(nèi)部因素是指由反應(yīng)堆自身特性所決定的因素,例如反應(yīng)堆一系列的設(shè)計(jì)參數(shù)。外部因素是指由非反應(yīng)堆自身特性所決定的因素,例如人為以及不可抗力因素。
根據(jù)人為環(huán)境因素,本文在內(nèi)部因素中選取設(shè)計(jì)功率、堆芯高度、堆芯直徑、燃料類型、冷卻液類型和慢化劑類型6個(gè)變量。設(shè)計(jì)功率是衡量核反應(yīng)堆輸出能力的表征量;堆芯高度、堆芯直徑是表征核反應(yīng)堆堆芯大小的幾何量;燃料類型、冷卻液類型及慢化劑類型是代表核反應(yīng)堆類型的表征量。同時(shí),在這些內(nèi)部因素中,設(shè)計(jì)功率、堆芯高度和堆芯直徑是數(shù)值變量;燃料類型、冷卻液類型及慢化劑類型是類別變量。本文使用虛變量表示不同的燃料、冷卻液及慢化劑類型。
對(duì)于外部因素,選取建造地址和人為操作因素作為模型獨(dú)立自變量。建造地址是反映樣本反應(yīng)堆的安全運(yùn)行是否容易遭受由地理位置而帶來(lái)的不可抗力因素,諸如地震或海嘯的影響的表征量。人為因素是反映在整個(gè)核反應(yīng)堆運(yùn)行過(guò)程中,樣本反應(yīng)堆的安全運(yùn)行是否容易遭受由于重大人為操作失誤因素而帶來(lái)的運(yùn)行風(fēng)險(xiǎn)的表征量。同時(shí),在這些外部因素中,兩者均為布爾變量,即0代表建造地址不易受諸如地震、海嘯的影響以及沒(méi)有發(fā)現(xiàn)任何人為操作失誤的歷史記錄;1代表建造地址容易受諸如地震、海嘯的影響及發(fā)現(xiàn)存在人為操作失誤的歷史記錄。本文研究的變量類型見(jiàn)表1所列。
表1 變量因素類型
邏輯回歸模型(logistic regression model,LRM)是基于一系列獨(dú)立自變量預(yù)測(cè)并分類系統(tǒng)應(yīng)變量的統(tǒng)計(jì)學(xué)分析方法[8]。LRM不同于傳統(tǒng)的判別式分析模型,其自變量無(wú)需服從正態(tài)分布,或要求其每個(gè)組別中都有相同的方差[9],存在明顯的優(yōu)勢(shì)。此外,LRM對(duì)其輸入自變量基本不存在任何限制[9]。在本研究中,LRM中的獨(dú)立自變量為布爾類型、類別類型、數(shù)值類型。LRM可允許在不同復(fù)雜程度的模型中進(jìn)行預(yù)測(cè)精確性的對(duì)比。最簡(jiǎn)單的模型是只用一個(gè)與應(yīng)變量具有最顯著數(shù)值關(guān)系的變量作為獨(dú)立自變量的模型,而最復(fù)雜的模型是采取所有可能與系統(tǒng)應(yīng)變量有關(guān)系的變量作為獨(dú)立自變量的模型。本文采用具有最精確的分類預(yù)測(cè)能力,同時(shí)具有最少獨(dú)立自變量的LRM。
本研究使用可產(chǎn)生2種輸出結(jié)果的二元LRM,即輸出結(jié)果可以是判定反應(yīng)堆出現(xiàn)核泄漏事故或反應(yīng)堆無(wú)核泄漏事故。采用50個(gè)來(lái)自不同組別的反應(yīng)堆來(lái)訓(xùn)練回歸模型,即19個(gè)具有核泄漏事故歷史的反應(yīng)堆和31個(gè)無(wú)核泄漏歷史的反應(yīng)堆。選取19個(gè)具有核泄漏事故歷史的反應(yīng)堆的原因在于該類反應(yīng)堆的數(shù)量在全球范圍內(nèi)較少,它們的樣本已經(jīng)充分利用了此類樣本所能提供的有限的信息。對(duì)于另一組31個(gè)無(wú)核泄漏歷史的反應(yīng)堆,首先在數(shù)據(jù)庫(kù)中排除所有具有核泄漏事故歷史的樣本,然后采取隨機(jī)選取的方式在數(shù)據(jù)庫(kù)中剩余的反應(yīng)堆樣本里選取31個(gè)反應(yīng)堆來(lái)組成第2組無(wú)核泄漏歷史記錄的樣本。
在建立LRM之前,本文采用卡方檢驗(yàn)方法(chi-squared method)測(cè)試各個(gè)獨(dú)立自變量與應(yīng)變量的顯著性水平[10-11]。具體步驟為從建立最簡(jiǎn)單的只含有一個(gè)獨(dú)立自變量的模型開(kāi)始到最復(fù)雜的含有所有獨(dú)立自變量的模型,利用ANOVA chi-squared測(cè)試方法檢測(cè)每個(gè)模型之間是否產(chǎn)生顯著性差別,判斷各個(gè)獨(dú)立自變量與應(yīng)變量之間是否存在顯著聯(lián)系[12]。獨(dú)立變量及其顯著性水平對(duì)應(yīng)的P值(顯著性水平概率)見(jiàn)表2所列。
表2 獨(dú)立變量與其顯著性水平
從表2可以看出,每個(gè)獨(dú)立自變量都與發(fā)生核泄漏之間存在潛在的聯(lián)系?;诟鱾€(gè)變量和P值,采取98%(P值小于0.02)和95%(P值小于0.05)2種顯著性水平來(lái)建立模型。對(duì)于98%顯著性回歸模型,只在模型中采取P值小于0.02的獨(dú)立自變量作為預(yù)測(cè)變量,即堆芯高度、冷卻液類型、建造地理位置以及人為因素,而放棄P值大于0.02的獨(dú)立自變量。同理,對(duì)于95%顯著性回歸模型,采取所有P值小于0.05的獨(dú)立自變量作為預(yù)測(cè)變量,即模型中將包括除了設(shè)計(jì)能力和慢化劑類型的所有獨(dú)立自變量。
在這以上2種具有不同顯著性水平的模型中,樣本反應(yīng)堆的輸出泄漏概率大于0.5將會(huì)被分類為發(fā)生核泄漏組,輸出泄漏概率小于0.5將會(huì)被分類至無(wú)核泄漏發(fā)生組。使用Nagelkerke的R2值評(píng)估模型的精確度,即通過(guò)衡量模型樣本預(yù)測(cè)分類成功的概率來(lái)衡量模型評(píng)估核泄漏發(fā)生風(fēng)險(xiǎn)的能力[13]。
本文采取線性判別模型(linear discriminant model,LDM)的方法來(lái)評(píng)估預(yù)測(cè)核泄漏事故發(fā)生風(fēng)險(xiǎn),不同于LRM,LDM同樣有其優(yōu)勢(shì)與劣勢(shì)。在本研究中,較小的樣本容量(50個(gè)核反應(yīng)堆)會(huì)導(dǎo)致LRM所產(chǎn)生的結(jié)果具有不穩(wěn)定性[14]。而在LDM中,在每組樣本數(shù)據(jù)中每一個(gè)自變量服從正態(tài)分布的假設(shè)前提下,可近似地認(rèn)為該模型可以很好地解決這一問(wèn)題[15],然而這也無(wú)法確定在每組樣本數(shù)據(jù)中每一個(gè)自變量確實(shí)嚴(yán)格地服從正態(tài)分布。因此,LDM的存在確實(shí)帶來(lái)了一個(gè)明顯的權(quán)衡,即模型的穩(wěn)定性與不確定性之間的取舍[16]。
對(duì)于建立的LDM,基于表2采取與LRM相同的2種顯著性水平來(lái)考慮。對(duì)于自由模型,采取95%的顯著性水平,模型中包含堆芯高度、堆芯直徑、燃料類別、冷卻劑類別,建造地理位置及人為操作作為獨(dú)立自由變量。對(duì)于保守模型,采取98%的顯著性水平,模型中僅包含堆芯高度、冷卻劑類別、建造地理位置及人為操作作為獨(dú)立自由變量。在二分問(wèn)題中,與LRM類似采取50%作為既定觀測(cè)值來(lái)區(qū)分樣本。
基于LRM和LDM,采用支持向量機(jī)(support vector machine,SVM)的方法來(lái)學(xué)習(xí)并分類核反應(yīng)堆樣本。采取與前2個(gè)模型相同的顯著性水平來(lái)建立SVM模型。不同的是在SVM中,采取徑向核的方法來(lái)達(dá)到實(shí)現(xiàn)非線性邊界決策的效果[17]。同時(shí)采取十折交叉驗(yàn)證的方法,即將樣本容量均等分為2組,即每組25個(gè)樣本個(gè)例,分別用其來(lái)訓(xùn)練模型和檢測(cè)模型[18]。該方法可對(duì)每種顯著性水平的SVM選取最佳的代價(jià)函數(shù)cost及徑向核參數(shù)γ。
3.1.1 邏輯回歸的自由模型
在自由模型中,有堆芯高度、堆芯直徑、燃料類別、冷卻液類別、建造地址以及人為因素這6個(gè)預(yù)測(cè)變量可以達(dá)到95%的顯著性水平,因此該模型中包含這6個(gè)預(yù)測(cè)變量。該自由模型公式為:
(1)
x=-18.08-0.22HC-0.91DC+0.71TF1+
9.76TF2+14.19TF3+0.001TF4+19.37LC1+
15.34LC2+22.81LC3-4.25PLC+6.52PHU
(2)
該模型的預(yù)測(cè)準(zhǔn)確率為92%,具體預(yù)測(cè)結(jié)果見(jiàn)表3所列。該模型的R2值為0.76,P值為2.86E-05,模型具體信息見(jiàn)表4所列。
表3 LRM中自由模型預(yù)測(cè)結(jié)果
表4 LRM中自由模型計(jì)算結(jié)果
采用受試者工作特征曲線 (receiver operating characteristic curve,ROC)及其線下面積(area under the curve,AUC)來(lái)評(píng)估本文中出現(xiàn)的所有判別模型的預(yù)測(cè)能力。ROC曲線是根據(jù)一系列不同的二分類方式,以真陽(yáng)性率(敏感度)為縱坐標(biāo),假陽(yáng)性率(特異性)為橫坐標(biāo)繪制的曲線[19]。AUC是衡量模型優(yōu)劣的一種性能指標(biāo),其越接近于1.0,分類方法真實(shí)性越高,等于0.5時(shí),則真實(shí)性最低,模型無(wú)應(yīng)用價(jià)值[20-22]。該自由模型的ROC曲線如圖1所示, AUC值為0.953 1。
圖1 LRM中自由模型的ROC曲線
3.1.2 邏輯回歸的保守模型
在保守模型中,有堆芯高度、燃料類別、建造地址以及人為因素4個(gè)預(yù)測(cè)變量可以達(dá)到98%的顯著性水平,因此該模型中包含這4個(gè)預(yù)測(cè)變量。模型公式為:
P/(1-P)=ey
(3)
y=-19.05-0.39HC+18.69LC1+
18.55LC2+21.64LC3-3.16PLC+4.79PHU
(4)
該模型的預(yù)測(cè)準(zhǔn)確率為88%,具體預(yù)測(cè)結(jié)果見(jiàn)表5所列。該模型的R2的值為0.68,P值為6.41E-06,計(jì)算結(jié)果見(jiàn)表6所列。該保守模型的ROC曲線如圖2所示,AUC值為0.946 2。
圖2 LRM中保守模型的ROC曲線
表5 LRM中保守模型預(yù)測(cè)結(jié)果
表6 LRM中保守模型計(jì)算結(jié)果
3.2.1 線性判別的自由模型
在線性判別的自由模型中,先驗(yàn)概率值πk通過(guò)訓(xùn)練模型數(shù)據(jù)部分計(jì)算得出,核泄漏組和無(wú)核泄漏組πk值依次為0.36、0.64。在LDM中,假設(shè)每個(gè)預(yù)測(cè)變量都近似地服從高斯分布。高斯分布的系數(shù)平均值μk、方差σ2可由樣本數(shù)據(jù)來(lái)預(yù)估得到。線性判別模型中利用這些預(yù)測(cè)變量的高斯分布信息構(gòu)建。在線性判別過(guò)程中主要步驟分為抽取步驟和分類步驟。
在抽取步驟中,輸入的預(yù)測(cè)變量線性組合形成判別式隱藏變量。該模型中相關(guān)預(yù)測(cè)變量的系數(shù)及判別式系數(shù)分別見(jiàn)表7所列。具體的2組數(shù)據(jù)的判別結(jié)果如圖3所示。從圖3可以看出,在每組中判別式的分布差別較大,表明該模型可較好區(qū)分2組數(shù)據(jù)。
表7 預(yù)測(cè)變量的μk和判別式系數(shù)
自由模型的預(yù)測(cè)準(zhǔn)確率為86%,具體預(yù)測(cè)結(jié)果見(jiàn)表8所列。自由模型的ROC曲線如圖4所示,AUC值為0.960 1。
圖4 LDM中的自由模型ROC曲線
表8 LDM中自由模型預(yù)測(cè)結(jié)果
3.2.2 線性判別的保守模型
保守的線性判別模型只包含堆芯高度、冷卻液類別、建造地址與人為因素4個(gè)預(yù)測(cè)變量。該保守模型的樣本先驗(yàn)概率值πk與自由模型中的先驗(yàn)概率值相同,先驗(yàn)概率及保守模型判別式系數(shù)見(jiàn)表9所列。
表9 預(yù)測(cè)變量的πk和判別式系數(shù)
LDM中的保守模型判別結(jié)果如圖5所示。保守模型的預(yù)測(cè)準(zhǔn)確率為88%,具體預(yù)測(cè)結(jié)果見(jiàn)表10所列 。
圖5 保守模型的線性判別式
表10 LDM中保守模型預(yù)測(cè)結(jié)果
ROC曲線如圖6所示,AUC值為0.941 0。
圖6 LDM中的保守模型ROC曲線
3.3.1 支持向量機(jī)的自由模型
在SVM的自由模型中,同樣包含與前面所有自由模型相同的6個(gè)預(yù)測(cè)變量。在SVM模型建立過(guò)程中,把50個(gè)樣本核反應(yīng)堆均等分為訓(xùn)練模型部分和檢驗(yàn)?zāi)P筒糠?。利用十折交叉?yàn)證的方法,SVM自由模型最佳參數(shù)選擇代價(jià)函數(shù)cost取5,徑向核參數(shù)γ取1。SVM中的自由模型在檢驗(yàn)數(shù)據(jù)下的ROC曲線如圖7所示,該曲線與橫坐標(biāo)之間的面積為0.618 1。利用檢驗(yàn)數(shù)據(jù)計(jì)算得出模型的預(yù)測(cè)精確度為68%。自由模型的預(yù)測(cè)結(jié)果見(jiàn)表11所列。
圖7 SVM中的自由模型ROC曲線
表11 SVM的自由模型的預(yù)測(cè)結(jié)果
3.3.2 支持向量機(jī)的保守模型
在SVM的保守模型中,預(yù)測(cè)變量的數(shù)量減少為4個(gè)。同樣利用十折交叉驗(yàn)證的方法,選擇的最佳參數(shù)代價(jià)函數(shù)cost取1,γ徑向核參數(shù)取1。SVM中的保守模型在檢驗(yàn)數(shù)據(jù)下的ROC曲線如圖8所示,AUC為0.611 1。利用檢驗(yàn)數(shù)據(jù)計(jì)算得出該保守模型的預(yù)測(cè)精確度為84%,高于自由模型。SVM的保守模型預(yù)測(cè)結(jié)果見(jiàn)表12所列。
圖8 SVM中的保守模型ROC曲線
表12 SVM中保守模型預(yù)測(cè)結(jié)果
通過(guò)統(tǒng)計(jì)模型的構(gòu)建,確定影響核泄漏事故的重要因素。對(duì)比自由模型與保守模型可看出,在核泄漏事故中,堆芯高度、建造地理位置及人為因素是影響事故發(fā)生的重要因素。值得注意的是,在自由模型和保守模型中,堆芯高度的讓步比均小于1,表明此預(yù)測(cè)變量與核泄漏事故發(fā)生風(fēng)險(xiǎn)之間可能存在負(fù)相關(guān)的關(guān)系。
另一個(gè)重要的影響因素是人為因素。在所有模型中,人為因素與核泄漏事故發(fā)生風(fēng)險(xiǎn)均存在非常明顯的正相關(guān)關(guān)系:在越有可能發(fā)生人為操作失誤的樣本中,發(fā)生核泄漏事故的風(fēng)險(xiǎn)越大。人為因素也可能會(huì)是主導(dǎo)所有其他因素并成為影響核泄漏事故發(fā)生的唯一因素。盡管在樣本核反應(yīng)堆中,有一些未發(fā)生過(guò)核泄漏事故的樣本也存在人為操作失誤的歷史記錄,但這并不妨礙人為操作失誤可以直接導(dǎo)致核泄漏事故發(fā)生這一結(jié)論。同時(shí),基于LRM發(fā)現(xiàn)人為操作這一預(yù)測(cè)變量的讓步比大于1,P值較小,說(shuō)明在本研究中,人為因素可覆蓋其他所有預(yù)測(cè)變量的趨勢(shì)并有可以單獨(dú)主導(dǎo)核泄漏事故發(fā)生的可能性。即使增大樣本大小,人為因素與核泄漏事故之間聯(lián)系的強(qiáng)度不會(huì)改變,依然可能是影響核泄漏事故發(fā)生的最重要因素。
文中模型潛在的不確定性主要來(lái)自樣本數(shù)據(jù),樣本數(shù)據(jù)的大小偏小。雖然歷史上發(fā)生核泄漏事故的次數(shù)較多,但關(guān)于這些核泄漏事故的詳細(xì)歷史記錄較少,因此極難囊括所有的核泄漏事故并把它們?nèi)慷加迷诖搜芯繕颖局?。尤其在LRM中,較小的樣本數(shù)量可能會(huì)在構(gòu)建該模型時(shí)造成誤差,因此LRM的精確度會(huì)隨著樣本數(shù)量的增加而變得更為精確。另外,在樣本反應(yīng)堆中,采用現(xiàn)階段不同運(yùn)行狀態(tài)的核反應(yīng)堆。這些不同運(yùn)行狀態(tài)的核反應(yīng)堆樣本會(huì)在一定程度上給模型結(jié)果帶來(lái)不確定性。例如,將正在安全運(yùn)行的核反應(yīng)堆樣本完全歸為安全的無(wú)核泄漏事故發(fā)生的核反應(yīng)堆樣本是不嚴(yán)謹(jǐn)?shù)摹:诵孤┦鹿适且环N一次性事件,不能被看作反應(yīng)堆內(nèi)部的自有特性,因此不會(huì)發(fā)生核泄漏事故與目前還沒(méi)有發(fā)生核泄漏事故是不能完全等價(jià)的。也就是說(shuō),對(duì)于這些目前還沒(méi)有發(fā)生核泄漏事故的“干凈”的核反應(yīng)堆樣本,其在未來(lái)依然有發(fā)生核泄漏事故的風(fēng)險(xiǎn),盡管概率很低。從另外一個(gè)角度來(lái)詮釋這一樣本不確定性,發(fā)生核泄漏事故可被視作為一個(gè)核反應(yīng)堆的內(nèi)在“基因”,一些樣本核反應(yīng)堆已經(jīng)展示出了此“基因”,另外一些樣本核反應(yīng)堆在現(xiàn)階段還沒(méi)有展示出此“基因”,但并不能完全排除其沒(méi)有易發(fā)生核泄漏事故的“基因”。然而,本文研究的是評(píng)估一些列核反應(yīng)堆的內(nèi)在、外在屬性與其發(fā)生核泄漏事故“基因”之間的內(nèi)在聯(lián)系,卻使用這些樣本的外在表現(xiàn)來(lái)代表其內(nèi)在發(fā)生核泄漏事故“基因”,這必然會(huì)給模型結(jié)果帶來(lái)不確定性。此外,本文對(duì)預(yù)測(cè)變量之間存在的關(guān)聯(lián)性進(jìn)行探討,以日本的核反應(yīng)堆為例,由于日本傾向于建造沸水型反應(yīng)堆(boiling water reactor,BWR),采取的來(lái)自日本的核反應(yīng)堆樣本傾向?yàn)锽WR,這些樣本均有很相似的燃料類型、冷卻液類型以及慢化劑類型等特性。由于日本國(guó)的國(guó)土面積較小,在靠近海岸線的位置建造核反應(yīng)堆是不得已選擇,會(huì)大大增加核反應(yīng)堆受到海嘯或者地震影響而發(fā)生核泄漏事故的概率,從而在一些樣本核反應(yīng)堆中,可以很明顯得到預(yù)測(cè)變量之間的關(guān)聯(lián)性。預(yù)測(cè)變量之間的關(guān)聯(lián)性如圖9所示。
圖9 預(yù)測(cè)變量之間的相關(guān)性
根據(jù)以上分析,本文所建立的LRM和與LDM均由相同的一組數(shù)據(jù)訓(xùn)練和測(cè)試,LRM和與LDM中的預(yù)測(cè)準(zhǔn)確性就是樣本數(shù)據(jù)的訓(xùn)練誤差。因此對(duì)于這2種模型,當(dāng)其被用于預(yù)測(cè)一組新的數(shù)據(jù)時(shí),模型所產(chǎn)生的真實(shí)的預(yù)測(cè)準(zhǔn)確性要低于上述所報(bào)道的預(yù)測(cè)準(zhǔn)確性。此外本文所建立的SVM的預(yù)測(cè)誤差要大于LRM和LDM,說(shuō)明這2種模型在預(yù)測(cè)新的數(shù)據(jù)時(shí)可能會(huì)產(chǎn)生大于本文所報(bào)道的預(yù)測(cè)誤差的結(jié)果。
本文6種模型的預(yù)測(cè)準(zhǔn)確率對(duì)比見(jiàn)表13所列。對(duì)比自由模型與保守模型發(fā)現(xiàn),保守模型的預(yù)測(cè)準(zhǔn)確率要大于自由模型的,除了LRM的情況。對(duì)比不同模型的預(yù)測(cè)能力發(fā)現(xiàn),LRM的預(yù)測(cè)準(zhǔn)確率要強(qiáng)于其他2種判別模型??傮w來(lái)看,3種不同模型類別均具有基本預(yù)測(cè)核反應(yīng)堆發(fā)生核泄漏事故風(fēng)險(xiǎn)的能力。
表13 模型的預(yù)測(cè)準(zhǔn)確率對(duì)比 %
另外一種直觀地對(duì)比3種不同類型模型的預(yù)測(cè)能力的方法就是通過(guò)比較ROC曲線的AUC。3種自由模型與保守模型的ROC曲線對(duì)比分別如圖10、圖11所示。
圖10 自由模型的ROC曲線對(duì)比
圖11 保守模型的ROC曲線對(duì)比
由圖10、圖11可知,LRM和LDM的預(yù)測(cè)能力均比SVM更精確,然而SVM有最接近真實(shí)值的預(yù)測(cè)準(zhǔn)確性,因此也是解決這一類問(wèn)題非常好的的模型類別,尤其考慮到該風(fēng)險(xiǎn)評(píng)估系統(tǒng)的非線性特征。
本文通過(guò)構(gòu)建概率統(tǒng)計(jì)分析模型探究核反應(yīng)堆中的內(nèi)部和外部因素與核泄漏事故之間的關(guān)聯(lián)性,并對(duì)核泄漏風(fēng)險(xiǎn)的影響因素進(jìn)行評(píng)估。通過(guò)對(duì)3種不同模型研究并預(yù)測(cè)核反應(yīng)堆發(fā)生核泄漏事故風(fēng)險(xiǎn)的安全評(píng)估能力。利用樣本中的訓(xùn)練數(shù)據(jù)組與檢測(cè)數(shù)據(jù)組構(gòu)建3種不同概率統(tǒng)計(jì)分析模型并檢測(cè)其預(yù)測(cè)能力。LRM中自由模型的預(yù)測(cè)準(zhǔn)確率為92%,保守模型的預(yù)測(cè)準(zhǔn)確率為88%;LDM中自由模型的預(yù)測(cè)準(zhǔn)確率為86%,保守模型的預(yù)測(cè)準(zhǔn)確率為88%;SVM中自由模型的預(yù)測(cè)準(zhǔn)確率為68%,其保守模型的預(yù)測(cè)準(zhǔn)確率為84%。
通過(guò)構(gòu)建并比較3種不同類型的概率統(tǒng)計(jì)分析模型發(fā)現(xiàn),核反應(yīng)堆內(nèi)部和外部因素均會(huì)影響核泄漏事故發(fā)生的安全風(fēng)險(xiǎn)。但在這些影響因素中,外部因素比內(nèi)部因素更具有支配地位,并在整個(gè)評(píng)估體系中起主要作用。此外,雖然LRM和LDM在預(yù)測(cè)計(jì)算方面相較于SVM更加精準(zhǔn),但其仍然沒(méi)有SVM在這個(gè)風(fēng)險(xiǎn)評(píng)估體系中更加適用,原因是該風(fēng)險(xiǎn)評(píng)估體系是非線性的。