朱曉樂(lè),肖松濤,歐陽(yáng)應(yīng)根
中國(guó)原子能科學(xué)研究院 放射化學(xué)研究所,北京 102413
钚是一種重要的戰(zhàn)略資源,是制造核武器和核燃料的關(guān)鍵材料。Pu在水溶液中的化學(xué)行為比較復(fù)雜,以多價(jià)態(tài)共存的方式存在。其中Pu(Ⅳ)易被TBP萃取到有機(jī)相,而Pu(Ⅲ)不易被萃取到有機(jī)相,在PUREX流程中可利用這個(gè)特點(diǎn)將Pu(Ⅳ)還原為Pu(Ⅲ)實(shí)現(xiàn)鈾钚的分離和钚的純化。
王婷[1]、邵開(kāi)元[2]、石靈娟[3]等分別對(duì)有機(jī)污染物的混合毒性、催眠類(lèi)藥物的毒性、多環(huán)芳烴的熒光強(qiáng)度進(jìn)行了定量構(gòu)效關(guān)系研究,均得到了理想的結(jié)果。其中邵開(kāi)元[2]為了改善定量構(gòu)效關(guān)系(quantitative structure-activity relationship, QSAR)模型,提出了化學(xué)勢(shì)變化率這一量化參數(shù),最終使QSAR相關(guān)性得到提高,降低了預(yù)測(cè)誤差。
Norinder[4]、鄧景景[5]和張永紅[6]將偏最小二乘法(partial least square, PLS)應(yīng)用于QSAR研究,在處理多重相關(guān)性的問(wèn)題上表現(xiàn)良好。鄧景景還指出,使用PLS方法建模,較多元線性回歸(multiple linear regression, MLR)具有更好的擬合能力和穩(wěn)定性。
PLS-Bootstrap法用于定量構(gòu)效關(guān)系研究的情況較少。金志超[7]提出,使用PLS-Bootstrap法對(duì)變量進(jìn)行篩選,能解決受實(shí)驗(yàn)條件限制導(dǎo)致的樣本數(shù)較少的問(wèn)題,并可應(yīng)用于化學(xué)藥物的活性與親油性等參數(shù)之間相關(guān)關(guān)系的預(yù)測(cè)。Bras[8]則將PLS-Bootstrap法進(jìn)行了拓展,用于篩選波數(shù)間隔。雖尚未發(fā)現(xiàn)有文獻(xiàn)報(bào)道將PLS-Bootstrap法用于QSAR研究工作中,但由于該方法可實(shí)現(xiàn)變量的篩選,因此本課題組將使用PLS-Bootstrap法進(jìn)行QSAR研究。本工作將在之前的研究基礎(chǔ)上[9],在剔除錯(cuò)誤樣本點(diǎn)后重新建立定量構(gòu)效關(guān)系。將分別使用逐步回歸法和PLS-Bootstrap法來(lái)建立定量構(gòu)效關(guān)系模型并進(jìn)行交叉檢驗(yàn)和外部檢驗(yàn)。
Pu(Ⅳ)與肼衍生物反應(yīng)的半反應(yīng)時(shí)間t1/2及它們的量化參數(shù)列入表1和表2[9],肼衍生物結(jié)構(gòu)示于圖1[9]。考慮到肼衍生物與Pu(Ⅳ)的半反應(yīng)時(shí)間存在著數(shù)量級(jí)差異,因此將它們轉(zhuǎn)化成自然對(duì)數(shù)后再進(jìn)行定量構(gòu)效關(guān)系研究。肼衍生物與Pu(Ⅳ)反應(yīng)的半反應(yīng)時(shí)間可用于表示該反應(yīng)進(jìn)行的快慢程度。半反應(yīng)時(shí)間越小,該反應(yīng)進(jìn)行得越快。量化參數(shù)有最高占據(jù)軌道能(EHOMO)、最低非占軌道能(ELUMO)、前線軌道能量差(ΔE=ELUMO-EHOMO)、分子總能量(E)、分子偶極矩(μ)、疏水性參數(shù)(lgP)、分子折射率(R)、分子摩爾體積(V)、分子表面積(A)、網(wǎng)格化分子表面積(G)、相對(duì)分子質(zhì)量(Mr)、分子極化率(P)以及水合能(EH)等。
表1 肼衍生物與Pu(Ⅳ)反應(yīng)的半反應(yīng)時(shí)間[9]
為了考察半反應(yīng)時(shí)間與量化參數(shù)的相關(guān)性、量化參數(shù)之間的相關(guān)性,求解其Pearson矩陣,列于表3。由于Pearson矩陣為對(duì)稱(chēng)矩陣,且主對(duì)角元的相關(guān)性系數(shù)均為1,概率p值均為0,因此僅求出其上半部分的相關(guān)性系數(shù)及對(duì)應(yīng)的p值。由表3可知,半反應(yīng)時(shí)間(t1/2)與最高占據(jù)軌道能(EHOMO)、前線軌道能量差(ΔE)、分子偶極矩(μ)、疏水性參數(shù)(lgP)有較強(qiáng)的線性相關(guān)性,相關(guān)系數(shù)均達(dá)到0.6以上,且不相關(guān)的可能性p均小于0.05,即半反應(yīng)時(shí)間與這些參數(shù)均存在相關(guān)性,但線性相關(guān)性并不強(qiáng)。此外,各參數(shù)之間也存在相關(guān)關(guān)系,如最高占據(jù)軌道能(EHOMO)與前線軌道能量差(ΔE)存在強(qiáng)相關(guān)性,與偶極矩存在較強(qiáng)的相關(guān)性;最低非占軌道能(ELUMO)則與前線軌道能量差(ΔE)、疏水性參數(shù)(lgP)、水合能(EH)之外的其他量化參數(shù)均存在較強(qiáng)的相關(guān)性。即量化參數(shù)之間存在著較強(qiáng)的相關(guān)性,無(wú)法直接進(jìn)行回歸建模,因此將分別使用逐步回歸法和PLS-Bootstrap法對(duì)量化參數(shù)進(jìn)行篩選,再通過(guò)回歸分析的方法建立定量構(gòu)效關(guān)系模型,且半反應(yīng)時(shí)間與量化參數(shù)之間存在相關(guān)性但線性相關(guān)性并不強(qiáng),故還需要考慮非線性定量構(gòu)效關(guān)系模型。
表2 肼衍生物的量化參數(shù)[9]
表3 Pearson相關(guān)性矩陣
逐步回歸法是結(jié)合了變量篩選與回歸的一種方法,在每一步中,都要分別考查所有的參數(shù)與因變量的相關(guān)性,將未引入方程中但相關(guān)性最顯著的參數(shù)引入方程,即將p值最小的參數(shù)引入方程,而將方程中相關(guān)性不夠強(qiáng)的參數(shù)剔除掉。為防止被剔除的參數(shù)能再次被引入而形成死循環(huán),一般設(shè)置剔除參數(shù)的p臨界值(premove)要大于進(jìn)入方程的p臨界值(penter)。一般默認(rèn)設(shè)置為penter=0.05,premove=0.10。逐步回歸法的結(jié)果是否有意義需要由F檢驗(yàn)確定,各參數(shù)與因變量的相關(guān)性是否顯著則應(yīng)當(dāng)由t檢驗(yàn)確定。
PLS被認(rèn)為是一種能較好處理自變量共線性和樣本數(shù)較少的回歸方法,在對(duì)每一個(gè)成分進(jìn)行回歸時(shí)都要完成提取主成分、相關(guān)性分析和回歸三個(gè)步驟。首先對(duì)自變量與因變量各提取一個(gè)主成分,并使自變量的主成分與因變量的主成分相關(guān)性最大,其次使用自變量的主成分對(duì)因變量進(jìn)行回歸,然后分別求得經(jīng)過(guò)回歸之后自變量與因變量的殘差,并使用殘差分別代替自變量與因變量重復(fù)前述步驟進(jìn)行回歸。一般情況下不需要選擇所有的成分來(lái)建立回歸方程,僅需要選用前幾個(gè)成分即可得到預(yù)測(cè)能力較好的回歸方程。需要注意的是,使用PLS進(jìn)行回歸時(shí)所有的參數(shù)都會(huì)被引入方程,其中可能會(huì)包括部分相關(guān)性不顯著的參數(shù),考慮到Bootstrap作為一種檢驗(yàn)方法,能較好地處理樣本數(shù)較少的情況,通過(guò)蒙特卡羅隨機(jī)抽樣的方法建立Bootstrap樣本,然后對(duì)Bootstrap樣本進(jìn)行回歸,將回歸系數(shù)按大小順序排列并選定一定的分位數(shù),若該數(shù)大于原樣本回歸方程中的回歸系數(shù),則該參數(shù)應(yīng)當(dāng)從方程中剔除。將PLS與Bootstrap結(jié)合起來(lái)進(jìn)行回歸分析時(shí),可以將相關(guān)性不顯著的參數(shù)從方程中剔除掉,使方程的意義更明確。由于Bootstrap本身已包含了對(duì)各參數(shù)的檢驗(yàn),故無(wú)需對(duì)各參數(shù)進(jìn)行t檢驗(yàn)。
本工作使用了Matlab 2014b軟件來(lái)進(jìn)行回歸處理,在逐步回歸法中調(diào)用了程序自帶的stepwise和stepwisefit函數(shù)來(lái)進(jìn)行逐步回歸,在PLS-Bootstrap法中調(diào)用了程序自帶的plsregress函數(shù)實(shí)現(xiàn)PLS的部分,使用rand函數(shù)結(jié)合for循環(huán)語(yǔ)句,按照文獻(xiàn)[7]的步驟來(lái)實(shí)現(xiàn)Bootstrap的部分。
利用逐步回歸法進(jìn)行回歸分析,在完成回歸分析任務(wù)的同時(shí),也完成了變量的篩選。在默認(rèn)的設(shè)置(penter≤0.05,premove>0.10)下,對(duì)其進(jìn)行逐步回歸,得到的結(jié)果列入表 4。由表4知,第1、2、6個(gè)變量,即最高占據(jù)軌道能(EHOMO)、最低非占軌道能(ELUMO)和疏水性參數(shù)(lgP)保留在方程中,方程為t1/2=54.939EHOMO+176.841ELUMO+6.363 lgP+27.718。其方程的分子自由度為3,分母自由度為6,F(xiàn)統(tǒng)計(jì)量值為37.719,即F(3,6)=37.719>4.76=F0.05(3,6),即在95%的置信度上該回歸方程有意義,對(duì)應(yīng)的調(diào)整相關(guān)系數(shù)即調(diào)整r2=0.924。標(biāo)準(zhǔn)化回歸方程為y=0.384x1+0.463x2+0.701x6。標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值反映了該自變量對(duì)因變量的影響大小,故疏水性參數(shù)是該反應(yīng)的主要特征參數(shù),且疏水性參數(shù)越大,半反應(yīng)時(shí)間越大,該反應(yīng)進(jìn)行得越慢;最高占據(jù)軌道能(EHOMO)和最低非占軌道能(ELUMO)是該反應(yīng)的次要特征參數(shù),且它們的值越大,半反應(yīng)時(shí)間越大,該反應(yīng)進(jìn)行得越慢。
下面考慮非線性關(guān)系,由于參數(shù)較多,考慮指數(shù)形式,假設(shè)存在指數(shù)關(guān)系,則有
y=Ae(Bx1+Cx2+Dx3)=e(Bx1+Cx2+Dx3+A′)
其中A′=lnA。兩邊同取對(duì)數(shù)得:
lny=A′+Bx1+Cx2+Dx3
若將半反應(yīng)時(shí)間取自然對(duì)數(shù),則其對(duì)數(shù)值與變量依舊呈線性關(guān)系。按此方法處理后進(jìn)行回歸分析,得非線性回歸方程t1/2=e(5.543EHOMO+17.201ELUMO+0.560lg P+4.010),方程的調(diào)整r2=0.928,F(xiàn)統(tǒng)計(jì)量為39.964>4.76=F0.05(3,6)。標(biāo)準(zhǔn)化回歸方程t1/2=e(0.413x1+0.479x2+0.656x3)。疏水性參數(shù)(lgP)仍為該反應(yīng)的主要特征參數(shù),最高占據(jù)軌道能(EHOMO)和最低非占軌道能(ELUMO)仍為該反應(yīng)的次要特征參數(shù),且它們的值越大,半反應(yīng)時(shí)間越大,該反應(yīng)進(jìn)行得越慢。
表4 逐步回歸結(jié)果
注:“In”為變量在方程中出現(xiàn),“Out”為變量在方程中未出現(xiàn)
在使用PLS進(jìn)行回歸分析時(shí),需要確定提取的成分?jǐn)?shù)。一般情況下,當(dāng)所選取成分包含的信息量達(dá)到85%時(shí),便認(rèn)為信息已經(jīng)提取完全,因此,把X信息量與Y信息量均達(dá)到85%時(shí)的最小成分?jǐn)?shù)作為PLS回歸分析時(shí)提取成分?jǐn)?shù),對(duì)所有樣本進(jìn)行處理,結(jié)果列入表5。
表5 PLS回歸分析的成分?jǐn)?shù)與信息量關(guān)系
注:1) “-”,在第二次回歸中,當(dāng)成分?jǐn)?shù)為4時(shí),X信息量已達(dá)到1,繼續(xù)增加成分?jǐn)?shù)也不會(huì)提升信息量,故無(wú)需對(duì)更多成分?jǐn)?shù)的情況進(jìn)行計(jì)算
在第一次篩選中,成分?jǐn)?shù)為2時(shí),包含的X信息量?jī)H為0.801,而Y信息量達(dá)到了0.872;當(dāng)成分?jǐn)?shù)為3時(shí),包含的X信息量為0.877,Y信息量為0.946,因此,選定PLS提取的成分?jǐn)?shù)為3,進(jìn)行Bootstrap檢驗(yàn),結(jié)果列入表6。在經(jīng)過(guò)第一次篩選后,僅有最高占據(jù)軌道能、分子總能量、疏水性參數(shù)和相對(duì)分子質(zhì)量被保留。然后進(jìn)行第二次的PLS-Bootstrap法篩選,首先進(jìn)行PLS回歸分析(表5),確定提取的成分?jǐn)?shù)為3,然后再進(jìn)行Bootstrap檢驗(yàn),結(jié)果列入表6。由表6可知,最終僅有最高占據(jù)軌道能和疏水性參數(shù)被保留下來(lái)。下面將使用經(jīng)過(guò)兩次篩選后仍被保留的參數(shù)進(jìn)行回歸分析。使用最高占據(jù)軌道能和疏水性參數(shù)對(duì)半反應(yīng)時(shí)間進(jìn)行回歸分析,得方程t1/2=92.673EHOMO+4.866 lgP+34.956。調(diào)整r2=0.766,統(tǒng)計(jì)量F=15.730>4.74=F0.05(2,7),即在95%的置信度上該回歸方程有意義,模型示于圖2。所有的PLS-Bootstrap法的分位數(shù)均選為0.95。
以同樣的方法對(duì)半反應(yīng)時(shí)間進(jìn)行處理以考慮其非線性關(guān)系,并對(duì)其進(jìn)行回歸分析,得非線性回歸方程t1/2=e(0.195 8EHOMO+0.138 6lg P+2.371),調(diào)整r2=0.758,模型示于圖3。比較其調(diào)整r2,顯然線性模型較非線性模型略?xún)?yōu)。
表6 PLS-Bootstrap法對(duì)參數(shù)進(jìn)行篩選的結(jié)果
注:1) “-”,由于第一次篩選已經(jīng)將對(duì)應(yīng)的變量排除在方程外,它們將不會(huì)參與第二次篩選,故其對(duì)應(yīng)值均不存在
圖2 PLS-Bootstrap法線性模型
圖3 PLS-Bootstrap法非線性模型
無(wú)論是線性模型還是非線性模型,結(jié)果均表明,最高占據(jù)軌道能(EHOMO)和疏水性參數(shù)(lgP)是該反應(yīng)的特征參數(shù),且它們的值越大,該反應(yīng)的半反應(yīng)時(shí)間越大,即反應(yīng)進(jìn)行得越慢。
為了對(duì)模型進(jìn)行比較,同時(shí)也對(duì)前人定量構(gòu)效研究進(jìn)行補(bǔ)充,將對(duì)兩種方法建立的模型進(jìn)行留一法(leave one only, LOO)交叉檢驗(yàn),并對(duì)被剔除的樣本點(diǎn)叔丁基肼的部分量化參數(shù)進(jìn)行訂正后作為外部檢驗(yàn)點(diǎn)進(jìn)行檢驗(yàn)[10]。
使用LOO交叉檢驗(yàn)后得到的結(jié)果列入表 7。由表7可知:兩種方法的交叉檢驗(yàn)系數(shù)(Q2)均大于0.5,其中逐步回歸法的Q2達(dá)到了0.820,表明逐步回歸法建立的線性模型穩(wěn)定性較優(yōu)秀,因此就穩(wěn)定性而言,逐步回歸法建立的線性模型更好。由于逐步回歸法建立的線性模型與非線性模型相比無(wú)明顯差別,調(diào)整r2分別為0.924和0.928,因此不再單獨(dú)對(duì)其非線性模型進(jìn)行討論,即使非線性模型從調(diào)整r2上看比線性模型略?xún)?yōu)。
表7 逐步回歸法及PLS-Bootstrap法交叉檢驗(yàn)結(jié)果
由于兩種方法僅用到了最高占據(jù)軌道能(EHOMO)、最低非占軌道能(ELUMO)和疏水性參數(shù)(lgP),使用了參考文獻(xiàn)[8]的逐步回歸法,在對(duì)叔丁基肼的結(jié)構(gòu)進(jìn)行校正后重新計(jì)算了這些參數(shù)的值,結(jié)果如下:最高占據(jù)軌道能EHOMO=-0.237,最低非占軌道能ELUMO=-0.006,疏水性參數(shù) lgP=0.370,半反應(yīng)時(shí)間對(duì)數(shù)值 lnt1/2=16.240。使用兩種線性模型分別對(duì)lnt1/2進(jìn)行預(yù)測(cè),并與觀測(cè)值進(jìn)行對(duì)比,得到逐步回歸模型預(yù)測(cè)值為15.991,PLS-Bootstrap模型預(yù)測(cè)值為14.793,結(jié)果列入表8。由表8可知,逐步回歸法對(duì)外部樣本點(diǎn)的預(yù)測(cè)誤差更小,誤差不足2%,而PLS-Bootstrap模型的預(yù)測(cè)誤差已接近10%。就叔丁基肼作為外部檢驗(yàn)點(diǎn)而言,逐步回歸法表現(xiàn)更優(yōu)秀,但外部檢驗(yàn)點(diǎn)樣本點(diǎn)數(shù)量較少,并不意味著逐步回歸法的預(yù)測(cè)能力一定強(qiáng)于PLS-Bootstrap法。
表8 外部檢驗(yàn)結(jié)果
總體上來(lái)看,逐步回歸模型中包含了三個(gè)參數(shù),且交叉檢驗(yàn)、外部檢驗(yàn)結(jié)果均優(yōu)于PLS-Bootstrap模型,而后者雖然只包含了兩個(gè)參數(shù),但從Pearson相關(guān)性矩陣可以看出,這兩個(gè)參數(shù)均與半反應(yīng)時(shí)間有較強(qiáng)的相關(guān)性,而差異之處在于相關(guān)性相對(duì)較弱的最低非占軌道能(ELUMO),這正好表明了通過(guò)提取成分進(jìn)行相關(guān)性分析的PLS更能有效地保證自變量與因變量之間的相關(guān)性。
為了進(jìn)一步探討最低非占軌道能(ELUMO)對(duì)模型的影響,以比較兩種回歸方法的異同,下面將使用相同的變量分別建立回歸方程。由于參與回歸的變量已經(jīng)被指定,逐步回歸法無(wú)需再進(jìn)行變量篩選,因此可使用最小二乘回歸法代替逐步回歸法進(jìn)行比較,而PLS-Bootstrap法無(wú)需再進(jìn)行變量篩選,在回歸過(guò)程中也無(wú)須進(jìn)行Bootstrap檢驗(yàn)。對(duì)比實(shí)驗(yàn)一指定的變量有疏水性參數(shù)、最高占據(jù)軌道能和最低非占軌道能,對(duì)比實(shí)驗(yàn)二指定的變量有疏水性參數(shù)和最高占據(jù)軌道能。
對(duì)比實(shí)驗(yàn)一中,逐步回歸法回歸方程為t1/2=54.939EHOMO+176.841ELUMO+6.363 lgP+27.718,PLS回歸方程為t1/2=70.866EHOMO+126.893ELUMO+5.916 lgP+30.992;對(duì)比實(shí)驗(yàn)二中,逐步回歸法回歸方程為t1/2=92.673EHOMO+4.866 lgP+34.956,PLS回歸方程為t1/2=92.673EHOMO+4.866 lgP+34.956;對(duì)比實(shí)驗(yàn)一與實(shí)驗(yàn)二的各參數(shù)列于表9 。由表9可知,當(dāng)變量數(shù)為三個(gè)時(shí),PLS在回歸時(shí)認(rèn)為僅需提取兩個(gè)成分?jǐn)?shù)即可建立效果較好的回歸方程,當(dāng)所有的成分?jǐn)?shù)均提取完全即將三個(gè)成分全部提取時(shí),其回歸結(jié)果與逐步回歸法的結(jié)果相同,即第三個(gè)成分對(duì)改善模型的擬合優(yōu)度,即調(diào)整r2的貢獻(xiàn)不大。對(duì)比可知,第三個(gè)成分對(duì)調(diào)整r2的提高僅為0.004,較0.920提高了0.43%,表明了PLS能選取合適的成分?jǐn)?shù)進(jìn)行回歸的同時(shí),舍棄對(duì)回歸結(jié)果作用不明顯的部分。但就對(duì)比實(shí)驗(yàn)一中對(duì)逐步回歸法與PLS在LOO交叉檢驗(yàn)的結(jié)果進(jìn)行對(duì)比是不合理的,因?yàn)橹鸩交貧w法在交叉檢驗(yàn)時(shí)的變量數(shù)為3,而PLS由于僅提取了兩個(gè)成分,在交叉檢驗(yàn)時(shí)僅有兩個(gè)成分進(jìn)行回歸,即變量數(shù)為2,故無(wú)法簡(jiǎn)單地將其進(jìn)行比較。而考慮變量數(shù)相同的情況時(shí),在對(duì)比實(shí)驗(yàn)二中,逐步回歸法交叉檢驗(yàn)時(shí)變量數(shù)為2,而PLS在對(duì)比實(shí)驗(yàn)一中,交叉檢驗(yàn)時(shí)提取兩個(gè)成分,變量數(shù)也為2,對(duì)比交叉檢驗(yàn)系數(shù)Q2,可得出PLS的模型穩(wěn)定性更好。綜上,對(duì)比逐步回歸法與PLS,可認(rèn)為PLS的回歸結(jié)果更好。
表9 對(duì)比實(shí)驗(yàn)一與實(shí)驗(yàn)二的回歸情況
注:1) 回歸時(shí)提取兩個(gè)成分,F(xiàn)統(tǒng)計(jì)量為F(2,7)=52.776
將對(duì)比實(shí)驗(yàn)二的逐步回歸法與對(duì)比實(shí)驗(yàn)一中的PLS在交叉檢驗(yàn)中的表現(xiàn)進(jìn)行對(duì)比,雖然存在一定的不合理性,但由對(duì)比實(shí)驗(yàn)二可以看出,PLS在提取所有的成分?jǐn)?shù)的情況下與逐步回歸法有相同的結(jié)果。將兩個(gè)對(duì)比實(shí)驗(yàn)中PLS的表現(xiàn)進(jìn)行對(duì)比,兩種情況下PLS均提取了兩個(gè)成分進(jìn)行回歸,差別在于成分中是否包含ELUMO這一參數(shù)。由調(diào)整r2的比較可知,該參數(shù)的引入對(duì)模型有較大的改善,以調(diào)整r2的值來(lái)看,擬合優(yōu)度的改善程度為20.10%,但以Q2來(lái)看,模型穩(wěn)定性的提高程度卻僅為16.95%。即使這樣的比較不準(zhǔn)確,卻仍能說(shuō)明ELUMO參數(shù)的引入對(duì)模型擬合效果的改善作用更大,即ELUMO參數(shù)引入的作用存在著過(guò)分追求方程擬合效果的可能性。
綜上所述,在肼衍生物與Pu(Ⅳ)的反應(yīng)中,PLS-Bootstrap可使用較少的變量來(lái)描述整體的趨勢(shì)變化,而逐步回歸法能獲得預(yù)測(cè)效果更好的模型,兩者的結(jié)果具有相似性,即兩種方法均可得到反映該反應(yīng)規(guī)律的回歸方程。就肼衍生物與Pu(Ⅳ)反應(yīng)而言,ELUMO是否能作為該反應(yīng)的特征參數(shù),還需進(jìn)一步研究確定。
通過(guò)逐步回歸法與PLS-Bootstrap法分別對(duì)Pu(Ⅳ)與肼衍生物反應(yīng)的定量構(gòu)效關(guān)系進(jìn)行了研究,獲得了可描述該反應(yīng)進(jìn)行快慢的特征參數(shù):最高占據(jù)軌道能(EHOMO)、疏水性參數(shù)(lgP),其中疏水性參數(shù)是該反應(yīng)的主要特征參數(shù),且它們的值越大,半反應(yīng)時(shí)間越大,該反應(yīng)進(jìn)行得越慢。而作為次要特征參數(shù)的最低非占軌道能(ELUMO)能否作為該反應(yīng)的特征參數(shù)仍需進(jìn)一步研究確定,因此兩種方法得到的結(jié)果具有相似性。
對(duì)之前的Pu(Ⅳ)與肼衍生物反應(yīng)的定量構(gòu)效關(guān)系研究的不足之處進(jìn)行了補(bǔ)充,對(duì)錯(cuò)誤的樣本點(diǎn)進(jìn)行了校正并作為外部檢驗(yàn)點(diǎn)對(duì)模型進(jìn)行了檢驗(yàn),完成了之前模型未進(jìn)行的交叉檢驗(yàn)等檢驗(yàn)工作。
本工作使用PLS-Bootstrap法進(jìn)行定量構(gòu)效關(guān)系研究并進(jìn)行了交叉檢驗(yàn)與外部檢驗(yàn),結(jié)果表明,該模型的穩(wěn)定性較逐步回歸模型差,考慮到外部檢驗(yàn)點(diǎn)數(shù)量少,其預(yù)測(cè)能力還需進(jìn)一步研究確定。