亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        第二十九講 關(guān)于留一法PRESS統(tǒng)計量的應(yīng)用討論

        2018-09-29 02:44:44徐靜安浦靜雯許保云
        關(guān)鍵詞:實驗模型

        徐靜安 浦靜雯 吳 芳 許保云

        應(yīng)國家獎勵辦聘任,6月15日赴北京參加2016年科技進(jìn)步獎化工組評審工作。因提前一天報到,帶了一本《六西格瑪管理統(tǒng)計指南——MINITAB使用指南》,再次閱讀有關(guān)統(tǒng)計量預(yù)測殘差平方和PRESS的相關(guān)內(nèi)容。這段時間借用化機所小會議室作辦公室,更接近科研一線,有了更多機會和吳芳、浦靜雯碩士一起學(xué)習(xí)、討論PRESS的相關(guān)問題。

        在實驗研究中,擬合選定統(tǒng)計模型后需要分析評估回歸模型的總效果:回歸模型的P值,兩個確定系數(shù)R2及擬合標(biāo)準(zhǔn)差S值,回歸方程各個項的P值等?,F(xiàn)在殘差診斷引起重視,也關(guān)注DPS二次多項式逐步回歸計算后輸出的d值,MINITAB系統(tǒng)輸出的Cp值。

        統(tǒng)計模型預(yù)測結(jié)果評估有效的方法是對預(yù)報進(jìn)行重復(fù)驗證試驗。數(shù)理統(tǒng)計中也采用“留一法”求取PRESS值對模型預(yù)報能力作出整體估計。

        一 PRESS的概念

        PRESS是留一法模型預(yù)測的誤差平方和。對實驗數(shù)據(jù)樣本N留下一個——第i個實驗觀察點,用N-1個數(shù)據(jù)擬合回歸方程,把留下的第i個觀察點作為預(yù)測驗證值,求出殘差 。以此類推,可得

        (1)DPS數(shù)據(jù)處理系統(tǒng)對留一法預(yù)測標(biāo)準(zhǔn)差的定義

        N為樣本量;

        P為統(tǒng)計模型中因子的項數(shù)。

        (2)在MINITAB系統(tǒng)中,根據(jù)將回歸方程擬合的殘差平方和SSE變換成PRESS,公式,定義為總的偏差平方和。

        設(shè)想在樣本量為N的實驗數(shù)據(jù)中,如果某個點的存在與否會強烈影響統(tǒng)計模型的結(jié)構(gòu),則該點為有特殊地位的“杠桿點”“離群點”等。一般來說,樣本中更多的是普通點,是以樣本訓(xùn)練集的整體影響建立統(tǒng)計模型。普通點的個體、一個點對統(tǒng)計模型的結(jié)構(gòu)影響是不顯著的,對一定結(jié)構(gòu)模型的參數(shù)估計的影響也比較小。這樣輪番留一計算得到的殘差平方和PRESS用來對統(tǒng)計模型的預(yù)測作整體評估。PRESS(留一法預(yù)報的殘差平方和)通常要比擬合的殘差平方和)大些,“但如果大得不多,則表明數(shù)據(jù)點中有特殊地位的點不多……,用此回歸方程作預(yù)測結(jié)果也比較可信?!?/p>

        查閱了幾本專著及一些留一法應(yīng)用案例,均無明確判據(jù),PRESS比SSE大多少才是大得不多,才是可信、可接受的。

        (3)討論

        在PRESS工程應(yīng)用的討論中,涉及統(tǒng)計模型結(jié)構(gòu)型式、樣本量大小、樣本點在實驗多維空間中分布的均勻性、樣本實驗點的質(zhì)量(有否異常誤差)等,這些因素會影響PRESS值,影響預(yù)報質(zhì)量。

        對于隨機安排的實驗,如考察因子有M個,一般多項式統(tǒng)計建模要求樣本量N/M≥5。如果采用多項式逐步回歸及適合于小樣本的支持向量機回歸SVR,則樣本量可適當(dāng)小些,但過小的樣本量會影響模型的穩(wěn)定性。

        樣本實驗點中如有可疑點,應(yīng)在實驗過程中用重復(fù)試驗予以剔除,或以平均值來降低對統(tǒng)計模型的特殊影響。試驗結(jié)束后,采用數(shù)理統(tǒng)計方法進(jìn)行“壞點”剔除時要慎重。

        大多數(shù)試驗設(shè)計(如全因子設(shè)計、正交設(shè)計等)因子水平都有重復(fù),可以用留一法計算PRESS。均勻設(shè)計中因子水平只做一次試驗,而且樣本量本就偏小,N/M≥2~2.5,且少一個點對實驗點的均勻性產(chǎn)生較大負(fù)面影響。

        統(tǒng)計模型的結(jié)構(gòu)選擇對預(yù)測質(zhì)量的影響更大,經(jīng)常出現(xiàn)模型擬合效果的統(tǒng)計檢驗良好,但PRESS過大預(yù)測質(zhì)量不行的情況,為此要重視統(tǒng)計模型的優(yōu)化選擇。

        現(xiàn)在面對的問題是:

        ①PRESS計算時的主體模型如何選擇?

        ②PRESS比SSE大多少,才是可信可接受的?

        二 應(yīng)用案例

        高溫假后上班第一天(8月1日),吳芳碩士推薦我閱讀《MATLAB神經(jīng)網(wǎng)絡(luò)30個案例分析》。讀后即網(wǎng)購《MATLAB神經(jīng)網(wǎng)絡(luò)43個案例分析》,其中“神經(jīng)網(wǎng)絡(luò)遺傳算法函數(shù)極值尋優(yōu)——非線性函數(shù)極值尋優(yōu)”一文的實驗數(shù)據(jù),可作為本案例的基礎(chǔ)數(shù)據(jù)。

        其實驗考察因子X1為添加物1(kg),水平為0,10,30,50;X2為溫度(℃),水平為 0,5,10,15,20;X3為添加物 2(kg),水平為 1650,1700,1750;X4為反應(yīng)時間(s),水平為 40,60,80。

        三 二次多項式隨機模型求取PRESS

        浦靜雯碩士采用“試錯”學(xué)習(xí),在DPS中用二次多項式逐步回歸求取預(yù)報值yi,-i,已知表1的實驗值y可求得計算18個隨機模型的及PRESS=i見表2。

        表1 實驗數(shù)據(jù)

        顯然,采用隨機模型出現(xiàn)了NO.5為“離群點”,可能的原因之一是該點在實驗范圍內(nèi)為某個區(qū)域的“孤獨點”,影響特殊。如在實驗過程中,對該工藝條件應(yīng)予以重復(fù)驗證。經(jīng)計算檢查,該隨機模型由二次多項式逐步回歸求出,擬合統(tǒng)計量全部良好顯著,就是預(yù)報ymax值及留一預(yù)測驗證的δi值完全不靠譜??梢娪秒S機模型求取PRESS放大了個別點的負(fù)面影響。

        為此,根據(jù)DPS數(shù)據(jù)處理系統(tǒng)及MINITAB使用指導(dǎo),求取PRESS需指定統(tǒng)計模型的主體結(jié)構(gòu)。

        四 (線性項+交互項)全回歸模型求取PRESS

        在MINITAB系統(tǒng)中,本案例表1指定模型為:

        從統(tǒng)計>DOE>因子>分析因子設(shè)計窗口進(jìn)入計算界面,全回歸方法計算結(jié)果輸出如下:

        表2 隨機模型計算匯總表

        表2 隨機模型計算匯總表

        測試集序號 添加物1/kg 溫度/℃ 預(yù)報值/kg 實驗值/kg 1 0 0?257.036 258 0.929752684 2 10 0 274.549 272 6.498421445 3 30 0 313.502 312 2.257140104 4 50 0 358.618 363 19.20362982 5 0 5-11887.493 360 150001090.3 6 10 557.149 493 4115.077543 7 0 15 614.613 605 92.41534093 1650 40 10 10 15 1700 60 621.695 627 28.13777168 11 10 20 1750 80 276.174 406 16854.72292 12 30 5 1750 40 259.631 390 16996.13102 13 30 10 1650 80 515.400 519 12.96292384 14 30 15 1700 60 637.981 662 576.8948036 15 50 5 1650 80 377.315 456 6191.382285 16 50 10 1750 60 951.392 523 183519.6317 17 50 15 1700 60 670.732 712 1703.07129 18 50 20 1700 40 704.125 555 22238.24853時間/s 60 60 60 60 80 40 60 60 9 0 8 0 20 464.149 400 4115.073822添加物2/kg 1700 1700 1700 1700 1650 1700 1700 1750 10 10 11.428 464 204821.1033∑150462384

        模型擬合質(zhì)量尚可,留一法模型預(yù)報PRESS雖有大幅度改善,但趨于零,模型預(yù)報功能很差。此外,x1,x3,x1x2,x1x3,x2x4,x3x4等對響應(yīng) y 的貢獻(xiàn)均不顯著,進(jìn)入模型后過擬合造成統(tǒng)計模型不穩(wěn)定,提高了擬合效果,降低了預(yù)報質(zhì)量,模型尚需改進(jìn)。

        五 (線性項+交互項)剔除不顯著項模型求取PRESS

        在MINITAB系統(tǒng)中,對公式(1)剔除不顯著項,按四計算結(jié)果P≤0.05的項保留,指定模型為:

        公式中添加物2即x3在公式(1)中P=0.94>0.05是不顯著的,在MINITAB系統(tǒng)中因子設(shè)計的計算,其x2x3交互項是顯著的,要求公式(2)中保留主成分x3,否則另行指定模型,x2x3需進(jìn)行線性變換。

        MINITAB系統(tǒng)的計算輸出:

        由于指定的模型結(jié)構(gòu)變化,擬合、預(yù)報功能有了變化,PRESS進(jìn)一步改善,但預(yù)報功能仍需改進(jìn)。

        公式(1)并非完整的二次多項式,加以公式(2)采用簡單剔除,可通過二次多項式逐步回歸求取優(yōu)化模型,存在改進(jìn)空間。

        六、二次多項式優(yōu)化模型求取PRESS

        本文三中是對N=18組數(shù)據(jù)分別留一組數(shù)據(jù)N-1=17進(jìn)行二次多項式逐步回歸,得到18個隨機模型及δi。此處是用N=18組數(shù)據(jù)進(jìn)行二次多項式逐步回歸獲得實驗范圍內(nèi)二次多項式的最優(yōu)模型,以此優(yōu)化模型的主體結(jié)構(gòu)求取留一法的PRESS。

        用DPS系統(tǒng)處理,輸出:

        復(fù)相關(guān)系數(shù)R=0.982962;

        決定系數(shù)R2=0.966214;

        剩余標(biāo)準(zhǔn)差SSE=29.0229;

        調(diào)整相關(guān)系數(shù)Ra=0.975775;

        調(diào)整決定系數(shù)Ra2=0.952136。

        分析評估回歸方程擬合的各項統(tǒng)計量均有顯著性意義。表1單因素考察因混雜而難以分析的數(shù)據(jù),經(jīng)二次多項式逐步回歸處理,統(tǒng)計規(guī)律具有顯著意義。剩下的工作是對模型的預(yù)報進(jìn)行評估,把優(yōu)化模型線性變換,作為指定的主體模型結(jié)構(gòu),計算求取留一法的PRESS。

        方程引入的項分別有:X3,X2×X2,X3×X3,X1×X4,X2×X3。這5個引入項線性變換重新作為5個因子(分別記為進(jìn)行統(tǒng)計分析,見表 3。

        在DPS系統(tǒng)中,輸入表3實驗數(shù)據(jù),從“多元分析>回歸分析>線性回歸”窗口進(jìn)入,計算輸出。方差分析表

        回歸方程

        剩余標(biāo)準(zhǔn)差SSE=29.0229

        預(yù)測誤差標(biāo)準(zhǔn)差MSPE=44.0679

        表3 線性化處理后的實驗數(shù)據(jù)

        本文用了大量計算解讀PRESS計算時的主體模型如何選擇。浦靜雯碩士同時使用DPS,MINITAB兩個軟件系統(tǒng)的不同模塊進(jìn)行計算校核,限于篇幅不能一一展開?,F(xiàn)把本文選擇主體模型計算PRESS的方法結(jié)果匯總于表4。

        表4 方法結(jié)果匯總

        從輸出PRESS=23303.7123可知,模型預(yù)報質(zhì)量大為改善,預(yù)測誤差的標(biāo)準(zhǔn)差MSPE=44.1相當(dāng)不錯。

        七 PRESS統(tǒng)計量可接受判據(jù)

        本案例留一法預(yù)報的殘差平方和PRESS通常比擬合的殘差平方和要大,所以

        分子分母自由度為N-P-1=18-5-1=12,常用顯著性水平α=0.05,查單邊檢驗F分布表,臨界值F0.05(12,12)=2.69>2.31,結(jié)論是 F 統(tǒng)計檢驗相對于 SSE,PRESS沒有顯著性差異。用留一法PRESS值來對統(tǒng)計模型的預(yù)測作整體評估,在本案例中是可信、可接受的。

        在神經(jīng)網(wǎng)絡(luò)、支持向量機中,也有類似留一法PRESS的LOO-CV方法,把所有樣本N均作為訓(xùn)練集用于訓(xùn)練模型,得到的模型最接近原始樣本的分布,然后再逐次留一作預(yù)報,評估結(jié)果比較可靠。吳芳碩士用MATLAB軟件對此進(jìn)行了BP-LOO-CV、SVR-LOO-CV計算PRESS的工作,另作專題討論。

        最近科技界有頗多的熱點。2016年3月Deep Mind團(tuán)隊開發(fā)的Alpha Go在人機大戰(zhàn)中以4∶1的成績擊敗圍棋世界冠軍李世石,具有里程碑意義。人們對人工智能(AI)具有的潛在顛覆性有了新的認(rèn)識。Alpha Go應(yīng)用了13層的深度神經(jīng)網(wǎng)絡(luò)、蒙特卡洛搜索樹計算技術(shù)以強化學(xué)習(xí)等。機器學(xué)習(xí)人工神經(jīng)網(wǎng)絡(luò)技術(shù)值得我們學(xué)習(xí)、關(guān)注。

        NgAgo基因編輯技術(shù)的可重復(fù)性、成功概率、細(xì)胞污染實驗誤差的可控制性引起科技界的一片爭議之聲。對此結(jié)合上海化工研究院的科研工作,編寫了2016年第7講“統(tǒng)計模型優(yōu)化預(yù)報的驗證”以及本文“關(guān)于留一法PRESS統(tǒng)計量的應(yīng)用討論?!?/p>

        筆者在2012年曾和許保云博士對PRESS嘗試過計算解讀,本次學(xué)習(xí)研討有了進(jìn)一步認(rèn)識,也占用了年青朋友的一些業(yè)余時間。在此抄錄一段愛因斯坦語錄以作共勉:

        人的差異產(chǎn)生于業(yè)余時間。業(yè)余時間能成就一個人,也能毀滅一個人。

        猜你喜歡
        實驗模型
        一半模型
        記一次有趣的實驗
        微型實驗里看“燃燒”
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        做個怪怪長實驗
        3D打印中的模型分割與打包
        NO與NO2相互轉(zhuǎn)化實驗的改進(jìn)
        實踐十號上的19項實驗
        太空探索(2016年5期)2016-07-12 15:17:55
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        国产成人亚洲精品无码mp4| 亚洲日本国产一区二区三区| 日韩av一区二区不卡在线| 久久久久成人精品免费播放动漫| 暖暖视频在线观看免费| av无码天一区二区一三区| 日韩少妇高潮在线视频| 9久久婷婷国产综合精品性色| 亚洲国产成人av在线观看| 中文无码精品一区二区三区| 天天躁日日躁狠狠躁| 品色堂永远的免费论坛| 国产精品国产三级国产av主| 精品乱色一区二区中文字幕| 伊人色综合久久天天五月婷| 国产尤物精品自在拍视频首页| 国产内射视频在线播放| 亚洲国产成人久久精品不卡| 久久99精品九九九久久婷婷| 99热精品国产三级在线观看| 国产精品亚洲av无人区二区 | 国产一区二区三区免费精品| 亚洲女同av在线观看| 国产激情视频免费在线观看| 野外少妇愉情中文字幕| 国产资源精品一区二区免费| 青青草久久久亚洲一区| 欧美黑人又粗又大xxxx| 成年女人毛片免费视频| 久久人妻av不卡中文字幕| 免费在线观看播放黄片视频| 日本公与熄乱理在线播放| 野外三级国产在线观看| 中文字幕高清视频婷婷| 欧美牲交videossexeso欧美| 精品一区二区三区免费播放| 国产情侣一区在线| 国产另类人妖在线观看| 樱桃视频影院在线播放| 六月丁香久久| 人妖与人妖免费黄色片|