亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        提高回歸模型擬合優(yōu)度的策略(Ⅲ)
        ——校正均值變換與其他變量變換

        2019-03-29 03:03:14胡良平
        四川精神衛(wèi)生 2019年1期
        關(guān)鍵詞:因變量名義校正

        胡良平

        (1.軍事醫(yī)學(xué)科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029

        1 問題的提出

        1.1 “算術(shù)均值變換”有改進(jìn)的余地

        本期科研方法專題的《提高回歸模型擬合優(yōu)度的策略(Ⅱ)——算術(shù)均值變換與其他變量變換》一文(以下簡稱“前文”)提出了對“多值名義自變量(包括多值有序自變量)”進(jìn)行“算術(shù)均值變換”的處理方法,配合其他變量變換方法(指對定量自變量與因變量的多種變量變換方法),較好地提高了回歸模型的擬合優(yōu)度。然而,“算術(shù)均值變換”有改進(jìn)的余地。因?yàn)樵谟嬎愣嘀得x自變量各水平組中定量因變量的均值時,其“隱含前提條件”是“沒有其他自變量”或“其他自變量的影響完全相同”。事實(shí)上,在具有多自變量的回歸分析資料中,除了“多值名義自變量或多值有序自變量或二值自變量”外,還有多個“定量自變量”,而且,沒有理由認(rèn)為這些“定量自變量”滿足前面述及的“隱含前提條件”。需要借助“協(xié)方差分析”的計算方法消除“其他定量自變量”對定量因變量的影響。此時,求出的“多值名義自變量”各水平下“定量因變量的均值”被稱為“校正均值”。采用“校正均值”取代“算術(shù)均值”的方法被稱為“校正均值變換”法。

        1.2 用“校正均值變換”取代”啞變量變換”

        1.2.1 何為“校正均值變換”

        求“校正均值”的具體方法是借助“協(xié)方差分析”,在方差分析模型中,分組變量為“多值名義自變量”,它是一個“定性影響因素”,再將其他的定量自變量一同寫入“一般線性模型”,以“定量因變量”為協(xié)方差分析的“因變量”。在獲得“協(xié)方差分析”結(jié)果之前,需要計算出“消除了其他定量自變量影響”條件下“定性影響因素”各水平下“定量結(jié)果變量”的均值,它們被稱為“校正均值”。

        1.2.2用“校正均值變換”取代“啞變量變換”的合理性

        前文已用了較大篇幅陳述了用“算術(shù)均值變換”取代“啞變量變換”的合理性。由上面的內(nèi)容可知,“校正均值”比未校正的“算術(shù)均值”更合理。故用“校正均值變換”取代“啞變量變換”的合理性,也就不言而喻了。

        1.3 實(shí)際問題與數(shù)據(jù)結(jié)構(gòu)

        沿用本期科研方法專題第一篇文章《提高回歸模型擬合優(yōu)度的策略(Ⅰ)——啞變量變換與其他變量變換》中的“實(shí)際問題與數(shù)據(jù)結(jié)構(gòu)”[1],此處不再贅述。

        2 解決問題的思路和做法

        2.1 對自變量和因變量的處置方法

        2.1.1對“燃油種類(fuel)”這個“6值名義自變量”進(jìn)行”校正均值變換”

        求出“燃油種類(fuel)”各水平下“氧化氮釋放量(nox)”的校正均值所需要的SAS程序如下:

        /*下面的SAS程序計算出多值名義變量各水平下定量因變量的校正均值*/

        data aa;

        set sashelp.gas;

        proc glm data=aa;

        class fuel;

        model nox=fuel cpratio eqratio;

        lsmeans fuel;

        run;

        【說明】上面的“l(fā)smeans語句”就是希望輸出“多值名義自變量(fuel)”各水平下的“校正均值”。

        【SAS輸出結(jié)果】

        校正均值Fuelnox LSMEAN82rongas3.5185295994%Eth2.11619735Ethanol1.95691843Gasohol3.32335605Indolene3.54233497Methanol1.54554003

        將“燃油種類(fuel)”的各水平變換成與定量因變量相應(yīng)的“算術(shù)均值”所需要的SAS程序如下:

        /*下面的SAS程序?qū)⒍嘀得x變量各水平變換成與定量因變量相應(yīng)的校正均值*/

        data a1;

        set sashelp.gas;

        if fuel=' 82rongas' then mfuel=3.51853;

        else if fuel=' 94%Eth' then mfuel=2.11620;

        else if fuel=' Gasohol' then mfuel=3.32336;

        else if fuel=' Indolene' then mfuel=3.54233;

        else if fuel=' Methanol' then mfuel=1.545540;

        else if fuel=' Ethanol' then mfuel=1.95692;

        run;

        通過運(yùn)行上面的SAS程序,在原數(shù)據(jù)集sashelp.gas中就增加了一個定量自變量mfuel,將用它取代多值名義自變量“燃油種類(fuel)”。

        2.1.2 對定量因變量和自變量的處置方法

        “對定量因變量和自變量不做任何變換”“僅對定量自變量做變換”“僅對定量因變量做變換”和“同時對定量自變量和因變量做變換”,這幾種情況的“具體含義”參見“前文”“第2.1.2節(jié)至第2.1.5節(jié)”,此處從略。

        2.2 對定量自變量和因變量進(jìn)行變量變換的方法

        2.2.1對定量自變量進(jìn)行多種變量變換,以產(chǎn)生派生變量

        所需要的SAS程序如下:

        /*在數(shù)據(jù)集a1的基礎(chǔ)上增加定量自變量的各種派生變量18個,形成數(shù)據(jù)集a2*/

        data a2;

        set a1;

        x1=log(cpration);x2=sqrt(cpration);x3=exp(cpration);

        x4=cpratio**2;x5=x4*cpratio;

        w1=log(eqration);w2=sqrt(eqration);w3=exp(eqration);

        w4=eqratio**2;w5=w4*eqratio;

        z1=log(mfuel);z2=sqrt(mfuel);z3=exp(mfuel);

        z4=mfuel**2;z5=z4*mfuel;

        m1=cpration*eqration;m2=cpration*mfuel;

        m3=eqration*mfuel;

        run;

        運(yùn)行以上SAS程序后,就創(chuàng)建了數(shù)據(jù)集a2,它在數(shù)據(jù)集a1基礎(chǔ)上增加了由三個定量自變量“cpratio”“eqratio”和“mfuel”派生出來的18個新自變量,它們分別是每個定量自變量的自然對數(shù)變換、平方根變換、指數(shù)變換、平方變換和立方變換的結(jié)果;還有三個定量自變量兩兩交叉乘積變換的結(jié)果。

        2.2.2 對定量因變量進(jìn)行5種變量變換

        所需要的SAS程序如下:

        /*在數(shù)據(jù)集a2的基礎(chǔ)上增加定量因變量的5種變量變換結(jié)果,形成數(shù)據(jù)集a3*/

        data a3;

        set a2;

        y1=log(nox);y2=sqrt(nox);y3=exp(nox);

        y4=1/nox;y5=exp(nox)/(1+exp(nox));

        run;

        運(yùn)行以上SAS程序后,就創(chuàng)建了數(shù)據(jù)集a3,它在數(shù)據(jù)集a2基礎(chǔ)上增加了由定量因變量(nox)派生出來的5個新因變量,它們分別是自然對數(shù)變換(y1)、平方根變換(y2)、指數(shù)變換(y3)、倒數(shù)變換(y4)和Logistic變換(y5)的結(jié)果。

        2.3 基于“校正均值變換”的建模策略

        【說明】在以下的建模策略中,先對多值名義自變量進(jìn)行“校正均值變換”;然后在以下每種情形中都將分別在“包含截距項”與“不含截距項”的條件下,分別采取“前進(jìn)法”“后退法”和“逐步法”篩選自變量。

        建模策略將由以下六部分組成:①以“氧化氮釋放量(nox)”為定量因變量;②以“氧化氮釋放量的自然對數(shù)變換結(jié)果(y1)”為定量因變量;③以“氧化氮釋放量的平方根變換結(jié)果(y2)”為定量因變量;④以“氧化氮釋放量的指數(shù)變換結(jié)果(y3)”為定量因變量;⑤以“氧化氮釋放量的倒數(shù)變換結(jié)果(y4)”為定量因變量;⑥以“氧化氮釋放量的Logistic變換結(jié)果(y5)”為定量因變量。以上6種建模策略的具體內(nèi)容與“前文第2.3.1節(jié)至第2.3.6節(jié)”完全相同,此處從略。

        3 基于“校正均值變換與其他變量變換”的回歸建模結(jié)果與評價

        3.1 各種回歸建模策略下所得主要結(jié)果的匯總

        以摘要形式呈現(xiàn)選出的24個擬合較好的回歸模型見表1。

        3.2 基于“校正均值變換與其他變量變換”回歸建模效果的分組評價

        這部分有六個小標(biāo)題,其內(nèi)容與“前文”中相應(yīng)部分完全相同,詳見“前文第3.2.1節(jié)至第3.2.6節(jié)”,此處從略。

        3.3 對各組模型中挑選出來的最優(yōu)模型再進(jìn)行擬合優(yōu)度的總評價

        從以上的“評價結(jié)果”可知:模型4、模型8、模型12、模型16、模型20和模型24分別是從6組模型中挑選出來的“最優(yōu)模型”,現(xiàn)將它們從表1中摘錄出來,以便直觀比較和判斷。見表2。

        表1 反映24個多重回歸模型擬合優(yōu)度的計算結(jié)果

        注:第1組模型對應(yīng)的因變量為“氧化氮釋放量(nox)”;第2組模型對應(yīng)的因變量為“氧化氮釋放量的自然對數(shù)變換結(jié)果(y1)”;第3組模型對應(yīng)的因變量為“氧化氮釋放量的平方根變換結(jié)果(y2)”;第4組模型對應(yīng)的因變量為“氧化氮釋放量的指數(shù)變換結(jié)果(y3)”;第5組模型對應(yīng)的因變量為”“氧化氮釋放量的倒數(shù)變換結(jié)果(y4)”;第6組模型對應(yīng)的因變量為”氧化氮釋放量的Logistic變換結(jié)果(y5)”

        表2 各組挑選出來的6個“最優(yōu)”多重回歸模型擬合優(yōu)度的計算結(jié)果

        由表2可知:模型24是6個“最優(yōu)”模型中“最佳”的。該模型的因變量為“氧化氮釋放量的Logistic變換結(jié)果(y5)”,從全部(3+18=21個)自變量中篩選出了12個具有統(tǒng)計學(xué)意義的自變量,模型中不含截距項。具體計算結(jié)果如下:

        變量參數(shù)估計值標(biāo)準(zhǔn)誤差I(lǐng)I 型 SSFPr > FCpRatio-0.305280.151010.002474.090.0449EqRatio-294.7077832.775120.0489080.85<0.0001x21.516950.692470.002904.800.0300x40.004580.002060.003004.970.0273w187.098569.411430.0518085.65<0.0001w2-349.8387438.958570.0487780.64<0.0001w3284.6897431.703120.0487780.64<0.0001w5-130.5704714.465230.0492881.48<0.0001z20.342150.078430.0115119.03<0.0001z50.002360.000988630.003465.710.0180m1-0.024140.002950.0403766.74<0.0001m3-0.132250.018390.0312951.72<0.0001

        輸出以上結(jié)果的“SAS過程步程序”如下:

        /*模型24:R2=0.9992,調(diào)整R2=0.9992,MSE=0.00060486,Cp=14.9351,niv=12,無截距項*/

        Proc reg data=a3;

        model y5=cpratio eqratio mfuel x1-x5 w1-w5

        z1-z5 m1-m3/noint selection=backward sls=0.05 r;

        /*模型24*/

        run;

        3.4 小結(jié)

        在對定量因變量構(gòu)建多重回歸模型的過程中,摒棄了傳統(tǒng)統(tǒng)計思維下的理論和方法(對定量因變量和定量自變量保持一次方形式,即不做任何變量變換,也不產(chǎn)生派生變量;對多值名義自變量進(jìn)行啞變量變換,構(gòu)建所謂的“多重線性回歸模型”),而引入了動態(tài)統(tǒng)計思維下的理論和方法(對定量因變量分別采取不做變量變換和做5種變量變換,即對數(shù)變換、平方根變換、指數(shù)變換、倒數(shù)變換和Logistic變換);淘汰了對“定量自變量不做任何變換”和“永遠(yuǎn)固定為一次方形式”的僵化思維,不僅對其做“對數(shù)變換、平方根變換和指數(shù)變換”,還引入了“平方項、立方項和交叉乘積項”;本文提出了一種新的變量變換方法,即對“多值名義自變量”進(jìn)行“校正均值變換”,不僅將其變換成“定量自變量”,還產(chǎn)生出多項派生變量。

        由表1和表2可知:基于傳統(tǒng)統(tǒng)計思維創(chuàng)建的回歸模型的擬合效果非常差(模型編號分別為1、5、9、13、17、21),而基于動態(tài)統(tǒng)計思維創(chuàng)建的回歸模型的擬合效果很好(表2中除模型16之外)。其中,“校正均值變換”“引入派生變量”“假定回歸模型中不含截距項”和“找到定量因變量合適的變量變換方法(就本文實(shí)例而言,除了‘指數(shù)變換’外,其他4種變量變換方法的擬合效果都相當(dāng)好,其中最佳的是Logistic變換)”是動態(tài)統(tǒng)計思維“建模策略”中的核心。

        有興趣的讀者可以運(yùn)用文獻(xiàn)[2-4]中“機(jī)器學(xué)習(xí)”算法,實(shí)現(xiàn)本文資料的回歸建模,并將其擬合結(jié)果與本文進(jìn)行比較,從而發(fā)現(xiàn)不同分析方法的優(yōu)缺點(diǎn)。

        猜你喜歡
        因變量名義校正
        調(diào)整有限因變量混合模型在藥物經(jīng)濟(jì)學(xué)健康效用量表映射中的運(yùn)用
        中國藥房(2022年7期)2022-04-14 00:34:30
        劉光第《南旋記》校正
        國學(xué)(2020年1期)2020-06-29 15:15:30
        逆行,以生命的名義
        適應(yīng)性回歸分析(Ⅳ)
        ——與非適應(yīng)性回歸分析的比較
        以二胎的名義,享受生活
        好日子(2018年9期)2018-10-12 09:57:18
        一類具有校正隔離率隨機(jī)SIQS模型的絕滅性與分布
        機(jī)內(nèi)校正
        偏最小二乘回歸方法
        以創(chuàng)新的名義宣誓發(fā)展
        一種基于eNode B的主動式頻偏校正算法
        亚洲产国偷v产偷v自拍色戒| 激情偷拍视频一区二区| 亚洲av网站在线免费观看| 亚洲中文字幕九色日本| 日本精品久久久久中文字幕| 亚洲日韩一区精品射精| 久久棈精品久久久久久噜噜| 精品国产香蕉伊思人在线又爽又黄| 国内精品91久久久久| 亚洲国产av精品一区二| 亚洲av日韩一卡二卡| 精品人妻av区乱码| 亚洲精品无码乱码成人| 日韩中文无线码在线视频观看| 无码一区二区三区久久精品| 国产精品老女人亚洲av无| 免费在线观看播放黄片视频| 又粗又大又硬毛片免费看| 久久99久久99精品免观看| 国产爆乳乱码女大生Av| 亚洲精品国产精品av| 亚洲av永久一区二区三区| 狠狠综合久久av一区二区蜜桃| 日韩精品一区二区三区中文| 亚洲中文字幕无码永久在线 | 国产精品成人观看视频国产奇米| 亚洲国产av无码专区亚洲av| 人人妻人人爽人人做夜欢视频九色 | 亚洲国产日韩欧美综合a| 日日噜狠狠噜天天噜av| 中文字幕在线日韩| 中文乱码字幕在线中文乱码 | av无码人妻中文字幕| 东北无码熟妇人妻AV在线| 国产乱人伦AⅤ在线麻豆A| 日本精品人妻一区二区| 欧美亚洲精品suv| 特级av毛片免费观看| 国产爆乳乱码女大生Av| 亚洲天堂av另类在线播放| 91色老久久偷偷精品蜜臀懂色|