亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        適應(yīng)性回歸分析(Ⅳ)
        ——與非適應(yīng)性回歸分析的比較

        2019-06-18 02:45:00羅艷虹胡良平
        四川精神衛(wèi)生 2019年2期
        關(guān)鍵詞:因變量數(shù)目適應(yīng)性

        羅艷虹,胡良平

        (1.山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室,山西 太原 030001;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029;3.軍事科學(xué)院研究生院,北京 100850

        1 概 述

        相對于因變量是“計數(shù)變量”和“定性變量”而言,因變量為“計量變量”的回歸建模方法的種類更多。其中,若按是否采用“適應(yīng)性回歸分析”可劃分為以下兩類:適應(yīng)性回歸分析[1-2]與非適應(yīng)性回歸分析[3-12]。在非適應(yīng)性回歸分析方法中,最常用且最有代表性的就是多重線性回歸分析方法,在SAS軟件中,可以通過REG過程來實現(xiàn)。

        本文將采用ADAPTIVEREG過程和REG過程來實現(xiàn)對同一個數(shù)據(jù)集的回歸建模,并結(jié)合數(shù)據(jù)集和數(shù)據(jù)子集的真實情況,反映并揭示兩種建模思想對數(shù)據(jù)集和數(shù)據(jù)子集的建模效果。從而得出對回歸建模及建模效果評價有意義的參考性建議。

        2 問題與數(shù)據(jù)結(jié)構(gòu)

        2.1 原問題與數(shù)據(jù)集

        沿用本期科研設(shè)計方法專題中第二篇文章《適應(yīng)性回歸分析(II)——排除噪聲變量的干擾》(以下簡稱“前文”)中的“問題與數(shù)據(jù)結(jié)構(gòu)”,其數(shù)據(jù)集名為“artificial”。

        2.2 新問題與數(shù)據(jù)集

        在原問題中,數(shù)據(jù)集artificial包含一個因變量y及其取值,10個在(0,1)區(qū)間上服從均勻分布的隨機(jī)變量x1~x10及其取值;y是x1和x2的函數(shù),并具有“前文”式(1)的表達(dá)式。整個數(shù)據(jù)集的樣本含量N=400。隨機(jī)變量x3~x10是獨立于因變量y的,或者說,它們是與因變量y無關(guān)的隨機(jī)變量。

        2.3 擴(kuò)展的數(shù)據(jù)集

        2.3.1 擴(kuò)展的數(shù)據(jù)集a1

        在數(shù)據(jù)集artificial的基礎(chǔ)上,引入由隨機(jī)變量x1~x10產(chǎn)生的派生變量[3],它們是由隨機(jī)變量x1~x10的全部二次項組成,共55項(包括10個平方項和45個交叉乘積項)。連同隨機(jī)變量x1~x10共有65個自變量,所得的數(shù)據(jù)集為a1。所需要的SAS數(shù)據(jù)步程序如下:

        data a1;

        set artificial;

        z1=x1*x1;z2=x1*x2;z3=x1*x3;

        z4=x1*x4;z5=x1*x5;z6=x1*x6;

        z7=x1*x7;z8=x1*x8;z9=x1*x9;

        z10=x1*x10;z11=x2*x2;z12=x2*x3;

        z13=x2*x4;z14=x2*x5;z15=x2*x6;

        z16=x2*x7;z17=x2*x8;z18=x2*x9;

        z19=x2*x10;z20=x3*x3;z21=x3*x4;

        z22=x3*x5;z23=x3*x6;z24=x3*x7;

        z25=x3*x8;z26=x3*x9;z27=x3*x10;

        z28=x4*x4;z29=x4*x5;z30=x4*x6;

        z31=x4*x7;z32=x4*x8;z33=x4*x9;

        z34=x4*x10;z35=x5*x5;z36=x5*x6;

        z37=x5*x7;z38=x5*x8;z39=x5*x9;

        z40=x5*x10;z41=x6*x6;z42=x6*x7;

        z43=x6*x8;z44=x6*x9;z45=x6*x10;

        z46=x7*x7;z47=x7*x8;z48=x7*x9;

        z49=x7*x10;z50=x8*x8;z51=x8*x9;

        z52=x8*x10;z53=x9*x9;z54=x9*x10;

        z55=x10*x10;

        run;

        【說明】在上面的程序中,“z1=x1*x1”和“z11=x2*x2”分別代表x1與x2的平方項;“z2=x1*x2”代表x1與x2的交叉乘積項;z3~z10代表與x1有關(guān)的交叉乘積項;z12~z19代表與x2有關(guān)的交叉乘積項。也就是說,z1~z19或多或少與因變量y有一定的聯(lián)系。z20~z55這36個變量都獨立于因變量y;另外,由前面的介紹可知,隨機(jī)變量x3~x10是獨立于因變量y的,故獨立于因變量y的自變量共有44個(即x1~x10,z20~z55)。

        2.3.2 擴(kuò)展的數(shù)據(jù)集a2

        由于因變量y是計量變量,故可以對其進(jìn)行變量變換。常規(guī)的變量變換方法有以下五種:對數(shù)變換、平方根變換、倒數(shù)變換、指數(shù)變換和Logistic變換[13-15]。在數(shù)據(jù)集a1基礎(chǔ)上,引入對因變量y的上述五種變換,分別記為y1~y5,所得的數(shù)據(jù)集為a2。所需要的SAS數(shù)據(jù)步程序如下:

        data a2;

        set a1;

        y1=log(y+5);y2=sqrt(y+5);y3=1/(y+5);

        y4=exp(y+5);y5=exp(y+5)/(1+exp(y+5));

        run;

        【說明】因為在因變量y的取值中,出現(xiàn)了負(fù)數(shù)和零,不便于取對數(shù)和平方根變換,統(tǒng)一加上一個正數(shù)5即可。

        數(shù)據(jù)集a2中包含了數(shù)據(jù)集a1,而其又包含了數(shù)據(jù)集artificial,故以下僅基于數(shù)據(jù)集a2進(jìn)行計算即可。

        2.3.3 數(shù)據(jù)集a2中變量的分類

        因變量有6種表現(xiàn)形式,分別為原先的形式y(tǒng)、取了不同變量變換后的形式y(tǒng)1~y5;自變量可分為以下兩類:A類中含有21個與因變量有關(guān)系的自變量,即“x1和x2,z1~z19”;B類中含有44個與因變量無關(guān)系的自變量,即“x3~x10,z20~z55”。

        3 基于a2數(shù)據(jù)集中A與B兩類共65個自變量進(jìn)行回歸建模

        3.1 采用ADAPTIVEREG過程對65個自變量進(jìn)行回歸建模

        3.1.1建模策略

        分別選取y、y1~y5為因變量,利用65個自變量(其中,A類21個自變量與因變量有關(guān)系,B類44個自變量與因變量無關(guān)系),采用ADAPTIVEREG過程進(jìn)行回歸建模。

        3.1.2 建模結(jié)果

        建模的輸出結(jié)果較多,下面僅給出自變量對因變量貢獻(xiàn)排名前五位的自變量及反映其重要性大小的百分?jǐn)?shù)。見表1。

        表1 ADAPTIVEREG過程對65個自變量進(jìn)行回歸建模給出前五位自變量及其重要性數(shù)值

        由表1可知:分別以“y、y1和y2”為因變量時,ADAPTIVEREG過程從65個自變量中提取的前五位重要的自變量全部屬于A類中的自變量;而分別以“y3、y4和y5”為因變量時,ADAPTIVEREG過程從65個自變量中提取的前五位重要的自變量中分別有4、3、3個屬于A類中的自變量,即出錯數(shù)目分別為1、2、2個。

        3.2 采用REG過程對65個自變量進(jìn)行回歸建模

        3.2.1建模策略

        分別選取y、y1~y5為因變量,利用65個自變量(其中,A類21個自變量與因變量有關(guān)系,B類44個自變量與因變量無關(guān)系),采用REG過程進(jìn)行回歸建模。具體地說,在假定模型包含截距項與不含截距項的條件下,再分別采用“前進(jìn)法”“后退法”和“逐步法”篩選自變量,并記錄下最終回歸模型的有關(guān)重要信息。

        3.2.2 建模結(jié)果

        建模的輸出結(jié)果較多,下面僅給出最終的回歸模型中分別包含A類與B類自變量的數(shù)目。見表2。

        表2 REG過程對65個自變量進(jìn)行回歸建模保留A與B類自變量的數(shù)目

        由表2可知:假定回歸模型中不含截距項時,保留在回歸模型中的自變量數(shù)目明顯增多,此時,有很多與因變量無關(guān)的自變量會被保留在最終的回歸模型之中。假定回歸模型中包含截距項且采用前進(jìn)法或逐步法篩選自變量時,回歸模型中保留與因變量無關(guān)的自變量的數(shù)目比較少,即結(jié)論的正確性較高。

        4 基于a2數(shù)據(jù)集的B類中44個自變量進(jìn)行回歸建模

        4.1 采用ADAPTIVEREG過程對B類中44個自變量進(jìn)行回歸建模

        4.1.1建模策略

        分別選取y、y1~y5為因變量,利用B類中44個自變量,采用ADAPTIVEREG過程進(jìn)行回歸建模。

        4.1.2 建模結(jié)果

        建模的輸出結(jié)果很多,為節(jié)省篇幅,下面僅給出自變量對因變量貢獻(xiàn)排名前五位的自變量及反映其重要性大小的百分?jǐn)?shù)。見表3。由表3可知:盡管B類中44個自變量獨立于因變量,但ADAPTIVEREG過程仍以較高的“重要性”數(shù)值保留了較多的自變量。

        表3 ADAPTIVEREG過程對B類中44個自變量進(jìn)行回歸建模給出前五位自變量及其重要性數(shù)值

        4.2 采用REG過程對B類中44個自變量進(jìn)行回歸建模

        4.2.1 建模策略

        分別選取y、y1~y5為因變量,利用B類中44個自變量,采用REG過程進(jìn)行回歸建模。具體地說,在假定模型包含截距項與不含截距項的條件下,再分別采用“前進(jìn)法”“后退法”和“逐步法”篩選自變量,并記錄下最終回歸模型的有關(guān)重要信息。

        4.2.2 建模結(jié)果

        建模的輸出結(jié)果較多,下面僅給出最終的回歸模型中包含B類自變量的數(shù)目。見表4。

        表4 REG過程對B類中44個自變量進(jìn)行回歸建模保留自變量的數(shù)目

        由表4可知:假定回歸模型中包含截距項且采用前進(jìn)法篩選自變量時,與因變量無關(guān)的自變量全部都不被保留在回歸模型中,結(jié)果最可信;假定回歸模型中包含截距項且采用逐步法篩選自變量時,與因變量無關(guān)的自變量幾乎都不被保留在回歸模型中(本例僅因變量y3時有一個自變量),結(jié)果比較可信;而假定回歸模型中不含截距項且采用“指數(shù)變換(因變量y4)”時,與因變量無關(guān)的自變量被保留在回歸模型中的數(shù)目最少(本例中出現(xiàn)了一個);假定回歸模型中不含截距項且采用Logistic變換(因變量y5)時,與因變量無關(guān)的自變量被保留在回歸模型中的數(shù)目最多(本例中出現(xiàn)了43個)。

        5 回歸建模所需要的SAS程序

        5.1 實現(xiàn)表1和表3計算的SAS程序

        5.1.1 實現(xiàn)表1計算所需要的SAS過程步程序

        proc adaptivereg data=a2;

        model y=x1-x10 z1-z55;

        quit;

        5.1.2 實現(xiàn)表3計算所需要的SAS過程步程序

        proc adaptivereg data=a2;

        model y=x3-x10z20-z55;

        quit;

        5.1.3 關(guān)于上述SAS程序的說明

        將因變量y依次修改為“y1~y5”,分別運行上面的SAS過程步程序。

        5.2 實現(xiàn)表2和表4計算的SAS程序

        5.2.1 實現(xiàn)表2計算所需要的SAS過程步程序

        proc reg data=a2;

        model y=x1-x10 z1-z55/selection=forward sle=0.05;

        quit;

        proc reg data=a2;

        model y=x1-x10 z1-z55/noint selection=forward sle=0.05;

        quit;

        5.2.2 實現(xiàn)表4計算所需要的SAS過程步程序

        proc reg data=a2;

        model y= x3-x10 z20-z55/selection=forward sle=0.05;

        quit;

        proc reg data=a2;

        model y=x3-x10 z20-z55/noint selection=forward sle=0.05;

        quit;

        5.2.3 關(guān)于上述SAS程序的說明

        將“model語句”中的“selection=”及其后面的內(nèi)容分別修改為“backward sls=0.05;”和“stepwise sle=0.5 sls=0.05;”,就是采用“后退法”和“逐步法”篩選自變量;將因變量y依次修改為“y1~y5”,分別運行上面的SAS過程步程序。

        6 討論與結(jié)論

        6.1 討論

        統(tǒng)計學(xué)教科書上所講授的、統(tǒng)計軟件中所實現(xiàn)的回歸分析方法,主要依據(jù)是數(shù)學(xué)原理和數(shù)理統(tǒng)計知識;實際工作者在運用回歸分析技術(shù)時,并不知曉資料的自變量中哪些與因變量有關(guān)系、哪些與因變量無關(guān)系,全依靠回歸分析技術(shù)和統(tǒng)計軟件計算的結(jié)果來作出肯定或否定的結(jié)論。

        基于本文的“數(shù)據(jù)結(jié)構(gòu)”“真實情況”和“兩種回歸建模思路及計算結(jié)果”,可提出以下問題:在通常情況下,使用回歸分析技術(shù)處理各種“真實情況未知”的試驗數(shù)據(jù)時,所得到的“回歸分析結(jié)果”的可信度究竟有多高?究竟應(yīng)該如何提高回歸分析結(jié)果的可信度?

        筆者認(rèn)為:對于“真實情況未知”的試驗數(shù)據(jù)而言,無論采用“參數(shù)法”“半?yún)?shù)法”“非參數(shù)數(shù)”或所謂的“機(jī)器學(xué)習(xí)或深度學(xué)習(xí)”等方法進(jìn)行回歸建模,都是在“無中生有”,其整個過程都是一個“黑箱”,結(jié)果的可信度在相當(dāng)大的程度上取決于資料中變量之間的真實情況。然而,當(dāng)研究者對資料的真實情況一無所知時,應(yīng)采取非常審慎的態(tài)度看待其分析結(jié)果。

        6.2 結(jié)論

        當(dāng)資料中存在與因變量確有關(guān)系的自變量時,①由表1可知,ADAPTIVEREG過程具有較好的甄別能力;當(dāng)對因變量采取對數(shù)變換或平方根變換時,其甄別能力下降;當(dāng)對因變量采取倒數(shù)變換或指數(shù)變換或Logistic變換時,其甄別能力下降較為明顯。②由表2可知,REG過程具有較好的甄別能力,但需要滿足一定條件,即采用“前進(jìn)法”或“逐步法”篩選自變量,同時還需要“假定模型包含截距項”。

        當(dāng)資料中不存在與因變量確有關(guān)系的自變量時,①由表3可知,ADAPTIVEREG過程幾乎完全失去了甄別能力;②由表4可知,REG過程具有較好的甄別能力,但需要滿足一定條件,即采用“前進(jìn)法”篩選自變量,同時還需要“假定模型包含截距項”。若對因變量采取指數(shù)變換且“假定模型不含截距項”時,無論采取“前進(jìn)法”“后退法”或“逐步法”篩選自變量,都具有較好的甄別能力(見表4中倒數(shù)第2行最后3個數(shù)據(jù),從44個獨立于因變量的自變量中僅錯誤地保留了一個自變量)。若研究者基于基本常識和專業(yè)知識確定的自變量都與因變量有關(guān)系,對因變量進(jìn)行Logistic變換,并且,假定回歸模型中不含截距項時,會在回歸模型中保留非常多的自變量。此時,反映模型對資料擬合效果的R2值非常接近1、均方誤差MSE的數(shù)值遠(yuǎn)遠(yuǎn)小于1(因輸出結(jié)果較多,未在表2和表4中呈現(xiàn)出來)。

        猜你喜歡
        因變量數(shù)目適應(yīng)性
        有機(jī)物“同分異構(gòu)體”數(shù)目的判斷方法
        谷子引種適應(yīng)性鑒定與篩選初報
        調(diào)整有限因變量混合模型在藥物經(jīng)濟(jì)學(xué)健康效用量表映射中的運用
        中國藥房(2022年7期)2022-04-14 00:34:30
        健全現(xiàn)代金融體系的適應(yīng)性之“點論”
        中國外匯(2019年23期)2019-05-25 07:06:20
        偏最小二乘回歸方法
        談?wù)勅绾沃v解多元復(fù)合函數(shù)的求導(dǎo)法則
        卷宗(2017年6期)2017-06-06 10:38:48
        大型飛機(jī)A380-800在既有跑道起降的適應(yīng)性研究
        《哲對寧諾爾》方劑數(shù)目統(tǒng)計研究
        牧場里的馬
        固有免疫和適應(yīng)性免疫與慢性丙肝的研究進(jìn)展
        亚洲精品国产av成人网| 精品人妻人人做人人爽夜夜爽| 久久精品国产亚洲av成人| 免费无码午夜福利片69| 久久精品亚洲中文字幕无码网站| 亚洲日韩专区在线视频| 欧美xxxxx精品| 亚洲av网站在线免费观看| 美女国产毛片a区内射| 国产精品成人va在线观看| 婷婷午夜天| 一本大道在线一久道一区二区| 久久中文字幕av第二页| 日本a级片一区二区三区| 精品国产一区二区三区三| 男女性杂交内射妇女bbwxz| 欧美饥渴熟妇高潮喷水水| 四月婷婷丁香七月色综合高清国产裸聊在线 | 国产喷白浆精品一区二区豆腐| 国产三级av大全在线爽| 欧美三级不卡在线观看| 最新高清无码专区| 国内精品国产三级国产av另类| 黑丝国产精品一区二区| 国产三级精品三级在线专区2| 国产高清在线精品一区app| 69sex久久精品国产麻豆| 乌克兰少妇xxxx做受6| 蜜桃av观看亚洲一区二区| 毛片在线视频成人亚洲| 国产高清乱码又大又圆| 风韵饥渴少妇在线观看| 国产国拍亚洲精品福利| 日本不卡视频一区二区三区| 国产福利视频一区二区| 永久免费无码av在线网站| 亚洲AV小说在线观看| 熟女肥臀白浆一区二区| 国产免费一区二区三区免费视频| 亚洲最新偷拍网站| 精品人妻夜夜爽一区二区|