亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合SBM 的偏最小二乘輔助分析

        2014-12-23 01:22:16郝竹林杜建強王國龍余日躍熊旺平
        計算機工程與設計 2014年8期
        關鍵詞:因變量建模樣本

        郝竹林,杜建強+,王國龍,余日躍,聶 斌,熊旺平

        (1.江西中醫(yī)藥大學 計算機學院,江西 南昌330004;2.江西中醫(yī)藥大學 藥學院,江西 南昌330004)

        0 引 言

        多元回歸內(nèi)部采用最小二乘原理且數(shù)據(jù)樣本須滿足高斯-馬爾科夫假設條件。然而當回歸數(shù)據(jù)的樣本點個數(shù)少于變量個數(shù) (即維數(shù))或自變量存在嚴重多重共線性時,則不滿足高斯-馬爾科夫假設條件[1],此時多元回歸分析失效。為此,Krishnan[2]將主成分分析和典型相關分析與多元回歸分析進行結合的偏最小二乘回歸 (partial least square,PLS)方法進行了推廣和拓展;郭建校[3]對偏最小二乘在消除多重共線性中的作用進行了具體分析,驗證PLS可更好地消除數(shù)據(jù)樣本中多重共線性對回歸建??煽啃栽斐傻挠绊?,且詳細闡述了偏最小二乘中的輔助分析方法,并指出其中的T2橢圓圖輔助分析方法可用來判斷數(shù)據(jù)樣本點的重要性以及識別特異點。但當主成分維數(shù)增加到三維以上空間時,T2橢圓圖就無法識別出哪些樣本點是重要的,此時僅僅依靠偏最小二乘方法本身擁有的輔助分析技術和特性,無法完全識別到 “錯誤的數(shù)據(jù)”。據(jù)此,基于對多維空間分析中存在的局限性和 “錯誤數(shù)據(jù)得到錯誤模型”的問題,Du Juan[4]對SBM 模型進行了整體剖析和拓展,驗證了將樣本作為決策單元來計算其效率值以找出特異樣本的可行性;馬生昀等[5]將多元回歸應用到經(jīng)濟學理論數(shù)據(jù)包絡分析 (DEA)的BCC 模型多指標降維中,取得了較好成效,然而傳統(tǒng)DEA 模型 (CCR 模型和BCC 模型等)沒有考慮到數(shù)據(jù)樣本中投入產(chǎn)出的松弛性,因而不能完全反映出數(shù)據(jù)特性。鑒于此,提出將SBM 算法引入到偏最小二乘輔助分析中,進一步優(yōu)化偏最小二乘回歸建模方法。

        1 SBM 模型

        由CharnesA,CooperWW 和RhodesE[6]提出的數(shù)據(jù)包絡分析 (data envelopment analysis,DEA)可用來評價具有多個輸入和多個輸出的決策單元 (decision making unit,DMU)之間的相對有效性。傳統(tǒng)的DEA 模型 (如CCR 模型和BCC模型等)確保了相對有效性邊界或無差異曲線的凸性,但是有可能導致投入要素的 “飽和” (congestion)或 “松弛”(slacks)[7]。當投入產(chǎn)出要素增加并且考慮相應松弛情況時,對整體數(shù)據(jù)樣本的各個決策單元進行相對有效性評價就變得更加困難。Kaoru Tone提出基于松弛變量的效率測度的非徑向DEA 模型即 (slacks based measure)SBM模型[8],有效解決了BCC模型和CCR模型中存在的缺陷,是一種解決松弛問題的有效方法。

        假設n 個決策單元DMU,每個DMU 有s1種期望輸出、s2種非期望輸出和m 種投入,則SBM 模型表示如下

        式中:ρ——效率評價的有效值,s-、sg和sb——投入、期望產(chǎn)出和非期望產(chǎn)出的松弛變量,x0、yg0和yb0——被評價決策單元DMU0的投入、期望產(chǎn)出和非期望產(chǎn)出。對于特定的被評價決策單元,有如下定義1。

        定義1 ①當且僅當ρ=1即sg=0、sb=0和s-=0時是有效的;②當ρ<1時,則被評價決策單元是弱有效的但接近有效的,存在投入產(chǎn)出改進的必要性。

        為方便使用Matlab 進行編程計算,采用Charnes,Cooper變換[9],將式 (1)轉換為一個等價的線性規(guī)劃

        2 SBM 優(yōu)化偏最小二乘回歸

        SBM 方法不需要對樣本數(shù)據(jù)進行任何預處理[10],故可直接用其對原始樣本數(shù)據(jù)集進行相對有效性評價。根據(jù)評價效率值篩選出有效樣本,然后進行偏最小二乘回歸建模,具體分析步驟如下:

        (1)設樣本數(shù)據(jù)集S =(s1,s2,…,sm),m 為樣本點個數(shù),S 為樣本向量構成的數(shù)據(jù)矩陣,樣本數(shù)據(jù)集的自變量、因變量分別為(x1,x2,…,xp)和(y1,y2,…yr,…,yq)。根據(jù)SBM 模型,將樣本數(shù)據(jù)集的m 個樣本觀測點(s1,s2,…,sm)作為決策單元DMU,不期望增加的因變量(y1,y2,…,yr)作為非期望產(chǎn)出指標,期望增加的因變量(yr+1,yr+2,…,yq)作為期望產(chǎn)出指標,所有自變量(x1,x2,…,xp)作為投入指標,采用線性規(guī)劃式 (2)進行模型求解,計算該決策單元DMU 的效率值ρ。對于單個樣本點,當其效率值為1時稱為有效樣本點即SBM 效率值的閾值=1作為標準,據(jù)此,將最終選取的樣本數(shù)據(jù)集進行偏最小二乘回歸分析,其具體SBM 算法框架如下:

        (2)根據(jù)步驟 (1)篩選得到有效樣本數(shù)據(jù)集后,將其進行標準化預處理,得到處理后的數(shù)據(jù)矩陣:自變量X 為n×p 矩陣,X =(x1,…,xi,…,xp),因變量Y 為n×q矩陣,Y =(y1,…,yj,…,yq),其中n為樣本點個數(shù),p 為自變量個數(shù),q為因變量個數(shù)。

        (3)記t1為X 的第1個成分,u1為Y 的第1個成分,有t1=Xw1,u1=Yv1,其中w1為X 的第1個軸,v1為Y的第1個軸,軸均為單位列向量即 v1=1, w1=1。t1和u1須滿足以下2個條件[11]:

        變異信息最大:Var(t1)→max,Var(u1)→max

        相關程度最大:r(t1,u1)→max

        綜合可得協(xié)方差最大

        再根據(jù)拉格朗日算法推導,可得到

        其中,X1、Y1為X、Y 的殘差信息矩陣,回歸系數(shù)向量p1和r1分別為

        (5)如此循環(huán)利用剩余殘差信息矩陣不斷迭代計算,假設X 的秩為m(即若有A 個主成分,A≤r(X)=m),迭代后有

        式中:t1,t2,…,tm為自變量{x1,x2,…,xp}的線性組合,其中Xm、Ym分別為X 、Y 的第m 個殘差信息矩陣。

        (7)在PLS過程中,由于后續(xù)主成分已經(jīng)不可以為解釋Y 而提供更有意義的信息,因此,采取更多后續(xù)主成分只會破壞回歸模型的統(tǒng)計趨勢,從而引導錯誤結論。針對PLS并不需要構造出全部主成分進行回歸建模,并且根據(jù)樣本數(shù)據(jù)集規(guī)模,對小樣本數(shù)據(jù)集采用舍一交叉有效性檢驗[12]進行有效主成分個數(shù)的判定,主成分tm的交叉有效性計算公式如下

        3 實驗分析

        為對比采用SBM 算法優(yōu)化偏最小二乘回歸前后的模型效果,對中藥實驗數(shù)據(jù)和刀具磨損實驗數(shù)據(jù)分別進行實驗分析。

        參見江西中醫(yī)藥大學現(xiàn)代中藥制劑教育部重點實驗室所做的大承氣湯及其成分對梗阻大鼠腸血流量和周長的影響的實驗數(shù)據(jù)見表1,表中最左欄是實驗方種類,除原方外,各實驗方混料均采用均勻設計配方,各方用量參考原方臨床用量進行折算。x1~x9為大黃的成分含量,x10~x12為厚樸的成分含量。y1為梗阻大鼠距結扎1cm 處小腸的周長 (cm),y2為大鼠回腸末段血管的血流量,據(jù)此,共有12個化學成分的自變量和2個因變量。根據(jù)所設計的中醫(yī)藥實驗數(shù)據(jù)方案可知,y 與x 呈線性關系且2個因變量被劃入期望產(chǎn)出,再通過Matlab編程計算各組樣本觀測的效率值(見表1)。由此,方3 和方7 的對應樣本觀測效率值低于1,將其剔除。然后將剩余8個樣本采用偏最小二乘線性回歸建模,由于該樣本數(shù)據(jù)為小樣本量,故采用舍一交叉檢驗,確定主成分應提取2個,得到SBM 算法優(yōu)化后的偏最小二乘回歸方程 (見式 (9))。這里由于方3和方7是通過SBM 算法判定其為 “噪音”,但實驗均是在同條件下進行的,故在判斷SBM 算法優(yōu)化后的PLS模型的可靠性以及計算預測值時,應將方3和方7包含在內(nèi)

        再將未進行SBM 算法優(yōu)化的表1所有10個樣本點直接進行偏最小二乘回歸建模。同上,根據(jù)舍一交叉檢驗,確定主成分應提取2個。為與上述實驗比較,分別求出相應2個因變量的預測值、預測值的相對誤差、所有樣本預測值的平均相對誤差,結果見表2。

        再以刀具磨損實驗[13]數(shù)據(jù) (見表3)進行實驗分析,采用相同實驗方案,將效率值低于1的樣本4、樣本6和樣本7剔除,根據(jù)刀具磨損實驗研究可知,y與x1、x2、x3、x4、x5之間是一種非線性指數(shù)關系,將剔除后的樣本數(shù)據(jù)進行對數(shù)變換,再偏最小二乘回歸建模,根據(jù)舍一交叉檢驗可知,確定主成分應提取5 個,得到方程后再反對數(shù)變換,得到y(tǒng) 與x 的關系方程 (見式 (10))。再將表3的所有10個樣本點直接進行偏最小二乘回歸建模,同上,確定主成分應提取3個,最后計算因變量的預測值、預測值的相對誤差和平均相對誤差,二者進行對比,結果見表4

        表1 大承氣湯及其成分對梗阻大鼠腸血流量和周長的影響

        表2 中藥實驗數(shù)據(jù)的SBM 優(yōu)化PLS和直接PLS回歸結果對比

        由表2和表4可知,以平均相對誤差作為模型可靠性標準,針對中藥實驗數(shù)據(jù)的2個因變量,計算出SBM 優(yōu)化的偏最小二乘回歸平均相對誤差為5.0844%和8.7485%,低于樣本數(shù)據(jù)直接進行偏最小二乘回歸建模的5.5825%和9.2810%;針對刀具磨損實驗數(shù)據(jù)的1個因變量,SBM 優(yōu)化后的平均相對誤差為2.6984%,低于直接偏最小二乘回歸建模的3.3526%。

        4 結束語

        通過上述分析,可得到以下結論:①提出使用SBM 優(yōu)化偏最小二乘回歸建模,提高了建模精度。根據(jù)SBM 計算樣本點效率值和分析其特點,可以更好地剔除 “錯誤的數(shù)據(jù)”,得到更可靠的模型。②通過對比分析可得到,SBM優(yōu)化的PLS回歸與直接PLS相比,其平均相對誤差得到降低。③不同的DEA 經(jīng)濟數(shù)學模型對樣本數(shù)據(jù)的評價有不同的特性和影響,可采用不同的DEA 模型,從而減少無效數(shù)據(jù)對回歸建模的影響。④可以將不同的DEA 經(jīng)濟數(shù)學模型引入到中醫(yī)藥實驗數(shù)據(jù)的回歸建模上,為中醫(yī)藥事業(yè)提供更好的技術支撐。

        表3 刀具磨損實驗樣本數(shù)據(jù)

        表4 刀具磨損實驗數(shù)據(jù)SBM 優(yōu)化PLS和直接PLS回歸結果對比

        [1]XU Qun.The research on non-linear regression analysis methods[D].Hefei:Hefei University of Technology,2009 (in Chinese). [徐群.非線性回歸分析的方法研究 [D].合肥:合肥工業(yè)大學,2009.]

        [2]Krishnan A,Williams L J,Mcintosh A R,et al.Partial least squares(PLS)methods for neuroimaging:A tutorial and review [J].NeuroImage,2011,56 (2):455-475.

        [3]GUO Jianxiao.Study on improved high-dimension and nonlinear partial least-squares regression method and applications[D].Tianjin:Tianjin University,2010 (in Chinese).[郭建校.改進的高維非線性PLS回歸方法及應用研究 [D].天津:天津大學,2010.]

        [4]Du J,Liang L,Zhu J.A slacks-based measure of super-efficiency in data envelopment analysis:a comment[J].European Journal of Operational Research,2010,204 (3):694-697.

        [5]MA Shengjun,WANG Dongmei,MA Zhanxin,et al.Application of multivariate regression to reduce the dimension of the index in DEA method [J].Journal of Inner Mongolia Agricultural University (Natural Science Edition),2012,33 (1):231-235 (in Chinese).[馬生昀,王冬梅,馬占新,等.多元回歸在DEA 方法指標降維中的應用 [J].內(nèi)蒙古農(nóng)業(yè)大學學報 (自然科學版),2012,33 (1):231-235.]

        [6]Cooper W W.Handbook on data envelopment analysis [M].Springer US,2011.

        [7]WEI Quanling.Data envelopment analysis model to evaluate the relative effectiveness——DEA and network DEA [M].Beijing:China Renmin University Press,2012 (in Chinese).[魏權齡.評價相對有效性的數(shù)據(jù)包絡分析模型——DEA 和網(wǎng)絡DEA [M].北京:中國人民大學出版社,2012.]

        [8]Zhou Y,Xing X,F(xiàn)ang K,et al.Environmental efficiency analysis of power industry in China based on an entropy SBM model[J].Energy Policy,2012,57:68-75.

        [9]Li H,F(xiàn)ang K,Yang W,et al.Regional environmental efficiency evaluation in China:Analysis based on the super-SBM model with undesirable outputs [J].Mathematical and Computer Modelling,2013,58 (5-6):1018-1031.

        [10]Tone K.Variations on the theme of slacks-based measure of efficiency in DEA [J].European Journal of Operational Research,2010,200 (3):901-907.

        [11]SUN Fenglin,HAO Zhifeng.Application of OPLS in non-linear partial least squares regression model[J].Computer Engineering and Design,2010,31 (12):2826-2829 (in Chinese).[孫鳳林,郝志峰.OPLS在非線性偏最小二乘回歸模型的應用[J].計算機工程與設計,2010,31 (12):2826-2829.]

        [12]Rodriguez J D,Perez A,Lozano J A.Sensitivity analysis of k-fold cross validation in prediction error estimation [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32 (3):569-575.

        [13]ZHANG Xiaohai,JIN Jiashan,GENG Junbao.Optimized partial least squares regression with data envelopment analysis and its application [J].Journal of Zhejiang University (Engineering Science),2011,45 (9):1688-1692(in Chinese).[張小海,金家善,耿俊豹.用DEA優(yōu)化偏最小二乘回歸建模及應用 [J].浙江大學學報(工學版),2011,45 (9):1688-1692.]

        猜你喜歡
        因變量建模樣本
        調(diào)整有限因變量混合模型在藥物經(jīng)濟學健康效用量表映射中的運用
        中國藥房(2022年7期)2022-04-14 00:34:30
        用樣本估計總體復習點撥
        聯(lián)想等效,拓展建模——以“帶電小球在等效場中做圓周運動”為例
        適應性回歸分析(Ⅳ)
        ——與非適應性回歸分析的比較
        基于PSS/E的風電場建模與動態(tài)分析
        電子制作(2018年17期)2018-09-28 01:56:44
        推動醫(yī)改的“直銷樣本”
        不對稱半橋變換器的建模與仿真
        偏最小二乘回歸方法
        文理導航(2017年20期)2017-07-10 23:21:03
        隨機微分方程的樣本Lyapunov二次型估計
        村企共贏的樣本
        无码人妻久久一区二区三区免费| 琪琪av一区二区三区| 日本乱熟人妻中文字幕乱码69| 国产国语亲子伦亲子| 真人与拘做受免费视频| 国产va免费精品高清在线观看| 午夜少妇高潮免费视频| 国产一区二区三区三区四区精品| 国产美腿丝袜一区二区| 强开少妇嫩苞又嫩又紧九色 | 插插射啊爱视频日a级| 无码人妻一区二区三区在线视频| 久久半精品国产99精品国产| 一区二区亚洲精美视频| 精品国产亚洲亚洲国产| 中国国语毛片免费观看视频| 亚洲一级电影在线观看| 男生自撸视频在线观看| 色哟哟最新在线观看入口| 亚洲有码转帖| 中文亚洲成a人片在线观看| 亚洲中文字幕高清乱码毛片| av在线免费观看网站免费| 中文字幕亚洲精品无码| 精品人妻无码一区二区色欲产成人| 黄 色 成 年 人 网 站免费| 国产av一区二区三区狼人香蕉 | 美女把内衣内裤脱了给男人舔| 国内精品国产三级国产| 久久亚洲精品成人av无码网站| 国产高颜值大学生情侣酒店| 日韩亚洲制服丝袜中文字幕| 成人自拍三级在线观看| 久久久久久欧美精品se一二三四| 人人妻人人玩人人澡人人爽 | 手机看片福利日韩国产| 国产亚洲中文字幕久久网| 熟妇高潮一区二区三区在线观看| 亚洲国产美女精品久久久 | 亚洲熟妇自偷自拍另类| 亚洲熟女乱色综合亚洲图片|