亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種解決三區(qū)間數(shù)回歸的混合PM方法

        2023-07-13 10:32:00林祎明孫慧敏
        統(tǒng)計(jì)與決策 2023年9期
        關(guān)鍵詞:下界參考點(diǎn)方根

        汪 瑜,林祎明,孫慧敏

        (中國民用航空飛行學(xué)院 經(jīng)濟(jì)與管理學(xué)院,四川 廣漢 618307)

        0 引言

        線性回歸是指利用數(shù)理統(tǒng)計(jì)中的回歸分析確定被解釋變量和兩個(gè)或者兩個(gè)以上解釋變量之間線性關(guān)系的一種統(tǒng)計(jì)分析方法。在大數(shù)據(jù)時(shí)代,大量精確點(diǎn)數(shù)據(jù)被壓縮和歸類到若干具備上下界的區(qū)間中,并通常會(huì)在該類區(qū)間中增加一個(gè)最有可能值,以防止因數(shù)據(jù)壓縮而造成的信息過度丟失現(xiàn)象。正是這種優(yōu)勢使得三區(qū)間數(shù)被廣泛應(yīng)用于交通、醫(yī)藥、金融、工程等領(lǐng)域。三區(qū)間線性回歸就是探索這種三區(qū)間數(shù)據(jù)類型變量之間相互依賴關(guān)系的一種方法,且被廣泛應(yīng)用于模式識(shí)別、人工智能、數(shù)據(jù)挖掘、數(shù)據(jù)建模等領(lǐng)域。

        區(qū)間回歸法從區(qū)間數(shù)據(jù)中利用不同的參考點(diǎn)對(duì)被解釋變量進(jìn)行回歸預(yù)測?,F(xiàn)有的區(qū)間回歸法大多選取區(qū)間中點(diǎn)范圍或者端點(diǎn)作為參考點(diǎn)展開研究[1—4]。Billard和Diday(2000)[5]首先提出了中點(diǎn)法(Center Method,CM),通過區(qū)間數(shù)據(jù)的中點(diǎn)對(duì)回歸系數(shù)進(jìn)行求解,進(jìn)而推導(dǎo)出回歸區(qū)間的上下界。Neto和Carvalho(2008)[6]提出了中點(diǎn)范圍法(Centre and Range Method,CRM),通過區(qū)間數(shù)據(jù)的中點(diǎn)和范圍來對(duì)被解釋變量的上下界進(jìn)行回歸預(yù)測。然而,上述回歸方法均不能保證區(qū)間的數(shù)學(xué)一致性。為了解決上述問題,Lima和Carvalho(2010)[7]提出了一種考慮增加范圍系數(shù)非負(fù)約束的CRM 法,即CCRM(Constrained Center and Range Method)法來保證回歸區(qū)間的合理性。Dias和Brito(2017)[8]提出了一種用分位數(shù)函數(shù)表示區(qū)間分布的回歸模型(ID模型),并對(duì)回歸參數(shù)進(jìn)行非負(fù)約束以保證數(shù)學(xué)一致性,但該模型僅在被解釋變量與解釋變量之間存在正相關(guān)關(guān)系時(shí)才會(huì)起作用。Zhao等(2022)[9]提出了一種基于中點(diǎn)和對(duì)數(shù)范圍的區(qū)間值數(shù)據(jù)穩(wěn)健回歸方法(LN-IRR),并分別建立了基于區(qū)間變量的中點(diǎn)和區(qū)間對(duì)數(shù)范圍的回歸模型,該模型針對(duì)對(duì)數(shù)范圍建模,可以消除區(qū)間范圍上的非負(fù)約束。Giordani(2011)[10]提出了一種更加靈活的Lasso-IR線性回歸方法,該方法使用了最小絕對(duì)收縮和選擇算子(Lasso)約束,并對(duì)區(qū)間值數(shù)據(jù)的中點(diǎn)和半徑進(jìn)行線性回歸分析,然而該方法假設(shè)被解釋變量的回歸半徑(中點(diǎn))只依賴于解釋變量的半徑(中點(diǎn)),不存在任何的交叉關(guān)系。Billard 和Diday(2002)[11]提出了基于解釋變量區(qū)間數(shù)據(jù)上下界進(jìn)行回歸預(yù)測的最大最小值法(MinMax Method,MinMax),相較于中點(diǎn)范圍法,僅選取端點(diǎn)作為參考點(diǎn)無法體現(xiàn)數(shù)據(jù)的內(nèi)部波動(dòng)情況進(jìn)而使得數(shù)據(jù)信息過度丟失,因此部分學(xué)者基于區(qū)間端點(diǎn)進(jìn)行改進(jìn)研究。為了減少數(shù)據(jù)信息的丟失,Wang等(2012)[12]提出了一種捕捉區(qū)間值觀測的完整信息的線性模型,稱為完全信息方法(Complete Information Method,CIM)。Nasirzadeh等(2021)[13]為了增加數(shù)據(jù)信息的可利用度,提出了一種在觀測區(qū)間上下界內(nèi)均勻選取參考點(diǎn)從而分別建立回歸上下界的方法,稱為馬爾可夫鏈蒙特卡洛方法(MCMC)。Baymani和Saffaran(2021)[14]在傳統(tǒng)ε-SVR方法的基礎(chǔ)上提出一種ISVR(Interval Support Vector Regression)方法,該方法利用區(qū)間數(shù)據(jù)的下界和上界解決了兩個(gè)ε-SVR問題從而得到兩個(gè)超平面。通過實(shí)例驗(yàn)證發(fā)現(xiàn),相較于ε-SVR方法,ISVR方法對(duì)于數(shù)據(jù)集中的樣本數(shù)量是沒有限制的,且實(shí)驗(yàn)效果優(yōu)于CM、CRM和CCRM方法??梢园l(fā)現(xiàn),現(xiàn)有的中點(diǎn)范圍法和端點(diǎn)法都是選取固定參考點(diǎn)來進(jìn)行回歸,但在觀測數(shù)據(jù)波動(dòng)較大時(shí),這種固定參考點(diǎn)的回歸方法往往效果不佳。為了解決這一問題,Souza 等(2017)[15]提出了一種PM(Parameterized Method)方法,該模型通過自動(dòng)調(diào)整區(qū)間上下界的被選擇參考點(diǎn)來優(yōu)化回歸效果,同時(shí)CM、MINMAX和CRM方法均被證明是PM方法的特殊形式。但該模型在區(qū)間數(shù)據(jù)波動(dòng)幅度過大時(shí),卻很難解決區(qū)間的相交性問題。另外,上述區(qū)間回歸法大多僅針對(duì)具有上下界的兩區(qū)間數(shù)據(jù)格式,因此無法直接用于解決三區(qū)間數(shù)的回歸問題。

        鑒于此,本文首先將區(qū)間上下界數(shù)據(jù)序列用參數(shù)化方法表示,將最有可能值數(shù)據(jù)序列用普通點(diǎn)回歸模型表示;其次,通過限制“回歸區(qū)間上界≥回歸最有可能值點(diǎn)≥回歸區(qū)間下界”來保證區(qū)間數(shù)據(jù)的數(shù)學(xué)一致性,并增加“回歸區(qū)間上界≥觀測區(qū)間下界且觀測區(qū)間上界≥回歸區(qū)間下界”這一約束條件來保證區(qū)間的相交性,從而構(gòu)建以被解釋變量回歸區(qū)間與觀測區(qū)間上下界誤差值和最有可能值誤差值平方和最小化為目標(biāo)函數(shù)的區(qū)間回歸模型;再次,基于K-T條件對(duì)模型的回歸系數(shù)進(jìn)行討論和求解;最后,通過蒙特卡洛模擬法檢驗(yàn)本文模型的優(yōu)勢。

        1 三區(qū)間數(shù)回歸的混合PM方法

        1.1 上下界回歸的PM模型

        上下界的區(qū)間回歸PM 模型本質(zhì)上是兩區(qū)間數(shù)回歸PM模型。該模型通過自動(dòng)調(diào)整區(qū)間上下界被選擇參考點(diǎn)來實(shí)現(xiàn)優(yōu)化回歸誤差的目的。下頁圖1 是以回歸下界為例展示的PM方法的基本原理。

        圖1 PM方法的基本原理

        可以發(fā)現(xiàn),PM方法通過自動(dòng)調(diào)整固定參考點(diǎn)(即每一個(gè)自變量的觀測下界線段的固定分配比例)的選擇來達(dá)到優(yōu)化回歸誤差的目的。但現(xiàn)有的PM 方法只通過限定每個(gè)回歸區(qū)間的非負(fù)性來保證區(qū)間數(shù)據(jù)的數(shù)學(xué)一致性。當(dāng)區(qū)間數(shù)據(jù)整體波動(dòng)過大時(shí),可能會(huì)出現(xiàn)回歸精度下降的現(xiàn)象(如下頁圖2所示),無法保證區(qū)間的相交性。

        圖2 區(qū)間數(shù)據(jù)波動(dòng)幅度過大時(shí)的PM方法回歸效果圖

        尤其是對(duì)于三區(qū)間數(shù)回歸問題,目前的兩區(qū)間數(shù)回歸的PM法無法保證最有可能值、上下界之間的數(shù)學(xué)一致性,同時(shí)也無法確保三區(qū)間觀測區(qū)間和回歸區(qū)間的相交性。

        1.2 最有可能值的回歸模型

        基于CRM 方法[6]的基本理念對(duì)最有可能值點(diǎn)進(jìn)行建模,如式(3)所示:

        1.3 三區(qū)間數(shù)回歸的混合PM模型

        由于本文增加了最有可能值點(diǎn),因此為了使混合模型的回歸精度最大化,將目標(biāo)函數(shù)定義為被解釋變量上界、下界和最有可能值點(diǎn)誤差項(xiàng)的平方和最小化,具體如式(6)所示:

        由圖2 可知,該模型在區(qū)間數(shù)據(jù)波動(dòng)幅度較大時(shí)難以保證回歸區(qū)間與觀測區(qū)間一定存在交集,進(jìn)而導(dǎo)致模型的回歸精度降低,因此需要對(duì)PM模型進(jìn)行改進(jìn)。為保證回歸區(qū)間和觀測區(qū)間的相交性,添加如下兩條約束:(1)回歸區(qū)間上界≥觀測區(qū)間下界;(2)觀測區(qū)間上界≥回歸區(qū)間下界。具體模型如式(7)和式(8)所示,稱為PM+模型。

        1.4 回歸系數(shù)求解

        為了便于系數(shù)估計(jì)值的求解,將上述模型轉(zhuǎn)化為矩陣形式,如式(9)所示:

        將式(10)中的約束條件轉(zhuǎn)化為式(11)的形式,可知該模型的約束條件均為線性函數(shù),因此其Hessian矩陣均為實(shí)對(duì)稱矩陣,且他們的各階主子式均為0,因此約束條件均為凹函數(shù)。

        表1 解的可能性的情況討論

        1.5 評(píng)價(jià)指標(biāo)

        現(xiàn)有兩區(qū)間PM 模型通常選取均方根誤差(RMSE)、平均準(zhǔn)確率(AR)、平均比率(PCO)[15]和觀測區(qū)間與回歸區(qū)間不相交的個(gè)數(shù)(N0)[16]四個(gè)方面的評(píng)價(jià)指標(biāo)對(duì)模型的回歸結(jié)果進(jìn)行比較。在解決三區(qū)間數(shù)問題時(shí),本文在上述基礎(chǔ)上進(jìn)行擴(kuò)展。

        (1)RMSE

        為了明確三區(qū)間混合回歸模型對(duì)區(qū)間數(shù)據(jù)每一部分的回歸精度的影響,本文主要從觀測區(qū)間與回歸區(qū)間的左半徑均方根誤差(RMSErl)、右半徑均方根誤差(RMSErr)、最有可能值均方根誤差(RMSEm)和整體均方根誤差(RMSE)四個(gè)方面來計(jì)算。

        (2)AR

        對(duì)于AR 來說,本文主要從左半徑平均準(zhǔn)確率(ARrl)和右半徑平均準(zhǔn)確率(ARrr)兩個(gè)方面來計(jì)算。

        2 蒙特卡洛模擬分析

        為了驗(yàn)證本文PM+模型的優(yōu)勢,將其與文獻(xiàn)[2]和[16]中的CCRM+模型進(jìn)行對(duì)比分析。

        2.1 模擬數(shù)據(jù)生成

        為了便于對(duì)比,本文采用前文選取的評(píng)價(jià)指標(biāo)進(jìn)行計(jì)算分析;為了說明區(qū)間自變量個(gè)數(shù)對(duì)于回歸效果的影響,本文分別模擬了自變量個(gè)數(shù)j=1 和j=3 兩種情況;為了說明數(shù)據(jù)波動(dòng)幅度對(duì)回歸模型精度的影響,本文分別模擬了中點(diǎn)序列和范圍序列兩種不同的波動(dòng)情況來進(jìn)行對(duì)比分析。

        在蒙特卡洛模擬過程中,本文基于CRM模型[6]的基本思想共生成了400組數(shù)據(jù),其中的300組數(shù)據(jù)作為訓(xùn)練集,用于回歸系數(shù)的估計(jì);其余100 組數(shù)據(jù)作為測試集,用于對(duì)回歸結(jié)果進(jìn)行評(píng)價(jià)。為了避免1次模擬的隨機(jī)性,本文對(duì)上述過程重復(fù)100次,結(jié)果如表2所示。

        表2 蒙特卡洛模擬過程的數(shù)據(jù)生成

        2.2 結(jié)果對(duì)比與分析

        本文通過t 檢驗(yàn)對(duì)改進(jìn)的CCRM模型(簡稱CCRM+模型)和PM+模型進(jìn)行比較,顯著性水平取為1%。將CCRM+模型優(yōu)于PM+模型作為原假設(shè),將CCRM+模型不劣于PM+模型作為備擇假設(shè)??紤]到RMSE為成本型指標(biāo),該指標(biāo)值越大說明擬合的效果越差,因此原假設(shè)為RMSECCRM+<RMSEPM+,備擇假設(shè)為RMSECCRM+≥RMSEPM+;考慮到AR和PCO 為效益型指標(biāo),該指標(biāo)值越大說明擬合的效果越好,因此原假設(shè)為PCOCCRM+>PCOPM+時(shí),備擇假設(shè)為PCOCCRM+≤PCOPM+;原假設(shè)為ARCCRM+>ARPM+時(shí),備擇假設(shè)為ARCCRM+≤ARPM+。若假設(shè)CCRM+模型和PM+模型相同,則原假設(shè)為CCRM+模型與PM+模型的指標(biāo)值相同,備擇假設(shè)為CCRM+模型與PM+模型的指標(biāo)值不相同。

        表3 至表5 分別是以CCRM+模型優(yōu)于、劣于、等同于PM+模型作為原假設(shè)進(jìn)行t檢驗(yàn)的結(jié)果。

        表3 CCRM+模型優(yōu)于PM+模型為原假設(shè) (單位:%)

        表4 CCRM+模型劣于PM+模型為原假設(shè) (單位:%)

        表5 CCRM+模型等同于PM+模型為原假設(shè) (單位:%)

        可以看出:均方根誤差RMSErl和RMSErr均拒絕“CCRM+模型劣于PM+模型”和“CCRM+模型等同于PM+模型”的原假設(shè),但接受“CCRM+模型優(yōu)于PM+模型”的原假設(shè)。RMSEm拒絕“CCRM+模型優(yōu)于PM+模型”和“CCRM+模型等同于PM+模型”的原假設(shè),但接受“CCRM+模型劣于PM+模型”的原假設(shè)。當(dāng)j=1時(shí),RMSE拒絕“CCRM+模型劣于PM+模型”和“CCRM+模型等同于PM+模型”的原假設(shè),但接受“CCRM+模型優(yōu)于PM+模型”的原假設(shè);當(dāng)j=3 時(shí),RMSE拒絕“CCRM+模型優(yōu)于PM+模型”和“CCRM+模型等同于PM+模型”的原假設(shè),但接受“CCRM+模型劣于PM+模型”的原假設(shè)。

        觀測區(qū)間包含預(yù)測區(qū)間的平均比率PCOrl和PCOrr均拒絕“CCRM+模型優(yōu)PM+模型”和“CCRM+模型等同于PM+模型”的原假設(shè),但接受“CCRM+模型劣于PM+模型”的原假設(shè)。

        在j=1 的情形下,平均準(zhǔn)確率ARrl和ARrr均拒絕“CCRM+模型劣于PM+模型”和“CCRM+模型等同于PM+模型”的原假設(shè),但接受“CCRM+模型優(yōu)于PM+模型”的原假設(shè)。在j=3 的情形下,ARrl和ARrr均拒絕“CCRM+模型優(yōu)于PM+模型”和“CCRM+模型等同于PM+模型”的原假設(shè),但接受“CCRM+模型劣于PM+模型”的原假設(shè)。

        綜上所述,相較于CCRM+模型,PM+模型的回歸精度明顯提高,但卻是以犧牲一部分的均方根誤差和平均準(zhǔn)確率的擬合精度為代價(jià)的。此外,隨著數(shù)據(jù)波動(dòng)幅度和解釋變量個(gè)數(shù)的增加,PM+模型只犧牲了較小的RMSErl和RMSErr值就保證了整體的回歸精度,具有明顯的優(yōu)勢。

        表6給出了100組測試數(shù)據(jù)下各類評(píng)價(jià)指標(biāo)的均值。

        表6 CCRM+模型與PM+模型評(píng)價(jià)指標(biāo)值

        可以發(fā)現(xiàn),對(duì)于均方根誤差來說,相較于j=1 的情形,j=3 情形下PM+模型均方根誤差的相關(guān)指標(biāo)值的犧牲較小,在RMSEm和RMSE方面均優(yōu)于CCRM+模型的擬合精度,且在多元擬合下兩個(gè)模型在RMSErl和RMSErr指標(biāo)方面的差距明顯縮小,說明此時(shí)PM+模型在RMSErl和RMSErr方面也有一定程度的改善。對(duì)于平均準(zhǔn)確率來說,當(dāng)j=1 時(shí),PM+模型的指標(biāo)值在整體上略小于CCRM+模型的指標(biāo)值,在多元回歸的情況下,隨著區(qū)間數(shù)據(jù)序列波動(dòng)幅度增大,PM+模型的AR 值有所提高且大于CCRM+模型的AR 值。此外,PM+模型的PCOrl、PCOrr和N0指標(biāo)明顯優(yōu)于CCRM+模型,即使在數(shù)據(jù)波動(dòng)幅度較大時(shí)仍能保持在較高的水平,說明PM+模型的回歸精度明顯高于CCRM+模型且在極大程度上保證了回歸區(qū)間和觀測區(qū)間的重合度。相較于CCRM+模型選取固定的中點(diǎn)和范圍作為參考點(diǎn),PM+模型通過自動(dòng)調(diào)整λlj和λuj值獲得使目標(biāo)函數(shù)取得最小值的回歸系數(shù)這一方法使得最終的回歸精度明顯提高。

        3 結(jié)論

        三區(qū)間數(shù)線性回歸是數(shù)據(jù)建模分析中的一類重要問題,具有廣泛的應(yīng)用價(jià)值。本文在兩區(qū)間數(shù)PM回歸模型的基礎(chǔ)上,將區(qū)間上下界數(shù)據(jù)序列用參數(shù)化方法表示,將最有可能值數(shù)據(jù)序列用普通點(diǎn)回歸模型表示,然后以被解釋變量回歸上下界和最有可能值誤差平方和最小化為目標(biāo)函數(shù),以保證區(qū)間數(shù)據(jù)的數(shù)學(xué)一致性和觀測區(qū)間與回歸區(qū)間必存在交集為約束條件,提出了三區(qū)間數(shù)回歸的混合PM模型。蒙特卡洛模擬結(jié)果驗(yàn)證了本文的PM+模型能夠提升區(qū)間回歸精度,尤其是在PCO 和N0方面具有明顯優(yōu)勢,且該模型無論是在一元回歸還是多元回歸過程中都保持著較好的回歸效果。需要說明的是,該模型的總體回歸效果是以犧牲一小部分RMSE 或者AR 值為代價(jià)的,因此如何平衡這種關(guān)系是后續(xù)研究的一個(gè)重要方向。

        猜你喜歡
        下界參考點(diǎn)方根
        方根拓展探究
        FANUC數(shù)控系統(tǒng)機(jī)床一鍵回參考點(diǎn)的方法
        參考點(diǎn)對(duì)WiFi位置指紋算法的影響
        Lower bound estimation of the maximum allowable initial error and its numerical calculation
        數(shù)控機(jī)床返回參考點(diǎn)故障維修
        均方根嵌入式容積粒子PHD 多目標(biāo)跟蹤方法
        揭開心算方根之謎
        FANUC數(shù)控機(jī)床回參考點(diǎn)故障分析與排除
        矩陣Hadamard積的上下界序列
        最大度為10的邊染色臨界圖邊數(shù)的新下界
        精品久久久久久无码人妻热| 日本午夜伦理享色视频| 久久亚洲中文字幕精品熟| 无码熟妇人妻av影音先锋| 免费a级毛片无码a| 久久精品无码一区二区三区不卡| 白色白在线观看免费2| 97在线视频人妻无码| 99精品热这里只有精品| 999久久66久6只有精品| 国产白浆一区二区三区佳柔| 每日更新在线观看av| 丰满老熟妇好大bbbbb| 亚洲精品中文字幕观看| 久久婷婷综合激情亚洲狠狠| 婷婷成人丁香五月综合激情| 精品久久久久久中文字幕| 99精品国产一区二区| 国产乱视频| 风韵丰满妇啪啪区老老熟女杏吧| 国产精品亚洲三级一区二区三区| 欧美中日韩免费观看网站| 久久精品国产99精品九九| 亚洲五月七月丁香缴情| 午夜视频一区二区三区四区| 中文字幕日韩精品一区二区三区| 亚洲国产成人精品无码区在线观看| 最新国产精品精品视频| 亚洲国产精品高清在线| 午夜福利一区二区三区在线观看| 欧美日韩性视频| 青青草视频在线免费观看91| 成熟了的熟妇毛茸茸| 无尽动漫性视频╳╳╳3d| 无码中文字幕久久久久久| 91三级在线观看免费| 久久99精品久久久久久秒播| 精品久久久久久蜜臂a∨| 亚洲麻豆av一区二区| 人人妻人人澡人人爽精品日本| 51久久国产露脸精品国产|