琪美格
摘要 開墾河位于新疆奇臺縣境內(nèi),發(fā)源于東天山博格達山脈北坡,開墾河水文站是其水量控制站。本文選用開墾河水文站19602019年68月平均流量并構(gòu)建為分類因變量(預報對象),5月下的的平均氣溫、4月下的的平均流量和4月上的降水量為預報因子,用SPSS進行有序回歸分析,對2020年68月平均流量各類可能發(fā)生的概率進行預報,結(jié)果令人滿意。
關(guān)鍵詞 開墾河;分類因變量;有序回歸分析;預報
中圖分類號:P457
文獻標識碼:A
文章編號:2095-3305(2021)02-032-02
0引言
每年5月,政府防御等部門要求水文部門提供當?shù)刂饕恿飨募緛硭厔莘治龀晒?,由于新疆河流夏季來水變幅大、隨機性強,増大了預報難度。本文通過選用開墾河水文站夏季前期預報因子,將2020年68月平均流量構(gòu)建為反映夏季來水偏豐、正?;蚱莸姆诸愐蜃兞浚瑢ζ湮磥砀黝惪赡馨l(fā)生的概率用有序回歸分析進行嘗試預報,確保滿足精度要求。
1基本思路
取值有內(nèi)在大小或高低順序之分的分類因變量,稱為有序多項分類因變量(簡稱分類因變量),對其各類可能發(fā)生的概率進行預報,可用有序回歸分析法。
有序回歸分析就是通過一組預報因子,采用逐步改變參照類的方法,建立多個類似二值LogisticI的回歸方程,以此來描述分類因變量各類與參照類相比的條件下預報因子對預報對象的作用。
如果預報對象y(分類因變量)有J類別別,令第(1,2,,)類的概率為P,則∑P=1,且y≤j的累加概率可表示為P(y≤j)=P1+…:P。P(y≤j常用Logit連接函數(shù),若用x(k=12,…,m,m是預報因子總數(shù))表示預報因子,a和b分別表示第類的常數(shù)項與預報因子回歸系數(shù),則Logit連接函數(shù)形式為:
式中,=1,2,…,J-1,(下同),由此可建立J1個累加Logitt模型,第j個累加Logi模型類似一個二值Logistic回歸模型,其中1~類合并為一類,而+1)~J類再合并為另一類,再將兩類相比較(后一類為參照類,并逐步改變),即將原來的多項分類通過合并轉(zhuǎn)變成了一般的二值分類。累加LogitA模型的J-1個預測概率回歸方程為:
由上式可計得分類因變量各類可能發(fā)生的概率:第1類的概率為P1=P(y≤1),第j類的概率為P=P(y≤j)-Py≤j-1)],第J類的概率為P=1-Py≤(J-1)]。
在J1個連接函數(shù)和預測概率模型中,回歸系數(shù)b是假設(shè)不變的,僅常數(shù)項a在改變。
2有序回歸分析與預報
2.1構(gòu)建6-8月平均流量分類因變量
開墾河水文站1960-2019年5月下旬句平均氣溫T53、4月下旬旬平均流量Q43、4月上句降水量P41及6-8月平均流量Q序列SPSS數(shù)據(jù)文件(僅顯示局部)見圖1。
Q序列多年均值為10.6m/s。本次約定,Q低于9.54m/s(即距平值《-10)時,來水量為偏枯,對應的分類因變量Y取1;介于9.54ms和11.7m/s之間(即距平值介于-10和10之間)為正常,Y取2;高于11.7m/s(即距平值》10)為偏豐,Y取3。構(gòu)建的分類因變量Y序列見圖1,其中,預報因子是通過1-5月句平均流量、句降水量、旬平均氣溫與Q建立逐步回歸方程優(yōu)選而得的。
2.2有序回歸分析
SPSS操作步驟為:
步驟1:在圖1中依次單擊菜單“分析→回歸→有序”,從彈出的Ordinal回歸對話框左側(cè)的列表框中選擇“Y”,移動到因變量列表框,選擇T53”、“Q43”和'P41”,移動到協(xié)變量列表框。
步驟2:單擊“輸出”按鈕,在打開的對話框中勾選“擬合度統(tǒng)計”、“摘要 統(tǒng)計”、“參數(shù)估計”和“平行線檢驗”,單擊“繼續(xù)”按鈕,返回Ordinall回歸對話框。
步驟3:單擊“確定”按鈕,執(zhí)行有序回歸的操作。
2.3回歸效果的統(tǒng)計檢驗
SPSS輸出的回歸效果統(tǒng)計檢驗結(jié)果如下:
(1)案例處理摘要 :60個分類因變量個案全部有效,其中偏枯27個,正常15個,偏豐18個。
(2)模型擬合信息:僅包含截距項的模型和最終模型的似然比檢驗結(jié)果,其-2倍對數(shù)似然值分別為128.051、102.584,c2=25.467,自由度為3,顯著性水平p-0.00050.001,表明最終模型要優(yōu)于只含截距項的模型,即最終模型成立,說明模型中至少有1個預報因子有統(tǒng)計學意義。
(3)擬合優(yōu)度檢驗:Pearsonc2及偏差c2分別為130844(p=0.148》0.05)、102.584(p=0.790》0.05),表明有序回歸方程預測值與觀測值之間的差異無統(tǒng)計學意義,意味著模型擬合優(yōu)度較好。
(4)累加Logit模型的J-1(J=3)個預測概率回歸方程的參數(shù)估計累加Logt模型預測概率計算式(2個)
由上式可計得分類因變量各類可能發(fā)生的概率P:P1=P(y≤1),P2=P(y≤2)-P(y≤1),P3=1-P(y≤2);其中,P1是類別1(偏枯型)的預測概率P2是類別2(正常型)的預測概率,P3是類別3(偏豐型)的預測概率。5)平行線檢驗:廣義c2為2.245,D=0.523》0.05,說明在0.05顯著性水平下,T53、Q43、P41的回歸系數(shù)在不同分類因變量水平上是相對不變的。
2.4預報
開墾河水文站2020年T53為15.1℃,Q43為1.81m/s,P41為0.0mm,代入上述2個累加Logit模型預測概率計算式,計得P(y≤1)P(y≤2)分別為0.78和0.94。由此可計得分類因變量各類可能發(fā)生的概率P:P1=P(y≤1)=0.78,P2=Py≤2)-P(y≤1)0.16,P3=1-P(y≤1)=0.22。
可見,P1值最大,所以分類因變量Y取1的可能性最大,即開墾河水文站2020年68月平均流量預計為偏枯的可能性較大。實際情況是5.73ms,低于偏枯的上限值9.54m/s,屬于偏枯型,預報正確。
3結(jié)語
(1)通過優(yōu)選前期預報因子,用有序回歸分析對分類因變量Y未來各類可能發(fā)生的概率進行預報,是一次成功的嘗試。
(2)有序回歸模型擬合信息表明,最終模型成立,且至少有1個預報因子有統(tǒng)計學意義;擬合優(yōu)度檢驗顯示,模型擬合優(yōu)度較好;平行線檢驗表明,預報因子的回歸系數(shù)在不同分類因變量水平上均相對不變。
(3)2020年68月平均流量豐枯趨勢的預報結(jié)果正確,說明有序回歸分析適用于中長期水文定性預報。
參考文獻
[1]旦木仁加甫,中長期水文預報與SPSS應用[M]鄭州:黃河水利出版社,2011.
責任編輯:黃艷飛