琪美格
(新疆維吾爾自治區(qū)水文分析計(jì)算中心,新疆 烏魯木齊 830000)
在中長期水文預(yù)報(bào)實(shí)踐中,會(huì)遇到預(yù)報(bào)對(duì)象是分類因變量的情況,如一條河流未來來水是偏豐、正常還是偏枯。本文通過選用五圣宮水文站前期預(yù)報(bào)因子,將4至5月平均流量構(gòu)建為反映春季來水偏豐、正?;蚱莸姆诸愐蜃兞浚瑢?duì)分類因變量未來各類可能發(fā)生的概率用多項(xiàng)Logistic回歸分析進(jìn)行嘗試性的預(yù)報(bào),確保符合精度要求。
多項(xiàng)Logistic回歸分析是指通過一組預(yù)報(bào)因子,采用多個(gè)二值Logistic回歸方程,來描述分類因變量各類與參照類相比的條件下預(yù)報(bào)因子對(duì)預(yù)報(bào)對(duì)象的作用。
如果預(yù)報(bào)對(duì)象y(分類因變量)有J個(gè)類別,令第j(j=1、2、…、J)類的概率為Pj,則預(yù)報(bào)對(duì)象的樣本觀測值在這J個(gè)類別中的分布服從多項(xiàng)分布,且∑Pj= 1。若用xk(k=1、2、…、m,m是預(yù)報(bào)因子總數(shù))表示預(yù)報(bào)因子,aj和bjk分別表示第j類的常數(shù)項(xiàng)和預(yù)報(bào)因子回歸系數(shù),則多項(xiàng)Logistic回歸方程可表示為:
ln(pj/pJ)=aj+bj1·x1+…+bjk·xk+…+bjm·xm(j=1、2、…、J-1)
上述方程是以分類因變量最后一類(J)為基線的,可見,在每個(gè)類別j與基線類別J之間建立了J-1個(gè)二值Logistic回歸方程。若令P=∑(Exp(aj+bj1·x1+…+bjk·xk+…+bjm·xm)),則分類因變量各類可能發(fā)生的概率Pj的計(jì)算式為:
Pj=Exp(aj+bj1·x1+…+bjk·xk+…+bjm·xm)/P(j=1、2、…、J-1)
基線對(duì)應(yīng)的常數(shù)項(xiàng)與回歸系數(shù)均為0,故基線類別可能發(fā)生的概率PJ=1/P。
五圣宮水文站1981-2019年3月下旬旬平均流量Q、2月中旬降水量R、1月上旬旬平均氣溫T及4至5月平均流量Q4-5序列SPSS數(shù)據(jù)文件(僅顯示局部)見圖1。
計(jì)得Q4-5序列多年均值為2.44 m3/s。本次約定,Q4-5低于2.20 m3/s(即距平值﹤-10)時(shí),來水量為偏枯,對(duì)應(yīng)的分類因變量Y取1;介于2.20 m3/s和2.68 m3/s之間(即距平值介于-10和10之間)為正常,Y取2;高于2.68 m3/s(即距平值﹥10)為偏豐,Y取3。構(gòu)建的分類因變量Y序列見圖1。
圖1 五圣宮水文站分類因變量及前期預(yù)報(bào)因子序列
SPSS操作步驟為:
步驟1:在圖1中依次單擊菜單“分析→回歸→多項(xiàng)Logistic”,從彈出的多項(xiàng)Logistic回歸對(duì)話框左側(cè)的列表框中選擇“Y”,移動(dòng)到因變量列表框,選擇“Q”、“R”和“T”,移動(dòng)到協(xié)變量列表框。
步驟2:單擊“統(tǒng)計(jì)量”按鈕,在打開的對(duì)話框中勾擇“個(gè)案處理摘要”、“步驟摘要”、“模型擬合度信息”、“分類表”、“擬合度”、“估計(jì)”和“似然比檢驗(yàn)”,單擊“繼續(xù)”按鈕返回多項(xiàng)Logistic回歸對(duì)話框。
步驟3:單擊“確定”按鈕,執(zhí)行多項(xiàng)Logistic回歸的操作。
SPSS輸出的回歸效果統(tǒng)計(jì)檢驗(yàn)結(jié)果如下:
(1)案例處理摘要:39個(gè)分類因變量個(gè)案全部有效,其中偏枯18個(gè),正常9個(gè),偏豐12個(gè)。
(2)模型擬合信息:僅包含截距項(xiàng)的模型和最終模型的似然比檢驗(yàn)結(jié)果,其-2倍對(duì)數(shù)似然值分別為82.517、54.992,2=27.524,自由度為6,顯著性水平ρ=0.000<0.001,表明最終模型要優(yōu)于只含截距項(xiàng)的模型,即最終模型成立,說明模型中至少有1個(gè)預(yù)報(bào)因子有統(tǒng)計(jì)學(xué)意義。
(4)似然比檢驗(yàn):預(yù)報(bào)因子中,1月上旬旬平均氣溫T的顯著性水平ρ小于0.5,其余因子都小于0.05,說明在0.5顯著性水平下,預(yù)報(bào)因子對(duì)多項(xiàng)Logistic回歸方程的貢獻(xiàn)都有統(tǒng)計(jì)學(xué)意義。
(5)以類別3為基線的多項(xiàng)Logistic回歸方程參數(shù)估計(jì)
分類因變量Y各類可能發(fā)生的概率Pj的計(jì)算式為:
P1=Exp(11.334-13.830*Q-0.842*R-0.173*T)/(1+Exp(11.334-13.830*Q-0.842*R-0.173*T)+Exp(8.244-10.727*Q-0.673*R-0.182*T))
P2=Exp(8.244-10.727*Q-0.673*R-0.182*T)/(1+Exp(11.334-13.830*Q-0.842*R-0.173*T)+Exp(8.244-10.727*Q-0.673*R-0.182*T))
P3=1/(1+Exp(11.334-13.830*Q-0.842*R-0.173*T)+Exp(8.244-10.727*Q-0.673*R-0.182*T))
式中:P1是類別1與基線類別3相比較得到的預(yù)測概率(偏枯型),P2是類別2與基線類別3相比較得到的預(yù)測概率(正常型),P3是基線類別3的預(yù)測概率(偏豐型)。
(6)分類表中總的正確預(yù)測百分率為59.0%,說明多項(xiàng)Logistic回歸方程的預(yù)測效果良好。
五圣宮水文站2020年3月下旬旬平均流量Q為0.754 m3/s,2月中旬降水量R為2.3 mm,1月上旬旬平均氣溫T為-8.7℃,代入上述3個(gè)類別的預(yù)測概率計(jì)算式,計(jì)得P1、P2、P3分別為0.42、0.32和0.26。
可見,P1值最大,所以分類因變量取1的可能性最大,即五圣宮水文站2020年4-5月平均流量預(yù)計(jì)為偏枯的可能性較大。實(shí)際情況是1.86 m3/s,低于偏枯的上限值2.20 m3/s,屬于偏枯型,預(yù)報(bào)正確。
(1)選用前期預(yù)報(bào)因子,用多項(xiàng)Logistic回歸分析對(duì)分類因變量Y未來各類可能發(fā)生的概率進(jìn)行預(yù)報(bào),是一次成功的嘗試。
(2)多項(xiàng)Logistic回歸模型擬合信息表明,最終模型成立,且至少有1個(gè)預(yù)報(bào)因子有統(tǒng)計(jì)學(xué)意義;擬合優(yōu)度檢驗(yàn)顯示,模型擬合優(yōu)度較好;似然比檢驗(yàn)表明,預(yù)報(bào)因子對(duì)模型的貢獻(xiàn)在0.5信度下都有統(tǒng)計(jì)學(xué)意義;分類表顯示,模型的預(yù)測效果良好。
(3)2020年4-5月平均流量的豐枯趨勢的預(yù)報(bào)結(jié)果為正確,說明該技術(shù)在中長期水文定性預(yù)報(bào)方面有一定的實(shí)用價(jià)值。