郭鵬
(貴陽學(xué)院經(jīng)濟(jì)管理學(xué)院,貴陽550005)
在近40年的收益管理(RM)理論和實(shí)踐發(fā)展使需求無約束估計(jì)得到了廣泛重視[1],其計(jì)算結(jié)果是預(yù)測模型的重要輸入,能幫助收益管理系統(tǒng)(RMSs)制定更準(zhǔn)確的優(yōu)化控制策略??紤]到現(xiàn)代服務(wù)業(yè)的網(wǎng)絡(luò)化特征從根本上使產(chǎn)品預(yù)售時(shí)間窗和乘客預(yù)訂用時(shí)大幅縮減,公司中央預(yù)售系統(tǒng)(CRSs)中的短期需求數(shù)據(jù)具有高度不確定性,不同“預(yù)售提前期間隔”中的乘客需求能被擬合為不同的分布形式,比如正態(tài)、對(duì)數(shù)正態(tài)、威布爾、伽瑪和泊松分布等[2]。
郭鵬等[3]僅考慮了乘客需求在同一航班不同艙位間的“再現(xiàn)”效應(yīng),未對(duì)短視型和策略型乘客在整個(gè)航空客運(yùn)網(wǎng)絡(luò)O-D航程產(chǎn)品間的當(dāng)期和跨期轉(zhuǎn)移購買行為進(jìn)行描述。已有仿真研究結(jié)果表明,無約束估計(jì)方法分布形式假設(shè)的選擇不當(dāng)會(huì)對(duì)公司收入造成1.5%的相對(duì)影響,對(duì)于一般大型航空公司而言,其絕對(duì)經(jīng)濟(jì)損失可達(dá)上億元[4]。
因此,為提高網(wǎng)絡(luò)環(huán)境下多分布需求無約束估計(jì)的準(zhǔn)確性,提出一種基于威布爾和對(duì)數(shù)正態(tài)分布的改進(jìn)參數(shù)回歸模型。由于Liu等[2]的研究僅考慮需求“溢出”效應(yīng),在模型構(gòu)建和參數(shù)估計(jì)等方面均無法滿足網(wǎng)絡(luò)環(huán)境下需求無約束估計(jì)的應(yīng)用要求,本文所提模型不僅考慮了航空網(wǎng)絡(luò)乘客需求分布形式、“隨機(jī)獨(dú)立截尾”機(jī)理以及數(shù)據(jù)收集條件等信息,還同時(shí)針對(duì)網(wǎng)絡(luò)需求的“溢出”和“再現(xiàn)”效應(yīng)、以及乘客取消預(yù)訂和no-shows行為,分別提出了基于截尾樣本數(shù)據(jù)的模型參數(shù)估計(jì)和需求無約束估計(jì)值計(jì)算方法,在提高計(jì)算準(zhǔn)確性的同時(shí),有效避免了現(xiàn)有方法對(duì)歷史乘客真實(shí)“初始需求”的高估問題。
本文的研究重點(diǎn)不包括模型擬合優(yōu)度檢驗(yàn)和參數(shù)假設(shè)檢驗(yàn),相應(yīng)內(nèi)容可參見Lawless[5]的研究。本文的研究對(duì)象主要針對(duì)完全競爭網(wǎng)絡(luò)市場環(huán)境下的航空客運(yùn)公司,由于“受截尾數(shù)據(jù)分析”不局限于RM實(shí)踐行業(yè),本文所提方法同樣能為酒店、汽車租賃、庫存管理、零售生產(chǎn)規(guī)劃、現(xiàn)代旅游服務(wù)供應(yīng)鏈管理、生命可靠性測試和疾病預(yù)測等領(lǐng)域提供參考。根據(jù)文獻(xiàn)[6]提出的RM研究分類,本文的研究對(duì)象如表1所示。
表1 本文的研究對(duì)象
由于能夠考慮與乘客“初始需求”相關(guān)的所有信息,相較于數(shù)據(jù)驅(qū)動(dòng)類的非參數(shù)模型,參數(shù)回歸模型通常更具魯棒性,在計(jì)算過程中顯得更為實(shí)際[2]。
本文所提方法的符號(hào)及變量定義如下:
(1)Ο:出發(fā)地集合;
(2)nod:出發(fā)地?cái)?shù)量;
(3)Rm:以出發(fā)地m為起點(diǎn)的O-D航程集合,R={R1,R2,???,Rm},m=(1,2,???,nod);
(4)rm:Rm中的O-D航程數(shù)量,j=(1,2,???,rm);
(5)C:所有航班票價(jià)家庭所構(gòu)成的艙位集合,C={C1,C2,???,Cm},Cm={C1,m,C2,m,???,Cjm};
(6)cjm:Cjm中的票價(jià)等級(jí)數(shù)量,i=(1,2,???,cjm);
(7)t:預(yù)售提前期中觀察點(diǎn)t=(0,1,2,???,T),當(dāng)t=0時(shí),艙位預(yù)售開放,當(dāng)t=T時(shí),航班起飛;
(8)Δt:時(shí)刻t和t-1之間的“預(yù)售提前期間隔”;
(9)n:從一個(gè)給定的出發(fā)日期集合中相同“預(yù)售提前期間隔”中抽樣到的、代表相同歷史票價(jià)艙位的乘客需求量樣本觀察值數(shù)量,即樣本容量:k=(1,2,???,n);
(23)X:以艙位i為初次購買首選的乘客“初始需求”量隨機(jī)變量;
(24)x:乘客成功預(yù)訂可觀察樣本需求量,x=(x1,x2,…,xn);其中,可將第k個(gè)樣本需求量定義為xk=B
(25)z:參數(shù)回歸模型中解釋變量的行向量,z=(z1,z2,???,zp);zk表示與第k個(gè)樣本需求相關(guān)的1×p維解釋變量行向量,zk=(zk,1,zk,2,???,zk,p);
(26)θ:參數(shù)回歸模型中與解釋變量z相對(duì)應(yīng)的需要被估計(jì)的p×1維參數(shù)列向量,θ=(θ1,θ2,???,θp)′;
(27)f(x|z;θ):X的概率密度函數(shù);
(28)F(x|z;θ):X的分布函數(shù),F(xiàn)(x|z;θ)=P{X≤x|z;θ};
(29)S(x|z;θ):X的生存函數(shù),S(x|z;θ)=P{X≥x|z;
(30)h(x|z;θ):X的危險(xiǎn)函數(shù),h(x|z;θ)=X<x+Δx|X≥x)Δx=f(x|z;θ)S(x|z;θ);
(31)Uxk:考慮“溢出”效應(yīng)下B的無約束估計(jì)量,可用uk表示;其中,當(dāng)k∈Q時(shí),Ux=B=xk;當(dāng)k∈時(shí),Uxk=B+CXYD+CFWX;
本文所提方法的計(jì)算過程有如下四個(gè)步驟:
(1)O-D航程艙位預(yù)售開放狀態(tài)檢查
基于從CRSs中所獲得的某一“聚合水平”下的樣本數(shù)據(jù),可得到O-D航程中的各
(2)基于某種參數(shù)回歸模型形式建立f(x|z;θ)
為正確建立f(x|z;θ),需要在對(duì)X的分布形式、z對(duì)f(x)的作用、以及建立模型和參數(shù)估計(jì)的難易程度進(jìn)行綜合考慮的基礎(chǔ)上,選擇一種合適的參數(shù)回歸模型形式。其中比較常用的主要有兩類:比例風(fēng)險(xiǎn)模型(PHM)和位置尺度模型(LSM)。
建立f(x|z;θ)后,可采用極大似然估計(jì)法對(duì)回歸模型中的未知參數(shù)θ進(jìn)行估計(jì),然后通過計(jì)算獲得U??紤]到從CRSs中所獲得的B是D在“溢出”和“再現(xiàn)”綜合效應(yīng)作用下的結(jié)果,因此,本文分別定義引起上述兩種效應(yīng)、以及取消預(yù)訂和no-shows行為的解釋變量zk,并采用如下兩個(gè)步驟分別對(duì)θ、Uxk和U進(jìn)行估計(jì)和計(jì)算。
①考慮乘客需求“溢出”效應(yīng)下的估計(jì)和計(jì)算
②考慮乘客需求“再現(xiàn)”效應(yīng)、取消預(yù)訂和no-shows行為下的估計(jì)和計(jì)算:
(4)模型的擬合優(yōu)度檢驗(yàn)和參數(shù)的假設(shè)檢驗(yàn)
一些一般化的擬合優(yōu)度檢驗(yàn)方法可被用來檢驗(yàn)?zāi)P偷臄M合程度。比如,針對(duì)連續(xù)型需求分布的改進(jìn)后的Kolmogorov-Smirnov檢驗(yàn)。諸如概率密度圖、危險(xiǎn)函數(shù)圖或殘差圖等圖形方法也經(jīng)常被用到。對(duì)于模型參數(shù)θ的假設(shè)檢驗(yàn)及其置信區(qū)間的獲取,可通過Fisher信息矩陣和對(duì)數(shù)似然比統(tǒng)計(jì)檢驗(yàn)法來進(jìn)行。如未通過上述兩類檢驗(yàn),則需返回相應(yīng)步驟重新建立模型。有關(guān)該問題更加深入的討論參見Lawless[5]。
2.3.1威布爾分布
(1)f(x|z;θ)的建立
本文考慮基于雙參數(shù)威布爾分布建立參數(shù)回歸模型,若允許其尺度參數(shù)α依賴于回歸解釋變量z,而位置參數(shù)δ則與z無關(guān),在給定z后,有:
其中,x≥0,α(z)是z的函數(shù),并含有一些未知參數(shù)β??紤]到δ與z無關(guān)不僅保證了上述模型屬于PHM模型,還使乘客“初始需求”對(duì)數(shù)的方差相等,因此,在給定z的情況下通過研究=lnX的分布也能對(duì)式(1)進(jìn)行考察,便得到基于極值分布的參數(shù)回歸模型:
其中,Y服從標(biāo)準(zhǔn)極值分布:f(y)=exp[y-exp(y)],-∞<y<∞。式(3)為LSM模型,其誤差項(xiàng)為Y。式(1)中δ的不變性對(duì)應(yīng)于式(2)中σ的不變性,故lnX具有共同方差。因此,式(2)可寫為:
①考慮乘客需求“溢出”效應(yīng)
由極值分布與威布爾分布的關(guān)系可知:
②考慮乘客需求“再現(xiàn)”效應(yīng)、取消預(yù)訂和no-shows行為
在將上述步驟得到的Uxk替換樣本中的B后,便可得到新樣本中的獨(dú)立觀測值,zk)。其中,=lnuk=lnUxk。則對(duì)數(shù)似然函數(shù)為同理,似然方程?lnL?βl=0(l=1,???,p)和?lnL?σ=0用Newton-Raphson方法或其他迭代方法求解也是沒有困難的。令={,}和z=zR。則:
2.3.2對(duì)數(shù)正態(tài)分布
(1)f(x|z;θ)的建立
①考慮乘客需求“溢出”效應(yīng)
V(y)是標(biāo)準(zhǔn)正態(tài)分布的危險(xiǎn)函數(shù),λ(y)則是它的導(dǎo)數(shù)。由式(11)和式(12)可得:
如Lawless[5]所述,對(duì)式(13)和式(14)采用首先由Sampford和Toylor[7]提出的迭代法,后經(jīng)Wolynetz[8,9]修改和推廣,該迭代方法相較于Newton-Raphson迭代算法能夠更好和更加方便地獲取和。假設(shè)→N(zSβ,σ),那么:
求解可得:
(c)利用式(19)和式(20)計(jì)算β(q)和σ(q)。
本質(zhì)上,該方法是一種EM算法[5]。令={,}和z=zS,利用式(15)計(jì)算k,可獲得:
②考慮乘客需求“再現(xiàn)”效應(yīng)、取消預(yù)訂和no-shows行為
則:
此時(shí),對(duì)式(24)和式(25)采用Newton-Raphson迭代以獲得
可得到:
假定國內(nèi)某航空公司有如圖1所示的航空網(wǎng)絡(luò),以北京、西安、青島和貴陽為出發(fā)地m={1,2,3,4}的O-D航程集合中,nod=4,r1=6,r2=4,r3=5,r4=7。該公司從西安到青島于2015年6月7日起飛的所有航班具有相同艙位設(shè)置,i={1,2,3,4}。其預(yù)售提前期劃分為8個(gè)階段?,F(xiàn)使用本文所提方法對(duì)上述航空網(wǎng)絡(luò)中西安→北京→青島中轉(zhuǎn)聯(lián)程航線(m=2,j=3)商務(wù)艙(i=2)在第4個(gè)“預(yù)售提前期間隔”Δt(t=4)中行無約束估計(jì),z如表2所示(n=6)。
圖1航空網(wǎng)絡(luò)示意圖
表2 的訂購情況以及參數(shù)回歸模型解釋變量示例
表2 的訂購情況以及參數(shù)回歸模型解釋變量示例
zS k zRk k 123456 B3,2 2,4,k zS I3,2 2,4,k k,1 zS k,2 k,1 zR k,2(xk)BL3,22,4,k P3,2 2,4,k100 14.40 8.50 10.20 9.70 6.80 9.50 P2,2 2,4,k100 9.50 11.70 10.20 15.20 9.30 11.70 DL3,2 zR 537546 111011 777577 k 010011
表3 考慮乘客需求“溢出”效應(yīng)的參數(shù)估計(jì)和無約束估計(jì)結(jié)果
表4 考慮乘客需求“再現(xiàn)”效應(yīng)、取消預(yù)訂和no-shows行為的參數(shù)估計(jì)和無約束估計(jì)結(jié)果
本文所提方法能更加全面地對(duì)網(wǎng)絡(luò)環(huán)境中歷史無約束需求與歷史乘客“初始需求”之間的正相關(guān)關(guān)系進(jìn)行估計(jì),可將其作為大數(shù)據(jù)時(shí)代下RMSs中無約束需求預(yù)測子系統(tǒng)的關(guān)鍵核心,在分析網(wǎng)絡(luò)環(huán)境下的需求聚合水平與具體分布形式之間相關(guān)關(guān)系的基礎(chǔ)上,將大數(shù)據(jù)倉庫中的結(jié)構(gòu)化和非結(jié)構(gòu)化需求信息用解釋變量進(jìn)行描述,能為優(yōu)化模型提供更加準(zhǔn)確和魯棒的無約束需求預(yù)測結(jié)果,RMSs的整體可靠性和實(shí)施成功率可顯著提高[1,10]。
參考文獻(xiàn):
[1]郭鵬.網(wǎng)絡(luò)環(huán)境下收益管理系統(tǒng)需求無約束估計(jì)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2017,53(19).
[2]Liu P H,Smith S,Orkin E B,et al.Estimating Unconstrained Hotel Demand Based on Censored Booking Data[J].Journal of Revenue and Pricing Management,2002,1(2).
[3]郭鵬,蕭柏春,李軍.基于多需求分布的收益管理多艙位無約束估計(jì)模型[J].系統(tǒng)科學(xué)與數(shù)學(xué),2013,33(10).
[4]郭鵬,蕭柏春,李軍.收益管理中多分布無約束估計(jì)方法的仿真比較[J].計(jì)算機(jī)仿真,2014,31(2).
[5]Lawless J F.Statistical Models and Methods for Lifetime Data[M].New York:John Wiley&Sons,2003.
[6]Weatherford L R,Bodily S E.A Taxonomy and Research Overview of Perishable-Asset Revenue Management:Yield Management,Overbooking,and Pricing[J].Operations Research,1992,40(5).
[7]Sampford M R,Taylor J.Censored Observations in Randomized Block Experiments[J].Journal of the Royal Statistical Society,1959,21(1).
[8]Wolynetz M S.Algorithm AS 138:Maximum Likelihood Estimation From Confined and Censored Normal Data[J].Journal of the Royal Statistical Society,1979,28(2).
[9]Wolynetz M S.Algorithm AS 139:Maximum Likelihood Estimation in a Linear Model From Confined and Censored Normal Data[J].Journal of the Royal Statistical Society,1979,28(2).
[10]郭鵬.收益管理中基于大數(shù)據(jù)倉庫的需求無約束估計(jì)——框架與挑戰(zhàn)[J].大數(shù)據(jù),2017,3(3).