程 謙,楊 光,胡啟洲
(1.南京鐵道職業(yè)技術(shù)學(xué)院 運(yùn)輸管理學(xué)院,江蘇 南京 210031;2.中國鐵路上海局集團(tuán)公司 上海客運(yùn)段,上海 200071;3.南京理工大學(xué) 自動(dòng)化學(xué)院,江蘇 南京 210094)
旅客在選擇高速鐵路出行時(shí),面對不同種類、不同時(shí)段開行的列車表現(xiàn)出不同的選擇行為。深入研究旅客對不同列車的選擇行為,定量分析影響旅客選擇行為的主要因素,可以進(jìn)一步豐富交通出行選擇行為理論研究的內(nèi)涵,也可以為高鐵運(yùn)營企業(yè)合理設(shè)計(jì)列車服務(wù)產(chǎn)品、開展精準(zhǔn)營銷活動(dòng)提供理論依據(jù)。
旅客對不同列車的選擇屬于交通出行選擇行為研究領(lǐng)域。離散選擇模型是研究交通出行選擇行為的常用方法[1-2]。Nuzzolo 等[3]將列車票價(jià)、出行時(shí)間、進(jìn)出站方式等作為影響旅客選擇的主要因素,構(gòu)建巢式Logit模型,研究了鐵路列車服務(wù)水平及價(jià)格政策與市場需求的匹配程度。Coldren等[4-6]將不同航班的服務(wù)水平、航程關(guān)聯(lián)特性、機(jī)型特點(diǎn)、乘坐舒適程度等作為主要影響因素,應(yīng)用多項(xiàng)式Logit模型、巢式Logit模型以及排序廣義極值模型,研究了旅客對不同航班的選擇行為。Bekhor 等[7]將航線價(jià)格、經(jīng)停次數(shù)、中轉(zhuǎn)等待時(shí)間等航班服務(wù)水平作為影響旅客選擇行為的主要因素,應(yīng)用多項(xiàng)式Logit模型與排序Logit模型,分析了旅客對不同航班的選擇行為??紤]到出行旅客的異質(zhì)特點(diǎn),Hetrakul 等[8]將旅客社會特征與票價(jià)、出行時(shí)間、提前購票時(shí)間等作為影響因素,分別應(yīng)用多項(xiàng)式Logit模型、潛類別Logit模型以及混合Logit模型研究鐵路旅客購票行為,結(jié)果表明潛類別Logit模型、混合Logit模型相比傳統(tǒng)的多項(xiàng)式Logit模型具有更強(qiáng)的客流預(yù)測能力。國內(nèi)相關(guān)研究中,史峰等[9]將旅客主體特性、列車特性和隨機(jī)因素作為主要影響因素,應(yīng)用多項(xiàng)式Logit模型研究鐵路旅客乘車選擇行為。王文憲等[10]構(gòu)建巢式Logit模型分析了旅客社會特征、出行特征、列車服務(wù)特征對旅客選擇普速鐵路不同列車行為的主要影響。王文憲等[11]將旅客社會特征、旅客出行特征、列車服務(wù)特征作為影響旅客選擇的主要影響因素,應(yīng)用多項(xiàng)式Logit模型分析了旅客在面對動(dòng)車類與高鐵類列車時(shí)的選擇行為。上述研究中,多數(shù)是將列車種類作為旅客乘車選項(xiàng),但旅客對同一種類列車的不同開行時(shí)段,也表現(xiàn)出差異化的選擇行為,有必要將列車出發(fā)時(shí)間也作為選擇項(xiàng),深入分析旅客差異化的乘車選擇行為。
選擇集獨(dú)立、互斥是應(yīng)用選擇行為模型(多項(xiàng)式Logit模型、巢式Logit模型等)的假設(shè)條件之一,這一假設(shè)條件要求選擇項(xiàng)不相關(guān),但并不適合實(shí)際應(yīng)用場景。混合Logit模型突破了這一假設(shè),可以近似于幾乎任何一種隨機(jī)效用模型[12]。高鐵在不同種類、不同開行時(shí)段下的列車相互替代性強(qiáng),旅客對不同列車的選擇行為過程建模更適合采用混合Logit模型,而目前該模型在高鐵旅客出行選擇行為領(lǐng)域的研究較少,尚缺乏系統(tǒng)化的論證分析。
本文以旅行時(shí)間在3 h范圍內(nèi)的南京到上海和南京到杭州的短途高速鐵路旅客群體為研究背景,應(yīng)用行為調(diào)查與意向調(diào)查方法收集客流數(shù)據(jù),分別構(gòu)建混合Logit模型與多項(xiàng)式Logit模型,擬合實(shí)際調(diào)查數(shù)據(jù),研究旅客對短途高鐵不同種類、不同時(shí)段出發(fā)列車的選擇行為,比較混合Logit模型與多項(xiàng)式Logit模型的擬合優(yōu)度,分析旅客選擇高鐵列車的影響機(jī)理,為定量描述短途高鐵市場需求,以及高鐵運(yùn)營企業(yè)合理設(shè)計(jì)列車服務(wù)產(chǎn)品、開展精準(zhǔn)營銷活動(dòng)提供理論支持。
本文綜合應(yīng)用行為調(diào)查法與意向調(diào)查法[13-15]開展客流調(diào)查,其中行為調(diào)查法用于調(diào)查旅客的個(gè)體特征和出行特征;意向調(diào)查法通過構(gòu)建選擇情境,調(diào)查旅客的出發(fā)時(shí)間、在途時(shí)間及車票價(jià)格等偏好。
客流調(diào)查范圍設(shè)定在旅行時(shí)間在3 h范圍內(nèi)的短途高鐵旅客群體。假設(shè)旅客搭乘滬寧高鐵、寧杭高鐵列車從南京到上?;蛘叩胶贾?,根據(jù)在線時(shí)刻表(12306 網(wǎng)站)構(gòu)建意向調(diào)查的選擇情景:出發(fā)時(shí)間選擇在5:00—21:00時(shí)間范圍,并按照3 h的間隔將其劃分為6個(gè)時(shí)間段(其中最后1個(gè)時(shí)間段是1 h);在途時(shí)間根據(jù)D類與G類高鐵列車不同停站方案,設(shè)置6個(gè)水平,分別是1 h 20 min,1 h 40 min,2 h 00 min,2 h 20 min,2 h 40 min,3 h 00 min;車票價(jià)格根據(jù)高鐵二等座實(shí)際售票價(jià)格設(shè)置4個(gè)水平,分別是115,128,135 和216 元。根據(jù)上述不同影響因素及水平設(shè)置條件,應(yīng)用全因子實(shí)驗(yàn)設(shè)計(jì)方法,構(gòu)造出24 趟列車信息。將這24 趟列車分為4 組,每組6 趟列車,在每個(gè)時(shí)間段安排1 趟出發(fā)列車,6 趟出發(fā)列車構(gòu)成1個(gè)選擇集;受訪者對1個(gè)選擇集進(jìn)行1 輪選擇,則每1位受訪者需完成4輪選擇實(shí)驗(yàn)。4 組列車分別為:①列車1,列車5,…,列車21;②列車2,列車6,…,列車22;③列車3,列車7,…,列車23;④列車4,列車8,…,列車24。為更好把握旅客對不同列車的主觀選擇意愿,簡化分析,假設(shè)選擇情境中的各次列車預(yù)售票額充足。
2019年5月15日—6月15日課題組在上海、蘇州、無錫、南京、杭州等地的高鐵車站、長途汽車站開展客流調(diào)查,共計(jì)發(fā)放調(diào)查問卷600 份,其中南京到上海和到杭州各300 份,收回有效問卷511 份,問卷回收率85.2%,滿足標(biāo)定選擇行為模型對樣本數(shù)量回收率的要求。數(shù)據(jù)統(tǒng)計(jì)時(shí),僅按照列車序號進(jìn)行匯總,不再區(qū)分到站。
通過行為調(diào)查得到的旅客個(gè)體特征和出行特征分布見表1。由表可知:女性旅客略多于男性;年齡集中在31~50歲之間;職業(yè)多為公務(wù)單位與企業(yè)的職員;大部分旅客為中等偏高收入;休閑出行占比最高,公務(wù)出行次之;大部分旅客自費(fèi)出行;出行前時(shí)間多數(shù)在2 h 之內(nèi);公共交通是旅客偏愛的出行前接駁方式。
通過意向調(diào)查獲得旅客對不同時(shí)間段開行不同列車的選擇偏好見表2,其中“選擇比例”是指選擇該列車的旅客數(shù)占本輪樣本總數(shù)的比例。由表2可知:旅客選擇較多的列車集中在時(shí)段1,時(shí)段2和時(shí)段3;在同一時(shí)段內(nèi),旅客選擇比例較高的是列車行程時(shí)間短的列車。
混合Logit模型突破了多項(xiàng)式Logit模型要求選擇集內(nèi)各選擇項(xiàng)不相關(guān)的假設(shè)條件,允許選擇者存在“隨機(jī)口味差異”[16]。基于選擇行為理論,多項(xiàng)式Logit模型中,旅客n選擇列車i的概率Pni(βTn)[1-2]為
表1 旅客個(gè)體特征和出行特征比例分布
式中:βTn為系數(shù)向量;Vni(βTn)為旅客n選擇列車i的效用的固定部分;j為備選列車序號。
混合Logit模型中,旅客n選擇列車i的概率Pni,是在系數(shù)向量βTn不同取值處的加權(quán)平均值,權(quán)重是密度函數(shù)f(βTn)。假設(shè)密度函數(shù)f(βTn)服從正態(tài)分布,若均值向量為θ,則混合Logit模型的選擇概率Pni為
均值θ可采用仿真計(jì)算的方法獲得,即通過連續(xù)抽取系數(shù)向量βTn的值計(jì)算仿真概率,得到模型的模擬對數(shù)似然函數(shù),進(jìn)而應(yīng)用梯度法或Newton-Rapson法求解。
如果旅客n選擇列車i的效用的固定部分關(guān)于系數(shù)向量βTn是線性的,則Vni(βTn)=βTn xni,其中,xni是可以觀察到的與旅客n及被選列車i有關(guān)的影響因素向量。這些影響因素向量包括旅客的個(gè)體特征、出行特征與列車的服務(wù)水平[7],用In表示旅客n的個(gè)體特征向量,Tn表示旅客n的出行特征向量,Ci表示列車i的服務(wù)水平向量。則旅客n選擇列車i的效用的固定部分為
表2 不同列車選擇比例分布
將式(3)代入式(1),則得多項(xiàng)式Logit模型中,旅客n選擇列車i的選擇概率Pni(βTn)為
將式(4)代入式(2),則得混合Logit模型中旅客n選擇列車i的選擇概率Pni為
將表1中性別、年齡、職業(yè)、學(xué)歷及月收入作為模型中的個(gè)體特征變量,出行目的、購票資金來源、行前時(shí)間、行前接駁方式及當(dāng)天返程與否作為模型中的出行特征變量;將表2中列車出發(fā)時(shí)刻、旅行時(shí)間及車票價(jià)格作為列車服務(wù)水平變量;將前述變量中性別、年齡、職業(yè)、月收入、出行目的及購票資金來源與車票價(jià)格的點(diǎn)積作為交互變量,以便通過分析交互變量的系數(shù)說明不同類別旅客對票價(jià)的敏感性。以此設(shè)計(jì)的模型變量見表3,為避免模型擬合出現(xiàn)多重共線性,對模型中的無序多分類及啞元變量指定了參照組。
表3 模型變量
續(xù)表
分別應(yīng)用式(5)和式(4),基于Stata14.0軟件,擬合問卷調(diào)查得到的客流數(shù)據(jù),其中系數(shù)估計(jì)值的顯著性采用P值(p<0.05)進(jìn)行檢驗(yàn)?;旌螸ogit模型在連續(xù)抽取系數(shù)向量βTn的仿真計(jì)算過程中,應(yīng)用Halton 數(shù)列方法,隨機(jī)抽樣150次計(jì)算仿真概率。
列車服務(wù)水平變量的系數(shù)估計(jì)結(jié)果見表4。混合Logit模型中,列車服務(wù)水平變量的系數(shù)估計(jì)結(jié)果為隨機(jī)項(xiàng),可以用來描述不同旅客對列車服務(wù)水平的感知差異,因此表中列出了系數(shù)均值與系數(shù)均值標(biāo)準(zhǔn)差、P值及P值標(biāo)準(zhǔn)差;多項(xiàng)式Logit模型的系數(shù)估計(jì)結(jié)果是非隨機(jī)項(xiàng),因此表中僅列出了系數(shù)估計(jì)值和P值。個(gè)體特征及出行特征變量在混合Logit模型中的參數(shù)估計(jì)結(jié)果見表5,在多項(xiàng)式Logit模型中的參數(shù)估計(jì)結(jié)果見表6。旅客的個(gè)體特征及出行特征變量對旅客選擇行為的影響是確定的,因此在2個(gè)模型中的系數(shù)估計(jì)結(jié)果均是非隨機(jī)項(xiàng)。
表4 列車服務(wù)水平變量的系數(shù)估計(jì)結(jié)果
評價(jià)離散選擇模型擬合優(yōu)度的指標(biāo)有多種,其中較為常用的指標(biāo)是麥克法登偽R2度量、赤池信息準(zhǔn)則(AIC)、貝葉斯信息準(zhǔn)則(BIC)。麥克法登偽R2指標(biāo)越接近0,表明模型擬合度差;越接近1,說明模型擬合度好。AIC 指標(biāo)與BIC 指標(biāo)相對較小的模型擬合結(jié)果較好。表7列出了混合Logit模型與多項(xiàng)式Logit模型的擬合指標(biāo)。由表7可以看出,混合Logit模型的最優(yōu)對數(shù)似然函數(shù)值、麥克法登偽R2指標(biāo)均大于多項(xiàng)式Logit模型,AIC值與BIC值相對較小,說明相較于多項(xiàng)式Logit模型,混合Logit模型的擬合優(yōu)度更好,更適合列車選擇行為建模。
1)出發(fā)時(shí)間
分析表4可知:混合Logit模型中,列車服務(wù)水平變量系數(shù)的估計(jì)結(jié)果較好地描述了出行旅客的“隨機(jī)口味差異”,以6:00—7:00時(shí)間范圍為例,變量TM67系數(shù)估計(jì)均值為2.089,標(biāo)準(zhǔn)差為2.861,根據(jù)正態(tài)分布定義,樣本中系數(shù)估計(jì)值小于0的累計(jì)概率為0.23,說明有77%的樣本旅客偏好選擇該時(shí)段出行;同理,變量TA121和TA89系數(shù)估計(jì)均值分別為0.069 和1.793,標(biāo)準(zhǔn)差分別為-1.205和0.969,說明有51%的樣本旅客偏好選擇12:00—13:00時(shí)段出發(fā)的列車,而僅有10%的樣本旅客偏好選擇20:00—21:00時(shí)段出發(fā)列車;而多項(xiàng)式Logit模型中,變量TAM67系數(shù)估計(jì)值大于0 且統(tǒng)計(jì)結(jié)果顯著,說明樣本旅客偏好選擇6:00—7:00時(shí)間范圍出發(fā)列車,但無法定量說明偏好選擇該時(shí)間范圍出發(fā)列車旅客群體的數(shù)量多少;變量TPM01和TPM89的系數(shù)估計(jì)值小于0但估計(jì)結(jié)果不顯著,系數(shù)估計(jì)結(jié)果沒有統(tǒng)計(jì)意義。
表5 混合Logit模型個(gè)體特征與出行特征變量系數(shù)估計(jì)結(jié)果
表6 多項(xiàng)式Logit模型個(gè)體特征與出行特征變量參數(shù)估計(jì)結(jié)果
續(xù)表
表7 模型擬合指標(biāo)
2)旅行時(shí)間和票價(jià)水平
表4的混合Logit模型中:旅行時(shí)間變量t系數(shù)估計(jì)均值為-1.269,標(biāo)準(zhǔn)差為0.863,根據(jù)正態(tài)分布定義,表明93%的樣本旅客對票價(jià)水平敏感;票價(jià)水平變量C系數(shù)估計(jì)均值為-0.509,標(biāo)準(zhǔn)差為-1.529,表明僅有37%的樣本旅客對票價(jià)水平敏感。而多項(xiàng)式Logit模型中:旅行時(shí)間與票價(jià)水平變量的系數(shù)估計(jì)值小于0且統(tǒng)計(jì)結(jié)果顯著,說明旅行時(shí)間、票價(jià)水平變量與旅客對列車的選擇行為負(fù)相關(guān);旅行時(shí)間變量的系數(shù)估計(jì)值小于票價(jià)水平變量的系數(shù)估計(jì)值且統(tǒng)計(jì)結(jié)果顯著,說明旅行時(shí)間變量對旅客選擇行為的邊際效用大于票價(jià)水平變量,影響旅客對短途高鐵列車選擇行為的關(guān)鍵因素是旅行時(shí)間。
綜合分析表5與表6的參數(shù)估計(jì)結(jié)果可知:性別與票價(jià)水平交互變量Cx系數(shù)估計(jì)值大于0,表明女性旅客票價(jià)敏感度高;年齡與票價(jià)水平交互變量Ca3系數(shù)估計(jì)值遠(yuǎn)小于Ca1與Ca2系數(shù)估計(jì)值,表明50歲以上旅客群體對價(jià)格敏感度高;職業(yè)類別變量O1系數(shù)估計(jì)值在第2類列車組中大于0,表明對比參照組(其他職業(yè)),公務(wù)人員及企業(yè)職員群體偏好選擇上午8:00—11:00時(shí)間范圍開行的列車;職業(yè)類別與票價(jià)水平交互變量Co1系數(shù)估計(jì)值的統(tǒng)計(jì)結(jié)果顯著,表明對比公務(wù)人員與企業(yè)職員,學(xué)生群體的價(jià)格敏感度高;收入變量I系數(shù)估計(jì)值的統(tǒng)計(jì)結(jié)果不顯著,表明月收入水平與出行時(shí)間范圍不相關(guān);月收入與票價(jià)交互變量Ci1的系數(shù)估計(jì)值小于變量Ci2的系數(shù)估計(jì)值,表明低收入群體價(jià)格敏感度高;行前接駁變量Sc3的系數(shù)估計(jì)值在5類列車組中均為負(fù)值,表明行前接駁選擇自駕換乘的旅客群體偏好選擇5:00—8:00時(shí)間范圍開行的列車。
對比表5與表6的參數(shù)估計(jì)結(jié)果發(fā)現(xiàn):一些變量的系數(shù)在混合Logit模型與多項(xiàng)式Logit模型中的估計(jì)結(jié)果表現(xiàn)出不一樣的顯著特征。例如,在表5中,出行目的變量D2在第2類及第4類列車組的系數(shù)估計(jì)值大于0 且統(tǒng)計(jì)結(jié)果顯著,表明休閑出行旅客對上午8:00—11:00及下午14:00—17:00開行列車的選擇偏好基本一致;但在表6中,這一系數(shù)估計(jì)值統(tǒng)計(jì)結(jié)果不顯著。購票資金來源變量M的系數(shù)估計(jì)值在表5第2類列車組的中大于0 且統(tǒng)計(jì)結(jié)果顯著,表明公費(fèi)購票旅客偏好選擇上午8:00—11:00 開行列車;變量Cm的系數(shù)估計(jì)值大于0 且統(tǒng)計(jì)結(jié)果顯著,說明對比公費(fèi)購票旅客,自費(fèi)購票旅客的價(jià)格敏感度高;但這2個(gè)系數(shù)估計(jì)值在表6中統(tǒng)計(jì)結(jié)果不顯著。這是由于混合Logit模型將與選擇項(xiàng)相關(guān)的列車服務(wù)水平變量的系數(shù)設(shè)定為隨機(jī)變量,提高了模型中非選項(xiàng)相關(guān)變量(旅客個(gè)體特征與出行特征變量)參數(shù)的估計(jì)精度;而多項(xiàng)式Logit模型將該系數(shù)設(shè)定為固定值。
根據(jù)選擇行為理論,不同時(shí)間范圍開行列車的旅客支付意愿可以用開行時(shí)間變量系數(shù)與價(jià)格變量系數(shù)的比值表示,該值可以反映在單位價(jià)格水平下,旅客愿意為某一開行時(shí)間額外支付的代價(jià),如果比值結(jié)果為正,說明旅客愿意為當(dāng)前開行時(shí)間范圍列車多支付,反之則相反[1]?;诒?中不同出發(fā)時(shí)間變量及價(jià)格變量系數(shù)計(jì)算不同時(shí)段的旅客支付意愿,整理結(jié)果見表8。由表8可知,早6:00—10:00范圍內(nèi)的旅客支付意愿最高,早10:00—12:00及午后14:00—16:00范圍次之,晚間17:00—22:00范圍旅客支付意愿最低。目前,高鐵運(yùn)營企業(yè)正在試點(diǎn)車票彈性定價(jià)改革,熱門時(shí)段價(jià)格上浮,非熱門時(shí)段保持平價(jià)或價(jià)格下浮,應(yīng)用價(jià)格水平描述旅客支付意愿可以為不同時(shí)段列車實(shí)施彈性定價(jià)提供理論支持。
表8 不同出行時(shí)間旅客支付意愿
(1)對比多項(xiàng)式Logit模型,混合Logit模型的擬合優(yōu)度更好,更適合旅客對列車選擇行為建模。
(2)列車出發(fā)時(shí)間是影響旅客選擇行為的關(guān)鍵因素,對于6:00—7:00時(shí)間范圍出發(fā)列車,有77%的樣本旅客偏好選擇,對12:00—13:00時(shí)段出發(fā)的列車,有51%的樣本旅客偏好選擇,而對于20:00—21:00時(shí)段出發(fā)列車,僅有10%的樣本旅客偏好選擇。旅行時(shí)間、票價(jià)水平變量與旅客對列車的選擇行為負(fù)相關(guān),旅行時(shí)間對旅客選擇行為的邊際效用大于票價(jià)水平,有93%的樣本旅客對票價(jià)水平敏感,而僅有37%的樣本旅客對票價(jià)水平敏感。
(3)不同性別、年齡、職業(yè)、月收入、購票資金來源的旅客群體對票價(jià)的敏感度不同,其中女性旅客、50歲以上、學(xué)生、低收入、自費(fèi)購票等旅客對票價(jià)敏感度均較高。不同職業(yè)、出行目的以及行前接駁方式旅客群體對列車出發(fā)時(shí)間選擇偏好不同,公務(wù)人員及企業(yè)職員偏好選擇早8:00—11:00時(shí)間范圍開行的列車,休閑出行旅客偏好選擇8:00—11:00及14:00—17:00開行列車。行前接駁選擇自駕換乘的旅客,偏好選擇5:00—8:00時(shí)間范圍開行的列車。
(4)對不同時(shí)間段列出支付意愿不同,其中早6:00—10:00范圍開行列車的支付意愿最高,早10:00—12:00 及午后14:00—16:00范圍次之,晚間17:00—22:00范圍旅客支付意愿最低。
(5)本研究調(diào)查范圍設(shè)定在旅行時(shí)間3h范圍內(nèi)的短途高鐵旅客群體,對于長途高鐵列車,由于出行選擇產(chǎn)品的多樣性,需要進(jìn)一步研究其他產(chǎn)品(航空、普速列車等)的替代性以及其他因素對旅車選擇行為的影響。