陳 林,黃奕慧
(1.蜀道投資集團(tuán)有限責(zé)任公司,四川 成都 610000;2.西南交通大學(xué)交通與物流學(xué)院,四川 成都 610000)
研究意愿調(diào)查問卷的目的就是希望通過科學(xué)的實(shí)驗(yàn)設(shè)計(jì)方法設(shè)計(jì)精細(xì)的選擇情景,獲取出行者意愿偏好數(shù)據(jù),進(jìn)而預(yù)測(cè)出行者的交通選擇行為。常用的實(shí)驗(yàn)設(shè)計(jì)方法包括隨機(jī)部分因子設(shè)計(jì)法、正交設(shè)計(jì)法(Orthogonal Design,OD)以及D-efficient(D-e)設(shè)計(jì)法。隨機(jī)部分因子設(shè)計(jì)法是從全因子組合中隨機(jī)挑選部分實(shí)驗(yàn)組合作為調(diào)查問卷內(nèi)容,該方法能夠有效減少實(shí)驗(yàn)組合數(shù)量,但是該方法無法避免選擇枝屬性之間存在相關(guān)性,一旦相關(guān)性達(dá)到一定程度將會(huì)導(dǎo)致模型參數(shù)估計(jì)誤差[1]。正交設(shè)計(jì)法以選擇枝屬性相互正交為準(zhǔn)則挑選實(shí)驗(yàn)組合,從而避免由于屬性間的相關(guān)性造成模型參數(shù)估計(jì)誤差。正交設(shè)計(jì)法由于受到正交性的約束,一旦選擇枝屬性與屬性水平設(shè)置過多,采用正交設(shè)計(jì)法得到的實(shí)驗(yàn)組合數(shù)量也非常大,這樣造成調(diào)查工作量與投入非常大[1]。D-efficient設(shè)計(jì)法以Logit模型漸進(jìn)協(xié)方差矩陣行列式值最小為目標(biāo)反推實(shí)驗(yàn)組合,該方法能夠降低模型參數(shù)估計(jì)的標(biāo)準(zhǔn)差,提高模型參數(shù)估計(jì)結(jié)果的顯著度[2-5]。這些實(shí)驗(yàn)設(shè)計(jì)方法具有不同的理論基礎(chǔ)且各具優(yōu)勢(shì)與不足,在實(shí)證研究中有著豐富的應(yīng)用[6-9]。
理論上無論采用何種實(shí)驗(yàn)設(shè)計(jì)方法,都能得到無偏的模型參數(shù)估計(jì)結(jié)果。事實(shí)上,基于不同實(shí)驗(yàn)設(shè)計(jì)方法得到的模型參數(shù)結(jié)果存在一定程度的差異,尤其是在小樣本量情況下。一些學(xué)者推測(cè)造成此結(jié)果的原因是調(diào)查問卷存在含有主導(dǎo)項(xiàng)的選擇情景[10-13]。主導(dǎo)項(xiàng)是指選擇情景中存在某個(gè)選擇枝的屬性水平都優(yōu)于其他選擇枝[5]。一旦選擇情景中存在明顯的主導(dǎo)項(xiàng),主導(dǎo)項(xiàng)被選擇的概率將遠(yuǎn)大于情景內(nèi)的其他選擇枝,該情景將無法有效捕捉出行者決策過程中的意愿偏好信息,從而導(dǎo)致模型參數(shù)估計(jì)結(jié)果產(chǎn)生偏差[11-12]。采用效用均衡法檢測(cè)調(diào)查問卷中是否存在包含主導(dǎo)項(xiàng)的選擇情景,標(biāo)定Nested Logit Trick(NLT)模型,對(duì)比分析不同效用均衡值的兩種實(shí)驗(yàn)設(shè)計(jì)法對(duì)效用函數(shù)誤差項(xiàng)方差、尺度參數(shù)與參數(shù)估計(jì)結(jié)果的影響,進(jìn)而證明是否由于主導(dǎo)項(xiàng)的存在引起誤差項(xiàng)方差變化,從而導(dǎo)致模型參數(shù)估計(jì)結(jié)果產(chǎn)生偏差。
效用均衡主要應(yīng)用于經(jīng)濟(jì)學(xué)領(lǐng)域,它要求調(diào)查問卷的選擇情景中每個(gè)選擇枝具備相似的效用或者選擇概率[14]。若選擇情景中存在主導(dǎo)項(xiàng),則主導(dǎo)項(xiàng)被選擇的概率將遠(yuǎn)大于情景內(nèi)的其他選擇枝,那么該選擇情景的效用均衡值將較小。效用均衡值通常采用百分比作為衡量標(biāo)準(zhǔn),某一選擇情景的效用均衡值的計(jì)算方式,如公式(1)所示[14]
(1)
式中:BS為選擇情景S的效用均衡值;J為選擇枝數(shù)量;PjS為選擇情景S中選擇枝j被選擇的概率。
若調(diào)查問卷中存在多個(gè)選擇情景,則全部選擇情景的效用均衡值如公式(2)所示。
(2)
式中:BS為選擇情景S的效用均衡值;s為選擇情景數(shù)量。
根據(jù)隨機(jī)效用理論,效用函數(shù)U分為可以觀測(cè)的固定項(xiàng)V和不可觀測(cè)的誤差項(xiàng)ε,并假設(shè)它們呈線性關(guān)系[1]。因此,交通方式i對(duì)出行者n的效用函數(shù)可以表示為
Uni=Vni+εni
(3)
Logit模型中,εni獨(dú)立同Gamble分布時(shí),其概率分布函數(shù)和概率密度函數(shù)分別為
F(y)=exp[-exp(-λy)]
f(y)=λF(y)exp(-by)]
(4)
式中:λ>0為尺度參數(shù),尺度參數(shù)λ的平方與誤差項(xiàng)方差D(ε)呈反比的關(guān)系,如公式(5)所示:
(5)
根據(jù)隨機(jī)效用理論,出行者n選擇交通方式i的選擇概率為
(6)
式中:Cn為選擇枝集合;Xnjk為選擇枝j中的屬性k;θk為未知參數(shù);λ為尺度參數(shù)。
實(shí)證研究中,用極大似然函數(shù)法得到未知參數(shù)λθk的值,將λ標(biāo)準(zhǔn)化為1(即誤差項(xiàng)方差D(ε)=π2/6),從而得到θk的值。根據(jù)公式(5),尺度參數(shù)的平方與效用函數(shù)誤差項(xiàng)方差呈現(xiàn)倒數(shù)關(guān)系。如果誤差項(xiàng)方差發(fā)生變化,則尺度參數(shù)的大小也會(huì)發(fā)生變化,最終模型參數(shù)估計(jì)值λθk與真實(shí)值θk將存在顯著差異。
應(yīng)用NLT模型,分析不同實(shí)驗(yàn)設(shè)計(jì)法對(duì)誤差項(xiàng)方差、尺度參數(shù)與參數(shù)估計(jì)結(jié)果影響[1]。NLT模型與NL模型(Nested Logit,NL)模型的區(qū)別在于層次結(jié)構(gòu)樹的劃分原理。NL模型將具有相關(guān)性的選擇枝劃分到同一個(gè)樹枝結(jié)構(gòu)內(nèi),而NLT模型則可以按照研究者需要來劃分層次樹枝結(jié)構(gòu)[1],本文將按照實(shí)驗(yàn)設(shè)計(jì)方法的不同來劃分層次樹枝結(jié)構(gòu)。
以成都市主城區(qū)與衛(wèi)星城龍泉驛區(qū)之間的新增地鐵為研究背景,開展意愿調(diào)查獲取出行者在新增地鐵方式情況下交通方式選擇行為偏好。通道內(nèi)的選擇枝集合包含地鐵、地面公交、出租車、私家車以及客運(yùn)大巴;選擇枝屬性包括到站時(shí)間、候車時(shí)間、費(fèi)用、車內(nèi)時(shí)間以及下車到目的地時(shí)間。選擇枝屬性水平是在現(xiàn)狀水平的基礎(chǔ)上相應(yīng)地增加或者減少相同比例得到[1],如表1所示。
表1 選擇枝屬性水平定義
按照表1所示的選擇枝屬性及屬性水平,得到全因子組合648個(gè)。采用正交設(shè)計(jì)法挑選屬性水平相互正交的組合,最終得到32個(gè)組合。正交實(shí)驗(yàn)設(shè)計(jì)法受到正交性條件的限制,不能夠按照研究需要確定實(shí)驗(yàn)組合數(shù)量。所以,將32個(gè)組合全部納入到意愿調(diào)查問卷中。為了減輕被調(diào)查者的工作量,采用分塊實(shí)驗(yàn)設(shè)計(jì)法(Blocking Experiment)在保證正交性的前提下,將32個(gè)組合劃分為8組,一個(gè)被調(diào)查者隨機(jī)完成其中1組。最后,輔助以調(diào)查說明、填寫說明、選擇枝組合相關(guān)問題以及被調(diào)查者個(gè)人屬性,形成完整的正交意愿調(diào)查問卷。一式完整的調(diào)查問卷中包含了8份問卷。
D-efficient實(shí)驗(yàn)設(shè)計(jì)法是以模型漸進(jìn)協(xié)方差矩陣行列式值最小為目標(biāo),降低模型參數(shù)估計(jì)的標(biāo)準(zhǔn)差,獲得更加顯著的模型參數(shù)估計(jì)結(jié)果[5,10,11]。通常,模型漸進(jìn)協(xié)方差矩陣行列式值采用D-error來表示,D-efficient設(shè)計(jì)法的數(shù)學(xué)推導(dǎo)式如下
D-error=det(Ω)1/K
(8)
式中:Ω為離散選擇模型的漸進(jìn)協(xié)方差矩陣;K為模型參數(shù)估計(jì)個(gè)數(shù)。
漸進(jìn)協(xié)方差矩陣等于費(fèi)歇爾信息矩陣的逆矩陣,如公式(9)
Ω=I-1
(9)
式中:I為費(fèi)歇爾信息矩陣。
費(fèi)歇爾信息矩陣的計(jì)算方法,如下公式(10)所示
(10)
式中:L(x,β)為離散選擇模型的極大似然函數(shù);Xnjk代表選擇枝j的第k個(gè)屬性;βjk代表選擇枝j的第k個(gè)屬性在效用函數(shù)中未知參數(shù)。
離散選擇模型的極大似然函數(shù),如公式(11)所示
(11)
式中:yni表示決策者n的選擇結(jié)果;Pni表示決策者n的選擇選擇枝i的概率。
首先實(shí)施預(yù)調(diào)查采集數(shù)據(jù),標(biāo)定MNL模型,將參數(shù)標(biāo)定結(jié)果作為D-efficient實(shí)驗(yàn)設(shè)計(jì)法的參數(shù)預(yù)先值,如表2所示。得到預(yù)先值后,根據(jù)上述原理完成實(shí)驗(yàn)組合設(shè)計(jì)。為了同正交設(shè)計(jì)法進(jìn)行對(duì)比,將實(shí)驗(yàn)組合數(shù)量設(shè)置為32個(gè),最終得到D-error值最小情況下的32個(gè)組合方案。同樣,為了減輕被調(diào)查者的工作量,也采用分塊實(shí)驗(yàn)設(shè)計(jì)法(Blocking Experiment)將32個(gè)組合劃分到8組,一個(gè)被調(diào)查者隨機(jī)完成其中1組。最后,將這些組合分別輔助以調(diào)查說明、填寫說明以及被調(diào)查者個(gè)人屬性問題,形成完整的D-efficient意愿調(diào)查問卷,一式完整的調(diào)查問卷中包含了8份問卷。
表2 選擇枝屬性參數(shù)預(yù)先值
所有的問卷調(diào)查都采用面對(duì)面訪問式的調(diào)查方式。調(diào)查獲取出行者在不同選擇情景下的偏好數(shù)據(jù),同時(shí)被調(diào)查者還需要提供年齡、收入、性別等個(gè)人信息,最終分別得到1 272組有效數(shù)據(jù)。調(diào)查問卷通過設(shè)置了4個(gè)年齡區(qū)間來衡量調(diào)查樣本的年齡情況,同樣設(shè)置了5個(gè)收入?yún)^(qū)間來呈現(xiàn)被調(diào)查者的收入分布情況,每種問卷對(duì)應(yīng)調(diào)查樣本的總體屬性統(tǒng)計(jì)情況如表3所示。根據(jù)表3可以看出,兩組調(diào)查樣本的總體特征基本符合該城市人口的總體特征,兩組調(diào)查樣本的總體特征之間不存在顯著差異,說明調(diào)查樣本的總體特征不會(huì)對(duì)模型參數(shù)估計(jì)結(jié)果存在顯著的影響。
表3 調(diào)查樣本總體特征表
NLT模型與MNL模型的參數(shù)標(biāo)定結(jié)果如表4所示。模型參數(shù)結(jié)果符號(hào)正確且顯著,模型擬合度較好。對(duì)比兩組MNL模型結(jié)果發(fā)現(xiàn),兩者存在明顯的差異,尤其是費(fèi)用與到站時(shí)間等變量,表明不同實(shí)驗(yàn)設(shè)計(jì)方法會(huì)導(dǎo)致參數(shù)估計(jì)偏差。
表4 不同實(shí)驗(yàn)設(shè)計(jì)法的模型結(jié)果
NLT模型中按照實(shí)驗(yàn)設(shè)計(jì)法的不同劃為兩個(gè)結(jié)構(gòu)樹,如圖1所示。不同樹枝結(jié)構(gòu)間選擇枝效用函數(shù)誤差項(xiàng)相互獨(dú)立,并且每個(gè)樹枝結(jié)構(gòu)都有對(duì)應(yīng)的IV參數(shù)(IV1,IV2)。IV參數(shù)與尺度參數(shù)的關(guān)系,如公式(12)所示
(12)
圖1 NLT模型的層次結(jié)構(gòu)劃分
式中:λOD表示樹枝結(jié)構(gòu)OD內(nèi)Level1層的尺度參數(shù);λi表示樹枝結(jié)構(gòu)OD內(nèi)Level2層的尺度參數(shù)。
為了驗(yàn)證基于不同實(shí)驗(yàn)設(shè)計(jì)法得到的模型結(jié)果中,效用函數(shù)誤差項(xiàng)方差是否存在顯著差異。將Level1層中的尺度參數(shù)標(biāo)準(zhǔn)化為1,即λOD=λD-e=1。如表4所示,NLT模型結(jié)果中IV值顯著(|T|=33.7>1.96),表明基于兩種實(shí)驗(yàn)設(shè)計(jì)法的尺度參數(shù)存在顯著差異。
根據(jù)公式(12)計(jì)算得到Level2中尺度參數(shù)(λi,λj)的值分別為1與1.14。同時(shí),利用公式(1)、(2)以及(5)計(jì)算得到兩組調(diào)查問卷的效用均衡值以及誤差項(xiàng)方差,如表5所示。計(jì)算結(jié)果表明正交設(shè)計(jì)法與D-efficient設(shè)計(jì)法都沒有保持良好的效用均衡,即調(diào)查問卷中存在一些包含主導(dǎo)項(xiàng)的選擇情景。
表5 誤差項(xiàng)方差與尺度參數(shù)值
根據(jù)表5所示,相比于正交設(shè)計(jì)法,D-efficient設(shè)計(jì)法的效用均衡值(9.1%)更小,誤差項(xiàng)方差更小,尺度參數(shù)值更大。表明D-efficient調(diào)查問卷中含有主導(dǎo)項(xiàng)的選擇情景數(shù)量更多,導(dǎo)致其效用均衡值較小。由于主導(dǎo)項(xiàng)的存在,選擇情景無法有效獲取被調(diào)查者決策過程中的意愿偏好信息,造成誤差項(xiàng)方差變小,尺度參數(shù)值變大,則模型參數(shù)估計(jì)值(λθk)與真實(shí)值(θk)之間的偏差更為顯著。
進(jìn)一步對(duì)比了設(shè)計(jì)D-efficient調(diào)查問卷時(shí)采用的預(yù)先值與MNL模型結(jié)果,發(fā)現(xiàn)兩者間存在明顯的差異,表明D-efficient設(shè)計(jì)法的設(shè)計(jì)效能有所損失。認(rèn)為造成D-efficient設(shè)計(jì)法參數(shù)估計(jì)偏差大于正交設(shè)計(jì)法的原因就在于較差的預(yù)先值,較差的預(yù)先值無法有效的避免選擇情景中出現(xiàn)主導(dǎo)項(xiàng)。
分別使用正交設(shè)計(jì)方法和D-efficient設(shè)計(jì)法設(shè)計(jì)了兩組出行意愿調(diào)查問卷,獲取出行者在通道內(nèi)新增地鐵情況下的交通方式選擇偏好數(shù)據(jù)。利用效用均衡法分別計(jì)算兩組調(diào)查問卷的效用均衡值,定量化評(píng)估了調(diào)查問卷中是否含有主導(dǎo)項(xiàng)的選擇情景。根據(jù)NLT模型與MNL模型標(biāo)定結(jié)果,對(duì)比分析了不同實(shí)驗(yàn)設(shè)計(jì)法對(duì)誤差項(xiàng)方差、尺度參數(shù)以及模型參數(shù)估計(jì)結(jié)果的影響。
(1)通過效用均衡分析發(fā)現(xiàn)D-efficient調(diào)查問卷的效用均衡值(9.1%)小于正交設(shè)計(jì)法(11.9%),表明D-efficient調(diào)查問卷中存在主導(dǎo)項(xiàng)的選擇情景多于正交設(shè)計(jì)法。NLT模型結(jié)果則證實(shí)基于D-efficient設(shè)計(jì)法的效用函數(shù)誤差項(xiàng)方差比正交設(shè)計(jì)法小,尺度參數(shù)值則更大,模型參數(shù)估計(jì)值與真實(shí)值之間的偏差則更顯著。表明由于問卷中存在包含主導(dǎo)項(xiàng)的選擇情景,導(dǎo)致效用函數(shù)誤差項(xiàng)的方差較小,尺度參數(shù)值變大,模型參數(shù)估計(jì)值與真實(shí)值之間的偏差更為顯著。
(2)D-efficient調(diào)查問卷中存在較多包含主導(dǎo)項(xiàng)的選擇情景的原因在于較差的預(yù)先值,較差的預(yù)先值降低了D-efficient設(shè)計(jì)法的設(shè)計(jì)效能,無法有效避免選擇情景中主導(dǎo)項(xiàng)的存在。
(3)效用均衡在意愿調(diào)查問卷實(shí)驗(yàn)設(shè)計(jì)過程將是非常重要的一個(gè)過程,它能夠有效降低參數(shù)估計(jì)結(jié)果的偏差。