朱 瑋, 楊嘉智
(同濟(jì)大學(xué) 建筑與城市規(guī)劃學(xué)院,上海 20092)
敘述性偏好法(stated preference, SP)是指通過實(shí)驗(yàn)設(shè)計(jì)(design of experiment),讓被試者面對虛擬對象表達(dá)其偏好的一種調(diào)查和研究方法.相對于直接觀察人們實(shí)際選擇行為的顯示性偏好法(revealed preference, RP)而言,SP具有變量變異性可控、相關(guān)性可控、被試行為可控、可加入實(shí)際中尚不存在的新變量或新產(chǎn)品等優(yōu)勢,有利于得到更加符合理論的數(shù)據(jù)和模型[1],因此成為諸多研究和應(yīng)用領(lǐng)域的常用方法.
應(yīng)用SP法的一個(gè)關(guān)鍵步驟就是實(shí)驗(yàn)設(shè)計(jì).通常研究者首先設(shè)定影響決策和選擇的要素,并設(shè)定每個(gè)要素的水平;再組合不同要素的水平來生成選項(xiàng),將若干選項(xiàng)組合成選擇題供被試者選擇;最后多采用離散選擇模型方法(discrete choice models)[2-3],通過解讀模型估計(jì)的參數(shù)來推斷偏好.因此,參數(shù)估計(jì)的可靠性和準(zhǔn)確性至關(guān)重要.可靠性是指估計(jì)參數(shù)的離散程度,離散程度越小說明在重復(fù)試驗(yàn)中越不可能出現(xiàn)與估計(jì)值相差較大的參數(shù)值;準(zhǔn)確性是指估計(jì)參數(shù)與真實(shí)參數(shù)的接近程度,越接近說明模型越能反映人們的真實(shí)偏好.兩者往往隨樣本量的增加而提高.
但受成本限制,實(shí)際的調(diào)查實(shí)施總希望用盡量少的樣本來得到足夠可靠和準(zhǔn)確的模型結(jié)果,稱其為有效樣本量.這需要采用一定的實(shí)驗(yàn)設(shè)計(jì)策略,常用的設(shè)計(jì)策略包括正交設(shè)計(jì)(orthogonal design)、效率設(shè)計(jì)(efficient design)[4-5]等,不同策略下的有效樣本量可能不同.除此之外,影響有效樣本量的還有要素的數(shù)量、水平的數(shù)量以及偏好本身的特征等因素.
目前關(guān)于SP實(shí)驗(yàn)設(shè)計(jì)樣本量的研究主要集中在醫(yī)學(xué)及商業(yè)決策等領(lǐng)域.運(yùn)用較廣的傳統(tǒng)模型有Orme提出的經(jīng)驗(yàn)法則(rule of thumb Ⅰ)[6],指出樣本量(被試人數(shù))取決于選擇題的數(shù)量、構(gòu)成選擇的要素?cái)?shù)量,以及所有要素中出現(xiàn)的最大水平數(shù)量,它們之間的關(guān)系可以用簡單的數(shù)學(xué)公式表示.之后Orme進(jìn)一步指出在一般實(shí)驗(yàn)中,被調(diào)查人數(shù)至少在300人以上,結(jié)果才可能具有說服力(rule of thumb Ⅱ)[7].但兩個(gè)經(jīng)驗(yàn)法則都缺少充分的證明.另一個(gè)傳統(tǒng)模型來自簡單隨機(jī)抽樣理論(SRS theory)[1],其樣本量估算基于選擇概率的真實(shí)值和估計(jì)值、每個(gè)被試者需要完成的任務(wù)數(shù)量,由公式可計(jì)算出有效被試者人數(shù);不足的是,如果沒有源于實(shí)際的調(diào)查背景便不能獲得選擇概率的真實(shí)值.文獻(xiàn)[4-5]在簡單隨機(jī)抽樣理論的基礎(chǔ)上,提出了以協(xié)方差矩陣衡量實(shí)驗(yàn)設(shè)計(jì)效率的方法,以及利用參數(shù)檢驗(yàn)得到最小樣本量的實(shí)驗(yàn)設(shè)計(jì)策略(S-efficient design).
既有研究主要存在3點(diǎn)不足:①僅關(guān)注模型的可靠性,欠考慮模型的準(zhǔn)確性.得到低標(biāo)準(zhǔn)誤、統(tǒng)計(jì)顯著的參數(shù)通常比得到接近真實(shí)值的參數(shù)容易,既有研究一般止步于此.在實(shí)證研究中,真實(shí)參數(shù)是未知的,成為準(zhǔn)確性驗(yàn)證的主要障礙;②在有效樣本量的影響要素中,未考慮偏好本身的特征.該特征具體來說就是偏好參數(shù)的尺度.根據(jù)離散選擇模型的原理,大尺度的參數(shù)相較小尺度的參數(shù)更能減少隨機(jī)誤差的干擾,從而令選擇結(jié)果的傾向更加明確,對偏好的估計(jì)相應(yīng)更容易,因此所需的樣本量理論上應(yīng)更少;③有效樣本量估計(jì)方法的可操作性、普適性低,一般需要針對特定問題預(yù)設(shè)參數(shù)值[4],因此受預(yù)設(shè)過程本身可靠性的影響大,實(shí)施過程也比較復(fù)雜.
本文旨在彌補(bǔ)以上缺陷,得到一個(gè)更加容易操作的SP實(shí)驗(yàn)有效樣本估計(jì)方法框架.具體來說,希望通過實(shí)施這一框架,得到一個(gè)(或幾個(gè),針對不同的設(shè)計(jì)策略)操作模型,應(yīng)用該模型,便可以通過預(yù)設(shè)實(shí)驗(yàn)中要素的數(shù)量、水平的數(shù)量、偏好參數(shù)的尺度以及參數(shù)的目標(biāo)準(zhǔn)確度,來預(yù)估實(shí)驗(yàn)所需的有效樣本量.
SP實(shí)驗(yàn)設(shè)計(jì)的一般過程為:①確定實(shí)驗(yàn)對象,根據(jù)其屬性設(shè)定影響決策和選擇的要素;②設(shè)定每個(gè)要素的水平;③采用選定的實(shí)驗(yàn)設(shè)計(jì)策略對不同要素的水平進(jìn)行組合,生成選項(xiàng),將若干選項(xiàng)組合成選擇題供被試者選擇.
SP實(shí)驗(yàn)的選擇行為數(shù)據(jù)通常用離散選擇模型來解釋,其中最基本的是多項(xiàng)邏輯特模型(multinomial logit model),其假定人們在選擇時(shí),面對選項(xiàng)i=1,…,I,選擇概率pi為
(1)
(2)
可見,該準(zhǔn)確性與模型擬合參數(shù)的標(biāo)準(zhǔn)誤成反比,與真實(shí)參數(shù)的容差成正比,如圖1所示.從理論上可以推斷,提高容差可以提高參數(shù)準(zhǔn)確性,相應(yīng)需要的有效樣本量就會(huì)減少;相反,小容差就需要大樣本.因此,容差尺度要適當(dāng),但又因具體應(yīng)用問題而不同:參數(shù)誤差造成的后果在多大程度上是可接受的,需具體情況具體確定.筆者將容差設(shè)定為0.1,即允許估計(jì)參數(shù)相對于真實(shí)參數(shù)有最多正負(fù)10%的偏移.
(3)
圖1 參數(shù)準(zhǔn)確性定義
SP選擇實(shí)驗(yàn)中,影響模型參數(shù)準(zhǔn)確性的因素可能包括:① 樣本量(xN).進(jìn)入模型擬合的選擇數(shù)量越多、選擇結(jié)果越豐富,就能為模型提供越多的信息量,使得參數(shù)估計(jì)越準(zhǔn)確;② 設(shè)計(jì)要素(解釋變量)數(shù)量(xV)和要素水平數(shù)量(xL).這兩個(gè)因素決定實(shí)驗(yàn)設(shè)計(jì)的復(fù)雜程度,要素和水平數(shù)量越多則生成選擇方案的數(shù)量越多;相比于復(fù)雜度較低的實(shí)驗(yàn)設(shè)計(jì),需要較大的樣本量和較豐富的選擇結(jié)果來得到相同準(zhǔn)確性的參數(shù)估計(jì);③ 模型參數(shù)的尺度(xS).參數(shù)尺度決定了可見效用相對于誤差的作用強(qiáng)度,尺度越大則選擇結(jié)果越確定,規(guī)律性越強(qiáng),越容易得到準(zhǔn)確的參數(shù)估計(jì);④ 實(shí)驗(yàn)設(shè)計(jì)策略(xD).不同的實(shí)驗(yàn)設(shè)計(jì)策略(如正交設(shè)計(jì)、效率設(shè)計(jì)、隨機(jī)設(shè)計(jì))產(chǎn)生不同的選擇方案,對應(yīng)不同程度的信息豐富性和有偏性,從而影響參數(shù)估計(jì)的準(zhǔn)確性.例如,正交設(shè)計(jì)可以產(chǎn)生具有代表性、均好性、數(shù)量較少的選擇方案,但其自變量的信息量不隨樣本量的增加而變化;而隨機(jī)設(shè)計(jì)在樣本量較少時(shí),自變量的分布很可能有偏,但隨著樣本量增加,有偏性會(huì)減弱,信息豐富性會(huì)增加.
以上影響因素與參數(shù)準(zhǔn)確性的假設(shè)關(guān)系總結(jié)如表1所示.
表1 變量的含義及其與參數(shù)準(zhǔn)確性的假設(shè)關(guān)系
Tab.1 Variables and hypothetical relationship with parameter accuracy
變量影響因素含義與參數(shù)準(zhǔn)確性的假設(shè)關(guān)系xN樣本量正相關(guān)(+)xV設(shè)計(jì)要素的數(shù)量負(fù)相關(guān)(-)xL設(shè)計(jì)要素水平的數(shù)量負(fù)相關(guān)(-)xS模型參數(shù)的尺度正相關(guān)(+)xD實(shí)驗(yàn)設(shè)計(jì)策略對應(yīng)的選擇方案豐富度正相關(guān)(+)
由于設(shè)計(jì)策略不易量化,因此在特定實(shí)驗(yàn)設(shè)計(jì)策略xD下,建構(gòu)其余4個(gè)影響因素與參數(shù)準(zhǔn)確性的關(guān)系模型,而設(shè)計(jì)策略的影響可通過比較不同設(shè)計(jì)策略對應(yīng)模型的參數(shù)來獲得.參數(shù)準(zhǔn)確性的取值范圍為0~1,通過預(yù)研究基本掌握了參數(shù)準(zhǔn)確性在3個(gè)設(shè)計(jì)策略下(詳見2.1)與樣本量的關(guān)系,以要素?cái)?shù)量、水平數(shù)量皆為3、模型參數(shù)尺度選擇中類時(shí)為例(圖2),圖中曲線接近標(biāo)準(zhǔn)邏輯斯蒂函數(shù)的上半部分(圖3).
圖2 參數(shù)準(zhǔn)確性與樣本量變化的關(guān)系(要素?cái)?shù)量=3,水平數(shù)量=3,模型參數(shù)尺度=中類)
Fig.2 Parameter accuracy versus sample size
圖3 邏輯斯蒂函數(shù)
標(biāo)準(zhǔn)邏輯斯蒂函數(shù)為
(4)
(5)
得
(6)
鑒于準(zhǔn)確性的影響因素都要通過樣本量起作用,例如當(dāng)樣本量為0,準(zhǔn)確性也應(yīng)為0;同時(shí)考慮到模型應(yīng)較易于操作.因此,將自變量間的關(guān)系定義為如下乘積形式:
(7)
式中:βk為各影響因素xk的權(quán)重,可用線性回歸模型求解.根據(jù)公式(7),當(dāng)給定實(shí)驗(yàn)設(shè)計(jì)策略、參數(shù)準(zhǔn)確性、實(shí)驗(yàn)設(shè)計(jì)要素?cái)?shù)量、要素水平數(shù)量以及參數(shù)尺度,即可求得實(shí)驗(yàn)所需的有效樣本量.
本研究中的有效樣本量是指得到足夠模型參數(shù)準(zhǔn)確性所需的最小樣本量.應(yīng)用以上的框架對SP實(shí)驗(yàn)的有效樣本量進(jìn)行實(shí)證研究.總體思路是,將以上5個(gè)參數(shù)準(zhǔn)確性影響因素作為設(shè)計(jì)要素進(jìn)行實(shí)驗(yàn)設(shè)計(jì),得到不同的檢驗(yàn)方案;根據(jù)每個(gè)方案,用模擬的方法生成虛擬決策數(shù)據(jù),進(jìn)行選擇模型擬合,得到模型參數(shù),并計(jì)算參數(shù)準(zhǔn)確性.根據(jù)式(7)得到準(zhǔn)確性的回歸模型,考查影響因素與準(zhǔn)確性的實(shí)證關(guān)系,以及不同條件下有效樣本量的變化規(guī)律.
對5個(gè)影響因素的等級設(shè)定如下:
(1) 設(shè)計(jì)要素的數(shù)量(xV),為2~10個(gè).
(2) 要素水平的數(shù)量(xL),為2~4個(gè).
(3) 模型參數(shù)的尺度(xS),即為預(yù)設(shè)的真實(shí)參數(shù),為大、中、小3個(gè)等級.大尺度參數(shù)值為0、2、4、8,中尺度參數(shù)值為0、1、2、4,小尺度參數(shù)值為0、0.5、1、2.
采用R語言的DoE.base包,對以上3個(gè)因素經(jīng)過正交設(shè)計(jì),得到27個(gè)檢驗(yàn)方案,其中典型方案如表2所示.
(4) 樣本量(xN),根據(jù)每個(gè)檢驗(yàn)方案以及對應(yīng)選擇方案規(guī)模,并根據(jù)式(1),模擬2選1選擇的若干樣本.在每種策略下模擬了500、800、1 500、3 000、6 000、12 000、20 000、30 000次選擇.
(5) 實(shí)驗(yàn)設(shè)計(jì)策略(xD),選取了3種實(shí)驗(yàn)設(shè)計(jì)策略分別進(jìn)行檢驗(yàn).一是將要素的數(shù)量擴(kuò)大選項(xiàng)數(shù)兩倍后做正交設(shè)計(jì)(偏移成對正交設(shè)計(jì),shifted-pairs orthogonal design[8-9]),直接生成選擇方案,以下簡稱“成對組合策略”;二是運(yùn)用正交設(shè)計(jì)生成單個(gè)選項(xiàng)后,從中隨機(jī)抽取兩個(gè)選項(xiàng)組合成選擇方案,以下簡稱“隨機(jī)組合策略”;三是所有選項(xiàng)的要素值均隨機(jī)生成,以下簡稱“完全隨機(jī)策略”.一般來說,成對組合策略生成的選擇方案最少,在小樣本下的代表性和均勻性最好;完全隨機(jī)策略的方案豐富性最高,利于降低參數(shù)偏差,但需要大樣本才能得以體現(xiàn);隨機(jī)組合策略的特性居于以上兩者之間.
表2 檢驗(yàn)方案示例
分別在以上3種設(shè)計(jì)策略下實(shí)施檢驗(yàn)方案,用R語言中的mlogit包擬合選擇模型(式(1)),得到模型估計(jì)參數(shù),根據(jù)式(2)、(3)計(jì)算該方案、該樣本的模型參數(shù)準(zhǔn)確性;接著用準(zhǔn)確性模型對所有檢驗(yàn)方案的所有樣本加以回歸分析,可得到3個(gè)對應(yīng)設(shè)計(jì)策略的模型.根據(jù)式(7),對準(zhǔn)確性模型加以調(diào)整,主要是因?yàn)槟P蛥?shù)尺度因素(xS)在本實(shí)證中不易量化,進(jìn)而采取啞變量的形式(0/1),分別由xS1(小尺度)、xS2(中尺度)和xS3(大尺度)來表示;對應(yīng)參數(shù)為βS1、βS2、βS3.式(7)相應(yīng)調(diào)整為
(8)
在準(zhǔn)確性模型擬合前,篩選準(zhǔn)確性在0.70~0.95的樣本予以保留,目的一是對準(zhǔn)確性較高的樣本建模更具針對性和實(shí)用性,二是去除異常情況.模型擬合結(jié)果見表3.
3種策略下模型參數(shù)的符號和關(guān)系均符合假設(shè):參數(shù)尺度與準(zhǔn)確性正相關(guān);設(shè)計(jì)要素的數(shù)量和要素水平的數(shù)量均與準(zhǔn)確性負(fù)相關(guān),且要素水平的作用更強(qiáng);樣本數(shù)量與準(zhǔn)確性正相關(guān).模型中未加入常數(shù)項(xiàng),因?yàn)槌?shù)項(xiàng)與xSc的作用重疊.將通過模型(式(8))估計(jì)的樣本量與實(shí)際的樣本量進(jìn)行比較(圖4).相比前兩種策略,完全隨機(jī)策略圖像上的點(diǎn)分布更聚集,估計(jì)樣本量與實(shí)際樣本量更為接近,對兩者的線性回歸亦可同樣證明.
表3 準(zhǔn)確性模型結(jié)果
注:***、**、*和·的統(tǒng)計(jì)顯著性水平分別為0.001、0.01、0.05、0.1.
a 成對組合策略
b 隨機(jī)組合策略
c 完全隨機(jī)策略
為了更加清晰地呈現(xiàn)有效樣本量與其影響因素的關(guān)系,并便于對這3種設(shè)計(jì)策略進(jìn)行比較,對以上模型進(jìn)行可視化處理,如圖5所示.圖中,縱坐標(biāo)表示27種要素與水平的組合,自下而上根據(jù)要素和水平的數(shù)量排列,越往上,選擇的復(fù)雜性越高;橫坐標(biāo)表示在之前條件設(shè)定下估算的有效樣本量.它們顯示的規(guī)律是:① 要素?cái)?shù)量和水平數(shù)量越多,需要的有效樣本量越大,且要素水平數(shù)量的影響比要素?cái)?shù)量的影響大得多.② 參數(shù)尺度越小,需要的有效樣本量越大,且呈非線性增長,即從中尺度到小尺度參數(shù)需要增加的有效樣本量比從大尺度到中尺度需要增加的有效樣本量多得多.③ 參數(shù)準(zhǔn)確性越高,需要的有效樣本量越大,也呈非線性增長,即同等程度的準(zhǔn)確性提高,在較高準(zhǔn)確性下要比較低準(zhǔn)確性下需要更多的有效樣本量.④ 兩種隨機(jī)設(shè)計(jì)策略所需的有效樣本量明顯少于成對設(shè)計(jì)策略的樣本量.例如,在最高的準(zhǔn)確性、最小的參數(shù)尺度、最高的復(fù)雜性下,隨機(jī)策略的有效樣本量不超過40 000次選擇,而成對設(shè)計(jì)策略需要超過60 000次選擇.在參數(shù)準(zhǔn)確性較低或在復(fù)雜度較低的條件下,成對設(shè)計(jì)策略需要的樣本量與隨機(jī)策略接近甚至更少.⑤ 比較這兩種隨機(jī)策略,完全隨機(jī)策略在大多數(shù)條件下需要較少的有效樣本量;僅在最高準(zhǔn)確性、最小參數(shù)尺度、較高復(fù)雜性下,有效樣本量略多于隨機(jī)組合策略所需有效樣本量.
a 成對組合策略
b 隨機(jī)組合策略
c 完全隨機(jī)策略
既有SP實(shí)驗(yàn)設(shè)計(jì)研究主要關(guān)注估計(jì)可信度高的參數(shù),卻忽略了對參數(shù)準(zhǔn)確性的要求.對此,本文提出了一個(gè)以獲得準(zhǔn)確參數(shù)估計(jì)為目標(biāo),估計(jì)SP實(shí)驗(yàn)設(shè)計(jì)所需有效樣本量的模型框架.研究的主要結(jié)論為:
(1) 提出了一個(gè)易于操作、更加全面的SP實(shí)驗(yàn)有效樣本量估計(jì)方法框架,最終可通過一個(gè)線性模型來估計(jì)實(shí)驗(yàn)所需的樣本量.該模型中的因變量為參數(shù)的準(zhǔn)確性,解釋變量包括要素的數(shù)量、要素水平的數(shù)量、參數(shù)的尺度、樣本量以及實(shí)驗(yàn)設(shè)計(jì)策略.當(dāng)預(yù)設(shè)包括準(zhǔn)確性在內(nèi)的其他變量,即可應(yīng)用此模型求得有效樣本量.
(2) 應(yīng)用該框架開展了一個(gè)模擬檢驗(yàn),發(fā)現(xiàn)所有這些解釋變量都對參數(shù)的準(zhǔn)確性產(chǎn)生顯著的影響,從中得到對SP實(shí)驗(yàn)設(shè)計(jì)的一些實(shí)踐原則.第一,要素水平的數(shù)量比要素的數(shù)量更顯著地影響樣本量,因此實(shí)驗(yàn)應(yīng)盡量控制要素水平數(shù);第二,在估計(jì)樣本量前,可通過預(yù)實(shí)驗(yàn)或文獻(xiàn)查閱對參數(shù)尺度有所預(yù)估;第三,在高參數(shù)準(zhǔn)確性的要求下,隨機(jī)實(shí)驗(yàn)策略基本上要優(yōu)于成對設(shè)計(jì)策略,僅在低參數(shù)準(zhǔn)確性、大尺度參數(shù)等寬松的條件下,成對設(shè)計(jì)策略才體現(xiàn)出優(yōu)勢.
以上框架適用于基于SP選擇實(shí)驗(yàn)的研究,幫助研究者評價(jià)實(shí)驗(yàn)設(shè)計(jì),選擇恰當(dāng)?shù)膶?shí)驗(yàn)設(shè)計(jì)策略,預(yù)估樣本量和實(shí)施難度.相信通過以上模擬檢驗(yàn)得到的實(shí)驗(yàn)設(shè)計(jì)要素與有效樣本量之間的關(guān)系在其他一般實(shí)驗(yàn)情景中仍是有效的,不過具體的關(guān)聯(lián)程度應(yīng)該會(huì)隨著研究問題的不同而有所不同,因此仍需要具體問題具體研究.在這個(gè)過程中,比較難的步驟就是界定真實(shí)參數(shù)的尺度,因其對有效樣本量規(guī)模有較大影響.通過預(yù)實(shí)驗(yàn)或文獻(xiàn)查閱對參數(shù)尺度有較為準(zhǔn)確的預(yù)估是需認(rèn)真對待的環(huán)節(jié).本研究也僅考查了影響有效樣本量的部分因素,在此框架下,值得研究的要素還包括其他設(shè)計(jì)策略(如效率設(shè)計(jì))和選項(xiàng)數(shù)量.此外,要素影響有效樣本量的機(jī)制、模型是否還有其他更加貼切的形式,也值得深入探索,畢竟本研究模型還原實(shí)際樣本量的準(zhǔn)確度不高,其中有隨機(jī)過程的影響.