劉仲琦 郝 春△ 顧 菁 郝元濤
離散選擇試驗(yàn)(discrete choice experiment,DCE)是基于經(jīng)濟(jì)學(xué)的需求理論和效用理論進(jìn)行研究的,最初應(yīng)用于經(jīng)濟(jì)學(xué)、市場營銷領(lǐng)域,近十幾年被越來越多地應(yīng)用到衛(wèi)生領(lǐng)域。DCE在衛(wèi)生領(lǐng)域中的應(yīng)用主要有兩方面,一是在衛(wèi)生人力政策研究中的應(yīng)用,主要用于測量衛(wèi)生服務(wù)人員的工作意愿[1-3]。如國內(nèi)有研究者運(yùn)用DCE研究鄉(xiāng)鎮(zhèn)衛(wèi)生院護(hù)理人員的工作偏好,發(fā)現(xiàn)月收入、繼續(xù)教育機(jī)會和住房是影響護(hù)理人員工作意愿的前三位因素[1]。二是在衛(wèi)生服務(wù)利用的研究中,應(yīng)用離散選擇實(shí)驗(yàn)的方法研究目標(biāo)人群對某項(xiàng)衛(wèi)生服務(wù)的使用偏好或需求。如利用DCE研究人們對于大腸癌篩查的意愿偏好[4]或用于研究居民對服務(wù)提供者的選擇偏好[5]、疫苗接種偏好及需求等[6-7]。
DCE假設(shè)某項(xiàng)商品或服務(wù)可以由幾個(gè)特性(如月收入、工作負(fù)荷等)進(jìn)行描述,每個(gè)特性可以定義不同的水平(如報(bào)銷比例的水平可為30%、60%、90%),根據(jù)幾種特性不同水平的變化,可組合成一系列假設(shè)的選擇集問卷。由受訪者通過對選擇集中的替代方案做出選擇,而這些選擇結(jié)果被假設(shè)為是受訪者經(jīng)過權(quán)衡后,認(rèn)為能對其產(chǎn)生最大效用的選項(xiàng)。通過整理和統(tǒng)計(jì)分析,可以定量分析出服務(wù)或商品的某一特性對受訪者選擇意愿的影響程度,從而體現(xiàn)出受訪者從自身角度出發(fā)的意愿、偏好[8-10]。
與一般常用的單因素和多因素分析研究影響意愿的因素的方法不同,DCE通過設(shè)計(jì)選擇集,模擬一個(gè)合理、直接、近似現(xiàn)實(shí)的決策權(quán)衡過程,從而定量測量受訪者接受服務(wù)前的自述偏好,即從患者自身的角度出發(fā),通過受訪者自身的理解和權(quán)衡其所需的醫(yī)療服務(wù)的效用價(jià)值,以便衛(wèi)生政策制定者與醫(yī)療服務(wù)提供者明確了解“消費(fèi)者”的需求。另一方面,DCE中納入的屬性和水平既可以是實(shí)際存在的,也可以是根據(jù)政策設(shè)想而設(shè)計(jì)的,但傳統(tǒng)的影響因素調(diào)查只能基于現(xiàn)實(shí)條件,說明了DCE能更真實(shí)準(zhǔn)確地反映受訪者的需求和意愿。此外,若屬性中包含有連續(xù)型變量,可以由此測量各個(gè)屬性之間的替代關(guān)系。如個(gè)人愿意為一個(gè)較近的社區(qū)醫(yī)院而多花費(fèi)的價(jià)錢等[6,11]。
DCE的實(shí)施步驟主要包括:(1)確定研究因素及各因素不同水平的設(shè)置。(2)試驗(yàn)設(shè)計(jì),即將不同因素的各個(gè)水平組合成不同的選項(xiàng)方案,然后每兩個(gè)或多個(gè)選項(xiàng)方案組合成一個(gè)選擇集,最終形成有多個(gè)選擇集的選擇試驗(yàn)問卷。(3)數(shù)據(jù)收集整理。(4)數(shù)據(jù)分析與解釋。確定研究因素及各因素不同水平的設(shè)置和試驗(yàn)設(shè)計(jì)是DCE實(shí)施的兩個(gè)關(guān)鍵步驟[3,12]。
本文主要基于SAS 9.4宏程序介紹DCE中試驗(yàn)設(shè)計(jì)步驟的實(shí)現(xiàn)。
確定了研究因素和相應(yīng)的水平后,各個(gè)因素和水平將被整合成不同選項(xiàng)方案。研究者將向研究對象逐一展現(xiàn)這些選項(xiàng),并讓他們從中做出選擇。試驗(yàn)設(shè)計(jì)關(guān)注的內(nèi)容就是如何以統(tǒng)計(jì)學(xué)有效的方式將各個(gè)因素的水平組合成不同的選項(xiàng),并最終形成選擇集[3,11-12]。
總的來說,試驗(yàn)設(shè)計(jì)的方法可以分為完全因子設(shè)計(jì)和部分因子設(shè)計(jì)。完全因子設(shè)計(jì)包含各個(gè)因素所有水平的組合,它的優(yōu)點(diǎn)是可以估計(jì)所有因子的主效應(yīng)、兩兩交互效應(yīng)、以及更高階的交互效應(yīng)。但是,在實(shí)際研究中,完全因子設(shè)計(jì)會產(chǎn)生大量的選項(xiàng)。因此,實(shí)際應(yīng)用中通常只選擇所有可能組合的一部分進(jìn)行試驗(yàn),即部分因子設(shè)計(jì)[11]。
部分因子設(shè)計(jì)(factional factorial design)是指從完全因子設(shè)計(jì)中挑選一部分組合來進(jìn)行數(shù)據(jù)收集。而僅取一部分的代價(jià)是,在部分因子設(shè)計(jì)中,一些效應(yīng)會被混雜。例如,在市場研究中,最常用的是分辨度Ⅲ的部分因子設(shè)計(jì),在該設(shè)計(jì)中,各個(gè)主效應(yīng)不與任何其他主效應(yīng)混雜,但是可能與二因子交互作用混雜。在部分因子設(shè)計(jì)中,最常用的是正交設(shè)計(jì)和D-optimal設(shè)計(jì)[11,13-14]。
正交設(shè)計(jì)是在早年的DCE研究中應(yīng)用較多的一類部分因子設(shè)計(jì)。它是基于正交表設(shè)計(jì)的,具有正交、平衡的性質(zhì)。正交性是指兩因素之間相關(guān)性較低或?yàn)榱?表現(xiàn)為任意兩個(gè)因素的所有水平對在整個(gè)試驗(yàn)設(shè)計(jì)中出現(xiàn)的次數(shù)相等或者成比例。平衡是指每個(gè)因素的各個(gè)水平在整個(gè)試驗(yàn)設(shè)計(jì)中出現(xiàn)的次數(shù)相同,例如,假設(shè)有一個(gè)2水平的因素A,在正交設(shè)計(jì)中,兩個(gè)水平出現(xiàn)的次數(shù)各為50%。一個(gè)4水平的因素B,它的4個(gè)水平在正交設(shè)計(jì)出現(xiàn)的次數(shù)各為25%。Huber和Zwerina提出,一個(gè)好的試驗(yàn)設(shè)計(jì)除了要具備正交、水平平衡的性質(zhì)外,還要做到最小重疊,即在每個(gè)選擇集內(nèi)因素水平重復(fù)的概率要盡可能小[15]。
但近年來,從統(tǒng)計(jì)學(xué)角度出發(fā)研究的更有效的試驗(yàn)設(shè)計(jì)得到發(fā)展[11]。這一類的設(shè)計(jì)稱為D-optimal設(shè)計(jì)。這類設(shè)計(jì)的目的是犧牲一定的正交性,使得自變量的協(xié)方差矩陣的行列式最小化,即通過參數(shù)的標(biāo)準(zhǔn)誤最小化來確保參數(shù)估計(jì)值的變異最小化,從而使得模型的參數(shù)估計(jì)精確度更高[11,15-16]。假設(shè)在一個(gè)試驗(yàn)中有i個(gè)因素,x1,…,xi,則y與各因素間的關(guān)系可以表示為y=β1g1(x1,…,xi)+…+βmgm(x1,…,xi)+ε
SAS 9.2以上的版本可以使用宏程序?qū)崿F(xiàn)DCE的試驗(yàn)設(shè)計(jì),最常用到的宏程序之一是%ChoicEff。這個(gè)程序可以為選擇試驗(yàn)尋找有效的試驗(yàn)設(shè)計(jì),并可對設(shè)計(jì)進(jìn)行評價(jià)。%ChoicEff采用調(diào)整的Fedorov備選集尋找算法。首先向宏程序提供一個(gè)完全因子設(shè)計(jì)或部分因子設(shè)計(jì)或從%MktEx宏程序產(chǎn)生的正交設(shè)計(jì)作為備選集。然后%ChoicEff宏將從備選集中隨機(jī)構(gòu)建一個(gè)初始設(shè)計(jì)(也可指定初始設(shè)計(jì))。接著程序會用備選集中的每個(gè)方案去替換初始集中的每個(gè)方案,只有能夠提高試驗(yàn)設(shè)計(jì)效率的交換才會被執(zhí)行。這個(gè)過程會持續(xù)直到設(shè)計(jì)功效穩(wěn)定在最大值,最后輸出最優(yōu)設(shè)計(jì)[16]。試驗(yàn)設(shè)計(jì)的效率通常用D-efficiency和相對D-efficiency來衡量。D-efficiency是信息矩陣的逆陣的行列式的幾何均值,其值會隨設(shè)計(jì)過程中對因素水平的編碼方式不同而不同。因此,有相對D-efficiency這一指標(biāo)。相對D-efficiency為兩種設(shè)計(jì)方案的D-efficiency的比值,用以比較兩種試驗(yàn)設(shè)計(jì)方案。也有部分文獻(xiàn)直接將D-efficiency定義為兩個(gè)設(shè)計(jì)的信息矩陣的行列式之比[17]。
本文采用WHO的DCE應(yīng)用指導(dǎo)書中的例子,來展示利用SAS宏程序?qū)崿F(xiàn)選擇試驗(yàn)中試驗(yàn)設(shè)計(jì)步驟。
該例子是在坦桑尼亞進(jìn)行的關(guān)于衛(wèi)生人力資源的研究。坦桑尼亞在實(shí)現(xiàn)向大部分人口提供關(guān)鍵衛(wèi)生服務(wù)這一目標(biāo)時(shí),所面臨的嚴(yán)重問題是衛(wèi)生人員的地域分布不平衡。為此,設(shè)計(jì)DCE的研究目的是:(1)探索臨床工作人員在工作選擇時(shí)工作的不同屬性的影響。(2)探索受訪者在這些屬性之間的權(quán)衡,即“受訪者愿意放棄多少薪水來獲得其他因素的改進(jìn)?”。希望以此為政策制定者提供有價(jià)值的信息,考慮不同的激勵措施,為農(nóng)村偏遠(yuǎn)地區(qū)招募更多衛(wèi)生工作者。經(jīng)過前期的文獻(xiàn)綜述和對臨床學(xué)生進(jìn)行半結(jié)構(gòu)化深入訪談,最終確定了7個(gè)納入研究因素,其中3個(gè)4水平因素,4個(gè)2水平因素[11]。如表1所示。
表1 坦桑尼亞研究中的因素和其水平
根據(jù)所確定的因素與水平,如果實(shí)施完全因子設(shè)計(jì),將產(chǎn)生43×24=1024個(gè)可能的工作組合。若將這些組合兩兩配對成一個(gè)選擇集,則將產(chǎn)生(1024×1023)/2=523776個(gè)選擇集。因此,我們采用部分因子設(shè)計(jì),利用%ChoicEff宏程序來創(chuàng)建一個(gè)含16個(gè)選擇集,每個(gè)選擇集里有2個(gè)備選方案的選擇設(shè)計(jì)。
首先,%MktRuns宏會輸出建議備選集的大小:
%mktruns(4 4 4 2 2 2 2),/*一個(gè)替代方案的因素水平列表*/
其結(jié)果顯示如圖1。
Design SummaryNumber of Levels Frequency2 4 4 3Saturated = 14Full Factorial = 1,024Some Reasonable Cannot BeDesign Sizes Violations Divided By16*032*02431620158 1628158 1614 S244 8 1618244 8 1622244 8 1626244 8 1630244 8 16*-100% Efficient design can be made with the MktEx macro.S-Saturated Design-The smallest design that can be made.
圖1%MktRuns宏程序運(yùn)行結(jié)果
結(jié)果報(bào)告飽和的設(shè)計(jì)只需要14次運(yùn)行(一次運(yùn)行即一個(gè)因素水平的組合,也就是一個(gè)選項(xiàng)方案),而16次和32次運(yùn)行是可以產(chǎn)生最優(yōu)設(shè)計(jì)的運(yùn)行次數(shù)。我們也可以選擇128、256甚至完整的1024次,這樣可以給宏程序更大的自由度去找到一個(gè)好的設(shè)計(jì)。
然后,通過%MktEx創(chuàng)建一個(gè)備選集合:
%mktex(4 4 4 2 2 2 2,/*一個(gè)替代方案的因素水平列表*/
n=1024)/*備選方案的數(shù)量*/
接下來,通過%ChoicEff搜索備選集并創(chuàng)建有效的設(shè)計(jì)。
%choiceff(data=design,
model=class(x1-x7 / sta),/* 用standardized orthogonal contrast coding擬合模型*/
nsets=16,/*選擇集的數(shù)量*/
maxiter=100,/* 迭代次數(shù) */
seed=145,/* 隨機(jī)數(shù)種子 */
flags=2,/* 每個(gè)選擇集里有2個(gè)備選方案 */
options=relative,/* 顯示relative D-efficiency */
beta=zero)/* 假定beta,Ho:b=0 */
model=class(x1-x7 / sta)選項(xiàng)指定了分析時(shí)考慮的最常用的模型。這是一個(gè)標(biāo)準(zhǔn)正交對比編碼下的主效應(yīng)模型。如果想看到一個(gè)在0~100之間的相對D-efficiency,就要使用該編碼方式。maxiter=100選項(xiàng)是要求做基于100個(gè)隨機(jī)初始設(shè)計(jì)的100個(gè)設(shè)計(jì)(該選項(xiàng)的默認(rèn)值是maxiter=2)。
最終輸出的設(shè)計(jì)來自第28次迭代的結(jié)果,相對D-efficiency為73.40。程序運(yùn)行的部分結(jié)果如圖2所示。
Final ResultsDesign28Choice Sets16Alternatives2Parameters13Maximum Parame-ters16D-Efficiency11.7439Relative D-Eff73.3993D-Error0.08521/Choice Sets0.0625
圖2%ChoicEff宏程序運(yùn)行部分結(jié)果
將變量水平對應(yīng)具體的意義,則最終的選擇集如表2所示??紤]版面原因,僅顯示前2個(gè)選擇集。檢驗(yàn)這16個(gè)選擇集的設(shè)計(jì)的正交性、水平平衡,結(jié)果如表3所示。表3所示,各因素間相關(guān)系數(shù)都很小,且沒有統(tǒng)計(jì)學(xué)意義。至于水平平衡的性質(zhì),月薪等4水平因素的每個(gè)水平應(yīng)占25%,其他2水平因素的每個(gè)水平應(yīng)各占50%,通過簡單計(jì)數(shù)可發(fā)現(xiàn)該設(shè)計(jì)的水平平衡雖然不是完美,但也較平衡(見表4)。
表2 最終的部分選擇集(顯示前2個(gè))
表3 相關(guān)系數(shù)矩陣
表4 部分因素各水平的頻率分布表
以往在DCE試驗(yàn)設(shè)計(jì)中最常用的方法是先通過電腦軟件獲得一個(gè)正交的主效應(yīng)設(shè)計(jì)(orthogonal main effect plans,OMEP),然后將產(chǎn)生的方案隨機(jī)配對成若干選擇。而本文介紹了基于SAS 9.4的宏程序進(jìn)行D-optimal試驗(yàn)。在這個(gè)方法中,正交性和水平平衡不是最重要的考量,我們更多地關(guān)注設(shè)計(jì)的功效,通過D評分來衡量。D-efficiency可以分為絕對D-efficiency和相對D-efficiency。具體在設(shè)計(jì)中采用的編碼方式不同會使得絕對的D-efficiency 值發(fā)生變化,而相對D-efficiency 是設(shè)計(jì)與設(shè)計(jì)間D-efficiency的比值,因此不隨編碼方式發(fā)生變化。大多數(shù)軟件包中都默認(rèn)給出相對D-efficiency,這對于大多數(shù)研究者來說已經(jīng)足夠了。由于對最佳設(shè)計(jì)的功效分值沒有一個(gè)確切的閾值,因此在評價(jià)一個(gè)設(shè)計(jì)的好壞時(shí),研究者應(yīng)該結(jié)合相對D-efficiency和其他試驗(yàn)設(shè)計(jì)的標(biāo)準(zhǔn)[16]。
本文介紹的利用SAS的宏程序?qū)崿F(xiàn)離散選擇試驗(yàn)的設(shè)計(jì),只是其中一種方法。其他實(shí)現(xiàn)DCE試驗(yàn)設(shè)計(jì)的方法還包括:人工計(jì)算構(gòu)建試驗(yàn)設(shè)計(jì)、R語言程序包、Sawtooth軟件包、Ngene軟件包等可供研究者選擇[11,18]。