分類精確性指數(shù)Entropy在潛剖面分析中的表現(xiàn)：一項(xiàng)蒙特卡羅模擬研究*

2017-02-01 00:00:16王孟成鄧俏文畢向陽(yáng)葉浩生楊文登

心理學(xué)報(bào) 2017年11期

王孟成鄧俏文畢向陽(yáng) 葉浩生楊文登

(1廣州大學(xué)心理系; 2廣州大學(xué)心理測(cè)量與潛變量建模研究中心; 3廣東省未成年人心理健康與教育認(rèn)知神經(jīng)科學(xué)實(shí)驗(yàn)室,廣州 510006) (4中國(guó)政法大學(xué)社會(huì)學(xué)院, 北京 102249)

1 引言

以結(jié)構(gòu)方程模型為代表的潛變量建模方法在心理學(xué)和社會(huì)科學(xué)各領(lǐng)域得到了廣泛的應(yīng)用(侯杰泰, 溫忠麟, 成子娟, 2004; 王孟成, 2014)。然而在傳統(tǒng)的結(jié)構(gòu)方程模型中, 研究的樣本通常假設(shè)來(lái)自同質(zhì)性(Homogeneity)群體, 但這一假設(shè)在很多情況下并不成立。不同質(zhì)群體的結(jié)構(gòu)方程建?？梢允褂枚嘟M分析(Multiple-Group Analysis)或多指標(biāo)多因模型(MIMIC) (侯杰泰等, 2004)。不過(guò)這種處理的前提是存在明確的分組變量, 最多見(jiàn)的分組變量如性別、種族和宗教信仰等。但更多時(shí)候, 往往很難找到客觀的外顯分組變量, 最常見(jiàn)的例子就是心理疾病的診斷(e.g., Helzer, Kraemer, & Krueger, 2006;Widiger & Samuel, 2005; Zachar & Kendler, 2007)。目前的心理疾病診斷通常以患者滿足某種疾病最低的癥狀數(shù)目為確診依據(jù)即采用類型(Categorical)標(biāo)準(zhǔn)將個(gè)體分為異常和正常。然而實(shí)證研究的結(jié)果通常并不支持這種診斷劃分(e.g., Widiger, Livesley,& Clark, 2009), 即心理疾病不是有或無(wú)的類別。在不存在明確的分組變量的情況下, 不同質(zhì)群體(即異質(zhì)群體)的劃分是隱蔽的、潛在的, 因此需要通過(guò)基于模型的方法對(duì)潛在分組進(jìn)行估計(jì)。

在統(tǒng)計(jì)學(xué)上, 為了處理潛在分組問(wèn)題, 研究者提出了多種統(tǒng)計(jì)模型, 比如Taxometric分析法(Meehl,1995; Ruscio, Haslam, & Ruscio, 2006)和潛類別/潛剖面分析(McLachlan & Peel, 2000)。由于Taxometric方法在處理存在兩個(gè)以上的潛在群體方面存在很大的局限性(Lubke & Miller, 2015; Lubke & Tueller,2010), 潛類別/潛剖面分析是目前將人群分成不同潛在組最流行的方法(McClintock, Dale, Laumann,& Waite, 2016; Mokros et al., 2015; 王孟成, 畢向陽(yáng), 葉浩生, 2014)。

潛類別分析(Latent Class Analysis, LCA)或潛類別模型(Latent Class Model, LCM)是通過(guò)個(gè)體在觀測(cè)變量上的反應(yīng)模式將其劃分成不同的潛類別組, 與聚類分析在功能上類似, 只是LCA是基于模型的聚類方法, 因此也稱作潛聚類分析(latent cluster analysis)。潛類別模型主要處理分類的觀測(cè)變量, 如果觀測(cè)變量是連續(xù)指標(biāo)時(shí)則稱作潛剖面分析(Latent Profile Analysis, LPA)。近年來(lái)LPA/LCA在心理學(xué)、預(yù)防醫(yī)學(xué)、精神病學(xué)、市場(chǎng)營(yíng)銷、組織管理等諸多領(lǐng)域逐漸流行(e.g., Carragher, Adamson,Bunting, & McCann, 2009; Lanza, Rhoades, Greenberg,Cox, & The Family Life Project Key Investigators,2011; McClintock et al., 2016; Wang & Hanges, 2011;張潔婷, 焦璨, 張敏強(qiáng), 2010)。例如, Carragher等(2009)在12,180個(gè)全美代表性樣本中應(yīng)用潛類別分析將抑郁癥狀劃分成4個(gè)類別：嚴(yán)重抑郁組(Severely Depressed, 40.9%)、軀體癥狀組(Psychosomatic,30.6%)、認(rèn)知情感組(Cognitive-Emotional, 10.2%)和健康組(Non-depressed, 18.3%)。

LPA/LCA作為潛在分組的統(tǒng)計(jì)方法其分類精確性是應(yīng)用研究者關(guān)注的焦點(diǎn), 目前絕大多數(shù)LPA/LCA均報(bào)告分類精確性指標(biāo)(e.g., McClintock et al., 2016; Pastor, Barron, Miller, & Davis, 2007;Vannucci, Tanofsky-Kraff, Crosby et al., 2013), 因此深入分析分類精確性在不同條件下的表現(xiàn)將是評(píng)價(jià) LPA/LCA作為潛分類分析法有效性和適切性的重要議題, 同時(shí)也將為實(shí)際使用者提供應(yīng)用參考。由于心理學(xué)研究中的變量通常為連續(xù)型變量, 所以本研究主要考察潛剖面分析的分類精確性。

1.1 潛剖面分析

潛剖面分析通過(guò)類別的潛變量即潛在剖面變量來(lái)解釋連續(xù)外顯指標(biāo)間的關(guān)聯(lián), 使外顯指標(biāo)間的關(guān)聯(lián)通過(guò)潛在類別變量來(lái)估計(jì), 進(jìn)而維持其局部獨(dú)立性的統(tǒng)計(jì)方法。連續(xù)指標(biāo)的方差被分解為類別/剖面間和類別/剖面內(nèi)方差。例如, 第

個(gè)剖面的第

個(gè)指標(biāo)的方差可以分解為(Lazarsfeld & Henry,1968)：

1.2 分類精確性指標(biāo)及其影響因素

1.2.1 分類精確性指標(biāo)Entropy

LPA/LCA作為潛在聚類的分析方法, 其分類精確性是考查建模有效性的重要指標(biāo), 也是研究的主要興趣。例如, 在臨床診斷上, 根據(jù)LPA/LCA的結(jié)果將不同患者歸入不同的臨床分組, 分類的精確性將會(huì)影響診斷的有效性。在LPA/LCA模型中, 通常使用 Entropy作為分類精確性的指標(biāo), 取值范圍在0～1之間, 越接近1表明分類越精確。其計(jì)算公式如下：

其中,

為估計(jì)第

個(gè)個(gè)體屬于第

個(gè)類別的后驗(yàn)概率,

為樣本量。

可通過(guò)如下貝葉斯后驗(yàn)概率獲得：

與精確性對(duì)應(yīng)的是分類錯(cuò)誤率(Asparouhov &Muthén, 2014)。假設(shè)

是基于模型估計(jì)的類別潛變量, 與實(shí)際的類別潛變量

并不完全一致(完全一致時(shí)不存在分類誤差), 因此存在如下分類不確定率：

c是根據(jù)

將個(gè)體分配到

的數(shù)量。

1.2.2 Entropy指數(shù)的變式

由于Entropy容易受剖面間類別距離和剖面內(nèi)方差的影響(e.g., Lubke & Muthén, 2007; Muthén,2004), 文獻(xiàn)中還提出了三種基于Entropy指數(shù)的變式, 分別為規(guī)范化Entropy指數(shù)(Normalized Entropy Criterion, NEC; Celeux & Soromenho, 1996)、分類似然指數(shù)(Classification Likelihood Criterion, CLC;Biernacki & Govaert, 1997)和綜合似然指數(shù)(Integrated Completed Likelihood Criterion, ICL-BIC; Biernacki,Celeux, & Govaert, 2000)。由于本研究不考慮總體同質(zhì)(潛類別數(shù)

= 1)的情況, 所以我們不考慮納入NEC作為評(píng)價(jià)分類精確性的指標(biāo)。CLC和ICL_BIC的公式分別如下：

樣本校正的ICL_BIC, SaICL_BIC的公式如下：

上述公式中的

為模型估計(jì)的參數(shù)量,

為對(duì)數(shù)似然統(tǒng)計(jì)量,

為樣本量。

1.2.3 Entropy的影響因素

Entropy作為分類精確性的標(biāo)準(zhǔn)化衡量指數(shù),凡是影響潛類別分類精確性的因素均會(huì)對(duì)其產(chǎn)生影響, 其中最重要的影響因素是潛類別間距(Latent Class Separation)和類別內(nèi)方差(e.g., Lubke & Muthén,2007; Muthén, 2004)。

潛類別間距是指潛類別間差異的大小, 反映在項(xiàng)目反應(yīng)概率或均值上, 表現(xiàn)為不同類別個(gè)體間在所有觀測(cè)指標(biāo)上存在顯著的差別(Collins & Lanza,2009)。潛類別間距越大, 對(duì)于來(lái)自任一潛類別的個(gè)體來(lái)說(shuō), 將其劃分到所屬類別的精確性越高。如果兩個(gè)類別間的差異不明顯, 即潛類別間距小, 將個(gè)體精確地劃分到所屬類別就越困難。因此, 潛類別間距的大小是影響分類精確性的重要因素, 也是影響潛類別個(gè)數(shù)保留的重要變量(Lubke & Neale, 2006)。

對(duì)分類精確性有影響的另一個(gè)因素是類別內(nèi)方差。在潛類別間距相同的情況下, 特定類別分布的方差越大, 兩個(gè)分布之間重疊的部分越大, 將個(gè)體劃分到特定類別組就越困難。類別分布的方差越小, 兩個(gè)分布之間重疊的部分越小, 將個(gè)體劃分到特定類別組就越容易。由于在此模擬研究中, 通過(guò)固定方差法來(lái)統(tǒng)一潛變量的單位, 所以本研究不考查類別內(nèi)方差對(duì)分類精確性的影響。

1.3 先前研究的不足與本研究目的

盡管Entropy是衡量分類精確性最常用的指標(biāo),然而令人遺憾地是, 在方法學(xué)文獻(xiàn)中考查該指數(shù)表現(xiàn)的研究非常少。據(jù)我們所知當(dāng)前僅有一項(xiàng)研究考查了Entropy與分類精確性的關(guān)系(Lubke & Muthén,2007), 其他研究只考查Entropy作為確定潛類別數(shù)目的評(píng)價(jià)指標(biāo)時(shí)的表現(xiàn)(e.g., Peugh & Fan, 2013;Tein, Coxe, & Cham, 2013)。

Lubke和 Muthén (2007)的模擬研究在考查樣本量、潛類別間距、協(xié)變量和模型復(fù)雜性等因素對(duì)因子混合模型(factor mixture model)的參數(shù)估計(jì)和分類精確性的影響時(shí), 發(fā)現(xiàn)當(dāng)Entropy < 0.60時(shí)相當(dāng)于超過(guò)20%的個(gè)體存在分類錯(cuò)誤; Entropy≥0.80表明分類準(zhǔn)確率超過(guò)90%。這一結(jié)果是否能推廣到研究設(shè)定因素之外的情況呢？另外, 在他們的研究中還存在如下幾個(gè)方面的不足。首先, 該研究考查的樣本量范圍有限, 僅考查了

= 300時(shí)的情況。在本研究之前的預(yù)實(shí)驗(yàn)中, 我們發(fā)現(xiàn)樣本量與Entropy呈負(fù)相關(guān), 即樣本量越大 Entropy值越小,所以擴(kuò)大樣本量范圍對(duì)全面了解Entropy的表現(xiàn)具有重要意義。另外, 她們的研究只考查了存在2個(gè)潛在類別組即

= 2的情況, 然而在實(shí)際研究中,潛類別數(shù)量通常多于2個(gè)。最后, 上述關(guān)于Entropy的臨界值是在考慮協(xié)變量的情況下獲得的, 在很多應(yīng)用研究中并未涉及協(xié)變量, 所以在其他條件下這些值是否適用有待進(jìn)一步分析。

最近, Peugh和 Fan (2013)的模擬研究考查了Entropy及其三種變式(CLC、NEC、ICL_BIC)在確定潛剖面類別個(gè)數(shù)中的表現(xiàn), 但沒(méi)有考查這些指數(shù)與分類精確性的關(guān)系。本研究將在上述兩個(gè)研究的基礎(chǔ)上, 進(jìn)一步考察 Entropy及相關(guān)變式在不同樣本量、潛類別數(shù)目、類別距離和指標(biāo)個(gè)數(shù)等因素在不同水平組合條件下的表現(xiàn)。

2 模擬研究

2.1 模擬設(shè)計(jì)

(1) 樣本量

樣本量是多變量模型考慮的重要因素之一。在先前針對(duì) LPA/LCA的模擬研究中, 樣本量主要集中在100～3000的范圍內(nèi)(e.g., Nylund, Asparouhov,& Muthén, 2007; Peugh & Fan, 2013; Tein et al.,2013; Yang, 2006)?？紤]到考查更小樣本量的重要性(Paxton, Curran, Bollen, Kirby, & Chen, 2001), 特別是臨床應(yīng)用研究(Kyriakopoulos et al., 2015)的樣本量通常不大; 同時(shí)為了更全面揭示樣本量對(duì)分類精確性的影響(Lubke & Muthén, 2007), 本研究主要考查以下5個(gè)樣本量：50, 100, 500, 1000, 3000。

(2) 類別距離

類別距離是影響分類精確性最重要的因素, 馬氏距離(Mahalanobis Distance, MD)常被用來(lái)衡量潛類別間的距離。MD測(cè)量?jī)蓚€(gè)隨機(jī)向量

(

,…,

)和

(

,…,

)之間的距離, 其中

與

有著相同的分布和協(xié)方差矩陣

。與之前的相關(guān)研究一致(e.g., Lubke & Muthén, 2007; Peugh & Fan, 2013),本研究采用馬氏距離來(lái)衡量潛類別間的距離, 公式如下(

表示元素或變量個(gè)數(shù))：

本研究選擇了 3個(gè)水平的類別距離, 分別為0.5、1.2和 3, 涵蓋了從小到較大的類別距離范圍(Lubke & Neale, 2006; Peugh & Fan, 2013)。正態(tài)分布的方差固定為 1, 具體的指標(biāo)均值和馬氏距離的關(guān)系呈現(xiàn)在表1中。其中, 類別數(shù)為3時(shí)對(duì)應(yīng)的馬氏距離的均值等于類別數(shù)為5時(shí)對(duì)應(yīng)的馬氏距離的潛類別1-3的均值。

(3) 指標(biāo)數(shù)

(4) 類別數(shù)目

另外一個(gè)考慮的變量是類別數(shù)。在模擬研究中,研究 3個(gè)潛類別數(shù)的情況比較多(e.g., Lubke &Neale, 2006; Peugh & Fan, 2013; Tein et al., 2013;Tofighi & Enders, 2008)。另外, 在多數(shù)應(yīng)用研究中通常發(fā)現(xiàn)3～5個(gè)潛在類別或剖面(e.g., Pastor et al.,2007; Vannucci et al., 2013; Wade, Crosby, & Martin,2006), 所以本研究考慮3和5個(gè)類別的情況。

2.2 研究假設(shè)

本研究主要通過(guò)蒙特卡洛模擬(Monte Carlo simulation, MC)來(lái)考查分類精確性指標(biāo)Entropy受上述因素及其組合影響的情況; 另外我們想通過(guò)模擬上述條件下的 Entropy值, 為應(yīng)用研究者提供合理的臨界值。基于以上文獻(xiàn)回顧, 我們提出如下研究假設(shè)：首先, 由于 Entropy是衡量分類精確性的指標(biāo), 所以 Entropy應(yīng)該與分類精確率之間具有強(qiáng)的正相關(guān)(Lubke & Muthén, 2007)。其次, 我們希望通過(guò)此研究驗(yàn)證Lubke和Muthén (2007)的發(fā)現(xiàn), 即Entropy < 0.60時(shí)相當(dāng)于超過(guò)20%的個(gè)體存在分類錯(cuò)誤; Entropy≥0.80表明分類準(zhǔn)確率超過(guò)90%。第三, 在預(yù)實(shí)驗(yàn)中, 我們發(fā)現(xiàn) Entropy隨樣本量的增加而減小, 在此研究中, 我們預(yù)計(jì)會(huì)出現(xiàn)同樣的結(jié)果。最后, 基于其他混合模型(Mixture model)的研究結(jié)果(e.g., Lubke & Neale, 2006; Tein et al., 2013;Wurpts & Geiser, 2014), 本研究還假設(shè)指標(biāo)數(shù)和類別距離對(duì)分類精確性有正向的影響作用。

2.3 數(shù)據(jù)生成與分析

本研究包含以下 120種組合：5個(gè)樣本量(50,100, 500, 1000, 3000)′3 類別距離(0.5, 1.2, 3)′4 指標(biāo)數(shù)(4, 8, 12, 20)′2潛類別數(shù)(3, 5)?？傮w參數(shù)的設(shè)定情況為：類別內(nèi)指標(biāo)之間不相關(guān); 指標(biāo)正態(tài)分布方差為 1, 均值由對(duì)應(yīng)的馬氏距離決定(如表 1所示)。分析模型的統(tǒng)計(jì)量與總體參數(shù)一致, 即擬合的是真模型。由于本研究的目的并非檢驗(yàn)?zāi)骋粎?shù)估計(jì)的統(tǒng)計(jì)功效問(wèn)題, 受重復(fù)次數(shù)影響較大的參數(shù)覆蓋率并非此次研究的焦點(diǎn)(Kim, 2012), 所以參考前人模擬研究中的重復(fù)次數(shù)(e.g., Lubke & Neale,2006; Tein et al., 2013), 我們將每種組合設(shè)定為重復(fù)100次。本研究中所有數(shù)據(jù)的生成與分析均采用M

plus

7.4 實(shí)現(xiàn)(Muthén & Muthén, 1998–2015)。

表1 馬氏距離(MD)與指標(biāo)均值(指標(biāo)數(shù)=4)

圖1 k=3指標(biāo)數(shù)=4 (左圖)和指標(biāo)數(shù)=20 (右圖)時(shí)Entropy和分類錯(cuò)誤率隨類別距離(MD)和樣本量的變化情況(兩圖的圖例相同)

圖2 k=5指標(biāo)數(shù)=4 (左圖)和指標(biāo)數(shù)=20 (右圖)時(shí)Entropy和分類錯(cuò)誤率隨類別距離(MD)和樣本量的變化情況(兩圖的圖例相同)

2.4 評(píng)價(jià)指標(biāo)

本研究的評(píng)價(jià)指標(biāo)主要有：Entropy及其變式、分類精確率和分類錯(cuò)誤率(Asparouhov & Muthén,2014)。Entropy通過(guò)M

plus

直接輸出獲得。分類精確率是通過(guò)對(duì)每個(gè)類別的平均后驗(yàn)概率值求和再除以類別數(shù)得到, 具體做法是通過(guò)平均類別概率矩陣中的斜對(duì)角線上的分類確定性概率值獲得。另外,通過(guò)平均所有

值獲得分類錯(cuò)誤率。

3 結(jié)果

研究發(fā)現(xiàn), Entropy與3個(gè)類別模型的分類精確率相關(guān)系數(shù)為0.94, 與5個(gè)類別模型的分類精確率相關(guān)系數(shù)為0.95 (

s < 0.001)。類別數(shù)為3時(shí), Entropy< 0.64相當(dāng)于超過(guò)20%的個(gè)體存在分類錯(cuò)誤; Entropy≥ 0.76表明分類準(zhǔn)確率超過(guò)90%。類別數(shù)為5時(shí),Entropy < 0.68相當(dāng)于超過(guò)30%的個(gè)體存在分類錯(cuò)誤; Entropy > 0.84表明分類準(zhǔn)確率超過(guò)90%。當(dāng)類別數(shù)為3指標(biāo)數(shù)相同時(shí), Entropy與樣本量的關(guān)系, 雖然不是單調(diào)遞減的形式, 但總體呈下降趨勢(shì), 分類錯(cuò)誤率隨樣本量的增大總體呈上升趨勢(shì)。當(dāng)類別距離達(dá)到3時(shí), Entropy明顯高于其他類別距離下的結(jié)果, 分類錯(cuò)誤率明顯小于其他類別距離下的結(jié)果(以4和20個(gè)指標(biāo)為例, 見(jiàn)圖1)。隨樣本量的增大, 大類別距離的優(yōu)勢(shì)更加明顯。多指標(biāo)數(shù)的情況下, 大樣本量更容易體現(xiàn)類別距離對(duì)Entropy和分類錯(cuò)誤率的影響。類別數(shù)為5的模擬中呈現(xiàn)同樣的結(jié)果(見(jiàn)圖 2)。小樣本的情況下(

=50～100), Entropy總體上隨指標(biāo)數(shù)的增多而增大,逐漸接近1, 分類錯(cuò)誤率逐漸接近0 (見(jiàn)表2)。

整體來(lái)說(shuō), 在各種條件下CLC、ICL_BIC與樣本校正的ICL_BIC變化趨勢(shì)一致, 都隨著樣本量的增大而增大, 且類別距離越大, CLC、ICL_BIC與樣本校正的ICL_BIC值越大, 但跨類別距離之間的差異沒(méi)有Entropy明顯(以類別數(shù) = 3指標(biāo)數(shù)為4和類別數(shù) = 5指標(biāo)數(shù) = 20的CLC為例, 見(jiàn)圖3和圖4)。隨著指標(biāo)數(shù)的增多, CLC、ICL_BIC與樣本校正的ICL_BIC之間變化的差異越來(lái)越小。

4 討論

近年來(lái) LPA/LCA在心理學(xué)等社會(huì)科學(xué)領(lǐng)域逐漸流行, 研究者通常選擇報(bào)告 Entropy作為分類精確性的衡量指標(biāo), 然而在方法學(xué)文獻(xiàn)中, 缺少考察Entropy在不同條件下表現(xiàn)的研究, 因此有必要探明 Entropy在不同條件下的表現(xiàn)。據(jù)此, 本研究系統(tǒng)考察了樣本量、類別距離、指標(biāo)數(shù)和類別數(shù)對(duì)Entropy及相關(guān)指數(shù)影響的情況。

表2 不同樣本量和類別數(shù)目下Entropy值及對(duì)應(yīng)錯(cuò)誤率

圖3 k=3指標(biāo)數(shù)=4 CLC隨樣本量和類別距離的變化情況

圖4 k=5指標(biāo)數(shù)=20 CLC隨樣本量和類別距離的變化情況

4.1 樣本量和指標(biāo)數(shù)對(duì)Entropy的影響

正如我們預(yù)實(shí)驗(yàn)發(fā)現(xiàn)的那樣, 樣本量越大, 分類精確性越差。盡管Tein及其同事(2013)主要研究在什么條件下以及采用什么樣的評(píng)價(jià)指標(biāo)有利于正確選擇潛剖面模型的類別數(shù), 但從他們擬合真模型(

= 5)的結(jié)果可以發(fā)現(xiàn), 樣本量越大(

= 250,500, 1000), Entropy的值越小。Lubke和Neale (2006)的研究中也發(fā)現(xiàn)大樣本量的情況下, 更傾向于高估類別數(shù)。在 Lubke和 Muthén (2007)的研究中沒(méi)有直接考查 LPA模型中指標(biāo)數(shù)的變化對(duì)分類精確性影響的情況。盡管有研究發(fā)現(xiàn)指標(biāo)數(shù)越多(指標(biāo)數(shù) = 6,10, 15), Entropy的結(jié)果越好(

= 250, 500, 1000;Tein et al., 2013), 但本研究發(fā)現(xiàn)這一規(guī)律只適用于小樣本的情況(

= 50～100)。隨著樣本量的增大, 先是8個(gè)指標(biāo)數(shù)的情況出現(xiàn)與這一結(jié)果的不一致現(xiàn)象,然后到 12個(gè)指標(biāo)的組合情況。即中等以上的樣本(在本研究中為

≥ 500)與指標(biāo)數(shù)交互影響分類精確性的表現(xiàn), 所以不能忽略樣本量的影響而單純通過(guò)增多指標(biāo)數(shù)來(lái)獲得好的分類精確性。

4.2 類別距離對(duì)Entropy的影響

類別距離是對(duì)模型分類精確性影響最大的因素(Lubke & Muthén, 2007; Lubke & Neale, 2006)。Lubke 和 Muthén (2007)發(fā)現(xiàn), 較大的類別距離(MD= 1 vs. 1.5)可以得到更高的Entropy。Tein等(2013)也發(fā)現(xiàn)類似的結(jié)論(類別距離用 Cohen’

表示, 分別為0.2, 0.5, 0.8, 1.5)。但本研究發(fā)現(xiàn)類別距離對(duì)分類精確性的影響依然受樣本量的影響。小樣本情況下(

= 50～100), 類別距離越大, 分類精確性越好。但是對(duì)于更大的類別距離(MD = 3), Entropy明顯高于其他類別距離下的結(jié)果, 分類錯(cuò)誤率明顯小于其他類別距離下的結(jié)果, 且具有跨樣本量的一致性。隨著樣本量的增大, 類別距離為3的優(yōu)勢(shì)更加明顯。當(dāng)類別數(shù)較多的時(shí)候(本研究中

= 5), 大類別距離(MD = 3)的作用更明顯, 尤其是在指標(biāo)數(shù)少或樣本量大的條件下。顯然, 要得到好的分類精確性, 且不用擔(dān)心樣本量的影響, 類別距離最好達(dá)到 3。另外, 盡管類別距離對(duì) Entropy的變式 CLC、ICL_BIC、SaICL_BIC也有一定的影響, 但從這些變式的指數(shù)中可以發(fā)現(xiàn)類別距離對(duì)他們的影響比較小, 這主要是因?yàn)檫@些指標(biāo)考慮了模型復(fù)雜程度,特別是公式包含對(duì)數(shù)似然值, 使得各因素對(duì)Entropy的影響被稀釋了。因此, 在LPA/LCA分析中采用Entropy衡量精確性比其變式更靈敏。

4.3 Entropy受多個(gè)因素影響很難確定唯一臨界值

盡管 Entropy值與分類精確性高相關(guān), 但其值隨類別數(shù)、樣本量和指標(biāo)數(shù)的變化而變化, 很難確定唯一的臨界值,這一結(jié)果與前人研究類似(Lubke& Muthén, 2007)。Entropy與分類精確率呈高相關(guān),說(shuō)明Entropy是個(gè)不錯(cuò)的衡量分類精確性的指標(biāo)。同時(shí)Entropy作為一個(gè)單獨(dú)的分類精確性指標(biāo)比分類錯(cuò)誤率更加方便, 正因?yàn)槿绱?Entropy在不同條件下的表現(xiàn)更具有實(shí)踐意義。盡管Lubke和Muthén(2007,

= 2)考慮協(xié)變量后的研究結(jié)果表明：Entropy < 0.60時(shí)相當(dāng)于超過(guò)20%的個(gè)體存在分類錯(cuò)誤; Entropy≥0.80表明分類準(zhǔn)確率超過(guò)90%。但我們的研究發(fā)現(xiàn), 類別數(shù)為 3的時(shí)候, Entropy <0.64時(shí)相當(dāng)于超過(guò) 20%的個(gè)體存在分類錯(cuò)誤,Entropy≥0.76時(shí)表明分類準(zhǔn)確率超過(guò) 90%; 類別數(shù)為5時(shí), Entropy < 0.68時(shí)相當(dāng)于超過(guò)30%的個(gè)體存在分類錯(cuò)誤, Entropy > 0.84時(shí)表明分類準(zhǔn)確率超過(guò) 90%。本研究中的 3個(gè)類別(

= 3)時(shí)的結(jié)果與Lubke和Muthén (2007) 2個(gè)類別(

= 2)時(shí)的結(jié)果相近, 當(dāng)類別數(shù)達(dá)到 5的時(shí)候, 差異比較大。由此可見(jiàn), Entropy的表現(xiàn)不僅受協(xié)變量的影響, 還受類別數(shù)的影響。因此, 在選擇哪個(gè)臨界值作為 Entropy分類精確性的衡量指數(shù)時(shí), 我們不僅要考慮有沒(méi)有協(xié)變量的影響, 還要根據(jù)不同的類別數(shù)進(jìn)行抉擇。

4.4 不足與展望

本模擬研究的不足主要有以下幾個(gè)方面：首先,與其他模擬研究一樣, 本研究的發(fā)現(xiàn)能否應(yīng)用于模擬之外的模型。例如, 研究只考慮3和5個(gè)潛類別的情況, 對(duì)于其他潛類別的數(shù)量的研究不一定適用。其次, 我們主要考察的是 LPA, 以后的研究可以探索本研究的結(jié)果能否推廣到其他混合模型。第三, 在當(dāng)前僅有的一項(xiàng)考查了 Entropy與分類精確性的關(guān)系(Lubke & Muthén, 2007)的研究中, 違反局部獨(dú)立性假設(shè)時(shí)Entropy分類精確性的問(wèn)題并沒(méi)有被探究。而在有些情況下, 局部獨(dú)立性假設(shè)很難滿足。將來(lái)的研究可以探究違反局部獨(dú)立性時(shí)Entropy的表現(xiàn)。第四, 本研究考查的LPA模型并沒(méi)有考慮協(xié)變量的情況, 將來(lái)的研究可以對(duì)協(xié)變量的影響進(jìn)行系統(tǒng)考查。最后, 我們擬合的是真模型,在實(shí)踐中可能存在高估或低估類別數(shù)的情況, 因此在誤設(shè)模型下, Entropy的表現(xiàn)也是未來(lái)研究的一個(gè)重要議題。

5 結(jié)論與建議

總的來(lái)說(shuō), 本研究首次系統(tǒng)地研究了樣本量、類別距離、指標(biāo)數(shù)和類別數(shù)對(duì)分類精確性指標(biāo)Entropy在LPA中的表現(xiàn)。隨著LPA/LCA這些處理潛變量的統(tǒng)計(jì)模型的廣泛應(yīng)用, 本研究的結(jié)果對(duì)應(yīng)用研究者而言有很大的參考價(jià)值。

基于本研究的發(fā)現(xiàn), 下面總結(jié)了幾點(diǎn)結(jié)論和為應(yīng)用研究者建議。

(1) 由于 Entropy受多種因素影響, 實(shí)踐中的模型各不相同, 因此不存在絕對(duì)的臨界值。但當(dāng)實(shí)際的模型與我們模擬的條件類似時(shí)可以參考表2和網(wǎng)絡(luò)版附表1-2的Entropy值及對(duì)應(yīng)的錯(cuò)誤率。

(2) 其他條件不變的情況下, 樣本量越大Entropy的值越小, 分類精確性越差。因此從分類精確性的角度來(lái)說(shuō), 樣本量并非越多越好, 小樣本進(jìn)行LPA分析是可行。另外, 當(dāng)小樣本(

=50～100)時(shí),指標(biāo)數(shù)越多Entropy的結(jié)果越好。因此, 實(shí)踐中處理小樣本時(shí)可以通過(guò)增加指標(biāo)數(shù)來(lái)提高分類精確性。

(3) 盡管本研究發(fā)現(xiàn)類別距離對(duì)分類精確性影響最大, 但實(shí)際分析之前是不知道分類距離的, 所以在實(shí)踐中盡可能的抽取有代表性的樣本并盡可能的擴(kuò)大群體異質(zhì)性。

致謝：

本文作者衷心感謝三位匿名評(píng)審專家對(duì)本文提出的修改意見(jiàn)和建議。感謝澳洲國(guó)立大學(xué)壽懿赟博士幫助修改英文摘要。Asparouhov, T., & Muthén, B. (2014). Auxiliary variables in mixture modeling: Three-step approaches using Mplus.

Structural Equation Modeling: A Multidisciplinary Journal,21

, 329–341.Biernacki, C., Celeux, G., & Govaert, G. (2000). Assessing a mixture model for clustering with the integrated completed likelihood.

IEEE Transactions on Pattern Analysis & Machine Intelligence, 22

, 719–725.Biernacki, C., & Govaert, G. (1997).

Using the classification likelihood to choose the number of clusters

Computing Science and Statistics

, 29, 451–457.Carragher, N., Adamson, G., Bunting, B., & McCann, S. (2009).Subtypes of depression in a nationally representative sample.

Journal of Affective Disorders, 113

, 88–99.Celeux, G., & Soromenho, G. (1996). An entropy criterion for assessing the number of clusters in a mixture model.

Journal of Classification

, 195–212.Collins, L. M., & Lanza, S. T. (2009).

Latent class and latent transition analysis: With applications in the social, behavioral,and health sciences

. London: John Wiley & Sons, Inc.Helzer, J. E., Kraemer, H. C., & Krueger, R. F. (2006). The feasibility and need for dimensional psychiatric diagnoses.

Psychological Medicine, 36

, 1671–1680.Hou, J. T., Wen, Z. L., & Cheng, Z. J. (2004).

Structural equation model and its applications.

Beijing: Education Science Press.[侯杰泰, 溫忠麟, 成子娟. (2004).

結(jié)構(gòu)方程模型及其應(yīng)用

.北京: 教育科學(xué)出版社.]Kim, S. Y. (2012). Sample size requirements in single- and multiphase growth mixture models: A Monte Carlo simulation study.

Structural Equation Modeling, 19

, 457–476.Kyriakopoulos, M., Stringaris, A., Manolesou, S., Radobuljac,M. D., Jacobs, B., Reichenberg, A., … Frangou, S. (2015).Determination of psychosis-related clinical profiles in children with autism spectrum disorders using latent class analysis.

European Child & Adolescent Psychiatry, 24

, 301–307.Lanza, S. T., Rhoades, B. L., Greenberg, M. T., Cox, M., &The Family Life Project Key Investigators. (2011). Modeling multiple risks during infancy to predict quality of the caregiving environment: Contributions of a person-centered approach.

Infant Behavior and Development, 34

, 390–406.Lazarsfeld, P. F., & Henry, N. W. (1968).

Latent structure analysis

. Boston: Houghton Mifflin.Lubke, G. H., & Miller, P. J. (2015). Does nature have joints worth carving? A discussion of taxometrics, model-based clustering and latent variable mixture modeling.

Psychological Medicine, 45

, 705–715.Lubke, G., & Muthén, B. O. (2007). Performance of factor mixture models as a function of model size, covariate effects,and class-specific parameters.

Structural Equation Modeling,14

, 26–47.Lubke, G., & Neale, M. C. (2006). Distinguishing between latent classes and continuous factors: Resolution by maximum likelihood?

Multivariate Behavioral Research, 41

, 499– 532.Lubke, G. H., & Tueller, S. (2010). Latent class detection and class assignment: A comparison of the MAXEIG taxometric procedure and factor mixture modeling approaches.

Structural Equation Modeling, 17

, 605–628.Marsh, H. W., Hau, K. T., & Wen, Z. L. (2004). In search of golden rules: Comment on hypothesis-testing approaches to setting cutoff values for fit indexes and dangers in overgeneralizing Hu and Bentler’s (1999) findings.

Structural Equation Modeling, 11

, 320–341.McLachlan, G. J., & Peel, D. (2000).

Finite mixture models.

New York, NY: Wiley.McClintock, M. K., Dale, W., Laumann, E. O., & Waite, L.(2016). Empirical redefinition of comprehensive health and well-being in the older adults of the United States.

Proceedings of the National Academy of Sciences of the United States of America, 113

, E3071–E3080.Meehl, P. E. (1995). Bootstraps taxometrics: Solving the classification problem in psychopathology.

American Psychologist, 50

, 266–275.Mokros, A., Hare, R. D., Neumann, C. S., Santtila, P., Habermeyer,E., & Nitschke, J. (2015). Variants of psychopathy in adult male offenders: A latent profile analysis.

Journal of Abnormal Psychology, 124

, 372–386.Muthén, B. (2004). Latent variable analysis: growth mixture modeling and related techniques for longitudinal data. In D.Kaplan (Eds.),

The SAGE handbook of quantitative methodology for the social sciences

(pp. 345–368)

Thousand Oaks, CA:Sage Publications.Muthén, L. K., & Muthén, B. O. (1998–2015).

Mplus user’s guide (7.4 Ed.)

. Los Angeles, CA: Muthén & Muthén.Nylund, K. L., Asparouhov, T., & Muthén, B. O. (2007).Deciding on the number of classes in latent class analysis and growth mixture modeling: A Monte Carlo simulation study.

Structural Equation Modeling, 14

, 535–569.Pastor, D. A., Barron, K. E., Miller, B. J., & Davis, S. L.(2007). A latent profile analysis of college students’achievement goal orientation.

Contemporary Educational Psychology, 32

, 8–47.Paxton, P., Curran, P. J., Bollen, K. A., Kirby, J., & Chen, F. N.(2001). Monte Carlo experiments: Design and implementation.

Structural Equation Modeling, 8

, 287–312.Peugh, J., & Fan, X. T. (2013). Modeling unobserved heterogeneity using latent profile analysis: A Monte Carlo simulation.

Structural Equation Modeling, 20

, 616–639.Ruscio, J., Haslam, N., & Ruscio, A. M. (2006).

Introduction to the taxometric method: A practical guide.

London: Routledge.Sterba, S. K. (2013). Understanding linkages among mixture models.

Multivariate Behavioral Research, 48

, 775–815.Tein, J. Y., Coxe, S., & Cham, H. (2013). Statistical power to detect the correct number of classes in latent profile analysis.

Structural Equation Modeling, 20

, 640–657.Tofighi, D., & Enders, C. K. (2008). Identifying the correct number of classes in growth mixture models. In G. R.Hancock & K. M. Samuelsen (Eds.),

Advances in latent variable mixture models

(pp. 317–341). Greenwich, CT:Information Age Pub.Vannucci, A., Tanofsky-Kraff, M., Crosby, R. D., Ranzenhofer,L. M., Shomaker, L. B., Field, S. E., ... & Yanovski, J. A.(2013). Latent profile analysis to determine the typology of disinhibited eating behaviors in children and adolescents.

Journal of Consulting and Clinical Psychology, 81

, 494–507.Wade, T. D., Crosby, R. D., & Martin, N. G. (2006). Use of latent profile analysis to identify eating disorder phenotypes in an adult Australian twin cohort.

Archives of General Psychiatry, 63

, 1377–1384.Wang, M. C. (2014).

Latent variable modeling with Mplus

.Chongqing: Chongqing University Press.[王孟成. (2014).

潛變量建模與Mplus應(yīng)用

. 重慶: 重慶大學(xué)出版社.]Wang, M. C., Bi, X. Y., & Ye, H. S. (2014). Growth mixture modeling: A method for describing specific class growth trajectory.

Social Studies, 29

, 220–241.[王孟成, 畢向陽(yáng), 葉浩生. (2014). 增長(zhǎng)混合模型——分析不同類別個(gè)體發(fā)展趨勢(shì).

社會(huì)學(xué)研究, 29

, 220–241.]Wang, M., & Hanges, P. J. (2011). Latent class procedures:Applications to organizational research.

Organizational Research Methods, 14

, 24–31.Widiger, T. A., Livesley, W. J., & Clark, L. A. (2009). An integrative dimensional classification of personality disorder.

Psychological Assessment, 21

, 243–255.Widiger, T. A., & Samuel, D. B. (2005). Diagnostic categories or dimensions? A question for the diagnostic and statistical manual of mental disorders—fifth edition.

Journal of Abnormal Psychology, 114

, 494–504.Wurpts, I. C., & Geiser, C. (2014). Is adding more indicators to a latent class analysis beneficial or detrimental? Results of a Monte-Carlo study.

Frontiers in Psychology, 5

, 920.Yang, C. C. (2006). Evaluating latent class analysis models in qualitative phenotype identification.

Computational Statistics& Data Analysis, 50

, 1090–1104.Zachar, P., & Kendler, K. S. (2007). Psychiatric disorders: a conceptual taxonomy.

American Journal of Psychiatry, 164

,557–565.Zhang, J. T., Jiao, C., & Zhang, M. Q. (2010). Application of latent class analysis in psychological research.

Advances in Psychological Science, 18

, 1991–1998.[張潔婷, 焦璨, 張敏強(qiáng). (2010). 潛在類別分析技術(shù)在心理學(xué)研究中的應(yīng)用.

心理科學(xué)進(jìn)展, 18

, 1991–1998.]

附錄：

數(shù)據(jù)生成與分析的M

plus

語(yǔ)句(指標(biāo)數(shù)=4, 類別數(shù)=3,類別距離=0.5, 樣本量=50)

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

分類精確性指數(shù)Entropy在潛剖面分析中的表現(xiàn)：一項(xiàng)蒙特卡羅模擬研究*

1 引言

1.1 潛剖面分析

1.2 分類精確性指標(biāo)及其影響因素

1.2.1 分類精確性指標(biāo)Entropy

1.2.2 Entropy指數(shù)的變式

1.2.3 Entropy的影響因素

1.3 先前研究的不足與本研究目的

2 模擬研究

2.1 模擬設(shè)計(jì)

2.2 研究假設(shè)

2.3 數(shù)據(jù)生成與分析

2.4 評(píng)價(jià)指標(biāo)

3 結(jié)果

4 討論

4.1 樣本量和指標(biāo)數(shù)對(duì)Entropy的影響

4.2 類別距離對(duì)Entropy的影響

4.3 Entropy受多個(gè)因素影響很難確定唯一臨界值

4.4 不足與展望

5 結(jié)論與建議