周剛 張曉斌 曲行達(dá) 羅美芳 彭瓊玲 馬麗亞 趙眾
(1.深圳大學(xué)機(jī)電與控制工程學(xué)院,廣東深圳 518060;2.深圳市光明區(qū)疾控中心,廣東深圳 518107;3.深圳市寶安區(qū)婦幼保健院發(fā)育行為兒科,廣東深圳 518102)
孤獨(dú)癥譜系障礙(autism spectrum disorder,ASD)是一類以社交障礙、重復(fù)刻板行為、興趣狹隘為特征的神經(jīng)發(fā)育障礙[1]。ASD早期與全面發(fā)育遲緩(global developmental delay, GDD)存在相應(yīng)癥狀的重疊。ASD患兒在語(yǔ)言[2]、運(yùn)動(dòng)[3]、社交[4]等方面往往存在不同程度的發(fā)育滯后,而GDD 患兒早期也可能出現(xiàn)社交互動(dòng)能力欠佳等表現(xiàn),這就使得早期兩類兒童容易混淆。因此,如何快速準(zhǔn)確鑒別ASD與GDD具有重要臨床意義。
2016年金春華團(tuán)隊(duì)在0~6歲兒童神經(jīng)心理發(fā)育量表的基礎(chǔ)上修訂并編制出兒童神經(jīng)心理行為檢查量表2016版(以下簡(jiǎn)稱“兒心量表”),該量表信效度良好[5-6]。新版兒心量表增加了交流互動(dòng)警示行為能區(qū)(以下簡(jiǎn)稱“警示行為能區(qū)”),能夠有效鑒別正常兒童和ASD 兒童[7],然而,并無(wú)直接證據(jù)表明該能區(qū)能有效鑒別ASD 與GDD 兒童。有研究顯示,警示行為能區(qū)能以77%的準(zhǔn)確度鑒別ASD 和GDD 兒童[8],然而,目前尚未有研究探索其他能區(qū)是否有助于鑒別ASD和GDD兒童。
近年來(lái),機(jī)器學(xué)習(xí)(machine learning, ML)的廣泛應(yīng)用為提高ASD 早期篩查、檢測(cè)和診斷的準(zhǔn)確性和可靠性提供了新的機(jī)會(huì)[9-10]。國(guó)際上已有諸多學(xué)者將ML應(yīng)用于ASD的篩查和診斷,并獲得了很好的效果[11-12],展示了ML在篩查ASD方面的強(qiáng)大性能。然而,雖然ML在ASD分類方面的應(yīng)用較多,但目前國(guó)內(nèi)外尚未發(fā)現(xiàn)有研究應(yīng)用ML算法區(qū)分ASD和GDD兒童。本研究旨在利用ML的算法探索兒心量表哪些指標(biāo)能有效地鑒別ASD 和GDD 兒童,并驗(yàn)證警示行為指標(biāo)是否會(huì)被ML算法優(yōu)先選中為最重要的指標(biāo),為ASD 與GDD 兒童的快速鑒別提供新的思路。
回顧性選取2019—2022 年就診于深圳市寶安區(qū)婦幼保健院兒童心理行為康復(fù)科門診,并初次診斷為ASD 或單純GDD 的18~48 月齡兒童為研究對(duì)象。樣本共包含277 例ASD 和415 例GDD 兒童,所有兒童均未接受過(guò)專業(yè)康復(fù)訓(xùn)練。
ASD組納入標(biāo)準(zhǔn):(1)在社區(qū)健康服務(wù)中心初篩陽(yáng)性后,經(jīng)≥2 名的主治醫(yī)生級(jí)別兒童發(fā)育行為醫(yī)生嚴(yán)格按照精神障礙診斷與統(tǒng)計(jì)手冊(cè)第5 版(Diagnostic and Statistical Manual of Mental Disorders,Fifth Edition, DSM-5)中ASD 的診斷標(biāo)準(zhǔn)[1]進(jìn)行確診;(2)兒童孤獨(dú)癥評(píng)定量表(Childhood Autism Rating Scale, CARS)得分≥30 分。排除標(biāo)準(zhǔn):有明顯出生缺陷或肢體殘疾(如視聽覺喪失)的患兒。
單純GDD 組納入標(biāo)準(zhǔn):(1)在社區(qū)健康服務(wù)中心初篩陽(yáng)性后,經(jīng)≥2 名的主治醫(yī)生級(jí)別兒童發(fā)育行為醫(yī)生嚴(yán)格按照DSM-5 中GDD 診斷標(biāo)準(zhǔn)[1]進(jìn)行確診;(2)2個(gè)或以上的發(fā)育維度沒(méi)有達(dá)到預(yù)期的發(fā)育標(biāo)志,即發(fā)育商(developmental quotient,DQ)<70 分;(3)無(wú)法接受系統(tǒng)性智力測(cè)驗(yàn),病情的嚴(yán)重程度無(wú)法確切評(píng)估[13]。排除標(biāo)準(zhǔn):患ASD、有明顯出生缺陷或肢體殘疾(如視聽覺喪失)的患兒。
本研究已通過(guò)深圳市寶安區(qū)婦幼保健院醫(yī)學(xué)倫理委員會(huì)審批(LLSC-2021-02-7-14-KS);患兒及父母自愿配合參與評(píng)估,并簽署知情同意書。
由具備兒心量表主試資格的測(cè)評(píng)師與患兒進(jìn)行一對(duì)一互動(dòng)式測(cè)評(píng),嚴(yán)格按照指導(dǎo)手冊(cè)上的操作標(biāo)準(zhǔn)施測(cè),對(duì)受試者在大運(yùn)動(dòng)、精細(xì)運(yùn)動(dòng)、適應(yīng)能力、語(yǔ)言、社會(huì)行為及警示行為6大能區(qū)的發(fā)育程度進(jìn)行評(píng)估。每個(gè)能區(qū)的結(jié)果用智齡表示,用DQ(DQ=測(cè)驗(yàn)月齡/實(shí)際月齡×100)衡量?jī)和陌l(fā)育情況[7]。每個(gè)被試者共得到13個(gè)指標(biāo)評(píng)分,即大運(yùn)動(dòng)智齡、精細(xì)運(yùn)動(dòng)智齡、適應(yīng)能力智齡、語(yǔ)言能力智齡、社會(huì)行為智齡、警示行為智齡,以及大運(yùn)動(dòng)DQ、精細(xì)運(yùn)動(dòng)DQ、適應(yīng)能力DQ、語(yǔ)言能力DQ、社會(huì)行為DQ、警示行為DQ、綜合DQ。
智齡作為兒心量表的直接評(píng)測(cè)結(jié)果,可以判斷兒童個(gè)體智能是否達(dá)標(biāo),而DQ 由智齡計(jì)算得來(lái),是兒心量表評(píng)估測(cè)試兒童發(fā)育情況的主要指標(biāo)[7,14]。一般來(lái)說(shuō),智齡衡量的是個(gè)體縱向發(fā)展上各維度的發(fā)育程度,不宜作為群體評(píng)價(jià)指標(biāo)。然而,鑒于ML的主要工作是將所有被試者進(jìn)行分類,除DQ外,本研究仍將智齡作為指標(biāo)之一納入了特征集。因此,ML 過(guò)程使用的原始數(shù)據(jù)集為692(被試數(shù))×13(特征數(shù))的矩陣。
整個(gè)ML 的程序運(yùn)算均在MATLAB(2021a)中實(shí)現(xiàn)。本研究采用包括支持向量機(jī)(support vector machine, SVM)、線性判別分析(linear discriminant analysis, LDA)、隨機(jī)森林(random forest, RF)、集成學(xué)習(xí)(ensemble learning, ENS)和K近鄰(K-nearest neighbor, KNN)5種常用的ML分類器來(lái)進(jìn)行分類任務(wù),以探索各分類器的分類效果和最優(yōu)模型下對(duì)應(yīng)的特征集。
本研究將13 個(gè)特征輸入分類器,采用前向特征選擇的方法訓(xùn)練并測(cè)試ML模型。通過(guò)使用前向特征選擇,每個(gè)分類器都能得到不同數(shù)量下的最高分類準(zhǔn)確度的特征組合。
為了最大限度地減少潛在的過(guò)擬合問(wèn)題,本研究在ML訓(xùn)練模型和測(cè)試模型中實(shí)施留一交叉驗(yàn)證(每次抽出一個(gè)被試作為測(cè)試樣本)的方法。分類的準(zhǔn)確度、靈敏度和特異度作為分類器的評(píng)價(jià)指標(biāo)。準(zhǔn)確度定義為在兩組中正確分類的被試樣本的百分比;靈敏度為正確區(qū)分ASD 的人數(shù)占所有ASD 人數(shù)的百分比;特異度為正確區(qū)分GDD的人數(shù)占所有GDD人數(shù)的百分比。
采用SPSS 26.0 軟件進(jìn)行統(tǒng)計(jì)分析。正態(tài)分布的計(jì)量資料用均數(shù)±標(biāo)準(zhǔn)差(±s)表示,兩組間比較采用兩樣本t檢驗(yàn);非正態(tài)分布的計(jì)量資料以中位數(shù)(四分位數(shù)間距)[M(Q1,Q3)]表示,組間比較采用Mann-WhitneyU檢驗(yàn)。計(jì)數(shù)資料以例數(shù)或百分比(%)表示,組間比較采用χ2檢驗(yàn)。繪制各模型鑒別ASD 的受試者操作特征曲線(receiver operator characteristic curve, ROC 曲線),并計(jì)算曲線下面積(area under the curve, AUC)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
本研究共納入692 例患兒,男性526 例,女性166 例,中位入組月齡為24.8(22.3,27.5)個(gè)月。ASD組277例,GDD組415例,兩組患兒性別構(gòu)成(χ2=0.198,P=0.656)和入組月齡(Z=0.198,P=0.647)比較差異均無(wú)統(tǒng)計(jì)學(xué)意義。
ASD 組和GDD 組患兒精細(xì)運(yùn)動(dòng)智齡、適應(yīng)能力智齡、語(yǔ)言能力智齡、社會(huì)行為智齡、警示行為智齡、大運(yùn)動(dòng)DQ、精細(xì)運(yùn)動(dòng)DQ、適應(yīng)能力DQ、語(yǔ)言能力DQ、社會(huì)行為DQ、警示行為DQ、綜合DQ 得分比較差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見表1。
表1 ASD組與GDD組患兒兒心量表評(píng)估結(jié)果比較[M(Q1,Q3),分]
5 種ML 分類器的分類準(zhǔn)確度隨特征數(shù)量的變化而變化,見圖1。對(duì)于ENS 分類器,特征數(shù)為1時(shí),準(zhǔn)確度為78.90%(靈敏度:82.67%,特異度:76.39%),被選中的特征是警示行為DQ。該分類器最高準(zhǔn)確度為86.71%(靈敏度:83.75%,特異度:88.67%),模型包含4 個(gè)特征:警示行為DQ、警示行為智齡、大運(yùn)動(dòng)智齡和語(yǔ)言能力智齡。對(duì)于KNN 分類器,特征數(shù)為1 時(shí),準(zhǔn)確度僅為64.31%(靈敏度:98.56%,特異度:41.45%)。當(dāng)特征數(shù)等于2 時(shí),準(zhǔn)確度為77.89% (靈敏度:74.37%,特異度:80.24%)。使用6 個(gè)特征時(shí)準(zhǔn)確度最高,為81.21%(靈敏度:74.73%,特異度:85.54%),這6個(gè)特征分別是:警示行為DQ、語(yǔ)言能力DQ、精細(xì)運(yùn)動(dòng)智齡、適應(yīng)能力智齡、大運(yùn)動(dòng)DQ和語(yǔ)言能力智齡。SVM、LDA和RF分類器的準(zhǔn)確度隨特征數(shù)變化的浮動(dòng)較小。對(duì)于SVM分類器,使用6 個(gè)特征時(shí)準(zhǔn)確度最高,為79.77%(靈敏度:70.76%,特異度:85.78%),這6 個(gè)特征分別是:警示行為DQ、語(yǔ)言能力DQ、社會(huì)行為DQ、語(yǔ)言能力智齡、精細(xì)運(yùn)動(dòng)智齡和適應(yīng)能力智齡。對(duì)于LDA 分類器,使用7 個(gè)特征時(shí)準(zhǔn)確度最高,為79.91%(靈敏度:68.59%,特異度:87.47%),這7 個(gè)特征分別是:警示行為DQ、語(yǔ)言能力智齡、社會(huì)行為DQ、大運(yùn)動(dòng)DQ、適應(yīng)能力智齡、精細(xì)運(yùn)動(dòng)智齡和社會(huì)行為智齡。對(duì)于RF 分類器,使用8個(gè)特征時(shí)準(zhǔn)確度最高,為79.19% (靈敏度:70.04%,特異度:85.30%),這8 個(gè)特征分別是:警示行為DQ、社會(huì)行為智齡、大運(yùn)動(dòng)DQ、精細(xì)運(yùn)動(dòng)DQ、社會(huì)行為DQ、適應(yīng)能力智齡、語(yǔ)言能力智齡和綜合DQ。見圖1、表2。ENS 分類器的最大AUC 達(dá)到了0.909(P<0.001),且所有分類器的AUC均大于0.85(P<0.001),這表明所選的分類器性能均表現(xiàn)良好,見圖2。5 個(gè)分類器最高準(zhǔn)確度下的混淆矩陣見表3。
圖1 特征數(shù)與分類器準(zhǔn)確度的函數(shù)曲線 每條折線代表對(duì)應(yīng)分類器的分類準(zhǔn)確度隨所選特征組合的變化,標(biāo)記的方格點(diǎn)代表該分類器的最高準(zhǔn)確度。[SVM]支持向量機(jī);[LDA]線性判別分析;[RF]隨機(jī)森林;[ENS]集成學(xué)習(xí);[KNN]K-近鄰。
圖2 SVM、LDA、RF、ENS和KNN分類器最高分類準(zhǔn)確度對(duì)應(yīng)的ROC 曲線 [SVM]支持向量機(jī);[LDA]線性判別分析;[RF]隨機(jī)森林;[ENS]集成學(xué)習(xí);[KNN]K-近鄰。
表2 5個(gè)ML分類器的最高準(zhǔn)確度、靈敏度和特異度
表3 各個(gè)ML分類器的最高準(zhǔn)確度下的混淆矩陣 (例)
本研究納入277 例ASD,415 例GDD,共692名研究對(duì)象。其中ENS 分類器的最高分類準(zhǔn)確度為86.71%(靈敏度:83.75%,特異度:88.67%,AUC:0.909),該分類效果高于羅美芳等[8]在類似樣本情況下使用ROC 曲線分析的結(jié)果(準(zhǔn)確度:77.81%,靈敏度:75.00%,特異度:79.80%,AUC:0.835)。另外,Chen 等[15]使用ROC 曲線分析方法對(duì)130 例ASD 和86 例GDD 進(jìn)行分類,其分類準(zhǔn)確度為87.50%(靈敏度:89.20%,特異度:84.90%,AUC:0.910)。本研究的分類準(zhǔn)確度略低于Chen等[15]結(jié)果??赡艿脑蚴潜狙芯繕颖玖扛?,更大的樣本量意味著納入臨界值附近被試的概率增大,從而會(huì)削弱ML的分類效果。以上結(jié)果表明,ML在鑒別ASD和GDD兒童方面能夠獲得較高的分類準(zhǔn)確度,且可靠性良好,對(duì)未來(lái)臨床上快速鑒別診斷ASD與GDD提供了一定的參考價(jià)值。
為了提高適用性,兒心量表設(shè)置6大能區(qū)全面評(píng)估兒童的發(fā)育情況,但對(duì)于區(qū)分ASD 和GDD 來(lái)說(shuō),并非所有能區(qū)都能發(fā)揮作用。本研究將兒心量表的大運(yùn)動(dòng)、精細(xì)運(yùn)動(dòng)、適應(yīng)能力、語(yǔ)言、社會(huì)行為和警示行為6 大能區(qū)共13 個(gè)指標(biāo)全都納入特征集,ENS分類器選中4個(gè)特征(警示行為DQ、警示行為智齡、大運(yùn)動(dòng)智齡和語(yǔ)言能力智齡)時(shí),獲得超過(guò)86%的準(zhǔn)確度。該結(jié)果表明,臨床上只需要對(duì)警示行為、大運(yùn)動(dòng)和語(yǔ)言能力3個(gè)能區(qū)進(jìn)行測(cè)試,便能較準(zhǔn)確地對(duì)ASD 和GDD 進(jìn)行區(qū)分,能有效提升篩查的效率。
既往研究已經(jīng)證明只使用警示行為能區(qū)能夠有效鑒別ASD 和GDD[15],而本研究發(fā)現(xiàn)其他能區(qū)可以為鑒別ASD和GDD提供幫助。SVM和KNN分類器達(dá)到最高準(zhǔn)確度時(shí)都提取了6個(gè)特征,且準(zhǔn)確度均超過(guò)79%。同時(shí),LDA 和RF 分類器在分別提取7個(gè)和8個(gè)特征時(shí),也分別獲得超過(guò)78%的準(zhǔn)確度。值得指出的是,警示行為DQ在本研究中起到重要作用,其原因是5個(gè)分類器均在首個(gè)特征選中警示行為DQ,而ENS 分類器僅選取警示行為DQ作為第一個(gè)特征就取得78.90%的準(zhǔn)確度。以上結(jié)果表明,警示行為能區(qū)在檢測(cè)ASD 方面確實(shí)能發(fā)揮重要作用,但是搭配兒心量表其他能區(qū)的指標(biāo),可以進(jìn)一步提升準(zhǔn)確度。這表明其他能區(qū)的指標(biāo)能起到一定的輔助作用,這對(duì)改進(jìn)診斷方法有一定的指導(dǎo)意義。
盡管本研究采用ML的方法提高了鑒別ASD和GDD 兒童的效率和準(zhǔn)確度,但仍然存在一些局限性。例如,遺傳、孕產(chǎn)期和家庭教育已經(jīng)被證明會(huì)影響ASD和GDD的發(fā)生[16]。由于本研究中部分被試的既往史、撫養(yǎng)人水平和家庭教育情況等信息未錄入系統(tǒng),導(dǎo)致無(wú)法將其納入ML 的特征集中。后續(xù)的研究可以考慮豐富被試的相關(guān)社會(huì)人口學(xué)信息,進(jìn)一步提高M(jìn)L的分類效能。其次,兒心量表作為一種問(wèn)卷需要專業(yè)評(píng)測(cè)師操作,其人工操作的主觀性無(wú)法避免。而基于客觀指標(biāo)作為數(shù)據(jù),采用ML方法預(yù)測(cè)分類是當(dāng)前研究的重要方向。既往研究顯示,客觀指標(biāo)在識(shí)別ASD 兒童方面表現(xiàn)出色。Crippa等[17]將15例ASD兒童和15例正常兒童納入研究,利用簡(jiǎn)單的上肢運(yùn)動(dòng)提取7個(gè)客觀運(yùn)動(dòng)學(xué)特征,可以準(zhǔn)確地分類ASD 和正常兒童(準(zhǔn)確度為96.70%)。Li 等[18]將14 例ASD 兒童和16 例正常兒童納入研究,借助運(yùn)動(dòng)追蹤技術(shù)確定9 個(gè)運(yùn)動(dòng)參數(shù),ML 的最大分類準(zhǔn)確度可達(dá)86.70%。值得注意的是,以上研究的樣本量較小,而本研究在相對(duì)大樣本量的情況下通過(guò)ML選出的特征同樣具有良好的分類效果。這不僅彌補(bǔ)了ML應(yīng)用于鑒別ASD 與GDD 領(lǐng)域的空白,同樣可以對(duì)未來(lái)基于客觀數(shù)據(jù)鑒別ASD 與GDD 提供一定的參考價(jià)值。
本研究創(chuàng)新地采用ML的方法,使用兒心量表數(shù)據(jù)對(duì)277例ASD兒童和415例GDD兒童進(jìn)行分類預(yù)測(cè),獲得了良好的預(yù)測(cè)結(jié)果。進(jìn)一步證實(shí)警示行為能區(qū)在檢測(cè)ASD 方面效果顯著,并且發(fā)現(xiàn)聯(lián)合其他能區(qū)指標(biāo)可以獲得更好的預(yù)測(cè)效果,為臨床快速準(zhǔn)確鑒別ASD和GDD提供了可行的方法。
利益沖突聲明:所有作者聲明無(wú)利益沖突。