劉笑晗 陳明隆 郭 靜
機(jī)器學(xué)習(xí)在兒童創(chuàng)傷后應(yīng)激障礙識(shí)別及轉(zhuǎn)歸預(yù)測(cè)中的應(yīng)用*
劉笑晗 陳明隆 郭 靜
(北京大學(xué)公共衛(wèi)生學(xué)院, 北京 100191)
創(chuàng)傷后應(yīng)激障礙(PTSD)會(huì)給兒童發(fā)展帶來(lái)負(fù)面效應(yīng), 其影響甚至延續(xù)至成年期。然而傳統(tǒng)診斷方式難以做到快速、客觀(guān)、準(zhǔn)確的識(shí)別和診斷兒童PTSD, 機(jī)器學(xué)習(xí)作為一種處理大量變量和數(shù)據(jù)的新興方法, 逐漸被應(yīng)用到兒童PTSD的早期預(yù)測(cè)、識(shí)別及輔助診斷等研究中。機(jī)器學(xué)習(xí)憑借其性能、原理等方面的優(yōu)勢(shì), 可被應(yīng)用在兒童PTSD的識(shí)別與轉(zhuǎn)歸領(lǐng)域。相比自我報(bào)告式的診斷, 通過(guò)機(jī)器學(xué)習(xí)輔助識(shí)別和診斷兒童PTSD的過(guò)程具有效率高、客觀(guān)準(zhǔn)確、節(jié)約資源等獨(dú)特優(yōu)勢(shì)。然而, 機(jī)器學(xué)習(xí)也在硬件成本、算法選擇和預(yù)測(cè)準(zhǔn)確度等方面存在局限性。未來(lái)研究人員需要進(jìn)一步提高機(jī)器學(xué)習(xí)診斷識(shí)別兒童PTSD的準(zhǔn)確率, 并將機(jī)器學(xué)習(xí)算法同傳統(tǒng)診斷方法結(jié)合進(jìn)行更多的探索和應(yīng)用。
機(jī)器學(xué)習(xí), 創(chuàng)傷后應(yīng)激障礙, 轉(zhuǎn)歸預(yù)測(cè), 兒童
創(chuàng)傷后應(yīng)激障礙(Post-Traumatic Stress Disorder PTSD)是個(gè)體經(jīng)歷、目睹或遭遇到一個(gè)或多個(gè)威脅生命或造成嚴(yán)重傷害事件后所出現(xiàn)和持續(xù)存在的警醒、負(fù)向情緒、回避等精神癥狀(Weathers et al., 2013)。兒童PTSD具有較高流行率:據(jù)估計(jì), 10%~20%的兒童在經(jīng)歷創(chuàng)傷性事件后, 會(huì)出現(xiàn)警醒、回避、負(fù)向情緒等創(chuàng)傷后應(yīng)激障礙癥狀(Post-Traumatic Stress Symptoms PTSS) (Alisic et al., 2014)。兒童PTSD的發(fā)展結(jié)局具有異質(zhì)性:一項(xiàng)綜述研究提示, 災(zāi)難發(fā)生一個(gè)月后兒童PTSD發(fā)生率在21%, 3個(gè)月后降至15%, 一年后保持在11% (Hiller et al., 2016), 并且罹患PTSD的患者在疾病的后續(xù)階段中會(huì)出現(xiàn)6%恢復(fù)、10%惡化或4%長(zhǎng)期患病等不同結(jié)局(Bryant et al., 2015), 意味著兒童PTSD的發(fā)生與轉(zhuǎn)歸會(huì)隨著環(huán)境、時(shí)間等因素發(fā)生動(dòng)態(tài)變化。兒童創(chuàng)傷后應(yīng)激障礙的追蹤研究發(fā)現(xiàn), PTSD與抑郁、物質(zhì)濫用、犯罪、自殺等不良健康結(jié)果高度相關(guān)(Cancilliere et al., 2021; Jensen et al., 2014, 2019), 其負(fù)面影響可以持續(xù)到成年期, 甚至具有代際傳遞效應(yīng) (Yehuda et al., 2001)。因而, 預(yù)測(cè)或識(shí)別兒童PTSD的風(fēng)險(xiǎn)因素, 提出有針對(duì)性的干預(yù)策略有利于降低兒童PTSD的發(fā)生、減少其向其他身心疾病發(fā)展的可能性。
如何提高兒童PTSD診斷方法的準(zhǔn)確性一直是臨床實(shí)踐和學(xué)術(shù)研究中的挑戰(zhàn)。以往識(shí)別兒童PTSD的方法, 通常使用美國(guó)心理學(xué)協(xié)會(huì)出版的《精神障礙診斷和統(tǒng)計(jì)手冊(cè)》(Diagnostic and Statistical Manual of Mental Disorders, DSM)、國(guó)際疾病和相關(guān)健康問(wèn)題統(tǒng)計(jì)分類(lèi)(International Statistical Classification of Diseases and Related Health Problems, ICD)和嬰幼兒心理健康與發(fā)育障礙的診斷分類(lèi)(Diagnostic Classification of Mental Health and Developmental Disorders of Infancy and Early Childhood, DC), 我們國(guó)家也會(huì)使用中國(guó)精神障礙分類(lèi)與診斷標(biāo)準(zhǔn)(Chinese Classification and Diagnostic Criteria of Mental Disorders, CCMD), 根據(jù)兒童自我報(bào)告或父母報(bào)告的癥狀進(jìn)行判斷(Scheeringa et al., 2006)。但由于年齡較小的兒童難以準(zhǔn)確清晰的表達(dá)癥狀, 以及代理人(通常為父母)對(duì)兒童的了解程度不足往往導(dǎo)致診斷率低于真實(shí)情況(Scheeringa et al., 2006)。同時(shí), 在實(shí)際診斷過(guò)程中, 醫(yī)生的主觀(guān)理解和判斷也可能導(dǎo)致診斷率或敏感性偏低(de Young & Landolt, 2018)。除此之外, 兒童PTSD疾病發(fā)展的過(guò)程具有長(zhǎng)期性和復(fù)雜性, 發(fā)展結(jié)局受多種因素影響。但由于可納入的變量有限, 用于預(yù)測(cè)PTSD轉(zhuǎn)歸的傳統(tǒng)方法容易產(chǎn)生誤差。
機(jī)器學(xué)習(xí)因其強(qiáng)大的數(shù)據(jù)處理、挖掘能力已經(jīng)被廣泛用于醫(yī)療領(lǐng)域。近年來(lái)機(jī)器學(xué)習(xí)已成功用于自閉癥、注意缺陷多動(dòng)障礙和精神分裂癥的預(yù)測(cè)分類(lèi)(Bedi et al., 2015; Mueller et al., 2010; Zandvakili et al., 2019), 也被用于預(yù)測(cè)成人急性PTSD (Galatzer-Levy et al., 2014; Karstoft et al., 2015)。在兒童精神健康領(lǐng)域, 機(jī)器學(xué)習(xí)被用來(lái)診斷注意力問(wèn)題、學(xué)業(yè)問(wèn)題、焦慮問(wèn)題、注意缺陷多動(dòng)障礙和廣泛性發(fā)育障礙(Sumathi & Poorna, 2016)。盡管目前使用機(jī)器學(xué)習(xí)診斷兒童PTSD的研究還處于探索階段, 不具有統(tǒng)一的標(biāo)準(zhǔn), 對(duì)模型的選擇和應(yīng)用還沒(méi)有形成成熟的體系。但越來(lái)越多的研究表明基于多源數(shù)據(jù)、大數(shù)據(jù), 運(yùn)用機(jī)器學(xué)習(xí)方法, 探索PTSD的發(fā)展規(guī)律、轉(zhuǎn)歸機(jī)制和影響因素具有可行性(Takahashi et al., 2020; Worthington et al., 2020)。
本研究旨在整理機(jī)器學(xué)習(xí)方法應(yīng)用于兒童PTSD診斷和轉(zhuǎn)歸的相關(guān)研究, 歸納總結(jié)機(jī)器學(xué)習(xí)方法用于兒童PTSD識(shí)別和轉(zhuǎn)歸中的優(yōu)勢(shì)、劣勢(shì), 為完善機(jī)器學(xué)習(xí)在該領(lǐng)域的應(yīng)用提供參考。
機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支、涉及多個(gè)學(xué)科, 包含了能通過(guò)經(jīng)驗(yàn)(訓(xùn)練)提高自身表現(xiàn)的程序(Al-Sahaf et al., 2019; Jones, 2019), 致力于通過(guò)計(jì)算手段改善系統(tǒng)自身性能。機(jī)器學(xué)習(xí)研究的內(nèi)容是關(guān)于在計(jì)算機(jī)上從數(shù)據(jù)中產(chǎn)生模型的算法, 即學(xué)習(xí)算法(learning algorithm) (周志華, 2018)。機(jī)器學(xué)習(xí)的分類(lèi)非常廣泛, 根據(jù)數(shù)據(jù)是否帶有標(biāo)記信息(即是否提前規(guī)定了結(jié)果或其他指標(biāo))可以分為監(jiān)督學(xué)習(xí)、無(wú)(非)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)(Brownlee, 2016)。按照學(xué)習(xí)策略可分為機(jī)械學(xué)習(xí)、示教學(xué)習(xí)、類(lèi)比學(xué)習(xí)、歸納學(xué)習(xí)和基于解釋的學(xué)習(xí)。也可以根據(jù)應(yīng)用的領(lǐng)域如語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、智能機(jī)器人等進(jìn)行分類(lèi), 或者依據(jù)獲取知識(shí)的形式進(jìn)行分類(lèi)等。機(jī)器學(xué)習(xí)的主要過(guò)程是根據(jù)收集數(shù)據(jù)的特征或?qū)傩? 將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集, 在訓(xùn)練集中進(jìn)行數(shù)據(jù)模擬和運(yùn)算, 用測(cè)試集不斷調(diào)整和優(yōu)化模型, 最終能夠良好的適用于新的數(shù)據(jù), 見(jiàn)圖1。
近年來(lái)機(jī)器學(xué)習(xí)的應(yīng)用越來(lái)越廣泛。以在PubMed中的檢索結(jié)果為例, 截止到2021年4月21日, 得到111233條有關(guān)機(jī)器學(xué)習(xí)的研究, PTSD領(lǐng)域的研究有185篇, 但聚焦于兒童群體只有10篇。機(jī)器學(xué)習(xí)最初應(yīng)用到精神健康涉及抑郁癥、精神分裂癥、雙相障礙等診斷技術(shù)較為準(zhǔn)確和成熟的領(lǐng)域(Koprowski & Foster, 2018)。2012年James等人利用機(jī)器學(xué)習(xí)的方法優(yōu)化了成年人PTSD的認(rèn)知行為干預(yù)方式, 將機(jī)器學(xué)習(xí)引入PTSD領(lǐng)域(Kelly et al., 2012)。2017年Glenn等人首次嘗試將機(jī)器學(xué)習(xí)的概念應(yīng)用于兒童PTSD, 探索與兒童PTSD發(fā)生相關(guān)的因素(Saxe et al., 2017)。機(jī)器學(xué)習(xí)在兒童PTSD中的研究是遵循著風(fēng)險(xiǎn)因素探索——預(yù)測(cè)轉(zhuǎn)歸結(jié)局——驗(yàn)證或選擇治療方案的邏輯路徑。首先探索風(fēng)險(xiǎn)因素(Saxe et al., 2017), 再將相關(guān)因素作為機(jī)器學(xué)習(xí)的特征, 用以進(jìn)行PTSD的識(shí)別和診斷(Li et al., 2020), 根據(jù)長(zhǎng)期追蹤的結(jié)果預(yù)測(cè)轉(zhuǎn)歸結(jié)局(Ge et al., 2020), 最后研究治療方法的有效性(Ucuz et al., 2020)。在這一過(guò)程中以監(jiān)督式機(jī)器學(xué)習(xí)為主, 使用較多的模型是決策樹(shù)、隨機(jī)森林, 支持向量機(jī)和回歸(Li et al., 2020; Saxe et al., 2017), 近年來(lái)為優(yōu)化機(jī)器學(xué)習(xí)效果, 逐漸嘗試非監(jiān)督機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等新方法(Schultebraucks, Yadav, et al., 2020)。
本研究在主要的文獻(xiàn)檢索平臺(tái)PubMed、Embase、Scopus、Web of science、Ovid、中國(guó)知網(wǎng)、中國(guó)萬(wàn)方進(jìn)行檢索, 最終納入5篇調(diào)查研究。關(guān)鍵詞的檢索策略是:機(jī)器學(xué)習(xí)(“Machine Learning” [Title/Abstract] OR “Artificial Intelligence”[Title/Abstract] OR “Deep Learning” [Title/Abstract] OR “Neural Network” [Title/Abstract] OR “Support vector machine” [Title/Abstract] OR “Prediction Network” [Title/Abstract] OR “Forecast Model” [Title/Abstract] OR “Data mining” [Title/Abstract] OR “Supervised Learning” [Title/Abstract]) and PTSD/創(chuàng)傷后應(yīng)激障礙(“post-traumatic stress” [Title/Abstract] OR “posttraumatic stress” [Title/ Abstract] OR PTSD[Title/Abstract] OR PTSS[Title/ Abstract] OR PTS [Title/Abstract]) and 兒童/青少年(child [Title/Abstract] OR children[Title/Abstract] OR girl [Title/Abstract] OR boy [Title/Abstract] OR infant [Title/Abstract] OR baby [Title/Abstract] OR babies [Title/Abstract] OR toddler [Title/Abstract] OR preschool [Title/Abstract] OR “pre-school” [Title/ Abstract] OR minor [Title/Abstract] OR teen [Title/ Abstract] OR adolescent [Title/Abstract] OR youth [Title/Abstract]).
圖1 機(jī)器學(xué)習(xí)預(yù)測(cè)兒童PTSD診斷與識(shí)別過(guò)程(以Saxe等人(2017)的研究為例)
納入標(biāo)準(zhǔn):1)研究對(duì)象:18歲以下的兒童。2)研究設(shè)計(jì):包括橫斷面研究、隊(duì)列研究或病例對(duì)照研究等中英文文章(中文檢索結(jié)果為0)。3)研究?jī)?nèi)容:應(yīng)用機(jī)器學(xué)習(xí)分析創(chuàng)傷后應(yīng)激障礙或創(chuàng)傷后應(yīng)激癥狀。排除標(biāo)準(zhǔn):1)研究對(duì)象:18歲以上的成年人、老年人及其他特殊群體。2)研究設(shè)計(jì):排除使用政策分析、描述性分析的文獻(xiàn)。3)研究?jī)?nèi)容:排除與創(chuàng)傷后應(yīng)激障礙或創(chuàng)傷后癥狀無(wú)關(guān)的心理疾病研究以及沒(méi)有將創(chuàng)傷后應(yīng)激障礙作為因變量的研究, 或未應(yīng)用機(jī)器學(xué)習(xí)方法的研究。4)出版物類(lèi)型:描述性綜述、評(píng)論, 給編輯的書(shū)信、病例報(bào)告、書(shū)籍章節(jié)、報(bào)告、會(huì)議記錄或未發(fā)表的手稿被排除。見(jiàn)圖2。
傳統(tǒng)方法識(shí)別診斷兒童PTSD是臨床醫(yī)生或研究人員根據(jù)診斷手冊(cè)上的癥狀標(biāo)準(zhǔn)進(jìn)行比對(duì), 符合癥狀描述的兒童診斷為患有PTSD。識(shí)別兒童PTSD的風(fēng)險(xiǎn)因素是通過(guò)既往文獻(xiàn)或根據(jù)研究者經(jīng)驗(yàn)做出假設(shè), 應(yīng)用傳統(tǒng)多元回歸方法進(jìn)行驗(yàn)證。這種判斷兒童PTSD的方法過(guò)于依賴(lài)臨床醫(yī)生或研究者的個(gè)人經(jīng)驗(yàn), 診斷或識(shí)別兒童PTSD受主觀(guān)因素影響較大, 臨床醫(yī)生和父母很大程度上決定了診斷結(jié)果。預(yù)測(cè)的風(fēng)險(xiǎn)因素結(jié)果也受到研究者所選擇統(tǒng)計(jì)方法的影響, 研究人員經(jīng)常使用的基于回歸模型的預(yù)測(cè)方法納入的變量數(shù)量和類(lèi)型有限, 對(duì)風(fēng)險(xiǎn)因素的識(shí)別不夠全面, 并且在調(diào)查過(guò)程中需要消耗大量人力物力資源。
圖2 應(yīng)用機(jī)器學(xué)習(xí)診斷識(shí)別兒童PTSD相關(guān)研究的檢索過(guò)程
機(jī)器學(xué)習(xí)是根據(jù)已有經(jīng)驗(yàn)進(jìn)行規(guī)律總結(jié)和特征歸納, 通過(guò)不斷的數(shù)據(jù)訓(xùn)練使程序自行判斷新數(shù)據(jù)中兒童是否會(huì)患有PTSD, 比人為判斷更為客觀(guān), 而且速度更快, 效率更高。在預(yù)測(cè)風(fēng)險(xiǎn)因素時(shí), 可以同時(shí)處理多個(gè)維度的變量。Saxe等人(Saxe et al., 2017)基于兒童人口統(tǒng)計(jì)學(xué)信息、發(fā)育特征、癥狀和功能、兒童父母的癥狀、壓力、損傷程度、相關(guān)基因、神經(jīng)內(nèi)分泌和心理生理反應(yīng)等領(lǐng)域的105個(gè)變量, 選擇重復(fù)嵌套5次交叉驗(yàn)證的模型, 重復(fù)計(jì)算30次, 采用支持向量機(jī)(Support Vector Machines SVM)、隨機(jī)森林和Lasso回歸三類(lèi)五種廣泛應(yīng)用的分類(lèi)器。結(jié)果顯示機(jī)器學(xué)習(xí)的AUC平均值是0.79, 高于傳統(tǒng)邏輯回歸模型。最終確定了既往創(chuàng)傷應(yīng)激障礙、既往損傷、相關(guān)基因、氯胺酮使用劑量等10個(gè)能導(dǎo)致兒童PTSD的因果變量。Emel Sari Gokten等人也進(jìn)行了相似的研究, 應(yīng)用隨機(jī)森林模型, 得到0.76的AUC均值, 并確定虐待類(lèi)型和孩子的共同居住者兩個(gè)最重要的影響特征(Gokten & Uyulan, 2021), 詳見(jiàn)表1。識(shí)別PTSD的風(fēng)險(xiǎn)因素, 意味著可通過(guò)客觀(guān)指標(biāo)進(jìn)行PTSD的診斷, 在提高診斷效率的同時(shí)能有效降低臨床診斷中的主觀(guān)偏倚, 節(jié)約物質(zhì)資源, 減輕臨床醫(yī)生的工作量。若對(duì)風(fēng)險(xiǎn)因素進(jìn)行早期干預(yù)與控制也能預(yù)防PTSS惡化導(dǎo)致的不良心理健康結(jié)局。
除支持向量機(jī)、隨機(jī)森林等常見(jiàn)模型, 基于復(fù)合樹(shù)模型的監(jiān)督式分類(lèi)和回歸樹(shù)算法(classificationand regression trees CART)也表現(xiàn)出較高的準(zhǔn)確度, AUC等于0.80 (Ge et al., 2020)。而使用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network ANN)算法的準(zhǔn)確度達(dá)到了99.2% (Ucuz et al., 2020)。ANN是深度學(xué)習(xí)算法的基本組成部分, 能夠克服上述基于邏輯符號(hào)的機(jī)器算法在處理直覺(jué)、非結(jié)構(gòu)化信息方面的缺陷, 具有自適應(yīng)、自組織和實(shí)時(shí)學(xué)習(xí)的特點(diǎn), 具有高速尋找最優(yōu)解能力, 更擅長(zhǎng)處理復(fù)雜變量。
機(jī)器學(xué)習(xí)應(yīng)用于兒童PTSD識(shí)別和診斷的過(guò)程中, 影響因素覆蓋范圍從生物學(xué)指標(biāo)(基因、腦核磁成像)到社會(huì)心理因素(壓力、童年創(chuàng)傷), 越來(lái)越廣泛和全面(Li et al., 2020; Saxe et al., 2017; Ucuz et al., 2020); 機(jī)器學(xué)習(xí)的模型也從傳統(tǒng)的決策樹(shù)、回歸發(fā)展到深度學(xué)習(xí)領(lǐng)域, 診斷準(zhǔn)確率大幅提高(Saxe et al., 2017; Ucuz et al., 2020)。
兒童PTSD的轉(zhuǎn)歸是指兒童在確診PTSD后的不同發(fā)展軌跡, 其主要涉及兩個(gè)內(nèi)容, 基于量變的軌跡(常用潛在生長(zhǎng)混合模型分析)和基于質(zhì)變的軌跡(常用潛在轉(zhuǎn)變分析或潛在類(lèi)別分析)。發(fā)展軌跡的分類(lèi)根據(jù)不同的數(shù)據(jù)及分析方法呈現(xiàn)多樣性。Betty等人根據(jù)現(xiàn)有文獻(xiàn)歸納出PTSS的三種基本軌跡, 分別是:慢性, 恢復(fù)和抗逆力型(Lai et al., 2017)。Galatzer-Levy等人的文獻(xiàn)綜述則提出了潛在創(chuàng)傷事件發(fā)生后的抗逆力型、恢復(fù)、慢性和延遲發(fā)作四種軌跡(Galatzer-Levy et al., 2018)。Bonanno等人認(rèn)為大多數(shù)人在經(jīng)歷創(chuàng)傷后具有心理抗逆力, 創(chuàng)傷經(jīng)歷與心理問(wèn)題并不是絕對(duì)的因果關(guān)系(Bonanno, 2004)。據(jù)此他們將面臨潛在創(chuàng)傷后人們的反應(yīng)分為了6類(lèi):抗逆力型, 在人群中占35%~65%; 持續(xù)性痛苦(5%~15%); 慢性功能障礙(5%~30%); 延遲性癥狀增加(10%~ 15%); 恢復(fù)(15%~25%)和癥狀改善(5%~10%) (Bonanno et al., 2011; Bonanno & Diminich, 2013)。只有不能從PTSD自行恢復(fù)的兒童才需要進(jìn)行早期干預(yù)(Masten & Narayan, 2012)。因此研究?jī)和疨TSD轉(zhuǎn)歸對(duì)篩選高危人群和幫助確定需要心理干預(yù)的兒童和青少年具有很強(qiáng)的理論和實(shí)踐意義(Cheng et al., 2019)。
表1 機(jī)器學(xué)習(xí)在兒童PTSD診斷和識(shí)別中的應(yīng)用
注:RF: random forest隨機(jī)森林; SVM: support vector machines支持向量機(jī); CART: XGBoost平臺(tái)的Classification and Regression Trees分類(lèi)回歸樹(shù); ANNs: Artificial neural networks人工神經(jīng)網(wǎng)絡(luò)
兒童PTSD的病因眾多, 疾病本身具有遲發(fā)性, 預(yù)后呈現(xiàn)多模式性和復(fù)雜性的特點(diǎn), 追蹤長(zhǎng)期結(jié)局較為困難, 因此關(guān)于兒童PTSD結(jié)局轉(zhuǎn)歸的研究較少(Takahashi et al., 2020)。傳統(tǒng)用于分類(lèi)的統(tǒng)計(jì)方法例如潛在類(lèi)別分析(Latent Category Analysis, LCA)和潛在生長(zhǎng)混合模型(Latent Growth Mixture Modeling LGMM), 根據(jù)個(gè)體在分類(lèi)變量上的響應(yīng)情況將個(gè)體分為互斥的群。例如Jin Cheng等人使用LCA探索地震后兒童PTSD的發(fā)展軌跡, 將幸存兒童的狀態(tài)劃歸為四類(lèi), 命名為彈性(53.8%)、低癥狀(32.6%)、恢復(fù)(7.0%)和慢性功能障礙(6.6%) (Cheng et al., 2019)。然而這項(xiàng)長(zhǎng)達(dá)4年的縱向研究中也存在回憶偏倚與遺漏重要變量等局限性。
機(jī)器學(xué)習(xí)主要有兩種基本方法可以預(yù)測(cè)兒童PTSD的結(jié)局。一種是預(yù)測(cè)離散數(shù)據(jù)的方法, 也稱(chēng)為分類(lèi), 屬于監(jiān)督學(xué)習(xí), 是人為設(shè)定訓(xùn)練數(shù)據(jù)集可能會(huì)出現(xiàn)的分類(lèi)結(jié)果。例如根據(jù)以往經(jīng)驗(yàn), 假設(shè)符合某些特征的兒童可能會(huì)出現(xiàn)PTSD的結(jié)局, 如恢復(fù)、惡化等, 或者是通過(guò)傳統(tǒng)分類(lèi)方法如潛在生長(zhǎng)混合模型先確定轉(zhuǎn)歸結(jié)局。然后再通過(guò)機(jī)器學(xué)習(xí)將預(yù)測(cè)兒童PTSD的特征與轉(zhuǎn)歸結(jié)局進(jìn)行映射, 訓(xùn)練集習(xí)得模型后, 可以預(yù)測(cè)新的數(shù)據(jù)會(huì)出現(xiàn)哪種結(jié)局。另一種預(yù)測(cè)離散數(shù)據(jù)的方法是聚類(lèi), 即訓(xùn)練集中的數(shù)據(jù)會(huì)按照特征或某些潛在的概念自動(dòng)分成若干組, 每一組稱(chēng)一簇, 之后人為總結(jié)出這些簇的共性, 屬于非監(jiān)督學(xué)習(xí)。聚類(lèi)分析可以用于區(qū)別PTSD和其他精神疾病, 或評(píng)估PTSD各癥狀之間的關(guān)系(Ramos-Lima et al., 2020)。Luis等人的系統(tǒng)綜述中詳細(xì)的介紹了應(yīng)用監(jiān)督機(jī)器學(xué)習(xí)對(duì)PTSD轉(zhuǎn)歸結(jié)局進(jìn)行分類(lèi)的研究, 包括主要算法和準(zhǔn)確度(Ramos-Lima et al., 2020)。也有研究嘗試使用其他非監(jiān)督機(jī)器學(xué)習(xí)算法如圖示分析(graph analysis)探索PTSD的轉(zhuǎn)歸。例如Galatzer-Levy等人首先應(yīng)用LGMM確定了兩種轉(zhuǎn)歸結(jié)局, 恢復(fù)和未見(jiàn)好轉(zhuǎn)(Galatzer-Levy et al., 2017)。隨后采用支持向量機(jī)、隨機(jī)森林、AdaBoost等算法, 進(jìn)行5次10折交叉驗(yàn)證, 得到0.82的AUC。并且在圖示分析中分類(lèi)出尿皮質(zhì)醇、回避癥狀、NE/皮質(zhì)醇血漿比率和PTSD嚴(yán)重程度四類(lèi)與PTSD轉(zhuǎn)歸相關(guān)的信息, 還確定了兩種無(wú)法緩解創(chuàng)傷后應(yīng)激癥狀的途徑:路徑1是沒(méi)有報(bào)告童年期創(chuàng)傷的個(gè)體在急診室經(jīng)歷了高度的交感神經(jīng)興奮和負(fù)面情緒, 導(dǎo)致其出現(xiàn)回避癥狀, 最終PTSD無(wú)法緩解。路徑2是報(bào)告兒童期創(chuàng)傷的個(gè)體其尿皮質(zhì)醇降低與無(wú)法緩解的PTSD存在因果關(guān)系(Galatzer-Levy et al., 2017)。與監(jiān)督機(jī)器學(xué)習(xí)相比, 非監(jiān)督機(jī)器學(xué)習(xí)確定疾病轉(zhuǎn)歸的結(jié)果更具有不確定性。但是目前檢索到的文獻(xiàn)中并未發(fā)現(xiàn)僅僅針對(duì)兒童PTSD使用分類(lèi)或聚類(lèi)分析的研究, 可能與對(duì)機(jī)器學(xué)習(xí)預(yù)測(cè)兒童PTSD轉(zhuǎn)歸的關(guān)注較少, 非監(jiān)督機(jī)器學(xué)習(xí)的預(yù)測(cè)準(zhǔn)確率較低有關(guān)。應(yīng)用機(jī)器學(xué)習(xí)預(yù)測(cè)兒童PTSD的發(fā)展軌跡可以彌補(bǔ)傳統(tǒng)兒童PTSD長(zhǎng)期預(yù)后調(diào)查難度較大, 失訪(fǎng)率較高, 研究時(shí)限較長(zhǎng)等問(wèn)題, 也可改善既往研究中出現(xiàn)的由于兒童PTSD的遲發(fā)性, 未能持續(xù)追蹤及時(shí)發(fā)現(xiàn)PTSD癥狀, 導(dǎo)致患者錯(cuò)過(guò)最佳療愈時(shí)期的問(wèn)題。
盡管機(jī)器學(xué)習(xí)對(duì)兒童PTSD的診斷和識(shí)別具有一定優(yōu)勢(shì), 但應(yīng)用仍處于初級(jí)階段, 機(jī)遇與挑戰(zhàn)同時(shí)存在。
不同模型的預(yù)測(cè)結(jié)果可能存在差異。雖然可以通過(guò)大量的特征進(jìn)行兒童PTSD的診斷預(yù)測(cè), 但PTSD的結(jié)局包含諸多癥狀結(jié)構(gòu)和不同的嚴(yán)重程度, 對(duì)于有限的建模方法其定義相對(duì)廣泛, 可能無(wú)法保證每次運(yùn)行結(jié)果的一致性(Galatzer-Levy & Bryant, 2013)。其次目前有關(guān)兒童PTSD的機(jī)器學(xué)習(xí)研究采用監(jiān)督式較多, 對(duì)分類(lèi)器(模型)的選擇依靠人工選擇、個(gè)人對(duì)模型的理解程度, 缺乏具體的判斷標(biāo)準(zhǔn), 只能通過(guò)各種模型的不斷嘗試選擇預(yù)測(cè)概率最高的模型, 而沒(méi)有納入計(jì)算的模型, 無(wú)法進(jìn)行判斷。
預(yù)測(cè)準(zhǔn)確度仍需要提高。以往研究結(jié)果顯示, 機(jī)器學(xué)習(xí)預(yù)測(cè)準(zhǔn)確率在65%~80% (Ge et al., 2020; Gokten & Uyulan, 2021; Li et al., 2020; Saxe et al., 2017), 相較于機(jī)器學(xué)習(xí)用于其他領(lǐng)域的成熟發(fā)展, 準(zhǔn)確率相對(duì)較低。樣本量、訓(xùn)練方法和所選模型均是準(zhǔn)確率的影響因素。為推動(dòng)機(jī)器學(xué)習(xí)在兒童PTSD診斷和識(shí)別的實(shí)踐應(yīng)用, 嘗試不同樣本量、訓(xùn)練頻次和各類(lèi)模型以提高預(yù)測(cè)準(zhǔn)確度, 提升機(jī)器學(xué)習(xí)的效率十分必要。
關(guān)于治療方法的研究相對(duì)不足。早期診斷和識(shí)別兒童PTSD的目的是采取治療措施減少對(duì)兒童未來(lái)發(fā)展的影響, 排除治療方法本身的局限, 選擇適宜不同程度PTSD的治療方法對(duì)于兒童的恢復(fù)和降低復(fù)發(fā)概率至關(guān)重要, 但使用機(jī)器學(xué)習(xí)預(yù)測(cè)治療方法的相關(guān)研究在兒童PTSD中極度缺乏。早期干預(yù)決定了兒童PTSD的長(zhǎng)期健康結(jié)果, 機(jī)器學(xué)習(xí)應(yīng)用于兒童PTSD干預(yù)措施的評(píng)估和選擇是對(duì)先前診斷和識(shí)別的緊密承接, 也可能成為影響兒童PTSD發(fā)展的重要因素。
應(yīng)用于兒童PTSD診斷和識(shí)別的機(jī)器學(xué)習(xí)算法較為單一。機(jī)器學(xué)習(xí)算法可以實(shí)現(xiàn)數(shù)據(jù)的回歸、分類(lèi)和聚類(lèi), 不同算法的適用條件和運(yùn)行結(jié)果有所差異, 理論上嘗試更多的算法有助于選擇最佳模型, 提高預(yù)測(cè)準(zhǔn)確度, 但在兒童PTSD的診斷和識(shí)別領(lǐng)域, 監(jiān)督式算法較為常見(jiàn), 而非監(jiān)督式算法(如神經(jīng)網(wǎng)絡(luò)算法)和深度學(xué)習(xí)算法(如卷積網(wǎng)絡(luò)算法)相對(duì)少見(jiàn)。監(jiān)督學(xué)習(xí)可用于對(duì)已知結(jié)果的分類(lèi)分析, 既可以評(píng)估兒童PTSD的患病風(fēng)險(xiǎn), 也可以診斷高風(fēng)險(xiǎn)因素兒童患病的情況, 而非監(jiān)督學(xué)習(xí)用于對(duì)未知結(jié)果的聚類(lèi)分析, 能夠分析兒童PTSD發(fā)展的長(zhǎng)期軌跡和趨勢(shì)(Rajkomar et al., 2019)。兒童PTSD應(yīng)用機(jī)器學(xué)習(xí)最常用的算法是處理分類(lèi)問(wèn)題的決策樹(shù)(CART)、隨機(jī)森林模型等集成算法、基于核的支持向量機(jī)以及延伸傳統(tǒng)回歸的正則化回歸(lasso、ridge)算法等, 均屬于監(jiān)督式機(jī)器學(xué)習(xí)。隨機(jī)森林、支持向量機(jī)都可實(shí)現(xiàn)數(shù)據(jù)的分類(lèi)和回歸, 但支持向量機(jī)泛化能力更優(yōu), 內(nèi)存要求高, 訓(xùn)練時(shí)間長(zhǎng), 適用于小樣本數(shù)據(jù), 隨機(jī)森林無(wú)需進(jìn)行特征選擇, 計(jì)算速度快, 在很多數(shù)據(jù)集上表現(xiàn)良好, 普適性較強(qiáng), 適合處理高維數(shù)據(jù), 而對(duì)于樣本較小的數(shù)據(jù)集, 分類(lèi)效果不佳。因此我們發(fā)現(xiàn)雖然有研究同時(shí)使用多種算法, 但僅限于監(jiān)督式學(xué)習(xí)中的算法, 與廣泛的機(jī)器學(xué)習(xí)算法相比, 略顯單一。
目前, 臨床上對(duì)兒童PTSD的識(shí)別診斷主要基于各類(lèi)量表中PTSD診斷標(biāo)準(zhǔn), 結(jié)合患兒、其父母的訪(fǎng)談情況及醫(yī)生診療經(jīng)驗(yàn)進(jìn)行。而影響兒童PTSD發(fā)生與轉(zhuǎn)歸因素的識(shí)別主要依靠傳統(tǒng)回歸方法。相較于經(jīng)驗(yàn)診斷和傳統(tǒng)統(tǒng)計(jì)方法, 機(jī)器學(xué)習(xí)的優(yōu)勢(shì)集中體現(xiàn)在四個(gè)方面。
首先, 機(jī)器學(xué)習(xí)捕獲、分析兒童PTSD影響因素的能力更強(qiáng)。傳統(tǒng)的統(tǒng)計(jì)學(xué)方法如多元線(xiàn)性回歸所確定的預(yù)測(cè)因子單個(gè)預(yù)測(cè)能力較弱, 因此需要建立基于多個(gè)預(yù)測(cè)因子的多元線(xiàn)性回歸模型。PTSD的發(fā)生與其轉(zhuǎn)歸的影響因素較多, 如創(chuàng)傷后個(gè)體因素、心理社會(huì)學(xué)因素、精神病理學(xué)因素等(Trickey et al., 2012); (Rangaprakash et al., 2018; Zhang et al., 2016)。但是傳統(tǒng)統(tǒng)計(jì)學(xué)方法同時(shí)處理大量因子易降低每個(gè)預(yù)測(cè)變量的準(zhǔn)確性, 不能對(duì)數(shù)據(jù)進(jìn)行充分的挖掘, 難以對(duì)PTSD的發(fā)生與轉(zhuǎn)歸過(guò)程做到很好的預(yù)測(cè)。為保持傳統(tǒng)線(xiàn)性模型的穩(wěn)定性和可重復(fù)性, 預(yù)測(cè)因子的數(shù)量相對(duì)于樣本量必須保持較小, 因子子集之間不能高度相關(guān), 在變量的交互分析上也有相當(dāng)大的限制。此外, 影響兒童PTSD發(fā)生和轉(zhuǎn)歸的各因素之間存在交互影響, 傳統(tǒng)的加法模型不能識(shí)別數(shù)據(jù)中更復(fù)雜的非線(xiàn)性模式(Breiman, 2001; Chekroud et al., 2021)。利用機(jī)器學(xué)習(xí)可以捕獲所有相關(guān)預(yù)測(cè)因子的同時(shí)效應(yīng)(Saxe et al., 2017), 構(gòu)建出準(zhǔn)確預(yù)測(cè)兒童PTSD識(shí)別和分類(lèi)的模型, 可以根據(jù)包含多種變量和小樣本量的數(shù)據(jù)實(shí)現(xiàn)可靠因果關(guān)系推斷(Saxe et al., 2017), 更好的分析兒童PTSD這類(lèi)復(fù)雜、影響因素眾多的疾病。
其次, 機(jī)器學(xué)習(xí)的建模過(guò)程和計(jì)算原理區(qū)別于傳統(tǒng)方法。機(jī)器學(xué)習(xí)研究將重點(diǎn)轉(zhuǎn)移到模型的整體預(yù)測(cè)能力上, 可以通過(guò)直接針對(duì)感興趣的現(xiàn)象建立預(yù)測(cè)分類(lèi)模型并測(cè)試這些模型的穩(wěn)定性和準(zhǔn)確性, 而無(wú)需數(shù)據(jù)生成模型和系數(shù)估計(jì)(Chekroud et al., 2021), 從而避免了估算準(zhǔn)確可變系數(shù)和建模的誤差(Saxe et al., 2017)。在分析影響兒童PTSD的風(fēng)險(xiǎn)因素時(shí), 機(jī)器學(xué)習(xí)并不像傳統(tǒng)回歸方法一樣以方差分析來(lái)識(shí)別關(guān)系, 對(duì)變量和樣本量的要求不高, 不會(huì)因?yàn)樽兞恐g的共線(xiàn)性影響導(dǎo)致運(yùn)算錯(cuò)誤概率的增加, 在匹配疾病的多病因和異質(zhì)性結(jié)果方面的能力更好(Galatzer-Levy et al., 2014)。機(jī)器學(xué)習(xí)充分考慮所研究對(duì)象的特征, 從而產(chǎn)生更準(zhǔn)確的預(yù)測(cè)結(jié)果, 但以往建模是以實(shí)現(xiàn)結(jié)果均衡為目的, 在一定程度上并不符合研究對(duì)象特征, 也需要更多的指標(biāo)輔助驗(yàn)證和判別真實(shí)結(jié)果。機(jī)器學(xué)習(xí)不僅僅作為一個(gè)用于組合和探索更大數(shù)據(jù)集的分析工具, 也標(biāo)志著研究范式的轉(zhuǎn)變(Chekroud et al., 2021)。
第三, 對(duì)于研究產(chǎn)出, 機(jī)器學(xué)習(xí)可以做到在非實(shí)驗(yàn)數(shù)據(jù)集中啟用因果推理。當(dāng)數(shù)據(jù)不是來(lái)自隨機(jī)對(duì)照實(shí)驗(yàn)時(shí), 傳統(tǒng)的廣義線(xiàn)性模型揭示因果關(guān)系的能力有限, 然而在有關(guān)創(chuàng)傷危險(xiǎn)因素的研究中, 實(shí)驗(yàn)設(shè)計(jì)是違背倫理的, 在這種情況下, 機(jī)器學(xué)習(xí)方法也能在非實(shí)驗(yàn)數(shù)據(jù)集中進(jìn)行因果關(guān)系的檢驗(yàn)。
最后, 與人為診斷的方式相比, 機(jī)器學(xué)習(xí)綜合判斷多種影響因素, 特征存儲(chǔ)、提取能力和速度比人工更強(qiáng)更快, 分析數(shù)據(jù)更為客觀(guān)。通過(guò)人為診斷和識(shí)別兒童PTSD方法容易受到主觀(guān)理解偏差的影響。兒童自述癥狀不清、父母代替回答過(guò)程中出現(xiàn)的轉(zhuǎn)述誤差都會(huì)影響診斷的準(zhǔn)確性。機(jī)器學(xué)習(xí)的方法或許更適用于人群的PTSD識(shí)別。當(dāng)災(zāi)難(如自然災(zāi)害、疫情等)作為一種群體心理健康的應(yīng)激源導(dǎo)致了人群PTSD, 機(jī)器學(xué)習(xí)可以迅速高效的篩選出潛在或高危PTSD患者, 節(jié)約了人力成本, 也可以避免情緒傳遞給救助人員帶來(lái)心理創(chuàng)傷。隨后及時(shí)為這部分人群提供早期心理干預(yù), 則有助于節(jié)約醫(yī)療資源。
從理論上, 第一, 機(jī)器學(xué)習(xí)突破了傳統(tǒng)回歸方法可納入變量有限性的局限, 降低了對(duì)變量的要求, 減少了前提假設(shè)的限制。算法上的非線(xiàn)性擬合更符合兒童PTSD的實(shí)際情況, 提高了預(yù)測(cè)的準(zhǔn)確率。第二, 機(jī)器學(xué)習(xí)為預(yù)測(cè)兒童PTSD的模型構(gòu)建打開(kāi)了新思路。為適應(yīng)PTSD的特征機(jī)器學(xué)習(xí)需構(gòu)建新模型, 推動(dòng)了更多算法的研發(fā)和驗(yàn)證, 而隨著數(shù)據(jù)量的累積將加速理論模型應(yīng)用于實(shí)踐的進(jìn)程。第三, 機(jī)器學(xué)習(xí)彌補(bǔ)了傳統(tǒng)模型中外部驗(yàn)證不足的問(wèn)題。模型預(yù)測(cè)的方法雖然在概念預(yù)測(cè)中表現(xiàn)出較高的準(zhǔn)確性(Galatzer-Levy et al., 2014, 2017; Karstoft et al., 2015), 但需要外部驗(yàn)證作為評(píng)估預(yù)測(cè)模型外推的黃金標(biāo)準(zhǔn), 而在PTSD預(yù)測(cè)模型的文獻(xiàn)中關(guān)于外部驗(yàn)證的文獻(xiàn)較為缺乏, 因此阻礙了此類(lèi)方法在臨床中的應(yīng)用 (Altman et al., 2009; Schultebrauck & Galatzer- Levy, 2019; Schultebraucks, Shalev, et al., 2020)。機(jī)器學(xué)習(xí)自然的將數(shù)據(jù)集分為訓(xùn)練集與驗(yàn)證集, 同時(shí)包含了模型的內(nèi)外部驗(yàn)證, 提高了理論到臨床應(yīng)用的速度。
從實(shí)踐上, 機(jī)器學(xué)習(xí)應(yīng)用于臨床將有助于節(jié)約人力成本和醫(yī)療資源。其快速準(zhǔn)確進(jìn)行轉(zhuǎn)歸預(yù)測(cè)的優(yōu)勢(shì)可以避免重復(fù)就醫(yī), 輔助醫(yī)生確診和判斷病情。同時(shí)機(jī)器學(xué)習(xí)應(yīng)用于PTSD的早期預(yù)測(cè)和干預(yù)降低了后期健康結(jié)果惡化的風(fēng)險(xiǎn)。尤其對(duì)于兒童而言, 機(jī)器學(xué)習(xí)應(yīng)用于PTSD的診斷可以減少其對(duì)生命歷程的影響, 降低PTSD的長(zhǎng)期疾病負(fù)擔(dān)。此外, 機(jī)器學(xué)習(xí)若應(yīng)用于人群的心理健康干預(yù)還對(duì)提高群體健康水平有顯著效益。例如自然災(zāi)害的發(fā)生常伴隨人群出現(xiàn)PTSD癥狀, 而缺乏心理專(zhuān)家的有效干預(yù)措施會(huì)導(dǎo)致精神健康狀況被忽視, 引入機(jī)器學(xué)習(xí)方法將大范圍解決人群PTSD的識(shí)別, 或能減少因人群的健康損失帶來(lái)的各種社會(huì)問(wèn)題。
機(jī)器學(xué)習(xí)在兒童PTSD識(shí)別和轉(zhuǎn)歸預(yù)測(cè)上有一定的方法學(xué)優(yōu)勢(shì), 但預(yù)測(cè)兒童PTSD的指標(biāo)本身存在一些問(wèn)題, 也會(huì)成為機(jī)器學(xué)習(xí)發(fā)展的制約或機(jī)遇。首先, 收集預(yù)測(cè)指標(biāo)困難。預(yù)測(cè)PTSD的指標(biāo)數(shù)據(jù)主要來(lái)源于醫(yī)院的臨床問(wèn)診和患者自述, 源于醫(yī)院的指標(biāo)數(shù)據(jù)相對(duì)較多, 應(yīng)用臨床的指標(biāo)與患者的自我報(bào)告相比, 預(yù)測(cè)結(jié)果更為準(zhǔn)確(Schultebraucks, Shalev, et al., 2020)。然而現(xiàn)實(shí)情況是突發(fā)創(chuàng)傷事件發(fā)生后少有醫(yī)療機(jī)構(gòu)及時(shí)的收集數(shù)據(jù), 研究表明僅有7%的一級(jí)創(chuàng)傷中心進(jìn)行了PTSD的篩查工作(Love & Zatzick, 2014)。因此在預(yù)測(cè)PTSD時(shí), 收集指標(biāo)數(shù)據(jù)成為預(yù)測(cè)的首要阻礙。此外, 收集指標(biāo)過(guò)程中出現(xiàn)的過(guò)失誤差、系統(tǒng)誤差也可能存在。盡管機(jī)器學(xué)習(xí)無(wú)法解決數(shù)據(jù)來(lái)源的問(wèn)題, 但如何提高其預(yù)測(cè)能力, 減少過(guò)失誤差和降低系統(tǒng)誤差需要進(jìn)一步探討。第二, 確認(rèn)準(zhǔn)確的預(yù)測(cè)指標(biāo)困難。盡管導(dǎo)致PTSD的因素多種多樣, 但并非所有的因素都可以作為有效的預(yù)測(cè)指標(biāo), 例如患者自我報(bào)告的心理壓力就還未被納入醫(yī)療診斷的標(biāo)準(zhǔn)(Schultebraucks, Shalev, et al., 2020)。所以準(zhǔn)確識(shí)別、確認(rèn)風(fēng)險(xiǎn)因素與PTSD的關(guān)系, 將其作為判斷指標(biāo)仍需要實(shí)證研究的反復(fù)驗(yàn)證。這一過(guò)程是漫長(zhǎng)而不確定的, 也將導(dǎo)致預(yù)測(cè)成本的增加。如何應(yīng)用機(jī)器學(xué)習(xí)強(qiáng)大的數(shù)據(jù)處理能力, 通過(guò)不斷重復(fù)的高速運(yùn)算, 快速的排除無(wú)關(guān)因素, 構(gòu)建更為準(zhǔn)確的醫(yī)療診斷預(yù)測(cè)指標(biāo)體系或許會(huì)成為今后值得研究的方向。第三, 潛在預(yù)測(cè)指標(biāo)可能被遺漏。PTSD的復(fù)雜性決定了不能僅依靠某個(gè)獨(dú)立指標(biāo)進(jìn)行預(yù)測(cè), 但與之相關(guān)的生理、心理方面的指標(biāo)又是繁雜的, 如生物應(yīng)激響應(yīng)、免疫反應(yīng)、威脅感知和心理社會(huì)決定因素等(Hinrichs et al., 2019; Michopoulos et al., 2017; Schultebraucks et al., 2019; Shalev et al., 2017), 如何選擇指標(biāo), 避免遺漏潛在指標(biāo)造成預(yù)測(cè)偏倚有待進(jìn)一步研究。
機(jī)器學(xué)習(xí)作為數(shù)據(jù)預(yù)測(cè)和分類(lèi)的有效方法, 應(yīng)用于PTSD領(lǐng)域需要隨著PTSD研究的深入不斷更新。當(dāng)出現(xiàn)越來(lái)越多新類(lèi)型的PTSD, 如DSM-5中正式確認(rèn)的分離性PTSD (Hagan et al., 2018), 機(jī)器學(xué)習(xí)的新算法迭代能否滿(mǎn)足所出現(xiàn)疾病的識(shí)別和診斷需求, 決定了臨床應(yīng)用的可行性和效率。目前機(jī)器學(xué)習(xí)的診斷準(zhǔn)確率并不穩(wěn)定, 依然需要臨床診斷的金標(biāo)準(zhǔn)來(lái)檢驗(yàn)。在收集原始數(shù)據(jù)時(shí)也是通過(guò)問(wèn)診、問(wèn)卷調(diào)研等基礎(chǔ)傳統(tǒng)的方式, 而隨著機(jī)器學(xué)習(xí)模型和預(yù)測(cè)指標(biāo)的不斷精準(zhǔn)完善, 相信機(jī)器學(xué)習(xí)預(yù)測(cè)準(zhǔn)確性很有可能超越醫(yī)生診斷, 成為新的金標(biāo)準(zhǔn)。同時(shí)物聯(lián)網(wǎng)等新型科技和智慧醫(yī)療也在持續(xù)發(fā)展, 未來(lái)也有機(jī)會(huì)實(shí)現(xiàn)從數(shù)據(jù)收集到分析預(yù)測(cè)全過(guò)程的技術(shù)升級(jí), 幫助人們更高效便捷的進(jìn)行疾病的科學(xué)預(yù)測(cè)。與此同時(shí)對(duì)深度學(xué)習(xí)的持續(xù)性探索以及大數(shù)據(jù)環(huán)境都為兒童PTSD的診斷和識(shí)別提供了良好的發(fā)展環(huán)境和進(jìn)步空間。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)中較新的研究方向, 其中進(jìn)化機(jī)器學(xué)習(xí)(Evolutionary Machine Learning)應(yīng)用于精神健康領(lǐng)域解決了很多復(fù)雜的模式識(shí)別難題, 推動(dòng)了人工智能相關(guān)技術(shù)的進(jìn)步, 也很可能成為未來(lái)兒童PTSD領(lǐng)域研究的突破口。另一方面大數(shù)據(jù)時(shí)代的海量信息也為機(jī)器學(xué)習(xí)的應(yīng)用提供了前提, 將有助于兒童PTSD診斷和識(shí)別技術(shù)盡快投入臨床實(shí)踐, 持續(xù)發(fā)展。
目前機(jī)器學(xué)習(xí)已經(jīng)滲透到普通人的生活之中, 也正在不斷與大數(shù)據(jù)技術(shù)以及其他學(xué)科互相融合、交叉發(fā)展, 如天氣預(yù)測(cè)、搜索引擎、營(yíng)銷(xiāo)策略等都應(yīng)用了機(jī)器學(xué)習(xí)技術(shù)進(jìn)行數(shù)據(jù)分析, 逐漸改變了人們的生活方式。將機(jī)器學(xué)習(xí)算法應(yīng)用于兒童PTSD領(lǐng)域, 可以預(yù)測(cè)PTSD的發(fā)生發(fā)展情況以及可能的長(zhǎng)期結(jié)局。其優(yōu)勢(shì)是可以減少人為診斷兒童PTSD的主觀(guān)性, 并且效率較高, 適合大范圍內(nèi)的篩查工作, 節(jié)約長(zhǎng)期跟蹤隨訪(fǎng)所需要的人力物力資源, 在此基礎(chǔ)上提供預(yù)防性干預(yù)策略。然而機(jī)器學(xué)習(xí)應(yīng)用于兒童PTSD領(lǐng)域還處于探索階段, 對(duì)最優(yōu)模型以及變量的選擇還需要更多的證據(jù)支持, 算法也相對(duì)單一, 導(dǎo)致預(yù)測(cè)結(jié)果的準(zhǔn)確性有待提高。隨著未來(lái)我國(guó)醫(yī)療大健康產(chǎn)業(yè)的發(fā)展, 機(jī)器學(xué)習(xí)作為方法學(xué)工具在精神病學(xué)領(lǐng)域?qū)l(fā)揮巨大的潛力。相信未來(lái)兒童PTSD的機(jī)器學(xué)習(xí)實(shí)踐應(yīng)用也會(huì)迅速發(fā)展, 為早期預(yù)防或治療兒童PTSD提供指導(dǎo)建議。
周志華. (2018).. 清華大學(xué)出版社.
Alisic, E., Zalta, A. K., van Wesel, F., Larsen, S. E., Hafstad, G. S., Hassanpour, K., & Smid, G. E. (2014). Rates of post-traumatic stress disorder in trauma-exposed children and adolescents: Meta-analysis.(5), 335–340. https://doi.org/10.1192/bjp.bp.113.131227
Al-Sahaf, H., Bi, Y., Chen, Q., Lensen, A., Mei, Y., Sun, Y., Tran, B., Xue, B., & Zhang, M. (2019). A survey on evolutionary machine learning.,(2), 205–228. https://doi.org/ 10.1080/03036758.2019.1609052
Altman, D. G., Vergouwe, Y., Royston, P., & Moons, K. G. M. (2009). Prognosis and prognostic research: Validating a prognostic model.,, b605. https://doi.org/10.1136/bmj.b605
Bedi, G., Carrillo, F., Cecchi, G. A., Slezak, D. F., Sigman, M., Mota, N. B., … Corcoran, C. M. (2015). Automated analysis of free speech predicts psychosis onset in high-riskyouths.,, 1–7.
Bonanno, G. A. (2004). Loss, trauma, and human resilience: Have we underestimated the human capacity to thrive after extremely aversive events?,(1), 20–28. https://doi.org/10.1037/0003-066X.59.1.20
Bonanno, G. A., & Diminich, E. D. (2013). Annual research review: Positive adjustment to adversity—Trajectories of minimal-impact resilience and emergent resilience.,(4), 378–401. https://doi.org/10.1111/jcpp.12021
Bonanno, G. A., Westphal, M., & Mancini, A. D. (2011). Resilience to loss and potential trauma.,, 511–535. https://doi.org/10.1146/ annurev-clinpsy-032210-104526
Breiman, L. (2001). Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author).,(3), 199–231. https://doi.org/10.1214/ss/1009213726
Brownlee, J. (2016).. https://max.book118.com/html/2018/0818/8042001075001120.shtm
Bryant, R. A., Nickerson, A., Creamer, M., O’Donnell, M., Forbes, D., Galatzer-Levy, I., McFarlane, A. C., & Silove, D. (2015). Trajectory of post-traumatic stress following traumatic injury: 6-year follow-up.,(5), 417–423. https://doi.org/10.1192/bjp. bp.114.145516
Cancilliere, M. K., Kavanaugh, B., Bodzy, M., & Holler, K. (2021). Psychiatric outcomes of childhood maltreatment: A retrospective chart review from a children’s psychiatric inpatient program., https://doi.org/10.1007/s10578-021-01209-3
Chekroud, A. M., Bondar, J., Delgadillo, J., Doherty, G., Wasil, A., Fokkema, M., ... Choi, K. (2021). The promise of machine learning in predicting treatment outcomes in psychiatry.,(2), 154–170. https://doi.org/10.1002/wps.20882
Cheng, J., Liang, Y. M., Zhou, Y. Y., Eli, B., & Liu, Z. K. (2019). Trajectories of PTSD symptoms among children who survived the Lushan earthquake: A four-year longitudinal study.,(1), 421–427. https://doi.org/10.1016/j.jad.2019.04.047
de Young, A. C., & Landolt, M. A. (2018). PTSD in children below the age of 6 years.,(11), 97. https://doi.org/10.1007/s11920-018-0966-z
Galatzer-Levy, I. R., & Bryant, R. A. (2013). 636, 120 ways to have posttraumatic stress disorder.,(6), 651–662. https://doi.org/10. 1177/1745691613504115
Galatzer-Levy, I. R., Huang, S. H., & Bonanno, G. A. (2018). Trajectories of resilience and dysfunction following potential trauma: A review and statistical evaluation.,, 41–55. https://doi.org/ 10.1016/j.cpr.2018.05.008
Galatzer-Levy, I. R., Karstoft, K.-I., Statnikov, A., & Shalev, A. Y. (2014). Quantitative forecasting of PTSD from early trauma responses: A machine learning application.,, 68–76. https://doi.org/10. 1016/j.jpsychires.2014.08.017
Galatzer-Levy, I. R., Ma, S., Statnikov, A., Yehuda, R., & Shalev, A. Y. (2017). Utilization of machine learning for prediction of post-traumatic stress: A re-examination of cortisol in the prediction and pathways to non-remitting PTSD.,(3), e1070. https://doi. org/10.1038/tp.2017.38
Ge, F., Li, Y., Yuan, M., Zhang, J., & Zhang, W. (2020). Identifying predictors of probable posttraumatic stress disorder in children and adolescents with earthquake exposure: A longitudinal study using a machine learning approach.,, 483–493. https://doi.org/10.1016/j.jad.2019.11.079
Gokten, E. S., & Uyulan, C. (2021). Prediction of the development of depression and post-traumatic stress disorder in sexually abused children using a random forest classifier.,, 256–265. https://doi.org/10.1016/j.jad.2020.10.006
Hagan, M. J., Gentry, M., Ippen, C. G., & Lieberman, A. F. (2018). PTSD with and without dissociation in young children exposed to interpersonal trauma.,, 536–541. https://doi.org/10. 1016/j.jad.2017.11.070
Hiller, R. M., Meiser-Stedman, R., Fearon, P., Lobo, S., McKinnon, A., Fraser, A., & Halligan, S. L. (2016). Research Review: Changes in the prevalence and symptom severity of child post-traumatic stress disorder in the year following trauma – A meta-analytic study.,(8), 884–898. https://doi.org/10.1111/jcpp. 12566
Hinrichs, R., van Rooij, S. J. H., Michopoulos, V., Schultebraucks, K., Winters, S., Maples-Keller, J., ... Jovanovic, T. (2019). Increased skin conductance response in the immediate aftermath of trauma predicts PTSD risk.,. https://doi.org/10.1177/2470547019844441
Jensen, T. K., Skar, A. M. S., Andersson, E. S., & Birkeland, M. S. (2019). Long-term mental health in unaccompanied refugee minors: Pre- and post-flight predictors.,(12), 1671–1682. https://doi.org/10.1007/s00787-019-01340-6
Jensen, T. K., Sk?rdalsmo, E. B. M., & Fjermestad, K. W. (2014). Development of mental health problems—A follow-up study of unaccompanied refugee minors.,(1), 29–39. https://doi.org/10.1186/1753-2000-8-29
Jones, D. T. (2019). Setting the standards for machine learning in biology.,, 659–660. https://doi.org/10.1038/s41580- 019-0176-5
Karstoft, K.-I., Galatzer-Levy, I. R., Statnikov, A., Li, Z., & Shalev, A. Y. (2015). Bridging a translational gap: Using machine learning to improve the prediction of PTSD.,, 30. https://doi.org/10. 1186/s12888-015-0399-8
Kelly, J., Gooding, P., Pratt, D., Ainsworth, J., Welford, M., & Tarrier, N. (2012). Intelligent real-time therapy: Harnessing the power of machine learning to optimise the delivery of momentary cognitive-behavioural interventions.,(4), 404–414. https://doi.org/ 10.3109/09638237.2011.638001
Koprowski, R., & Foster, K. R. (2018). Machine learning and medicine: Book review and commentary.,(1), 17. https://doi.org/10.1186/ s12938-018-0449-9
Lai, B. S., Lewis, R., Livings, M. S., La Greca, A. M., & Esnard, A.-M. (2017). Posttraumatic stress symptom trajectories among children after disaster exposure: A review.,(6), 571–582. https://doi.org/10.1002/jts.22242
Li, L., Pan, N., Zhang, L., Lui, S., Huang, X., Xu, X., Wang, S., Lei, D., Li, L., Kemp, G. J., & Gong, Q. (2020). Hippocampal subfield alterations in pediatric patients with post-traumatic stress disorder.,(3), 334–344. https://doi.org/ 10.1093/scan/nsaa162
Love, J., & Zatzick, D. (2014). Screening and intervention for comorbid substance disorders, PTSD, depression, and suicide: A trauma center survey.,(7), 918–923. https://doi.org/10.1176/appi.ps.201300399
Masten, A. S., & Narayan, A. J. (2012). Child development in the context of disaster, war, and terrorism: Pathways of risk and resilience.,, 227–257. https://doi.org/10.1146/annurev-psych-120710-100356
Michopoulos, V., Powers, A., Gillespie, C. F., Ressler, K. J., & Jovanovic, T. (2017). Inflammation in fear- and anxiety-based disorders: PTSD, GAD, and beyond.,(1), 254–270. https://doi. org/10.1038/npp.2016.146
Mueller, A., Candrian, G., Kropotov, J. D., Ponomarev, V. A., & Baschera, G.-M. (2010). Classification of ADHD patients on the basis of independent ERP components using a machine learning system.,(S1), 1–12. https://doi.org/10.1186/1753-4631-4-s1-s1
Rajkomar, A., Dean, J., & Kohane, I. (2019). Machine learningin medicine.,(14), 1347–1358.
Ramos-Lima, L. F., Waikamp, V., Antonelli-Salgado, T., Passos, I. C., & Freitas, L. H. M. (2020). The use of machine learning techniques in trauma-related disorders: A systematic review.,, 159–172. https://doi.org/10.1016/j.jpsychires.2019.12.001
Rangaprakash, D., Dretsch, M. N., Venkataraman, A., Katz, J. S., Denney, T. S. J., & Deshpande, G. (2018). Identifying disease foci from static and dynamic effective connectivity networks: Illustration in soldiers with trauma.,(1), 264–287. https://doi.org/10. 1002/hbm.23841
Saxe, G. N., Ma, S., Ren, J., & Aliferis, C. (2017). Machine learning methods to predict child posttraumatic stress: A proof of concept study.,(1), 223. https://doi.org/10.1186/s12888-017-1384-1
Scheeringa, M. S., Wright, M. J., Hunt, J. P., & Zeanah, C. H. (2006). Factors affecting the diagnosis and prediction of PTSD symptomatology in children and adolescents.,(4), 644–651. https://doi.org/ 10.1176/ajp.2006.163.4.644
Schultebrauck, K., & Galatzer-Levy, I. R. (2019). Machine learning for prediction of posttraumatic stress and resilience following trauma: An overview of basic concepts and recent advances.,(2), 215–225. https://doi.org/10.1002/jts.22384
Schultebraucks, K., Rombold-Bruehl, F., Wingenfeld, K., Hellmann-Regen, J., Otte, C., & Roepke, S. (2019). Heightened biological stress response during exposure to a trauma film predicts an increase in intrusive memories.,(7), 645–657. https://doi.org/10.1037/abn0000440
Schultebraucks, K., Shalev, A. Y., Michopoulos, V., Grudzen, C. R., Shin, S.-M., Stevens, J. S., ... Galatzer-Levy, I. R. (2020). A validated predictive algorithm of post- traumatic stress course following emergency department admission after a traumatic stressor.,(7), 1084–1088. https://doi.org/10.1038/s41591-020-0951-z
Schultebraucks, K., Yadav, V., Shalev, A. Y., Bonanno, G. A., & Galatzer-Levy, I. R. (2020). Deep learning-based classification of posttraumatic stress disorder and depression following trauma utilizing visual and auditory markers of arousal and mood., 1–11. https://doi.org/10.1017/S0033291720002718
Shalev, A., Liberzon, I., & Marmar, C. (2017). Post-traumatic stress disorder.,(25), 2459–2469. https://doi.org/10.1056/ NEJMra1612499
Sumathi, M., & Poorna, D. B. (2016). Prediction of mental health problems among children using machine learning techniques.,(1), 552–557. https://doi.org/ 10.14569/ijacsa.2016.070176
Takahashi, Y., Yoshizoe, K., Ueki, M., Tamiya, G., Zhiqian, Y., Utsumi, Y., ... Tomita, H. (2020). Machine learning to reveal hidden risk combinations for the trajectory of posttraumatic stress disorder symptoms.,(1), 21726. https://doi.org/10.1038/s41598-020-78966-z
Trickey, D., Siddaway, A. P., Meiser-Stedman, R., Serpell, L., & Field, A. P. (2012). A meta-analysis of risk factors for post-traumatic stress disorder in children and adolescents.,(2), 122–138. https://doi. org/10.1016/j.cpr.2011.12.001
Ucuz, I., Ari, A., Ozcan, O. O., Topaktas, O., Sarraf, M., & Dogan, O. (2020). Estimation of the development of depression and PTSD in children exposed to sexual abuse and development of decision support systems by using artificial intelligence., 1–13. https://doi.org/10.1080/10538712.2020.1841350
Weathers, F. W., Litz, B. T., Keane, T. M., Palmieri, P. A., Marx, B. P., & Schnurr, P. P. (2013).. National Center for PTSD, 5(August), 2002. https://www.ptsd.va.gov/professional/assessment/ documents/PCL-5_LEC_criterionA.pdf
Worthington, M. A., Mandavia, A., & Richardson-Vejlgaard, R. (2020). Prospective prediction of PTSD diagnosis in a nationally representative sample using machine learning.,(1), 532. https://doi.org/ 10.1186/s12888-020-02933-1
Yehuda, R., Halligan, S. L., & Grossman, R. (2001). Childhood trauma and risk for PTSD: Relationship to intergenerational effects of trauma, parental PTSD, and cortisol excretion.,(3), 733–753. https://doi.org/10.1017/S0954579401003170
Zandvakili, A., Philip, N. S., Jones, S. R., Tyrka, A. R., Greenberg, B. D., & Carpenter, L. L. (2019). Use of machine learning in predicting clinical response to transcranial magnetic stimulation in comorbid posttraumatic stress disorder and major depression: A resting state electroencephalography study.,(1), 47–54. https://doi.org/10.1016/j.jad.2019.03.077
Zhang, Q., Wu, Q., Zhu, H., He, L., Huang, H., Zhang, J., & Zhang, W. (2016). Multimodal MRI-based classification of trauma survivors with and without post-traumatic stress disorder.,(JUN), 1–9. https://doi.org/10.3389/fnins.2016.00292
Application of machine learning in prognosis and trajectory of post-traumatic stress disorder in children
LIU Xiaohan, CHEN Minglong, GUO Jing
(School of Public Health, Peking University, Beijing 100191, China)
Post-traumatic stress disorder (PTSD) could have negative effects on the development of children, and its impact can even last into adulthood. However, the traditional diagnostic methods are difficult to quickly, objectively and accurately identify and diagnose PTSD in children. Machine learning, as an emerging method to deal with a large number of variables and data, has gradually been applied to the research of early prediction, recognition and auxiliary diagnosis of PTSD in children. Machine learning, with its advantages in performance and algorithm, can be applied to the recognition and prognosis of PTSD in children. Compared with self-reported diagnosis, the process of identifying and diagnosing PTSD in children through machine learning has unique advantages of high efficiency, objective accuracy and resource saving. However, machine learning has limitations in terms of hardware cost, algorithm selection and prediction accuracy. In the future, researchers need to further improve the accuracy of machine learning diagnosis and children’s PTSD recognition, and explore more combinations of machine learning and traditional diagnosis methods.
machine learning, post-traumatic stress disorder, prognosis, children
2021-05-06
*國(guó)家自然科學(xué)基金項(xiàng)目(82173636)。
郭靜, E-mail: jing624218@163.com
R395