潘云菲 胡夢杰 趙費敏 任菁菁
據世界衛(wèi)生組織保守估計,2010年全球范圍內肌少癥患者超過5 000萬,預計2050年患病人數將高達5億[1]。數據顯示,≥65歲人群中有近1/3患肌少癥,患病率為14%~33%;≥80歲人群患病率則高達50%~60%[2]。肌少癥導致身體活動能力低下,生活質量降低[3]。循證醫(yī)學證據顯示,肌少癥是老年人群跌倒、抑郁等疾病的重要危險因素[4-6],且被證實對各種疾病的預后都有影響,增加再入院率,延長住院時間,極大加重了個人及社會負擔[3]。肌少癥的診斷需包括肌肉質量、肌肉力量及軀體功能等多方面評估,傳統(tǒng)診斷方法繁瑣、耗時,分割效果受操作者差異限制,因此衛(wèi)生服務效能和效率均較低[7]。近年來,人工智能(artifical intelligence,AI)在數據、算法、算力驅動下迅速發(fā)展,在醫(yī)學影像學領域基本實現人體成分自動分割,診斷效能較好,故被用于構建肌少癥AI診斷模型,以期簡單、準確地診斷及管理肌少癥。本文就近年來AI在肌少癥診斷中的應用現狀與前景作一綜述。
1.1 肌少癥的定義及疾病影響 1989年Rosenberg等[8]首先提出了肌少癥的概念,用以表示在正常增齡過程中肌肉(不含脂肪的骨骼肌肌肉組織)的丟失。此后隨著概念逐漸擴展,肌少癥又包含了肌肉力量和肌肉功能等方面的內容。2010年,歐洲老年人肌少癥工作組(European Working Group on Sarcopenia in Older People,EWGSOP)將肌少癥定義為與增齡相關的進行性骨骼肌量減少、伴有肌肉力量和(或)肌肉功能減退的綜合征,并可能導致跌倒、殘疾、生活質量下降等不良后果。研究表明肌少癥影響多種疾病預后,其在慢性心力衰竭[9]、腫瘤性疾病(如胃癌[10]、直腸癌[11-13]、肺癌[14])預后中的預測價值也已被證實。
1.2 肌少癥的發(fā)病機制 肌少癥發(fā)病機制十分復雜,目前仍處于研究和探索階段,一般認為與年齡、炎癥、運動、蛋白攝入、激素、遺傳等因素有關,免疫失調、神經病變、線粒體異常、脂質累積、胰島素抵抗、運動神經元退化、骨骼肌蛋白合成與分解代謝失衡、細胞因子的動態(tài)調節(jié)失衡等都可能引發(fā)或加劇肌少癥[15]。
1.3 肌少癥的診斷 肌少癥的診斷標準較多,EWGSOP、國際肌少癥工作組(International Working Group on Sarcopenia,IWGS)、亞洲肌少癥工作組(Asian Working Group for Sarcopenia,AWGS)先后提出了觀點相仿的診斷標準,主要從肌量減少、肌力下降及軀體功能減退等3個方面展開評估。(1)肌肉質量/數量的評估:MRI和CT被認為是非侵入性評估的金標準,能夠精準區(qū)分肌肉組織和脂肪組織,但存在設備成本高、缺乏便攜性等問題,暫不作為臨床常用評估手段。雙能X射線吸收測定法(dual energy X-ray absorptiometry,DXA)較前兩種方法在臨床上使用更廣泛,電離輻射小,測量較為簡便,是目前最常用的方法之一。生物電阻抗測量分析(bioimpedance analysis,BIA)設備價格低,攜帶使用方便,是肌少癥篩查的重要手段;但診斷易受機體含水量及其他因素的影響,評估結果有一定誤差。(2)肌肉力量的評估:握力檢測容易操作且與日常生活能力、住院時間的長短等有關[16],因此被推薦作為評估肌肉力量的最佳臨床指標。(3)軀體功能評估:目前測量軀體功能方法較多,如步速測定、簡易體能狀況量表評估和起坐試驗等,其中步速法更為實用。此外,EWGSOP及AWGS最新提出的共識推薦使用簡易五項評分問卷或小腿圍測量等方法對肌少癥進行初步篩查,如篩查陽性再進行肌肉力量、軀體功能和肌肉質量/數量等。
1.4 肌少癥的治療 運動干預和營養(yǎng)干預是目前肌少癥治療的基石,兩者結合能夠獲得較好效果,但仍需進一步研探最佳方案?,F有藥物治療肌少癥的證據仍不夠充分,血流限制、神經肌肉電刺激、振動等其他治療手段確切的臨床益處仍不確定??傮w來講,目前肌少癥治療多采用運動聯合營養(yǎng)干預。在常規(guī)臨床實踐中,早期篩查、早期診斷和早期干預肌少癥及其危險因素對提高老年人生活質量、減少并發(fā)癥、避免嚴重后果具有重要意義。
2.1 AI應用領域 AI是基于計算機程序的智能實體,能夠模擬人類進行學習、推理和自我校正,并根據環(huán)境認知最大限度地模擬人類智能[17],完成傳統(tǒng)意義上的依賴人的智力才能完成的復雜工作,涵蓋計算機科學、統(tǒng)計學、社會科學等學科,擁有較強的大數據存儲和分析能力,涉及機器人、語言識別、圖像識別、自然語言處理、機器學習和專家系統(tǒng)等多個領域[18]。近年來,AI在數據、算法、算力的驅動下迅速發(fā)展,醫(yī)學領域應用AI有助于提高圖像識別、遺傳學和基因組學分析、智能診療、預測預后等方面的準確性;在輔助診療、減輕醫(yī)生的數據分析壓力方面,準確性可接近人類專家水平[19]。
2.2 機器學習(machine learning,ML)及其在醫(yī)學領域的主要應用 ML是AI的主要亞類,其原理是通過算法進行數據集中學習并作出準確預測,通常不需明確的程序設定。ML的常用算法包括支持向量機、決策樹、隨機森林和神經網絡等[20]。其中支持向量機、決策樹等已被廣泛應用于心肌梗死預測、病理識別及術式改進等方向[21]。深度學習(deep learning,DL)是基于神經網絡的一種ML算法,采用多個非線性處理層對數據信息進行逐層提取,通過分析高維數據檢測超出人類識別能力的細微變化并挖掘更深層次的特征,從而實現圖像分割和分類預測。因DL可直接應用原始數據而避免信息丟失,且在數據規(guī)模較大、預測任務復雜時表現出更高的效率,因而成為當前研究熱點[21-22]。近年來,作為DL代表算法之一的卷積神經網絡在人體成分自動分割方面展現了良好的效能,如Roth等[23]利用卷積神經網絡構建模型實現CT圖像上胰腺的自動定位與分割;Yan等[24]利用DL識別局部解剖結構并對人體部位進行定位等。
人體成分的分析對診斷肌少癥非常重要。對肌肉和脂肪組織進行分割,傳統(tǒng)方法是由醫(yī)師手工分割完成,效果較好但耗時較長,同時由于醫(yī)師技能存在個體差異,結果往往較難復制[25]。半自動化的分割方法需要人工修正錯誤或進行復雜的手工制作[26],受限于人力資源和時間需求,通常不能應用于大型數據集。這也是CT、MRI檢查在臨床上廣泛應用,但在臨床實踐中難以推廣的原因,因缺乏自動化分割測量工具,實際分割工作依舊繁瑣、耗時及昂貴,且易受操作者差異限制,衛(wèi)生服務效能和效率并不高[7]。因此,基于AI的自動化分割成為目前大部分肌少癥AI診斷模型構建的研究熱點。
3.1 基于影像學 目前大部分研究將肌少癥作為影像學標志物,使用DL,特別是卷積神經網絡方法進行人體成分的自動分割,效果較為理想。大部分研究構建的肌少癥診斷模型利用CT/MRI圖像,在第3腰椎(L3)水平(因L3水平骨骼肌和脂肪組織對應于全身的組織,故被認為是人體成分分析的標準標志[27])進行人體成分自動分割,少部分研究則在第12胸椎(T12)、L4、L5-第1骶椎(S1)水平等進行人體成分自動分割,得到特定層面的骨骼肌橫截面積(cm2),使用預定的回歸方程,與身高的平方(m2)進行標準化處理,得到骨骼肌指數(cm2/m2),并用以估計全身組織質量,實現肌少癥的診斷。研究發(fā)現,部分AI人體成分自動分割模型的Dice系數(Dice系數是DL圖像分割標準之一,取值范圍為0~1,越接近1說明構建的模型越好)高于0.95,診斷效能較高,應用前景可觀,見表1。多項回顧性研究證實,使用這些模型可實現人體成分自動分割,從而實現肌少癥的診斷,在評估肌少癥/非肌少癥對腫瘤患者(包括婦科惡性腫瘤[28-29],泌尿系統(tǒng)惡性腫瘤[30],消化系統(tǒng)惡性腫瘤[31]等)預后的影響也有不錯表現。
表1 利用ML實現人體成分自動分割的文獻報道
基于影像學人體成分自動分割的肌少癥診斷模型還存在以下缺點:(1)因放射學量化特征相似,與骨骼肌臨近或重疊的臟器可能被誤認為骨骼肌組織,和脂肪組織放射學量化特征相似的體素可能會被誤認為內臟脂肪組織,可見AI診斷模型的準確性還有待提高[7,43]。(2)單個層面的CT圖像分析可能無法精確反映全身肌肉、脂肪組織量。(3)部分研究沒有明確表明如何選擇研究層面。(4)部分研究設定的相關參數可能并不適合所有人群,需要進一步結合種族、性別、疾病等特征進行參數設定。(5)AI算法極為復雜,無法清晰展現推理過程(“黑匣子”原理),系統(tǒng)輸出結果的可解釋性差。就目前的研究現狀而言,基于影像學人體成分自動分割的肌少癥診斷模型展現了較好的效能,今后可選擇多模態(tài)多層面影像實現人體成分自動分割,并結合種族、性別等特征進行肌少癥診斷模型構建,以提高模型的泛化能力和準確性。
3.2 基于非影像學等結構化信息 部分研究利用ML評估不同結構化信息的重要性,確定重要因素并建立模型,從而診斷及預測肌少癥[44-48]。納入的結構化信息包括年齡、體質量、身高、BMI、腰圍、臀圍、收縮壓、舒張壓以及平均紅細胞血紅蛋白量、HDL、平均紅細胞體積、紅細胞、TG、簡易營養(yǎng)評估量表(mini nutritional assessment,MNA)、血鈉、尿素氮、鐵蛋白、維生素D、FPG等。亦有研究通過AI建立重要變量之間的相關性網絡[45],為深入研究肌少癥發(fā)生和發(fā)展的主要生物學機制提供了可能。
3.3 其他相關進展 近年來一些便攜、可穿戴設備的逐步應用為肌少癥的AI診斷提供了新思路。利用慣性傳感器獲得患者不同時相的步態(tài)參數信息,包括時空參數(左/右腿站立時相時間、左/右腿擺動時相時間、單/雙腿站立時相時間、左/右腿站立時相百分比、左/右腿跨步時間等)以及相應的統(tǒng)計參數(最大/小值、最小值、標準差、均方根、峰度、偏度等),通過不同算法構建基于步態(tài)參數信息的AI診斷模型,準確度較高[49-50]。穿戴式表面肌電圖探針可收集運動時來自腓腸肌外側肌群及脛骨前肌的原始肌電圖信號,使用ML提取并選擇特征,使用不同算法構建肌少癥AI診斷模型也可獲得較高的準確度,其中樸素貝葉斯算法準確度相對較低,但也達到了0.828[51],支持向量機算法準確度較高,為0.967。
小部分學者將研究的焦點轉向尋找早期診斷的生物標志物。Chung等[52]研究了來自多種族的肌少癥患者(118例患者,17 339個基因)和健康人群轉錄組譜,選定27個基因作為模型輸入特征變量,建立四層深層神經網絡DSnet-v1,并將其應用于獨立的測試數據。結果發(fā)現模型靈敏度為100%,特異度為94.12%,準確度為95.83%,平衡準確度為97.06%,接收機AUC為0.99,可用于實現肌少癥的智能診斷。為了擴展患者數據,研究組同時開發(fā)了網絡應用程序(http://sarcopeniaai.ml/),用戶可有限制地訪問DSnet-v1,獲取轉錄組數據從而用以診斷肌少癥。Kwak等[53]對46名正常受試組和50例肌少癥患者的21個潛在生物標志物的血清學進行分析,結果發(fā)現正常組和肌少癥組IL-6、骨連接素/基底膜蛋白40、巨噬細胞遷移抑制因子、胰島素樣生長因子1水平差異有統(tǒng)計學意義。雖然這4個生物標志物均不適合作為診斷肌少癥的單一生物標志物,但將這些生物標志物聯合使用合并成單一風險評分時,肌少癥診斷準確率顯著提高(AUC=0.763)。事實上,用以肌少癥診斷的有效多重生物標志物仍在不斷發(fā)現與豐富中,未來可進一步研究與肌少癥相關的生物學途徑,探索診斷肌少癥的生物學標志物最佳組合。
目前大部分AI肌少癥診斷模型構建的研究均為回顧性研究,納入的數據存在發(fā)表偏倚,單中心研究居多,樣本量較小,模型泛化能力較差,絕大部分研究納入的人群背景與中國不同,缺乏大樣本、前瞻性的適合中國人群背景的AI肌少癥診斷模型。未來可通過前瞻性隊列研究,深入探討單個放射學特征是否可用于肌少癥診斷或是否導致不同的臨床結局等方面的研究。針對中國肌少癥人群建立多模態(tài)數據庫,以探討適用于中國人群的肌少癥AI診斷模型。
單個層面的CT圖像自動分割分析可能無法精確反映全身肌肉、脂肪組織量,不一定適用于所有患者。今后可考慮將單個研究層面擴展為研究區(qū)域,實現研究區(qū)域內的人體成分自動分割,降低模型的不穩(wěn)定性,從而更準確地反映整體的骨骼肌質量。若能進一步實現不同區(qū)域內/多層面的對等轉換,利用臨床獲取度更高的CT圖像(比如胸部CT平掃圖像),則更有利于肌少癥的早期篩查及早期診斷,在缺乏有效治療手段的情況下,患者受益可能更高。
當前大部分研究均基于肌肉質量的影像學信息,忽略了肌肉力量和肌肉功能等結構化信息,但肌肉力量和肌肉功能是診斷肌少癥及評估嚴重程度中不可缺少的依據。研究表明,“肌少癥可能”(AWGS2019年共識標準)的簡化評估對于肌少癥的診斷準確性非常好,而“肌少癥可能”的簡化評估主要依據肌肉力量和肌肉功能等結構化數據,同時還包括小腿圍、SARC-F量表評分等[54]。EWGSOP2也提出應同時運用影像學信息和非影像學信息發(fā)現和診斷肌少癥[3],因此今后可考慮將基于肌肉質量等非結構化信息和篩查指標、基于肌肉力量和肌肉功能評估等結構化信息與生物學標志物相結合,并利用便攜智能設備等先進儀器,構建肌少癥AI診斷模型,在提高效能的同時擴大應用場景,從而實現不同場景下的快速診斷及篩查。
DL等算法自動提取數據特征,細節(jié)較難捕捉,系統(tǒng)輸出結果多數不具可解釋性,目前對于AI可解釋性探索仍處于起步階段,比如生成熱力圖以顯示DL模型關注的區(qū)域[55],今后關于肌少癥診斷模型的可解釋性亦是研究的方向之一。
隨著人口老齡化程度加劇,肌少癥發(fā)病率逐漸升高。肌少癥與多種不良臨床結局相關,治療手段有限。相比傳統(tǒng)診斷方法,DL,特別是卷積神經網絡在實現人體成分自動分割方面有較好的效能,有利于實現基于影像學的肌少癥AI診斷模型的構建,但未來關于肌少癥的AI診斷仍面臨優(yōu)化挑戰(zhàn),需要進一步深入研究。