谷翔,彭明洋,陳宇辰,殷信道,陳國中,任軍*
帕金森?。≒arkinson's disease, PD)作為神經(jīng)退行性疾病的第二常見疾病,其患病率隨著年齡的增長而增加,致使患者的生活質量下降、死亡率增加[1]。因此,早期準確診斷PD并進行相應的干預至關重要。然而,PD 的臨床表現(xiàn)具有較大的異質性,臨床早期準確診斷困難。研究顯示PD 的特征是黑質神經(jīng)元的缺失[2]。神經(jīng)成像尤其是磁敏感加權成像(susceptibility-weighted imaging, SWI)可評估黑質神經(jīng)元的損失[3-5]。燕尾征消失,即在SWI上健康的黑質體消失,已被證明是診斷PD 的影像征象[6-7]。然而,由于較低的特異性和準確性及較強的主觀性,使其臨床應用受到限制。影像組學可從影像中提取肉眼無法識別的高通量信息,為臨床決策提供準確信息[8-9]。本研究擬基于SWI 圖像提取黑質影像組學特征,并應用機器學習方法,構建PD 的診斷模型,并與人工識別的燕尾征診斷PD 進行比較,旨在達到早期準確診斷PD的目的。
回顧性分析2020 年1 月至2023 年1 月在南京市第一醫(yī)院接受腦部MRI(包括SWI 序列)的PD 早期患者的臨床及影像資料。所有患者均符合英國帕金森病學會腦庫帕金森病臨床診斷標準,且Hoehn-Yahr分期為0~2 期[10]。有其他神經(jīng)和精神疾病史以及繼發(fā)性或非典型PD 的患者排除在外。同時招募年齡和性別匹配的健康受試者作為對照,所有健康受試者均接受相同的腦部MRI(包括SWI 序列)。本研究遵守《赫爾辛基宣言》,經(jīng)南京市第一醫(yī)院倫理委員會批準,批準文號:2022-664,所有患者及健康受試者均已簽署知情同意書。最終共納入80 例PD 患者和80 例健康受試者。將PD 患者和健康受試者按7∶3 的比例隨機分為訓練組(n=112)和測試組(n=48)。
采用西門子3.0 T MRI(Magnetom Prisma,Siemens Healthineer)掃描設備。掃描序列包括T1WI、T2WI、SWI。SWI 掃描參數(shù)如下:TR 27 ms,TE 20 ms,翻轉角15°,F(xiàn)OV 220 mm×220 mm,層厚2 mm,層面內(nèi)分辨率0.9 mm×0.9 mm×2.0 mm。
燕尾征表現(xiàn)為在SWI 序列上高信號結構,呈線性、逗號或楔形,兩側以低信號結構(緊密部黑質和內(nèi)側丘系)為邊界[11]。由2名具有10年工作經(jīng)驗的神經(jīng)放射學診斷醫(yī)師采用雙盲法對患者和受試者的SWI 評估是否存在燕尾征,雙側不存在、單側不存在或微弱存在則認為燕尾征消失判定為PD,雙側存在則認為燕尾征陽性判定為健康受試者,評估結果存在分歧時由另一位具有20年工作經(jīng)驗的神經(jīng)放射學診斷醫(yī)師共同協(xié)定。
1.4.1 感興趣區(qū)勾畫
使用ITK-SNAP 軟件(版本3.4.0,http://www.itksnap.org)逐層手動勾畫SWI 兩側黑質區(qū)作為感興趣區(qū)(volume of interests, VOIs)(圖1)。由上述1 名具有10 年工作經(jīng)驗的神經(jīng)放射學診斷醫(yī)師進行VOIs的勾畫,并由上述另一名具有10年工作經(jīng)驗的神經(jīng)放射學診斷醫(yī)師進行核對;(2)特征提取及篩選:使用PyRadiomics 軟件(version: 3.0.1,https://pyradiomics.readthedocs.io/en/latest/)提取特征。影像組學特征包含形態(tài)學特征、一階特征(first order)和紋理特征等共1132個特征。采用最小絕對收縮與選擇算子(least absolute shrinkage and selection operator, LASSO)選取與PD 密切相關的影像組學特征。LASSO 通過構造懲罰函數(shù)得到一個較為精練的模型,壓縮一些回歸系數(shù),并設定一些回歸系數(shù)為零。采用10倍交叉驗證對模型參數(shù)進行最優(yōu)化。
圖1 磁敏感加權成像黑質感興趣區(qū)勾畫示意圖。1A~1B:帕金森病患者黑質感興趣區(qū)勾畫,左側燕尾征消失(箭)(1A);1C~1D:健康受試者黑質感興趣區(qū)勾畫,雙側燕尾征存在(1C)。Fig.1 Schematic diagram of volumes of interest delineation of substantia nigra on susceptibility-weighted imaging (SWI) images.1A-1B: The volumes of interest delineation of substantia nigra on SWI images in Parkinson's disease patients, absence of the swallow tail sign in the left side (arrow) (1A).1C-1D: The volumes of interest delineation of substantia nigra on SWI images in the health controls, normal swallow tail sign on both sides (1C).
應用5 個常見的分類器[支持向量機(support vector machine, SVM)、邏輯回歸(logistic regression,LR)、隨 機 森 林(random forest, RF)、貝 葉 斯(Bayesian, Bayes)、K 近 鄰(K-nearest neighbor,KNN)]對篩選的特征進行機器學習,構建模型。每個模型構建100 次,并計算相應的100 個曲線下面積(area under the curve, AUC)。使用以下公式計算相對標準差(relative standard deviations,RSD):
其中σAUC 表示100 個AUC 值的標準差,μAUC 是這100 個AUC 值的平均值。RSD 越小,模型越穩(wěn)定。在上述過程中,選擇最穩(wěn)定的模型(AUC的RSD值最小的模型)作為最終模型,并在測試集中進行驗證。
統(tǒng)計學分析均使用R 軟件(4.0.3 版)。應用Kolmogorov-Smimov 檢驗計量資料是否符合正態(tài)分布,正態(tài)分布的計量資料以均數(shù)±標準差表示并用獨立樣本t檢驗分析;計數(shù)資料采用例(%)表示并用卡方檢驗分析。應用Kappa 一致性檢驗評估觀察者間的一致性。應用pROC 軟件包進行ROC 曲線分析。應用AUC、準確度、敏感度、特異度等評價指標評估模型。人工識別與機器學習模型效能間比較采用DeLong檢驗。P<0.05表示差異有統(tǒng)計學意義。
共160例研究對象納入分析,經(jīng)人工識別為PD的對象為60例(PD組),正常受試者為100例(對照組),觀察者間一致性為k=0.80(95%CI: 0.76-0.83)。在訓練集和測試集中,PD 組與對照組組間性別、年齡差異均無明顯統(tǒng)計學意義(P>0.05)(表1)。ROC 曲線分析顯示人工識別燕尾征診斷PD 的AUC 為0.750,敏感度和特異度分別為67.9%、82.1%(表2)。
表1 PD組和對照組的臨床基線資料比較Tab.1 Comparison of basic clinical data between PD and controls group
表2 人工識別和五種機器學習方法診斷PD的效能Tab.2 Efficacy of visual analysis and five machine learning methods in diagnosing PD
SWI黑質區(qū)共提取的1132個特征經(jīng)方差分析+秩和檢驗后剩下172 個,Spearman 相關性檢驗后剩下37個,最后使用LASSO降維后選擇的特征數(shù)為7個,包含2個形態(tài)學特征、1個一階特征、2個灰度共生矩陣特征(gray-level co-occurrence matrix, GLCM)、1 個灰度尺寸區(qū)域矩陣(gray-level size zone matrix,GLSZM)、1 個灰度相關矩陣(gray-level dependence matrix, GLDM)。影像組學特征的LASSO 邏輯回歸、系數(shù)分布及最佳特征見圖2。
圖2 影像組學特征最小絕對收縮與選擇算子算法(LASSO)邏輯回歸、系數(shù)分布及最佳特征圖。2A:LASSO模型中的調(diào)諧參數(shù)通過最小標準使用十倍交叉驗證選擇。繪制曲線下面積與log (λ)的關系,根據(jù)最小準則和最小準則的1標準誤差,在最優(yōu)值處繪制虛線;2B:在最佳λ值處繪制一條垂直線;2C:LASSO篩選后與帕金森病相關的特征及加權系數(shù)。Fig.2 Radiomics feature selection using least absolute shrinkage and selection operator (LASSO) logistic regression, LASSO coefficient profiles of the radiomics features and the optimum radiomics.2A: The tuning parameters in the LASSO model are selected using 10-fold cross-validation via minimum criteria.The area under the curve is plotted vs.log(λ).Dotted vertical lines are drawn at the optimal values according to the minimum criteria and the 1 standard error of the minimum criteria; 2B: A vertical line is plotted at the optimal λ value; 2C: The detailed features associated with Parkinson's disease and the weighting coefficients of different datasets after LASSO screening.
基于所得的最佳影像組學特征構建PD的診斷模型。五種機器學習的診斷效能見表2。在訓練集中,LR 模型的診斷效能最好,AUC 為0.975,敏感度為94.4%、特異度為97.6%、準確度為95.6%。此外,用不同機器學習方法評估模型的穩(wěn)定性,LR 模型最穩(wěn)定(AUC的RSD為4%)。在測試集中,選擇診斷效能做好、穩(wěn)定性最高的LR模型作為最終的驗證模型,其診斷PD的AUC 為0.938,敏感度為83.3%、特異度為95.8%、準確度為89.6%。經(jīng)DeLong檢驗后,其診斷效能明顯優(yōu)于人工識別(Z=2.241,P=0.025)(表2,圖3)。
圖3 測試集中邏輯回歸模型和人工識別診斷帕金森病的ROC曲線。Fig.3 ROC curve of test set for diagnosing Parkinson's disease using logistic regression model and visual analysis in the test set.
本研究對80 例PD 患者和80 例健康受試者的SWI 圖像上黑質區(qū)域進行影像組學特征提取、篩選,共篩選出與PD 密切相關的7 個影像組學特征,包含2 個 形 態(tài) 學 特 征、1 個 一 階 特 征、2 個GLCM、1 個GLSZM、1 個GLDM。經(jīng)5 種機器學習方法建模后,結果顯示LR 模型診斷PD 的效能最好且最穩(wěn)定,且明顯優(yōu)于人工識別燕尾征的診斷效能。本研究結果可有效克服由于人工識別的主觀性帶來的低敏感度和低準確度。通過構建的模型可使臨床醫(yī)生能夠通過模型快速準確地診斷PD,進而進行早期臨床干預治療。
PD 的病因目前尚不清楚,但黑質在其神經(jīng)病理學中具有重要的作用,研究顯示PD 中黑質多巴胺能神經(jīng)元缺失[12-13]。Nigrosome-1 在SWI 上黑質的尾部顯示為兩個低信號,中間為高信號,在SWI 或T2WI 上顯示為燕尾征[14-16]。因此,以往的研究顯示[17-20],燕尾征的缺失可有助于將PD 患者與健康受試者區(qū)分開。BLAZEJEWSKA 等[21]在7 T MRI 高分辨率T2*加權序列上描述了原本低強度的黑質致密部后外側區(qū)域內(nèi)的高信號線性區(qū)域,即Nigrosome-1,而在10 名PD 患者中沒有看到。SCHWARZ等[22]在3 T MRI上描述了與高分辨率T2*加權序列上的燕尾征消失類似的結構。該研究主要包括非PD 參與者,與對照組中燕尾征消失的存在相比,PD 患者中STS 缺失的敏感度(100%)、特異度(97%)和準確度(96%)非常高。COSOTTINI 等[23]的一項研究顯示3 T MRI 的平均敏感度為79%,特異度為94%,診斷準確度為86%。本研究基于SWI 的燕尾征消失診斷PD,在訓練集中的敏感度為67.9%、特異度為82.1%、準確度為75.0%;在測試集中的敏感度為70.8%、特異度為83.3%、準確度為77.1%,其診斷效能稍低于以往研究。可能原因為本研究納入的PD患者均為早期患者(Hoehn-Yahr 分期為0~2 期),黑質改變不明顯,導致醫(yī)生通過燕尾征消失診斷PD 的準確性相對較低。由此可見,由于存在主觀性強、一致性較低、診斷準確度相對較低的局限性,目前基于燕尾征消失診斷PD在臨床應用中仍受限。
影像組學目前已廣泛應用于醫(yī)學研究中,與以往的研究類似[24-25],本研究也使用了影像組學的方法來提取并構建PD 的診斷模型。SHU 等[26]從SWI 圖像上的黑質區(qū)域提取影像組學特征,可一定程度上反映PD的Hoehn-Yahr分期。本研究通過從SWI圖像上勾畫黑質區(qū)域并提取特征進行篩選,發(fā)現(xiàn)2個形態(tài)學特征、1 個一階特征、2 個GLCM、1 個GLSZM、1 個GLDM與PD 診斷密切相關,具有較高的加權系數(shù)。本研究進一步應用5 種分類器方法構建PD 的診斷模型。不同的分類器模型在PD 的診斷中具有不同的效能,本研究顯示LR 模型的診斷效能優(yōu)于其他分類器方法。二進制的LR是一種基于一個或多個自變量估計二進制響應概率的傳統(tǒng)方法,提供的不是離散輸出,而是與每個觀測相關的概率[27-29]。此外,本研究發(fā)現(xiàn)LR模型是所有診斷模型中最穩(wěn)定的。因此,本研究選擇LR 作為最終分類器,并用測試集進行驗證。結果顯示LR 模型在測試集中仍然具有較好的診斷效能,并明顯優(yōu)于人工識別燕尾征消失診斷PD的效能。由此可見,與傳統(tǒng)的人工識別相比,基于LR分類器構建的PD 診斷模型臨床適用性,且避免了人工識別主觀性強、診斷準確度低的局限性。
本研究仍存在一些不足之處。首先,本研究為單中心研究,且樣本量較少。其次,本研究僅根據(jù)影像方法進行診斷,未納入臨床量表。此外,本研究僅提取了SWI圖像上的影像組學特征,后期需進一步加入T1WI、T2WI等其他序列的特征,以期進一步提高PD的診斷效能。最后,本研究未做外部驗證。
綜上所述,基于SWI 黑質的影像組學特征,應用機器學習方法構建的PD診斷模型能夠較為準確地診斷PD,為臨床早期干預治療提供指導。
作者利益沖突聲明:全體作者均聲明無利益沖突。
作者貢獻聲明:任軍設計本研究的方案,對稿件重要內(nèi)容進行了修改;谷翔起草和撰寫稿件,獲取、分析或解釋本研究的數(shù)據(jù);彭明洋、陳宇辰、殷信道、陳國中獲取、分析或解釋本研究的數(shù)據(jù),對稿件重要內(nèi)容進行了修改,其中殷信道獲得了江蘇省自然科學基金的資助;陳國中獲得了國家自然科學基金的資助;全體作者都同意發(fā)表最后的修改稿,同意對本研究的所有方面負責,確保本研究的準確性和誠信。