蔡旭, 肖劍偉, 郭粉蓮, 程釩釩, 胡鑫玉, 許楚花, 陳澤建
1深圳市福田區(qū)風(fēng)濕病專科醫(yī)院風(fēng)濕免疫科(廣東深圳 518000); 2深圳市福田區(qū)婦幼保健院計(jì)算機(jī)中心(廣東深圳 518000)
強(qiáng)直性脊柱炎(ankylosing spondylitis, AS)是一種典型的炎癥性疾病,它屬于脊柱關(guān)節(jié)炎中的一種,其特征是脊柱、外周關(guān)節(jié)、韌帶和肌腱炎癥[1]。AS的病程通常逐漸進(jìn)展,隨之而來的是與脊柱相關(guān)的功能的惡化,導(dǎo)致生活質(zhì)量下降[2]。隨著生物制劑的研發(fā)和發(fā)展,目前其已經(jīng)在AS中獲得了廣泛的應(yīng)用,并使眾多患者獲益。然而,在臨床應(yīng)用中,也存在部分患者因?yàn)橐缽男圆?導(dǎo)致治療效果欠佳的現(xiàn)象,從而影響了患者的預(yù)后。依從性是與治療結(jié)果密切相關(guān)的重要因素之一,不依從性是日常臨床實(shí)踐中的一個(gè)具有挑戰(zhàn)性的問題。研究顯示,依從性不足會(huì)導(dǎo)致疾病的發(fā)病率和病死率增加。此外,依從性差會(huì)給醫(yī)療帶來重大經(jīng)濟(jì)負(fù)擔(dān)[3-5],生活質(zhì)量下降、治療效果差、住院風(fēng)險(xiǎn)增加和住院時(shí)間延長(zhǎng)、由于低估治療效果而做出不適當(dāng)?shù)闹委煕Q定以及患者滿意度下降[6]。依從性領(lǐng)域的研究證實(shí),提高依從性干預(yù)措施的有效性,對(duì)人群健康的影響可能遠(yuǎn)遠(yuǎn)大于具體醫(yī)療方法的任何改進(jìn)[7]。幾項(xiàng)研究調(diào)查了風(fēng)濕性疾病如類風(fēng)濕性關(guān)節(jié)炎、系統(tǒng)性硬化癥 (SSc)、幼年特發(fā)性關(guān)節(jié)炎和系統(tǒng)性紅斑狼瘡的不依從性風(fēng)險(xiǎn)[8-9],證實(shí)藥物依從性與年齡、疾病感知、藥物選擇和給藥途徑有關(guān)。關(guān)于AS的依從性研究顯示,AS患者在隨訪第一年治療依從性為41.0%,在兩年的隨訪結(jié)束時(shí),比率降至20.0%[10]。慢性病的藥物的不依從性受到多種因素的影響,如年齡、性別、收入和受教育程度、病情活動(dòng)度等[11]??紤]到藥物治療不依從性嚴(yán)重影響患者預(yù)后,同時(shí),大量因素影響了藥物的不依從性。因而,建立可靠的依從性的預(yù)測(cè)工具,及時(shí)發(fā)現(xiàn)依從性差的患者并進(jìn)行干預(yù),是改善患者預(yù)后,避免患者出現(xiàn)各種并發(fā)癥的有效方法之一。常見評(píng)估不依從性有直接和間接兩種方法,直接法包括治療藥物監(jiān)測(cè)和藥物或代謝物測(cè)量等提供了可量化的值,從而提供了藥物攝入的證據(jù)。然而,這些方法費(fèi)用昂貴而且對(duì)患者極不方便。而間接方法,包括了藥丸計(jì)數(shù)法、自我報(bào)告方法等,其操作較為便利,但是因?yàn)橹饔^性較高,可能高估了依從性。兩種方法各有優(yōu)點(diǎn)和缺點(diǎn),目前仍然沒有一種方法可以準(zhǔn)確地衡量治療依從性。本研究通過機(jī)器學(xué)習(xí),旨在開發(fā)一種有效但簡(jiǎn)單的預(yù)測(cè)工具來評(píng)估AS患者使用生物制劑的不依從性的風(fēng)險(xiǎn)。
1.1 一般資料 機(jī)器學(xué)習(xí)樣本量需為納入因子的5~10倍,同時(shí)按照失訪率20%計(jì)算,需納入患者不能低于160名,樣本量越大其結(jié)果越可靠。按照樣本量測(cè)算,選取我院2020年1月至2022年10月我院門診及住院確診AS患者共220例,所有入院患者均為首次使用生物制劑治療(阿達(dá)木單抗、依那西普、司庫奇尤單抗)。本研究經(jīng)深圳市福田區(qū)風(fēng)濕病??漆t(yī)院倫理委員會(huì)審查同意通過(FS202001001)。
納入標(biāo)準(zhǔn):(1)年齡>18歲,符合修訂的AS 紐約標(biāo)準(zhǔn)(1984年)[12];(2)具有小學(xué)以上文化水平,能夠進(jìn)行有效溝通及填寫問卷;(3)簽署知情同意書。
排除標(biāo)準(zhǔn):(1)存在上述生物制劑過敏患者;(2)妊娠、哺乳期患者;(3)合并有惡性腫瘤及精神類疾病無法配合者。
1.2 方法 所有入組患者在第一次使用生物制劑時(shí)由門診或病房??谱o(hù)士收集患者年齡、性別、身高、體重、是否參與醫(yī)保、月收入、受教育水平、疾病活動(dòng)度,是否存在藥物不良反應(yīng)、居住地到醫(yī)院的距離、藥物每月使用頻次、焦慮程度、醫(yī)患信任度、是否合并使用非甾體類藥物等資料。其中,疾病活動(dòng)度使用強(qiáng)直性脊柱炎疾病活動(dòng)指數(shù)(bath ankylosing spondylitis disease activity index, BASDAI);體質(zhì)指數(shù)(body mass index, BMI)通過身高體重計(jì)算得出;醫(yī)患信任度采用維克森林醫(yī)師信任量表中文修訂版評(píng)估[13],焦慮程度采用漢密爾頓焦慮量表評(píng)估[14];在患者首次接受治療后,在第1周,第1、2、6個(gè)月通過微信或電話進(jìn)行隨訪,在半年內(nèi)出現(xiàn)皮疹、肝腎功能異常、注射部位異常及結(jié)核等感染均視為存在不良反應(yīng)。共納入13個(gè)預(yù)測(cè)因子。
藥物使用依從性通過治療覆蓋時(shí)間比例(propotion of days covered, PDC)來確認(rèn)[15]。PDC>80%認(rèn)定該患者依從性良好[16]。所有的患者均在第1周,第1、2、6個(gè)月時(shí)通過微信、電話或門診隨診,研究終點(diǎn)為在第6個(gè)月最后1次隨訪時(shí),患者是否仍繼續(xù)堅(jiān)持治療,同時(shí)查詢醫(yī)院處方信息系統(tǒng),最終計(jì)算得出PDC。根據(jù)總病例數(shù)減去PDC結(jié)果得到的依從性良好病例數(shù),得到不依從性人數(shù)。
1.3 數(shù)據(jù)處理及統(tǒng)計(jì)學(xué)分析 所有研究數(shù)據(jù)均采用 Microsoft office EXCEL軟件,由雙人平行錄入。由另外2名工作人員進(jìn)行一致性核對(duì)和異常值核查。如出現(xiàn)缺失值超過50%的特征變量,予以刪除。對(duì)于缺失值<50%的變量,如變量為分類變量,采用KNN分類器進(jìn)行缺失填補(bǔ);如變量為連續(xù)變量,采用隨機(jī)森林分類器進(jìn)行缺失填補(bǔ)。
在分析前,對(duì)變量進(jìn)行因子轉(zhuǎn)換,年齡因子<50歲設(shè)置為0,≥50歲設(shè)置為1;性別因子男性設(shè)置為0,女性設(shè)置為1;BMI<23.9 kg/m2設(shè)置為0,≥23.9 kg/m2設(shè)置為1;醫(yī)保因子根據(jù)是否醫(yī)保設(shè)置為0/1;月收入因子根據(jù)收入水平<5 000元,5 000~10 000元及10 000元以上分別設(shè)置為0/1/2;教育水平因根據(jù)其學(xué)歷水平(初中及以下,高中,大專及以上)子分別設(shè)置為0/1/2;疾病活動(dòng)度使用BASDAI評(píng)分,<4分設(shè)置為0,≥4分<7分設(shè)置為1,≥7分設(shè)置為2。無藥物不良反應(yīng)設(shè)置為0,出現(xiàn)藥物不良反設(shè)置為1;到醫(yī)院的距離,<20 km設(shè)置為1,≥20 km設(shè)置為2;藥物每月使用頻次,每月1次設(shè)置為1,每月2次設(shè)置為2,每月>2次設(shè)置為3;根據(jù)漢密爾頓量表評(píng)分結(jié)果,將焦慮評(píng)分<7分設(shè)置為0,7~14分設(shè)置為1,15~28分設(shè)置為2,≥29分設(shè)置為3;醫(yī)患信任度以量表評(píng)估結(jié)果為非常認(rèn)同及比較認(rèn)同設(shè)置為1,余設(shè)置為0。合并使用非甾體類藥物設(shè)置為1,未使用設(shè)置為0。
所有收集到的數(shù)據(jù)以百分比(%)表示。使用R軟件(版本號(hào)4.2.0)進(jìn)行分析。使用R軟件corrplot包分析各因子相關(guān)性。使用LASSO(least absolute shrinkage and selection operator)回歸分析、支持向量機(jī)(support vector machine, SVM)分別進(jìn)行因子篩選。使用R中的glmnet包,通過LASSO算法采取10折交叉驗(yàn)證對(duì)特征因子進(jìn)行篩選。通過R的e1071包進(jìn)行SVM分析,其中核函數(shù)設(shè)置為線性核函數(shù),懲罰系數(shù)C設(shè)置為0.1。LASSO回歸及SVM計(jì)算結(jié)果取交集獲得最佳因子。分析各個(gè)因子相關(guān)性。隨后使用多變量logistic回歸建立預(yù)測(cè)模型,同時(shí)繪制諾模圖。通過測(cè)量C 指數(shù)來辨別諾模圖的預(yù)測(cè)能力;繪制受試者工作特征(receiver operating characteristic,ROC)曲線及校正曲線評(píng)估預(yù)測(cè)模型的準(zhǔn)確性;繪制決策分析曲線來評(píng)估不同閾值概率下的凈收益以確定預(yù)測(cè)模型的臨床實(shí)用性。通過AdaBoost算法及Lightgbm算法對(duì)構(gòu)建的二分類模型進(jìn)行驗(yàn)證,繪制ROC曲線及PR (precision-recall)曲線驗(yàn)證模型預(yù)測(cè)能力,并通過SHAP值(SHapley Additive exPlanation)可視化顯示各變量重要性。隨后,對(duì)原始數(shù)據(jù)集進(jìn)行隨機(jī)抽樣70%,通過C指數(shù)、校正曲線、ROC曲線進(jìn)行內(nèi)部驗(yàn)證。
2.1 臨床特征 共有201例患者納入研究, 19例因失訪、不良反應(yīng)及數(shù)據(jù)缺失等原因退組。201例患者中,依從性組為107例,不依從性組為94例。兩組納入數(shù)據(jù)具體見表1。
2.2 特征因子篩選及多變量logistic回歸構(gòu)建模型 LASSO回歸篩選出教育水平、月收入、焦慮程度、藥物使用頻次、疾病活動(dòng)度、年齡6個(gè)因子。SVM篩選出教育水平、月收入、焦慮程度、藥物使用頻次、疾病活動(dòng)度、年齡、性別7個(gè)因子,兩者取交集得到教育水平、月收入、焦慮程度、藥物使用頻次、疾病活動(dòng)度、年齡作為構(gòu)建預(yù)測(cè)模型的因子(圖1)。相關(guān)性分析顯示,各因子之間無明顯相關(guān)性,提示各因子不存在多重共線性(圖2)。通過多變量logistic回歸將納入的6個(gè)因子構(gòu)建臨床預(yù)測(cè)模型(β=0.3996,OR=1.491, 95%CI=0.490~4.601,P<0.05),通過諾莫圖可視化(圖3)。
注:A:LASSO回歸;B:SVM篩選特征因子
圖2 特征因子相關(guān)性分析
圖3 藥物不依從性諾模圖
2.3 模型預(yù)測(cè)性能評(píng)估 模型C指數(shù)結(jié)果為0.739,提示該預(yù)測(cè)模型具有良好的區(qū)分性。校準(zhǔn)曲線結(jié)果顯示出良好的一致性(圖4A)。ROC曲線顯示曲線下面積(AUC)為0.715,提示模型有較高的準(zhǔn)確性(圖4B);校準(zhǔn)曲線結(jié)果顯示,在不損害其他患者利益的情況下,該模型可使約90%的患者受益 (圖5)。AdaBoost算法及Lightgbm算法顯示ROC曲線下面積分別為0.643和0.633(圖6A),PR曲線下面積分別為為0.634和0.676(圖6B)。SHAP可視化結(jié)果顯示,AdaBoost算法中,各變量重要性依次為疾病活動(dòng)度、焦慮水平、月收入、教育水平、用藥頻次及年齡(圖7A);Lightgbm算法各變量重要性依次為焦慮水平、疾病活動(dòng)度、教育水平、月收入、年齡及用藥頻次(圖7B)。
注:A:對(duì)角線的虛線表示理想的模型,實(shí)線表示諾模圖實(shí)際的性能,實(shí)線越接近對(duì)角線的虛線表示模型的預(yù)測(cè)能力越強(qiáng);B: ROC曲線顯示AUC為0.715
圖5 臨床決策曲線
注:A:ROC曲線;B:PR曲線
注:A:Adaboost算法;B:Lightgbm算法
2.4 內(nèi)部驗(yàn)證 隨機(jī)抽取70%數(shù)據(jù)進(jìn)行內(nèi)部驗(yàn)證,結(jié)果顯示內(nèi)部驗(yàn)證集C指數(shù)為0.755,ROC曲線顯示AUC為0.733(圖8A),校準(zhǔn)曲線結(jié)果也顯示抽樣數(shù)據(jù)構(gòu)建的模型具有良好的一致性(圖8B)。
注:A:ROC曲線;B:校準(zhǔn)曲線
機(jī)器學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域取得了令人矚目的進(jìn)步,多個(gè)研究表明,機(jī)器學(xué)習(xí)在疾病生物標(biāo)志物、預(yù)后等多個(gè)方面發(fā)揮著重要的作用[17-18]。本研究通過多種機(jī)器學(xué)習(xí)的方法,篩選出多個(gè)因子,構(gòu)建AS患者使用生物制劑不依從性的臨床預(yù)測(cè)模型,以期更加精準(zhǔn)識(shí)別依從性差的AS患者,及時(shí)進(jìn)行干預(yù)。對(duì)該模型進(jìn)行驗(yàn)證,C指數(shù)、ROC曲線等均顯示模型具有良好的預(yù)測(cè)及校準(zhǔn)能力。而AdaBoost及Lightgbm通過SHAP可視化結(jié)果顯示在6個(gè)變量中,疾病活動(dòng)度及焦慮程度對(duì)模型的貢獻(xiàn)值較大,兩個(gè)模型與諾莫圖展現(xiàn)的結(jié)果是相一致的,顯示疾病活動(dòng)度及焦慮程度在患者不依從性中有著重要的作用,建立的模型能夠較有效的識(shí)別不依從性高的患者。
不依從性預(yù)測(cè)模型可以幫助臨床醫(yī)護(hù)人員識(shí)別具有不依從性高風(fēng)險(xiǎn)的AS患者。根據(jù)這種模型采取干預(yù)措施,通過解決可改變的因素,可以最大限度地提高依從性。本研究發(fā)現(xiàn),有46.8%的AS患者未能堅(jiān)持使用生物制劑治療。特征重要性分析可以提供對(duì)臨床的見解。研究發(fā)現(xiàn)教育水平、月收入、焦慮程度、藥物使用頻次、疾病活動(dòng)度、年齡可能是AS患者用藥不依從性的相關(guān)風(fēng)險(xiǎn)因素。眾所周知,依從性差會(huì)導(dǎo)致疾病活動(dòng)增加[19]。依從性和疾病嚴(yán)重程度之間的關(guān)系可以是雙向的,疾病的嚴(yán)重程度可能是依從性的原因和結(jié)果。在這項(xiàng)研究中,模型結(jié)果顯示,BASDAI是預(yù)測(cè)不依從性的重要因素,病情活動(dòng)度高的患者具有更高的依從性,可能為患者在疾病活動(dòng)期出現(xiàn)劇烈的疼痛及晨僵,同時(shí)其他口服的慢作用抗風(fēng)濕藥物在AS患者中效果較差,讓患者有更大的意愿積極使用生物制劑治療。而在病情緩解后,很多患者會(huì)忽視疾病的后續(xù)治療。因而在臨床上,要更加關(guān)注疾病活動(dòng)度較低的患者,做好疾病相關(guān)知識(shí)的宣教,從而提高患者的依從性。
年齡對(duì)風(fēng)濕免疫患者治療不依從性的影響在不同的研究有著不同的結(jié)論[20-21]。本研究發(fā)現(xiàn),老年患者對(duì)生物制劑的治療有個(gè)更高的不依從性,考慮可能為生物制劑多數(shù)需在醫(yī)院注射,同時(shí)老年患者部分合并有基礎(chǔ)疾病,治療藥物的增加,導(dǎo)致老年患者治療意愿下降。和既往研究類似,受教育水平越低,不依從性越高[22]。在受教育水平高的患者中,其獲取疾病相關(guān)知識(shí)的來源更加多樣,如互聯(lián)網(wǎng)等,同時(shí)對(duì)于疾病遠(yuǎn)期的損害的理解也更加深刻,因而有更強(qiáng)的意愿規(guī)范治療。慢性風(fēng)濕性疾病給患者及其家屬帶來了沉重的經(jīng)濟(jì)負(fù)擔(dān),國(guó)內(nèi)一項(xiàng)研究顯示,AS患者年平均費(fèi)用為29 035.60元[23]。本研究發(fā)現(xiàn),收入較低人群的依從性較差,考慮可能為沉重的經(jīng)濟(jì)負(fù)擔(dān)影響了患者治療的依從性,這與一項(xiàng)研究炎性關(guān)節(jié)病患者依從性與經(jīng)濟(jì)關(guān)系相關(guān)性分析結(jié)果[24]是一致的,提示在臨床治療中,要更加關(guān)注患者經(jīng)濟(jì)情況,選擇更加經(jīng)濟(jì)而有效的方案,從而提高患者的依從性。多個(gè)報(bào)告指出,藥物的使用頻次會(huì)影響患者依從性[9,25]。本研究發(fā)現(xiàn),生物制劑每月使用頻次會(huì)對(duì)患者的依從性產(chǎn)生負(fù)面影響,推測(cè)對(duì)于每月使用頻次更少的生物制劑有著更好的依從性歸因于更方便的給藥方案,減少了患者反復(fù)就醫(yī)及注射藥物次數(shù),從而提高了依從性。
越來越多的研究關(guān)注風(fēng)濕免疫患者的心理狀況。一項(xiàng)關(guān)注AS患者心理狀況的研究顯示, AS患者更容易患焦慮癥[26]。另一項(xiàng)研究顯示,60%的AS患者合并有焦慮癥[27]。研究結(jié)果顯示,在患有風(fēng)濕免疫疾病人群中,更好的心理健康狀況預(yù)示著更好的依從性[28]。而在AS患者中,目前尚未有報(bào)道焦慮程度與依從性相關(guān)的報(bào)道,本研究發(fā)現(xiàn),焦慮是AS患者不依從性的危險(xiǎn)因素,焦慮程度越高,其不依從性風(fēng)險(xiǎn)越高,考慮可能為焦慮患者對(duì)治療的信心降低,認(rèn)為藥物無效以及用藥會(huì)產(chǎn)生不良反應(yīng),從而對(duì)治療采取消極的態(tài)度。
綜上,本研究通過構(gòu)建6個(gè)預(yù)測(cè)因子構(gòu)建了簡(jiǎn)易,操作性強(qiáng)且預(yù)測(cè)能力較高的AS患者使用生物制劑不依從性預(yù)測(cè)模型,并通過諾莫圖給予可視化,提高了臨床使用的便利性,有利于醫(yī)護(hù)人員及早發(fā)現(xiàn)不依從性較高的患者從而及早進(jìn)行干預(yù)。然而,本研究也存在一定局限性,一是患者數(shù)量有限,無法評(píng)估可能的混雜因素,例如患者對(duì)治療的反應(yīng)、自身其他合并疾病等,同時(shí)可能出現(xiàn)數(shù)據(jù)分布不均情況。二是未能進(jìn)行外部數(shù)據(jù)驗(yàn)證,需要在接下來的研究中進(jìn)一步收集數(shù)據(jù)進(jìn)行外部驗(yàn)證。
利益相關(guān)聲明:所有作者聲明無可能影響研究結(jié)果的非財(cái)務(wù)沖突關(guān)系,或可能影響本研究結(jié)果和討論的競(jìng)爭(zhēng)利益。
作者貢獻(xiàn)說明:蔡旭直接參與研究設(shè)計(jì)、研究實(shí)施、論文起草和批評(píng)性審閱;肖劍偉參與研究設(shè)計(jì)、數(shù)據(jù)收集、論文修改;郭粉蓮參與數(shù)據(jù)整理、論文起草及修改;程釩釩參與患者隨訪、數(shù)據(jù)收集、論文起草和修改;胡鑫玉參與患者隨訪、數(shù)據(jù)收集、論文起草和修改;許楚花參與患者隨訪、數(shù)據(jù)收集、論文起草和修改;陳澤建參與數(shù)據(jù)分析、模型建立及代碼編寫支持。