孫玉萍,宋 崗,張建美,宋云萍
膠州市人民醫(yī)院,山東266300
經(jīng)外周靜脈穿刺中心靜脈置管(peripherally inserted central catheter,PICC)是一種從外周靜脈導(dǎo)入且末端位于中心靜脈的深靜脈置管技術(shù),廣泛應(yīng)用于惡性腫瘤、胃腸外靜脈營(yíng)養(yǎng)等病人,有留置時(shí)間長(zhǎng)、費(fèi)用低、可減少反復(fù)穿刺等優(yōu)點(diǎn)[1]。但相關(guān)并發(fā)癥也時(shí)有發(fā)生,如相關(guān)性上肢靜脈血栓形成(upper extremity deep vein thrombosis,UEDVT),據(jù)最近的一項(xiàng)臨床研究顯示,PICC相關(guān)的UEDVT的發(fā)生率約為2%[2],增加了病人的死亡率[3-5]。目前,國(guó)際常用的血栓形成風(fēng)險(xiǎn)評(píng)估工具包括:①Autar深靜脈血栓風(fēng)險(xiǎn)評(píng)估表,主要用于手術(shù)骨創(chuàng)傷病人的深靜脈血栓風(fēng)險(xiǎn)評(píng)估[6];②Caprini風(fēng)險(xiǎn)評(píng)估模型,廣泛用于所有住院病人深靜脈血栓的評(píng)估[7];③Wells量表大多用于門(mén)診病人深靜脈血栓的篩查[8];④密歇根PICC-DVT風(fēng)險(xiǎn)評(píng)估量表[9]。但這些量表只籠統(tǒng)地評(píng)估深靜脈血栓形成風(fēng)險(xiǎn),而特異性地評(píng)估UEDVT的工具,應(yīng)用較為廣泛的有Seeley量表,Seeley量表最初是由美國(guó)拉什大學(xué)醫(yī)學(xué)中心的Seeley教授建立,是UEDVT的風(fēng)險(xiǎn)評(píng)估工具。該評(píng)分系統(tǒng)共涵蓋5個(gè)條目并有相應(yīng)的賦值,分別是長(zhǎng)期臥床14分、深靜脈局部壓痛13分、吸煙10分、因骨髓炎而置管20分以及居家或住院期間抗凝9分,總分66分,若總分≥20分則意味著病人住院期間容易發(fā)生UEDVT,總分<20分則相反,該評(píng)估工具陰性預(yù)測(cè)值98.9%,陽(yáng)性預(yù)測(cè)值27.3%,陽(yáng)性預(yù)測(cè)值偏低[7]。該量表未在大樣本人群中驗(yàn)證,尚缺乏普適性和針對(duì)性[8]。因此,構(gòu)建新型工具評(píng)估PICC相關(guān)UEDVT,有助于提升PICC相關(guān)UEDVT預(yù)測(cè)的準(zhǔn)確性。
機(jī)器學(xué)習(xí)(ML)是人工智能的一種,是數(shù)據(jù)統(tǒng)計(jì)與計(jì)算機(jī)科學(xué)的結(jié)合,通常包括訓(xùn)練集和測(cè)試集,訓(xùn)練集用來(lái)學(xué)習(xí)的樣本集,通過(guò)匹配一些參數(shù)來(lái)建立一個(gè)分類(lèi)器,對(duì)所輸入的信息進(jìn)行學(xué)習(xí)。測(cè)試集是為了測(cè)試已經(jīng)訓(xùn)練好的模型的樣本集,可以找出輸入信息的特征與輸出信息之間的關(guān)聯(lián)。目前在醫(yī)學(xué)領(lǐng)域已經(jīng)有較廣泛的應(yīng)用[9-10]。本研究采用ML的方法,對(duì)PICC置管前后所有受試者進(jìn)行信息采集,將采集的信息輸入訓(xùn)練集,訓(xùn)練集對(duì)采集的信息進(jìn)行特征提取,通過(guò)測(cè)試集對(duì)訓(xùn)練集結(jié)果進(jìn)行進(jìn)一步驗(yàn)證,檢驗(yàn)ML對(duì)PICC相關(guān)性UEDVT風(fēng)險(xiǎn)做出相對(duì)精準(zhǔn)的評(píng)估和預(yù)測(cè)的可行性。
1.2.1 臨床資料的采集
PICC置管前,對(duì)所有受試者進(jìn)行了血常規(guī)、凝血檢查,并全面收集病人基本信息,包括性別、年齡、體重指數(shù)(BMI)、吸煙、飲酒、營(yíng)養(yǎng)風(fēng)險(xiǎn)篩查(Nutrition Risk Screening 2002,NRS 2002)、血栓形成家族史、化療史、糖尿病、導(dǎo)管移位和D-二聚體(≥0.5 mg/L)等。PICC置入時(shí),由專(zhuān)科護(hù)士采用超聲引導(dǎo)下改良Seldinger技術(shù)在肘上穿刺貴要靜脈置入三向瓣膜單腔4Fr或5Fr PICC導(dǎo)管。由專(zhuān)科護(hù)士記錄穿刺情況,導(dǎo)管的長(zhǎng)短和內(nèi)腔,插入的部位等導(dǎo)管相關(guān)的數(shù)據(jù)。置管當(dāng)天開(kāi)始,每周對(duì)置管上肢行常規(guī)超聲檢查,持續(xù)4周。對(duì)常規(guī)超聲判斷困難者行超聲造影,并由超聲專(zhuān)業(yè)醫(yī)師協(xié)助判斷血栓形成情況。UEDVT的診斷以常規(guī)超聲檢查或者超聲造影檢測(cè)上肢靜脈血栓的形成為標(biāo)準(zhǔn)。
1.2.2 ML模型構(gòu)建
首先,比較了Seeley量表和ML模型(ML-LASSO,ML-Seeley-LASSO)的訓(xùn)練集結(jié)果。在訓(xùn)練集中,常規(guī)超聲檢查或者超聲造影檢測(cè)發(fā)現(xiàn)UEDVT 38例,Seeley量表預(yù)測(cè)PICC相關(guān)UEDVT高風(fēng)險(xiǎn)的有33例,ML-LASSO預(yù)測(cè)PICC相關(guān)UEDVT為陽(yáng)性結(jié)果有37例,ML-Seeley-LASSO預(yù)測(cè)PICC相關(guān)UEDVT為陽(yáng)性結(jié)果有38例,ML-Seeley-LASSO預(yù)測(cè)與實(shí)際結(jié)果一致。在訓(xùn)練集中,ML-Seeley-LASSO的敏感性、特異性、PPV和NPV均為1.000 0,展現(xiàn)出完美的性能。而ML-LASSO的模型的敏感性、特異性、PPV和NPV分別為0.965 5,0.873 5,0.652 8,0.973 1,表現(xiàn)次于ML-Seeley-LASSO的訓(xùn)練結(jié)果。因?yàn)樵赟eeley量表只標(biāo)記陽(yáng)性結(jié)果,所以PPV項(xiàng)無(wú)結(jié)果標(biāo)記,并且其特異性始終為1.000 0。詳見(jiàn)表1。
表1 Seeley量表和ML模型的訓(xùn)練集結(jié)果比較
隨后,對(duì)Seeley量表、ML-LASSO模型,ML-Seeley-LASSO模型的測(cè)試集結(jié)果進(jìn)行比較。在測(cè)試集中,常規(guī)超聲檢查或者超聲造影檢測(cè)發(fā)現(xiàn)UEDVT病人38例,Seeley量表預(yù)測(cè)PICC相關(guān)UEDVT高風(fēng)險(xiǎn)44例,ML-LASSO預(yù)測(cè)PICC相關(guān)UEDVT為陽(yáng)性的結(jié)果有36例,ML-Seeley-LASSO預(yù)測(cè)PICC相關(guān)UEDVT為陽(yáng)性的結(jié)果有38例,ML-Seeley-LASSO預(yù)測(cè)與實(shí)際結(jié)果一致。同訓(xùn)練集類(lèi)似,Seeley量表特異性始終為1.000 0,PPV項(xiàng)無(wú)結(jié)果標(biāo)記,并且與ML模型相比,性能較差。在ML-LASSO模型中,敏感性、特異性、PPV和NPV分別為0.761 9,0.721 3,0.651 0,0.678 2。而在ML-Seeley-LASSO模型中,敏感性、特異性、PPV和NPV則分別為0.543 0,0.548 8,0.983 2,0.983 4。從整體來(lái)看,ML-LASSO模型在測(cè)試集結(jié)果的表現(xiàn)優(yōu)于ML-Seeley-LASSO模型。詳見(jiàn)表2。
表2 Seeley預(yù)測(cè)工具和ML模型的測(cè)試集結(jié)果比較
進(jìn)一步進(jìn)行了ROC曲線分析,并計(jì)算了AUC。對(duì)于ML-LASSO模型而言,AUC為0.856,95%置信區(qū)間(CI)[0.782,0.931]。對(duì)于ML-Seeley-LASSO模型而言,AUC為0.799,95%CI[0.711,0.887]。Seeley標(biāo)記為reference line,AUC為0.500。由此可見(jiàn),2個(gè)ML模型的AUC均>0.5,提示ML-LASSO模型和ML-Seeley-LASSO模型在都具有優(yōu)越的預(yù)測(cè)性能。詳見(jiàn)圖1。
圖1 ML模型(ML-LASSO、ML-Seeley-LASSO)的ROC曲線分析
在ML-LASSO、ML-Seeley-LASSO模型中,分別排列出整個(gè)數(shù)據(jù)集中得分最高的預(yù)測(cè)因子及其得分。在ML-LASSO模型中,最重要的預(yù)測(cè)UEDVT的發(fā)生的因子包括體質(zhì)指數(shù)、吸煙、深靜脈血栓家族史、NRS 2002評(píng)分等。在ML-Seeley-LASSO模型中,最重要的預(yù)測(cè)UEDVT的發(fā)生因子則為糖尿病、體質(zhì)指數(shù)、導(dǎo)管的位置、D-二聚體(≥0.5 mg/L)等。詳見(jiàn)表3。
表3 不同ML模型中UEDVT發(fā)生的預(yù)測(cè)因子
隨著惡性腫瘤化療藥物的不斷發(fā)展,腫瘤病人中PICC的使用日漸普遍[12]。惡性腫瘤病人一方面由于血液成分發(fā)生改變,血液處于高凝狀態(tài);另一方面,PICC置管可致血管內(nèi)皮損傷,增強(qiáng)黏附分子反應(yīng),誘發(fā)血栓形成[13]。在使用過(guò)程中相關(guān)血栓的發(fā)生率也日漸增多[14]。近年來(lái),PICC相關(guān)性UEDVT的發(fā)生率呈現(xiàn)逐年增高的趨勢(shì)[15-17]。 眾所周知,血栓形成有三大因素,即血液高凝狀態(tài)、靜脈壁損傷和血流緩慢[18]。通常UEDVT包括有癥狀和無(wú)癥狀2種類(lèi)型,其中有癥狀靜脈血栓常表現(xiàn)為皮溫升高,局部發(fā)紅腫脹,導(dǎo)管置入部位肢體感覺(jué)或者功能障礙,嚴(yán)重者伴有觸痛;無(wú)癥狀者上肢可無(wú)上述表現(xiàn),但是進(jìn)行彩色多普勒血流顯像檢查時(shí)發(fā)現(xiàn)靜脈內(nèi)有血栓形成[19-20]。在本研究中,采用隊(duì)列研究,以電子病歷的方式記錄UEDVT的發(fā)生及其他相關(guān)臨床特征,隨訪四周,以超聲檢查或超聲造影檢測(cè)確定是否有上肢靜脈血栓形成。
ML方法是強(qiáng)大的分析工具,其理論和方法已被廣泛應(yīng)用于解決工程應(yīng)用和科學(xué)領(lǐng)域的復(fù)雜問(wèn)題,當(dāng)然亦可應(yīng)用于醫(yī)學(xué)研究的領(lǐng)域。先前有研究將ML應(yīng)用于靜脈血栓評(píng)估,并取得了一定成果。Kawaler等[8]于2012年提出用ML的方法識(shí)別,并提出了用此方法預(yù)測(cè)深靜脈血栓較傳統(tǒng)模型更為優(yōu)越。Narain[21]將自然語(yǔ)言處理系統(tǒng)(natural language processing,NLP)與ML相結(jié)合,來(lái)加強(qiáng)深靜脈血栓的識(shí)別率。此外,Perroni等[22]運(yùn)用ML方法對(duì)進(jìn)行化療的門(mén)診癌癥病人進(jìn)行靜脈血栓栓塞的風(fēng)險(xiǎn)評(píng)估,基于支持向量和隨機(jī)優(yōu)化(RO)模型的多核學(xué)習(xí)(MKL)進(jìn)行靜脈血栓形成的風(fēng)險(xiǎn)預(yù)測(cè)。Liu等[23]將ML運(yùn)用于PICC相關(guān)靜脈血栓形成的評(píng)估中。以上均是ML運(yùn)用于血栓形成風(fēng)險(xiǎn)評(píng)估及預(yù)測(cè)的實(shí)例,但是尚未有研究將ML運(yùn)用于PICC相關(guān)UEDVT形成風(fēng)險(xiǎn)評(píng)估中。本研究中采用2個(gè)ML模型,以現(xiàn)有評(píng)估模型Seeley為基礎(chǔ),建立ML-LASSO和ML-Seeley-LASSO模型。樣本被隨機(jī)分為訓(xùn)練集和測(cè)試集,并將訓(xùn)練及測(cè)試結(jié)果與現(xiàn)有評(píng)估量表Seeley進(jìn)行比較。在訓(xùn)練集結(jié)果中,Seeley預(yù)測(cè)工具與ML模型比較,ML-LASSO和ML-Seeley-LASSO都較Seeley工具更為優(yōu)越。在測(cè)試集結(jié)果中,與Seeley相比,ML-LASSO和ML-Seeley-LASSO工具也更為優(yōu)越,且ML-LASSO的優(yōu)越性高于ML-Seeley-LASSO。進(jìn)一步對(duì)2個(gè)ML模型ML-LASSO和ML-Seeley-LASSO進(jìn)行了ROC曲線分析,其AUC分別為0.856和0.799,表明ML-LASSO模型和ML-Seeley-LASSO模型在對(duì)PICC相關(guān)UEDVT形成都具有優(yōu)越的預(yù)測(cè)性能。
傳統(tǒng)的預(yù)測(cè)模型Seeley包括的預(yù)測(cè)因子有5個(gè),分別為最近臥床不起、深靜脈局部壓痛、吸煙、骨髓炎和抗凝劑等。另外,近年來(lái)國(guó)內(nèi)護(hù)理領(lǐng)域?qū)ICC相關(guān)性血栓形成危險(xiǎn)因素方面的研究也比較多。如裘成莉等[24]對(duì)食管癌化療病人PICC相關(guān)性血栓的危險(xiǎn)因素進(jìn)行回歸分析,結(jié)果顯示:食管癌TNM分期、靜脈血栓史、放療史、PICC導(dǎo)管類(lèi)型與PICC相關(guān)性血栓的發(fā)生相關(guān)。陳江瓊等[5]構(gòu)建PICC相關(guān)性上肢靜脈血栓風(fēng)險(xiǎn)評(píng)估模型并進(jìn)行評(píng)價(jià),Logistic回歸分析顯示,肥胖、糖尿病、血栓史、化療史和D-二聚體(≥0.5 mg/L)為獨(dú)立危險(xiǎn)因素。本研究應(yīng)用的ML模型為PICC相關(guān)UEDVT形成的預(yù)測(cè)因素和危險(xiǎn)因素提供了一些指示。在模型中,最重要的預(yù)測(cè)UEDVT的發(fā)生的因子包括體質(zhì)指數(shù)、吸煙、深靜脈血栓家族史、NRS 2002評(píng)分、糖尿病、導(dǎo)管的位置和D-二聚體(≥0.5 mg/L)等。之前的相關(guān)研究?jī)H使用線性模型(邏輯回歸)來(lái)擬合數(shù)據(jù),而不是ML使用測(cè)試集來(lái)衡量模型的性能,ML與回歸模型相比,可以處理許多的自變量(也稱(chēng)預(yù)測(cè)因子),以非線性的方式整合,更適用于分析真實(shí)世界中數(shù)據(jù),而非線性回歸所擬合的結(jié)構(gòu)化數(shù)據(jù)。并且測(cè)試集基于訓(xùn)練集的結(jié)果,能更好預(yù)測(cè)UEDVT的發(fā)生,在預(yù)測(cè)性能上具有明顯的優(yōu)越性。然而本研究也存在一定的局限性,如所有的樣本均來(lái)自1所醫(yī)院,未進(jìn)行相關(guān)時(shí)間序列的分析,隨著信息化的普及,將來(lái)可擴(kuò)大樣本量,進(jìn)行時(shí)間序列分析,以獲取更準(zhǔn)確的信息。