陳余興 王貴
(海南西部中心醫(yī)院,海南 儋州 571700 )
隨著老年人口在人口結(jié)構(gòu)中的比例不斷增加及醫(yī)療技術(shù)的進(jìn)步,老年骨科行手術(shù)治療的患者也在不斷增多〔1,2〕。低蛋白血癥是骨科術(shù)后的常見(jiàn)并發(fā)癥,具體指血清總白蛋白低于60 g/ml或白蛋白低于35 g/ml〔3,4〕。低蛋白血癥也是影響免疫功能的重要原因,及早地糾正低蛋白血癥可降低并發(fā)癥的發(fā)生率,特別是高齡老人應(yīng)尤其予以重視〔5〕。骨科手術(shù)往往創(chuàng)傷較大、術(shù)中出血多、手術(shù)時(shí)間長(zhǎng)及需要復(fù)合麻醉,而高齡老年患者身體耐受能力差,更容易導(dǎo)致骨科術(shù)后并發(fā)癥發(fā)生〔6〕。因此,本研究針對(duì)高齡老年骨科患者術(shù)后低蛋白血癥為研究對(duì)象,用數(shù)據(jù)挖掘方法對(duì)高齡骨科手術(shù)患者的臨床資料進(jìn)行回顧性分析,分析這類人群術(shù)后低蛋白血癥的風(fēng)險(xiǎn)因素,建立高齡骨科患者術(shù)后低蛋白血癥的風(fēng)險(xiǎn)預(yù)測(cè)模型,以期為高齡骨科患者術(shù)后低蛋白血癥的預(yù)防和治療提供依據(jù)。
1.1數(shù)據(jù)來(lái)源 數(shù)據(jù)來(lái)自海南省儋州中心醫(yī)院信息管理系統(tǒng),出院日期為2015年3月1日至2020年3月31日的80歲及以上高齡骨科患者住院病歷信息。提取內(nèi)容主要為5個(gè)部分,包括一般信息、診斷信息、檢驗(yàn)結(jié)果、檢查結(jié)果、病例中明確記錄的術(shù)后并發(fā)癥。
1.2納入排除標(biāo)準(zhǔn) 納入標(biāo)準(zhǔn):①因骨科疾病在海南省儋州中心醫(yī)院住院的患者;②患者年齡≥80歲;③行手術(shù)治療。排除標(biāo)準(zhǔn):①臨床資料不全影響判斷者;②轉(zhuǎn)科患者。
1.3數(shù)據(jù)采集 根據(jù)海南省儋州中心醫(yī)院住院病人電子病歷首頁(yè)查詢系統(tǒng)查詢符合納入排除標(biāo)準(zhǔn)的病歷的病案號(hào),制定名單列表,然后由醫(yī)院信息系統(tǒng)(HIS)中導(dǎo)出列表上病人的電子病歷,同時(shí)由HIS中導(dǎo)出患者的檢驗(yàn)記錄,心電圖、B超、胸片、CT、磁共振成像(MRI)等檢查結(jié)果及部分病歷在病案室手工采集。將收集到的各項(xiàng)數(shù)據(jù)輸入Excel表,建立基礎(chǔ)數(shù)據(jù)庫(kù)。
1.4數(shù)據(jù)預(yù)處理 數(shù)據(jù)規(guī)約:對(duì)檢查檢驗(yàn)指標(biāo)的連續(xù)型特征統(tǒng)一單位,并按術(shù)前術(shù)后劃分,并取極值,離散型特征進(jìn)行類別規(guī)范。時(shí)間由“小時(shí)、天、周、月、年”統(tǒng)一為“天”;紅細(xì)胞計(jì)數(shù)術(shù)前最小值(min)為3.16,紅細(xì)胞計(jì)數(shù)術(shù)前最大值(max)為3.83;血紅蛋白min為92,血紅蛋白max為113。麻醉名稱由“腰麻、神經(jīng)阻滯、局麻、腰硬聯(lián)合、硬膜外、臂叢、全麻、硬外、連硬外”整理歸為“椎管內(nèi)麻醉、腰從麻醉、局麻、頸叢麻醉、神經(jīng)阻滯、臂叢麻醉、全麻”7類。異常值和缺失值處理:首先,部分缺失值經(jīng)醫(yī)學(xué)專家確認(rèn)后在原數(shù)據(jù)補(bǔ)全。無(wú)法補(bǔ)全者根據(jù)不同數(shù)據(jù)類型按照以下規(guī)定補(bǔ)全:①錄入導(dǎo)致的異常值修正或用缺失值替代;②連續(xù)變量由于不符合正態(tài)分布,偏度較大,用中位數(shù)插補(bǔ);③離散變量用眾數(shù)插補(bǔ)相應(yīng)的缺失值〔7〕。標(biāo)準(zhǔn)化:①連續(xù)特征采用z-score標(biāo)準(zhǔn)化方法轉(zhuǎn)換,經(jīng)轉(zhuǎn)換后的數(shù)據(jù)滿足均值為0標(biāo)準(zhǔn)差為1;②離散特征做one-hot變換,實(shí)現(xiàn)離散特征的標(biāo)準(zhǔn)化。
1.5術(shù)后低蛋白血癥的判定規(guī)則 ①根據(jù)病歷信息中病程記錄、會(huì)診記錄、出院記錄的診斷信息確定術(shù)后并發(fā)癥的低蛋白血癥。②根據(jù)術(shù)后的檢驗(yàn)結(jié)果的最低值進(jìn)行判定(術(shù)后血清總蛋白低于60 g/L或白蛋白低于35 g/L〔3〕,術(shù)前正常)。
2.1數(shù)據(jù)提取結(jié)果的一般信息 根據(jù)納入排除標(biāo)準(zhǔn),共提取患者病案號(hào)498例,經(jīng)篩查發(fā)現(xiàn)數(shù)據(jù)中有重復(fù)出現(xiàn)的病案號(hào)20例,均為二次住院手術(shù),二次住院時(shí)間均超過(guò)半年,經(jīng)討論決定作為新的病歷來(lái)研究。因此原數(shù)據(jù)新增20例,共518例。數(shù)據(jù)嚴(yán)重缺失影響判斷病歷2例,最終剩余516例。提取出病歷特征共357種,剔除缺失比例大于30%的特征不予分析,剔除無(wú)法分析的特征(如:病案號(hào),既往史等),共剩余128個(gè)特征。其中最早出院時(shí)間為2003年7月18日,最晚出院時(shí)間為2020年3月29日?;颊吣挲g最大97歲,最小80歲,平均83.99歲,男性173例,女性343例。全部患者的術(shù)后低蛋白血癥發(fā)生率為36.6%(189例)。
2.2單因素分析結(jié)果 單因素分析將有統(tǒng)計(jì)學(xué)意義的特征作為下一步建模的特征。全部128個(gè)特征,有統(tǒng)計(jì)學(xué)意義的共63個(gè)連續(xù)型特征和3個(gè)離散型特征(椎管內(nèi)麻醉、致傷因素、是否使用中藥),見(jiàn)表1。
表1 單因素分析結(jié)果
續(xù)表1 單因素分析結(jié)果
2.3模型構(gòu)建結(jié)果 將年齡、傷后至入院時(shí)間、術(shù)中出血量、術(shù)中輸血量、術(shù)中輸液量、術(shù)后輸血量、術(shù)后引流量、血磷min、血磷max、凝血酶原時(shí)間INR min、凝血酶原時(shí)間max、纖維蛋白原定量max等多個(gè)因素納入多元預(yù)測(cè)模型。利用網(wǎng)格搜索(GridSearch)方法進(jìn)行參數(shù)尋優(yōu),并使用k-折交叉驗(yàn)證對(duì)模型評(píng)估。對(duì)比模型擬合及預(yù)測(cè)效果,選擇最佳模型作為最終的風(fēng)險(xiǎn)模型。研究中使用了決策樹(shù)(Decision Tree)、邏輯回歸(Logistic Regression)、隨機(jī)森林(Random Forest)、ExtraTreesClassifier、AdaBoost、GradientBoostDecisionTree、SVM等7種目前流行的機(jī)器學(xué)習(xí)模型。其中以隨機(jī)森林模型為最佳,訓(xùn)練集的10折交叉驗(yàn)證AUC值高達(dá)87.7%。按特征重要對(duì)模型特征排序,系數(shù)越大代表特征對(duì)模型的影響越大:白蛋白定量min(0.6)、椎管內(nèi)麻醉(0.5)、肌酸激酶同工酶min(0.5)、術(shù)后引流量(0.4)、術(shù)中出血量(0.4)、直接膽紅素max(0.4)、血清總蛋白max(0.4)、術(shù)后輸血量(0.3)、血清總蛋白min(0.3)、血鈉min(0.3)、總膽紅素min(0.3)、總膽紅素max(0.2)、肌酸激酶min(0.2)、高密度脂蛋白min(0.2),表明它們是老年骨科患者術(shù)后發(fā)生低蛋白血癥的獨(dú)立危險(xiǎn)因素。
2.4模型驗(yàn)證及ROC曲線 模型ROC曲線見(jiàn)圖1。
圖1 模型ROC曲線
通過(guò)對(duì)7種機(jī)器學(xué)習(xí)模型的對(duì)比,最終選定最佳模型為隨機(jī)森林,模型的ROC曲線為0.891 638,10折交叉驗(yàn)證后的ROC曲線為0.790 397,通過(guò)結(jié)果可以看出模型有較好的預(yù)測(cè)能力。
在本研究中,通過(guò)對(duì)術(shù)后發(fā)生低蛋白血癥的高齡老年骨科手術(shù)患者臨床資料進(jìn)行分析及建模,發(fā)現(xiàn)了20種可能導(dǎo)致患者術(shù)后發(fā)生低蛋白血癥的預(yù)測(cè)因素。本研究發(fā)現(xiàn)高齡老年骨科手術(shù)患者發(fā)生低蛋白血癥的發(fā)生率明顯高于李秋萍等〔8〕在363例65歲以上老年外科大手術(shù)患者研究中的15.2%,可能與其診斷標(biāo)準(zhǔn)定為白蛋白<25 g/L,而本研究的診斷標(biāo)準(zhǔn)為白蛋白<35 g/L有關(guān)。此外,本研究為80以上高齡老年患者,術(shù)前衰弱及營(yíng)養(yǎng)狀況、生理儲(chǔ)備能力均不及65歲以上人群。沈妍交〔9〕通過(guò)對(duì)衰弱指數(shù)在老年髖部骨折圍術(shù)期風(fēng)險(xiǎn)評(píng)估的應(yīng)用研究發(fā)現(xiàn),行手術(shù)治療的髖部骨折患者中,衰弱患者的術(shù)后低蛋白血癥發(fā)生率明顯高于非衰弱患者。所以年齡段的不同也是本研究術(shù)后低蛋白血癥發(fā)生率高的重要原因。但在本研究中并未發(fā)現(xiàn)年齡是80歲以上老年骨科手術(shù)的風(fēng)險(xiǎn)因素,可能與患者間年齡差距較小相關(guān)。本研究患者年齡主要集中于80~86歲,約占患者總數(shù)的78%,所以年齡對(duì)術(shù)后的影響不能較好體現(xiàn)。
3.1文獻(xiàn)報(bào)道的可能原因及機(jī)制 目前骨科術(shù)后低蛋白血癥的主要原因及機(jī)制主要有:①術(shù)后應(yīng)激:術(shù)后應(yīng)激造成機(jī)體處于一種分解激素高于合成激素的高代謝水平,進(jìn)而引起蛋白質(zhì)大量消耗,導(dǎo)致低蛋白血癥,即內(nèi)分泌代謝反應(yīng)〔10〕;②急性炎癥:急性炎癥時(shí)形成的內(nèi)皮間隙與大量炎性介質(zhì)所導(dǎo)致的微血管白蛋白滲漏相匹配,使內(nèi)皮細(xì)胞連接間隙開(kāi)放,白蛋白無(wú)須依賴能量即可通過(guò)內(nèi)皮間隙,即炎癥反應(yīng),加速術(shù)后低蛋白血癥的發(fā)生〔11〕;③術(shù)中失血:白蛋白隨術(shù)中失血及術(shù)后胸腔積液的丟失而減少。本研究中術(shù)后引流量及術(shù)后輸血量同樣是手術(shù)造成患者血液流失的直接和間接指標(biāo),印證了手術(shù)失血是術(shù)后低蛋白血癥的風(fēng)險(xiǎn)因素;④術(shù)中及術(shù)后輸液:術(shù)中、術(shù)后因病情需要輸注大量液體而造成的稀釋性低蛋白血癥,與本研究結(jié)論一致。其中內(nèi)分泌反應(yīng)所致的高分解代謝及炎癥反應(yīng)引起的微血管白蛋白滲漏是術(shù)后低蛋白血癥發(fā)生的主要機(jī)制。⑤衰弱:衰弱的老年患者處于易損性增加、內(nèi)環(huán)境紊亂、營(yíng)養(yǎng)不良導(dǎo)致基礎(chǔ)蛋白較低的特異性狀態(tài),是術(shù)后并發(fā)癥的獨(dú)立風(fēng)險(xiǎn)因素〔12,13〕。⑥術(shù)前白蛋白:術(shù)前白蛋白水平體現(xiàn)了患者的營(yíng)養(yǎng)狀況及代謝能力,營(yíng)養(yǎng)不良患者在應(yīng)激狀態(tài)下增加蛋白的分解以保證機(jī)體能量的平衡〔14〕。所以術(shù)前蛋白水平較低者,術(shù)后更容易出現(xiàn)低蛋白血癥。術(shù)后血清白蛋白水平下降幅度與術(shù)前白蛋白水平呈明顯正相關(guān)。郭志金等〔15〕通過(guò)對(duì)200例患者進(jìn)行回歸分析發(fā)現(xiàn),術(shù)前低蛋白患者術(shù)后低蛋白血癥的發(fā)生是正?;颊叩?6.163倍。本研究的最高風(fēng)險(xiǎn)因素為術(shù)前白蛋白定量min及血清白蛋白max,體現(xiàn)了患者術(shù)前白蛋白的最低狀態(tài)。
3.2本研究新發(fā)現(xiàn)的風(fēng)險(xiǎn)因素 本研究通過(guò)建模分析發(fā)現(xiàn)以下風(fēng)險(xiǎn)因素:①椎管內(nèi)麻醉:麻醉方式的不同,一定程度上反映了手術(shù)的難度與創(chuàng)傷的大小。椎管內(nèi)麻醉是骨科的常見(jiàn)麻醉方式,但與局麻、頸叢麻醉、臂叢等麻醉相比,所行手術(shù)創(chuàng)傷一般較大。此外,有研究ASA麻醉分級(jí)越高,表示病情越嚴(yán)重,風(fēng)險(xiǎn)越高〔16〕。同時(shí),這也意味著術(shù)中出血量、輸液量、術(shù)后引流等相關(guān)風(fēng)險(xiǎn)因素的增加,使椎管內(nèi)麻醉成為高齡老年患者術(shù)后低蛋白血癥的風(fēng)險(xiǎn)因素。②肌酸激酶min:肌酸激酶主要存在于骨骼肌、心肌、平滑肌的細(xì)胞質(zhì)和線粒體中,是一個(gè)與細(xì)胞內(nèi)能量運(yùn)轉(zhuǎn)、肌肉收縮、ATP再生有直接關(guān)系的重要激酶,肌酸激酶水平較高反映了患者的創(chuàng)傷情況。對(duì)于骨折的患者來(lái)說(shuō),骨折及其伴隨的軟組織損傷,是術(shù)前肌酸激酶水平高的主要原因〔17〕。此類患者與勞損退變性骨科手術(shù)患者相比較,術(shù)前身體經(jīng)受了初次打擊,大大增加了低蛋白血癥的常見(jiàn)風(fēng)險(xiǎn)因素。③總膽紅素及直接膽紅素:白蛋白作為游離膽紅素變成結(jié)合膽紅素的重要載體,直接參與膽紅素完成肝腸循環(huán)〔18〕。對(duì)于術(shù)前膽紅素水平較高的患者,筆者考慮是由于創(chuàng)傷骨折患者應(yīng)激造成患者蛋白血合成功能下降,導(dǎo)致膽紅素代謝降低所致〔19〕。綜上所述,高齡老年骨科手術(shù)患者的術(shù)前白蛋白水平對(duì)患者術(shù)后的預(yù)后有十分重要的參考意義〔20〕。
3.3本研究的不足 本研究的局限在于病例來(lái)源于一所醫(yī)院,樣本量較小,還需樣本量更大的資料進(jìn)行進(jìn)一步論證。其次,在文本型數(shù)據(jù)提取與標(biāo)準(zhǔn)化過(guò)程中還存在一些問(wèn)題,例如:術(shù)中出血量、傷后至入院時(shí)間等,在自然語(yǔ)言識(shí)別過(guò)程中難以完全通過(guò)自動(dòng)語(yǔ)義識(shí)別方式完成數(shù)據(jù)標(biāo)準(zhǔn)化工作,尚需要專業(yè)人員通過(guò)人工識(shí)別方式進(jìn)行質(zhì)量控制。