亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于常規(guī)臨床檢驗指標構(gòu)建子癇前期風(fēng)險預(yù)測模型

        2022-02-02 08:18:06王浩烏永嘎郭玉婷梁雨朝李海成周健夏書琴左永春
        臨床檢驗雜志 2022年10期
        關(guān)鍵詞:特征選擇準確率樣本

        王浩,烏永嘎,郭玉婷,梁雨朝,李海成,周健,夏書琴,左永春

        (1.內(nèi)蒙古大學(xué)生命科學(xué)學(xué)院,呼和浩特 010070;2.內(nèi)蒙古智匯大數(shù)據(jù)研究院,呼和浩特 010000;3.內(nèi)蒙古醫(yī)科大學(xué)&內(nèi)蒙古臨床醫(yī)學(xué)院,呼和浩特 010110;4.內(nèi)蒙古自治區(qū)人民醫(yī)院婦產(chǎn)科,呼和浩特 010017)

        子癇前期(preeclampsia,PE)是指發(fā)生于妊娠20周后,以高血壓、蛋白尿為主要臨床特征的常見妊娠并發(fā)癥,在發(fā)展中國家發(fā)病率高達10%,是造成孕產(chǎn)婦及胎兒患病率和死亡率增高的主要原因之一[1]。目前有很多針對PE的篩查項目,但PE早期預(yù)測效果不佳,亟待開發(fā)快速有效的早期診斷模型。

        近年來,研究人員利用機器學(xué)習(xí)算法針對臨床檢驗指標對妊娠期疾病開展了一系列研究。Betts等[2]用梯度提升樹構(gòu)建用于預(yù)測產(chǎn)后并發(fā)癥的風(fēng)險模型,表明常規(guī)健康數(shù)據(jù)在確定女性因常見產(chǎn)后并發(fā)癥入院的風(fēng)險方面發(fā)揮了重要作用。張心遠等[3]通過收集PE和健康妊娠孕婦的凝血、血常規(guī)等臨床檢驗數(shù)據(jù),利用LightGBM預(yù)測PE,取得了較好的結(jié)果。Rasmussen等[4]利用游離RNA(cfRNA)特征預(yù)測PE的發(fā)病概率,敏感性達75.00%。Wu等[5]開發(fā)了妊娠期糖尿病分層預(yù)測模型,為孕婦16孕周前篩查妊娠期糖尿病提供了一種簡單有效的方法。

        本研究基于多項臨床檢驗指標,建立了一種特征篩選策略Tuning Relief F (TURF)與機器學(xué)習(xí)方法K-nearest neighbor (KNN)相結(jié)合的PE預(yù)警模型,實現(xiàn)了對PE的準確預(yù)測。

        1 對象與方法

        1.1研究對象 選擇2019年1月至2021年12月于內(nèi)蒙古自治區(qū)人民醫(yī)院婦產(chǎn)科就診的346例健康孕婦為對照組(HE組),年齡23~40(30.4±4.9)歲,單胎妊娠,臨床資料完整,初次入院孕周 37~40(39.4±1.0)周;另選取同期就診的PE孕婦 342例為實驗組(PE組),年齡 22~44(31.7±5.3)歲,初次入院孕周 23~37(35.7±4.3)周。

        PE患者符合第9版《婦產(chǎn)科學(xué)》中關(guān)于PE的診斷標準,妊娠20周后,患者靜坐休息5 min后測量血壓,2次測量至少間隔4 h,血壓高于140 mmHg/90 mmHg,合并有尿蛋白≥ 0.3 g/24 h或隨機蛋白尿(尿蛋白+),或者患者合并出現(xiàn)腹痛、肺水腫、肝腎功能異常、血小板下降等癥狀;單胎妊娠;臨床資料完整。排除患有慢性高血壓、心臟病、自身免疫病、腎臟疾病、合并其他妊娠期疾病等。

        收集年齡、收縮壓、舒張壓、BMI、初次入院孕周、初次入院實驗室資料(血常規(guī)、尿常規(guī)、生化全項、凝血功能)等,排除含有缺失值的指標,最終納入87個特征指標用于分析。

        本研究經(jīng)內(nèi)蒙古自治區(qū)人民醫(yī)院倫理委員會批準(批準文號:202201004L)。所有參與者簽署知情同意書。

        1.2數(shù)據(jù)預(yù)處理 收集所有研究對象(688例樣本共87項指標)的血常規(guī)、尿常規(guī)、生化全項和凝血四項檢測數(shù)據(jù)。對過濾后樣本的臨床檢測數(shù)據(jù)集進行標準化,然后按照3∶1的比例將688份樣本數(shù)據(jù)拆分為包含516份樣本的訓(xùn)練集和172份樣本的測試集,見表1。

        表1 臨床檢驗數(shù)據(jù)集組成

        1.3特征選擇策略 對高維數(shù)據(jù)的計算分析及其解釋對于理解模型決策至關(guān)重要。LASSO和TURF將特征選擇過程從單輪推進到多輪過程,對所有特征評分[6]。通過使用TURF和LASSO 2種特征選擇策略對87個臨床檢驗指標進行評分并根據(jù)分值從大到小排序。基于增量特征選擇策略(incremental feature selection, IFS),使用4種機器學(xué)習(xí)分類器擬合TURF訓(xùn)練集數(shù)據(jù)。

        1.4機器學(xué)習(xí)模型 K近鄰(K-nearest neighbor,KNN)[7]、支持向量機(support vector machine,SVM)[8]、隨機森林(random forest classifier,RFC)和XGBoost 4種機器學(xué)習(xí)算法被用來構(gòu)建PE預(yù)測模型,并比較預(yù)測性能,選擇最優(yōu)模型?;趐ython包xgboost(1.5.2)構(gòu)建XGBoost模型,基于python包scikit-learn(1.0)構(gòu)建SVM、RFC和KNN模型。

        1.5五折交叉驗證 五折交叉驗證即對數(shù)據(jù)進行5次劃分,每次選取4份樣本為訓(xùn)練集建立模型,1份樣本為測試集評估預(yù)測效果,每次記錄模型分別在訓(xùn)練集和測試集上的預(yù)測結(jié)果和預(yù)測誤差,如此重復(fù)5次,最后將5次的預(yù)測誤差取平均值,得到1個綜合的預(yù)測誤差估計值。五折交叉驗證法的實現(xiàn)以及各個預(yù)測模型的模擬計算與預(yù)測分析均通過python編程實現(xiàn)。

        1.6模型評估 基于五折交叉驗證策略,用準確率、召回率、F1 measure和精確度4個經(jīng)典指標評估模型的預(yù)測性能[9-10]。準確率=(TP+TN)/(TP+TN+FP+FN),召回率=TP/(TP+FN),F(xiàn)1 measure=2×(準確率×召回率)/(準確率+召回率),精確度=TP/(TP+FP)。TP、TN、FP和FN分別代表真陽性、真陰性、假陽性和假陰性。用ROC曲線定量評估模型的整體性能,通過計算ROC曲線下面積(AUCROC)客觀評價預(yù)測器的性能。

        1.7SHAP解釋方法 SHAP是在合作博弈論啟發(fā)下構(gòu)建的加性可解釋模型,其核心是計算出每個特征的SHAP值,能夠反映特征對整個模型預(yù)測能力的貢獻程度。

        2 結(jié)果

        2.1基線資料 與HE組比較,PE組年齡、收縮壓、舒張壓和BMI均升高,初次入院孕周降低(P均<0.05),見表2。

        表2 HE組和PE組一般資料比較

        2.2構(gòu)建PE預(yù)測模型

        2.2.1基于特征選擇策略構(gòu)建預(yù)測PE最優(yōu)模型 基于增量特征選擇策略,評估機器學(xué)習(xí)算法在不同數(shù)量特征集下的預(yù)測性能結(jié)果見圖1A。SVM隨特征數(shù)量的變化,預(yù)測性能波動劇烈,另外3種機器學(xué)習(xí)模型隨特征數(shù)量的變化則呈現(xiàn)出逐漸平穩(wěn)的趨勢。

        注:A,基于增量特征選擇策略,評估機器學(xué)習(xí)算法在不同數(shù)量特征集下的預(yù)測性能;B,基于7個特征,KNN在測試數(shù)據(jù)集的混淆矩陣;C和D,UMAP顯示原始特征集和TURF最優(yōu)特征指標之間HE組和PE組的聚類情況(C,原始特征集,D,TURF特征集)。圖1 模型的預(yù)測表現(xiàn)

        4個基本分類器基于TURF和LASSO預(yù)測PE性能的訓(xùn)練集結(jié)果見表3?;赥URF,XGBoost在使用28個特征指標時表現(xiàn)最優(yōu),準確率為88.15%。KNN和SVM同樣有優(yōu)異表現(xiàn),基于TURF特征策略,在僅使用7個和8個特征指標的情況下,準確率分別達到了82.55%和84.68%?;贚ASSO選擇的7個最優(yōu)特征子集,4種機器學(xué)習(xí)模型也同樣達到了較優(yōu)異的預(yù)測結(jié)果,KNN、SVM、RFC和XGBoost的準確率分別為75.58%、75.58%、75.00%和75.00%。TURF特征策略更適合用于進一步分析和建模。

        表3 4個基本分類器基于TURF和LASSO預(yù)測PE的性能(訓(xùn)練集)

        2.2.2基于測試集驗證PE預(yù)測模型 用完全獨立于訓(xùn)練過程的測試集驗證4種模型的可靠性和穩(wěn)定性,見表4。SVM在使用8個特征指標時,準確率、精確度、召回率和F1 measure分別為80.81%、84.52%、78.02%和80.14%。RFC在使用15個特征指標時,準確率、精確度、召回率和F1 measure分別為79.53%、65.07%、85.11%和75.57%。XGBoost在使用28個特征指標時,準確率、精確度、召回率和F1 measure分別為81.28%、85.22%、74.48%和80.42%。

        表4 4個基本分類器基于TURF識別PE的性能(測試集)

        當K=14時,KNN算法在僅使用7個特征指標時表現(xiàn)最為優(yōu)異,準確率、精確度、召回率和F1 measure分別達到了82.56%、87.54%、71.42%、80.24%。進一步通過模型在獨立數(shù)據(jù)集的ACC表現(xiàn)來評判其魯棒性,SVM、RFC和XGBoost均出現(xiàn)了不同程度的過擬合現(xiàn)象,然而KNN表現(xiàn)優(yōu)異,準確率和精確度均優(yōu)于其他模型且展現(xiàn)出優(yōu)異的魯棒性。

        ROC曲線顯示,基于TURF特征子集,KNN預(yù)測模型的AUCROC達0.90,可以將PE與HE區(qū)分開來?;赥RUF特征策略的KNN算法被選擇搭建基于臨床檢驗數(shù)據(jù)預(yù)測PE的機器學(xué)習(xí)模型。

        KNN預(yù)測PE和HE表現(xiàn)的混淆矩陣見圖1B,6個健康妊娠樣本被預(yù)測為PE患者,26個PE患者被預(yù)測為HE,總體預(yù)測性能優(yōu)異。分別以全部特征指標和7個特征指標為輸入變量,使用均勻流形近似和投影(uniform manifold approximation and projection, UMAP)對所有樣本進行聚類分析,見圖1C和1D。當使用所有特征指標進行降維聚類時,PE和HE夾雜在一起,冗余信息使樣本幾乎無法區(qū)別;當使用7個最優(yōu)特征指標時,PE和HE完美地分開;表明采用的特征選擇策略有效過濾掉了冗余信息,篩選出了關(guān)鍵的特征指標。最終,尿蛋白、尿電導(dǎo)率、血尿酸、堿性磷酸酶、乳酸脫氫酶、平均紅細胞血紅蛋白濃度和淀粉酶被確定為最具有診斷PE能力的7個指標。

        2.3PE預(yù)測模型的特征解釋 用SHAP解釋7個特征指標見圖2。圖2A顯示尿蛋白值越高對模型預(yù)測性能的提升越大,乳酸脫氫酶升高同樣與模型預(yù)測性能呈正相關(guān);反之,淀粉酶值越低會改善模型的預(yù)測性能;而堿性磷酸酶、尿電導(dǎo)率、血尿酸和平均紅細胞血紅蛋白濃度似乎沒有顯著影響模型的決策能力。用7個特征指標SHAP值的平均絕對值來觀察如何影響模型,見圖2B。結(jié)果表明尿蛋白對于模型做出決策有絕對的影響力,淀粉酶會影響模型對HE做出決策,乳酸脫氫酶會影響模型對PE患者做出決策,堿性磷酸酶、尿電導(dǎo)率、血尿酸和平均紅細胞血紅蛋白濃度沒有顯著影響模型做出決策。

        注:A,樣本特征SHAP值;B,樣本特征SHAP值平均絕對值的柱狀圖。圖2 SHAP值解釋預(yù)測模型特征

        2.4預(yù)測模型揭示在常規(guī)臨床檢驗數(shù)據(jù)中的PE關(guān)鍵指標 比較7個特征指標的表達水平,HE組和PE組差異有統(tǒng)計學(xué)意義(表5)。

        表5 7個特征指標在HE組和PE組中的表達水平

        2.5網(wǎng)絡(luò)服務(wù)web平臺搭建 為方便用戶使用,搭建網(wǎng)絡(luò)服務(wù)器來實現(xiàn)PE的預(yù)測功能,見圖3,免費訪問網(wǎng)址為http://bioinfor.imu.edu.cn/ipreeclampsia。

        注:A,PE預(yù)測平臺主頁;B,用戶通過點擊“SERVER”進入到預(yù)測功能模塊;C,用戶可以直接在表格中鍵入數(shù)據(jù)或者點擊“Upload File”上傳需要預(yù)測的數(shù)據(jù)文件,點擊“Submit”將獲得預(yù)測結(jié)果并通過“Disease Diagnosis”獲取到所有樣本數(shù)以及對應(yīng)標簽,最終通過“Download”可以將預(yù)測結(jié)果下載至本地電腦。圖3 基于常規(guī)臨床檢驗指標的PE預(yù)測模塊

        3 討論

        PE除了產(chǎn)生不良妊娠和分娩結(jié)局外,還可能通過胎盤功能障礙、妊娠期缺氧缺血環(huán)境、異常炎癥水平和表觀遺傳變化等途徑增加子代對疾病的易感性,如免疫病、代謝綜合征、神經(jīng)發(fā)育和精神障礙[11]。目前有大量關(guān)于PE風(fēng)險預(yù)測的研究,但研究質(zhì)量參差不齊、預(yù)測步驟繁瑣且精確度不高,后期缺乏有效的臨床驗證,最終這些預(yù)測方案并沒有落地于臨床實踐[12]。本研究結(jié)果表明,基于血常規(guī)、尿常規(guī)、生化全項和凝血四項結(jié)果的基礎(chǔ)臨床檢驗數(shù)據(jù)可以實現(xiàn)對PE患者的有效預(yù)測。使用TURF策略去冗余后得到的7個特征指標作為KNN輸入特征構(gòu)建的PE預(yù)測模型取得了優(yōu)異性能,準確率達到了82.56%。此外,通過模型解釋探究了7個特征指標如何影響模型做出決策,例如,尿蛋白和乳酸脫氫酶值的升高會提升模型預(yù)測效果。通過比較7個特征指標在PE患者和健康孕婦中的表達水平,進一步證實了其可以作為PE預(yù)測的關(guān)鍵指標,然而血小板減少、血清轉(zhuǎn)氨酶升高、血肌酐升高指標并未成為最優(yōu)特征,可能與PE臨床表現(xiàn)多樣性有關(guān)。

        Poon等[13]根據(jù)PE表型的異質(zhì)性和預(yù)測的復(fù)雜性提出了PE篩查的最佳方法是在母體風(fēng)險因素的基礎(chǔ)上,加入各項生物學(xué)指標,包括平均動脈壓(MAP)、子宮動脈多普勒參數(shù)和不同的血清學(xué)指標建立預(yù)測分析模型。PE確診的金標準是在女性妊娠20周后出現(xiàn)高血壓伴隨尿蛋白顯著增加[14],與本研究結(jié)論一致。此外,堿性磷酸酶和乳酸脫氫酶在PE患者中發(fā)生變化,且通過機器學(xué)習(xí)模型發(fā)現(xiàn)其可能會增加PE患病風(fēng)險,并有可能成為PE的風(fēng)險標志物[15-16]。平均紅細胞血紅蛋白濃度在PE中明顯低于HE組,可以用于預(yù)測PE[17]。PE與血尿酸水平有關(guān),血尿酸濃度的變化可能是由于PE初始階段的代謝改變,血尿酸促進炎癥和氧化應(yīng)激功能障礙,是PE的可靠預(yù)測因子[18-19]。淀粉酶和尿電導(dǎo)率在PE中的作用很少受到關(guān)注。本研究有效地整合了上述指標,有助于建立良好的預(yù)測模型。此外,本研究根據(jù)得到的預(yù)測模型提供了PE預(yù)測web服務(wù)器。

        本研究也存在一些不足之處:(1)數(shù)據(jù)均來源于內(nèi)蒙古自治區(qū),可能存在選擇偏倚,需要外部驗證進一步評估模型的性能;(2)研究中部分指標的缺失率偏大,如孕前BMI是孕產(chǎn)婦產(chǎn)檢的重要指標,但在本研究中由于該指標缺失率偏大而未納入模型中,重要指標的缺失可能會對模型的效能產(chǎn)生一些影響。

        猜你喜歡
        特征選擇準確率樣本
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
        2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
        用樣本估計總體復(fù)習(xí)點撥
        推動醫(yī)改的“直銷樣本”
        高速公路車牌識別標識站準確率驗證法
        隨機微分方程的樣本Lyapunov二次型估計
        Kmeans 應(yīng)用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        村企共贏的樣本
        聯(lián)合互信息水下目標特征選擇算法
        日韩少妇激情一区二区| 99精品国产综合久久麻豆| 无码少妇丰满熟妇一区二区| 人妻激情另类乱人伦人妻 | 亚洲精品国产第一区二区| 特黄特色的大片观看免费视频 | 国产精品国产午夜免费福利看| 国产一区二区三区在线观看黄| 精人妻无码一区二区三区| 97久久精品午夜一区二区| 人妻精品一区二区三区视频| 极品少妇一区二区三区四区视频| 欧美性高清另类videosex| 久久无码人妻精品一区二区三区| 色综合久久精品中文字幕| 亚洲一区二区三区福利久久蜜桃| 国产高清在线观看av片| 欧美人与动人物牲交免费观看| 国产传媒在线视频| 伊人久久大香线蕉av不变影院 | 一区二区三区国产黄色| 色拍自拍亚洲综合图区| 国产欧美日韩网站| 亚洲国产一区中文字幕| 日本一本免费一二区| 一本大道色婷婷在线| 国产日韩三级| 亚洲一区二区刺激的视频| 97久久草草超级碰碰碰| 亚洲国产午夜精品乱码| 日本av第一区第二区| 中文字幕av中文字无码亚| 躁躁躁日日躁| 一区二区三区蜜桃在线视频| 亚洲精品有码日本久久久| 国产精品福利自产拍在线观看| 久久精品亚洲中文无东京热| 国产亚洲一区二区精品| 国产av一区二区精品凹凸| 93精91精品国产综合久久香蕉| 亚洲影院在线观看av|