亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于心腦血管疾病發(fā)病風(fēng)險(xiǎn)預(yù)測的CatBoost 算法和貝葉斯網(wǎng)絡(luò)模型分析

        2024-08-30 00:00:00王愛民王鳳琳黃一銘徐雅琪張文婧叢顯鑄蘇維強(qiáng)王素珍高夢瑤李爽孔雨佳石福艷陶恩學(xué)

        [摘 要] 目的:篩選影響心腦血管疾病發(fā)病的主要特征變量,基于排序前10位的特征變量構(gòu)建心腦血管疾病發(fā)病風(fēng)險(xiǎn)貝葉斯網(wǎng)絡(luò)模型,為心腦血管疾病發(fā)病風(fēng)險(xiǎn)預(yù)測提供參考。方法:從英國生物樣本(UK Biobank) 數(shù)據(jù)庫中納入315 896 例參與者和相關(guān)變量,通過類別型特征提升(CatBoost) 算法進(jìn)行特征選擇, 將所有參與者按7∶ 3 比例隨機(jī)分為訓(xùn)練集和測試集, 并基于最大最小爬山(MMHC) 算法構(gòu)建貝葉斯網(wǎng)絡(luò)模型。結(jié)果:本研究中人群心腦血管疾病患病率為28. 8%。CatBoost算法篩選的排名前10 位變量分別為年齡、體質(zhì)量指數(shù)(BMI)、低密度脂蛋白膽固醇(LDL-C)、總膽固醇(TC)、甘油三酯-葡萄糖(TyG) 指數(shù)、家族史、載脂蛋白A/B 比值、高密度脂蛋白膽固醇(HDL-C)、吸煙狀態(tài)和性別。CatBoost 訓(xùn)練集模型受試者工作特征(ROC) 曲線下面積(AUC) 為0. 770,模型準(zhǔn)確性為0. 764;驗(yàn)證集模型AUC 為0. 759,模型準(zhǔn)確性為0. 763。臨床效能分析,訓(xùn)練集閾值范圍為0. 06~0. 85,驗(yàn)證集閾值范圍為0. 09~0. 81。心腦血管疾病發(fā)病風(fēng)險(xiǎn)貝葉斯網(wǎng)絡(luò)模型分析,年齡、性別、吸煙狀態(tài)、家族史、BMI 和載脂蛋白A/B 比值與心腦血管疾病直接相關(guān),是心腦血管疾病發(fā)生的重要風(fēng)險(xiǎn)因素,TyG 指數(shù)、HDL-C、LDL-C 和TC 通過影響B(tài)MI 和載脂蛋白A/B 比值間接影響心腦血管疾病的發(fā)生風(fēng)險(xiǎn)。結(jié)論:控制BMI、載脂蛋白A/B比值和吸煙行為,可以降低心腦血管疾病的發(fā)病風(fēng)險(xiǎn)。貝葉斯網(wǎng)絡(luò)模型可用于預(yù)測心腦血管疾病發(fā)病風(fēng)險(xiǎn)。

        [關(guān)鍵詞] 心腦血管疾?。?CatBoost 算法; 貝葉斯網(wǎng)絡(luò); 風(fēng)險(xiǎn)推理

        [中圖分類號] R54; R743 [文獻(xiàn)標(biāo)志碼] A

        心腦血管疾病是造成全球人口死亡和殘疾的主要疾病之一[1-2]。相關(guān)研究[3-7] 顯示: 全球心腦血管疾病死亡占總死亡的 32. 8%, 1990—2019 年患病人數(shù)約增加2. 52 億人, 且預(yù)計(jì)心腦血管疾病在未來幾十年內(nèi)會增加2 倍,預(yù)計(jì)到2030 年其治療費(fèi)用將增加至10 440 億美元。心腦血管疾病具有高發(fā)病率和高致死率等特點(diǎn)[8],因此對其進(jìn)行早期發(fā)病風(fēng)險(xiǎn)預(yù)測研究具有重要意義。

        目前有關(guān)心腦血管疾病發(fā)病風(fēng)險(xiǎn)預(yù)測研究多采用Cox 比例風(fēng)險(xiǎn)模型、Logistic 回歸模型、決策樹和支持向量機(jī)等機(jī)器學(xué)習(xí)模型[9-13]。但上述傳統(tǒng)的預(yù)測模型需要假設(shè)變量之間相互對立且只能基于完整數(shù)據(jù)集來預(yù)測,不適合變量之間存在復(fù)雜關(guān)系或存在缺失數(shù)據(jù)的研究。貝葉斯網(wǎng)絡(luò)是一種靈活的建模工具, 不僅能處理變量間的復(fù)雜關(guān)系和缺失數(shù)據(jù),而且該模型的結(jié)構(gòu)和參數(shù)學(xué)習(xí)可直觀展示變量之間的因果關(guān)系和相關(guān)程度[14]。目前將貝葉斯網(wǎng)絡(luò)用于心腦血管疾病早期風(fēng)險(xiǎn)預(yù)測的研究較少。本研究擬基于英國生物樣本(UK Biobank) 數(shù)據(jù)庫,采用類別型特征提升 (categorical boosting,CatBoost) 算法結(jié)合貝葉斯網(wǎng)絡(luò)的方式構(gòu)建心腦血管疾病發(fā)病風(fēng)險(xiǎn)預(yù)測模型,進(jìn)而直觀表達(dá)和展示心腦血管疾病發(fā)病風(fēng)險(xiǎn)和各變量間的關(guān)系及相關(guān)程度,為心腦血管疾病的早期風(fēng)險(xiǎn)預(yù)測和復(fù)雜病因研究提供參考。

        1 資料與方法

        1. 1 資料來源

        本研究數(shù)據(jù)來源于UK Biobank數(shù)據(jù)庫,已獲得批準(zhǔn)的項(xiàng)目編號為78500。該數(shù)據(jù)庫在2006—2010 年招募約50 萬名年齡40~69 歲的志愿者,并持續(xù)追訪,是目前全球最大的前瞻性研究數(shù)據(jù)庫[15-16]。本研究的納入和排除標(biāo)準(zhǔn):①選擇參與并回答“醫(yī)生診斷的血管/心臟問題”的研究對象; ②納入可能與心腦血管疾病發(fā)生相關(guān)的16 個(gè)變量,包括年齡、性別、血液生化檢查、心腦血管疾病家族史、飲食習(xí)慣、吸煙和飲酒狀態(tài)等;③排除因不愿回答或未參與問卷調(diào)查的志愿者。本研究最終納入315 896 例研究對象。

        1. 2 數(shù)據(jù)預(yù)處理

        為構(gòu)建離散化貝葉斯網(wǎng)絡(luò),本研究對納入的連續(xù)性變量進(jìn)行了離散化處理。所有研究對象按照年齡分為4 組,分別為lt;45 歲、45~54 歲、55~64 歲和≥65 歲組; 根據(jù)世界衛(wèi)生組織關(guān)于肥胖定義標(biāo)準(zhǔn)[17] 按照體質(zhì)量指數(shù)(bodymass index, BMI) 分 為 4 組, 分 別 為 偏 瘦(lt;18. 5 kg·m-2)、正常(18. 5~24. 9 kg·m-2)、超重(25~29. 9 kg·m-2) 和肥胖( ≥30 kg·m-2) 組;《2019 歐洲心臟病學(xué)會(European Society ofCardiology,ESC) /歐洲動脈硬化學(xué)會(EuropeanAtherosclerosis Society, EAS) 血脂異常管理指南》[18] 指出,血脂4 項(xiàng)在不同風(fēng)險(xiǎn)下參考值范圍不同,故本研究中總膽固醇(total cholesterol,TC)、低密度脂蛋白膽固醇(low-density lipoproteincholesterol, LDL-C)、高密度脂蛋白膽固醇(high-density lipoprotein cholesterol, HDL-C)、載脂蛋白A/B 比值和甘油三酯-葡萄糖(triglycerideglucose,TyG) 指數(shù)按照四分位數(shù)分別分為4 組[19];納入研究的飲食變量參考英國國家醫(yī)療服務(wù)體系(National Health Service, NHS) 指南[20]和CHUDASAMA 等[21] 關(guān)于壽命期望的研究將研究對象均分為2 組,分別為每日蔬菜水果攝入是否滿足5 份及以上(是或否) 組、紅肉是否每周2 次及以上(是或否) 和油性魚是否每周1 次及以上(是或否)。其他變量均采用UK Biobank 數(shù)據(jù)庫的編碼分類。各變量賦值情況見表1。

        1. 3 CatBoost模型分析

        CatBoost算法是一種強(qiáng)大的機(jī)器學(xué)習(xí)算法, 可用于分類和回歸任務(wù)[22],其原理是基于梯度提升決策樹(gradient boostingdecision tree, GBDT) 的思想, 即通過迭代訓(xùn)練多個(gè)弱學(xué)習(xí)器(決策樹),然后將其組合成一個(gè)強(qiáng)學(xué)習(xí)器,其中每一棵樹都試圖糾正前一棵樹的預(yù)測錯(cuò)誤,進(jìn)而提高模型的預(yù)測精度[23-24]。在CatBoost模型構(gòu)建中, 將研究對象按7∶ 3 比例隨機(jī)分為訓(xùn)練集和測試集。訓(xùn)練集構(gòu)建CatBoost 模型, 其最優(yōu)參數(shù)基于網(wǎng)格搜索法[25] 選擇,模型參數(shù)設(shè)置如下: loss_function=MultiClass, eval_metric=WKappa,od_type=Iter,early_stopping_rounds=500。Catboost模型的預(yù)測性能通過受試者工作特征(receiveroperating characteristic, ROC) 曲線和混淆矩陣熱圖評價(jià)。Catboost 模型的臨床效用通過決策曲線分析(decision curve analysis,DCA) 法評價(jià)[26],DCA曲線通常包含2 條參考線,分別表示所有樣本均預(yù)測為陰性或陽性的極端情況。模型DCA 曲線高于2 條參考線范圍越大則模型的臨床效用越好[27]。

        1. 4 貝葉斯網(wǎng)絡(luò)分析

        貝葉斯網(wǎng)絡(luò)又稱因果網(wǎng)絡(luò),可探究各節(jié)點(diǎn)之間的因果關(guān)系,即在已知某些節(jié)點(diǎn)發(fā)生的情況下,可對未知節(jié)點(diǎn)發(fā)生狀態(tài)進(jìn)行推斷。貝葉斯網(wǎng)絡(luò)通過概率圖模型探索變量之間的不確定性關(guān)系,其中概率圖模型由一組變量和之間的概率關(guān)系組成,結(jié)構(gòu)是一個(gè)有向無環(huán)圖(directed acyclicgraph,DAG),其中節(jié)點(diǎn)表示隨機(jī)變量,節(jié)點(diǎn)之間的有向弧表示變量間的條件依賴關(guān)系[28],節(jié)點(diǎn)方框中的數(shù)值代表各節(jié)點(diǎn)的先驗(yàn)概率[29]。

        1. 5 統(tǒng) 計(jì) 學(xué) 分 析

        采 用 R 4. 2. 3 統(tǒng) 計(jì) 軟 件 和Python 3. 11 統(tǒng)計(jì)軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。心腦血管疾病組和非心腦血管疾病組研究對象臨床資料組間比較采用χ2 檢驗(yàn), 檢驗(yàn)水準(zhǔn)為α =0. 05。采用Python 3. 11 統(tǒng)計(jì)軟件中catboost 包構(gòu)建 CatBoost模型, 通過網(wǎng)格搜索法進(jìn)行參數(shù)調(diào)優(yōu)。 模型的ROC 曲線通過sklear 包繪制, 混淆矩陣熱圖采用seaborn 包繪制, DCA 曲線采用matplotlib 包繪制。通過R 4. 2. 3 統(tǒng)計(jì)軟件中的bnlearn 包以最大最小爬山(max-min hill-climbing, MMHC) 算法實(shí)現(xiàn)貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí),并采用Netica 軟件可視化貝葉斯網(wǎng)絡(luò)和條件概率。

        2 結(jié) 果

        2. 1 研 究 對 象 的 一 般 情 況

        本 探 究 共 納 入315 896 例研究對象, 其中男性150 940 例, 女性164 956 例, 平均年齡56. 3 歲, 其中234 293 例有心腦血管疾病家族史, 90 818 例患有心腦血管疾病。本研究對非心腦血管疾病組和心腦血管疾病組研究對象的基本情況進(jìn)行比較分析,除蔬菜/水果攝入量之外,其余各變量與心腦血管疾病均有關(guān)聯(lián)(Plt;0. 01)。見表2。

        2. 2 CatBoost 模 型 參 數(shù) 調(diào) 優(yōu) 結(jié) 果

        采 用Python 軟件sklearn 包中的GridSearchCV 函數(shù)進(jìn)行超參數(shù)尋優(yōu), 結(jié)果見圖1。當(dāng)樹深(depth) 為6,最大迭代次數(shù)(iterations) 為800 時(shí),對應(yīng)得分最高,此時(shí)CatBoost 模型的性能最佳。

        2. 3 基于CatBoost模型的心腦血管疾病發(fā)病風(fēng)險(xiǎn)重要變量篩選

        本研究基于訓(xùn)練集數(shù)據(jù),通過最優(yōu)CatBoost 模型對心腦血管疾病影響因素進(jìn)行篩選,結(jié)果見圖2。模型特征重要性排序前10 位篩選變量分別為年齡(22. 40)、BMI (15. 20)、LDL-C (8. 84)、TC (8. 55)、 TyG 指數(shù)(7. 99)、 家族史(6. 65)、載脂蛋白A/B 比值(4. 08)、HDL-C (4. 02)、吸煙狀態(tài)(3. 80) 和性別(3. 64)。

        2. 4 心腦血管疾病發(fā)病風(fēng)險(xiǎn) CatBoost 模型評價(jià)

        本研究分別基于訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集,以前述步驟篩選的排序前10 位變量為參數(shù)變量, 分別構(gòu)建 CatBoost 模型,并繪制模型的 ROC 曲線、混淆矩陣熱圖和DCA 曲線,見圖3 和4。訓(xùn)練集模型的ROC 曲線下面積(area under curve, AUC)為0. 770,模型準(zhǔn)確性為0. 764;驗(yàn)證集模型AUC為0. 759, 模型準(zhǔn)確性為0. 763, 由此可知基于CatBoost 算法篩選的排序前10 位變量構(gòu)建的模型其預(yù)測準(zhǔn)確度較高。臨床效能分析結(jié)果顯示:訓(xùn)練集和驗(yàn)證集的DCA 曲線均具有較寬的凈收益取值范圍,訓(xùn)練閾值范圍約為0. 06~0. 85,驗(yàn)證集閾值范圍約為0. 09~0. 81, 模型具有較好的臨床實(shí)用性。

        2. 5 心腦血管疾病發(fā)病風(fēng)險(xiǎn)貝葉斯網(wǎng)絡(luò)模型構(gòu)建

        本研究采用MMHC 算法和極大似然估計(jì)法,以CatBoost 模型篩選的特征重要性排序前10 位的變量為參數(shù)變量,構(gòu)建心腦血管疾病發(fā)病風(fēng)險(xiǎn)貝葉斯網(wǎng)絡(luò)模型(圖5)。圖5 中節(jié)點(diǎn)方框的數(shù)值代表各節(jié)點(diǎn)的先驗(yàn)概率,如心腦血管疾病的患病對應(yīng)數(shù)值為28. 8, 表示患心腦血管疾病者在總研究人群中所占比例為 28. 8%,為該節(jié)點(diǎn)的先驗(yàn)概率。年齡、家族史、性別、吸煙狀態(tài)、載脂蛋白A/B 和BMI為心腦血管疾病的父節(jié)點(diǎn),直接影響心腦血管疾病的患病概率, TyG 指數(shù)、TC、HDL-C 和LDL-C通過影響B(tài)MI 和載脂蛋白A/B 比值進(jìn)而間接影響心腦血管疾病患病概率。

        在本研究中,當(dāng)其他節(jié)點(diǎn)不設(shè)置先驗(yàn)條件時(shí),隨著年齡和載脂蛋白A/B 比值檢測值增加, 心腦血管疾病的患病風(fēng)險(xiǎn)也逐漸增加,男性和吸煙行為會增加心腦血管疾病的患病風(fēng)險(xiǎn),有心腦血管疾病家族史的研究對象較無心腦血管疾病家族史的研究對象患病風(fēng)險(xiǎn)增加11. 7%, 偏瘦、超重和肥胖人群心腦血管疾病的患病風(fēng)險(xiǎn)均高于體質(zhì)量正常的人群。

        2. 6 不同個(gè)體心腦血管疾病貝葉斯網(wǎng)絡(luò)發(fā)病風(fēng)險(xiǎn)預(yù)測

        貝葉斯網(wǎng)絡(luò)可通過有向弧和條件概率進(jìn)行風(fēng)險(xiǎn)預(yù)測,即在已知某些節(jié)點(diǎn)發(fā)生的情況下,預(yù)測未知節(jié)點(diǎn)的狀態(tài)。假定某個(gè)體有家族史,可推測其患心腦血管疾病的患病風(fēng)險(xiǎn)為31. 9% (表3); 年齡超過65 歲且具備家族史, 可推測心腦血管疾病的患病風(fēng)險(xiǎn)為47. 1% (圖6A);在以上條件下,當(dāng)個(gè)體BMI 正常、無吸煙行為且載脂蛋白A/B 比值lt;8. 31時(shí),心腦血管疾病的患病風(fēng)險(xiǎn)為24. 5% (圖6B)。

        3 討 論

        本研究首先通過CatBoost 算法進(jìn)行心腦血管疾病特征選擇, 并以CatBoost 模型中特征值排序前10 位的變量構(gòu)建貝葉斯網(wǎng)絡(luò)模型, 結(jié)果顯示:CatBoost 算法確定的排序前10 位特征變量為年齡、BMI、LDL-C、TC、TyG 指數(shù)、家族史、載脂蛋白A/B 比值、HDL-C、吸煙狀態(tài)和性別; 在貝葉斯網(wǎng)絡(luò)模型結(jié)構(gòu)中顯示:年齡、性別、吸煙狀態(tài)、家族史、BMI 和載脂蛋白A/B 比值與心腦血管疾病間存在有向弧,表示與心腦血管疾病直接相關(guān),而TyG 指數(shù)、HDL-C、LDL-C 和TC 與心腦血管疾病為間接相關(guān)。

        本研究中患心腦血管疾病的先驗(yàn)概率為28. 8%,當(dāng)某個(gè)體有家族史時(shí),其心腦血管疾病的發(fā)病風(fēng)險(xiǎn)概率為31. 9%,風(fēng)險(xiǎn)提高了3. 1%;如果某個(gè)人年齡超過65 歲并且有心腦血管疾病家族史,則其心腦血管疾病的風(fēng)險(xiǎn)概率為47. 1%, 其患病風(fēng)險(xiǎn)大幅提高。本研究結(jié)果提示:具有心腦血管疾病家族史的人群隨著年齡的增加應(yīng)及時(shí)體檢,進(jìn)而做到心腦血管疾病的三早防治; 如果 BMI 正常、無吸煙行為且載脂蛋白A/B 比值lt;8. 31 時(shí), 則其心腦血管疾病的風(fēng)險(xiǎn)概率為24. 5%, 提示平時(shí)可以通過飲食和體育鍛煉等方式控制BMI、載脂蛋白A 和載脂蛋白B 水平,減少吸煙,進(jìn)而可降低心腦血管疾病的患病風(fēng)險(xiǎn)。

        綜上所述,本研究構(gòu)建的貝葉斯網(wǎng)絡(luò)可以直觀表達(dá)心腦血管疾病發(fā)病風(fēng)險(xiǎn)與各變量間的關(guān)系及相關(guān)程度,即使變量之間存在復(fù)雜關(guān)系或缺失醫(yī)學(xué)檢測數(shù)據(jù), 仍可以通過已知變量進(jìn)行心腦血管疾病發(fā)病風(fēng)險(xiǎn)推斷,本研究結(jié)果為心腦血管疾病的防控提供了一定的實(shí)踐依據(jù)。但本研究也存在一定的局限性:在構(gòu)建心腦血管疾病貝葉斯網(wǎng)絡(luò)模型時(shí),主要采用了橫斷面分類變量,構(gòu)建的模型為靜態(tài)貝葉斯網(wǎng)絡(luò)模型,該模型未能反映各變量的縱向動態(tài)變化情況,后期在條件許可的情況下,可考慮構(gòu)建心腦血管疾病動態(tài)貝葉斯網(wǎng)絡(luò);采用的MMHC 算法容易陷入局部最優(yōu)[29], 因此為提高貝葉斯網(wǎng)絡(luò)模型的普適性,可通過禁忌搜索等算法綜合比較進(jìn)而構(gòu)建最優(yōu)貝葉斯網(wǎng)絡(luò)模型。

        利益沖突聲明:

        所有作者聲明不存在利益沖突。

        作者貢獻(xiàn)聲明:

        王愛民參與研究選題、研究設(shè)計(jì)、數(shù)據(jù)分析、論文撰寫和修改, 王鳳琳、黃一銘、徐雅琪、張文婧、叢顯鑄、蘇維強(qiáng)、高夢瑤和李爽參與數(shù)據(jù)整理和圖表編輯,王素珍、孔雨佳、石福艷和陶恩學(xué)參與研究設(shè)計(jì)和論文修改及審校。

        [參考文獻(xiàn)]

        [1] REN Q Q, LI S Y, XIAO C L, et al. The impact of airpollution on hospitalization for cardiovascular andcerebrovascular disease in Shenyang, China[J]. Iran JPublic Health, 2020, 49(8): 1476-1484.

        [2] YOU Q, SHAO X Y, WANG J P, et al. Progress onphysical field-regulated micro/nanomotors forcardiovascular and cerebrovascular disease treatment[J].Small Methods, 2023, 7(10): e2300426.

        [3] BENJAMIN E J, MUNTNER P, ALONSO A, et al.Heart disease and stroke statistics-2019 update: a reportfrom the American heart association[J]. Circulation,2019, 139(10): e56-e528.

        [4] MENSAH G A, ROTH G A, FUSTER V. The globalburden of cardiovascular diseases and risk factors: 2020and beyond[J]. J Am Coll Cardiol, 2019, 74(20):2529-2532.

        [5] DISEASES AND INJURIESCOLLABORATORSGBD. Global burden of369 diseases and injuries in 204 countries and territories,1990-2019: a systematic analysis for the Global Burdenof Disease Study 2019[J]. Lancet, 2020, 396(10258):1204-1222.

        [6] MELA A, RDZANEK E, PONIATOWSKI ? A,et al. Economic costs of cardiovascular diseases inPoland estimates for 2015-2017 years [J]. FrontPharmacol, 2020, 11: 1231.

        [7] QIAO W J, ZHANG X Y, KAN B, et al.Hypertension, BMI, and cardiovascular andcerebrovascular diseases[J]. Open Med, 2021, 16(1):149-155.

        [8] STROKE COLLABORATORSGBD. Global,regional, and national burden of stroke and its riskfactors, 1990-2019: a systematic analysis for the GlobalBurden of Disease Study 2019[J]. Lancet Neurol,2021, 20(10): 795-820.

        [9] BOYD C, BROWN G, KLEINIG T, et al. Machinelearning quantitation of cardiovascular andcerebrovascular disease: a systematic review of clinicalapplications[J]. Diagnostics, 2021, 11(3): 551.

        [10]CHEUN"C Y, XU D J, CHENG C Y, et al. A deeplearningsystem for the assessment of cardiovasculardisease risk via the measurement of retinal-vesselcalibre[J]. Nat Biomed Eng, 2021, 5(6): 498-508.

        [11]AZMI J, ARIF M, NAFIS M T, et al. A systematicreview on machine learning approaches for cardiovasculardisease prediction using medical big data[J]. Med EngPhys, 2022, 105: 103825.

        [12]KELSHIKER M A, SELIGMAN H, HOWARD J P,et al. Coronary flow reserve and cardiovascularoutcomes: a systematic review and meta-analysis[J].Eur Heart J, 2022, 43(16): 1582-1593.

        [13]ZHENG P F, CHEN L Z, LIU P, et al. Identificationof immune-related key genes in the peripheral blood ofischaemic stroke patients using a weighted genecoexpression network analysis and machine learning[J].J Transl Med, 2022, 20(1): 361.

        [14]BIEDERMANN A, TARONI F. Bayesian networksand probabilistic reasoning about scientific evidence whenthere is a lack of data[J]. Forensic Sci Int, 2006,157(2/3): 163-167.

        [15]BYCROFT C, FREEMAN C, PETKOVA D, et al.The UK Biobank resource with deep phenotyping andgenomic data[J]. Nature, 2018, 562(7726): 203-209.

        [16]黃夏璇, 黃 韜, 楊 瑞, 等. UK Biobank數(shù)據(jù)的應(yīng)用介紹[J]. 中國循證醫(yī)學(xué)雜志, 2022, 22(9): 1099-1107.

        [17]UCHAI S, ANDERSEN L F, THORESEN M, et al.Does the association between adiposity measures andprefrailty among older adults vary by social position?Findings from the Troms? study 2015/2016[J]. BMCPublic Health, 2024, 24(1): 1457.

        [18]MACH F, BAIGENT C, CATAPANO A L, et al.2019 ESC/EAS Guidelines for the management ofdyslipidaemias: lipid modification to reducecardiovascular risk[J]. Eur Heart J, 2020, 41(1): 111-188.

        [19]PIZZI N J. Fuzzy quartile encoding as a preprocessingmethod for biomedical pattern classification[J]. TheorComput Sci, 2011, 412(42): 5909-5925.

        [20]JAYAWARDENA R, SOORIYAARACHCHI P. Theinside story of fruits; exploring the truth behindconventional theories[J]. Diabetes Metab Syndr, 2021,15(6): 102085.

        [21]CHUDASAMA Y V, KHUNTI K K, ZACCARDI F,et al. Physical activity, multimorbidity, and lifeexpectancy: a UK Biobank longitudinal study[J]. BMCMed, 2019, 17(1): 108.

        [22]苗豐順, 李 巖, 高 岑, 等. 基于CatBoost算法的糖尿病預(yù)測方法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2019, 28(9):215-218.

        [23]HANCOCK J T, KHOSHGOFTAAR T M. CatBoostfor big data: an interdisciplinary review[J]. J Big Data,2020, 7(1): 94.

        [24]胡建錦, 熊 偉, 方陸明, 等. 基于距離相關(guān)系數(shù)和Catboost方法的森林蓄積量估測[J]. 中南林業(yè)科技大學(xué)學(xué)報(bào), 2023, 43(5): 27-35.

        [25]PRABU S, THIYANESWARAN B, SUJATHA M,et al. Grid search for predicting coronary heart disease bytuning hyper-parameters[J]. Comput Syst Sci Eng,2022, 43(2): 737-749.

        [26]ROUSSON V, ZUMBRUNN T. Decision curveanalysis revisited: overall net benefit, relationships toROC curve analysis, and application to case-controlstudies[J]. BMC Med Inform Decis Mak, 2011, 11: 45.

        [27]唐 末. 基于循證醫(yī)學(xué)及機(jī)器學(xué)習(xí)的中醫(yī)藥影響早中期結(jié)直腸癌預(yù)后模型研究[D]. 北京: 中國中醫(yī)科學(xué)院,2022.

        [28]鐘 璐, 薛付忠. 基于貝葉斯網(wǎng)絡(luò)不確定性推理的肺癌風(fēng)險(xiǎn)預(yù)測模型[J]. 山東大學(xué)學(xué)報(bào)(醫(yī)學(xué)版), 2023,61(4): 86-94.

        [29]王旭春, 宋偉梅, 潘金花, 等. MMPC-Tabu 混合算法的貝葉斯網(wǎng)絡(luò)模型在高脂血癥相關(guān)因素研究中的應(yīng)用[J]. 中國衛(wèi)生統(tǒng)計(jì), 2022, 39(3): 345-350, 355.

        [基金項(xiàng)目] 國家自然科學(xué)基金項(xiàng)目(81803337,81872719,82003560);國家統(tǒng)計(jì)局科研項(xiàng)目(2018LY79);山東省科技廳自然科學(xué)基金項(xiàng)目(ZR2019MH034,ZR2020MH340,ZR2023MH313);山東省教育廳高等學(xué)校青創(chuàng)人才引育計(jì)劃項(xiàng)目(2019-6-156);濰坊醫(yī)學(xué)院博士啟動基金項(xiàng)目(2017BSQD51)

        欧美日本精品一区二区三区| 色综合999| 中文字幕亚洲精品高清| 国内揄拍国内精品人妻久久| 永久免费人禽av在线观看| 人人玩人人添人人澡| 福利视频一二区| 最新日本免费一区二区三区| 音影先锋中文字幕在线| 久久久久波多野结衣高潮| 欧洲中文字幕| 国产亚洲精品高清视频| 国产一区二区三区在线观看完整版| 国内精品卡一卡二卡三| 96免费精品视频在线观看| 大屁股流白浆一区二区| 一二三区无线乱码中文在线| 俺去俺来也在线www色官网| 欧美日韩区1区2区3区| 亚洲女同人妻在线播放| 少妇无码太爽了在线播放| 国产全肉乱妇杂乱视频| 精精国产xxxx视频在线播放器| 久久精品国产在热亚洲不卡| 久久久久久欧美精品se一二三四 | 久久久久久一本大道无码| 东风日产车是不是国产的| 欧美亚洲国产一区二区三区| 日韩在线精品国产成人| 日本不卡一区二区三区在线| 亚洲精品在线国产精品| 国产精品免费大片| 大伊香蕉精品视频一区| 日本中文字幕精品久久| 国产av无码专区亚洲av毛网站| 欧美成人a在线网站| 亚洲精品av一区二区日韩| 性无码一区二区三区在线观看| 日产精品久久久久久久蜜臀| 亚洲一区二区三区中文视频| 一道本久久综合久久鬼色|