趙安容,徐世成,崔利君,李垚,李波,王莉
636000 四川 巴中,巴中市中心醫(yī)院 神經(jīng)內(nèi)科(趙安容、徐世成、崔利君、李垚、李波);637002 四川 南充,川北醫(yī)學(xué)院附屬醫(yī)院 神經(jīng)內(nèi)科(王莉)
急性缺血性腦卒中(acute ischemic stroke, AIS)是腦血管疾病中最為常見的一種類型,約占全部急性腦血管疾病的70%,具有高發(fā)病率、高致殘率、高病死率等特征,是全球范圍內(nèi)的第一位致殘病因和第二位致死病因,已經(jīng)成為嚴(yán)重危害人類生命健康的重大疾病之一[1-2]。癌癥患者缺血性腦卒中(cancer-associated ischemic stroke, CAIS)是癌癥患者最常見的中樞神經(jīng)系統(tǒng)并發(fā)癥之一[3],CAIS 的發(fā)病機(jī)制目前尚未完全清楚,除了傳統(tǒng)腦血管病危險(xiǎn)因素如高血壓、高血糖等因素外,CAIS 的發(fā)病可能還與癌癥介導(dǎo)的高凝狀態(tài)、瘤栓塞及腫瘤治療的并發(fā)癥或不良反應(yīng)等有關(guān)[4-5]。數(shù)據(jù)挖掘Relief 特征選擇算法作為特征權(quán)重算法之一,根據(jù)數(shù)據(jù)的特征與類別的相關(guān)性來(lái)賦予每個(gè)特征不同的權(quán)重值,并對(duì)權(quán)重進(jìn)行排序,可根據(jù)權(quán)重排序獲得分辨能力強(qiáng)的特征子集。Relief 特征選擇算法對(duì)數(shù)據(jù)類型并無(wú)明確要求且可以較好地去除數(shù)據(jù)中的無(wú)關(guān)特征,從而具有評(píng)估效率高的優(yōu)點(diǎn)[6]。本研究以巴中市中心醫(yī)院神經(jīng)內(nèi)科2016 年1 月至2021 年12 月連續(xù)收治的1 260 例AIS 患者構(gòu)建數(shù)據(jù)庫(kù),運(yùn)用Relief 特征選擇算法探討各個(gè)危險(xiǎn)因素(特征)與是否CAIS(類別)的相關(guān)性并賦予不同的權(quán)重值,為預(yù)測(cè)本地區(qū)CAIS 的危險(xiǎn)因素提供相關(guān)參考依據(jù)。
以巴中市中心醫(yī)院神經(jīng)內(nèi)科2016 年1 月至2021 年12 月連續(xù)收治的1 260 例AIS 患者作為研究對(duì)象,收集患者的臨床資料構(gòu)建數(shù)據(jù)庫(kù)。納入標(biāo)準(zhǔn):(1)符合中華醫(yī)學(xué)會(huì)第四屆全國(guó)腦血管病學(xué)術(shù)會(huì)議修訂的診斷標(biāo)準(zhǔn)[7]診斷為AIS;(2)經(jīng)頭顱CT或MRI 證實(shí);(3) 腦血管事件發(fā)生至入院接受治療時(shí)間小于3 d;(4)年齡>18 歲;(5)CAIS 患者必須有明確的病理診斷,確診為癌癥。排除標(biāo)準(zhǔn):(1)有腦腫瘤病史、既往腦卒中病史且造成神經(jīng)功能障礙患者;(2)伴有嚴(yán)重感染性疾病、嚴(yán)重肝、腎功能不全者;(3)拒絕登記注冊(cè)者。按照AIS 發(fā)病前有無(wú)活動(dòng)性非神經(jīng)系統(tǒng)癌癥分為癌癥患者缺血性腦卒中組(CAIS 組,n=116)和非癌癥患者缺血性腦卒中組(NCAIS 組,n=1 564)。全部研究對(duì)象的知情同意均已獲得,并獲得醫(yī)院倫理委員會(huì)批準(zhǔn)。
1.2.1 資料收集 全部AIS 患者均按照標(biāo)準(zhǔn)的腦卒中注冊(cè)登記系統(tǒng)完成登記記錄,主要包括一般資料(姓名、性別、年齡等)、既往疾病史、臨床體征、格拉斯哥昏迷量表(Glasgow Coma Scale, GCS)評(píng)分、美國(guó)國(guó)立衛(wèi)生研究院卒中量表(National Institutes of Health Stroke Scale,NIHSS)評(píng)分、影像學(xué)檢查結(jié)果、實(shí)驗(yàn)室檢查結(jié)果、治療藥物情況、出院診斷及預(yù)后改良Rankin 量表(Modified Rankin Scale,mRS)評(píng)分等。列入待評(píng)價(jià)的可能危險(xiǎn)因素主要包括:性別、年齡、是否吸煙、是否飲酒、是否罹患高血壓、是否罹患糖尿病、是否罹患高脂血癥、短暫性腦缺血發(fā)作疾病史、腦卒中疾病史、房顫疾病史、甘油三酯、總膽固醇、低密度脂蛋白、高密度脂蛋白、血尿素氮、血肌酐、血尿酸、谷丙轉(zhuǎn)氨酶、谷草轉(zhuǎn)氨酶、同型半胱氨酸等,將數(shù)據(jù)資料錄入Epidata 3.1 數(shù)據(jù)庫(kù)。
1.2.2 Relief 特征選擇算法 Relief 特征選擇算法是一種基于各個(gè)特征(危險(xiǎn)因素)與類別(是否CAIS)的相關(guān)性來(lái)計(jì)算特征(危險(xiǎn)因素)權(quán)重的算法,與類別(是否CAIS)相關(guān)性高的特征(危險(xiǎn)因素)更利于分類判別,因此被賦予較高的權(quán)重值。具體算法為:①設(shè)定初始集合:類別集合Y=[y1,y2];特征集合X=[x1,x2,…,xn];②運(yùn)用Relief 函數(shù)對(duì)特征集合X的所有特征值x 進(jìn)行計(jì)算,得到每個(gè)特征值的權(quán)重值;③重復(fù)運(yùn)行主程序20 次,求出每個(gè)特征值的平均權(quán)重值;④將所有特征值x按降序排列;⑤輸出降序排名后的特征值列表R。
采用SPSS 17.0 軟件進(jìn)行統(tǒng)計(jì)處理,計(jì)量資料采用均數(shù)±標(biāo)準(zhǔn)差表示,組間比較采用t檢驗(yàn),計(jì)數(shù)資料采用率或構(gòu)成比(%)進(jìn)行描述,組間比較采用χ2檢驗(yàn);以P< 0.05 表示差異有統(tǒng)計(jì)學(xué)意義。采用Matlab 軟件運(yùn)用Relief 算法對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)進(jìn)行分析,計(jì)算不同危險(xiǎn)因素的權(quán)重值。
CAIS組男性68例(58.62%),女性48例(41.38%),NCAIS 組男性860 例(54.99%),女性704 例(45.01%),兩組性別構(gòu)成差異無(wú)統(tǒng)計(jì)學(xué)意義(P> 0.05);CAIS 組年齡分布32~86 歲,NCAIS 組年齡分布46 ~ 84 歲,兩組平均年齡之間差異無(wú)統(tǒng)計(jì)學(xué)意義(P> 0.05)。兩組性別、年齡具有可比性(表1)。
表1 CAIS 組與NCAIS 組患者一般資料比較Table 1.General Data of Patients in CAIS group and NCAIS Group
設(shè)定初始集合:類別集合Y=[y1,y2],即y1=腦卒中患者、y2=健康對(duì)照人群;特征集合X=[x1,x2,…,xn],即x1=性別、x2=年齡、…、x20=同型半胱氨酸。具體特征名稱分配及取值范圍詳見表2。
表2 特征名稱分配及取值范圍Table 2.Characteristic Variables of Risk Factors and Their Value Ranges
權(quán)重系數(shù)取值范圍-1~1,正值表示該特征變量(危險(xiǎn)因素)與分類(是否CAIS)具有相關(guān)性,數(shù)值越大,相關(guān)性越強(qiáng)。按權(quán)重系數(shù)排序后有15 個(gè)危險(xiǎn)因素與CAIS 發(fā)病有關(guān),權(quán)重系數(shù)大于0.1 的危險(xiǎn)因素依次為:腦卒中疾病史、飲酒和高血脂癥,是其最主要的危險(xiǎn)因素(表3)。
表3 特征集中20 個(gè)危險(xiǎn)因素的權(quán)重值Table 3.Weight Values of 20 Risk Factors in the Feature Set
AIS 因其高發(fā)病率、高致死率和高致殘率一直是近些年神經(jīng)科領(lǐng)域研究的熱點(diǎn)及難點(diǎn)問(wèn)題[8-9]。近年的研究發(fā)現(xiàn)[10-11],高血壓、吸煙、糖尿病、心房顫動(dòng)、其他心臟?。毙怨跔顒?dòng)脈綜合征、心衰等)、血脂異常、無(wú)癥狀頸動(dòng)脈狹窄、缺乏身體活動(dòng)、低蔬菜水果攝入量、肥胖、飲酒、代謝綜合征、高同型半胱氨酸血癥、炎癥和感染等是目前較為公認(rèn)的腦卒中的主要危險(xiǎn)因素。但有研究發(fā)現(xiàn),AIS 的癌癥和非癌癥患者發(fā)病危險(xiǎn)因素及臨床特點(diǎn)和預(yù)后方面存在差異[12-13],如何識(shí)別CAIS 患者的主要危險(xiǎn)因素,并進(jìn)行針對(duì)性的腦卒中危險(xiǎn)因素的一級(jí)預(yù)防、早期干預(yù),這對(duì)減少腦卒中的發(fā)生有著重要的臨床意義[14]。
基于腦卒中注冊(cè)登記數(shù)據(jù)庫(kù)中的腦卒中疾病資料信息,神經(jīng)科醫(yī)師可以進(jìn)行一定區(qū)域范圍內(nèi)的病因?qū)W、流行病學(xué)等方面的研究。腦卒中注冊(cè)登記數(shù)據(jù)庫(kù)是大樣本的數(shù)據(jù)管理系統(tǒng),面對(duì)龐大的數(shù)據(jù),如何應(yīng)用計(jì)算機(jī)方法提取、挖掘潛在的、有用的信息是神經(jīng)科醫(yī)師需要面對(duì)的主要問(wèn)題。本研究在整合腦卒中注冊(cè)登記數(shù)據(jù)庫(kù)及CAIS 人群的Epidata 數(shù)據(jù)庫(kù)資料的基礎(chǔ)上,應(yīng)用數(shù)據(jù)挖掘Relief 特征選擇算法提取數(shù)據(jù)庫(kù)中隱藏的疾病與危險(xiǎn)因素之間相關(guān)關(guān)系的潛在信息,以明確本地區(qū)CAIS 發(fā)生的主要危險(xiǎn)因素及其影響排序,以指導(dǎo)本地區(qū)醫(yī)師即針對(duì)癌癥相關(guān)腦卒中的危險(xiǎn)因素進(jìn)行積極地早期干預(yù)預(yù)防等一級(jí)預(yù)防工作。
本組數(shù)據(jù)研究結(jié)果顯示,相對(duì)于非癌癥患者,本地區(qū)CAIS 發(fā)病的危險(xiǎn)因素中,腦卒中疾病史在腦卒中發(fā)生中所占的權(quán)重值最大,其次為飲酒和高血脂癥,權(quán)重系數(shù)均大于0.1。已有大量文獻(xiàn)報(bào)道,有腦卒中疾病史是再次發(fā)生腦卒中的重要危險(xiǎn)因素。巴中地處秦巴山區(qū),當(dāng)?shù)氐木莆幕瘽夂?,?dāng)?shù)仫嬀迫巳杭懊咳诊嬀屏慷济黠@高于其他地區(qū)[15-16],因此,飲酒已經(jīng)成為本地區(qū)癌癥相關(guān)腦卒中發(fā)生的主要危險(xiǎn)因素之一。在實(shí)驗(yàn)室檢查方面,血尿素氮、血尿酸、總膽固醇、同型半胱氨酸及甘油三酯水平等在區(qū)別癌癥與非癌癥與腦卒中高危患者中具有重要提示作用,上述指標(biāo)對(duì)于CAIS 的一級(jí)預(yù)防具有重要的指導(dǎo)作用,并且可以直接應(yīng)用于腦卒中的早期篩查中[17-18]。而一些傳統(tǒng)意義上的危險(xiǎn)因素如:吸煙、高血壓、糖尿病、短暫性腦缺血發(fā)作疾病史等在區(qū)分癌癥與非癌癥腦卒中人群時(shí)的權(quán)重值為負(fù)值,表示其與腦卒中的發(fā)作的相關(guān)性并不大。既往已有臨床研究發(fā)現(xiàn)在無(wú)傳統(tǒng)腦血管疾病危險(xiǎn)因素(包括高血壓、糖尿病等)的惡性腫瘤患者中,腦卒中的發(fā)病風(fēng)險(xiǎn)也增加明顯[19]。這也進(jìn)一步證實(shí)了,CAIS 患者的發(fā)病危險(xiǎn)因素與單純AIS 的發(fā)病危險(xiǎn)因素之間存在差異,多數(shù)CAIS 患者發(fā)病缺乏傳統(tǒng)的高血壓、糖尿病等腦血管危險(xiǎn)因素[20]。
綜上所述,利用數(shù)據(jù)挖掘Relief 特征選擇算法可以挖掘腦卒中注冊(cè)登記數(shù)據(jù)庫(kù)中與CAIS 發(fā)病密切相關(guān)的危險(xiǎn)因素,主要包括腦卒中疾病史、飲酒和高血脂癥。但需要指出的是Relief 特征選擇算法仍然存在一定的缺陷,如對(duì)不同特征(危險(xiǎn)因素)的權(quán)重值只能作為區(qū)別不同類別(是否CAIS)的依據(jù),但不能說(shuō)明該屬性在多種疾病狀態(tài)中所的作用。因此,應(yīng)用Relief 特征選擇算法需要結(jié)合其他統(tǒng)計(jì)學(xué)方法和具體數(shù)據(jù)庫(kù)資料,方能更加準(zhǔn)確的挖掘數(shù)據(jù)庫(kù)的各種潛在信息。
作者聲明:本文全部作者對(duì)于研究和撰寫的論文出現(xiàn)的不端行為承擔(dān)相應(yīng)責(zé)任;并承諾論文中涉及的原始圖片、數(shù)據(jù)資料等已按照有關(guān)規(guī)定保存,可接受核查。
學(xué)術(shù)不端:本文在初審、返修及出版前均通過(guò)中國(guó)知網(wǎng)(CNKI)科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的學(xué)術(shù)不端檢測(cè)。
同行評(píng)議:經(jīng)同行專家雙盲外審,達(dá)到刊發(fā)要求。
利益沖突:所有作者均聲明不存在利益沖突。
文章版權(quán):本文出版前已與全體作者簽署了論文授權(quán)書等協(xié)議。