低增生性骨髓增生異常綜合征(hypocellular myelodysplastic syndrome,hypo-MDS)與再生障礙性貧血(aplastic anemia,AA)均為血液性疾病,二者在臨床表現(xiàn)和實(shí)驗(yàn)室檢查(如血液學(xué)、細(xì)胞形態(tài)學(xué))上存在交叉性,如均存在外周血細(xì)胞減少、骨髓增生減低等[1-3]。hypo-MDS屬于惡性血液性疾病,血細(xì)胞大多呈現(xiàn)病態(tài)造血;而AA是由造血細(xì)胞數(shù)量減少或者造血干細(xì)胞損壞、質(zhì)量缺陷引起的造血功能受到抑制,而非病態(tài)造血[3]。hypo-MDS患者比AA患者有更高的白血病轉(zhuǎn)化風(fēng)險(xiǎn)及更短的生存期[4-5],在臨床治療和預(yù)后方面兩者亦有很大不同,因此臨床上對(duì)這兩種疾病做出準(zhǔn)確及時(shí)的鑒別診斷尤為重要。hypo-MDS和AA的病理特征和臨床表現(xiàn)極其相似,目前臨床上對(duì)這兩種疾病進(jìn)行鑒別診斷的主要方法有血液學(xué)、細(xì)胞形態(tài)學(xué)及細(xì)胞遺傳學(xué),鑒別診斷指標(biāo)很多,但特異性均不高,對(duì)這兩種疾病鑒別診斷較為困難。反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)模型是非線性不確定性數(shù)學(xué)模型,是一種具有連續(xù)傳遞函數(shù)的多層前饋人工神經(jīng)網(wǎng)絡(luò)[6]。BP神經(jīng)網(wǎng)絡(luò)模型對(duì)資料類型無(wú)特殊要求,具有良好的非線性處理能力、強(qiáng)大的容錯(cuò)性、較高的分類精確度等優(yōu)點(diǎn)[6]。本研究旨在將BP神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于hypo-MDS和AA的鑒別診斷,探討其對(duì)兩者鑒別診斷的價(jià)值,為這兩種疾病的鑒別診斷研究提供一個(gè)新的思路。
1.1 研究對(duì)象 選取2008—2016年于華北理工大學(xué)附屬醫(yī)院和中國(guó)醫(yī)學(xué)科學(xué)院血液病醫(yī)院首診入院的130例hypo-MDS患者和452例AA患者為研究對(duì)象。所有hypo-MDS和AA患者均符合2008年WHO修訂的骨髓增生異常(MDS)分型標(biāo)準(zhǔn)[1]和血液病診斷與療效標(biāo)準(zhǔn)(3版)[3]。hypo-MDS還需符合骨髓組織活檢有核細(xì)胞增生程度<30%(60歲以下)或<20%(60歲及以上),并經(jīng)由多名血液病專家討論確診。排除資料不完整、肝腎功能異?;蚧加衅渌盒约膊〉幕颊?。130例hypo-MDS患者中男61例(53.1%),女69例(46.9%),年齡11~82歲,平均年齡(36.9±16.5)歲;452例AA患者中男247例(54.6%),女205例(45.4%),年齡6~95歲,平均年齡(34.8±18.6)歲。本研究經(jīng)華北理工大學(xué)倫理委員會(huì)審批通過(guò),所有患者均已簽署知情同意書。
1.2 研究方法 采用回顧性研究方法,在兩所醫(yī)院的病案科通過(guò)自編調(diào)查問(wèn)卷收集研究對(duì)象的病歷資料。調(diào)查問(wèn)卷分為兩部分:第1部分是患者的基本信息和病史,包括年齡、性別、婚姻狀況、民族、職業(yè)、吸煙史、飲酒史、血型等;第2部分是實(shí)驗(yàn)室檢查資料,包括外周血分類計(jì)數(shù)、外周血細(xì)胞形態(tài)、骨髓細(xì)胞形態(tài)等。
1.3 統(tǒng)計(jì)學(xué)方法 采用Excel進(jìn)行數(shù)據(jù)錄入,采用SPSS 17.0統(tǒng)計(jì)軟件進(jìn)行統(tǒng)計(jì)分析。符合正態(tài)分布的計(jì)量資料以(±s)表示,組間比較采用t檢驗(yàn);不符合正態(tài)分布的計(jì)量資料以中位數(shù)(四分位數(shù)間距)〔M(QR)〕表示,組間比較采用Wilcoxon秩和檢驗(yàn);計(jì)數(shù)資料以相對(duì)數(shù)表示,組間比較采用χ2檢驗(yàn)。采用標(biāo)準(zhǔn)化公式,將協(xié)變量歸一化處理為[0,1]區(qū)間變量;采用單隱層建模,應(yīng)用隨機(jī)數(shù)字生成器分區(qū)變量將個(gè)案隨機(jī)分成訓(xùn)練樣本與檢驗(yàn)樣本,訓(xùn)練樣本用于BP神經(jīng)網(wǎng)絡(luò)模型的建立,檢驗(yàn)樣本用于模型準(zhǔn)確率的驗(yàn)證;培訓(xùn)類型設(shè)為批處理,優(yōu)化算法設(shè)為調(diào)整的共軛梯度。采用受試者工作特征(ROC)曲線分析計(jì)算模型的靈敏度、特異度、ROC曲線下面積等指標(biāo),從而對(duì)模型分類效果進(jìn)行評(píng)價(jià)。
以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 兩組患者一般資料比較 兩組患者年齡、職業(yè)的比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.01);性別、婚姻狀況、民族、吸煙史、飲酒史、血型的比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05,見(jiàn)表1)。
2.2 兩組患者實(shí)驗(yàn)室檢查結(jié)果比較 hypo-MDS患者紅細(xì)胞計(jì)數(shù)、血紅蛋白水平低于AA患者〔(2.07±0.71)×1012/L 比(2.39±0.77)×1012/L;70.00(27.25)mg/L比73.00(32.00)〕,差異有統(tǒng)計(jì)學(xué)意義(t=4.22,P<0.01;u=-3.45,P<0.01)。血細(xì)胞計(jì)數(shù)顯示hypo-MDS患者與AA患者白細(xì)胞、血小板計(jì)數(shù)比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。血涂片顯示hypo-MDS患者中性桿狀核粒細(xì)胞分?jǐn)?shù)高于AA患者,成熟淋巴細(xì)胞、中性晚幼核粒細(xì)胞分?jǐn)?shù)低于AA患者,差異有統(tǒng)計(jì)學(xué)意義(P<0.05);兩組中性分葉核粒細(xì)胞、成熟單核粒細(xì)胞、中性中幼核粒細(xì)胞分?jǐn)?shù)比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。骨髓片顯示hypo-MDS患者中性分葉核粒細(xì)胞、成熟淋巴細(xì)胞、成熟漿細(xì)胞分?jǐn)?shù)低于AA患者,中性早幼核粒細(xì)胞、中性中幼核粒細(xì)胞、中性晚幼核粒細(xì)胞分?jǐn)?shù)高于AA患者,差異有統(tǒng)計(jì)學(xué)意義(P<0.05);兩組中性桿狀核粒細(xì)胞、成熟單核細(xì)胞分?jǐn)?shù)比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05,見(jiàn)表2)。
2.3 BP神經(jīng)網(wǎng)絡(luò)模型的建立 以表2中有統(tǒng)計(jì)學(xué)意義的指標(biāo)作為輸入,疾病類型作為輸出,建立BP神經(jīng)網(wǎng)絡(luò)模型。模型隱含層數(shù)為1,隱含層的單位數(shù)為6,激活函數(shù)為雙曲正切函數(shù);模型輸出層激活函數(shù)為Softmax函數(shù)。隨機(jī)數(shù)字生成器將個(gè)案隨機(jī)分為訓(xùn)練樣本415例,驗(yàn)證樣本167例。該模型對(duì)訓(xùn)練樣本分類準(zhǔn)確率為93.0%,對(duì)檢驗(yàn)樣本分類準(zhǔn)確率為87.4%(見(jiàn)表3)。
表1 兩組一般資料的比較〔n (%)〕Table 1 Comparison of the baseline characteristics between hypo-MDS and AA patients
表2 兩組患者實(shí)驗(yàn)室檢查結(jié)果的比較〔M(QR)〕Table 2 Comparison of laboratory findings between two groups of patients
表3 BP神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率結(jié)果Table 3 Accuracy of BP neural network model for the differential diagnosis of hypo-MDS and AA by type of samples
2.4 ROC曲線分析結(jié)果 ROC曲線分析結(jié)果顯示,BP神經(jīng)網(wǎng)絡(luò)模型對(duì)hypo-MDS和AA的鑒別曲線下面積為0.919〔95%CI(0.890,0.944)〕。最佳臨界點(diǎn)為0.730,對(duì)應(yīng)的靈敏度和特異度分別為86.9%和86.2%(見(jiàn)圖1)。
圖1 BP神經(jīng)網(wǎng)絡(luò)模型對(duì)hypo-MDS和AA鑒別的ROC曲線分析Figure 1 ROC curve analysis of BP neural network model for the identification of hypo-MDS and AA
MDS是一類獲得性造血干/祖細(xì)胞的克隆性疾病,以髓細(xì)胞病態(tài)造血和高風(fēng)險(xiǎn)向急性髓系白血病轉(zhuǎn)化為臨床特點(diǎn)[7]。部分MDS患者骨髓增生低下,稱為hypo-MDS,是MDS的一種特殊類型,發(fā)生率占MDS總數(shù)的8.2%~29.0%,最高可達(dá)38.0%[8]。AA指再生障礙性貧血,病因不明,主要表現(xiàn)為全血細(xì)胞減少,骨髓造血功能低下,臨床可有出血、感染表現(xiàn)[9]。在疾病發(fā)展的不同階段,hypo-MDS和AA患者外周血均可表現(xiàn)為一系、兩系或三系同時(shí)減低[10]。病態(tài)造血是臨床診斷hypo-MDS的主要指標(biāo),但有研究表明部分AA患者也可見(jiàn)病態(tài)造血[10],亦有研究發(fā)現(xiàn)了沒(méi)有病態(tài)造血的hypo-MDS患者[11]。既往認(rèn)為細(xì)胞遺傳學(xué)異常是hypo-MDS的可靠診斷標(biāo)準(zhǔn),但MDS 患者染色體異常檢出率在 40%~60%[12-13],在 hypo-MDS 組更低[14],可見(jiàn)MDS異常細(xì)胞遺傳學(xué)比例并不是很高,提示該指標(biāo)特異性不強(qiáng)。目前,對(duì)于hypo-MDS和AA的臨床鑒別診斷尚無(wú)特異性指標(biāo)。
數(shù)據(jù)挖掘是指從大型數(shù)據(jù)庫(kù)中提取具有潛在應(yīng)用價(jià)值知識(shí)和信息的過(guò)程,是近年來(lái)迅速發(fā)展起來(lái)的新型信息處理系統(tǒng)[15]。分類在數(shù)據(jù)挖掘中是一項(xiàng)非常重要的任務(wù),常用的方法主要有BP神經(jīng)網(wǎng)絡(luò)模型、Logistic回歸分析、決策樹(shù)分析、K-最鄰近分類分析、貝葉斯分類分析等。數(shù)據(jù)挖掘分類算法在醫(yī)學(xué)領(lǐng)域中已獲得廣泛和成功的應(yīng)用[16-18],在疾病預(yù)測(cè)、鑒別診斷及預(yù)后研究等方面均取得了理想的效果,它能夠及時(shí)、有效、深層次地分析各類醫(yī)學(xué)數(shù)據(jù)信息,提高醫(yī)務(wù)工作者的工作效率。本研究將數(shù)據(jù)挖掘分類算法中的BP神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于hypo-MDS與AA的鑒別診斷,為這兩種疾病的鑒別診斷提供新的思路。BP神經(jīng)網(wǎng)絡(luò)模型是一種應(yīng)用廣泛的模擬人腦的智能算法,對(duì)資料無(wú)任何要求,具有良好的非線性處理能力、強(qiáng)大的容錯(cuò)性、較高分類精確度等優(yōu)點(diǎn)。相對(duì)于傳統(tǒng)的Logistic回歸模型,BP神經(jīng)網(wǎng)絡(luò)模型解決了它適用條件較為嚴(yán)格的問(wèn)題,有相關(guān)學(xué)者對(duì)BP神經(jīng)網(wǎng)絡(luò)與Logistic回歸的分類性能進(jìn)行了比較,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)的分類準(zhǔn)確率(93.5%)高于Logistic回歸模型(90.7%)[19]。本研究使用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)這兩種疾病進(jìn)行分類診斷,選取紅細(xì)胞計(jì)數(shù)、血紅蛋白水平、成熟淋巴細(xì)胞分?jǐn)?shù)、成熟漿細(xì)胞分?jǐn)?shù)等單因素分析有統(tǒng)計(jì)學(xué)差異的指標(biāo)作為輸入變量,構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型。ROC曲線分析結(jié)果顯示,BP神經(jīng)網(wǎng)絡(luò)模型對(duì)hypo-MDS和AA的鑒別曲線下面積為0.919〔95%CI(0.890,0.944)〕。最佳截?cái)帱c(diǎn)為0.730,對(duì)應(yīng)的靈敏度和特異度分別為86.9%和86.2%,說(shuō)明基于BP神經(jīng)網(wǎng)絡(luò)的hypo-MDS與AA的鑒別診斷模型具有一定的價(jià)值。
由于資料收集的限制,本研究只將血細(xì)胞計(jì)數(shù)、血涂片、骨髓片相關(guān)數(shù)據(jù)作為輸入變量構(gòu)建了模型,在以后的研究中,可以將細(xì)胞遺傳學(xué)、流式細(xì)胞術(shù)等相關(guān)指標(biāo)納入到輸入變量當(dāng)中,以期建立更加完善的基于BP神經(jīng)網(wǎng)絡(luò)的hypo-MDS與AA的鑒別診斷模型。
作者貢獻(xiàn):張曉雅、汪可可、武建輝、尹素鳳負(fù)責(zé)文章的構(gòu)思與設(shè)計(jì)、可行性分析、論文撰寫及修訂,對(duì)文章整體負(fù)責(zé);劉斌、宋潔負(fù)責(zé)查閱病歷、收集信息;張曉雅、周瑩、袁欣、王倩、曹英志、宋宇負(fù)責(zé)文獻(xiàn)的收集和整理;武建輝、王國(guó)立、尹素鳳負(fù)責(zé)文章的質(zhì)量控制和審校。
本文無(wú)利益沖突。
[1]VARDIMAN J W,THIELE J,ARBER D A,et al.The 2008 revision of the World Health Organization(WHO)classification of myeloid neoplasms and acute leukemia:rationale and important changes[J].Blood,2009,114(5):937-51.DOI:10.1182/blood-2009-03-209262.2009.4.8.
[2]施均,鄭以州.再生障礙性貧血與低增生性骨髓增生異常綜合征鑒別診斷思路[J].中華血液學(xué)雜志,2013,34(10):910-912.DOI:10.3760/cma.j.issn.0253-2727.2013.10.020.
SHI J,ZHENG Y Z.Thoughts on differential diagnosis between aplastic anemia and hypoplastie myelodysplastic syndrome[J].Chinese Journal of Hematology,2013,34(10):910-912.DOI:10.3760/cma.j.issn.0253-2727.2013.10.020.
[3]張之南.血液病診斷及療效標(biāo)準(zhǔn)(3版)[M].北京:科學(xué)出版社,2007.
[4]KOH Y,LEE H R,SONG E Y,et al.Hypoplastic myelodysplastic syndrome(h-MDS)is a distinctive clinical entity with poorer prognosis and frequent karyotypic and FISH abnormalities compared to aplastic anemia(AA)[J].Leuk Res,2010,34(10):1344-1350.DOI:10.1016/j.leukres.2010.03.001.
[5]呂遠(yuǎn)飛,閆振宇,陳乃耀,等.淋巴細(xì)胞亞群在再生障礙性
貧血和低增生性骨髓增生異常綜合征患者外周血中的表達(dá)分析[J].中國(guó)實(shí)驗(yàn)血液學(xué)雜志,2016,24(5):1505-1510.DOI:10.7534/j.issn.1009-2137.2016.05.040.
LYU Y F,YAN Z Y,CHEN N Y,et al.Analysis of lymphocyte subsets in peripheral blood of patients with aplastic anemia or hypoplastic myelodysplastic syndrome[J].Journal of Experimental Hematology,2016,24(5):1505-1510.DOI:10.7534/j.issn.1009-2137.2016.05.040.
[6]LI J B.Application of BP neural network algorithm in biomedical diagnostic analysis[J].International Journal Bioautomation,2016,20(3):417-426.
[7]PLATZBECKER U,SANTINI V,MUFTI G J,et al.Update on developments in the diagnosis and prognostic evaluation of patients with myelodysplastic syndromes(MDS):consensus statements and report from an expert workshop[J].Leuk Res,2012,36(3):264-270.DOI:10.1016/j.leukres.2011.11.005.
[8]SWERDLOW S H,CAMPO E,HARRIS N L,et al.WHO classification of tumours of haematopoietic and lymphoid tissues[M].Lyon:IARC Press,2008:88.
[9]CHAIR S,BOWN N,CAVENAGH J,et al.Guidelines for the diagnosis and management of adult aplastic anaemia[J].British Journal of Haematology,2015,172(2):187-207.DOI:10.1111/bjh.13853.
[10]黃俊,鄧明鳳,陳永玲,等.低增生性骨髓增生異常綜合征與再生障礙性貧血的檢查診斷[J].中國(guó)衛(wèi)生檢驗(yàn)雜志,2014,24(16)2371-2373.HUANG J,DENG M F,CHEN Y L,et al.Diagnosis and differential diagnosis between hypoplastic myelodysplastic syndrome(Hypo- MDS)and aplastic anemia (AA)[J].Chinese Journal of Health Laboratory Technology,2014,24(16):2371-2373.
[11]HAST R,ERIKSSON M,WIDELL S,et al.Neutrophil dysplasia is not a specific feature of the abnormal chromosomal clone in myelodysplastic syndromes[J].Leukemia Research,1999,23(6):579-84.
[12]RASHID A,KHURSHID M,SHAIKH U,et al.Chromosomal abnormalities in primary myelodysplastic syndrome[J].J Coll Physicians Surg Pak,2014,24(9):632-635.DOI:09.2014/JCPSP.632635.
[13]WU L,SHI W,XIAO L,et al.High expression of the human equilibrative nucleoside transporter 1 gene predicts a good response to decitabine in patients with myelodysplastic syndrome[J].Journal of Translational Medicine,2016,14(1)1-9.DOI:10.1186/s12967-016-0817-9.
[14]DESOUZA D C,F(xiàn)ERNANDEZ C S,CAMARGO A,et al.Cytogenetic as an important tool for diagnosis and prognosis for patients with hypocellular primary myelodysplastic syndrome[J].Biomed Research International,2014,2014(1):29-42.DOI:10.1155/2014/542395.
[15]GIUDICI P.Applied data mining:statistical methods for business and industry [M].Hoboken:Wiley Sons,2003:2.
[16]MANACH Y L,COLLINS G,RODSETH R,et al.Preoperative score to predict postoperative mortality(POSPOM)[J].Anesthesiology,2016,124(3):570-579.DOI:10.1097/ALN.0000000000000972.
[17]SANTIN F M,SILVAR V D,GRZYBOWSKIJ M V.Artificial neural network ensembles and the design of performance-oriented riparian buffer strips for the filtering of nitrogen in agricultural catchments[J].Ecological Engineering,2016,94:493-502.DOI:org/10.1016/j.ecoleng.2016.06.008.
[18]STOIA M,KURTANJEK Z,OANCEA S.Reliability of a decisiontree model in predicting occupational lead poisoning in a group of highly exposed workers[J].American Journal of Industrial Medicine,2016,59(7):575-582.DOI:10.1002/ajim.22589.
[19]WU J H,WANG G L,LI X M,et al.Comparison of BP neural network model and Logistic regression in the analysis of influencing factors of violence in hospitals[J].Applied Mechanics &Materials,2011,50/51:964-967.DOI:10.4028/www.scientific.net/AMM.50-51.964.