李佳鑫,葛 淼,張 雷,裴澤華,楊文婕,何進(jìn)偉,王聰霞
(1.陜西師范大學(xué)地理科學(xué)與旅游學(xué)院健康地理研究所,陜西西安 710061;2.延安大學(xué)醫(yī)學(xué)院,陜西延安 716099;3.西安交通大學(xué)第二附屬醫(yī)院,陜西西安 710054)
新型冠狀病毒(coronavirus disease 2019,COVID-19)是一種單股正鏈RNA包膜病毒[1],通過(guò)表面的刺突蛋白與靶細(xì)胞表面的血管緊張素轉(zhuǎn)換酶Ⅱ(angiotensin-converting enzymeⅡ,ACEⅡ)受體相結(jié)合[2],入侵肺部引發(fā)急性肺損傷[3]。中性粒細(xì)胞和淋巴細(xì)胞比值(neutrophil-to-lymphocyte ratio,NLR)是一種常用于反映炎癥和免疫狀態(tài)的循環(huán)生物標(biāo)志物[4]。在用于評(píng)估重癥/危重型新冠肺炎患者預(yù)后的單項(xiàng)指標(biāo)中,以NLR準(zhǔn)確性最高,且NLR易測(cè)量、可快速獲得、費(fèi)用低廉,可推廣應(yīng)用于檢測(cè)新冠肺炎患者的病情進(jìn)展,并指導(dǎo)后續(xù)治療方案的選擇[5]。NLR是新型冠狀病毒的獨(dú)立危險(xiǎn)評(píng)估因素,可以作為預(yù)后因子對(duì)患者進(jìn)行分級(jí)管理[6-14]。目前國(guó)內(nèi)對(duì)于NLR參考值的地區(qū)性分布差異常集中在以市(縣)為單位的參考區(qū)間的差異性區(qū)分[15]。微觀研究區(qū)層面,居住環(huán)境可能成為NLR相關(guān)參數(shù)參考值的影響因素[16-17]。
居住環(huán)境是指與人們居住生活密切相關(guān)的空間環(huán)境,包括空氣質(zhì)量、景觀綠化、交通、室內(nèi)外空間布局、聲光熱等[18]。健康與居住環(huán)境的關(guān)系,主要從物理環(huán)境(自然環(huán)境、室內(nèi)外住宅物理環(huán)境、基礎(chǔ)設(shè)施和空間適用等)和精神環(huán)境(社會(huì)、人文、心理等)兩個(gè)層面進(jìn)行評(píng)估[19]。已有大量研究通過(guò)區(qū)域?qū)Ρ?、病例?duì)照等方法對(duì)照研究健康和疾病與自然和社會(huì)環(huán)境因素的關(guān)系[16-17,20]。其中,自然環(huán)境對(duì)于各項(xiàng)醫(yī)療指標(biāo)的參考值影響較為顯著[21-22]。
因此,本文從自然環(huán)境角度出發(fā),構(gòu)建指標(biāo)體系,對(duì)可能影響全國(guó)健康成年人NLR參考值空間分異的影響因子進(jìn)行篩選,將得到的顯著性指標(biāo)進(jìn)行共線性診斷后,通過(guò)構(gòu)建隨機(jī)森林模型預(yù)測(cè)全國(guó)健康成年人的NLR參考值,最終運(yùn)用地統(tǒng)計(jì)分析方法探究在全國(guó)范圍內(nèi)NLR參考值的變化趨勢(shì)。
1.1.1 NLR參考值獲取通過(guò)檢索中國(guó)知網(wǎng)(CNKI)、萬(wàn)方數(shù)據(jù)庫(kù)、維普網(wǎng)、超星數(shù)字圖書館及中國(guó)重要會(huì)議數(shù)據(jù)庫(kù)等數(shù)據(jù)庫(kù),收集2016至2020年共65個(gè)市(縣)級(jí)醫(yī)院、相關(guān)研究單位和高等院校所測(cè)定的健康人的NLR參考值數(shù)據(jù)共162 681例。研究對(duì)象為健康人,其納入標(biāo)準(zhǔn)為:研究對(duì)象無(wú)明顯感染癥狀和貧血表現(xiàn),WBC計(jì)數(shù)3.5~9.5×109/L,CRP<10 mg/L。NLR參考值在男性和女性的參考區(qū)間無(wú)較大差別,因此不考慮區(qū)分性別對(duì)參考值的影響[15,21]。所有受測(cè)者均采用檢測(cè)方法為:禁食12 h,次日清晨抽取肘靜脈血5 mL,4℃條件下12 000 r/min離心15 min吸取上層清液置于EP管內(nèi),-80℃超低溫冰箱內(nèi)保存,應(yīng)用血液細(xì)胞分析儀檢測(cè)受試者血常規(guī),得到外周血的中性粒細(xì)胞和淋巴細(xì)胞個(gè)數(shù),根據(jù)其數(shù)值進(jìn)一步計(jì)算NLR的值。
1.1.2 指標(biāo)體系構(gòu)建本文從自然環(huán)境的角度出發(fā),構(gòu)建地勢(shì)、氣候和土壤3個(gè)一級(jí)指標(biāo),再細(xì)分出25個(gè)二級(jí)指標(biāo)體系(表1),來(lái)探索自然地理因素與NLR參考值的相關(guān)性。其中,地勢(shì)指標(biāo)來(lái)源于國(guó)家測(cè)繪數(shù)據(jù)中心共享資料,氣象指標(biāo)來(lái)源于中國(guó)氣象數(shù)據(jù)共享服務(wù)網(wǎng),土壤指標(biāo)來(lái)源于聯(lián)合國(guó)糧農(nóng)組織(FAO)和維也納國(guó)際應(yīng)用系統(tǒng)(IIASA)建立的世界土壤數(shù)據(jù)庫(kù)。
表1 影響因素指標(biāo)體系Tab.1 Index system of the influencing factors
1.2.1 相關(guān)性分析自相關(guān)分析在研究不同事物在空間位置屬性上的相關(guān)關(guān)系上應(yīng)用廣泛??臻g自相關(guān)分析有全局自相關(guān)和局部自相關(guān)兩種方法。本文選取全局自相關(guān)的分析方法,通過(guò)MoranI指數(shù)分析要素與鄰近單元要素間的空間聯(lián)系,其公式為:
其中,n是指空間單元總個(gè)數(shù),X i和Xj分別表示第i個(gè)空間單元和第j個(gè)空間單元的屬性值,X為所有空間單元屬性值的均值,W ij為空間權(quán)重值。I值值域?yàn)閇-1,1],I<0呈負(fù)相關(guān)關(guān)系,I>0呈正相關(guān)關(guān)系,I=0時(shí)則不相關(guān)。
Spearman等級(jí)相關(guān),是通過(guò)Spearman秩相關(guān)系數(shù)來(lái)度量?jī)蓚€(gè)變量之間聯(lián)系的強(qiáng)弱。其計(jì)算公式如下。
若存在相同的秩次,則相關(guān)系數(shù)ρs可由下式計(jì)算:
其中,n表示數(shù)據(jù)的數(shù)量,d i表示兩個(gè)數(shù)據(jù)次序的差值。
若不存在相同的秩次,則采用如下公式計(jì)算:
共線性診斷及模型擬合,在計(jì)算Spearman相關(guān)系數(shù)后進(jìn)行回歸分析。通過(guò)SPSS檢測(cè)影響因子是否存在共線性問(wèn)題[23],VIF>10則認(rèn)為因子存在共線性[24],模型擬合度R 2>0.8則認(rèn)為擬合程度較好[25]。
1.2.2 模型構(gòu)建隨機(jī)森林模型。隨機(jī)森林模型(random forest,RF)是LED BREIMAN[26]和CUTLERA[27]共同提出的一種利用多棵樹訓(xùn)練樣本后再作出預(yù)測(cè)的分類器。RF模型利用bootstrap方法選擇樣本,其次數(shù)由ntree表示,mtry則表示每次重建決策樹模型時(shí)的節(jié)點(diǎn)分裂數(shù)。其表達(dá)式為:
其中:h(x)為預(yù)測(cè)值,θi是獨(dú)立分布的隨機(jī)向量,決定決策樹的生長(zhǎng),(X,θi)為第i課回歸樹的輸出結(jié)果,k表示回歸樹的數(shù)量。
地統(tǒng)計(jì)分析,地統(tǒng)計(jì)學(xué)是一種用于研究空間上的隨機(jī)性與結(jié)構(gòu)性、空間相關(guān)性和依賴性的自然現(xiàn)象科學(xué)。其最基本的核心是克里金(Kriging)空間插值法,是一種對(duì)估點(diǎn)值進(jìn)行的線性無(wú)偏最優(yōu)估計(jì)。本研究在根據(jù)正態(tài)性檢驗(yàn)后得出的結(jié)果,選擇析取克里金法,對(duì)RF模型得出的NLR參考值進(jìn)行空間分析。
2.1.1 空間自相關(guān)分析通過(guò)Arcgis10.2對(duì)162 681例健康人的NLR參考值進(jìn)行莫蘭指數(shù)分析(圖1)。在空間自相關(guān)分析的過(guò)程中,Moran’sI值的范圍在[-1,1]之間,Moran’sI>0則呈空間正相關(guān),且值越靠近1則正相關(guān)性越明顯,Moran’sI<0則呈空間負(fù)相關(guān),且值越靠近-1則空間異質(zhì)性越強(qiáng)。本次研究指出,Moran’sI指數(shù)為0.195 21,則NLR參考值具有較明顯的空間差異,P=0.000 476<0.05通過(guò)95%的置信度檢驗(yàn),Z=3.493 745超過(guò)臨界值1.65則通過(guò)顯著性檢驗(yàn)。因此,NLR的標(biāo)準(zhǔn)值是具有空間分異規(guī)律的,本文從自然環(huán)境的角度出發(fā)評(píng)價(jià)空間差異,采用相關(guān)性分析的方法進(jìn)一步探討不同自然環(huán)境指標(biāo)對(duì)NLR標(biāo)準(zhǔn)值的影響情況。
圖1 莫蘭指數(shù)分析結(jié)果Fig.1 Moran index analysis results
2.1.2 相關(guān)性分析通過(guò)SPSS軟件進(jìn)行Spearman相關(guān)性分析,用25個(gè)二級(jí)自然環(huán)境指標(biāo)作為自變量,NLR參考值作為因變量,通過(guò)r、P值判斷地理因子與NLR參考值的相關(guān)關(guān)系。
25項(xiàng)二級(jí)指標(biāo)中海拔(X3)、年日照時(shí)數(shù)(X4)、年平均氣溫(X5)、年平均相對(duì)濕度(X6)、氣溫年較差(X8)、年平均風(fēng)速(X9)、表土有機(jī)質(zhì)含量(X16)、表土(粘土)陽(yáng)離子交換量(X18)、土壤CaSO4總量(X23)與各地區(qū)的健康成年人的NLR正常值存在相關(guān)關(guān)系,其中海拔(X3)、年日照時(shí)數(shù)(X4)、年平均風(fēng)速(X9)、表土有機(jī)質(zhì)含量(X16)、表土(粘土)陽(yáng)離子交換量(X18)與NLR參考值呈現(xiàn)高度相關(guān)(表2)。
表2 健康成年人NLR參考值的地理影響因素分析Tab.2 Analysis of geographical factors influencing NLR reference values in healthy adults
2.1.3 共線性診斷對(duì)于線性相關(guān)關(guān)系進(jìn)行多重共線性診斷和模型擬合的過(guò)程中可以發(fā)現(xiàn),方差膨脹系數(shù)VIF>7.5,代表存在局部共線性(表3)。模型擬合度調(diào)整后的r2=0.182存在欠擬合問(wèn)題。為解決這一問(wèn)題,下文采用RF模型的方法構(gòu)建NLR參考值的空間響應(yīng)趨勢(shì)。
表3 相關(guān)因子的共線性診斷Tab.3 Collinearity diagnosis of the related factors
2.2.1 全國(guó)健康成年人NLR參考值預(yù)測(cè)通過(guò)訓(xùn)練現(xiàn)有的樣本,運(yùn)用Matlab其中的RandomForest軟件包構(gòu)建隨機(jī)森林模型,選用海拔、年日照時(shí)數(shù)、年平均氣溫、年平均相對(duì)濕度、氣溫年較差、年平均風(fēng)速、表土有機(jī)質(zhì)含量、表土(粘土)陽(yáng)離子交換總量、土壤CaSO4總量這幾個(gè)相關(guān)性指標(biāo),對(duì)全國(guó)健康成年人NLR參考值進(jìn)行預(yù)測(cè)(圖2)。其中,通過(guò)機(jī)器學(xué)習(xí),發(fā)現(xiàn)當(dāng)mtry為15,ntree為50時(shí),R2=0.859 2故可以判斷RF擬合效果最好,模型穩(wěn)定度最高。
圖2 RF模型預(yù)測(cè)結(jié)果Fig.2 Prediction results of RF model
2.2.2 NLR參考值預(yù)測(cè)的空間分布
2.2.2.1 正態(tài)性檢驗(yàn) 利用Arcgis地統(tǒng)計(jì)分析模塊進(jìn)行數(shù)據(jù)挖掘,檢驗(yàn)RF模型預(yù)測(cè)數(shù)據(jù)的正態(tài)性。根據(jù)繪制好的直方圖(圖3)可以看出,RF模型預(yù)測(cè)的全國(guó)健康成年人NLR參考值呈現(xiàn)弱偏態(tài)變化趨勢(shì),為負(fù)偏分布,其峰度值為3.849 4,呈現(xiàn)高峰態(tài),因此數(shù)據(jù)不符合正態(tài)分布要求,NLR參考值的預(yù)測(cè)數(shù)據(jù)并不呈現(xiàn)正態(tài)分布。
圖3 RF模型預(yù)測(cè)結(jié)果直方圖Fig.3 Histogram of RF model prediction results
2.2.2.2 NLR空間變化趨勢(shì)分析 通過(guò)Arcgis的趨勢(shì)分析工具,構(gòu)建NLR參考值預(yù)測(cè)值的空間變化趨勢(shì)三維圖(圖4)??梢钥闯鋈珖?guó)健康成年人NLR參考值預(yù)測(cè)值在Y軸(南北方向)較之X軸(東西方向)的變化幅度較大,且均呈現(xiàn)二維變化趨勢(shì)。因此,在進(jìn)行數(shù)據(jù)點(diǎn)插值之前要進(jìn)行二階或三階的變化處理。
圖4 全國(guó)健康成年人NLR參考值趨勢(shì)分布圖Fig.4 Trend distribution of NLR reference values for healthy adults in China
將全國(guó)健康成年人的NLR參考值預(yù)測(cè)數(shù)據(jù)導(dǎo)入Arcgis中,運(yùn)用地統(tǒng)計(jì)分析模塊擬合空間響應(yīng)。由于正態(tài)性檢驗(yàn)過(guò)程中發(fā)現(xiàn)其不符合正態(tài)分布,因此采用析取克里金插值法,選用半變異函數(shù)進(jìn)行差值。東南沿海地區(qū)的NLR參考值是相對(duì)較高的,如???、深圳、福州、臺(tái)灣等;中部地區(qū)相對(duì)較低,如重慶、成都、合肥、武漢;而西北地區(qū)則更甚,數(shù)據(jù)整體呈現(xiàn)沿海高、內(nèi)陸低,東南高、西北低的變化態(tài)勢(shì)。
本次研究通過(guò)探究健康成年人NLR參考值與地理因素的相關(guān)關(guān)系,為不同地區(qū)使用NLR參考值作為新型冠狀病毒肺炎預(yù)后因子制定參考標(biāo)準(zhǔn)時(shí)提供依據(jù),為后續(xù)進(jìn)一步研究不同影響因子對(duì)NLR指標(biāo)參考值的作用機(jī)制奠定基礎(chǔ)。
高海拔地區(qū)與低海拔地區(qū)的血漿質(zhì)量存在一定差異[28],海拔因子從自然環(huán)境(居民飲用水質(zhì)、植被多樣性等)、人文環(huán)境(景觀格局、生態(tài)服務(wù)價(jià)值)兩方面直接或間接地對(duì)血漿質(zhì)量存在顯著影響[29],進(jìn)一步對(duì)其中的血液指標(biāo)產(chǎn)生作用。海拔升高必然伴隨著空氣中氧含量降低、溫度降低、氣壓降低的自然環(huán)境[30];同時(shí)高海拔地區(qū)人群飲食習(xí)慣傾向于高脂、高熱、高蛋白、低維生素;海拔升高導(dǎo)致不同地區(qū)生態(tài)多樣性,景觀格局發(fā)生變化,生態(tài)服務(wù)價(jià)值也隨之變化,這些都直接或間接的影響著人體內(nèi)的血液循環(huán)系統(tǒng)[31-33]。
氣候條件不同直接導(dǎo)致溫度增加、降水量變化、極端天氣事件、海平面上升等,通過(guò)一定的暴露途徑影響人的健康結(jié)果;間接地,氣候變化還會(huì)引起環(huán)境和制度背景的差異(土地利用變化、生態(tài)系統(tǒng)改變、基礎(chǔ)設(shè)施條件、地貌地形、農(nóng)業(yè)生產(chǎn)和牲畜利用等)、社會(huì)和行為背景的差異(性別和年齡、種族特點(diǎn)、貧困、住房、教育、歧視、醫(yī)療健康條件的獲得性等)從而影響人體健康[34]。對(duì)于NLR起顯著影響作用的主要是年平均氣溫與年平均相對(duì)濕度。溫度可以改變?nèi)松砩蠈?duì)有毒有害污染物的反應(yīng),引起生理壓力,極端天氣造成的社會(huì)經(jīng)濟(jì)影響(如極端氣候引起電力短缺導(dǎo)致衛(wèi)生設(shè)施、能源、交通和水資源基礎(chǔ)設(shè)施等)也會(huì)間接影響到當(dāng)?shù)鼐用駥?duì)于環(huán)境的適應(yīng)能力,影響人體內(nèi)相關(guān)指標(biāo)的標(biāo)準(zhǔn)值[35-36]。
相對(duì)濕度會(huì)引起大氣氣溶膠的粒徑、化學(xué)成分和化學(xué)過(guò)程等物化性質(zhì)的變化,是溫度、輻射、風(fēng)和濕度之間相互作用的結(jié)果。年平均相對(duì)濕度的差異,一方面會(huì)影響空氣傳播疾病的傳播以及空氣中細(xì)菌、真菌、塵螨的傳播;另一方面,影響氣體交換率、機(jī)體最大攝氧量等,改變血流速度[37]。
土壤因素與社會(huì)生活息息相關(guān),通過(guò)飲食、呼吸等方面間接影響人體內(nèi)NLR的含量。表土有機(jī)質(zhì)的含量與徑流流向、地形因素相關(guān),土壤作為天然碳庫(kù),直接影響著動(dòng)植物生長(zhǎng),間接影響當(dāng)?shù)厝祟愺w制機(jī)制。表土有機(jī)質(zhì)含量對(duì)土壤生產(chǎn)力存在影響作用,進(jìn)而通過(guò)飲食循環(huán)影響人體體質(zhì)[38-41]。表土有機(jī)質(zhì)含量、表土(粘土)陽(yáng)離子交換量和土壤CaSO4總量是與健康成年人NLR參考值的空間分布存在較高的相關(guān)關(guān)系。其中表土有機(jī)質(zhì)含量呈現(xiàn)負(fù)相關(guān)關(guān)系、表土(粘土)陽(yáng)離子交換量、土壤CaSO4總量是與NLR呈現(xiàn)正相關(guān)關(guān)系。
一、樣本量不足。由于數(shù)據(jù)的獲取方式尚未優(yōu)化,故而收集到的健康成年人數(shù)據(jù)存在小樣本情況,對(duì)于相關(guān)關(guān)系分析可能存在一定的影響,考慮通過(guò)日后與相關(guān)機(jī)構(gòu)合作等方式,擴(kuò)充樣本數(shù)據(jù)庫(kù)。二、僅分析了自然地理因素,沒有考慮到建成環(huán)境、社會(huì)經(jīng)濟(jì)因素對(duì)NLR參考值的影響。在后期的指標(biāo)體系構(gòu)建中,可以通過(guò)加入相關(guān)建成環(huán)境因子、社會(huì)經(jīng)濟(jì)因子進(jìn)一步衡量居住環(huán)境變化對(duì)健康成年NLR參考值可能存在的影響。
西安交通大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2022年2期