于 蓉,席 新,王 華,李 波
癌癥是全球發(fā)病和死亡的主要原因,2016年全球約有1 720萬新發(fā)癌癥病例和890萬死亡病例,2006年至2016年新增癌癥病例增加了28%,增幅最大的是最不發(fā)達國家[1]。21世紀以來,隨著我國經(jīng)濟的高速發(fā)展和城鎮(zhèn)化率的不斷攀升,我國城鎮(zhèn)居民因癌癥而發(fā)生死亡的情況不可避免地會發(fā)生各種各樣的變化。預(yù)防是治愈疾病最佳的良藥,尤其對于癌癥來說,如果能對癌癥進行提前預(yù)測并進行干預(yù),無疑能達到最好的效果。
在癌癥的流行病學調(diào)查中,經(jīng)常收集有關(guān)研究參與者的大量數(shù)據(jù),其中包括很多分類變量,如性別、年齡、癌癥類型等。對應(yīng)分析是對大型列聯(lián)表進行分類數(shù)據(jù)分析的一種特別有用的方法。盡管已有大量關(guān)于此方法的研究,但大多未能充分發(fā)揮其潛力,僅關(guān)注圖形解釋[2]。鑒于此,本研究收集我國2014年至2018年癌癥死亡數(shù)據(jù),運用對應(yīng)分析法對我國城鎮(zhèn)居民性別、年齡與癌癥死亡類型進行偏好分析,以突出特定人群日益增加的癌癥死亡危險,并為相關(guān)部門制定干預(yù)措施提供支持。
1.1 材料本研究數(shù)據(jù)資料來自2015年至2017年中國衛(wèi)生和計劃生育統(tǒng)計年鑒、2018年至2019年中國衛(wèi)生健康統(tǒng)計年鑒[3-7]。
1.2 方法采用IBM SPSS Statistics 26軟件對采集數(shù)據(jù)進行對應(yīng)分析。
1.2.1 變量設(shè)計選取癌癥中的鼻咽癌,食管癌,胃癌,結(jié)腸、直腸和肛門癌,肝癌,膽囊癌,胰腺癌,肺癌,乳腺癌,宮頸癌,卵巢癌,前列腺癌,膀胱癌,腦及神經(jīng)系統(tǒng)惡性腫瘤和白血病設(shè)為類型變量(Type),并分別用C01~C15代表;選取1~4歲、5~9歲、10~14歲、15~19歲、20~24歲、25~29歲、30~34歲、35~39歲、40~44歲、45~49歲、50~54歲、55~59歲、60~64歲、65~69歲、70~74歲、75~79歲、80~84歲、≥85歲設(shè)為年齡組變量,將城鎮(zhèn)男性和城鎮(zhèn)女性設(shè)為性別變量,將年齡組和性別合并為性別-年齡組變量(Sex-age)(M代表城鎮(zhèn)男性,F(xiàn)代表城鎮(zhèn)女性,1~85分別取自各年齡組的起始年齡);計算出2014年至2018年各年齡組癌癥的平均死亡率,得出基礎(chǔ)數(shù)據(jù)。見表1。
表1 我國城鎮(zhèn)居民癌癥性別、年齡類型死亡率基礎(chǔ)數(shù)據(jù)
1.2.2 對應(yīng)分析性別-年齡組變量和類型變量共同構(gòu)成了對應(yīng)分析的列和行。對應(yīng)分析是一種R型和Q型因子分析相結(jié)合的多元統(tǒng)計分析方法,其本質(zhì)是一種在低維空間中用圖形方法表示關(guān)聯(lián)的技術(shù),其最大的特點是能把眾多的樣品和變量同時表現(xiàn)在一張二維圖上。將表1的數(shù)據(jù)錄入IBM SPSS Statistics 26軟件進行對應(yīng)分析。
2.1 卡方檢驗在對應(yīng)分析過程中進行卡方檢驗,結(jié)果表明,卡方值為3 183.470,顯著性值為0.000,卡方檢驗結(jié)果顯著,表明性別、年齡組與癌癥類型之間具有顯著的相關(guān)性,使用對應(yīng)分析是有效的。第一維和第二維的累積慣量比例為0.771,表明使用前兩個維度可以解釋總信息量的77.1%,即經(jīng)過降維后,二維對應(yīng)分析圖仍能較好地描述兩變量間的關(guān)系。
2.2 偏好的定性分析圖1是用SPSS 26得出的對應(yīng)分析圖,解讀的方法是:從坐標原點出發(fā),如果代表列變量(性別、年齡組)的某個點與代表行變量(癌癥類型)的某個點在同一方位上距離較近,則表明二者有較強的關(guān)聯(lián)性;如果距離較遠或不在同一方位,則表明兩者關(guān)聯(lián)性較弱[8]。具體到本研究,若某個性別、年齡組與某種癌癥類型在同一方位上且距離較近,則意味著該性別、年齡組偏好該癌癥類型。
藍色“〇”代表性別、年齡組,紅色“〇”代表癌癥類型,X軸線和Y軸線在坐標原點(0,0)交叉。
就同一變量而言,在癌癥類型中,乳腺癌、卵巢癌和宮頸癌所處同一方位且距離較近,表明它們的發(fā)生具有較強的相似性和可替代性,發(fā)生這3種癌癥的條件極為相似;在性別、年齡組中,F(xiàn)40、F45和F50所處同一方位且距離較近,表明她們罹患癌癥風險的概率幾乎相同。同樣的,F(xiàn)1~F10和M1~M10罹患癌癥風險的概率幾乎相同,且由于遠離中心點,罹患癌癥死亡的風險更高。就不同變量而言,可以將性別、年齡組和癌癥類型大致分為3類,第一類包括M40~M85,前列腺癌,膀胱癌,食管癌,肺癌,胃癌,肝癌,結(jié)腸、直腸和肛門癌,表明40~89歲男性偏好前列腺癌,膀胱癌,食管癌,肺癌,胃癌,肝癌,結(jié)腸、直腸和肛門癌,主要集中在左象限;第二類包括F40~F85、胰腺癌、膽囊癌、乳腺癌、卵巢癌和宮頸癌,表明40~89歲女性偏好胰腺癌、膽囊癌、乳腺癌、卵巢癌和宮頸癌,主要集中在右上象限。第三類包括M1~M35、F1~F35、鼻咽癌、腦及神經(jīng)系統(tǒng)惡性腫瘤和白血病,表明1~39歲男性和女性偏好鼻咽癌、腦及神經(jīng)系統(tǒng)惡性腫瘤和白血病,主要集中在右下象限。
表2 我國城鎮(zhèn)居民各性別、年齡組的癌癥類型偏好值
2.3.1 性別、年齡分析在區(qū)分性別的情況下,城鎮(zhèn)女性居民(偏好值=-19.80)的全年齡段總體癌癥死亡風險高于城鎮(zhèn)男性居民(偏好值=-47.87)。在區(qū)分年齡的情況下,城鎮(zhèn)男性隨著年齡的增長,癌癥偏好值不斷上升,于85歲及以上達到最高;城鎮(zhèn)女性隨著年齡的增長,癌癥偏好值呈現(xiàn)先升后降的趨勢,于40~44歲達高峰,而后不斷下降。在1~14歲年齡段,城鎮(zhèn)男性的癌癥偏好值高于女性,15歲及以上的年齡段,城鎮(zhèn)女性的癌癥偏好值高于男性。見圖2。
圖2 城鎮(zhèn)居民不同年齡段的癌癥死亡偏好值
2.3.2 癌癥類型分析城鎮(zhèn)男性全年齡段的癌癥類型偏好值(從高到低,且偏好值>0)排序依次為:鼻咽癌、白血病、肝癌、腦及神經(jīng)系統(tǒng)惡性腫瘤。城鎮(zhèn)女性全年齡段的癌癥類型偏好值(從高到低,且偏好值>0)排序依次為:腦及神經(jīng)系統(tǒng)惡性腫瘤、白血病、鼻咽癌、肝癌、卵巢癌、宮頸癌、乳腺癌。見圖3。
圖3 城鎮(zhèn)居民全年齡段癌癥類型的偏好值
2.3.3 綜合分析在城鎮(zhèn)男性居民中,1~64歲偏好癌癥類型依次為(偏好值從高到低):鼻咽癌(偏好值=56.01)、白血病(偏好值=55.83)、肝癌(偏好值=55.20)和腦及神經(jīng)系統(tǒng)惡性腫瘤(偏好值=54.23),且年齡越小偏好關(guān)系越強;65歲及以上偏好癌癥類型依次為(偏好值從高到低):食管癌(偏好值=1.72),前列腺癌(偏好值=1.72),肺癌(偏好值=1.58),膀胱癌(偏好值=1.55),胃癌(偏好值=1.42),結(jié)腸、直腸和肛門癌(偏好值=-0.07,其中80歲及以上年齡的偏好值=0.19),且年齡越大偏好關(guān)系越強。見圖4。在城鎮(zhèn)女性中,1~29歲偏好癌癥類型依次為(偏好值從高到低):白血病(偏好值=47.17)、鼻咽癌(偏好值=47.14)、腦及神經(jīng)系統(tǒng)惡性腫瘤(偏好值=46.52)和肝癌(偏好值=45.47),且年齡越小偏好關(guān)系越強;30歲及以上偏好癌癥類型依次為(偏好值從高到低):卵巢癌(偏好值=20.28),宮頸癌(偏好值=20.23),乳腺癌(偏好值=20.12),膽囊癌(偏好值=17.20),胰腺癌(偏好值=16.56)和結(jié)腸、直腸和肛門癌(偏好值=0.69,其中40歲及以上年齡的偏好值=1.92)。見圖5。
圖4 城鎮(zhèn)男性居民不同年齡段不同癌癥類型的偏好值
圖5 城鎮(zhèn)女性居民不同年齡段不同癌癥類型的偏好值
癌癥已成為重要的公共衛(wèi)生問題,是全球第二大死亡原因[9]。對于中低收入國家的衛(wèi)生系統(tǒng)來說,了解癌癥的流行病學是一個相對較新的挑戰(zhàn),因為直到20世紀下半葉,主要的病理特征都是急性和傳染性疾病,因此癌癥沒有得到足夠的重視[10]。目前,發(fā)病率、死亡率、存活率和患病率已成為評估公共衛(wèi)生政策和估計人群癌癥治療需求的關(guān)鍵指標[11],但這些指標在評估多種分類變量之間內(nèi)在聯(lián)系方面缺少相應(yīng)的效能。
對應(yīng)分析又稱關(guān)聯(lián)分析,也稱R-Q分析,是在R型因子分析(研究變量之間的相關(guān)關(guān)系)和Q型因子分析(研究樣本之間的相關(guān)關(guān)系)的基礎(chǔ)上發(fā)展起來的一種多元統(tǒng)計分析方法,它主要分析定性變量構(gòu)成的列聯(lián)表來揭示變量之間的關(guān)系,并被廣泛應(yīng)用于公共安全和衛(wèi)生健康等領(lǐng)域[12-14]。本研究應(yīng)用“維得分”和計算公式,在定性可視化分類變量關(guān)系的基礎(chǔ)上,進一步達到了定量變量之間關(guān)系的目的。這里偏好值代表某個性別、年齡組和某種癌癥類型的關(guān)聯(lián)程度,偏好值越高代表兩者的關(guān)聯(lián)特征越明顯,反之,偏好值越低代表兩者的關(guān)聯(lián)特征越弱。即在相同的環(huán)境條件下,偏好值高的人群比其他人群更容易發(fā)生某種癌癥死亡。當然也存在死亡率很高但偏好值低的癌癥,不是說這樣的癌癥不重要,而只是說明這樣的癌癥在選擇人群方面的偏好特征不明顯,不具有統(tǒng)計學意義。
性別和年齡是影響癌癥死亡的重要因素。癌癥的性別差異可能是由于環(huán)境、遺傳和表觀遺傳因素的結(jié)合,以及基因調(diào)控和表達的差異所致[15]。而癌癥的年齡差異與免疫功能缺陷、老年人健康下降高度相關(guān)[16]。分析不同性別、年齡與癌癥類型的偏好關(guān)系,就可以有針對性地采取預(yù)防措施,具有非常重要的研究價值。本研究發(fā)現(xiàn)在15種癌癥類型和36個性別、年齡組構(gòu)成的540對對應(yīng)關(guān)系中,存在偏好關(guān)系的有230對(偏好值>0)??傮w而言,城鎮(zhèn)女性居民全年齡段罹患癌癥死亡風險高于城鎮(zhèn)男性居民;城鎮(zhèn)女性于40~44歲與癌癥的偏好關(guān)系最強,城鎮(zhèn)男性年齡越大與癌癥的偏好關(guān)系越強;城鎮(zhèn)男性全年齡段偏好鼻咽癌、白血病、肝癌、腦及神經(jīng)系統(tǒng)惡性腫瘤,城鎮(zhèn)女性全年齡段偏好腦及神經(jīng)系統(tǒng)惡性腫瘤、白血病、鼻咽癌、肝癌、卵巢癌、宮頸癌和乳腺癌。具體而言,在城鎮(zhèn)男性居民中,1~64歲偏好鼻咽癌、白血病、肝癌和腦及神經(jīng)系統(tǒng)惡性腫瘤,且年齡越小偏好關(guān)系越強;65歲及以上偏好食管癌,前列腺癌,肺癌,膀胱癌,胃癌,結(jié)腸、直腸和肛門癌(80歲及以上年齡存在偏好關(guān)系),且年齡越大偏好關(guān)系越強。在城鎮(zhèn)女性中,1~29歲偏好白血病、鼻咽癌、腦及神經(jīng)系統(tǒng)惡性腫瘤和肝癌,且年齡越小偏好關(guān)系越強;30歲及以上偏好卵巢癌,宮頸癌,乳腺癌,膽囊癌,胰腺癌,結(jié)腸、直腸和肛門癌(40歲及以上年齡存在偏好關(guān)系),且卵巢癌、宮頸癌、乳腺癌、膽囊癌和胰腺癌于40~44歲偏好關(guān)系最強,結(jié)腸、直腸和肛門癌于50~54歲偏好關(guān)系最強。
綜上,癌癥主要有3種類型:第一類偏好年輕人群,包括鼻咽癌、白血病、肝癌和腦及神經(jīng)系統(tǒng)惡性腫瘤;第二類偏好老年男性,包括食管癌,前列腺癌,肺癌,膀胱癌,胃癌,結(jié)腸、直腸和肛門癌;第三類偏好中年女性,包括卵巢癌,宮頸癌,乳腺癌,膽囊癌,胰腺癌,結(jié)腸、直腸和肛門癌。由此得出,鼻咽癌、白血病、肝癌、腦及神經(jīng)系統(tǒng)惡性腫瘤、食管癌、前列腺癌、肺癌、膀胱癌和胃癌是與年齡高度相關(guān)的癌癥類型;卵巢癌,宮頸癌,乳腺癌,膽囊癌,胰腺癌,結(jié)腸、直腸和肛門癌是與年齡和性別均高度相關(guān)的癌癥類型。以往研究總是側(cè)重于一種癌癥類型在人群中的發(fā)病率和死亡率,往往僅僅依據(jù)死亡率隨著年齡或者性別的變化就得出結(jié)論,認為癌癥僅與性別、年齡增長有關(guān)[17-22]。本研究運用對應(yīng)分析法挖掘多種癌癥類型與城市居民性別、年齡的內(nèi)在聯(lián)系,發(fā)現(xiàn)多種癌癥風險偏好不僅與性別有關(guān),而且不同的癌癥類型在年齡偏好上也不盡相同,表明對應(yīng)分析更有利于篩選出不同癌癥類型的風險人群。
總之,通過性別和年齡可以大致了解癌癥死亡發(fā)生的性別和年齡偏好特征,后續(xù)的研究應(yīng)進一步挖掘可能導(dǎo)致癌癥死亡發(fā)生的條件和原因,制定更加詳細的癌癥死亡偏好模型,以達到從源頭上預(yù)防癌癥和降低其死亡率的目的。