張占林,龔 政,葉勒丹·馬漢,妥小青,張 燕,黃冰雪,田 恬,阿比旦·艾尼瓦爾,陳 珍,古麗斯亞·海力力,戴江紅△
(1.新疆醫(yī)科大學公共衛(wèi)生學院流行病學與衛(wèi)生統(tǒng)計學教研室,烏魯木齊 830011;2.新疆維吾爾自治區(qū)烏魯木齊市友誼醫(yī)院青年路醫(yī)院,烏魯木齊 830049)
人乳頭瘤病毒(human papilloma virus,HPV)感染是一種常見的性傳播感染[1]。到目前為止可檢測的HPV型別已有170余種[2],低危型HPV主要引起疣等疾病,而高危型HPV與肛門癌、陰莖癌和口咽癌等發(fā)病有關。由于男男性行為人群(men who have sex with men,MSM)特殊的性行為方式,使該類人群發(fā)生HPV感染及HPV相關疾病的風險很高[3]。潛類別模型(latent class model,LCM)是一種探討外顯類別變量與潛在類別變量的統(tǒng)計方法[4]。探索外顯變量中隱藏的潛在類別變量,用最少的潛在類別變量解釋外顯變量,而保留大部分的原來信息,從而達到“降維”的目的。LCM采用最大似然法進行聚類,與傳統(tǒng)的基于距離的聚類方法相比,具有能估計需要的最佳亞組數(shù)目、給每個個體提供分類概率并有較高的分類精度且能夠更好地處理缺失數(shù)據(jù)等優(yōu)勢[5]。
LCM在心理學、社會學、生物醫(yī)學等領域得到應用[6-8],近年來用于行為學方面研究。有學者在乙醇使用和藥物使用行為模擬中采用LCM進行分析[9]。MSM HPV感染的影響因素較多且作用復雜,本研究使用LCM進行HPV感染風險的探索性分析,現(xiàn)將結(jié)果報道如下。
1.1一般資料 2016年3月到2017年4月在烏魯木齊市基于非政府組織(NGO)采用滾雪球的抽樣方法招募MSM。納入標準:18歲及以上;近1年曾與同性發(fā)生性行為;HIV陰性。排除曾治療過疣體、肛門癌的MSM。通過新疆醫(yī)科大學第一附屬醫(yī)院倫理審查委員會批準(20160512-11),所有研究對象均自愿簽署知情同意書。
1.2方法
1.2.1調(diào)查問卷 自行設計的調(diào)查問卷表,包括一般人口學特征、性行為特征及HPV感染影響因素等。
1.2.2標本采集 經(jīng)過統(tǒng)一培訓的調(diào)查員用生理鹽水潤濕的無菌棉拭子在調(diào)查對象肛周3~5 cm處順時針擦拭360°以采集肛周脫落細胞[10]。
1.2.3HPV基因分型檢測 用37種型別的DNA檢測試劑盒進行基因分型檢測(廣東潮州凱普生物科技有限公司),包括23種高危型(16、18、26、31、33、34、35、39、45、51、52、53、55、56、57、58、59、66、68、69、71、81、83),14種低危型(6、11、40、42、43、44、54、61、67、70、72、73、82、84)[10-12]。高危型HPV感染定義為在本次檢測中至少有1種高危型HPV DNA陽性;低危型HPV感染定義為在本次檢測中至少有1種低危型HPV DNA陽性。如果同時出現(xiàn)高危型和低危型HPV DNA陽性時定義為高危型HPV感染,HPV未感染為在本次檢測中各型HPV DNA均為陰性。
1.2.4LCM LCM的基本假設是,假設外顯變量之間的內(nèi)在聯(lián)系是通過潛變量維系的,考慮潛變量之后,潛類別的每個類別里外顯變量之間在統(tǒng)計學是獨立的。LCM是建立在概率分布原理與對數(shù)線性模型的基礎上,引入因子分析與聚類分析的功能,目的是用最少的潛類別變量來解釋外顯變量間的關聯(lián)。分析過程包括模型參數(shù)化、參數(shù)估計、模型識別、模型評價、潛在分類和結(jié)果解釋。
1.2.4.1模型參數(shù)化 該模型包括兩種分類變量和兩種總體參數(shù)。兩種分類變量包括外顯變量(觀察變量)和潛在變量(非觀察變量);兩種總體參數(shù)包括潛在類別概率和條件概率。潛在類別概率表示研究對象屬于潛在類別某一水平的概率;條件概率表示屬于潛在類別某一水平的研究對象對外顯變量的某一個水平作出反應的概率,條件概率說明外顯變量的分布情況。
1.2.4.2參數(shù)估計、模型識別及評價 最大似然法進行參數(shù)估計。模型識別是為了找出擬合度最優(yōu)的模型,模型評價指標有:似然比2(G2)、Akaike信息準則(AIC)、Baysian信息準則(BIC)、連續(xù)性校正的Akaike信息準則(CAIC)、調(diào)整的Baysian信息準則(aBIC),其中AIC值、BIC值、CAIC值、aBIC值、G2值越小說明模型的擬合效果越好[4]。當樣本量低于1 000時,AIC值越小,模型越優(yōu),當樣本量高于1 000時,BIC值越小模型越佳[13]。Entropy表示類別劃分,其值越接近1表示類別劃分越明確[14]。
1.2.4.3潛在分類 LCM最后一步是潛在聚類分析,基于貝葉斯理論,利用概率估計和概率大小比較將個體進行分類。觀察值的潛類別變量t在某一類別的概率值最大,則相應的研究對象歸為該類。
1.2.4.4潛在類別的命名 潛類別數(shù)為3表示含有3組潛類別人群,分別為Class 1、Class 2、Class 3。在Class 1中自我認知性取向為同性戀、近6個月同性性伴數(shù)2個及以上、未行包皮環(huán)切術(shù)、有性傳播感染史的條件概率高于Class 2和Class 3,因此將Class 1定義為HPV感染高風險組;在Class 2中自我認知性取向為雙性戀及其他、最近一次與同性發(fā)生肛交未使用安全套、同性肛交從未使用和有時使用安全套的條件概率高于Class 1和Class 3,因此將Class 2定義為HPV感染中風險組;在Class 3中近6個月同性性伴數(shù)為1個、最近一次同性肛交使用安全套、同性肛交每次都使用安全套、無性傳播感染史、行包皮環(huán)切術(shù)的條件概率高于Class 1和Class 2,因此將Class 3定義為HPV感染低風險組。
1.3統(tǒng)計學處理 Epidata3.0建立數(shù)據(jù)庫,SAS9.4 PROC LCA 1.3.2構(gòu)建LCM,潛類別間HPV感染結(jié)局指標和人口學特征比較采用SPSS 21.0進行秩和檢驗和χ2檢驗,PROC LCA下載:https://methodology.psu.edu/。以P<0.05為差異有統(tǒng)計學意義。
2.1研究對象的基本情況 共招募704例MSM,其中30歲以下有345例(49.0%),漢族有641例(91.1%),戶籍是烏魯木齊市的有387例(55.0%),未婚的有530例(75.3%),高中及以下學歷的有431例(61.2%),在業(yè)的有582例(82.7%),月收入5 000元以上的有330例(46.9%)。
2.2LCM納入的變量 納入的變量包括:HPV感染相關的性行為特征和HPV感染危險因素。見表1。
表1 LCM中納入的研究變量
2.3模型擬合效果 潛類別數(shù)1~10的LCM擬合度統(tǒng)計量,見表2。潛類別數(shù)為3的模型有最小的AIC值,此時BIC值略高于潛類別數(shù)為2的模型。潛類別數(shù)為3的G2值也要小于潛類別數(shù)為2的模型,綜合考慮本研究選定潛類別數(shù)為3的模型。
表2 不同分類數(shù)目下LCM的擬合度統(tǒng)計量
Df為自由度
2.4模型的參數(shù)估計及潛在類別的命名 HPV感染高風險組,有347例(49.3%),潛類別概率為0.563;HPV感染中風險組,有184例(26.1%),潛類別概率為0.227;HPV感染低風險組,有173例(24.6%),潛類別概率為0.210。見表3。
表3 MSM人群的性行為特征及HPV感染因素的條件概率
2.5潛類別間HPV感染結(jié)局比較 704例MSM中HPV總感染例數(shù)為355例(50.43%),其中高危型HPV感染例數(shù)為272例(38.64%)。HPV感染高風險組、中風險組和低風險組間HPV感染結(jié)局比較,3組間差異有統(tǒng)計學意義(χ2=8.816,P=0.012)。進一步兩兩比較發(fā)現(xiàn),HPV感染高風險組和低風險組間HPV感染率差異有統(tǒng)計學意義(χ2=7.753,P=0.005)。見表4。
表4 潛類別變量的HPV感染結(jié)局指標比較[n(%)]
2.6潛類別間人口學特征比較 3組潛類別人群在不同年齡段、婚姻狀況構(gòu)成差異有統(tǒng)計學意義(P<0.05),<29歲、未婚者多集中于HPV感染高風險組。見表5。
表5 不同潛類別的人口學特征比較[n(%)]
a:等級資料,使用非參數(shù)檢驗
LCM是一種通過外顯變量來確定潛在變量的統(tǒng)計方法,模型對外顯變量和潛在變量的要求是分類變量。MSM HPV感染的危險因素很多,這些危險因素可能是單獨作用,也有可能是聯(lián)合作用,危險因素間的相互作用目前沒有得到明確的解釋。CHAN等[15]運用LCM來確定MSM HIV感染風險最高的亞組人群,對高風險人群進行暴露前預防。本研究通過LCM挖掘HPV感染因素的潛在信息,利用MSM的性行為特征及相關因素對該人群進行分類。
MSM HPV感染主要危險因素有高危性行為,如性取向、性伴數(shù)、安全套使用情況、性傳播感染、HIV感染狀況、不良生活方式及其他因素(如包皮環(huán)切情況)等[16]。高風險組和中風險組有性傳播感染史的條件概率高于低風險組,高風險組有性傳播感染史的條件概率略高于中風險組。HPV感染高風險組有高危性行為特征和HPV感染危險因素,HPV感染低風險組有低危性行為特征和HPV感染保護因素,即低風險組有低危性行為特征、行包皮環(huán)切術(shù)和無性傳播感染史,HPV感染中風險組性行為特征和HPV感染因素危險性處于高、低風險組中間水平。3個潛類別間HPV感染率差異有統(tǒng)計學意義,高風險組HPV感染率高于低風險組,可見建立的LCM在HPV感染風險方面是能夠解釋的;從AIC值說明該模型本身最優(yōu)。
MEITES等[17]研究指出自我認知同性戀者感染HPV的可能性比雙性戀或其他高,可能是自我認知同性戀者發(fā)生高危性行為的可能性更高;GILLISON等[18]研究表明,性伴數(shù)越多發(fā)生HPV感染的可能性越大,同性性伴數(shù)越多可能會發(fā)生性行為的次數(shù)更多,有性傳播感染史的個體既往發(fā)生高危性性行為的可能性更大;上述結(jié)果與HPV感染高風險組的行為一致。NYITRAY等[19]研究表明近3個月同性性伴數(shù)為1個、同性肛交每次使用安全套是MSM HPV感染的保護因素;SENKOMAGO等[20]通過隨機對照試驗發(fā)現(xiàn),男性包皮環(huán)切可降低HPV感染風險;以上研究結(jié)果與HPV感染低風險組的行為一致。
NYITRAY等[19]研究指出,45歲以下人群比45歲以上人群有更多的肛交性伴數(shù),性伴數(shù)與肛周HPV感染是相關的;這與29歲及以下人群多集中于HPV感染高風險組中是一致的,該年齡段MSM性行為活躍,發(fā)生HPV感染的可能性較大。KREIMER等[21]研究表明,未婚者比已婚者感染HPV的可能性大;這與未婚者多集中于HPV感染高風險組中是一致的,可能是由于未婚者性行為對象既有男性又有女性、年齡較小其性行為活躍導致HPV的感染率較高。
本研究是橫斷面研究,無法獲得該人群HPV持續(xù)感染狀況,而HPV持續(xù)感染與健康密切相關,HPV對機體存在多個型別持續(xù)反復感染,在以后的研究中對該人群進行長期隨訪是很有必要的;HIV感染與HPV感染途徑基本相同,在控制HPV感染的同時也能降低HIV感染。