劉亞舉,岳俊濤,李 瑾,李學(xué)博,石美森
1.河南省許昌市公安局刑事科學(xué)技術(shù)研究所,河南許昌 461000;2.山東省高校證據(jù)鑒識(shí)重點(diǎn)實(shí)驗(yàn)室(山東政法學(xué)院),山東濟(jì)南 250014;3.中國(guó)政法大學(xué)證據(jù)科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100192
短串聯(lián)重復(fù)(STR)基因座是法醫(yī)學(xué)常用遺傳標(biāo)記,因其主要表現(xiàn)為長(zhǎng)度多態(tài)性,結(jié)合毛細(xì)管電泳技術(shù)可快速完成基因的檢測(cè),已成為法醫(yī)學(xué)檢驗(yàn)中DNA分型技術(shù)的主流遺傳標(biāo)記及主要檢測(cè)技術(shù)[1],廣泛應(yīng)用于法醫(yī)學(xué)個(gè)體識(shí)別和親緣關(guān)系鑒定[2-4]。本研究通過對(duì)SureID?PanGlobal試劑盒中所包含的24個(gè)常染色體STR基因座在湖北土家族人群中的分布頻率和群體遺傳學(xué)參數(shù)進(jìn)行調(diào)查,并收集了全國(guó)其他多民族群體的相關(guān)數(shù)據(jù),進(jìn)行了人群間遺傳距離和遺傳關(guān)系的推斷,為該民族個(gè)體識(shí)別和親權(quán)鑒定、群體間遺傳分布等相關(guān)研究提供參考數(shù)據(jù)。
1.1一般資料 根據(jù)知情同意原則,從體檢健康人群中隨機(jī)采集湖北土家族人群457例(男394例,女63例)無(wú)血緣關(guān)系個(gè)體外周血0.1 mL,滴入采血卡(武漢驥騰公司),陰干后常溫保存。該研究得到汕頭大學(xué)醫(yī)學(xué)院倫理委員會(huì)批準(zhǔn)。
通過中國(guó)知網(wǎng)(www.cnki.net)和NCBI(www.ncbi.nlm.nih.gov)數(shù)據(jù)庫(kù)獲得10個(gè)漢族人群[北京(369例)、遼寧(342例)、河南(1 136例)、山東(1 030例)、山西(554例)、湖北(3 078例)、湖南(560例)、廣東(1 533例)、福建(741例)、貴州(605例)]以及10個(gè)少數(shù)民族人群[內(nèi)蒙古蒙古族(135例)、甘肅東鄉(xiāng)族(511例)、甘肅回族(1 038例)、甘肅裕固族(174例)、西藏藏族(203例)、新疆喀什維吾爾族(1 381例)、新疆和田哈薩克族(1 130例)、云南苗族(748例)、海南黎族(189例)、湖南沅陵土家族(510例)]共20個(gè)人群的STR基因座等位基因頻率作為群體遺傳關(guān)系比較的數(shù)據(jù)。每人群至少含有18個(gè)STR基因座資料、樣本量至少有100例。
1.2儀器與試劑 Hamilton STAR-LET自動(dòng)化工作站(AusBio公司,瑞士);平板離心機(jī)(Eppendorf公司,德國(guó));Mastercycler pro S銀座PCR擴(kuò)增儀(Eppendorf公司,德國(guó));3500XL型遺傳分析儀和ID-X分析軟件(ThermoFisher公司,美國(guó));GeneMarker?HID分析軟件(SoftGenetics公司,美國(guó))。SureID?PanGlobal試劑盒和內(nèi)標(biāo)SIZE-500 Plus(寧波海爾施基因科技有限公司),陽(yáng)性標(biāo)準(zhǔn)品9947A(ThermoFisher公司,美國(guó))。
1.3方法 根據(jù)SureID?PanGlobal熒光檢測(cè)試劑盒說(shuō)明書,用直擴(kuò)法(免提取)對(duì)前述血液標(biāo)本進(jìn)行PCR擴(kuò)增。在Mastercycler pro S銀座PCR擴(kuò)增儀上進(jìn)行復(fù)合擴(kuò)增,反應(yīng)體系為10 μL,其中PCR Master Mix 5.0 μL、Primer Mix 2.5 μL、純水2.5 μL和1.2 mm直徑血卡。熱循環(huán)參數(shù):95 ℃ 5 min;95 ℃ 10 s,61 ℃ 1 min,70 ℃ 30 s,28個(gè)循環(huán);60 ℃ 15 min;4 ℃保溫。取1 μL擴(kuò)增產(chǎn)物與0.5 μL內(nèi)標(biāo)SIZE-500 Plus和8.5 μL去離子甲酰胺混合,95 ℃變性3 min后,冰浴3 min,置3500XL型遺傳分析儀上進(jìn)行全自動(dòng)毛細(xì)管電泳,Data Collection軟件收集數(shù)據(jù),用GeneMarker?HID分析軟件進(jìn)行等位基因分型,并采用GeneMapper ID-X v1.5分析軟件復(fù)核分析。每批標(biāo)本檢測(cè)均采用9947A和超純水分別作為陽(yáng)性對(duì)照和陰性對(duì)照。
1.4統(tǒng)計(jì)學(xué)處理 用PowerMarker?v3.25軟件獲得各STR基因座的等位基因頻率及法醫(yī)學(xué)相關(guān)參數(shù)[雜合度(H)、個(gè)人識(shí)別概率(DP)、多態(tài)性信息含量(PIC)];采用PowerStats v12軟件計(jì)算三聯(lián)體非父排除率(PEtrios)和二聯(lián)體非父排除率(PEduos)。采用Arlequin v3.5 軟件(http://cmpg.unibe.ch/software/arlequin3.5)進(jìn)行各基因座Hardy-Weinberg平衡及連鎖不平衡檢驗(yàn)。應(yīng)用DISPAN軟件(http://www.personal.psu.edu/nxm2/software.htm)計(jì)算21個(gè)群體Nei′s DA 遺傳距離矩陣(Rst值),Mega 6.0軟件(http://www.megasoftware.net/)構(gòu)建21個(gè)群體鄰接(NJ)系統(tǒng)發(fā)生樹和UPGMA聚類分析。
2.1湖北土家族人群24個(gè)STR和1個(gè)Y-indel基因座遺傳多態(tài)性 在457例湖北土家族無(wú)關(guān)個(gè)體血液標(biāo)本中,SureID?PanGlobal熒光檢測(cè)試劑盒中的24個(gè)STR和1個(gè)Y-indel、DYS391基因座都得到了有效擴(kuò)增,其中男性標(biāo)本在Y-indel和DYS391基因座均檢測(cè)到1個(gè)等位基因,性別(Amel)檢測(cè)結(jié)果為XY,而女性標(biāo)本在Y-indel和DYS391基因座檢測(cè)結(jié)果均為陰性,Amel檢測(cè)結(jié)果為X。各等位基因頻率見表1。
2.2湖北土家族人群24個(gè)STR基因座的法醫(yī)遺傳學(xué)參數(shù) 24個(gè)STR基因座的基因型頻率分布在湖北土家族人群中達(dá)到Hardy-Weinberg平衡(PHWE>0.05),各基因座之間相互獨(dú)立,屬于連鎖平衡狀態(tài),累積個(gè)體識(shí)別率(CDP)和累積非父排除率(CPE)分別為1-2.574 0×10-30和1-1.593 9×10-11。24個(gè)STR基因座的群體遺傳學(xué)參數(shù)見表2。
2.3湖北土家族與20個(gè)人群間的遺傳距離 應(yīng)用本文獲得的湖北土家族人群的STR基因座基因頻率數(shù)據(jù),與20個(gè)比較人群的Nei′s DA遺傳距離見表3;根據(jù)遺傳距離,采用鄰位相連法構(gòu)建的21個(gè)人群間NJ系統(tǒng)發(fā)生樹;采用UPGMA法對(duì)21個(gè)人群進(jìn)行聚類分析,見圖1。
表1 湖北土家族人群24個(gè)常染色體STR基因座和1個(gè)Y-indel的等位基因頻率分布
注:A為等位基因,F為等位基因頻率。
表2 湖北土家族人群24個(gè)STR基因座的群體遺傳學(xué)參數(shù)
表3 21個(gè)人群Nei′s DA遺傳距離矩陣
續(xù)表3 21個(gè)人群Nei′s DA遺傳距離矩陣
注:[01]為湖北土家族;[02]為湖南沅陵土家族;[03]為山東漢族;[04]為山西漢族;[05]為湖南漢族;[06]為廣東漢族;[07]為湖北漢族;[08]為貴州漢族;[09]為河南漢族;[10]為福建漢族;[11]為北京漢族;[12]為遼寧漢族;[13]為內(nèi)蒙古蒙古族;[14]為甘肅東鄉(xiāng)族;[15]為甘肅回族;[16]為甘肅裕固族;[17]為新疆和田哈薩克族;[18]為新疆喀什維吾爾族;[19]為西藏藏族;[20]為云南苗族;[21]為海南黎族。
圖1 21個(gè)人群的UPGMA法聚類分析
人類STR基因座在不同人群中表現(xiàn)出不同的遺傳多態(tài)性,即具有群體特異性[1],評(píng)價(jià)遺傳標(biāo)記STR基因座的遺傳多態(tài)性常用參數(shù)有F、H、DP、PIC和PE,PHWE值均大于0.05,說(shuō)明所收集的群體數(shù)據(jù)基因型的預(yù)期值和觀察值是吻合的,樣本收集有效[5]。本研究結(jié)果顯示,DP為0.797 2~0.991 7,表明隨機(jī)抽取個(gè)體在進(jìn)行個(gè)體識(shí)別時(shí)匹配可能性較高。PE為0.360 3~0.882 8,表明多態(tài)性程度越高排除非親生父親的效能越高。DP和PE反映遺傳標(biāo)記系統(tǒng)在個(gè)體識(shí)別和親權(quán)鑒定中的能力,通常當(dāng)DP大于0.9、PE大于0.5[6]表明基因座具有高度多態(tài)性[1]。本研究的24個(gè)STR基因座在湖北土家族人群中的CDP為1-2.574 0×10-30,CPE為1-1.593 9×10-11,遠(yuǎn)高于判定標(biāo)準(zhǔn)CPE的99.99%,說(shuō)明此鑒定系統(tǒng)對(duì)個(gè)體識(shí)別和親權(quán)鑒定具有較高的法醫(yī)學(xué)應(yīng)用價(jià)值。
通過計(jì)算上述群體的遺傳距離,結(jié)果顯示,同其他人群相比,湖北土家族與云南苗族(0.038 8)遺傳距離最遠(yuǎn),與湖北漢族(0.002 9)遺傳距離最近。NJ系統(tǒng)發(fā)生樹聚類分析顯示,本研究納入的21個(gè)不同地區(qū)人群被劃分為3個(gè)分支,其中湖北土家族和湖北漢族分別單獨(dú)列為一支,其他漢族群體列為第3個(gè)分支。對(duì)第3個(gè)分支進(jìn)一步分析,各民族有明確的地域區(qū)分。另外,同一民族群體,其群體等位基因頻率會(huì)隨樣本容量、地域及環(huán)境變化而改變,本研究納入的21個(gè)群體的樣本量大小不同,對(duì)其采樣群體的代表性也不盡相同,大樣本量的頻率資料更能準(zhǔn)確地反映出所在群體的頻率分布情況;同時(shí),這些群體分布在我國(guó)地理差異較大的地區(qū),受環(huán)境因素影響較大;這些差異均可在聚類分支里體現(xiàn)出來(lái)。本研究選用D3S1358、TH01、D21S11、D18S51、D12S391、D2S1338、D5S818、D13S317、D7S820、D19S433、CSF1PO、vWA、D8S1179、TPOX、FGA、D16S539等16個(gè)STR基因座遺傳信息是基于參考資料所涉及的基因座不同,采用相同基因座可避免因不同位點(diǎn)造成的統(tǒng)計(jì)學(xué)誤差[7]。從總體來(lái)看,根據(jù)24個(gè)STR基因座計(jì)算的遺傳距離與各民族群體的形成歷史較一致[8],說(shuō)明了常染色體STR遺傳標(biāo)記在民族間遺傳距離和基因漂流的評(píng)價(jià)中起到一定作用。
綜上所述,根據(jù)21個(gè)人群的24個(gè)STR基因座計(jì)算的遺傳距離結(jié)果與它們的地理分布和民族歷史記載基本一致,能夠比較全面地反映我國(guó)多民族間的遺傳關(guān)系和近期以來(lái)的基因漂流變化。要闡明這些群體間的遺傳結(jié)構(gòu),需要增加研究STR遺傳標(biāo)記,特別是與Y-SNP分型、線粒體DNA結(jié)果進(jìn)行互補(bǔ)[9-11],才能提高精確性,更加全面地揭示出各個(gè)人群的進(jìn)化歷史以及群體間的親緣關(guān)系。