張幼芳,張巍,侯思如
1.浙江警察學院,浙江 杭州 310053;2.中國刑事警察學院,遼寧 沈陽 110854;3.中國醫(yī)科大學,遼寧 沈陽 110122
STR 是當前法醫(yī)DNA 分析的主流遺傳標記,具有較高的突變率,這雖然會影響法醫(yī)分型判斷和鑒定意見的準確性,但為群體遺傳學提供了研究基礎(chǔ)。因此,常染色體STR基因座被廣泛運用于人類群體遺傳學研究。本研究對云南回族人群17 個常染色體STR基因座的遺傳多態(tài)性進行調(diào)查,以期為法醫(yī)學個體識別、親權(quán)鑒定以及群體遺傳學研究提供基礎(chǔ)數(shù)據(jù)。
根據(jù)知情同意原則收集725 例云南回族無關(guān)個體的血濾紙樣本。
采用打孔器取1.2 mm 直徑血濾紙進行檢驗。使用PowerPlex? 18D 試劑盒(美國Promega 公司)在9700型PCR儀(美國Applied Biosystems 公司)上進行直接擴增,擴增體系為10 μL。采用3130xl基因分析儀(美國Applied Biosystems 公司)進行電泳分離。使用GeneMapper? ID v3.2軟件(美國Applied Biosystems公司)進行基因分型,等位基因峰高閾值設(shè)置為50 相對熒光單位(relative fluorescence units,RFU)。以男性標準品2800M(美國Thermo Fisher Scientific 公司)作為質(zhì)量控制的陽性對照,雙蒸水作為陰性對照。對于off-ladder(OL)等位基因,采用ForenSeq DNA Sig?nature Prep試劑盒(美國Verogen公司)進行二代測序,使用ForenSeqTMUniversal Analysis Software(UAS)v1.3(美國Verogen 公司)和STRait Razor 3.0[1]軟件進行序列分析。
采用Modified Powerstats 軟件[2]計算17 個常染色體STR 基因座的等位基因頻率、匹配概率(probabili?ty of match,Pm)、個體識別率(discrimination power,DP)、多態(tài)信息含量(polymorphic information content,PIC)、非父排除率(probability of paternity excluding,PE)、親權(quán)指數(shù)(parentage index,PI)、觀察雜合度(observed heterozygosity,Ho)以及Hardy-Weinberg 平衡檢驗等。
使用Arlequin 3.5 軟件[3]進行基因座間連鎖不平衡檢驗,并比較云南回族與其他7 個云南群體(白族[4]、藏族[5]、拉祜族[6]、哈尼族[7]、苗族[8]、佤族[9]、漢族[10])在除Penta D和Penta E外的15個常染色體STR基因座的群體遺傳距離(Fst)。利用MEGA 軟件[11]基于Fst平均值構(gòu)建系統(tǒng)發(fā)生樹。
本研究在云南回族人群17 個常染色體STR 基因座中共檢出190 個等位基因,等位基因頻率分布在0.000 7~0.504 1(表1)。其中,發(fā)現(xiàn)兩個OL 等位基因,分別為FGA上的等位基因26.2(頻率為0.000 7)和Penta E上的等位基因25(頻率為0.003 4)。盡管這兩個OL 等位基因在STRBase 網(wǎng)站(https://strbase.nist.gov/)上均有報道,但所報道的Penta E等位基因25 并非使用PowerPlex? 18D 試劑盒檢測所得的基因分型。二代測序結(jié)果顯示,該等位基因命名為Penta E_25_[TCTTT]25,側(cè)翼序列分別為上游序列AGAAAACTCCTTACAATTT(經(jīng)UAS 分析)和下游序列GAGACTGAGTCTTGCTCAGTCGCCCAGGCTGGAG TGCAATGGCGTGATCTCGGCTCACTTCAATCTCCAC CTCCT(經(jīng)STRait Razor分析)。
表1 17個常染色體STR基因座在云南回族人群中的等位基因頻率分布Tab.1 Allele frequency distribution of 17 autosome STR loci in Yunnan Hui population (n=725)
本研究中,17 個常染色體STR 基因座基因型的觀察值與期望值經(jīng)過Bonferroni 矯正,基因型分布均符合Hardy-Weinberg 平衡(P>0.002 9),不存在連鎖不平衡現(xiàn)象(P>0.0004)。Ho值分布在0.6083~0.8966。Penta E和FGA為高多態(tài)性基因座(PIC>0.85);D2S1338、D5S818、D7S820等11 個基因座為中高度多態(tài)性基因座(PIC>0.70);CSF1PO、D3S1358、TH01和TPOX4 個基因座識別能力稍差。Pm 值在0.017 5~0.196 0,累積匹配概率(cumulative match probability,CMP)達到7.02×10-21。DP 值在0.804 0~0.982 5,累積個體識別率(cumulative discrimination power,CDP)達到0.999999999999999999993。PE值在0.3009~0.7884,三聯(lián)體累積非父排除率(cumulative probability of ex?clusion,CPE)達到0.999 999 801。詳見表2。
表2 17個常染色體STR基因座在云南回族人群中的群體遺傳學參數(shù)Tab.2 Population genetic parameters of 17 autosome STR loci in Yunnan Hui population (n=725)
云南回族人群與白族、藏族、拉祜族等7 個人群15 個常染色體STR 基因座遺傳距離的比較結(jié)果見表3。結(jié)果顯示,經(jīng)Bonferroni 矯正(P<0.003 3),云南回族人群與白族在12 個基因座上差異具有統(tǒng)計學意義,與藏族、拉祜族和哈尼族在11 個基因座上差異具有統(tǒng)計學意義,與苗族在8 個基因座上差異具有統(tǒng)計學意義,與佤族和漢族在2 個基因座上差異具有統(tǒng)計學意義。
表3 云南回族人群與其他人群的遺傳距離比較結(jié)果(P值)Tab.3 Comparison of genetic distance between the Hui population and other populations in Yunnan(P value)
基于云南8 個人群遺傳距離構(gòu)建的系統(tǒng)發(fā)生樹見圖1,其中哈尼族和藏族聚為一類,回族與佤族、漢族、苗族、拉祜族和白族相對聚集成樹。
圖1 云南8個人群的系統(tǒng)發(fā)生樹Fig.1 Phylogenetic tree of 8 populations in Yunnan
本研究結(jié)果顯示,在云南回族群體17 個常染色體STR基因座中,除CSF1PO、D3S1358、TH01和TPOX外,其余13 個基因座均具有高多態(tài)性和高識別能力(Ho>0.7、PIC>0.7、DP>0.9)。所有基因座的基因型分布均符合Hardy-Weinberg 平衡且不存在連鎖不平衡現(xiàn)象,說明采樣隨機且各基因座相互獨立。根據(jù)乘積原則,17 個常染色體STR 基因座構(gòu)成的復合擴增體系在云南回族人群中具有較高的個體識別和親權(quán)鑒定的系統(tǒng)效能(CDP>0.999 999 999、CPE>0.999 999)。
本研究所調(diào)查的回族群體是我國第二大少數(shù)民族,主要集中在寧夏回族自治區(qū)(20.53%)、甘肅(11.89%)、新疆維吾爾自治區(qū)(9.29%)和青海(7.88%)等西北地區(qū),但在全國各地亦存在集中分布,尤其是在河南(9.05%)、云南(6.60%)、河北(5.39%)、山東(5.06%)、安徽(3.10%)、北京(2.35%)、遼寧(2.32%)等地[12]。同時,云南又是我國擁有少數(shù)民族最多的省份,明確各民族人群的遺傳多態(tài)性和群體遺傳關(guān)系有助于科學地進行法醫(yī)學鑒定。通過觀察,筆者認為,云南8 個民族人群遺傳距離的差異與語系有一定的關(guān)聯(lián):云南回族和漢族的遺傳距離比較接近,兩者同屬于漢藏語系漢語族;云南白族、哈尼族、拉祜族和藏族四者均屬于漢藏語系藏緬語族;云南苗族屬于漢藏語系苗瑤語族;云南佤族屬于南亞語系孟高棉語族。比較特別的是,藏緬語族中,白族和拉祜族比哈尼族和藏族有更多的機會與其他語系或語族的人群進行基因交換,分析可能與民族混居有關(guān)。綜上,云南回族與其他各民族之間的關(guān)系基本符合地域及語系的分布。
綜上所述,17 個常染色體STR 基因座在云南回族人群中具有較高的多態(tài)性和較好的識別能力,可滿足法醫(yī)學個體識別和親權(quán)鑒定應(yīng)用,本研究亦可為群體遺傳學和語言學等研究提供基礎(chǔ)數(shù)據(jù)。