王 晶,馬溫華,董穎強(qiáng),劉星雨,謝 穎,江 麗,李萬(wàn)水,趙興春,張 建
(公安部物證鑒定中心,北京市現(xiàn)場(chǎng)物證檢驗(yàn)工程技術(shù)研究中心,現(xiàn)場(chǎng)物證溯源技術(shù)國(guó)家工程實(shí)驗(yàn)室,北京 100038)
人類有23對(duì)46條染色體,其中22對(duì)44條為常染色體,還有1對(duì)為性染色體,XY組合的為男性,XX組合的為女性。Y染色體為男性所特有,嚴(yán)格遵循父系遺傳,且重組率低、對(duì)遺傳漂變敏感,與常染色體不同。研究Y染色體,可以發(fā)現(xiàn)人群在父系關(guān)系上的遷徙和發(fā)展,其基因多態(tài)性在不同民族和地域上也具有明顯的差異性[1-2],在法醫(yī)學(xué)個(gè)體識(shí)別、親權(quán)鑒定、遺傳學(xué)分析和人類遷徙等方面有重要的研究意義[3-5]。本研究對(duì)貴州地區(qū)人數(shù)較多的3個(gè)少數(shù)民族人群(回族、苗族、彝族)進(jìn)行了29個(gè)Y-STR基因座(DYS391、DYS438、DYS439、DYS444、DYS447、DYS458、DYS643、DYS389I、DYS389II、DYS437、DYS448、DYS449、DYS390、DYS392、DYS393、DYS19、GATA-H4、DYS576、DYS635、DYS456、DYS460、DYS481、DYS508、DYS518、DYS533、DYS385ab、DYF387S1)的多態(tài)性研究,旨在對(duì)該地區(qū)少數(shù)民族人群的基因特征、人口遷徙等進(jìn)行分析,為該地區(qū)的法醫(yī)學(xué)和群體遺傳學(xué)研究應(yīng)用提供基礎(chǔ)數(shù)據(jù)支撐。
從無(wú)關(guān)個(gè)體人群中篩選獲得291份貴州地區(qū)回族個(gè)體血樣、309份貴州地區(qū)苗族血樣和331份貴州地區(qū)彝族血樣,血樣采集載體均為紙質(zhì)類型,常溫保存。通過(guò)YHRD數(shù)據(jù)庫(kù)(www.yhrd.org)獲得貴州仡佬族(YP001174)、四川彝族(YP001345)、湖北土家族(YP001234)、廣西苗族(YP001169)、甘肅東鄉(xiāng)族(YP000976)、上海漢族(YP000973)和河南回族(YP001359)7個(gè)群體共計(jì)4 472個(gè)單倍型分型數(shù)據(jù)作為對(duì)比數(shù)據(jù)。
按照DNATyperTMY29試劑盒(公安部物證鑒定中心)說(shuō)明,采用直接擴(kuò)增法進(jìn)行操作[6-8],此過(guò)程中均采用9948和超純水分別作為陽(yáng)性和陰性對(duì)照。所有樣本在ABI9700擴(kuò)增儀上進(jìn)行擴(kuò)增,使用ABI3500型遺傳分析儀進(jìn)行檢測(cè),采用Data Collection軟件進(jìn)行數(shù)據(jù)收集,然后使用GeneMapper ID v3.2軟件進(jìn)行數(shù)據(jù)分析,并使用GeneMapper ID-X 1.4分析軟件進(jìn)行數(shù)據(jù)復(fù)核分析。
應(yīng)用直接計(jì)數(shù)法對(duì)各基因座的等位基因頻率進(jìn)行統(tǒng)計(jì)?;蚨鄻有裕╣ene diversity,GD)和單倍型多樣性(haplotype diversity,HD)按照公式GD/HD=[n(1-∑Pi2)]/(n-1)計(jì)算[9-10](n分別為樣本數(shù)或觀察到的單倍型個(gè)數(shù),Pi分別為基因頻率或單倍型頻率)。使用YHRD數(shù)據(jù)庫(kù)在線軟件進(jìn)行分子方差分析(analysis of molecular variance,AMOVA),計(jì)算群體間遺傳距離Rst矩陣,并進(jìn)行多維尺度分析(multidimensional scaling,MDS)[11]。
本研究中使用的29個(gè)Y-STR基因座包括25個(gè)單拷貝Y-STR基因座及2個(gè)雙拷貝基因座(DYS-385ab和DYF387S1,視為4個(gè)Y-STR基因座)。貴州地區(qū)3個(gè)民族931名無(wú)關(guān)個(gè)體的29個(gè)Y-STR基因座等位基因頻率分布見(jiàn)表1~3。在29個(gè)Y-STR基因座中,回族人群共檢出229個(gè)單倍型,其中186個(gè)為唯一單倍型,29種單倍型出現(xiàn)2次,10種單倍型出現(xiàn)3次,3種單倍型出現(xiàn)4次,1種單倍型出現(xiàn)5次,計(jì)算得到的HD值為0.995 5。彝族人群共檢出305個(gè)單倍型,其中281個(gè)為唯一單倍型,22種單倍型出現(xiàn)2次,2種單倍型出現(xiàn)3次,計(jì)算得到的HD值為0.999 1。苗族人群共檢出282個(gè)單倍型,其中258個(gè)為唯一單倍型,22種單倍型出現(xiàn)2次,1種單倍型出現(xiàn)3次,1種單倍型出現(xiàn)4次,計(jì)算得到的HD值為0.998 9。
29個(gè)Y-STR基因座在貴州回族、苗族和彝族3個(gè)民族的GD值分別為0.289 9~0.874 7、0.252 3~0.915 5、0.316 2~0.947 9(表4)。在貴州回族人群中,除DYS437、DYS391、DYS438 3個(gè)基因座,其余基因座GD值均大于0.5。在貴州苗族人群中,除DYS390、DYS391、DYS508、DYS438 4個(gè)基因座,其余基因座GD值均大于0.5。在貴州彝族人群中,除DYS437、DYS391、DYS508、DYS533、DYS438 5個(gè)基因座,其余基因座GD值均大于0.5。
表1 貴州回族、苗族和彝族人群25個(gè)單拷貝Y-STR基因座等位基因頻率分布Tab. 1 Guizhou Hui, Miao and Yi population allelic frequencies of 25 Y-STR loci
貴州回族、苗族和彝族在不同基因座上的等位基因頻率分布存在明顯差異性,同一基因座在不同民族群體中的基因頻率也存在明顯的差異,例如在DYS19基因座上,貴州回族群體中等位基因13的基因頻率較高,貴州彝族群體中等位基因14的基因頻率較高,而在貴州苗族群體中14、15、16、17 4個(gè)等位基因的基因頻率呈現(xiàn)比較均衡的分布。在DYS389Ⅰ基因座上,貴州回族和彝族群體中等位基因13的基因頻率最高,分別為0.639 2和0.643 5;而貴州苗族群體中12的等位基因頻率最高,為0.514 6,詳見(jiàn)表1。DYS387S1與DYS385ab基因座為雙拷貝基因座,在不同民族群體中等位基因頻率差異性更為明顯。DYS385ab基因座在貴州回族和彝族群體中未觀察到三等位基因分型,在貴州苗族群體中觀察到1組三等位基因分型,分型為12/13/18,頻率為0.003 2。DYS387S1基因座在貴州回族群體中觀察到1組三等位基因分型,分型為37/38/39,頻率為0.020 6。在貴州彝族群體中觀察到2組三等位基因分型,分型分別為34/36/39和36/37/39,頻率分別為0.003 0和0.012 1;在貴州苗族群體中觀察到6組三等位基因分型,分型分別為35/36/38、35/36/39、36/37/39、36/37/40、36/38/39和37/38/40,頻率分別為0.003 2、0.003 2、0.009 7、0.003 2、0.003 2和0.003 2。具體詳見(jiàn)表2和表3。
表2 DYF387S1基因座在貴州回族、苗族和彝族人群的等位基因頻率分布Tab. 2 Allelic frequencies of DYF387S1 loci in Guizhou Hui, Miao and Yi population
表3 DYF385ab基因座在貴州回族、苗族和彝族人群的等位基因頻率分布Tab. 3 Allelic frequencies of DYF385ab loci in Guizhou Hui, Miao and Yi population
表4 貴州回族、苗族和彝族人群的基因多樣性Tab.4 Gene diversity of Guizhou Hui, Miao and Yi populations
表5 10個(gè)民族Rst值遺傳距離矩陣Tab. 5 Pairwise Rst and the associated P values computed for 10 populations
遺傳距離指不同群體之間的基因差異的程度,并且以某種數(shù)值進(jìn)行度量。通常由基因頻率的某個(gè)函數(shù)所確定,是反應(yīng)群體之間遺傳差異與群體間遺傳分化的重要指標(biāo)。通過(guò)AMOVA分析,貴州苗族、回族和彝族與其他7個(gè)人群間的Rst遺傳矩陣見(jiàn)表5,10個(gè)群體間有明顯遺傳學(xué)差異(P<0.05),10個(gè)人群間的遺傳距離在0.007 8~0.138 9。其中貴州仡佬族與上海漢族的遺傳距離最?。?.007 8),廣西苗族和湖北土家族的距離最遠(yuǎn)(0.138 9),貴州回族與其他民族相比與廣西苗族距離最遠(yuǎn)(0.130 6),貴州彝族和貴州苗族與其他民族相比與湖北土家族的遺傳距離最遠(yuǎn)(0.075 4,0.116 3)。基于遺傳距離MDS散點(diǎn)圖(圖1)可以看出貴州仡佬族、上海漢族、河南回族和四川彝族聚集一簇,廣西苗族和貴州苗族聚集一簇,貴州回族與甘肅東鄉(xiāng)族一簇,湖北土家族與其他民族相距較遠(yuǎn)。
圖1 10個(gè)民族多維尺度分析圖Fig. 1 Multi-dimensional scaling (MDS) plot for 10 populations based on Rst values
Y染色體為人類性染色體,為正常人類男性所特有。Y染色體以單倍型的形式由父親傳給兒子,呈父系遺傳的方式。因此,Y染色體可被用于性別鑒定。近年來(lái),通過(guò)對(duì)Y染色體特有的STR序列多態(tài)性進(jìn)行深入研究,Y染色體上的STR基因座被廣泛用于個(gè)體識(shí)別與親子鑒定。并且通過(guò)不同民族和地域的Y-STR多態(tài)性的研究對(duì)了解人類的起源和遷移等方面也有著重要的遺傳學(xué)意義[12-15]。所有Y-STR基因座位于一條染色體上,呈現(xiàn)的是連鎖遺傳,不符合Hardy-Weinberg平衡定律,個(gè)體識(shí)別與父權(quán)鑒定的統(tǒng)計(jì)學(xué)計(jì)算不能參照常染色體的累計(jì)法,只能以單倍型概率計(jì)算,再計(jì)算個(gè)體識(shí)別率。在Y染色體上,單個(gè)基因座的非父排除率(excluding probability of paternity,EPP)、多態(tài)信息含量(polymorphism information content,PIC)與GD相同。累計(jì)非父排除率、累計(jì)個(gè)體識(shí)別能力與HD相同。
本文29個(gè)Y-STR基因座的遺傳多態(tài)性結(jié)果顯示:貴州回族人群HD值為0.995 5;彝族人群HD值為0.999 1;苗族人群HD值為0.998 9。這表明此29個(gè)Y-STR基因座在貴州回族、彝族和苗族人群中具有較高的個(gè)體識(shí)別力。29個(gè)Y-STR基因座在貴州回族、苗族和彝族3個(gè)民族的GD值分別為0.289 9~0.874 7、0.252 3~0.915 5、0.316 2~0.947 9。在貴州回族人群中,除DYS437、DYS391、DYS438 3個(gè)基因座,其余基因座GD值均大于0.5;在貴州苗族人群中,除DYS390、DYS391、DYS508、DYS438 4個(gè)基因座,其余基因座GD值均大于0.5;在貴州彝族人群中,除DYS437、DYS391、DYS508、DYS533、DYS438 5個(gè)基因座,其余基因座GD值均大于0.5。上述結(jié)果表明這29個(gè)Y-STR基因座的大部分基因座在貴州回族、苗族和彝族3個(gè)人群中具有較高的遺傳多態(tài)性,適合用于法醫(yī)學(xué)應(yīng)用。通過(guò)對(duì)不同民族和地域間人群的分析,同一基因座在不同地域民族之間的Y-STR基因座多態(tài)性具有明顯的差異[16-18]。如DYS533在苗族中的GD值為0.635 8,在回族中的GD值為0.673 9,在彝族中的GD值為0.495 5,說(shuō)明各個(gè)民族之間都有自己獨(dú)特的單倍型,對(duì)不同地域民族間的Y-STR基因座頻率不能通用,不同地域民族的Y-STR基因座基因頻率的詳細(xì)調(diào)研具有重大的法醫(yī)學(xué)和遺傳學(xué)意義[19-20]。
本研究選擇了其他7個(gè)民族群體與貴州苗族、彝族和回族群體進(jìn)行遺傳學(xué)分析,這7個(gè)民族群體分別為:湖北土家族、甘肅東鄉(xiāng)族、上海漢族、貴州仡佬族、四川彝族、河南回族和廣西苗族(除上海漢族外其他屬于少數(shù)民族)。選擇這7個(gè)民族群體是為了比對(duì)同一地域不同民族的遺傳學(xué)差異(貴州仡佬族)、同一民族不同地域的遺傳學(xué)差異(四川彝族、河南回族、廣西苗族)以及不同地域不同民族間的遺傳學(xué)差異(湖北土家族、甘肅東鄉(xiāng)族、上海漢族),尤其是少數(shù)民族間的遺傳學(xué)差異。對(duì)貴州3個(gè)群體與這7個(gè)群體進(jìn)行AMOVA分析,獲得的Rst遺傳距離矩陣顯示:同一地區(qū)不同民族間遺傳距離較遠(yuǎn),例如貴州仡佬族與貴州回族遺傳距離為0.075 7,表明即使在同一地域內(nèi),不同民族間遺傳學(xué)參數(shù)存在較大差異,其不同民族間遺傳交流較少,遺傳結(jié)構(gòu)較為獨(dú)立;同一民族不同地域群體間的遺傳距離也存在明顯差異性,例如河南回族與貴州回族遺傳距離為0.057 4;但同一民族的亞群體易聚為一類,遺傳距離相對(duì)較近,例如廣西苗族與貴州苗族的遺傳距離為0.012 4,此結(jié)果表明,可能由于遷徙等原因,同一民族群體即使處于不同地域,其遺傳距離依然較近;而通過(guò)不同民族且不同地域群體間的遺傳數(shù)據(jù)進(jìn)行對(duì)比,發(fā)現(xiàn)該組遺傳距離較遠(yuǎn),比如廣西苗族與湖北土家族的遺傳距離最遠(yuǎn)為0.138 9,湖北土家族與貴州苗族和四川彝族的遺傳距離也較遠(yuǎn),分別為0.116 3和0.118 7,貴州回族和廣西苗族和四川彝族的遺傳距離也較遠(yuǎn),分別為0.130 6和0.122 1。這說(shuō)明遺傳距離與不同地域不同民族群體都有著密不可分的聯(lián)系,尤其在少數(shù)民族群體之間,不同民族且不同地域間的民族群體間,其遺傳學(xué)差異越明顯,遺傳距離越遠(yuǎn)。
綜上所述,29個(gè)Y-STR基因座在貴州回族、苗族和彝族人群中大部分基因座的遺傳多態(tài)性較高,其聯(lián)合運(yùn)用具有較高的個(gè)體識(shí)別力,適用于法醫(yī)學(xué)個(gè)體識(shí)別和親權(quán)關(guān)系鑒定。本文通過(guò)對(duì)貴州苗族、回族和彝族3個(gè)人群與其他7個(gè)群體的遺傳結(jié)構(gòu)分析,進(jìn)一步為各民族的起源和遷移等遺傳關(guān)系研究提供了重要基礎(chǔ)。