苗龍飛,孫大鵬,馬溫華,仲建軍*
1.德州市公安局物證鑒定研究中心,山東 德州 253000;2.公安部物證鑒定中心,北京100038
人類Y 染色體為男性所特有,其長度約60 Mb,Y 染色體包含的基因數(shù)量在46條染色體中是最少的。Y 染色體兩端的擬常染色質(zhì)區(qū)在減數(shù)分裂時可與X 染色體進行聯(lián)會而重組,Y 染色體區(qū)域非重組區(qū)約占95%,并由父親穩(wěn)定遺傳給兒子[1-2]。短串聯(lián)重復序列(Y-STR,Y-short tandem repeat)在Y 染色體上大量存在且分散排布,位于非重組區(qū),是連鎖遺傳。從1992 年第一個Y-STR基因座DYS19 被發(fā)現(xiàn)并報道[3],到目前已有700多個Y-STR基因座被公開發(fā)表。除了在法庭科學領(lǐng)域用于父系鑒定、家系排查及族源推斷等[4-5],Y-STR 基因座在人類起源、進化和群體間的遺傳關(guān)系等方面的研究在國內(nèi)外也已經(jīng)廣泛開展[6-8]。
Y-STR 基因座的遺傳多態(tài)性研究主要集中在單倍型的頻率分布、基因座等位基因分布范圍、等位基因分布頻率、稀有等位基因、多拷貝現(xiàn)象等,能夠為Y-STR 在法醫(yī)學個體識別、親權(quán)鑒定以及人類遺傳學方面的研究提供數(shù)據(jù)支撐。在Y-STR基因座的遺傳多態(tài)性研究中,研究對象一般是某個民族或者某個區(qū)域內(nèi)的無關(guān)男性個體。近年來,Y-STR 基因座頻率調(diào)查的相關(guān)研究報道較多[9-13],基于此,本研究對598 名德州漢族無關(guān)男性個體的37 個Y-STR 基因座進行基因頻率調(diào)查,并與其他15 個群體的遺傳關(guān)系進行比較,旨在為德州地區(qū)漢族人群的法庭科學和群體遺傳學研究提供基礎(chǔ)數(shù)據(jù)支持。
在山東省德州市隨機采集598 份無關(guān)男性個體血樣,以血卡形式保存。所有研究對象均對本研究知情,并自愿簽署知情同意書。
所有血樣直接取直徑為1.2 mm 大小的圓片,檢測試劑采用AGCU Y37 熒光檢測試劑盒(無錫中德美聯(lián)生物技術(shù)有限公司),用10 μL 體系,按照說明書上推薦的擴增條件,在9700 型擴增儀(美國Thermo Fisher Scientific 公司)上進行擴增,在3500xL 遺傳分析儀(美國Thermo Fisher Scientific 公司)上進行檢測。Y-STR 分型數(shù)據(jù)使用GeneMapper ID-X v1.5分析軟件進行分析。
各基因座的等位基因頻率采用直接計數(shù)法進行統(tǒng)計;基因多樣性(gene diversity,GD)和單倍型多樣性(haplotype diversity,HD)的計算采用公式GD/HD=[n(1-∑Pi2)]/(n-1)來計算(n分別為樣本數(shù)和單倍型個數(shù),Pi分別為基因頻率和單倍型頻率);識別能力(discriminative capacity,DC)=H/N(H為單倍型數(shù),N為樣本數(shù));采用YHRD 數(shù)據(jù)庫(https://yhrd.org)在線軟件進行分子方差分析(analysis of molecular variance,AMOVA),計算群體間遺傳距離(pairwise genetic distance,Rst),并構(gòu)建多維尺度分析(multidimensional scaling,MDS)。然后采用MEGA 7.0 軟件[14],通過鄰接法(neighbor-joining,NJ)[15]構(gòu)建德州漢族群體和其他15個參考群體的系統(tǒng)發(fā)生樹。
德州漢族人群在37 個Y-STR 基因座上共檢出423 個等位基因,等位基因最多的基因座是DYS385a/b(66 個),等位基因最少的基因座是DYS645(4 個),等位基因頻率分布見表1。DYS385a/b、DYF387S1、DYS527a/b 基因座為多拷貝基因座,可同時獲得兩個擴增片段,有的樣本在上述基因座中檢測出多譜帶分型。在6 個單拷貝基因座(DYS19、DYS393、DYS449、DYS518、DYS576、DYS627)中發(fā)現(xiàn)較低頻率的雙等位基因。本研究在8 個基因座(DYS449、DYS481、DYS518、DYS527a/b、DYS557、DYS570、DYS593、DYS627)上共觀察到15 種微變異等位基因,其中在DYS518 基因座上出現(xiàn)的頻率最高(0.048 5),且種類也較多(3 種)。雙等位基因與微變異等位基因等特征在數(shù)據(jù)分析和案件應用過程中應引起注意。
表1 德州地區(qū)漢族人群37個Y-STR 基因座等位基因頻率分布(n=598)Table 1 Allele frequencies of 37 Y-STR loci in Dezhou Han population(n=598)
續(xù)表
續(xù)表
598 名無關(guān)男性個體中共觀察到593 種單倍型,其中588 種為唯一單倍型,5 種單倍型出現(xiàn)兩次。GD 值范圍為0.113 9(DYS645)~0.971 4(DYS385a/b),除DYS437、DYS438、DYS391、DYS645 4個基因座,其他基因座的GD值均大于0.6,GD值分布見表2。總體的HD值為0.999 971 989,DC值為0.991 6。
表2 德州漢族人群的基因多樣性(n=598)Table 2 Gene diversity of Dezhou Han population(n=598)
利用YHRD數(shù)據(jù)庫在線軟件計算德州漢族群體和其他15 個民族的遺傳距離,該計算是在與Yfiler plus 試劑盒重疊的27 個Y-STR 基因座的基礎(chǔ)上完成的,16 個群體Rst 結(jié)果見表3。結(jié)果表明,德州漢族與呼倫貝爾漢族距離最近(0.002 9),其次是黑龍江漢族(0.004 8);與內(nèi)蒙古達斡爾族距離最遠(0.103 1)。
表3 16個群體Rst值遺傳距離矩陣Table 3 Genetic distance matrix of Rst values between 16 populations
基于Rst 值構(gòu)建了MDS 散點圖由圖1 可知,南方漢族緊密聚集成一簇,北方漢族緊密聚集成一簇,所有的漢族距離都很近,均聚集在第一和第四象限,南方少數(shù)民族聚集在第一和第二象限,北方少數(shù)民族聚集在第二和第三象限。
圖1 16個群體基于27個Y-STR基因座的MDS圖Fig.1 MDS map of 27 Y-STR loci for 16 populations
基于Rst 值采用MEGA 7.0軟件,通過NJ法構(gòu)建了系統(tǒng)發(fā)生樹(圖2),該系統(tǒng)發(fā)生樹可以分為兩大分支,漢族與南方少數(shù)民族聚為一支,北方少數(shù)民族聚為一支。漢族與南方少數(shù)民族一支可以分成兩個分支,德州漢族與呼倫貝爾漢族、黑龍江漢族等典型的北方漢族匯聚,然后與福建漢族、臺灣漢族匯聚,再先后與廣東漢族、香港漢族、海南漢族等典型的南方漢族匯聚,所有漢族與四川羌族匯聚后形成一個分支,貴州仡佬族、海南黎族匯聚成另一分支。北方少數(shù)民族也分為兩個分支,西北的甘肅東鄉(xiāng)族與阿克蘇維吾爾族匯聚后與甘肅回族匯聚成一個分支,呼和浩特蒙古族和內(nèi)蒙古達斡爾族匯聚成另一分支。遺傳距離、MDS 圖和系統(tǒng)發(fā)生樹均顯示,所有的漢族群體遺傳關(guān)系均較密切。
圖2 16個群體基于27個Y-STR基因座的系統(tǒng)發(fā)生樹Fig.2 NJ phylogenetic trees of 27 Y-STR loci for 16 populations
AGCU Y37 熒光檢測試劑盒中包含6 個快速突變Y-STR(rapidly mutating,RM Y-STR)基因座,分別是DYF387S1、DYS449、DYS518、DYS570、DYS576、DYS627,RM Y-STR 在法庭科學中可以作為一個有效補充,幫助提高系統(tǒng)的分辨能力[16]。但另一方面,在家系排查中可能對有親緣關(guān)系的男性個體錯誤排除[17]。因此,RM Y-STR在家系排查時應慎用,吳微微等[18]認為,該類基因座不適合在較大范圍內(nèi)進行家系排查。除DYS437、DYS438、DYS391、DYS645 4 個基因座,其他基因座的GD 值均大于0.6,表明該試劑盒對于大部分Y-STR 基因座具有較高的遺傳多態(tài)性。經(jīng)計算,德州漢族人群的HD 值為0.999 971 989,DC 值為0.991 6,結(jié)果表明37 個Y-STR 基因座具有較高的個體識別能力。因此,該試劑盒適合德州漢族群體的法醫(yī)學應用。
系統(tǒng)發(fā)生樹可以直觀地看出研究群體間的遺傳進化關(guān)系,本研究用NJ 法構(gòu)建了系統(tǒng)發(fā)生樹。相同語系的人群更容易聚集在一個地區(qū)[19-20],本研究中的系統(tǒng)發(fā)生樹分成兩大分支,與語系的劃分基本一致。第一個分支中漢族和羌族、仡佬族、黎族都屬于漢藏語系;第二個分支中達斡爾族、蒙古族、回族、東鄉(xiāng)族、維吾爾族都屬于阿爾泰語系。語言是民族的重要特征之一,遺傳變異與之密切相關(guān),基因的遺傳變異和語系的發(fā)展演變是一脈相承的[21-22]。
臺灣漢族與福建漢族、廣東漢族的距離最近,這一結(jié)果驗證了臺灣的漢族中,福建人占絕大多數(shù),其次是廣東人[23]。甘肅回族與新疆維吾爾族距離最近,與回族的形成歷史相符?;刈迨窃谔囟v史時期下,來自中亞地區(qū)的多個民族成分融合漢、維吾爾、蒙古等各族成分逐漸形成的民族共同體,在居住上呈現(xiàn)“大分散,小集中”的特點[24]。
人群結(jié)構(gòu)與地理分布有著密切的聯(lián)系[25-27],地域較近的群體在遺傳距離上也很接近,如位于西北的回族、東鄉(xiāng)族、維吾爾族匯聚成一簇,所有的漢族距離均較近,但南、北方漢族相比,南方漢族與南方少數(shù)民族遺傳距離更接近,與MDS 圖和系統(tǒng)發(fā)生樹的結(jié)果是一致的。
總體來看,根據(jù)27 個Y-STR 基因座計算的各群體間的遺傳距離與語系劃分、歷史形成、地理分布等方面基本一致,說明了Y-STR單倍型是研究男性人群間遺傳進化關(guān)系和推斷群體結(jié)構(gòu)的理想工具[28]。德州漢族人群的群體遺傳學數(shù)據(jù)也符合這一特點,德州地處黃河故道,地貌為黃河沖積平原,歷史悠久,德州人口中絕大多數(shù)為漢族,其語言是漢語,位于漢藏語系分支,其遺傳距離均與北方漢族最為接近。本研究為德州漢族人群的法醫(yī)遺傳學和群體遺傳學方面提供了基礎(chǔ)數(shù)據(jù)支持。