孫佳勝 ,田慶花 ,趙 霖 ,王俊方 ,畢 潔 ,石美森
(1.長沙市公安局刑事偵查支隊技術大隊,湖南 長沙 410000;2.中國政法大學 證據科學教育部重點實驗室,北京 100088;3.北京明正司法鑒定中心,北京 100191)
短串聯(lián)重復(short tandem repeat,STR)序列,由于具有豐富的多態(tài)性,被廣泛地用于連鎖分析、個體識別、群體遺傳學分析以及人類進化史的研究[1-3]。本研究應用Goldeneye?DNA身份鑒定系統(tǒng)BASIC對2004份長沙漢族個體共18個常染色體STR基因座進行遺傳多態(tài)性調查,旨在為長沙地區(qū)的親權鑒定和個體識別提供更為準確的概率計算依據,同時運用該數(shù)據和有關文獻探討長沙漢族和其他群體的遺傳關系,現(xiàn)報道如下。
根據“知情同意”原則,通過湖南省長沙市公安局DNA數(shù)據庫,選取長沙市各類案件中的涉案人員中無親緣關系個體2 004名(其中男性997名,女性1007名)。取血樣置于FTA采血卡上(武漢驥騰生物科技有限公司),干燥后常溫保存。
用打孔器打取直徑為1.2 mm的血樣,利用Goldeneye?DNA身份鑒定系統(tǒng)BASIC[基點認知技術(北京)有限公司]10μL體系進行直接擴增:PCR反應緩沖液4μL,引物混合液2μL,Taq聚合酶 0.16μL,補水至10μL。采用9700型PCR儀(美國AB公司)進行擴增,擴增條件:95℃ 5min;94℃ 30s,60℃ 1min,70℃ 1 min;28~30個循環(huán);60℃ 60 min。 3130xl基因分析儀(美國AB公司)進行毛細管電泳,用Gene-Mapper?ID v3.2軟件(美國Thermo Fisher Scientific公司)進行基因分型。檢測使用標準物質9947(女性)的基因組DNA作為擴增陽性對照,超純水作為陰性對照進行質量控制。
運用Modified-Powerstats軟件[4]獲得各STR基因座的等位基因頻率及群體遺傳學參數(shù),如觀察雜合度(observed heterozygosity,Ho)、期望雜合度(expected heterozygosity,He)、個體識別率(discrimination power,DP)、多態(tài)信息含量(polymorphic information content,PIC)。 采用 Cervus 3.0(http://www.fieldgenetics.com/pages/Home.jsp)計算累積個體識別率(total probability of discrimination power,TDP)、三聯(lián)體非父排除率(probability of exclusion in trio cases,PEtrio)和二聯(lián)體非父排除率(probability of exclusion in duo cases,PEduo)。 采用 Arlequin v3.5 軟件(http://cmpg.unibe.ch/software/arlequin3.5)進行各基因座Hardy-Weinberg平衡及連鎖不平衡檢驗。Bonferroni法[5]進行修正。檢驗水準α=0.05。
通過文獻檢索獲得12個漢族地區(qū)[甘肅(272份)[6]、黑龍江大慶(221 份)[7]、貴州(1 104 份)[8]、廣東(1500 份)[9]、河北石家莊(323 份)[10]、四川(226 份)[11]、浙江(5000 份)[12]、江蘇(3097 份)[13]、重慶(180 份)[14]、山西(1 233 份)[15]、湖南(1 218 份)[16]、吉林長春(1775 份)[17]]和 7 個少數(shù)民族地區(qū)[廣西瑤族(70 份)[18]、廣西苗族(68 份)[18]、廣西壯族(223 份)[19]、云南傣族(100 份)[20]、廣西侗族(70 份)[20]、新疆維吾爾族(1 381 份)[21]、新疆哈薩克族(81 份)[21]]人群的 18 個STR基因座等位基因頻率作為群體遺傳關系比較的數(shù)據。應用DISPAN軟件(http://www.personal.psu.edu/nxm2/software.htm)計算Nei的DA遺傳距離,Mega 7.0軟件(http://www.megasoftware.net/)構建20個群體鄰接法(neighbor-joining,NJ)系統(tǒng)發(fā)育樹。
在2 004份湖南長沙漢族無關個體的血樣中,Goldeneye?DNA身份鑒定系統(tǒng)BASIC中的18個STR基因座都得到了有效擴增,且各基因座間擴增產物平衡,擴增產物片段長度在85~428bp,純合子只顯現(xiàn)1個等位基因峰,雜合子則有2個等位基因峰且峰高比例>70%。有效擴增的18個STR基因座的等位基因及其頻率見表1。
采用 Bonferroni法修正,將 P值設為 0.002 8(0.05/18),18個STR基因座的基因型頻率分布在長沙漢族人群中均達到 Hardy-Weinberg平衡(P>0.0028)。18個STR基因座兩兩之間共進行153次連鎖不平衡檢驗,其中有5次比較的結果P<0.05,為 0.000 4~0.041 8,且位于不同的染色體上,采用Bonferroni法修正,將P值設為0.000 327(0.05/153),各位點間均不存在連鎖不平衡現(xiàn)象(P>0.000 327)。群體遺傳學參數(shù)(表2)表明,18個STR基因座的基因型頻率分布在長沙漢族群體中達到Hardy-Weinberg遺傳平衡。長沙漢族各基因座 DP為0.783 6~0.987 9,PIC為 0.5494~0.9145。 18 個 STR 基因座 TDP、CPEtrio和CPEduo分別為 0.999 999 999 999 999 999 999 865 2、0.999999979和 0.999988325。
根據本文獲得的長沙漢族人群18個STR基因座基因頻率數(shù)據,應用DISPAN軟件計算與國內目前公開發(fā)表的19個人群Nei的DA遺傳距離,并得到各群體間遺傳距離矩陣,見表3,應用鄰接法所構建的NJ系統(tǒng)發(fā)育樹見圖1。
表1 長沙漢族18個STR基因座等位基因及等位基因頻率 (n=2004)
續(xù)表1
表2 長沙漢族18個STR基因座的Hardy-Weinberg平衡檢驗及群體遺傳學參數(shù) (n=2004)
圖1 20個人群NJ系統(tǒng)發(fā)育樹
從表3和圖1可以看出,在12個漢族比較人群中,湖南長沙漢族與湖南漢族的遺傳距離最近(0.0141),其次是與浙江漢族(0.0148)、廣東漢族(0.0158)的距離較近,與黑龍江大慶漢族的遺傳距離最遠(0.0345)。在7個少數(shù)民族人群中,湖南長沙漢族與廣西壯族的遺傳距離相對較近(0.0265),與新疆哈薩克族的遺傳距離相對最遠(0.0418)。
STR基因座的遺傳多態(tài)性為人類遺傳學、群體遺傳學研究提供了可靠依據。目前,已經有學者對我國不同民族或漢族亞群進行了不同程度的研究,但研究對象多為單一民族,且選擇的遺傳標記數(shù)量少、不統(tǒng)一[22-25]。本研究選擇收集包括本實驗室及其他研究者所調查的Goldeneye?DNA身份鑒定系統(tǒng)BASIC中的18個STR基因座的等位基因頻率,探討長沙漢族人群的遺傳多態(tài)性及其與19個群體之間的遺傳關系,保證所分析數(shù)據量豐富、遺傳標記選擇及分析方法科學合理。
表3 20 個群體Nei 的DA遺傳距離矩陣
本研究表明,該18個STR基因座在長沙漢族人群中具有高度的遺傳多態(tài)性,可以滿足該地區(qū)法醫(yī)學中的親子鑒定和個體識別問題。
遺傳距離是評價群體間或物種間遺傳差異或遺傳分化的重要參數(shù),根據所計算的遺傳距離繪制NJ系統(tǒng)發(fā)育樹,漢族基本上聚為南北兩大類,與許麗娜等[3,26]的研究報道一致。長沙漢族大致位于南北漢族的中間位置,來自南方的漢族人群(浙江漢族、四川漢族、廣東漢族、湖南漢族、重慶漢族、貴州漢族)彼此分散聚在同一支;北方漢族人群(江蘇漢族、山西漢族、吉林長春漢族、河北石家莊漢族、甘肅漢族、黑龍江大慶漢族)彼此聚在一起,基本上與史料記載[27]相吻合。標本來源和標本均一性會對人群的聚類造成一定影響,江蘇漢族主要是針對蘇北地區(qū)人群的調查[13],這也就解釋了江蘇漢族與北方人群聚類的原因。
在7個少數(shù)民族人群中,長沙漢族與廣西壯族的遺傳距離相對較近。廣西壯族與相鄰的漢族和少數(shù)民族關系較近的原因可能在于壯族是我國南方最大的少數(shù)民族,人口多,分布廣,與漢族及其他少數(shù)民族的基因交流要多于廣西其他少數(shù)民族。本研究結果顯示,廣西壯族和云南傣族十分靠近,聚為一支。廣西苗族、瑤族、侗族相聚在一起,說明他們遺傳結構十分相似。新疆哈薩克族、新疆維吾爾族彼此間比較相近,與漢族和其他少數(shù)民族遺傳關系最遠,可能與這兩個民族信仰伊斯蘭教,與漢族文化交融較少,甚少與其他民族通婚,因此積累著自己的祖系基因,與其他民族存在較大的遺傳差異所致??傮w來看,根據Goldeneye?DNA身份鑒定系統(tǒng)BASIC中的18個STR基因座計算的遺傳距離與各民族群體的形成歷史較一致,說明常染色體STR遺傳標記在民族間遺傳距離和基因漂流的評價中起到一定作用,但要確定某一群體與其他群體的關系,還有待于對Y染色體DNA、線粒體DNA等其他遺傳標記以及考古學、人類學等的分析研究。
綜上,本研究獲得了長沙漢族人群18個STR基因座的等位基因頻率及基因型分布數(shù)據,為建立長沙地區(qū)漢族人群STR數(shù)據庫、群體遺傳關系的分析及法醫(yī)學應用提供了良好的遺傳背景數(shù)據。