蘇永東,萬洪靜,陳沖,霍立文
1.重慶市合川區(qū)公安局刑警支隊,重慶 401520;
2.麗江市公安司法鑒定中心,云南 麗江 674100
人類遺傳多樣性是人類自50 萬年前起源于非洲后,在不同的自然環(huán)境、疾病困難及生活方式改變的影響下不斷富集的遺傳信息的總和[1]。隨著人類基因組計劃、千人基因組計劃等全基因組測序計劃的完成[2],遺傳學家對不同的遺傳標記的遺傳多樣性有了更清楚的認識,常見的遺傳標記包括傳統(tǒng)的限制性片段長度多態(tài)性、短串聯(lián)重復序列、單核苷酸多態(tài)性、插入缺失遺傳多樣性及迷你單倍型、微單倍型[3-4]。法醫(yī)學短串聯(lián)重復(short tandem repeats,STR)序列是一種以2~6 bp 為基本序列的具有高度多態(tài)性的遺傳標記,廣泛地存在于基因組的非編碼區(qū)域。作為目前法醫(yī)學個體識別及親緣關系鑒定的金標準[5],STR 檢測具有技術成熟、檢測自動快捷標準化、各種比對數(shù)據(jù)庫建立趨于完善等優(yōu)點。
云南省是我國西南地區(qū)少數(shù)民族聚集比較密集的省份,近年來法醫(yī)學相關的STR遺傳標記在少數(shù)民族群體中的遺傳多樣性及其法醫(yī)學特征先后被報道(云貴地區(qū)漢族[6]、云南白族[7]、云南壯族[8]、云南傣族[8]、云南哈尼族[8]、云南苗族[9]、云南彝族[10]),但相關研究在云南漢族群體較為缺乏。本研究擬采用AGCU EX22STR熒光檢測試劑盒(無錫中德美聯(lián)生物技術有限公司)對云南地區(qū)大樣本漢族群體的常用STR遺傳多樣性及群體遺傳價值進行研究。
1.1 樣本收集 1 418 名個體的血痕收集于云南昆明、麗江等地區(qū)的隨機個體,其中男性個體1 077名,女性個體341名。所有參與者都需是本地土著居民且在樣本采集之前都簽訂了樣本采集知情同意書。本實驗通過了重慶市合川區(qū)公安局物證鑒定所與云南省麗江市公安局司法鑒定中心相關的倫理審批。
1.2 DNA 提取、擴增及電泳 納入研究樣本利用ΒSD600DUET 自動打孔機(澳大利亞ΒSD Robotics公司),打孔技術采取1.2 mm 大小的樣本。采用直接擴增技術檢測。利用AGCU EX22 熒光檢測試劑盒(無錫中德美聯(lián)生物技術有限公司)擴增21個常染色體STR 基因座及性別基因座Amelogenin。DNA 擴增產(chǎn)物用3130xl 基因分析儀(美國AΒ 公司)進行分型。等位基因命名采用Genemapper?ID軟件(美國AΒ 公司)分析。每批次實驗(擴增、電泳)都采用水作為陰性對照,9947A作為陽性對照。
1.3 統(tǒng)計學方法 采用Power States V 1.2 軟件包(美國Promega公司)計算21個常染色體STR基因座等位基因頻率及相關的群體遺傳學參數(shù),包括觀察值雜合度(observed heterozygosity,Ho)、個體識別率(power of discrimination,PD)、多態(tài)信息含量(polymorphism information content,PIC)和非父排除率(probability of exclusion,PE)。利用Arlequin 3.5 軟件[11]計算期望雜合度(expected heterozygosity,He)、Hardy-Weinberg平衡檢驗及連鎖分析。本研究納入地理位置相近的早期研究—21 個群體[12-22]的遺傳多樣性信息,基于不同檢測體系的19 個重疊基因座(D2S1338,D3S1358,D5S818,D6S1043,D7S820,D8S1179,D12S391,D13S317,D16S539,D18S51,D19S433,D21S11,CSF1PO,F(xiàn)GA,TH01,TPOX,vWA,Penta D和Penta E)的遺傳變異信息探索云南漢族群體和相關納入的參考群體的遺傳關系。納入群體包括兩個四川漢族[8,17]、重慶漢族[22]、湖南漢族[6]、湖北漢族[19]、江西漢族[6]、廣西漢族[6]、廣東漢族[18]、閩南漢族[20]、閩西漢族[6]、廈門漢族[7]、云貴地區(qū)漢族[12]、新疆維吾爾族[9]、云南白族[13]、云南越南群體[21]、云南苗族[14]、云南彝族[15]、云南壯族[16]、云南傣族[16]、云南哈尼族[16]、伊犁錫伯族[10]。利用Phylip3.695軟件計算群體間的Nei遺傳距離。使用SPSS21.0 軟件[23]進行多維尺度分析、MVSP 軟件進行主成分分析、Mega7.0 軟件[24]基于鄰近連接法(Neighboring-Joining)進行系統(tǒng)發(fā)生分析。
2.1 基因頻率分布 納入研究的1 418名無關個體在21 個常染色體STR 基因座上共檢測到277 個等位基因,其頻率分布為0.000 4 (D16S539)到0.528 6(vWA)。TPOX擁有最少等位基因個數(shù)7個,Penta E擁有最多等位基因個數(shù)28個,見表1。
表1 云南地區(qū)漢族人群21 個STR 基因座等位基因頻率分布情況(n=1 418)Table 1 Frequency distribution of alleles of 21 STR loci in the Han population in Yunnan(n=1 418)
2.2 群體遺傳學統(tǒng)計 經(jīng)多重檢驗Βonferroni矯正,所有檢測的21 個位點都符合Hardy-Weinberg 平衡。對21個基因座進行連鎖不平衡檢驗,未發(fā)現(xiàn)連鎖不平衡現(xiàn)象。如表2 所示,云南漢族群體中,He 為0.617 0~0.915 1,Ho為0.607 9~0.914 0,PIC為0.555 6~0.908 6,PD 為0.793 9~0.986 1,PE 為0.300 5~0.824 0,研究基因座在云南漢族群體中的累積匹配概率為7.335 4×10-26,累積非父排除率為0.999 999 993,累積個體識別能力為0.999 999 999 999 999 999 999 93。
表2 云南地區(qū)漢族群體21個常染色體STR遺傳標記法醫(yī)學相關參數(shù)Table 2 Forensic parameters related to 21 autosomal STR genetic markers in Han population in Yunnan
2.3 Nei 遺傳距離及多維尺度分析 東亞地區(qū)群體起源、進化、遷移及混雜歷史復雜,中國目前擁有56 個官方認可的少數(shù)民族。本研究基于不同試劑盒之間重疊的19個STR基因座的遺傳多樣性信息,探索了云南漢族群體和21個周邊相關群體的遺傳關系。圖1 顯示,云南漢族與四川漢族(0.001 0 和0.004 9)、云南白族(0.004 7)、云貴地區(qū)漢族群體(0.001 9)有較小的Nei遺傳距離,但同云南苗族有較大的Nei遺傳距離(0.080 9)。圖2顯示,云南漢族群體和其他納入群體比較的漢族群體緊密聚集在一起位于正中央,新疆維吾爾族群體和伊利錫伯族群體位于左上角,越南苗族和云南越南群體位于右上角,云南的其他少數(shù)民族位于正下方。
圖1 云南漢族群體與21個周邊相關群體之間的Nei遺傳距離熱圖Figure 1 Heat map of Nei genetic distance between Yunnan Han population and 21 neighboring related populations
圖2 云南漢族群體與21個參考群體多維尺度分析Figure 2 Multidimensional scale analysis of Han population and 21 reference groups in Yunnan
2.4 主成分分析及系統(tǒng)發(fā)生重建 本研究提取了第一成分(50.153%)和第二成分(16.249%)探索云南漢族和其他21 個群體的遺傳結構相似性(圖3)。如主成分分析結果顯示,第一成分明顯地將云南苗族和云南居住的越南群體與其他20 個群體區(qū)分開。第二成分可以清楚地將新疆的維吾爾族群體和錫伯族群體與其他群體區(qū)分開,同時也能將云南傣族及壯族群體與其他群體區(qū)分開。云南漢族與鄰近漢族群體(如重慶漢族、四川漢族、云貴漢族)緊密聚集在一起。從圖4可知,云南苗族和云南越南群體聚成一支,其他20 個群體聚集在另一支。本研究群體首先同廈門漢族群體聚在一起,隨后相繼同四川漢族和云貴漢族群體聚集在一起。整體群體分布規(guī)律同上述多維尺度分析、主成分分析結果一致。
圖3 云南漢族群體與21個參考群體主成分分析Figure 3 Principal component analysis of Yunnan Han population and 21 reference populations
圖4 云南漢族群體與21個參考群體系統(tǒng)發(fā)生重建Figure 4 Systematic reconstruction of the Yunan Han population and 21 reference groups
東亞地區(qū)人群起源遷移復雜,近年來一直是考古學、語言學、人類學及法醫(yī)學探索的熱點地區(qū)[25-29],這里有適應高原的藏族群體,也有人口數(shù)量超過13億的全球最大群體—漢族群體。本研究利用AGCU EX22試劑盒在1 418名云南地區(qū)無關漢族個體中共檢測出21個STR 基因座、277 個等位基因。21 個基因座均具有較高的雜合性和足夠的PD和PE。該復合擴增體系可應用于云南漢族人群進行個體識別和三聯(lián)體親子鑒定。
在云南漢族群體的21 個STR 基因座頻率分布同21個地理位置相近的群體比較中,Nei遺傳距離分布、多維尺度分析、主成分分析及系統(tǒng)發(fā)生重建揭露出云南漢族群體與周圍四川漢族、云貴地區(qū)漢族群體擁有較近的遺傳關系,與本地少數(shù)民族中的彝族亦擁有較近的遺傳關系,如同云南白族(0.004 7)。本研究基于常染色體遺傳標記基因多樣性揭示了中國不同地區(qū)的漢族群體和少數(shù)名族群體的遺傳關系與其他基于性染色體遺傳標記多態(tài)性研究的群體遺傳關系一致[30-33]。整體上中國不同地區(qū)的漢族群體具有極強的基因相似性,漢族群體同多數(shù)少數(shù)民族還存在極大的遺傳結構差異,如苗族和維吾爾族群體,需要注重相關群體的群體數(shù)據(jù)庫的建立。
本研究觀察了云南漢族群體21 個常染色體STR遺傳標記的遺傳多樣性及群體遺傳關系,為建立云南地區(qū)漢族群體基礎數(shù)據(jù)提供依據(jù)。法醫(yī)學特征分析結構顯示,21個STR基因座在云南地區(qū)表現(xiàn)出很高的多態(tài)信息含量和遺傳多樣性,研究位點適合該地區(qū)漢族群體的個體識別及親緣關系鑒定的法醫(yī)學實踐需求。Nei遺傳距離、多維尺度分析、主成分分析及系統(tǒng)發(fā)生重建的結果顯示,云南漢族群體與四川漢族、云貴地區(qū)漢族群體有著較近的遺傳關系,同新疆維吾爾族群體有著相對較遠的遺傳關系。