(南京醫(yī)科大學第一附屬醫(yī)院 江蘇省人民醫(yī)院司法鑒定所,江蘇 南京 210029)
短串聯(lián)重復(short tandem repeat,STR)序列一般由長度為2~6bp的核心序列串聯(lián)重復而成,廣泛應用于法醫(yī)學個體識別和親緣關系鑒定[1-2]。本研究采用Goldeneye?DNA身份鑒定系統(tǒng)20A對江蘇漢族九千余份樣本展開STR基因座群體遺傳學調查,旨在總結江蘇地區(qū)漢族人群19個常用STR基因座的群體遺傳學參數(shù)等基礎數(shù)據(jù)。
9025份樣本來源于本鑒定所2010—2018年進行親緣關系鑒定的無關個體,其中男性樣本5661份,女性樣本3364份。采用本機構自主研發(fā)的親權鑒定信息管理系統(tǒng)和司法鑒定科學研究院研發(fā)的親權鑒定信息管理系統(tǒng),以公民身份證前4位(省市代碼)進行嚴格篩選,確保所有樣本均來自江蘇省各地級市范圍。血樣提供者均簽署知情同意書。
采用Chelex-100法提取模板DNA,或對1 mm×1mm血斑免提取進行直接擴增。
擴增體系、擴增條件及分型方法按Goldeneye?DNA身份鑒定系統(tǒng)20A[基點認知技術(北京)有限公司]操作說明書進行。采用10 μL反應體系進行擴增,擴增產(chǎn)物在3130基因分析儀(美國AB公司)上進行電泳。采用GeneScan 3.2軟件進行分型結果分析。
聯(lián)合應用PowerStats v12軟件和SPSS 19.0軟件對19個常染色體STR基因座進行Hardy-Weinberg平衡檢驗以及基因頻率分析,計算雜合度(heterozygosity,H)、匹配概率(probability of match,Pm)、個體識別率(discrimination power,DP)、非父排除率(probability of paternity exclusion,PE)、多態(tài)信息含量(polymorphic information content,PIC)等群體遺傳學參數(shù)。應用Arlequin v3.5.2.2軟件對江蘇漢族人群19個常染色體STR基因座進行連鎖不平衡分析,并對其與其他17個不同地區(qū)人群(13個國內人群、4個國外人群)[3-16]兩兩之間的遺傳分化系數(shù)(Fst)和P值進行計算。采用MEGA 7軟件進行鄰接法進化樹繪制。
江蘇漢族人群19個常染色體STR基因座的分布均符合Hardy-Weinberg平衡(P>0.05),等位基因頻率和群體遺傳學參數(shù)見表1~2。其中,H為0.616 1~0.916 3,Pm為0.012 8~0.202 6,DP為0.797 4~0.987 2,PE 為0.310 8~0.828 8,PIC 為 0.561 7~0.913 6。各基因座之間相互獨立,屬于連鎖平衡狀態(tài),CDP為0.9999999999999999984341,CPE為0.999999989。
通過對江蘇漢族人群和其他17個地區(qū)人群兩兩之間的基因頻率差異進行統(tǒng)計學分析,獲得不同地區(qū)之間遺傳距離的Fst值和P值(表3)。其中,江蘇漢族和新疆阿勒泰漢族之間的Fst值(0.07355)差異具有統(tǒng)計學意義(P<0.05)。
續(xù)表1
表2 江蘇漢族人群19個STR基因座的群體遺傳學參數(shù) (n=9025)
進化樹用鄰接法推斷,本次比對數(shù)據(jù)按0.010 0比例繪制。進化樹結果表明:江蘇漢族人群和國內其他漢族人群遺傳距離較近,而與新疆阿勒泰漢族、云南苗族、俄羅斯、波蘭和奧地利人群距離較遠。
圖1 鄰接法分析18個人群間的遺傳進化距離
本研究采用等位基因頻率,H、Pm、DP、PE和PIC等群體遺傳學參數(shù)對江蘇漢族人群19個常染色體STR基因座的遺傳多態(tài)性進行分析。Hardy-Weinberg平衡檢驗P值均大于0.05,說明所收集的群體數(shù)據(jù)基因型分布的觀察值和預期值之間差異無統(tǒng)計學意義,樣本收集有效。H值范圍從0.616 1(TPOX)到0.916 3(Penta E),表明體系內所有基因座的兩個等位基因在隨機抽樣情況下區(qū)分為兩個不同等位基因(雜合子)的可能性較高[17]。Pm值從0.012 8(Penta E)到0.202 6(TPOX),表明隨機抽取個體在進行個體識別時匹配可能性較低[17]。PIC值從0.561 7(TPOX)到0.9136(Penta E),當該值大于0.5時STR標記物可提供高度多態(tài)性信息[18]。DP和PE值反映遺傳標記系統(tǒng)在個體識別和親權鑒定中的能力,通常當DP大于0.9、PE大于0.5能表明基因座具有高度多態(tài)性[19],本研究江蘇漢族人群在19個STR基因座的DP值從0.797 4(TPOX)到0.987 2(Penta E),PE值從0.310 8(TPOX)到0.828 8(Penta E)。各基因座之間相互獨立,屬于連鎖平衡狀態(tài),CDP為0.9999999999999999984341,CPE為0.999 999 989。其中,TPOX(0.310 8)、TH01(0.3424)、D3S1358(0.4567)和CSF1PO(0.4828) 4個基因座PE值小于0.5,說明在江蘇漢族人群中上述4個基因座多態(tài)性欠佳,可通過大樣本分析獲得更符合江蘇人群特征的基因座予以替代。以上統(tǒng)計數(shù)據(jù)表明,本研究選擇的STR基因座在江蘇漢族人群中具有較高的應用可行性。
對18個不同人群間的Fst和P值進行比較,結果表明,江蘇漢族和新疆阿勒泰漢族人群之間的Fst值差異具有統(tǒng)計學意義(P<0.05),和其他人群間的遺傳距離差異無統(tǒng)計學意義。新疆阿勒泰漢族人群與大
部分漢族人群間差異均有統(tǒng)計學意義。江蘇漢族人群與天津漢族、湖南漢族、吉林漢族、福建廈門漢族、四川漢族、澳門(民族不詳)、甘肅漢族、河南漢族、西藏藏族、云南彝族、廣西漢族、越南人群的遺傳距離依次增加,如以江蘇漢族和天津漢族人群的遺傳距離(0.01097)作為參考,江蘇漢族與云南苗族、俄羅斯、波蘭和奧地利等人群有超過2倍以上的遺傳距離,用進化樹可直觀展示上述差異。遺傳距離統(tǒng)計分析提示,人群的基因遺傳差異與實際的物理距離成正相關。
表3 18個人群間的Fst值(對角線以下)和P值(對角線以上)
目前,江蘇地區(qū)各鑒定機構采用不同來源的基因頻率作為累積親權指數(shù)值計算的依據(jù)。由于這些頻率可能會存在樣本量相對較少、地區(qū)代表性低等問題,對區(qū)域性親權鑒定的標準化和規(guī)范化造成影響。通過本次9025例大樣本數(shù)據(jù)的分析總結,可得到較以往更科學、可靠的江蘇地區(qū)19個常染色體STR基因座的群體遺傳學數(shù)據(jù),將會為江蘇地區(qū)法醫(yī)物證專業(yè)的有序化、規(guī)范化發(fā)展提供必要的基礎數(shù)據(jù)支撐。同時,希望通過本研究成果的發(fā)表,面向江蘇省法醫(yī)物證專業(yè)進行基因頻率推廣,達到在江蘇省內統(tǒng)一基因頻率的目標。
(感謝中山大學孫宏鈺教授對本文的悉心指導?。?/p>