丁光樹,孫 輝,孫 敬,袁麗萍,莫曉婷,宋 文,尚 蕾,李萬水
(公安部鑒定中心,北京 100038)
Y-STR遺傳標記已廣泛應用于男性家系排查[1],對多起大案要案的偵破發(fā)揮了重要作用。由于突變的存在,利用Y-STR進行家系排查,通常需要遵循一定的評判標準[2]。有研究人員提出,對于兩個Yfiler Plus單倍型,差異基因座不超過4個或總突變步數(shù)不超過5時,不應排除來源于同一家系的可能性[3]。另有研究指出,當檢驗的Y-STR基因座數(shù)量增加至30個以上且包含較多的高突變率Y-STR基因座(RM Y-STR)時,同一家系男性個體間Y-STR的分型容差可達6個/步[4]甚至7個/步[5]。當然,這其中主要考慮的是單拷貝Y-STR基因座,其容差的產生往往來源于DNA復制滑動引起的等位基因突變。而對于核心重復序列結構復雜、分布于染色體上多個位置的多拷貝Y-STR基因座[6]而言,情況可能截然不同。現(xiàn)有一起案件,其檢材的多個多拷貝Y-STR基因座疑似存在拷貝丟失的情況,很可能源于Y染色體的片段缺失。為分析驗證,本文設計系列實驗,探討了利用內參基因拷貝數(shù)變化輔助判斷多拷貝Y-STR基因座拷貝數(shù)的方法,提出了多拷貝Y-STR在家系排查中的初步評判方案,以期為后續(xù)有關案件的偵查提供思路。
1998年,某省某市一女性被殺。2021年,辦案機關將待排查血樣送至公安部物證鑒定中心進行Y-STR檢驗。經利用自制DNATyperTMY36、MCY、RMY等Y-STR試劑盒檢驗,僅從分型上看,獲得了與現(xiàn)場物證容差在3以內的樣本69份(含0容差樣本5份)。
在向當?shù)毓矙C關反饋家系樣本排查結果時,需要計算排查樣本與現(xiàn)場DNA分型之間存在的容差。從電泳圖譜(圖1)看,大量排查樣本與現(xiàn)場DNA在DYF399S1基因座上存在分型差異,且該基因座僅出現(xiàn)了1個“等位”基因(“等位”用以區(qū)別于常染色體上的真正等位基因,下同)(表1)。DYF399S1基因座為三拷貝基因座[7],那么,一個“等位”基因的出現(xiàn)可能是由于該基因座三個拷貝“等位”基因分型一致,也可能是出現(xiàn)了拷貝丟失。但是僅根據分型圖譜,很難判定拷貝是否丟失及其丟失的數(shù)量,因此會影響到對于現(xiàn)場物證與排查樣本是否來自于同一家系的判斷。
進一步分析Y-STR毛細管電泳檢驗圖譜發(fā)現(xiàn),排查樣本在其他多拷貝基因座的分型似乎也存在異常(圖1)。初步比較同一基因座中不同“等位”基因的檢測峰面積發(fā)現(xiàn),大量樣本在DYS464、DYF371基因座(均為四拷貝基因座)[8-9]中分別檢測到了疑似3個拷貝(表1)。
結合多拷貝基因座DYF399S1、DYS464、DYF371 在Y染色體上的位置推測:這些樣本可能在Y染色體上存在片段缺失,在DYF399S1基因座可能只存在1~2個拷貝。
圖1 部分家系排查樣本(A、B、C)在DYF399S1、DYS464、DYF371基因座的分型圖譜Fig. 1 Profiling genotypes of three Y-STR loci (DYF399S1, DYS464, DYF371) from certain samples (A, B, C) of case
表1 部分排查樣本在多拷貝Y-STR基因座(DYF399S1、DYS464、DYF371)的分型情況Table 1 Profiled genotypes of multicopy Y-STR loci (DYF399S1, DYS464, DYF371) from certain samples of case
為進一步驗證上述案件排查樣本中3個多拷貝Y-STR基因座的“等位”基因缺失情況,研究3個多拷貝Y-STR基因座缺失規(guī)律,在回溯近期幾起案件排查樣本的電泳圖譜后,綜合選取了疑似分型異常(圖2)的樣本40份用于后續(xù)研究。
用MCY試劑盒重復檢驗后,將這些樣本根據峰型特征初步分為4類,其中,第1類樣本10份,第2類樣本20份,第3類樣本9份,這3類樣本均各來自于同一地區(qū),第4類樣本僅1份。4類樣本在3個多拷貝Y-STR基因座的拷貝數(shù)根據分型圖譜中各“等位”基因峰面積比進行初步推測(表2),以男性基因組標準品(9948)作為正常分型 參照。
圖2 4類多拷貝Y-STR基因座分型異常樣本的典型電泳圖譜Fig. 2 Typical electropherograms of 3 multicopy Y-STR loci from 4 kinds of abnomal profiling samples
表2 4類多拷貝Y-STR基因座分型異常樣本的推測拷貝數(shù)Table 2 Speculated copies of 3 multicopy Y-STR loci from 4 kinds of abnomal profiling samples
2.2.1 內參基因的選擇
根據文獻調研,選取可用于分別表征DYF399S1、 DYS464和DYF371基因座拷貝數(shù)變化的3個內參基因:BPY2[10]、DAZ[11]和CDY1[12],通過對此3個內參基因拷貝數(shù)的檢測推斷相應多拷貝Y-STR基因座的拷貝數(shù)。
內參基因選取原則如下:1)其拷貝數(shù)與所表征的多拷貝Y-STR基因座拷貝數(shù)相同,且相應拷貝在Y染色體上位置很近(40 kb以內)(圖3),發(fā)生缺失或重復時,二者拷貝數(shù)也應同步變化。2)其在基因組中有相應的同源基因且同源基因拷貝數(shù)確定并基本不變。BPY2DP[10]、DAZL[11]和CDY2[12]分別為BPY2、DAZ和CDY1的同源基因(表3)。
設計三對引物,分別擴增三個內參基因及其同源基因:BPY2(BPY2DP)、DAZ(DAZL)、CDY1(CDY2),利用擴增片段長度差異和毛細管電泳區(qū)分內參基因和同源基因,通過內參基因與其同源基因檢測峰面積比(檢測值)判斷內參基因的拷貝數(shù),進而推斷DYF399S1、DYS464和DYF371基因座的拷貝數(shù)(表3)。
在未發(fā)生Y染色體片段缺失(或重復)的樣本中(比如9948基因組標準品),理論上3個內參基因與其同源基因經擴增、檢測后,預期峰面積比應分別為3∶1、4∶2、2∶2(表3)。同理,對于四類分型異常樣本,內參基因與其同源基因的預期峰面積比(預期值)可以根據表2中的多拷貝Y-STR推測拷貝數(shù)演算。
BPY2(BPY2DP)基因的引物根據UCSC網站(http://genome.ucsc.edu/)參考序列設計,而DAZ(DAZL)和CDY1(CDY2)基因的引物序列則參考文獻[13],上游引物均用6-FAM染料進行標記。
2.2.2 實驗過程
研究選用10 μL擴增體系,其中2×Master Mix 5 μL,上下游引物4 μL,模板:男性基因組標準品(9948)0.2 ng、四類分型異常樣本血卡(0.5 mm直徑) 1片。PCR擴增程序如下:94 ℃、5 min;94 ℃、40 s,56 ℃、30 s,72 ℃、40 s,28個循環(huán);60 ℃、20 min。擴增產物以ABI 3500XL型遺傳分析儀經毛細管電泳檢測和GeneMapper ID-X v.1.5軟件數(shù)據分析,統(tǒng)計計算各樣本關于BPY2(BPY2DP)、DAZ(DAZL)、CDY1(CDY2)基因的檢測峰面積比。
圖3 部分多拷貝Y-STR基因座及本文所用3個內參基因的染色體位置分布示意圖[12]Fig. 3 Schematic for Y chromosomal locations of certain multicopy Y-STR loci and 3 reference genes [12] for this research
表3 9948中3個內參基因與其同源基因預期峰面積比Table 3 Expected ratios of peak area from each of 3 reference genes to that of their respective homologous gene from 9948
通過上述實驗,獲得9948及4類分型異常樣本在BPY2(BPY2DP)、DAZ(DAZL)和CDY1(CDY2) 基因的檢測峰面積比值(檢測值),部分結果見表4。總體而言,檢測值與預期值基本相符。因此,研究選取的BPY2、DAZ和CDY1基因,基本上可用于分別表征DYF399S1、DYS464和DYF371基因座的拷貝數(shù)變化。這或可作為將來案件排查樣本有關多拷貝基因座準確判型的一種簡便 方法。
第2類20份樣本選取自本文1.1中所述的69份案件排查樣本,均來自于同一家系。對于個別樣本在DYS464基因座表現(xiàn)出的1個“等位”基因(表2),根據DAZ(DAZL)的檢測結果(表4),可以判定此類樣本在DYS464基因座僅缺失了1個拷貝,也就是說電泳圖譜表現(xiàn)出的單峰實際上代表3個拷貝,這也驗證了我們之前的推測拷貝數(shù)(表2)。根據BPY2(BPY2DP)的檢測結果,可以判定第2類樣本均在DYF399S1基因座缺失了2個拷貝,電泳圖譜(圖1)中的1個峰實際上就代表DYF399S1的1個拷貝。至此,可以確定現(xiàn)場物證與排查樣本在DYF399S1基因座的拷貝數(shù)是一致的,嫌疑人很可能來自于0容差樣本所在家系。
本研究也發(fā)現(xiàn)3份樣本(1-3號、2-2號、4-1號)在部分內參基因的檢測值與預期值之間存在差異(表4)。如4-1號(第4類異常分型的1號)樣本在DAZ(DAZL)基因的峰面積比檢測值約為6∶2,也就是說DAZ基因可能是增加了2個拷貝,相應地,DAZ表征的DYS464應該也增加了2個拷貝。因此,有理由推測4-1號樣本在DYS464分型圖譜(圖2)中表現(xiàn)出的二“等位”基因型,實際上分別代表4個拷貝(AAAA)和2個拷貝(BB),而不是表2中推測的3個拷貝(AAB)。其他2份樣本的檢測結果異??赡芘c其特殊的缺失類型或者內參基因引物結合區(qū)變異有關,具體原因有待進一步探究。
多拷貝Y-STR基因座的各“等位”基因命名方法主要有兩種:1)僅根據觀察到的“等位”基因片段大小直接命名的C型命名法(conservative approach)。2)結合觀察到的“等位”基因片段大小及其峰高比例進行命名的E型命名法(expanded typing method)。
對于三拷貝及以上的基因座而言,兩種命名方法的結果存在較大差異,E型命名法獲得的單倍型數(shù)目往往更多,但是僅根據峰型高低判斷也更易產生分型誤差[6]。
表4 9948和部分多拷貝Y-STR基因座分型異常樣本的內參基因檢測結果Table 4 Results of reference genes from both 9948 and 4 kinds of abnomal profiling samples bearing multicopy Y-STR loci
隨著多拷貝Y-STR 基因座在案件排查中的應用越來越廣,異常分型將會更多地出現(xiàn),這對于分型結果的判定和解釋會帶來更多的困難。張文瓊等[14]對DYF387S1、DYF399S1、DYF403S1、DYF404S1四個多拷貝基因座在湖北漢族252名無關男性個體中的異常分型進行了研究,觀測到的異常分型發(fā)生率高達7.94%,遠高于傳統(tǒng)試劑盒中Y-STR多“等位”基因的發(fā)生率。
Y染色體的男性特異區(qū)域(male-specific region of the human Y chromosome, MSY)主要由八大回文序列構成[12]。分析多拷貝Y-STR基因座的Y染色體位置(圖3),發(fā)現(xiàn)這些基因座大多分布于AZF(azoospermia factor,無精癥因子)區(qū)域中的AZFb和AZFc亞區(qū),這兩個區(qū)域主要由五大回文序列和一些反向重復序列構成。AZFc區(qū)域缺失或重復事件的出現(xiàn),往往為非等位同源重組(non-allelic homologous recombination,NAHR)所致。在精子生成的過程中,AZFc區(qū)域中位置不同但序列相似的片段(block)之間可能發(fā)生重排,導致產生各類染色體結構變化如缺失、重復、易位、倒位等[15],這也是多拷貝Y-STR 基因座異常分型出現(xiàn)頻率較高的潛在原因。
對于多拷貝Y-STR基因座判型標準,現(xiàn)提出以下建議,供大家參考。
1)對于DYF387S1、DYS527等兩拷貝基因座,建議都采用E 型命名法,根據同一基因座內各“等位”基因的峰型和峰高、結合不同基因座間峰高比(或峰面積比)進行判型。
2)對 于DYF399S1、DYS464和DYF371等 三拷貝及以上的基因座,僅根據峰型高低判型,難度較大且有可能錯誤判型。根據峰高、峰型初步判斷其拷貝數(shù)可能存在異常時,建議采用其他方法(如qPCR、NGS等)對拷貝數(shù)進行驗證,從而準確判型。比如本文通過對分型異常樣本中3個內參基因拷貝數(shù)的檢測,輔助推斷DYF399S1、DYS464、DYF371這3個多拷貝Y-STR的拷貝數(shù)。
3)基于以上兩點,建議對發(fā)生缺失(或重復)的Y染色體區(qū)段進行分析,結合各多拷貝Y-STR在Y染色體上的位置分布,綜合判定各個多拷貝Y-STR的拷貝數(shù)與分型。比如位于AZFc區(qū)域(圖3)的DYS527、DYF387S1、DYF383S1、DYF404S1、DYS459這5個兩拷貝基因座的拷貝數(shù)一般會同步增減。
Zhang等[16]對AZFc區(qū)域常見的gr/gr缺失在東亞人群的發(fā)生頻率進行研究發(fā)現(xiàn),東亞人群中gr/gr 缺失的頻率(約8%)遠高于歐美人群,并且這種AZFc區(qū)域的部分缺失通常并不影響東亞男性的生精能力。Zhang等[16]還發(fā)現(xiàn),在研究選取的我國八個不同民族群體內部,gr/gr缺失頻率也存在顯著差異,湖南土家族和甘肅漢族群體缺失頻率最高(15.3%),而在廣西瑤族群體中沒有發(fā)現(xiàn)缺失。盡管AZFc區(qū)域部分缺失可能并不影響生育能力,但是會導致多拷貝Y-STR基因座出現(xiàn)異常分型,并且能遺傳給下一代。因此,在我國不同地區(qū)與不同民族間,多拷貝Y-STR基因座出現(xiàn)異常分型的頻率和類型很可能也存在較大差異。
本研究所涉多起案件排查樣本中發(fā)現(xiàn)多拷貝Y-STR基因座存在拷貝數(shù)缺失,這提示對于男性家系排查的標準應重新審視。已報道的家系排查參考標準大多針對單拷貝Y-STR基因座,其對“等位”基因突變的考慮相對簡單?,F(xiàn)在,大量的家系排查實踐加入了對多拷貝Y-STR基因座的檢驗,由于Y染色體AZFc區(qū)域部分缺失(或重復)導致的多拷貝Y-STR基因座異常分型出現(xiàn)概率增大,對異常分型的準確解釋及利用應引起足夠的重視,在進行家系排查時,多拷貝Y-STR的異常分型或許可以作為一種重要的家系、民族、地域特征。
在此,我們初步提出家系排查中涉及多拷貝Y-STR基因座的判定方案:
1)現(xiàn)場檢材與排查樣本僅在某一個多拷貝Y-STR基因座分型存在差異時,建議采用不同試劑盒進行驗證,排除引物結合區(qū)堿基突變造成拷貝數(shù)減少的可能。由于2個以上Y-STR基因座引物結合區(qū)同時發(fā)生突變的概率很低,因此建議結合其他Y-STR進一步判定是否存在缺失。
2)現(xiàn)場檢材與排查樣本在多個多拷貝Y-STR基因座的分型均無缺失(或重復),從零容差樣本所在家系開始,按容差數(shù)依次展開排查。
3)現(xiàn)場檢材在多個多拷貝Y-STR基因座分型均無缺失(或重復),而家系排查樣本在多個多拷貝基因座中存在分型缺失(或重復),則排除該家系的可能性較大;反之亦然。
4)現(xiàn)場檢材與排查樣本的多個多拷貝Y-STR基因座分型均存在缺失(或重復),且缺失(或重復)類型基本一致,那么來源于同一家系的可能性較大。
5)對于2、3、4中提到的多個多拷貝Y-STR基因座的具體個數(shù),應綜合分析檢驗的多拷貝Y-STR基因座數(shù)量和出現(xiàn)缺失(或重復)的多拷貝Y-STR在染色體上的位置分布與連鎖情況,視情況而定。
上述判定依據將在今后的實際案件中做進一步驗證,并嘗試通過STS、SNV等標記對不同地區(qū)、不同民族人群的多拷貝Y-STR的缺失/重復模式進行更為精細的研究,以期能為相關案件的排查提供更具指向性的線索。