葛建業(yè),嚴(yán)江偉,謝群,孫宏鈺,周懷谷,李斌
(1.北德州大學(xué)健康科學(xué)中心,美國(guó)德克薩斯州 76107;2.中國(guó)科學(xué)院北京基因組研究所,北京 100029;3.公安部物證鑒定中心,北京 100038;4.中山大學(xué)中山醫(yī)學(xué)院法醫(yī)學(xué)系,廣東廣州 510080;5.上海市公安局物證鑒定中心上海市現(xiàn)場(chǎng)物證重點(diǎn)實(shí)驗(yàn)室,上海 200083;6.福建省公安廳刑事技術(shù)總隊(duì),福建福州 350003)
·綜述·
中國(guó)Y-STR數(shù)據(jù)庫(kù)建設(shè)相關(guān)問(wèn)題探討
葛建業(yè)1,嚴(yán)江偉2,謝群3,孫宏鈺4,周懷谷5,李斌6
(1.北德州大學(xué)健康科學(xué)中心,美國(guó)德克薩斯州 76107;2.中國(guó)科學(xué)院北京基因組研究所,北京 100029;3.公安部物證鑒定中心,北京 100038;4.中山大學(xué)中山醫(yī)學(xué)院法醫(yī)學(xué)系,廣東廣州 510080;5.上海市公安局物證鑒定中心上海市現(xiàn)場(chǎng)物證重點(diǎn)實(shí)驗(yàn)室,上海 200083;6.福建省公安廳刑事技術(shù)總隊(duì),福建福州 350003)
目的Y染色體是男性所特有的父系遺傳染色體,Y染色體上的STR基因座已經(jīng)大量應(yīng)用于實(shí)際案件。本文總結(jié)了Y-STR的特性以及選擇適合中國(guó)人群的Y-STR基因座所需要考慮的問(wèn)題,展望了Y-STR在家系排查、親緣搜索、來(lái)源人群推斷、混合樣本檢驗(yàn)、親緣關(guān)系鑒定等方面的應(yīng)用前景,并探討了Y-STR試劑盒研發(fā)、驗(yàn)證,Y-STR突變率,搜索軟件等方面的問(wèn)題,提出了相應(yīng)的建議。
法醫(yī)遺傳學(xué);Y染色體;綜述[文獻(xiàn)類(lèi)型];短串聯(lián)重復(fù)序列;DNA數(shù)據(jù)庫(kù)
Y染色體是男性所特有,它只從父親傳遞給兒子,同一父系內(nèi)的男性通常有一致的或者非常接近的Y染色體。當(dāng)前法庭科學(xué)上常用的Y染色體上的短串聯(lián)重復(fù)序列(Y-chromosome short tandem repeat,Y-STR)多態(tài)性基因座主要選擇于非重組區(qū),因其完全連鎖,可作為一個(gè)整體用于追蹤和識(shí)別男性之間的家系關(guān)系。目前,Y染色體的父系遺傳特點(diǎn)越來(lái)越多地應(yīng)用于法庭科學(xué)的實(shí)際檢案中,如家系排查、親緣搜索、來(lái)源人群推定、個(gè)體識(shí)別和親緣關(guān)系輔助鑒定等。
我國(guó)的法庭科學(xué)DNA數(shù)據(jù)庫(kù)自開(kāi)始建立以來(lái)已經(jīng)在公安實(shí)際檢案中發(fā)揮了巨大作用,但它僅包含常染色體STR基因座,利用DNA數(shù)據(jù)庫(kù)破獲的案件以個(gè)體間的匹配為主,這也是“全國(guó)公安機(jī)關(guān)DNA數(shù)據(jù)庫(kù)”的局限所在。盡管當(dāng)前數(shù)據(jù)庫(kù)的數(shù)據(jù)總量已超過(guò)1 500萬(wàn),但相對(duì)于違法犯罪人員所占比例及全國(guó)潛在犯罪人口而言,覆蓋率仍很低,依靠個(gè)體間匹配造成比中的效能相對(duì)低下。由于罪犯絕大多數(shù)為男性,在DNA數(shù)據(jù)庫(kù)中增加Y染色體的男性家系遺傳特性及其比對(duì)功能,可在未來(lái)進(jìn)一步擴(kuò)展DNA數(shù)據(jù)庫(kù)的作用,使其功能從個(gè)體覆蓋擴(kuò)展到家系覆蓋。本文旨在探討中國(guó)Y-STR數(shù)據(jù)庫(kù)建設(shè)中需要考慮的問(wèn)題并提出相應(yīng)的建議。
Y染色體上的遺傳標(biāo)記主要包括STR和SNP,其中SNP突變率極低,在幾代家系內(nèi)可以認(rèn)為不發(fā)生突變,但是絕大部分SNP位點(diǎn)只有兩個(gè)等位基因,個(gè)體識(shí)別能力較低。此外,SNP分析技術(shù)與當(dāng)前STR技術(shù)有所不同,從目前SNP的研究應(yīng)用現(xiàn)狀來(lái)看,使用SNP可能會(huì)額外增加實(shí)驗(yàn)室的檢驗(yàn)成本和工作量。因此在當(dāng)前和可預(yù)見(jiàn)的未來(lái),Y-STR還將是法庭科學(xué)應(yīng)用中主流的Y染色體遺傳標(biāo)記。
目前,已有商業(yè)化Y-STR試劑盒可供選擇,這些試劑盒包含17~24個(gè)Y-STR基因座(表1)。根據(jù)當(dāng)前研究[1-3],幾千個(gè)無(wú)關(guān)個(gè)體可能具有相同的Y-filer單倍型。因此,在Y-filer系統(tǒng)17個(gè)Y-STR基因座的基礎(chǔ)上,有些公司增加了各自認(rèn)為合適的基因座,以提高系統(tǒng)效能。Y-filer和PowerPlex Y23試劑盒中基因座的選擇主要是基于歐洲、非洲和南亞人群中各個(gè)Y-STR基因座個(gè)體識(shí)別能力的考慮[4],但是,Y-STR基因座等位基因的頻率分布和個(gè)體識(shí)別能力會(huì)因群體不同而有所差異。Hedman等[5]針對(duì)芬蘭人群選擇了7個(gè)Y-STR基因座(DYS449、DYS460、DYS505、DYS522、DYS576、DYS612、DYS627),發(fā)現(xiàn)這7個(gè)基因座所組成的單倍型在芬蘭人群的個(gè)體識(shí)別能力比Y-filer系統(tǒng)的17個(gè)Y-STR更高。同理,在歐洲人群中個(gè)體識(shí)別能力比較高的基因座或單倍型不一定在中國(guó)人群中也有較高的個(gè)體識(shí)別能力[3],因此需要確定適合中國(guó)人群的Y-STR基因座?,F(xiàn)階段,我國(guó)已有大量關(guān)于Y-filer的群體遺傳學(xué)數(shù)據(jù)[6-10],但是其他基因座的單倍型數(shù)據(jù)還很有限,至今還無(wú)法確定哪些基因座、試劑盒更適合中國(guó)人群。如果能夠收集足夠量的中國(guó)不同群體的樣本和單倍型數(shù)據(jù),對(duì)于篩選和驗(yàn)證適合中國(guó)人群的Y-STR基因座將具有重要價(jià)值。
表1 中國(guó)法庭科學(xué)DNA實(shí)驗(yàn)室常用的Y-STR檢測(cè)試劑盒
法庭科學(xué)中的數(shù)據(jù)庫(kù)工具可發(fā)揮排查、認(rèn)定兩種作用。相對(duì)于常染色體STR基因座,Y-STR單倍型的個(gè)體識(shí)別能力較低,且不能單獨(dú)用于個(gè)體認(rèn)定,但其輔助鑒定價(jià)值已在大量案件中得以證實(shí)。Y-STR的作用主要體現(xiàn)在以下方面。
2.1 家系排查
如果案件發(fā)生在一個(gè)相對(duì)封閉、流動(dòng)人口較少的地域內(nèi)(例如臨近的幾個(gè)村莊),使用常染色體STR進(jìn)行排查通常需要大量時(shí)間和資源,但如果分析該地域各個(gè)家系內(nèi)的親緣關(guān)系,并有選擇地對(duì)每個(gè)家系中的幾名代表進(jìn)行Y-STR分型,將能迅速有效地確定犯罪嫌疑人可能的家系來(lái)源(朱傳紅等[11-12]已總結(jié)了這方面的經(jīng)驗(yàn)并破獲了大量案件)。在我國(guó),子代一般繼承父姓,其傳遞方式類(lèi)似人類(lèi)Y染色體的遺傳方式,因此男性姓氏與Y染色體存在一定程度的相關(guān)性。如果案件發(fā)生在相對(duì)封閉的環(huán)境,可通過(guò)Y染色體分析來(lái)推斷犯罪嫌疑人可能的姓氏。然而,由于中國(guó)歷史上存在改姓、賜姓、隨母姓以及領(lǐng)養(yǎng)等復(fù)雜情況,在廣義范圍上使用Y染色體來(lái)推測(cè)姓氏也會(huì)存在誤差。
2.2 親緣搜索
如果案件發(fā)生在人口流動(dòng)頻繁的地域(例如北京、上海等大都市),現(xiàn)階段直接使用Y-STR排查并不一定能得到很好的效果,可考慮利用常染色體STR基因座在數(shù)據(jù)庫(kù)中搜索罪犯可能的親屬,繼而對(duì)其中的男性樣本進(jìn)行Y-STR分型,迅速排除絕大部分與罪犯無(wú)關(guān)的個(gè)體,而對(duì)Y-STR匹配的樣本可進(jìn)一步分析調(diào)查其親屬,以確定是否有常染色體STR也完全匹配的個(gè)體。這個(gè)方法已經(jīng)在實(shí)際案件中被應(yīng)用并破獲了一些積壓多年的懸案[13]。如果Y-STR數(shù)據(jù)庫(kù)足夠大,在現(xiàn)場(chǎng)物證常染色體STR信息錄入數(shù)據(jù)庫(kù)比對(duì)后僅有少數(shù)基因座比中或無(wú)基因座比中的情況下,可以率先對(duì)Y-STR數(shù)據(jù)庫(kù)進(jìn)行搜索,結(jié)合其他背景信息為案件的偵查提供可能的線(xiàn)索或方向。
2.3 來(lái)源人群推斷
由于呈父系遺傳特性,Y染色體可用于估計(jì)生物樣本的來(lái)源人群,其準(zhǔn)確程度與基因座的選擇和數(shù)量直接相關(guān)。最理想的用于推斷來(lái)源人群的Y-STR基因座具有如下特點(diǎn):(1)在各個(gè)人群中均具有較高的個(gè)體識(shí)別能力;(2)在各個(gè)人群中基因頻率分布差異較大。由于這類(lèi)基因座報(bào)道較少,當(dāng)前比較現(xiàn)實(shí)的做法是選擇盡可能多的基因座,以提高系統(tǒng)效能,用于確定來(lái)源人群。
2.4 混合樣本檢驗(yàn)
通常犯罪學(xué)實(shí)驗(yàn)室所受理的案件中,性侵犯案件占50%以上,其中一男一女的混合樣本是最常見(jiàn)的情況。常染色體STR的分析結(jié)果比較難以解析,經(jīng)常無(wú)法確定男女各自的身份,而Y-STR分析能排除女性DNA的干擾,得到Y(jié)-STR分型結(jié)果。雖然Y-STR檢測(cè)不能完全認(rèn)定男性身份,但可作為一個(gè)可靠的排查工具。此外,某些強(qiáng)奸案中,犯罪嫌疑人無(wú)精或少精,但其前列腺液中可能含有脫落上皮細(xì)胞、白細(xì)胞等,鑒定人從檢材中可能提取到微量的男性DNA,此時(shí)常染色體STR分析往往不能得到理想的結(jié)果,而應(yīng)用Y-STR分析通??梢源_定男性的單倍型。對(duì)于輪奸案中多個(gè)男性的混合樣本,檢驗(yàn)Y-STR可以比較準(zhǔn)確地推斷犯罪嫌疑人的人數(shù)。
2.5 失蹤人員及失蹤人員親屬鑒定
失蹤人員數(shù)據(jù)庫(kù)和打拐數(shù)據(jù)庫(kù)檢索中需要進(jìn)行大量的親緣關(guān)系鑒定。對(duì)于二聯(lián)體,如果所檢測(cè)的常染色體STR基因座少于19個(gè),有可能得出錯(cuò)誤的鑒定結(jié)論[14]。如果增加額外的基因座,無(wú)論是常染色體STR基因座還是Y-STR基因座,均有助于提高鑒定的準(zhǔn)確率。研究[14]表明,增加Y-STR基因座比增加同樣數(shù)量的常染色體STR基因座效果更佳。
3.1 Y-STR試劑盒的研發(fā)
法庭科學(xué)DNA數(shù)據(jù)庫(kù)主要由兩部分組成——人員庫(kù)和物證庫(kù)。人員庫(kù)的DNA樣本質(zhì)量通常較好,對(duì)試劑盒的靈敏度要求不高,因此,研發(fā)時(shí)可考慮同時(shí)將常染色體STR基因座和Y-STR基因座納入一個(gè)試劑盒中??紤]到中國(guó)DNA數(shù)據(jù)庫(kù)的規(guī)模,這樣的做法能極大地節(jié)約辦案經(jīng)費(fèi)。目前,五色熒光技術(shù)的試劑盒最多只能容納大約25個(gè)基因座,而常用的常染色體STR基因座至少有15個(gè),因此Y-STR基因座最多只能選擇10個(gè)。如果六色熒光技術(shù)乃至更多顏色的熒光得以應(yīng)用,擴(kuò)增體系能復(fù)合的基因座數(shù)將有所增加。如果在中國(guó)人群能夠篩選出10個(gè)左右個(gè)體識(shí)別能力高的Y-STR基因座,同常染色體STR組合成一個(gè)試劑盒,將能極大地節(jié)約辦案經(jīng)費(fèi)并提升辦案效率。
3.2 Y-STR試劑盒的驗(yàn)證
不同的試劑盒由于引物設(shè)計(jì)不同,對(duì)同一樣本分型結(jié)果不一致的現(xiàn)象并不罕見(jiàn)。目前,中國(guó)市場(chǎng)上可選擇的試劑盒類(lèi)型比其他國(guó)家更多,因此這個(gè)問(wèn)題尤其明顯。Davis等[15]對(duì)美國(guó)人群951個(gè)樣本比較了Y-filer和PowerPlex Y23體系的一致性,發(fā)現(xiàn)在Y-filer的17個(gè)基因座上兩個(gè)試劑盒的分型結(jié)果完全一致,但是當(dāng)DYS448區(qū)域出現(xiàn)一個(gè)極少見(jiàn)的42bp缺失的等位基因峰,因?yàn)椴煌幕蜃植荚O(shè)計(jì),Y-filer體系判讀該等位基因?qū)儆贒YS437,而PowerPlex Y23體系判讀該等位基因?qū)儆贒YS576,從而造成不一致的結(jié)果。這個(gè)等位基因主要出現(xiàn)在印第安人中,這也是試劑盒設(shè)計(jì)主要針對(duì)高加索人和非洲人而忽視其他人群的一個(gè)直接表現(xiàn)。因此,針對(duì)中國(guó)人群Y-STR分型的試劑盒研發(fā)完成后,需要采用不同的試劑盒進(jìn)行一致性驗(yàn)證,并在數(shù)據(jù)庫(kù)搜索軟件中有相關(guān)設(shè)定或提示,以減少或避免因?yàn)槭褂貌煌噭┖卸斐傻呐凶x錯(cuò)誤。
3.3 Y-STR基因座突變情形的處理
Y-STR基因座的突變是另外一個(gè)要注意的問(wèn)題。Y-STR基因座的突變率約為0.2%[16]。以Y-filer中的17個(gè)基因座為例,父子之間出現(xiàn)至少一個(gè)突變的可能性是3.3%,平均33對(duì)父子之間就有一對(duì)父子有突變發(fā)生。因此,大規(guī)模的Y-STR數(shù)據(jù)庫(kù)搜索中,單倍型不一致的樣本仍有來(lái)源于同一父系的可能,這種情況在實(shí)際案件中已經(jīng)得到證實(shí)[17]。其次,在統(tǒng)計(jì)突變次數(shù)時(shí),必須考慮DYS389Ⅰ和DYS389Ⅱ的結(jié)構(gòu)特殊性。如果DYS389Ⅰ發(fā)生突變,DYS389Ⅱ也會(huì)出現(xiàn)重復(fù)片段的不一致,看似發(fā)生了兩次突變,而實(shí)際上只是一次發(fā)生在DYS389Ⅰ的突變。此外,我們需要良好的突變數(shù)學(xué)模型來(lái)描述發(fā)生突變的可能性,以計(jì)算個(gè)體識(shí)別案件中10→11、10→13、10→10.2等各種突變情形的似然率[18]。重復(fù)序列變化為整數(shù)的突變(例如11→13)通常屬于滑變,變化數(shù)量越大,隨機(jī)匹配概率越低。而重復(fù)序列變化為非整數(shù)時(shí)(例如11→10.2),通常是因?yàn)閴A基缺失,其隨機(jī)匹配概率通常極低(可能低至10-8)。以上情況在設(shè)計(jì)Y-STR搜索比對(duì)軟件時(shí)應(yīng)予以高度重視。
3.4 搜索軟件系統(tǒng)開(kāi)發(fā)
和其他數(shù)據(jù)庫(kù)一樣,搜索軟件系統(tǒng)是Y-STR數(shù)據(jù)庫(kù)建設(shè)的核心,該系統(tǒng)應(yīng)該能夠容納當(dāng)前常用的YSTR,并保留繼續(xù)擴(kuò)展基因座的能力。數(shù)據(jù)庫(kù)系統(tǒng)的容量要能夠滿(mǎn)足未來(lái)5~10年數(shù)據(jù)庫(kù)發(fā)展的需要。數(shù)據(jù)庫(kù)搜索算法應(yīng)能快速地搜索到匹配或者近似的單倍型?;诜此饕淼暮喜⒑徒徊孢\(yùn)算可能是比較高效的解決方案。對(duì)于搜索得到的單倍型,軟件系統(tǒng)應(yīng)能估算單倍型之間的相似度,并猜測(cè)可能的來(lái)源人群。搜索中同樣需要考慮不同試劑盒的不一致性問(wèn)題。為了更加有效地利用現(xiàn)有資源,Y-STR數(shù)據(jù)庫(kù)可作為現(xiàn)有常染色體DNA數(shù)據(jù)庫(kù)的一部分,或者至少可以利用一致的索引號(hào)相互檢索以實(shí)現(xiàn)兩個(gè)數(shù)據(jù)庫(kù)的對(duì)接,這樣可以大大提高比對(duì)效能。
總而言之,為了有效地建立中國(guó)Y-STR數(shù)據(jù)庫(kù)并應(yīng)用于公安刑偵工作,對(duì)數(shù)據(jù)庫(kù)建設(shè)中需要注意的問(wèn)題進(jìn)行全面的前期研究十分必要。從各個(gè)民族和地域(包括人口流動(dòng)頻繁的城市和相對(duì)封閉的山村)廣泛收集樣本和數(shù)據(jù),驗(yàn)證和比較當(dāng)前常用的Y-STR基因座并尋找適合中國(guó)人群的新基因座,分析基因座的群體特異性,比較不同試劑盒在不同人群中的一致性,探索突變的數(shù)學(xué)模型,解析與常染色體STR聯(lián)合使用的結(jié)果,結(jié)合實(shí)際辦案不斷總結(jié)問(wèn)題和需求,將為中國(guó)Y-STR數(shù)據(jù)庫(kù)的建設(shè)及高效應(yīng)用打下良好的基礎(chǔ)。
[1]Budowle B,Ge J,Aranda XG,et al.Texas population substructure and its impact on estimating the rarity of Y STR haplotypes from DNA evidence[J]. J Forensic Sci,2009,54(5):1016-1021.
[2]Budowle B,Ge J,Low J,et al.The effects of Asian population substructureon YSTRforensic analyses[J].Leg Med(Tokyo),2009,11(2):64-69.
[3]Ge J,Budowle B,Planz JV,et al.US forensic Y-chromosome short tandem repeats database[J].Leg Med(Tokyo),2010,12(6):289-295.
[4]Kayser M,Kittler R,Erler A,et al.A comprehensive survey of human Y-chromosomal microsatellites[J]. Am J Hum Genet,2004,74(6):1183-1197.
[5]Hedman M,Neuvonen AM,Sajantila A,et al.Dissecting the Finnish male uniformity:the value of additional Y-STR loci[J].Forensic Sci Int Genet,2011,5(3):199-201.
[6]Wu W,Pan L,Hao H,et al.Population genetics of 17 Y-STR loci in a large Chinese Han population from Zhejiang Province,Eastern China[J].Forensic Sci Int Genet,2011,5(1):e11-e13.
[7]Zhu B,Shen C,Xun X,et al.Population genetic polymorphisms for 17 Y-chromosomal STRs haplotypes of Chinese Salar ethnic minority group[J].Leg Med(Tokyo),2007,9(4):203-209.
[8]Zhu B,Wu Y,Shen C,et al.Genetic analysis of 17 Y-chromosomal STRs haplotypes of Chinese Tibetan ethnic group residing in Qinghai province of China[J].Forensic Sci Int,2008,175(2-3):238-243.
[9]Guo H,Yan J,Jiao Z,et al.Genetic polymorphisms for 17 Y-chromosomal STRs haplotypes in Chinese Hui population[J].Leg Med(Tokyo),2008,10(3):163-169.
[10]Huang TY,Hsu YT,Li JM,et al.Polymorphism of 17 Y-STR loci in Taiwan population[J].Forensic Sci Int,2008,174(2-3):249-254.
[11]朱傳紅,史紹杏,王海生,等.Y-STR家系排查法的應(yīng)用原則及注意事項(xiàng)[J].中國(guó)法醫(yī)學(xué)雜志,2007,22(6):431-432.
[12]史紹杏,馬偉,朱傳紅.Y-STR家系分型及ITO分析法偵破強(qiáng)奸殺人案1例[J].刑事技術(shù),2005,(4):58-59.
[13]STR-DNA Y-chromosome[DB/OL].[2012-10-18].http:// www.denverda.org/DNA/Y-chromosome_DNA_Lega_% 20Decisions.htm.
[14]Ge J,Eisenberg A,Budowle B.Developing criteria and data to determine best options for expanding the core CODIS loci[J].Investig Genet,2012,3:1.
[15]Davis C,Ge J,Sprecher C,et al.Prototype PowerPlex?Y23 System:A concordance study[J].Forensic Sci Int Genet,2013,7(1):204-208.
[16]Ge J,Budowle B,Aranda XG,et al.Mutation rates at Y chromosome short tandem repeats in Texas populations[J].Forensic Sci Int Genet,2009,3(3):179-184.
[17]史紹杏,朱傳紅,王海生,等.Y-STR家系排查中出現(xiàn)Y-STR突變1例[J].刑事技術(shù),2008,(1):68-69.
[18]Ge J,Budowle B,Chakraborty R.DNA identification by pedigree likelihood ratio accommodating population substructure and mutations[J].Investig Genet,2010,1(1):8.
Development of Chinese Forensic Y-STR DNA Database
GE Jian-ye1,YAN Jiang-wei2,XIE Qun3,SUN Hong-yu4,ZHOU Huai-gu5,LI Bin6
(1.Health Science Center,University of North Texas,Texas 76107,USA;2.Beijing Institute of Genomics, Chinese Academy of Sciences,Beijing 100029,China;3.Institute of Forensic Science,Ministry of Public Security,Beijing 100038,China;4.Department of Forensic Medicine,Zhongshan Medical College,Sun Yat-Sen University,Guangzhou 510080,China;5.Shanghai Key Laboratory of Crime Scene Evidence, Criminal Technology Agency,Shanghai 200083,China;6.Forensic Science Division,Fujian Provincial Public Security,Fuzhou 350003,China)
Y chromosome is a male-specific paternal inherited chromosome.The STR markers on Y chromosome have been widely used in forensic practices.This article summarizes the characteristics of Y-STR and some factors are considered of selecting appropriate Y-STR markers for Chinese population. The prospects of existing and potential forensic applications of Y-STR profiles are discussed including familial excluding,familial searching,crowd source deducing,mixture sample testing,and kinship identifying.The research,development,verification of Y-STR kit,Y-STR mutation rate,and search software are explored and some suggestions are given.
forensic genetics;Y chromosome;review[publication type];short tandem repeat;DNA database
DF795.2
A
10.3969/j.issn.1004-5619.2013.03.015
1004-5619(2013)03-0212-04
2012-10-19)
(本文編輯:李莉)
葛建業(yè)(1977—),男,浙江寧海人,博士,主要從事DNA證據(jù)解析方面的研究;E-mail:Jianye.Ge@unthsc.edu