陶瑞旸,王守宇,袁春艷,夏若成,李成濤
1.司法鑒定科學研究院 上海市法醫(yī)學重點實驗室 司法部司法鑒定重點實驗室 上海市司法鑒定專業(yè)技術服務平臺,上海 200063;2.復旦大學基礎醫(yī)學院法醫(yī)學系,上海 200032;3.內(nèi)蒙古醫(yī)科大學法醫(yī)學教研室,內(nèi)蒙古 呼和浩特 010030
從犯罪現(xiàn)場提取的生物檢材中獲取盡可能多的信息對于案件偵破和犯罪事實認定具有重要意義。其中,通過體液斑鑒定識別生物樣本的來源對于明確案情和犯罪性質(zhì)定性,尤其是性侵犯案件中犯罪事實的認定,具有十分關鍵的作用。精液(斑)是性侵犯案件中常見的生物檢材,且往往與女性成分(如陰道分泌物)以混合物的形式出現(xiàn),因此,精液(斑)的鑒定和個體識別是法醫(yī)學領域的研究重點之一。
由于傳統(tǒng)的種屬預實驗和基于免疫學方法的體液鑒定手段存在樣品消耗量大、檢測特異性和靈敏度較低等問題[1-3],近年來,學者們陸續(xù)提出了DNA 甲基化模式分析、拷貝數(shù)變異分析和RNA 表達模式分析等方法,為法醫(yī)學體液斑鑒定提供了更多有效的途徑[4-6]。在這些新方法中,RNA 表達模式分析的應用最為成熟,并且可與DNA 遺傳標記檢測聯(lián)合應用于未知類型斑痕的體液鑒定和個體識別。然而,由于DNA 遺傳標記檢測和RNA 分子標記檢測的分析結果實際上相互獨立,盡管在單一類型的體液斑中可將體液類型信息與其供體信息直接結合起來,但在混合斑中,DNA 分型結果有可能來自RNA 表達分析中未被識別的體液或組織,造成DNA 證據(jù)與RNA 證據(jù)的錯誤關聯(lián)[7]。
為了實現(xiàn)DNA 證據(jù)與RNA 證據(jù)的直接連鎖,HANSON 等[8-10]于2015 年首次提出將基因編碼區(qū)單核苷酸多態(tài)性(coding region single nucleotide polymorphism,cSNP)應用于體液特異性mRNA 的來源個體識別的設想,并嘗試進行了相應的檢測體系構建。由于同時具有體液特異性與序列多態(tài)性,cSNP 在體液斑鑒定中可實現(xiàn)將特定類型的體液與其來源個體相鎖定的目的,因此在混合斑鑒定中具有十分明顯的優(yōu)勢。
本課題組在前期研究中構建了包含6 個血液特異性cSNP 的復合檢測體系[11],探索了將SNaPshot 技術應用于法醫(yī)體液斑樣本cSNP 檢測的可行性,并在20 名無親緣關系個體中驗證了分別以基因組DNA(genomic DNA,gDNA)和互補DNA(complementary DNA,cDNA)為模板的情況下cSNP 檢測結果的一致性。在此基礎上,本研究擬進一步擴大樣本類型,期望構建一個有效的精液特異性cSNP 復合檢測體系并對其在混合斑鑒定中可發(fā)揮的效果進行探索。
根據(jù)知情同意原則,精液樣本收集自16名無親緣關系的健康漢族男性個體(24~30 歲),靜脈血樣本隨機取自其中3 名精液提供者。樣本收集后立即-80 ℃凍存。制備精液斑時,取50 μL 精液樣本滴加在無菌棉簽上;混合斑的制備則以不同比例精液-靜脈血(表1)混勻后滴加在無菌棉簽上。常溫風干后分別使用PureLinkTM基因組DNA 小提試劑盒(美國Thermo Fisher Scientific 公司)和TRIzolTM試劑(美國Thermo Fisher Scientific 公司)進行gDNA 和總RNA 的提取。使用TURBO DNA-freeTM試劑盒(美國Thermo Fisher Scientific 公司)去除可能殘留的gDNA,隨后使用SuperScriptTMⅢ第一鏈合成系統(tǒng)(美國Thermo Fisher Scientific公司)進行逆轉錄以獲得cDNA。
表1 混合斑樣本的供體及混合比例Tab.1 The donors and mixing ratio of mixtures
參照文獻[12-13],將已經(jīng)通過驗證的精液特異性mRNA 編碼基因作為cSNP 篩選范圍。在dbSNP 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/snp/)獲取這些基因編碼區(qū)和非翻譯區(qū)的全部cSNP 相關信息后,依據(jù)以下標準對cSNP 進一步篩選:(1)候選cSNP 在db-SNP 數(shù)據(jù)庫各人群匯總數(shù)據(jù)中的最小等位基因頻率(minor allele frequency,MAF)大于0.2;(2)若候選cSNP 位于同一條染色體,需經(jīng)過Haploview 軟件(https://www.broadinstitute.org/haploview/haploview)計算確保納入復合檢測體系的cSNP 之間r2(連鎖不平衡程度的衡量指標)小于0.4;(3)候選cSNP 距最近的內(nèi)含子距離不超過300 bp。
基于最終確定的cSNP 遺傳標記,分別設計針對gDNA 和cDNA 的特異性擴增引物,其中cDNA 的擴增引物至少跨1 個內(nèi)含子以避免gDNA 污染,單堿基延伸引物可在gDNA 和cDNA 的檢測中通用,由于部分cSNP 相鄰位置存在其他可能影響單堿基延伸引物與DNA模板結合的SNP,為了避免其干擾,本研究擇優(yōu)選取編碼鏈和模板鏈的其中一條進行單堿基延伸引物的設計。擴增引物和單堿基延伸引物序列詳見表2。
表2 5 個精液特異性cSNP 擴增引物及單堿基延伸引物Tab.2 The amplification primers and single base extension primers of 5 semen-specific cSNPs
使用Multiplex PCR 試劑盒(德國Qiagen 公司)對cSNP 進行復合擴增后,通過聚丙烯酰胺凝膠電泳驗證PCR 產(chǎn)物特異性。在確定每個cSNP 具有唯一擴增子后,使用SNaPshotTMMultiplex 試劑盒(美國Thermo Fisher Scientific 公司)進行單堿基延伸并在3130xl基因分析儀(美國Applied Biosystems 公司)上通過CE 進行片段分離和基因型檢測:96 孔進樣板中每孔加入9.6 μL 去離子甲酰胺、0.4 μL Gene-ScanTM600 LIZTM染料片段標準品(分子量內(nèi)標,美國Thermo Fisher Scientific 公司)和1 μL 單堿基延伸擴增產(chǎn)物,95 ℃變性3 min,冰浴3 min,短暫離心后置于3130xl基因分析儀中,采用POP-4TM聚合物(美國Thermo Fisher Scientific 公司),毛細管長度為36 cm;進樣電壓、進樣時間、電泳電壓等根據(jù)各試劑盒說明書設置;采用Genemapper?IDv4.0 軟件(美國Thermo Fisher Scientific 公司)分析電泳結果。
在排除了無法設計特異性擴增引物的候選cSNP 之后,共篩選出5 個符合條件的精液特異性cSNP(表3),并基于CE 構建了cSNP 復合檢測體系。
表3 精液特異性cSNP 基本信息Tab.3 General information of semen-specific cSNP
應用構建的cSNP 復合檢測體系,成功在16 例精液樣本的gDNA 和cDNA 中檢測到5 個精液特異性cSNP 遺傳標記(僅在部分樣本中出現(xiàn)檢測結果缺失)。在以gDNA 為模板的情況下,僅1 例樣本(M02)在rs1995640 未成功獲取分型結果。而在以cDNA 為模板的情況下,有4 例樣本(M10、M11、M14 和M15)在rs9876921、rs1058274 和rs2301366 上 存在不 同程度的檢測結果缺失。對于精液-靜脈血混合斑,有6例樣本的cSNP 檢測結果出現(xiàn)了1 個或多個標記的檢測結果缺失,主要是rs1058274 與rs2301366 這2 個cDNA 擴增子長度超過200 bp 的cSNP 遺傳標記(16 個樣本中有10 個樣本獲得完整分型)。具體cSNP 分型結果詳見附表1。
在成功得到分型結果的cSNP 中,位于KLK3、SEMG1和PRM1基因上的3 個cSNP(rs1058274、rs2301366、rs737008)在分別以gDNA 與cDNA 為模板的情況下檢測結果完全一致。而位于TGM4基因上的2 個cSNP(rs9876921 和rs1995640)分別在1 例和5 例樣本中出現(xiàn)了檢測結果不一致的現(xiàn)象,并且這些等位基因丟失情況完全相同,均為gDNA 的檢測結果為“AG”雜合子,而cDNA 只能檢測到“G”等位基因。
在M01 精液與M06 靜脈血的混合斑中,5 個cSNP在1∶9(混合斑A2)和1∶49(混合斑A3)的混合比例下均成功檢出,而在1∶3(混合斑A1)的混合比例下有1 個cSNP(rs2301366)未檢出。M03 精液與M01 靜脈血的混合斑中,5 個cSNP 中有4 個在1∶49(混合斑B3)的混合比例下成功檢出,而在1∶9(混合斑B1)、1∶19(混合斑B2)的混合比例下成功檢出的cSNP 數(shù)量分別為1、2 個。M06 精液與M03 靜脈血的混合斑中,5 個cSNP 在1∶1(混合斑C1)、1∶3(混合斑C2)和1∶9(混合斑C3)的混合比例下均成功檢出,而在1∶19(混合斑C4)、1∶49(混合斑C5)的混合比例下成功檢出的cSNP 數(shù)量分別為1、2 個。以上成功檢出的cSNP 分型結果均與精液提供者的基因型一致,并且在精液與靜脈血提供者基因型不一致的情況下,cSNP 的分型結果未受到靜脈血提供者基因型的干擾(圖1)。
圖1 cSNP 復合檢測體系的基因分型圖譜Fig.1 Genotyping electropherogram of the cSNP detection system
目前,國際法醫(yī)學領域最早開展cSNP 相關研究的BALLANTYNE 教授和HAAS 研究員團隊已實現(xiàn)了在高通量測序平臺上將部分攜帶cSNP 的mRNA 分子標記納入mRNA 體液鑒定復合檢測體系,從而在體液類型判定的同時獲取相關體液來源個體的遺傳多態(tài)性信息[8]。而在國內(nèi)法醫(yī)遺傳學領域,本課題組[11]在前期研究中率先探索了將SNaPshot 技術應用于cSNP檢測的可行性,并驗證了靜脈血中DNA 和RNA 的cSNP 分析結果的一致性。隨后,張更謙教授團隊[14-15]也針對靜脈血和精液cSNP 的個體識別能力進行了探索研究,進一步揭示了其在法醫(yī)學鑒定中的價值。雖然cSNP 相關研究尚處于起步階段,但其在法醫(yī)學鑒定中的巨大應用潛力已經(jīng)顯現(xiàn)。在此基礎上,本研究以中國人群為研究對象,篩選了5 個cSNP 以構建精液特異性復合檢測體系,并基于SNaPshot 技術在CE平臺上對一系列精液斑和混合斑樣本進行了檢驗,以評估cSNP 在法醫(yī)學實踐中的應用潛能。
本研究檢測的5 個精液特異性cSNP 在部分cDNA 樣本的分型中出現(xiàn)了不同程度的檢測結果缺失,并且這種現(xiàn)象主要出現(xiàn)在cDNA 擴增子長度超過200 bp 的cSNP 遺傳標記中,這提示部分精液樣本中的RNA 在制備斑痕或提取過程中可能發(fā)生了一定程度的降解,導致較長mRNA 片段的逆轉錄效果不理想。由于本研究設計的cDNA 擴增子需要同時滿足覆蓋cSNP 和跨內(nèi)含子的條件,在引物設計上受到很大限制,因此各擴增子的長度可調(diào)整范圍有限,這導致cSNP 在CE 平臺上的檢測靈敏度可能不及既往研究中構建的一些具有較短擴增子的體液特異性mRNA 復合檢測體系[16-18],INGOLD 等[19]在基于高通量測序平臺的cSNP 研究中也觀察到了類似的情況。然而擴增子長度并不是影響mRNA 檢測靈敏度的唯一因素,LIN 等[20]在針對降解檢材的研究中發(fā)現(xiàn),一些mRNA 在不同區(qū)域的穩(wěn)定性方面存在較大差異。因此,未來的體液鑒定相關研究可嘗試探索更多體液特異性mRNA 的最佳穩(wěn)定區(qū)域,并在cSNP 的篩選過程中將其作為一個重要條件納入考慮。
在gDNA 與cDNA 的檢測結果一致性方面,本研究觀察到TGM4基因上的2 個cSNP,尤其rs1995640在cDNA 的檢測結果中容易出現(xiàn)等位基因“A”的丟失。由于這種情況并未在其他基因的cDNA 檢測結果中觀察到,推測TGM4可能在2 條等位基因的轉錄水平上存在一定差異,這種差異經(jīng)過PCR 放大造成了SNaPshot 檢測結果的偏倚。這一發(fā)現(xiàn)提示,未來在構建包含更多cSNP 復合檢測體系的過程中,可能需要通過大樣本量和不同初始模板量的系統(tǒng)性評估篩除一些容易出現(xiàn)等位基因丟失的標記。此外,本研究發(fā)現(xiàn),在具有T 等位基因的位點檢測結果中出現(xiàn)了比較明顯的等位基因峰高不平衡現(xiàn)象,對于次要等位基因的判定有所干擾,這一情況很大程度上是由SNaPshot 檢測方法本身所導致的。因為用于標記雙脫氧尿苷三磷酸(dideoxyuridine triphosphate,ddUTP)的紅色熒光強度較弱,T 等位基因的峰高偏低這一問題在其他應用SNaPshot 技術檢測SNP 的研究中也經(jīng)常存在,且其偏倚程度受到檢測平臺的影響較大。在未來研究中,本研究團隊將繼續(xù)關注這一問題,通過在3130 基因分析儀和3500 基因分析儀平臺上分別進行大樣本量的檢測獲取更多有效數(shù)據(jù),并系統(tǒng)評估雜合子的峰高比范圍,從而為所構建的檢測體系提供可參考的分析標準。
在混合斑的區(qū)分方面,本研究構建的cSNP 復合檢測體系在大部分混合樣本中顯示出良好的應用潛力,在精液與靜脈血的混合比例低至1∶49 的情況下,5 個cSNP 均可以被成功檢出,并且分型結果與精液提供者的基因型完全一致。相較于混合比例,部分標記檢測結果的缺失似乎受到混合斑中精液樣本本身質(zhì)量的影響更大。此外,本研究觀察到在精液與靜脈血提供者基因型不一致的情況下,精液特異性cSNP 的分型結果并不會受到靜脈血提供者基因型的干擾,這意味著cSNP 檢測在不同體液的混合斑鑒定中可解決一些通過傳統(tǒng)的DNA 遺傳標記分析不能解決的問題,如排除某種體液來源于某一特定個體的可能性,或明確某種體液的提供者必攜帶某個特定的等位基因。此前,張更謙教授團隊[15]對精液特異性cSNP 在不同類型混合斑中的檢測靈敏度進行了評估,但其研究中使用單一類型體液樣本提取的cDNA 進行混合,而本研究使用體液樣本直接混合,隨后再進行混合斑的RNA 提取和逆轉錄。相較而言,本研究使用的混合斑樣本與實際案件更為接近,因此對于精液-靜脈血體積比影響cSNP 檢測靈敏度的評估結果有一定的實踐意義。
為了避免連鎖不平衡,本研究選用的cSNP 多位于不同基因和染色體,盡管rs9876921 和rs1995640 均位于TGM4基因上,但基于dbSNP 數(shù)據(jù)庫的分析結果顯示,這兩個標記之間的r2小于0.4,這樣的標記篩選標準保證了后期通過等位基因頻率計算法醫(yī)學參數(shù)(如累積個體識別能力)的可行性。然而,由于許多體液特異性mRNA 上往往存在多個具有良好多態(tài)性但相互之間完全或不完全連鎖的cSNP 遺傳標記,這種篩選標準在一定程度上會導致cSNP 多態(tài)性信息的浪費。因此,后續(xù)研究會嘗試將一些mRNA 上完全連鎖遺傳的cSNP 以單倍型的方式進行分析。此外,本課題組也將篩選更多新的體液特異性mRNA 及cSNP 遺傳標記,并擴展研究中納入的體液類型和樣本量,通過推進cSNP 的法醫(yī)學應用轉化,進一步提升RNA 證據(jù)在法醫(yī)物證鑒定中的重要性,為疑難案件中混合(斑)的體液類型鑒定及其來源個體判別提供新的技術手段。