張琦,趙禾苗,楊康,陳靜,楊瑞琴,王沖
1.中國人民公安大學(xué),北京 100038;2.瓦房店市公安局,遼寧 大連 116300;3.公安部鑒定中心 法醫(yī)遺傳學(xué)公安部重點實驗室,北京 100038;4.西安市公安局,陜西 西安 710038
月經(jīng)血是法醫(yī)物證檢驗中的一類重要物證,對其準(zhǔn)確識別有助于判斷案件的性質(zhì),如通過鑒定現(xiàn)場血痕是否為月經(jīng)血來判斷該案是否存在暴力行為的可能,排除或確定嫌疑人范圍,為案件性質(zhì)的確定提供依據(jù),為進(jìn)一步偵查提供方向。已有研究[1]證明,以mRNA 分析法為代表的RNA 分析法能夠有效鑒別體液斑跡種類,為案件偵查和法庭判案提供參考。隨著分子生物學(xué)的發(fā)展,越來越多在經(jīng)期子宮內(nèi)膜脫落細(xì)胞中特異性表達(dá)的RNA 標(biāo)志被發(fā)現(xiàn),為月經(jīng)血體液斑跡的鑒定提供了可能。研究[2]對特異性標(biāo)志的檢出結(jié)果只能進(jìn)行陽性、陰性的定性描述,難以準(zhǔn)確解釋檢測結(jié)果。隨著訴訟過程對證據(jù)證明力要求的提升,法庭更加關(guān)注體液樣本鑒定的可靠性與準(zhǔn)確性,為此,需進(jìn)行大量的樣本檢驗和統(tǒng)計學(xué)計算,從定量的角度描述月經(jīng)血相關(guān)RNA 標(biāo)志的檢驗結(jié)果,為案件偵辦提供更加強(qiáng)有力的證據(jù)支持。
2016 年,DE ZOETE 等[3]利用樸素貝葉斯(Na?ve Bayes,NB)和多元logistic 回歸(multivariate logistic regression,MLR)2 種分類方法構(gòu)建了分類模型,用過往研究中的RNA 檢測數(shù)據(jù)進(jìn)行模型的訓(xùn)練和測試,以定量形式呈現(xiàn)2 種分類模型的計算結(jié)果。結(jié)果表明,NB 模型和MLR 模型能基于特征屬性對樣本進(jìn)行分類,并計算返回某類別的后驗概率值,據(jù)此可以得到類似于DNA 檢驗中的似然比的概率型數(shù)據(jù)來解釋RNA 檢驗結(jié)果。
本研究對樣本中月經(jīng)血特異性mRNA 標(biāo)志進(jìn)行批量檢測,統(tǒng)計特異性標(biāo)志的相關(guān)數(shù)據(jù),作為訓(xùn)練集構(gòu)建NB 和MLR 分類器,為月經(jīng)血特異性mRNA 標(biāo)志檢測結(jié)果的解釋提供新的技術(shù)方法。
QIAcube?全自動核酸純化儀(德國Qiagen 公司),ProFlexTMPCR 系統(tǒng)(美國Applied Biosystems 公司),3500xL 基因分析儀(美國Applied Biosystems 公司),RNeasy Micro 試劑盒(德國Qiagen 公司),InvitrogenTMSuperScriptTMⅢ第一鏈合成系統(tǒng)(美國Invitrogen 公 司),Applied BiosystemsTMAmpliTaq GoldTMDNA 聚合酶(美國Thermo Fisher Scientific 公司),2×TransStart?FastPfuFly PCR SuperMix(北京全式金生物技術(shù)股份有限公司),Hi-DiTMFormamide(美國Applied Biosystems 公司),Typer500 內(nèi)標(biāo)(公安部物證鑒定中心)。
月經(jīng)血樣本86 份、外周血和陰道分泌物樣本各48 份、唾液和精液樣本各24 份。月經(jīng)血樣本來自志愿者提供的經(jīng)期第1~2 天的衛(wèi)生巾,為22~25 歲的健康女性;外周血樣本一部分使用采血專用卡收集,另一部分使用醫(yī)用一次性真空采血管收集;精液使用50 mL 離心管收集;自然流出唾液使用拭子蘸??;陰道分泌物采用陰道拭子收集。血卡存放于常溫干燥處,其余樣本儲存在-80 ℃的冰箱中。
本研究的樣本采集經(jīng)公安部物證鑒定中心倫理委員會審核批準(zhǔn)(審準(zhǔn)號2020—013,批準(zhǔn)日期2020年7 月7 日),采集過程遵循相關(guān)流程和協(xié)議,撰寫知情同意書,并指導(dǎo)全部提供生物樣本的志愿者簽署。知情同意書內(nèi)容包含研究的目的、步驟、獲益、風(fēng)險、可能帶來的不便或不適等。
通過文獻(xiàn)檢索和表達(dá)譜芯片篩選,結(jié)合本實驗室前期使用的熒光標(biāo)志,本研究選用B2M[4]作為管家基因,選用基質(zhì)金屬蛋白酶(matrix metalloproteinase,MMP)7[4]、MMP11[4]、MMP3[5]、斯鈣素-1(stanniocalcin-1,STC1)[5]和孕激素相關(guān)子宮內(nèi)膜蛋白(progestogens associated endometrial protein,PAEP)[6]作為月經(jīng)血特異的mRNA 標(biāo)志,管家基因B2M 和5 種月經(jīng)血特異性標(biāo)志的6 對引物序列如表1 所示。上述標(biāo)志均經(jīng)瓊脂糖凝膠電泳、測序、靈敏度和特異度的初篩,隨后進(jìn)行熒光引物合成用于本次研究。
表1 月經(jīng)血特異性mRNA 和管家基因B2M 的PCR 引物Tab.1 PCR primers for menstrual blood specific mRNA and housekeeping gene B2M
按RNeasy Micro 試劑盒、InvitrogenTMSuper-ScripTMⅢ第一鏈合成系統(tǒng)、Applied BiosystemsTMAmpliTaq GoldTMDNA 聚合酶和2×TransStart?FastPfuFly PCR SuperMix 2 種聚合酶體系說明書進(jìn)行提取、逆轉(zhuǎn)錄和擴(kuò)增。10 μL 擴(kuò)增體系在ProFlexTMPCR 系統(tǒng)上進(jìn)行擴(kuò)增,擴(kuò)增條件:95 ℃ 15 min;95 ℃ 20 s,60 ℃30 s,72 ℃ 40 s,36 次循環(huán);72 ℃ 10 min,4 ℃保存。
本研究同時檢測6 種標(biāo)志的最低檢測閾值,共設(shè)置20、10、4、1、0.5、0.2、0.1、0.05、0.02、0.01、0.002 和0.001 ng 12個RNA起始量,每個起始量平行擴(kuò)增3次,綜合3 次檢驗結(jié)果對檢出率和信號穩(wěn)定性進(jìn)行分析。
按1 000∶30 體積比混合Hi-DiTMFormamide 和Typer500內(nèi)標(biāo),取10 μL加入96孔板中,加入1 μL PCR產(chǎn)物混合均勻。在3500xL 基因分析儀上進(jìn)行電泳檢測。電泳數(shù)據(jù)在GeneMapper?ID-X1.5 軟件(美國Thermo Fisher Scientific 公司)上進(jìn)行分析,得到管家基因和月經(jīng)血特異性標(biāo)志在每份樣本中的檢出情況。
使用SPSS 22.0 軟件(美國IBM 公司)繪制R×C列聯(lián)表,并根據(jù)列聯(lián)表的數(shù)據(jù)計算條件獨立檢驗的單尾P值,以檢驗水準(zhǔn)α=0.01 進(jìn)行Fisher 檢驗。以月經(jīng)血特異性標(biāo)志的檢出情況為獨立的特征屬性,根據(jù)獨立性檢驗的結(jié)果,使用MMP3、MMP7 和MMP11 的檢出情況作為分類依據(jù)。MLR 分類器不受條件獨立性的影響,使用全部5 種標(biāo)志的檢出情況作為分類依據(jù)。將全部數(shù)據(jù)分為月經(jīng)血和非月經(jīng)血。應(yīng)用Wolfram Mathematica 11.3 軟件(美國Wolfram Research公司)對數(shù)據(jù)進(jìn)行NB 和MLR 分類[7]。將收集的樣本檢測數(shù)據(jù)作為已知體液類型的訓(xùn)練集對分類器進(jìn)行訓(xùn)練之后,通過訓(xùn)練好的模型,對訓(xùn)練集進(jìn)行測試,將得到的分類結(jié)果和原有的結(jié)果進(jìn)行對比,計算正確分類的數(shù)目占總數(shù)的比例,得到該模型訓(xùn)練集的準(zhǔn)確率。最后,將已知體液類型的樣本檢測數(shù)據(jù)(測試集)代入分類器,得到不同體液的分類情況,再計算每份樣本返回正確分類的后驗概率(即月經(jīng)血是月經(jīng)血的概率以及外周血、陰道分泌物、精液和唾液是非月經(jīng)血的概率),分別評估模型的可靠性。
6種標(biāo)志成功擴(kuò)增后得到的毛細(xì)管電泳結(jié)果(圖1)顯示,經(jīng)梯度稀釋檢驗,所有標(biāo)志在起始總RNA 量為0.01 ng 時均可檢出,在總RNA 量為0.1 ng 時峰高較為穩(wěn)定。
圖1 6 種標(biāo)志擴(kuò)增產(chǎn)物在0.1 ng RNA 起始量時的毛細(xì)管電泳結(jié)果Fig.1 Capillary electrophoresis results of 6 markers with 0.1 ng RNA input
所有檢測樣本中6種標(biāo)志的擴(kuò)增情況(表2)顯示,5 種特異性標(biāo)志在月經(jīng)血樣本中有較高的檢出率。管家基因B2M 在所有體液中普遍檢出,可作為衡量樣本RNA是否成功提取及進(jìn)行后續(xù)反轉(zhuǎn)錄的依據(jù)。
表2 月經(jīng)血特異性標(biāo)志和管家基因在不同體液樣本中的檢出率Tab.2 Detection rate of menstrual blood specific markers and housekeeping gene in different body fluid samples (%)
5種月經(jīng)血特異性標(biāo)志在86份月經(jīng)血樣本中檢出情況的Fisher 檢驗結(jié)果(表3)顯示,在10 組P值中,MMP3標(biāo)志的檢出獨立于其他4種標(biāo)志,之間的P值均大于0.01。MMP11 和MMP3、MMP7、STC1 3 種標(biāo)志相互獨立。MMP7 只和MMP3、MMP11 兩種標(biāo)志相互獨立。STC1 只和MMP3、MMP11 兩種標(biāo)志相互獨立。PAEP 標(biāo)志的檢出只和MMP3 相互獨立,和其余標(biāo)志均不獨立。
表3 5 個標(biāo)志的Fisher獨立性檢驗P 值Tab.3 P values of the Fisher exact tests for 5 markers
由表4可知,2種方法分類陰道分泌物時準(zhǔn)確率均過低。NB 分類器只判別出8 份陰道分泌物樣本為“非月經(jīng)血”,其余40 份全部被歸類為“月經(jīng)血”。MLR 分類器判別出16份陰道分泌物樣本為“非月經(jīng)血”,其余32份被歸類為“月經(jīng)血”。由于2種分類器未能將陰道分泌物和月經(jīng)血進(jìn)行有效的區(qū)分,降低了分類器的準(zhǔn)確性。外周血、精液和唾液的區(qū)分度較好,MLR 分類器在所有體液中的準(zhǔn)確性均高于NB,超過95%的外周血、精液和唾液被歸類為“非月經(jīng)血”。
表4 2 種分類器對不同體液的分類準(zhǔn)確率Tab.4 Classification accuracy of different body fluids by two classifiers (%)
以1.6 節(jié)中的計算方法計算后驗概率,由表5 可知,這2 種方法得到的后驗概率值較為接近,只有較少的值差異較大。盡管表4 的結(jié)果證明,MLR 分類器分類月經(jīng)血時總體準(zhǔn)確率高于NB,但其計算得到的月經(jīng)血后驗概率普遍低于NB。
表5 2 種分類方法的后驗概率分布信息Tab.5 Posterior probability distribution information of two methods
本研究構(gòu)建的分類器對外周血、精液和唾液的區(qū)分度較好,準(zhǔn)確率普遍超過80%,因此,本研究提出的月經(jīng)血鑒定方法能夠在需要區(qū)分月經(jīng)血與外周血的實際案件中得到較好的應(yīng)用。其中MLR 分類器在所有體液中的準(zhǔn)確性均高于NB 方法,超過95%的外周血、精液和唾液被正確歸類為“非月經(jīng)血”。
NB 方法要求各特征之間相互獨立,對測試集樣本的選擇有較高要求,只有保證志愿者來自多種群體、體液類型足夠多、樣本量足夠大,才能保證測試集樣本的條件獨立性、隨機(jī)性和分布正態(tài)性,使計算結(jié)果更準(zhǔn)確。本研究中只有MMP3、MMP7 和MMP11 這3種標(biāo)志的統(tǒng)計結(jié)果符合要求。在10組P值中,有4組的P值小于0.01,說明標(biāo)志之間并不全部支持條件獨立性的假設(shè)。MLR 法在分類時不需要條件獨立性假設(shè),此方法獲得的后驗概率取決于訓(xùn)練集中不同體液類型的相對頻率。MLR 分類器的準(zhǔn)確性高于NB,不僅與算法本身有關(guān),也有前者使用的特征點(5 種標(biāo)志)多于后者的原因。
本研究選用的各標(biāo)志之間都出現(xiàn)了一定程度的交叉反應(yīng),如MMP3 在除外周血的其他體液斑跡中均有較高的檢出率,特異度較差,而其他標(biāo)志(如MMP11)靈敏度較低、特異度較高。出現(xiàn)上述情況除了與標(biāo)志本身的性質(zhì)有關(guān),也與采樣、擴(kuò)增條件、引物特異性等相關(guān)。提示采用單個標(biāo)志進(jìn)行體液斑跡的組織來源推斷是不可靠的,標(biāo)志數(shù)量增加,檢驗結(jié)果將更加穩(wěn)定、可靠。增加檢驗更多的特異性標(biāo)志,能夠在后續(xù)的統(tǒng)計分析過程中提供更多的特征屬性,以達(dá)到優(yōu)化月經(jīng)血預(yù)測模型、提高RNA檢測準(zhǔn)確性的目的。
5 種月經(jīng)血特異性標(biāo)志在陰道分泌物中檢出率極高,分別為91.67%(MMP3)、91.67%(MMP7)、64.58%(MMP11)、77.08%(PAEP)和91.67%(STC1)。在分類器對陰道分泌物進(jìn)行初步驗證時,準(zhǔn)確率較低。NB分類器只判別出16.67%陰道分泌物樣本為“非月經(jīng)血”,其余83.33%被歸類為“月經(jīng)血”。MLR 分類器判別出33.33%陰道分泌物樣本為“非月經(jīng)血”,其余被歸類為“月經(jīng)血”。本研究結(jié)果提示,盡管月經(jīng)血不完全等同于血與陰道分泌物的混合物,但陰道分泌物在采集時不可避免地混合了一部分子宮內(nèi)膜細(xì)胞,使得在子宮內(nèi)膜中特異性表達(dá)的基因可能在陰道分泌物樣本中被檢出,因此,在檢驗推斷陰道分泌物時,亦可考慮結(jié)合使用月經(jīng)血特異性標(biāo)志。若期望能夠準(zhǔn)確區(qū)分組成成分相近的體液斑跡(如月經(jīng)血和陰道分泌物),則后續(xù)的研究應(yīng)當(dāng)檢測更加細(xì)分的標(biāo)志,為部分復(fù)雜疑難案件的體液斑跡識別(如性侵案件中的月經(jīng)血和陰道破裂出血)提供更有價值的線索。
此外,分類器的分類依據(jù)是后驗概率最高的類別,如當(dāng)月經(jīng)血樣本MMP3、MMP7、MMP11 的檢出情況依次為“+”“+”“-”(即“檢出”“檢出”“未檢出”)時,則NB 分類器算出的后驗概率,有0.503 的概率是“月經(jīng)血”,有0.497 的概率是“非月經(jīng)血”,盡管這樣的樣本最終被歸類為月經(jīng)血,但顯然可信度存疑。為了更準(zhǔn)確地對RNA 檢測結(jié)果進(jìn)行解釋,必須檢驗返回正確分類的后驗概率。計算“月經(jīng)血”與“非月經(jīng)血”2 種類別的后驗概率的比值即可得到類似于DNA 鑒定的似然比,使實際案例中提取到的生物物證具有更高的解釋力。此外,特異性引物只有月經(jīng)血特異,而其他體液只有一個大的分類為“非月經(jīng)血”,因為非月經(jīng)血的體液不只包含上述幾種,先驗概率加起來不為1,而先驗概率無法計算,只能依靠擴(kuò)大樣本量和增加體液種類的方法來減輕該因素的影響。
本研究發(fā)現(xiàn),當(dāng)選擇使用復(fù)合擴(kuò)增體系檢測樣本時,由于不同供者的個體差異,基于固定的引物濃度配比下,其擴(kuò)增的結(jié)果可能會有一定的差異,會出現(xiàn)某個標(biāo)志峰值較低或難以檢測的情形,此時為了謹(jǐn)慎起見,一般會考慮對復(fù)合擴(kuò)增體系下陰性的標(biāo)志作單一標(biāo)志擴(kuò)增檢測,可能會出現(xiàn)單一擴(kuò)增體系檢出的情形。為確保結(jié)果的可靠性,本研究使用了單一擴(kuò)增體系進(jìn)行驗證確認(rèn)的方法。本研究利用兩種統(tǒng)計學(xué)方法,對月經(jīng)血特異性標(biāo)志進(jìn)行統(tǒng)計學(xué)分析,并初步構(gòu)建了分類器,實現(xiàn)了對未知體液斑跡的歸類區(qū)分,從定量的角度解釋了檢驗結(jié)果,為后續(xù)實際案件的應(yīng)用奠定了基礎(chǔ)。在未來的研究中,應(yīng)增加檢驗標(biāo)志的數(shù)量和檢驗樣本的數(shù)量,以獲得更為穩(wěn)定的結(jié)果。