張旭東,姜垚如,梁芯瑞,田甜,靳茜茜,張小紅,曹潔,杜秋香,孫俊紅
1.山西醫(yī)科大學(xué)法醫(yī)學(xué)院,山西 晉中 030600;2.禹州市公安局,河南 禹州 452570;3.四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院,四川 成都 610041;4.鄒平市公安局,山東 鄒平 256200
準(zhǔn)確推斷死亡時(shí)間(postmortem interval,PMI)是法醫(yī)學(xué)實(shí)踐中的一個(gè)關(guān)鍵問題,死后相關(guān)生物技術(shù)分析可為其提供重要、可靠的數(shù)據(jù)。法醫(yī)昆蟲學(xué)[1]或形態(tài)學(xué)[2]分析可為死亡時(shí)間推斷提供基礎(chǔ)依據(jù),但因易受外界復(fù)雜環(huán)境的影響,存在一定的局限性和不穩(wěn)定性。
隨著生物技術(shù)的發(fā)展,研究者們愈發(fā)關(guān)注生物大分子如RNA[3-4]、DNA[5-6]或蛋白質(zhì)[7-8]的死后變化。近年來,機(jī)體死后骨骼肌蛋白質(zhì)降解的相關(guān)研究取得了重大進(jìn)展。在標(biāo)準(zhǔn)化動(dòng)物模型中,可通過十二烷基硫酸鈉-聚丙烯酰胺凝膠電泳(sodium dodecyl sulfonate-polyacrylamide gel electrophoresis,SDS-PAGE)和Western 印跡分析,發(fā)現(xiàn)如蛋白磷酸酶2A、結(jié)蛋白、肌鈣蛋白[7-8]等特定蛋白質(zhì)的降解模式。此外,死后變化如天然蛋白條帶的丟失或特定降解產(chǎn)物的出現(xiàn),與死亡時(shí)間顯著相關(guān)[9]。
利用蛋白質(zhì)芯片毛細(xì)管電泳進(jìn)行蛋白質(zhì)分離,具有快速、準(zhǔn)確、靈敏等優(yōu)勢(shì)[10]。2100 生物分析儀(美國(guó)Agilent 公司)集成多個(gè)實(shí)驗(yàn)程序,包括樣品處理、分離染色、脫色、檢測(cè)和分析,在其基礎(chǔ)上結(jié)合蛋白質(zhì)芯片,可分析多種蛋白質(zhì)樣品。目前,蛋白質(zhì)表達(dá)譜的應(yīng)用主要集中在臨床疾病檢驗(yàn)、藥物研制及物種鑒定等領(lǐng)域[11]。
本研究收集死后不同時(shí)間點(diǎn)大鼠骨骼肌及人體骨骼肌樣本,采用蛋白質(zhì)芯片檢測(cè)技術(shù)獲取死后蛋白質(zhì)表達(dá)譜,通過多維統(tǒng)計(jì)方法,探索蛋白質(zhì)含量變化與死亡時(shí)間的關(guān)系,建立死亡時(shí)間預(yù)測(cè)模型,為死亡時(shí)間推斷提供新的思路和技術(shù)支持。
健康成年雄性SD 大鼠8 只,10~12 周齡,體質(zhì)量200~230 g,由山西醫(yī)科大學(xué)實(shí)驗(yàn)動(dòng)物中心提供。溫室飼養(yǎng)2 d,腹腔注射20%烏拉坦(1 g/kg,北京索萊寶科技有限公司)麻醉后頸椎脫臼處死,死后放入16 ℃人工氣候箱。于死后0 d、1 d、2 d、3 d、4 d、5 d、6 d、7 d、8 d 和9 d 分別取每只大鼠右后肢腓腸?。?00±2)mg,重復(fù)收集大鼠的肌肉組織樣本,每次收集后保持皮膚覆蓋,共收集80份樣本。樣本于液氮速凍后放入-80 ℃冰箱待檢。
收集2021 年山西醫(yī)科大學(xué)司法鑒定中心9 例不同死亡時(shí)間人體骨骼肌樣本,按序編為1~9 號(hào),其中3 例經(jīng)冷藏(計(jì)算死亡時(shí)間時(shí)除去尸體冷藏時(shí)間),樣本信息詳見表1。樣本均為無損傷、無出血的胸大肌,每份肌肉組織為(200±2)mg,于液氮速凍后放入-80 ℃冰箱待檢。
表1 9 例人體樣本的詳細(xì)信息Tab.1 Details of 9 human cadaver samples
本研究已獲得山西醫(yī)科大學(xué)科學(xué)研究倫理審查委員會(huì)批準(zhǔn)(審批文號(hào):2020LL149)。
將大鼠和人體的骨骼肌在液氮中研磨至粉末狀后置入微量離心管,同時(shí)將蛋白酶抑制劑苯甲基磺酰氟(phenylmethylsulfonyl fluoride,PMSF;武漢博士德生物工程有限公司)與純水按1∶3.5的質(zhì)量濃度比(kg/L)加入離心管,冰上孵育1 h,以12 000×g離心20 min,吸取上清液400 μL 分裝備用。
從每只大鼠10 個(gè)時(shí)間點(diǎn)的蛋白上清液中各取50 μL,混勻制成400 μL 的質(zhì)量控制(quality control,QC)樣本,共8 份。
根據(jù)蛋白質(zhì)230 試劑盒(美國(guó)Agilent 公司)說明書在4 μL 樣本中加入2 μL 變性劑,將樣本溶液和Ladder 置入100 ℃水浴中加熱5 min,再加入84 μL 去離子水進(jìn)一步稀釋,從稀釋液中取6 μL 加載到蛋白質(zhì)芯片相應(yīng)的孔道中。
每個(gè)芯片加載10 個(gè)樣本,然后將芯片置于2100生物分析儀中進(jìn)行分析,20~30 min 后,獲取每個(gè)樣本相對(duì)分子質(zhì)量為14 000~230 000 的水溶性蛋白質(zhì)表達(dá)譜數(shù)據(jù)。
采用2100 Expert 軟件(美國(guó)Agilent 公司)獲取大鼠和人體骨骼肌蛋白質(zhì)凝膠電泳圖和電泳色譜圖。根據(jù)內(nèi)標(biāo)“l(fā)ower marker”和“upper marker”對(duì)電泳色譜進(jìn)行定標(biāo)識(shí)別,并對(duì)峰位進(jìn)行校正調(diào)整。為消除雜質(zhì)干擾,去除熒光強(qiáng)度在10 FU 以下的峰[12]。將遷移時(shí)間(相對(duì)分子質(zhì)量大?。┗疽恢碌姆逵洖橄嗤幪?hào),對(duì)峰含量進(jìn)行歸一化處理。
使用SPSS 22.0 軟件(美國(guó)IBM 公司)對(duì)8 份QC樣本進(jìn)行單因素方差分析,檢驗(yàn)組間是否存在差異;再行多重比較最小顯著性差異(least significant difference,LSD)檢驗(yàn),分析QC 樣本是否存在差異。采用SIMCA 14.1 軟件(瑞典Umetrics 公司)對(duì)死后各時(shí)間點(diǎn)大鼠骨骼肌樣本的峰高數(shù)據(jù)進(jìn)行主成分分析(principal component analysis,PCA)降維,結(jié)合正交偏最小二乘(orthogonal partial least squares,OPLS)判別分析死后各時(shí)間點(diǎn)之間的差異,其中R2、Q2表示模型的解釋能力和預(yù)測(cè)能力,R2、Q2終點(diǎn)越接近,同時(shí)Q2回歸直線與Y軸有負(fù)截距,說明模型有效,無過度擬合現(xiàn)象。R2X、R2Y分別為模型對(duì)自變量X、因變量Y的解釋能力。當(dāng)Q2>0.5 且與R2Y差值不超過±0.3 時(shí),認(rèn)為模型有效、數(shù)據(jù)可靠[13],用基于交互驗(yàn)證的方差分析(cross validation-analysis of variance,CV-ANOVA)檢驗(yàn)死后不同時(shí)間點(diǎn)樣本間的差異。采用SPSS Clementine 12.0 軟件(美國(guó)IBM 公司)分別建立Fisher 判別模型和反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)模型,對(duì)死后不同時(shí)間點(diǎn)大鼠骨骼肌樣本進(jìn)行分類預(yù)測(cè),隨機(jī)選取70%的數(shù)據(jù)作為訓(xùn)練集、30%的數(shù)據(jù)作為測(cè)試集,分別獲取兩個(gè)模型的內(nèi)部交叉驗(yàn)證準(zhǔn)確率及外部驗(yàn)證準(zhǔn)確率,同時(shí)以混淆矩陣總結(jié)BP模型的預(yù)測(cè)能力。使用Morpheus分析軟件(https://clue.io/morpheus/)對(duì)人體骨骼肌蛋白質(zhì)中各峰的含量進(jìn)行熱圖及聚類分析。檢驗(yàn)水準(zhǔn)α=0.05。
2.1.1 大鼠骨骼肌蛋白質(zhì)譜峰特征及差異性
QC 樣本的單因素方差分析及多重比較結(jié)果表明,組間差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。
死后不同時(shí)間點(diǎn)蛋白質(zhì)的譜峰形狀相近,多數(shù)峰位置一致但峰高不同(圖1A~B);凝膠電泳圖中各條帶隨死亡時(shí)間的延長(zhǎng)有所變化(圖1C),在保留時(shí)間24 s 時(shí),死后0 d 與9 d 蛋白條帶存在明顯差異。在死后0~9 d 的所有蛋白質(zhì)樣本中共識(shí)別出25 個(gè)峰(按序編號(hào)為1~25),各峰含量(蛋白質(zhì)相對(duì)分子質(zhì)量)在死后不同時(shí)間點(diǎn)具有差異性,峰10 在死后0~3 d 含量較高,而在死后4~9 d 含量逐漸減少,同時(shí)某些峰(如峰14)在死后0~9 d 的含量始終維持較高的水平(圖1D)。
圖1 死后不同時(shí)間點(diǎn)大鼠骨骼肌蛋白質(zhì)的表達(dá)Fig.1 Protein expression of rat skeletal muscles at different time points after death
PCA 模型指標(biāo)良好(R2=0.866,Q2=0.654),可解釋大部分的數(shù)據(jù)變異(圖2)。死后不同時(shí)間點(diǎn)大鼠骨骼肌蛋白質(zhì)譜峰隨死亡時(shí)間的延長(zhǎng)呈一定的聚集趨勢(shì),但模型為無監(jiān)督學(xué)習(xí),部分死亡時(shí)間段內(nèi)差異不能完全顯現(xiàn),需進(jìn)一步分析。
圖2 死后不同時(shí)間點(diǎn)大鼠骨骼肌蛋白質(zhì)譜峰的PCA 模型Fig.2 PCA model of rat skeletal muscle protein peaks at different time points after death
組間OPLS 判別分析發(fā)現(xiàn),死后0 d、1 d、2 d、3 d、4 d、5 d 和9 d 兩兩時(shí)間點(diǎn)間均可分離,模型R2、Q2值均大于0.5,且CV-ANOVA 結(jié)果顯示各組間差異均有統(tǒng)計(jì)學(xué)意義(P<0.05);6 d、7 d、8 d 3 個(gè)時(shí)間點(diǎn)間較難分離且CV-ANOVA 中P>0.05。
2.1.2 死亡時(shí)間預(yù)測(cè)模型
對(duì)80 份大鼠骨骼肌蛋白質(zhì)樣本進(jìn)行Fisher 判別分析,典型判別函數(shù)圖顯示死后10 個(gè)時(shí)間點(diǎn)分離效果尚可(圖3A),但部分樣本存在重疊交叉現(xiàn)象,模型內(nèi)部交叉驗(yàn)證和外部驗(yàn)證的準(zhǔn)確率分別為71.4%和66.7%,準(zhǔn)確率較低。
圖3 大鼠骨骼肌蛋白質(zhì)樣本的死亡時(shí)間預(yù)測(cè)模型Fig.3 Prediction model of postmortem interval in protein samples from rat skeletal muscles
以蛋白質(zhì)樣本為數(shù)據(jù)節(jié)點(diǎn)、死亡時(shí)間為輸出節(jié)點(diǎn)、25 個(gè)峰為輸入節(jié)點(diǎn)的BP 神經(jīng)網(wǎng)絡(luò)模型中,內(nèi)部交叉驗(yàn)證和外部驗(yàn)證的準(zhǔn)確率分別為98.2%和95.8%,以混淆矩陣結(jié)合散點(diǎn)圖判斷BP 神經(jīng)網(wǎng)絡(luò)模型分類預(yù)測(cè)結(jié)果中,行代表預(yù)測(cè)時(shí)間點(diǎn),列代表實(shí)際時(shí)間點(diǎn),發(fā)現(xiàn)在5 d、7 d 各有1 例錯(cuò)判(圖3B)。
經(jīng)兩種模型的比較,BP 神經(jīng)網(wǎng)絡(luò)模型具有良好的穩(wěn)定性和對(duì)未知樣本的預(yù)測(cè)能力。
將人體骨骼肌蛋白質(zhì)樣本中識(shí)別出的16 個(gè)峰按序標(biāo)記為a~p,發(fā)現(xiàn)各峰形狀、位置基本一致(圖4A)。案例1(死后4 d)樣本的個(gè)別峰與其余8 例略有差異,其峰識(shí)別個(gè)數(shù)最少(10 個(gè)),案例6(死后22 h)樣本的峰識(shí)別個(gè)數(shù)最多(13 個(gè))。
圖4 死后人體骨骼肌蛋白質(zhì)的表達(dá)Fig.4 Protein expression of human skeletal muscles after death
進(jìn)一步探究人體蛋白質(zhì)譜峰含量在不同死亡時(shí)間點(diǎn)的分布狀態(tài)和規(guī)律,對(duì)樣本數(shù)據(jù)進(jìn)行熱圖分析,發(fā)現(xiàn)不同譜峰含量隨死亡時(shí)間的延長(zhǎng)發(fā)生變化,如峰a 含量隨時(shí)間的延長(zhǎng)而增加,峰e(cuò) 含量呈現(xiàn)先減少后增加的趨勢(shì),峰i 與峰e(cuò) 趨勢(shì)相反。根據(jù)峰含量對(duì)死亡時(shí)間進(jìn)行聚類,發(fā)現(xiàn)死后4 d 的蛋白質(zhì)樣本與死后25 h 內(nèi)的蛋白質(zhì)樣本明顯分離,各峰含量隨死亡時(shí)間的延長(zhǎng)呈一定的時(shí)序性變化(圖4B)。
死后機(jī)體蛋白質(zhì)隨死亡時(shí)間延長(zhǎng)而降解,其降解過程為基于蛋白質(zhì)降解的死亡時(shí)間推斷提供了可靠的證據(jù)[9,14]。蛋白質(zhì)的測(cè)定和分析多采用Western 印跡、質(zhì)譜和免疫組織化學(xué)等方法[15-17];腎、肺、肝,尤其是骨骼肌,常作為蛋白質(zhì)降解的研究對(duì)象[16]??紤]到死后機(jī)體內(nèi)環(huán)境的相互作用對(duì)蛋白質(zhì)的影響,多指標(biāo)聯(lián)合研究可能更全面、精準(zhǔn)。LI 等[15,18]利用質(zhì)譜技術(shù)發(fā)現(xiàn)死后蛋白質(zhì)表達(dá)與死亡時(shí)間具有相關(guān)性,為死亡時(shí)間推斷提供了新思路。然而質(zhì)譜分析成本昂貴,操作流程復(fù)雜且嚴(yán)格,在一定程度上限制了其實(shí)際應(yīng)用。
2100 生物分析儀基于微流控毛細(xì)管電泳技術(shù),可對(duì)蛋白質(zhì)進(jìn)行高通量的自動(dòng)化分析。蛋白質(zhì)230試劑盒可用于分離和分析相對(duì)分子質(zhì)量為14 000~230 000 的蛋白質(zhì),分辨率為10%[12],與傳統(tǒng)的SDSPAGE 相比具有易于處理、可重復(fù)性及環(huán)保等優(yōu)點(diǎn)[11]。李文晉等[12]利用蛋白質(zhì)芯片檢測(cè)技術(shù)高通量、準(zhǔn)確、便捷等特性,獲取死后大鼠肝組織蛋白質(zhì)表達(dá)譜,推測(cè)其與死亡時(shí)間的關(guān)系。
本研究使用蛋白質(zhì)芯片檢測(cè)技術(shù)對(duì)大鼠骨骼肌蛋白質(zhì)進(jìn)行檢測(cè),結(jié)果顯示,不同死亡時(shí)間的蛋白質(zhì)芯片譜峰及峰含量具有差異,其變化趨勢(shì)和程度不同。PCA 是一種數(shù)據(jù)降維方法,可利用較少的綜合指標(biāo)來解釋原始變量信息[19-20]。本研究中PCA 結(jié)果顯示,死后不同時(shí)間點(diǎn)大鼠骨骼肌蛋白質(zhì)譜峰分布有一定趨勢(shì),但不能完全體現(xiàn)組間差異。OPLS 判別分析是將連續(xù)變量數(shù)據(jù)分為預(yù)測(cè)信息和不相關(guān)信息,使結(jié)果更易解釋和可視化[21]。本研究對(duì)死后不同時(shí)間點(diǎn)的蛋白質(zhì)表達(dá)進(jìn)行OPLS 判別分析發(fā)現(xiàn),除死后6 d、7 d 和8 d 外,其余7 個(gè)時(shí)間點(diǎn)間差異均有統(tǒng)計(jì)學(xué)意義(P<0.05),可能與蛋白質(zhì)降解產(chǎn)物類型、降解速率及個(gè)體差異等因素有關(guān)。
Fisher 判別模型按分類能力提取特征,具有很強(qiáng)的數(shù)據(jù)壓縮能力[22-23],本研究死亡時(shí)間預(yù)測(cè)模型效果不理想,考慮Fisher 判別對(duì)線性不可分樣本無法準(zhǔn)確分類,因此需選擇更適合的數(shù)據(jù)分析方法。BP 神經(jīng)網(wǎng)絡(luò)作為一種應(yīng)用廣泛的多層前饋神經(jīng)網(wǎng)絡(luò),無需具體的數(shù)學(xué)模型,同時(shí)因其良好的穩(wěn)定性、準(zhǔn)確性和快速運(yùn)算能力,在解決復(fù)雜非線性關(guān)系方面具有優(yōu)勢(shì),有很高的實(shí)際應(yīng)用價(jià)值[24]。本研究中BP 神經(jīng)網(wǎng)絡(luò)模型分析僅在死后5 d 和7 d 各有1 例錯(cuò)判。對(duì)比Fisher 判別模型和BP 神經(jīng)網(wǎng)絡(luò)模型的外部驗(yàn)證準(zhǔn)確率,BP 神經(jīng)網(wǎng)絡(luò)模型對(duì)本研究死亡時(shí)間的預(yù)測(cè)可達(dá)到較為理想的效果,更適用于多指標(biāo)聯(lián)合推斷死亡時(shí)間的研究。
本研究對(duì)大鼠樣本進(jìn)行PCA 及OPLS 判別分析發(fā)現(xiàn),蛋白質(zhì)表達(dá)譜隨死亡時(shí)間的延長(zhǎng)呈時(shí)序性變化,死亡時(shí)間分類預(yù)測(cè)模型具有較高準(zhǔn)確率,與李文晉等[12]前期發(fā)現(xiàn)的肝組織蛋白質(zhì)不同死亡時(shí)間變化規(guī)律相一致?;趧?dòng)物樣本分析結(jié)果,本研究收集人體骨骼肌蛋白質(zhì)樣本,發(fā)現(xiàn)不同死亡時(shí)間的芯片譜峰存在差異,譜峰含量隨死亡時(shí)間的延長(zhǎng)發(fā)生變化。根據(jù)譜峰含量對(duì)死亡時(shí)間進(jìn)行聚類分析,發(fā)現(xiàn)樣本在死后4 d 和25 h 兩個(gè)時(shí)間點(diǎn)明顯區(qū)分,各峰含量亦隨死亡時(shí)間延長(zhǎng)呈現(xiàn)一定變化,說明蛋白質(zhì)芯片檢測(cè)技術(shù)可應(yīng)用于動(dòng)物和人體樣本的死亡時(shí)間研究。此外,人體樣本死亡時(shí)間多在25 h 內(nèi),時(shí)間跨度小,且受死亡原因、現(xiàn)場(chǎng)環(huán)境條件和死后保存條件等多種因素影響,信息較為復(fù)雜?;诙喾矫嬉蛩氐挠绊?,本研究未能建立人體死亡時(shí)間推斷的數(shù)學(xué)模型。
綜上所述,蛋白質(zhì)芯片檢測(cè)技術(shù)可快速、準(zhǔn)確、高重復(fù)性地獲取死后不同時(shí)間點(diǎn)動(dòng)物和人體骨骼肌組織相對(duì)分子質(zhì)量為14 000~230 000 的水溶性蛋白質(zhì)表達(dá)譜,結(jié)合PCA、OPLS 多維統(tǒng)計(jì)方法探索死后蛋白質(zhì)表達(dá)與死亡時(shí)間之間的變化規(guī)律,建立多種死亡時(shí)間推斷模型,其中BP 神經(jīng)網(wǎng)絡(luò)更適于多指標(biāo)聯(lián)合死亡時(shí)間推斷,可為死亡時(shí)間推斷提供新的思路和方法。本研究在實(shí)驗(yàn)動(dòng)物模型的制備上盡可能模擬實(shí)際情況,如設(shè)置多個(gè)死后時(shí)間點(diǎn)、增加多種死亡原因、尸體冷藏等處理方法,后續(xù)將擴(kuò)大尸體樣本的收集,完善相關(guān)信息,以期建立基于真實(shí)案例下的人體死亡時(shí)間蛋白質(zhì)信息庫。