吳艷花, 孫克娜, 代玉玲, 朱惠茹, 陳英劍, 劉曉斐
1.聯(lián)勤保障部隊第九六〇醫(yī)院 檢驗科,山東 濟南 250031;2.濰坊市人民醫(yī)院 檢驗科,山東 濰坊 261053;3.濰坊醫(yī)學院 醫(yī)學檢驗學院,山東 濰坊 261053
結(jié)直腸癌(colorectal cancer,CRC)是全球最常見的消化道惡性腫瘤之一,其病死率高居惡性腫瘤第2位,發(fā)病率居第3位[1-2]。有研究報道,早期CRC治療后5年存活率>95%,甚至可以完全治愈[3]。中國是CRC高發(fā)地區(qū),但85%以上的患者在確診時已屬于中晚期;CRC早期診斷率<10%,明顯落后于日本(1991年,20%)和韓國(2009年,20%)[4-5]。目前,臨床常用的血清學標志物CEA、CA199和CA242診斷CRC的敏感性及特異性均有不足,大多數(shù)學者認為單一腫瘤標志物不能滿足臨床需求,需要聯(lián)合檢測來提高診斷效能[6-7]。因此,為改變我國CRC高發(fā)病率、高病死率和低早期診斷率的現(xiàn)狀,急需尋找更有效的血清學標志物輔助診斷CRC。蛋白質(zhì)組學是一種新型的研究方法,可以動態(tài)、整體、定量觀察疾病發(fā)生發(fā)展中蛋白質(zhì)的種類和數(shù)量的改變,有助于研究者們尋找腫瘤早期診斷和預后的特異性標志物以及藥物治療靶標[8]。基質(zhì)輔助激光解吸電離飛行時間質(zhì)譜(matrix-assisted laser desorption/ionization time-of-flight mass spectrometry,MALDI-TOF MS)是一種新興蛋白質(zhì)組學研究技術(shù),已被證明是一種有價值的癌癥診斷工具[9]。有研究報道,弱陽離子交換磁珠(magnetic bead-weak cation exchange,MB-WCX)對低豐度蛋白質(zhì)具有較好的富集能力[10],與MALDI-TOF MS技術(shù)聯(lián)用,可用于血液、尿液及腦脊液等多種體液標本的分析。多項研究表明,基于該技術(shù)平臺建立的甲狀腺癌、非小細胞肺癌等診斷模型具有良好的診斷效能[11-13]。本研究應用MALDI-TOF MS技術(shù)聯(lián)合MB-WCX對CRC患者與健康者血清蛋白質(zhì)譜圖進行對比分析,篩選出差異蛋白/多肽,建立CRC診斷預測模型并進行初步驗證,尋找可用于CRC診斷的潛在血清學標志物,旨在提高CRC早期診斷水平,改善患者預后?,F(xiàn)報道如下。
1.1 一般資料 選取自2018年12月至2020年12月就診于聯(lián)勤保障部隊960醫(yī)院的114例CRC初診患者設為CRC組,其中,男性60例,女性54例;年齡40~78歲,平均年齡(62.19±10.55)歲。納入標準:(1)初次行CRC治療,未經(jīng)過手術(shù)、放化療及抗癌藥物治療;(2)經(jīng)病理組織學確診;(3)具有完整的臨床資料;(4)在收集血清前1個月內(nèi)未接受過輸血。排除標準:(1)合并有其他惡性腫瘤;(2)患有免疫系統(tǒng)疾病及傳染性疾病;(3)肝腎功能不全。另選取同期來院做健康查體的各項指標均正常且無既往史的60例健康體檢者設為健康組,其中,男性36例,女性24例;年齡32~79歲,平均年齡(59.75±11.45)歲。健康組與CRC組的年齡、性別比例比較,差異均無統(tǒng)計學意義(P>0.05),具有可比性。將收集的血清樣本分別按照3∶1的比例隨機分為訓練組和驗證組,分組結(jié)果如下:訓練組131例(CRC患者87例,健康者44例);驗證組43例(CRC患者27例,健康者16例)。訓練組用于建立CRC診斷模型,驗證組用于診斷模型敏感性、特異性及準確性的驗證。本研究獲得醫(yī)院科研倫理委員會批準。所有研究對象均對本研究知情同意。
1.2 儀器與試劑 Autoflex Speed MALDI-TOF MS、Flex Control軟件、ClinPro Tools軟件;MTP An-chorip 384 BC靶板、蛋白多肽標準品(Bruker公司)、低溫高速離心機(Eppendorf公司)、磁珠分離器(Lifer Technologies公司);MB-WCX 試劑盒(Bruker公司)、α-氰基-4羥基肉桂酸(a-cyano-4-hydroxycinnamic acid,HCCA)、三氟乙酸(trifluoroacetic acid,TFA)、乙腈(acetonitrile,ACN)、色譜級無水乙醇、丙酮(Sigma-Aldrich 公司)。
1.3 血清蛋白的提取 采集受試者空腹靜脈血4 ml置于含惰性分離膠的真空采血管中,避免標本溶血。分離血清,于-80℃保存。實驗前將凍存的血清標本逐步復融(-20℃放置8 h,4℃放置4 h或至標本完全融化)。應用Bruker公司MB-WCX試劑盒提取蛋白質(zhì)/多肽。為保證檢測結(jié)果的一致性,所有標本同時復融,同時進行蛋白提取。
1.4 MALDI-TOF MS檢測樣本 取1 μl蛋白質(zhì)/多肽樣本點樣于Anchor-Chip 384 BC靶板上,自然干燥,每份樣本點靶3次,用于評估方法的穩(wěn)定性;將1 μl基質(zhì)(6 mg HCCA,50% ACN,2% TFA)點樣于已干燥的樣本點上,室溫干燥后,上機檢測,采集質(zhì)譜圖并分析。應用Flex Control軟件檢測,參數(shù)設置:采用陽離子線性模式,在相對分子質(zhì)量1 000~15 000范圍內(nèi)采集數(shù)據(jù),激光強度75%,每個樣品點累積轟擊100×10次。
1.5 儀器校準與質(zhì)量控制 在上機檢測前使用蛋白質(zhì)/多肽混合標準品對儀器進行校準。隨機選取30份健康者的血清標本,每份血清標本各取5 μl混勻,使用MB-WCX試劑盒提取蛋白質(zhì)/多肽作為實驗的質(zhì)控品。在點樣過程中,每隔15個樣本點加1個質(zhì)控品點,檢測后分析所獲得的蛋白質(zhì)/多肽質(zhì)譜圖,用于評估質(zhì)譜儀是否處于正常的檢測狀態(tài)。
1.6 統(tǒng)計學方法 將采集的數(shù)據(jù)導入Flex Analysis 3.4軟件進行處理,經(jīng)基線去除、平滑、歸一化等處理,剔除1 000 Da以下的峰,以排除基質(zhì)峰干擾。選取信噪比≥5的峰做統(tǒng)計分析。通過Clinpro Tools 3.0軟件分析兩組間差異蛋白峰,分析范圍為1~10 kDa,篩選出具有統(tǒng)計學差異的蛋白峰(P<0.05),并獲得每個差異峰的受試者工作特征(receiver operating characteristic,ROC)曲線及曲線下面積(area under the curve,AUC),計算兩組間差異蛋白的平均峰下面積和平均峰值強度。分別采用遺傳算法(genetic algorithm,GA)、監(jiān)督神經(jīng)網(wǎng)絡(supervised neural network,SNN)算法和快速分類(quick classification,QC)算法建立診斷模型,綜合分析選擇最佳診斷模型。選擇差異最顯著的兩個峰分別為X、Y軸做聚類分析,用驗證組驗證該模型的敏感性、特異性及準確性。
2.1 質(zhì)量控制結(jié)果分析 通過對質(zhì)控品點的檢測,得到12個質(zhì)控點的質(zhì)譜圖,從每張圖中隨機選取6個穩(wěn)定質(zhì)譜峰進行分析,結(jié)果得到各個多肽峰的平均變異系數(shù)為17.84%(表1),這表明質(zhì)譜儀在整個檢測過程中重復穩(wěn)定性較好,符合實驗要求。
表1 6個質(zhì)控質(zhì)譜峰的平均變異系數(shù)
2.2 CRC組與健康組血清差異蛋白質(zhì)/多肽分析 CRC組和健康組間蛋白質(zhì)/多肽質(zhì)譜圖存在明顯差異(圖1)。共篩選出差異蛋白峰117個,其中,79個峰差異有統(tǒng)計學意義(P<0.05)。對篩選出的79個蛋白峰進一步做ROC曲線分析得到AUC>0.70且DAve≥5.0的質(zhì)譜峰有9個(表2),其中,在CRC組表達上調(diào)7個,表達下調(diào)2個。蛋白峰m/z 4645.32和m/z 5906.48差異最顯著(P<0.01),AUC分別為0.91、0.76,其中,m/z 4645.32在CRC組表達下調(diào),m/z 5906.48表達上調(diào)(圖2)。將訓練組所有樣本的三維譜圖堆疊,可見上述兩個峰在CRC組的表達趨勢(圖3)。
圖1 CRC組和健康組的血清蛋白質(zhì)/肽指紋圖譜(紅色代表CRC組,綠色代表健康組)
圖2 疊加譜峰圖與ROC曲線(a.m/z 4645.32的疊加譜峰圖;b.m/z 4645.32的ROC曲線圖;c.m/z 5906.48的疊加譜峰圖;d.m/z 5906.48的ROC曲線圖;紅色代表CRC組,綠色代表健康組) 圖3 三維堆疊譜圖(a.m/z 4645.32的堆疊譜圖;b.m/z 5906.48的堆疊譜圖;紅色代表CRC組,綠色代表健康組)
表2 CRC組與健康組之間的差異蛋白/多肽
2.3 CRC診斷模型的建立及驗證 采用GA、SNN和QC 3種不同的運算分析方法建立診斷預測模型。應用驗證組進行外部盲法驗證,得出了每個模型的識別能力和交叉驗證能力。綜合比較SNN診斷模型分類能力最佳。見表3。以m/z 4645.32和m/z 5906.48分別為X、Y軸做聚類分析,發(fā)現(xiàn)CRC組和健康組樣本基本無交叉,可被明顯區(qū)分。將驗證組43例蛋白圖譜導入診斷模型進行驗證,結(jié)果顯示,27例CRC患者均被正確判別;16例健康者中正確判別15例,錯誤判別1例。見圖4。該診斷模型敏感性為92.6%,特異性為81.25%,準確性為88.37%。
圖4 聚類分析圖[a.驗證組中CRC患者圖(黑色);b.驗證組中健康者圖(黑色);紅色為訓練組CRC患者;綠色為訓練組健康者]
表3 3種診斷模型的診斷表現(xiàn)
蛋白質(zhì)組學是對細胞整體水平蛋白質(zhì)屬性的研究,包括表達水平、轉(zhuǎn)錄后修飾、翻譯后加工、相互作用等,在蛋白質(zhì)水平上獲得關(guān)于疾病發(fā)生、細胞代謝等過程整體而全面的認識,有助于研究者們尋找腫瘤早期診斷和預后的特異性標志物以及藥物治療靶標[14]。但是,蛋白質(zhì)組學作為一個完整系統(tǒng),其特性和活動在很大程度上仍然難以解釋。近年來,MALDI-TOF MS作為精準醫(yī)學發(fā)展的新技術(shù),因高準確度、高靈敏度和高通量等優(yōu)點,在蛋白質(zhì)組學研究中應用越來越廣泛[15]。
傳統(tǒng)的二維凝膠電泳技術(shù)操作復雜,重復穩(wěn)定性差,對小分子量、低豐度蛋白質(zhì)分離效果較差[16]。而MB-WCX對血清中低豐度蛋白/多肽富集能力強[17],可消除大分子多肽的干擾,具有簡單快速和高敏感性等優(yōu)點,已成為研究蛋白質(zhì)組學強有力的方法。前期筆者基于MALDI-TOF MS平臺聯(lián)合MB-WCX方法已建立了非小細胞肺癌、甲狀腺癌、食管癌、胃癌、子宮內(nèi)膜癌的診斷預測模型,為血清學腫瘤標志物的篩選奠定了基礎[11-12,18-20]。
目前,基于MALDI-TOF MS技術(shù)對CRC的研究已有相關(guān)報道,但尚未發(fā)現(xiàn)可應用于臨床診斷的特異性血清學標志物。段寶軍等[21]采用與本研究相同的提取和檢測方法,在CRC患者血清中發(fā)現(xiàn)12個具有統(tǒng)計學差異的質(zhì)譜峰,其中,多個質(zhì)譜峰與本研究的質(zhì)譜峰相近,如m/z 5343.48與m/z 5338.60,m/z 5070.95、m/z 5085.73與m/z 5161.99;與之不同的是,本研究未直接采用GA算法而是對3種運算方法(GA、SNN和QC)對比分析和驗證,選用了分類能力較佳的SNN算法建立的診斷預測模型。王秀麗等[22]研究確立了以m/z為759、3316、4645、4248和2645等5個蛋白質(zhì)所組成的模型,可正確地將CRC患者與健康者分組,準確率達97%;其發(fā)現(xiàn)的m/z 4645與本研究m/z 4645.32相一致,間接說明了MALD-TOF MS技術(shù)的可行性和可重復性。Hao等[23]也發(fā)現(xiàn)了存在顯著性差異的5個質(zhì)譜峰(m/z 1895.3、2020.9、2080.7、2656.8和3238.5),基于差異峰建立的診斷預測模型準確性為91.8%,敏感性為95.6%,特異性為87.9%;與本研究發(fā)現(xiàn)的差異峰(2106.05、3096.67、4055.26、4092.33、4645.32、5161.99、5338.60、5906.48和9289.64)幾乎無重疊,原因可能在于標本量較少,來源于單中心,可能存在選擇偏倚。后續(xù)將擴大樣本量,細化分組,對各年齡、各民族進行統(tǒng)計分析,進一步對該診斷預測模型的診斷效能進行評估。此外,還需要進一步豐富試驗內(nèi)容,通過高效液相色譜-電噴霧串聯(lián)質(zhì)譜法對所篩選出的差異蛋白/多肽峰進行鑒定,基于蛋白質(zhì)或基因表達水平對鑒定的差異蛋白進行分析驗證。
綜上所述,本研究建立的SNN診斷模型具有較好的敏感性、特異性和準確性,可準確地區(qū)分健康人與CRC患者,有望用于CRC高危人群的篩查及輔助診斷。篩選出的差異蛋白質(zhì)譜峰m/z 4645.32和m/z 5906.48有望成為CRC的潛在血清學標志物。