彭湘旎,鐘洋,王一任
(1.湖南師范大學(xué)附屬中學(xué),湖南 長沙 410006;2.湘潭大學(xué) 數(shù)學(xué)與計算科學(xué)學(xué)院,湖南 湘潭411105;3.中南大學(xué) 湘雅公共衛(wèi)生學(xué)院,湖南 長沙 410078)
預(yù)后指數(shù)累計分布曲線拐點分析在卵巢癌患者預(yù)后分類中的運用*
彭湘旎1,鐘洋2,王一任3
(1.湖南師范大學(xué)附屬中學(xué),湖南 長沙 410006;2.湘潭大學(xué) 數(shù)學(xué)與計算科學(xué)學(xué)院,湖南 湘潭411105;3.中南大學(xué) 湘雅公共衛(wèi)生學(xué)院,湖南 長沙 410078)
目的了解卵巢癌(O VC A)患者的預(yù)后,幫助臨床醫(yī)師對O VC A患者制定科學(xué)合理的治療方案。方法利用多重逐步C ox比例風(fēng)險回歸模型分析R N As表達數(shù)據(jù),建立O VC A患者的預(yù)后指數(shù)(PI)模型。依據(jù)PI分布曲線的拐點,將O VC A患者分為高危組和低危組。結(jié)果由10個R N As表達數(shù)據(jù)計算得到PI值的累計分布曲線,有1個拐點(278.00,-0.780)。將552例O VC A患者分為高危組和低危組,中位生存時間分別為1 678 和1 058 d。經(jīng)Log-rank檢驗,兩組間生存率比較,差異有統(tǒng)計學(xué)意義(χ2=46.365,P=0.000),低危組生存率高于高危組。實例分析表明,利用PI曲線拐點對O VC A患者預(yù)后進行分類,具有較好的分類效果。結(jié)論用累計分布曲線拐點方法建立O VC A患者的預(yù)后分類模型,能進行很好分類,為O VC A患者的治療和管理提供新的科學(xué)依據(jù)。
生存分析;預(yù)后指數(shù);拐點;卵巢癌
卵巢癌(vari an cancer,OVCA)病死率居婦科惡性腫瘤的首位,其病理類型復(fù)雜,起病隱匿,缺乏特異性癥狀,尚無有效的早期診斷措施。初次診斷的患者中,晚期病例占70%左右。在臨床治療中,個體化程度低,療效差,導(dǎo)致卵巢癌患者的復(fù)發(fā)率高,5年生存率徘徊在20%~30%[1-2]。因此,積極尋找卵巢癌預(yù)后相關(guān)因素,通過控制預(yù)后因素和給予患者精準的個體化治療,以減少復(fù)發(fā)和延長患者的生存時間顯得尤為重要。準確預(yù)測卵巢癌患者的預(yù)后成為進行個體化治療的基礎(chǔ)。卵巢癌的獨立預(yù)后影響因子主要包括:國際婦產(chǎn)科協(xié)會(Federat i on Int ernat i onal of Gynecol ogy and Obst et ri cs,F(xiàn)IGO)分期、病理類型、腫瘤分化程度和殘余腫瘤大小等。除此以外,腫瘤相關(guān)基因即腫瘤分子標志物對卵巢癌預(yù)后的預(yù)測價值不容忽視[3-5]。在以往的卵巢癌流行病學(xué)研究中,研究者通常把重點放在單一預(yù)后因素的比較分析上[2]。本研究擬采用綜合指標——預(yù)后指數(shù)(prognosi si ndex,PI)綜合分析卵巢癌相關(guān)腫瘤分子標志物的表達水平,結(jié)合累計分布曲線拐點分析,對卵巢癌患者預(yù)后的分類進行預(yù)測。預(yù)后指數(shù)為Cox比例風(fēng)險回歸模型(以下簡稱Cox回歸模型)中反映患者個體預(yù)后情況的指標,具有足夠的預(yù)后效能,能幫助臨床醫(yī)師對卵巢癌患者的預(yù)后進行準確分類,從而為個體化治療方案的制定和調(diào)整提供科學(xué)依據(jù)[6-9]。
1.1資料來源
本研究中的資料來源于美國癌癥基因組圖譜(The Cancer Genom e At l as,TCGA)數(shù)據(jù)庫中卵巢癌研究隊列子數(shù)據(jù)庫,利用開放的TCGA數(shù)據(jù)平臺(ht t p://t cga-dat a.nci.ni h.gov/t cga)獲得分析用的數(shù)據(jù)。數(shù)據(jù)為生存分析中隨訪研究搜集的原始資料,包括552例卵巢癌患者的生存時間、是否截尾的信息,以及患者的12 042種m RNAs、799種m i croRNAs基因的表達數(shù)據(jù)等。
1.2資料的前期處理
首先對RNAs數(shù)據(jù)進行對數(shù)轉(zhuǎn)換,接著采用單因素Cox回歸分析對12 841種RNAs進行單因素分析,初步篩選并獲得對患者生存有影響的RNAs,即獲得卵巢癌相關(guān)的可能基因。
1.3卵巢癌相關(guān)基因的預(yù)后預(yù)測模型
1.3.1多重逐步C ox回歸模型對初步篩選獲得的多個可能相關(guān)基因,采用多重逐步Cox回歸分析,同時分析多個RNAs對生存時間和生存結(jié)局的影響,從中再篩選并獲得對患者預(yù)后有影響的RNAs,建立Cox回歸模型。
1.3.2預(yù)后指數(shù)模型Cox回歸模型中的線性部分βiXi+βjXj+…+βkXk與風(fēng)險函數(shù)h(t)成正比,即風(fēng)險越大,其值越大,因此Cox回歸模型的線性部分反映一個個體的預(yù)后,稱βiXi+βjXj+…+βkXk=PI為預(yù)后指數(shù)。預(yù)后指數(shù)越大,患者風(fēng)險越大,預(yù)后越差;反之預(yù)后指數(shù)越小,預(yù)后越好[6,10]。
1.4預(yù)后指數(shù)累計分布曲線拐點分析
以累計頻數(shù)為橫軸,預(yù)后指數(shù)為縱軸,繪制預(yù)后指數(shù)累計頻數(shù)分布圖,可以估計頻數(shù)在某預(yù)后指數(shù)值上、下,或某2個預(yù)后指數(shù)值之間。當(dāng)樣本含量足夠大且組距很小時,累計頻數(shù)分布圖就成為累計分布曲線[7]。
曲線拐點的數(shù)學(xué)定義為,若曲線圖形在一點由凸轉(zhuǎn)凹,或由凹轉(zhuǎn)凸,則稱該點為拐點,拐點是使切線穿越曲線的點。在平面圖中,曲線圖形為凸或凹,此時橫軸值的變化將引起縱軸值出現(xiàn)相應(yīng)的變化,該變化量用曲線的斜率來描述,曲線的斜率即函數(shù)的一階導(dǎo)數(shù)(橫軸變量的增量趨于0時,縱軸變量增量和橫軸變量增量比值的極限)。函數(shù)的二階導(dǎo)數(shù)描述函數(shù)斜率的變化率,凹、凸形曲線的二階導(dǎo)數(shù)分別為正和負。二階導(dǎo)數(shù)為正,意味著該點的斜率是遞增的,即縱軸變量隨橫軸變量增大而增加得越多,反之則越少。若曲線圖形在拐點由凹轉(zhuǎn)凸或凸轉(zhuǎn)凹,即二階導(dǎo)數(shù)由正變成負或負變成正,二階導(dǎo)數(shù)為0的點即為筆者尋找的拐點[11-12]。
當(dāng)預(yù)后指數(shù)累計分布曲線存在拐點時,拐點兩側(cè)的變量個數(shù)都會增多,但在拐點處沒有增加;預(yù)后指數(shù)值在其取值范圍內(nèi)分布有聚集性。求得拐點處的預(yù)后指數(shù)值,即可對患者的預(yù)后類別做精確分類,繼而通過比較各組間的生存過程包括生存曲線、生存率,考察基于預(yù)后指數(shù)累計分布曲線拐點分析的卵巢癌患者預(yù)后分類效果。
1.5統(tǒng)計學(xué)方法
采用SPSS 18.0統(tǒng)計軟件進行數(shù)據(jù)分析,應(yīng)用多重Cox回歸分析,獲得預(yù)后指數(shù)的計算模型;對預(yù)后指數(shù)的累計分布曲線擬合函數(shù)求二階導(dǎo)數(shù),獲得曲線拐點,并應(yīng)用拐點對卵巢癌患者的預(yù)后情況分組;采用Log-rank檢驗進行組間比較,P≤0.05為差異有統(tǒng)計學(xué)意義。
附表 逐步C ox回歸分析
2.1單因素分析
對552例卵巢癌患者的12 042種m RNAs、799 種m i croRNAs基因的表達數(shù)據(jù),運用單因素Cox回歸分析進行單因素分析,初步篩選并獲得對卵巢癌患者生存有影響的37種RNAs,其中34種m RNAs、3種m i croRNAs。
2.2多重逐步C ox回歸分析
對單因素Cox回歸分析初步篩選的37個可能相關(guān)基因的表達數(shù)據(jù),采用多重逐步Cox回歸分析,同時分析這37個RNAs對生存時間和生存結(jié)局的影響,結(jié)果顯示,10個RNAs對患者預(yù)后有影響,通過篩選成為卵巢癌的預(yù)后因子(見附表)。從而得到預(yù)后指數(shù)PI的計算公式為:
PI=-0.515(OVGP1.1)-0.439(PRAM E.1)+0.724 (LYVE1.1)+…+0.557(C1orf 114.1)。
2.3預(yù)后指數(shù)的累計分布曲線分析
2.3.1預(yù)后指數(shù)分別將10個基因的表達數(shù)據(jù)代入預(yù)后指數(shù)的計算公式,得到552例卵巢癌患者的預(yù)后指數(shù)值。繪制預(yù)后指數(shù)累計分布曲線,并進行函數(shù)擬合,獲得Cubi c函數(shù)曲線(R2=0.986)。見圖1。
PI=3.231×10-8×(頻數(shù))3-2.692×10-5×(頻數(shù))2+ 0.009×(頻數(shù))-1.983
2.3.2預(yù)后指數(shù)累計分布曲線拐點Cubi c函數(shù)曲線圖形自左到右呈由凸轉(zhuǎn)凹,即二階導(dǎo)數(shù)由負變成正,二階導(dǎo)數(shù)為0的點即為筆者尋找的拐點。計算該函數(shù)的二階導(dǎo)數(shù):
PI''=6×3.231×10-8×(頻數(shù))-2×2.692× 10-5=19.386×10-8×(頻數(shù))-5.384×10-5
圖1 預(yù)后指數(shù)PI累計分布曲線
令二階導(dǎo)數(shù)PI''=0,得(頻數(shù))≈278,代入Cubi c函數(shù)曲線,計算得PI=-0.78,獲得點(278,-0.78)即為曲線的拐點。以PI=-0.78將552例卵巢癌患者分為高危組和低危組,繪制兩組Kapl an-M ei er生存曲線(見圖2),兩條生存曲線無交叉,對兩組生存率比較,經(jīng)Log-rank檢驗,差異有統(tǒng)計學(xué)意義(χ2=46.365,P= 0.000)。高危組和低危組患者的中位生存時間分別為1 678和1 058 d,低危組患者的生存率較高,結(jié)果表明,預(yù)后指數(shù)分布曲線拐點能將卵巢癌患者精確地分為高危組和低危組。
圖2 Kapl an-M ei er生存曲線
在卵巢癌患者的預(yù)后預(yù)測中,卵巢癌相關(guān)基因即卵巢癌腫瘤分子標志物表達的預(yù)測作用不容忽視。近幾年來,RNAs與卵巢癌預(yù)后的相關(guān)性得到較多的關(guān)注[3-6]。本研究基于對12 841種RNAs表達數(shù)據(jù)分析,建立多重Cox回歸模型,獲得反映個體預(yù)后的指標——預(yù)后指數(shù)的計算模型[6-7]。對預(yù)后指數(shù)累計分布曲線擬合函數(shù)求二階導(dǎo)數(shù),獲得曲線拐點[11]。
本研究的預(yù)后指數(shù)累計分布曲線有一個拐點,依據(jù)拐點處的預(yù)后指數(shù)值將卵巢癌患者的預(yù)后分成高危組和低危組。對高危組和低危組卵巢癌患者的生存率進行比較,低危組患者的生存率高于高危組的,中位生存時間低危組患者的為高危組患者的1.6倍(1 678/1 058),顯示預(yù)后指數(shù)分布曲線拐點能將卵巢癌患者的預(yù)后進行精確分類,即利用預(yù)后指數(shù)累計分布曲線拐點分析,對卵巢癌患者預(yù)后具有較好的分類效果[6,9-10]。
綜上所述,基于卵巢癌相關(guān)的RNAs表達數(shù)據(jù)建立的預(yù)后指數(shù)模型,結(jié)合累計分布曲線拐點分析,能幫助臨床醫(yī)師對卵巢癌患者的預(yù)后進行較精確的分類,為卵巢癌患者的治療和管理提供新的依據(jù)。
[1]Choi M,F(xiàn)ul l er CD,Thom as CR,et al.Condi t i onal survi val i n ovari an cancer:resul t s f romt he SEERdat aset 1988-2001[J]. Gynecol Oncol,2008,109:203-209.
[2]劉侃,陳紅曉,張虹.晚期卵巢癌預(yù)后相關(guān)因素分析[J].現(xiàn)代婦產(chǎn)科進展,2010,19(12):918-921.
[3]蔡晶,王澤華.腫瘤標志物預(yù)測卵巢癌預(yù)后的價值[J].中國實用婦科與產(chǎn)科雜志,2015,31(3):226-229.
[4]Cao J,Cai J,H uang D,et al.m i R-335 represent s an i ndepen-dent prognost i c m arker i n epi t hel i al ovari an cancer[J].Am J Cl i n Pat hol,2014,141(3):437-442.
[5]Lee CH,Subram ani an S,Beck AH,et al.M i croRNA prof i l i ng of BRCA1/2 m ut at i on-carryi ng and non-m ut at i on-carryi ng hi ghgrade serous carci nom as of ovary[J].PLoS One,2009,4(10):DOI: 10.1371/j ournal.pone.0007314.
[6]孫振球.醫(yī)學(xué)統(tǒng)計學(xué)[M].第4版.人民衛(wèi)生出版社,北京:2015.
[7]方積乾.衛(wèi)生統(tǒng)計學(xué)[M].第7版.人民衛(wèi)生出版社,北京:2013.
[8]夏耀雄,李文輝,王曉莉,等.新的預(yù)后指數(shù)模型GPA在肺癌腦轉(zhuǎn)移中的應(yīng)用分析[J].昆明醫(yī)科大學(xué)學(xué)報,2012(6):113-117.
[9]余紅梅,何大衛(wèi).預(yù)后指數(shù)在慢性病及腫瘤病人長期生存預(yù)測中的應(yīng)用[J].中國公共衛(wèi)生,2001,17(8):749-750.
[10]Cox DR.Regressi on m odel s and 1i f e-t abl es(wi t h di scussi on)[J]. Journal of t he Royal St at i st i cal Soci et y,1972,34:187.
[11]陳玉.曲線拐點的判別法[J].高等數(shù)學(xué)研究,2008,11(5):9-10.
[12]白曉東.曲線拐點差別法的研究[J].職大學(xué)報,2004(4):16-23.
(童穎丹編輯)
Application of cumulative distribution curve inflection point analysis of prognosis index in prognosis of ovarian cancer patients*
Xiang-ni Peng1,Yang Zhong2,Yi-ren Wang3
(1.High School Attached to Hunan Normal University,Changsha,Hunan 410006,China;2.School of Mathematics and Computational Science,Xiangtan University,Xiangtan,Hunan 411105,China;3.Xiangya School of Public Health,Central South University,Changsha,Hunan 410078,China)
Objective To understand the prognosis of ovarian cancer,and help clinicians to make scientific and reasonable treatment plans for ovarian cancer patients.Methods Using the Cox's proportional hazards regression equation method,a prognostic index(PI)was constructed for ovarian cancer patients.With the individual inflection point of the prognostic index curve,ovarian cancer patients were classified to high-risk group and low-risk group.Results The cumulative distribution curves were established using the expression data of 10 RNAs,and 1 inflection point(278.00,-0.780)was obtained.Using this inflection point,552 ovarian cancer patients were divided into high-risk group and low-risk group,and the median survival time of the two groups was 1,678 days and 1,058 days respectively.Log-rank test showed that the survival rate of the low-risk group was significantly higher than that of the high-risk group(χ2=46.365,P=0.000).Case analysis showed that the inflection point of the prognostic index curve had good classification effect on the patientswith ovarian cancer.Conclusions The prognosis model of ovarian cancer patients based on the inflection point of the cumulative distribution curve can accurately classify the prognosis of ovarian cancer patients,which will provide a new scientific basis for the treatment and management of ovarian cancer patients.
survival analysis;prognostic index;inflection point;ovarian cancer
R 737.31
B
1005-8982(2016)05-0124-04
10.3969/j.i s s n.1005-8982.2016.05.027
2015-12-24
*
湖南省哲學(xué)社會科學(xué)基金(No:14YBA395)
王一任,E-m ai l:bri ght wyr@hot m ai l.com