郭佩,何寧寧,夏玉軍#
1青島大學(xué)基礎(chǔ)醫(yī)學(xué)院,山東 青島 266071
2煙臺(tái)毓璜頂醫(yī)院放射科,山東 煙臺(tái) 264000
結(jié)直腸癌又稱大腸癌,是結(jié)腸癌和直腸癌的總稱,是人類最常見(jiàn)的消化道惡性腫瘤之一。在中國(guó),隨著經(jīng)濟(jì)水平的提高以及生活方式的改變,結(jié)直腸癌的發(fā)病率逐年上升。目前,結(jié)直腸癌的主要診斷方法包括腸鏡檢查、磁共振成像(magnetic resonance imaging,MRI)和異常隱窩病灶(aberrant crypt foci,ACF)檢查。目前對(duì)結(jié)直腸癌的早期診斷仍然缺乏一種高敏感性的方法。腫瘤標(biāo)志物存在于組織、血液、體液和尿液中,對(duì)腫瘤的早期診斷、預(yù)后和療效評(píng)估具有重要作用。組織激肽釋放酶家族(kallikrein-related peptidase,KLK)也稱為激肽釋放酶,屬于絲氨酸蛋白酶,它們廣泛存在于機(jī)體的各個(gè)組織中,主要參與調(diào)控心血管、腎臟、神經(jīng)系統(tǒng)等的生理功能。KLK的異常表達(dá)與心臟病、腎病、炎癥反應(yīng)、惡性腫瘤等疾病的發(fā)生有著密切聯(lián)系,尤其是在腫瘤中,KLK異常表達(dá)提示其可作為臨床上腫瘤早期診斷的標(biāo)志物。已有研究證明,KLK5、KLK10、KLK11的異常表達(dá)與卵巢癌密切相關(guān),KLK6的高表達(dá)與胃癌的增殖和遷移密切相關(guān),KLK3可以作為前列腺癌診斷的生物標(biāo)志物,KLK7的高表達(dá)與結(jié)腸癌細(xì)胞的增殖和侵襲密切相關(guān)。雖然人們對(duì)KLK與各種惡性腫瘤的關(guān)系進(jìn)行了一些研究,但是對(duì)KLK家族基因在結(jié)直腸癌中的表達(dá)及與預(yù)后的關(guān)系未進(jìn)行過(guò)系統(tǒng)分析。ONCOMINE數(shù)據(jù)庫(kù)是目前世界上最大的腫瘤基因芯片數(shù)據(jù)庫(kù)和整合數(shù)據(jù)提取平臺(tái)。TCGA數(shù)據(jù)庫(kù)是目前世界上最大的腫瘤基因組信息數(shù)據(jù)庫(kù)。STRING數(shù)據(jù)庫(kù)是一個(gè)搜尋蛋白質(zhì)和蛋白質(zhì)之間相互作用的系統(tǒng),以幫助研究人員更加深入地認(rèn)清相關(guān)蛋白質(zhì)的功能和其調(diào)控機(jī)制。GEO是功能基因組學(xué)的數(shù)據(jù)存儲(chǔ)庫(kù),可以查詢和下載樣本信息以及基因組的表達(dá)概況。本研究利用ONCOMINE、TCGA及GEO數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘,分析人KLK基因在結(jié)直腸癌中的表達(dá)和預(yù)后意義,以及KLK作為結(jié)直腸癌標(biāo)志物的可能性,為研究KLK基因在結(jié)直腸癌發(fā)生發(fā)展中的作用機(jī)制提供線索和思路,現(xiàn)報(bào)道如下。
在ONCOMINE v4.5數(shù)據(jù)庫(kù)中進(jìn)行注冊(cè),獲得數(shù)據(jù)庫(kù)的使用權(quán)限。根據(jù)實(shí)驗(yàn)要求設(shè)定搜索條件,設(shè)定篩選條件。①Gene:KLK1-KLK15(依次檢索KLK家族的基因);②THRESHOLD(P-VALUE):0.01;③THRESHOLD(FOLD CHANGE):2;④ THRESHOLD(GENE RANK):ALL;⑤ Data Type:All。
登錄TCGA數(shù)據(jù)庫(kù)(版本v71),獲得人KLK基因在結(jié)直腸癌組織和正常結(jié)直腸組織中的表達(dá)數(shù)據(jù)。
登錄UALCAN在線分析工具(http://ualcan.path.uab.edu/index.html),選擇TCGA數(shù)據(jù)庫(kù)的研究,設(shè)定篩選條件。①Select Cancer Study:Colorectal cancer;②Select Genomic Profiles:Expression;③Kaplan-Meier生存曲線:Survival。然后以PDF格式導(dǎo)出。
選擇GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)的GSE39582系列數(shù)據(jù),這個(gè)數(shù)據(jù)庫(kù)包括585個(gè)結(jié)直腸癌樣本。此數(shù)據(jù)系列還具有分子亞型分類以及臨床生存特征等信息。下載數(shù)據(jù)庫(kù)后,利用R軟件(https://www.r-project.org/,版本:3.5.3)分析KLK基因表達(dá)與結(jié)直腸癌患者預(yù)后的關(guān)系。根據(jù)基因的中位表達(dá)數(shù),分為高表達(dá)和低表達(dá)。
進(jìn)入STRING在線數(shù)據(jù)庫(kù)(https://string-db.org/),設(shè)定查找條件。①基因名稱:KLK6、KLK8和KLK10;②物種:homo(人種);③證據(jù)來(lái)源(active interaction sources):選擇實(shí)驗(yàn)數(shù)據(jù)(Experiments)。從而得到KLK基因相關(guān)的蛋白質(zhì)-蛋白質(zhì)作用網(wǎng)絡(luò)。
臨床組織樣本來(lái)自于煙臺(tái)毓璜頂醫(yī)院,且是在患者知情同意且簽署知情同意書(shū)的情況下取得的。研究方案得到了青島大學(xué)醫(yī)學(xué)部倫理委員會(huì)批準(zhǔn)。2018年6月至2019年5月,共收集了24例組織樣本,包括20例結(jié)直腸癌組織和4例正常結(jié)直腸組織。手術(shù)之前,患者未進(jìn)行任何化療或放療。在手術(shù)切除后,組織樣本立即被冷凍在液氮中,保存于-80℃,供后續(xù)研究。
根據(jù)mirVana miRNAIsolation kit(購(gòu)自Thermo Fisher Scientific公司)的說(shuō)明書(shū)進(jìn)行操作,從組織中提取RNA。采用逆轉(zhuǎn)錄試劑盒[購(gòu)自寶生物工程(大連)有限公司]進(jìn)行cDNA的合成。采用Nanodrop測(cè)定cDNA的濃度。產(chǎn)物保存于-80℃,用于下一步的實(shí)驗(yàn)。使用試劑盒Power SYBR-Green PCR Master Mix(購(gòu)自Thermo Fisher Scientific公司)以及適當(dāng)?shù)囊镞M(jìn)行聚合酶鏈反應(yīng),采用ABI7500-fast thermocycler(購(gòu)自Thermo Fisher Scientific公司)進(jìn)行實(shí)驗(yàn)數(shù)據(jù)的采集。以甘油醛-3-磷酸脫氫酶(glyceraldehyde-3-phosphate dehydrogenase,GAPDH)作為內(nèi)參,引物見(jiàn)表1。
表1 KLK和GAPDH基因的引物序列
M
(Q
,Q
)]表示,組間比較采用非參數(shù)檢驗(yàn);符合正態(tài)分布的計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差(x-
±s
)表示,組間比較采用t
檢驗(yàn)。采用Kaplan-Meier法繪制生存曲線,組間比較采用Logrank檢驗(yàn)。采用AdobeIllustrator CS4軟件對(duì)圖片進(jìn)行整理。以P
<0.05為差異有統(tǒng)計(jì)學(xué)意義。KLK6
、KLK8
、KLK10
和KLK11
基因在結(jié)直腸癌組織中具有高水平的表達(dá),KLK7
和KLK12
具有相對(duì)較高的表達(dá)水平,KLK1
和KLK15
具有較低的表達(dá)水平。其中KLK6
在13組數(shù)據(jù)、KLK8
在6組數(shù)據(jù),KLK10
在17組數(shù)據(jù)、KLK11
在10組數(shù)據(jù)中顯示具有高水平的表達(dá)(且基因排序超過(guò)1%)。(圖1)圖1 ONCOMINE數(shù)據(jù)庫(kù)中人KLK 基因在各種腫瘤類型中的表達(dá)情況
KLK
基因在結(jié)直腸癌組織和正常結(jié)直腸組織中的表達(dá)結(jié)果,對(duì)具有顯著性差異的數(shù)據(jù)進(jìn)行比較分析。結(jié)果顯示,結(jié)直腸癌組織中人KLK6
、KLK7
、KLK8
、KLK10
、KLK11
和KLK12
基因的表達(dá)水平均明顯高于正常結(jié)直腸組織,差異均有統(tǒng)計(jì)學(xué)意義(P
<0.01)。(表2)表2 TCGA數(shù)據(jù)庫(kù)中人KLK基因在結(jié)直腸癌組織和正常結(jié)直腸組織中的表達(dá)情況
KLK
基因表達(dá)與結(jié)直腸癌預(yù)后的關(guān)系,本研究利用UALCAN在線工具分析TCGA數(shù)據(jù)庫(kù)中人KLK
mRNA表達(dá)水平與結(jié)直腸癌預(yù)后的相關(guān)數(shù)據(jù)。結(jié)果表明,KLK
基因表達(dá)與結(jié)直腸癌預(yù)后無(wú)關(guān)。TCGA數(shù)據(jù)庫(kù)包括121例具有預(yù)后信息的結(jié)直腸癌組織,進(jìn)一步選擇GEO數(shù)據(jù)庫(kù)中的GSE39582系列數(shù)據(jù),此系列數(shù)據(jù)包括578例具有預(yù)后信息的結(jié)直腸癌組織。利用R軟件進(jìn)行數(shù)據(jù)處理和分析,結(jié)果顯示,KLK6
、KLK8
、KLK10
和KLK12
基因低表達(dá)患者的預(yù)后分別優(yōu)于上述基因高表達(dá)的患者,差異均有統(tǒng)計(jì)學(xué)意義(P
=0.0008、0.0392、0.0013、0.0203)(圖2)。圖2 人KLK 基因高表達(dá)與低表達(dá)結(jié)直腸癌患者的生存曲線
KLK
基因在結(jié)直腸癌組織中的表達(dá)情況,對(duì)臨床收集的20例結(jié)直腸癌組織和4例正常結(jié)直腸組織進(jìn)行定量逆轉(zhuǎn)錄聚合酶鏈反應(yīng)。結(jié)果顯示,結(jié)直腸癌組織中KLK1
基因的表達(dá)水平低于正常結(jié)直腸組織,KLK6
、KLK7
、KLK8
、KLK10
和KLK11
基因的表達(dá)水平均高于正常結(jié)直腸組織,差異均有統(tǒng)計(jì)學(xué)意義(P
<0.05)(表3)。綜合數(shù)據(jù)挖掘結(jié)果和臨床樣本驗(yàn)證的結(jié)果,KLK6
、KLK8
和KLK10
基因具有很高的可能性作為結(jié)直腸癌標(biāo)志物。表3 臨床樣本中人KLK基因在結(jié)直腸癌組織和正常結(jié)直腸組織中的表達(dá)水平
為了進(jìn)一步明確與KLK6、KLK8和KLK10相互作用的蛋白,通過(guò)挖掘STRING數(shù)據(jù)庫(kù)構(gòu)建KLK6、KLK8和KLK10蛋白質(zhì)-蛋白質(zhì)作用網(wǎng)絡(luò)。結(jié)果表明,KLK6和5個(gè)蛋白[YY1關(guān)聯(lián)因子2(YY1 associated factor 2,YAF2)、α-突觸核蛋白(alpha-synuclein,SNCA)、α2-巨球蛋白樣蛋白 1(alpha-2-macroglobulin like protein 1,A2ML1)、絲氨酸蛋白酶抑制劑Kazal型5(serine peptidase inhibitor Kazal type 5,SPINK5)和絲氨酸蛋白酶抑制劑Kazal 型 9(serine peptidase inhibitor Kazal type 9,SPINK9)]相關(guān),KLK10 和 2 個(gè)蛋白(SPINK5 和KLK8)相關(guān),KLK8和8個(gè)蛋白[SPINK5、SPINK9、KLK5、半胱天冬酶 1(caspase-1,CASP1)、半胱天冬酶募集結(jié)構(gòu)域16(caspase recruitment domain 16,CARD16)、絲氨酸蛋白酶抑制劑B6(serine proteinase inhibitor B6,SERPINB6)、絲氨酸蛋白酶抑制劑B5(serine proteinase inhibitor B5,SERPINB5)和KLK10]相關(guān)。進(jìn)一步對(duì)KLK6、KLK8和KLK10相關(guān)的10個(gè)相互作用蛋白的生物學(xué)功能進(jìn)行分析,發(fā)現(xiàn)這些相互作用分子主要參與對(duì)細(xì)胞增殖和凋亡的調(diào)節(jié)。(圖3)
圖3 KLK6、KLK8和KLK10基因相關(guān)的蛋白質(zhì)-蛋白質(zhì)作用網(wǎng)絡(luò)圖
結(jié)直腸癌是臨床上一種常見(jiàn)的消化道腫瘤,對(duì)人類的健康和生命危害極大,并且經(jīng)常伴隨多種并發(fā)癥。結(jié)直腸癌的醫(yī)學(xué)研究一直是腫瘤研究的熱點(diǎn)之一。目前治療結(jié)直腸癌的主要方法是外科手術(shù)和結(jié)腸鏡治療,結(jié)直腸癌可經(jīng)手術(shù)治愈,但術(shù)后復(fù)發(fā)轉(zhuǎn)移率高,可達(dá)40%~50%。因此,早期發(fā)現(xiàn)是治療結(jié)直腸癌的關(guān)鍵,提前發(fā)現(xiàn)將會(huì)發(fā)生癌變的患者是醫(yī)學(xué)的研究重點(diǎn)。發(fā)現(xiàn)有效的結(jié)直腸癌標(biāo)志物對(duì)了解腫瘤成因及患者預(yù)后具有關(guān)鍵作用。
20世紀(jì)90年代中期發(fā)展起來(lái)的基因組學(xué)是生物信息學(xué)的主要研究?jī)?nèi)容之一。在病理生理、疾病檢測(cè)、藥物開(kāi)發(fā)、疾病預(yù)防和功能基因組方面得到了廣泛的應(yīng)用。在腫瘤研究領(lǐng)域,利用公開(kāi)的組學(xué)數(shù)據(jù)庫(kù)尋找腫瘤標(biāo)志物成為目前科學(xué)研究的重要手段之一。本研究通過(guò)ONCOMINE數(shù)據(jù)庫(kù)的整合分析發(fā)現(xiàn),KLK6、KLK8、KLK10和KLK11基因在結(jié)直腸癌組織中具有高水平的表達(dá),KLK7和KLK12基因具有相對(duì)較高的表達(dá)水平。通過(guò)TCGA數(shù)據(jù)庫(kù)收集KLK mRNA在結(jié)直腸癌組織和正常結(jié)直腸組織中的表達(dá)水平,結(jié)果發(fā)現(xiàn),結(jié)直腸癌組織中人 KLK6、KLK7、KLK8、KLK10、KLK11和KLK12基因的表達(dá)水平均明顯高于正常結(jié)直腸組織(P<0.01)。TCGA數(shù)據(jù)庫(kù)雖然是目前世界上最大的腫瘤基因組信息數(shù)據(jù)庫(kù),但是它只有121例具有預(yù)后信息的結(jié)直腸癌組織,因此,本研究進(jìn)一步選擇了GEO數(shù)據(jù)庫(kù)中包括578例具有預(yù)后信息的結(jié)直腸癌組織的GSE39582系列數(shù)據(jù)進(jìn)行生存分析,采用Kaplan-Meier法繪制生存曲線。結(jié)果發(fā)現(xiàn),KLK6、KLK8、KLK10和KLK12基因低表達(dá)患者的預(yù)后分別優(yōu)于上述基因高表達(dá)的患者,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。本研究還對(duì)臨床收集的結(jié)直腸癌組織和正常結(jié)直腸組織樣本中的KLK基因進(jìn)行檢測(cè),結(jié)果發(fā)現(xiàn),結(jié)直腸癌組織中KLK6、KLK7、KLK8、KLK10和KLK11基因的表達(dá)水平均高于正常結(jié)直腸組織,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。綜合分析,KLK6、KLK8和KLK10基因具有很大的可能性作為結(jié)直腸癌標(biāo)志物。之前的研究已經(jīng)發(fā)現(xiàn)KLK6在結(jié)直腸癌中具有較高的表達(dá)水平以及靶向KLK6作為結(jié)直腸癌治療策略的可能性。另外,本研究通過(guò)挖掘STRING數(shù)據(jù)庫(kù)構(gòu)建了KLK6、KLK8和KLK10基因相關(guān)的蛋白質(zhì)-蛋白質(zhì)作用網(wǎng)絡(luò)圖。通過(guò)分析相關(guān)的10個(gè)相互作用蛋白的生物學(xué)功能,進(jìn)一步證明了KLK6、KLK8和KLK10對(duì)細(xì)胞增殖和凋亡具有調(diào)節(jié)作用。
綜上所述,本研究通過(guò)對(duì)公共數(shù)據(jù)庫(kù)中腫瘤相關(guān)基因信息和預(yù)后信息深入挖掘,發(fā)現(xiàn)KLK6、KLK8和KLK10基因在結(jié)直腸癌組織中高表達(dá),且與結(jié)直腸癌患者的預(yù)后有關(guān),將為進(jìn)一步闡明KLK6、KLK8和KLK10在結(jié)直腸癌發(fā)生發(fā)展中的作用奠定理論基礎(chǔ)。