李建祺,張晶,甄亞男,魏飛力,歐陽雅博,肖瑞雪,徐忠法
(1濟南大學 山東省醫(yī)學科學院醫(yī)學與生命科學學院,濟南250022;2山東省醫(yī)學科學院附屬醫(yī)院;3首都醫(yī)科大學附屬北京佑安醫(yī)院 北京市肝病研究所)
現(xiàn)階段對結直腸癌的篩查多依靠糖類抗原檢測,其特異性較理想,但敏感性較低,早期診斷率較低,因此需要尋找一種更加有效的篩查及評價方法。環(huán)狀RNA(circRNA)是一種調節(jié)基因表達的內源性非編碼RNA(ncRNA)[1]。circRNA存在數(shù)量眾多,作用機制豐富,影響范圍廣泛,在結直腸癌、肺癌、胃癌、肝癌等惡性腫瘤的發(fā)生發(fā)展中均發(fā)揮重要作用[2,3],因此可能成為反映結直腸癌發(fā)生、進展的新的生物標志物。2016年5月~2018年10月,本研究對不同分期結直腸癌組織及相應癌旁組織的circRNA表達進行比較,篩選差異性表達的circRNA,并分析其在結直腸癌發(fā)生發(fā)展中的作用?,F(xiàn)報告如下。
1.1 組織標本來源及分組 結直腸癌組織及癌旁正常組織來源于2016~2018年在山東省醫(yī)學科學院附屬醫(yī)院行結直腸癌根治手術且經病理證實的9例原發(fā)性結直腸癌患者,男5例、女4例,年齡54~64(59±6)歲,直腸癌8例、乙狀結腸癌1例,病理分型均為腺癌?;颊呒{入標準:病理診斷為原發(fā)性結直腸腺癌;無遠處轉移。排除標準:術前接受過化療、放療、免疫治療;同時合并其他類型的惡性腫瘤;臨床資料不完整。根據(jù)TNM分期將組織標本分為A(T1~3N0M0)、B(T4a~bN0M0)、C(T4a~bN1~2M0)組。入組患者均簽署相關知情文件,同時本研究已得到山東省醫(yī)學科學院附屬醫(yī)院倫理委員會批準。
1.2 樣本RNA的提取及質控 獲取結直腸癌組織標本后立即剪成直徑<0.5 cm的小塊,浸沒在5倍體積的RNAlater中,4 ℃浸泡過夜,轉移至-80 ℃冰箱保存。利用定容RNA的RNAse-free Water作為空白對照,每個樣品吸取1 μL,用分光光度計測定RNA溶液在260 nm、280 nm波長處的吸光度值,檢測RNA的濃度和純度。每個樣品吸取400~700 ng的總RNA,用1.5%甲醛變性凝膠電泳(120 V)15 min,在凝膠成像儀下檢測總RNA中28 S和18 S的完整性。
1.3 結直腸癌組織中差異表達circRNA的篩選 各組RNA樣品依次進行添加多聚腺苷酸、標記、雜交、洗脫、掃描等操作,后用Affymetrix Scanner3000 7G激光共聚焦掃描儀對雜交后的Affymetrix Clariom D芯片進行掃描。最后對雜交信號值進行本底分離及標準化操作。以調整后P<0.05、|log2FC|>2作為篩選標準,根據(jù)circRNA在每個樣本中的表達值進行聚類分析,采用Cluster3.0軟件制作聚類圖。按照TNM分期逐漸增高的順序設計序列實驗,篩選出隨TNM分期表達變化最顯著、最主流的基因群,對差異circRNA進行表達趨勢分析。將呈主流表達趨勢的circRNA作為進一步研究的目標基因。根據(jù)circRNA與mRNA的實測值,通過共表達計算方式構建網絡,按基因屬性評分,得到處于調控網絡中心的circRNA(共表達調控網絡基因屬性評分前10位),再與目標基因群進行交集處理,篩選出與結直腸癌進展密切相關的circRNA。
1.4 差異表達circRNA對應mRNA的功能分析 通過circRNA周邊與其共表達的mRNA來預測未知mRNA的功能。對差異表達基因通過DAVID6.7網站整合的數(shù)據(jù)庫進行基因本體論(GO)分析和京都基因與基因組大百科全書(KEGG)信號通路描述分析,篩選功能最顯著的基因。以P<0.05為差異有統(tǒng)計學意義。
2.1 結直腸癌組織中差異表達circRNA篩選結果 初步分析發(fā)現(xiàn),A組癌組織與癌旁組織比較,有424個差異表達circRNA,其中表達降低165個、表達升高239個;B組差異表達circRNA共計560個,表達降低284個、表達升高276個;C組差異表達circRNA共計409個,表達降低190個、表達升高220個(P<0.05,F(xiàn)C>1.5)。對各組差異表達circRNA進行聚類分析。之后將A組的差異表達circRNA在B組、C組中進行驗證,并進行表達趨勢分析。對差異表達circRNA的表達豐度進行多次驗證,發(fā)現(xiàn)circRNA表達隨結直腸癌的進展而降低為主流趨勢。編號0~15組circRNA群中,僅編號1、2、6、7、8、9組表達差異有統(tǒng)計學意義(圖1),其中編號第7組差異表達circRNA的表達變化趨勢既符合主流趨勢同時更具有統(tǒng)計學意義(P<0.05,且值更小),故選定第7組的差異表達circRNA為主要研究對象。第7組circRNA共有103條,與共表達調控網絡基因屬性評分前10位的circRNA(表1)進行交集處理,篩選出與結直腸癌進展密切相關的8個circRNA,分別為hsa_circ_0000007、hsa_circ_0001111、hsa_circ_0006977、hsa_circ_0079656、hsa_circ_0023608、hsa_circ_0024508、hsa_circ_0026694、hsa_circ_0029903。通過預測篩選出500余個相關mRNA,并非均具有重要生物學作用,因此進一步進行GO分析和KEGG分析。
圖1 差異表達circRNA的表達趨勢圖
表1 共表達調控網絡基因屬性評分前10位的circRNA
2.2 差異表達circRNA對應mRNA的GO分析和KEGG分析結果 對8個circRNA相對應的所有mRNA進行GO功能注釋分析(圖2)及KEGG通路富集分析發(fā)現(xiàn),被富集的大部分基因及hsa03010通路(P<0.05)主要參與核糖體RNA的加工與代謝、RNA的剪切與加工處理等細胞基礎功能過程。在8個與結直腸癌進展密切相關的circRNA中,hsa_circ_0079656與HINFP基因存在顯著生物學功能關系,HINFP基因可能與細胞有絲分裂周期G1/S期的轉錄調控有關。確定hsa_circ_0079656為最終目標基因。
circRNA是通過套索驅動環(huán)化或內含子配對驅動環(huán)化形成的環(huán)形RNA,該RNA早在1976年在植物病毒中發(fā)現(xiàn),但一直認為是轉錄的副產品,并不存在生物學作用。近年來隨著研究水平的不斷提高,大量高精度探針及檢驗儀器投入使用,circRNA被發(fā)現(xiàn)廣泛存在于不同生物的細胞質中,具有高度穩(wěn)定的特性[4],在真核生物細胞中發(fā)揮重要作用[5]。
研究發(fā)現(xiàn),circRNA與糖尿病、動脈粥樣硬化及心力衰竭、心肌梗死等多種疾病進展均有一定的相關性[6,7]。胃癌、肝癌、乳腺癌、結直腸癌等惡性腫瘤相關研究發(fā)現(xiàn),circRNA利用miRNA應答元件結合相應miRNA,阻止miRNA抑制目標基因的表達,進而影響惡性腫瘤的進展[8~12]。另有研究發(fā)現(xiàn),與相鄰的正常組織相比,多種惡性腫瘤組織中存在異常表達的circRNA。Zhang等[13]發(fā)現(xiàn),hsa_circ_0091579在肝癌組織中的表達水平顯著升高,可能作為肝癌診斷及預后評估的標志物。Chi等[14]發(fā)現(xiàn),hsa_circ_0000285在膀胱癌組織中的表達水平顯著降低,可能作為膀胱癌的診斷及預后評估標志物。Chen等[15]研究表明,hsa_circ_0000190診斷胃癌具有更好的敏感性和特異性。本研究同樣發(fā)現(xiàn),在結直腸癌組織中circRNA表達水平隨腫瘤進展而降低,說明circRNA有可能成為結直腸癌的新型生物標志物。
圖2 差異表達circRNA相對應mRNA的GO分析結果
本研究發(fā)現(xiàn),各組circRNA的表達存在不同程度變化。之后按照結直腸癌TNM分期順序設計序列實驗,篩選出隨TNM分期變化最顯著、最主流的基因群,對樣本的差異表達基因進行表達趨勢分析。選取表達變化與結直腸癌進展程度具有顯著聯(lián)系的基因,結合主流表達趨勢,篩選出進一步研究的目標基因。本研究中差異表達circRNA的主流變化趨勢為隨病情進展而表達降低,有學者在肝癌及結直腸癌相關研究中也有類似發(fā)現(xiàn)[15,16]。
借助共表達網絡可發(fā)現(xiàn)circRNA與mRNA之間可能存在的作用關系,找到影響mRNA表達的circRNA,從而發(fā)現(xiàn)網絡中起中心調控作用的circRNA及可能存在的新作用機制。我們依據(jù)基于芯片的實測值運算,突破了傳統(tǒng)分析中基因注釋不齊全的限制,增加了研究的創(chuàng)新性。本研究發(fā)現(xiàn),在共表達網絡中存在500余個circRNA位于共表達網絡核心位置,篩選其中評分前10位者,與第7組差異circRNA群進行交集,得到8個與結直腸癌進展密切相關的circRNA,即hsa_circ_0000007、hsa_circ_0001111、hsa_circ_0006977、hsa_circ_0079656、hsa_circ_0023608、hsa_circ_0024508、hsa_circ_0026694、hsa_circ_0029903。
GO數(shù)據(jù)庫是一個跨物種、綜合性、描述性的數(shù)據(jù)庫,目的在于建立一個適用于各種物種、對基因和蛋白功能進行限定和描述并能隨著研究不斷深入而更新的語義詞匯標準。KEGG可提供整合代謝途徑查詢,包括碳水化合物、核苷、氨基酸等的代謝及有機物的生物降解,不僅提供了所有可能的代謝途徑,而且對催化各步反應的酶進行了全面的注解。通路富集分析可將本研究中得到的差異表達基因基于KEGG數(shù)據(jù)庫進行信號通路注釋,得到基因參與的所有信號通路后,利用Fisher精確檢驗和多重比較檢驗計算每個信號通路的顯著性水平和誤判率,從而篩選出基因參與的重點信號通路。我們分別對8個差異表達circRNA所預測的mRNA用GO功能注釋分析及KEGG通路富集分析,發(fā)現(xiàn)被富集的大部分基因及hsa03010通路主要參與核糖體RNA的加工與代謝、RNA的剪切與加工處理等細胞基礎功能,其中hsa_circ_0079656與HINFP基因存在顯著生物學關系,而HINFP基因主要參與細胞有絲分裂周期中G1/S期的轉錄過程的調控。
總之,經篩選與分析,本研究發(fā)現(xiàn)hsa_circ_0079656在結直腸癌組織中低表達且隨病情進展表達降低,該circRNA可能通過作用于HINFP基因從而調控細胞有絲分裂周期中G1/S期的轉錄過程,影響結直腸癌的進展。同時,本實驗存在一些不足:由于實驗時間限制,未進行后續(xù)驗證,相關作用機制僅為預測結果;由于實驗分組需均衡各臨床病理分期組織樣本,導致樣本收集工作存在困難,未能取得充足實驗樣本;本研究僅針對結直腸癌浸潤深度進行研究,未考慮其他分期因素。因此,今后仍需增加后續(xù)實驗,逐步完善其他樣本數(shù)據(jù),并進行生物信息學分析驗證上述結果。