朱向情,陳裕浩,王嚴影,高 萌,潘興華
長鏈非編碼RNA(lncRNA)是一類長度>200個核苷酸的非編碼RNA,其轉錄水平和狀態(tài)與細胞分化、個體發(fā)育及人類疾病等相關。lncRNA的表達具有嚴格的細胞類型和組織特異性,還具有精確的時間和空間表達模式,在惡性腫瘤、退行性疾病等疾病中可出現序列、空間結構、表達水平、與結合蛋白相互作用的異常[1]。為探討年齡和臍帶間充質干細胞(UCMSC)治療對外周血單個核細胞lncRNA的影響,本研究對不同年齡獼猴及UCMSC治療后的老年獼猴外周血單個核細胞的全轉錄組進行測序分析,試圖解析年齡和UCMSC對lncRNA表達的影響。
1.1 實驗動物及分組 不同年齡健康獼猴12只,分為幼年、中年、老年和老年UCMSC治療4個組,每組3只,均為雄性。其中幼年組為年齡1歲,、體重 2~3 kg;中年組為年齡 10 歲,體重 8~10 kg;老年和老年UCMSC治療組為年齡22~24歲,體重8~10 kg。編號分別為老年組1~3號,中年組4~6號,幼年組7~9號,老年UCMSC治療組10~12號。實驗用獼猴均來自于中國科學院昆明動物研究所實驗動物中心,在醫(yī)院實驗動物中心進行飼養(yǎng)和實驗,動物使用經過醫(yī)院實驗動物倫理委員會審查、批準。
1.2 UCMSC來源及治療 獼猴UCMSC來源于剖腹產母猴的臍帶組織,UCMSC的制備和鑒定在本實驗室完成。經體外分離、擴增、傳代培養(yǎng)后,獲得第3代(P3)經鑒定符合以下標準:(1)體外培養(yǎng)呈長梭形,旋渦狀克隆生長;(2)高表達 CD105、CD90、CD29,不表達 CD34、CD45;(3)體外可誘導分化為神經、骨、軟骨、脂肪細胞;(4)可分泌多種生長因子、炎癥調節(jié)因子和外分泌體。UCMSC治療方法:將P3 UCMSC用生理鹽水稀釋為1×106細胞/ml懸液,采用后肢隱靜脈輸入法按1×106個細胞/kg的劑量輸入老年UCMSC治療組獼猴體內,1次/w,連續(xù)治療3次,其他組不作處理。所有實驗獼猴均常規(guī)飼養(yǎng)于普通級實驗環(huán)境,給予充足飲水和飼料。
1.3 外周血單個核細胞的采集及處理 末次UCMSC治療后30 d,采集各組獼猴外周靜脈血5 ml,用等量生理鹽水稀釋后,置于預先準備好的淋巴細胞分層液上,400 r/min離心20 min,收集單個核細胞;用生理鹽水洗滌3次,再用1640培養(yǎng)基稀釋成5×106細胞/ml備用。
1.4 LncRNA轉錄組測序及數據分析 外周血單個核細胞樣本交由上海歐易生物醫(yī)學科技有限公司進行RNA提取、二代測序,并提供原始數據、統(tǒng)計處理、數據庫比對、聚類分析、差異分析報告。高通量測序得到的原始圖像數據文件經堿基識別分析轉化為原始測序序列,使用軟件FASTQC對原始數據進行質量評估,使用軟件NGS QC TOOLKIT v2.3.3對數據進行預處理,篩選獲得轉錄組數據。lncRNA的篩選方法:(1)使用cuffcompare軟件樣本轉錄本與參考轉錄本進行比對,去除已知編碼轉錄本;(2)篩選到的轉錄本按長度200 bp和外顯子數目≥2 進行再次篩選;(3)使用 CPC、CNCI、Pfam、PLEK軟件和數據庫[3-6]對篩選得到的轉錄本進行編碼能力預測分析,獲得有編碼潛能的轉錄本。
通過上述3步篩選后,最終獲得的轉錄本為本研究預測得到的潛在lncRNA轉錄本。利用LncRNA的表達量進行主成分PCA分析,對樣品分布和實驗設計進行驗證。利用DESeq軟件包比較不同組別的差異lncRNA,并對差異表達lncRNA進行聚類分析,計算多個樣品兩兩之間的距離,構成距離矩陣,合并距離最近的兩類為一新類,計算新類與當前各類的距離;再合并、計算,直至只有一類為止。同一類樣品能通過聚類出現在同一個簇中,具有相似的生物學功能,用熱圖展示。
2.1 測序數據統(tǒng)計 采用Solexa RNA的pairedend測序法獲得了老年組、中年組、幼年組和老年經UCMSC治療組共12個樣本的全基因組轉錄數據。將獲得的原始數據(raw data)進行預處理:(1)去除低質量的reads,質量閾值設置為20,長度閾值設置為70%;(2)從3'端去除低質量堿基:質量閾值設置為20;(3)切除reads中含有未識別堿基的:長度閾值設置為前35 bp。經過預處理,最終獲得的數據結果見表1。
表1 LncRNA序列數據統(tǒng)計結果
2.2 LncRNA類型分布及主成分分析 通過生物信息學比較分析獲得的lncRNA主要包括基因間lncRNA、內含子lncRNA、反義 lncRNA和有意義重疊lncRNA,其中反義RNA的含量最多,其次是基因間lncRNA和重疊lncRNA(圖1)。采用主成分PCA分析法對12個樣本的lncRNA數據進行樣本分布分析,其中幼年、老年和老年UCMSC治療組的主成分分布相對集中,中年組存在個體差異(圖2)。
圖1 lncRNA類型及含量
圖2 樣品主成分分析
2.3 基因表達量分析 本研究獲得的lncRNA轉錄本的表達豐度結果見表2。差異表達分析采用DESeq軟件中的負二項分布檢驗,計算出各組lncRNA表達差異。老年組與中年組比較,差異表達的基因總數為111個,其中上調表達的48個,下調表達的63個。老年組與幼年組比較,差異表達的基因總數為103個,其中上調表達的54個,下調表達的49個。中年組與幼年組比較,差異表達的基因總數為98個,其中上調表達的52個,下調表達的46個。老年組與老年UCMSC治療組比較,差異表達的基因總數為109個,其中上調表達的41個,下調表達的68個。
2.4 聚類分析 對篩選獲得的差異表達基因進行生物信息聚類分析,結果發(fā)現各組IncRNA表達水平均呈現較大差異,總體趨勢是部分幼年高表達的IncRNA,在中年和老年時表達降低。 見圖3。
lncRNA是一類長度超過200 bp、不具有蛋白編碼功能的RNA分子。在哺乳動物基因組序列中,約有4%~9%的序列產生的轉錄本為lncRNA。研究表明,lncRNA在劑量補償效應、表觀遺傳調控、細胞周期和分化調控等眾多生命活動中發(fā)揮重要作用,參與了X染色體沉積、基因組印記、染色體修飾、轉錄激活、轉錄干擾、核內運輸等多種重要的調控過程[7]。
表2 轉錄本豐度分布
圖3 各組差異表達IncRNA移動平均線(MA)分析
關于衰老及UCMSC治療對IncRNA表達的影響研究,國內外報道極少。本研究通過基因轉錄組測序,獲得了獼猴老年、中年、幼年和老年UCMSC治療后的外周血單個核細胞IncRNA轉錄本,通過生物信息學篩選和比較分析,找出了不同年齡和老年UCMSC治療獼猴差異IncRNA及表達變化。結果發(fā)現,在不同年齡狀態(tài)和UCMSC治療后,IncRNA表達水平存在一定差異,這些差異表達的IncRNA參與了細胞生物過程、功能分子及細胞組成成份基因的表達調控,其主要變化趨勢是隨著年齡增長,部分幼年高表達的IncRNA表達下調,部分幼年低表達的IncRNA表達上調。值得關注的是,在對老年獼猴實施UCMSC治療后,衰老狀態(tài)的低表達IncRNA表達水平升高,而一些高表達IncRNA的表達水平降低,表明衰老狀態(tài)的IncRNA表達譜發(fā)生了向中年或幼年方向逆轉,這種變化可能是UCMSC發(fā)揮抗衰老效應機制之一。
本研究為生物體衰老及UCMSC抗衰老的基因表達調控機制提供了新的思路和證據,一步將針對差異表達IncRNA的靶基因及在衰老和UCMSC治療中的生物學功能進行深入,逐步闡明差異IncRNA的調控機制。