譚曉勇,劉洪,馮春念,田明英,趙恩慧,牟必鴻,馮甜華,冉啟軍
宣漢縣人民醫(yī)院藥學(xué)部1、檢驗(yàn)科2、婦產(chǎn)科3,四川 達(dá)州 636150
隨著人民生活水平的不斷提高和生活方式的不斷改變,我國(guó)妊娠期糖尿病(gestational diabetes mellitus,GDM)的發(fā)病率逐年攀升。GDM是指妊娠中期或晚期發(fā)生的一種妊娠期并發(fā)癥,是妊娠過(guò)程中最常見(jiàn)的代謝性疾病,主要表現(xiàn)為妊娠期初次發(fā)生的自發(fā)性糖耐量異常[1]。據(jù)報(bào)道,我國(guó)GDM發(fā)病率約為17.5%,而全球每年約有1 800 萬(wàn)妊娠婦女罹患GDM[2]。目前,臨床上GDM的治療方法主要是藥物治療,主要包括胰島素類、雙胍類藥物[3]。研究表明,GDM 不僅會(huì)導(dǎo)致母親妊娠期高血壓疾病、產(chǎn)后2型糖尿病、分娩巨大兒和腫瘤等并發(fā)癥的發(fā)生率顯著升高,而且還會(huì)對(duì)胎兒產(chǎn)生近期和遠(yuǎn)期影響,如分娩后新生兒發(fā)生低血糖及未來(lái)發(fā)生肥胖、糖耐量降低甚至死亡的風(fēng)險(xiǎn)明顯升高[4]。因此,早診斷、早治療GDM,對(duì)于保護(hù)婦女妊娠安全、避免不良妊娠結(jié)局具有重要意義,尋找具有潛在診斷和治療效果評(píng)估價(jià)值的新型標(biāo)記物成為當(dāng)務(wù)之急。
長(zhǎng)鏈非編碼RNA (long-chain non-coding RNAs,lncRNAs)是一類長(zhǎng)度超過(guò)200個(gè)核苷酸具有特定生物學(xué)功能的非編碼RNA(noncoding RNAs,ncRNAs),由RNA聚合酶Ⅱ催化轉(zhuǎn)錄合成,起初被認(rèn)為是基因轉(zhuǎn)錄過(guò)程中生成的“垃圾序列”和“噪音”[5-6]。隨著現(xiàn)代科技尤其是二代測(cè)序的不斷發(fā)展,越來(lái)越多的研究表明,lncRNAs 能以RNA 的形式參與表觀遺傳、轉(zhuǎn)錄以及轉(zhuǎn)錄后水平調(diào)控基因的表達(dá),廣泛參與心血管系統(tǒng)疾病[7]、腫瘤[5]、泌尿系統(tǒng)疾病[8]和代謝性系統(tǒng)疾病[9]等多種疾病的生命調(diào)控過(guò)程,在人類疾病的發(fā)生發(fā)展過(guò)程中扮演著十分重要的角色。Yang 等[10]通過(guò)RNA測(cè)序和差異表達(dá)分析揭示,與對(duì)照組(健康成人)比較,2 型糖尿病組有441個(gè)lncRNAs(366個(gè)上調(diào)和75個(gè)下調(diào))、93 個(gè)miRNAs (63 個(gè)上調(diào)和30 個(gè)下調(diào))、2 923 個(gè)mRNA(1 156 個(gè)上調(diào)和1 779 個(gè)下調(diào))差異表達(dá)顯著。而Zhou 等[11]研究表明,lncRNA Malat1 在糖尿病腎病患者中高表達(dá),而聯(lián)合ACR、肌酐、α1-MG 和lncRNA Malat1 監(jiān)測(cè)對(duì)診斷糖尿病腎病具有重要意義。lncRNAs在2型糖尿病及其并發(fā)癥病理發(fā)生機(jī)制的研究已經(jīng)較為詳盡,但在GDM 病理發(fā)生發(fā)展中的調(diào)控機(jī)制研究較少。本研究以此為出發(fā)點(diǎn),擬通過(guò)高通量測(cè)序技術(shù)查明GDM患者外周血中差異表達(dá)的lncRNAs,構(gòu)建lncRNAs-mRNA共表達(dá)網(wǎng)絡(luò),并預(yù)測(cè)其生物學(xué)功能,探討lncRNAs 未來(lái)成為研發(fā)診斷和治療GDM 的新試劑、新藥物分子靶點(diǎn)的可能。
1.1 一般資料 收集2020 年7 月至2021 年12月于宣漢縣人民醫(yī)院婦產(chǎn)科入院就診的GDM 患者(GDM 組)和門(mén)診健康體檢孕婦(對(duì)照組)各30 例,各隨機(jī)抽取3 例,收集其外周血標(biāo)本進(jìn)行后續(xù)測(cè)序研究。入組GDM患者符合2021年國(guó)際妊娠期糖尿病研究協(xié)會(huì)(IADPSG)推薦的GDM 診斷標(biāo)準(zhǔn),并排除精神患者及不同意參與研究的患者。本研究獲得宣漢縣人民醫(yī)院倫理委員會(huì)的批準(zhǔn),所有研究?jī)?nèi)容已取得入組對(duì)象同意,并簽署知情同意書(shū)。兩組孕婦的年齡和孕周比較差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),但在分娩前BMI、糖化血紅蛋白、糖耐量空腹血糖、糖耐量1 h 后血糖、糖耐量2 h 后血糖方面比較差異均具有統(tǒng)計(jì)學(xué)意義(P<0.05),見(jiàn)表1。
表1 兩組孕婦的基本資料比較(±s)Table 1 Comparison of basic information and data of two groups of pregnant women(±s)
表1 兩組孕婦的基本資料比較(±s)Table 1 Comparison of basic information and data of two groups of pregnant women(±s)
基本資料年齡(歲)孕周(周)分娩前BMI(kg/m2)糖化血紅蛋白(%)糖耐量空腹血糖(mmol/L)糖耐量1 h后血糖(mmol/L)糖耐量2 h后血糖(mmol/L)GDM組(n=30)27.54±4.25 38.21±1.10 27.35±2.21 5.33±0.25 5.13±0.52 9.69±1.52 8.32±1.52對(duì)照組(n=30)27.89±3.91 38.35±1.15 25.38±2.35 5.15±0.23 4.31±0.21 7.71±1.12 6.51±0.82 t值0.33 0.48 3.34 2.90 8.00 5.69 5.74 P值0.740 0.630 0.001 0.005 0.001 0.001 0.001
1.2 研究方法
1.2.1 總RNA 的提取 抽取GDM 組和對(duì)照組患者外周血各5 mL,按照TRIzol 試劑(Invitrogen,ThermoFisherScientific,MA)說(shuō)明書(shū)操作步驟,分離和純化全血基因組總RNA,對(duì)總RNA 進(jìn)行rRNA 的剔除、質(zhì)量控制及合成cDNA,將構(gòu)建好的文庫(kù)在Illumina HiSep 4000 測(cè)序系統(tǒng)上進(jìn)行RNA 測(cè)序。lncRNAs基因測(cè)序及表達(dá)譜分析由上海美吉生物醫(yī)藥科技有限公司完成。
1.2.2 lncRNAs差異表達(dá)譜分析 采用軟件Fastp對(duì)原始測(cè)序數(shù)據(jù)進(jìn)行堿基質(zhì)量分布統(tǒng)計(jì)、堿基錯(cuò)誤率分布統(tǒng)計(jì)和A/T/G/C 堿基含量分布統(tǒng)計(jì)的質(zhì)量評(píng)估。為保證后續(xù)分析結(jié)果的準(zhǔn)確性,利用SeqPrep和Sickle軟件進(jìn)行數(shù)據(jù)質(zhì)控和篩選,主要包括:(1)去除reads中的接頭序列;(2)將序列末端(3'端)質(zhì)量值小于20 的堿基修剪掉;(3)去除含N (模塊堿基)的reads;(4)去掉adapter及質(zhì)量修剪后長(zhǎng)度小于30 bp 的序列。通過(guò)比對(duì)和過(guò)濾得到已知lncRNAs和新預(yù)測(cè)lncRNAs兩種形式后,采用TopHat2/HISAT2 軟件,與參考基因組進(jìn)行比對(duì)分類和均一性分析,獲得用于后續(xù)轉(zhuǎn)錄本組裝、表達(dá)量計(jì)算等的mapped data (reads)。采用RSEM、Kallisto 和Salmon 軟件對(duì)基因?qū)哟?轉(zhuǎn)錄本層次的lncRNAs和mRNA的整體表達(dá)水平進(jìn)行定量分析,采用DESeq2 軟件包進(jìn)行GDM 組和對(duì)照組基因?qū)哟?轉(zhuǎn)錄本層次的lncRNAs 和mRNA 差異表達(dá)譜分析。以顯著性P值和差異表達(dá)倍數(shù)(fold change,F(xiàn)C)作為判斷標(biāo)準(zhǔn),對(duì)兩組間上調(diào)和下調(diào)差異表達(dá)的lncRNAs進(jìn)行資料統(tǒng)計(jì),并對(duì)差異表達(dá)的lncRNAs 運(yùn)用R 語(yǔ)言進(jìn)行聚類分析,分別繪制熱圖和火山圖。
1.2.3 構(gòu)建lncRNAs與mRNA共表達(dá)網(wǎng)絡(luò) 基于mRNA/lncRNAs 表達(dá)量的相關(guān)性,構(gòu)建基因共表達(dá)網(wǎng)絡(luò)能直觀地顯示差異表達(dá)的lncRNAs和mRNA之間的關(guān)聯(lián),通過(guò)Pearson相關(guān)性算法獲得mRNA間、lncRNAs間和mRNA 與lncRNAs 間的相關(guān)系數(shù),分析是否存在相關(guān)性,篩選出表達(dá)明顯相關(guān)的lncRNAs-mRNA關(guān)系對(duì)。
1.2.4 差異表達(dá)lncRNAs的GO及KEGG信號(hào)通路富集分析 分別利用軟件Goatools和R腳本對(duì)差異表達(dá)的lncRNAs顯著相關(guān)的mRNA進(jìn)行GO富集分析和KEGG PATHWAY 富集分析,從而通過(guò)mRNA 的功能推導(dǎo)差異表達(dá)的lncRNAs的功能,了解差異表達(dá)的lncRNAs 在GDM 病理生理發(fā)生發(fā)展過(guò)程中的作用。利用Fisher 進(jìn)行精確假設(shè)檢驗(yàn),當(dāng)經(jīng)過(guò)校正的P 值<0.05時(shí),認(rèn)為此GO功能和KEGG PATHWAY功能存在顯著富集情況。
1.3 統(tǒng)計(jì)學(xué)方法 采用limma 和DESeq 軟件以篩選條件為|log2FC|≥2 且P<0.05 為差異表達(dá)lncRNAs的篩選標(biāo)準(zhǔn)(FC為差異表達(dá)的倍數(shù),即GDM組與對(duì)照組差異表達(dá)倍數(shù)在2 倍以上且滿足P<0.05)。根據(jù)每個(gè)樣品中基因/轉(zhuǎn)錄本的表達(dá)量計(jì)算Pearson相關(guān)系數(shù),樣品間的Pearson 相關(guān)系數(shù)r 的范圍是|r|≤1。計(jì)數(shù)資料采用“%”統(tǒng)計(jì)表示,計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差(±s)表示,采用R軟件利用t檢驗(yàn)對(duì)歸一化數(shù)據(jù)組進(jìn)行分析統(tǒng)計(jì)。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 高通量測(cè)序數(shù)據(jù)的質(zhì)量控制 對(duì)測(cè)序得到的原始數(shù)據(jù)進(jìn)行質(zhì)量控制,并對(duì)其進(jìn)行統(tǒng)計(jì)以及質(zhì)量評(píng)估,主要包括:(1)堿基質(zhì)量分布統(tǒng)計(jì);(2)堿基錯(cuò)誤率分布統(tǒng)計(jì);(3)A/T/G/C堿基含量分布統(tǒng)計(jì)。結(jié)果顯示,經(jīng)質(zhì)量控制后,錯(cuò)誤率均在0.02%以下,Q20、Q30的比例分別達(dá)到98%和94%以上,GC含量均高于54%,數(shù)據(jù)質(zhì)量較高,保證了后續(xù)測(cè)序結(jié)果的可靠性,見(jiàn)表2。
表2 高通量測(cè)序數(shù)據(jù)的質(zhì)檢結(jié)果Table 2 Quality inspection results of high-throughput sequencing data
2.2 差異表達(dá)的lncRNAs 測(cè)序結(jié)果顯示,以|log2FC|≥2且P<0.05為依據(jù),在lncRNAs和mRNA表達(dá)譜方面,GDM 組與對(duì)照組的差異有統(tǒng)計(jì)學(xué)意義(P<0.05),與對(duì)照組比較,GDM 組有333 個(gè)差異表達(dá)的lncRNAs(上調(diào)的lncRNAs 有169 條,下調(diào)的lncRNAs有164 條)和2 036 個(gè)差異表達(dá)的mRNA (上調(diào)的mRNA有645條,下調(diào)的mRNA有1 391條),分別如火山圖1A、1B,散點(diǎn)圖2A、2B 所示,差異表達(dá)的lncRNAs 和mRNAs 均勻地分布在兩側(cè),表明測(cè)序結(jié)果良好,結(jié)果可靠。進(jìn)一步研究顯示,與對(duì)照組比較,GDM 組有12 條lncRNAs 表達(dá)上調(diào)超過(guò)6 倍,14 條lncRNAs表達(dá)下調(diào)超過(guò)6倍;有其中有20條mRNA表達(dá)上調(diào)超過(guò)8 倍,有17 條mRNA 表達(dá)下調(diào)超過(guò)12 倍。表3、表4 分別按照P 值大小列出來(lái)上調(diào)、下調(diào)lncRNAs和mRNA的前10位。
表3 差異表達(dá)顯著的lncRNAs(按照P值大小排序前10位)Table 3 lncRNAs with significant differential expression(top 10 by P value)
表4 差異表達(dá)顯著的mRNA(按照P值大小排序前10位)Table 4 mRNA with significant differential expression(top 10 by P value)
圖1 差異表達(dá)的lncRNAs和mRNA火山圖Figure 1 Volcano map of differentially expressed lncRNAs and mRNA
圖2 差異表達(dá)的lncRNAs和mRNA散點(diǎn)圖Figure 2 Scatter plot of differentially expressed lncRNAs and mRNA
2.3 lncRNAs-mRNA 共表達(dá)網(wǎng)絡(luò)構(gòu)建 為查明哪些關(guān)鍵mRNA受差異表達(dá)的lncRNAs所調(diào)控,本研究通過(guò)構(gòu)建lncRNAs-mRNA 共表達(dá)網(wǎng)絡(luò),以Pearson相關(guān)系數(shù)絕對(duì)值大于0.99 且P<0.05 為標(biāo)準(zhǔn),共得到16 104 個(gè) 條 目,其 中l(wèi)ncRNAs-mRNA 和mRNA-lncRNAs關(guān)系對(duì)分別為611個(gè)、2 965個(gè)。
2.4 GO 生物學(xué)功能富集分析和KEGG PATHWAY信號(hào)通路富集分析 對(duì)兩個(gè)關(guān)系對(duì)中l(wèi)ncRNAs相應(yīng)靶基因進(jìn)行GO 富集分析和KEGG Pathway 分析。GO 生物學(xué)功能富集分析結(jié)果顯示:在生物過(guò)程條目中,差異表達(dá)的lncRNAs 靶向調(diào)控的mRNA轉(zhuǎn)錄本主要富集在蛋白復(fù)合物分解調(diào)控、免疫系統(tǒng)調(diào)節(jié)、代謝過(guò)程調(diào)節(jié)、細(xì)胞過(guò)程調(diào)節(jié)和生物過(guò)程調(diào)節(jié)等。在細(xì)胞成分條目中,主要富集在轉(zhuǎn)錄因子AP-1 復(fù)合物、胞漿、細(xì)胞膜元件、膜結(jié)合細(xì)胞器、細(xì)胞器和核等。在分子功能條目中,主要富集在有機(jī)環(huán)化合物結(jié)合、雜環(huán)化合物結(jié)合、鈣黏蛋白結(jié)合、RNA 結(jié)合、序列特異性雙鏈DNA 結(jié)合和核酸結(jié)合等,見(jiàn)圖3。KEGG 信號(hào)通路富集分析結(jié)果顯示,差異表達(dá)的lncRNAs 靶向調(diào)控的mRNA 轉(zhuǎn)錄本參與的信號(hào)通路主要包括:B 細(xì)胞受體信號(hào)通路、泛素介導(dǎo)的蛋白質(zhì)水解、破骨細(xì)胞分化、內(nèi)質(zhì)網(wǎng)中的蛋白質(zhì)加工、人類T 細(xì)胞白血病病毒1 感染、雌激素信號(hào)通路、PD-L1 和PD-1 在癌癥中的表達(dá)信號(hào)通路等,見(jiàn)圖4。
圖3 差異表達(dá)的lncRNAs靶向mRNA轉(zhuǎn)錄本GO富集分析Figure 3 GO enrichment analysis of differentially expressed lncRNAs target-regulated mRNA transcripts
圖4 差異表達(dá)的lncRNAs靶向mRNA轉(zhuǎn)錄本KEGG pathway富集分析Figure 4 KEGG enrichment analysis of differentially expressed lncRNAs targeted mRNA
續(xù)表3
研究表明,妊娠期糖尿病患者可分為兩類,一種是妊娠前就已確診為糖尿病患者,稱為“糖尿病合并妊娠”;而另一種是妊娠前糖代謝正常而妊娠期過(guò)程中罹患糖尿病的患者,則稱為妊娠期糖尿病。目前,國(guó)內(nèi)外對(duì)GDM 病理生理發(fā)展過(guò)程的認(rèn)識(shí)與研究仍然很少,而關(guān)于GDM 患者的外周血lncRNAs 差異表達(dá)譜以及l(fā)ncRNAs的異常表達(dá)與GDM 患者的臨床表現(xiàn)特征、診療方式和預(yù)后發(fā)展情況的關(guān)系目前均未見(jiàn)報(bào)道。隨著基因組時(shí)代的快速發(fā)展,高通量測(cè)序和基因芯片技術(shù)已成為分子生物學(xué)和遺傳學(xué)研究中的兩大重要技術(shù)[12]。數(shù)以萬(wàn)計(jì)的基因組序列的發(fā)現(xiàn)和功能研究,使得大規(guī)模識(shí)別常見(jiàn)病、多發(fā)病lncRNAs 表達(dá)譜及其在這些疾病病理發(fā)展分子機(jī)制、信號(hào)通路成為可能。本研究以此為切入點(diǎn),對(duì)lncRNAs 在GDM 患者外周血表達(dá)譜進(jìn)行初步篩查,為lncRNAs的異常表達(dá)在GDM 病理生理過(guò)程研究提供了新思路和新依據(jù)。同時(shí),加速對(duì)GDM 患者最新治療靶點(diǎn)的研究以及預(yù)防、診斷和預(yù)后監(jiān)測(cè)標(biāo)記物的開(kāi)發(fā)研究。因此,查明GDM 患者的生物遺傳學(xué)特征將有助于探索該病的發(fā)病分子機(jī)制和信號(hào)通路,找到新的個(gè)體化診療方案。越來(lái)越多的研究表明,外周血中異常表達(dá)的lncRNAs在諸如心血管疾病[7]、腫瘤[5]和內(nèi)分泌系統(tǒng)疾病[9]等人類眾多疾病的病理生理過(guò)程中扮演著重要的角色,已成為近年來(lái)國(guó)內(nèi)外研究者們關(guān)注的焦點(diǎn)。Liang 等[13]研究表明,LncRNA RSU1P2 在肝癌組織和細(xì)胞中的表達(dá)顯著上升,而敲除LncRNA RSU1P2 能顯著抑制肝癌細(xì)胞的存活、侵襲、上皮-間充質(zhì)轉(zhuǎn)化(EMT)和癌干細(xì)胞相關(guān)基因的表達(dá),同時(shí)促進(jìn)肝癌細(xì)胞的凋亡;進(jìn)一步研究揭示,lncRNA RSU1P2 能通過(guò)let-7a/Tex10 途徑促進(jìn)肝癌的腫瘤發(fā)生和腫瘤干細(xì)胞樣特性。Zheng 等[14]研究表明,lncRNA TTTY15 在缺氧誘導(dǎo)的HUVEC 中的表達(dá)水平明顯上調(diào),而miR-186-5p的表達(dá)水平顯著下調(diào);進(jìn)一步研究表明,lncRNA TTTY15 能通過(guò)靶向調(diào)控HUVEC中的miR-186-5p調(diào)節(jié)缺氧誘導(dǎo)的細(xì)胞損傷。
本研究分別收集了3 例GDM 患者和健康孕婦外周血樣本,并采用高通量測(cè)序的方法對(duì)lncRNAs表達(dá)譜進(jìn)行生物信息學(xué)分析。研究發(fā)現(xiàn),與健康孕婦比較,GDM 患者外周血有差異表達(dá)的lncRNAs 333 個(gè),mRNA 2 036 個(gè),其中上調(diào)的lncRNAs 169 個(gè),mRNA 645 個(gè);下調(diào)的lncRNAs 164 個(gè),mRNA 1 391 個(gè);且有12 條lncRNAs表達(dá)上調(diào)超過(guò)6 倍,14 條lncRNAs 表達(dá)下調(diào)超過(guò)6 倍;20 條mRNA 表達(dá)上調(diào)超過(guò)8 倍,17 條mRNA表達(dá)下調(diào)超過(guò)12倍。GO生物學(xué)功能富集分析結(jié)果顯示:差異表達(dá)的lncRNAs靶向調(diào)控的mRNA轉(zhuǎn)錄本主要富集在轉(zhuǎn)錄因子AP-1 復(fù)合物、蛋白質(zhì)復(fù)合物分解的調(diào)控、免疫系統(tǒng)調(diào)節(jié)、防御反應(yīng)、細(xì)胞解剖實(shí)體、大分子代謝過(guò)程的調(diào)控、氮化合物代謝過(guò)程的調(diào)控、胞漿、代謝過(guò)程調(diào)節(jié)等;KEGG 信號(hào)通路富集分析結(jié)果顯示,差異表達(dá)的lncRNAs靶向調(diào)控的mRNA轉(zhuǎn)錄本參與的信號(hào)通路主要包括:B 細(xì)胞受體信號(hào)通路、泛素介導(dǎo)的蛋白質(zhì)水解、破骨細(xì)胞分化、內(nèi)質(zhì)網(wǎng)中的蛋白質(zhì)加工、人類T 細(xì)胞白血病病毒1 感染、雌激素信號(hào)通路、PD-L1 和PD-1 在癌癥中的表達(dá)信號(hào)通路等。
本研究結(jié)果表明,lncRNAs的異常表達(dá)與GDM的發(fā)生發(fā)展密切相關(guān),為尋找GDM 診療新型標(biāo)志物提供了新的思路,為后續(xù)研究GDM 病理發(fā)生過(guò)程,實(shí)現(xiàn)GDM 診治的精準(zhǔn)化,提高GDM 患者的生活質(zhì)量打下了堅(jiān)實(shí)基礎(chǔ)。目前,要將lncRNAs 作為GDM 臨床診療標(biāo)志物仍存在一定的局限性,主要原因是本研究選取的是小范圍地區(qū)內(nèi)的患者,其他地區(qū)和其他種族是否具有同樣差異還未可知,同時(shí)具體的分子調(diào)控分子網(wǎng)絡(luò)和信號(hào)通路尚需進(jìn)一步深入研究。本次研究的創(chuàng)新點(diǎn)主要是采用高通量測(cè)序篩選了GDM 患者外周血差異表達(dá)lncRNAs,查明了更多未知的與GDM 相關(guān)的lncRNAs,遴選了相關(guān)性較高的差異表達(dá)的lncRNAs的靶基因mRNA,并闡述了這些mRNA 的主要生物學(xué)功能和可能參與調(diào)控的信號(hào)通路。作為當(dāng)前較為熱門(mén)的研究方向,雖然lncRNAs還未能真正應(yīng)用于臨床,但是對(duì)于lncRNAs與臨床疾病相結(jié)合的研究仍具有重要的指導(dǎo)意義。未來(lái),本研究團(tuán)隊(duì)將遴選具有重要意義的lncRNAs 和mRNA 進(jìn)行PCR 驗(yàn)證,并進(jìn)一步深入探索lncRNAs 在GDM 病理發(fā)生發(fā)展中的重要分子機(jī)制,參與的重要代謝性信號(hào)通路等。