杜雪玲 ,馬媛媛,程洋洋,何 軍,宋運賢, 余如剛
(1.淮北師范大學 生命科學學院,安徽淮北 235000;2.北京陽光綠地生態(tài)科技有限公司,北京 100083)
蘿卜(RaphanussativusL.)屬十字花科蘿卜屬,1 a、2 a生草本植物。肉質直根為蘿卜主要貯藏和食用器官,它的形成與產量和品質緊密相關[1-2]。肉質直根的形狀和大小在蘿卜品種間存在基因型差異,直徑為1~30 cm,長度為3~2 m[3]。通常育種家通過選育不同根大小的蘿卜滿足消費者的需求。因此,揭示蘿卜肉質直根膨大形成的分子調控機制非常重要。
目前,對蘿卜肉質直根的形態(tài)和解剖學已有深入的研究,發(fā)現(xiàn)蘿卜肉質直根的增粗是由維管束形成層的活動產生次生木質部(主要)和韌皮部,以及薄壁細胞分裂和膨大而形成[1,4]。另據(jù)蘿卜肉質直根形成膨大的生理生化研究表明,肉質直根的膨大還受到激素和環(huán)境因子的影響[5-6]。植物生長發(fā)育期間,器官的形成是基于基因持續(xù)表達及其組織或發(fā)育時期的特異性基因表達的結果。然而,有關決定蘿卜肉質直根大小的關鍵基因分離及其形成的分子機制尚鮮有報道。
近年來,隨著組學測序技術的發(fā)展,基于新一代高通量測序平臺的數(shù)字基因表達譜(Digital gene expression profiling, DGE)技術已廣泛應用于植物貯藏根生長發(fā)育過程中的基因差異表達分析,如胡蘿卜[7]、蕪菁[8]、蓮藕[9]和甘薯[10]等,闡明了植物貯藏根生長發(fā)育的分子生物學基礎。Yu等[11]運用基于高通量測序的DGE技術,對蘿卜‘NAU-YH’不同發(fā)育時期(破肚前期、破肚期和膨大期)的肉質直根進行測序,并獲得大量的差異表達基因及其功能注釋和富集調控網絡。蘿卜全基因組序列已被日本學者公布[12],基于此序列,Xu等[13]利用高通量測序技術對長形蘿卜不同發(fā)育時期(7、14、20、60、90 d)的根和葉進行基因差異表達分析。盡管高通量測序技術已成功鑒定到參與肉質直根生長發(fā)育的大量候選基因,但利用DGE技術對不同基因型間蘿卜肉質直根直徑大小的差異表達基因研究鮮有報道。本研究以公開的蘿卜基因組為參考序列,利用數(shù)字基因表達譜技術,對2種根直徑大小不同的圓球形蘿卜 ‘揚州圓白’(直徑大)和‘薩丁’(直徑小)在破肚期和膨大期的基因表達情況進行分析。利用生物信息學手段,對差異表達基因進行注釋和功能分類。以期洞察調控蘿卜肉質根大小的分子機制,為進一步基因功能驗證奠定基礎。
以圓球形蘿卜‘揚州圓白’(肉質根直徑10 cm左右,YB)和‘薩丁’(肉質根直徑2~3 cm, SD)為材料,挑取整齊飽滿基本一致的種子,經過φ=1%次氯酸鈉溶液消毒,于25 ℃黑暗培養(yǎng),萌發(fā)后于營養(yǎng)缽中培養(yǎng),溫度:白天25 ℃/夜晚18 ℃,光照16 h。播種后1周間苗,每盆留3株苗,每個品種6盆。分別采集培養(yǎng)時間為播后 20 d(破肚期)和播后40 d(膨大期)的蘿卜肉質直根材料。取樣后,將每盆中根樣品(3株/盆)用蒸餾水洗滌,等量混合在一起、切碎,液氮速凍,保存于-80 ℃冰箱中,備用。
1.2.1 總RNA提取及質量檢測 分別將YB和SD蘿卜肉質直根2個不同發(fā)育時期(播后20 d和40 d)的根樣品等量混合,然后采用Trizol試劑盒(Invitrogen,USA)分別提取YB和SD混合根樣品的總RNA,操作步驟參照試劑盒提供的說明書進行。利用Nanodrop檢測RNA的純度(OD260/OD280≥1.8),采用Agilent 2100檢測RNA的完整性。
1.2.2 DGE文庫構建和Illumina測序 DGE文庫構建和數(shù)字基因表達譜測序是在北京諾禾致源生物信息科技有限公司進行(Novogene,Beijing,China)。將提取的YB和SD蘿卜的肉質根總RNA,分別用于構建2個DGE文庫(YB和SD庫)。其步驟如下,利用帶有Oligo(dT)的磁珠,通過A-T互補配對與mRNA的ployA尾結合的方式富集純化mRNA,并加入緩沖液,將其打斷成短片段,再以片段化后的mRNA為模板,用六堿基隨機引物(random hexamers)合成一鏈cDNA,然后加入緩沖液、dNTPs和DNA polymerase Ⅰ合成二鏈cDNA,隨后利用AMPure XP beads純化雙鏈cDNA;合成的雙鏈cDNA經末端修復、加A尾并連接測序接頭,接著用AMPure XP 體系進行片段大小選擇,然后進行PCR富集得到最終的DGE文庫;構建好的文庫使用Agilent 2100 system進行質量檢測,合格后進行Illumina HiSeq測序(參照諾禾致源測序結題報告)。
1.2.3 差異表達基因篩選 為了提高篩選蘿卜根大小品種間差異關鍵基因的準確性,本研究差異表達基因篩選方法參照Pimentel等[14],結合基于泊松分布的DEGseq和基于貝葉斯推斷法的Cuffdiff2兩種方法進行基因的差異表達分析。其中,DEGSeq采用TMM(Trimmed mean of M-values,M-值的加權截尾均值)對基因序列數(shù)(read count)數(shù)據(jù)進行標準化處理,以設定閾值錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)q-value <0.005和 |log2fold change|≥ 1(fold change為差異倍數(shù))作為基因差異表達的評判標準;而Cuffdiff2軟件采用FPKM(Expected number of Fragments Per Kilobase of transcript sequence per Millions base pairs sequenced,每百萬片段中來自某一基因每千堿基長度的片段數(shù)目)對read count數(shù)據(jù)進行標準化處理,以q-value < 0.05和 |log2fold change| ≥ 1作為基因差異表達的評判標準。最后,取2種方法獲得的差異表達基因交集作為本研究進一步分析數(shù)據(jù)。
1.2.4 RT-qPCR分析 利用Trizol試劑盒(Invitrogen,USA),在YB和SD中,分別提取肉質直根2個不同發(fā)育時期(播后20 d和40 d)的總RNA,命名為YB20、YB40、SD20和SD40。然后使用PrimeScript○RRT 試劑盒 (Takara,Dalian,China)將各時期的總RNA反轉錄為cDNA。從鑒定的差異表達基因中選擇6個與細胞壁代謝酶相關的候選基因進行RT-qPCR分析。利用Beacon Designer 7.0軟件對基因的特異引物進行設計(表1)。RT-qPCR反應在實時熒光定量PCR儀(ABC7300)中進行。PCR反應程序參考文獻[15]。每個樣品有3次生物學重復(將每盆3株苗的根樣品等量混合形成1個生物學重復),且每個生物學重復有3次技術重復;以β-Actin基因為內參基因,按照 2-ΔΔCT法計算特異基因相對表達量。
運用Microsoft Excel 2010計算每個基因在生物學重復中的標準差,對同一個基因在2個品種肉質根不同發(fā)育時期的結果做t檢驗,以P<0.05作為差異具有統(tǒng)計學意義。
以YB和SD破肚期和膨大期的肉質根為材料構架2個數(shù)字基因表達文庫,分別獲得YB和SD原始序列總數(shù)分別為9 971 691 個和11 089 789個,經去除接頭污染、N(無法確定堿基信息)含量超過10%和低質量序列,YB和SD各庫凈序列總數(shù)分別獲得9 930 954個和11 036 869個(表2)。
表1 用于RT-qPCR分析的引物Table 1 Primers used for RT-qPCR analysis
將獲得的凈序列總數(shù)與參考基因組比對分析,發(fā)現(xiàn)2個DGE文庫當中有80%(YB:8 550 057,86.10%;SD:8 933 608,80.94%)以上的凈序列總數(shù)能夠成功定位到參考基因組上,說明參考基因組選擇合適,而且相關試驗不存在污染(表3)。同時,發(fā)現(xiàn)YB和SD文庫中,比對到基因組上的序列數(shù)分別有8 172 997和8 509 539個為唯一匹配,這些序列數(shù)將被用于差異表達基因的篩選(表3)。
利用DEGseq在YB和SD文庫中共獲得3 666個差異表達轉錄本,Cuffdiff2共獲得1 924個差異表達轉錄本。求交集,共篩選出1 468個差異表達轉錄本,其中有1 369個轉錄本在YB和SD中共同表達,占所有差異表達基因的93.3%。另外,有48和51個差異表達轉錄本分別在YB和SD中特異性表達,分別占所有差異表達基因的3.3%和3.5%(圖1)。
2.2.1 參與細胞壁代謝的差異表達基因鑒定 植物細胞的生長與細胞壁伸展性密切相關[16]。本研究共鑒定到28個差異表達轉錄本編碼的關鍵酶參與細胞壁代謝(表4)。其中,編碼細胞壁降解酶有20個差異表達轉錄本,相比SD,大多數(shù)編碼細胞壁降解酶的轉錄本在YB中上調表達,如內切葡聚糖酶(endoglucanase,EG,2/2)、多聚半乳糖醛酸酶抑制劑(Polygalacturonase inhibitor,PGIP,4/5)、果膠酯酶/果膠酯酶抑制劑(Pectinesterase/pectinesterase inhibitor,PMEI,2/4)、果膠(甲)酯酶(pectinesterase,PE,1/1)和木葡聚糖內糖基轉移酶/水解酶(xyloglucan endotransglycosylase/hydrolase,XTH,5/5);多聚半乳糖醛酸酶(polygalacturonase,PG,)在YB中有1個差異轉錄本上調和2個下調表達。令人驚奇的是,纖維素酶(cellulase)在SD和YB比較中沒有差異表達。另外,YB與SD比較中,編碼細胞壁合成酶有3個差異表達轉錄本,包括1個編碼木葡聚糖轉移酶4(Xyloglucan glycosyltransferase 4,CSLC4)和2個編碼纖維素合成酶類似蛋白(Cellulose synthase-like protein,CSLD2和CSLD3)的轉錄本,在YB中均上調表達(表4)。
表2 原始數(shù)據(jù)產出組成Table 2 The component of sequencing raw data in YB and SD
表3 測序序列與蘿卜基因組比對結果Table 3 The blast result of the reads with radish genome
圖1 YB和SD品種間差異表達基因維恩圖Fig.1 The Venn of differential expression genes (DEGs) between YB and SD
此外,還發(fā)現(xiàn)了2個參與細胞壁代謝調控的關鍵因子,糖基磷脂酰肌醇錨定蛋白(COBRA,COB)和擴展蛋白(expansin,EXP)在YB與SD比較中差異表達。與SD相比較,大多數(shù)編碼EXP蛋白(3/4)和COB蛋白(1/1)的差異轉錄本在YB中上調表達(表4)。
2.2.2 參與蔗糖代謝的差異表達基因鑒定 肉質直根是蘿卜碳水化合物和蛋白質的貯藏庫,參與蔗糖代謝的酶在肉質根的形成過程中發(fā)揮了重要的作用[17]。本研究共鑒定到編碼參與蔗糖代謝途徑的2個相關酶的2個差異表達轉錄本(表5)。YB與SD比較中,一個編碼催化己糖磷酸化的己糖激酶(hexokinase 3,HK3)的轉錄本在YB中上調表達;一個編碼蔗糖分解代謝中轉化酶(beta-fructofuranosidase,AtBETAFRUCT)的轉錄本在YB中下調表達(表5)。此外,基于Cuffdiff2法,編碼蔗糖磷酸合成酶(sucrose phosphate synthase,SPS)和蔗糖合成酶(Sucrose synthase,SuSy)的轉錄本在YB和SD比較中沒有差異表達。
2.2.3 參與植物激素信號轉導途徑差異表達基因鑒定 植物激素信號對根的發(fā)育起關鍵作用[18]。本研究共鑒定到激素相關差異表達轉錄本29個,其中有4個、1個、1個、4個、1個、4個、13個和1個分別參與到生長素(auxin)、細胞分裂素(CTK)、赤霉素(GA)、脫落酸(ABA)、乙烯(ETH)、油菜素類固醇(BR)、茉莉酸(TA)和水楊酸(SA)的生物合成、代謝、激素信號轉導途徑等各個過程(表6)。這些差異轉錄本被分別匹配到SAUR、A-ARR、DELLA、PYR/PYL、PP2C、ABF、ERF2、TCH4、CYCD3、JAZ和NPR1等植物信號轉導途徑相關的基因家族(表6)。YB與SD比較中,SAUR家族匹配上的不同差異轉錄本表達不一致,在YB中即有上調表達又有下調表達;A-ARR、ERF2、TCH4、CYCD3和JAZ家族匹配上的不同差異轉錄本在YB中都上調表達。DELLA、PYR/PYL、PP2C、JAR1、ABF和NPR1家族匹配上的不同差異轉錄本在YB中都下調表達。另外,細胞分裂素、油菜素類固醇和茉莉酸相關的差異表達轉錄本,在YB中整體上調表達。相反,生長素、赤霉素、脫落酸和水楊酸在YB中整體下調表達。
表4 YB 和SD中參與細胞壁代謝的候選差異表達基因Table 4 Candidate DEGs involved in cell wall metabolism in YB and SD
表5 YB 和SD中參與蔗糖代謝的候選差異表達基因Table 5 Candidate DEGs involved in sucrose metabolism in YB and SD
表6 YB 和SD中參與植物激素信號轉導途徑候選差異表達基因Table 6 Candidate DEGs involved in pathway of plant hormone signal transduction in YB and SD
為了驗證數(shù)字基因表達譜測序的可靠性和有效性,選取6個與細胞壁代謝相關的差異表達基因進行RT-qPCR驗證(圖2)。結果表明,6個差異表達基因在YB和SD蘿卜肉質直根2個不同發(fā)育時期(播后20 d和40 d)具有明顯的差異表達。其中,6 個差異基因在RT-qPCR驗證表達模式與DGE測序所得結果基本相符。例如,PG和PMEI3在SD中的相對表達水平高于YB,且PG在SD的破肚期表達水平高于膨大期,相反,PMEI3在SD和YB中的膨大期較高。此外,CSLD3、EG17、XTH22和PGIP1在YB中的表達水平高于SD。這些結果也進一步證實基于RNA-Seq的數(shù)字基因表達譜測序的可靠性和有效性。
不同字母代表在P<0.05 水平顯著性差異 Different letters indicate significant differences atP<0.05
圖26個候選差異表達基因在YB和SD中不同根發(fā)育時期的RT-qPCR分析
Fig.2RT-qPCRanalysisofsixcandidateDEGswithdifferentdevelopmentstagesofrootsinYBandSD
不同的蘿卜品種中,肉質直根的大小和形狀存在很大的差異。其形狀和大小是影響運輸效率、加工效率和消費的重要因素。由此,形狀和大小不僅直接決定蘿卜的產量和品質,而且也關系到產品的價格。因此,揭示不同蘿卜肉質直根形狀和大小形成的生理和分子機制具有重要意義。目前,有關蘿卜肉質直根形狀和大小形成的生理機制已有報道[4,19]。然而,有關決定蘿卜及其他根菜類作物根大小和形狀形成的關鍵分子機制知之甚少[20]。鑒于此,本研究利用DGE技術,對2種不同根直徑大小的圓球形蘿卜:‘揚州圓白’和‘薩丁’進行DGE文庫構建以及測序分析,通過2種方法篩選求交集,共獲得1 468個差異表達轉錄本。有1 369個(93.3%)轉錄本在YB和SD中共同表達,暗示這些基因在蘿卜品種間根發(fā)育過程中具有功能保守性;另外,有48個(3.3%)和51個(3.5%)差異表達轉錄本分別在YB和SD中特異性表達(圖1),暗示這些基因可能是引起2個品種根直徑大小差異的調控因素,這些結果為揭示蘿卜肉質根大小和形狀形成的分子機制奠定了基礎。
細胞壁的力學特性通過調控細胞的擴張性來控制細胞的大小和形狀,從而決定組織和器官的形態(tài)[21]。蘿卜肉質直根的形成主要是次生木質部和次生韌皮部薄壁細胞生長的結果[1]。目前,已有研究證實幾個細胞壁代謝相關的基因,如EXP[22]、COB[23]、XTH[24]通過影響細胞壁軟化從而促進細胞體積的增大。本研究共鑒定出28個差異表達轉錄本與細胞壁代謝相關。其中,發(fā)現(xiàn)大多數(shù)編碼EXP(3/4)、COB(1/1)、XTH(5/5)的轉錄本在YB中上調表達。暗示這3個基因可能是‘揚州圓白’和‘薩丁’蘿卜肉質直根直徑大小差異的影響因子。
蔗糖和己糖是植物中調節(jié)“庫-源”關系的重要信號分子。蘿卜肉質直根為主要的庫器官。蔗糖作為光合作用的主要產物,為肉質直根的形成提供生長代謝原料[25]。與蔗糖代謝和積累緊密相關的酶主要有蔗糖磷酸合成酶(SPS)、蔗糖合成酶(SuSy)和蔗糖轉化酶(INV)。有關蔗糖代謝對蘿卜肉質直根形成的影響已有相關報道[26-27]。通過對不同根冠比蘿卜研究發(fā)現(xiàn),蘿卜庫的活性與SuSy基因密切相關,而不是INV[27-28]。由此推測SuSy可能是調節(jié)肉質根蔗糖水平、控制肉質根庫活性的關鍵酶。但是,基于KEGG途徑分析,本研究僅篩選出1個參與蔗糖代謝的酶家族的差異表達轉錄本,即轉化酶基因ATBETAFRUCT4(Rsa1.0_00018.1_g00046.1)在YB中下調表達,暗示ATBETAFRUCT4可能參與‘揚州圓白’和‘薩丁’蘿卜肉質直根直徑大小差異的調控。相反,SuSy和SPS基因在YB和SD比較中沒有變化。對于這些基因是否參與蘿卜肉質直根直徑大小差異的調控還需進一步功能驗證。
另外,據(jù)報道,光合同化產物的分配,除了蔗糖外,其分解產物己糖通過糖酵解途徑為植物的生理活動也提供各種養(yǎng)分[25]。植物體內己糖必需經磷酸化后才能進入糖酵解途徑,己糖激酶是催化己糖磷酸化的酶系統(tǒng)。研究表明木薯的塊根形成過程中,膨大期己糖激酶的活性最高,而塊根成熟期,己糖激酶的活性有所降低[29];此外,MeHK2基因在木薯塊根形成期表達量最高,表明該基因在塊根膨大過程中起一定的作用[29]。本研究發(fā)現(xiàn)一個編碼HK3基因的轉錄本(Rsa1.0_08050.1_g00001.1)在YB中上調表達。結果表明,HK3基因可能是影響‘揚州圓白’和‘薩丁’蘿卜肉質直根直徑大小差異的因子。
植物激素對貯藏根的發(fā)育和膨大具有重要作用[18,29]。本研究共鑒定到激素相關差異表達轉錄本29個,分別參與了生長素、細胞分裂素、赤霉素、脫落酸、乙烯、油菜素類固醇、茉莉酸和水楊酸等8條植物激素信號轉導途徑。生長素具有促進細胞分裂和分化以及細胞膨大的作用[30],本研究發(fā)現(xiàn)參與生長素代謝途徑的4個差異轉錄本均為SAUR基因,2個SAUR差異表達轉錄本(Rsa1.0_01909.1_g00006.1和Rsa1.0_00483.1_g00001.1)在YB中上調表達,2個(Rsa1.0_00019.1_g00012.1和Rsa1.0_00269.1_g00025.1)在YB中下調表達,暗示同一個SAUR基因家族不同成員在蘿卜肉質根膨大過程中所起的作用不同。CTK誘導貯藏根形成時的細胞分裂,促進分生組織的擴大[31],A-type ARR在抑制細胞分裂素反應中起重要作用[32]。筆者發(fā)現(xiàn)1個參與CTK代謝途徑的A-ARR基因(Rsa1.0_05100.1_g00001.1)在YB中均上調表達,暗示了A-ARR基因不是引起2個蘿卜根直徑大小差異的主要因子,其具體功能有待進一步驗證。JA通過促進碳水化合物代謝而引起貯藏根的形成[33]。TIFY家族中的JAZ亞家族蛋白是JA信號轉導途徑中的重要調控因子,可以啟動JA應答基因的轉錄[34]。擬南芥中,過表達ZIM/AtTIFY1基因促進葉柄和下胚軸伸長[35]。本研究發(fā)現(xiàn)12個編碼TIFY蛋白的差異轉錄本,屬于JAZ亞家族基因,在YB中均表現(xiàn)為上調表達。其中,TIFY10B(Rsal.001963.1_g00004.1)在YB中特異性表達,暗示這個基因可能是‘揚州圓白’蘿卜肉質直根的膨大關鍵因子。GA能夠調控根細胞的膨大[36],本研究發(fā)現(xiàn)GA信號通路中的負向調控因子DELLA蛋白在YB中下調表達。ETH刺激細胞延伸從而引起貯藏根膨大[37],ERF與EREBPs可以與靶基因啟動子上的GCCbox相互作用,從而激活ETH響應[38]。本研究發(fā)現(xiàn)1個ERF2基因在YB中均上調表達。BR提高蘿卜可溶性蛋白質含量[39],也可以促進植物的生長和細胞的膨大,CYCD3是BR響應的下游組件,可以促進細胞分裂[40]。本研究發(fā)現(xiàn)1個CYCD3基因在YB中表現(xiàn)為顯著上調表達;此外,據(jù)報道在擬南芥中BR通過增加AtXTH22基因(TCH4)表達量促進細胞擴展伸長[41]。本研究發(fā)現(xiàn)3個編碼XTH22酶基因在YB中均表現(xiàn)為上調表達。以上結果推測,TIFYs、DELLA、ERF2、XTH22和CYCD3基因可能是引起YB和SD根直徑大小差異的調控因子。以上所有基因在蘿卜肉質根發(fā)育過程中的生理作用尚需進一步深入研究。
基于RNA-seq測序的數(shù)字基因表達譜技術,本研究共獲得1 468個差異表達轉錄本。功能注釋共鑒定28個差異轉錄本參與細胞壁代謝,2個差異轉錄本參與蔗糖代謝,29個差異轉錄本參與激素合成與信號轉導。令人感興趣的是,一些參與植物激素合成與激素信號轉導相關基因(TIFYs、DELLA、ERF2和CYCD3)、蔗糖代謝相關基因(ATBETAFRUCT4和HK3)和細胞壁代謝相關基因(XTHs、EXPs和COBs)在‘揚州圓白’蘿卜中上調表達,推測這些基因可能參與‘揚州圓白’和‘薩丁’蘿卜肉質直根大小的差異的調控。同時利用RT-qPCR 對6個細胞壁代謝相關基因的表達模式進行了驗證。這些結果將有助于對控制根大小相關基因的進一步功能分析,并為揭示蘿卜肉質直根大小基因型間差異的分子機制提供依據(jù)。