李和平 姚運(yùn)法 練冬梅 賴正鋒 洪建基
(福建省農(nóng)業(yè)科學(xué)院亞熱帶農(nóng)業(yè)研究所,漳州 363005)
黃秋葵(Abelmoschus esculentus)為錦葵科秋葵屬植物,是一種眾所周知的天然的、健康的蔬菜品種,廣泛分布于非洲、亞洲、美洲等地區(qū),非洲和亞洲的種植面積超過(guò)了99%[1]。黃秋葵莢果中富含不飽和脂肪酸、膳食纖維、活性多糖、維生素等[2],經(jīng)常食用幫助消化、增強(qiáng)體力、保護(hù)肝臟、健胃整腸,而且莢果中含有黃酮、類黃酮、葉黃素、生物堿和微量元素,能增強(qiáng)機(jī)體的抗病能力[3-5]。王君耀等[6]研究小鼠經(jīng)黃秋葵水提取液灌胃15 d,然后進(jìn)行游泳、耐缺氧等實(shí)驗(yàn),結(jié)果顯示黃秋葵水可以明顯提高小鼠耐缺氧能力及耐寒耐熱能力,降低小鼠劇烈運(yùn)動(dòng)后血乳酸水平,因而具有抗疲勞作用。由于其果實(shí)具有較高的營(yíng)養(yǎng)價(jià)值,并且可以提高運(yùn)動(dòng)耐力,歐美等國(guó)把它列入21世紀(jì)最佳綠色食品名錄之中,并被許多國(guó)家作為運(yùn)動(dòng)員首選蔬菜。黃秋葵被認(rèn)為是次要的作物,直到現(xiàn)在都很少人關(guān)注其遺傳改良工作。
轉(zhuǎn)錄組是某個(gè)物種或者特定細(xì)胞類型產(chǎn)生的所有轉(zhuǎn)錄本的集合。轉(zhuǎn)錄組研究能夠從整體水平研究基因功能以及基因結(jié)構(gòu),揭示特定生物學(xué)過(guò)程以及疾病發(fā)生過(guò)程中的分子機(jī)理,已廣泛應(yīng)用于基礎(chǔ)研究、臨床診斷和藥物研發(fā)等領(lǐng)域。在錦葵科植物中棉花的轉(zhuǎn)錄組研究最多,有針對(duì)棉花纖維早期發(fā)育的[7]、有針對(duì)根部水脅迫的[8]、有研究苗期棉花雜種優(yōu)勢(shì)的[9]等。而黃秋葵作為一個(gè)小物種,研究報(bào)道比較少,Roland等[10]對(duì)黃秋葵葉片和果實(shí)進(jìn)行了轉(zhuǎn)錄組測(cè)序,獲得了葉片和果實(shí)基因表達(dá)的基本信息;張少平等[11]對(duì)紅秋葵葉片進(jìn)行轉(zhuǎn)錄組測(cè)序,主要研究花青素的合成。而黃秋葵果實(shí)作為主要收獲部位,果實(shí)的發(fā)育和營(yíng)養(yǎng)成分變化應(yīng)該是研究的主要方向。因此,針對(duì)黃秋葵果實(shí)轉(zhuǎn)錄組信息不全、次生代謝相關(guān)功能基因研究較少的情況,本研究利用RNA-seq技術(shù)研究黃秋葵果實(shí)發(fā)育過(guò)程中的轉(zhuǎn)錄組,可以全面了解黃秋葵果實(shí)基因表達(dá)相關(guān)信息,以及各代謝途徑關(guān)鍵基因的表達(dá)情況,并且可以以此為基礎(chǔ)開發(fā)SSR、SNP等多種分子標(biāo)記,以期為品種鑒定和遺傳分析提供依據(jù)。
黃秋葵種質(zhì)GZ167(福建省農(nóng)業(yè)科學(xué)院亞熱帶農(nóng)業(yè)研究所資源編號(hào))種植于福建省農(nóng)業(yè)科學(xué)院亞熱帶農(nóng)業(yè)研究所試驗(yàn)基地,7月下旬采集開花后1 d、5 d、12 d的黃秋葵果實(shí)(去除種子,可排除異花授粉造成的影響),每個(gè)處理采3株的果實(shí),等量混合后提取RNA,即每個(gè)RNA樣品含有3株黃秋葵果實(shí)的RNA,這樣可以排除個(gè)體差異,3份樣品分別標(biāo)記為167-1、167-5、167-12。
1.2.1 黃秋葵總RNA的提取 黃秋葵總RNA的提取采用成都福際生物有限公司的多糖多酚植物總RNA提取試劑盒(產(chǎn)品編號(hào):RE-05021),RNA濃度和純度通過(guò)Agilent 2100 檢測(cè)。
1.2.2 文庫(kù)構(gòu)建 檢測(cè)合格的黃秋葵總RNA用帶有Oligo(dT)的磁珠富集mRNA,向得到的mRNA中加入Fragmentation Buffer使其成為短片段,再以片段后的mRNA為模板,用六堿基隨機(jī)引物(Random hexamers)合成cDNA第1鏈,并加入緩沖液、dNTPs、RNase H 和 DNA polymerase I合 成 cDNA第2鏈,經(jīng)過(guò)QiaQuick PCR試劑盒純化并加 EB緩沖液洗脫經(jīng)末端修復(fù)、加堿基A,加測(cè)序接頭,再經(jīng)瓊脂糖凝膠電泳回收目的片段,并進(jìn)行PCR擴(kuò)增,從而完成整個(gè)文庫(kù)制備工作,構(gòu)建好的文庫(kù)用Illumina HiSeq2000進(jìn)行測(cè)序。
1.2.3 Unigene的獲得與功能注釋 測(cè)序儀產(chǎn)生的原始圖像數(shù)據(jù)經(jīng) base calling 轉(zhuǎn)化為序列數(shù)據(jù),稱之為raw reads,再經(jīng)過(guò)平臺(tái)初步的過(guò)濾后稱之為clean reads,然后使用短reads組裝軟件Trinity[10]做轉(zhuǎn)錄組從頭組裝。Trinity首先將具有一定長(zhǎng)度overlap的reads連成更長(zhǎng)的片段,這些通過(guò)reads overlap關(guān)系得到的不含N的組裝片段作為組裝出來(lái)的Unigene。3個(gè)轉(zhuǎn)錄組一起組裝。
Unigene基本功能注釋信息給出Unigene的蛋白功能注釋、Pathway注釋、COG/KOG功能注釋、Gene Ontology(GO)功能注釋等。首先,通過(guò)blastx將Unigene序列比對(duì)到蛋白數(shù)據(jù)庫(kù)nr(非冗余蛋白數(shù)據(jù)庫(kù))、SwissProt(蛋白質(zhì)序列數(shù)據(jù)庫(kù))、KEGG(京都基因與基因組百科全書)和COG/KOG(蛋白質(zhì)原核/真核同源數(shù)據(jù)庫(kù))(evalue<0.000 01),得到跟給定Unigene具有最高序列相似性的蛋白(如有并列,取第一條),從而得到該Unigene的蛋白功能注釋信息。
1.2.4 轉(zhuǎn)錄組中SSR位點(diǎn)分析 按照以下配置參數(shù)使用軟件 MISA(http://pgrc.ipk-gatersleben.de/misa/)對(duì)轉(zhuǎn)錄組的所有 Unigene 進(jìn)行搜索,尋找 Unigene 中的 SSR,搜索條件為2個(gè)堿基的重復(fù)單元,需要至少6個(gè)重復(fù)才會(huì)被認(rèn)為是SSR,3個(gè)堿基的重復(fù)單元,需要至少5個(gè)重復(fù)才會(huì)被認(rèn)為是SSR,4-6個(gè)堿基重復(fù)至少4次,在此基礎(chǔ)上,如果兩個(gè)SSR序列的距離短于100 bp,就會(huì)被合并當(dāng)作一個(gè)SSR標(biāo)記。
采用Illumina HiSeqTM2000高通量測(cè)序技術(shù)對(duì)黃秋葵不同發(fā)育時(shí)期果實(shí)轉(zhuǎn)錄組進(jìn)行測(cè)序,從表1可以看出,167-1、167-5、167-12三份樣品轉(zhuǎn)錄組測(cè)序數(shù)據(jù)量和質(zhì)量都較高,為后續(xù)的數(shù)據(jù)拼接組裝提供了較好的數(shù)據(jù)源。
3個(gè)黃秋葵果實(shí)的轉(zhuǎn)錄組測(cè)序所獲得的reads通過(guò)組裝和拼接共獲得77 476個(gè)Unigene,總長(zhǎng)度達(dá)54 699 979 bp(約 54.7 Mb),平均長(zhǎng)度為 706 bp,N50為1 033 bp,最大拼接長(zhǎng)度為13 091 bp,最小為201 bp,表明組裝效果良好。
表1 數(shù)據(jù)過(guò)濾后統(tǒng)計(jì)表
通過(guò)blastx將Unigene序列比對(duì)到蛋白數(shù)據(jù)庫(kù)nr、SwissProt、KEGG 和 COG/KOG,比對(duì)結(jié)果(圖 1-A)顯示,77 476個(gè)Unigene序列在Nr數(shù)據(jù)庫(kù)中有61 559(占79.46%)個(gè)找到相似序列,在SwissProt數(shù)據(jù)庫(kù)中有42 609(55.00%)個(gè)找到相似序列,在KEGG數(shù)據(jù)庫(kù)中有34 972(45.14%)個(gè)找到相似序列,在COG/KOG數(shù)據(jù)庫(kù)中有25 140(32.45%)個(gè)找到相似序列,4個(gè)數(shù)據(jù)庫(kù)一共注釋了61 891(79.88%)個(gè)Unigene序列,未能夠得到注釋的Unigene序列有 15585(20.12%) 個(gè), 有 18 587(23.99%) 個(gè)Unigene序列序列被4大數(shù)據(jù)庫(kù)同時(shí)注釋。如圖1-B所示,前3大物種的同源序列數(shù)量達(dá)到51 502個(gè),占已注釋基因總數(shù)的83.21%,它們分別是雷蒙德氏棉(Gossypium raimondii,28139 個(gè))、亞洲棉(Gossypium arboreum,13 116個(gè) )、 可 可(Theobroma cacao,10 247)。
以KEGG代謝途徑數(shù)據(jù)庫(kù)為依據(jù),可將13 336個(gè)黃秋葵果實(shí)的Unigene分成128個(gè)代謝途徑(表2),比張少平等[11]報(bào)道的黃秋葵葉片轉(zhuǎn)錄組多了9個(gè)代謝途徑,體現(xiàn)出葉片與果實(shí)轉(zhuǎn)錄組的差異。其中涉及Unigene數(shù)量最多的前5個(gè)代謝途徑分別是核糖體代謝、植物激素信號(hào)轉(zhuǎn)導(dǎo)、內(nèi)質(zhì)網(wǎng)蛋白質(zhì)代謝、碳代謝和內(nèi)吞作用。
利用GO數(shù)據(jù)庫(kù),將黃秋葵果實(shí)的Unigene進(jìn)行基因生物學(xué)特征功能分類。結(jié)果(圖2)顯示,GO數(shù)據(jù)庫(kù)注釋到44 507個(gè)Unigene,可分為細(xì)胞組分、分子功能及生物學(xué)過(guò)程等3個(gè)本體共48個(gè)功能組,其中在參與的生物過(guò)程中,細(xì)胞進(jìn)程(24 970)和代謝進(jìn)程(25 434)含有Unigene最多;在細(xì)胞組分本體中,細(xì)胞進(jìn)程(18 890)及其組織部分(18 884)含Unigene最多;在分子功能本體中,結(jié)合活性(23 656)和催化活性(23 117)含有的Unigene最多。
圖1 四大數(shù)據(jù)庫(kù)注釋維恩圖和前10大物種分布統(tǒng)計(jì)圖
按照以下配置參數(shù)使用軟件MISA對(duì)轉(zhuǎn)錄組的所有Unigenes進(jìn)行搜索,尋找Unigenes中的SSR,在黃秋葵果實(shí)轉(zhuǎn)錄組77 476條Unigenes序列中發(fā)現(xiàn)3 830個(gè)SSR位點(diǎn),分布在3 569條Unigenes中,發(fā)生頻率(含有SSR的Unigenes數(shù)量與總Unigenes數(shù)量之比)為4.61%。其中有3 329條Unigenes序列中只含1個(gè)SSR位點(diǎn),含2個(gè)及2個(gè)以上SSR位點(diǎn)的Unigenes序列有240條,SSR的分布頻率(SSR的個(gè)數(shù)與總Unigenes的數(shù)量比)為4.94%,黃秋葵轉(zhuǎn)錄組序列中平均14.282 Kb就能發(fā)現(xiàn)一個(gè)SSR位點(diǎn)(表3)。黃秋葵轉(zhuǎn)錄組中SSR的主要重復(fù)類型是三核苷酸重復(fù),占SSR總數(shù)的59.56%;其次是二核苷酸重復(fù),占SSR總數(shù)的20.97%;四核苷酸重復(fù),占SSR總數(shù)的9.69%;五、六核苷酸重復(fù)類型的數(shù)量較少,總計(jì)9.79%(表3)。SSR重復(fù)單元的重復(fù)次數(shù)分布在4-15次之間,其中5次重復(fù)的最多,有1605個(gè)SSR,占41.91%;其次為6和4次重復(fù),分別有878、571個(gè)SSR,分別占22.92%和14.91%;15次以上重復(fù)的僅有32個(gè)SSR,占0.84%。從不同串聯(lián)重復(fù)單元類型看(圖3),AAG/CTT重復(fù)類型最多,占19.4%,其次為AG/CT,占9.9%。
圖2 GO功能分類圖
表2 黃秋葵果實(shí)Unigene的KEGG代謝途徑分析
續(xù)表
表3 SSR類型和分類統(tǒng)計(jì)表
隨著黃秋葵所含特殊成分及其營(yíng)養(yǎng)保健功效的發(fā)掘,黃秋葵已經(jīng)在非洲、歐美及東南亞等地進(jìn)行了廣泛種植,相關(guān)基礎(chǔ)研究也受到極大的關(guān)注。前人對(duì)黃秋葵的研究主要集中在遺傳育種[12-13]、栽培生理[14-15]、營(yíng)養(yǎng)成分[16]和藥用功效[5,17]等方面,關(guān)于分子生物學(xué)方面特別是功能基因研究方面的研究較少。王旭等[18]采用同源序列克隆和RT-PCR技術(shù),首次克隆了黃秋葵查爾酮合成酶基因(CHS)cDNA全長(zhǎng)序列。張少平等[11]通過(guò)Illumina HiSeq 2500高通量測(cè)序獲得了紫色黃秋葵葉片基因表達(dá)的基本信息,使研究者對(duì)葉片的代謝途徑有了全面的了解。但是,對(duì)黃秋葵果實(shí)發(fā)育過(guò)程的代謝途徑和轉(zhuǎn)錄組分析的研究至今還未見報(bào)道。本研究中利用RNA-seq技術(shù)分離了大量的多糖代謝、萜類化合物代謝、黃酮和異黃酮類代謝、脂肪酸代謝等次生代謝途徑相關(guān)基因,為今后黃秋葵功能基因的開發(fā)利用等研究奠定了良好基礎(chǔ)。
圖3 SSR不同重復(fù)單元
黃秋葵種質(zhì)資源極其豐富,有些資源可以通過(guò)顏色、葉片形狀、果形等形態(tài)學(xué)特征進(jìn)行辨別,但形態(tài)標(biāo)記數(shù)量有限、觀測(cè)標(biāo)準(zhǔn)容易受到觀測(cè)者的主觀判斷影響,因此,還必須結(jié)合其他的標(biāo)記技術(shù),進(jìn)行更深層次的研究。SSR標(biāo)記是近年來(lái)發(fā)展起來(lái)的一種以特異引物PCR為基礎(chǔ)的分子標(biāo)記技術(shù),具有數(shù)量豐富、覆蓋整個(gè)基因組、多等位基因等特性,目前該技術(shù)已廣泛用于遺傳圖譜的構(gòu)建、目標(biāo)基因的標(biāo)定、指紋圖譜的繪制等研究中。Roland等[10]對(duì)黃秋葵葉片和果實(shí)進(jìn)行了轉(zhuǎn)錄組測(cè)序,得到了935個(gè)SSR位點(diǎn),而本研究中得到了3 830個(gè)SSR位點(diǎn),遠(yuǎn)遠(yuǎn)超過(guò)其發(fā)現(xiàn)的個(gè)數(shù),主要原因可能是選擇的材料差異造成的。Roland等的測(cè)序結(jié)果得到最多的3類SSR位點(diǎn)是AT/TA(9.3%)、TTC/GAA(8.3%)和TCT/AGA(6.9%),而本研究中獲得的最多的3類SSR位點(diǎn)是AAG/TCTT(19.43%)、AG/CT(9.95%)和AGC/CTG(8.96%),后期的工作將對(duì)Roland等獲得的SSR位點(diǎn)與本研究結(jié)果進(jìn)行對(duì)比,找出相同的SSR位點(diǎn),豐富、可靠的SSR位點(diǎn)將為黃秋葵品種鑒定和資源分析提供有力依據(jù)。
采用RNA-Seq技術(shù)對(duì)3份黃秋葵果實(shí)進(jìn)行測(cè)序分析,3份測(cè)序材料組裝后共獲得了77 476個(gè)Unigene序列,有61 891個(gè)Unigene在四大數(shù)據(jù)庫(kù)中得到注釋,占79.88%;以KEGG代謝途徑數(shù)據(jù)庫(kù)為依據(jù),可將13 336個(gè)黃秋葵果實(shí)的Unigene分成128個(gè)代謝途徑,使研究者全面了解了黃秋葵果實(shí)的代謝途徑信息;在黃秋葵果實(shí)轉(zhuǎn)錄組中發(fā)現(xiàn)3 830個(gè)SSR位點(diǎn),分布在3 569條Unigenes中,發(fā)生頻率為4.61%,獲得的最多的3類SSR位點(diǎn)是AAG/TCTT(19.43%)、AG/CT(9.95%)和AGC/CTG(8.96%)。
[1]FAOSTAT, 2010. http://faostat. fao. org/site/567/default. aspx.
[2]Kumar S, Dagnoko S, Haougui A, et al. Okra(Abelmoschus spp.)in West and Central Africa:potential and progress on its improvement[J]. African Journal of Agricultural Research, 2010,5:3590-3598.
[3]Islam M, Hossain N, Alamgir M, et al. Comparative effects of biogas plant residues, poultry manure and inorganic fertilizer on growth and yield of ladies finger[J]. IOSR Journal of Agriculture and Veterinary Science, 2014, 7(1):2319-2372.
[4]黃阿根, 陳學(xué)好, 高云中, 等. 黃秋葵的成分測(cè)定和分析[J].食品科學(xué), 2007, 28(10):451-455.
[5] Mairuae N, Connor JR, Lee SY, et al. The effects of okra(Abelmoschus esculentusLinn.)on the cellular events associated with Alzheimer’s disease in a stably expressedHFEneuroblastoma SH-SY5Y cell line[J]. Neuroscience Letters, 2015, 603(10):6-11.
[6]王君耀, 周俊, 湯谷平. 黃秋葵抗疲勞作用的研究[J]. 中國(guó)現(xiàn)代應(yīng)用藥學(xué)雜志, 2003, 20(4):316-317.
[7]李錫花, 吳嫚, 于霽雯, 等. 棉花纖維發(fā)育早期RNA-Seq轉(zhuǎn)錄組分析[J]. 棉花學(xué)報(bào), 2013, 25(3):189-196.
[8]Megan JB, Wonkeun P, Phili JB, et al. RNA-seq transcriptome profiling of upland cotton(Gossypium hirsutumL.)root tissue under water-deficit stress[J]. PLoS ONE. 8(12):e82634.
[9]丁元昊, 袁道軍, 朱龍付, 等. 基于RNA-Seq技術(shù)的棉花苗期雜種優(yōu)勢(shì)的基因表達(dá)分析[C]. 作物雜種優(yōu)勢(shì)利用國(guó)際學(xué)術(shù)大會(huì), 2012, 123-124.
[10]Roland S, Sanjeet K, Lin CY, et al. The okra(Abelmoschus esculentus)transcriptome as a source for gene sequence information and molecular markers for diversity analysis[J].Gene, 2013, 517:27-36.
[11]張少平, 邱珊蓮, 鄭云云, 等. 紫色黃秋葵轉(zhuǎn)錄組功能基因測(cè)序及分析[J]. 核農(nóng)學(xué)報(bào), 2017, 31(4):643-653.
[12]Mehta N, Asati BS, Mamidwar SR. Heterosis and gene action in okra[J]. Bangladesh Journal of Agricultural Research, 2007, 32(3):421-432.
[13]Wammanda DT, Kadams AM, Jonah PM. Combining ability analysis and heterosis in a diallel cross of okra(Abelmoschus esculentus(L.)Moench)[J]. African Journal of Agricultural Research, 2010, 5(16):2108-2115.
[14]Olayiwola MO, Ariyo OJ. Relative discriminatory ability of GGE Biplot and YSi in the analysis of genotype×environment interaction in okra(Abelmoschus esculentus)[J]. International Journal of Plant Breeding and Genetics, 2013, 7(3):146-158.
[15]Islam M, Hossain N, Alamgir M, et al. Comparative effects of biogas plant residues, Poultry manure and inorganic fertilizer on growth and yield of ladies finger[J]. Iosrjournals Org, 2014, 7 :2319-2372.
[16]黃阿根, 陳學(xué)好, 高云中, 等. 黃秋葵的成分測(cè)定和分析[J].食品科學(xué), 2007, 28(10):451-455.
[17]Monte LG, Santi-Gadelha T, Reis LB, et al. Lectin ofAbelmoschus esculentus(okra)promotes selective antitumor effects in human breast cancer cells[J]. Biotechnology Letters, 2014, 36(3):461-469.
[18]王旭, 韓春樂, 周亞楠, 等. 黃秋葵查爾酮合成酶基因AeCHS的克隆與表達(dá)分析[J]. 植物遺傳資源學(xué)報(bào), 2014, 15(3):561-567.