歐陽雨晴,李玲玲,石好宇,趙藝,朱甫臻,尹艷燕,王靈芝(北京中醫(yī)藥大學(xué)生命科學(xué)學(xué)院,北京100029)
轉(zhuǎn)錄組(transcriptome)是指細(xì)胞在特定發(fā)育階段或生理?xiàng)l件下,所表達(dá)的全部RNA 的總和,可反映相同基因在不同環(huán)境下表達(dá)的差異,揭示不同基因間的相互作用及其各自的功能[1-2]。轉(zhuǎn)錄組測(cè)序,又稱為RNA 測(cè)序(RNA-seq),將樣本總RNA 反轉(zhuǎn)錄成cDNA 后,進(jìn)行高通量測(cè)序來確定樣本中整體轉(zhuǎn)錄組的表達(dá)情況。自2005年以來,以Solexa 技術(shù)、SOLiD 技術(shù)和454 技術(shù)為代表的第二代測(cè)序技術(shù),推動(dòng)了RNA-seq 技術(shù)的迅速發(fā)展。RNA-seq 可在限定時(shí)間內(nèi)全面而快速地獲取特定樣品的幾乎所有mRNA 序列信息,該技術(shù)在基因功能分析、特異表達(dá)基因挖掘、信號(hào)途徑構(gòu)建、代謝途徑鑒定、基因家族確定等方面發(fā)揮重要作用[3]。RNA-seq 技術(shù)已經(jīng)成功應(yīng)用于許多藥用植物轉(zhuǎn)錄組信息的收集,如黃連[4]、人參[5]、黃三七[6]、銀杏[7]、紅豆杉[8]和阿育魏實(shí)[9]等,在植物有效成分生物合成的功能基因挖掘和分子標(biāo)記育種方面取得了較大進(jìn)展[10]。
薏苡(Coix lacryma-jobiL.var.mayuenStapf),是禾本科(Gramineae)玉蜀黍族(Maydeae),薏苡屬CoixL.植物[11],為藥食同源作物,具有利水滲濕、健脾止瀉之功能,中醫(yī)臨床常用于治療水腫、排尿困難和腹瀉等[12]。薏苡仁含有多種化學(xué)成分如多糖、蛋白質(zhì)、脂質(zhì)、多酚、類胡蘿卜素、植物甾醇、螺甾內(nèi)酯和內(nèi)酰胺[13],具有多種藥理功能,如抗腫瘤[14]、免疫調(diào)節(jié)[15]、抗氧化[16]、降血壓[17]等功能。其中,薏苡仁油因具有顯著的抗腫瘤活性,已被研制成康萊特注射液,廣泛應(yīng)用于臨床,并被美國(guó)食品和藥物管理局(FDA)批準(zhǔn)在美國(guó)進(jìn)行臨床試驗(yàn)[18]。薏苡仁油的主要活性成分為三酰甘油類,占薏苡仁油含量的86.96%~94.39%[19],其中甘油三油酸酯為《中國(guó)藥典》(2020年版)薏苡仁質(zhì)量標(biāo)準(zhǔn)的指標(biāo)性成分。研究表明1,3-二油酸-2-亞油酸甘油酯[20]和1-棕櫚酸-2-亞油酸-3-油酸甘油酯[21]具有顯著抗腫瘤活性。根據(jù)溶解度不同,種子儲(chǔ)藏蛋白分為清蛋白、球蛋白、醇溶蛋白和谷蛋白,谷蛋白約占總蛋白含量的40%[22],具有多種潛在的生物活性。美國(guó)山核桃谷蛋白源多肽有降壓,抗氧化和抗腫瘤活性[23]。莧菜谷蛋白水解產(chǎn)物有降血糖作用[24]。胡桃楸谷蛋白水解產(chǎn)物具有免疫調(diào)節(jié)作用[25]。本課題組前期研究表明,薏苡仁谷蛋白源小分子肽具有免疫調(diào)節(jié)活性[26]。
薏苡仁的生物活性主要取決于其品種。薏苡在中國(guó)除青海和寧夏以外的大多數(shù)省份中均有分布,藥材的質(zhì)量與生產(chǎn)區(qū)域的環(huán)境密切相關(guān)[27],由于地理環(huán)境和栽培條件的差異,使得我國(guó)薏苡仁種質(zhì)資源極為豐富多樣。但薏苡基因序列信息缺乏,阻礙其遺傳育種與藥用價(jià)值的開發(fā)。本研究采用Illumina Hiseq 測(cè)序平臺(tái)技術(shù),構(gòu)建薏苡轉(zhuǎn)錄組數(shù)據(jù)庫,并進(jìn)行功能注釋,為谷蛋白和三酰甘油等成分合成關(guān)鍵基因提供序列信息。
薏苡種植于北京中醫(yī)藥大學(xué)的藥材種植園,采集不同發(fā)育時(shí)期的根、葉、穗、幼苗及籽粒,液氮冷凍后,-80℃保存,用于后續(xù)RNA 提取。
EASY spin 植物RNA 快速提取試劑盒(北京博邁德生物技術(shù)有限公司);1%瓊脂糖凝膠電泳檢驗(yàn)RNA 完整性;Qubit Fluorometer 熒光定量?jī)x(美國(guó)BioTek);NanoDrop 超微量分光光度計(jì)(美國(guó)Thermo);Agilent 2100 生物分析儀(美國(guó)安捷倫科技有限公司)。
樣品檢測(cè)合格后,等量混合EASY spin 植物RNA 快速提取試劑盒提取的各薏苡組織的總RNA,經(jīng)帶有Oligo(dT)的磁珠純化mRNA 以構(gòu)建cDNA 文庫。 采用Illumina HiSeq 4000 以PE 100 的測(cè)序讀長(zhǎng)對(duì)cDNA 進(jìn)行測(cè)序,得到原始數(shù)據(jù)(Raw reads)。使用SOAPnuke 處理Raw reads,去除低質(zhì)量,包含接頭以及未知堿基N含量大于5%的reads,得到Clean reads。使用Trinity 對(duì)Clean reads 進(jìn)行De novo組裝,使用Tgicl 對(duì)組裝的轉(zhuǎn)錄本進(jìn)行聚類,去除冗余獲得unigene。N50 值用于評(píng)估組裝過程中的連續(xù)性。
將組裝得到的薏苡轉(zhuǎn)錄本數(shù)據(jù),通過BLAST 軟件分別與NT、NR、COG、KEGG 以及SwissProt 數(shù)據(jù)庫進(jìn)行比對(duì);基于NR 注釋,使用Blast2GO 軟件獲得GO 注釋,使用InterProScan5軟件獲得InterPro 注釋。
使用Blast 軟件將unigene 序列按照 NR、SwissProt、KEGG、COG 數(shù)據(jù)庫的優(yōu)先順序進(jìn)行比對(duì),得到unigene 編碼區(qū)5'-3'方向的核酸序列,即CDS。使用ESTScan 軟件對(duì)未比對(duì)上的unigene 序列,進(jìn)行CDS 預(yù)測(cè)。使用MISA 軟件對(duì)unigene 進(jìn)行SSR 分析,并用Primer 3.0 軟件設(shè)計(jì)SSR 引物。使用HISAT 軟件將Clean reads 比對(duì)到unigene,然后通過變異檢測(cè)軟件GATK 識(shí)別SNP 位點(diǎn)。
基因表達(dá)量用 FPKM(Fragments Per Kilobase of transcript per Million mapped reads)表示。使用Bowtie2 軟件將Clean reads 比對(duì)到unigene,然后利用RSEM 計(jì)算各樣品的基因表達(dá)水平。FPKM計(jì)算公式如下:
FPKM=cDNA Fragments/[Mapped Fragments(Millions)×Transcript Length(kd)]
式中,cDNA Fragments 表示比對(duì)到某一轉(zhuǎn)錄本上片段數(shù)目,即雙端Reads 數(shù)目;Mapped Fragments(Millions)表示比對(duì)到轉(zhuǎn)錄本上的片段總數(shù),以106為單位;Transcript Length(kd)表示轉(zhuǎn)錄本的長(zhǎng)度,以1×103個(gè)堿基為單位。
電泳圖譜(見圖1)表明樣品RNA 完整性較好。根據(jù)HiSeq 測(cè)序樣品質(zhì)量標(biāo)準(zhǔn),各樣品均為A級(jí),滿足后續(xù)cDNA 文庫構(gòu)建要求。使用Illumina HiSeq 4000 平臺(tái)共得到了65.60 Mb Raw reads,過濾后得到99.95%的Clean reads(65.57 Mb),Q20為96.09%。讀本中堿基分布均勻沒有明顯的AT或GC 分離現(xiàn)象(見圖2A),表明該RNA-seq 質(zhì)量較高。使用Trinity 軟件對(duì)Clean reads 進(jìn)行De novo組裝,共獲得102 092 個(gè)transcripts。經(jīng)Tgicl軟件將transcrips 聚類并除去冗余之后,獲得了76 164 個(gè)unigene,平均長(zhǎng)度為1023 bp,GC 含量為49.36%,N50 為1700 bp,表明組裝效果較好(見表1),其中序列長(zhǎng)度為300 bp 數(shù)目最多,有18 321 條(見圖2B)。
表1 組裝過程質(zhì)量指標(biāo)Tab 1 Quality index of assembly process
圖1 薏苡各組織RNA 電泳圖Fig 1 RNA electrophoretogram of Coix tissues
圖2 Clean reads 堿基含量(A)和unigene 長(zhǎng)度(B)分布圖Fig 2 Clean reads base content(A)and unigene length(B)distribution
將unigene 序列與NT、NR、COG、KEGG、SwissProt、GO 和InterPro 七大功能數(shù)據(jù)庫進(jìn)行比對(duì),共有59 460 個(gè)unigene 獲得注釋,占總數(shù)的78.07%。其中,在NT 數(shù)據(jù)庫中,獲得注釋的unigene 數(shù)量最多,有56 121 個(gè),占73.68%。而在COG 數(shù)據(jù)庫中,獲得注釋的unigene 數(shù)量最少,僅有20 670 個(gè),占27.14%(見表2)。unigene 功能注釋Venn 圖(見圖3A)顯示,共有14 177 個(gè)unigene在NR、Interpro、Swissprot、COG 和KEGG 5 個(gè)數(shù)據(jù)庫同時(shí)得到注釋,占unigene 總數(shù)的23.84%。
表2 Unigenes 功能注釋Tab 2 Function annotation of unigenes
2.2.1 Unigene 的NR 數(shù)據(jù)庫比對(duì)分析 將unigene與NR 數(shù)據(jù)庫進(jìn)行相似序列匹配,結(jié)果如圖3B 所示,共有49 092 個(gè)unigene 在NR 數(shù)據(jù)庫中注釋成功。其中薏苡與高粱(Sorghum bicolor)同源的序列最多,占NR 總注釋的51.73%,其次匹配的物種有玉米(Zea mays,26.29%)、小米(Setaria italica,10.16%)和水稻(Oryza sativaJaponica Group,3.21%)。
2.2.2 Unigene 的GO 功能分類分析 如圖3C 所示,共有27 407 個(gè)unigene 在GO 數(shù)據(jù)庫中注釋成功,得到156 122 條對(duì)應(yīng)關(guān)系。三大功能中生物學(xué)過程最多,為67 477 條(43.22%);細(xì)胞組分?jǐn)?shù)目為55 713 條(35.69%);分子功能最少為32 932條(21.09%)。這三大功能可詳細(xì)劃分為56個(gè)分支,生物學(xué)過程22個(gè)、細(xì)胞組分17個(gè)、分子功能17個(gè)。在生物學(xué)過程類型中,與新陳代謝過程相關(guān)的unigene 為15 060 條,所占比例最高;在細(xì)胞組分功能分類中,細(xì)胞與細(xì)胞成分所涉及的unigene 數(shù)量一致且最多,有14 043 條;在分子功能類型中,注釋上的unigene 涉及結(jié)合、抗氧化、催化、翻譯調(diào)節(jié)及營(yíng)養(yǎng)儲(chǔ)存等多方面功能活性,其中,涉及到結(jié)合功能的unigene 有14 728 條,所占比例最高,對(duì)應(yīng)蛋白質(zhì)標(biāo)簽功能的unigene 最少(1 條)。
2.2.3 Unigene 的COG 注釋結(jié)果分析 如圖3D所示,共有20 670 個(gè)unigene 在COG 數(shù)據(jù)庫中注釋成功,根據(jù)其功能的不同可分為25 類。一般功能基因類別中unigene 數(shù)量最多,占unigene總量的27.33%;核結(jié)構(gòu)類unigene 有4 條,所占比例最小。此外,翻譯、核糖體結(jié)構(gòu)與生物合成(19.86%),轉(zhuǎn)錄(17.50%),信號(hào)轉(zhuǎn)導(dǎo)機(jī)制(12.13%),復(fù)制、重組與修復(fù)(16.72%),翻譯后修飾、蛋白質(zhì)轉(zhuǎn)運(yùn)及分子伴侶(12.76%),細(xì)胞膜、細(xì)胞壁生物合成(10.42%),細(xì)胞周期調(diào)控、細(xì)胞分裂與染色體重排(14.61%),碳水化合物轉(zhuǎn)運(yùn)與代謝(11.55%),氨基酸轉(zhuǎn)運(yùn)與代謝(7.51%)等功能類別的unigene 表達(dá)豐度也相對(duì)較高。
2.2.4 Unigene 的KEGG 代謝途徑分析共有30 941 個(gè)unigene 在KEGG 數(shù)據(jù)庫中注釋成功,涉及126 個(gè)代謝途徑(見圖3E)。與新陳代謝相關(guān)的unigene 數(shù)量最多,參與影響氨基酸代謝(1363 個(gè))、次級(jí)代謝產(chǎn)物代謝(1085 個(gè))、碳水化合物代謝(2418 個(gè))、能量代謝(704 個(gè))、脂質(zhì)代謝(3308 個(gè))及核酸代謝(1020 個(gè))等多個(gè)方面,其中,參與聚糖合成與代謝的基因最少,僅有496 個(gè),占unigene 總量的1.60%。
圖3 Unigene 功能注釋圖Fig 3 Functional annotation of unigenes
經(jīng)統(tǒng)計(jì)分析,注釋到三酰甘油代謝路徑(ko00561)的unigene 有388 個(gè),結(jié)合三酰甘油目前已知的生物合成途徑,篩選出257 個(gè)與三酰甘油生物合成途徑相關(guān)的unigene,并對(duì)其表達(dá)量進(jìn)行分析(見表3)。二酰基甘油?;D(zhuǎn)移酶(diacylglycerolO-acyltransferase,DGAT) 是依賴酰基輔酶A 的三酰甘油從頭合成途徑的關(guān)鍵酶和限速酶。分別有19、5、1 個(gè)unigene 編碼DGAT1、DGAT2、DGAT3,其中編碼DGAT3 的unigene 表達(dá)量最高,F(xiàn)PKM 值為30.20。磷脂:二?;视王;D(zhuǎn)移酶(phospholipid:diacylglycerol acyltransferase,PDAT)是不依賴酰基輔酶A 的合成途徑的關(guān)鍵酶,共有10 個(gè)unigene 編碼PDAT,F(xiàn)PKM 值最高為35.49。除此之外與三酰甘油生物合成的途徑相關(guān)的酶中表達(dá)量較高的還有醛脫氫酶(NAD+)[aldehyde dehydrogenase(NAD+),ALDH]、1-?;?sn-甘油-3-磷酸?;D(zhuǎn)移酶(1-acyl-sn-glycerol-3-phosphate acyltransferase,plsC)和?;视椭久福╝cylglycerol lipase,MGLL),其FPKM 分別為993.54、113.86、70.14。
表3 薏苡三酰甘油生物合成中編碼關(guān)鍵酶的unigene Tab 3 Unigenes encoding the key enzymes involved in the synthesis of triacylglycerol in Coix
CDS 預(yù)測(cè)可為薏苡基因組圖譜繪制及基因功能研究提供關(guān)鍵依據(jù)。使用BLAST 軟件比對(duì)得到48 449 個(gè)CDS 序列(63.61%),通過ESTScan 軟件預(yù)測(cè)得到2711 個(gè)CDS 序列(3.56%)??偣搏@得51 160 個(gè)CDS 序列,占unigene 總數(shù)的67.17%。CDS 長(zhǎng)度分布如圖4A 所示,長(zhǎng)度在200~800 bp 內(nèi)的CDS 序列有33 550 個(gè)(69.25%);長(zhǎng)度為300 bp 的數(shù)量最多,9793 個(gè)(20.21%);其中與谷蛋白相關(guān)的CDS 序列有9 個(gè)(見表4),分別來自Swissprot、NR 數(shù)據(jù)庫和NT 數(shù)據(jù)庫,可用于后續(xù)谷蛋白基因克隆和定點(diǎn)突變研究。
表4 薏苡谷蛋白相關(guān)CDS 序列Tab 4 Glutelin related CDS of Coix
使用MISA 軟件對(duì)unigene 進(jìn)行SSR 檢測(cè),共搜索得到分布于11 101 個(gè)unigene 中的3324 個(gè)SSR,占unigene 總序列的29.94%。SSR 長(zhǎng)度特征見表5及圖4B,SSR 類型豐富,從單核苷酸到六核苷酸均有出現(xiàn),其中,三核苷酸重復(fù)最多(7899,占71.2%),出現(xiàn)頻率最高的基序?yàn)镃CG/CGG(3690),最低的是ACT/AGT(84)。在二核苷酸重復(fù)類型中,AG/CT 基序出現(xiàn)的頻率最高(1407),而CG/CG 出現(xiàn)的頻率最低(242)。
圖4 薏苡CDS(A)和SSR(B)分布圖Fig 4 CDS(A)and SSR(B)distribution in Coix
表5 SSR 長(zhǎng)度統(tǒng)計(jì)結(jié)果Tab 5 Statistics of SSR length distribution
使用GATK 軟件對(duì)樣本基因進(jìn)行SNP 檢測(cè),共鑒定出22 764 個(gè)SNP,其中轉(zhuǎn)換15 141個(gè)(66.51%),發(fā)生A-G 替換的有7704 個(gè),發(fā)生C-T 替換的有7437 個(gè);變異類型為顛換的共7623 個(gè)(33.49%),發(fā)生A-C、A-T、C-G 及G-T替換的數(shù)目分別為1831、1699、2322 及1771 個(gè)(見表6)。
表6 SNP 變異類型統(tǒng)計(jì)Tab 6 Statistics of SNP variation types
根據(jù)組裝結(jié)果,使用 Bowtie2 軟件將Clean reads 比對(duì)到unigene,后使用RSEM 軟件計(jì)算樣品的基因表達(dá)水平,計(jì)算獲得72 188 條unigene的表達(dá)量。
RNA-seq 技術(shù)具有靈敏度高、通量高、成本低、操作簡(jiǎn)單、重復(fù)性好、檢測(cè)范圍廣、分辨率高等諸多優(yōu)勢(shì),不局限于已知的基因組序列信息,還可用于發(fā)現(xiàn)未知基因及非編碼RNAs,精確地識(shí)別可變剪切位點(diǎn)以及SNP,提供更加全面的樣本轉(zhuǎn)錄組信息[3,28-29]。目前,RNA-seq 技術(shù)已成功應(yīng)用于多種藥用植物轉(zhuǎn)錄組信息的采集。李依民等[6]應(yīng)用Illumina HiSeq 2000 測(cè)序平臺(tái),以PE150 的測(cè)序讀長(zhǎng),對(duì)黃三七根莖進(jìn)行RNA-seq 技術(shù),得到63 322 086 條Clean reads 和52 575 個(gè)unigene,為今后黃三七功能基因的鑒定、代謝途徑的分析及奠定基礎(chǔ)。Majeed 等[8]構(gòu)建了紅豆杉參考轉(zhuǎn)錄組,經(jīng)注釋得到129 869 個(gè)unigene,同時(shí)產(chǎn)生了7041 個(gè)SSR 標(biāo)記,為破譯紅豆杉遺傳多樣性及其保護(hù)提供了有價(jià)值的信息。Amiripour 等[9]對(duì)阿育魏實(shí)的花序進(jìn)行RNA-seq 技術(shù),De novo組裝后產(chǎn)生68 051 個(gè)unigene,其中43 156 個(gè)獲得注釋,生成了8751 個(gè)SSR 標(biāo)記,是目前第一個(gè)可用于轉(zhuǎn)錄組表征、基因發(fā)現(xiàn)、開發(fā)SSR 分子標(biāo)記和阿育魏實(shí)基因組研究的數(shù)據(jù)庫。鄧楠等[30]應(yīng)用Illumina HiSeq 2000 測(cè)序平臺(tái)對(duì)膜果麻黃不同發(fā)育期種子進(jìn)行RNA-seq 技術(shù),得到12 999 122 條初始序列,組裝后獲得49 449 條編碼基因,并根據(jù)KEGG 通路找到了有關(guān)姜醇烷、二芳基庚及芪類合成途徑的編碼基因片段230 個(gè)。張紹鵬等[31]獲得了珠子參根莖的轉(zhuǎn)錄組信息數(shù)據(jù),為該物種資源的有效開發(fā)和利用提供了重要的理論基礎(chǔ)。李鐵柱等[32]利用高通量測(cè)序技術(shù)構(gòu)建杜仲葉片和果實(shí)的轉(zhuǎn)錄組數(shù)據(jù)庫,共獲得54 471 338 條Raw reads,拼接組裝后得到49 610 條unigene,總長(zhǎng)度為37 616 729 bp。本研究使用Illumina HiSeq 4000平臺(tái)對(duì)薏苡不同發(fā)育時(shí)期的各種組織部位RNA進(jìn)行RNA-seq 技術(shù),構(gòu)建薏苡轉(zhuǎn)錄組數(shù)據(jù)庫??偣搏@得76 164 個(gè)unigene,總長(zhǎng)度為77 917 702 bp,數(shù)據(jù)量大且組裝效果較好,可為薏苡分子生物學(xué)研究及相關(guān)藥用價(jià)值的開發(fā)提供重要依據(jù)。將unigene 與七大功能數(shù)據(jù)庫比對(duì)后分別有49 092(NR:64.46%)、56 121(NT:73.68%)、32 748(Swissprot:43.00%)、20 670(COG:27.14%)、30 941(KEGG:40.62%),27 407(GO:35.98%)以及 29 789(Interpro:39.11%)個(gè)unigene 得到注釋。未得到注釋的unigene 占21.93%,推測(cè)原因可能是由于數(shù)據(jù)庫基因信息缺乏、測(cè)序技術(shù)的局限、序列長(zhǎng)度較短未包含蛋白質(zhì)功能域,或者是由于序列本身是非編碼序列或不完整序列或薏苡特有的新基因[33]。NR 數(shù)據(jù)庫比對(duì)結(jié)果顯示,薏苡與高粱具有最近的親緣關(guān)系(51.73%),這與Ottoboni等[34]研究結(jié)果一致。GO 功能分類中涉及代謝過程的unigene 數(shù)量最多(15 060)與KEGG 數(shù)據(jù)庫的注釋結(jié)果相一致。由KEGG 注釋結(jié)果可知,代謝分支中,除涉及全局和概覽圖途徑外,涉及脂質(zhì)代謝途徑的unigene 數(shù)量最多(3308),提示脂類化合物在薏苡生長(zhǎng)發(fā)育過程中有著重要作用。本研究分析了三酰甘油生物合成的相關(guān)代謝通路的257 個(gè)unigene,為今后提高三酰甘油含量奠定了理論基礎(chǔ)。
質(zhì)譜鑒定中的數(shù)據(jù)庫搜索是肽/蛋白質(zhì)結(jié)構(gòu)解析的重要步驟,通過擴(kuò)展蛋白數(shù)據(jù)庫可顯著提高肽/蛋白質(zhì)鑒定的準(zhǔn)確性和靈敏度。Goecks 等[35]采用RNA-seq 技術(shù)建立了果蠅雌性寄生蜂腹部轉(zhuǎn)錄本序列文庫,液相色譜-串聯(lián)質(zhì)譜法鑒定寄生蜂毒液腺腔分離純化的肽序列,將肽譜數(shù)據(jù)與轉(zhuǎn)錄組數(shù)據(jù)庫信息進(jìn)行比對(duì),最終從寄生蜂L.boulardi毒液中鑒定獲得了129 種蛋白,從L.heterotoma毒液中鑒定得到176 種蛋白。本研究共獲得51 160 個(gè)CDS 序列,成功構(gòu)建了薏苡蛋白數(shù)據(jù)庫,解決了以往薏苡蛋白序列信息量較少的問題,豐富了禾本科植物蛋白數(shù)據(jù)庫,為薏苡及其近緣物種蛋白及多肽序列的分析、鑒定提供重要依據(jù)。薏苡仁谷蛋白水解物具有顯著的降壓活性,本研究中獲得的CDS 序列中有9 個(gè)與谷蛋白相關(guān),借助分子標(biāo)記輔助育種,選擇高表達(dá)谷蛋白相關(guān)基因親本材料,可為薏苡抗高血壓親本的選育,提高薏苡仁的藥用價(jià)值奠定了理論基礎(chǔ)。推測(cè)到的3324 個(gè)SSR中CCG/CGG 基序出現(xiàn)最多(36 090),與水稻、高粱、玉米的SSR 檢測(cè)結(jié)果相一致[36]?;谶@3324個(gè)SSR 位點(diǎn),開發(fā)SSR 分子標(biāo)記,將為薏苡的遺傳多樣性研究和進(jìn)化研究奠定基礎(chǔ)。得到的22 764個(gè)SNP 位點(diǎn)中,轉(zhuǎn)換位點(diǎn)以A-G 居多(7704),顛換位點(diǎn)最多的是C-G(2322),與張得芳等[37]對(duì)花葉海棠的SNP 位點(diǎn)研究相一致。薏苡生長(zhǎng)發(fā)育的過程中需要大量基因的調(diào)控,而SNP 位點(diǎn)的改變可能會(huì)導(dǎo)致所在基因序列的改變,從而對(duì)基因的轉(zhuǎn)錄、翻譯過程造成影響,得到結(jié)構(gòu)和功能可能發(fā)生變化的蛋白質(zhì),進(jìn)而造成薏苡植株性狀的改變[38]。因此,通過對(duì)SNP 位點(diǎn)和其改變所造成的植株性狀變化,可為薏苡的分子育種提供理論參考。