牟少華,李雪平,李 娟,高 健
(國(guó)際竹藤中心,國(guó)家林業(yè)和草原局/北京市共建竹藤科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100102)
全基因組重測(cè)序是對(duì)已完成基因組序列的同一物種或者近緣種的其他個(gè)體進(jìn)行全基因組測(cè)序,并在此基礎(chǔ)上對(duì)個(gè)體或群體進(jìn)行差異性分析。新個(gè)體基因組序列通過映射參考基因組獲得同源數(shù)據(jù)集,然后檢測(cè)基因組范圍內(nèi)的單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)、插入缺失(Insertion/deletion,InDel)及結(jié)構(gòu)變異(Structural variation,SV)等多態(tài)位點(diǎn)[1]。運(yùn)用高通量的重測(cè)序技術(shù)進(jìn)行遺傳變異分析已經(jīng)在谷子[2]、大豆[3]、水稻[4]、花生[5]、鼠尾草[6]、葡萄[7]、木蘭[8]、煙草[9]、竹黃菌[10]和蘑菇[11]等植物上得到了廣泛應(yīng)用。
毛竹(Phyllostachysedulis)是我國(guó)特有的、利用歷史悠久的重要經(jīng)濟(jì)竹種,也是栽培面積最廣的竹種,其生長(zhǎng)速度快,材性優(yōu)良,繁殖能力強(qiáng),一次造林可以永續(xù)利用。毛竹筍是一種全天然營(yíng)養(yǎng)食品,含有豐富的蛋白質(zhì)、脂肪、糖類、胡蘿卜素、維生素、鈣、磷、鐵以及18種氨基酸等成分。因此,毛竹是優(yōu)良的筍材兩用竹種,有著巨大的開發(fā)和應(yīng)用潛力[12]。毛竹廣泛分布于我國(guó)南方16個(gè)省區(qū),跨越北、中、南3種亞熱帶氣候,在長(zhǎng)期適應(yīng)不同的生長(zhǎng)環(huán)境和栽培經(jīng)營(yíng)措施下,加上自身發(fā)生遺傳漂移等因素,發(fā)生了一系列的形態(tài)變異。目前,在天然毛竹林中已經(jīng)發(fā)現(xiàn)21個(gè)毛竹變型[13],這些變型在形態(tài)上表現(xiàn)出豐富的多態(tài)性,尤其是稈形、稈色等形態(tài)性狀差異顯著。為研究這些形態(tài)差異究竟是因?yàn)榛蜃儺惗鴮?dǎo)致的可遺傳變異還是由于生境不同而產(chǎn)生的表型可塑性,非常有必要在基因水平上揭示毛竹的遺傳多樣性和變異程度。
近年來,隨著分子生物學(xué)技術(shù)的突飛猛進(jìn)以及組學(xué)技術(shù)在竹類植物上的應(yīng)用,特別是毛竹全基因組測(cè)序工作的完成[14],竹類植物基因組研究進(jìn)入后基因組時(shí)代。目前,毛竹已得到一個(gè)完整的可變剪接圖譜[15],對(duì)P450s[16]、AP2/ERF[17]、NAC[18]、SAUR[19]、AQP[20]、IQD[21]、SBP-like[22]、WRKY[23]、HD-Zip[24]和TCP[25]、Hsp[26]、CO-Like[27]等基因家族已采用生信方法進(jìn)行了鑒定和功能驗(yàn)證,但尚未發(fā)現(xiàn)有關(guān)毛竹變型基因組序列變異的研究。本研究采用成熟且經(jīng)濟(jì)的二代測(cè)序技術(shù),以毛竹全基因組為參考,對(duì)4個(gè)有代表性的毛竹變型進(jìn)行重測(cè)序,對(duì)其SNP、Indel、結(jié)構(gòu)變異SV等進(jìn)行深度挖掘,從而揭示其全基因組的突變類型,分析其廣適性狀的變異基因,為從全基因組尺度分析毛竹的“種性”和變型種質(zhì)“品性”獲得海量基因組序列數(shù)據(jù)。
試驗(yàn)材料為毛竹的4個(gè)變型(表1):圣音竹、黃槽毛竹、黃皮花毛竹和厚壁毛竹,編號(hào)分別為R01、R02、R03和R04,均采自國(guó)際竹藤中心安徽太平試驗(yàn)中心。選取剛長(zhǎng)出且尚未展開的嫩葉,液氮速凍后超低溫保存。
表1 4個(gè)毛竹變型形態(tài)特征Tab.1 Morphological characteristics of 4 variations of Moso bamboo
1.2.1 DNA提取與基因組測(cè)序 基因組DNA采用改良CTAB法提取[28]。將檢測(cè)合格的樣品基因組DNA,用超聲波方法將DNA進(jìn)行片段化,然后進(jìn)行DNA片段的純化、末端修復(fù)、在3′端加A、連測(cè)序接頭,進(jìn)行瓊脂糖凝膠電泳完成片段大小選擇,通過PCR擴(kuò)增建成測(cè)序文庫(kù),進(jìn)行文庫(kù)的質(zhì)檢,合格文庫(kù)采用Illunima Hiseq 2500平臺(tái)進(jìn)行測(cè)序,得到原始測(cè)序序列(Raw reads),對(duì)其進(jìn)行數(shù)據(jù)過濾,去掉帶接頭的reads,過濾N含量高(超過10%)和質(zhì)量值低(低于10的堿基數(shù)超過50%)的reads,得到Clean reads,用作后續(xù)的信息分析。
1.2.2 與參考基因組進(jìn)行比對(duì)統(tǒng)計(jì) 將重測(cè)序得到的測(cè)序reads重新定位到毛竹參考基因組上,進(jìn)行后續(xù)的變異分析[14]。運(yùn)用Bwa軟件將測(cè)序獲得的短序列與毛竹的參考基因組(毛竹基因組數(shù)據(jù)庫(kù) BambooGDB下載網(wǎng)址:http://www.bamboogdb.org/page/download.jsp)進(jìn)行比對(duì),通過Samtools flagstat命令對(duì)Clean reads比對(duì)定位到參考基因組上的位置,然后統(tǒng)計(jì)4個(gè)樣品的測(cè)序深度和基因組覆蓋度等方面的信息,進(jìn)行序列變異的檢測(cè)。
1.2.3 檢測(cè)基因組變異 使用GATK軟件工具包對(duì)樣品的SNP和InDel進(jìn)行檢測(cè)[29]。根據(jù)參考基因組上Clean reads的定位結(jié)果,使用Picard軟件去重復(fù)、GATK軟件進(jìn)行局部重比對(duì)和堿基質(zhì)量值的校正等預(yù)處理,然后進(jìn)行SNP和InDel的變異檢測(cè)。對(duì)SNP進(jìn)行嚴(yán)格的過濾,包括:SNP cluster過濾(5 bp內(nèi)若有2個(gè)SNP過濾掉),InDel附近5 bp內(nèi)的SNP過濾掉;相鄰2個(gè)InDel距離小于10 bp過濾掉,從而獲得SNP位點(diǎn)集。使用BreakDancer軟件檢測(cè)SV,主要是基于序列的比對(duì)結(jié)果,獲得測(cè)序文庫(kù)的插入片段大小、方差,再查找序列和參考基因組間比對(duì)的異常結(jié)果,尋找可能的結(jié)構(gòu)變異。
1.2.4 注釋SNP、InDel和SV 通過SnpEff軟件進(jìn)行SNP、InDel和SV的注釋[30]。根據(jù)檢測(cè)獲得的變異位點(diǎn)比對(duì)到參考基因組的位置基因、CDS位置等,獲得變異位點(diǎn)在基因組的發(fā)生區(qū)域(基因區(qū)、基因間區(qū)或CDS區(qū)等),以及產(chǎn)生的同義非同義突變等。
1.2.5 挖掘變異基因和功能注釋 通過尋找樣品間與參考基因組發(fā)生非同義突變SNP基因、CDS區(qū)發(fā)生的InDel基因與SV基因,挖掘可能存在的功能變異基因。通過Blast將變異基因與NR[31]、GO[32]、COG[33]、KEGG[34]等功能數(shù)據(jù)庫(kù)進(jìn)行比對(duì),獲得基因的注釋,以便分析基因的功能。
4個(gè)竹種通過高通量測(cè)序(Illunima Hiseq 2500等測(cè)序平臺(tái))得到原始圖像數(shù)據(jù)文件,經(jīng)堿基識(shí)別分析轉(zhuǎn)化為原始測(cè)序序列(Raw reads),然后去除帶接頭的reads,過濾得到Clean reads,分別為180 506 436,184 142 480,213 567 146,188 998 942 bp,定位到毛竹參考基因組的占所有Clean reads數(shù)的百分比分別為96.13%,96.32%,96.33%和97.44%,雙端均定位到毛竹參考基因組上并且距離符合測(cè)序片段的長(zhǎng)度分布占所有Clean reads數(shù)的百分比分別為88.18%,88.42%,88.57%和89.65%。樣品平均覆蓋深度在10×以上,各深度對(duì)應(yīng)的基因組覆蓋比例如表2所示。
表2 4個(gè)毛竹變型的測(cè)序數(shù)據(jù)統(tǒng)計(jì)Tab.2 Summary of sequencing data of 4 variants of Moso bamboo
2.2.1 SNP檢測(cè) 對(duì)4個(gè)毛竹變型的基因組DNA進(jìn)行SNP檢測(cè),獲得SNP位點(diǎn)集(表3),4個(gè)毛竹變型樣品分別檢測(cè)到的SNP數(shù)量為1 479 567~1 616 020,SNP總數(shù)為2 035 983,Ti/Tv值約為2.90。樣品之間的SNP數(shù)統(tǒng)計(jì)結(jié)果見表4。
表3 4個(gè)毛竹變型SNP數(shù)據(jù)統(tǒng)計(jì)Tab.3 Summary of SNPs detected in 4 variants of Moso bamboo
表4 毛竹變型間的SNP統(tǒng)計(jì)Tab.4 Summary of SNPs detected between variants of Moso bamboo
2.2.2 SNP注釋 運(yùn)用SnpEff軟件對(duì)4個(gè)毛竹變型全基因組SNP進(jìn)行注釋,得到其變異位點(diǎn)在基因組發(fā)生的區(qū)域或類型(表5)。圣音竹發(fā)生在CDS區(qū)域內(nèi)的SNP共計(jì)24 426個(gè),其中,同義突變占比為47.28%,非同義突變占比為51.56%。黃槽毛竹發(fā)生在CDS區(qū)域內(nèi)的SNP共計(jì)25 319個(gè),其中,同義突變占47.26%,非同義突變占51.50%。黃皮花毛竹發(fā)生在CDS區(qū)域內(nèi)的SNP共計(jì)25 628個(gè),其中,同義突變占47.26%,非同義突變占51.52%。厚壁毛竹發(fā)生在CDS區(qū)域內(nèi)的SNP共計(jì)24 738個(gè),其中,同義突變占47.49%,非同義突變占51.31%。
表5 4個(gè)毛竹變型SNP注釋結(jié)果Tab.5 SNP annotations in 4 variants of Moso bamboo
2.3.1 InDel檢測(cè) 從4個(gè)樣品InDel檢測(cè)結(jié)果(表6)可以看出,圣音竹全基因組范圍與編碼區(qū)分別檢測(cè)出174 657,3 173個(gè)InDel,CDS區(qū)有插入突變2 296個(gè)和缺失突變877個(gè),其中純合突變?yōu)?78個(gè)。黃槽毛竹全基因組范圍與CDS區(qū)分別檢測(cè)出185 096,3 262個(gè)InDel,CDS區(qū)有插入突變2 323個(gè)和缺失突變939個(gè),其中629個(gè)為純合突變。黃皮花毛竹全基因組范圍與CDS區(qū)分別檢測(cè)出195 518,3 296個(gè)InDel,CDS區(qū)有插入突變2 371個(gè)和缺失突變925個(gè),其中純合突變?yōu)?39個(gè)。厚壁毛竹全基因組范圍與CDS區(qū)分別檢測(cè)出176 393,3 121個(gè)InDel,CDS區(qū)有插入突變2 246個(gè)和缺失突變875個(gè),其中純合突變?yōu)?11個(gè)。對(duì)樣品在全基因組范圍和CDS區(qū)的InDel長(zhǎng)度進(jìn)行統(tǒng)計(jì)(圖1),基因組范圍存在較多的+1、-1、+2、-2類型突變,在CDS區(qū)域存在較多的+1、-1、+3、-3類型突變。
表6 4個(gè)毛竹變型全基因組和編碼區(qū)InDel統(tǒng)計(jì)Tab.6 Summary of InDels detected in 4 variants of Moso bamboo
橫坐標(biāo)小于0為缺失,大于0為插入。
2.3.2 InDel注釋 根據(jù)4個(gè)樣品與參考基因組的InDel檢測(cè)結(jié)果,進(jìn)行兩兩比較,獲得樣品間的InDel變異位點(diǎn)(表7)。黃皮花毛竹與厚壁毛竹間的InDel數(shù)最少,為45 967;圣音竹與黃槽毛竹間InDel數(shù)最多,為48 551。
表7 毛竹變型間的InDel統(tǒng)計(jì)Tab.7 Summary of InDels detected between variants of Moso bambooo
2.4.1 SV檢測(cè) 使用BreakDancer進(jìn)行SV的檢測(cè)(表8),圣音竹共檢測(cè)到148 682個(gè)SV,其中插入3 701個(gè),占總變異2.49%;缺失31 439個(gè),占總變異21.15%;染色體間易位107 945個(gè),占總變異72.60%;染色體內(nèi)部易位4 991個(gè),反轉(zhuǎn)321個(gè),其他285個(gè)。黃槽毛竹共檢測(cè)到176 960個(gè)SV,其中插入17 377個(gè),占總變異9.82%;缺失36 496個(gè),占總變異20.62%;染色體間易位116 941個(gè),占總變異66.08%。黃皮花毛竹共檢測(cè)到181 687個(gè)SV,其中插入9 498個(gè),占總變異5.23%;缺失37 880個(gè),占總變異20.85%;染色體間易位127 646個(gè),占總變異70.26%。厚壁毛竹共檢測(cè)到148 968個(gè)SV,其中插入2 481個(gè),占總變異1.67%;缺失30 971個(gè),占總變異20.79%;染色體間易位110 054個(gè),占總變異73.88%。
表8 4個(gè)毛竹變型結(jié)構(gòu)變異數(shù)量統(tǒng)計(jì)Tab.8 Summary of SVs detected in 4 variants of Moso bamboo
2.4.2 SV注釋 對(duì)結(jié)構(gòu)變異深入分析表明(表9),圣音竹外顯子區(qū)變異總數(shù)為1 894個(gè),內(nèi)含子區(qū)變異總數(shù)為789個(gè),基因間區(qū)變異總數(shù)為32 778。黃槽毛竹外顯子區(qū)變異總數(shù)為2 732個(gè),內(nèi)含子區(qū)變異總數(shù)為1 209個(gè),基因間區(qū)變異總數(shù)為50 241個(gè)。黃皮花毛竹外顯子區(qū)存在2 498個(gè)變異,內(nèi)含子區(qū)存在1 064個(gè)變異,基因間區(qū)存在44 150個(gè)變異。厚壁毛竹外顯子區(qū)分別存在1 731,內(nèi)含子區(qū)存在773個(gè),基因間區(qū)存在31 237個(gè)。
表9 4個(gè)毛竹變型結(jié)構(gòu)變異注釋結(jié)果Tab.9 SV annotations in 4 variants of Moso bamboo
2.5.1 變異基因挖掘 分別提取毛竹4個(gè)變型與參考基因組間發(fā)生非同義突變的SNP以及CDS區(qū)發(fā)生InDel與SV的基因,各樣品的變異如表10所示。稈形變異的2個(gè)竹種圣音竹和厚壁毛竹基因組分別存在9 307,9 148個(gè)基因變異,其中SNP突變基因分別為4 973,4 981個(gè),InDel基因分別為2 735,2 699個(gè),SV突變的基因分別為1 599,1 468個(gè),多個(gè)基因同時(shí)存在多種類型突變。稈色變異的2個(gè)竹種黃槽毛竹和黃皮花毛竹基因組分別存在10 194,9 977個(gè)基因變異,其中,SNP突變基因分別為5 094,5 095個(gè),InDel基因分別為2 799,2 816個(gè),SV突變基因2 301,2 066個(gè),且多個(gè)基因同時(shí)存在多種類型突變。
表10 4個(gè)毛竹變型的變異基因統(tǒng)計(jì)Tab.10 Summary of gene variations in 4 variants
2.5.2 變異基因的功能注釋 運(yùn)用Blast軟件,將挖掘的變異基因分別與GO、KEGG和COG等功能數(shù)據(jù)庫(kù)進(jìn)行比對(duì),獲得這些變異基因的注釋,進(jìn)而分析基因功能。4個(gè)毛竹變型注釋到數(shù)據(jù)庫(kù)的變異基因數(shù)分別為8 351,9 195,8 966,8 197個(gè)。
通過GO數(shù)據(jù)庫(kù),獲得變異基因GO分類統(tǒng)計(jì)結(jié)果(圖2)。從圖中可以看出,細(xì)胞組件、分子功能和生物過程3個(gè)基因功能分類體系中,GO各分類內(nèi)容對(duì)應(yīng)的基因數(shù)以及基因數(shù)目所占百分比。對(duì)GO數(shù)據(jù)進(jìn)一步分析發(fā)現(xiàn),在細(xì)胞組分方面,葉綠素合成相關(guān)基因有1 848個(gè),細(xì)胞壁相關(guān)基因750個(gè),細(xì)胞骨架相關(guān)基因194個(gè);在生物過程方面,參與類胡蘿卜素合成過程的基因有60個(gè),參與花青素合成過程中的調(diào)控以及紫外光下組織中花青素積累的相關(guān)基因有55個(gè);在功能基因方面,參與信號(hào)轉(zhuǎn)導(dǎo)的基因283個(gè),轉(zhuǎn)錄因子475個(gè),激素相關(guān)基因75個(gè)。
圖2 變異基因的GO注釋分類圖Fig.2 Classification of gene variations compared with GO database by Blast
COG數(shù)據(jù)庫(kù)是對(duì)基因產(chǎn)物進(jìn)行直系同源分類的數(shù)據(jù)庫(kù)。從變異基因COG分類統(tǒng)計(jì)結(jié)果(圖3)中可以看出,在不同的功能分類中,基因數(shù)目相差很大,其中參與功能預(yù)測(cè)、轉(zhuǎn)錄、復(fù)制重組修復(fù)和信號(hào)轉(zhuǎn)導(dǎo)機(jī)制的基因數(shù)目較多。基因所占比例多少,反映對(duì)應(yīng)時(shí)期和環(huán)境下代謝或者生理偏向等內(nèi)容。COG注釋獲得的參與功能預(yù)測(cè)的基因1 131個(gè),參與糖代謝途徑的基因355個(gè),細(xì)胞壁、細(xì)胞膜合成相關(guān)的基因有276個(gè),信號(hào)轉(zhuǎn)導(dǎo)機(jī)制的基因數(shù)為228個(gè),細(xì)胞周期調(diào)控、細(xì)胞分裂和染色的相關(guān)基因145個(gè)。
通過KEGG數(shù)據(jù)庫(kù),變異基因注釋到114個(gè)KEGG代謝通路中,分析共獲得了1 310個(gè)轉(zhuǎn)錄因子及813個(gè)信號(hào)轉(zhuǎn)導(dǎo)相關(guān)單基因;在功能基因方面,共獲得618個(gè)與細(xì)胞壁構(gòu)建相關(guān)的代謝基因。KEGG數(shù)據(jù)庫(kù)能夠系統(tǒng)地分析基因產(chǎn)物在細(xì)胞中的代謝途徑和功能,有助于把基因及表達(dá)信息作為一個(gè)整體的網(wǎng)絡(luò)進(jìn)行研究。從變異基因的糖代謝通路(圖4)可以看出,整個(gè)通路有46種不同的酶通過復(fù)雜的生化反應(yīng)形成,框內(nèi)的數(shù)字分別代表酶的號(hào)碼。其中的4種酶:1.2.4.1(丙酮酸脫氫酶)、1.8.1.4(二氫硫辛酸脫氫酶)、5.3.1.1(磷酸丙糖異構(gòu)酶)和5.4.2.2(葡萄糖磷酸變位酶)對(duì)應(yīng)的框代表變異基因中與此通路相關(guān)。
圖3 變異基因的COG注釋分類圖Fig.3 Classification of gene variations compared with COG database
將變異基因與GO、COG、KEGG等3個(gè)功能數(shù)據(jù)庫(kù)進(jìn)行比對(duì)、注釋,共獲得1 739個(gè)參與細(xì)胞壁和細(xì)胞膜合成的基因、501個(gè)細(xì)胞骨架構(gòu)建相關(guān)基因、1 785個(gè)轉(zhuǎn)錄因子、1 324個(gè)信號(hào)轉(zhuǎn)導(dǎo)、104個(gè)赤霉素及76個(gè)激素代謝相關(guān)基因、1 938個(gè)葉綠素合成相關(guān)的基因、73個(gè)類胡蘿卜素合成代謝相關(guān)基因和68個(gè)花青素合成調(diào)控基因。
經(jīng)過長(zhǎng)期的自然演化和人工栽培后,毛竹種內(nèi)產(chǎn)生豐富的遺傳變異,從而形成不同的結(jié)構(gòu)形態(tài)。圣音竹、黃皮花毛竹、黃槽毛竹和厚竹是毛竹種的4個(gè)變型,具有明顯的稈形或稈色特征。圣音竹竹稈從上面向基部逐漸膨大呈喇叭狀,同時(shí)節(jié)間縮短,且上粗下細(xì)或下部緊靠節(jié)處有不規(guī)則凹陷,節(jié)部呈波浪狀歪斜。厚竹稈略呈四方形或橢圓形,壁厚,上部近實(shí)心,分枝以下節(jié)隆起較高。黃皮花毛竹稈黃色或黃綠色基本各半,有寬窄不等的綠色縱條紋。黃槽毛竹稈主要為綠色,但節(jié)間分枝一側(cè)縱溝槽為黃色或淡黃色。這些在竹稈形態(tài)和顏色等方面的不同變異使其具有很高的觀賞價(jià)值。
通過對(duì)4個(gè)毛竹變型進(jìn)行重測(cè)序,初步統(tǒng)計(jì)分析了這些形態(tài)變異發(fā)生的分子數(shù)據(jù)。樣品檢測(cè)到的SNP總數(shù)為2 035 983,Ti/Tv值約為2.90,說明同種類型的堿基之間突變比不同類型間更容易發(fā)生。分別提取毛竹4個(gè)變型與參考基因組間發(fā)生非同義突變的SNP、CDS區(qū)發(fā)生InDel與SV的基因,可以發(fā)現(xiàn)其基因組基因的變異數(shù)目和變異類型呈現(xiàn)一定的規(guī)律,其中,2個(gè)稈形變異竹種圣音竹和厚壁毛竹基因組基因的變異數(shù)目和變異類型相近,而2個(gè)稈色變異竹種黃槽毛竹和黃皮花毛竹基因組的變異數(shù)目和變異類型相近,但稈形和稈色變異的竹種兩兩之間差異較大。
DNA水平的變異基因挖掘和功能注釋,可以分析基因產(chǎn)物在細(xì)胞中的代謝途徑以及這些基因產(chǎn)物的功能。將變異基因通過多個(gè)數(shù)據(jù)庫(kù)注釋,共獲得1 739個(gè)基因參與細(xì)胞壁、細(xì)胞膜合成,501個(gè)細(xì)胞骨架構(gòu)建相關(guān)基因,以及1 785個(gè)轉(zhuǎn)錄因子、1 324個(gè)信號(hào)轉(zhuǎn)導(dǎo)、104個(gè)赤霉素和76個(gè)激素代謝相關(guān)基因。參考矢竹的研究結(jié)果,其地下莖生長(zhǎng)發(fā)育受到從各類激素、轉(zhuǎn)錄因子到其下游功能基因等組成的復(fù)雜分子網(wǎng)絡(luò)的協(xié)同調(diào)控,細(xì)胞壁、細(xì)胞骨架下游功能相關(guān)基因在矢竹地下莖節(jié)間快速生長(zhǎng)階段表達(dá)最高,而赤霉素合成及信號(hào)傳導(dǎo)相關(guān)基因則在節(jié)間伸長(zhǎng)起始階段最高[35]。因此,進(jìn)一步對(duì)毛竹變型細(xì)胞組分、生物過程和分子功能相關(guān)變異基因的研究,有利于推測(cè)毛竹稈形變異的分子調(diào)控機(jī)制。
竹類植物中的色素主要有葉綠素、類胡蘿卜素和花青素3大類,色素的變化會(huì)影響植株的呈色變異。通過數(shù)據(jù)庫(kù)注釋,發(fā)現(xiàn)的葉綠素合成相關(guān)基因、類胡蘿卜素合成代謝相關(guān)基因和花青素合成調(diào)控基因,深入研究這些差異基因的調(diào)控途徑利于從DNA水平上解釋稈色的變異。研究表明[36],毛竹不同變異類型在凈光合速率、葉綠素含量、β胡蘿卜素含量、硝酸還原酶活性、游離氨基酸含量這5個(gè)生理指標(biāo)中存在著顯著性差異,其中,黃皮花毛竹最高,其次為厚壁毛竹,然后是圣音毛竹、黃槽毛竹。對(duì)毛竹的栽培變種進(jìn)行ISSR和AFLP分子標(biāo)記分析,分子遺傳的分析結(jié)果與阮曉賽[37]進(jìn)行的形態(tài)學(xué)研究結(jié)果相似,變型之間的遺傳變異程度較小。進(jìn)一步分析這4個(gè)毛竹變型基因產(chǎn)物的功能及其代謝途徑,也有利于從基因水平上對(duì)其生物學(xué)和生理特性加以解釋和分析。數(shù)據(jù)的挖掘與深入分析工作正在進(jìn)行,后續(xù)分析將解析毛竹眾多種質(zhì)的分子遺傳基礎(chǔ),闡析不同變異類型的分子品性、基因家族、功能基因等遺傳根基。