郭媛婷 楊玉潔 胡曉艷 杜淑輝
關(guān)鍵詞:δ8-FAD2;密碼子使用偏好性;油料作物;非油料作物
隨著人們對(duì)食品健康的關(guān)注度越來(lái)越高,油脂作為食品必不可少的成分,得到了廣泛的社會(huì)關(guān)注。不飽和脂肪酸(如油酸、亞油酸)可保持細(xì)胞膜的相對(duì)流動(dòng)性、有效降低血液膽固醇和甘油三酯含量,人體若缺乏此類脂肪酸,膽固醇便會(huì)和一些飽和脂肪酸進(jìn)行結(jié)合,沉積于血管壁,逐漸形成動(dòng)脈粥樣硬化,引發(fā)心腦血管疾病[1]。植物中不飽和脂肪酸分布廣泛,如花生、大豆、油菜、油橄欖中含有豐富的亞油酸、亞麻酸以及其他不飽和脂肪酸[2-3],且各種植物中油酸及亞油酸含量與比例并不相同,如核桃中亞油酸含量可以高達(dá)70%[4];花生中油酸含量為35%~80%,亞油酸變含量為1%~40%[5];而油菜中油酸含量可達(dá)60%,亞油酸僅占12%~24%[6]。
脂肪酸去飽和酶(FAD2)是一種常見(jiàn)的脫氫酶,存在于細(xì)胞內(nèi)質(zhì)網(wǎng)的表面,調(diào)控植物中各種不飽和脂肪酸的合成,故FAD2基因直接決定了植物體儲(chǔ)存脂中不飽和脂肪酸的含量與比例[7-9],然而,F(xiàn)AD2基因并非聚集于油料作物中,而是普遍存在于各種植物中[8],且不同類型植物中FAD2基因序列編碼存在著差異。據(jù)報(bào)道,基因序列對(duì)密碼子的使用不是完全隨機(jī)的,而是具有一定的偏好性,合成某種蛋白質(zhì)的基因序列對(duì)同義密碼子的使用頻率不同,會(huì)造成mRNA轉(zhuǎn)錄產(chǎn)生的蛋白數(shù)量發(fā)生顯著變化。研究發(fā)現(xiàn),酸棗[10]、銀杏[11]等中已被檢測(cè)出較弱的密碼子偏好性;而在油茶[12]、棉花[13]中發(fā)現(xiàn),自然選擇的影響對(duì)其密碼子偏好性的形成起到很大作用。近年來(lái),對(duì)不同植物中某一特定基因的密碼子使用偏好的探索已成為基因研究的熱點(diǎn)。朱靈芝等[14]進(jìn)行馬尾松PmDXR基因密碼子偏好性分析,得出其密碼子偏好性較弱、偏好使用A/T結(jié)尾的密碼子結(jié)論。吳彥慶等[15]對(duì)不同植物中花的APETALA1基因密碼子使用模式進(jìn)行比較,結(jié)果發(fā)現(xiàn),芍藥和牡丹AP1基因的密碼子使用特點(diǎn)相似,碧桃和蘋果AP1基因的密碼子使用特點(diǎn)相似。然而,目前大多對(duì)密碼子偏好性的研究都只從親緣關(guān)系的層面討論植物密碼子使用偏好性規(guī)律的相似性[16-17],未有提及木本與草本植物的密碼子使用模式是否也有規(guī)律可循;此外,對(duì)于FAD2基因的研究也多在論述其功能作用[7-9],少有學(xué)者探討油料與非油料植物中的FAD2基因在序列結(jié)構(gòu)中是否存在差異。
本研究在FAD2基因家族中挑選出δ8-FAD2基因,通過(guò)對(duì)比分析15種不同類型植物的基因序列,對(duì)其密碼子使用偏好性及其影響因素進(jìn)行分析,旨在明確草本與木本、油料與非油料作物中δ8-FAD2基因密碼子的使用偏好成因及其差異,從而為理解不同物種的基因結(jié)構(gòu)與進(jìn)化關(guān)系,并進(jìn)一步通過(guò)基因調(diào)控改良油料作物品質(zhì)提供研究基礎(chǔ)。
1 材料和方法
1.1 序列數(shù)據(jù)來(lái)源
目前,GenBank數(shù)據(jù)庫(kù)中來(lái)自不同物種的δ8-FAD2基因序列共166條。為明確草本與木本、油料與非油料作物內(nèi)δ8-FAD2基因密碼子的使用偏好性及其影響因素的差異,本試驗(yàn)選取15種代表性植物作為研究對(duì)象,具體序列信息如表1所示。
1.2 密碼子使用偏好性分析
1.2.1 堿基組成偏好性分析 使用CodonW1.4.2軟件對(duì)15個(gè)基因序列的堿基組成進(jìn)行分析,并計(jì)算各基因的GC含量(GC)、密碼子第3位的GC含量(GC3)、密碼子末位堿基使用頻率(T3、C3、A3、G3)、最優(yōu)密碼子的使用頻率(Fop)、密碼子適應(yīng)指數(shù)(CAI)及密碼子偏愛(ài)指數(shù)(CBI)[18]。通過(guò)對(duì)15種植物的綜合比較分析,評(píng)估δ8-FAD2基因的堿基組成偏好性與不同植物中同一基因的堿基組成差異性。
1.2.2 有效密碼子分析 有效密碼子(effectivenum?berofcodons,ENC)可用于反映各同義密碼子的使用偏好度,取值范圍為20~61,ENC值越小偏好性越強(qiáng),基因表達(dá)量也越高,因此,通過(guò)比較ENC值大小可以得出內(nèi)源基因表達(dá)量的相對(duì)高低[15]。
1.2.3 相對(duì)同義密碼子使用度分析 相對(duì)同義密碼子使用度(RelativeSynonymousCodonUsage,RSCU)是密碼子實(shí)際使用值與無(wú)偏好值之比[19]。RSCU=1表示所有同義密碼子被均衡使用,無(wú)偏好性;RSCU<1表示密碼子使用頻率較低,反之則偏高;RSCU>1.6表示該密碼子有極強(qiáng)偏好性[20]。
1.2.4 最優(yōu)密碼子分析 利用MicrosoftExcel對(duì)CodonW計(jì)算得到的數(shù)據(jù)進(jìn)行相關(guān)性分析和不同氨基酸最優(yōu)密碼子確定。將基因序列參照ENC值由高到低進(jìn)行排序,選取ENC值最低的5個(gè)基因作為高偏好組,最高的5個(gè)基因?yàn)榈推媒M,分別計(jì)算2組的RSCU值,記作RSCUhigh和RSCUlow,計(jì)算二者差值ΔRSCU值。將同時(shí)滿足ΔRSCU>0.08和RSCU值>1的密碼子視為最優(yōu)密碼子[21]。
1.3 ENC-plot繪圖分析
ENC-GC3關(guān)聯(lián)圖可用來(lái)判斷基因密碼子使用偏好性的壓力來(lái)源。已知標(biāo)準(zhǔn)曲線為:ENC=2+GC3+29/(GC3?+(1-GC3)?)[22]。若ENC繪圖中所有點(diǎn)分布在標(biāo)準(zhǔn)曲線上或分布于標(biāo)準(zhǔn)曲線附近,則密碼子使用偏好只受到突變壓力影響;若這些點(diǎn)分布于標(biāo)準(zhǔn)曲線外,則認(rèn)為密碼子使用偏好受到自然選擇及其他因素影響[23-24]。
1.4 PR2-plot分析
PR2-plot繪圖可用來(lái)判斷基因密碼子第3位點(diǎn)堿基的使用偏性情況。為便于分析不同植物δ8-FAD2基因密碼子第3位點(diǎn)使用偏好,以G3/(G3+C3)值為橫坐標(biāo)、A3/(A3+T3)值為縱坐標(biāo)繪制直角坐標(biāo)系,當(dāng)A=T,G=C時(shí),坐標(biāo)為(0.50,0.50),過(guò)此坐標(biāo)分別作垂直于橫縱坐標(biāo)的直線,將坐標(biāo)軸第1象限分成4個(gè)區(qū)域[25]。若點(diǎn)分布于中心點(diǎn)附近,則說(shuō)明密碼子使用偏好性主要受到了堿基突變的影響;若分布于直線上部區(qū)域,表明該基因密碼子末位堿基使用頻率A高于T;若分布在直線的左部區(qū)域,則表明末位堿基C高于G。
1.5 統(tǒng)計(jì)分析
利用R軟件繪制不同植物RSCU值的聚類熱圖[15]?;?5種植物δ8-FAD2不同RSCU值使用SPSS26.0軟件進(jìn)行聚類分析[17],使用MEGA-X軟件對(duì)不同物種δ8-FAD2完整基因編碼序列進(jìn)行對(duì)比,并對(duì)其聚類分析[26]。
2 結(jié)果與分析
2.1 不同植物δ8-FAD2基因的密碼子堿基組成
15種植物δ8-FAD2基因密碼子使用參數(shù)如表2所示。
使用CodonW1.4.2軟件對(duì)15種植物δ8-FAD2基因完整編碼序列進(jìn)行分析統(tǒng)計(jì),結(jié)果表明(表2),在密碼子末位堿基的選擇上,除高粱使用C3頻率最高外,其余14種植物皆為T3頻率最高,且C3和G3頻率都較低;GC值變化范圍為0.342~0.592,平均值為0.433,GC3值變化范圍0.305~0.568,平均值為0.409。除高粱的δ8-FAD2基因GC含量和GC3大于0.5,其余14種植物均小于0.5,說(shuō)明這14種植物δ8-FAD2基因密碼子偏好使用AT,且偏好以A或T結(jié)尾。15種植物的ENC值范圍為47.200~58.030,平均為52.448,說(shuō)明這15種植物δ8-FAD2基因的密碼子使用偏好性都較弱。
2.2 最優(yōu)密碼子確定
對(duì)15種植物δ8-FAD2基因所有氨基酸不同密碼子的含量以及RSCU值進(jìn)行統(tǒng)計(jì),結(jié)果顯示(表3),除起始密碼子(AUG、UGG)和終止密碼子(UAA、UAG、UGA)以外,δ8-FAD2基因偏好使用的密碼子共有26個(gè),其中,23個(gè)以U、A結(jié)尾,僅有3個(gè)以G、C結(jié)尾,AGA、UCU和GUU表現(xiàn)為較強(qiáng)偏好性?;讦?-FAD2基因中各氨基酸不同密碼子含量的差異,在氨基酸水平上,得到了17個(gè)優(yōu)勢(shì)密碼子,分別為GCU、AGA、AAU、GAU、UGU、CAA、GGA、CAU、AUU、UUG、AAA、UUU、CCU、UCU、ACA、UAU、GUU。
從圖1可以看出,不同植物δ8-FAD2基因最優(yōu)密碼子存在一定差異,開(kāi)心果、美國(guó)山核桃、角豆樹(shù)、大豆、野大豆、甘藍(lán)的最優(yōu)密碼子為AGG,棉花、木薯、桑樹(shù)的最優(yōu)密碼子為AGA,豌豆和花生的最優(yōu)密碼子為UCU,而核桃、高粱、向日葵、油菜的最優(yōu)密碼子分別為GGA、UUG、GUU和CCG。
對(duì)δ8-FAD2基因高偏好組和低偏好組進(jìn)行分析結(jié)果表4所示。其中,有27個(gè)密碼子RSCU>1,表現(xiàn)為較高使用偏性,23個(gè)密碼子ΔRSCU>0.08,具有高表達(dá)性。同時(shí)滿足2個(gè)條件的密碼子有21個(gè),視為δ8-FAD2基因的最優(yōu)密碼子。
2.3 ENC-plot繪圖分析
ENC-plot繪圖可以對(duì)15種植物δ8-FAD2基因的實(shí)際ENC值與ENC期望曲線進(jìn)行比較,結(jié)果顯示(圖2),15種植物δ8-FAD2基因的實(shí)際ENC值與期望值都存在一定差異,全部分布于ENC期望曲線下方,說(shuō)明這些物種δ8-FAD2基因密碼子使用偏好性的形成都受到了自然選擇的影響。木本油料作物的ENC值大都偏離標(biāo)準(zhǔn)曲線且分布相對(duì)集中,而草本油料作物的ENC值分布差異較大,如向日葵、油菜等接近期望曲線,而大豆、花生等卻偏離嚴(yán)重,說(shuō)明木本植物受到選擇壓力情況相似,而不同種類草本植物受到的突變壓力與選擇壓力不盡相同;非油料作物的ENC值均偏離期望曲線,說(shuō)明大多非油料作物δ8-FAD2基因密碼子使用偏好性的主導(dǎo)因素是選擇壓力。
2.4 PR2-plot分析
PR2-plot繪圖可用來(lái)比較不同植物δ8-FAD2基因密碼子第3位堿基的使用偏好性情況,若點(diǎn)落于x=0.5的直線上,表示密碼子第3位G和C的使用頻率相同;若點(diǎn)落于y=0.5的直線上,則表示密碼子第3位A和T的使用頻率相同。分析統(tǒng)計(jì)15種植物δ8-FAD2基因的密碼子使用情況(圖3),發(fā)現(xiàn)除桑樹(shù)密碼子第3位對(duì)A或T、G或C沒(méi)有選擇偏好性,其余物種皆偏離中心點(diǎn)(0.5,0.5),且集中分布在右下部分,因此,幾乎所有物種的δ8-FAD2基因密碼子使用偏好性皆很大程度上受自然選擇的影響,密碼子末位堿基使用頻率G高于C,T高于A。非油料作物相對(duì)更接近“x=0.5”和“y=0.5”2條輔助線,說(shuō)明非油料作物在密碼子第3位點(diǎn)堿基的選擇上偏好性較弱。
2.5 不同植物δ8-FAD2基因密碼子使用模式的系統(tǒng)關(guān)系
基于RSCU值構(gòu)建δ8-FAD2基因進(jìn)化樹(shù),結(jié)果如圖4所示。圖4-A反映了密碼子相對(duì)使用度的相似性,有相同密碼子使用偏好的物種離得更近,而有些親緣關(guān)系接近的植物卻并有著相似的密碼子使用偏好。例如甘藍(lán)單獨(dú)分為一類,而非與油菜等親緣物種歸為一類,其余14種植物又分為2類,高粱單獨(dú)為一類?;?5種植物δ8-FAD2基因完整序列構(gòu)建的系統(tǒng)進(jìn)化樹(shù)(圖4-B)則更能反映出物種基因序列相似性,親緣關(guān)系接近的分為一類。由此可見(jiàn),許多物種的分類在2個(gè)聚類中并不完全相同。然而,無(wú)論哪種分類方式,都有將木本植物單獨(dú)劃分出來(lái)的趨勢(shì),而草本植物中許多物種雖然親緣關(guān)系較接近,在2個(gè)分類結(jié)果中卻差異較大,表明物種間的親緣關(guān)系并不是密碼子使用偏好性的決定性因素。
3 結(jié)論與討論
由于同義密碼子的差異集中表現(xiàn)于密碼子末位堿基,且密碼子此位點(diǎn)選擇壓力較小,因此,常把GC3用于密碼子使用模式分析[10]。ENC值同樣是評(píng)價(jià)基因密碼子偏好性的重要參考指標(biāo)[27]。本研究表明,15種植物中,草本植物δ8-FAD2基因序列長(zhǎng)度普遍大于木本植物,而密碼子GC含量和GC3除高粱外都小于0.5,使用多種方式統(tǒng)計(jì)優(yōu)勢(shì)密碼子,結(jié)果都表現(xiàn)為此基因偏好使用AT堿基,且偏好用A或T結(jié)尾,這一結(jié)果與晁岳恩等[28]的研究結(jié)果類似,是由于15種植物中僅高粱是禾本科植物,禾本科植物密碼子偏好以G或C結(jié)尾,而雙子葉作物則更偏好使用以A或T結(jié)尾的密碼子[29]。15種植物δ8-FAD2基因ENC平均值為52.448,說(shuō)明此基因密碼子使用偏好性弱,這與前人的研究結(jié)果一致[30]。
本研究表明,15種植物δ8-FAD2基因密碼子使用情況有較大差異,自然選擇和堿基突變的影響是造成不同物種同一基因密碼子使用出現(xiàn)偏差的主要原因[23,31]。在ENC-plot繪圖分析中,油料木本植物除棉花外都偏離ENC標(biāo)準(zhǔn)曲線且分布相對(duì)集中,可能是由于木本植物受到選擇壓力情況相似,具有相似的密碼子使用偏好,而棉花作為唯一一種1年生木本植物,生命周期短且基因序列相對(duì)其他木本植物較長(zhǎng),可以積累更多的變異,密碼子使用偏好性被強(qiáng)烈的堿基突變左右。1年生草本油料植物如油菜、向日葵的ENC值接近預(yù)期曲線,密碼子使用偏好性的主導(dǎo)因素是堿基突變,而豆科植物如大豆、花生等因受到長(zhǎng)期定向選擇育種而遠(yuǎn)離標(biāo)準(zhǔn)曲線[32-33]。此外,其他非油料作物除高粱外的ENC值均偏離期望曲線,說(shuō)明大多數(shù)非油料作物密碼子使用偏好性的主導(dǎo)因素是選擇壓力,這便導(dǎo)致非油料作物密碼子使用偏好性遠(yuǎn)小于油料作物。PR2-plot繪圖中,多數(shù)物種密碼子末位堿基的使用都受到了自然選擇的影響,且非油料作物的密碼子第3位堿基的選擇上偏好性較弱,因此得出,油料作物δ8-FAD2基因密碼子使用偏好性強(qiáng)于非油料作物,這與ENC-plot繪圖分析結(jié)果一致。
本研究結(jié)果表明,15種不同類型植物δ8-FAD2基因密碼子使用偏好差異較大,油料作物的密碼子使用偏好性要強(qiáng)于非油料作物,木本植物間其密碼子偏好性的受壓力情況基本類似,草本植物間各不相同,而大家普遍認(rèn)為的物種間的親緣關(guān)系并非密碼子使用偏好性的決定性因素。由此推斷,植物中δ8-FAD2基因的改變或許會(huì)間接改變其脂肪酸組分與油脂含量,要解決這個(gè)問(wèn)題仍需今后進(jìn)一步驗(yàn)證與分析。深入了解δ8-FAD2基因密碼子使用偏好性有助于進(jìn)一步理解脂肪酸轉(zhuǎn)化與累積規(guī)律,通過(guò)基因調(diào)控改良油料作物質(zhì)量,為尋找和培育更加優(yōu)質(zhì)的油料作物提供了方向。