丁 戈,黃 楊,陳倫林,李書宇,宋來強,熊 潔
(江西省農(nóng)業(yè)科學院 作物研究所,國家油料改良中心南昌分中心,江西省油料作物生物學重點實驗室,農(nóng)業(yè)農(nóng)村部長江中下游作物生理生態(tài)與耕作重點實驗室,江西 南昌 330200)
酸性土壤(pH 值<5.5)的溶解鋁(Al3+)通過抑制根系生長,影響水分和養(yǎng)分吸收,限制了作物的生長與產(chǎn)量[1-3]。植物根系是鋁毒害的主要作用部位,根系通過誘導(dǎo)或增強相關(guān)鋁抗性基因表達,如轉(zhuǎn)錄、RNA剪接、蛋白質(zhì)翻譯或翻譯后修飾等調(diào)控,合成功能性基因產(chǎn)物來應(yīng)對鋁毒害[4-9]。實時熒光相對定量PCR(Real-time fluorescence relative quantitative PCR)是研究基因轉(zhuǎn)錄水平表達量的常用技術(shù),具有高通量、特異性強、靈敏度高、重復(fù)性高等特點。其對目標基因的相對表達量分析需要選擇高度保守且穩(wěn)定表達的基因作為內(nèi)參基因。常用內(nèi)參基因通常是在所有細胞中表達的持家基因(Housekeeping gene),但持家基因的表達穩(wěn)定性是相對的,已經(jīng)不能滿足多樣化的試驗體系中相對定量分析對內(nèi)參基因的要求[10]。內(nèi)參基因需要根據(jù)物種、組織器官、生長發(fā)育階段和試驗條件等因素進行篩選、評估和驗證[11]。根據(jù)具體的樣品類型選擇合適的內(nèi)參基因作為參照物校正樣品間的試驗誤差,通過對結(jié)果數(shù)據(jù)的標準化處理,確保實時熒光相對定量PCR分析結(jié)果的準確性[12]。隨著轉(zhuǎn)錄組測序技術(shù)(RNA-seq)[13-15]的發(fā)展,基于高通量大數(shù)據(jù)的新內(nèi)參基因發(fā)掘可以不再局限于常見的持家基因。本研究采用有參考基因組的轉(zhuǎn)錄組測序技術(shù)篩選候選內(nèi)參基因,隨后采用實時熒光相對定量PCR分析、基因表達穩(wěn)定性分析及相對表達量分析等技術(shù),評估、驗證候選內(nèi)參基因的表達穩(wěn)定性,進行鋁脅迫下甘藍型油菜苗期根組織新內(nèi)參基因的發(fā)掘以及實時熒光相對定量PCR引物的開發(fā)。
植物材料培養(yǎng)于人工氣候溫室(晝夜時間14 h/10 h,晝夜溫度25 ℃/20 ℃)。供試材料為前期研究篩選獲得1對苗期耐鋁性差異顯著的油菜品種:耐鋁品種贛油雜7號(Ganyouza 7)和鋁敏感品種蓉油18(Rongyou 18)。將2個品種分別播種在裝有純凈水的培養(yǎng)箱中,7 d后每品種選擇長勢一致的40株幼苗,移栽于裝有改良型Hoagland(pH值 5.8~6.0)營養(yǎng)液[16]的培養(yǎng)箱中,依次1/4、1/2、完全營養(yǎng)液各培養(yǎng)7 d。在苗齡28 d時,分為6個試驗組,設(shè)置3次重復(fù),對照組為未施加AlCl3時的0 h取樣,處理組為施加100 μmol/L AlCl3(pH值 4.5)后分別在3,24 h取樣。每個試驗組各取樣3個生物重復(fù)樣品,共18個樣品。每個樣品根部取樣大于4 g,液氮速凍后保存于-70 ℃冰柜。后續(xù)的文庫制備及有參考基因組的轉(zhuǎn)錄組測序,總RNA提取,cDNA逆轉(zhuǎn)錄反應(yīng)及實時熒光相對定量PCR由廣州基迪奧生物科技有限公司完成。
1.2.1 文庫制備及轉(zhuǎn)錄組測序分析 使用TRIzolTMReagent(Invitrogen,美國)提取樣品的總RNA,質(zhì)檢合格后,真核生物轉(zhuǎn)錄組文庫構(gòu)建使用NEB#7530試劑盒(New England Biolabs,美國),文庫質(zhì)檢(DNA 1000 assay Kit,Agilent,美國)合格后,每個樣品構(gòu)建一個300~500 bp片段長度的雙端(Paired-end,PE)測序文庫,在Illumina HiSeq2500測序儀(Illumina,美國)上進行PE150測序。經(jīng)測序原始數(shù)據(jù)質(zhì)控,基于基因組注釋的定量質(zhì)控、基因分析、表達量統(tǒng)計等步驟,獲得基因表達的FPKM值與組間差異倍數(shù)|log2FC|值。本研究中使用的甘藍型油菜基因序列均參考甘藍型油菜Darmor-bzh參考基因組[17-18](Darmor-bzhv4.1,下載自http://www.genoscope.cns.fr/brassicanapus)。
1.2.2 總RNA提取與質(zhì)量檢測 用于cDNA逆轉(zhuǎn)錄反應(yīng)及實時熒光相對定量PCR分析的總RNA提取參照賽默飛世爾科技(中國)有限公司InvitrogenTMTRIzolTMReagent產(chǎn)品說明書。提取完成后存于-70 ℃?zhèn)溆?。微量分光光度?型號NanoDrop 2000,Thermo Scientific,美國)檢測RNA的質(zhì)量與濃度。RNA完整性檢測采用1%(0.5 μg/mL EB)非變性瓊脂糖凝膠(1×TAE緩沖液,pH值 8.5,40 mmol/L Tris-乙酸,2 mmol/L EDTA),RNA原液上樣1 μL。電泳儀參數(shù)設(shè)置為恒壓5 V/cm,電泳時間20~30 min或溴酚藍染料遷移至膠下游3/4處時停止電泳。EB染色的凝膠置于凝膠成像系統(tǒng)(型號Gel DocTMXR+,BIO-RAD,美國)觀察并照相。
1.2.3 cDNA逆轉(zhuǎn)錄反應(yīng)體系 用于實時熒光相對定量PCR分析的cDNA逆轉(zhuǎn)錄反應(yīng)體系的配制參照南京諾唯贊生物科技股份有限公司HiScript?Ⅱ Q RT SuperMix for qPCR(+gDNA wiper)產(chǎn)品說明書。使用1 μg總RNA按兩步驟依次建立16 μL基因組DNA去除反應(yīng)體系及20 μL cDNA逆轉(zhuǎn)錄反應(yīng)體系。反應(yīng)完成后存于-70 ℃?zhèn)溆谩?/p>
1.2.4 實時熒光相對定量PCR引物設(shè)計與合成、反應(yīng)體系及程序設(shè)置 遵循實時熒光定量PCR的引物設(shè)計原則,采用Primer Premier 5設(shè)計,上海捷瑞生物工程有限公司合成及PAGE方式純化引物。Actin7上游引物序列為5′-GTTACGCTCTTCCT CACGCT-3′,下游引物序列為5′-CAGGGGCTTCCAT TCCG-3′,擴增子堿基對數(shù)為315 bp;ARFA1E上游引物序列為5′-TCGTCACAACCATTCCCACC-3′,下游引物序列為5′-AGATAAGCCCCTGCGTGTTC-3′,擴增子堿基對數(shù)為144 bp;SAP5上游引物序列為5′-CGCAGAGAACGGAGAAGGAA-3′,下游引物序列為5′-ACGACTTTGGCTGGTGATGG-3′,擴增子堿基對數(shù)為238 bp;UXS3上游引物序列為5′-GACCC TCTCATCCACCCTCA-3′,下游引物序列為5′-CACC ATCTTTATCTCTATGCTCGG-3′,擴增子堿基對數(shù)為432 bp;UBC9上游引物序列為5′-GCCCTTACTCTG GTGGTGTT-3′,下游引物序列為5′-CGAACAGAT AGATAGCAGCACC-3′,擴增子堿基對數(shù)為197 bp。反應(yīng)體系的配制參照南京諾唯贊生物科技股份有限公司ChamQTMSYBRTMqPCR Master Mix(High ROX Premixed)產(chǎn)品說明書,使用4 μL cDNA稀釋液(原液稀釋10×)為模板配制20 μL反應(yīng)體系。SYBRTMGreen Ⅰ嵌合熒光實時定量PCR反應(yīng)在StepOne PlusTMReal-Time PCR System(Applied Biosystems,美國)上運行,步驟依次為,步驟1預(yù)變性:95 ℃預(yù)變性90 s;步驟2循環(huán)反應(yīng)(三步法):進行40個循環(huán),95 ℃變性5 s,60 ℃退火15 s,72 ℃延伸20 s;步驟3熔解曲線采集:升溫(速率100%)至95 ℃變性15 s,降溫(速率100%)至65 ℃退火60 s,緩慢升溫(0.3 ℃/s)至95 ℃變性15 s。分別在循環(huán)反應(yīng)延伸階段、熔解曲線緩慢升溫及后續(xù)變性階段采集實時熒光信號。
1.2.5 基因表達穩(wěn)定性分析的算法 geNorm[19](下載地址https://genorm.cmgg.be)采用成對比較法(Pairwise comparison approach),計算出基因表達穩(wěn)定性M值(Average pairwise variationV,平均配對變異V值)。當M值低于1.5時,M值越低,穩(wěn)定性越高。當配對變異值Vn/Vn+1<0.15時,內(nèi)參基因組合的最適基因是高穩(wěn)定性排名的前n個。geNorm算法的數(shù)據(jù)輸入格式為,每個樣品(含生物學重復(fù))相對定量EΔCt值,其中樣本i中基因j的Ct(i,j)值為其技術(shù)重復(fù)Ct值的算數(shù)平均數(shù)(Arithmetic mean),ΔCt(i,j)=minCt(m,j)-Ct(i,j)。minCt(m,j)為該基因j在所有樣本m中最小Ct值,E為擴增效率(效率為100%時,E=2)。NormFinder[20](下載地址https://www.moma.dk/normfinder-software)采用基于模型的方法(The Model-Based Approach),計算出基因組內(nèi)方差(Intra-group variances)與組間方差(Inter-group variances),再計算出基因表達穩(wěn)定性ρ值,組間方差越接近0,同時平均組內(nèi)方差越小,ρ值越低,穩(wěn)定性越高。NormFinder算法的數(shù)據(jù)輸入格式為,每個樣品(含生物學重復(fù))的技術(shù)重復(fù)Ct值的中位數(shù)(Median),并勾選"log transform data"選項進行自然對數(shù)log(x)轉(zhuǎn)換,或數(shù)據(jù)輸入相對定量EΔCt值。BestKeeper[21](下載地址https://www.gene-quantification.de/bestkeeper.html)采用重復(fù)配對相關(guān)分析(Repeated pair-wise correlation analysis)、相關(guān)分析(Correlation analysis)和回歸分析(Regression analysis),計算Ct值的標準偏差(Standard deviation,s)、變異系數(shù)(Coefficient of variation,CV)和配對相關(guān)系數(shù)(Coefficient of correlation,r)。當s<1時,r值越大,CV值和s值越低,穩(wěn)定性越高。BestKeeper算法的數(shù)據(jù)輸入格式為,每個樣品(含生物學重復(fù))的技術(shù)重復(fù)Ct值的算數(shù)平均數(shù)以及基因的擴增效率。
有參考基因組的轉(zhuǎn)錄組測序的基因表達量計算使用FPKM法(Fragments per kilobase of transcript per million mapped fragments,每百萬片段中來自于某基因每千堿基長度的片段)[22],F(xiàn)PKM法適用于雙端測序文庫,其公式能夠抵消基因編碼區(qū)堿基數(shù)和樣品測序片段數(shù)差異對基因表達量運算的影響,計算得到的FPKM值可直接用于比較不同組間的基因表達差異,其比值即為2組間基因表達差異倍數(shù)(Fold Change,F(xiàn)C),對FC取以2為底的對數(shù)之后即為log2FC,在|log2FC|>1時,表達差異2倍以上。持家基因具有2個特征,即在試驗組織中穩(wěn)定表達,且表達水平高于背景值,因此,以FPKM值(大于10,表達水平高于背景值)和log2FC絕對值(小于0.1,表達變化較小)作為雙層過濾篩選條件,從6個試驗組的轉(zhuǎn)錄組測序數(shù)據(jù)中篩選出符合持家基因2個特征的5個候選內(nèi)參基因(Actin7、ARFA1E、SAP5、UXS3、UBC9)。此外,由于它們屬于不同的功能分類,在理論上降低了這些基因會受到共調(diào)控的可能性,因此,它們可作為不同類別的候選內(nèi)參基因(圖1-A、表1)。傳統(tǒng)持家基因β-肌動蛋白基因(β-actin)的異型體ACT2[23]、磷酸化的甘油醛-3-磷酸脫氫酶基因GAPDH的細胞質(zhì)同工型GAPC1(Glyceraldehyde-3-phosphate dehydrogenase C subunit 1)[24]、α-微管蛋白基因(α-tubulin)的亞型TUA4(Tubulin alpha-4 chain)[25]在2個品種的鋁脅迫時間梯度(3,24 h)處理組中表達量發(fā)生變化,不適宜作為鋁脅迫分析的內(nèi)參基因(圖1-B、表1)?;谵D(zhuǎn)錄組測序數(shù)據(jù)的候選內(nèi)參基因的表達穩(wěn)定性尚不確定,需要后續(xù)結(jié)合實時熒光相對定量PCR分析、基因表達穩(wěn)定性分析及相對表達量分析等方法進行評價。
表1 油菜候選內(nèi)參基因與擬南芥同源基因的蛋白質(zhì)序列比對分析Tab.1 Alignment analysis of the protein sequences of rape candidate reference genes and Arabidopsis thaliana homologous genes
提取的總RNA進行瓊脂糖凝膠電泳和紫外分光光度檢測,6個試驗組共18個樣品的大片段28S rRNA和18S rRNA條帶明亮清晰,泳道無彌散區(qū),加樣孔無基因組及蛋白質(zhì)雜質(zhì)殘留(圖2),樣品濃度在183.9~462.7 ng/μL,OD260/280均值在1.92~2.06,OD260/230均值在1.89~1.96,提取的樣品RNA完整性好,質(zhì)量較好,可用于后續(xù)分析。
SYBR?Green I嵌合熒光實時定量PCR分析表明,各候選內(nèi)參基因擴增子(Amplicon)的擴增曲線清晰可辨認(圖3),其所有PCR復(fù)孔(包括每個樣品的3個技術(shù)性重復(fù),n=54)擴增曲線重復(fù)性高,未出現(xiàn)平臺期明顯降低的引物二聚體擴增曲線。在三步法循環(huán)反應(yīng)完成后,進行熔解曲線分析。熔解曲線分析是一種簡單、直接地檢查反應(yīng)中引物二聚體和擴增子的方法。其原理是核酸的熔解溫度(Tm)受堿基對數(shù)目、GC堿基含量以及堿基錯配等因素影響,因此,可根據(jù)熔解特性區(qū)分擴增產(chǎn)物。熔解曲線分析能夠確保反應(yīng)的特異性,可以替代擴增產(chǎn)物的凝膠電泳檢測步驟。熔解曲線(圖3、表2)分析表明,各候選內(nèi)參基因所有PCR復(fù)孔(n=54)的擴增產(chǎn)物熔解曲線均為顯著的尖銳單一熔解峰,峰的Tm值大于80 ℃,且起峰到落峰溫度跨度不高于7 ℃,表明引物特異性高,擴增產(chǎn)物中未出現(xiàn)非特異性擴增子及引物二聚體,實時熒光相對定量PCR的結(jié)果可用于后續(xù)分析。
表2 擴增子的熔解溫度與擴增效率Tab.2 Tm and amplification efficiency of amplicons
在完成高質(zhì)量的實時熒光PCR后,需要運用合適的程序[26-28]對原始熒光值(Raw fluorescence)或閾值循環(huán)(Threshold cycle,Ct)數(shù)據(jù)進行正確分析。程序LinRegPCR[29-30](Version 2020.0.0.3,下載地址https://www.genetargetsolutions.com.au/qpcr/linregpcr-and-factor-qpcr),將每個PCR反應(yīng)孔(包括技術(shù)性重復(fù)的復(fù)孔)在第1~40個循環(huán)擴增的熒光信號實時檢測絕對值(Non-baseline corrected data)經(jīng)對數(shù)log10(x)轉(zhuǎn)換,通過線性回歸分析計算線性區(qū)段(擴增曲線指數(shù)期)的斜率,能夠準確獲得每個反應(yīng)孔的具體擴增效率(E)。LinRegPCR分析表明,各候選內(nèi)參基因的所有PCR復(fù)孔(n=54)的擴增線性區(qū)段的相關(guān)系數(shù)r值為0.997 42~0.999 67,表明該區(qū)段的循環(huán)數(shù)與對數(shù)轉(zhuǎn)換后的熒光信號值之間的線性相關(guān)程度高。各候選內(nèi)參基因擴增子的擴增效率為87.3%~92.1%(表2)。
采用常用的比較基因表達變化及穩(wěn)定性的geNorm、NormFinder和BestKeeper等3種Microsoft Excel 2003 宏或加載項對候選內(nèi)參基因進行表達穩(wěn)定性分析。因算法差異,各候選內(nèi)參基因在3個軟件中的排序略有差異,對各候選內(nèi)參基因的3種排序值進行幾何平均值(Geometric mean)運算后進行綜合排名,優(yōu)先選擇綜合排名靠前的候選內(nèi)參基因,其中表達穩(wěn)定性綜合排名前兩位的候選內(nèi)參基因分別是SAP5和UXS3(表3)。
表3 候選內(nèi)參基因表達穩(wěn)定性分析Tab.3 Expression stability analysis of candidate reference genes
表4 樣品組候選內(nèi)參基因相對表達量Tab.4 Relative expression of candidate reference genes in sample group
實時熒光PCR的相對定量數(shù)據(jù)分析方法主要有2-ΔΔCt法[34]、雙標準曲線法[35]、線性回歸分析法等。相對定量2-ΔΔCt法不需要計算擴增效率,但需要對試驗條件進行嚴格優(yōu)化,使目標基因和內(nèi)參基因的擴增效率接近100%且偏差在5%以內(nèi)。由于實際擴增效率會不同于理想擴增效率(100%),為了保證結(jié)果的準確性,需要檢測引物對的擴增效率。線性回歸分析法采用的數(shù)據(jù)全部來自指數(shù)期,計算得到的理論擴增效率會低于真實值,可能會引入一定的誤差[36],但是相對定量數(shù)據(jù)分析的最終數(shù)據(jù)處理是目的基因和內(nèi)參基因的相對表達量比率,可以抵消一部分試驗誤差。本研究采用LinRegPCR線性回歸分析法作為實時熒光PCR擴增效率分析的方法。與雙標準曲線法相比,LinRegPCR法可以進行自動化分析,不需要用穩(wěn)定的標準品構(gòu)建多條標準曲線,分析效率高。
新內(nèi)參基因的發(fā)掘需要綜合衡量基因表達穩(wěn)定性及相對表達量分析的結(jié)果。持家基因細胞骨架結(jié)構(gòu)蛋白Actin基因家族成員屬于傳統(tǒng)的內(nèi)參基因,在多個物種及重金屬脅迫條件下能夠穩(wěn)定表達[37-38]。本研究通過基因表達穩(wěn)定性及相對表達量分析,同樣證實Actin基因家族成員Actin7在甘藍型油菜受到鋁脅迫時能夠穩(wěn)定表達,可以作為內(nèi)參基因。在基因表達穩(wěn)定性分析中,UBC9的綜合排名高于Actin7,但是基因相對表達量分析表明樣品組UBC9的相對表達量上調(diào)極顯著,不適宜選作內(nèi)參基因。此外,Actin7和新發(fā)掘的內(nèi)參基因ARFA1E、SAP5、UXS3分別屬于4類不同的生物學功能范疇,受到共調(diào)控的可能性低,針對它們開發(fā)的4對新內(nèi)參基因引物可以提高鋁脅迫試驗體系實時熒光PCR試驗的準確性,為甘藍型油菜遺傳學研究和分子育種研究提供更多種類的內(nèi)參基因資源。
基因表達的穩(wěn)定性是相對的,例如組織器官、發(fā)育階段等因素可能會引起基因的特異性表達,但特定試驗系統(tǒng)都存在著相對穩(wěn)定表達的特定基因[10],因此,需要根據(jù)具體的樣品類型,通過系統(tǒng)的試驗及分析,確定候選的功能基因作為內(nèi)參基因的適用性。Actin7、ARFA1E、SAP5、UXS3在耐鋁性差異顯著的2個甘藍型油菜品種的對照組和處理組中均穩(wěn)定表達,暗示這些基因沒有參與鋁毒害的根部響應(yīng)過程,這些試驗結(jié)果為這些基因在該試驗體系的內(nèi)參基因適用性提供了科學依據(jù),表明這些基因可以作為不同甘藍型油菜品種根組織鋁脅迫條件下的內(nèi)參基因。這些基因在根部和地上部(莖、葉、花、角果)的時空表達調(diào)控特性以及作為地上部內(nèi)參基因的適用性,需要后續(xù)試驗數(shù)據(jù)的分析和驗證。
綜上所述,本研究根據(jù)候選內(nèi)參基因序列開發(fā)的4對新內(nèi)參基因引物特異性高,在鋁脅迫試驗體系的實時熒光PCR試驗中有效實用。新發(fā)掘的4個內(nèi)參基因在2個鋁脅迫耐受差異性品種苗期根組織的未處理組(0 h)和鋁脅迫(100 μmol/L AlCl3,pH值 4.5)的2個時間梯度(3,24 h)處理組中均穩(wěn)定表達,按表達穩(wěn)定性綜合排名由高至低排序依次為UXS3、SAP5、ARFA1E、Actin7,其中最優(yōu)組合為SAP5和UXS3。