張曉華,孫達鋒,,劉紹雄,,李建英,李雪松,岳萬松,高章會,華 蓉**
(1.中華全國供銷合作總社昆明食用菌研究所,云南 昆明 650221;2.云南省食用菌產(chǎn)業(yè)發(fā)展研究院,云南 昆明 650221)
研究基因表達差異對于了解基因功能和調(diào)控機制具有重要作用[1]。隨著組學技術的快速發(fā)展和日益完善,可通過研究同種食(藥) 用菌不同菌株、同一菌株不同發(fā)育階段或不同培養(yǎng)條件下的基因表達差異,篩選與生物學性狀及表型差異相關的功能基因,最終幫助我們了解食(藥) 用菌生長發(fā)育過程中相關基因的調(diào)控機制,以便為食(藥) 用菌遺傳育種工作的開展提供指導。目前基因表達量測定的方法有Northern 印跡法、微陣列法、基因表達連續(xù)分析法(SAGE)、實時熒光定量PCR (RT-qPCR)等[2]。其中RT-qPCR 由于具有操作簡單、靈敏度高、特異性強、重復性好、分析結(jié)果準確等優(yōu)勢,已普遍用于基因表達分析[1]。
RT-qPCR 的結(jié)果易受RNA 質(zhì)量、逆轉(zhuǎn)錄效率、引物特異性、轉(zhuǎn)錄物標準化等多種技術因素的影響。為消除這些因素帶來的試驗誤差,通常需要引入合適的內(nèi)參基因,以便對目的基因的表達量進行校正。QIAN 等[3]的研究結(jié)果顯示,在用RT-qPCR 分析目標基因表達差異時,如果選用了不合適的內(nèi)參基因,可能會得到不可靠甚至錯誤的結(jié)論。因此,合適的內(nèi)參基因?qū)Χ糠治鼋Y(jié)果的準確性尤其重要。內(nèi)參基因通常是維持細胞基本功能的組成型表達基因,理論上,其表達水平在所有樣品中應該是恒定的[4];但事實上并沒有適用于所有物種的內(nèi)參基因,同一物種在不同的發(fā)育階段、不同菌株之間以及同一菌株在不同試驗條件下,最適內(nèi)參基因也不相同。例如關于草菇(Volvariella volvacea) 的研究表明,在寒冷和高溫脅迫下,MSF1 基因表達較穩(wěn)定;在Na-Cl 和CuSO4脅迫下,UBQ 基因表達最為穩(wěn)定;而在酸脅迫中MAPK 基因的穩(wěn)定性最好[3]。關于靈芝(Ganoderma lucidum) 的試驗結(jié)果也顯示,在短時間的茉莉酸甲酯、水楊酸和過氧化氫處理下,Actin 和UCE2 基因的穩(wěn)定性較好;但在長時間的茉莉酸甲酯、水楊酸和過氧化氫處理下,這2 個基因的穩(wěn)定性卻最差[5]。因此,同一菌株使用相同的培養(yǎng)基,在不同的試驗條件下最適內(nèi)參基因也各不相同。此外,在黑木耳(Auricularia heimuer) 中進行了最適內(nèi)參基因的研究,結(jié)果顯示18S rRNA、β-TUB、EF1-α和28S rRNA 在不同菌株間表現(xiàn)出較好的穩(wěn)定性,而APRTase、18S rRNA 和28S rRNA 適合作為研究不同發(fā)育階段基因表達差異的內(nèi)參基因[6]。以上研究表明,在使用RT-qPCR 開展食(藥) 用菌基因表達分析前,根據(jù)不同的試驗條件和物種選擇合適的內(nèi)參基因十分必要。
近年來,隨著食(藥) 用菌基因組和轉(zhuǎn)錄組數(shù)據(jù)在各大數(shù)據(jù)庫的相繼公布,越來越多的候選功能基因亟需進行基因表達差異分析,這使得RT-qPCR技術廣受歡迎,各食(藥) 用菌中能穩(wěn)定表達的內(nèi)參基因的篩選也受到了許多研究者的關注。食(藥)用菌研究中常見的內(nèi)參基因詳見表1。
表1 食(藥) 用菌中常見的內(nèi)參基因Tab.1 The internal reference gene in common edible and medicinal fungi
如表1 所示,在這些研究中所用的內(nèi)參基因大部分是從植物或動物中借鑒,大量證據(jù)表明在動植物中穩(wěn)定表達的18S rRNA、Actin、GAPDH 等傳統(tǒng)內(nèi)參基因在食(藥) 用菌中并不穩(wěn)定[10]。比如在草菇[3]、靈芝[7,16]、毛木耳[12]等食(藥) 用菌中18S rRNA 是最不穩(wěn)定的內(nèi)參基因,但在許多食(藥) 用菌的內(nèi)參基因篩選中還是將這些基因作為研究對象。
隨著大部分食(藥) 用菌轉(zhuǎn)錄組測序工作的逐步完成,許多穩(wěn)定性較好的新內(nèi)參基因被篩選,詳見表2。
表2 基于轉(zhuǎn)錄組數(shù)據(jù)篩選的候選內(nèi)參基因Tab.2 Screening candidate reference gene sets based on transcriptome data
如表2 所示,相比于從動植物研究中借鑒的傳統(tǒng)內(nèi)參基因,從轉(zhuǎn)錄組數(shù)據(jù)中篩選得到的候選內(nèi)參基因的穩(wěn)定性更高,更適合用于RT-qPCR 數(shù)據(jù)的校正和標準化。
目前食(藥) 用菌內(nèi)參基因篩選的試驗方案與動植物的研究類似,首先是根據(jù)基因表達分析的試驗設計收集樣品,對樣品進行RNA 提取和cDNA 的合成;其次是候選內(nèi)參基因的選擇及引物設計,然后進行RT-qPCR 試驗;再使用geNorm、NormFinder、BestKeeper、RefFinder 等軟件對試驗結(jié)果進行評價,最終篩選出最合適的內(nèi)參基因。
植物內(nèi)參基因的篩選已經(jīng)有大量的報道,食(藥) 用菌中相關的工作也在逐步開展[20-21]。隨著靈芝[5]、平菇[17]、草菇[3]、蛹蟲草[11]等的研究,表明在食(藥) 用菌中通用的內(nèi)參基因并不存在,都需要在基因表達分析前先進行內(nèi)參基因的篩選。SONG 等[13]在竹黃菌內(nèi)參基因篩選的研究中,選擇了11 個在其他物種中常用的內(nèi)參基因作為候選基因集,結(jié)果表明UBI、VAC 和TFC 3 個內(nèi)參基因的穩(wěn)定性較好。ZHANG 等[14]根據(jù)竹黃菌的轉(zhuǎn)錄組數(shù)據(jù),以SONG 等確定的3 個穩(wěn)定性好的內(nèi)參基因(UBI、VAC 和TFC) 和9 個新基因組成候選內(nèi)參基因集,對12 個候選內(nèi)參基因開展了篩選工作,結(jié)果顯示穩(wěn)定性排名前7 的均是基于轉(zhuǎn)錄組數(shù)據(jù)篩選出的候選內(nèi)參基因,而UBI、VAC 和TFC 的排名則相對靠后。竹黃菌內(nèi)參基因的篩選結(jié)果說明,用于篩選的候選內(nèi)參基因集不同,篩選到的最佳內(nèi)參基因也不相同。這就提示我們,合適的候選內(nèi)參基因集是內(nèi)參基因篩選的重要前提,若候選內(nèi)參基因集不合適,可能導致篩選到的內(nèi)參基因并非最優(yōu),甚至需要額外使用更多的內(nèi)參基因進行基因表達分析。以往在食(藥)用菌最適內(nèi)參基因的篩選研究中,候選內(nèi)參基因集通常是選擇在動物、植物中具有一定代表性的內(nèi)參基因,遺憾的是這些內(nèi)參基因在食(藥) 用菌中的穩(wěn)定性并不一致。對目前食(藥) 用菌內(nèi)參篩選工作中常見內(nèi)參基因的研究次數(shù)和研究結(jié)果進行了梳理,統(tǒng)計結(jié)果詳見圖1、圖2。
圖1 研究次數(shù)較多的常見內(nèi)參基因Fig.1 Common internal reference genes that have been studied more frequently
圖2 使用頻率較高的理想內(nèi)參基因Fig.2 Ideal reference gene with higher frequency of use
如圖1、圖2 所示,ACT1、β-TUB、GAPDH、18S rRNA、UBQ、TUB-1a、EF1-α 在食(藥) 用菌內(nèi)參基因篩選中作為候選內(nèi)參基因次數(shù)最多,同時也是被選擇作為理想內(nèi)參基因頻率最高的常見內(nèi)參基因。
目前,在草菇、平菇、羊肚菌等研究中已經(jīng)成功將轉(zhuǎn)錄組數(shù)據(jù)運用到候選內(nèi)參基因集的選擇中[3,17-18]。在這些研究中,候選內(nèi)參基因集通常由數(shù)個依據(jù)轉(zhuǎn)錄組數(shù)據(jù)得到的穩(wěn)定性較高的新內(nèi)參基因和幾個傳統(tǒng)的內(nèi)參基因組成。在羊肚菌的研究中發(fā)現(xiàn),雖然候選內(nèi)參基因集中包含轉(zhuǎn)錄組數(shù)據(jù)篩選到的新內(nèi)參基因,但傳統(tǒng)內(nèi)參基因Actin 表現(xiàn)出較好的穩(wěn)定性[18]。ELENA 等[22]在平菇內(nèi)參基因篩選時,選擇了RAUL 等[17,23]在另外2 項研究中認為較為穩(wěn)定的內(nèi)參基因作為候選內(nèi)參基因。這說明在選擇候選內(nèi)參基因時,若研究的物種已經(jīng)開展過相關研究,可以將前人篩選出的穩(wěn)定性較好的內(nèi)參基因加入候選基因集中進行篩選驗證。同時,若研究物種缺乏相關的轉(zhuǎn)錄組數(shù)據(jù),也可以選擇目前在食(藥) 用菌中研究次數(shù)較多且穩(wěn)定性相對較好的傳統(tǒng)內(nèi)參基因作為候選基因。綜上所述,候選內(nèi)參基因的選擇最好是基于轉(zhuǎn)錄組數(shù)據(jù)進行分析及挖掘,同時可以根據(jù)研究物種和特定的試驗條件引入部分傳統(tǒng)的內(nèi)參基因。
目前常用的分析軟件有geNorm、NormFinder 和BestKeeper。
geNorm 是在實時熒光定量PCR 中,用于內(nèi)參基因篩選和最佳內(nèi)參基因數(shù)目分析的軟件。該軟件對候選內(nèi)參基因的數(shù)目和試驗條件無任何限制,最終從候選內(nèi)參基因集中挑選出至少2 個最優(yōu)內(nèi)參基因用于數(shù)據(jù)的校準,可使相對定量的結(jié)果更為準確[24]。RTqPCR 試驗中得到的原始Ct 值要轉(zhuǎn)換為相對定量數(shù)據(jù)才能輸入到geNorm 軟件中進行分析。首先找到每一個候選內(nèi)參基因在所有樣品中的最小Ct 值,然后用其他樣品的Ct 值減去最低Ct 值,此時得到的值就是△Ct 值(該值≥0)。最后計算每個樣品的2-△Ct值,將該值輸入geNorm 軟件,通過計算每個候選內(nèi)參基因在不同樣品中的平均變異值M (average pairwise variation),最終呈現(xiàn)出候選內(nèi)參基因集穩(wěn)定性排名的折線圖和最佳內(nèi)參基因數(shù)目,從而篩選出穩(wěn)定性較好的內(nèi)參基因組合[24]。判定標準為M 值小于1.5 即可作為內(nèi)參基因,且M 值越低代表內(nèi)參基因的穩(wěn)定性越好;反之,則表明其穩(wěn)定性較差[15]。有報道認為當M 值≤0.2 時,代表該候選內(nèi)參基因具有較高的穩(wěn)定性[9]。
NormFinder 也是用于候選內(nèi)參基因穩(wěn)定性篩選的軟件,數(shù)據(jù)處理及判定標準和geNorm 相同。表達穩(wěn)定值越小的內(nèi)參基因穩(wěn)定性越高,最終根據(jù)表達穩(wěn)定值的大小單獨顯示出最穩(wěn)定的內(nèi)參基因。NormFinder 程序既可以比較候選內(nèi)參基因的表達差異,同時也能計算樣品組間的變異,但該程序最終只呈現(xiàn)一個最佳的內(nèi)參基因[24]。
BestKeeper 是一款基于Excel 分析內(nèi)參基因和靶基因表達量的分析工具。與geNorm 和NormFinder所不同的是,BestKeeper 是直接使用不同樣本RTqPCR 試驗中得到的原始Ct 值進行分析,根據(jù)Ct 值得到標準差(SD) 和變異系數(shù)(CV)。SD 值和CV值越小,則該內(nèi)參基因的穩(wěn)定性越好;若SD>1 則表明該內(nèi)參基因不穩(wěn)定,最好不用于基因表達量分析,據(jù)此對每個候選內(nèi)參基因的表達穩(wěn)定性進行評估[25]。
RefFinder 是一款集成了geNorm、NormFinde 和BestKeeper 3 個主要內(nèi)參基因篩選軟件的綜合分析工具,根據(jù)每個軟件對內(nèi)參基因的排名,給每個候選內(nèi)參基因的穩(wěn)定性賦予一個適當?shù)臋?quán)重,并計算出權(quán)重的幾何平均值,最終給出候選內(nèi)參基因集的總排名[15]。以geNorm 軟件進行分析,發(fā)現(xiàn)在黑木耳不同菌株間28S rRNA 表達最穩(wěn)定,但以BestKeeper 和NormFinder 軟件進行分析的結(jié)果卻顯示該基因表現(xiàn)一般,這種情況在香菇[8]、靈芝[7]等食(藥) 用菌的研究中均存在。而在草菇[3]和竹黃菌[13]中的研究表明,使用geNorm 和NormFinder 分析內(nèi)參基因穩(wěn)定性時往往能得出相同的結(jié)論,但BestKeeper 軟件的分析結(jié)果則與這2 個軟件有一定的出入,在植物內(nèi)參基因篩選研究中也出現(xiàn)過類似的現(xiàn)象[26-27]。這可能是因為BestKeeper 依賴于候選參考基因的標準差來評估其穩(wěn)定性,而geNorm 和NormFinder 則根據(jù)基因的累積標準差和成對穩(wěn)定性來評估內(nèi)參基因。由于每種軟件的算法不同,使用不同的軟件進行分析時內(nèi)參基因的穩(wěn)定性排名會有細微差異,因此有必要先使用多種分析軟件對RT-qPCR 結(jié)果進行分析,再通過RefFinder 軟件對分析結(jié)果進行綜合排名,最終篩選出最佳的內(nèi)參基因[3,14]。
在確定內(nèi)參基因時,首先需要使用geNorm 軟件,根據(jù)平均成對變異值(V) 的比值確定最佳內(nèi)參基因的數(shù)量,當Vn/Vn+1值<0.15 時,表明最佳內(nèi)參基因的數(shù)量是n 個,當Vn/Vn+1值>0.15 時,則表明最佳內(nèi)參基因的數(shù)量是n+1 個[24]。在草菇的研究中指出Vn/Vn+1的比值不應該是嚴格的0.15,經(jīng)geNorm軟件分析顯示最佳內(nèi)參基因的數(shù)量是2,研究者分別選擇了SPRYp+UBQ (穩(wěn)定性排名前二)、SPRYp+UBQ+TUBα (穩(wěn)定性排名前三) 和SPRYp+UBQ+TUBα+28S rRNA (穩(wěn)定性排名前三的基因加最不穩(wěn)定的28S rRNA 基因) 作為內(nèi)參基因,對G6PDH 基因的表達量進行了分析,結(jié)果表明只要按照geNorm軟件分析出的最佳內(nèi)參基因數(shù)量選擇內(nèi)參基因,即使額外的內(nèi)參基因的穩(wěn)定性較差也不會影響目標基因表達量的分析結(jié)果[3]。在其他研究中也提出使用2個最優(yōu)的內(nèi)參基因組合對RT-qPCR 的結(jié)果進行校正和標準化是可靠的,但使用geNorm 軟件可能會給出1 個較為客觀的最佳內(nèi)參基因數(shù)量,使基因表達分析的結(jié)果更加精確。此外,許多食(藥) 用菌的研究結(jié)果表明,僅使用1 個內(nèi)參基因?qū)Π谢虻谋磉_量進行分析是不夠的,需要根據(jù)候選內(nèi)參基因的排名情況,結(jié)合軟件推薦的最佳內(nèi)參基因數(shù)量,選擇2 個及以上的內(nèi)參基因?qū)T-qPCR 結(jié)果進行校正,以保證分析結(jié)果的可靠性。
挑選出特定試驗條件下某物種中穩(wěn)定表達的內(nèi)參基因,可以對靶基因的RT-qPCR 試驗數(shù)據(jù)進行校正。在毛木耳內(nèi)參基因篩選的試驗中,為了進一步驗證篩選結(jié)果,研究人員分別以軟件分析得出的最佳基因組合(PP2A+UBQ) 和穩(wěn)定性最差的基因18S rRNA 為內(nèi)參基因,對靶基因LAC 的相對表達量進行了分析驗證,結(jié)果顯示使用穩(wěn)定性不同的內(nèi)參基因?qū)Π谢蜻M行差異分析時,其結(jié)果差異顯著[12]。在香菇[8]、草菇[3]、平菇[9]、靈芝[5]、杏鮑菇(Pleurotus eryngii)[28]、金針菇(Flammulina velutipes)[29]等研究中也出現(xiàn)了類似的現(xiàn)象。通過對不同的歸一化策略進行測試,證明使用未驗證的內(nèi)參基因?qū)TqPCR 數(shù)據(jù)進行歸一化,可能會得到不準確的結(jié)論,從而對基因表達背后的生物現(xiàn)象造成誤解。因此,在特定的試驗條件下,篩選出穩(wěn)定的內(nèi)參基因是獲得可信的基因表達數(shù)據(jù)的前提。
由于RT-qPCR 技術在基因表達分析中的諸多優(yōu)點,目前已成為許多研究者開展食(藥) 用菌基因表達分析的主要技術。其中,根據(jù)試驗目的篩選出在特定條件下穩(wěn)定表達的內(nèi)參基因尤為重要。通過對食(藥) 用菌內(nèi)參基因篩選研究進展進行整理,總結(jié)出以下幾點建議。
1) 建議根據(jù)所研究物種的轉(zhuǎn)錄組或表達譜數(shù)據(jù)來選擇候選內(nèi)參基因,以便能粗略估計候選內(nèi)參基因的表達量和穩(wěn)定性。
2) 若所研究的物種已經(jīng)有篩選內(nèi)參基因的相關報道,可將報道中穩(wěn)定性較好的內(nèi)參基因作為候選基因,但不建議直接作為內(nèi)參基因用于RT-qPCR數(shù)據(jù)分析,仍然需要根據(jù)即將開展的試驗對候選基因進行篩選和驗證。
3) 若缺乏轉(zhuǎn)錄組數(shù)據(jù),也可選擇目前在食(藥) 用菌中研究次數(shù)較多且穩(wěn)定性相對較好的傳統(tǒng)內(nèi)參基因作為開展內(nèi)參篩選研究的候選基因。
4) 建議選擇多種算法對候選基因進行分析排名。真正穩(wěn)定性好的基因在所有算法中均趨于穩(wěn)定,而穩(wěn)定性較差的基因在不同軟件中的排名會有很大波動。
5) 使用geNorm 軟件分析可以確定最佳內(nèi)參基因的數(shù)量,進而使用多個合適的內(nèi)參基因?qū)TqPCR 的數(shù)據(jù)進行歸一化,從而保證靶基因表達分析的結(jié)果更加可靠。
6) 在即將開展的試驗條件下,對候選內(nèi)參基因進行驗證分析,才能獲得準確的試驗結(jié)果,最終揭示基因差異表達背后所代表的生物學意義。