丁 蕾 ,高彩霞 ,劉兆遠(yuǎn) ,陳 磊
1.上海交通大學(xué)基礎(chǔ)醫(yī)學(xué)院免疫學(xué)與微生物學(xué)系,上海 200025;2.上海交通大學(xué)醫(yī)學(xué)院,上海市免疫學(xué)研究所,上海 200025
伴隨著高通量測(cè)序技術(shù)的迅猛發(fā)展和測(cè)序成本的降低,轉(zhuǎn)錄組測(cè)序借助其靈敏度高、檢測(cè)范圍廣、提供轉(zhuǎn)錄組信息全面等獨(dú)特的優(yōu)勢(shì)在轉(zhuǎn)錄組學(xué)研究領(lǐng)域逐漸占據(jù)主導(dǎo)地位[1],是目前深入研究轉(zhuǎn)錄組復(fù)雜性的強(qiáng)大工具。
針對(duì)轉(zhuǎn)錄組測(cè)序的生物信息學(xué)分析主要包括以下幾個(gè)步驟:數(shù)據(jù)質(zhì)量控制、序列比對(duì)和基因表達(dá)分析。其中數(shù)據(jù)質(zhì)量控制主要包括評(píng)估建庫(kù)試劑在實(shí)驗(yàn)中捕獲轉(zhuǎn)錄本的能力和所測(cè)序列在基因覆蓋度的均勻性。基因表達(dá)分析主要包括差異表達(dá)基因的鑒定和差異表達(dá)基因富集分析,如KEGG(Kyoto encyclopedia of genes and genomes)通路富集分析,這是轉(zhuǎn)錄組測(cè)序最重要的分析結(jié)果?;虮磉_(dá)分析結(jié)果可用于更深入的研究,包括轉(zhuǎn)錄本結(jié)構(gòu)研究(如基因的可變剪切)、轉(zhuǎn)錄本變異研究(如基因融合、單核苷酸突變)、差異基因表達(dá)水平的比較,甚至包括全新轉(zhuǎn)錄本或稀有轉(zhuǎn)錄本的發(fā)現(xiàn)[2]。尤其對(duì)于如腫瘤干細(xì)胞等來(lái)源極為有限的生物樣品,轉(zhuǎn)錄組測(cè)序技術(shù)的優(yōu)勢(shì)明顯[3],要求的起始樣品量要比芯片技術(shù)少得多且技術(shù)重復(fù)性好。SMART(switching mechanism at 5′ end of RNA template)技術(shù)經(jīng)優(yōu)化后,選擇使用鎖核酸(locked nucleic acid,LNA)、更高濃度的氯化鎂以及甜菜堿的新方案,使得起始僅使用1~1 000個(gè)細(xì)胞或10 pg~10 ng的總RNA就可獲得高質(zhì)量的測(cè)序文庫(kù),而且還使得序列在基因的覆蓋度上獲得很大改善[4],能夠更好地實(shí)現(xiàn)單核苷酸變異等的檢測(cè)?;谠摷夹g(shù)的商業(yè)化試劑盒有多種,均價(jià)格昂貴,其中普遍使用的是TaKaRa Bio公司名為SMART-Seq v4 Ultra Low Input RNA Kit的試劑盒(下文簡(jiǎn)稱為T(mén)aKaRa試劑)。本研究利用SMART技術(shù)自制相對(duì)價(jià)格更低的建庫(kù)試劑(下文簡(jiǎn)稱為DIY試劑)用于少量細(xì)胞輸入的轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建實(shí)驗(yàn),并通過(guò)生物信息學(xué)分析,從多個(gè)方面比較DIY試劑和TaKaRa試劑對(duì)轉(zhuǎn)錄組測(cè)序結(jié)果的影響,從而驗(yàn)證用DIY試劑替代TaKaRa試劑的可行性,以降低轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建的成本。
1.1.1 實(shí)驗(yàn)細(xì)胞和動(dòng)物 小鼠腹腔巨噬細(xì)胞,分別來(lái)自于4只8周齡雌性SPF級(jí)C57BL/6小鼠。小鼠飼養(yǎng)于上海交通大學(xué)醫(yī)學(xué)院實(shí)驗(yàn)動(dòng)物科學(xué)部屏障環(huán)境內(nèi)。生產(chǎn)許可證號(hào)為SCXK(滬)2018-0007,使用許可證號(hào)為SYXK(滬)2018-0027。
1.1.2 主要試劑 TaKaRa試劑:SMART-Seq v4 Ultra Low Input RNA Kit,購(gòu)于TaKaRa Bio公司。DIY試劑:不含鈣、鎂的磷酸緩沖液DPBS(Dulbecco′s phosphate buffered saline),1×TrypLE Express 酶(無(wú)酚紅),購(gòu)于Gibco公司;RNaseZap,購(gòu)于Ambion公司;DNA去除試劑(DNAOFF),購(gòu)于TaKaRa Bio公司;2′-脫氧核苷酸-5′-三磷酸混合物(10 mmol/L dNTP mix),購(gòu) 于Fermentas公 司;5×First-strand Buffer(250 mmol/L Tris-HCl,pH 8.3,室溫;375 mmol/L 氯化鉀;15 mmol/L 氯化鎂;二硫蘇糖醇)、Superscript Ⅱ Reverse Transcriptase,購(gòu)于Invitrogen公司;重組RNase 抑制劑,購(gòu)于Clonetech公司;甜菜堿、氯化鎂(無(wú)水),購(gòu)于Sigma-Aldrich公司。其他試劑:蒸餾水,購(gòu)于Gibco公司;2×KAPA HiFi HotStart ReadyMix,購(gòu)于KAPA Biosystems公司;Agencourt Ampure XP beads,購(gòu)于Beckman Coulter公司;溴化乙錠(ethidium bromide,EB,10 mmol/L Tris-HCl,pH 8.5),購(gòu)于Qiagen公司;雙端測(cè)序TruSeq Dual-index Sequencing Primer試劑盒、Nextera XT DNA Sample Preparation試劑盒、Nextera XT 24-index試劑盒、Adapter oligos,購(gòu)于Illumina公司;99.5%乙醇,購(gòu)于Sigma-Aldrich公司;TRIzol 試劑、Glycoblue,購(gòu)于Invitrogen公司;氯仿、異丙醇,購(gòu)于國(guó)藥試劑公司;4%巰基乙酸鹽肉湯,購(gòu)于BD公司。
1.1.3 主要儀器 Agilent 2100 生物分析儀系統(tǒng),購(gòu)于安捷倫科技有限公司;Illumina NextSeq 500儀器,購(gòu)于Illumina公司;移液槍、低溫超速離心機(jī)、高速臺(tái)式離心機(jī),購(gòu)于Eppendorf公司;EasyCycler 96 PCR儀,購(gòu)于Analytik Jena AG公司。
1.1.4 主要軟件 使用基于JAVA 8 的FastQC 0.11.9對(duì)高通量測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估;使用基于Python 3.7 的RSeQC 3.0.1 評(píng)估高通量測(cè)序尤其是轉(zhuǎn)錄組測(cè)序數(shù)據(jù)的覆蓋均勻性;使用基于C++ 的fastp 0.20.0對(duì)原始測(cè)序數(shù)據(jù)進(jìn)行隨機(jī)抽樣等操作;使用HISAT2 (hierarchical indexing for spliced alignment of transcripts 2) 2.1.0進(jìn)行有參考基因組的序列比對(duì);使用基于C 語(yǔ)言的SAMtools 1.4處理經(jīng)HISAT2 等軟件比對(duì)后生成的sam/bam 文件;基于Python 3.7 的HTSeq 0.11.3處理高通量測(cè)序數(shù)據(jù);使用基于R 3.6.1的DESeq2、edgeR、ggplot2軟件包進(jìn)行基因差異分析以及數(shù)據(jù)可視化分析等。
1.2.1 腹腔巨噬細(xì)胞的誘導(dǎo) 將4只小鼠隨機(jī)均分為2組,再分別編號(hào)為M1、M2、M3、M4,其中M1、M2號(hào)小鼠作為對(duì)照組不進(jìn)行任何處理,M3、M4號(hào)小鼠作為實(shí)驗(yàn)組向其腹腔內(nèi)注射1 mL濃度為4%的巰基乙酸鹽肉湯以誘導(dǎo)巨噬細(xì)胞[5]。經(jīng)72 h后,利用流式細(xì)胞分選技術(shù)分離腹腔巨噬細(xì)胞。
1.2.2 腹腔巨噬細(xì)胞RNA的提取 腹腔巨噬細(xì)胞離心5 min,4 ℃,500×g;向每個(gè)樣品中加入500 μL TRIzol,混合均勻,室溫孵育5 min;置于-80 ℃至少1 h;向每個(gè)樣品中添加適量的氯仿(TRIzol與氯仿的體積比為5:1),劇烈搖動(dòng)約15 s,室溫孵育2~3 min;離心15 min,4 ℃,12 000×g;將水相轉(zhuǎn)移至新管中(TRIzol與氯仿的體積比為2:1),此后在冰上工作;向每個(gè)樣品中添加1 μL共沉淀劑GlycoBlue;在每個(gè)樣品中加入適量的異丙醇(TRIzol與異丙醇的體積比為2:1),混合均勻,-80 ℃孵育1 h以上;離心20 min,4 ℃,12 000×g;用適量的75%預(yù)冷過(guò)的乙醇洗滌(TRIzol與異丙醇的體積比為1:1);離心15 min,4 ℃,7 400×g,風(fēng)干以盡可能地除去乙醇;在12.5~15.0 μL無(wú)核酸酶的水中將每個(gè)RNA沉淀重懸;室溫孵育2~3 min,充分混合并置于冰上;使用Qubit儀器定量RNA;保存RNA于-80℃條件下。
1.2.3 cDNA的構(gòu)建及二代測(cè)序 將編號(hào)為M2和M3的小鼠的腹腔巨噬細(xì)胞提取的RNA各均分成2份,用DIY試劑和TaKaRa試劑分別進(jìn)行cDNA的構(gòu)建,所得4個(gè)樣品的編號(hào)為C_M2_DIY、C_M2_TaKaRa、T_M3_DIY和T_M3_TaKaRa(C,對(duì)照組;T,實(shí)驗(yàn)組)。另外,從編號(hào)為M1和M4的小鼠的腹腔巨噬細(xì)胞提取的RNA皆用DIY試劑進(jìn)行cDNA的構(gòu)建,所得2個(gè)樣品的編號(hào)為C_M1_DIY、T_M4_DIY。使用Agilent 2100 生物分析儀系統(tǒng)對(duì)6個(gè)樣品的cDNA進(jìn)行質(zhì)檢。在完成轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建后,對(duì)上述6個(gè)樣品利用Illumina NextSeq 500平臺(tái)進(jìn)行雙端測(cè)序,測(cè)序模式為2×75 bp。
1.2.4 測(cè)序數(shù)據(jù)質(zhì)量控制和序列比對(duì) 使用FastQC軟件對(duì)測(cè)序數(shù)據(jù)進(jìn)行初步質(zhì)量控制,輸出結(jié)果會(huì)給每個(gè)堿基一個(gè)相應(yīng)的質(zhì)量評(píng)分,用于衡量測(cè)序精確度。一個(gè)給定堿基的測(cè)序質(zhì)量評(píng)分Q定義為:Q=-10×lge,其中e為預(yù)計(jì)堿基檢出不正確的概率。故堿基的質(zhì)量評(píng)分與堿基檢出精確度存在一定關(guān)系,即Q較高表示出錯(cuò)的概率較小。其中,質(zhì)量控制結(jié)果中的重要指標(biāo)Q30(%)代表堿基質(zhì)量評(píng)分≥30的堿基的數(shù)量占全部堿基數(shù)的百分比。一般而言,Q30>85%時(shí),測(cè)序數(shù)據(jù)質(zhì)量合格。使用fastp軟件對(duì)原始的序列文件進(jìn)行隨機(jī)抽樣,使用HISAT2軟件[6]進(jìn)行有參考基因組的序列比對(duì),并使用SAMtools軟件[7]處理比對(duì)結(jié)果,再用HTSeq軟件[8]統(tǒng)計(jì)比對(duì)到參考基因組上基因區(qū)間內(nèi)的讀序數(shù)目,計(jì)算不同測(cè)序數(shù)據(jù)量下可檢測(cè)的轉(zhuǎn)錄本數(shù),比較DIY試劑和TaKaRa試劑捕獲轉(zhuǎn)錄本的能力。使用RSeQC軟件[9]對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量控制,獲得測(cè)序數(shù)據(jù)在基因上的覆蓋均勻性。從數(shù)據(jù)質(zhì)量以及序列比對(duì)的層面探究2種試劑對(duì)轉(zhuǎn)錄組測(cè)序結(jié)果的影響。
1.2.5 基因表達(dá)分析 經(jīng)過(guò)HTSeq軟件完成基因表達(dá)量的計(jì)算后,使用R語(yǔ)言軟件包DESeq2[10]和edgeR[11]進(jìn)行樣品的相似性分析以及實(shí)驗(yàn)組與對(duì)照組之間的差異表達(dá)基因分析[12],選擇符合|log2fold change|>1、P<0.005的基因?yàn)椴町惐磉_(dá)基因,探究2種試劑處理樣品的差異表達(dá)基因鑒定結(jié)果是否一致。log2fold change表示以2為底、基因表達(dá)量差異的對(duì)數(shù),代表實(shí)驗(yàn)組中的基因表達(dá)量與對(duì)照組中的基因表達(dá)量的差異倍數(shù)。若log2fold change的數(shù)值為正,則反映該基因在實(shí)驗(yàn)組中的表達(dá)量比在對(duì)照組中的表達(dá)量高;相反若數(shù)值為負(fù),則反映該基因在實(shí)驗(yàn)組中的表達(dá)量比在對(duì)照組中的表達(dá)量低。
1.2.6 差異表達(dá)基因通路富集分析 使用在線富集分析工具DAVID(database for annotation, visualization, and integrated discovery)6.8[13]對(duì)差異表達(dá)基因進(jìn)行通路富集分析,并使用R語(yǔ)言軟件包ggplot2[14]進(jìn)行可視化分析。通路富集分析方法以通路為單位,以物種已知的全部基因?yàn)楸尘?,通過(guò)Fisher精確檢驗(yàn)來(lái)分析計(jì)算各個(gè)通路基因富集度的顯著性水平,從而確定受到顯著影響的代謝和信號(hào)轉(zhuǎn)導(dǎo)途徑,探究2種試劑處理情況下差異表達(dá)基因通路富集分析的結(jié)果是否一致。以錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)表示富集的顯著性水平。FDR表示以10為底、P值的對(duì)數(shù),F(xiàn)DR數(shù)值越大,代表在統(tǒng)計(jì)學(xué)上該通路的影響或變化越顯著。
6個(gè)樣品的cDNA片段均分布在200~3 000 bp范圍內(nèi),主峰均在1 000 bp左右,cDNA質(zhì)量良好。使用FastQC軟件對(duì)測(cè)序原始數(shù)據(jù)進(jìn)行質(zhì)量控制,結(jié)果如表1所示。Q30均>91%,表明數(shù)據(jù)質(zhì)量良好。經(jīng)HISAT2軟件比對(duì)后,發(fā)現(xiàn)比對(duì)到基因組的序列占比均>90%,捕獲的轉(zhuǎn)錄本數(shù)也基本相近。
表1 樣品基本信息及數(shù)據(jù)質(zhì)量控制Tab 1 Sample basic information and data quality control
在一定范圍內(nèi),轉(zhuǎn)錄組測(cè)序結(jié)果顯示捕獲到的轉(zhuǎn)錄本數(shù)會(huì)隨著測(cè)序數(shù)據(jù)量的增加而增加,并最終趨于飽和。為了比較DIY試劑和TaKaRa試劑捕獲轉(zhuǎn)錄本的能力,使用fastp軟件對(duì)原始的序列文件進(jìn)行隨機(jī)抽樣,獲得具有0.5、1、1.5、2、2.5、3、4、5、6、7 M的序列子集文件,再用HTSeq軟件計(jì)算不同測(cè)序數(shù)據(jù)量下可檢測(cè)的轉(zhuǎn)錄本數(shù)。如圖1所示:可檢測(cè)的轉(zhuǎn)錄本數(shù)隨著測(cè)序數(shù)據(jù)量的增加而增加;測(cè)序數(shù)據(jù)量一定時(shí),對(duì)照組(C_M1_DIY、C_M2_DIY、C_M2_TaKaRa)和 實(shí) 驗(yàn) 組(T_M3_DIY、T_M4_DIY、T_M3_TaKaRa)可檢測(cè)的轉(zhuǎn)錄本數(shù)差異明顯,而不同試劑處理的樣品各自在對(duì)照組(C_M2_DIYvsC_M2_TaKaRa)和實(shí)驗(yàn)組(T_M3_DIYvsT_M3_TaKaRa)內(nèi)無(wú)明顯差異。
圖1 2種試劑捕獲轉(zhuǎn)錄本的能力比較Fig 1 Comparison of the capability in transcripts capture of DIY reagent and TaKaRa reagent
使用RSeQC軟件計(jì)算所測(cè)序列在基因上的覆蓋度,結(jié)果如圖2所示。DIY試劑和TaKaRa試劑處理的樣品基因覆蓋度都較均勻、無(wú)偏差,且兩者的一致性較高。
圖2 2種試劑處理的樣品基因覆蓋度Fig 2 Gene coverage plot of the samples treated with the two reagents
分別使用R軟件的DESeq2包和ggplot2包對(duì)樣品進(jìn)行主成分分析(principal component analysis,PCA)以及可視化分析。圖3清晰地體現(xiàn)了樣品的聚類(lèi)情況,橫坐標(biāo)PC1反映實(shí)驗(yàn)處理導(dǎo)致的樣品間差異,即巰基乙酸鹽肉湯對(duì)腹腔巨噬細(xì)胞持續(xù)72 h的誘導(dǎo)作用,存在91%的差異性;縱坐標(biāo)PC2反映2種試劑導(dǎo)致的樣本間差異,該差異性僅為8%,說(shuō)明DIY試劑和TaKaRa試劑對(duì)樣品的影響遠(yuǎn)小于實(shí)驗(yàn)處理導(dǎo)致的基因表達(dá)譜差異。而且,DIY試劑處理的對(duì)照組樣品(C_M1_DIYvsC_M2_DIY)和實(shí)驗(yàn)組樣品(T_M3_DIYvsT_M4_DIY)的組內(nèi)差異均較小,表示DIY試劑的實(shí)驗(yàn)重復(fù)性好且結(jié)果穩(wěn)定。
圖3 PCA體現(xiàn)的樣品聚類(lèi)情況Fig 3 Sample clustering reflected by PCA
將6個(gè)樣品分為2組:第1組為DIY試劑處理的樣品,包括C_M1_DIY、C_M2_DIY、T_M3_DIY、T_M4_DIY;第2組為T(mén)aKaRa試劑處理的樣品,包括C_M2_TaKaRa和T_M3_TaKaRa。使用edgeR包對(duì)2組數(shù)據(jù)就對(duì)照組和實(shí)驗(yàn)組之間的差異表達(dá)基因進(jìn)行鑒定,最終DIY試劑處理組樣品共有3 877個(gè)差異表達(dá)的基因,TaKaRa試劑處理組樣品共有3 855個(gè)差異表達(dá)的基因,重合的基因數(shù)為2 737個(gè)。結(jié)果如圖4所示,從2組結(jié)果中各取顯著性差異最大的前1 000個(gè)基因(按照P值排序),重合的基因數(shù)有748個(gè),重合率達(dá)75%,并且相同基因在2組數(shù)據(jù)中的|log2fold change|值比較接近。
圖4 2種試劑處理樣品的差異表達(dá)基因鑒定結(jié)果Fig 4 Differential gene expression analysis results of the samples treated with the two reagents
根據(jù)上述按照所用試劑將樣品分為2組的策略,各自選取差異表達(dá)分析結(jié)果中最顯著的1 000個(gè)基因(按照P值排序),使用DAVID在線分析工具進(jìn)行KEGG通路富集分析,結(jié)果顯示2組差異基因中富集程度顯著的通路一致性較高,重合率達(dá)80%。使用R語(yǔ)言的ggplot2軟件包對(duì)各自重合的前10個(gè)通路進(jìn)行可視化,結(jié)果如圖5所示。橫坐標(biāo)數(shù)值為正數(shù)代表在實(shí)驗(yàn)組中上調(diào)基因富集出來(lái)的結(jié)果,為負(fù)值則代表在實(shí)驗(yàn)組中下調(diào)基因富集出來(lái)的結(jié)果;數(shù)值的大小則體現(xiàn)通路富集的顯著性水平。結(jié)果表明,DIY試劑處理組和TaKaRa試劑處理組的基因富集通路的顯著差異情況較相近。
圖5 2種試劑處理樣品的基因通路富集分析結(jié)果Fig 5 Results of KEGG pathway analysis of the samples treated with the two reagents
轉(zhuǎn)錄組測(cè)序的研究對(duì)象為特定細(xì)胞在某一功能狀態(tài)下能轉(zhuǎn)錄出來(lái)的所有RNA的總和,可以用于基因功能以及基因結(jié)構(gòu)的研究[15]。轉(zhuǎn)錄組測(cè)序結(jié)果可以揭示特定生物學(xué)過(guò)程以及疾病發(fā)生過(guò)程中的分子機(jī)制,因此該技術(shù)被廣泛應(yīng)用于生物學(xué)、基礎(chǔ)醫(yī)學(xué)、臨床診斷和藥物研發(fā)等多個(gè)領(lǐng)域[16],并成為一個(gè)識(shí)別細(xì)胞類(lèi)型、鑒定標(biāo)記基因、識(shí)別信號(hào)通路和研究調(diào)控機(jī)制的重要工具。轉(zhuǎn)錄組測(cè)序技術(shù)可為不同個(gè)體和疾病的組織帶來(lái)更好的生物靶標(biāo)識(shí)別和藥物標(biāo)靶[17],從而有助于進(jìn)一步發(fā)展精準(zhǔn)醫(yī)學(xué)。
本研究使用DIY試劑和TaKaRa試劑分別進(jìn)行轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建,并通過(guò)生物信息學(xué)分析,從不同的方面來(lái)驗(yàn)證DIY試劑代替TaKaRa試劑的可行性。結(jié)果發(fā)現(xiàn),2種試劑處理樣品得到的數(shù)據(jù)質(zhì)量皆良好,比對(duì)到基因組的序列占比也基本相等;在相同的測(cè)序深度下,2種試劑捕獲的轉(zhuǎn)錄本數(shù)較相近;2種試劑處理的樣品所測(cè)序列在基因上的覆蓋度均勻,且一致性較高。此外,分析結(jié)果顯示DIY試劑在僅有少量細(xì)胞輸入的情況下,能夠捕獲相對(duì)較多的轉(zhuǎn)錄本數(shù)量,表明該試劑使得來(lái)源極為有限的生物樣品分析成為可能。所以從數(shù)據(jù)質(zhì)量、捕獲轉(zhuǎn)錄本能力、基因覆蓋度均勻性等方面來(lái)看,DIY試劑可以很好地替代TaKaRa試劑進(jìn)行少量細(xì)胞輸入的轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建。差異表達(dá)基因的鑒定和差異基因通路富集分析是轉(zhuǎn)錄組測(cè)序較重要的分析結(jié)果[18],所以有必要比較這2個(gè)分析結(jié)果在2種不同試劑處理的情況下是否一致。結(jié)果顯示,2組分析結(jié)果相近,無(wú)明顯差別。從構(gòu)建文庫(kù)的成本方面來(lái)看,DIY試劑的優(yōu)勢(shì)更加明顯:若用于建庫(kù)的起始細(xì)胞量為100個(gè)細(xì)胞,TaKaRa試劑建庫(kù)實(shí)驗(yàn)所花費(fèi)用高達(dá)6萬(wàn)元,DIY試劑則僅需約5 700元。然而在進(jìn)行一項(xiàng)科學(xué)研究時(shí),動(dòng)輒需要對(duì)上千萬(wàn)乃至更大數(shù)量級(jí)的細(xì)胞進(jìn)行文庫(kù)構(gòu)建及測(cè)序,測(cè)序的費(fèi)用更是昂貴,所以使用DIY試劑代替此類(lèi)商業(yè)化試劑不僅能在保證數(shù)據(jù)質(zhì)量良好、差異基因分析等結(jié)果可靠的前提下降低約90%的建庫(kù)成本,還能根據(jù)具體實(shí)驗(yàn)進(jìn)行酶反應(yīng)條件的調(diào)整以及試劑使用的優(yōu)化等。因此綜合多方面的評(píng)測(cè),DIY試劑可以替代昂貴的商業(yè)化試劑用于少量細(xì)胞輸入的轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建。此外,SMART技術(shù)不僅可用于少量細(xì)胞輸入的轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建,也可對(duì)單個(gè)細(xì)胞進(jìn)行建庫(kù)并測(cè)序,用以在免疫、神經(jīng)等復(fù)雜系統(tǒng)中研究細(xì)胞高異質(zhì)性這一類(lèi)問(wèn)題;該技術(shù)不僅為測(cè)序技術(shù)提供了新的發(fā)展方向,還有望在單細(xì)胞水平上進(jìn)行遺傳變異的檢測(cè)、腫瘤的診斷及免疫治療等研究[19]。因此,如何優(yōu)化DIY試劑并將其用于單細(xì)胞的轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建還亟待解決。
綜上所述,本研究比較了DIY試劑與TaKaRa試劑對(duì)少量細(xì)胞的轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建以及轉(zhuǎn)錄組測(cè)序結(jié)果,表明DIY試劑可以替代昂貴的商業(yè)化試劑進(jìn)行轉(zhuǎn)錄組測(cè)序文庫(kù)構(gòu)建。該研究將使得基于SMART技術(shù)的轉(zhuǎn)錄組測(cè)序得到真正的廣泛應(yīng)用,將為生物學(xué)以及基礎(chǔ)醫(yī)學(xué)等各個(gè)研究領(lǐng)域提供良好的技術(shù)支持。