林長(zhǎng)松,邵嬌芳,武 劍,汪強(qiáng)虎
(南京醫(yī)科大學(xué) 江蘇 南京 211166)
近些年興起的單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)已經(jīng)成為生物醫(yī)藥研究中的一把利劍,在研究腫瘤異質(zhì)性,發(fā)育等方面起著重要的作用,是生物信息學(xué)本科生教學(xué)中不可或缺的一塊內(nèi)容。然而單細(xì)胞轉(zhuǎn)錄組測(cè)序產(chǎn)生的數(shù)據(jù)量巨大,從下機(jī)數(shù)據(jù)處理到后續(xù)分析也是異常復(fù)雜,并且分析環(huán)境也多種多樣,極大地增加了教學(xué)難度,因此需要老師對(duì)整塊教學(xué)內(nèi)容進(jìn)行有效編排。
單細(xì)胞轉(zhuǎn)錄組測(cè)序是一門新興學(xué)科,不單單是轉(zhuǎn)錄組測(cè)序的延續(xù),目前國(guó)內(nèi)很少學(xué)校開(kāi)設(shè)該課程[1-3]。教學(xué)中面臨的兩大問(wèn)題:①單細(xì)胞轉(zhuǎn)錄組分析環(huán)境復(fù)雜,涉及眾多R 包和python 軟件包,分析環(huán)境難以配置,學(xué)生需要耗費(fèi)大量時(shí)間用以配置分析環(huán)境,是學(xué)習(xí)單細(xì)胞轉(zhuǎn)錄組過(guò)程中主要的障礙;②涉及眾多知識(shí)點(diǎn),學(xué)生容易掌握單個(gè)知識(shí)點(diǎn),但難以融會(huì)貫通,串成一根主線,分析完整的案例時(shí)顯得力不從心;如果老師繼續(xù)使用傳統(tǒng)的講授方式,學(xué)生無(wú)法產(chǎn)生學(xué)習(xí)興趣,對(duì)單細(xì)胞轉(zhuǎn)錄組測(cè)序內(nèi)容難以理解,并且學(xué)生不能理解單細(xì)胞轉(zhuǎn)錄組測(cè)序這門課設(shè)置的目的與意義,無(wú)法激發(fā)學(xué)好一門學(xué)科應(yīng)該有的積極性,因此恰當(dāng)?shù)慕虒W(xué)方式就顯得尤為重要。于是,在此情形下,突破傳統(tǒng)的大課堂,導(dǎo)入其他教學(xué)模式是極為必要的。為了解決配置環(huán)境方面的問(wèn)題,引入容器化技術(shù),基于singularity 構(gòu)建單細(xì)胞分析的R 環(huán)境容器文件以及shell 環(huán)境下的容器文件,徹底解決單細(xì)胞轉(zhuǎn)錄組分析環(huán)境的軟件配置難題。在教學(xué)方法上,采用問(wèn)題導(dǎo)向式學(xué)習(xí)(problem-based learning,PBL)教學(xué)方法,將完整的案例穿插在單個(gè)知識(shí)點(diǎn)的教學(xué)中,引導(dǎo)學(xué)生運(yùn)用單細(xì)胞轉(zhuǎn)錄組測(cè)序分析方法對(duì)科學(xué)問(wèn)題進(jìn)行探索[4]。
當(dāng)前部署生物信息分析平臺(tái)常借助于容器化技術(shù):
①借助于conda 軟件安裝生物信息分析軟件,可以將單個(gè)的生物信息分析軟件安裝在獨(dú)立的虛擬環(huán)境中,也可以將多生物信息分析軟件安裝在一個(gè)conda環(huán)境,但conda軟件會(huì)安裝額外的環(huán)境所需軟件,環(huán)境臃腫,安裝時(shí)受網(wǎng)速影響很大,另外不便于跨平臺(tái)移植使用[5-6];②docker 是一種輕量級(jí)的虛擬化技術(shù),在生物信息學(xué)中使用廣泛[7]。docker 可為單一的生物信息學(xué)分析流程建立一個(gè)可移植的容器,并且在該容器內(nèi)可以放置分析代碼,配置文件,而當(dāng)前在很多生信公司中使用成熟的代碼進(jìn)行規(guī)范化分析時(shí)多使用docker 技術(shù)[8-9]。docker hub 網(wǎng)站中也有單細(xì)胞分析所需的docker鏡像,但在教學(xué)中,有一致命性缺陷,即運(yùn)行時(shí)需要服務(wù)器的root 權(quán)限,增加了服務(wù)器的不安全性,而且不好修改,不便于實(shí)際中使用;③近些年隨著超算興起的singularity 軟件,和docker 軟件的功能很類似,卻不需要root 權(quán)限,在生信領(lǐng)域具有很廣闊的使用前景。相較于docker,singularity 有獨(dú)特的優(yōu)勢(shì):容易對(duì)分析環(huán)境進(jìn)行打包遷徙,和現(xiàn)有系統(tǒng)無(wú)縫整合,無(wú)須運(yùn)行daemon 進(jìn)程,支持多種鏡像和容器文件格式,易于和現(xiàn)有的超算系統(tǒng)整合,國(guó)內(nèi)多個(gè)超算平臺(tái)已部署singularity 軟件,并且可以使用singularity pull 命令獲取docker 資源。另外,在教學(xué)中融入構(gòu)建singularity 容器的內(nèi)容,使學(xué)生從底層掌握容器構(gòu)建過(guò)程,提高他們的科研技能。
穩(wěn)定的生物信息學(xué)分析軟件環(huán)境不僅是教學(xué)的需要,同樣也是科研之必需。在教學(xué)中采用的策略是:linux 基礎(chǔ)一般的學(xué)生掌握容器化軟件的使用,了解容器化軟件的構(gòu)建流程,而學(xué)有余力的學(xué)生可以掌握容器化軟件的構(gòu)建過(guò)程,圖1 所示搭建單細(xì)胞轉(zhuǎn)錄組測(cè)序分析軟件,具體構(gòu)建過(guò)程如下:①下載純凈版的Ubuntu(版本18.0.6),構(gòu)建沙盒,設(shè)置沙盒的讀寫屬性,安裝常見(jiàn)的庫(kù)文件,將linux shell環(huán)境中使用的軟件Sratools(sra 文件下載及轉(zhuǎn)換),Samtools(sam/bam 文件操作),Cellranger(單細(xì)胞測(cè)序文件比對(duì)),cellphonedb(python 環(huán)境下的細(xì)胞通訊分析軟件),velocyto(python 環(huán)境下的RNA 速率分析軟件),pySCENIC(python 環(huán)境下的單細(xì)胞轉(zhuǎn)錄調(diào)控軟件)軟件安裝在純凈的Ubuntu 操作系統(tǒng)中,打包封裝成是以sif 結(jié)尾的singularity 容器文件。②R 包分析環(huán)境的構(gòu)建:在純凈的ubuntu環(huán)境中裝R 所需的庫(kù)文件,然后裝R-base 軟件(版本4.0.6),接著將單細(xì)胞分析的R 包都安裝在該環(huán)境下,安裝過(guò)程中需要安裝眾多依賴的庫(kù)文件,安裝完成后封裝成是以sif 結(jié)尾的singularity 文件。該R 包分析環(huán)境主要涉及以下R 包軟件:數(shù)據(jù)讀入整合R 包(Seurat,harmony);雙細(xì)胞鑒別R 包(DoubletFinder);細(xì)胞亞群識(shí)別(scMCA,scHCL,singleR);細(xì)胞通訊(iTALK,Nichenet,CellChat);CNV的推斷(inferCNV,copyKAT);軌跡分化(velocyto.R,Monocle2,Monocle3);轉(zhuǎn)錄調(diào)控(SCENIC);功能化分析(clusterprofiler,org.Hs.eg.db,GSVA),以上R 包能夠滿足本科生單細(xì)胞轉(zhuǎn)錄組測(cè)序課程的教學(xué)。
圖1 單細(xì)胞轉(zhuǎn)錄組測(cè)序分析環(huán)境的容器化軟件
從教育心理學(xué)的定義來(lái)看,問(wèn)題本身可分為結(jié)構(gòu)良好問(wèn)題和結(jié)構(gòu)不良問(wèn)題。單細(xì)胞轉(zhuǎn)錄組教學(xué)中的案例教學(xué)內(nèi)容問(wèn)題就屬于后者,適用于PBL 中的案例教學(xué),其被解決的過(guò)程和可能的答案常常不具有規(guī)律性和穩(wěn)定性,即新的問(wèn)題不能按部就班照著舊的問(wèn)題的解決方法去處理,因此這種教學(xué)方式不是枯燥且一成不變地學(xué),而是基于真實(shí)情景的問(wèn)題,以解決問(wèn)題為起點(diǎn),從問(wèn)題出發(fā)延伸,從而對(duì)知識(shí)進(jìn)行探索、掌握中心分析與理解運(yùn)用,是一種“高水平學(xué)習(xí)”[10]。單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)分析這門課要求學(xué)生理清并掌握概念間的各式復(fù)雜聯(lián)系,學(xué)以致用,且因事制宜,運(yùn)用到具體的科學(xué)問(wèn)題(肺腺癌的異質(zhì)性)中去。而逐漸掌握的過(guò)程也是從案例問(wèn)題中學(xué)習(xí)的過(guò)程;運(yùn)用的過(guò)程則對(duì)應(yīng)著加強(qiáng)理解的過(guò)程,并能檢驗(yàn)掌握程度。正如實(shí)踐是認(rèn)識(shí)的唯一來(lái)源,也是目的和歸宿。因此,問(wèn)題的發(fā)現(xiàn)者即學(xué)生,是PBL 教學(xué)的主體與核心[11]。因此,PBL 教學(xué)對(duì)于生物信息學(xué)專業(yè)本科學(xué)生將來(lái)的學(xué)習(xí)和工作的能力塑造至關(guān)重要。
傳統(tǒng)的教學(xué)方法更傾向于授人以“魚”,雖一直提倡學(xué)習(xí)是學(xué)生自己的事,但在現(xiàn)當(dāng)代的填鴨式教育模式下,老師在教學(xué)中處于主體地位,通常是學(xué)生學(xué)了什么取決于老師教了什么,PBL 教學(xué)法則傾向于授人以“漁”,其差別便在于將從教為中心翻轉(zhuǎn)為了以學(xué)生自主學(xué)為中心[12]。本課程中老師的作用相當(dāng)于其中的“根節(jié)點(diǎn)”,給學(xué)生提供一個(gè)綜合的框架或者一個(gè)問(wèn)題,學(xué)生根據(jù)老師提供的框架和問(wèn)題,通過(guò)自身對(duì)資料的查閱來(lái)解決問(wèn)題,其過(guò)程本身則更傾向于對(duì)問(wèn)題的探尋,而不是拘泥于那“正確”的答案。由此不難看出,學(xué)生在這種學(xué)習(xí)模式當(dāng)中占據(jù)了主體地位,問(wèn)題導(dǎo)向式學(xué)習(xí)的過(guò)程也極大地增加了學(xué)生學(xué)習(xí)的自主性和去盲從性,脫離了無(wú)意義的“死記硬背”,激發(fā)學(xué)生的求知欲,活躍其思維,迸發(fā)出更多的“頭腦風(fēng)暴”。
傳統(tǒng)的教學(xué)模式中,教師是“灌輸式教育”的主導(dǎo)者,而在PBL 教育模式當(dāng)中,教師是學(xué)生獲得知識(shí)的教練,即“教”學(xué)生如何自主達(dá)到“練”的目的。教師和學(xué)生之間構(gòu)成了一種新型的關(guān)系,從只教與學(xué)轉(zhuǎn)變?yōu)閰f(xié)作關(guān)系。所謂“協(xié)作”,即教師與學(xué)生的關(guān)系是平等的,其通過(guò)共同的合作達(dá)到所設(shè)定的目標(biāo)。傳統(tǒng)教學(xué)當(dāng)中,教師的身份大多數(shù)“替代”了學(xué)生一職,鼓勵(lì)學(xué)生提出問(wèn)題無(wú)錯(cuò)之有,不恰當(dāng)?shù)氖枪膭?lì)學(xué)生提出問(wèn)題之后,并未鼓勵(lì)其自己解決,教師反倒成了“學(xué)生”,鉆研出成果之后直接告訴學(xué)生,學(xué)生只知其結(jié)果而不知探求的過(guò)程之樂(lè)[13]。單細(xì)胞轉(zhuǎn)錄組測(cè)序課程中教師應(yīng)當(dāng)發(fā)揮“教”的長(zhǎng)處,滲透了“一葉黃而知天下秋”的教育理念,給學(xué)生提供一“點(diǎn)”供其發(fā)展為一“面”,并在學(xué)生毫無(wú)頭緒或與所達(dá)目的有所偏差的情況下參與討論,提點(diǎn)其一二,充當(dāng)學(xué)生獲得知識(shí)的教練和指導(dǎo)者的同時(shí),給學(xué)生最大的發(fā)揮空間。至此,一貫盛行的教師應(yīng)當(dāng)講滿課程、充分利用好一節(jié)課的每一分鐘的觀點(diǎn)則不攻自破,一幅好的畫須“留白”,教學(xué)亦如此,在本課程中教師的身份很好地詮釋了“留白”的作用,留白才可供學(xué)生發(fā)揮。誠(chéng)然,新的教育模式也需要教師具備更高水平的、多學(xué)科的專業(yè)知識(shí)、專業(yè)技能,才能有足夠的能力給予學(xué)生幫助,所謂教學(xué)相長(zhǎng),應(yīng)是如此。
采用理論課和實(shí)驗(yàn)課相結(jié)合的方式介紹單細(xì)胞轉(zhuǎn)錄組測(cè)序的基本知識(shí),讓學(xué)生從宏觀角度對(duì)單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)有初步的認(rèn)識(shí),以及每個(gè)細(xì)小問(wèn)題的分析方法。主要涉及數(shù)據(jù)讀入,整合、雙細(xì)胞鑒別;細(xì)胞亞群識(shí)別;細(xì)胞通訊;CNV 的推斷;軌跡分化;轉(zhuǎn)錄調(diào)控;功能化分析。
完整的案例是以O(shè)ncogene 雜志中Single-cell RNA sequencing reveals distinct tumor microenvironmental patterns in lung adenocarcinoma 這一文章為基礎(chǔ),提出的問(wèn)題為:如何用單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)探索肺腺癌的異質(zhì)性。圍繞這一主要問(wèn)題衍生出子問(wèn)題:①腫瘤的異質(zhì)性是什么,如何用分析結(jié)果展示;②多樣本數(shù)據(jù)怎么整合;③如何注釋肺腺癌微環(huán)境中多種細(xì)胞;④肺腺癌微環(huán)境中多種細(xì)胞的細(xì)胞間通訊如何;⑤如何鑒定肺腺癌腫瘤細(xì)胞;⑥細(xì)胞內(nèi)的調(diào)控網(wǎng)絡(luò)中核心的轉(zhuǎn)錄因子是哪些?⑦肺腺癌微環(huán)境中多種細(xì)胞的分化軌跡是什么。立足于原文,但又不限于原文,根據(jù)這些子問(wèn)題對(duì)原始數(shù)據(jù)進(jìn)行重新分析。
我們將學(xué)生分成不同小組,由小組長(zhǎng)牽頭,討論以上的子問(wèn)題,確定分析思路,并將上課時(shí)學(xué)到的零碎知識(shí)點(diǎn)串聯(lián)起來(lái),組織代碼,加以分析。在實(shí)際運(yùn)行中遇到的困難在小組群中加以討論。
對(duì)于實(shí)際分析過(guò)程中遇到的學(xué)生迷惑的知識(shí)點(diǎn)采用集中討論的方式,其中重點(diǎn)突出的問(wèn)題有“如何鑒定肺腺癌腫瘤細(xì)胞”及“分析軌跡分化的多個(gè)軟件比較”。通過(guò)集中討論的方法有效地解決了學(xué)生的困惑,第一個(gè)問(wèn)題是“如何鑒定肺腺癌腫瘤細(xì)胞”,經(jīng)過(guò)討論給出的解決方案:鑒定腫瘤細(xì)胞類型的方法是借助inferCNV 和標(biāo)記基因兩種方法。第二個(gè)問(wèn)題是“分析軌跡分化的多個(gè)軟件比較”,經(jīng)過(guò)大家討論給出的解決方案:Monocle2,SlingShot 及PAGA等軟件結(jié)果需同RNA 速率軟件結(jié)果結(jié)合,軟件的選擇取決于數(shù)據(jù)及真實(shí)的生物學(xué)意義。
以小組為單位展示本小組的分析結(jié)果,采用PPT 展示和小論文形式,PPT 展示分析的過(guò)程及思路,論文中展示詳細(xì)的代碼及處理過(guò)程。熟悉該領(lǐng)域的3 位老師對(duì)每一小組的匯報(bào)結(jié)果進(jìn)行打分,取平均分,該部分占總成績(jī)的40%。
單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)課程中使用基于容器化技術(shù)部署生物信息學(xué)軟件和問(wèn)題導(dǎo)向式學(xué)習(xí)在單細(xì)胞轉(zhuǎn)錄組測(cè)序課程教學(xué)中的應(yīng)用案例,從基礎(chǔ)、理論、實(shí)踐三方面的學(xué)習(xí),提高實(shí)際科學(xué)問(wèn)題中的數(shù)據(jù)分析能力,激發(fā)了學(xué)生的學(xué)習(xí)潛能,為他們的數(shù)據(jù)分析及科研奠定良好的基礎(chǔ)。