亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        NGS分析教學(xué)實操平臺的開發(fā)與應(yīng)用

        2022-11-08 05:49:34
        醫(yī)學(xué)教育管理 2022年5期
        關(guān)鍵詞:分析課程學(xué)生

        王 晶 劉 旭 段 犖 程 杉

        (首都醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院,北京 100069)

        近年來,二代測序技術(shù)(next-generation sequencing,NGS)飛速發(fā)展,測序成本持續(xù)降低,其樣本消耗低、數(shù)據(jù)量大等優(yōu)勢得到充分顯現(xiàn),日漸成為生物醫(yī)藥領(lǐng)域必備研究手段,使生命科學(xué)的探索進入了 “組學(xué)”時代[1-2]。

        在高通量測序的相關(guān)實驗研究中,NGS數(shù)據(jù)的生物信息學(xué)分析專業(yè)度要求較高,雖然國內(nèi)外綜合性院校在研究生教育階段開設(shè)了生物信息學(xué)等相關(guān)課程,但在醫(yī)學(xué)領(lǐng)域相關(guān)專業(yè)技術(shù)人才對測序數(shù)據(jù)分析的需求仍然未能充分滿足,特別是本科生教學(xué)中,相關(guān)能力培養(yǎng)的課程覆蓋存在明顯的缺口。其中主要原因是由于NGS的數(shù)據(jù)分析需要提供必要實操條件,從而與理論授課內(nèi)容相結(jié)合,達到預(yù)期教學(xué)目標(biāo)。

        在醫(yī)學(xué)相關(guān)“大數(shù)據(jù)”的分析中,既要展示海量組學(xué)數(shù)據(jù),更要解讀這些數(shù)據(jù)背后的醫(yī)學(xué)及生物學(xué)意義,這就要求師資兼?zhèn)溽t(yī)學(xué)生物學(xué)的知識儲備及生物信息處理能力。對上述問題系統(tǒng)性的解決,可填補大多數(shù)臨床醫(yī)學(xué)及基礎(chǔ)醫(yī)學(xué)專業(yè)學(xué)生在測序數(shù)據(jù)分析中的技能短板,也能夠為醫(yī)學(xué)院校加快學(xué)科交叉領(lǐng)域人才的培養(yǎng)鋪路助力[3]。

        1 BIONEO高通量測序數(shù)據(jù)分析平臺的搭建

        1.1 高通量數(shù)據(jù)分析平臺前期基礎(chǔ)

        依托醫(yī)學(xué)遺傳學(xué)與發(fā)育生物學(xué)學(xué)系,在基礎(chǔ)醫(yī)學(xué)培養(yǎng)方案中開設(shè)高通量數(shù)據(jù)分析課程,與已開設(shè)的醫(yī)用數(shù)據(jù)挖掘課程偏向醫(yī)用數(shù)據(jù)庫的檢索和使用等教學(xué)內(nèi)容互補,主要涉及NGS數(shù)據(jù)處理相關(guān)的理論及實驗等教學(xué)內(nèi)容。醫(yī)學(xué)遺傳學(xué)作為銜接基礎(chǔ)研究和臨床研究橋梁學(xué)科,在面向臨床/基礎(chǔ)醫(yī)學(xué)專業(yè)講述交叉學(xué)科內(nèi)容方面具有天然的優(yōu)勢。在兼顧學(xué)生的知識背景、課程的師資準(zhǔn)備和授課內(nèi)容的精選等實踐基礎(chǔ)上,實現(xiàn)了內(nèi)容豐富、難度適中、理論與實踐并重且教學(xué)效果良好的高通量數(shù)據(jù)分析課程的運行。

        NGS測序數(shù)據(jù)分析作為一個新興前沿交叉學(xué)科,層出不窮的“組學(xué)”及NGS數(shù)據(jù)分析流程對課程教學(xué)團隊的背景及知識更新速度也有了更高的要求。特別在課程實驗部分的設(shè)計中,學(xué)生相關(guān)知識背景相對薄弱:如NGS數(shù)據(jù)處理中偏重計算生物學(xué)處理的部分,需要編程和算法設(shè)計,對于臨床醫(yī)學(xué)和基礎(chǔ)醫(yī)學(xué)學(xué)生而言,高等數(shù)學(xué)和計算機語言基礎(chǔ)較為欠缺,使得在對算法的理解和應(yīng)用上有一定難度;此外,在注重數(shù)據(jù)分析及可視化的生物數(shù)據(jù)挖掘部分,大多數(shù)NGS據(jù)分析軟件都定位在Linux系統(tǒng),人機交互需要通過命令輸入進行,從零基礎(chǔ)到能獨立完成基本分析操作需要一定的訓(xùn)練周期。因此,我們有針對性地提出了解決方案:分析軟件全部根據(jù)源代碼在Windows操作系統(tǒng)下重新編譯,并且提供圖形化操作界面,為主要流程的參數(shù)輸入提供交互性的用戶體驗。

        首先,我們通過從主流的生物信息學(xué)方法學(xué)期刊,如NatureMethods、Bioinformatics等雜志中甄選已發(fā)表并且被普遍采用的NGS測序數(shù)據(jù)分析軟件及分析流程,建立基因組測序(DNAseq)和轉(zhuǎn)錄組測序(RNA-seq)的標(biāo)準(zhǔn)化流程[4-12];進而重新編譯其中全部程序和軟件的代碼生成Windows操作系統(tǒng)下可直接運行的二進制可執(zhí)行文件,并在此基礎(chǔ)上分別構(gòu)建了基于Windows CMD窗口工具的全基因組測序(whole genome sequencing,WGS)、全外顯子組測序(whole exome sequencing,WES),RNA-seq及染色質(zhì)免疫共沉淀測序(chromatin immunoprecipitation sequencing, ChIP-seq)4個測序類型多個獨立分析流程;最后為每個獨立的分析流程利用簡易的HTA編程,配伍了相應(yīng)的圖形化操作界面。由于完全規(guī)避了對Linux操作系統(tǒng)的依賴和純終端命令行輸入的方式,徹底打破傳統(tǒng)實操教學(xué)中的許多技術(shù)壁壘,避免給學(xué)員造成不便[13]。

        通過上述前期努力和嘗試,在一定程度上降低了基礎(chǔ)NGS數(shù)據(jù)分析的學(xué)習(xí)門檻,為建立適合基礎(chǔ)及臨床醫(yī)學(xué)學(xué)生高通量測序數(shù)據(jù)分析課程奠定了良好基礎(chǔ)。在先后2個批次的小規(guī)模面向基礎(chǔ)醫(yī)學(xué)專業(yè)學(xué)生的培訓(xùn)后,均收獲了良好的教學(xué)反饋并收獲了同行督導(dǎo)專家的一致好評,同時建議對數(shù)據(jù)分析的實操步驟進一步整合及集成,改進互動式圖形化界面(graphic user interface, GUI)的集成,使面對高通量數(shù)據(jù)分析望而生畏的零基礎(chǔ)學(xué)生能有更好的入門體驗。

        為此,我們進一步在Windows系統(tǒng)下對部分標(biāo)準(zhǔn)分析流程進行了優(yōu)化和集成:將應(yīng)用最為廣泛的WES變異比對及注釋和RNA-seq中基礎(chǔ)的差異表達基因分析兩套流程制作 “生信牛BIONEO高通量測序數(shù)據(jù)分析平臺”,同時為之提供了專門的測試和演示數(shù)據(jù)。至此,BIONEO軟件包成為一個可獨立運行的NGS標(biāo)準(zhǔn)分析流程實操平臺,提供對課程教學(xué)的完全支持,同時其經(jīng)過拓展的專業(yè)版本(pro version)還能夠充分勝任科研級別的專業(yè)分析需求。

        1.2 數(shù)據(jù)分析流程選擇

        DNA-seq數(shù)據(jù)選擇Trimmomatic[9]中輸入fasta,將rawdata經(jīng)過配對和篩選后輸出cleandata fasta文件;BWA[4]將cleandata中讀長(reads)比對回參考基因組;SAMtools[5]進行二進制轉(zhuǎn)換及排序生成bam文件,Picard[6]去除文庫構(gòu)建過程中PCR產(chǎn)生的重復(fù)序列獲得bam文件;使用GATK[7]中BaseRecalibrator、ApplyBQSR及HaplotypeCaller,經(jīng)過局部重比對和堿基質(zhì)量重矯正后,檢測變異,并對評價出的位點進行質(zhì)控矯正后輸出vcf文件,包括突變信息及突變所在染色體位置信息等;最后用ANNOVAR[8]進行對變異注釋,標(biāo)注變異位置、變異類型、人群數(shù)據(jù)庫頻率、突變對表達蛋白的功能影響預(yù)測及保守性分析等。全部流程按照標(biāo)準(zhǔn)化流程操作,也可通過勾選操作進行部分步驟的分析。為了覆蓋更多的研究類型,分別建立人hg19、人hg38、小鼠mm10 3套參考基因組序列體系。

        RNA-seq差異表達基因分析流選擇Trimmomatic[9]輸入fasta,將rawdata經(jīng)過配對和篩選后輸出cleandata;HISAT2[10]將cleandata的reads比對回參考基因組;SAMtools[5]進行二進制轉(zhuǎn)換及排序;HTseq[11]生成收檢樣本每個基因的counts信息;DESeq2[12]輸出組間差異表達分析結(jié)果。支持通用流程連續(xù)自動運行或勾選部分分析步驟操作。BIONEO RNA-seq提供人hg38,小鼠mm10,大鼠Rnod 6.0及果蠅4套參考基因組序列體系。

        1.3 系統(tǒng)基本構(gòu)架及平臺GUI實現(xiàn)

        目前雖然已有帶有GUI的高通量分析軟件,但大多僅完成注釋分析,而非完整分析流程套件[14-15],我院醫(yī)學(xué)遺傳學(xué)與發(fā)育生物學(xué)學(xué)系獨立開發(fā)的帶有GUI界面的BIONEO軟件可一次性集成完成全部分析流程。軟件的編譯使用基于HTML應(yīng)用程序和vbscript語言編譯,實現(xiàn)GUI。BIONEO平臺對操作系統(tǒng)和使用環(huán)境的要求很低,其中系統(tǒng)配置為8核以上Windows 7或以上的64位操作系統(tǒng)即可;要求內(nèi)存容量8 G以上,硬盤容量256 G即可(可通過USB 3. 0外接擴容);網(wǎng)絡(luò)以太網(wǎng)卡或調(diào)制解調(diào)器。

        此外,針對軟件的產(chǎn)權(quán)保護,BIONEO采用了獨特的加密方式,每個軟件綁定一個磁盤,拷貝復(fù)制會觸發(fā)“Invalid Access”提示,并關(guān)閉軟件,在一定程度上保護了軟件的知識產(chǎn)權(quán)。該平臺已經(jīng)成功搭建并獲得中華人民共和國國家版權(quán)局計算機軟件著作權(quán)(登記號:2021SR79556)。

        2 BIONEO平臺在教學(xué)中的推廣使用

        以這個平臺為基礎(chǔ),我們正式面向全校基礎(chǔ)醫(yī)學(xué)及臨床醫(yī)學(xué)專業(yè)研究生開設(shè)高通量測序數(shù)據(jù)分析研究生選修課程,該課程分為理論課和實驗課。其中實驗課以案例實操為主,由教師提供樣例數(shù)據(jù),或由選課研究生直接使用科研課題中產(chǎn)生的高通量數(shù)據(jù),以我們建立的BIONEO軟件為操作平臺,進行數(shù)據(jù)分析的實時分析訓(xùn)練。學(xué)生實時接觸主流高通量數(shù)據(jù)WES變異比對及注釋和RNA-seq 差異表達分析流程。通過師生線下座談和線上問卷等形式與所有選課學(xué)生交流,一致認(rèn)為課程開設(shè)意義重大,使得零基礎(chǔ)的醫(yī)學(xué)生可以通過課程實踐,獨立完成主流常規(guī)高通量數(shù)據(jù)分析。同時,為了提高教學(xué)效果,我們也通過認(rèn)真總結(jié)學(xué)生提出的反饋意見,對BIONEO進行了升級和調(diào)整。

        2.1 增加互動界面,詳細(xì)介紹標(biāo)準(zhǔn)操作流程中生物信息學(xué)軟件及實時程序進程

        在BIONEO的初始版本中,所有在數(shù)據(jù)分析的過程中,直接后臺運行每一步,學(xué)生的直觀感覺更像是在操作一個成熟的軟件套件,而不能監(jiān)測每步所用的具體生物信息分析軟件和實時的數(shù)據(jù)產(chǎn)出。為了更詳細(xì)地展示每步數(shù)據(jù)分析過程,實現(xiàn)更好的教學(xué)效果,我們在操作界面上特別添加了針對高通量數(shù)據(jù)分析流程中每步軟件的說明,以“Read Me”的形式嵌套在每個可勾選流程右側(cè),并在運行軟件的同時,恢復(fù)顯示W(wǎng)indows CMD窗口工具,使學(xué)生可以更加清晰直觀地掌握每一步數(shù)據(jù)產(chǎn)生的方法和過程。

        2.2 疫情期間滿足線上教學(xué)需求,并進行教學(xué)比較

        2020-2021學(xué)年度研究生課程實操課恰逢疫情期間線上授課,我們將BIONEO light版套件及樣例數(shù)據(jù)以開放下載的形式對學(xué)生共享,教師通過網(wǎng)絡(luò)授課軟件進行授課和實操指導(dǎo)。對比兩學(xué)年教學(xué)效果發(fā)現(xiàn):無論是線下還是線上的授課模式,對于從未接觸過高通量數(shù)據(jù)分析的研究生,均有超過70%從未接觸過高通量測序數(shù)據(jù)分析的學(xué)生在初次接觸BIONEO套件后即能在指導(dǎo)后獨立完成DNA-seq基礎(chǔ)分析及RNA-seq差異表達基因分析,說明軟件本身的互動性及可操作性良好。此外,根據(jù)授課結(jié)果比較發(fā)現(xiàn),線下互動性實操課程教學(xué)效果優(yōu)于完全線上實操教學(xué)(表1),說明如何在線上教學(xué)模式下提高學(xué)生的課堂吸收率值得進一步探討和提高。

        表1 BIONEO套件教學(xué)應(yīng)用效果比較[n(%)]

        2.3 開發(fā)專供課上演示的快速簡版軟件

        基于目前普通個人電腦,單個樣本高通量測序數(shù)據(jù)分析周期約4~6 h,而單次實操課為4課時(3 h),初始版本的BIONEO只能演示測序數(shù)據(jù)分析的初始,由于課程時間限制,無法為學(xué)生呈現(xiàn)完整的數(shù)據(jù)分析流程。為了讓學(xué)生在課堂實時練習(xí)軟件操作,接受教師指導(dǎo)并獲得測序分析結(jié)果,我們將人類h38基因組參考序列中1號染色體的參考序列從全基因組參考序列中單獨拆分出來作為比對用參考基因組,單獨制作BIONEO light版本,這一操作大大提高了比對和注釋的時間,單個樣本從原始下機數(shù)據(jù)到變異注釋完成只需35 min,在保持軟件功能練習(xí)完整性的同時實現(xiàn)了課堂全過程操作,保留全功能的BIONEO pro版作為科研需求,Light版及Pro版功能對比見圖1。

        圖1 Light版及Pro版BIONEO操作流程比較

        2.4 覆蓋滿足教學(xué)科研雙需求

        符合當(dāng)前市場一般配置的普通個人電腦雖然可以完成BIONEO提供的生物信息學(xué)分析,但其計算速度仍然低于專業(yè)服務(wù)器,因此,學(xué)系面向基礎(chǔ)醫(yī)學(xué)院及各個臨床醫(yī)院開放了內(nèi)嵌BIONEO pro版套件的計算服務(wù)器和存儲服務(wù)器的預(yù)約使用,將課程內(nèi)容延伸至實際科研課題中。學(xué)生帶著科研問題走進課堂,通過理論學(xué)習(xí)更好地完成課題設(shè)計,通過BIONEO light實操訓(xùn)練初步掌握高通量測序數(shù)據(jù)基礎(chǔ)分析,再基于學(xué)系提供的服務(wù)器自助式完成個體科研課題數(shù)據(jù)分析及解讀,徹底實現(xiàn)“授之以漁”的教學(xué)目標(biāo)。迄今,基于BIONEO pro操作平臺,本校已經(jīng)完成了對基礎(chǔ)醫(yī)學(xué)院免疫學(xué)系、首都醫(yī)科大學(xué)附屬北京兒童醫(yī)院、首都醫(yī)科大學(xué)宣武醫(yī)院等多個系室/科室的科研支持。

        3 后續(xù)改進

        隨著生物醫(yī)藥研究所需主流高通量測序的種類越來越多,分析流程個性化愈發(fā)凸現(xiàn),基礎(chǔ)模式化流程不能完全滿足數(shù)據(jù)深度挖掘的需要;新興的單細(xì)胞轉(zhuǎn)錄組測序(single cell RNA-seq,scRNA-seq)、宏基因組測序(metagenomics next generation sequencing, mNGS)也已經(jīng)成為生物醫(yī)藥較常規(guī)大數(shù)據(jù)分析,數(shù)據(jù)分析套件種類急需擴充。同時,我們注意到,不同于早期生物信息學(xué)分析流程中不同模塊可由多款軟件實現(xiàn), scRNA-seq及mNGS均具有獨立成熟專業(yè)的分析套件(Cellranger及QIIME 2),這些套件基于Linux系統(tǒng),完全平移到Windows系統(tǒng)事倍功半。因此,在基于已有工作基礎(chǔ)及經(jīng)驗的同時,也充分考慮為專業(yè)生物信息學(xué)分析人員提供性能良好的自主分析平臺,后續(xù)擬建立以Linux 操作系統(tǒng)為基礎(chǔ)的多測序種類。自Windows 10開始,系統(tǒng)整合了wsl(windows subsystem for linux),提供對linux程序運行環(huán)境的原生態(tài)支持,目前wsl升級至版本2,兼容性得到很大改善,可以滿足絕大多數(shù)NGS生物信息學(xué)軟件包的環(huán)境支持。隨著高校軟件正版化對Windows操作系統(tǒng)的全面升級,我們?yōu)镹GS課程所準(zhǔn)備的雙系統(tǒng)流程和演示資源在完成系統(tǒng)培訓(xùn)的基礎(chǔ)上,將進一步為真實數(shù)據(jù)的研究工作提供更加直接和有力的支持。

        4 結(jié) 語

        BIONEO平臺為專業(yè)型強且操作難度高的高通量測序數(shù)據(jù)分析提供了一個有效的解決方案,在基礎(chǔ)醫(yī)學(xué)教學(xué)的應(yīng)用具有良好的靈活性和可行性,通過涵蓋目前最主流高通量測序類型的數(shù)據(jù)分析方法并單獨制作體系,為零基礎(chǔ)的基礎(chǔ)醫(yī)學(xué)和臨床醫(yī)學(xué)學(xué)生提供簡便的實操環(huán)境。通過在Windows界面下整合最主流的高通量測序數(shù)據(jù)(DNA-seq和RNA-seq)的標(biāo)準(zhǔn)化流程,極大降低了主流NGS數(shù)據(jù)分析與后續(xù)挖掘的技術(shù)門檻。BIONEO在基礎(chǔ)醫(yī)學(xué)教育中的全面推廣將為生物醫(yī)藥行業(yè)基礎(chǔ)研究領(lǐng)域中高通量測序數(shù)據(jù)分析作為必備手段的普及提供有效支持。

        (致謝:本研究的整體設(shè)計思路及主要實現(xiàn)方案由丁衛(wèi)教授和葉海虹教授指導(dǎo)完成,特此感謝!感謝牛歡等同學(xué)幫助完成軟件和流程的測試工作。)

        利益沖突所有作者均聲明不存在利益沖突

        作者貢獻聲明王晶:搭建、測試平臺,進行試驗或調(diào)查,撰寫論文;劉旭:平臺數(shù)據(jù)測試;段犖:不同版本BIONEO操作流程比較;程杉:設(shè)計課題,審訂論文

        猜你喜歡
        分析課程學(xué)生
        數(shù)字圖像處理課程混合式教學(xué)改革與探索
        隱蔽失效適航要求符合性驗證分析
        軟件設(shè)計與開發(fā)實踐課程探索與實踐
        計算機教育(2020年5期)2020-07-24 08:53:38
        為什么要學(xué)習(xí)HAA課程?
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        趕不走的學(xué)生
        學(xué)生寫話
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        學(xué)生寫的話
        聰明的學(xué)生等
        草草影院国产| 中文字幕在线亚洲日韩6页手机版| 天天爽天天爽天天爽| 尤物网址在线观看| 久久精品国产亚洲一区二区| 国产喷水福利在线视频| 日韩五十路| 日本一区二区在线播放观看| 国产一区二区在线中文字幕| 亚洲av高清天堂网站在线观看| 色窝窝亚洲av网在线观看| 国产精品激情| 97久久天天综合色天天综合色hd | 日韩在线精品免费观看| 美女在线一区二区三区视频 | 日本免费大片一区二区三区 | 人妻人人澡人人添人人爽人人玩| 国产亚洲精品日韩综合网| 91麻豆精品久久久影院| 国产一区二区三区我不卡| 最新系列国产专区|亚洲国产| 国产香蕉97碰碰视频va碰碰看| 国产 中文 制服丝袜 另类 | 亚洲爆乳无码精品aaa片蜜桃 | 亚洲一区二区三区精品视频 | 九九99久久精品在免费线18| 精品免费久久久久国产一区| 色哟哟精品中文字幕乱码| 一本之道日本熟妇人妻| 久久精品国产99国产精偷| 久激情内射婷内射蜜桃人妖| 精品人妻伦九区久久AAA片69| 丰满多毛少妇做爰视频| 丰满少妇高潮在线观看| 国产av精品一区二区三区久久 | 特黄做受又硬又粗又大视频小说 | 男吃奶玩乳尖高潮视频| 激情影院内射美女| 亚洲AV综合A∨一区二区| 亚洲在线视频一区二区| 日韩有码在线一区二区三区合集 |