亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于R語(yǔ)言的醫(yī)學(xué)院校生物信息學(xué)專業(yè)統(tǒng)計(jì)課程教學(xué)探索

        2021-12-24 08:13:36段巍巍成佳雯呂颯麗
        科技風(fēng) 2021年33期
        關(guān)鍵詞:R語(yǔ)言生物信息學(xué)統(tǒng)計(jì)學(xué)

        段巍巍 成佳雯 呂颯麗

        關(guān)鍵詞:R語(yǔ)言;統(tǒng)計(jì)學(xué);生物信息學(xué);教學(xué)

        21世紀(jì)以來(lái),隨著生物醫(yī)學(xué)研究技術(shù)的蓬勃發(fā)展,生物醫(yī)學(xué)相關(guān)領(lǐng)域,包括臨床醫(yī)療、公共衛(wèi)生、生物學(xué)、環(huán)境監(jiān)測(cè)等,產(chǎn)生的多層面數(shù)據(jù)出現(xiàn)井噴式增長(zhǎng)。生物醫(yī)學(xué)數(shù)據(jù)的分析離不開生物醫(yī)學(xué)、計(jì)算機(jī)科學(xué)、數(shù)理統(tǒng)計(jì)學(xué)和信息科學(xué)等多個(gè)領(lǐng)域的交叉融合。而生物信息學(xué)(bioinfor-matics)就是在生物組學(xué)數(shù)據(jù)爆發(fā)增長(zhǎng)的基礎(chǔ)上應(yīng)運(yùn)而生的一門新興交叉學(xué)科。它包含了對(duì)核酸(DNA、RNA)和蛋白質(zhì)的序列和結(jié)構(gòu)信息的獲取、整理、存儲(chǔ)、分析和解釋等多方面內(nèi)容,用以揭示生物體生理病理過(guò)程的分子機(jī)制,探索生命奧秘。生物信息學(xué)算法的開發(fā)為后續(xù)分析提供強(qiáng)大的技術(shù)支撐,而概率統(tǒng)計(jì)構(gòu)成了大多數(shù)軟件算法的理論基礎(chǔ)。

        統(tǒng)計(jì)學(xué)作為一門收集、整理、分析數(shù)據(jù)的一門科學(xué),已經(jīng)廣泛應(yīng)用到生物醫(yī)學(xué)研究的各個(gè)領(lǐng)域,包括生物信息在內(nèi)的生物醫(yī)學(xué)相關(guān)專業(yè)的基礎(chǔ)課程。以筆者所在專業(yè)為例,主要設(shè)置了概率論與數(shù)理統(tǒng)計(jì)、生物統(tǒng)計(jì)和多元統(tǒng)計(jì)三門課程,亦會(huì)在后續(xù)專業(yè)課中穿插講解生物信息領(lǐng)域主流的統(tǒng)計(jì)學(xué)方法。然而,與其他醫(yī)學(xué)基礎(chǔ)課程不同的是,統(tǒng)計(jì)學(xué)教學(xué)過(guò)程中不可避免地涉及復(fù)雜的公式和抽象的定義,這成為針對(duì)醫(yī)學(xué)院校學(xué)生的教學(xué)難點(diǎn)。針對(duì)這一共性問(wèn)題,很多學(xué)者給出了一些解決方案,較為一致的觀點(diǎn)就是充分利用統(tǒng)計(jì)學(xué)軟件的數(shù)據(jù)模擬和圖形可視化功能。本文將借助于R語(yǔ)言強(qiáng)大的數(shù)據(jù)模擬和繪圖功能對(duì)統(tǒng)計(jì)教學(xué)支撐做了初步探討,并給一些應(yīng)用實(shí)例和建議。

        一、R語(yǔ)言介紹

        R語(yǔ)言是一種專門用于統(tǒng)計(jì)分析和作圖的編程語(yǔ)言和軟件環(huán)境。相較于其他權(quán)威商業(yè)化統(tǒng)計(jì)軟件,如SAS、STATA、SPSS,R語(yǔ)言具有小巧、免費(fèi)、開源、易擴(kuò)展、功能強(qiáng)大、接口豐富和更新快等諸多優(yōu)勢(shì),尤其是其強(qiáng)大的圖形可視化功能讓人津津樂(lè)道。不僅如此,R語(yǔ)言擁有豐富的幫助文檔、強(qiáng)大學(xué)者交流社區(qū)資源,使得初學(xué)者更容易上手;此外R語(yǔ)言還可以直接調(diào)用c、c++或Fortran語(yǔ)言進(jìn)行分析。這一系列優(yōu)良的特點(diǎn)使得它不僅在科研領(lǐng)域里叱咤風(fēng)云,近些年在國(guó)內(nèi)外教學(xué)領(lǐng)域里也得到廣泛的重視和應(yīng)用。R語(yǔ)言中的統(tǒng)計(jì)教學(xué)常用模塊包括:分布函數(shù)、統(tǒng)計(jì)函數(shù)、數(shù)據(jù)管理、統(tǒng)計(jì)作圖和統(tǒng)計(jì)分析。然而現(xiàn)有R語(yǔ)言的上機(jī)教學(xué)主要傾向于統(tǒng)計(jì)方法在數(shù)據(jù)展示和分析中的應(yīng)用(包括統(tǒng)計(jì)繪圖、基本統(tǒng)計(jì)分析、回歸、聚類分析等),較少講解軟件的統(tǒng)計(jì)模擬應(yīng)用,而這一部分對(duì)于學(xué)生升入理解統(tǒng)計(jì)學(xué)的抽樣理論大有裨益。

        二、R語(yǔ)言和生物信息學(xué)

        醫(yī)學(xué)類院校的生物信息學(xué)專業(yè)培養(yǎng)的生物信息人才應(yīng)具有堅(jiān)實(shí)生物醫(yī)學(xué)理論基礎(chǔ)和扎實(shí)生物信息學(xué)分析技術(shù),可快速服務(wù)于精準(zhǔn)醫(yī)學(xué)產(chǎn)業(yè)。而完成這樣的目標(biāo)必不可缺的就是計(jì)算機(jī)實(shí)踐教學(xué),其中R語(yǔ)言又是生信分析最主要的工具之一,它廣泛應(yīng)用于基因組、轉(zhuǎn)錄組、表觀遺傳組、蛋白質(zhì)組、代謝組等各個(gè)組學(xué)數(shù)據(jù)的分析。例如,用ShortRead程序包對(duì)RNA-seq數(shù)據(jù)的序列質(zhì)量進(jìn)行評(píng)估,使用DESeq2包進(jìn)行差異表達(dá)基因的篩選,使用clusterProfile包進(jìn)行基因功能富集分析。還有針對(duì)腫瘤研究領(lǐng)域特定問(wèn)題的R包,如基于轉(zhuǎn)錄組數(shù)據(jù)計(jì)算樣本腫瘤純度的Estimate包。此外,各生信相關(guān)R包還自帶有豐富的可視化模塊。

        三、R語(yǔ)言輔助統(tǒng)計(jì)教學(xué)的探索和實(shí)踐

        當(dāng)前統(tǒng)計(jì)學(xué)課程教學(xué)過(guò)程中依然存在諸多問(wèn)題,其中一個(gè)典型問(wèn)題是:與其他醫(yī)學(xué)課程相比,統(tǒng)計(jì)學(xué)本身深?yuàn)W的理論知識(shí)和抽象的概念增加了學(xué)生的學(xué)習(xí)難度,降低了學(xué)習(xí)興趣。醫(yī)學(xué)院校的統(tǒng)計(jì)教學(xué)通常對(duì)統(tǒng)計(jì)理論的推導(dǎo)不作要求,更多的是要求學(xué)生能夠理解基本概念和相關(guān)理論并靈活運(yùn)用統(tǒng)計(jì)方法。而充分利用統(tǒng)計(jì)軟件進(jìn)行教學(xué)輔助可以在很大程度上解決概念抽象化的問(wèn)題,有助于培養(yǎng)學(xué)生的統(tǒng)計(jì)學(xué)思維。針對(duì)此,相關(guān)研究者提出開發(fā)模擬軟件用以驗(yàn)證統(tǒng)計(jì)學(xué)的一些概念和抽象理論。此外,R語(yǔ)言中亦有輔助統(tǒng)計(jì)教學(xué)的R包,如TeachingDemos包、animation包。然而,這些封裝好的軟件或函數(shù)并不利于學(xué)生對(duì)統(tǒng)計(jì)概念或方法的深層次理解,不利于學(xué)生編程能力的培養(yǎng)。

        該數(shù)據(jù)模擬步驟展示了統(tǒng)計(jì)量的隨機(jī)屬性,驗(yàn)證了中心極限定理的內(nèi)容,對(duì)于學(xué)生難以區(qū)分的標(biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差概念亦有很好的說(shuō)明。學(xué)生還可以自行更改樣本量的大小來(lái)查看標(biāo)準(zhǔn)誤與樣本量的關(guān)系。相對(duì)于理論推導(dǎo)各種抽樣分布,使用數(shù)據(jù)模擬的方式驗(yàn)證理論結(jié)果更容易讓數(shù)學(xué)基礎(chǔ)薄弱的同學(xué)們接受。上述代碼可以封裝成更為“專業(yè)”的自定義函數(shù),但我們認(rèn)為這不利于學(xué)生通過(guò)每一步代碼來(lái)深刻理解抽樣分布的概念。

        實(shí)例2:可信區(qū)間的含義

        參數(shù)的可信區(qū)間(置信區(qū)間)估計(jì)是總體參數(shù)估計(jì)的內(nèi)容之一,表示按照一定的可信度(1-d)用一個(gè)區(qū)間來(lái)估計(jì)總體參數(shù)所在范圍。以正態(tài)分布總體均數(shù)的95%可信區(qū)間估計(jì)為例,其計(jì)算公式比較簡(jiǎn)單。然而在學(xué)生學(xué)習(xí)過(guò)程中,真正的困難在于理解可信區(qū)間的含義。在算得某總體參數(shù)的95%可信區(qū)間,學(xué)生會(huì)誤以為“有95%的總體參數(shù)在該區(qū)間內(nèi)”或是“總體參數(shù)有95%的可能落在該區(qū)間”。在總體方差已知時(shí),總體均數(shù)95%可信區(qū)間為由于x是隨機(jī)變量,因此該區(qū)間是一個(gè)隨機(jī)區(qū)間。當(dāng)根據(jù)手頭樣本來(lái)計(jì)算可信區(qū)間時(shí),此時(shí)的x就是確定的常數(shù),該區(qū)間就變成了一個(gè)固定區(qū)間,其是否包含總體均數(shù)就不再是隨機(jī)事件了。因此,95%這個(gè)可信度是針對(duì)于構(gòu)建可信區(qū)間的方法而言的,而非針對(duì)某一個(gè)已估計(jì)出來(lái)的區(qū)間。可以通過(guò)R代碼的方式來(lái)解釋該概念:

        從圖中可以看出,基于100次重復(fù)抽樣算得總體均數(shù)100個(gè)可信區(qū)間,有95個(gè)區(qū)間包含了總體均數(shù)0,還有5個(gè)不包含,即95%的可信度允許有5%的錯(cuò)誤。而實(shí)例分析中基于手頭隨機(jī)樣本算得的95%可信區(qū)間,就可以認(rèn)為是圖中100個(gè)區(qū)間的某一個(gè),該區(qū)間要么包含總體均數(shù)要么不包含,二者必居其一,是確定性事件。學(xué)生就能清晰地認(rèn)識(shí)到實(shí)例中算得的一個(gè)區(qū)間,其背后對(duì)應(yīng)的是重復(fù)抽樣的思想,而可信度是從整體角度評(píng)價(jià)方法的可靠程度。

        四、結(jié)語(yǔ)

        統(tǒng)計(jì)學(xué)課程本身的特點(diǎn)使得學(xué)生在學(xué)習(xí)過(guò)程中存在各種各樣的困難,而如何讓學(xué)生學(xué)好統(tǒng)計(jì)、對(duì)統(tǒng)計(jì)學(xué)感興趣,還需要統(tǒng)計(jì)教育工作者不斷探索和努力。在統(tǒng)計(jì)教學(xué)中引入專業(yè)的統(tǒng)計(jì)軟件——R語(yǔ)言,借助于其強(qiáng)大的模擬和繪圖功能,通過(guò)程序設(shè)計(jì)將統(tǒng)計(jì)中晦澀難懂的概念和方法程序化、可視化,從而促進(jìn)學(xué)生的學(xué)習(xí)和理解,激發(fā)興趣,同時(shí)也有助于提升學(xué)生的統(tǒng)計(jì)編程能力、解決實(shí)際問(wèn)題的能力。正是由于R語(yǔ)言、統(tǒng)計(jì)學(xué)和生物信息學(xué)環(huán)環(huán)相扣的關(guān)系,在統(tǒng)計(jì)學(xué)課程中開展R語(yǔ)言上機(jī)實(shí)驗(yàn)課程不僅可以輔助于統(tǒng)計(jì)教學(xué),也可以為后續(xù)生物信息學(xué)各專業(yè)課的學(xué)習(xí)打下實(shí)踐操作基礎(chǔ)。

        猜你喜歡
        R語(yǔ)言生物信息學(xué)統(tǒng)計(jì)學(xué)
        關(guān)于投稿的統(tǒng)計(jì)學(xué)要求
        統(tǒng)計(jì)學(xué)符號(hào)使用的說(shuō)明
        統(tǒng)計(jì)學(xué)符號(hào)使用的說(shuō)明
        本刊對(duì)來(lái)稿中統(tǒng)計(jì)學(xué)處理的有關(guān)要求
        基于GPS軌跡數(shù)據(jù)進(jìn)行分析改善城市交通擁擠
        基于R語(yǔ)言的Moodle平臺(tái)數(shù)據(jù)挖掘技術(shù)的研究
        “PBL+E—learning”教學(xué)模式探索
        移動(dòng)教學(xué)在生物信息學(xué)課程改革中的應(yīng)用
        今傳媒(2016年11期)2016-12-19 11:35:50
        中醫(yī)大數(shù)據(jù)下生物信息學(xué)的發(fā)展及教育模式淺析
        數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用
        久久综合这里只有精品| 亚洲精品永久在线观看| 国产女人高潮叫床免费视频| 法国啄木乌av片在线播放| 国产精品自线在线播放| 美女被黑人巨大入侵的的视频| 欧美成人午夜免费影院手机在线看 | 日本道免费精品一区二区| 手机在线国产福利av| 中文字幕av伊人av无码av| 97夜夜澡人人爽人人喊中国片| 99这里只有精品| 久久婷婷综合色拍亚洲| 色婷婷久色国产成人免费| 色又黄又爽18禁免费网站现观看| 成人无码免费一区二区三区| 蜜桃在线播放免费一区二区三区| 国产免费人成视频在线观看播放播| 女人高潮久久久叫人喷水| a国产一区二区免费入口| 日日躁欧美老妇| 日本二区在线视频观看| 国产裸体舞一区二区三区| 香蕉色香蕉在线视频| 中文字幕久区久久中文字幕| 99久久99久久精品国产片| 亚洲精品乱码8久久久久久日本 | 91最新免费观看在线| 免费在线不卡黄色大片| 天堂中文а√在线| a级毛片无码免费真人| 国产免费人成视频在线播放播| 亚洲一区二区三区免费的视频| 国产精品免费看久久久无码| 两个人看的www中文在线观看| 国产精品亚洲av国产| 男女啪啪啪的高清视频| 99精品久久99久久久久| 国产96在线 | 欧美| 国产亚洲精选美女久久久久| 日本视频一中文有码中文|