亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        R語言在分子流行病學中的應用

        2023-12-04 08:51:28宋花玲
        數理醫(yī)藥學雜志 2023年11期
        關鍵詞:流行病學語言研究

        吳 娜,宋花玲

        上海中醫(yī)藥大學公共健康學院(上海 201203)

        分子流行病學作為醫(yī)學院校公共衛(wèi)生與預防醫(yī)學專業(yè)研究生的公共基礎課,不僅可以幫助醫(yī)學研究生探索疾病傳播和控制的科學意義及環(huán)境對人類健康的影響,還能從分子標記的角度了解飲食和營養(yǎng)影響人類健康的內在生物學機制。目前,大數據在識別和干預人口健康決定因素方面具有革命性意義,被認為是未來科學的革命性發(fā)展。為積極應對大數據時代的挑戰(zhàn),公共衛(wèi)生尤其流行病學相關專業(yè)的研究生不僅需要掌握傳統流行病學的方法,還應該熟知分子流行病學相關知識,尤其是通過R 語言編程處理大數據,通過大數據確定人口健康的干預目標。為培養(yǎng)相關大數據人才適應社會發(fā)展需求,醫(yī)學院校教師有必要在傳統流行病學的基礎上,指導研究生掌握新興技術和大數據分析方法,將R 語言應用于分子流行病學研究,推動分子流行病學領域的發(fā)展。

        1 分子流行病學概述

        1.1 分子流行病學的定義和應用

        分子流行病學是一種將先進的生物學實驗方法納入傳統流行病學,以確定疾病病因并提出相應預防和干預措施的科學[1-2]。它越來越多地被作為一種了解外部環(huán)境暴露與遺傳及其他易感因素間相互作用的工具,從而確定易感人群,被廣泛應用于遺傳及代謝性疾病。

        1973 年,Kilbourne 在“流感的分子流行病學”一文中首次引入了分子流行病學的概念[3]。隨著第一本關于分子流行病學的書籍《分子流行病學:原理與實踐》的出版,這個術語變得更加正式[1]。分子流行病學主要研究遺傳和環(huán)境因素在分子或細胞階段的作用及其相互作用。2003 年人類基因組計劃完成DNA 全測序工作是該領域的一個突破。隨著基因分型和高通量測序技術的發(fā)展,研究人員可以全方位評估人類的DNA、RNA、蛋白質或代謝組分,為更全面地檢測與疾病風險因素和途徑相關的潛在生物學變異奠定了基礎。另外,高通量技術豐富了研究人員對疾病表型-基因型關聯的理解,有助于尋找疾病的生物標志物,并利用其識別易感人群,從而幫助臨床醫(yī)生為患者制定個性化的治療方案。分子流行病學通過各種工具研究疾病的生物標志物,如DNA 甲基化譜、蛋白質譜、代謝物或新基因,有助于發(fā)現疾病的病因和決定因素,進而預防疾病以達到改善公眾健康的目的。

        1.2 分子流行病學在醫(yī)學院校研究生教育中的作用

        傳統流行病學是研究人群中疾病與健康狀況的分布及其影響因素,以及防治疾病及促進健康的策略和措施的科學[4]。分子流行病學作為傳統流行病學與分子生物學的交叉學科,強調通過先進的技術檢測生物學標志的分布情況,借助傳統流行病學的研究方法,從更深層次即分子或基因水平闡明疾病的病因及其致病過程[5]。分子流行病學是由傳統流行病學學科發(fā)展的需求,以及分子生物學理論和技術的巨大成就相結合的產物,是近十幾年迅速發(fā)展的一門流行病學新分支[6]。

        分子流行病學課程在醫(yī)學院校研究生教育中起著至關重要的作用[7]:①疾病診斷和預防。研究生能夠了解不同疾病的分子機制,如遺傳變異、突變和表達模式,這些知識對于疾病診斷、預后評估和預防是必不可少的。通過學習如何利用分子工具和技術識別病原體,研究疾病病因,有助于制定個性化醫(yī)療和預防策略。②藥物開發(fā)和治療研究。分子流行病學是藥物開發(fā)和治療研究的工具。通過掌握分子技術評估藥物的有效性和安全性,可以獲得有關藥物代謝、藥物靶標相互作用和藥物作用機制的知識,這些知識對于研究和開發(fā)新的治療方法和個性化藥物至關重要。③流行病學研究的設計和分析。通過學習設計和開展分子流行病學研究,掌握分析大規(guī)模分子數據的統計和生物信息學方法,對于研究疾病的遺傳和環(huán)境風險因素、建立疾病預測模型和評估干預措施的有效性具有指導意義。④研究技能和科學素養(yǎng)的培養(yǎng)。分子流行病學教育不僅注重傳授理論知識,而且注重培養(yǎng)研究技能和科學素養(yǎng),包括學習文獻綜述,制定研究假設,設計實驗方案,收集和分析數據等。

        2 R語言與SPSS軟件的比較

        2.1 R語言的特點

        R 是一種用于統計計算和圖形繪制的編程語言,由統計學家Ross Ihaka 和Robert Gentleman創(chuàng)建,核心R 語言由大量包含可重復使用的代碼和文檔的擴展包組成[8-9]。在過去的三十年里,R 語言在統計學和生物信息學領域發(fā)揮了重要作用,目前已產生了數以萬計的擴展包,涉及范圍從機器學習(如支持向量機、隨機森林、人工神經網絡等)到單核苷酸多態(tài)性(single nucleotide polymorphisms, SNPs)數據、轉錄組數據和DNA甲基化數據分析等[10-12]。

        R 語言具有以下特點[13]:①開源性,可以免費下載,并提供復雜的數據分析功能,同時還有一個活躍的在線用戶社區(qū),使用者們可以在其中尋求幫助。②跨平臺的編程語言,其代碼可以在多個操作系統上運行,程序員只需編寫一次程序。③可以進行各種機器學習操作,如分類、回歸以及開發(fā)人工神經網絡的各種擴展包。④可以繪制高質量圖片,通過ggplot2 和plotly 等R 包制作精美圖片。⑤在CRAN 存儲庫中存有超過10 000 個擴展包,可以執(zhí)行各種數據分析功能。⑥既能使數據可視化,又能連接外部數據庫如基因表達綜合數據庫(Gene Expression Omnibus,GEO)、京都基因與基因組百科全書數據庫(Kyoto Encyclopedia of Genes and Genomes, KEGG)等以執(zhí)行高級生物統計功能。⑦作為一種不斷發(fā)展的編程語言,每當添加任何新功能時,R 都會提供更新服務,便于廣大用戶使用。

        2.2 SPSS軟件的特點

        SPSS(statistical product and service solutions)是一種數據統計分析軟件,由SPSS 有限公司于1968 年推出,2009 年被國際商業(yè)機器公司(International Business Machines Corporation, IBM)收購。由于SPSS 簡單易操作,常被用于數據處理、市場調查等。

        SPSS 具有以下特點:①不需要編程,簡單易上手;②不適用于大數據分析,如分子流行病學中有關SNPs、轉錄組學及DNA 甲基化等大數據;③作為一款商業(yè)軟件包,正版軟件需要付費才可以使用。

        2.3 R語言與SPSS軟件的比較

        分子流行病學是一門探究疾病病因相關分子生物標記的學科,SNPs 數據、轉錄組學數據及DNA 甲基化數據等分子生物標記均屬于大數據集,越來越多的研究人員選擇使用R 語言中的各種擴展包進行分析,而SPSS 更適合分析樣本量較少的人類測量學數據及血液學指標,見表1。分子流行病學的教學目的之一是培養(yǎng)研究生掌握大數據處理與分析的能力以適應和滿足社會需求。研究者可根據自身需要選擇合適的統計軟件,考慮到R 語言在大數據處理上的優(yōu)勢,在分子流行病學研究中更推薦使用R 語言。

        表1 R語言與SPSS軟件的比較Table 1. Comparison between R language and SPSS software

        3 R語言在分子流行病學中的應用

        分子流行病學側重研究生物標記物在疾病病因、風險評估和預防研究中的應用。通過選擇和驗證不同種類的生物標記物,采用不同的研究設計和R 語言數據分析方法[14]。本研究通過案例介紹R 語言在分子流行病學生物標記物SNPs 和DNA 甲基化修飾數據分析中的應用。

        3.1 R語言應用于非酒精性脂肪肝的SNPs位點篩選

        易感基因的SNPs 位點是分子流行病學重點關注的一類生物標記物,也是分子流行病學課程教學的重要內容。利用R 語言中的SNPassoc 包的association 函數分析非酒精性脂肪肝(non-alcoholic fatty liver disease, NAFLD)的易感基因SNPs 在五種遺傳模型下的基因型頻率,操作簡單,結果展示清晰明了。具體代碼如下:

        > setwd

        > library(openxlsx)

        > File<- read.xlsx("NAFLD.xlsx",5)

        > File[File=="0 0"]<-NA

        > File[File=="NA"]<-NA

        > File[File==""]<-NA

        > File<-as.data.frame(File)

        > write.csv(File, file = "NAFLD_1.csv")

        > library(SNPassoc)

        > names(File)

        > File.1<- setupSNP(File,colSNPs=2,sep="")

        > zlassoc<- WGassociation(NAFLD~1,data=File.1)

        > zlassoc

        > dev.new()

        > plot(zlassoc,ylim = c(-0,-2))

        > write.csv(zlassoc,"NAFLD_5model.csv")

        > asso<- association(NAFLD~rs1260326,data=File.1)

        > asso

        > write.csv(asso,"rs1260326_result.csv")

        表2 展示了rs1260326 在五種遺傳模型下基因型的頻率,NAFLD 的葡萄糖調節(jié)蛋白基因(glucokinase regulator, GCKR)的rs1260326 位點在顯性模型(P=0.038)和超顯性模型(P=0.040)下具有統計學意義。

        表2 SNPs位點在五種遺傳模型下的基因型頻率分布Table 2. Genotype frequency distribution of SNPs loci under five genetic models

        3.2 R語言應用于非酒精性脂肪肝的DNA甲基化修飾標記篩選

        在后基因組時代,隨著高通量技術成本的降低,海量組學數據與研究結果展現了生命現象的復雜性。目前,分子流行病學研究越來越傾向于從多組學的角度出發(fā),從遺傳和表觀遺傳到轉錄和代謝,從機制到表型,進行整合研究以得到全局結果。DNA 甲基化是表觀遺傳學中研究最多的一種修飾,是將甲基基團(CH3)轉移至DNA,從而使基因活性發(fā)生改變的修飾方式。

        在當前的科研需求下,Illumina 的甲基化芯片Infinium Methylation EPIC BeadChip(簡稱850k 芯片)可以檢測超過853 000 個CpG 位點,全面覆蓋CpG 島、啟動子、編碼區(qū)、開放染色質和增強子,提供了性能優(yōu)越且經濟可靠的解決方案。R 語言中CHAMP 包的CpG.GUI 函數可以分析CpG 位點在染色體、CpG 島、轉錄起始區(qū)域(transcription star site, TSS)的分布情況,見圖1。

        圖1 NAFLD患者與健康人群DNA甲基化的分布情況Figure 1. Distribution of DNA methylation between NAFLD patients and healthy people

        差異甲基化位點的篩選是數據分析過程的主要環(huán)節(jié),R 語言中CHAMP 包的champ.DMP()函數可以計算差異甲基化,使用ggplot2 包可以繪制火山圖,以展示NAFLD 患者相比于健康人群的差異甲基化位點,見圖2。

        圖2 NAFLD的差異DNA甲基化位點Figure 2. Differential DNA methylation sites in NAFLD

        4 結語

        本文通過比較R 語言和SPSS 軟件的特點,重點探討了R 語言在分子流行病學中的應用,R語言具有強大的繪圖及數據分析能力,在大數據處理與分析上更具優(yōu)勢。醫(yī)學類高等院校教師應根據時代要求和現實需要,培養(yǎng)研究生掌握應用R 語言處理和分析大數據的能力,進一步滿足分子流行病學領域的研究需求。

        猜你喜歡
        流行病學語言研究
        FMS與YBT相關性的實證研究
        羊細菌性腹瀉的流行病學、臨床表現、診斷與防治措施
        遼代千人邑研究述論
        羊球蟲病的流行病學、臨床表現、診斷和防治措施
        新型冠狀病毒及其流行病學特征認識
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        視錯覺在平面設計中的應用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        EMA伺服控制系統研究
        讓語言描寫搖曳多姿
        一起疑似霉變蛋撻引起食物中毒的流行病學調查
        午夜性刺激免费看视频| av无码电影一区二区三区| 亚洲一区久久久狠婷婷| 在线播放草猛免费视频| 四虎影视成人永久免费观看视频| 婷婷久久av综合一区二区三区| 极品尤物一区二区三区| 久久久久久久久久久国产| 日本在线观看不卡| 国产精品人成在线观看不卡| 亚洲成a∨人片在线观看无码 | 久久久久久中文字幕有精品| 国产精品爽爽VA吃奶在线观看| 国产成人av区一区二区三| 午夜精品久久久久久久久| 激情偷乱人成视频在线观看| 国产69久久精品成人看| 亚洲精品aa片在线观看国产| 国产肉体XXXX裸体784大胆| 综合久久一区二区三区| av天堂午夜精品一区| 久久人人妻人人做人人爽| 国产成人精品日本亚洲直播| av在线不卡免费中文网| 少女韩国电视剧在线观看完整| 中文无码成人免费视频在线观看| 国产99精品精品久久免费| 久久99热只有频精品8国语| 凹凸在线无码免费视频| 亚洲av日韩av综合aⅴxxx| 少妇人妻精品一区二区三区视| 亚洲人成网站在线播放2019| 理论片87福利理论电影| 国产一在线精品一区在线观看| 成人国产乱对白在线观看| 亚洲最大在线视频一区二区| 亚洲欧美国产国产综合一区| 久久无码一一区| 青青操视频手机在线免费观看| 天堂а在线中文在线新版| 国产精品爽黄69天堂a|