湯在祥
大數據背景下醫(yī)學統(tǒng)計學教學的思考
湯在祥
(蘇州大學醫(yī)學部公共衛(wèi)生學院,江蘇蘇州215006)
在現(xiàn)今大數據時代的背景下,醫(yī)學統(tǒng)計學的發(fā)展以生命科研相關的數據信息為核心,無疑這對統(tǒng)計學這門工具學科產生了大量的需求。近年來,大數據所具有的數據特征使得部分傳統(tǒng)統(tǒng)計方法不再適用,迫切需要針對大數據的特征,以服務和滿足各領域需求為目標,不斷創(chuàng)新和發(fā)展數據分析方法與理論。在醫(yī)學統(tǒng)計學的教學過程中,迫切需要把新的統(tǒng)計學技術方法應用于教學實踐,使得學生們能夠迅速適應生命科學大數據的時代。
大數據;醫(yī)學統(tǒng)計學;統(tǒng)計方法
近年來,大數據已成為各個行業(yè)領域,包括醫(yī)學研究,健康醫(yī)療行業(yè)的熱門詞匯,醫(yī)學大數據孕育著巨大的價值,驅動著醫(yī)學科學的進步。在醫(yī)學研究和醫(yī)療行業(yè),借助先進的科學技術手段,以及創(chuàng)新的數據收集方式,已經積累并正在迅速積累著大量的數據,這些醫(yī)學大數據必將轉化為醫(yī)學科技進步的巨大動力。然而在這一進程中,統(tǒng)計學工具如何進步,特別是醫(yī)學統(tǒng)計學教學如何變革,如何在教學內容教學方法上適應醫(yī)學大數據的到來是醫(yī)學統(tǒng)計教學改革思考的重點。
大數據并不具備一個十分明確的概念,大數據起源于計算機和互聯(lián)網領域。在信息量逐步增多的情況下,使得計算機的存儲空間不足。另外,隨著新的數據收集和數據處理技術的產生,如大規(guī)模的測序分析技術,在生物醫(yī)學的組學技術,互聯(lián)網的搜索,智能手機的各種應用,智能手環(huán)等,這些技術不僅能夠大規(guī)模地收集生產數據,也能夠對復雜的數據進行程序化處理,極大程度地提升了人們可處理的數據量。
在維基百科中,大數據被定義為所涉及的數據量巨大且復雜,以至于無法通過傳統(tǒng)的數據處理工具和手段將其整理為人類所能解讀的信息。目前,被普遍接受的大數據定義是3V定義,即Volume、Variety以及Velocity,即要求數據產生速度快,變量多,類型復雜,數據體量大,而且處理速度快[1]。后來,人們又增加了Veracity(真實性)及Value(有價值)兩個特性[2]。由以上的概念可以看出,大數據的定義并不嚴密。首先,對于“多大的數據量算是大數據”沒有清晰的定義;其次,“傳統(tǒng)工具和方法的處理能力”這個參照也不是一個明確的標準,因為隨著技術的不斷進步和時間的變化,處理數據的能力會隨之提高,所謂現(xiàn)代工具也將成為傳統(tǒng)方法,再次,所謂數據產生的速度,體量,價值等都是相對的概念,不同的人從不同的角度都會有不同的認識。盡管沒有關于大數據的明確概念,但對大數據所具備的特征已有一定的判斷,對大數據的認識在不斷加深。
在醫(yī)學領域,醫(yī)學大數據包括:生物信息數據、醫(yī)療數據、衛(wèi)生數據、藥物數據、人類健康數據等,這些大數據的產生主要得益于下一代測序技術、生物信息學,電子臨床工具發(fā)展,以及數字醫(yī)療的興起。特別是生物信息數據,不僅僅來源于高通量的基因組和轉錄組測序,其他高通量組學數據,例如單細胞表型數據、動態(tài)生物醫(yī)學圖像等數據量也正在急劇增長。生命科學的快速進步,使得大數據貫穿從基礎研究到藥物開發(fā)到臨床診療到健康管理的所有環(huán)節(jié)?;谀壳吧镝t(yī)學大數據的現(xiàn)狀我們可以發(fā)現(xiàn),生物醫(yī)學大數據的研究正處于蓄勢待發(fā)狀態(tài),然而,適應于生物醫(yī)學大數據的軟件平臺、大數據分析挖掘的統(tǒng)計方法等還不成熟,制約著生物大數據的開發(fā)和利用。一旦適應與大數據的一整套統(tǒng)計策略獲得突破,生物醫(yī)學大數據將會全方位地支撐生物醫(yī)學研究的深入,進而有助于對醫(yī)學現(xiàn)象的分析和預測,不僅有利于基礎研究的迅速進展,更將有利于公共衛(wèi)生,醫(yī)療與醫(yī)藥開發(fā)等方面,大數據將以其自有的價值服務于廣泛生物醫(yī)學研究與應用。
(一)假設驅動與數據驅動的思維模式
傳統(tǒng)統(tǒng)計研究過程包括統(tǒng)計設計、收集數據、整理數據和分析數據四個基本環(huán)節(jié)。統(tǒng)計推斷是數據分析的關鍵,而假設檢驗是統(tǒng)計推斷的核心。以假設為基礎的研究可統(tǒng)稱為假設驅動型研究。假設驅動型研究有其特定的發(fā)展歷史背景。一般而言,某學科領域的初期研究一般是從大量的實驗現(xiàn)象的觀測開始的。此時,研究者對整個學科的認識缺少系統(tǒng)全面的認識,不同研究者只是在各自的研究角度發(fā)現(xiàn)各種自然現(xiàn)象,這些現(xiàn)象間很可能存在一致性,也可能存在沖突。不同的研究者似乎在盲人摸象,而各個研究者的認識往往離所要認識對象的本來面目可能相去甚遠。這一時期的科學研究被稱為假設驅動型研究,即通過若干實驗現(xiàn)象來驗證某一個科學假設。此時期的研究非常強調對實驗現(xiàn)象的客觀性描述,強調實證主義研究風格。假設驅動是科學研究的一般模式,生物醫(yī)學研究當前基本處在這一階段,適應這一階段需求的統(tǒng)計學分析工具,也以此為基礎而誕生。
生命科學領域的數據驅動,是一個嶄新的命題,它涉及很多新的概念和術語,也催生了各種新的統(tǒng)計學方法。借助具有廣度和深度的生物醫(yī)學大數據,人們能夠對生命科學中的各種現(xiàn)象重新認識,在新的方向助力人類健康。隨著生物信息學技術的進步,數據的體量和變量類型不斷增加,且可獲性越來越便利,又極大地促進了數據收集技術和數據分析方法的發(fā)展,包括數據整個生命周期中涉及的所有技術,如數據的收集、存儲、處理、分析等。
假設驅動和數據驅動,在本質上有這顯然的不同,然而目前的醫(yī)學統(tǒng)計學的教科書基本上二十年沒有變化,與時俱進的教學改革十分迫切。
在醫(yī)學統(tǒng)計的四個工作步驟中,研究設計,數據收集,數據整理,數據分析還基本圍繞這假設驅動的框架,以假設為前提,設計研究方案,然后收集整理分析數據。統(tǒng)計學的基本步驟依然是我們執(zhí)行研究的綱領,然而在內涵上需要拓展與深化。在研究方案的制定上,要考慮到影響生命醫(yī)學現(xiàn)象的關鍵要素,也要考慮到相關聯(lián)的其他要素。在數據類型上,除了常規(guī)以數據形式記錄到的數據外,圖像,音頻,文本形式的數據也要納入思考。在數據收集上,要能夠借助先進的電子化數據采集策略。在分析方法上,教科書上現(xiàn)有的統(tǒng)計分析方法,可能已經捉襟見肘,需要介紹當前流行的適用于大數據的統(tǒng)計分析新方法。無論我們面對的數據是已經積累到的大數據,還是將要收集的大數據,要全面的建立大數據總體統(tǒng)計思維,而不再是基本“小樣本”的簡單考慮[3]。在現(xiàn)有的教材中,對大數據本身往往介紹得比較少,對大數據相關的統(tǒng)計學方法更鮮見介紹。而在大數據背景下,數據驅動的教學改進方向,就是教學內容以全數據模式為研究對象,強調對所有的數據進行分析,而不僅僅是開展隨機抽樣;關注變量之間的相互關聯(lián),而不僅僅是強調因果推斷[4]??偟膩碚f,大數據時代的統(tǒng)計學教學,首要改進教材,要能夠突破固有思維限制,建立基于數據驅動的統(tǒng)計新思維[5]。
(二)課程與教學模式的設置
在醫(yī)學院校,本科階段的統(tǒng)計學課程多數以“醫(yī)學統(tǒng)計學”或“衛(wèi)生統(tǒng)計學”課程的形式出現(xiàn),在醫(yī)學院校的課程體系中,一般以專業(yè)基礎課的形式存在。教學內容根據課時數的不一樣,一般覆蓋到相關回歸分析,或多元統(tǒng)計的內容。在部分院校,建立了生物統(tǒng)計系,或預防醫(yī)學的專業(yè),統(tǒng)計相關課程一般會涉及專業(yè)基礎課程,專業(yè)基礎課程主要是指數學類的基礎理論課程(如高等代數、概率論和數理統(tǒng)計等)。作為專業(yè)基礎,其課程設置一般是理論課和實驗課的標配形式,其課時數的配比一般為3:1。其教學模式一般采用的還是以理論教學為主,上機練習為輔,但是教師主要還是依托于教材,對相關理論和方法逐一進行介紹,對涉及的公式和方法進行演示。學生聽和記,真正理解的內容并不多,真正付諸實際應用的就更少了。在如此課程設置下,不同專業(yè)和不同年級的學生都對醫(yī)學統(tǒng)計學課程形成了難學,難懂,難通過考試的印象,學生對這門課程的學習不僅興趣不高,一旦遇到困難,容易對課程產生抵觸心理[6]。此外,現(xiàn)有的教學內容也與大數據時代脫節(jié)。
大數據時代要求培養(yǎng)復合型人才,不僅對本身的專業(yè)精通,更要對統(tǒng)計學工具有深刻的認識和了解。因此醫(yī)學統(tǒng)計學的教學課程和模式的設置,要從單一課程的講解,向復合型轉變。醫(yī)學統(tǒng)計學課程的教學目標,不僅要讓同學具備基本的數據收集、處理和分析的能力,還要對統(tǒng)計學應用領域的背景知識有一定的了解,讓學生熟悉了解海量數據信息的背景知識以及掌握深度開發(fā)和利用海量數據信息的分析方法。在課程設置上,需要對現(xiàn)有教學體系中的專業(yè)基礎課程重新進行調整和設計。對于預防醫(yī)學專業(yè),醫(yī)學統(tǒng)計學作為專業(yè)基礎課,可以設置為兩門到三門課程,內容覆蓋現(xiàn)有的基于假設驅動的統(tǒng)計學基本方法,加強復雜多元統(tǒng)計,時間序列分析等課程內容,增加機器學習或統(tǒng)計學習、模擬研究、數據挖掘、統(tǒng)計軟件等處理復雜大數據的方法的課程[7]。在教學模式上,全面地加強統(tǒng)計軟件的使用,甚至把軟件教學也作為單獨的課程,不僅介紹基本的統(tǒng)計學方法,更要介紹基于大數據的統(tǒng)計學新方法。通過這樣的課程和教學模式的設置,使得學生不僅很好地掌握基本的統(tǒng)計學方法,而且對大數據時代的統(tǒng)計學有全面的認知,通過不斷地教學講解和演示,培養(yǎng)醫(yī)學生的應用能力和大數據思維。
(三)突破實踐教學環(huán)節(jié)薄弱點
醫(yī)學統(tǒng)計學是一門工具學科,具有較強的實踐應用性。盡管與過去相比,現(xiàn)有的專業(yè)教學體系中已經增加了實踐教學環(huán)節(jié),或設置專門的在計算機房進行授課的課程,或在課堂中進行了統(tǒng)計軟件的實踐演示。然而,現(xiàn)有的實踐教學仍然是醫(yī)學統(tǒng)計學教學體系中的薄弱環(huán)節(jié)。主要表型在三個方面:(1)實踐教學的思維模式,現(xiàn)有的實踐教學內容并不是從數據自身出發(fā),而是從假設出發(fā),通過模型來說明假設的是否有統(tǒng)計學意義,這種思維方式與大數據背景下的數據驅動思想不相適應,因為創(chuàng)造模型的目的是適應數據,而不是由假設驅動。在大數據背景下,以假設驅動為主的實踐教學模式已不適應大數據時代的要求;(2)沒有重視數據整理的過程[8]。大數據時代收集到的數據往往是非結構化數據,變量類型復雜,已經不是一般意義上的定性數據和定量數據兩種類型,此外還可能存在這大量缺失或異常值,如何對大規(guī)模的數據實施數據清理在過去的實踐教學中常常被忽視[9]。通過數據整理,獲得可分析的數據,是處理大數據必備的能力;(3)現(xiàn)有的實踐教學中,醫(yī)學生課程主要講授的統(tǒng)計軟件是SPSS和SAS,盡管這兩種軟件功能強大,發(fā)展成熟,但是,大數據時代數據是海量的,變量類型是復雜的,傳統(tǒng)的教學軟件已無法便利地處理這些大數據[10]。
針對這些實踐教學的薄弱環(huán)節(jié),有必要進行相關教學內容的改進,在時間中培養(yǎng)大數據的統(tǒng)計思維,對常常忽視的數據清理教學環(huán)節(jié)要予以足夠的重視,設計相關的教學內容。在軟件教學方面,要分配一定的學時,講解新的統(tǒng)計軟件,如當前流行的R軟件。R軟件是統(tǒng)計領域廣泛使用的開源軟件,R軟件包括了各種常用的數學計算、統(tǒng)計計算的函數和模型,更包括了大量新的適用于大數據分析的統(tǒng)計模型和分析方法,能靈活機動的進行數據分析,甚至創(chuàng)造出符合需要的新的統(tǒng)計計算方法。在大數據背景下,與時俱進地改革實踐教學內容,突破當前實踐教學的瓶頸,在掌握已有基本統(tǒng)計學基礎知識的基礎上,適應大數據時代的要求十分必要。
大數據時代的來臨,無論是課程的理論內容還是教學方法均通過不斷改革而實現(xiàn),醫(yī)學統(tǒng)計學教學的最大的考驗就是大數據背景下,如何訓練培養(yǎng)學生的統(tǒng)計思維。在大數據時代,人們應該關注數據的全面性,思維方式應該從樣本思維轉向總體思維,因為隨著現(xiàn)代互聯(lián)網技術和人工智能技術的發(fā)展,電子化的實時數據采集已經成為可能,人們科學獲得海量的數據,甚至是與之相關的所有數據,并進一步采用新的統(tǒng)計分析技術對數據進行分析,發(fā)現(xiàn)大數據背景下,生命醫(yī)學現(xiàn)象背后的數據關系和機制。這種采用全數據思維方式進行思考問題、解決問題,可以帶來對生命醫(yī)學現(xiàn)象更全面的認識,可以更清楚地發(fā)現(xiàn)樣本無法揭示的細節(jié)信息,更加立體、全面、系統(tǒng)地認識總體狀況??梢姡髷祿尘跋碌慕y(tǒng)計新思維首要的就是總體思維,要習慣于從更高更廣闊的角度思考問題[11]。
在統(tǒng)計推斷的技術方法上,傳統(tǒng)的統(tǒng)計推斷分析過程是以分布理論為基礎,通過概率計算,對總體進行推斷,通常是根據樣本特征去推斷總體特征,檢驗模型的假設。現(xiàn)在,大數據的統(tǒng)計分析過程變成了以實際分布為基礎,直接根據總體的特征進行概率的判斷,大數據所處理的對象幾乎就是總體數據,不強調根據分布理論進行推斷。這里需要說明的是學習大數據的分析方法,不是否定現(xiàn)有統(tǒng)計教材的基本架構,教科書上的基本統(tǒng)計方法仍然是每一個學生必須掌握的內容。
此外,在大數據時代,得益于計算機和網絡技術的突破,大量的生物醫(yī)學數據能夠得到及時的儲存和分析。然而,海量信息避免不了數據點的不精確性,這就要求我們在處理數據時,一方面要有容錯思維,即面對大數據時,不再追求絕對的精準性,適當忽略微觀層面上的精確度,容許一定程度的錯誤與混雜[3];另一方面,要具備足夠的數據清洗能力,有效篩選目標數據,獲得精準的統(tǒng)計分析結果,挖掘出大數據的正真價值[9]。
統(tǒng)計學是門工具學科,除了生物統(tǒng)計學相關專業(yè)的學生外,醫(yī)學生學習統(tǒng)計學的目的主要是應用。因此,醫(yī)學統(tǒng)計學教學要圍繞滿足應用這個主題來進行。怎樣在大數據時代背景下培養(yǎng)出適應醫(yī)學教學研究需求的醫(yī)學生?怎樣把當下流行的大數據理念和處理技術與傳統(tǒng)的醫(yī)學統(tǒng)計學課程教學有機的結合?如何以培養(yǎng)學生對高維醫(yī)學數據處理與分析的認識,興趣和能力?這些都是我們在醫(yī)學統(tǒng)計學課程教學中不得不思考的問題。為適應大數據時代的客觀要求,筆者對大數據背景下的教學改革的思考提出以下幾點想法。
(一)以鮮活的案例為基礎,開展案例教學
當前,絕大多數高校的教學一直采用傳統(tǒng)的教學模式,即教師圍繞學生,針對書本知識進行教學,這種教學模式存在以下三方面問題:(1)課堂教學以理論授課為主,書本知識體系更新較慢,學生興趣不高;(2)教學內容與實踐結合不緊密,課程學習結束后,學生分析數據的能力仍然薄弱;(3)學生的創(chuàng)新能力沒有得到培養(yǎng)[6]。這種傳統(tǒng)的教學模式,顯然與大數據背景下的教學要求不相適應。在生物醫(yī)學研究領域,有許多大數據的實際數據和案例,也有現(xiàn)成的軟件程序,借助鮮活的案例,不僅能夠調動學生的積極性和參與熱情,更能夠讓學生在案例中體會理解大數據的意義。
如在腫瘤基因組圖譜計劃(TCGA)的數據庫中,有近40余種癌癥的數據,這些數據包括全基因組約2萬個基因的表達數據和臨床數據,利用這樣一個變量類型相對單一的數據,展示R軟件glmnet包中l(wèi)asso算法的應用,必然引起學生的興趣,不僅掌握的軟件算法有應用,而且對于大數據的處理分析也有了直觀的認識和理解。這樣的鮮活案例,不僅有助于講解大數據的數據清理過程,軟件算法的含義,而且會激發(fā)學生不斷探索求新創(chuàng)新的熱情。以案例為中心的大數據教學,不只是純粹的理論宣導,而是強化大數據分析全過程的訓練。
(二)以項目式為抓手,開展大數據分析訓練
傳統(tǒng)的教學方法以老師講授為主,學生記背,兼有少量練習。這種模式在現(xiàn)代信息高度發(fā)達的社會環(huán)境顯然不能夠吸引學生主動參與學習的興趣和熱情。項目教學法就是教學改革的方向之一,項目教學法不僅有利于培養(yǎng)學生的綜合才能,而且能夠培養(yǎng)學生團隊合作的精神[12]。大數據的整合分析常常不是一個人能夠獨立完成,更多時候需要計算機技術,統(tǒng)計技術,甚至圖像文本識別技術等多學科技術人員同理合作才能完成。以項目為抓手,在老師的指導下,將一個相對獨立的大數據分析項目交由學生自行組織的團隊,學生自行討論信息的收集、方案的設計、項目實施及最終評價。學生通過該項目的進行,了解并把握大數據分析的整個過程,了解大數據產生,數據的清理,模型的應用,研究設計的制定,軟件編程,報告的編寫等諸多方面。
項目教學法最顯著的特點是以項目為主線、教師為引導、學生為主體。注重理論與實踐相結合,注重多學科領域知識的整合,在項目式教學的過程中,學生通過各種途經方法獲取信息和知識,學生是被允許、甚至是被期待去犯錯誤,讓學生自由探索大數據的奧秘,由此,他們變成了主動的學習者,并且得以培養(yǎng)團隊技能。項目教學法的開展,需要完善的課程計劃、足夠的靈活度和一個可以開展團隊協(xié)作,數據資源共享利用的環(huán)境[13]。
(三)創(chuàng)新實踐教學模式,加強實踐教學的開展
計算機和網絡技術迅速發(fā)展,在處理數據的時候,根據數據的特征創(chuàng)造出新的計算方法來滿足實際需要。當前的實踐教學需要從傳統(tǒng)的假設驅動下的實踐教學轉變到數據驅動下的實踐教學,構造以課堂案例教學和課后項目式訓練為主,校外實習和網絡學習并重的全面創(chuàng)新型實踐教學模式。在實踐教學的過程中,要強調統(tǒng)計學工具、計算機編程以及統(tǒng)計分析軟件的結合。目前,以R軟件為代表開源統(tǒng)計軟件顯示了強大的大數據分析能力,特別是其中有關高維大數據的部分,填補了其他軟件的不足。在實踐教學過程中,將計算機軟件的應用與課堂的理論教學有機結合,項目式訓練和實習實踐可以帶動學生了解和掌握整個大數據分析流程,激發(fā)學生學習的興趣,增強學生對大數據的理解,逐漸培養(yǎng)學生大數據觀。
實踐教學的關鍵環(huán)節(jié)是加強和規(guī)范統(tǒng)計軟件應用,強化統(tǒng)計計算。在教學上能夠讓學生熟練掌握一款統(tǒng)計軟件的程序語言并進行編程操作,那么學生在實踐當中就能得心應手地進行數據的整理和分析。R軟件是免費軟件,統(tǒng)計建模和統(tǒng)計計算功能強大,也是最新統(tǒng)計計算方法發(fā)布的主要平臺,非常有利于培養(yǎng)學生的編程能力和知識更新能力。當然,實踐教學中也可以使用其他專業(yè)統(tǒng)計軟件,如Stata等。但總而言之,基于非編程的統(tǒng)計軟件,進行統(tǒng)計方法講授的時代應該結束。
回顧醫(yī)學統(tǒng)計學的發(fā)展歷史可以發(fā)現(xiàn),從小樣本的t檢驗,到多元分析,醫(yī)學統(tǒng)計學的發(fā)展史實際上都是以實際需求為驅動,伴隨著需求和數據的改變逐步向前發(fā)展。在現(xiàn)今大數據時代的背景下,醫(yī)學統(tǒng)計學的發(fā)展以生命科研相關的數據信息為核心,無疑這對統(tǒng)計學這門工具學科產生了大量的需求。近年來,大數據所具有的數據特征使得部分傳統(tǒng)統(tǒng)計方法不再適用,迫切需要針對大數據的特征,以服務和滿足各領域需求為目標,不斷創(chuàng)新和發(fā)展數據分析方法與理論[13]。
[1]朱建平,李秋雅.大數據對大學教學的影響[J].中國大學教學,2014(9):41-44.
[2]郭曉科.大數據[M].北京:清華大學出版社,2013
[3]和志英.大數據時代對統(tǒng)計學的影響[J].商務必讀,2016(10):153-154.
[4]邱東.大數據時代對統(tǒng)計學的挑戰(zhàn)[J].統(tǒng)計研究,2014(1):16-22.
[5]李金昌.大數據與統(tǒng)計新思維[J].統(tǒng)計研究,2014(1):10-15.
[6]陳秀芬.大數據時代下統(tǒng)計學課程教學改革的思考[J].高教學刊,2015(20):106-107.
[7]王想.大數據對統(tǒng)計學本科專業(yè)課程設置的影響分析[J].高教學刊,2016(5):199-202.
[8]耿直.大數據時代統(tǒng)計學面臨的機遇與挑戰(zhàn)[J].統(tǒng)計研究,2014(1):5-9.
[9]朱建平,張悅涵.大數據時代對傳統(tǒng)統(tǒng)計學變革的思考[J].統(tǒng)計研究,2016(2):3-9.
[10]薛艷.大數據時代統(tǒng)計學專業(yè)教學體系的改革[J].教育教學論壇,2015(4):110-111.
[11]馬雙鴿,劉蒙闋,周峙利,等.大數據時代統(tǒng)計學發(fā)展的若干問題[J].統(tǒng)計研究,2017(1):5-11.
[12]宗亞妹,李建啟.系列化項目教學的研究與實踐[J].中國大學教學,2013(11):44-46.
[13]林江湧,魏農建,段明明.項目教學:應用型教學模式的選擇[J].中國大學教學,2010(10):33-35.
Thinking on Medical Statistics Teaching under the Background of Big Data
TANG Zai-xiang
(School of Public Health,Medical College,Suzhou University,Suzhou 215006,China)
Under the background of big data,the development of medical statistics takes life scientific research related data as the core,which no doubt causes a lot of demand in the statistical discipline.In recent years,the characteristics of the big data makes some traditional statistical methods no longer applicable,and there is urgent need for innovation and development of data analysis methods to aim to serve and meet requirements of different fields according to the characteristics of big data.In the process of teaching of medical statistics,the urgent need for the application of this new method of statistical techniques in teaching practice may make students quickly adapt to life science.
big data;medical statistics;statistical methods
G642.4
A
1009-4318(2017)03-0069-05
2017-06-30
國家自然科學基金資助(81573253;81773541)
湯在祥(1981-),男,江蘇揚州人,蘇州大學醫(yī)學部公共衛(wèi)生學院副教授,博士,主要從事生物統(tǒng)計學方面的研究。