亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺談數(shù)據(jù)科學(xué)人才的培養(yǎng)

        2016-05-10 04:31:32許嘉呂品
        教育界·下旬 2016年3期

        許嘉 呂品

        【摘 要】在大數(shù)據(jù)時代,各行各業(yè)對數(shù)據(jù)科學(xué)人才的需求量大幅增長,而我國尚未建立起成熟有效的數(shù)據(jù)科學(xué)人才培養(yǎng)體系。本文從領(lǐng)域知識、基礎(chǔ)理論、計算機(jī)工具和社會實(shí)踐等四個方面對如何培養(yǎng)數(shù)據(jù)科學(xué)人才進(jìn)行了探討,以期為我國高校制定數(shù)據(jù)科學(xué)人才培養(yǎng)方案提供參考。

        【關(guān)鍵詞】數(shù)據(jù)科學(xué)人才 領(lǐng)域知識 基礎(chǔ)理論 計算機(jī)工具 社會實(shí)踐

        一、引言

        隨著大數(shù)據(jù)時代的到來,無處不在的“數(shù)據(jù)”引發(fā)了人們空前的關(guān)注,各行各業(yè)對數(shù)據(jù)科學(xué)人才的需求量都呈現(xiàn)出大幅增長的趨勢。然而,當(dāng)前不論是國內(nèi)還是國外,數(shù)據(jù)科學(xué)人才的數(shù)量與實(shí)際需求相比都存在很大的缺口。培養(yǎng)大量合格的數(shù)據(jù)科學(xué)人才成為一項(xiàng)急迫的任務(wù)。本文根據(jù)數(shù)據(jù)科學(xué)人才應(yīng)當(dāng)具有的知識結(jié)構(gòu),從領(lǐng)域知識、基礎(chǔ)理論、計算機(jī)工具和社會實(shí)踐四個方面對如何培養(yǎng)數(shù)據(jù)科學(xué)人才進(jìn)行探討,為國內(nèi)高校建立數(shù)據(jù)科學(xué)人才培養(yǎng)機(jī)制提供參考。

        二、領(lǐng)域知識

        數(shù)據(jù)科學(xué)人才的職責(zé)是解決特定領(lǐng)域的問題。因此,數(shù)據(jù)科學(xué)人才必須具備一定的業(yè)務(wù)領(lǐng)域知識,包括行業(yè)信息和業(yè)務(wù)信息。一方面,這是正確開展數(shù)據(jù)分析工作的前提和保障;另一方面,積累足夠的領(lǐng)域知識有助于評價和區(qū)分有價值的數(shù)據(jù)分析結(jié)果。

        三、基礎(chǔ)理論

        數(shù)據(jù)科學(xué)人才因?yàn)槭桥c數(shù)據(jù)打交道,所以需要具有扎實(shí)的數(shù)學(xué)理論基礎(chǔ)。高等數(shù)學(xué)、線性代數(shù)、概率論、離散數(shù)學(xué)等課程都是需要學(xué)習(xí)的理論基礎(chǔ)課。除此之外,統(tǒng)計學(xué)、數(shù)據(jù)挖掘等方面的基礎(chǔ)理論對于建立數(shù)據(jù)科學(xué)人才的知識體系非常必要,應(yīng)當(dāng)重點(diǎn)加強(qiáng)。

        統(tǒng)計學(xué)是應(yīng)用數(shù)學(xué)的分支,包括描述統(tǒng)計和推斷統(tǒng)計。描述統(tǒng)計主要研究如何收集、處理和描述數(shù)據(jù),推斷統(tǒng)計則是研究如何利用樣本數(shù)據(jù)來推斷總體特征。統(tǒng)計學(xué)是數(shù)據(jù)分析的靈魂,可以實(shí)現(xiàn)對數(shù)據(jù)的量化分析、總結(jié)、推斷和預(yù)測,為相關(guān)領(lǐng)域問題的決策提供依據(jù)和參考。

        數(shù)據(jù)挖掘是數(shù)據(jù)科學(xué)的必備理論工具。數(shù)據(jù)科學(xué)把原始數(shù)據(jù)看作是形成知識的源泉,作為交叉學(xué)科的數(shù)據(jù)挖掘正是綜合運(yùn)用數(shù)學(xué)、數(shù)據(jù)庫、人工智能、機(jī)器學(xué)習(xí)、可視化和并行計算等方面的知識從數(shù)據(jù)海洋中提煉出有價值的信息,為領(lǐng)域決策提供重要支持。

        四、計算機(jī)工具

        在這個數(shù)據(jù)爆炸的時代,僅依靠人力處理快速增長的數(shù)據(jù)并不現(xiàn)實(shí),人們必須借助計算機(jī)來進(jìn)行處理大量的數(shù)據(jù)。因此,數(shù)據(jù)科學(xué)人才需要熟練掌握相應(yīng)的計算機(jī)工具。

        數(shù)據(jù)科學(xué)人才需要掌握的計算機(jī)工具之一就是用于存儲數(shù)據(jù)的數(shù)據(jù)庫管理系統(tǒng),包括傳統(tǒng)的關(guān)系數(shù)據(jù)庫和新興的NoSQL數(shù)據(jù)庫。對于結(jié)構(gòu)化數(shù)據(jù),使用關(guān)系數(shù)據(jù)庫和結(jié)構(gòu)化查詢語言(SQL)對其進(jìn)行存儲和查詢的技術(shù)已非常成熟。隨著數(shù)據(jù)多樣性的程度越來越高,半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)(如文檔、圖像、音頻、視頻數(shù)據(jù))所占的比重越來越大。這類數(shù)據(jù)更適合使用非關(guān)系的NoSQL數(shù)據(jù)庫進(jìn)行存儲與查詢。目前常用的NoSQL數(shù)據(jù)庫有MongoDB、HBase等。

        除了數(shù)據(jù)庫,用于數(shù)據(jù)處理的編程框架和編程語言也是數(shù)據(jù)科學(xué)人才需要掌握的。當(dāng)前廣受關(guān)注的開源數(shù)據(jù)處理編程框架包括Hadoop、Spark、Storm等。Hadoop是一個能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架,其核心是分布式文件系統(tǒng)HDFS和MapReduce編程模型,能夠充分利用集群的計算能力和存儲能力來處理大規(guī)模數(shù)據(jù)。Spark與Hadoop的工作原理類似,但由于Spark是把中間計算結(jié)果保存在內(nèi)存中而非分布式文件系統(tǒng)中,因此比Hadoop具有更快的運(yùn)算速度。Storm是一個分布式的實(shí)時計算系統(tǒng),主要針對流式數(shù)據(jù)進(jìn)行處理,適用于對實(shí)時性要求較高的系統(tǒng)。上述三個編程框架都主要使用Java作為編程語言。此外,Scala、Python、R等也都是在數(shù)據(jù)處理中常用的編程語言。

        為了將數(shù)據(jù)分析結(jié)果用最易于理解的方式呈現(xiàn)出來,數(shù)據(jù)可視化工具必不可少。常用的數(shù)據(jù)可視化工具包括Excel、R和Google Chart API等。另外還有不少值得關(guān)注的國產(chǎn)數(shù)據(jù)可視化工具,例如大數(shù)據(jù)魔鏡。

        五、社會實(shí)踐

        數(shù)據(jù)通常是來源于人們的生產(chǎn)生活,研究數(shù)據(jù)科學(xué)的目的也是為了更好地服務(wù)于人們的生產(chǎn)生活。因此,培養(yǎng)數(shù)據(jù)科學(xué)人才必須注重理論聯(lián)系實(shí)際,通過社會實(shí)踐來提高數(shù)據(jù)科學(xué)人才分析和解決實(shí)際問題的能力。

        社會實(shí)踐一方面是要讓學(xué)生接觸產(chǎn)業(yè)界,了解不同行業(yè)的背景和需求,特別是要利用在實(shí)際生產(chǎn)生活中產(chǎn)生的大數(shù)據(jù)進(jìn)行學(xué)習(xí),這樣能夠更好地理解理論知識。除了在不同的行業(yè)進(jìn)行實(shí)習(xí),參加各類大數(shù)據(jù)競賽也是一個接觸產(chǎn)業(yè)界的很好的方式?,F(xiàn)在不少政府部門、學(xué)術(shù)組織、企業(yè)、高校都通過組織大數(shù)據(jù)競賽的方式促進(jìn)人才培養(yǎng),推動產(chǎn)業(yè)發(fā)展。影響力比較大的競賽包括中國計算機(jī)學(xué)會主辦的中國大數(shù)據(jù)技術(shù)創(chuàng)新大賽、全國青年大數(shù)據(jù)創(chuàng)新大賽,阿里巴巴集團(tuán)舉辦的天池大數(shù)據(jù)競賽,百度和西安交通大學(xué)舉辦的大數(shù)據(jù)競賽等等。通過實(shí)習(xí)或競賽,學(xué)生能夠在實(shí)踐中鍛煉能力,從而能夠更快地成長為合格的數(shù)據(jù)科學(xué)人才。

        社會實(shí)踐的另一方面是培養(yǎng)學(xué)生的溝通與表達(dá)能力。因?yàn)閿?shù)據(jù)科學(xué)是為各行各業(yè)服務(wù)的,所以數(shù)據(jù)科學(xué)人才需要同非數(shù)據(jù)科學(xué)專業(yè)的人士交流,了解其需求,并向其解釋數(shù)據(jù)分析的結(jié)果。這就需要數(shù)據(jù)科學(xué)人才在掌握專業(yè)能力之外,同時需要具備良好的交流能力。因此,人際交往能力是數(shù)據(jù)科學(xué)人才培養(yǎng)的重要方面。

        六、總結(jié)

        數(shù)據(jù)科學(xué)是一門綜合性的學(xué)科,培養(yǎng)數(shù)據(jù)科學(xué)人才也是一項(xiàng)系統(tǒng)工程。只有從領(lǐng)域知識、基礎(chǔ)理論、計算機(jī)工具和社會實(shí)踐這幾個方面統(tǒng)籌規(guī)劃,制定合理的培養(yǎng)方案,才能培養(yǎng)出既有理論水平又有實(shí)踐經(jīng)驗(yàn)的數(shù)據(jù)科學(xué)人才,這樣的人才將更受社會歡迎。

        【參考文獻(xiàn)】

        [1]許嘉,呂品.哈佛大學(xué)數(shù)據(jù)科學(xué)課程教學(xué)初探[J].教育界,2015(15).

        [2]Rachel Schutt, Cathy O'Neil. Doing Data Science[M].O'Reilly,2013.

        [3]楊旭,湯海京,丁剛毅.數(shù)據(jù)科學(xué)導(dǎo)論[M].北京:北京理工大學(xué)出版社,2014.

        久久老熟女乱色一区二区 | 精品亚洲aⅴ在线观看| 国产精品一区2区三区| 国产av精品一区二区三区视频| 又硬又粗进去好爽免费| 暖暖视频在线观看免费| 国产亚洲精久久久久久无码苍井空| 日本无吗一区二区视频| 日本伦理精品一区二区三区| 亚洲中文字幕在线第二页| 国产羞羞视频在线观看| 国产美女高潮流白浆免费观看| 99久久免费看精品国产一| 亚洲精品天堂成人片av在线播放 | 日本韩国亚洲三级在线| 国产乱妇无码大片在线观看| 天天操夜夜操| 少妇被粗大猛进进出出| 国产av一级片在线观看| 人人爽久久涩噜噜噜丁香| 少妇AV射精精品蜜桃专区| 手机在线看片在线日韩av | 精品国内在视频线2019| 国产精美视频| 国产精品毛片av一区二区三区 | 亚洲综合色无码| 精品综合久久久久久97超人| a√无码在线观看| 日韩一级黄色片一区二区三区| www射我里面在线观看| 中文字幕亚洲综合久久菠萝蜜| 一区二区国产视频在线| 国产69精品久久久久9999apgf| 野外性史欧美k8播放| 国产西西裸体一级黄色大片| 91九色最新国产在线观看| 97高清国语自产拍| 免费看欧美日韩一区二区三区| 情头一男一女高冷男女| 国内精品久久久久国产盗摄| 91精品一区国产高清在线gif|