杜 賓,劉 煒
(江西財(cái)經(jīng)大學(xué) 信息管理學(xué)院,江西 南昌 330032)
近年來(lái),隨著信息技術(shù)和互聯(lián)網(wǎng)的爆發(fā)式跨越發(fā)展,人類(lèi)進(jìn)入萬(wàn)物互聯(lián)的大數(shù)據(jù)時(shí)代,數(shù)據(jù)已成為當(dāng)今世界的基礎(chǔ)性戰(zhàn)略資源。2012年美國(guó)總統(tǒng)奧巴馬宣布啟動(dòng)“大數(shù)據(jù)研究與開(kāi)發(fā)計(jì)劃”,旨在提高從海量數(shù)據(jù)中獲取知識(shí)和觀點(diǎn)的能力[1]。與此同時(shí),我國(guó)高度重視大數(shù)據(jù)發(fā)展,制定《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020年)》,全面實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略,助力中國(guó)經(jīng)濟(jì)從高速增長(zhǎng)轉(zhuǎn)向高質(zhì)量發(fā)展[2]。隨著大數(shù)據(jù)的不斷開(kāi)發(fā)和深入應(yīng)用,各行各業(yè)對(duì)大數(shù)據(jù)方面的人才產(chǎn)生強(qiáng)烈的需求,許多知名企業(yè)開(kāi)設(shè)大數(shù)據(jù)研究中心,與大學(xué)開(kāi)展合作,因而催生了大學(xué)大數(shù)據(jù)專(zhuān)業(yè)教育[1],系統(tǒng)地講授數(shù)據(jù)分析(Data Analytics,DA)類(lèi)課程。
數(shù)據(jù)分析是指運(yùn)用適當(dāng)?shù)臄?shù)學(xué)、統(tǒng)計(jì)方法和軟件工具剖析數(shù)據(jù),揭示數(shù)據(jù)內(nèi)在的價(jià)值和規(guī)律,形成合乎邏輯的解釋和描述,達(dá)到對(duì)客觀事物的科學(xué)認(rèn)識(shí)[3]。同時(shí),數(shù)據(jù)分析也是對(duì)數(shù)據(jù)的全方位探索和概括提煉,從海量數(shù)據(jù)中提取有效信息和形成結(jié)論的過(guò)程[4],不僅通過(guò)對(duì)真實(shí)數(shù)據(jù)的分析去發(fā)現(xiàn)問(wèn)題,還能夠運(yùn)用經(jīng)濟(jì)學(xué)、會(huì)計(jì)學(xué)、金融學(xué)原理建立數(shù)學(xué)模型,對(duì)投資、期權(quán)或其他決策是否具有可行性進(jìn)行分析并給出解釋?zhuān)A(yù)測(cè)未來(lái)的收益及風(fēng)險(xiǎn)情況,為科學(xué)合理的決策提供參考依據(jù)[5]。
由此可見(jiàn),基于財(cái)經(jīng)類(lèi)高校的教學(xué)實(shí)踐構(gòu)建數(shù)據(jù)分析課程體系,能夠提升學(xué)生的專(zhuān)業(yè)能力和社會(huì)競(jìng)爭(zhēng)力,滿(mǎn)足經(jīng)濟(jì)高速發(fā)展的金融市場(chǎng)需求,體現(xiàn)財(cái)經(jīng)類(lèi)高校自身的辦學(xué)能力。
面對(duì)大數(shù)據(jù)時(shí)代,市場(chǎng)對(duì)數(shù)據(jù)分析的要求發(fā)生“質(zhì)”與“量”的轉(zhuǎn)變。從“質(zhì)”的維度看,數(shù)據(jù)分析的水平提升很高,要求掌握統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的知識(shí);從“量”的維度看,不僅數(shù)據(jù)分析人員的數(shù)量增大,而且數(shù)據(jù)分析的職位細(xì)化,層次分明。應(yīng)基于金融市場(chǎng)上數(shù)據(jù)分析行業(yè)的調(diào)查數(shù)據(jù),將數(shù)據(jù)分析職業(yè)匹配勝任能力,明確高校培養(yǎng)的目標(biāo)。高級(jí)別的職位需要覆蓋低職位的能力要求。
(1)數(shù)據(jù)專(zhuān)員。此職位能夠收集數(shù)據(jù)、整理數(shù)據(jù)并實(shí)現(xiàn)基本的可視化功能,對(duì)應(yīng)的能力要求是篩選、排序、透視表、公式和函數(shù),并且能夠簡(jiǎn)單的編程,這就要求熟練掌握Excel +Powerpoint + VBA。
(2)數(shù)據(jù)分析員。此職位能夠運(yùn)用專(zhuān)業(yè)的數(shù)據(jù)庫(kù)管理數(shù)據(jù),對(duì)應(yīng)的能力要求是增、刪、改、查詢(xún)、數(shù)據(jù)的讀入和寫(xiě)出等操作以及使用、管理大型數(shù)據(jù)庫(kù),這就要求熟練掌握SQL+RMSDB+領(lǐng)域知識(shí)。
(3)數(shù)據(jù)分析師。此職位能夠熟練駕馭統(tǒng)計(jì)學(xué)知識(shí),包括多元回歸、假設(shè)檢驗(yàn)、方差分析、蒙特卡羅和貝葉斯方法;同時(shí),熟悉領(lǐng)域背景知識(shí),可以做到了解企業(yè)現(xiàn)狀與競(jìng)爭(zhēng)環(huán)境、風(fēng)險(xiǎn)評(píng)判與決策支持,能夠充分利用大數(shù)據(jù)帶來(lái)的價(jià)值[6],進(jìn)行數(shù)據(jù)挖掘與可視化后,呈現(xiàn)給企業(yè)決策者的將是一份清晰、準(zhǔn)確且有數(shù)據(jù)支撐的報(bào)告。
(4)數(shù)據(jù)科學(xué)家。此職位能夠完成數(shù)據(jù)分析師、商務(wù)智能等工作,并且精通統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)。熟悉領(lǐng)域背景的同時(shí),掌握機(jī)器學(xué)習(xí)的技巧和方法,不僅可以處理數(shù)據(jù)、ETL、可視化,還能做到調(diào)節(jié)參數(shù)、選擇模型、優(yōu)化算法。數(shù)據(jù)科學(xué)家已不是簡(jiǎn)單的IT技術(shù)人員,而是可以參與到企業(yè)決策、制訂發(fā)展戰(zhàn)略的核心人物[6]。
20世紀(jì)70年代,以“智力”測(cè)評(píng)為主的能力評(píng)價(jià)思想遭到廣泛的質(zhì)疑[7]。哈佛大學(xué)教授McClelland提出“勝任力”概念,認(rèn)為成就動(dòng)機(jī)、人際關(guān)系、團(tuán)隊(duì)影響力才是真正影響績(jī)效的能力特征[8]。針對(duì)本科教育,大學(xué)的培養(yǎng)目標(biāo)定位于數(shù)據(jù)分析師;針對(duì)研究生教育,大學(xué)的培養(yǎng)目標(biāo)定位于數(shù)據(jù)科學(xué)家。以本科教育為例,與之匹配的數(shù)據(jù)分析師應(yīng)該具有的能力對(duì)應(yīng)的勝任力模型,主要有4個(gè)維度,具體有知識(shí)結(jié)構(gòu)、人文能力、工具能力、程序設(shè)計(jì)能力。
數(shù)據(jù)分析屬于數(shù)據(jù)科學(xué)的分支,需要多學(xué)科全方位的知識(shí)儲(chǔ)備,并在分析實(shí)踐過(guò)程中積累經(jīng)驗(yàn)值,主要覆蓋以下幾個(gè)方面。
(1)數(shù)學(xué)方面。微積分、概率論、線性代數(shù)等課程是大部分?jǐn)?shù)據(jù)結(jié)構(gòu)進(jìn)行矩陣運(yùn)算和數(shù)理分析的基本計(jì)算方法。
(2)統(tǒng)計(jì)方面。掌握描述性統(tǒng)計(jì)、統(tǒng)計(jì)推斷的基礎(chǔ)知識(shí)以及多元回歸等相關(guān)性分析和因果分析,融合結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)建模和預(yù)測(cè),至少會(huì)使用一種統(tǒng)計(jì)工具軟件,例如R、SPSS、Stata、SAS以及SciPy包等。
(3)數(shù)據(jù)庫(kù)方面。掌握SQL語(yǔ)言,了解MySQL、SQLServer、Oracle等高性能關(guān)系數(shù)據(jù)庫(kù)。
(4)程序設(shè)計(jì)語(yǔ)言方面。掌握至少一門(mén)計(jì)算機(jī)高級(jí)語(yǔ)言,例如C/C++、Java、VBA、Python等,并且具備程序設(shè)計(jì)思維和方法。
(5)算法方面。主要包括數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等,其中數(shù)據(jù)挖掘是數(shù)據(jù)分析的高級(jí)階段,機(jī)器學(xué)習(xí)則是數(shù)據(jù)挖掘的高級(jí)部分。具體算法是無(wú)監(jiān)督學(xué)習(xí)的主成分分析(PCA)和聚類(lèi)、有監(jiān)督學(xué)習(xí)的回歸和分類(lèi)、半監(jiān)督的強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)等。
(6)數(shù)據(jù)可視化。當(dāng)R、Python、SPSS、Stata等軟件的可視化功能不能滿(mǎn)足數(shù)據(jù)分析的要求時(shí),可以選擇一些專(zhuān)業(yè)性強(qiáng)的可視化工具,如HighCharts、Tableau、Google Visualization API 等。
數(shù)據(jù)分析是一項(xiàng)全方位融合的技術(shù)性工作,離不開(kāi)人文能力的支撐。人文能力的維度主要包括以下幾方面。
(1)行業(yè)領(lǐng)域知識(shí)。對(duì)行業(yè)及其背景的數(shù)據(jù)屬性、類(lèi)型、結(jié)構(gòu)非常了解,例如服務(wù)業(yè)、制造業(yè)、政府機(jī)關(guān)、事業(yè)單位等。
(2)創(chuàng)造力。數(shù)據(jù)分析工作本身就是一項(xiàng)數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)和創(chuàng)新為主的活動(dòng),因此并不缺乏創(chuàng)造力。
(3)項(xiàng)目管理能力。針對(duì)特定項(xiàng)目的數(shù)據(jù)集,在一定的約束條件下,負(fù)責(zé)人帶領(lǐng)團(tuán)隊(duì)成員完成數(shù)據(jù)分析和知識(shí)發(fā)現(xiàn)任務(wù)的綜合管理能力。
(4)溝通能力。團(tuán)隊(duì)負(fù)責(zé)人及其成員有效地將信息、知識(shí)、經(jīng)驗(yàn)等進(jìn)行溝通和共享,是完成DA工作的關(guān)鍵[7]。
根據(jù)DA知識(shí)結(jié)構(gòu)的要求,數(shù)據(jù)分析離不開(kāi)計(jì)算機(jī)硬件、軟件和軟件包,尤其是面向大數(shù)據(jù)。工欲善其事,必先利其器。因此,數(shù)據(jù)分析師需要擅長(zhǎng)一些工具軟件。數(shù)據(jù)分析工具眾多,主要有3類(lèi):一是統(tǒng)計(jì)軟件或軟件包,例如R、SPSS、Stata、SAS以及SciPy包;二是可視化軟件,例如,R有3套可視化系統(tǒng),由Base、lattice、ggplot2構(gòu)成;三是數(shù)據(jù)庫(kù)軟件,例如SQLServer、MySQL、Oracle等大型數(shù)據(jù)庫(kù)。
以良好的工具軟件或工具包為基礎(chǔ),數(shù)據(jù)分析在一般情況下不需要大量的編程工作。但是對(duì)于數(shù)據(jù)分析師或者數(shù)據(jù)科學(xué)家來(lái)說(shuō),具備高水平的程序設(shè)計(jì)能力,是職業(yè)勝任力不可或缺的一部分,而且,面向計(jì)算思維、掌握編程語(yǔ)言或者編寫(xiě)腳本(script)文件實(shí)現(xiàn)算法既是內(nèi)在能力要求也能夠體現(xiàn)強(qiáng)大的競(jìng)爭(zhēng)力。當(dāng)前流行且功能強(qiáng)大的語(yǔ)言或者軟件有Python、R、C/C++、Java、MATLAB、Ruby等;未來(lái)可期的還有Julia、Go等。
以財(cái)經(jīng)類(lèi)高校信息管理與信息系統(tǒng)專(zhuān)業(yè)(智能金融方向)為例,構(gòu)建DA課程體系,主要從3個(gè)方面闡述,即培養(yǎng)目標(biāo)、課程組成及其之間的依賴(lài)關(guān)系。
面向財(cái)經(jīng)類(lèi)高校,信息管理與信息系統(tǒng)專(zhuān)業(yè)(智能金融方向)的培養(yǎng)目標(biāo)融合傳統(tǒng)的信息管理與信息系統(tǒng)專(zhuān)業(yè)+財(cái)經(jīng)類(lèi)專(zhuān)業(yè),同時(shí)突出金融智能化特色。所以,具體目標(biāo)是培養(yǎng)具有先進(jìn)管理理念,掌握金融管理基礎(chǔ)知識(shí)、信息管理理論與系統(tǒng)科學(xué)方法,熟練掌握互聯(lián)網(wǎng)金融數(shù)據(jù)處理技術(shù)以及互聯(lián)網(wǎng)金融平臺(tái)開(kāi)發(fā)方法,具備較強(qiáng)的金融大數(shù)據(jù)分析能力,在銀行、證券、保險(xiǎn)等各類(lèi)金融機(jī)構(gòu)和管理部門(mén)以及政府機(jī)關(guān)、事業(yè)單位及互聯(lián)網(wǎng)金融企業(yè)從事信息管理、電子支付、咨詢(xún)服務(wù)、管理信息系統(tǒng)的實(shí)施、維護(hù)與評(píng)價(jià)等方面工作,具有健全人格、富有創(chuàng)新精神,同時(shí)具有較強(qiáng)實(shí)踐能力的互聯(lián)網(wǎng)金融方面的創(chuàng)新創(chuàng)業(yè)人才。依據(jù)培養(yǎng)目標(biāo)可以發(fā)現(xiàn),數(shù)據(jù)分析日益成為專(zhuān)業(yè)教育的核心能力,數(shù)據(jù)分析課程體系服從于培養(yǎng)目標(biāo),并為培養(yǎng)目標(biāo)奠定重要基礎(chǔ)。
依據(jù)高?!叭乃摹苯虒W(xué)育人體系,可將大學(xué)本科教育的所有課程劃分為4類(lèi):通識(shí)課程、基礎(chǔ)課程、專(zhuān)業(yè)理論課程、實(shí)踐課程。從這4類(lèi)課程中提取與數(shù)據(jù)分析相關(guān)聯(lián)的多層次課程,納入數(shù)據(jù)分析課程體系,同時(shí),將課程知識(shí)與數(shù)據(jù)分析職位要求相匹配,見(jiàn)圖1,詳細(xì)課程構(gòu)成如下。
(1)通識(shí)課程。指專(zhuān)業(yè)課程以外的基礎(chǔ)教育課程[9],旨在拓寬學(xué)生的知識(shí)廣度和獨(dú)立思考判斷力,主要包括:微積分Ⅰ&Ⅱ、辦公軟件高級(jí)應(yīng)用、西方經(jīng)濟(jì)學(xué)、會(huì)計(jì)學(xué)等。
(2)基礎(chǔ)課程。指信息管理與信息系統(tǒng)專(zhuān)業(yè)的基本理論課程,旨在培養(yǎng)學(xué)生的基本能力和基本素質(zhì),主要包括線性代數(shù)、概率論與數(shù)理統(tǒng)計(jì)、程序設(shè)計(jì)語(yǔ)言、管理學(xué)原理、學(xué)科專(zhuān)業(yè)導(dǎo)論等。
圖1 數(shù)據(jù)分析課程體系
(3)專(zhuān)業(yè)課程。指專(zhuān)業(yè)的主干課程,旨在講授本專(zhuān)業(yè)的核心理論和專(zhuān)門(mén)技能,主要有數(shù)據(jù)庫(kù)原理及應(yīng)用、R語(yǔ)言數(shù)據(jù)分析導(dǎo)論、金融大數(shù)據(jù)分析、管理統(tǒng)計(jì)學(xué)、管理信息系統(tǒng)、貨幣銀行學(xué)等。
(4)實(shí)踐課程。純粹的或側(cè)重于實(shí)踐課程有R語(yǔ)言數(shù)據(jù)分析、程序設(shè)計(jì)實(shí)訓(xùn)、專(zhuān)業(yè)實(shí)訓(xùn)等。一般地,與數(shù)據(jù)分析有關(guān)的實(shí)踐環(huán)節(jié)大部分與理論課程并行,即專(zhuān)業(yè)課程既有理論教學(xué)也有實(shí)踐輔助設(shè)計(jì),例如,金融大數(shù)據(jù)分析、數(shù)據(jù)庫(kù)原理與應(yīng)用、程序設(shè)計(jì)語(yǔ)言、辦公軟件高級(jí)應(yīng)用等。
數(shù)據(jù)分析體系內(nèi)每門(mén)課程不是孤立的存在,既有為后續(xù)課程做“鋪路石”的前導(dǎo)向課程,發(fā)揮基礎(chǔ)性支撐作用,如微積分為概率論與數(shù)理統(tǒng)計(jì)、數(shù)據(jù)庫(kù)原理及應(yīng)用為數(shù)據(jù)庫(kù)開(kāi)發(fā)技術(shù)、R語(yǔ)言數(shù)據(jù)分析導(dǎo)論為金融大數(shù)據(jù)分析等;也有學(xué)科交叉融合的創(chuàng)新特色課程,如管理統(tǒng)計(jì)學(xué)融合管理學(xué)和統(tǒng)計(jì)學(xué)、R語(yǔ)言數(shù)據(jù)分析導(dǎo)論融合計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)等;還有應(yīng)用融合類(lèi)課程,如計(jì)算機(jī)應(yīng)用技術(shù)涵蓋Excel、Powerpoint等軟件。
另一方面,數(shù)據(jù)分析是面向過(guò)程、強(qiáng)實(shí)踐性的一類(lèi)課程,更加注重理論教學(xué)與實(shí)踐教學(xué)的融合和一致性,提高學(xué)生解決復(fù)雜問(wèn)題能力和創(chuàng)新創(chuàng)業(yè)能力。依據(jù)數(shù)據(jù)分析課程體系的構(gòu)建理念,可以區(qū)別驗(yàn)證性實(shí)驗(yàn)、綜合性實(shí)驗(yàn)、設(shè)計(jì)性實(shí)驗(yàn)、創(chuàng)新性實(shí)驗(yàn)的實(shí)踐教學(xué)項(xiàng)目,分層次遞進(jìn)式設(shè)計(jì)實(shí)驗(yàn)?zāi)繕?biāo)和實(shí)驗(yàn)內(nèi)容。主要實(shí)踐環(huán)節(jié)劃分為專(zhuān)業(yè)基礎(chǔ)實(shí)驗(yàn)、個(gè)性化培養(yǎng)階段、畢業(yè)實(shí)習(xí)、畢業(yè)設(shè)計(jì)、社會(huì)調(diào)查與學(xué)年論文、課外科研創(chuàng)新實(shí)踐活動(dòng)。其中,在第一、二、三學(xué)年個(gè)性化培養(yǎng)階段(小學(xué)期或二階段)分別安排程序設(shè)計(jì)實(shí)訓(xùn)、專(zhuān)業(yè)實(shí)訓(xùn)Ⅰ和專(zhuān)業(yè)實(shí)訓(xùn)Ⅱ,強(qiáng)化學(xué)生的綜合實(shí)踐能力。
將DA課程體系應(yīng)用在財(cái)經(jīng)類(lèi)高校的智能金融方向,將財(cái)經(jīng)類(lèi)高校的金融市場(chǎng)領(lǐng)域與數(shù)據(jù)分析技術(shù)相結(jié)合,可以提升學(xué)生的金融大數(shù)據(jù)分析、建模與計(jì)算能力,并進(jìn)一步強(qiáng)化學(xué)生的綜合實(shí)踐能力。具體課程設(shè)置與學(xué)期分布見(jiàn)表1。
課程知識(shí)與職位勝任力相匹配,一年一個(gè)臺(tái)階,形成分階遞進(jìn)培養(yǎng)模式[10]。①第一學(xué)年通過(guò)必修課計(jì)算機(jī)應(yīng)用技術(shù)和選修課辦公軟件高級(jí)應(yīng)用,重點(diǎn)學(xué)習(xí)Excel、Powerpoint等,達(dá)到數(shù)據(jù)專(zhuān)員水平;②第二學(xué)年通過(guò)必修課數(shù)據(jù)庫(kù)原理及應(yīng)用和程序設(shè)計(jì)語(yǔ)言,重點(diǎn)學(xué)習(xí)SQL語(yǔ)言和管理數(shù)據(jù)庫(kù),能夠達(dá)到數(shù)據(jù)分析員水平;③第三學(xué)年通過(guò)選修課R語(yǔ)言數(shù)據(jù)分析導(dǎo)論和必修課金融大數(shù)據(jù)分析課程,重點(diǎn)學(xué)習(xí)數(shù)據(jù)分析的基本理論、方法和模型,接近金融行業(yè)的數(shù)據(jù)分析師水平。
目前,我國(guó)處于經(jīng)濟(jì)發(fā)展轉(zhuǎn)型的關(guān)鍵時(shí)期。宏觀上,大數(shù)據(jù)環(huán)境下的社會(huì)實(shí)體渴求具備數(shù)據(jù)分析能力的創(chuàng)新人才;微觀上,中國(guó)高校打造一流本科教育,著重培養(yǎng)創(chuàng)新創(chuàng)業(yè)精神。因此,破解傳統(tǒng)的課程結(jié)構(gòu)體系,重構(gòu)信息管理與信息系統(tǒng)專(zhuān)業(yè)的課程規(guī)劃,構(gòu)建數(shù)據(jù)分析課程體系,是高等教育不斷探索創(chuàng)新的舉措。數(shù)據(jù)分析課程體系既包容傳統(tǒng)數(shù)據(jù)庫(kù)類(lèi)課程,又納入金融大數(shù)據(jù)分析等新課程,整體處于快速探索階段。有理由相信在未來(lái)若干年,數(shù)據(jù)分析類(lèi)課程能像數(shù)學(xué)、英語(yǔ),進(jìn)入其他學(xué)科課程體系并在眾多領(lǐng)域中綻放光彩。
表1 數(shù)據(jù)分析課程設(shè)置與學(xué)期分布