▍上海交通大學高等教育研究院 魏昊卿
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)已逐漸成為信息時代社會發(fā)展及科學研究的重要資源。據(jù)IDC公司報告,2020年全世界產(chǎn)生的數(shù)據(jù)總量將高達40ZB。正如聯(lián)合國發(fā)布的報告“Big Data for Development: Challenges &Opportunities”所說,大數(shù)據(jù)時代已經(jīng)到來,數(shù)據(jù)在社會發(fā)展與科學研究中的作用逐漸顯現(xiàn)。
根據(jù)McKinsey公司的界定,大數(shù)據(jù)是指數(shù)據(jù)量達到海量,無法通過常規(guī)數(shù)據(jù)軟件進行獲取、存儲、管理和分析的數(shù)據(jù)。大數(shù)據(jù)的特征,根據(jù)IBM公司的定義,具有4V的特點,即:(1)Volum,數(shù)據(jù)量大,通常用海量來形容;(2)Variable,數(shù)據(jù)類型多樣化,數(shù)據(jù)逐漸轉(zhuǎn)變?yōu)榘虢Y(jié)構(gòu)化;(3)Velocity,數(shù)據(jù)處理的快速化,大量數(shù)據(jù)的快速傳輸、運算和處理成為可能;(4)Value,價值高和密度低,有分析價值的數(shù)據(jù)僅占一部分。
大數(shù)據(jù)的應(yīng)用帶來了科學研究范式的變化。Jim Gray提出了數(shù)據(jù)密集型科學的概念,并對科學研究的范式進行了以下分類:(1)實驗科學(Experimentation),通過對自然現(xiàn)象的描述,歸納其中的規(guī)律,該方法出現(xiàn)于 1000年前;(2)理論推演 (Theoretical),通過建模,由特殊到一般進行推進,歸納出理論框架,該方法出現(xiàn)于數(shù)百年前;(3)計算機仿真(Computational),擺脫對于實驗的依賴,通過“干試驗”模擬復(fù)雜現(xiàn)象,獲取實驗數(shù)據(jù),該方法出現(xiàn)于幾十年前;(4)數(shù)據(jù)密集型科學 (Data-Intensive Science),也稱第四范式,基于前三種方法,通過IT技術(shù),對于海量數(shù)據(jù)進行獲取、處理、存儲、分析。
2012年,美 國 開 始 啟 動“Big Data Research and Development Initiative”計 劃,旨在對大數(shù)據(jù)進行收集、處理、分析,從而加快科學領(lǐng)域的創(chuàng)新步伐,標志著正式將大數(shù)據(jù)提高到國家戰(zhàn)略層面。在教育領(lǐng)域,美國學校管理者協(xié)會(AASA)和學校網(wǎng)絡(luò)聯(lián)合會(COSN),同Gartne公司進行合作,啟動了“Closing the Gap: Turning Data into Action”項目,旨在促進大數(shù)據(jù)在教育領(lǐng)域的使用。此外,許多世界一流大學,例如耶魯大學、哈佛大學、斯坦福大學都采取了相應(yīng)舉措,加強了關(guān)于教育大數(shù)據(jù)的研究。
根據(jù)學者的定義,教育領(lǐng)域大數(shù)據(jù)的定義有宏觀和微觀之分。宏觀層面上,教育大數(shù)據(jù)涵蓋了一切參與者在教學活動中的行為數(shù)據(jù),具有層級性、時序性和情境性的特征;而微觀層面上,教育大數(shù)據(jù)專指學習者的行為數(shù)據(jù),主要來源為各類教育平臺、教育管理系統(tǒng)等。
LA是近年來大數(shù)據(jù)在教育領(lǐng)域運用較為典型的技術(shù)手段。首屆教育領(lǐng)域?qū)W習分析與知識國際會議提出,LA以理解、優(yōu)化學習情境為目的,對于學習者及其環(huán)境所產(chǎn)生的數(shù)據(jù)進行測量、收集、分析。
在“NMC Horizon Report 2012 Higher Education Edition”報告中,NMC闡釋了LA的定義:LA是指利用數(shù)據(jù)收集技術(shù)和分析方法,對于學習者學習參與、表現(xiàn)的相關(guān)數(shù)據(jù)進行研究與分析,從而達到評估學業(yè)、預(yù)測未來表現(xiàn)、發(fā)現(xiàn)潛在問題的目的。
美國國家教育部發(fā)布的報告“Enhancing teaching and learning through educational data mining and learning analytics”認為,LA需要綜合運用信息科學、社會學、心理學等學科中的相關(guān)理論,通過教育大數(shù)據(jù)的收集、統(tǒng)計、分析,建立相關(guān)模型,對學習行為進行評價,從而為學習者提供個性化反饋。
Bienkowski將LA的應(yīng)用領(lǐng)域分為幾類,包括用戶建模、領(lǐng)域建模、趨勢分析等。而這些應(yīng)用領(lǐng)域中LA的實現(xiàn),都需要相應(yīng)的數(shù)據(jù)來源,也需要相應(yīng)的技術(shù)方法。
首屆技術(shù)促進教育變革國際會議上,Jui-Long Hung博士提出了教育數(shù)據(jù)挖掘(EDM)這一概念。EDM是綜合運用機器學習和數(shù)據(jù)挖掘的技術(shù),對學習者行為相關(guān)數(shù)據(jù)進行研究,使行為模型化顯示,探究各變量的相關(guān)關(guān)系,預(yù)測學習者未來發(fā)展趨勢。
Baker R. S.認為,EDM的研究包括四方面:(1)建立學習模型,收集并分析學生的學習動機、學習掌握程度、學習態(tài)度等相關(guān)數(shù)據(jù),對于學生將來行為進行預(yù)測;(2)建立領(lǐng)域模型,對于教學者教學內(nèi)容進行展現(xiàn),調(diào)整教學序列;(3)評價支持效果,對于各類學習輔助軟件的支撐能力進行判斷與評價;(4)建立計算模型,模型中涵蓋了學習模型、領(lǐng)域模型涉及的數(shù)據(jù),可用于輔助教學的相關(guān)科學研究。
關(guān)于EDM的相關(guān)技術(shù)方法,Romero C和Ventura S歸納出五類:統(tǒng)計分析與可視化、聚類、預(yù)測、關(guān)系挖掘、文本挖掘。
常見的可視化技術(shù)包括標簽云、歷史流以及空間信息流等。通過對數(shù)據(jù)分析結(jié)果的可視化處理,可以發(fā)現(xiàn)其隱藏的關(guān)聯(lián),提供給用戶直觀觀測形式,最終用于指導決策。
許多網(wǎng)絡(luò)教學平臺都有對用戶行為進行記錄的功能,例如系統(tǒng)登錄時間、學習測試情況、與同學的交互等。學生的學習情況能夠直觀呈現(xiàn),對于教學者而言,能夠增加對于學生的了解與理解,更有針對性地對學生進行指導,從而有利于教學發(fā)展與進步;對于學習者而言,可直觀地了解自己的學習行為,反思自己的學習過程,從而促進自我規(guī)劃。
例如,魯汶大學的Gantz J和Reinsel D在歐盟項目ROLE中,開發(fā)了一個應(yīng)用程序,記錄學生在課程中參與活動的情況,并將數(shù)據(jù)進行可視化分析,以圖表來顯示學生的學習情況,為學生提供反饋。
在高等教育領(lǐng)域,數(shù)據(jù)可視化技術(shù)可以幫助教學管理者建立學習者模型,對學習表現(xiàn)進行分析,進而發(fā)現(xiàn)課程設(shè)計上的問題,完善教學設(shè)計與平臺功能,提供更好的教學支持服務(wù),促進教學組織的發(fā)展。
隨著互聯(lián)網(wǎng)時代的發(fā)展,如何將學習科學和現(xiàn)代技術(shù)有機結(jié)合,為所有學生創(chuàng)造融入性、個性化的學習體驗,使得學習能夠映射到學生未來的現(xiàn)實生活中,是當代教育面臨的全新挑戰(zhàn)。而大數(shù)據(jù)為這一挑戰(zhàn)提供了解決路徑。利用大數(shù)據(jù)的技術(shù)方法,可以增進教學者對于學習者真實狀態(tài)的了解,同時沉淀每個學習者的個性化數(shù)據(jù),便于教學者提供個性化的學習資源,在教學規(guī)劃、教學工具上都可實現(xiàn)個性化。
學習管理系統(tǒng)正在向個性化自適應(yīng)學習平臺發(fā)展。通過大數(shù)據(jù)技術(shù),持續(xù)采集學習者的數(shù)據(jù)并進行智能分析,學習行為的記錄更加精細化,可以完成從對結(jié)果到對過程的重視的轉(zhuǎn)化。
例如,MOOCs的學習中,學習者的各個行為都會產(chǎn)生大量數(shù)據(jù),通過對這些數(shù)據(jù)進行挖掘和分析,可全面跟蹤和掌握學習行為、過程和特點,提供分析報告和研究服務(wù),從而提高學習質(zhì)量。
教育大數(shù)據(jù)相關(guān)技術(shù)帶來新的教學方式變革,對于學習者的相關(guān)過程數(shù)據(jù)進行建模、分析、預(yù)測,有利于個性化教育的實現(xiàn)。美國在2010年發(fā)布的“National Education Technology Plan”中強調(diào),各類教育系統(tǒng)要利用技術(shù)測量、評價學習過程,教育管理者應(yīng)該利用技術(shù)收集學習中的實時數(shù)據(jù),為持續(xù)改善學習效果提供依據(jù)。
隨著互聯(lián)網(wǎng)時代的發(fā)展,新興的教學模式如MOOCs、翻轉(zhuǎn)課堂逐漸興起,而這些新興教育模式的開發(fā)與推廣,都與教育大數(shù)據(jù)技術(shù)的支持息息相關(guān)。教育技術(shù)的突破在于交互和大數(shù)據(jù),這使得MOOCs與此前的遠程和在線教育有本質(zhì)上的差別,形成了一場真正的教育革命。
以MOOCs為例,利用教育大數(shù)據(jù)技術(shù),在MOOCs學習過程中,系統(tǒng)對于學習者的過程性數(shù)據(jù)進行記錄與分析,最終會匯集成學習大數(shù)據(jù)。MOOCs系統(tǒng)建立了由機器自動評測的交互式測驗,可在分析中發(fā)現(xiàn)、總結(jié)數(shù)據(jù)中的規(guī)律,實現(xiàn)即時交互,使教學者能及時傳播知識,掌握每個學生的學習進度與狀態(tài),并能隨時對學習者進行引導。有別于傳統(tǒng)的遠程教育,MOOCs突破了單向的教師教書、學生學習的模式,提高了學習效率。
Course Signals System課程信號燈系統(tǒng),是普渡大學所開發(fā)的。借助數(shù)據(jù)挖掘技術(shù),該系統(tǒng)建立了相關(guān)模型,根據(jù)變量預(yù)測學生是否能夠完成該課程,數(shù)據(jù)量化地監(jiān)測學習進程,可以讓學生更好地了解自身狀態(tài)。
教育評價,Lee Joseph Cronbach將其界定為對任何于教育有指導意義的信息進行收集和分析的過程。而學者Daniel L.Stufflebeam提出,對于教育過程、教育成果涉及的資料進行收集,從而為教育決策提供一定支持的過程,是為教育評價。
隨著信息時代的發(fā)展,教育評價的數(shù)據(jù)主義趨勢逐漸顯現(xiàn),教育大數(shù)據(jù)在教育評價、教育決策方面發(fā)揮著越來越重要的作用,美國政府早在2002年便提出要重視教育大數(shù)據(jù)在支持教育決策方面的作用。
現(xiàn)階段已有不少將大數(shù)據(jù)評價方式應(yīng)用于教學中的實例。以LMS系統(tǒng)為例,LMS是用于教育管理自動化的軟件,在使用過程中,LMS能提供較多元的測試方式和較完整的評價體系,跟蹤記錄學習者數(shù)據(jù),并向管理者提交報告。同時,LMS中有個性化的學習軌跡數(shù)據(jù),能對學習進行客觀的分析,為教師改進教學提供重要依據(jù)。
而在我國,目前也已有完善的大數(shù)據(jù)教育評價應(yīng)用,通過大數(shù)據(jù)技術(shù)方法,客觀而全面地對學習者進行學習歷程的記錄與規(guī)劃。并且《國家中長期教育改革和發(fā)展規(guī)劃綱要》也提出了對大數(shù)據(jù)應(yīng)用于教育評價的重視,提出“要改進教育評價,根據(jù)培養(yǎng)目標和人才理念,建立科學、多樣的評價標準”。我國教育部已有相關(guān)的部門與人員,通過建立完善的數(shù)據(jù)庫,對教學質(zhì)量進行監(jiān)測。而上海作為試點地區(qū),在2011年已開始收集中小學學業(yè)水平數(shù)據(jù),包括學習動機、師生關(guān)系等信息。及時向教育管理部門反饋評價結(jié)果,有利于促進形成性評價的開展與實施。
在教育管理方面,教育大數(shù)據(jù)相關(guān)方法與技術(shù)能夠提供良好的支持。教育管理所涉及的數(shù)據(jù)量廣泛,包括人員信息、資產(chǎn)設(shè)備信息、教學活動信息、社會服務(wù)信息等,運用大數(shù)據(jù)技術(shù),能夠?qū)@些信息進行收集、分類、統(tǒng)計、分析,并加以可視化呈現(xiàn),構(gòu)建學校教育管理的Dashboard,讓自下而上的數(shù)據(jù)收集服務(wù)于管理者自上而下的校園管理。
目前,我國大學已廣泛將大數(shù)據(jù)用于教育管理之中。以復(fù)旦大學為例,其在多年前已有各業(yè)務(wù)數(shù)據(jù)庫,對這些分散數(shù)據(jù)庫進行整合,集成為全校范圍的綜合全局數(shù)據(jù)庫,為學校的教學管理提供支持。同時,上海財經(jīng)大學更是把教育數(shù)據(jù)倉庫寫入了本校信息化建設(shè)目標之中,計劃依靠數(shù)據(jù)倉庫技術(shù)對學校的校務(wù)管理提供決策支持。此外,在提升學校網(wǎng)絡(luò)安全、改善教學和科研管理、完善學生救助體系、防范教育危機、促進教育均衡發(fā)展等方面,教育大數(shù)據(jù)都能提供相應(yīng)支持。
綜上所述,教育領(lǐng)域的大數(shù)據(jù)應(yīng)用對于研究范式、教學方式、教育評價、教育管理都有所支持,但在應(yīng)用過程中需要注意數(shù)據(jù)的整合和交流。數(shù)據(jù)的重組與聯(lián)合、統(tǒng)一數(shù)據(jù)庫不同部分、不同數(shù)據(jù)庫之間的交流共享會產(chǎn)生比單個總和更高的價值。對于這一問題,美國有很多自組數(shù)據(jù)合作體進行數(shù)據(jù)交流共享,如COFHE、AAUDE、CSRDE等,都是較為成功的數(shù)據(jù)共享聯(lián)盟。
教育領(lǐng)域大數(shù)據(jù)的應(yīng)用,將增加學習透明性,但同時也有可能引發(fā)一系列社會倫理道德問題。針對這一問題,已有機構(gòu)與大學制定相關(guān)文件對其加以規(guī)避。例如,美國將對于學生隱私的保護寫入法案之中,美國頒布的《家庭教育權(quán)利與隱私法案》中就有相關(guān)規(guī)定;同時,在美國發(fā)布的“Big Data for Development: Challenges & Opportunities”報告中也提出,相關(guān)教育機構(gòu)在獲取學生個人數(shù)據(jù)信息后,如要交付給第三方機構(gòu)用于技術(shù)開發(fā),必須規(guī)避法律法規(guī)和相關(guān)國家政策。而我國目前正在積極推進大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用,在這一進程中,應(yīng)注重相關(guān)數(shù)據(jù)信息的隱私保護,提升技術(shù)防范措施,制定相應(yīng)法律法規(guī),通過國家保障讓教育大數(shù)據(jù)更好地發(fā)揮其真正的價值。