鄭婭峰,趙亞寧,白 雪,傅 騫
1.河南財經(jīng)政法大學(xué) 計算機(jī)與信息工程學(xué)院,鄭州450016
2.大連海事大學(xué) 航運經(jīng)濟(jì)與管理學(xué)院,遼寧 大連116026
3.河南財經(jīng)政法大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,鄭州450016
4.北京師范大學(xué) 教育學(xué)部 教育技術(shù)學(xué)院,北京100875
智慧教育作為我國教育改革與發(fā)展的重要組成部分,探索以大數(shù)據(jù)分析、物聯(lián)網(wǎng)感知、人工智能算法等為代表的智能技術(shù)與教育研究的深度融合[1]。智慧學(xué)習(xí)環(huán)境下,基于人工智能、物聯(lián)網(wǎng)、云計算、VR虛擬現(xiàn)實等先進(jìn)技術(shù)支持下的智能學(xué)習(xí)支持服務(wù)不斷豐富,使得學(xué)習(xí)者學(xué)習(xí)過程中的學(xué)習(xí)軌跡極易被系統(tǒng)全面捕獲并記錄,教育數(shù)據(jù)進(jìn)入了大數(shù)據(jù)時代[2]。智慧教育環(huán)境中生成的數(shù)據(jù)通常是龐大、復(fù)雜和異構(gòu)的,這些數(shù)據(jù)不僅包含學(xué)習(xí)管理系統(tǒng)中的課程參與、作業(yè)完成、閱讀材料、討論文本等異構(gòu)數(shù)據(jù),還包含學(xué)生在線學(xué)習(xí)產(chǎn)生的大量的點擊流數(shù)據(jù)以及智慧環(huán)境下的視頻、音頻、生物電信號等多模態(tài)數(shù)據(jù)信息[3]。盡管這些數(shù)據(jù)蘊含了大量關(guān)于學(xué)生自身及其與環(huán)境交互的豐富信息,但對于沒有掌握數(shù)據(jù)挖掘和分析處理技術(shù)的教師、學(xué)生和學(xué)校管理者來說,通常難以處理和解釋這些數(shù)據(jù)[4-5]。
教育大數(shù)據(jù)可視化利用人類視覺認(rèn)知高通量的特點,以可視化圖形的形式呈現(xiàn)隱含于教育教學(xué)數(shù)據(jù)中的認(rèn)知規(guī)律及行為模式,幫助用戶從大量數(shù)據(jù)中推斷有意義的信息,挖掘教育教學(xué)中隱藏的認(rèn)知規(guī)律,理解復(fù)雜教育現(xiàn)象[6]。近年來,可視化方法成為教育教學(xué)的活動實施[7]、規(guī)律挖掘[8]、教學(xué)設(shè)計[9]、反饋干預(yù)[10]及教學(xué)評價[11]等活動的重要支持手段。大量的產(chǎn)生于教學(xué)活動、管理活動、科研活動、校園活動中的學(xué)生學(xué)習(xí)行為數(shù)據(jù)、課堂交互數(shù)據(jù)、課程管理數(shù)據(jù)、學(xué)生發(fā)展數(shù)據(jù)、區(qū)域管理數(shù)據(jù)等都可以用來作為教育數(shù)據(jù)可視化呈現(xiàn)的數(shù)據(jù)來源。
教育數(shù)據(jù)可視化主要面向?qū)W習(xí)者、教師、管理人員使用,以提高學(xué)生的學(xué)習(xí)成績、改進(jìn)教學(xué)活動、提升管理效率和挖掘教育規(guī)律為直接目的。對學(xué)生而言,可視化數(shù)據(jù)使得學(xué)生能夠深入學(xué)習(xí)路徑、回溯他們的學(xué)習(xí)過程,進(jìn)行反思并理解它,促進(jìn)自我調(diào)節(jié)的學(xué)習(xí)以及幫助他們評估和調(diào)整學(xué)習(xí)策略來增強(qiáng)學(xué)習(xí)目標(biāo)的達(dá)成[12]。對教師而言,可視化數(shù)據(jù)幫助教師實時感知學(xué)習(xí)者正在做什么、如何做以及準(zhǔn)確發(fā)現(xiàn)他們的行為模式,從而使實時的教學(xué)監(jiān)督和及時反饋成為可能[13]。對于教學(xué)管理者而言,可視化數(shù)據(jù)幫助他們獲得大規(guī)模學(xué)習(xí)規(guī)律,發(fā)現(xiàn)可能無法完成課程的學(xué)生,評估設(shè)計的項目是否達(dá)到目標(biāo),促進(jìn)教育規(guī)律的認(rèn)識和教育評價的科學(xué)決策[14]。在大數(shù)據(jù)時代,教育大數(shù)據(jù)可視化成為學(xué)生自主學(xué)習(xí)、教師教學(xué)監(jiān)督以及管理者優(yōu)化決策的重要方法和手段,對于新時代下提升教育教學(xué)質(zhì)量起到了重要作用。
伴隨數(shù)據(jù)規(guī)模及種類的不斷擴(kuò)大,如何有效地表征和呈現(xiàn)教育場景中的大數(shù)據(jù)已經(jīng)成為一個重要的研究課題[15]。教育大數(shù)據(jù)可視化已經(jīng)得到了大量研究者的重視,但總體上仍處于起步階段,還有大量的空間值得探索。本文概述了教育大數(shù)據(jù)的特點,闡述了教育大數(shù)據(jù)可視化相關(guān)理論的發(fā)展脈絡(luò),更進(jìn)一步,從學(xué)生、教師和管理者三個角度全面總結(jié)了教育數(shù)據(jù)可視化發(fā)展現(xiàn)狀?;谖墨I(xiàn)分析,從實踐角度展示了可視化呈現(xiàn)技術(shù)在教育大數(shù)據(jù)研究中的具體應(yīng)用。最后研究提出了教育大數(shù)據(jù)可視化的現(xiàn)存問題及關(guān)鍵技術(shù)挑戰(zhàn),為教育大數(shù)據(jù)可視化方法研究指明未來方向。
教育大數(shù)據(jù)(big data in education,BDE)是指在整個教育活動過程中所產(chǎn)生的以及根據(jù)教育分析需要所采集到的一切用于教育發(fā)展并可創(chuàng)造潛在價值的數(shù)據(jù)集合[16]。每個教育相關(guān)者既是教育數(shù)據(jù)的生產(chǎn)者也是教育數(shù)據(jù)的消費者[17]。教育大數(shù)據(jù)主要來源包括學(xué)習(xí)管理系統(tǒng)(learning management system,LMS)、大型在線開放課程、開放教育資源(open educational resources,OER)和智慧課堂教學(xué)環(huán)境等。如在線學(xué)習(xí)活動中,學(xué)生學(xué)習(xí)進(jìn)度、社交共享、論壇消息、教學(xué)干預(yù)、用戶與系統(tǒng)的互動等數(shù)據(jù)信息都是教育大數(shù)據(jù)[18]。
教育大數(shù)據(jù)與傳統(tǒng)教育數(shù)據(jù)具有顯著的特征差異,不同研究者對其特征進(jìn)行了闡述。陳德鑫等人指出教育大數(shù)據(jù)精準(zhǔn)涵蓋了與教育相關(guān)的所有記錄,具有數(shù)據(jù)量大、類型繁多、連續(xù)性強(qiáng)、價值密度低等特點[19]。楊現(xiàn)民等人指出與傳統(tǒng)教育數(shù)據(jù)相比,教育大數(shù)據(jù)具有更強(qiáng)的實時性、連貫性、全面性和自然性等特征[16]。美國教育部發(fā)布的《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報告中則提出教育大數(shù)據(jù)具有層級性、時序性和情境性的特征[20]。
本研究綜合前人研究成果,并針對智慧學(xué)習(xí)環(huán)境下學(xué)習(xí)活動發(fā)生的特點,歸納提出教育大數(shù)據(jù)除具有大數(shù)據(jù)典型的4V特征外(規(guī)模大、價值大、數(shù)據(jù)流轉(zhuǎn)速度快以及數(shù)據(jù)類型多),還具有多維性、時序性、異構(gòu)性三種顯著特征。多維性特征是指由于教育對象及教育活動的復(fù)雜性,與其相關(guān)的教育過程性數(shù)據(jù)都具有典型的高維特征。如一個用于預(yù)測學(xué)生輟學(xué)的學(xué)生線上學(xué)習(xí)行為可以達(dá)到200 多種[21]。這些高維數(shù)據(jù)增加了數(shù)據(jù)分析的復(fù)雜度,同時也對可視化呈現(xiàn)帶來比較大的挑戰(zhàn)。教育大數(shù)據(jù)還具有時序性特征。學(xué)習(xí)活動的發(fā)生具有時間上的連貫性,因而教育數(shù)據(jù)具有典型的時空屬性。如學(xué)生伴隨時間的知識進(jìn)展、學(xué)生在線上學(xué)習(xí)中發(fā)生的學(xué)習(xí)行為序列等。這些基于時間序列的數(shù)據(jù)中常常蘊含重要的教育規(guī)律。因而,時序數(shù)據(jù)的分析是教育大數(shù)據(jù)挖掘的重要方面。教育大數(shù)據(jù)還具有典型的異構(gòu)性特征。傳統(tǒng)教育數(shù)據(jù)多為簡單統(tǒng)計型數(shù)據(jù)信息。而在智能時代,移動通訊、虛擬VR、智能傳感設(shè)備的普及使用,使得圖像、語音、文本、生物電信號等多模態(tài)數(shù)據(jù)的采集變得越來越容易,這些數(shù)據(jù)不僅呈現(xiàn)了結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化等不同結(jié)構(gòu)特征,而且數(shù)據(jù)表征的粒度、維度、形式各不相同,具有顯著的異構(gòu)特征。
教育大數(shù)據(jù)具有巨大的教育價值與潛力,其數(shù)據(jù)價值的釋放需要三個階段:教育數(shù)據(jù)采集、教育數(shù)據(jù)分析與處理、教育數(shù)據(jù)可視化和應(yīng)用[17]。教育數(shù)據(jù)可視化和應(yīng)用伴隨著教育大數(shù)據(jù)時代的到來而興起,成為教育數(shù)據(jù)分析的重要利器,對理解和挖掘復(fù)雜教育規(guī)律問題起到了極大的作用,是教育價值呈現(xiàn)的最直接體現(xiàn)。
可視化有助于分析和探索大規(guī)模復(fù)雜的教育數(shù)據(jù),在可視化應(yīng)用中,學(xué)習(xí)者的數(shù)據(jù)蹤跡(trace)被認(rèn)為是最有前途的數(shù)據(jù)來源。當(dāng)前教育可視化從應(yīng)用人群上可以分為學(xué)生、教師和教育管理者三類?;跀?shù)據(jù)痕跡的分析對學(xué)習(xí)者、教師和管理者等眾多利益相關(guān)者的決策起到了重要的優(yōu)化作用[22]。
面向?qū)W生的可視化工具旨在提高學(xué)生的自我意識,促進(jìn)學(xué)生元認(rèn)知發(fā)展[23]以及學(xué)習(xí)過程中的反思,從而激勵他們改進(jìn)學(xué)習(xí)行為,獲得學(xué)業(yè)的成功[14]。一些研究通過展示學(xué)生的學(xué)習(xí)行為或?qū)W習(xí)路徑促進(jìn)學(xué)習(xí)者的元認(rèn)知發(fā)展。如Law 等人[24]通過可視化呈現(xiàn)學(xué)生的目標(biāo)設(shè)定、任務(wù)列表、完成進(jìn)度以及對學(xué)習(xí)成果的自我評估等內(nèi)容,促進(jìn)和支持學(xué)生的自主學(xué)習(xí)。研究結(jié)果表明可視化在幫助學(xué)生設(shè)定合適學(xué)習(xí)目標(biāo),監(jiān)控他們的表現(xiàn)并對學(xué)習(xí)進(jìn)行自我反思方面都有顯著的積極作用。Xia等人[7]提出了可視化分析系統(tǒng)PeerLens,通過挖掘同等級學(xué)習(xí)者學(xué)習(xí)情況給出學(xué)習(xí)者可選的三種學(xué)習(xí)路徑,并使用新穎的類似拉鏈的視圖可視化用戶的詳細(xì)學(xué)習(xí)路徑,幫助他們高效地規(guī)劃如何在在線題庫中進(jìn)行學(xué)習(xí)。
可視化工具不僅可以促進(jìn)學(xué)生反思,還可以通過數(shù)據(jù)反饋使學(xué)生認(rèn)知工作更加輕松,提高學(xué)生知識構(gòu)建水平和協(xié)作參與等能力。如Barría 等人[25]提出一種基于協(xié)作學(xué)習(xí)環(huán)境的可視化工具,通過可視化團(tuán)隊之間的交流模式,來激勵學(xué)生參與在線討論,提高參與意識,結(jié)果表明該可視化工具能夠?qū)W(xué)生協(xié)作行為產(chǎn)生積極的影響。Corrin 等人[26]用學(xué)習(xí)分析儀表板的可視化方式向?qū)W生提供關(guān)于他們的表現(xiàn)以及所參與的學(xué)習(xí)活動的評估數(shù)據(jù)的反饋,研究結(jié)果表明,該方式使得在線學(xué)習(xí)的學(xué)生在學(xué)科成績上會有所提高,并且表現(xiàn)出了更好的保留行為。
一些研究還探索了針對特定情境的可視化應(yīng)用。Kamdi 等人[27]設(shè)計了一種用于科學(xué)教學(xué)的可視化工具,可以動態(tài)呈現(xiàn)科學(xué)過程及其變化。開展對照實驗的結(jié)果表明,動態(tài)可視化教學(xué)相對于靜態(tài)可視化教學(xué)更有助于學(xué)生對學(xué)習(xí)內(nèi)容建立深刻的理解,使學(xué)生在認(rèn)知過程中的記憶工作更加輕松,減少額外的認(rèn)知負(fù)荷。Virata等人[28]將一種增強(qiáng)現(xiàn)實可視化的工具用來幫助講師講授化學(xué)鍵和簡單化合物的課程,研究表明,虛擬增強(qiáng)的可視化呈現(xiàn)不僅可以提高學(xué)生的動機(jī),還可以引發(fā)更多的互動,對于學(xué)生對化學(xué)與現(xiàn)實生活的關(guān)系以及其意義形成過程的理解方面有很大的改善。
面向教師群體的可視化主要將學(xué)習(xí)分析結(jié)果以可視化的形式呈現(xiàn),幫助教師了解學(xué)習(xí)者的學(xué)習(xí)參與完成情況,形成對學(xué)習(xí)過程的動態(tài)監(jiān)控,適時調(diào)整教學(xué)過程[12]。Xia等人[29]提出了一種分析K12數(shù)學(xué)在線學(xué)習(xí)平臺的學(xué)生學(xué)習(xí)行為的可視化分析系統(tǒng),幫助教師快速發(fā)現(xiàn)學(xué)習(xí)材料設(shè)計中的潛在缺陷。Shi等人[3]開發(fā)名為VisMOOC(visualizing video clickstream data from massive open online courses)的工具幫助教師和教育分析人員通過可視化學(xué)生的點擊流數(shù)據(jù)來了解他們的在線視頻觀看行為。MOOC(massive open online course)在線學(xué)習(xí)可視化分析也是當(dāng)前的主流研究內(nèi)容。Wu等人[30]設(shè)計名為NetworkSeer的工具,可視化呈現(xiàn)參與MOOC學(xué)習(xí)的學(xué)生對論壇的使用情況,幫助教師了解學(xué)生在MOOC 論壇中的互動狀況。Wong等人[31]設(shè)計了一種交互式可視化分析系統(tǒng)MessageLens,從交流話題、情感、論壇用戶交互等不同方面支持對MOOC 論壇數(shù)據(jù)的多維可視化分析。同樣的,Zheng等人[32]開發(fā)了針對協(xié)作學(xué)習(xí)論壇的可視化分析工具,從知識加工、社交關(guān)系和行為模式三個不同的維度可視化協(xié)作小組的交互狀態(tài),幫助教師及時了解并對比協(xié)作小組問題解決過程。
可視化工具還可以對學(xué)生的學(xué)習(xí)成績、輟學(xué)、學(xué)習(xí)行為及表現(xiàn)進(jìn)行監(jiān)控和預(yù)測,分析學(xué)生學(xué)習(xí)行為或者學(xué)習(xí)序列背后的意義,幫助教師識別并及時干預(yù)有學(xué)業(yè)風(fēng)險的學(xué)生。如Deng等人[10]開發(fā)出一個交互式探索學(xué)生課程成績數(shù)據(jù)可視化界面——PerformanceVis,其將考試成績路徑、考試項目分析和預(yù)測模型的性能等視圖動態(tài)鏈接在一起,并結(jié)合機(jī)器學(xué)習(xí)技術(shù)來預(yù)測學(xué)生成績,幫助教師盡早發(fā)現(xiàn)有可能不及格的學(xué)生,做出學(xué)業(yè)干預(yù)措施。Chen等人[9]提出了DropoutSeer可視化系統(tǒng),從點擊流、論壇帖子和作業(yè)記錄中提取數(shù)據(jù)進(jìn)行分析,并利用時序視圖等方式可視化學(xué)生的學(xué)習(xí)情況、輟學(xué)預(yù)測結(jié)果,幫助教師理解學(xué)生輟學(xué)原因并及時對課程做出相應(yīng)調(diào)整。在Chen等人[33]的研究中,設(shè)計開發(fā)的ViSeq可視化分析系統(tǒng)呈現(xiàn)了學(xué)習(xí)者的學(xué)習(xí)順序模式、事件過渡和比較相似個體等視圖,通過可視化不同學(xué)習(xí)者群體的學(xué)習(xí)順序,幫助教師進(jìn)一步理解各種學(xué)習(xí)行為背后的原因和影響。
面向教育管理者的可視化工具旨在幫助管理者進(jìn)行科學(xué)的戰(zhàn)略決策和實踐改進(jìn)。如Guerra 等人[11]設(shè)計了呈現(xiàn)學(xué)生學(xué)術(shù)成績與課程體系結(jié)構(gòu)關(guān)系的可視化工具,幫助管理者檢查學(xué)生的學(xué)業(yè)情況,及時發(fā)現(xiàn)體系結(jié)構(gòu)中所存在的困難課程,促進(jìn)課程體系結(jié)構(gòu)的優(yōu)化。楊現(xiàn)民等人[34]設(shè)計了區(qū)域教育大數(shù)據(jù)的分析架構(gòu)與結(jié)果的可視化展示,通過采用基于圖表、地圖、數(shù)據(jù)流等多樣的可視化形式,直觀地呈現(xiàn)不同區(qū)域的教育發(fā)展水平、資源流動、信息交互等,為管理者實施科學(xué)決策提供支持。Cabanban-Casem[35]為簡化行政和技術(shù)人員與高等教育機(jī)構(gòu)相關(guān)人員之間的信息交換,開發(fā)了一個提供實時數(shù)據(jù)可視化的儀表板,幫助用戶系統(tǒng)地組織和查看數(shù)據(jù),并生成有效的報告,提高數(shù)據(jù)的有效性。更進(jìn)一步,基于數(shù)據(jù)驅(qū)動的可視化系統(tǒng)還能夠提供直接的教育分析報告,幫助管理者準(zhǔn)確預(yù)測未來趨勢,提供干預(yù)支持,并建立相關(guān)預(yù)警機(jī)制確保決策安全。如Krumm等人[36]為學(xué)術(shù)顧問開發(fā)出一個預(yù)警系統(tǒng),對學(xué)生產(chǎn)生的學(xué)習(xí)數(shù)據(jù)實時匯總分析,可視化學(xué)生的學(xué)習(xí)進(jìn)度和表現(xiàn),用來跟蹤識別成績不好的學(xué)生。Charleer等人[37]則開發(fā)了LISSA(learning dashboard for insights and support during study advice)系統(tǒng),通過可視化成績的等級、趨勢等數(shù)據(jù)來促進(jìn)學(xué)術(shù)顧問和學(xué)生的交流,幫助管理者激發(fā)學(xué)生的積極性,觸發(fā)學(xué)術(shù)顧問和學(xué)生之間更多的對話,更好地促進(jìn)學(xué)術(shù)咨詢的作用。
總體上而言,從應(yīng)用層面來講,當(dāng)前的教育可視化大多數(shù)還停留在學(xué)習(xí)分析結(jié)果的直觀呈現(xiàn),如教育領(lǐng)域大量應(yīng)用的儀表盤技術(shù)多呈現(xiàn)諸如學(xué)生互動信息、成績統(tǒng)計比較等聚合信息,這些研究大多強(qiáng)調(diào)可視化技術(shù)對學(xué)習(xí)分析結(jié)果的呈現(xiàn),支持學(xué)習(xí)者或教育者對數(shù)據(jù)的查看和理解。從技術(shù)層面來講,可視化呈現(xiàn)正在從傳統(tǒng)的統(tǒng)計圖表向文本、時序、地理空間、網(wǎng)絡(luò)等多樣的呈現(xiàn)方式過渡,交互式技術(shù)也使得教育數(shù)據(jù)處理從傳統(tǒng)的數(shù)據(jù)分析逐步轉(zhuǎn)變?yōu)樘剿餍詳?shù)據(jù)分析。未來的教育數(shù)據(jù)可視化呈現(xiàn)將從淺層數(shù)據(jù)聚合呈現(xiàn)工具向支持教學(xué)全過程深度探索的智能決策工具躍遷,使教育研究者能夠?qū)⑷祟惸芰Γㄒ曈X感知、創(chuàng)造力和常識之類)與機(jī)器能力(大內(nèi)存和快速計算)相結(jié)合,協(xié)同工作實現(xiàn)對內(nèi)在學(xué)習(xí)過程的深入理解[38]。
教育大數(shù)據(jù)的可視化流程主要是實現(xiàn)從數(shù)據(jù)空間到圖形空間的映射。根據(jù)Haber 和McNabb[39]在1990年提出的可視化流水線中描述的從數(shù)據(jù)空間到可視空間的幾個階段,可以將教育大數(shù)據(jù)可視化的基本流程歸納為教育大數(shù)據(jù)采集、數(shù)據(jù)清洗與預(yù)處理、數(shù)據(jù)存儲、數(shù)據(jù)可視化這四個基本步驟。利用各種設(shè)備從教育場景中采集數(shù)據(jù)之后,進(jìn)行數(shù)據(jù)清洗與預(yù)處理,以文件的形式(CSV、XML、Json 等)存儲或存儲在數(shù)據(jù)庫中。其中,數(shù)據(jù)存儲多采用Json 數(shù)據(jù)格式。Json數(shù)據(jù)格式是一種無序合集,合集中的所有元素都成對出現(xiàn),一般由名稱和對應(yīng)的數(shù)值組成,這種數(shù)據(jù)格式對于教育數(shù)據(jù)可視化具有非常重要的意義,能夠準(zhǔn)確地實現(xiàn)數(shù)據(jù)的挖掘、篩選和調(diào)用,極大地提升數(shù)據(jù)挖掘的效果,增強(qiáng)數(shù)據(jù)可視化的便捷性,對于教育數(shù)據(jù)可視化具有重要影響。
數(shù)據(jù)可視化則是在傳統(tǒng)數(shù)據(jù)采集、清洗、預(yù)處理、存儲后進(jìn)行的最后一個環(huán)節(jié)。其主要過程包括數(shù)據(jù)轉(zhuǎn)換、可視映射和視圖變換三個核心的交互過程。數(shù)據(jù)轉(zhuǎn)換是指從原始數(shù)據(jù)到可計量數(shù)據(jù)表的轉(zhuǎn)換,使得原始數(shù)據(jù)具備可視化映射的基礎(chǔ)??梢曈成涫菍?shù)據(jù)表數(shù)據(jù)轉(zhuǎn)換為坐標(biāo)、比例等圖形化屬性的過程,該過程是可視化表征的關(guān)鍵。通過可視映射數(shù)據(jù),將基于數(shù)學(xué)關(guān)系的數(shù)據(jù)表映射為能夠被人視覺感知的圖形屬性結(jié)構(gòu)。視圖變換是指將可視結(jié)構(gòu)根據(jù)設(shè)備屬性轉(zhuǎn)換為可視化的視圖這一映射過程。根據(jù)設(shè)備屬性的不同,可視化圖形在大小、分辨率、位置和顏色等方面進(jìn)行適應(yīng)性調(diào)整,使得可以跨終端呈現(xiàn)和展示。
針對不同的數(shù)據(jù)類型和目的,數(shù)據(jù)可視化已經(jīng)形成了從簡單的Excel電子表格、Google文檔等交互式可視化生成方式,到D3.js、Prefuse、ggplot2 等編程式生成等多種生成方式[40],表1給出了教育領(lǐng)域常用的數(shù)據(jù)可視化生成方式。
Table 1 Data visualization generation mode表1 數(shù)據(jù)可視化生成方式
交互式數(shù)據(jù)可視化生成方式操作簡單、直觀,用戶無需編程,但是局限于系統(tǒng)功能,無法滿足個性化需求?;诰幊痰臄?shù)據(jù)可視化生成方式需要用戶具有一定的編程能力,時間和人力成本較高,但是表達(dá)能力強(qiáng),可以基于用戶需求定制圖表,實現(xiàn)個性化展示。
教育大數(shù)據(jù)可視化旨在將復(fù)雜、抽象的教育數(shù)據(jù)挖掘結(jié)果進(jìn)行直觀的呈現(xiàn)與表達(dá),是教育大數(shù)據(jù)價值變現(xiàn)的最后一環(huán)[41]。可視化呈現(xiàn)的技術(shù)方法及其效果逐漸成為教育數(shù)據(jù)價值體現(xiàn)的關(guān)鍵問題。除傳統(tǒng)的基于圖表的可視化呈現(xiàn)外,一些創(chuàng)新的可視化技術(shù)方法也逐漸出現(xiàn)在當(dāng)前的研究中。本文對教育可視化相關(guān)文獻(xiàn)進(jìn)行分析匯總,并從文本數(shù)據(jù)可視化、多維數(shù)據(jù)可視化、網(wǎng)絡(luò)數(shù)據(jù)可視化、時間序列數(shù)據(jù)可視化以及地理空間數(shù)據(jù)可視化五個分類對現(xiàn)有研究進(jìn)行回顧與總結(jié)。
文本可視化是通過對文本資源的分析發(fā)現(xiàn)特定信息,并利用計算機(jī)技術(shù)將其以圖形化方式呈現(xiàn)出來的一種方法[42]。其主要包含兩種可視化方法:一是基于詞頻統(tǒng)計的文本可視化,即常見的標(biāo)簽云技術(shù);第二種是基于語義的文本可視化,要求通過關(guān)系計算、語義標(biāo)注、統(tǒng)計和推斷等技術(shù)手段,發(fā)現(xiàn)文本中隱含的語義關(guān)系,從而進(jìn)一步發(fā)現(xiàn)知識[43]。
(1)基于詞頻的文本數(shù)據(jù)可視化
基于詞頻的可視化實現(xiàn)思路可以將教育文本看成詞匯的集合,用詞頻表現(xiàn)文本特征。如鄭婭峰[44]采用標(biāo)簽云的方法將在線協(xié)作討論中的高頻關(guān)鍵詞按照大小、顏色等圖形屬性進(jìn)行可視化,如圖1(a)所示。圖1(b)同樣是采用標(biāo)簽云的形式對一門無線局域網(wǎng)課程周討論的高頻關(guān)鍵詞進(jìn)行可視化[45]。
Fig.1 Text data visualization based on word frequency圖1 基于詞頻的文本數(shù)據(jù)可視化
(2)基于語義的文本數(shù)據(jù)可視化
基于語義的文本可視化的實現(xiàn)思路是將教育文本看成詞匯及其關(guān)系的集合,通過語義標(biāo)注及語義檢索的方法反映文本內(nèi)在結(jié)構(gòu)和語義關(guān)系。Collins等人[46]的研究中采用文檔散的形式來顯示文本內(nèi)容的結(jié)構(gòu),它還通過徑向布局體現(xiàn)了詞的語義等級,如圖2(a)所示,最內(nèi)層的關(guān)鍵字表示文章內(nèi)容的最頂層概述,外層的詞是內(nèi)層詞的下義詞,顏色飽和度的深淺用來體現(xiàn)詞頻高低。而Wattenberg 等人[47]使用了單詞樹圖(word tree)把文本中的句子按樹形結(jié)構(gòu)布局,可以很容易看出一個單詞在文本中出現(xiàn)的頻率和單詞前后的聯(lián)系,還可以對上下文中的關(guān)鍵字進(jìn)行快速查詢和瀏覽,如圖2(b)所示。
(3)多信息文本數(shù)據(jù)可視化
文本數(shù)據(jù)的可視化不僅僅是關(guān)鍵詞的信息提取,對于教育領(lǐng)域來說,文本信息是最為重要的學(xué)習(xí)數(shù)據(jù),包含了諸如情感、學(xué)生參與、自我調(diào)節(jié)、交互意圖等不同維度的信息。一些文本數(shù)據(jù)可視化方法則通過對同一文本數(shù)據(jù)的多維度信息處理形成聯(lián)合數(shù)據(jù)可視化,獲得對同一數(shù)據(jù)的多維視角。如Hoque等人[48]將關(guān)鍵詞提取、情感識別的文本分析結(jié)果進(jìn)行組合,并與用戶id建立關(guān)聯(lián),直觀反映博客中用戶數(shù)量巨大的評論和回復(fù)信息,如圖3所示。該圖左側(cè)呈現(xiàn)會話的關(guān)鍵詞,中間的部分是對會話中的情感極性可視化,右邊則將兩者關(guān)聯(lián)到了用戶id上。
多維數(shù)據(jù)指的是具有多個維度屬性的數(shù)據(jù)變量,多維數(shù)據(jù)可視化將多維或高維的原始數(shù)據(jù)經(jīng)過處理后轉(zhuǎn)換成人類易于理解的圖形圖像[49]。多維數(shù)據(jù)可視化技術(shù)不是簡單的圖形映射,而是要盡量反映多維信息及其各屬性之間的關(guān)系信息,力圖在低維可視空間中展現(xiàn)抽象信息的多屬性數(shù)據(jù)特征[50]。目前主要的多維數(shù)據(jù)可視化技術(shù)主要有幾何圖技術(shù)、圖標(biāo)技術(shù)以及平行坐標(biāo)技術(shù)等。
Fig.2 Text data visualization based on semantic圖2 基于語義的文本數(shù)據(jù)可視化
Fig.3 Visualization of multi-information text data圖3 多信息文本數(shù)據(jù)可視化
(1)幾何圖技術(shù)
在教育研究中,箱線圖、雷達(dá)圖以及堆疊面積圖等通常被用來展現(xiàn)數(shù)據(jù)在多維度上的分布。箱線圖能顯示出一組數(shù)據(jù)的最大值、最小值、中位數(shù)及上下四分位數(shù),如Laet 等人[51]采用箱線圖來比較2018 年和2019 年之間工作量的變化,以及工作量之間的差異,如圖4(a)所示。雷達(dá)圖是將不同類系的多維度數(shù)據(jù)量映射到起始于同一圓心點的坐標(biāo)軸上,于圓周邊緣結(jié)束,將同一組的點使用線連接起來,用顏色區(qū)分系列,多被用來描述一個教育對象或教育活動的多個不同維度的表現(xiàn)。Vivian 等人[52]在研究中使用雷達(dá)圖對團(tuán)隊整體實時提供情感分析和可視化,從成員的討論中挖掘出八種基本情緒,包括“憤怒、期待、厭惡、恐懼、喜悅、悲傷、驚訝、信任”,如圖4(b)所示。而在Sung 等人[53]的研究中,將學(xué)生的評論類型分為六個維度,“一般會話、做筆記、提意見、提問、抱怨以及贊美”,并采用堆疊面積圖的形式呈現(xiàn)了學(xué)生對課程評論的數(shù)量和類型沿時間線的分布,如圖4(c)所示。
(2)圖標(biāo)技術(shù)
圖標(biāo)技術(shù)的基本思想是利用有多個視覺特征的圖標(biāo)來表達(dá)多維信息,不同呈現(xiàn)形式的圖標(biāo)用來表示多維信息的不同維度。通過圖標(biāo)用戶可以直觀、清晰并且準(zhǔn)確地理解圖標(biāo)每一維度所表示的意義。如圖5 所示,Charleer 等人[54]在研究中采用了點亮圖標(biāo)的方式來對學(xué)生的目標(biāo)達(dá)成情況進(jìn)行呈現(xiàn),圖中彩色徽章代表目標(biāo)已實現(xiàn),灰色徽章代表尚未實現(xiàn),徽章旁邊的數(shù)字(例如,紅色圓圈突出顯示的數(shù)字)指示班上有多少學(xué)生獲得了此徽章。
(3)平行坐標(biāo)技術(shù)
Fig.4 Geometric graph圖4 幾何圖
Fig.5 Visual presentation of student goal achievement based on icon technology圖5 基于圖標(biāo)技術(shù)的學(xué)生目標(biāo)達(dá)成情況可視化呈現(xiàn)
基于平行坐標(biāo)技術(shù)的多維數(shù)據(jù)可視化技術(shù)的基本思想是將N維數(shù)據(jù)空間用N條等距離的平行軸映射到二維平面上,每條軸線對應(yīng)于一個屬性維度。多維數(shù)據(jù)每個維度的屬性值可以在N個坐標(biāo)軸上找到對應(yīng)的點。將這N個點連接成一條折線表示一個多維數(shù)據(jù)點。如Wu等人[30]從學(xué)生日志數(shù)據(jù)中提取出日期、發(fā)帖數(shù)、成績等與學(xué)生行為相關(guān)的特征以及論壇活動中聲譽(yù)、貢獻(xiàn)度等特征,通過平行坐標(biāo)系的技術(shù)來建立分析各個特征之間的相關(guān)關(guān)系,如圖6所示。
網(wǎng)絡(luò)數(shù)據(jù)關(guān)系是教育研究中的常見數(shù)據(jù)類型。如群組學(xué)生交互關(guān)系、作者之間的共被引關(guān)系等。在網(wǎng)絡(luò)數(shù)據(jù)的可視化中,每個節(jié)點代表一個主體,節(jié)點之間的連接線表示主體之間的關(guān)聯(lián)關(guān)系。常見的有社會網(wǎng)絡(luò)表示法,同時層次數(shù)據(jù)也屬于網(wǎng)絡(luò)數(shù)據(jù)的一種[55]。網(wǎng)絡(luò)數(shù)據(jù)可視化常用的有社交關(guān)系圖、力導(dǎo)布局圖、樹圖等。
Fig.6 Parallel coordinates圖6 平行坐標(biāo)
Fig.7 Hierarchical data visualization圖7 層次數(shù)據(jù)可視化
(1)層次數(shù)據(jù)可視化
層次數(shù)據(jù)是一種常見的數(shù)據(jù)類型,它通常用來表達(dá)個體之間的包含和從屬關(guān)系,可以采用樹結(jié)構(gòu)表示[56]。Pardos 等人[57]的研究中通過樹圖對課程的流程和結(jié)構(gòu)進(jìn)行可視化的呈現(xiàn),如圖7(a)所示。Deng 等人[14]的研究則采用了可折疊的放射狀樹,將考試問題和作業(yè)問題之間的相關(guān)性進(jìn)行展示,教師可根據(jù)兩個問題之間的相關(guān)關(guān)系反饋教學(xué)并及時改進(jìn),如圖7(b)所示。
(2)社交網(wǎng)絡(luò)數(shù)據(jù)可視化
社交網(wǎng)絡(luò)是社會關(guān)系所構(gòu)成的結(jié)構(gòu),可反映社會群體間的社交關(guān)系[58]。對社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行可視化分析是最為重要的社會關(guān)系分析方法。通過將社會關(guān)系網(wǎng)絡(luò)抽象成由點和線組成的圖,可以直觀地分析社會群體網(wǎng)絡(luò)。再對圖形中的節(jié)點分布位置、節(jié)點的大小以及點線密度等進(jìn)行分析展示,可以有效觀測社會群體行為[59]。Saqr等人[60-61]采用了帶有方向的節(jié)點鏈接圖來描繪學(xué)生主體之間的交互。其中節(jié)點的大小反映該點在網(wǎng)絡(luò)中的重要性程度和處于網(wǎng)絡(luò)中心的程度,鏈接的粗細(xì)代表交互的強(qiáng)弱,不同顏色則代表不同的協(xié)作小組成員,如圖8(a)和圖8(b)所示。
在大規(guī)模的社會網(wǎng)絡(luò)可視化中,通常采用力導(dǎo)布局圖來對大規(guī)模社會網(wǎng)絡(luò)進(jìn)行分析。在Qu等人[5]的研究中,對學(xué)生的交互和成績進(jìn)行可視化,點的大小表示學(xué)生的活動水平,顏色表示學(xué)生的成績,點之間的鏈接代表學(xué)生之間的交互,可以清晰地看出不同成績學(xué)生間的交互程度,如圖9(a)所示。圖9(b)則顯示了一個討論組中學(xué)生之間的交互情況。其中,節(jié)點大小代表成員活躍程度,顏色深淺表達(dá)成員影響力,鏈接寬度代表兩個學(xué)生之間的相互回復(fù)頻率[62]。
Fig.8 Social network data visualization圖8 社交網(wǎng)絡(luò)數(shù)據(jù)可視化
Fig.9 Large-scale social network data visualization圖9 大規(guī)模社交網(wǎng)絡(luò)數(shù)據(jù)可視化
除此以外,與其他領(lǐng)域一樣,教育領(lǐng)域經(jīng)常采用網(wǎng)絡(luò)數(shù)據(jù)可視化進(jìn)行共被引關(guān)系及引文關(guān)系的呈現(xiàn),這被稱為一種特殊的網(wǎng)絡(luò)關(guān)系處理數(shù)據(jù)。如圖10(a)所示,在與Park[63]等人的論文相關(guān)作者網(wǎng)絡(luò)中,鏈接粗細(xì)表示兩位作者之間的密切程度,圓圈大小指示作者在該主題上被引用的次數(shù),由該圖可以看出以網(wǎng)絡(luò)學(xué)習(xí)主題為背景,多名作者之間依賴多個不同關(guān)鍵詞展開了不同形式的深度合作。除了作者以外,共被引關(guān)系也存在于文章之間,如圖10(b)展示了神經(jīng)信息處理系統(tǒng)進(jìn)展會議NIPS(conference and workshop on neural information processing systems)與頂級會議或期刊之間的相互總體引用量的關(guān)系視圖。
時間序列可視化是針對具有時間屬性的數(shù)據(jù)集進(jìn)行的呈現(xiàn)方式[64],強(qiáng)調(diào)基于時間發(fā)展內(nèi)容演變過程?;跁r間序列的可視化的一般設(shè)計思路是基于不同的時間單元進(jìn)行相關(guān)內(nèi)容的抽取和分析,并在時間軸上呈現(xiàn)連續(xù)的分析結(jié)果,從而發(fā)現(xiàn)伴隨時間變化的內(nèi)容演變規(guī)律,如數(shù)據(jù)的周期性以及峰值等。在教育中,數(shù)據(jù)可以在不同的時間聚合級別進(jìn)行分類展示,如按分鐘、小時、日、周或?qū)W期,按課程模塊,或在期中期末等。時間序列可視化是一個應(yīng)用前景廣闊的研究方向,但在教育領(lǐng)域的應(yīng)用剛剛起步。
Fig.10 Network diagram圖10 網(wǎng)絡(luò)圖
Fig.11 Time series圖11 時間序列圖
為了反映信息對象隨時間進(jìn)展所發(fā)生的變化及演變規(guī)律,可以采用桑基圖來進(jìn)行可視化呈現(xiàn)。如圖11(a)所示,該研究中將學(xué)生考試成績的等級分布與學(xué)期中不同時間開展的考試進(jìn)行關(guān)聯(lián)可視化,從而發(fā)現(xiàn)學(xué)生在屢次考試中成績分布的演變關(guān)系[65]。Zheng等人[32]的研究中,將學(xué)生討論的知識點隨時間的變化進(jìn)行可視化呈現(xiàn),通過時間軸觀察學(xué)生在討論中不同等級知識點的出現(xiàn)時間,從而直觀推斷學(xué)生問題解決的推進(jìn)程度,圖11(b)所示。
隨著教育大數(shù)據(jù)的不斷發(fā)展,研究者更加關(guān)注數(shù)據(jù)的精細(xì)層面,因此傳統(tǒng)的可視化圖表也與時序數(shù)據(jù)進(jìn)行有效整合,創(chuàng)新出更加適應(yīng)教育數(shù)據(jù)表達(dá)的創(chuàng)新可視化形式。如Chen 等人[33]的研究中,將傳統(tǒng)的和弦圖與基于時間序列的在線學(xué)習(xí)行為進(jìn)行融合展示,通過和弦的徑向布局,可以更好地比較不同成績等級的學(xué)習(xí)者在不同星期之間的學(xué)習(xí)序列過渡的差異,由圖12(a)所示。熱力圖混合日歷圖的形式同樣也被用到了教育中。在圖12(b)中,學(xué)習(xí)者的學(xué)習(xí)歷史信息被附加在日歷圖上展開,每一個活動矩陣記錄了學(xué)習(xí)者某一天的歷史學(xué)習(xí)活動信息,而當(dāng)天的學(xué)習(xí)時長則通過熱力圖的形式進(jìn)行表達(dá),顏色越深,學(xué)習(xí)時長越長[8]。
地理空間數(shù)據(jù)通常是指用于描述自然現(xiàn)象和社會事件的發(fā)生及演變的空間位置、分布、關(guān)系、變化規(guī)律等的數(shù)據(jù)。地理空間可視化能夠有效地融合數(shù)據(jù)挖掘和可視化設(shè)計來對地理空間數(shù)據(jù)中隱含的多維、時空、動態(tài)、關(guān)聯(lián)等特征進(jìn)行全面而細(xì)致的分析和探索[66]。在教育大數(shù)據(jù)中,地理空間數(shù)據(jù)通常應(yīng)用于教育統(tǒng)計信息對比,多從點和區(qū)域兩方面來進(jìn)行呈現(xiàn)。
(1)基于點的地理空間數(shù)據(jù)可視化
在地理空間數(shù)據(jù)可視分析研究中,通常借助點的設(shè)計描述實體屬性數(shù)據(jù)的分布和位置信息。Emmons等人[67]借助點狀地圖的形式對MOOC學(xué)生的生源地進(jìn)行可視化的呈現(xiàn),圖中使用不同顏色顯示了2013年和2014 年參與MOOC 學(xué)習(xí)的學(xué)生生源地,圓圈大小代表該區(qū)域參與學(xué)生的多少,如圖13(a)所示。He等人[68]的研究中同樣采用了基于點的地理空間數(shù)據(jù)可視化,如圖13(b)顯示了西安交通大學(xué)的在線遠(yuǎn)程教學(xué)中跨地區(qū)招生情況,圖中顯示了有很大比例的學(xué)生來自于學(xué)習(xí)中心所在省份以外的省份。
(2)基于區(qū)域的地理空間數(shù)據(jù)可視化
區(qū)域是地理空間數(shù)據(jù)中具有相鄰空間位置或者相似屬性的地域范圍。例如,地圖中的各個國家、省份、城市等行政區(qū)域或基于人類社交行為的屬性區(qū)域等。通?;趨^(qū)域的地理空間數(shù)據(jù)可視化需要結(jié)合熱力圖來進(jìn)行呈現(xiàn)。圖14(a)顯示了通過Coursera提供的斯坦福密碼學(xué)課程的每個國家的證書獲得者與注冊人數(shù)的比率[69],越深的顏色代表該比率越高。圖14(b)顯示的則是經(jīng)合組織國際學(xué)生評估計劃PISA 在2015 年首次評估的學(xué)生協(xié)作解決問題的能力,圖中不同顏色代表該區(qū)域?qū)W生協(xié)作解決問題能力的分?jǐn)?shù)高低[70]。
Fig.12 Time series圖12 時間序列圖
Fig.13 Geospatial data visualization based on point圖13 基于點的地理空間數(shù)據(jù)可視化
Fig.14 Geospatial data visualization based on region圖14 基于區(qū)域的地理空間數(shù)據(jù)可視化
不同的教育數(shù)據(jù)具有的特征不同,可視化呈現(xiàn)要基于數(shù)據(jù)的基本特征和展示的目標(biāo)需求找到合適的可視化方式,幫助人們理解數(shù)據(jù)。教育大數(shù)據(jù)可視化視圖的特征及其適用場景如表2總結(jié)所示。
目前,上述各種面向文本、面向過程、面向空間的可視化技術(shù)呈現(xiàn),已成為教育大數(shù)據(jù)應(yīng)用領(lǐng)域關(guān)注的研究重點。這其中涉及到如下的關(guān)鍵交互技術(shù)。
動態(tài)查詢與過濾技術(shù)在教育可視化中具有重要作用。在教育場景中,大多數(shù)具有時序特征的數(shù)據(jù)需要進(jìn)行實時狀態(tài)呈現(xiàn),應(yīng)用動態(tài)過濾交互技術(shù)可以對數(shù)據(jù)迭代挖掘和過濾,達(dá)成數(shù)據(jù)動態(tài)刷新,以確保數(shù)據(jù)顯示的準(zhǔn)確性。當(dāng)數(shù)據(jù)集規(guī)模非常大時,動態(tài)查詢與過濾技術(shù)還可以解決由大規(guī)模密集數(shù)據(jù)引起的“視覺混淆”(visual clutter)問題。動態(tài)查詢與過濾技術(shù)主要通過用戶動態(tài)交互控制,依賴全局可視化視圖,使用用戶直接操縱的方式實施快速、增量式、可回溯的查詢控制,同時可以在查詢時動態(tài)調(diào)整參數(shù)使得查詢結(jié)果做出相應(yīng)改變??梢暬瑒訔l、過濾透鏡等都是常用的動態(tài)查詢與過濾控件。動態(tài)查詢與可視化的結(jié)合,使得視覺編碼和交互操作迭代進(jìn)行,動態(tài)實時地反饋和更新過濾結(jié)果,達(dá)成用戶對結(jié)果快速評價的目的,從而加速教育信息獲取效率。
Table 2 Visualization features and application scenarios表2 可視化特征及應(yīng)用場景
可縮放/變形界面技術(shù)是實現(xiàn)從高層概要性信息到底層細(xì)節(jié)性信息再到分層可視化的重要支撐技術(shù)。可視化信息探索的過程即為“信息覓食”的過程,分析人員需要在信息可視化界面中通過概覽、縮放、查看細(xì)節(jié)、檢索等交互操作完成從總覽視圖到獲得有價值的結(jié)果信息,這其中的核心是語義縮放技術(shù)。即當(dāng)需要在固定的屏幕空間內(nèi)呈現(xiàn)從整體到局部的連續(xù)變化時,系統(tǒng)通過提供更改比例大小滑塊實現(xiàn)視圖的縮放展示,允許用戶縱深跟蹤觀察個體學(xué)習(xí)行為信息。變形技術(shù)包括以較高的詳細(xì)程度顯示部分?jǐn)?shù)據(jù),而以較低的詳細(xì)程度顯示其他數(shù)據(jù)的交互變形方法。魚眼視圖技術(shù)[71]、雙曲變形技術(shù)[72]、雙焦點透鏡技術(shù)[73]、透視墻技術(shù)[74]等是目前常用的交互變形技術(shù)。結(jié)合語義距離算法,這些技術(shù)能夠在突出教育數(shù)據(jù)關(guān)注焦點時仍保持對上下文的整體了解,可以為大規(guī)模在線學(xué)習(xí)交互分析、教學(xué)視頻情感及行為分析等密集型可視化界面和強(qiáng)調(diào)上下文關(guān)聯(lián)的搜索分析行為提供有力的支持。
多視圖關(guān)聯(lián)技術(shù)強(qiáng)調(diào)多個角度數(shù)據(jù)的內(nèi)在關(guān)聯(lián)分析。教育數(shù)據(jù)對象往往是具有多個維度的信息,這些不同維度的信息之間又具有語義關(guān)聯(lián)關(guān)系。運用多側(cè)面關(guān)聯(lián)技術(shù),可以建立針對各個信息屬性的視圖,在交互過程中對多視圖中的可視對象進(jìn)行動態(tài)關(guān)聯(lián),以幫助更好地探索數(shù)據(jù)之間內(nèi)在關(guān)系和規(guī)律。用戶在使用時,在與任意一個視圖中的節(jié)點進(jìn)行交互時,都可以動態(tài)鏈接到其他視圖中具有語義關(guān)聯(lián)的節(jié)點集合,實現(xiàn)視圖聯(lián)動。多視圖關(guān)聯(lián)技術(shù)可參考基于本體的多側(cè)面關(guān)聯(lián)模式[55],多側(cè)面關(guān)聯(lián)技術(shù)強(qiáng)調(diào)從多個角度來分析問題,并且重在建立多個分析角度之間的內(nèi)在關(guān)聯(lián)關(guān)系,為多維的教育數(shù)據(jù)分析提供了相應(yīng)的可視分析技術(shù)的支持。
未來的智慧學(xué)習(xí)環(huán)境下,VR/AR環(huán)境、生物電信號等多模態(tài)實時數(shù)據(jù)種類變得多樣,皮膚電、眼動、脈搏、體態(tài)、腦電等數(shù)據(jù)信息的便捷采集,強(qiáng)化了多模態(tài)信息的可用性。多模態(tài)信息的整合利用對于教育數(shù)據(jù)分析與規(guī)律挖掘具有重要價值[75]。多模態(tài)數(shù)據(jù)在應(yīng)用前必須經(jīng)過數(shù)據(jù)的預(yù)處理、轉(zhuǎn)換、融合等,以統(tǒng)一的形式進(jìn)行表達(dá)。然而,由于教育環(huán)境的特殊性,保證數(shù)據(jù)的準(zhǔn)確性、完整型、一致性等存在重要挑戰(zhàn)。
解決這一問題,需要在數(shù)據(jù)采集的標(biāo)準(zhǔn)、教育數(shù)據(jù)融合機(jī)制、數(shù)據(jù)分析與集成等方面深入研究。在數(shù)據(jù)采集方面,構(gòu)建教育數(shù)據(jù)采集標(biāo)準(zhǔn),并借鑒當(dāng)前不斷發(fā)展的深度學(xué)習(xí)技術(shù)方法,提升表情、情緒、姿態(tài)、生理信號等數(shù)據(jù)采集與識別的準(zhǔn)確度。在數(shù)據(jù)整合上,應(yīng)建立有效的數(shù)據(jù)融合機(jī)制,加強(qiáng)語義關(guān)聯(lián)的挖掘與獲取,關(guān)注教育數(shù)據(jù)的時序特征及環(huán)境狀態(tài)特征,建立時序數(shù)據(jù)與學(xué)習(xí)情境數(shù)據(jù)之間的映射關(guān)系,內(nèi)隱數(shù)據(jù)與外顯數(shù)據(jù)的關(guān)聯(lián)關(guān)系,實現(xiàn)數(shù)據(jù)之間的統(tǒng)一表征與有機(jī)關(guān)聯(lián),精準(zhǔn)表征數(shù)據(jù)變化規(guī)律后的教育行為。在數(shù)據(jù)分析與集成方面,探索高維大規(guī)模數(shù)據(jù)的有效降維,大規(guī)模教育數(shù)據(jù)的分布式并行運算,數(shù)據(jù)模型與可視化分析系統(tǒng)的松耦合接口關(guān)系,使得分析人員無需關(guān)注數(shù)據(jù)接口及數(shù)據(jù)分析與融合的復(fù)雜機(jī)理,提升可視化分析工具應(yīng)用效率。
當(dāng)前教育可視化工具與人的協(xié)同交互性不足,限制了教學(xué)參與者通過可視化交互深入理解和探索學(xué)習(xí)分析結(jié)果。現(xiàn)有研究主要通過學(xué)習(xí)儀表盤等可視化學(xué)習(xí)分析工具將關(guān)于學(xué)習(xí)者、學(xué)習(xí)過程、學(xué)習(xí)環(huán)境的不同指標(biāo)聚合到一個或多個可視化界面中進(jìn)行顯示。這些工具信息呈現(xiàn)固定,且僅能采用簡單的鼠標(biāo)點擊事件篩選需要呈現(xiàn)的信息。這使得教學(xué)參與者很難解釋工具呈現(xiàn)的數(shù)據(jù),更難以將工具中的反饋轉(zhuǎn)化為實際可操作的教學(xué)決策,降低了教育大數(shù)據(jù)可視化帶來的實際價值。另一方面,當(dāng)前的交互模式還處于鼠標(biāo)點擊的單一交互模式,缺乏開展實際的教學(xué)環(huán)境中進(jìn)行的自然交互可視化研究探索。自然交互可以使得分析者將注意力聚焦于分析任務(wù)上,而無需過多地關(guān)注分析過程中的具體操作方式和流程。尤其是在一些復(fù)雜的大型協(xié)同分析任務(wù)中,不依賴鼠標(biāo)和鍵盤的交互方式可以大大地提升交互的自然性和效率。
解決這一問題一方面可以大力發(fā)展動態(tài)查詢與過濾技術(shù)、可縮放界面技術(shù)、多視圖關(guān)聯(lián)技術(shù)等支持可視化推理與人機(jī)交互的重要技術(shù)方法[55],并加強(qiáng)這些方法的融合應(yīng)用;另一方面,發(fā)展以動作捕捉、空間定位、眼動、語音交互、多點觸控等交互模態(tài)的自然方式交互的教育可視化應(yīng)用工具,使得可視化應(yīng)用在教育中更具情境適切性,也是教育可視化交互方式上的重要技術(shù)挑戰(zhàn)。當(dāng)前已有一些初步的研究,如基于數(shù)字桌面多點交互協(xié)作可視分析[76]、基于手勢的交互可視方法[77],但在教育領(lǐng)域還未見到有效結(jié)合和應(yīng)用。
當(dāng)前的教育大數(shù)據(jù)可視化分析仍是以基于數(shù)據(jù)挖掘結(jié)果的聚合展示為主。在整個過程中,數(shù)據(jù)分析與可視化呈現(xiàn)缺乏人類智能的參與,這使得通過學(xué)習(xí)分析工具獲得的結(jié)果過于專業(yè),教師和學(xué)習(xí)者無法輕易理解這些可視化結(jié)果中表達(dá)的信息。在教育領(lǐng)域中,強(qiáng)化人工智能技術(shù)和交互可視化技術(shù)與人類智能的協(xié)同工作范式,將人類教師具有的感知認(rèn)知能力與人工智能具有的快速處理與響應(yīng)能力相結(jié)合,可以在未來促進(jìn)可視化分析工具從淺層數(shù)據(jù)聚合呈現(xiàn)工具向支持教學(xué)全過程深度探索的智能決策工具躍遷,實現(xiàn)對內(nèi)在學(xué)習(xí)過程的深入理解。
人機(jī)協(xié)同范式是人機(jī)共同工作的理論基礎(chǔ)與框架。發(fā)展教育可視化領(lǐng)域的人機(jī)協(xié)同范式,使得人類智能和人工智能更好地進(jìn)行互動和協(xié)同,促進(jìn)學(xué)生學(xué)習(xí)、教師教學(xué)以及管理者進(jìn)行科學(xué)決策。更具體的說,教育數(shù)據(jù)可視化需要探索不同的教學(xué)參與者(如學(xué)習(xí)者、教師、管理者)和教育場景(如混合學(xué)習(xí)、在線學(xué)習(xí)等)的需求,提供個性化、適應(yīng)性和場景化的人機(jī)協(xié)同范式。人機(jī)協(xié)同范式需要考慮人與機(jī)器協(xié)作的介入時機(jī)、介入方式、信息互換形式等核心問題,即需要清晰和細(xì)致地界定在問題分析過程中人機(jī)交互的多層次多粒度任務(wù)應(yīng)該如何最優(yōu)化地部署在人、機(jī)兩端[55];以及各種交互技術(shù)如何最優(yōu)地匹配具體場景的分析任務(wù)中的問題;探索人機(jī)可視化過程中如何通過恰當(dāng)?shù)娜藱C(jī)信息互換,強(qiáng)化人機(jī)協(xié)同循環(huán)過程,使得可視呈現(xiàn)的內(nèi)容不斷得到迭代優(yōu)化[78]。
當(dāng)前,可視化研究領(lǐng)域開發(fā)和積累了大量的可視化呈現(xiàn)形式,為大數(shù)據(jù)呈現(xiàn)提供了有力的技術(shù)支持。然而,從可視化技術(shù)領(lǐng)域在教育應(yīng)用中的諸多可視化表征形式來看,許多可視化圖表僅追求技術(shù)角度的創(chuàng)新,而忽視了可視化應(yīng)用符合人的認(rèn)知規(guī)律、心理映像、視覺感知的本質(zhì)需求[55]。已有研究表明,當(dāng)前的教育數(shù)據(jù)可視化呈現(xiàn)較少在教育相關(guān)理論的指導(dǎo)下進(jìn)行[30],因而造成很多創(chuàng)新的可視化呈現(xiàn)技術(shù)只能被少部分研究人員理解,而對于可視化應(yīng)用的教師和學(xué)生主體群體,卻難以獲得廣泛的接受。
針對這一問題,如何將認(rèn)知科學(xué)、教育科學(xué)、信息技術(shù)有效結(jié)合,建立教育數(shù)據(jù)可視化設(shè)計的標(biāo)準(zhǔn)規(guī)范和有效評價體系,對可視化呈現(xiàn)設(shè)計進(jìn)行評估,是未來教育數(shù)據(jù)可視化發(fā)展的重要研究方向。教育數(shù)據(jù)可視化分析的過程是從數(shù)據(jù)到知識的過程,分析人員與可視化界面平臺交互的過程是人的內(nèi)在認(rèn)知與外部環(huán)境交互作用的結(jié)合,體現(xiàn)了分析人員進(jìn)行有目的有意義知識建構(gòu)的過程。現(xiàn)有的認(rèn)知與信息科學(xué)相關(guān)理論為指導(dǎo)這一過程提供了理論基礎(chǔ),如認(rèn)知發(fā)展理論[79]、意義建構(gòu)循環(huán)模型建構(gòu)主義理論[80]等?;谶@些理論,可以構(gòu)建評估教育數(shù)據(jù)可視化設(shè)計的標(biāo)準(zhǔn)規(guī)范,對于可視化設(shè)計的效能進(jìn)行評估。對于教育數(shù)據(jù)可視化而言,有效性不僅體現(xiàn)在功能的可用性、有用性以及滿意度等方面,更體現(xiàn)在可視化設(shè)計及其結(jié)果呈現(xiàn)對使用者的心理映像的改變。如可視化設(shè)計是否增強(qiáng)了學(xué)習(xí)者的意識和反思能力,是否促進(jìn)了認(rèn)知、行為或情感方面的變化,是否促進(jìn)了學(xué)習(xí)者的自我調(diào)節(jié)能力等??梢暬ぞ呤欠窨梢詿o縫集成到在線學(xué)習(xí)環(huán)境和學(xué)習(xí)者的常規(guī)學(xué)習(xí)活動中,促進(jìn)教師對數(shù)據(jù)規(guī)律的再認(rèn)識。因而,評估可以從認(rèn)知、元認(rèn)知、行為態(tài)度情感、自我與社會調(diào)節(jié)能力等多方面進(jìn)行構(gòu)建。
本文從教育大數(shù)據(jù)可視化應(yīng)用這一視角出發(fā),分析教育大數(shù)據(jù)的特征,并探討了教育大數(shù)據(jù)可視化領(lǐng)域的相關(guān)概念的發(fā)展。通過文獻(xiàn)綜述,呈現(xiàn)了當(dāng)前面向?qū)W生認(rèn)知發(fā)展、教師教學(xué)監(jiān)督以及管理者科學(xué)決策的三大類可視化教育應(yīng)用。在此基礎(chǔ)上,討論了面向教育大數(shù)據(jù)主流應(yīng)用的可視化關(guān)鍵技術(shù)及呈現(xiàn)方法。更進(jìn)一步,基于對現(xiàn)存問題的分析,提出了當(dāng)前教育可視化面臨的問題和關(guān)鍵技術(shù)挑戰(zhàn)。
當(dāng)前,教育大數(shù)據(jù)可視化還處于起步階段,面臨較多的理論探索和技術(shù)應(yīng)用挑戰(zhàn)。未來的教育可視化工具絕不僅僅是解決最后一公里的呈現(xiàn)問題,而是發(fā)展人機(jī)交互及人機(jī)協(xié)同等關(guān)鍵技術(shù),強(qiáng)化人工智能技術(shù)和交互可視化技術(shù)與人類智能的協(xié)同工作,將人類教師具有的感知認(rèn)知能力與人工智能具有的快速處理與響應(yīng)能力相結(jié)合,促進(jìn)可視化分析工具從淺層數(shù)據(jù)聚合呈現(xiàn)工具向支持教學(xué)全過程深度探索的智能決策工具躍遷,為深度認(rèn)識教育規(guī)律,解決復(fù)雜教育問題提供技術(shù)支撐。