隨著人們對知識的需求不斷增加且變得越發(fā)迫切,知識發(fā)現(xiàn)研究日益受到關(guān)注,而基于大數(shù)據(jù)的知識發(fā)現(xiàn)有助于挖掘課堂教學(xué)行為和教師實踐性知識的數(shù)據(jù)樣貌,為理解教育教學(xué)現(xiàn)象及其本質(zhì)提供深刻的洞見。首都師范大學(xué)教授王陸結(jié)合團(tuán)隊22年來扎根中小學(xué)課堂的實踐,深入淺出地介紹了基于大數(shù)據(jù)的知識發(fā)現(xiàn)視頻課例中數(shù)據(jù)分析與挖掘的三種促進(jìn)教師專業(yè)發(fā)展的應(yīng)用模式。
作者簡介
王陸 首都師范大學(xué)教育技術(shù)研究所所長
首都師范大學(xué)現(xiàn)代教育技術(shù)重點實驗室主任
北京市基礎(chǔ)教育信息化實驗教學(xué)示范中心主任
引言
大數(shù)據(jù)即巨量的資料,指的是專業(yè)領(lǐng)域中所創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。什么是非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)?就視頻課例這一特定的研究情境來說,典型的非結(jié)構(gòu)化數(shù)據(jù)就是我們在課堂中所錄下來的課堂錄像;半結(jié)構(gòu)化數(shù)據(jù)就是包含圖形、符號、數(shù)據(jù)等形式的文檔,如教師課前撰寫的教學(xué)設(shè)計方案文本以及課后撰寫的反思文本。
在視頻課例研究中,我所在團(tuán)隊開發(fā)的靠譜COP項目研究成果包含了兩大類型數(shù)據(jù)——非結(jié)構(gòu)化型數(shù)據(jù)和半結(jié)構(gòu)化型數(shù)據(jù),分別對應(yīng)了課堂教學(xué)行為大數(shù)據(jù)和實踐性知識大數(shù)據(jù)。在搞清楚什么是大數(shù)據(jù)、課堂教學(xué)行為大數(shù)據(jù)、實踐性知識大數(shù)據(jù)后,我將從四個方面對視頻課例進(jìn)行分析和探究。
洞見大數(shù)據(jù)知識發(fā)現(xiàn)
的新見解
知識發(fā)現(xiàn)是指從數(shù)據(jù)集中提取有效的、新穎的、潛在有用的、可理解的模式的非平凡過程。同時,隨著計算與網(wǎng)絡(luò)通信技術(shù)、觀測與傳感儀器以及數(shù)字存儲的發(fā)展,教育學(xué)科同很多學(xué)科一樣,正在從數(shù)據(jù)貧乏轉(zhuǎn)變?yōu)閿?shù)據(jù)富集的研究領(lǐng)域,一種新的透鏡——大數(shù)據(jù)正在影響著研究者看待和認(rèn)識教育教學(xué)問題的方式,也逐漸形成了從數(shù)據(jù)中提取新知識的有效途徑。“讓數(shù)據(jù)說話”開始成為教育學(xué)研究領(lǐng)域的一種理論主張,基于大數(shù)據(jù)的知識發(fā)現(xiàn)為教育學(xué)的研究找到了新起點,也將獲得更深刻的洞見。
數(shù)據(jù)是知識發(fā)現(xiàn)的基礎(chǔ)與前提,數(shù)據(jù)處理的理論、方法與技術(shù)勢必影響知識發(fā)現(xiàn)的過程與結(jié)果。大數(shù)據(jù)的知識發(fā)現(xiàn)主要取決于兩個關(guān)鍵部分:一是數(shù)據(jù)獲取能力,即對數(shù)據(jù)獲得、共享、整合、分析以及構(gòu)建預(yù)測模型的能力,要獲取足夠多、足夠復(fù)雜、足夠蘊含復(fù)雜關(guān)系的數(shù)據(jù);二是數(shù)據(jù)分析能力,即將精細(xì)的概率模型、統(tǒng)計推理、數(shù)據(jù)挖掘與機器學(xué)習(xí)相結(jié)合。
當(dāng)然,知識發(fā)現(xiàn)不可能無中生有地創(chuàng)造知識,數(shù)據(jù)、信息、實物、現(xiàn)象之間普遍存在的各種關(guān)系是進(jìn)行知識發(fā)現(xiàn)的基本依據(jù),盡管在現(xiàn)實世界中有些關(guān)系是顯性的、直接的、較為容易發(fā)現(xiàn)的,甚至可以觀測到的,但是絕大部分關(guān)系還是隱性的,隱藏在我們數(shù)據(jù)信息事物和現(xiàn)象中,不容易被發(fā)現(xiàn)。其基本關(guān)系可以分為五種:因果關(guān)系,因時間而形成,是歸納、演繹等知識發(fā)現(xiàn)方法的基礎(chǔ);相似關(guān)系,因特征相似而形成,是類比、想象、聯(lián)想等知識發(fā)現(xiàn)方法的基礎(chǔ);結(jié)構(gòu)關(guān)系,因空間而形成,是系統(tǒng)、綜合等知識發(fā)現(xiàn)方法的基礎(chǔ);邏輯關(guān)系,因邏輯而形成,是分類、比較等知識發(fā)現(xiàn)方法的基礎(chǔ);數(shù)量關(guān)系,因數(shù)據(jù)而形成,是統(tǒng)計學(xué)、數(shù)學(xué)等知識發(fā)現(xiàn)方法的基礎(chǔ)。
大數(shù)據(jù)時代知識發(fā)現(xiàn)的思維模式超越了傳統(tǒng)數(shù)據(jù)分析和數(shù)據(jù)演繹的思維局限性,特別強調(diào)三個特點。1.整體兼顧部分:從方法論上看,“全數(shù)據(jù)模式”注重運用整體方法把握事物,但要克服其局限性,兼顧部分,深化認(rèn)識,重視還原事物的層次性。2.量化整合質(zhì)化:從內(nèi)容上看,質(zhì)化研究與量化研究應(yīng)該是統(tǒng)一的、相互補充的——質(zhì)化研究為量化研究奠定基礎(chǔ),是量化研究的依據(jù);而量化研究是質(zhì)化研究的具體化,使質(zhì)化研究更為科學(xué)、準(zhǔn)確。3.因果強調(diào)相關(guān):因果關(guān)系是客觀存在的,是我們認(rèn)識世界本質(zhì)的邏輯前提;即便大數(shù)據(jù)更側(cè)重強調(diào)相關(guān)關(guān)系,也始終離不開對因果關(guān)系的追求,這是由思維的本性所決定的,側(cè)重相關(guān)分析并沒有否定因果分析。
目前,我們正生活在數(shù)據(jù)的海洋中。然而,數(shù)據(jù)不等同于信息,信息也不等同于知識,知識更不等同于智慧。如果我們不能將數(shù)據(jù)轉(zhuǎn)化成信息,再轉(zhuǎn)化為知識,再涌現(xiàn)出智慧的方法與技術(shù),那么我們就會身處數(shù)據(jù)的海洋,卻忍受著知識的饑渴。此時,基于大數(shù)據(jù)的知識發(fā)現(xiàn)服務(wù)應(yīng)運而生。我所在團(tuán)隊開發(fā)的靠譜COP項目就是一種知識發(fā)現(xiàn)服務(wù),著眼于課堂教學(xué)行為大數(shù)據(jù)和實踐性知識大數(shù)據(jù),兩組數(shù)據(jù)相互影響,實踐性知識決定了教師課堂教學(xué)行為,而教師課堂教學(xué)行為的改進(jìn),可以反作用于實踐性知識,強化甚至重構(gòu)實踐性知識。兩組大數(shù)據(jù)的常模數(shù)據(jù)庫集群為深度的視頻課例研究奠定了堅實的基礎(chǔ)。
破解基于視頻課例的知識發(fā)現(xiàn)方法
視頻課例一般具有四個工具屬性:一是可以跨越時空限制被反復(fù)觀看。視頻課例分析能夠提供研究者一種來自研究場域的、永久的且可以支持研究者重復(fù)觀察的研究資料,從而使得研究者可以發(fā)現(xiàn)傳統(tǒng)觀察方式無法獲得的、但也許很重要的線索與知識。二是能夠忠實地記錄復(fù)雜課堂教學(xué)的細(xì)節(jié)以及口語數(shù)據(jù)以外(動作、表情等)的事件信息。三是視頻課例記錄可避免教師自陳資料中發(fā)生的社會期望偏差。二、三兩個工具屬性可有效降低因研究者自身的經(jīng)驗和自信而造成的個人主觀意見所形成的確認(rèn)偏差,從而提高研究的可靠性。四是允許跨領(lǐng)域分析并可用于不同分析方法。視頻課例分析并不限定于特定的研究方法,可用于民族志、言語分析、互動分析、會話分析等研究中,也可以經(jīng)過適當(dāng)編碼、計數(shù)等轉(zhuǎn)換程序后,同時使用量化與質(zhì)性等方法。因此,視頻課例為教育教學(xué)研究開辟了新的空間和新的領(lǐng)域。
基于大數(shù)據(jù)的視頻課例知識發(fā)現(xiàn)方法包括資料收集、資料管理和資料分析三個階段,包括“現(xiàn)象—表征—樣貌—知識”循環(huán)往復(fù)的知識發(fā)現(xiàn)路徑。
一、現(xiàn)象
教學(xué)現(xiàn)象是理解與研究課堂教學(xué)活動規(guī)律與本質(zhì)的重要切入點。然而,無論是進(jìn)入課堂的研究者,還是身處課堂的廣大中小學(xué)教師,即使有了研究的意識,面對復(fù)雜多變的教學(xué)現(xiàn)象,也不知如何研究,從而導(dǎo)致了當(dāng)前的教學(xué)規(guī)律更多的是研究者通過主觀臆想或演繹推論得出的,較少是從復(fù)雜、多變的教學(xué)現(xiàn)象的觀察研究中得出的。
那么,教學(xué)現(xiàn)象是如何形成的呢?教學(xué)現(xiàn)象是由教學(xué)行為導(dǎo)致的,教學(xué)現(xiàn)象因課堂教學(xué)行為的差異性而具有豐富性和多樣性;大數(shù)據(jù)自身蘊含的模式與關(guān)系就可以對復(fù)雜的現(xiàn)象產(chǎn)生知識洞見。
在日常的課堂觀察中,我們往往會有這樣的評價:優(yōu)秀教師的課堂教學(xué)很深入、很有效;低水平教師的課堂教學(xué)很淺顯,有效性很差。但評價從何得出呢?我們往往無法詳細(xì)列舉。但有了大數(shù)據(jù)的輔助——教學(xué)行為轉(zhuǎn)換序列網(wǎng)絡(luò)關(guān)系圖,我們就可以很容易地對其進(jìn)行描述。教學(xué)行為轉(zhuǎn)換序列網(wǎng)絡(luò)關(guān)系圖分為六個層次,從低到高依次為記憶、理解、運用、分析、評價、創(chuàng)造,通過研究發(fā)現(xiàn),優(yōu)秀教師的課堂教學(xué)不僅在低級階層有很多的認(rèn)知活動(記憶、理解、運用),同時在高級階層仍然有很多認(rèn)知活動(分析、評價、創(chuàng)造),而且低級階層和高級階層之間有很多的互動;但低水平教師的課堂教學(xué)大部分停留在記憶和理解階層。由此我們便可以對之前的評價進(jìn)行詳細(xì)的描述。
二、表征
表征是數(shù)據(jù)信息的呈現(xiàn)方式,特指當(dāng)事物從“感性存在”轉(zhuǎn)變?yōu)椤皵?shù)字存在”時數(shù)據(jù)所構(gòu)成的事物表象。大數(shù)據(jù)是對真實世界的表征與映射,由于任何形式的表征都會帶來信息的丟失,所以一般主張應(yīng)該直接對視頻課例進(jìn)行編碼而略過表征的環(huán)節(jié)。本文對此不作贅述。
三、樣貌
樣貌指意義上的表象,意為真實世界中的知識可計算與可視化地賦予數(shù)據(jù)的外貌。編碼體系和記號體系兩大類方法可以有效賦予課堂教學(xué)行為以數(shù)據(jù)的樣貌。編碼體系方法要求確定要觀察的具體項目,然后對準(zhǔn)備觀察的具體項目進(jìn)行編碼。編碼體系通常采用時間取樣法,觀察在特定的時間內(nèi)發(fā)生的特定行為,并以行為編碼表示。記號體系也叫項目清單,是指預(yù)先列出一些需要觀察并且有可能發(fā)生的行為,觀察者在每一種要觀察的事件或行為發(fā)生時做個記號。
除此之外,人工智能機器學(xué)習(xí)等算法可以有效賦予實踐性知識以數(shù)據(jù)的樣貌。例如我所在團(tuán)隊從六個維度(教育信念、自我知識、人際知識、策略知識、情境知識、反思知識)對實踐性知識數(shù)據(jù)進(jìn)行了分析,結(jié)果顯示,新手教師和成熟教師的人際知識增長最快,而勝任教師策略知識增長最快。
四、知識
知識是人類在改造世界和社會實踐中獲得的認(rèn)識與經(jīng)驗的綜合,傳統(tǒng)的知識生產(chǎn)方式主要是理論驅(qū)動式的生產(chǎn)模式,這是一種精英化的知識生產(chǎn)方式。隨著大數(shù)據(jù)智能時代的到來,已經(jīng)形成了從人類獲取與產(chǎn)生的各種數(shù)據(jù)中提取知識的新途徑,數(shù)據(jù)驅(qū)動的知識已經(jīng)成為認(rèn)識人和社會的全新的知識來源。大數(shù)據(jù)為什么可以產(chǎn)生數(shù)據(jù)驅(qū)動的知識呢?這是因為大數(shù)據(jù)具有三大特性:精準(zhǔn)數(shù)據(jù)追溯能力、協(xié)同數(shù)據(jù)驅(qū)動能力、可視化數(shù)據(jù)決策能力。大數(shù)據(jù)解釋了一種新的知識發(fā)現(xiàn)路徑,從海量的數(shù)據(jù)中挖掘出其背后具有規(guī)律性的“小模式”。例如,我所在團(tuán)隊針對福建省廈門市思明區(qū)教師三年的成長路徑數(shù)據(jù)挖掘出十條有效的發(fā)展路徑(見下表),這就是大數(shù)據(jù)背后發(fā)現(xiàn)的“小模式”,也是數(shù)據(jù)的一種高級表達(dá)形式。
從“現(xiàn)象—表征—樣貌—知識”的知識發(fā)現(xiàn)路徑,我們經(jīng)歷了經(jīng)驗科學(xué)、理論科學(xué)、計算(實證)科學(xué)、數(shù)據(jù)驅(qū)動型(大數(shù)據(jù))科研四代范式。當(dāng)前我們正經(jīng)歷著第四代范式,與第三代研究范式相比較,其分析思路從“假設(shè)—驗證”變?yōu)榱恕鞍l(fā)現(xiàn)—總結(jié)”,分析過程從“定性—定量—再定性”變?yōu)榱恕岸俊ㄐ浴?,邏輯關(guān)系從“分布理論—概率保證—總體推斷”變?yōu)榱恕皩嶋H分布—總體特征—概率判斷”。可以說,隨著研究水平的提高以及數(shù)據(jù)可得性、易得性的提升,我們的知識研究已經(jīng)發(fā)生了根本性的轉(zhuǎn)變。