盧文青 秦志永
摘 要 目前在教育大數(shù)據(jù)應(yīng)用過(guò)程中仍存在數(shù)據(jù)共享障礙、數(shù)據(jù)體系混雜、數(shù)據(jù)挖掘難度大、數(shù)據(jù)安全與隱私缺乏監(jiān)管以及數(shù)據(jù)結(jié)論存在缺陷等問(wèn)題,針對(duì)問(wèn)題進(jìn)行深入分析,并在數(shù)據(jù)共享、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)準(zhǔn)體系構(gòu)建、數(shù)據(jù)服務(wù)、數(shù)據(jù)管理等方面提出對(duì)策建議。
關(guān)鍵詞 教育大數(shù)據(jù);教育信息化;數(shù)據(jù)挖掘;數(shù)據(jù)管理
中圖分類(lèi)號(hào):G630 文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1671-489X(2017)17-0078-03
1 前言
教育大數(shù)據(jù)是整個(gè)教育活動(dòng)過(guò)程中所產(chǎn)生的以及根據(jù)教育需要采集到的一切用于教育發(fā)展并可創(chuàng)造巨大潛在價(jià)值的數(shù)據(jù)集合[1]。借助于教育大數(shù)據(jù)分析,可有效促進(jìn)教育教學(xué)發(fā)展,在個(gè)性化教學(xué)環(huán)境定制、提升教學(xué)水平、優(yōu)化教學(xué)質(zhì)量等方面具有積極意義。但亦應(yīng)指出的是,大數(shù)據(jù)雖然帶來(lái)思維方式的巨大變革,但是也可能成為一種過(guò)度膨脹的力量,使教育管理者寄希望于大數(shù)據(jù)能夠解決教育領(lǐng)域的諸多問(wèn)題。教育是培養(yǎng)人的過(guò)程,具有復(fù)雜性、公益性的特征。這一方面要求大數(shù)據(jù)的質(zhì)量不斷提高,另一方面在認(rèn)識(shí)上應(yīng)明確大數(shù)據(jù)不能代替豐富、動(dòng)態(tài)、變化的教育教學(xué)實(shí)踐活動(dòng),它僅是一種實(shí)踐的指導(dǎo),使實(shí)踐更具理性化的特征。因此,如何基于實(shí)踐的觀點(diǎn)認(rèn)識(shí)大數(shù)據(jù),如何正確認(rèn)識(shí)大數(shù)據(jù),提升數(shù)據(jù)質(zhì)量,如何利用教育大數(shù)據(jù)更好地服務(wù)于教育,是擺在教育工作者面前亟待解決的問(wèn)題。
2 教育大數(shù)據(jù)應(yīng)用過(guò)程中面臨的主要問(wèn)題及原因
數(shù)據(jù)共享存在障礙 大數(shù)據(jù)相信全量數(shù)據(jù),通過(guò)分析幾乎全樣本的數(shù)據(jù)來(lái)思考和分析問(wèn)題。從抽樣中得到的結(jié)論總是有水分的,而全部樣本中得到的結(jié)論水分就很少,數(shù)據(jù)量越大,真實(shí)性也就越大。然而各地學(xué)校之間教育信息化基礎(chǔ)設(shè)施環(huán)境的建設(shè)往往各具特色,互不兼容,限制了數(shù)據(jù)的共享,使得“數(shù)據(jù)孤島”成為制約教育大數(shù)據(jù)發(fā)展的瓶頸。
數(shù)據(jù)體系混雜 出于計(jì)量的需要,總是習(xí)慣于把教育分解,然而分解后的數(shù)據(jù)指標(biāo)體系所描述的屬性特征并不保證是教育的真實(shí)再現(xiàn)。由于缺乏標(biāo)準(zhǔn)的數(shù)據(jù)體系,各學(xué)校對(duì)數(shù)據(jù)指標(biāo)的性質(zhì)差異以及數(shù)值差異所表示的實(shí)際意義存在認(rèn)識(shí)上的分歧,各學(xué)校都傾向于強(qiáng)化本校數(shù)值較高的指標(biāo)在綜合分析中的作用,相對(duì)削弱數(shù)值水平較低的指標(biāo)的作用,導(dǎo)致在數(shù)據(jù)收集和分析時(shí)存在指標(biāo)各異、標(biāo)準(zhǔn)不同、口徑不一的情況。
教育大數(shù)據(jù)既包括常規(guī)的結(jié)構(gòu)化數(shù)據(jù)(如成績(jī)、學(xué)籍、就業(yè)率、出勤記錄等),也包括海量難以分析的非結(jié)構(gòu)化數(shù)據(jù)(如圖片、視頻、教學(xué)軟件、學(xué)習(xí)游戲等)。不僅結(jié)構(gòu)復(fù)雜,而且在收集數(shù)據(jù)的過(guò)程中因?yàn)椴僮飨到y(tǒng)以及版本的不同,數(shù)據(jù)收集的結(jié)果可能會(huì)存在多份的情況,造成不必要的數(shù)據(jù)冗余。另外,由于數(shù)據(jù)的真實(shí)性無(wú)法全部保證,數(shù)據(jù)中還可能存在許多的“偽數(shù)據(jù)”。
由此可知,數(shù)據(jù)體系的混雜不僅增加了數(shù)據(jù)收集的難度,而且削弱了數(shù)據(jù)整合的價(jià)值。
數(shù)據(jù)挖掘難度大 教育大數(shù)據(jù)的價(jià)值就在于數(shù)據(jù)挖掘,沒(méi)經(jīng)過(guò)挖掘的大數(shù)據(jù)只是沒(méi)有開(kāi)采出來(lái)的原油,不具有實(shí)用價(jià)值,而數(shù)據(jù)挖掘就是通過(guò)算法模型搜索隱藏于其中的信息的過(guò)程。教育大數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)將越來(lái)越占據(jù)主導(dǎo)地位,但是要把視頻和圖片等轉(zhuǎn)換成有用的數(shù)據(jù)信息,則必須首先定義視頻或圖片等的價(jià)值。大數(shù)據(jù)時(shí)代信息分析的難點(diǎn)就在于對(duì)海量的非結(jié)構(gòu)化數(shù)據(jù)的分析,而在此領(lǐng)域的研究尚不成熟。
在海量、復(fù)雜、多維的數(shù)據(jù)中去挖掘數(shù)據(jù)之間的相關(guān)性,使用的數(shù)據(jù)越多,分析的難度越大,則討論、分析、爭(zhēng)議的時(shí)間、人力、財(cái)力等成本也會(huì)相應(yīng)提高。而采用的數(shù)據(jù)過(guò)少,則又不能充分認(rèn)識(shí)教育過(guò)程的本質(zhì)。因此,數(shù)據(jù)挖掘的算法模型很重要,但是創(chuàng)建模型的人經(jīng)常不清楚建模依據(jù)的歷史數(shù)據(jù)在未來(lái)是否穩(wěn)定,而使用模型的人也不知道整個(gè)數(shù)據(jù)模型的加工過(guò)程;創(chuàng)建模型的人可能不知道此種模型效果好不好,而使用模型的人也不知道該怎么去反饋使用的結(jié)果[2]。這樣一來(lái),信息不對(duì)稱(chēng)現(xiàn)象嚴(yán)重,影響了算法模型的質(zhì)量?jī)?yōu)化。
數(shù)據(jù)挖掘的本質(zhì)就是還原。雖然好的數(shù)據(jù)模型是一種有益的提煉,但有時(shí)候也會(huì)因?yàn)槿鄙賵?chǎng)景數(shù)據(jù)的支持,在某種程度上造成信息的歪曲。事實(shí)表明,一些不易收集的量更直接影響人的行為,如健康、情緒、性格、興趣、習(xí)慣等。缺少了這些背景數(shù)據(jù)的支持,數(shù)據(jù)分析的結(jié)果可能會(huì)失真,甚至與事實(shí)大相徑庭。
數(shù)據(jù)安全與隱私亟待有效監(jiān)管 教育大數(shù)據(jù)收集了各種來(lái)源、各種類(lèi)型的數(shù)據(jù),其中也包含很多和用戶(hù)隱私相關(guān)的信息。由于國(guó)家在教育大數(shù)據(jù)方面并沒(méi)有出臺(tái)相應(yīng)的法律法規(guī),保護(hù)不當(dāng)可能會(huì)帶來(lái)嚴(yán)重的安全風(fēng)險(xiǎn)。在大數(shù)據(jù)時(shí)代,個(gè)體面臨的威脅并不僅限于個(gè)人的隱私泄露,還在于基于大數(shù)據(jù)對(duì)人們狀態(tài)和行為的預(yù)測(cè),而這種隱性的數(shù)據(jù)暴露往往是個(gè)人無(wú)法預(yù)知和控制的。如通過(guò)分析學(xué)生關(guān)于閱讀的歷史紀(jì)錄,得到學(xué)生的愛(ài)好、興趣傾向等信息。
教育是塑造人的過(guò)程,而這種重塑是建立在社會(huì)的遺忘機(jī)制之上的。因?yàn)橛辛穗S時(shí)間模糊的遺忘機(jī)制,個(gè)體才能夠不停地在記憶中構(gòu)建和重構(gòu)自己的過(guò)去,進(jìn)而接受不斷發(fā)展的自我與別人,才有能力從過(guò)去的經(jīng)歷中吸取教訓(xùn),并調(diào)整自身的行為以融入未來(lái)的社會(huì)[3]。由于數(shù)字化記憶缺少人類(lèi)記憶中自主遺忘的功能,因此,完善的數(shù)字化記憶帶來(lái)的寒蟬效應(yīng)(指用戶(hù)害怕自己的言行遭到指責(zé)或者懲罰,不敢發(fā)表言論,如同蟬在寒冷天氣中噤聲一般)可能會(huì)改變或約束學(xué)生的行為,進(jìn)而影響學(xué)生的健康成長(zhǎng)。
數(shù)據(jù)結(jié)論存在缺陷 雖然在教育實(shí)踐中運(yùn)用數(shù)據(jù)指標(biāo)來(lái)評(píng)價(jià)教育并不一定是最好的方式,但也是必然要選擇的方式,因?yàn)闊o(wú)計(jì)量則無(wú)管理。由于教育中人的性格、美感、道德、價(jià)值觀等方面難以量化的現(xiàn)實(shí),造成對(duì)教育指標(biāo)體系的“簡(jiǎn)單化”處理。換言之,在實(shí)踐中利用某些數(shù)據(jù)(如成績(jī))指標(biāo),并不是因?yàn)樽钣袃r(jià)值,而是最易計(jì)量。
數(shù)據(jù)分析的結(jié)論具有導(dǎo)向作用,由于數(shù)據(jù)體系的不完整以及算法模型的不完美,管理者的決策空間就會(huì)相應(yīng)地受到擠壓。雖然數(shù)據(jù)結(jié)論有一定的片面性,但是數(shù)據(jù)結(jié)論賦予管理策略合理性,加劇了學(xué)校對(duì)成績(jī)的關(guān)注而忽略了人文精神的培養(yǎng)。簡(jiǎn)單的教育培養(yǎng)了簡(jiǎn)單的學(xué)生:專(zhuān)制、占有欲強(qiáng)、缺乏審美情趣和道德感、自制力缺乏、攀比心太強(qiáng)……凡此種種,都是“簡(jiǎn)單人格”的寫(xiě)照,而在教育的輪回中,又在不斷復(fù)制并加劇這種“簡(jiǎn)單化”。由此可見(jiàn),數(shù)據(jù)結(jié)論的缺陷不僅反映了計(jì)量的必要性與科學(xué)性之間產(chǎn)生了矛盾,也體現(xiàn)了教育目標(biāo)的長(zhǎng)遠(yuǎn)性與計(jì)量的短視性之間的矛盾。endprint
在數(shù)據(jù)結(jié)論的表達(dá)方面,許多的數(shù)據(jù)結(jié)論雖然是正確的,但相對(duì)于非統(tǒng)計(jì)專(zhuān)業(yè)的學(xué)校管理者來(lái)講,要么晦澀難懂,要么枯燥乏味,缺乏高效的數(shù)據(jù)表達(dá)方式,降低了信息傳遞和溝通的質(zhì)量。
3 教育大數(shù)據(jù)應(yīng)用過(guò)程中的對(duì)策
針對(duì)教育大數(shù)據(jù)應(yīng)用過(guò)程中存在的問(wèn)題,提出以下對(duì)策。
互聯(lián)互通是基礎(chǔ) 統(tǒng)籌建設(shè)信息化基礎(chǔ)設(shè)施和應(yīng)用環(huán)境,達(dá)到高速可用、安全可靠、可信共享、泛在開(kāi)放的水平,推動(dòng)各級(jí)各類(lèi)學(xué)校逐步優(yōu)化教育信息化基礎(chǔ)應(yīng)用環(huán)境,完善信息化設(shè)施配備,提升網(wǎng)絡(luò)保障能力。以可持續(xù)發(fā)展的教育信息化應(yīng)用環(huán)境為基礎(chǔ),構(gòu)建省市級(jí)教育大數(shù)據(jù)平臺(tái),促進(jìn)各級(jí)各類(lèi)學(xué)校數(shù)據(jù)共享,實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一開(kāi)放、實(shí)時(shí)分析,破除“數(shù)據(jù)孤島”,推動(dòng)教育大數(shù)據(jù)建設(shè)。
標(biāo)準(zhǔn)的數(shù)據(jù)指標(biāo)體系是根本 國(guó)家正在推行學(xué)生的“終身一人一號(hào)”統(tǒng)一學(xué)籍信息管理制度,各項(xiàng)數(shù)據(jù)都有了身份標(biāo)簽,為持續(xù)性記錄每個(gè)學(xué)生的學(xué)業(yè)表現(xiàn)與全面發(fā)展情況提供制度保障。在數(shù)據(jù)指標(biāo)體系方面,需要加強(qiáng)基礎(chǔ)設(shè)計(jì),制定與國(guó)家教育信息化標(biāo)準(zhǔn)相銜接的統(tǒng)一的標(biāo)準(zhǔn)與規(guī)范,涉及數(shù)據(jù)的收集、分析與管理等方面,涵蓋基礎(chǔ)標(biāo)準(zhǔn)、數(shù)據(jù)處理標(biāo)準(zhǔn)、數(shù)據(jù)安全標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、數(shù)據(jù)服務(wù)標(biāo)準(zhǔn)等。只有確保標(biāo)準(zhǔn)的一致性和權(quán)威性,才能在統(tǒng)一的大數(shù)據(jù)平臺(tái)內(nèi)統(tǒng)籌梳理數(shù)據(jù)來(lái)源和流向,集中管理各類(lèi)基礎(chǔ)數(shù)據(jù),確保數(shù)據(jù)完整、可用、可整合,實(shí)現(xiàn)教育大數(shù)據(jù)的快速抽取、統(tǒng)一共享、及時(shí)挖掘。
人才與技術(shù)是關(guān)鍵 大數(shù)據(jù)時(shí)代課堂變得無(wú)處不在,如翻轉(zhuǎn)課堂的引入、數(shù)字校園的流行、云課堂的設(shè)想……課堂將不再是單一和被動(dòng)的模式化、固態(tài)化的傳統(tǒng)課堂。課堂既可以是校內(nèi)的,也可以是校外的;既可以是現(xiàn)場(chǎng)的,也可以是網(wǎng)絡(luò)的,課堂空間被無(wú)限拓寬,課堂形式變得自由多元[4]。在動(dòng)態(tài)變換的場(chǎng)景下面向多版本、多操作系統(tǒng)收集教育數(shù)據(jù),定義非結(jié)構(gòu)化數(shù)據(jù)的價(jià)值,研究新的算法模型以探尋教育因素之間的相關(guān)性等方面,都迫切需要人才與技術(shù)的支持。
新形勢(shì)下的教育不僅關(guān)注知識(shí)與技能的學(xué)習(xí),更加注重人文精神的培養(yǎng)。利用大數(shù)據(jù)挖掘興趣、性格等心理特征在教學(xué)與個(gè)人成長(zhǎng)中的價(jià)值,更是需要多學(xué)科人才的合作。因此,需要組織教育學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)等多學(xué)科的人員成立專(zhuān)門(mén)的教育大數(shù)據(jù)挖掘中心,打破信息不對(duì)稱(chēng),集聚各方智慧,引入多角度的評(píng)價(jià)方式,建立多樣化的指標(biāo)體系,通過(guò)技術(shù)攻關(guān)破解數(shù)據(jù)挖掘中的難題,并探究出美學(xué)形式與現(xiàn)實(shí)功能兼顧的數(shù)據(jù)可視化手段,實(shí)現(xiàn)數(shù)據(jù)結(jié)論的有效傳達(dá)與溝通。
數(shù)據(jù)服務(wù)與教學(xué)的深度融合是核心 教育大數(shù)據(jù)既服務(wù)于教育教學(xué),又來(lái)源于教育教學(xué),因此有必要通過(guò)優(yōu)質(zhì)數(shù)字化教育資源的建設(shè)與共享,深化信息技術(shù)與課堂教學(xué)的融合,拓展數(shù)據(jù)收集的類(lèi)型與規(guī)模,提升教育大數(shù)據(jù)的服務(wù)空間。
由于技術(shù)水平的限制,不可能把千變?nèi)f化的教育行為提煉歸納進(jìn)一套或幾套模型里。數(shù)據(jù)模型的局限性決定了在教育實(shí)踐中需要對(duì)模型進(jìn)行檢驗(yàn),并通過(guò)技術(shù)改進(jìn)實(shí)現(xiàn)模型的迭代優(yōu)化,形成持續(xù)反饋的機(jī)制,進(jìn)而不斷提升數(shù)據(jù)分析的價(jià)值和有效性。由此可見(jiàn),深化數(shù)據(jù)服務(wù)與教育教學(xué)的融合,不僅是促進(jìn)教學(xué)改革、提升教育質(zhì)量、實(shí)現(xiàn)教育均衡的重要手段,更是實(shí)現(xiàn)教育大數(shù)據(jù)驅(qū)動(dòng)教育發(fā)展的必然選擇,無(wú)融合則無(wú)數(shù)據(jù),無(wú)數(shù)據(jù)則無(wú)服務(wù),無(wú)服務(wù)則無(wú)反饋,無(wú)反饋則無(wú)優(yōu)化。
數(shù)據(jù)管理是保障 注重?cái)?shù)據(jù)的隱私保護(hù)與安全管理,出臺(tái)相關(guān)的管理辦法。按照分級(jí)管理、逐級(jí)負(fù)責(zé)的原則,健全網(wǎng)絡(luò)與信息安全管理責(zé)任體系,完善網(wǎng)絡(luò)與信息安全管理制度。明確數(shù)據(jù)管理各部門(mén)、人員的安全管理職責(zé),建立數(shù)據(jù)資源的保密等級(jí),設(shè)計(jì)高性能、高可信度的教育大數(shù)據(jù)存儲(chǔ)系統(tǒng),建立數(shù)據(jù)安全應(yīng)急保障機(jī)制,為大數(shù)據(jù)平臺(tái)提供充分的安全保障。
學(xué)生的成長(zhǎng)是一個(gè)過(guò)程,這一過(guò)程可能是緩慢而復(fù)雜的。針對(duì)教育大數(shù)據(jù)建立生命周期管理制度非常必要,對(duì)數(shù)據(jù)只進(jìn)行一定的控制,允許數(shù)據(jù)被模糊、被遺忘。給學(xué)生留一些自身需要的空間來(lái)定義自己,尊重學(xué)生重新塑造自己身份的自由,促使其在成長(zhǎng)的道路上甩掉過(guò)去的包袱,調(diào)整自身的行為并融入未來(lái),幫助其健康成長(zhǎng)。
4 結(jié)語(yǔ)
教育發(fā)展必將迎來(lái)大數(shù)據(jù)驅(qū)動(dòng)的新時(shí)代,大數(shù)據(jù)將幫助教育工作者找到更加合適的方法,提供更加廣闊的思路來(lái)為教育教學(xué)的決策提供數(shù)據(jù)支撐。立足于大數(shù)據(jù)發(fā)展的理論前沿和教育實(shí)踐的需要,才能強(qiáng)化數(shù)據(jù)對(duì)教育教學(xué)的服務(wù)與支撐,逐步完善對(duì)教育的認(rèn)識(shí),回歸教育復(fù)雜性的本質(zhì)。
參考文獻(xiàn)
[1]楊現(xiàn)民,王榴卉,唐斯斯.教育大數(shù)據(jù)的應(yīng)用模式與政策建議[J].電化教育研究,2015(9):54-61.
[2]車(chē)品覺(jué).決戰(zhàn)大數(shù)據(jù)[M].杭州:浙江人民出版社,2014.
[3]舍恩伯格.刪除:大數(shù)據(jù)取舍之道[M].袁杰,譯.杭州:浙江人民出版社,2013.
[4]吳地花.大數(shù)據(jù)時(shí)代的教育創(chuàng)新研究[J].教育探索,
2016(4):120-123.endprint