摘要:“互聯(lián)網(wǎng)+”時代,為提高高校英語教學效果,開拓大學英語課程線上線下混合式教學模式創(chuàng)新研究的思路,該文將著重關(guān)注如何有效地挖掘多個互聯(lián)網(wǎng)教學平臺的數(shù)據(jù),與外語教學的特殊性結(jié)合,做針對性研究,從而制訂有效的混合式精準教學實施方案,并通過數(shù)據(jù)融合方案全面地了解和指導(dǎo)學生的英語學習。該文介紹了方案實施工具Python與Anaconda,以及方案實施策略,其中包括數(shù)據(jù)的讀取與保存、數(shù)據(jù)的篩選處理、分析結(jié)果的可視化展示和相關(guān)性分析4個部分,并通過示例呈現(xiàn)了如何利用Python來實施混合式英語教學數(shù)據(jù)融合。
關(guān)鍵詞:數(shù)據(jù)融合??Python??英語教學??混合式??精準教學??實施方案
中圖分類號:H319.3;G434文獻標識碼:A???文章編號:1672-3791(2022)06(b)-0000-00
Implementation?of?Data?Fusion?in?Blended?English?Teaching?Based?on?Python
WANG?Jiehua
(Nanjing?University?Jinling?College,?Nanjing,?Jiangsu?Province,?210089?China)
Abstract:?In?the?“Internet?+”?era,?in?order?to?enhance?the?teaching?efficiency?of?college?English?courses,?and?explore?a?new?innovative?approach?for?the?online-offline?blended?teaching?mode,?the?paper?emphasizes?how?to?effectively?utilize?the?data?from?multiple?online?teaching?platforms,?and?carries?out?a?corresponding?study?by?combining?data?mining?with?the?particularity?of?language?teaching,?and?thereby?formulates?an?implementation?program?for?the?effective?blended?precision?teaching,?through?which?teachers?can?comprehensively?understand?and?instruct?English?learning?of?college?students.?This?paper?introduces?Python?and?Anaconda?as?the?development?tools,?and?the?implementation?strategies?including?data?reading?and?saving,?data?filter?and?processing,?visualization?display?and?relativity?analysis,?and?demonstrates?how?to?implement?data?fusion?in?blended?English?teaching?based?on?Python?by?way?of?illustration.
Key?Words:Data?fusion;Python;English?teaching;Blended;Precision?teaching;Implementation
大數(shù)據(jù)與多元智能的融合可以更為準確地判斷學生的個性、學習程度、學習特長等,從而為學生提供精準教學、個性化學習,提高教學質(zhì)量和效率[1]。在《大學英語教學指南》(教育部?2017?年最新版)建議將信息技術(shù)有效地應(yīng)用于教學當中,鼓勵教師實施基于課堂和在線課程的翻轉(zhuǎn)課堂等混合式教學模式的大背景下,許多高校英語課程展開了線上線下混合式教學的實踐[2]。
在此,該文將著重研究如何挖掘多個互聯(lián)網(wǎng)教學平臺的數(shù)據(jù),并通過數(shù)據(jù)融合方案全面地了解和指導(dǎo)學生的英語學習,從而實現(xiàn)更加精準的教學,開拓大學英語課程線上線下混合式教學模式創(chuàng)新研究的思路[3]。
由于該研究涉及各類數(shù)據(jù)來源的訪問、大量的數(shù)據(jù)處理以及分析結(jié)果的可視化展示,綜合考慮各個備選方案后,Python因其獨特的優(yōu)勢被選為了方案實施的編程語言。在數(shù)據(jù)科學領(lǐng)域,一般問題的解決過程都包括4個主要的步驟:數(shù)據(jù)收集和清洗、數(shù)據(jù)探索、數(shù)據(jù)建模和數(shù)據(jù)可視化,而Python可以在整個流程中提供必要有效的處理工具。Python數(shù)據(jù)工具箱中既有Python內(nèi)置函數(shù)和標準庫,又有第三方庫和工具。該課題主要用到了Pandas、NumPy和Matplotlib。Pandas是一個用于數(shù)據(jù)分析的開源Python庫,它讓Python能處理電子表格等數(shù)據(jù),提供了數(shù)據(jù)快速加載、操作、對齊與合并等功能。NumPy也是?Python?語言的一個擴展程序庫,支持大量的維度數(shù)組與矩陣運算,此外也針對數(shù)組運算提供大量的數(shù)學函數(shù)庫。Matplotlib?是?Python?的繪圖庫,它可與?NumPy?一起使用,提供了一種有效的?MatLab?開源替代方案[4]。
該研究選擇安裝了Anaconda作為工具平臺。因為Anaconda是專注于數(shù)據(jù)分析的Python發(fā)行版本,包含了大量科學包及其依賴項,是數(shù)據(jù)科學的利器。在Anaconda的包管理器conda中安裝Jupyter作為Python程序開發(fā)環(huán)境,Jupyter最大的優(yōu)勢在于能夠合理高效地展示數(shù)據(jù),提高了項目研究的效率。
2?方案實施策略介紹
2.1?數(shù)據(jù)的讀取與保存
該研究中將數(shù)據(jù)細分能力測試數(shù)據(jù)[5]和學習過程數(shù)據(jù)兩大類。線上學習過程數(shù)可以從各個在線教學平臺直接導(dǎo)出,在導(dǎo)出格式的選擇上,考慮數(shù)據(jù)的兼容性,建議統(tǒng)一選擇excel格式。能力測試數(shù)據(jù)(如英語四六級考試和期末考試的成績)則可以從學校教務(wù)處等相關(guān)部門獲得,這些信息一般也都以Excel格式保存。
該研究中需要對多個平臺的數(shù)據(jù)進行融合處理,由于所有的數(shù)據(jù)來源均統(tǒng)一為了Excel格式,Python中的Pandas庫是最適合對這些數(shù)據(jù)文件進行讀取與保存的。
例如:當教師開學前拿到了所教班級的學生名冊后,可以到全校歷次英語四六級成績表中,將所教學生按時間順序由近及遠依次做搜索查詢,保留每名學生最近一次的有效英語四六級成績作為初始能力數(shù)據(jù)。
Pandas讀取Excel數(shù)據(jù)文件后,會將數(shù)據(jù)保存在表格型的數(shù)據(jù)結(jié)構(gòu)Dataframe中。為了提高在Dataframe中搜索數(shù)據(jù)的效率,可以在Dataframe中增加索引項。在索引項的選擇上,要考慮該項數(shù)據(jù)的唯一性和普適性。比如:在全校英語四六級考試的成績文檔中,學生的信息項有姓名、證件號、學號、筆試報名號和準考證號等信息;而在教師拿到的學生名冊中,學生的信息有姓名、學號和所在班級等信息。通過比對可以發(fā)現(xiàn)學號信息是具有唯一性和普適性的,因此在該研究中均將學號信息作為Dataframe的索引項。需要提醒的是,學生學號在全校歷次英語四六級考試的成績表單搜索過程中,除了要檢查學號是否存在,還要對成績的有效性進行核查。有的學生雖然報名了某次四六級考試,但是可能出現(xiàn)缺考的情況,反映到成績表單中該學生的成績項可能為空,或者值為0。檢測到這種情況時,本次成績會被判為無效,要繼續(xù)搜索該名學生在之前考試中的有效成績。在當前班級所有學生的有效四六級成績讀取完成后,為了以后查閱方便,可以將Dataframe中的關(guān)鍵數(shù)據(jù)過濾保存為Excel文檔。
2.2?數(shù)據(jù)的篩選處理
該研究中要對根據(jù)學生的初始能力數(shù)據(jù)來實施精準教學[6]。以英語聽力為例,即使在分層教學的班級,學生的聽力水平仍然會存在一定的差距,因此教師需將聽力能力薄弱的學生篩選出來以制訂更有針對性的教學計劃。
該研究中參考最近一次的有效英語四級考試成績進行篩選。英語四級考試成績表是有分項數(shù)據(jù)的,讀取到Dataframe后可以得到如聽力得分、閱讀得分、翻譯得分、作文得分和筆試總得分等數(shù)據(jù),通過索引項學號定位到每位學生的行數(shù)據(jù)后,便可綜合判斷該生聽力單項得分率(聽力實得分/聽力總分)和聽力得分占比(聽力實得分/筆試總實得分)。目前英語四級聽力總分248.5,卷面分值占比為35%,該研究中若某學生聽力聽力單項得分率低于50%,或者聽力得分占比低于28%(35%*80%),則判定該生的聽力為薄弱項。在實施過程中,對于上述評判閾值50%和80%,教師可根據(jù)班上學生的實際情況做相應(yīng)的調(diào)整,在程序中設(shè)計接口到指定的配置文件中讀取相關(guān)參數(shù)。
2.3?分析結(jié)果的可視化展示
制作提供信息的可視化是數(shù)據(jù)分析中最重要的任務(wù)之一,Python中的Matplotlib模塊功能十分強大,可用于創(chuàng)建折線圖、直方圖、散點圖、條形圖、圓餅圖等。在混合式英語精準教學中,教師也需要借助可視化的圖像來分析教學效果。
該研究中將班上的學生按照學期前英語四級成績劃分為兩個對照組,成績490以上的為Group?A,490以下的為Group?B。該學期教師安排了線上線下混合式教學,通過繪制的散點圖(圖2)可以反映出兩個對照組英語期末考試成績隨在線學習表現(xiàn)分變化的大致趨勢。散點圖中X軸為在線學習表現(xiàn)分,其綜合了簽到、課前練習、課堂練習等多種因素[5],總分為253分;y軸為英語期末考試成績,滿分為100分。通過圖2可以看出,對于英語基礎(chǔ)較弱的Group?B的學生,總體而言呈現(xiàn)出在線學習表現(xiàn)分越高則英語期末考試成績越好的趨勢。
2.4?相關(guān)性分析
該研究中需要對學生在線學習的表現(xiàn)與英語期末考試中各個分項做量化的相關(guān)性分析。將英語期末考試的成績表讀入Pandas的Dataframe后,每個分項成績?yōu)镾eries數(shù)據(jù),轉(zhuǎn)換為Numpy的ndarray數(shù)據(jù)后,即可調(diào)用Numpy中的相關(guān)性函數(shù)進行計算。
本研究中相關(guān)性系數(shù)選擇皮爾森相關(guān)性系數(shù),其計算公式為:
其中x數(shù)列為學生在線學習的表現(xiàn)分,y數(shù)列為期末考試各個分項的成績,n為班級的學生人數(shù)。需要注意的是每個分項的相關(guān)系數(shù)都要進行獨立計算。該研究中,2019級某法語班學生在線學習的表現(xiàn)與英語期末考試中各個分項的相關(guān)系數(shù)如表2所示。
從表2中可以看出,仔細閱讀和詞匯詞組兩個單項與在線學習表現(xiàn)的相關(guān)性較強。另外,該學期的教學方式采用的是混合式教學,在線教學的課時占比為1/4。如果在線教學的課時占比提高后,可以預(yù)期相關(guān)系數(shù)的值還會有一定的提升。
3?結(jié)語
Python包含了許多強大的統(tǒng)計學和數(shù)學工具,通過上述示例可以看出,Anaconda/Python平臺對于本研究進行英語教學數(shù)據(jù)融合處理提供了很好的支撐。教師利用數(shù)據(jù)融合的結(jié)果,可以更有的放矢地對學生實施精準化教學,因此該文提到的基于Python的英語教學數(shù)據(jù)融合處理方案在高校英語教學中有較高的推廣價值。
參考文獻
[1] 許曉川,王愛芬.大數(shù)據(jù)與多元智能在教育教學中的深度融合[J].教育理論與實踐,2017,37(25):32-35.
[2] 賈振霞.?大學英語混合式教學中的有效教學行為研究[D].上海:上海外國語大學,2019.
[3] 王劼華,劉光源.基于數(shù)據(jù)融合的英語混合式精準教學可行性研究[J].科教文匯,2020(12):167-168.
[4] Wes?McKinney.利用Python進行數(shù)據(jù)分析[M].北京:機械工業(yè)出版署,2018:9-16.
[5] 黃濤,趙媛,耿晶,等.數(shù)據(jù)驅(qū)動的精準化學習評價機制與方法[J].現(xiàn)代遠程教育研究,2021,33(1):3-12.
[6] 趙濤.智慧技術(shù)支持下混合式學習模式建構(gòu)與實踐研究[J].中國電化教育,2021(9):137-142.