亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        國際教育文本挖掘研究熱點(diǎn)與前沿透視

        2021-07-20 01:24:40符雅茹牟智佳
        開放學(xué)習(xí)研究 2021年3期
        關(guān)鍵詞:文本評(píng)價(jià)分析

        王 萌 符雅茹 牟智佳

        (江南大學(xué) 人文學(xué)院,江蘇 無錫 214122)

        一、研究背景

        近年來,隨著教育大數(shù)據(jù)和人工智能技術(shù)的逐步發(fā)展,研究者對(duì)學(xué)習(xí)分析的關(guān)注和研究日益深入。在學(xué)習(xí)分析初期,基于學(xué)習(xí)行為類數(shù)據(jù)的研究較多,對(duì)其他類數(shù)據(jù)研究較少。在數(shù)字化學(xué)習(xí)過程中,不僅產(chǎn)生交互操作類的行為數(shù)據(jù),還產(chǎn)生互動(dòng)討論類的文本數(shù)據(jù),對(duì)文本的分析有助于發(fā)現(xiàn)學(xué)習(xí)者內(nèi)在的心理特征信息。文本挖掘(Text Mining)是數(shù)據(jù)挖掘中的一個(gè)重要應(yīng)用方向,它是從大量文本數(shù)據(jù)中抽取最終可用的信息和知識(shí)的過程。隨著學(xué)習(xí)數(shù)據(jù)種類的多樣化發(fā)展和文本挖掘的深入應(yīng)用,基于學(xué)習(xí)文本類數(shù)據(jù)的分析得到研究者的廣泛關(guān)注,并開展了大量的理論和實(shí)踐探索,教育文本挖掘由此產(chǎn)生。教育文本挖掘是對(duì)教與學(xué)活動(dòng)過程中所產(chǎn)生的各類互動(dòng)、評(píng)價(jià)、反思類文本數(shù)據(jù)提取有效信息和知識(shí)的過程。

        目前,隨著自然語言處理相關(guān)研究的不斷深入,為教育文本挖掘提供了新的技術(shù)支撐。理順教育文本挖掘的研究脈絡(luò),摸清其未來研究取向,對(duì)于深化學(xué)習(xí)分析研究、優(yōu)化文本分析技術(shù)具有重要的現(xiàn)實(shí)意義。本研究通過對(duì)近十年來文本挖掘類的文獻(xiàn)進(jìn)行內(nèi)容分析,觀測(cè)該領(lǐng)域的主要研究議題,為后續(xù)研究提供思路和借鑒。

        二、數(shù)據(jù)選取與研究方法

        (一)數(shù)據(jù)來源與清洗

        以“educational text mining”“text analysis &online course”“text analysis & educational online discussion”“discourse analysis & online learning”“content analysis & distance education”為關(guān)鍵詞,在Web of science核心數(shù)據(jù)庫、Elsevier Science Direct數(shù)據(jù)庫中進(jìn)行檢索,限定文獻(xiàn)的發(fā)表時(shí)間為2010年至2019年。對(duì)檢索結(jié)果進(jìn)行人工篩查,剔除文本挖掘技術(shù)、工具和算法研究、文本挖掘在其他領(lǐng)域的應(yīng)用等與教育無直接或間接關(guān)系的研究文獻(xiàn)以及會(huì)議報(bào)告、新聞資訊等非研究性文獻(xiàn),最終得到111篇相關(guān)文獻(xiàn)。

        (二)研究方法

        本研究采用共被引分析、共現(xiàn)分析、聚類分析、統(tǒng)計(jì)分析、時(shí)序圖譜分析等研究方法,利用EndNote X9、CiteSpace 5.6、Bicomb 2.0、HistCite和SPSS 25.0等工具進(jìn)行分析。其中,共被引分析旨在找出文獻(xiàn)的相互引用關(guān)系,分析領(lǐng)域中的核心文獻(xiàn);作者合作關(guān)系分析用于了解領(lǐng)域內(nèi)研究者之間的相互合作關(guān)系,分析找出當(dāng)前合作群體分布;關(guān)鍵詞共現(xiàn)分析用于探索核心關(guān)鍵詞,作為梳理當(dāng)前研究熱點(diǎn)的基礎(chǔ);聚類分析法用于對(duì)關(guān)鍵詞進(jìn)行聚類,分析當(dāng)前研究熱點(diǎn);統(tǒng)計(jì)分析用于整理當(dāng)前常用的挖掘方法,分析方法的種類和變遷;知識(shí)圖譜用于梳理教育文本挖掘的時(shí)間軸,以此來預(yù)測(cè)未來的研究趨勢(shì)。

        三、研究結(jié)果分析

        (一)高被引文獻(xiàn)分析

        教育文本挖掘的文獻(xiàn)量較多,時(shí)間跨度較大,理順文獻(xiàn)中的相互引證關(guān)系并找出關(guān)鍵文獻(xiàn),對(duì)于把握該方向的主要理論依據(jù)具有重要意義。此部分采用HistCite工具分析和繪制文獻(xiàn)的引證關(guān)系,在參數(shù)設(shè)置上,選擇顯示節(jié)點(diǎn)為“GCS”(總被引量),顯示數(shù)量選擇為70,分析結(jié)果如圖1所示。其中,縱向數(shù)字表示發(fā)表年份,每個(gè)圓圈(即節(jié)點(diǎn))表示一篇文獻(xiàn),圓圈中的數(shù)字代表該篇文獻(xiàn)在總分析文獻(xiàn)中的序號(hào),圓圈的大小代表其被引用次數(shù)的多少。

        圖1 高被引文獻(xiàn)引證關(guān)系圖譜

        由分析結(jié)果可以看出,文獻(xiàn)之間的引用關(guān)系鏈較少,這可能是因?yàn)楫?dāng)前教育文本挖掘涉及的領(lǐng)域較多,相互之間的聯(lián)系不強(qiáng)。其中,被引次數(shù)較高的是第25篇,總被引量為127次,是Romero、López、Luna和Ventura(2013)撰寫的“Predicting students’ final performance from participation in online discussion forums”一文,該文章展示了如何通過質(zhì)心和類關(guān)聯(lián)規(guī)則來獲得更強(qiáng)大和可解釋的模型集群,研究表明發(fā)送消息數(shù)量、評(píng)價(jià)文本字?jǐn)?shù)、文本的平均評(píng)價(jià)值、文本中心性及其程度等是預(yù)測(cè)學(xué)生最終成績(jī)的最重要屬性,為后續(xù)研究提供了重要的預(yù)測(cè)參考指標(biāo)。其次是第27篇,總被引量為113次,是Ortigosa、Martín、José和Carro(2014)撰寫的“Sentiment analysis in Facebook and its application to e-learning”一文,研究者提出了一種在Facebook上進(jìn)行情緒分析的新方法,開發(fā)了一個(gè)名為Sentbuk的程序,提取用戶發(fā)布內(nèi)容中蘊(yùn)含的反映情緒極性(正面、中性或負(fù)面)的信息,以檢測(cè)重大情緒變化。研究者指出,該方法可以應(yīng)用于在線學(xué)習(xí)領(lǐng)域,利用學(xué)習(xí)者情緒信息通過適應(yīng)性在線學(xué)習(xí)系統(tǒng)來支持個(gè)性化學(xué)習(xí),基于用戶情緒狀態(tài)推薦學(xué)習(xí)內(nèi)容。 除這兩篇文獻(xiàn)外,排名前十的其他高被引文獻(xiàn)見表1。

        表1 高被引文獻(xiàn)統(tǒng)計(jì)信息

        續(xù)表1

        (二)作者合作關(guān)系分析

        通過對(duì)作者合作關(guān)系的分析,可以明晰教育文本挖掘領(lǐng)域的主要研究者及其相互合作關(guān)系,把握不同作者的貢獻(xiàn)度。將清洗完成后的數(shù)據(jù)導(dǎo)入到CiteSpace5.6中,選擇時(shí)間范圍為“2010~2019”,時(shí)間切片設(shè)置為一年,在“Note Types”中選擇節(jié)點(diǎn)類型為“Author”,在“Selection Criteria”下的“Threshold”設(shè)置中,將前、中、后三個(gè)時(shí)間分區(qū)的閾值分別設(shè)定為(1,1,20)、(1,1,20)、(1,1,20),最終得到包含281個(gè)節(jié)點(diǎn)、409條連線的作者合作關(guān)系圖譜,如下頁圖2所示??梢钥闯?,Huei-tse Hou的出現(xiàn)頻次最高,為3次,但其周圍的連線較少,表明其與其他研究者的合作關(guān)系較少。其次是Cristóbal Romero、Wu He、Jui-long Huang、Kui Xie、Maija Aksela、Ming Ming Chiu等人,出現(xiàn)頻次都為2次,除Crisóobal Romero與其他研究者的關(guān)系較為密切外,其余出現(xiàn)頻次較高的研究者的合作關(guān)系均較少。這與當(dāng)前教育文本挖掘的研究現(xiàn)狀較為契合,研究者使用自然語言處理、話語分析、內(nèi)容分析等不同方法分析不同學(xué)科、平臺(tái)的文本,教育文本挖掘的應(yīng)用呈現(xiàn)廣泛化、多元化的特征,不同研究者之間的合作較為松散。已存在的成熟合作關(guān)系中,研究者的研究方向也大有不同,如以Huei-tse Hou為首的研究團(tuán)體聚焦于在線論壇中學(xué)生的行為模式和局限性;以Crisóobal Romero為首的研究團(tuán)體主要側(cè)重于預(yù)測(cè)學(xué)生在在線學(xué)習(xí)中的表現(xiàn),以Wu He為首的研究團(tuán)體關(guān)注在線學(xué)習(xí)過程中學(xué)生的交流與交互質(zhì)量。

        圖2 作者合作關(guān)系圖譜

        (三)基于關(guān)鍵詞聚類的研究熱點(diǎn)分析

        1. 關(guān)鍵詞共現(xiàn)分析

        分析關(guān)鍵詞可以快速掌握領(lǐng)域內(nèi)的核心研究熱點(diǎn)及其研究特性。通過分析得到包含314個(gè)節(jié)點(diǎn)、759條連線的關(guān)鍵詞共現(xiàn)圖譜,刪除“text mining”“educational text mining”“content analysis”等檢索關(guān)鍵詞,并將閾值設(shè)置為2,最終得到關(guān)鍵詞共現(xiàn)圖譜如圖3所示。其中,字體的大小表明關(guān)鍵詞出現(xiàn)頻次的高低,字體越大,表明關(guān)鍵詞出現(xiàn)的頻次越高;節(jié)點(diǎn)之間的連線表明關(guān)鍵詞的中心性大小,連線越多,表明關(guān)鍵詞的中心性越高。

        圖3 關(guān)鍵詞共現(xiàn)圖譜分析

        可以看出,共現(xiàn)頻次最高的關(guān)鍵詞是“sentiment analysis”,頻次為10次;其次是“e-learning”,頻次為9次;“l(fā)earning analysis”“online learning”“machine learning”“online discussion”“natural language processing”等頻次均高于6次;“cooperative learning” “classification”“research method” “coi”“computer-supported collaborative learning”“writing”等頻次均超過3次。在關(guān)鍵詞連接上,“e-learning”“machine learning”與“sentiment analysis”聯(lián)系最緊密,這反映出文本挖掘主要是在數(shù)字化學(xué)習(xí)環(huán)境下,利用機(jī)器學(xué)習(xí)算法進(jìn)行情緒分析。其次,“Online discussion”和“computer-supported collaborative learning”聯(lián)系較為緊密,表明計(jì)算機(jī)支持的協(xié)作學(xué)習(xí)及其生成文本是主要研究對(duì)象。此外“qualitative research”“research method”等詞反映出教育文本挖掘也常用在梳理某研究領(lǐng)域的研究熱點(diǎn)和研究脈絡(luò)中。

        2. 基于關(guān)鍵詞聚類的研究熱點(diǎn)分析

        審計(jì)風(fēng)險(xiǎn)屬于審計(jì)成果與現(xiàn)實(shí)財(cái)務(wù)之中的差距,在審計(jì)經(jīng)過當(dāng)中,注冊(cè)會(huì)計(jì)對(duì)于所有會(huì)計(jì)部分與會(huì)計(jì)經(jīng)過都具有一定的可能性出現(xiàn)錯(cuò)誤的評(píng)判,所有的審計(jì)部分都很有可能出現(xiàn)審計(jì)風(fēng)險(xiǎn),會(huì)計(jì)師事務(wù)所出現(xiàn)審計(jì)風(fēng)險(xiǎn)都是很普遍的。

        將關(guān)鍵詞生成共現(xiàn)矩陣,導(dǎo)入到SPSS25.0中,對(duì)數(shù)據(jù)進(jìn)行聚類分析,選擇“分類”下的系統(tǒng)聚類方法,設(shè)置聚類方法為組間聚類,測(cè)量區(qū)間為歐式距離,生成教育文本挖掘的關(guān)鍵詞聚類圖譜,如下頁圖4所示。

        圖4左側(cè)代表變量名,縱軸數(shù)據(jù)代表該變量在總變量集中的序號(hào),橫軸表示變量之間的距離??梢钥闯?,關(guān)鍵詞主要分為五類(聚類一至聚類五),第一類是教育文本挖掘的文獻(xiàn)來源和分析方法,主要依托在線學(xué)習(xí)和在線討論中的數(shù)據(jù),特別是MOOCs環(huán)境下的文本數(shù)據(jù);在方法上主要采用機(jī)器學(xué)習(xí)、自然語言處理、信息檢索等方式對(duì)文本進(jìn)行分析;第二類是學(xué)生行為分析,包括學(xué)生在在線學(xué)習(xí)中的行為模式和在線討論中的交互等;第三類是學(xué)生的認(rèn)知分析和情感分析,如學(xué)生的知識(shí)建構(gòu)過程和情緒情感變化;第四類是教育文本挖掘的呈現(xiàn)方式和方法,當(dāng)前已有的呈現(xiàn)方式包括學(xué)習(xí)者的用戶畫像和模型、概念地圖等(Ferreira-Mello, André,Pinheiro, Costa, & Romero, 2019);第五類是學(xué)習(xí)結(jié)果的分析和評(píng)價(jià),如根據(jù)學(xué)生的討論文本預(yù)測(cè)學(xué)生在線學(xué)習(xí)的輟學(xué)率、利用自然語言處理技術(shù)評(píng)價(jià)學(xué)生的寫作水平等。

        (四)基于時(shí)序圖譜的演進(jìn)趨勢(shì)分析

        在CiteSpace5.6工作界面上,將“Note Types”的節(jié)點(diǎn)類型設(shè)置為“Keyword”,其余設(shè)置保持不變,運(yùn)行后生成包含314個(gè)節(jié)點(diǎn)、754條連線的圖譜。選擇可視化視圖類型為“Timezone View”,為了便于清晰呈現(xiàn)關(guān)鍵詞演進(jìn)趨勢(shì),僅顯示出現(xiàn)頻次大于2的關(guān)鍵詞,最終生成下頁圖5呈現(xiàn)了研究演進(jìn)趨勢(shì)圖譜。

        圖5 研究熱點(diǎn)的時(shí)序圖譜分析圖

        可以看出,教育文本挖掘研究早期關(guān)注協(xié)作學(xué)習(xí)與在線討論,隨著教育研究和文本挖掘技術(shù)的不斷發(fā)展,情感分析和課程教學(xué)問題成為中期研究主流,到如今聚焦于知識(shí)建構(gòu)和認(rèn)知水平。在早期階段,研究者圍繞協(xié)作學(xué)習(xí)與互動(dòng)討論進(jìn)行探索,如Bower和Hedberg(2010)提出一種定量的多模態(tài)語篇分析方法來分析學(xué)生的在線協(xié)作學(xué)習(xí),從而分析網(wǎng)絡(luò)會(huì)議環(huán)境中任務(wù)主題、活動(dòng)設(shè)計(jì)和界面選擇對(duì)學(xué)生交互和協(xié)作的影響;Liaw和Bunn-Le Maste(2010)以中國臺(tái)灣和美國職前師范教育學(xué)生作為對(duì)比分析對(duì)象,研究?jī)傻貙W(xué)習(xí)者在論壇互動(dòng)中的話語特征以及跨文化對(duì)話者之間的互動(dòng)模式和類型,來探索在遠(yuǎn)程協(xié)作過程中如何進(jìn)行協(xié)作和跨文化學(xué)習(xí);Hou(2011)選取了23名大學(xué)生樣本,分析其在教師給定的案例情景和問題解決的任務(wù)下如何開展討論活動(dòng),以此來檢驗(yàn)高等教育課程中基于案例的在線協(xié)作討論的成效。

        在中期階段,研究熱點(diǎn)主要集中在學(xué)習(xí)情感分析與課程教學(xué)設(shè)計(jì)層面,如Esparza、Díaz、Canul-Reich、De-Luna和Ponce(2016)通過分析一個(gè)試點(diǎn)小組大學(xué)生撰寫的評(píng)價(jià),建立了一個(gè)情感分析模型,來評(píng)估教師在課堂上的表現(xiàn);Rajput、Haider和Ghani(2016)提出了一個(gè)基于情感分析的度量指標(biāo),通過應(yīng)用多種文本分析方法來解決學(xué)生的反饋問題,并借助標(biāo)簽云、情感評(píng)分和其他基于頻率的濾波器,為教師表現(xiàn)提供了新的見解;Guitart、Conesa、Baneres、Moré、Duran和Ga?an(2016)提出了一種利用自然語言處理技術(shù)來分析課程材料,以從課程不同方面收集信息的新方法,并且分析了概念在課程中的相關(guān)性以及概念與課程學(xué)習(xí)結(jié)果的一致性。

        后期階段主要集中在學(xué)習(xí)認(rèn)知層面,如Davis和Lester(2016)要求研究生閱讀與研究范式相關(guān)的文獻(xiàn),并在閱讀后撰寫討論。通過分析這些研究生撰寫的93個(gè)討論帖子,來探究學(xué)生如何使用特定的話語資源構(gòu)建在線討論中的研究身份;Rahimi、Litman、Correnti、Wang和Matsumura(2017)利用自然語言處理的方法,設(shè)計(jì)了一個(gè)與任務(wù)相關(guān)的模型,對(duì)學(xué)生寫作中的兩個(gè)目標(biāo)結(jié)構(gòu)的分?jǐn)?shù)進(jìn)行預(yù)測(cè):一是學(xué)生能否有效地使用論據(jù),二是學(xué)生如何組織想法和論據(jù)來支撐他們的觀點(diǎn); Xie、Di Tosto、Lu和Cho(2018)通過文本挖掘和社會(huì)網(wǎng)絡(luò)分析,系統(tǒng)地分析了美國東南部一所大學(xué)57名學(xué)生在線討論中的討論帖子,量化每個(gè)人的貢獻(xiàn),并以領(lǐng)導(dǎo)指數(shù)的形式總結(jié)學(xué)生的參與,分析群體結(jié)構(gòu)以探究學(xué)生的身份認(rèn)同。

        通過上述分析可知,教育文本挖掘表現(xiàn)出三個(gè)方面的取向:①從關(guān)注學(xué)習(xí)過程中某一部分的文本分析,到關(guān)注學(xué)習(xí)活動(dòng)中的整體文本分析,更加注重?cái)?shù)據(jù)的完整性;②從基于文本的知識(shí)內(nèi)容分析,到基于文本的學(xué)習(xí)心理和思維特征分析,更加注重分析的高階性;③從簡(jiǎn)單的文本詞頻統(tǒng)計(jì)分析,到基于機(jī)器學(xué)習(xí)的自然語言處理技術(shù),更加注重算法的智能性。此外,在分析情境上,教育文本挖掘?qū)?huì)從當(dāng)前的單通道語篇分析走向多通道語境分析,利用系統(tǒng)功能語言學(xué)來解構(gòu)文本互動(dòng)情境中所產(chǎn)生的意義類型。

        四、教育文本挖掘的研究熱點(diǎn)分析

        依據(jù)上述對(duì)研究熱點(diǎn)的初步歸類,結(jié)合教育文本分析與挖掘的不同應(yīng)用場(chǎng)景和對(duì)研究議題的質(zhì)性分析,我們認(rèn)為,當(dāng)前研究熱點(diǎn)主要集中在以下五個(gè)方面。

        (一)基于課程文本的學(xué)習(xí)行為和認(rèn)知分析

        課程文本包括學(xué)生在在線學(xué)習(xí)中所產(chǎn)生的論壇文本(討論文本)、評(píng)論文本、對(duì)話文本、作業(yè)文本等。課程文本作為學(xué)生在學(xué)習(xí)過程中生成的學(xué)習(xí)制品,反映了學(xué)生的學(xué)習(xí)和思考過程,幫助教師了解和掌握學(xué)生對(duì)信息處理的方式和過程,以便更好地開展學(xué)習(xí)。學(xué)習(xí)行為分析一直是教育文本挖掘領(lǐng)域研究的重點(diǎn),對(duì)其進(jìn)行全面理解和準(zhǔn)確表征是有效地進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)者分析、在線課程設(shè)計(jì)、知識(shí)服務(wù)供給、學(xué)習(xí)診斷與評(píng)價(jià)的基礎(chǔ)(張昕禹,梁越,高茜,2019)。通過挖掘?qū)W生的在線課程文本,可以清晰地了解學(xué)生的學(xué)習(xí)行為和認(rèn)知過程?;谖谋镜男袨榉治鲋饾u成為研究者預(yù)測(cè)學(xué)生在線學(xué)習(xí)表現(xiàn)的重要手段,結(jié)合課程文本、活動(dòng)文本、評(píng)價(jià)文本以及學(xué)生在在線學(xué)習(xí)中的點(diǎn)擊數(shù)據(jù)、瀏覽數(shù)據(jù)等,能精確分析學(xué)生的表現(xiàn),并據(jù)此對(duì)學(xué)生學(xué)習(xí)的行為進(jìn)行評(píng)價(jià)和預(yù)測(cè)。例如:Conijn、Van den Beemt和Cuijpers(2018)以基于MOOC的混合式課程為研究對(duì)象,以學(xué)生的活動(dòng)文本、活動(dòng)頻率、活動(dòng)順序等為分析數(shù)據(jù),通過相關(guān)性、多重回歸和過程挖掘來預(yù)測(cè)學(xué)生的行為表現(xiàn),并指出線上活動(dòng)可作為評(píng)價(jià)學(xué)生混合課程表現(xiàn)的重要指標(biāo)。

        在認(rèn)知分析方面,研究者傾向于基于已有研究理論和學(xué)生文本,分析學(xué)生的認(rèn)知能力和認(rèn)知建構(gòu)過程。例如:Liu和Yang(2014)基于布魯姆教學(xué)目標(biāo)分類學(xué)和Len Bird提出的3C模型,設(shè)計(jì)了一門《信息倫理》在線課程,通過分析參與者的留言帖子、對(duì)話質(zhì)量、小組領(lǐng)導(dǎo)者和教師使用的輔導(dǎo)腳手架策略,來驗(yàn)證在異步的、基于文本的會(huì)議中參與者如何展現(xiàn)他們的認(rèn)知話語,結(jié)果表明學(xué)生的認(rèn)知話語受討論問題的類型和腳手架的干預(yù)程度的影響。此外,學(xué)生的課程文本也反映出其認(rèn)知的諸多維度,如Molenaar和Chiu(2014)通過分析認(rèn)知、元認(rèn)知和關(guān)系活動(dòng)間的關(guān)系,即元認(rèn)知計(jì)劃組織認(rèn)知活動(dòng)并促進(jìn)知識(shí)獲取和意義生成之間的過渡,而關(guān)系活動(dòng)則有助于實(shí)施這種過渡;Lin、Hou、Wang和Chang(2013)的研究表明學(xué)生在在線討論中最突出的知識(shí)維度是元認(rèn)知知識(shí),而認(rèn)知過程則主要集中在理解上。

        (二)基于課堂互動(dòng)文本的情感分析

        學(xué)習(xí)者在學(xué)習(xí)某門課程時(shí)所流露出的情感變化,直接影響到其對(duì)課程的學(xué)習(xí)態(tài)度和最終的學(xué)習(xí)結(jié)果?;谡n堂互動(dòng)文本的情感分析主要采用分類、聚類、神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘方法,對(duì)文本中的情感關(guān)鍵詞進(jìn)行提取和分析。情感分析結(jié)果可作為評(píng)價(jià)學(xué)生學(xué)習(xí)過程的重要指標(biāo)和改善教學(xué)的重要依據(jù)。當(dāng)前,情感分析研究主要集中在兩個(gè)方面,一方面研究者通過捕捉學(xué)習(xí)者在在線學(xué)習(xí)中形成的反思文本或在線討論文本,結(jié)合特定的情感分析方法,對(duì)學(xué)習(xí)者進(jìn)行情感評(píng)價(jià)并進(jìn)行有針對(duì)性的干預(yù)。例如:Ozturk、Cicek和Ergul 對(duì)學(xué)生產(chǎn)生的交互文本進(jìn)行情感分析,收集了學(xué)生在參與課程時(shí)發(fā)布的Twitter文本,用樸素貝葉斯分類算法訓(xùn)練數(shù)據(jù),將文本情感分成了積極、消極和中立三類 ,以檢驗(yàn)遠(yuǎn)程教育的接受程度。Wang、Hu和Zhou(2018)提出了一種語義分析模型,從作業(yè)、評(píng)論等實(shí)時(shí)更新的數(shù)據(jù)中跟蹤MOOC學(xué)習(xí)者的情感傾向,以分析學(xué)生對(duì)課程的接受情況,通過情感量化和機(jī)器學(xué)習(xí)計(jì)算,實(shí)時(shí)預(yù)測(cè)不同學(xué)習(xí)階段的課程完成率,為MOOC的個(gè)性化教學(xué)提供解決。另一方面,研究者傾向于利用機(jī)器學(xué)習(xí)和文本挖掘技術(shù)開發(fā)情感分析工具,以用于學(xué)生的學(xué)習(xí)情緒評(píng)價(jià),例如:Cunningham-Nelson、Baktashmotlagh和Boles(2019)使用LDA模型探索學(xué)生在課程中各個(gè)方面的意見并將結(jié)果可視化后反饋給教師。Tian等(2014)提出了一個(gè)基于文本交互的情感識(shí)別框架,并設(shè)計(jì)了情緒類別檢測(cè)方法,利用隨機(jī)森林算法對(duì)學(xué)習(xí)者情緒進(jìn)行分類。

        (三)基于協(xié)作文本的知識(shí)建構(gòu)分析

        在線協(xié)作知識(shí)建構(gòu)是網(wǎng)絡(luò)學(xué)習(xí)社會(huì)化的重要產(chǎn)物,但當(dāng)前協(xié)作知識(shí)建構(gòu)中存在著“活動(dòng)無協(xié)作、協(xié)作無建構(gòu)或建構(gòu)低水平”的狀況,因此如何分析學(xué)生的知識(shí)建構(gòu)過程,評(píng)價(jià)學(xué)生的知識(shí)建構(gòu)水平是網(wǎng)絡(luò)學(xué)習(xí)研究的重要議題?;谝延械闹R(shí)建構(gòu)框架或評(píng)價(jià)標(biāo)準(zhǔn),結(jié)合文本挖掘技術(shù)和內(nèi)容分析、數(shù)據(jù)分析等方法,對(duì)學(xué)生在協(xié)作學(xué)習(xí)中提交的文本內(nèi)容、帖子數(shù)量、討論時(shí)長等數(shù)據(jù)進(jìn)行分析,以評(píng)價(jià)學(xué)生的知識(shí)建構(gòu)水平,是當(dāng)前對(duì)在線協(xié)作知識(shí)建構(gòu)研究的主要形式。如Liu和Yang(2014)基于Garrison提出的“探究性學(xué)習(xí)社區(qū)”模型,考察了學(xué)生在線課程異步討論中的知識(shí)建構(gòu)水平,分析了學(xué)生對(duì)網(wǎng)絡(luò)話語的態(tài)度和感知。Nami、Marandi和Sotoudehnama(2018)探索了教師在異步交流討論中的知識(shí)建構(gòu)過程,根據(jù)已有數(shù)據(jù)將教師的異步交流具體區(qū)分為不同類別,借助已有分類框架和分析方法,識(shí)別教師在認(rèn)知存在、社會(huì)存在和教學(xué)存在三個(gè)方面的認(rèn)知變化。

        (四)基于寫作文本的自動(dòng)化寫作評(píng)價(jià)

        寫作評(píng)價(jià)在教育教學(xué)中至關(guān)重要,教育研究者也曾開展了諸多的研究,但對(duì)寫作的評(píng)估一直存在著費(fèi)時(shí)費(fèi)力且可靠性低的現(xiàn)實(shí)困境(Landauer,2003)。隨著自然語言處理和文本挖掘技術(shù)的發(fā)展,寫作評(píng)價(jià)也迎來了新的轉(zhuǎn)機(jī)。詞頻統(tǒng)計(jì)、詞匯多樣性分析、句法相似性分析、句法復(fù)雜性分析、潛在語義分析、語義連貫性分析等算法和分析方法,能實(shí)現(xiàn)對(duì)學(xué)生寫作文本的自動(dòng)評(píng)價(jià)并檢測(cè)學(xué)生是否存在剽竊行為。因此當(dāng)前研究者致力于開發(fā)或利用已有評(píng)價(jià)平臺(tái),分析并評(píng)價(jià)學(xué)生的寫作文本,給予學(xué)生及時(shí)恰當(dāng)?shù)姆答?,以提高學(xué)生在寫作中生成知識(shí)的能力。例如:McNamara、Crossley和Roscoe(2013)在已有寫作評(píng)價(jià)模型的基礎(chǔ)上進(jìn)一步擴(kuò)展,提出一個(gè)評(píng)價(jià)寫作能力的五維框架,即詞匯、句法、銜接、修辭和易讀指數(shù)。研究者基于已有的智能導(dǎo)師系統(tǒng)“The Writing Pal”和評(píng)價(jià)框架分析學(xué)生的寫作文本,并提供了在寫作輔導(dǎo)系統(tǒng)中提供有意義反饋的手段。Akcapinar(2015)通過提供基于文本挖掘分析的自動(dòng)反饋來減少學(xué)習(xí)者在線作業(yè)中的剽竊行為。Yim和Warschauer(2017)綜合了已有的協(xié)作學(xué)習(xí)研究方法,分析了第二語言環(huán)境中學(xué)生的寫作文本,以驗(yàn)證學(xué)生的協(xié)作過程。除利用已有的導(dǎo)師系統(tǒng)和平臺(tái)外,研究者也致力于開發(fā)適用于自身研究的新系統(tǒng)或修改已有的評(píng)價(jià)系統(tǒng)。如Zupanc和Bosnic(2017)擴(kuò)展了現(xiàn)有的自動(dòng)論文評(píng)估系統(tǒng),納入額外的文本一致性屬性作為新的衡量指標(biāo),該系統(tǒng)可以提高評(píng)分精度并為作者提供語義反饋。

        (五)基于文本挖掘技術(shù)的評(píng)價(jià)工具和平臺(tái)的開發(fā)

        評(píng)價(jià)是教學(xué)的重要環(huán)節(jié),也是教育科學(xué)研究的重要議題,學(xué)習(xí)評(píng)價(jià)是影響學(xué)生學(xué)習(xí)質(zhì)量的重要因素之一(徐亞倩,趙宏,2019)。通過評(píng)價(jià)學(xué)生文本可以掌握學(xué)生的學(xué)習(xí)態(tài)度、情緒狀態(tài)、理解程度和學(xué)習(xí)效果等諸多方面,幫助教師及時(shí)調(diào)整和改善教學(xué)。通過數(shù)據(jù)分析發(fā)現(xiàn),文本挖掘技術(shù)也常用于開發(fā)評(píng)價(jià)工具或平臺(tái)以支持教學(xué)中學(xué)生學(xué)習(xí)成果和教學(xué)效果的評(píng)價(jià)。例如:Ramachandran、Gehringer和Yadav(2017)開發(fā)了一個(gè)自動(dòng)化元評(píng)論軟件來審查學(xué)生在在線交流中發(fā)表的評(píng)論。該軟件使用自然語言處理和機(jī)器學(xué)習(xí)技術(shù)來設(shè)置度量標(biāo)準(zhǔn),如評(píng)論內(nèi)容類型、相關(guān)性、覆蓋范圍、語氣、數(shù)量和是否剽竊等,以便為審查者提供快速反饋,幫助其快速審查學(xué)生提交的評(píng)論內(nèi)容。Hsu、Chou和Chang(2011) 研究開發(fā)出一套自動(dòng)化形成性評(píng)價(jià)的算法程序EduMiner,通過一系列文本挖掘技術(shù)來減輕教學(xué)評(píng)價(jià)負(fù)擔(dān)。Poce、Corcione和Iovine(2012)開發(fā)了一個(gè)“批判性思維技能和經(jīng)典閱讀”的平臺(tái),在已有批判性思維技能評(píng)價(jià)模型的基礎(chǔ)上進(jìn)行改編,確定了反映學(xué)生批判性思維能力的11個(gè)維度,并對(duì)學(xué)生提交的作品進(jìn)行詞匯量分析和內(nèi)容分析,以評(píng)價(jià)學(xué)生的批判性思維水平。

        五、教育文本挖掘的研究趨勢(shì)述評(píng)

        文本是人類語言中的重要組成部分,也是教與學(xué)思想內(nèi)容的主要呈現(xiàn)方式,對(duì)于文本的挖掘分析不僅可以了解學(xué)習(xí)行為特征,也可以把握學(xué)習(xí)心理特征。人工智能技術(shù)、網(wǎng)絡(luò)直播、移動(dòng)學(xué)習(xí)等新興環(huán)境和技術(shù)的廣泛應(yīng)用,使得文本的應(yīng)用場(chǎng)景、識(shí)別方式、傳播媒介、分析手段等都發(fā)生了較大變化?;谇笆鰧?duì)文本挖掘演進(jìn)趨勢(shì)的分析,結(jié)合文本的生成情境、分析內(nèi)容、處理方式對(duì)教育文本挖掘走向作一探討。

        (一)基于網(wǎng)絡(luò)直播交流的互動(dòng)模式分析

        自2016年以來,網(wǎng)絡(luò)直播以實(shí)時(shí)、雙向的獨(dú)特傳播方式,成為繼微信、微博等新媒體后的又一火爆行業(yè)。網(wǎng)絡(luò)直播的“異軍突起”,也吸引了大量教育工作者的關(guān)注,網(wǎng)絡(luò)直播學(xué)習(xí)逐漸成為網(wǎng)絡(luò)直播的主要內(nèi)容之一。網(wǎng)絡(luò)直播學(xué)習(xí)為學(xué)生營造了一種新穎的學(xué)習(xí)模式,學(xué)生可以在直播平臺(tái)中與教師和其他學(xué)生實(shí)時(shí)開展互動(dòng),及時(shí)提問并能得到及時(shí)反饋。已有研究表明,學(xué)生在網(wǎng)絡(luò)直播學(xué)習(xí)平臺(tái)中的師生互動(dòng)和同伴互動(dòng)在參與模式和討論主題上既有相似之處也有顯著差異(He, 2013)。網(wǎng)絡(luò)直播學(xué)習(xí)環(huán)境中,主要存在學(xué)生與教師之間的提問與解答、學(xué)生與學(xué)生之間的聊天討論這兩種主要的溝通交流方式,通過文本挖掘和數(shù)據(jù)分析的方式,可以直觀了解學(xué)生在不同角色中的不同互動(dòng)方式,從而根據(jù)學(xué)生的互動(dòng)偏好和習(xí)慣,提供更為個(gè)性化的學(xué)習(xí)指導(dǎo)。在未來的研究中,研究者還可以分析學(xué)生在不同學(xué)科中的互動(dòng)以及同一門學(xué)科不同學(xué)習(xí)背景的學(xué)生互動(dòng)模式之間的異同。

        (二)基于筆記文本的學(xué)習(xí)習(xí)慣分析

        當(dāng)前,對(duì)學(xué)習(xí)筆記的研究在醫(yī)學(xué)教育領(lǐng)域被廣泛使用,研究者利用醫(yī)學(xué)生的臨床筆記分析學(xué)生的醫(yī)學(xué)能力,并為筆記中的不足提供補(bǔ)充材料(Denny et al., 2015)。學(xué)習(xí)筆記不僅能反映出學(xué)生學(xué)習(xí)成果,也能很好地反映出學(xué)生在學(xué)習(xí)過程中的耐心、細(xì)心程度以及解決問題的能力,是衡量學(xué)生學(xué)習(xí)能力的重要指標(biāo)。學(xué)生在參與活動(dòng)過程中的筆記和活動(dòng)后的反思文本,或是學(xué)習(xí)日志、博客等,都能很好地反映出學(xué)生的學(xué)習(xí)習(xí)慣,如學(xué)生如何把握學(xué)習(xí)全過程、如何開展自主學(xué)習(xí)、是否獨(dú)立鉆研和思考、是否善于記錄和反思、傾向于何種學(xué)習(xí)方式、傾向于何種表達(dá)方法等。通過對(duì)學(xué)生筆記的分析,可以了解學(xué)生的學(xué)習(xí)習(xí)慣、學(xué)習(xí)偏好和思維過程,結(jié)合用戶畫像技術(shù)可以為學(xué)生進(jìn)行全面、細(xì)致地可視化畫像分析,可為學(xué)生提供個(gè)性化的學(xué)習(xí)指導(dǎo),也可作為教師改進(jìn)教學(xué)的重要參考指標(biāo)。

        (三)結(jié)合線上和線下文本的元認(rèn)知特征分析

        元認(rèn)知是認(rèn)知的認(rèn)知,它包括兩個(gè)主要的功能:意識(shí)性及調(diào)控性,即對(duì)認(rèn)知的認(rèn)知和對(duì)認(rèn)知的控制。對(duì)元認(rèn)知的分析可以幫助學(xué)生體驗(yàn)學(xué)習(xí)情景、自主選擇合適的學(xué)習(xí)方法以及客觀評(píng)價(jià)自己的學(xué)習(xí)活動(dòng)。而教育背景中的論證很大程度上依賴于學(xué)生的元認(rèn)知技能發(fā)展(Martínez & Valdivia,2016)。在協(xié)作學(xué)習(xí)環(huán)境中論證被認(rèn)為是促進(jìn)學(xué)習(xí)者自身思維過程相互調(diào)節(jié)的工具,因此通過分析學(xué)生的論證可以明確了解學(xué)生的元認(rèn)知技能。在網(wǎng)絡(luò)學(xué)習(xí)環(huán)境中,學(xué)生經(jīng)常被要求針對(duì)某一學(xué)習(xí)內(nèi)容或他人的評(píng)論發(fā)表意見,以展示自己的觀點(diǎn)和看法,但學(xué)生卻少有被要求對(duì)自己的觀點(diǎn)發(fā)表看法,評(píng)論自己的評(píng)論。通過分析學(xué)生對(duì)討論文本的再評(píng)價(jià),能夠得出學(xué)生思維的變化以及其元認(rèn)知能力的發(fā)展歷程,有利于教師對(duì)學(xué)生進(jìn)行過程性評(píng)價(jià),及時(shí)掌握學(xué)生學(xué)習(xí)情況。

        (四)基于討論文本的協(xié)作學(xué)習(xí)模式研究

        當(dāng)前關(guān)于協(xié)作學(xué)習(xí)的研究眾多,但研究者的關(guān)注點(diǎn)主要集中在協(xié)作學(xué)習(xí)的質(zhì)量(Schalk, Marcelo,2010)、協(xié)作學(xué)習(xí)討論內(nèi)容(He, 2013) 、協(xié)作學(xué)習(xí)能力的提高(Hou, 2011)等方面,對(duì)協(xié)作學(xué)習(xí)中學(xué)習(xí)者的行為和模式等尚未形成廣泛關(guān)注。學(xué)生協(xié)作對(duì)課程的完成情況起到了決定性作用,尤其是在遠(yuǎn)程教育方面(Brinton, Chiang, Jain, Lam, Liu, &Wong, 2014)。因此,有必要基于自然語言處理、潛在語義分析模型、監(jiān)督學(xué)習(xí)方法等文本挖掘和分析技術(shù)來分析學(xué)生在基于討論的協(xié)作學(xué)習(xí)中產(chǎn)生的文本,明晰學(xué)生的協(xié)作學(xué)習(xí)模式,為學(xué)生提供差異化反饋的同時(shí),改進(jìn)教學(xué)模式和教學(xué)方法,提高學(xué)生協(xié)作學(xué)習(xí)的效果。

        (五)教育文本的語義理解和語義計(jì)算

        文本挖掘和文本分析技術(shù)日臻成熟,研究者可以快速從文本中獲取信息,如何將簡(jiǎn)單易懂的自然語言轉(zhuǎn)換為較強(qiáng)專業(yè)性的數(shù)據(jù)概念、如何將相關(guān)聯(lián)語義進(jìn)行整合分析是文本挖掘過程中的重要環(huán)節(jié),也是文本分析的基礎(chǔ)和前提,但當(dāng)前的研究中卻較少提及。語義計(jì)算方式應(yīng)當(dāng)包括語義權(quán)重、分析算法、異構(gòu)數(shù)據(jù)的處理等。在語義理解方面,應(yīng)當(dāng)建立相關(guān)模型和框架,將文本解析為結(jié)構(gòu)化的、機(jī)器可讀的意圖與詞槽信息。因此,語義理解和語義計(jì)算應(yīng)是未來教育文本挖掘領(lǐng)域的重要研究?jī)?nèi)容之一,需要建立被廣泛接受的概念和框架,為后續(xù)研究提供參考。

        六、結(jié)語

        教育文本挖掘是學(xué)習(xí)分析方向下的一個(gè)重要研究領(lǐng)域,對(duì)學(xué)習(xí)文本的分析可以為整個(gè)學(xué)習(xí)過程數(shù)據(jù)分析提供較好的證據(jù)支撐。本研究采用共現(xiàn)分析、聚類分析等方法對(duì)教育文本挖掘的相關(guān)文獻(xiàn)進(jìn)行了定量分析,從引征關(guān)系、合作關(guān)系、時(shí)序關(guān)系等方面進(jìn)行了質(zhì)性探討,試圖厘清該研究領(lǐng)域的熱點(diǎn)內(nèi)容與脈絡(luò)??梢钥闯?,已有研究主要聚焦于文本分析和平臺(tái)開發(fā)兩個(gè)方面,致力于探究在線課程中學(xué)生的行為、認(rèn)知、情感、能力等方面。在數(shù)據(jù)源上需要進(jìn)一步結(jié)合其他學(xué)習(xí)行為數(shù)據(jù)進(jìn)行綜合分析,在分析方法上依托自然語言處理和深度學(xué)習(xí)技術(shù)進(jìn)行語義計(jì)算和理解,分析對(duì)象包括學(xué)習(xí)文本、師生互動(dòng)文本、教學(xué)文本等。通過海量文本數(shù)據(jù)的自動(dòng)化處理,提升文字處理效率和文本挖掘深度,降低人工成本,深入理解文字背后的含義,為學(xué)習(xí)設(shè)計(jì)和教學(xué)提供有力支持。

        猜你喜歡
        文本評(píng)價(jià)分析
        SBR改性瀝青的穩(wěn)定性評(píng)價(jià)
        石油瀝青(2021年4期)2021-10-14 08:50:44
        隱蔽失效適航要求符合性驗(yàn)證分析
        在808DA上文本顯示的改善
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        基于Moodle的學(xué)習(xí)評(píng)價(jià)
        如何快速走進(jìn)文本
        保加利亞轉(zhuǎn)軌20年評(píng)價(jià)
        亚洲精品2区在线观看| 成人片黄网站色大片免费观看cn| 亚洲最大天堂无码精品区| 国产精品麻豆A在线播放| 综合久久精品亚洲天堂| 五月av综合av国产av| 老色鬼永久精品网站| 91成人午夜性a一级毛片| 精品一区二区三区老熟女少妇| 亚洲精品国产第一综合色吧| 国模欢欢炮交啪啪150 | 日韩欧美在线播放视频| av网站一区二区三区| av在线免费观看蜜桃| 无码人妻精品丰满熟妇区| 日韩欧美亚洲中字幕在线播放| 成人性生交大片免费看i| 日本在线视频www色| 被群cao的合不拢腿h纯肉视频| 免费一级国产大片| 亚洲一区二区自偷自拍另类| 亚洲亚洲人成综合丝袜图片| 无套内谢孕妇毛片免费看看| 无遮挡很爽视频在线观看| 国产女主播一区二区久久| 亚洲国产精华液网站w| 欧洲中文字幕| 最新亚洲视频一区二区| 免费无码专区毛片高潮喷水| 国产三级在线观看播放视频| 人妻无码中文专区久久AV| 亚洲中文字幕高清av| 亚洲av片在线观看| 99热这里只有精品4| 久久精品国产亚洲av成人网| 亚洲av无码乱码精品国产| 亚洲色大网站www永久网站| 欧美亚洲另类 丝袜综合网| 中文字幕人妻在线少妇| 在线高清理伦片a| 91久久精品无码人妻系列|