胡飛
傳統(tǒng)的網(wǎng)上學習方式,在面對學生在線提問的時候,需要老師來理解學生的問題并做出答疑。這不光增加了老師的工作量,而且學生與在線學習系統(tǒng)之間的交互也無法做到隨時實時。本文利用深度學習技術來理解學生在線提交的問題,并且在沒有人工干預的情況下自動回答學生的問題。實現(xiàn)在線自主答疑。
1引言
我國對自主學習的系統(tǒng)研究,始于20世紀80年代。許多學者作了研究并在一些地方進行了實驗,取得了一定的成果。在1979年前后,我國就出現(xiàn)了不少以指導學生自主學習為目標的教學實驗,如:上海育才中學段力佩等人總結(jié)的“讀讀、議儀、練練、講講”八字教學法;中科院心理研究所盧仲衡主持的“自學輔導教學”實驗研究;遼寧盤錦二中魏書生實施的“六步教學法”實驗;上海嘉定中學錢夢龍進行的“導學教學法”研究等。所有這些教學實驗都把“自主學習”作為教學的主要環(huán)節(jié),明確把培養(yǎng)學生的自主學習能力和發(fā)展學生的智力作為主要追求目標。國內(nèi)目前各具特色的網(wǎng)絡自學平臺有:1)清華大學網(wǎng)絡自學平臺,它是由清華大學教育技術研究所開發(fā)的網(wǎng)絡自學平臺。該平臺包括網(wǎng)絡資源、網(wǎng)站、學生、課件資源和資料庫等構(gòu)建,通過完整的自學平臺和管理平臺來保證整個網(wǎng)絡教育的有序運行和管理。該平臺是一個先進的網(wǎng)絡自學基礎服務支撐平臺,可以開發(fā)一系列的網(wǎng)絡教學業(yè)務系統(tǒng),為課堂教學提供了有力的支撐。2)北京師范大學網(wǎng)絡自學平臺,它是由北京師范大學從2001年設立網(wǎng)絡教育學院,北京師范大學網(wǎng)絡教育學院利用網(wǎng)絡資源和資源平臺開展在職人員的繼續(xù)教育和在崗培訓,產(chǎn)生了廣泛的影響。北京師范大學的網(wǎng)絡自學平臺中包含課程資源、課件展示、精品課程、資源庫等功能,這種網(wǎng)絡自學方式將面授的優(yōu)勢和網(wǎng)絡的特點進行有機地結(jié)合,構(gòu)成了面授和網(wǎng)絡融為一體的獨特方式。平臺以構(gòu)建主義學習理論和系統(tǒng)方法淪為指導思想,便于學習者構(gòu)建他們的知識架構(gòu)。3)其它社會商業(yè)性質(zhì)的網(wǎng)絡自學平臺,例如網(wǎng)易云課堂、新浪公開課平臺等。
《基礎教育課程改革綱要(試行)》在論及基礎教育課程改革的具體目標時指出:“改變課程實施過于強調(diào)接受學習、死記硬背、機械的現(xiàn)狀,倡導學生主動參與、樂于探究、勤于動手,培養(yǎng)學生搜集和處理信息的能力、獲取新知識的能力、分析和解決問題的能力以及交流與合作的能力。” 傳統(tǒng)的學習強調(diào)的是接受式的、被動式的學習方式,而自主學習改變過去的那種“過于強調(diào)接受學習”的傾向,倡導學生學會自主學習的方式去主動學習和接受新知識。在線自主學習則是借助互聯(lián)網(wǎng)技術,把學生帶入網(wǎng)絡世界,借助互聯(lián)網(wǎng)、移動通信等技術讓學生接觸到更多學習內(nèi)容和知識,是互聯(lián)網(wǎng)+自主學習的完美結(jié)合。大數(shù)據(jù)為在線自主學習注入了新的活力。其借助深度學習等機器學習技術來分析大量學生的歷史學習記錄、學習內(nèi)容以及獲取到的知識點,從中尋找適合大眾的學習規(guī)律,同時再分析單個學生的學習軌跡,兩者結(jié)合來為學生推薦個性化的學習內(nèi)容。隨著教育信息化和互聯(lián)網(wǎng)技術的發(fā)展,基于網(wǎng)絡的學習方式成為用戶獲取知識的重要途徑和方法,學生不再是被動地在課堂上接受知識,而是通過各種方式(特別是互聯(lián)網(wǎng))主動參與到學習中。在線自主學習平臺也可作為課堂教學的延伸,它可以通過互聯(lián)網(wǎng)完成傳統(tǒng)的教學,還能通過用戶線上參加的課程學習、考試競賽、試題練習、調(diào)查問卷和交流等情況,實現(xiàn)對用戶學習情況的全程跟蹤管理和對用戶學習培訓需求的全面掌握?;诓煌哪繕?,線上學習的方式也是多種多樣的,比如有虛擬課堂、錄像點播平臺和多媒體互動課程學習平臺等。在線教育不受時間和空間的限制,可以與線下教育想結(jié)合,實現(xiàn)傳統(tǒng)教學的延伸。
自動答疑是在線自主學習中重要一環(huán)。學生在線自主學習的時候所產(chǎn)生的疑問會以文字的形式發(fā)送給自主學習平臺。過去的方法都是等到老師上線以后再作答,或者對一些簡單的問題進行查詢表(look-up table)式回答。這種方式不光回答不夠準確,而且有時間延遲,不利于實時解釋學生各種疑問。因為很多學習是在學生和老師之間通過一問一答的形式展開的。在本文中,我們利用深度學習技術,讓軟件系統(tǒng)可以代替老師來理解學生的問題并且做出回答。
2 自動答疑
深度學習在自動答疑上的應用實際上是其在自動問答系統(tǒng)上應用的延伸。在1950年,英國著名的數(shù)學家圖靈在他發(fā)表的論文《Computing Machinery and Intelligence》中提出了機器智能的概念。他提出通過自然語言問答的形式來判斷機器是否具有智能,也就是大家熟知的”圖靈測試“。這可以看作最早的自動答疑模型。這以后,自動答疑系統(tǒng)不斷完善發(fā)展中,并逐漸出現(xiàn)在各種遠程在線教學平臺上。例如互聯(lián)網(wǎng)早期的留言板、BBS論壇、實時聊天等。但是,這些答疑方式很多都需要通過人工干預。這是由于計算機對自然語言理解的能力還不夠成熟造成的。為了理解在線自主學習中學生提出的問題,我們引入深度學習技術。深度學習依靠其強大的表征學習能力,能夠深度地學習文本的語義表示,并且很容易地通過模型計算來對語義表示做出理解,并生成文本回復。這就實現(xiàn)了無人工干預的自動在線答疑系統(tǒng)。谷歌和百度公司的在線機器翻譯就可以看作這樣一種系統(tǒng),它們學習并理解人類輸入的問題(語言A),然后自動計算并輸入問題的答案(語言B)。并且可以反復多次實現(xiàn)這一過程。這樣就實現(xiàn)了一問一答的形式,把問題轉(zhuǎn)換為答案(語言A轉(zhuǎn)換為語言B)。
3 利用深度學習技術來理解并解答問題
大部分傳統(tǒng)的在線自主學習平臺都是借鑒線下學習的方案來進行設計和實施。隨著互聯(lián)網(wǎng)技術的興起,各種網(wǎng)上學習平臺中生成了許多歷史學習記錄和相關的學習內(nèi)容,如何有效地挖掘這些數(shù)據(jù)來改進學習方案,提升學習效率,是目前擺在相關研究者面前的一個難題。另一方面,很多自主學習平臺為每個學生提供千篇一律的學習方案和學習體驗,或者簡單地分為幾個大類,粗暴地把一部分學生放入到某一類學習方案中,再或者還有一些自主學習平臺提供一些游戲化的手段來吸引學生。這些方法對于有個性需求的成年大學生來說,無法滿足他們個性化的學習需求。因為有些大學生在某些知識點上已經(jīng)積累了豐富的基礎,不同的大學生對自我知識水平的提升有不同的訴求,這些都不是傳統(tǒng)的自主學習平臺可以滿足他們的。近年來大數(shù)據(jù)技術的蓬勃發(fā)展,特別是深度學習等機器學習的技術得到廣泛應用,分析和處理這一類數(shù)據(jù)成為可能。深度學習對文本的表征學習能力為文本理解帶了技術保障。其中的跨思維向量模型(Skip-Thought Vectors, STV)更是這方面的佼佼者。STV模型有一個編碼器和兩個解碼器。任意取一段文本中連續(xù)的三句話,編碼器對中間一句話話進行編碼,生成一個向量。然后,這個向量分別輸入到兩個解碼器中,分別得到前后兩句話。把這個模型在文本大數(shù)據(jù)集上做訓練,從訓練出來的模型中取編碼器用于文本語義理解。當一句話輸入這個編碼器以后得到的向量就是這句話的一個語義表示。我們可以把這個編碼器用于理解學生的提問。把學生的提問輸入到這個編碼器中就可以得到問題的向量表示。
用向量表示學生的提問,有利于計算機識別學生的問題。在識別和理解學生問題的基礎上,為了讓計算機能夠快速做出響應并回答問題,我們需要再引入一個新的解碼器。我們把這個新的解碼器和之前的編碼器結(jié)合起來成為一個”編碼-解碼“模型,然后用一個問答數(shù)據(jù)集來訓練這個模型。針對問答數(shù)據(jù)集中一條數(shù)據(jù)”問題:答案“,把“問題“輸入編碼器,編碼器輸出向量,然后把向量輸入解碼器,解碼器輸出一段文本,把這段文本和”答案“做對比得到的誤差反過來調(diào)整解碼器中的參數(shù)。如此反復訓練,最后讓輸出的文本和”答案“之間的誤差逐漸縮小。最后我們得到一個訓練好的”編碼-解碼“模型,這個模型可以用于在線理解學生問題并立即響應并做出回答。這就好比有一個”老師“不知疲倦的不停回答著學生的提問,實現(xiàn)了隨時隨地在線和學生互動的功能。
(作者單位:重慶第二師范學院網(wǎng)絡中心)