代巧玲 李振
摘要:在學習過程中,由于不同學生個體有不同的學習方式、學習規(guī)律、知識基礎(chǔ)及興趣愛好,針對學生在學習過程中各種學習行為產(chǎn)生的數(shù)據(jù),構(gòu)建數(shù)據(jù)倉庫。通過OLAP技術(shù),結(jié)合不同行為產(chǎn)生的結(jié)果,在線分析學生在不同時間、不同模塊產(chǎn)生不同行為的頻次分布情況,推測學生的學習狀態(tài)、學習側(cè)重點、興趣點、學習效率、學習軌跡與偏科現(xiàn)象等,使教師可以及時作出調(diào)整,提供更合理的學習策略,真正做到有科學依據(jù)地因材施教。同時,學習平臺可以根據(jù)推測結(jié)果,推薦個性化的學習內(nèi)容與學習路線,以提高學生學習效率。
關(guān)鍵詞:學習行為;數(shù)據(jù)倉庫;xAPI;個性化推薦
DOIDOI:10.11907/rjdk.181218
中圖分類號:TP392
文獻標識碼:A 文章編號:1672-7800(2018)010-0187-04
英文摘要Abstract:In the process of learning, different students have different learning styles, learning rules, knowledge base and interests. We build data warehouse about the data of students′ various kinds of learning behavior in the learning process. Through the OLAP technology, combined with the results of different behaviors, we can analyze the frequency distribution of students′ different behaviors in different time and modules on line to speculate students′ learning state, learning focus, interest point, learning efficiency, learning trajectory, learning branch phenomenon and so on. According to these speculations, teachers can make timely adjustments, provide more reasonable learning strategies, and truly have a scientific basis to teach students in accordance with their aptitude. At the same time, learning platforms can recommend personalized learning content and routes to improve the students′ learning efficiency.
英文關(guān)鍵詞Key Words:learning behavior;data warehouse;xAPI;personalized recommendation
0 引言
隨著信息化的飛速發(fā)展,各行各業(yè)產(chǎn)生了海量數(shù)據(jù),如何從這些數(shù)據(jù)中獲取更多有價值的信息,成為各行業(yè)關(guān)注的焦點。例如,政府、軍事及商業(yè)領(lǐng)域[1-3]都將海量歷史數(shù)據(jù)抽取轉(zhuǎn)換加載至數(shù)據(jù)倉庫中,通過分析并挖掘隱藏信息,對其進行充分利用以獲取更大價值。
近年來在教育領(lǐng)域,各大教育機構(gòu)及院校紛紛利用已有的信息化系統(tǒng)(如:選課系統(tǒng)、招生系統(tǒng)、圖書館系統(tǒng)、教學評價系統(tǒng)、就業(yè)系統(tǒng)、教務(wù)系統(tǒng)等[4-8])產(chǎn)生的數(shù)據(jù),建立數(shù)據(jù)倉庫,以期發(fā)現(xiàn)其中隱藏的信息,用于提高教學質(zhì)量及提供教育決策等。然而,這些已有的數(shù)據(jù)倉庫都只是記錄原始信息,或是最終考核結(jié)果之類的靜態(tài)信息,并沒有動態(tài)跟蹤記錄學生在學習過程中的各種學習行為軌跡。若將這些信息有效利用起來,可以分析挖掘出大量隱含的有價值信息。
本研究基于魏順平[9]提出的學習分析數(shù)據(jù)模型與xAPI規(guī)范中描述學習行為的數(shù)據(jù)結(jié)構(gòu)Statement,將其進一步改善為適合本研究的學習行為數(shù)據(jù)模型,旨在利用學生在學習過程中產(chǎn)生的數(shù)據(jù)構(gòu)建數(shù)據(jù)倉庫,在線分析學生的學習狀態(tài)、學習側(cè)重點、學習效率、學習軌跡等,不僅可以使教師利用分析結(jié)果對學生進行教學干預或提出學習策略等,同時使教育機構(gòu)可以優(yōu)化已有的在線教育平臺,提高學生學習效率。
1 相關(guān)概念
1.1 xAPI
xAPI是一種專門用來存儲與訪問學習經(jīng)歷的技術(shù)規(guī)范。它是“訓練和學習框架”(TLA)中的一部分,國外已有學習平臺通過該方式記錄學習行為。如果說被記錄的學習行為是一種“產(chǎn)品”,xAPI則可被稱為創(chuàng)建“產(chǎn)品”的圖紙[10]。
xAPI利用活動流(Activity Stream)概念描述學習者學習經(jīng)歷,當學習者與其他人通過互動進行學習時,xAPI可以記錄這些學習經(jīng)歷。學習經(jīng)歷以Statement形式存在,Statement在xAPI規(guī)范中是一種具有語義結(jié)構(gòu)的數(shù)據(jù),將學習事件數(shù)據(jù)存儲到 LRS(Learning Record Store)中。一個Statement除具有執(zhí)行者、動作、對象3個基本屬性外,還包含結(jié)果、情境、時間戳、授權(quán)等可選屬性[11],如表1所示。
1.2 數(shù)據(jù)倉庫
數(shù)據(jù)倉庫之父William H Inmon[12]指出:“數(shù)據(jù)倉庫是一個面向主題、集成、時變且非易失的數(shù)據(jù)集合,用于支持管理決策?!睌?shù)據(jù)倉庫建立在用戶提供的大量數(shù)據(jù)、硬件環(huán)境與數(shù)據(jù)庫管理系統(tǒng)上,是決策支持分析的基礎(chǔ)[13]。數(shù)據(jù)倉庫是后期在線分析的數(shù)據(jù)環(huán)境。
1.3 ETL技術(shù)
ETL技術(shù)負責將分散的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)抽取到臨時中間層后進行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中[14]。在此階段得到的數(shù)據(jù)質(zhì)量,直接關(guān)系到后期在線分析決策的準確性。
1.4 OLAP技術(shù)
OLAP(聯(lián)機分析處理)也稱為多維數(shù)據(jù)分析。OLAP 委員會對其定義如下:使分析人員、管理人員或執(zhí)行人員能夠從多種分析角度對從原始數(shù)據(jù)庫中轉(zhuǎn)化出來的、能夠準確為用戶所理解,并真實反映企業(yè)特性的信息進行快速、一致交互存取,從而獲得對數(shù)據(jù)更深入了解的軟件技術(shù)[15]。專業(yè)領(lǐng)域的數(shù)據(jù)分析師利用構(gòu)建成功的數(shù)據(jù)倉庫,并結(jié)合自己的經(jīng)驗,可作出有科學依據(jù)的決策。
2 基于學習行為數(shù)據(jù)模型的數(shù)據(jù)倉庫設(shè)計
2.1 數(shù)據(jù)源獲取
數(shù)據(jù)源是構(gòu)建數(shù)據(jù)倉庫的基礎(chǔ),本研究基于已有的學習分析數(shù)據(jù)模型[9]與xAPI規(guī)范中描述學習行為的數(shù)據(jù)結(jié)構(gòu)Statement,將其進一步改善為適合本研究的學習行為數(shù)據(jù)模型,并獲取學生各種學習行為產(chǎn)生的數(shù)據(jù),作為數(shù)據(jù)源。
2.2 決策主題確定
通過確定決策主題,制定數(shù)據(jù)倉庫范圍,并確定需要關(guān)注的數(shù)據(jù)內(nèi)容,以及需要分析與實現(xiàn)的目標?;趯W習行為的數(shù)據(jù)倉庫研究的決策主題有學習行為分析、作業(yè)成績分析、課程成績分析與課外活動記錄分析。
2.2.1 學習行為分析
該主題為本研究的主要分析對象,通過分析該主題可以了解:①學生在不同模塊產(chǎn)生不同行為的頻次分布情況,從而推測學生學習的側(cè)重點與興趣點,并據(jù)此為學生推薦個性化學習內(nèi)容,真正做到科學地因材施教;②發(fā)現(xiàn)學習者訪問路徑。機構(gòu)管理者通過該方式不僅可以優(yōu)化平臺設(shè)計,提高平臺使用率,同時可以據(jù)此給學生提供個性化學習路線,提高學生學習效率。
2.2.2 作業(yè)成績分析
通過平時的作業(yè)測試,可以了解學生對某一單元的掌握程度,再結(jié)合學習行為分析主題與課外活動記錄分析主題,推測學生在某一階段的積極性與學習結(jié)果的關(guān)系,使教師可以及時采取適當措施,提高學生學習成績。
2.2.3 課程成績分析
通過期末考核測試,可以了解學生在某一學期的整體知識掌握程度,再結(jié)合學習行為分析主題與課外活動記錄分析主題,可以推測學生在整個學期的學習積極性與學習結(jié)果的關(guān)系,從而使教師及時采取適當措施提高學生成績。
2.2.4 課外活動記錄分析
通過了解學生某一階段參加不同活動的記錄,可以了解學生在此階段的積極性,結(jié)合其它主題域情況,使教師充分了解學生在某一階段的狀態(tài),然后作出合理決策。
2.3 數(shù)據(jù)倉庫模型確定
根據(jù)決策主題,可大致得出數(shù)據(jù)倉庫維度模型,確定數(shù)據(jù)倉庫維度模型對構(gòu)建數(shù)據(jù)倉庫可起到重要作用。根據(jù)事實表與維度表的關(guān)系,可將常見模型分為星型模型與雪花型模型。
星型架構(gòu)(Star Schema)以事實表為核心,其它維表圍繞該核心表呈星型分布,維表彼此之間沒有任何聯(lián)系,每個維表中的主鍵只能是單列的,同時該主鍵被放置在事實表中,作為事實表與維表連接的外鍵。
雪花型架構(gòu)(Snow Schema)以事實表為核心,很多維表直接與事實表關(guān)聯(lián),允許附加一些其它維表,只與已有維表靠外鍵關(guān)聯(lián),而不與事實表直接關(guān)聯(lián),從而實現(xiàn)查看細化數(shù)據(jù)粒度的目的。
星型架構(gòu)與雪花型架構(gòu)的主要區(qū)別是,其可利用冗余的數(shù)據(jù)存儲改善查詢性能。因此,本研究依據(jù)數(shù)據(jù)倉庫的易用性與高性能兩個指標,采用星型模型。圖1-圖4分別為4個決策主題設(shè)計的對應(yīng)星型模型。
3 基于學習行為數(shù)據(jù)模型的數(shù)據(jù)倉庫實現(xiàn)
3.1 數(shù)據(jù)處理
ETL是數(shù)據(jù)倉庫構(gòu)建的重要一環(huán),所得到的數(shù)據(jù)質(zhì)量將直接影響后期決策的可信度。本研究采用腳本語言python,從數(shù)據(jù)源抽取出所需數(shù)據(jù),主要進行的數(shù)據(jù)清洗、轉(zhuǎn)換操作有:①剔除無用字段;②保證字段唯一性;③統(tǒng)一字段類型(類型轉(zhuǎn)換);④設(shè)置字段特殊值處理情況(處理維度模型時建立外鍵關(guān)系,需要保證對應(yīng)關(guān)系);⑤本研究數(shù)據(jù)源在抽取行為類型事實表的處理過程中,除瀏覽資源類型外,其它類型行為的Statement均沒有情境(Context)屬性,所以在抽取行為事實表時,將瀏覽資源行為類型的事實單獨抽取存放于一個事實表中,其它類型行為事實存放于另一個事實表中;⑥考慮到OLAP查詢性能,本研究的維度模型采用星型架構(gòu),因此在處理數(shù)據(jù)過程中,將維度表之間有關(guān)系的兩個或多個維度表進行必要的合并,通過存儲冗余數(shù)據(jù)達到查詢性能的優(yōu)化。
經(jīng)過數(shù)據(jù)清洗及轉(zhuǎn)換后,最終按照預先設(shè)計好的數(shù)據(jù)倉庫模型將數(shù)據(jù)導入數(shù)據(jù)庫中,作為數(shù)據(jù)倉庫的數(shù)據(jù)源。
3.2 數(shù)據(jù)倉庫構(gòu)建
本研究采用SQL Server 2005 Business Intelligence Development Studio構(gòu)建數(shù)據(jù)倉庫。經(jīng)過新建Analysis Service工程、新建數(shù)據(jù)源、新建數(shù)據(jù)視圖、新建維度及維度層次關(guān)系、新建多維數(shù)據(jù)集5個步驟,成功構(gòu)建數(shù)據(jù)倉庫。
3.3 OLAP示例
通過觀察初二上學期各門課程考試總成績,可以看到學號為20150142的學生總成績最高(見圖5),學號為20150201的學生總成績最低(見圖6)。
通過觀察“課外報名活動記錄”決策主題對應(yīng)的多維數(shù)據(jù)集(見圖7),可以看到,與成績較差的學生(學號為20150201)相比,成績較優(yōu)秀的學生(學號為20150142)參加課外活動較多,課外比較積極。
如圖8所示,通過觀察“學習行為分析”決策主題對應(yīng)的多維數(shù)據(jù)集,在用戶維度上選擇學號為“20150142”與“20150201”的學生,學期維度上選擇“初二第一學期”,模塊選擇全部,可分析得出,相較于成績較差的學生(學號為20150201),成績較優(yōu)秀的學生(學號為20150142)在“測評”、“課程”、“課外中心”、“上傳”以及“作業(yè)”模塊的行為總頻次均相對較高。
學校通常將最終成績作為一個學生的考核標準,但是成績不能代表一切,查找學生獲得對應(yīng)成績的背后原因更為重要。
通過以上比較分析可以發(fā)現(xiàn),相較于成績較優(yōu)秀的學生,成績較差的學生在初二第一學期參加課外活動不太積極,在各個學習模塊行為頻次也較低,能很大程度上反映成績不佳的原因。因此,教師可根據(jù)每個學生的具體情況,提供相應(yīng)的學習策略,使優(yōu)秀的學生更加優(yōu)秀,同時使相對較差的學生成績得到改善,真正做到有科學依據(jù)地因材施教。
4 結(jié)語
由于不同學生個體有不同的學習方式、學習習慣、知識基礎(chǔ)以及興趣愛好,通過OLAP技術(shù),在線分析某個學生在不同時間、不同模塊發(fā)生不同行為的頻次分布情況,并且結(jié)合學生的作業(yè)成績、課程成績、課外活動記錄,可以推測學生的學習側(cè)重點、興趣點以及偏科現(xiàn)象,從而使教師及時作出調(diào)整,提供更合理的學習策略,真正做到有科學依據(jù)地因材施教。同時,學習平臺可以根據(jù)推測結(jié)果,推薦個性化的學習內(nèi)容與學習路線,以提高學生學習效率。
通過綜合分析,教師可以對比某班級連續(xù)兩學期的整體活躍度與最終成績分布情況,發(fā)現(xiàn)其中的不足之處,從而適當調(diào)整教學策略,提高班級整體成績。同時,教育機構(gòu)可以根據(jù)學生訪問平臺不同模塊的頻率及學習軌跡,對平臺作進一步優(yōu)化,以提高平臺使用率,進而間接提高學生學習效率。
本研究充分利用學生各種學習行為產(chǎn)生的數(shù)據(jù),挖掘并分析其中有價值的隱含信息,以推進個性化學習的發(fā)展。然而,由于數(shù)據(jù)源有限,未能將學生各方面信息收集齊全(如就業(yè)信息、學籍信息、圖書借閱信息等),若能全面收集學生及教師的相關(guān)數(shù)據(jù)源,并對其進行充分利用,進而構(gòu)建數(shù)據(jù)倉庫,則會挖掘分析出更有價值的信息,作出更科學的教育決策。另外,本研究創(chuàng)建的數(shù)據(jù)倉庫為集中式,而非分布式,若構(gòu)建分布式數(shù)據(jù)倉庫,還可將不同地理范圍的學生進行對比分析,如可以對比了解同一學校的不同分校之間,在教學背景、教師資源、生源情況相當?shù)那闆r下,學生學習的整體情況。
參考文獻:
[1] 范靈俊,洪學海,黃晁,等.政府大數(shù)據(jù)治理的挑戰(zhàn)及對策[J].大數(shù)據(jù),2016,2(3):27-38.
[2] 陳凱.基于GPS的工程機械設(shè)備智能管理系統(tǒng)研究[D].廈門:廈門大學,2016.
[3] 王建輝,李濤.基于Hive的支付SDK日志分析系統(tǒng)的設(shè)計研究[J].計算機應(yīng)用與軟件,2017(7):51-54.
[4] 龍新征,李麗,彭一明,等.基于數(shù)據(jù)倉庫的高校數(shù)據(jù)統(tǒng)計服務(wù)平臺研究[J].通信學報,2013,34(S2):163-169.
[5] 郭載勛.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在高校招生決策中的應(yīng)用研究[D].北京:北京工業(yè)大學,2014.
[6] 呂欣.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘在圖書館決策管理中的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2017(6):89.
[7] 張端鴻,劉波,卞月妍.院校數(shù)據(jù)倉庫架構(gòu)與建設(shè)的過程研究[J].高校教育管理,2017,11(2):26-33.
[8] 方園,高潤生,徐國徽.數(shù)字化校園環(huán)境下的一卡通系統(tǒng)[J].華中師范大學學報:自然科學版,2017(S1):156-160.
[9] 魏順平.學習分析數(shù)據(jù)模型及數(shù)據(jù)處理方法研究[J].中國電化教育,2016(2):8-16.
[10] 邢曉蕭,師海寧.xAPI記錄系統(tǒng)在分析網(wǎng)絡(luò)學習行為中的應(yīng)用[J].計算機教育,2017(5):133-135.
[11] 胡建平.xAPI與基于Moodle的在線學習經(jīng)歷數(shù)據(jù)獲取[J].現(xiàn)代教育技術(shù),2016,26(11):121-126.
[12] 李雄飛,杜欽生,吳昊.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:機械工業(yè)出版社,2013.
[13] 沈偉.基于數(shù)據(jù)挖掘技術(shù)的高職院校招生決策倉庫設(shè)計與實現(xiàn)[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2015(3):165-167.
[14] 鄧炳光,張林霞,張治中,等.基于數(shù)據(jù)倉庫的旅游服務(wù)平臺的設(shè)計與實現(xiàn)[J].電視技術(shù),2015,39(20):26-30.
[15] 崔穎賀.家?;咏逃脚_中數(shù)據(jù)倉庫的研究與應(yīng)用[D].長春:東北師范大學,2011.
(責任編輯:黃 ?。?/p>