丁建英+張鈺涵
摘 要 大數(shù)據(jù)是繼云計算和物聯(lián)網(wǎng)之后IT領(lǐng)域的又一次顛覆性技術(shù)創(chuàng)新,大數(shù)據(jù)時代的到來為陷入瓶頸的信息化校園數(shù)據(jù)利用提供了新的出路。探討智慧校園建設(shè)現(xiàn)狀,基于大數(shù)據(jù)技術(shù)特點,提出基于大數(shù)據(jù)的智慧校園支撐平臺,分析、挖掘隱藏在校園信息化大數(shù)據(jù)中的教學(xué)結(jié)果和教學(xué)規(guī)律,對未來進(jìn)行預(yù)測,以便于教師、學(xué)生和教育決策者及時掌握個性化教學(xué)狀態(tài),改進(jìn)教育策略,最終真正實現(xiàn)智慧校園。
關(guān)鍵詞 大數(shù)據(jù);智慧校園;智慧校園支撐平臺
中圖分類號:G642 文獻(xiàn)標(biāo)識碼:B
文章編號:1671-489X(2017)22-0038-03
Construction of Wisdom Campus Support Platform based Big Data//DING Jianying, ZHANG Yuhan
Abstract Big data is another disruptive technological innovation in IT after cloud computing and the Internet of things. The arrival of Big Data Era provides a new way for the information campus data utilization which is in the bottleneck stage. This article discusses the status quo of the wisdom campus, proposes wisdom campus support platform based on the Big data, so as to analyze and excavate the tea-
ching results and rules which is hidded in the campus big data. Then teachers, students and educational decision makers can master the individual teaching state, improve the education strategy timely, and ultimately realize the real wisdom campus.
Key words big data; wisdom campus; wisdom campus support platform
1 前言
2012年,《紐約時報》首次提出“大數(shù)據(jù)”一詞?!按髷?shù)據(jù)”用于命名和描述信息化時代爆發(fā)的海量數(shù)據(jù)以及隨之出現(xiàn)的技術(shù)革新和發(fā)展[1],它是繼云計算和物聯(lián)網(wǎng)之后,互聯(lián)網(wǎng)領(lǐng)域又一次顛覆性的技術(shù)創(chuàng)新,給各行各業(yè)的發(fā)展帶來了極大的機(jī)遇[2]。作為新技術(shù)應(yīng)用前沿陣地之一的高校,大數(shù)據(jù)的概念已經(jīng)延伸至校園信息化建設(shè)中,來重塑校園業(yè)務(wù)流程、IT基礎(chǔ)設(shè)施以及對于教育信息、教學(xué)資源的獲取和使用方式。面對大數(shù)據(jù)時代的到來,如何構(gòu)建基于大數(shù)據(jù)的高校智慧校園服務(wù)平臺,從根本上促進(jìn)校園活動的深度融合,是當(dāng)前高校信息化建設(shè)的主題。
2 智慧校園建設(shè)現(xiàn)狀
智慧校園是數(shù)字化校園的進(jìn)一步發(fā)展和延續(xù),它是應(yīng)用各種新興的IT技術(shù),如物聯(lián)網(wǎng)、智能感知、云計算、移動互聯(lián)和大數(shù)據(jù)等,在完全感知校園環(huán)境,智能識別教師、學(xué)生的個別特征和校園教學(xué)、生活等場景的基礎(chǔ)上,有效整合學(xué)校的課堂教學(xué)、科學(xué)研究、運行管理等方面的資源與應(yīng)用,為教師和學(xué)生建立智能、開放的教育教學(xué)環(huán)境,改變其知識傳遞、資源共享和交互協(xié)作的方式,將學(xué)校物理空間和數(shù)字空間有機(jī)銜接起來,實現(xiàn)以人為本的個性化創(chuàng)新服務(wù)。
智慧校園結(jié)構(gòu)如圖1所示。首先是利用物聯(lián)網(wǎng)絡(luò)和移動互聯(lián)網(wǎng)絡(luò)連接校園網(wǎng)中的各種基礎(chǔ)傳感設(shè)備,創(chuàng)建一個一體化的智能感知環(huán)境,實時采集教學(xué)設(shè)備的運行狀態(tài),教師與學(xué)生的教學(xué)、活動動態(tài),以及生活環(huán)境狀態(tài)信息等,以積累校園教育教學(xué)、科學(xué)研究、運行管理等各個方面的海量大數(shù)據(jù)。在此基礎(chǔ)上,智慧校園還必須要建立一個基礎(chǔ)服務(wù)支撐平臺,使用先進(jìn)的技術(shù)(如大數(shù)據(jù)處理技術(shù)、數(shù)據(jù)挖掘技術(shù)等)深入分析挖掘校園大數(shù)據(jù)中有價值的信息,將其轉(zhuǎn)化為上層應(yīng)用服務(wù)的優(yōu)化依據(jù),為所有上層應(yīng)用提供存儲、計算、共享等服務(wù),從而為教師和學(xué)生提供基于角色的個性化教學(xué)引導(dǎo)服務(wù);同時引導(dǎo)教育信息化工作者從煩瑣的業(yè)務(wù)中抽身出來,推動業(yè)務(wù)服務(wù)向基于大數(shù)據(jù)分析的個性化服務(wù)模式發(fā)展[3],從而真正實現(xiàn)智慧校園的智慧化。
當(dāng)前大部分高校已經(jīng)完成智慧校園的基礎(chǔ)設(shè)施建設(shè),也開展了數(shù)據(jù)中心建設(shè),考慮了數(shù)據(jù)的積累和管理,但還沒有深入對這些海量教學(xué)數(shù)據(jù)進(jìn)行分析、挖掘和充分利用。以山西師范大學(xué)為例,據(jù)不完全統(tǒng)計,截至2016年底,學(xué)校核心業(yè)務(wù)系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)總量累計近1300 GB;在非結(jié)構(gòu)化數(shù)據(jù)方面也積累了大量的課件、視頻材料等,然而目前這些海量的基礎(chǔ)數(shù)據(jù)并未得到深入分析和利用。因此,對智慧校園運行過程中積累的海量大數(shù)據(jù)展開深入分析、挖掘,獲取其中蘊(yùn)藏的知識和價值,為學(xué)校的教育決策者、教師和學(xué)生提供個性化數(shù)據(jù)服務(wù)的迫切性正逐步呈現(xiàn)出來。
3 大數(shù)據(jù)概念及特點
“大數(shù)據(jù)”這個概念最初是在全球知名咨詢公司麥肯錫(McKinsey & Company)于2011年5月發(fā)布的報告《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿領(lǐng)域》中提出的。該報告指出:“數(shù)據(jù)已經(jīng)滲透到各行各業(yè)的職能領(lǐng)域,并且逐步構(gòu)成了行業(yè)發(fā)展的重要生產(chǎn)因素;因而人們對于海量數(shù)據(jù)的高效利用必會帶來新一波生產(chǎn)率增長和消費者盈余浪潮的到來?!盵4]大數(shù)據(jù)現(xiàn)在還沒有統(tǒng)一的界定,著云臺暨《中國云》團(tuán)隊將大數(shù)據(jù)定義為:企業(yè)在運行過程中產(chǎn)生的海量結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù),而這些海量數(shù)據(jù)采用關(guān)系型數(shù)據(jù)庫分析,將消耗大量的時間以及金錢。信息專家涂子沛認(rèn)為:大數(shù)據(jù)并不單單是指容量大,其更深層次意義在于通過對海量異構(gòu)類型數(shù)據(jù)的整合、統(tǒng)計以及分析,挖掘出其中蘊(yùn)藏的知識和價值。IDC將大數(shù)據(jù)定義為:為了更加快速經(jīng)濟(jì)地從海量的、異構(gòu)類型的數(shù)據(jù)中挖掘出潛藏價值而設(shè)計的新型架構(gòu)體系以及相關(guān)技術(shù)。endprint
總結(jié)起來,各種表達(dá)的共同之處就是:大數(shù)據(jù)不是傳統(tǒng)意義上的海量數(shù)據(jù),而是一種數(shù)據(jù)量很大、數(shù)據(jù)形式多種多樣的非結(jié)構(gòu)化數(shù)據(jù),它具有信息容量龐大、信息種類多樣化、處理速度快、價值密度低的特點。
1)數(shù)據(jù)量龐大,指采集、存儲和分析的數(shù)據(jù)量非常大,在實際應(yīng)用中,很多企業(yè)用戶把多個數(shù)據(jù)集放在一起,從TB級別躍升到PB級別、EB級別或者ZB級別。
2)數(shù)據(jù)種類多。大數(shù)據(jù)的種類和來源是多樣化的,既包含結(jié)構(gòu)化的數(shù)據(jù),也包含半結(jié)構(gòu)化以及非結(jié)構(gòu)化等形式的數(shù)據(jù),如文字、圖片、文檔、視音頻、網(wǎng)絡(luò)日志、位置、環(huán)境信息等。2012年由互聯(lián)網(wǎng)數(shù)據(jù)中心(DCCI)舉辦的“Adworld2012互動營銷世界”指出:2010年,全球數(shù)據(jù)量已經(jīng)達(dá)到1.2 ZB,然而在如此龐大的數(shù)據(jù)中,結(jié)構(gòu)化數(shù)據(jù)大約只占10%,其余的大部分?jǐn)?shù)據(jù)則是由視音頻、各類文檔、位置、環(huán)境等組成的大量半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)[5]。
3)處理速度快。和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)不同,大數(shù)據(jù)需要對海量數(shù)據(jù)采取近實時的分析和挖掘。因此,大數(shù)據(jù)強(qiáng)調(diào)利用強(qiáng)大的機(jī)器算法和專用技術(shù)如數(shù)據(jù)挖掘、數(shù)據(jù)倉庫和OLAP(聯(lián)機(jī)分析處理)對海量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行科學(xué)、快速分析和挖掘。如2011年,日本發(fā)生大地震之后僅僅九分鐘,美國國家海洋和大氣管理局(National Oceanic and
Atmospheric Administration)就通過分析海洋傳感器的實時大數(shù)據(jù),挖掘出了海嘯影響模型,公布了詳細(xì)的海嘯預(yù)警[6]。
4)價值密度低。大數(shù)據(jù)的信息容量極為龐大,然而其中有利用價值的信息少之又少,如時長60分鐘的視頻中,有利用價值的數(shù)據(jù)可能僅僅十幾秒。
4 基于大數(shù)據(jù)的智慧校園支撐平臺研究
智慧校園的關(guān)鍵特色在于利用校園內(nèi)的各種智能感知設(shè)備、物聯(lián)網(wǎng)以及移動互聯(lián)網(wǎng)絡(luò)等技術(shù),獲取海量的教學(xué)互動和狀態(tài)大數(shù)據(jù),并基于這些海量大數(shù)據(jù)的分析挖掘而掌握教與學(xué)的相關(guān)特征和規(guī)律,從而展開智慧的個性化教學(xué)應(yīng)用[7]。這其中的關(guān)鍵就在于對海量數(shù)據(jù)的分析與挖掘,使得高校師生通過數(shù)據(jù)不僅知道發(fā)生了什么,而且掌握數(shù)據(jù)背后隱藏的個性化指導(dǎo)信息,以便于他們在教學(xué)與學(xué)習(xí)過程中及時做出相應(yīng)的調(diào)整決策,主動積極地開展個性化的教與學(xué)。
面對這些問題,大數(shù)據(jù)時代提出利用Hadoop技術(shù)包括分布式存儲HDFS、分布式計算Map Reduce和數(shù)據(jù)實時反應(yīng)技術(shù)等,對海量的數(shù)據(jù)進(jìn)行科學(xué)化管理和分析。這個方法通過構(gòu)建一個基于大數(shù)據(jù)的智慧校園支撐平臺,利用HDFS分布式文件系統(tǒng)為海量非結(jié)構(gòu)化數(shù)據(jù)提供并行分布存儲,確保負(fù)載均衡的同時保證數(shù)據(jù)的可靠性和安全性,并通過Map Reduce并行計算多個任務(wù),提高大數(shù)據(jù)分析的速度和效率,快速、準(zhǔn)確地為上層應(yīng)用提供智慧服務(wù)?;诖髷?shù)據(jù)的智慧校園支撐平臺如圖2所示。
智能感知層 智能感知層首先利用各種傳感技術(shù)和傳感設(shè)備來收集校園活動的原始數(shù)據(jù),包括教學(xué)設(shè)備儀器的工作狀態(tài)、教師和學(xué)生的教學(xué)、生活和狀態(tài)數(shù)據(jù)等,為智慧校園支撐平臺提供海量、多樣化的校園基礎(chǔ)大數(shù)據(jù)。
大數(shù)據(jù)處理層 大數(shù)據(jù)處理層包括數(shù)據(jù)采集、數(shù)據(jù)分析和數(shù)據(jù)挖掘三個部分。
首先,數(shù)據(jù)采集是對智能感知層的海量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)過濾、數(shù)據(jù)篩選以及數(shù)據(jù)存儲等操作。其中,數(shù)據(jù)過濾主要是對海量的大數(shù)據(jù)展開約束性檢查,實施去冗余化等操作,初步保證數(shù)據(jù)的真實性以及可用性;數(shù)據(jù)篩選是對海量數(shù)據(jù)進(jìn)行多次反復(fù)過濾,從而獲取到低信息粒度的連續(xù)性數(shù)據(jù);數(shù)據(jù)存儲則是利用Hadoop中的HDFS技術(shù)對經(jīng)過篩選的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行安全存儲。
其次,數(shù)據(jù)分析是利用Hbase、ZooKeeper等數(shù)據(jù)處理和管理工具動態(tài)生成Map Reduce任務(wù),對經(jīng)過篩選的非結(jié)構(gòu)化數(shù)據(jù)(如教室信息云、教師信息云、學(xué)生信息資源云、教學(xué)信息云等)進(jìn)行計算和聚合高效處理。并利用Hadoop的ETL處理輸出基本模型分析匯總信息,以推斷出各種數(shù)據(jù)之間的細(xì)微差異與關(guān)系,從而獲得有利于優(yōu)化教與學(xué)效果的洞見點。如通過分析教學(xué)信息云中學(xué)生的課堂學(xué)習(xí)行為、與他人協(xié)作行為、解決問題行為、提交作業(yè)行為等學(xué)習(xí)行為,獲取每一個學(xué)生的性格特征、學(xué)習(xí)能力、交互協(xié)作能力、資源利用能力以及學(xué)習(xí)方式傾向等個性化信息,以便于教師和學(xué)生根據(jù)分析結(jié)果做出適當(dāng)教學(xué)調(diào)整。
最后,對數(shù)據(jù)進(jìn)行分析之后,大數(shù)據(jù)處理層還要利用回歸算法、分類算法、聚合算法等數(shù)據(jù)挖掘算法對數(shù)據(jù)進(jìn)行深層次挖掘,以提取隱藏在數(shù)據(jù)背后的有價值的信息,對未來的教與學(xué)提供相關(guān)優(yōu)化策略。如通過挖掘?qū)W生的各類資源點擊率和觀看率,可以直接預(yù)測出學(xué)生更傾向于哪種資源。
智慧應(yīng)用層 智慧應(yīng)用層是在大數(shù)據(jù)處理的基礎(chǔ)上,獲取學(xué)生學(xué)習(xí)能力、性格特征、作息規(guī)律等個性化信息,評估目前教師的教學(xué)效果以及學(xué)生的學(xué)習(xí)效果,然后對這些個性化的處理數(shù)據(jù)加以應(yīng)用,如信息檢索、數(shù)據(jù)可視化應(yīng)用、教學(xué)評估與預(yù)測等,從而便于學(xué)校各業(yè)務(wù)部門、教師和學(xué)生及時改進(jìn)。如課程教學(xué)之后,及時對學(xué)生的學(xué)習(xí)數(shù)據(jù)進(jìn)行分析和挖掘,在此基礎(chǔ)上對該課程的后期課時設(shè)置、教學(xué)環(huán)境設(shè)置等提出針對性建議。
5 結(jié)語
隨著高校教育信息化的迅猛發(fā)展,各種業(yè)務(wù)產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)必將會以成倍的速度快速增長,如何科學(xué)有效地分析、挖掘大數(shù)據(jù)中的隱藏價值,使數(shù)據(jù)真正為高校的教學(xué)、科研、管理等發(fā)揮指導(dǎo)和預(yù)測作用,逐漸成為高校信息化部門的關(guān)注焦點。基于大數(shù)據(jù)的智慧校園支撐平臺能夠?qū)@些海量的數(shù)據(jù)展開收集、過濾、深入分析和挖掘等一系列完全操作,從而為高校教育決策者、教師和學(xué)生提供教與學(xué)的相關(guān)特征和規(guī)律,以便其開展智慧的個性化教學(xué)應(yīng)用。
參考文獻(xiàn)
[1]成果.大數(shù)據(jù)背景下智慧校園云資源利用研究[J].信息化建設(shè),2016(1):185.
[2]劉中宇,劉海良.基于大數(shù)據(jù)的云教學(xué)環(huán)境設(shè)計[J].中國教育信息化,2013(24):18-21.
[3]宓詠,趙澤宇.大數(shù)據(jù)創(chuàng)新智慧校園服務(wù)[J].中國教育信息化,2013(24):3-7.
[4]Manyika J, Chui M, Brown B. Big data: The next frontier for innovation competition and productivity[R].USA: McKinsey Global Institute,2011.
[5]Adworid2012互動營銷世界夏暨2012微鋒匯啟動[J].電腦與電信,2012(5):14-15.
[6]佘叢國,朱志軍.大數(shù)據(jù)與云計算的關(guān)系及其對通信行業(yè)的影響[M]//中國通信學(xué)會通信管理委員會學(xué)術(shù)研討會暨寬帶中國戰(zhàn)略與創(chuàng)新學(xué)術(shù)研討會.2012.
[7]蔣東興,付小龍,袁芳,等.大數(shù)據(jù)背景下的高校智慧校園建設(shè)探討[J].華東師范大學(xué)學(xué)報:自然科學(xué)版,2015(S1):119-125.endprint