文/王左利
非結(jié)構(gòu)化數(shù)據(jù)的海量增多,為數(shù)據(jù)的挖掘提供了最好的原料,也給予了充分的挑戰(zhàn)。
目前,高校數(shù)據(jù)庫里的內(nèi)容不僅多,而且結(jié)構(gòu)也發(fā)生了極大改變,大量的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù)。據(jù)統(tǒng)計,全球結(jié)構(gòu)化數(shù)據(jù)增長速度約為32%,而非結(jié)構(gòu)化數(shù)據(jù)增速高達(dá)63%。這個趨勢在高校亦然。對于傳統(tǒng)的結(jié)構(gòu)化的數(shù)據(jù),由于已經(jīng)達(dá)到一定數(shù)量,以關(guān)注其應(yīng)用為主,而對于正在生長的海量非結(jié)構(gòu)化數(shù)據(jù),則要關(guān)注怎么收集、用什么方式有效管理?!皩W(xué)校正在掌握著越來越多活的數(shù)據(jù),這為我們提供了新的方向——尋找某個規(guī)律背后的原因?!毕嚓P(guān)人士說。
業(yè)界人士指出,海量數(shù)據(jù)的分析將對教育信息化產(chǎn)生深刻的影響和沖擊?!案咝R惨P(guān)注大數(shù)據(jù)技術(shù)的研究和應(yīng)用,智謀未來?!?/p>
從沉淀的數(shù)據(jù)中發(fā)現(xiàn)有價值的信息,深入挖掘、綜合利用、轉(zhuǎn)化為知識,才是信息系統(tǒng)真正價值的體現(xiàn),而這方面可拓展的空間幾乎是不可限量的。從管理的角度來看,如何充分利用信息系統(tǒng)中的數(shù)據(jù),是系統(tǒng)實施之后最重要的工作,也是長期的工作。 “要實現(xiàn)很好的數(shù)據(jù)分析,需要有兩個前提條件:一是足夠的數(shù)據(jù)量;二是數(shù)據(jù)必須是可用的、真實的,這就需要數(shù)據(jù)質(zhì)量的保證?!?/p>
但是目前普遍存在的問題是數(shù)據(jù)質(zhì)量不高。許多高校的數(shù)據(jù)分析、利用仍停留在初級水平,數(shù)據(jù)很難被發(fā)掘利用也反映了在系統(tǒng)建設(shè)和使用過程中的數(shù)據(jù)不準(zhǔn)確、不精確、不一致等諸多質(zhì)量問題。
專家表示,要進(jìn)行數(shù)據(jù)分析,首先必須有充足的有質(zhì)量的數(shù)據(jù)。之所以說現(xiàn)在做數(shù)據(jù)挖掘的時機(jī)是成熟的,是因為高校,尤其是一些大型高校擁有大量的教學(xué)、管理、科研等數(shù)據(jù),這為從各個層面進(jìn)行數(shù)據(jù)分析提供了信息基礎(chǔ)。此外,最近幾年移動互聯(lián)網(wǎng)技術(shù)、微博等SNS網(wǎng)站的推出,使學(xué)校擁有了很多可用的、有價值的海量數(shù)據(jù)。這也意味著,要進(jìn)行信息挖掘,必須充分?jǐn)U展應(yīng)用,才有可能掌握更多的數(shù)據(jù)。
總體來看,目前高校對信息數(shù)據(jù)的挖掘主要集中在幾個方面:一、針對網(wǎng)絡(luò)系統(tǒng)運(yùn)行所做的數(shù)據(jù)分析;二、針對教學(xué)教務(wù)管理所做的支持;三、針對特定學(xué)生的分析;四、針對科研所做的數(shù)據(jù)分析支持。
比如,華東師范大學(xué)對校園網(wǎng)站數(shù)據(jù)進(jìn)行分析,從而改善用戶體驗。浙江大學(xué)通過對資產(chǎn)的歸納、整理,最終形成權(quán)威、全面的資產(chǎn)數(shù)據(jù),并基于資產(chǎn)數(shù)據(jù)提供數(shù)據(jù)查詢和分析服務(wù)。這些數(shù)據(jù)分析的成果已經(jīng)被真正地應(yīng)用起來,能夠幫助教務(wù)處更好地利用教室、實驗室等資源。復(fù)旦大學(xué)則對特定的學(xué)生進(jìn)行數(shù)據(jù)分析,并且得到一些非常有價值的數(shù)據(jù)。
對于數(shù)據(jù)分析的前景,大部分專家認(rèn)為:前景非常好,但挑戰(zhàn)很多。數(shù)據(jù)分析存在兩個方面的關(guān)鍵因素。
首先,業(yè)務(wù)和技術(shù)的緊密結(jié)合非常重要。業(yè)務(wù)需求是所有數(shù)據(jù)分析的目的,做數(shù)據(jù)分析要先挖掘出分析什么,擁有了需求,高校才能有針對性地對數(shù)據(jù)進(jìn)行分析,把數(shù)據(jù)深層次的價值挖掘出來,讓它們?yōu)闆Q策服務(wù)。
其次,數(shù)據(jù)分析對于技術(shù)人員的要求很高,要求他們不僅精通技術(shù),也要熟悉校園網(wǎng)業(yè)務(wù)。