【摘 要】本文基于大數(shù)據(jù)的特征、價(jià)值和應(yīng)用從教學(xué)、科研和管理的角度闡明了大數(shù)據(jù)給普通高等學(xué)校發(fā)展帶來(lái)的機(jī)遇和挑戰(zhàn)。
【關(guān)鍵詞】大數(shù)據(jù);高等教育;機(jī)遇和挑戰(zhàn)
0.引言
數(shù)據(jù)是指一切保存在電腦中的信息,包括文本、聲音、視頻等。“大數(shù)據(jù)”是一股新的技術(shù)浪潮,也是逐步形成的歷史現(xiàn)象,其具體是指隨著信息存貯量的增多,人類(lèi)在實(shí)踐中逐漸認(rèn)識(shí)到,通過(guò)數(shù)據(jù)的開(kāi)放、整合和分析,能發(fā)現(xiàn)新的知識(shí)、創(chuàng)造新的價(jià)值,從而為社會(huì)帶來(lái)“大科技”、“大利潤(rùn)”、“大智能”和“大發(fā)展”等新的機(jī)遇。大數(shù)據(jù)之“大”,并不在于其表面的“大容量”,而在于其潛在的“大價(jià)值”。大數(shù)據(jù)之所以被稱(chēng)為革命性現(xiàn)象的根本原因,因?yàn)閺谋举|(zhì)上來(lái)說(shuō),它標(biāo)志著我們?nèi)祟?lèi)社會(huì)在從信息時(shí)代經(jīng)由知識(shí)時(shí)代快速向智能時(shí)代邁進(jìn),并給普通高等學(xué)校發(fā)展帶來(lái)的新機(jī)遇和挑戰(zhàn)[1]。
1.大數(shù)據(jù)給普通高等學(xué)校發(fā)展帶來(lái)的機(jī)遇和挑戰(zhàn)
大數(shù)據(jù),使教師面臨挑戰(zhàn),使學(xué)科專(zhuān)業(yè)設(shè)置和專(zhuān)業(yè)知識(shí)結(jié)構(gòu)面臨挑戰(zhàn);大數(shù)據(jù)為大學(xué)管理的精細(xì)化個(gè)性化服務(wù)提供了工具;大數(shù)據(jù)給科研帶來(lái)顛覆性的影響。
1.1教師面臨的挑戰(zhàn)
智能學(xué)習(xí)平臺(tái)只是大數(shù)據(jù)大潮在教育領(lǐng)域掀起的一朵浪花。如著名的在線教育公司Coursera,已經(jīng)和普林斯頓、伯克利、杜克、香港理工等全世界30多所大學(xué)達(dá)成協(xié)議,通過(guò)其平臺(tái)免費(fèi)開(kāi)放課程。如今這些學(xué)校的課程可以實(shí)現(xiàn)全球幾十萬(wàn)人同步學(xué)習(xí)。分布在世界各地的學(xué)習(xí)者不僅可以在同一時(shí)間聽(tīng)取同一位老師的授課,還和在校生一樣,做同樣的作業(yè)、接受同樣的評(píng)分和考試[2]。
這種學(xué)習(xí)平臺(tái)的崛起,在美國(guó)引起了廣泛的關(guān)注和激烈的討論。其中的原因,是因?yàn)樵撈脚_(tái)已經(jīng)不是一個(gè)鏡頭、一段視頻那么簡(jiǎn)單,而能對(duì)學(xué)習(xí)者的學(xué)習(xí)行為自動(dòng)進(jìn)行提示、誘導(dǎo)和評(píng)價(jià),從而彌補(bǔ)沒(méi)有老師面對(duì)面交流指導(dǎo)的不足。例如,通過(guò)記錄鼠標(biāo)的點(diǎn)擊,計(jì)算機(jī)能夠記錄你在一張幻燈片上停留的時(shí)間,判別你在答錯(cuò)一道題之后有沒(méi)有回頭復(fù)習(xí),發(fā)現(xiàn)不同的人對(duì)不同知識(shí)點(diǎn)的不同反應(yīng),從而總結(jié)出哪些知識(shí)點(diǎn)需要重復(fù)或強(qiáng)調(diào),哪種陳述方式或?qū)W習(xí)工具在哪種情況下最有效等規(guī)律。
不難發(fā)現(xiàn),該平臺(tái)之所以強(qiáng)大,正是因?yàn)榇髷?shù)據(jù)。單個(gè)個(gè)體學(xué)習(xí)行為的數(shù)據(jù)似乎是雜亂無(wú)章的,但當(dāng)數(shù)據(jù)累積到一定程度時(shí),群體的行為就會(huì)在數(shù)據(jù)上呈現(xiàn)一種秩序和規(guī)律。通過(guò)收集、分析大量的數(shù)據(jù),就能總結(jié)出這種秩序和規(guī)律,然后有的放矢,對(duì)不同的學(xué)習(xí)者提供有針對(duì)性的幫助。
這種智能學(xué)習(xí)平臺(tái)將會(huì)給教育行業(yè)帶來(lái)怎樣的影響。學(xué)校曾經(jīng)是最重要的教育資源,好的學(xué)校更是異常稀缺,由于這種智能平臺(tái)的普及,在不遠(yuǎn)的將來(lái),名校將人人可上,也就是說(shuō),如果應(yīng)對(duì)得當(dāng),中國(guó)教育資源匱乏的問(wèn)題將很快得到有效緩解。對(duì)個(gè)人來(lái)說(shuō),隨時(shí)隨地地學(xué)習(xí)、終身學(xué)習(xí)都將成為可能,例如,高中生可以嘗試大學(xué)的課程,離開(kāi)了校園的人,也可以登錄在線平臺(tái)再和在校生一起聽(tīng)課。這些都是教育工作者探討多年、孜孜以求的夢(mèng)想。但硬幣的另一面,是中國(guó)的教育行業(yè)要面對(duì)更加激烈的全球化競(jìng)爭(zhēng)和挑戰(zhàn)。過(guò)去,是學(xué)生爭(zhēng)學(xué)校;將來(lái),可能是學(xué)校在全球范圍中爭(zhēng)奪學(xué)生。發(fā)達(dá)國(guó)家的一流大學(xué)會(huì)擠壓發(fā)展中國(guó)家普通大學(xué)的生存和發(fā)展空間,普通大學(xué)該如何來(lái)吸引生源?它們會(huì)不會(huì)因此衰落?既然最好的教學(xué)視頻等學(xué)習(xí)資源都可以免費(fèi)獲得,教師的角色又需不需要調(diào)整?又該如何調(diào)整?這些問(wèn)題,都是大數(shù)據(jù)時(shí)代催生的重大挑戰(zhàn)。
1.2學(xué)科專(zhuān)業(yè)設(shè)置和專(zhuān)業(yè)知識(shí)結(jié)構(gòu)面臨的挑戰(zhàn)
網(wǎng)絡(luò)大數(shù)據(jù)在科學(xué)和技術(shù)上的突破,將可能誕生出數(shù)據(jù)服務(wù)、數(shù)據(jù)材料、數(shù)據(jù)制藥等戰(zhàn)略性新興產(chǎn)業(yè)[3].網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)的突破意味著人們能夠理清數(shù)據(jù)交互連接產(chǎn)生的復(fù)雜性,掌握數(shù)據(jù)冗余與缺失雙重特征引起的不確定性,駕馭數(shù)據(jù)的高速增長(zhǎng)與交叉互連引起的涌現(xiàn)性(Emergence),進(jìn)而能夠根據(jù)實(shí)際需求從網(wǎng)絡(luò)數(shù)據(jù)中挖掘出其所蘊(yùn)含的信息、知識(shí)甚至是智慧,最終達(dá)到充分利用網(wǎng)絡(luò)數(shù)據(jù)價(jià)值的目的.涌現(xiàn)性是指由低層次的多個(gè)元素構(gòu)成高層次的系統(tǒng)時(shí)展示出的每個(gè)單一元素所不具備的性質(zhì).網(wǎng)絡(luò)數(shù)據(jù)不再是產(chǎn)業(yè)環(huán)節(jié)上產(chǎn)生的副產(chǎn)品,相反地,網(wǎng)絡(luò)數(shù)據(jù)已成為聯(lián)系各個(gè)環(huán)節(jié)的關(guān)鍵紐帶.通過(guò)對(duì)網(wǎng)絡(luò)數(shù)據(jù)紐帶的分析與掌握,可以降低行業(yè)成本、促進(jìn)行業(yè)效率、提升行業(yè)生產(chǎn)力.因此,可以預(yù)見(jiàn),在網(wǎng)絡(luò)數(shù)據(jù)的驅(qū)動(dòng)下,行業(yè)模式的革新將可能催生出數(shù)據(jù)材料、數(shù)據(jù)制造、數(shù)據(jù)能源、數(shù)據(jù)制藥等一系列戰(zhàn)略性的新興產(chǎn)業(yè),使高等教育學(xué)科專(zhuān)業(yè)設(shè)置和專(zhuān)業(yè)知識(shí)結(jié)構(gòu)面臨挑戰(zhàn)。
1.3大數(shù)據(jù)為大學(xué)管理的精細(xì)化個(gè)性化服務(wù)提供了工具
教育是在生活中實(shí)現(xiàn)的,不在生活中實(shí)現(xiàn)的教育不是真正的教育,學(xué)校教育更需要“終極關(guān)懷”。華東師范大學(xué)一位女生節(jié)食減肥,很少在校內(nèi)用餐,學(xué)校通過(guò)困難生預(yù)警系統(tǒng)察覺(jué)到其飯卡消費(fèi)值較低,便發(fā)送了一條短信,詢(xún)問(wèn)是否有經(jīng)濟(jì)困難,是否需要幫助。這位女生收到短信,感到非常溫暖,便發(fā)了一條“華師大少女減肥減出人文關(guān)懷”微博,結(jié)果被網(wǎng)友紛紛轉(zhuǎn)發(fā)。網(wǎng)友們稱(chēng)贊學(xué)?!巴ㄟ^(guò)對(duì)數(shù)據(jù)的挖掘、應(yīng)用,更貼心地服務(wù)學(xué)生、關(guān)愛(ài)學(xué)生”,“讓冰冷的數(shù)字有了人性美!”這一事件至少告訴人們,大數(shù)據(jù)為大學(xué)管理的精細(xì)化服務(wù)提供了工具,有助于學(xué)校實(shí)現(xiàn)“終極關(guān)懷”[4]。
1.4大數(shù)據(jù)給科研帶來(lái)顛覆性的影響
科技創(chuàng)新實(shí)質(zhì)上是科學(xué)研究方法的創(chuàng)新,數(shù)據(jù)科學(xué)帶給大家改變探索世界的新方法——從大量的數(shù)據(jù)中,揭示世界運(yùn)行的規(guī)律。新方法體現(xiàn)在大數(shù)據(jù)的三個(gè)特征中。
大數(shù)據(jù)在舍恩伯格看來(lái),一共具有三個(gè)特征:全樣而非抽樣,效率而非精確,相關(guān)而非因果。
第一個(gè)特征非常好理解。在過(guò)去,由于缺乏獲取全體樣本的手段,人們發(fā)明了“隨機(jī)調(diào)研數(shù)據(jù)”的方法。理論上,抽取樣本越隨機(jī),就越能代表整體樣本。但問(wèn)題是獲取一個(gè)隨機(jī)樣本代價(jià)極高,而且很費(fèi)時(shí)。人口調(diào)查就是典型一例,一個(gè)稍大一點(diǎn)的國(guó)家甚至做不到每年都發(fā)布一次人口調(diào)查,因?yàn)殡S機(jī)調(diào)研實(shí)在是太耗時(shí)耗力了。
但有了云計(jì)算和數(shù)據(jù)庫(kù)以后,獲取足夠大的樣本數(shù)據(jù)乃至全體數(shù)據(jù),就變得非常容易了。谷歌可以提供谷歌流感趨勢(shì)的原因就在于它幾乎覆蓋了7成以上的北美搜索市場(chǎng),而在這些數(shù)據(jù)中,已經(jīng)完全沒(méi)有必要去抽樣調(diào)查這些數(shù)據(jù):數(shù)據(jù)倉(cāng)庫(kù),所有的記錄都在那里躺著等待人們的挖掘和分析。
第二點(diǎn)其實(shí)建立在第一點(diǎn)的基礎(chǔ)上。過(guò)去使用抽樣的方法,就需要在具體運(yùn)算上非常精確,因?yàn)樗^“差之毫厘便失之千里”。設(shè)想一下,在一個(gè)總樣本為1億人口隨機(jī)抽取1000人,如果在1000人上的運(yùn)算出現(xiàn)錯(cuò)誤的話,那么放大到1億中會(huì)有多大的偏差。但全樣本時(shí),有多少偏差就是多少偏差而不會(huì)被放大。諾維格,谷歌人工智能專(zhuān)家,在他的論文中寫(xiě)道:大數(shù)據(jù)基礎(chǔ)上的簡(jiǎn)單算法比小數(shù)據(jù)基礎(chǔ)上的復(fù)雜算法更加有效。
數(shù)據(jù)分析并非目的就是數(shù)據(jù)分析,而是有其它用途,故而時(shí)效性也非常重要。精確的計(jì)算是以時(shí)間消耗為代價(jià)的,但在小數(shù)據(jù)時(shí)代,追求精確是為了避免放大的偏差而不得已為之。但在樣本=總體的大數(shù)據(jù)時(shí)代,“快速獲得一個(gè)大概的輪廓和發(fā)展脈絡(luò),就要比嚴(yán)格的精確性要重要得多”。
第三個(gè)特征則非常有趣。相關(guān)性表明變量A和變量B有關(guān),或者說(shuō)A變量的變化和B變量的變化之間存在一定的正比(或反比)關(guān)系。但相關(guān)性并不一定是因果關(guān)系(A未必是B的因)。
亞馬遜的推薦算法非常有名,它能夠根據(jù)消費(fèi)記錄來(lái)告訴用戶(hù)你可能會(huì)喜歡什么,這些消費(fèi)記錄有可能是別人的,也有可能是該用戶(hù)歷史上的。但它不能說(shuō)出你為什么會(huì)喜歡的原因。難道大家都喜歡購(gòu)買(mǎi)A和B,就一定等于你買(mǎi)了A之后的果就是買(mǎi)B嗎?未必,但的確需要承認(rèn),相關(guān)性很高或者說(shuō),概率很大。
舍恩伯格認(rèn)為,大數(shù)據(jù)時(shí)代只需要知道是什么,而無(wú)需知道為什么,就像亞馬遜推薦算法一樣,知道喜歡A的人很可能喜歡B但卻不知道其中的原因。
越來(lái)越多的事物不斷的數(shù)字化。使得人們可以從大量的數(shù)據(jù)中,發(fā)現(xiàn)隱藏的自然規(guī)律、社會(huì)規(guī)律和經(jīng)濟(jì)規(guī)律。從這個(gè)角度來(lái)看,大數(shù)據(jù)將拓展人類(lèi)的視野。
大數(shù)據(jù)給科學(xué)和教育事業(yè)的發(fā)展提供了前所未有的機(jī)會(huì),同時(shí)也提出了前所未有的挑戰(zhàn)。它將對(duì)現(xiàn)有的科研和教學(xué)體制帶來(lái)大幅度的變革,對(duì)科學(xué)與產(chǎn)業(yè)之間的關(guān)系、科學(xué)與社會(huì)之間的關(guān)系帶來(lái)大幅度的變革。
事實(shí)上,數(shù)據(jù)科學(xué)還帶給大家觀察世界的新方法——從大量的數(shù)據(jù)中,揭示世界運(yùn)行的規(guī)律。2008 年《連線》雜志主編克里斯?安德森就指出“數(shù)據(jù)爆炸使所有的科學(xué)研究方法都落伍了”,用一系列的因果關(guān)系來(lái)驗(yàn)證各種假設(shè)和猜想的研究范式已經(jīng)不實(shí)用了,如今它已經(jīng)被無(wú)需理論指導(dǎo)的純粹的相關(guān)關(guān)系研究所取代。安德森指出:“現(xiàn)在已經(jīng)是一個(gè)有海量數(shù)據(jù)的時(shí)代,應(yīng)用數(shù)據(jù)已經(jīng)取代了其他的所有學(xué)科工具。而且只要數(shù)據(jù)足夠多,就能說(shuō)明問(wèn)題。如果你有一拍字節(jié)的數(shù)據(jù),只要掌握了這些數(shù)據(jù)之間的相關(guān)關(guān)系,一切就都迎刃而解。
人們?cè)谘芯孔匀徽Z(yǔ)言處理方面走過(guò)的彎路,為安德森的觀點(diǎn)提供了有利的證據(jù)。20 世紀(jì)50 年代,幾乎所有的科學(xué)家都認(rèn)為如果讓計(jì)算機(jī)來(lái)充當(dāng)翻譯,就必須像人一樣,讓他理解詞句的含義。于是提出人工智能的概念,讓計(jì)算機(jī)來(lái)學(xué)習(xí)的人類(lèi)的各種規(guī)則。這種方法很快在70 年代走到了盡頭。但是基于大量數(shù)據(jù)、運(yùn)用概率模型的統(tǒng)計(jì)語(yǔ)言學(xué)的出現(xiàn)使得自然語(yǔ)言處理柳暗花明。如果沒(méi)有這些概率統(tǒng)計(jì)模型,風(fēng)靡一時(shí)的Siri(個(gè)人語(yǔ)音處理)等應(yīng)用,就不可能實(shí)現(xiàn)。
2.結(jié)語(yǔ)
大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),對(duì)大數(shù)據(jù)進(jìn)行合理的分析,管理和應(yīng)用必將會(huì)推動(dòng)普通高等學(xué)校的大發(fā)展,當(dāng)然也會(huì)為社會(huì)提供更多的利益和創(chuàng)新性成果。
【參考文獻(xiàn)】
[1]趙國(guó)棟,易歡歡,糜萬(wàn)軍,鄂維南.大數(shù)據(jù)時(shí)代的歷史機(jī)遇—產(chǎn)業(yè)變革與數(shù)據(jù)科學(xué)[M].北京:清華大學(xué)出版社,2013.
[2]舍恩伯格.大數(shù)據(jù)時(shí)代[M].浙江人民出版社,2013.
[3]王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013,36(6):1125-1138.
[4]慶年.跑在大數(shù)據(jù)時(shí)代的前列[J].復(fù)旦教育論壇,2013,11(4):1-1.