劉潤清
(北京外國語大學,北京,100081)
現(xiàn)在討論一下在大數(shù)據(jù)時代,外語教育科研會發(fā)生怎樣的變化?;谇懊嫒?jié)的討論,我們有理由相信,在今后二三十年里,外語教育(可能主要是英語教育)會發(fā)生根本性變化。由于教學模式、學習模式的變化,教師認知和學生認知都會發(fā)生變化,我們科研的方向和重點(題目、領域、所跨學科)也會有根本性的改變。由于計算機技術的高度發(fā)達和大數(shù)據(jù)時代的到來,科研方法和統(tǒng)計方法也會有根本性的改變。本節(jié)將討論網(wǎng)上外語教育的變化趨勢和實現(xiàn)網(wǎng)絡教育后,外語科研中可能發(fā)生的重大改革。
教師不再是知識的唯一占有者和提供者,而變?yōu)檎n堂的組織者和學習的引導者。英語描寫這一變化更有趣:教師從God變成Guide,從Sage on the stage變成Guide on the side,從teacher變成helper、councilor、facilitator等。組織者和引導者并不好當:教師要對學習內(nèi)容十分熟悉,并知道網(wǎng)上有何種公開課視頻可以提供;同時最好能了解學習者的特征(性格、認知方式、學習方法、學習目的、特殊經(jīng)歷等),能比較準確地告訴他在特定階段選擇什么樣的視頻,只有這樣,才能實現(xiàn)教學的個性化。當然,引導者必須熟悉學習內(nèi)容,否則引導就是空話。換句話說,教師備課量不會減少,只是課堂呈現(xiàn)量減少了;而準備須回答的問題時,思維范圍會加寬,內(nèi)容也會多種多樣、千差萬別。此外,教師對教育技術的掌握也就成為理所當然的了。
少部分教師會成為公開課視頻的演講者或?qū)а?。提供公開課的教師,其教學理念要徹底轉(zhuǎn)變:他要知道網(wǎng)絡公開課不是課堂搬家;他要面對幾萬、十幾萬世界各地的水平不同、興趣不同、學習方法不同的選修學生;內(nèi)容之精準、繁簡之恰當、表達之清晰,以及吸引學生之牢固而持久等,都是對他極大的挑戰(zhàn)。例如,視頻要模塊化——每個主題只占3~5分鐘,方便學生利用零碎時間觀看;重要知識點處須嵌入交互式問題,方便學生及時檢查學習效果;涉及背景資料時要嵌入超鏈接,方便學生先鏈接到網(wǎng)上查看資源,然后立刻返回原處。將來以課程為載體的視頻會不斷地被生產(chǎn)、積累、淘汰和沉淀。可以肯定地說,通過互聯(lián)網(wǎng)上的編輯與合作,在不久的將來,世界上每個領域、每門課程、各個層次的視頻,都會出現(xiàn)一些經(jīng)典之作,保留下來。它們將取代教師的課堂授課,成為最受學生歡迎的學習材料。隨著在線平臺的推廣和普及,會有越來越多的教師把自己的授課視頻放到網(wǎng)上。美國有個Udemy網(wǎng)站,教師可以根據(jù)自己發(fā)放視頻的點擊率獲得報酬。除了課程視頻,教案也可以放到網(wǎng)絡進行交易。喬治亞州一位學前班老師的教案成交量已達79萬美元,月均收入6萬美元。教案的交易還出現(xiàn)了由學校牽頭組織團購,統(tǒng)一發(fā)給全校老師參考使用的形式。
還有的教師瞄準“引導者”角色,推出了提供專門輔導的家庭網(wǎng)站。學習者可以按自己的專業(yè)從網(wǎng)站公布的專家中選擇自己喜歡的課程輔導者,通過網(wǎng)上視頻輔導,10分鐘的視頻交流后輔導服務開始按分鐘計費。學習者和輔導者可以用很低的成本和很少的時間,實現(xiàn)有效對接,構(gòu)建一對一的學習環(huán)境。涂子沛(2014)①稱之為“微學?!?。由于計算機和網(wǎng)絡無處不在,“微學?!笨捎秒S時隨地地搭建。
多年來,我們總聽說高排放、高污染、高能耗的重工業(yè)正經(jīng)歷著“結(jié)構(gòu)性調(diào)整”。現(xiàn)在,輪到教育經(jīng)歷“結(jié)構(gòu)性調(diào)整”了。這一調(diào)整不僅更換結(jié)構(gòu),更重要的是革新理念和生產(chǎn)方式。不過,看來教師們不用擔心會丟掉飯碗,只是要調(diào)整教學理念,適應新的教學模式,提前做好準備,說不定我們能在新的環(huán)境下大顯身手。
學習者成了真正的中心:他自己決定學什么、何時學、如何學、在哪學、學多少、學多快。學習者的主動性要充分發(fā)揮出來:首先他不能是計算機盲,而是要嫻熟掌握網(wǎng)絡技術。第二,他要主動了解有關課程的一切信息,包括他自己的責任、教師的責任、管理員的責任等,以便決定自己選修的專業(yè)和課程。第三,他必須在網(wǎng)絡通知的限制之內(nèi),完成課程作業(yè),按要求修夠?qū)W分等。第四,他有大把的時間和絕對的主動權(quán),個人的決心和努力決定了自己的未來。這要求學生有高度自覺性、自律能力、毅力、自我管理能力等;放任自流、自由散漫、不能自律的學生會遇到困難。也會有極個別意志薄弱或嬌生慣養(yǎng)的學生,被網(wǎng)絡上的八卦信息所吸引,迷戀于不三不四的游戲、大片、賭博等,成為大數(shù)據(jù)時代的犧牲品。
師生角色的變化比表面看去上要深刻得多。從前的學徒制和私塾制里,講究“師徒如父子”,是很不平等的關系,知識的傳授是一對少,老師是絕對權(quán)威;后來的學校制,開始了師生關系,解除了不平等的“父子”關系,打破了師生的小比例關系;但一對多的教授方式和工廠生產(chǎn)線式的批量生產(chǎn),無法給學生提供個性化、持續(xù)性的指導和評價,而且,教師仍然把持知識的權(quán)威地位。用一個模子刻制零件的批量生產(chǎn)式也扼殺了學生的個性和創(chuàng)造性。大數(shù)據(jù)時代不同了:教師從“父親”、“權(quán)威者”變?yōu)橹笇д?、幫助者、協(xié)商者——師生間的關系平等多了。學生成了中心,是被服務的對象,無限擴大了自我發(fā)展的空間,不再被放入同一個模子里壓榨成統(tǒng)一型號的產(chǎn)品。
可能紙質(zhì)教材和參考書會減少(但不會徹底消失),音頻、視頻資料會大大增加;電視使用會減少,MP3、MP4、筆記本和iphone等會更加普遍。2013年的全國國民閱讀調(diào)查結(jié)果顯示,傳統(tǒng)紙質(zhì)媒介中,2013年成年國民對圖書、報紙和期刊的接觸時長均有不同程度的減少;新興媒介中,上網(wǎng)時長和手機閱讀的接觸時長呈增長趨勢。中國新聞研究院院長魏玉山表示,超九成的數(shù)字化閱讀方式接觸者表示閱讀電子書后就不再購買其紙質(zhì)版,這一數(shù)據(jù)連續(xù)四年持續(xù)上升,反映出數(shù)字出版對傳統(tǒng)出版物的沖擊作用不斷加強。學習材料的可及性極度增長:數(shù)字化材料應有盡有,有文字的、聲音的和視頻的,包括百科全書、詞典、虛擬場景、虛擬地圖、虛擬世界。因為媒介的徹底轉(zhuǎn)變,將來教材編寫的原則也會發(fā)生變化。比如,原來繁瑣的文字闡述和描寫可能被模擬視頻所代替。只依靠視覺輸入的文字材料會減少,要求手、眼、耳、口并用的材料會大大增加。技能層次類的課程大多具備可拷貝性,可以交給大投入的電影制作模式完成。文化性和學術性的教材制作起來挑戰(zhàn)性大些,可能要經(jīng)過幾年的試驗階段。最重要的學習材料是公開課視頻。每節(jié)時長為2個小時的課程視頻,一般會被分解為若干個時長為8~15分鐘的知識模塊(modules)。這是為了讓學生自己駕馭課程學習,學生自己在與學習材料的互動當中選擇屬于自己的路線和速度。只有按教師要求完成一個模塊,才能進入下一個模塊的學習。每個知識模塊里包括的課程活動有:8~15分鐘的講座視頻、嵌入式小測驗、課后的測驗和考試、同伴評價題目、編寫程序作業(yè)、調(diào)查題目、課程討論區(qū)、谷歌視頻群聊,等等。當然,還有上傳給學生的額外的背景材料。認知心理學告訴我們,回溯檢索性學習(the retrieval task)可以提升學生的學習質(zhì)量。MOOCs(massive open online courses)(可譯為“幕課”=屏幕上的課程)課堂教學由于在講座中成功地嵌入了測試問題(embed quiz questions),使得學習者投入的熱情大大增加。但必須提到的一點是,在MOOCs中,這些測驗的結(jié)果并不計入學生修課成績,否則學生會變得焦慮,對課程及學習內(nèi)容產(chǎn)生畏難情緒,甚至本來很想學習這門課程的都因此而棄選。
大學校園的界限會變得模糊甚至被打破;學生在教室里學習的時間減少,而隨時隨地地學習會成為普遍現(xiàn)象;師生之間面對面的交流不多,而在網(wǎng)上視頻互動的機會大大增加。來自不同國家的學生會在網(wǎng)上相遇、互動,成為學習伙伴——求學過程的國際化程度會發(fā)展到不可想象的地步。那時會有多個大網(wǎng)站,提供各個學科的各種資料,相當于多個大圖書館。輸入關鍵詞,想查閱的資料就會呈現(xiàn)于屏幕。只要學生能有上網(wǎng)的機會,就能克服地域限制,就能實現(xiàn)教育的相對公平,受教育機會相對均等。網(wǎng)絡公開課程有著極富生氣的討論區(qū),選擇同一門課程的數(shù)以萬計的同學,以他們特有的方式互幫互助。有些授課教師會通過網(wǎng)絡社交平臺積極參與到同學們的討論中去,有的教師則會邀請助教對同學們的討論和問題進行反饋和必要的提醒。前面提到,會有“微學校”或稱“家庭輔導網(wǎng)站”出現(xiàn),學生可用選擇自己看中的輔導老師就某一門課程進行輔導,那絕對是一對一、個性化的交流,按時間付費即可。以社交媒體為特征的Web2.0技術已經(jīng)把人際交流互動推向登峰造極的應用?,F(xiàn)有的信息技術可以通過網(wǎng)絡視頻和智能軟件,為每個學習者搭建一個學習情境,像活生生的人一樣對學習者的學習行為提供持續(xù)性的誘導、評價和支持——例如,發(fā)出提示和建議,指出錯誤,教授學習方法,幫助養(yǎng)成良好的學習習慣等等。部分Coursera的學員已經(jīng)在使用Google Hangouts on Air Weekly video,Twitter feed Facebook page進行在線聊天,制作在線教室,分享學習體驗,交換意見和看法等。部分近距離的學員甚至會通過線上約定方便的時間、地點見面,討論學習情況。還有,MOOCs作為一種基于科學學習理論和經(jīng)過精心設計的教學模式,首次把學習的本質(zhì)、學習過程、學習動機、學習策略等學習科學的基本規(guī)律運用到教學當中,大大提升了學習體驗和學習質(zhì)量。放眼看去,幾十年后,大學校園的圍墻將不復存在;課程、教案、輔導、討論統(tǒng)統(tǒng)被搬到網(wǎng)上;教師都在網(wǎng)上“上班”。這對去教育行政化和官僚化大概會起到不小的作用。以后的網(wǎng)絡管理和網(wǎng)絡政務不知道可以精簡多少百萬公務員。
首先,筆紙測試(pen and paper test)會逐漸減少,代之以機測、網(wǎng)上測試;機測的優(yōu)點之一就是它能自動調(diào)整項目的難易度(參見項目反應論item response theory);好處之二是它不僅記錄下考生的答案,同時記錄下答卷的過程——改動幾次才“碰”對答案,并把過程錯誤加權(quán)后計入分值。第三,隨著機器智能的提高,外語考試不再大量依靠多項選擇題,機器可以對口語表達和作文進行評分。多年來難以對主觀試題評分的棘手問題會逐漸解決,并不斷完善。以后的面試,考生不用再跋山涉水,“帷幄私宅,即可決勝千里之外”。口試還可以錄像,評分時參考視頻效果;甚至對視頻進行多模態(tài)分析(Multimodal Analysis)。一旦機器可以評閱主觀試卷,“人情分”、“成見分”就會隨之消失??荚囎鞅滓矔沤^——機器上的身份認證、可視鏡頭、網(wǎng)上監(jiān)控等會比安保人員更“六親不認”。一旦發(fā)現(xiàn)作弊的機器,立刻屏蔽,三年之內(nèi)不能登錄(比方說);槍手躺著也得中槍。順便說一句,那時不用幾萬人、幾十萬人同時考試;每個人都可隨時考試,立刻知道成績。網(wǎng)測的試卷也不同于目前的紙筆試卷。一定是聽說讀寫譯綜合考試,語言地道自然,真實場景再現(xiàn),圖文聲并茂,讓學生有身臨其境之感。再往后,機器會讓考生“進入”虛擬場景,與里面的人物對話、解決問題、完成任務等,那才叫考查語言運用。
不難想象,在上述教學背景下的科研一定與現(xiàn)在大不相同。目前可以想到的大概包括以下幾點:
(1)大數(shù)據(jù)對哲學觀點的沖擊。近些年來,經(jīng)驗主義受到不少批評,因為人類對事物的感知極為有限,靠人工收集數(shù)據(jù)幾十年充其量還只能算“樣本”(sample)。自從數(shù)據(jù)庫的出現(xiàn),人們開始對經(jīng)驗主義產(chǎn)生新的認識:瞬間獲取海量數(shù)據(jù),從量變跳到質(zhì)變(見本章第一節(jié)),讓研究者突然觀察到從來不敢想象的發(fā)現(xiàn)。維克托·邁爾-舍恩伯格和肯尼思·庫克耶在《大數(shù)據(jù)時代》(Mayer-Schonberger &Cukier 2013)②中談到三大變化:第一,現(xiàn)在的科研能分析更多的數(shù)據(jù),有時甚至是關于某個現(xiàn)象的全部數(shù)據(jù),因此不再依賴隨機采樣。他們提出,我們的目標是“樣本=總體”(這一“野心勃勃”的目標只有在大數(shù)據(jù)時代才有可能)。第二,我們擁有的數(shù)據(jù)如此之多,所以不再熱衷于追求精確度;當然,也不是放棄精確,只是不再迷戀于它;適當忽略微觀層面會讓我們在宏觀層面有更好的洞察力。第三,有了以上兩個變化,我們不再熱衷于尋找因果關系,而更注重相關關系。這三條會徹底改變我們在科研問題上的本體論、認識論和方法論。從前,因為我們能夠收集的數(shù)據(jù)少,所以只能依賴隨機抽樣。因為是隨機抽樣,所以講究精準。因為觀察范圍小,只能人工設計實驗求因果關系。但是,抽樣再精確,推理出的總體統(tǒng)計也有偏差;實驗設計再好,也是人工控制了某個變量,總有幾分不自然。邁爾-舍恩伯格和庫克耶在書中說:“大數(shù)據(jù)對個人的影響是最驚人的。在一個可能性和相關性占主導地位的世界里,專業(yè)性變得不那么重要了。行業(yè)專家不會消失,但是他們必須與數(shù)據(jù)表達的信息進行博弈。如同在電影《點球成金》(Moneyball)③里,棒球星探們在統(tǒng)計學家面前相形見絀——直覺的判斷被迫讓位于精準度數(shù)據(jù)分析。這將迫使人們調(diào)整在管理、決策、人力資源和教育方面的傳統(tǒng)理念”。下面就根據(jù)邁爾-舍恩伯格他們的論斷,引申出幾個重要問題加以討論。
(2)隨機抽樣要不要堅持?很長時間內(nèi),隨機抽樣是條捷徑,它使得數(shù)字時代前的大量數(shù)據(jù)分析成為可能。但是,就像把一張數(shù)碼照片或一首數(shù)碼歌曲截成多個小文件似的,在抽樣分析時,許多信息就丟失了——我們無法欣賞一首歌曲的抽樣。中國有句流行的話是“解剖麻雀”,意思是研究一只麻雀就能知道所有的麻雀是什么樣子。這話可能只說對了90%,肯定有些信息沒有涉及到。就以跟麻雀差不多大的椋鳥為例,它們是生性喜歡群飛的鳥,以其群飛隊形的變幻莫測而聞名,并成為攝影家的愛好。請看下面幾張椋鳥群飛圖。據(jù)說,它們飛行時靠得很近,但從來不會相撞,這一技能的功用是迷惑捕食者(如隼鷹)。沙丁魚的群游和蝙蝠的群飛也有這種特性。這一群飛能力單靠解剖一只椋鳥是發(fā)現(xiàn)不了的。這個例子說明了抽樣研究的局限性。
邁爾-舍恩伯格還舉過一個恰當?shù)睦?。具有革新性的Lytro照相機把大數(shù)據(jù)運用到了基本的攝影中,與傳統(tǒng)相機只能記錄一束光不同,它能記錄整個光場里所有的光,達到1100萬束光。具體生成什么照片則可在拍攝后根據(jù)需要而定。這就等于收集了全部數(shù)據(jù),“樣本=總體”。因此,這些照片就更具有“可循環(huán)利用性”。普通照相機就像隨機抽樣,拍攝前必須決定聚焦點。所以,隨機抽樣雖然優(yōu)點突出,但是它是沒有辦法的辦法。
從前我們沒有能力調(diào)查研究10億人,所以只好隨機抽樣200人。現(xiàn)在的大數(shù)據(jù)常常包括幾百億、甚至幾千億的被研究者——網(wǎng)民有多少,被試就有多少。在我們有能力全面利用大數(shù)據(jù)開展外語科研之前,只能堅持隨機抽樣,但在不久的將來,隨著大數(shù)據(jù)的普及,我們會在某個題目上或某個小領域中,達到或接近“樣本=總體”的境界。越到后來,此類現(xiàn)象會越多,直到某一天我們積累了各種各樣的大數(shù)據(jù),隨機抽樣不再唱主角,只在個別題目上偶爾/仍然使用。如今,我們掌握的數(shù)據(jù)庫越來越全面,它不再只包括一點點可憐的數(shù)據(jù),而是包括與研究問題相關的大量甚至是全部數(shù)據(jù)。我們不再需要擔心某一小部分數(shù)據(jù)對整套分析產(chǎn)生不利影響。我們要接受這些紛繁、雜亂的數(shù)據(jù)并從中受益,而不是以高昂的代價去消除那點不確定性。邁爾-舍恩伯格(2013)說:“要想獲得大規(guī)模數(shù)據(jù)帶來的好處,混亂應該是一種標準途徑,而不是應該竭力避免的”。他還說,世界上只存在一個唯一真理的想法已經(jīng)過時了;再去追求它是對注意力的分散。傳統(tǒng)數(shù)據(jù)庫的設計要求在不同的時間提供一致的結(jié)果。但是,隨著數(shù)據(jù)量的大幅增加以及系統(tǒng)用戶的增加,此類一致性將難以保持。以后的大數(shù)據(jù)庫不再固定在某個地方,而是分散在多個硬盤和多臺電腦上。為了確保其運行的穩(wěn)定性和速度,一個記錄可能分開存儲在兩三個地方。當服務器上每秒鐘都接受成千上萬條搜索指令時,同步更新記錄就不太現(xiàn)實了。因此,承認多樣性是解決問題的辦法。我們也許要學會容忍模糊性和不確定性——只要能對事物有個清楚的、完整的概念,其中摻雜點模糊也可以接受。
(3)如何處理因果關系和相關關系?我們喜歡求真,這是好的。但是,相關關系比較容易發(fā)現(xiàn),因果關系很難判定。前面講過,這個世界充滿相關關系,而且是想象不到的相關關系:我們能預測許多事情,但無法解釋其背后的原因。例如,醫(yī)生依靠大數(shù)據(jù)取得了病理分析,制定出治療方案,但卻無法說明其病學干預的合理性。我預料,將來在外語學習上也會發(fā)現(xiàn)此類現(xiàn)象:比如說,凡是讀過英語《哈利·波特》的學生都能通過“雅思”,但解釋不出為什么。相關不是因果,但相關本身就很重要。邁爾-舍恩伯格說:“大數(shù)據(jù)標志著人類在尋求量化和認識世界的道路上前進了一大步。過去不可計量、存儲、分析和共享的很多東西都被數(shù)據(jù)化了。擁有大量的數(shù)據(jù)和更多不那么精確的數(shù)據(jù)為我們理解世界打開了一扇新的大門。社會因此放棄了尋找因果關系的傳統(tǒng)偏好,開始挖掘相關關系的好處”。反過來講,如果多次、大面積地發(fā)現(xiàn)A與B密切相關,也許就有理由相信它們之間存在一點因果關系或間接的、邏輯不通的、理性不接受的因果關系,暫且稱之為“尿布和啤酒式的因果關系”(參見本章第一節(jié))。況且,相關關系分析本身意義重大,它也為探討因果關系奠定基礎。如果存在因果關系,我們可以進一步找出背后的原因。我們還可以從相互聯(lián)系中找出某些重要變量,將它們用到驗證因果關系的實驗中去。
已有許多例證說明相關關系重于因果關系。世界上最火的網(wǎng)上書店亞馬遜最初雇傭了一批書評專家寫書評(等于推薦),以期增加銷售量。結(jié)果發(fā)現(xiàn)書評的作用微乎其微,于是便開始使用一種協(xié)同過濾技術(靠書的內(nèi)容聯(lián)系)推薦圖書。最后由于通過數(shù)據(jù)推薦產(chǎn)品所增加的銷售量遠遠超過書評專家的貢獻,亞馬遜于是解散了書評小組。谷歌也能預測流感:在某個特定的地理位置,越多的人通過谷歌搜索跟流感相關的詞條,就表明該地區(qū)有越多的人患上了流感。還有沃爾瑪通過分析無數(shù)個年輕女客戶的購物趨勢,便可預知哪些女孩成準媽媽了,于是提前給她們寄去孕婦必需品說明書。這些例子都說明,“知道是什么就夠了,沒必要知道為什么?!边@等于說,知道相關關系就夠了,沒必要知道因果關系。在大數(shù)據(jù)背景下,相關關系大放異彩,它讓我們能夠更容易、更快捷、更清楚地分析事物。
(4)實驗設計還要不要堅持?近期,我們在外語教育中還收集不到很多大數(shù)據(jù),所以,人工設計的實驗還要持續(xù)一段時間。但是,由于有了網(wǎng)上教育,我們的實驗在規(guī)模上和控制手段上都會發(fā)生變化。例如,隨機抽樣可在網(wǎng)上進行;實驗組和控制組的分配可讓機器完成;前測、后測、改卷和評分一律網(wǎng)上完成;實驗不用總是面對面,可以在線進行;實驗教學過程也可以用錄像記錄下來;問卷的回答和提交都在網(wǎng)上完成等。傳媒手段的變化也會引起內(nèi)容的變化。例如,問卷不再是純紙質(zhì)的,而是有錄音、錄像、虛擬情景的。我預料,當我們能夠全面收集外語教育大數(shù)據(jù)時,也許再設計大型實驗的意義就不那么重要了。那時我們能觀察和分析的場景、因素、學生、教材、教育技術等等,已是數(shù)量巨大、種類繁多、層次分明、角度多維,比不夠自然的實驗揭示的東西不知要多幾百、幾千倍。我們現(xiàn)在還想象不出到底那時能開展什么研究以及如何研究。當然,話說回來,作為輔助驗證手段,小型實驗、勘查、觀察、民族志研究等本書前面提到的方法永遠不會全部消失;它們是新手研究者的入門教材,是剛接觸、了解、體會科研時的蹣跚步履,也是大數(shù)據(jù)分析后的三角核查工具。
(5)統(tǒng)計學可能發(fā)生的變化:統(tǒng)計學、會計學、經(jīng)濟學、管理學、矩陣計算、矢量計算、概率論、正態(tài)分布等知識和原理不會發(fā)生重大變化,因為它們揭示出世界的某些自然規(guī)律。但是,為應對大數(shù)據(jù),計算技術和范式會向前跨出一大步?,F(xiàn)在云計算、云存儲、眾包和外包模式等嶄露頭角,方興未艾,以后會開發(fā)出更多、更完美的計算方式。目前在用的諸如SPSS之類的計算軟件還會使用相當長一段時間,直到需要修改來應對新型數(shù)據(jù)。換句話說,在今后的20年里,我們應該進一步學習統(tǒng)計學原理和方法,盡可能多地掌握計算方法,比如,如何對音頻、視頻、各種圖像等進行計算;同時開始了解大數(shù)據(jù)的有關情況,為科研做好長足準備。邁爾-舍恩伯格他們在書中(2013)略顯狂妄地說:“行業(yè)專家和技術專家的光芒都會因為統(tǒng)計學專家和數(shù)據(jù)專家的出現(xiàn)而變暗,因為后者不受舊觀念的影響,能夠聆聽數(shù)據(jù)發(fā)出的聲音”。“大數(shù)據(jù)的先鋒們通常并不是來自他們做出極大貢獻的領域。他們是數(shù)據(jù)分析家、人工智能專家、數(shù)學家或統(tǒng)計學家,但他們把自己掌握的技能運用到了各個領域。”此話意味著,我們不但不會放棄統(tǒng)計學,還要加強對它的學習和研究,還要開始學習數(shù)據(jù)分析,而且是大數(shù)據(jù)分析。
(6)如何取得大數(shù)據(jù)?有關外語教育和學習的大數(shù)據(jù)從何而來?這是我們現(xiàn)在就應該考慮的問題。我們現(xiàn)在就應該意識到收集外語教育大數(shù)據(jù)的必要性和迫切性。一旦開始網(wǎng)絡教學、網(wǎng)上輔導、網(wǎng)上考試、網(wǎng)上報名、網(wǎng)上繳費、網(wǎng)上取得畢業(yè)證書等等,就要有意識地對有關信息開展物聯(lián)網(wǎng)、云儲存、云端分析、云端分享等,為開展各式各樣的科研提供條件。英語教師必須承擔開辟收集、挖掘、發(fā)現(xiàn)外語教育大數(shù)據(jù)的責任。近期我們也許還建立不了自己的引擎,但可以借助百度、谷歌等引擎或者其他出路。重要的是,我們首先應該閱讀關于大數(shù)據(jù)的文獻,深刻了解大數(shù)據(jù)時代的特點及其可能性。我們尤其要發(fā)揮最大想象力,記住“數(shù)據(jù),從最不可能的地方提取出來”之名言,苦思冥想,挖掘再挖掘。舉個例子。日本先進工業(yè)技術研究所的越水重臣教授研究了一個人的座姿。很少人會認為坐姿能提供什么有用信息。但它真能提供不少寶貴信息。當一個人坐著的時候,他的身形、姿勢和重量分布都可以量化和數(shù)據(jù)化。該教授和他的工程師團隊通過在汽車座椅下部安裝總共360個壓力傳感器以測量人對椅子施加壓力的方式。把人體屁股特征轉(zhuǎn)化成數(shù)據(jù),并用從0~256這個數(shù)值范圍對其進行量化,就會產(chǎn)生獨屬于每個乘坐者的精確數(shù)據(jù)資料。這個系統(tǒng)能根據(jù)人體對座位的壓力差異識別出乘坐者的身份,準確率高達98%。這項技術可以作為防盜系統(tǒng)安裝在汽車上。有了它,汽車能夠識別駕駛員是不是車主;如果不是,系統(tǒng)就會要求司機輸入密碼;如果輸入的密碼不正確,汽車就會自動熄火。把一個人的坐姿轉(zhuǎn)化為數(shù)據(jù)后,就能孕育出切實可行的服務和一個前途光明的產(chǎn)業(yè)。我們也可以分析事故發(fā)生前的人體姿勢變化,找出坐姿與安全的關系。該系統(tǒng)還可以在司機疲勞駕駛時發(fā)出警報或自動剎車。另外,如果汽車被盜,還可利用坐姿數(shù)據(jù)識別盜賊身份。細想起來,這位教授的想象力實在驚人。我們恰恰需要這種鉆研精神。
總有一天,我們會發(fā)現(xiàn),被英語學習者搜索得最多的英語詞是哪些,有何特征,用于何種目的,反應出搜索者有何種傾向,英語學習成績?nèi)绾蔚鹊?。擁有大?shù)據(jù)之后,我們可以分析什么視頻被觀看得最多,什么教材的借閱率最高,中國英語學習者寫作中最常犯的錯誤是什么,每個學習階段的詞匯量是多大,等等。從大數(shù)據(jù)的細節(jié)里,我們可以分析出學習者的性格、學習風格、認知傾向、學習策略、動機類型等,也可以分析出教師的教學理念、認知方式、習慣性教學行為、與學生的互動傾向、反饋時的風格、知識面的寬窄、教師的魅力、學生的評價等。將來,我們肯定會去分析為什么某些視頻最受歡迎,為什么某些“微課”最討學生喜歡,為何某人的教案被大量售出,等等。總之,任何教授和學習行為都在網(wǎng)上留下“指紋”,我們的信息會被第二次、第三次加以利用,而且不同的利用必將創(chuàng)造出不同的價值。
附注
① 根據(jù)復旦大學計算機研究所所長施伯樂的觀點,涂子沛的“《大數(shù)據(jù)》這本書揭示了數(shù)據(jù)在未來社會中的革命性作用。大數(shù)據(jù)將是下一個社會發(fā)展階段的‘石油’和‘金礦’。無論是個人,企業(yè)還是國家,誰能更好地抓住數(shù)據(jù)、理解數(shù)據(jù)、分析數(shù)據(jù),誰就能在下一波的社會競爭中脫穎而出。關于數(shù)據(jù)的知識,將成為個人知識結(jié)構(gòu)中的必備要素和基礎”。該書被列入《亞洲周刊》年度十大好書。其主要觀點包括:(1)數(shù)據(jù)競爭:數(shù)據(jù)興則企業(yè)興,數(shù)據(jù)強則企業(yè)強;(2)數(shù)據(jù)治國:足夠多的眼睛,將使所有的錯誤無所遁形;(3)數(shù)據(jù)開放:隱瞞政府實情的力量,就是摧毀這個政府的力量。該書最后一章談到,大數(shù)據(jù)時代教育可能發(fā)生革命性的變化。
② 該書已有漢譯本,譯者盛楊燕、周濤。寬帶資本董事長田溯寧在該書漢譯本序中寫道:這“是我看到的最好的大數(shù)據(jù)著作,不管對于產(chǎn)業(yè)實踐者,還是對于政府和公眾結(jié)構(gòu),都是非常具有價值的”。他還說:“現(xiàn)代歷史上的歷次技術革命,中國均是學習者。而在這次云計算與大數(shù)據(jù)的新變革中,中國與世界的距離最小,在很多領域甚至還有著創(chuàng)新與領先的可能。重要我們以開放的心態(tài)、創(chuàng)新的勇氣擁抱‘大數(shù)據(jù)時代’,就一定會抓住歷史賦予中國創(chuàng)新的機會”(邁爾-舍恩伯格、庫克耶2013:1)。該書翻譯得也好,一是懂行的人翻譯的;再就是譯者時不時在腳注里寫出自己的看法或解釋。譯文排版也費了心思,如把重要觀點專門排成黑體,把例證變換字體排在方塊內(nèi)。本文所引中文均來自該漢譯本,下引此作僅注頁碼。
③ 《點球成金》改編自2003年出版的《魔球——逆境制勝的智慧》,它被《財富》雜志推薦為75本商業(yè)必讀書之一。這本書記錄了美國體育界一個真實的商業(yè)奇跡:“爛隊”奧克蘭運動家隊自從采納了一種基于精算、概率論等的計算程序后,橫空出世,拉扯著一幫“哀兵敗將”型球員,創(chuàng)下103場比賽連勝的紀錄。這是一部財經(jīng)電影:統(tǒng)計學、會計學、經(jīng)濟學、管理學、矩陣計算、矢量計算、精算、概率論……搭建起一個傳說中的完美數(shù)學模型。這是一部勵志電影,充滿豐沛的美式“挑戰(zhàn)”精神:個人挑戰(zhàn)體制,衰人挑戰(zhàn)大牌,被釘死的釘子挑戰(zhàn)命運的板子。
Mayer-Schonberger,V.& K.Cukier.2013.Big Data:A Revolution that Will Transform How We Live,Work and Think [M].New York:Houghton Mifflin Harcourt.
涂子沛.2014.大數(shù)據(jù)[M].桂林:廣西師范大學出版社.
維克托·邁爾-舍恩伯格、肯尼思·庫克耶.2013.大數(shù)據(jù)時代:生活、工作與思維的大變革(盛楊燕、周濤譯)[M].杭州:浙江人民出版社.