桂安然,趙 晉
(1.同濟大學 經(jīng)濟與管理學院,上海201800;2.同濟大學 職業(yè)技術教育學院,上海200092)
隨著5G 時代的到來,許多平臺網(wǎng)站都累積了大量的數(shù)據(jù),在線教育平臺也不例外。但同時,在線教育平臺也面臨著一個問題,即只是“教育數(shù)據(jù)量大”,而不知道如何對收集到的這些數(shù)據(jù)進行處理、利用,從而獲得“教育大數(shù)據(jù)”。在學術界的研究中也存在著同樣的問題,大數(shù)據(jù)浪潮之下學術界對于在線評價的信息挖掘主要集中在電商購物領域,而非在線教育。比如在線課程的評論就是一個很好的例子,之前的學習者在學習過這些課程后,會產(chǎn)生大量和課程相關的評論信息,潛在的學習者通常會花大量的時間來閱讀在線評論,輔助自己制訂課程選擇決策。
然而,在線教育平臺的運營者卻未對在線課程評論的價值產(chǎn)生足夠的重視,未對可能隨意撰寫的評論進行回應或者刪除,這些都嚴重地干擾了后來學習者甄別信息,從而導致在線教育平臺在一定程度上會失去該學習者或者降低學習者的使用黏度。
對于評論信息在在線教育領域的利用主要可以從以下幾個方面實現(xiàn):在線學習者初步選定自己要進行在線課程學習的平臺,比如中國境內(nèi)的“網(wǎng)易云課堂”或海外學習網(wǎng)站“可汗學院”“Coursera”等;學習者在眾多在線課程中初步選擇五六門同質(zhì)化較高的課程;借助網(wǎng)絡爬蟲技術獲取這些在線課程的真實課后評論,所謂真實課后評論,就是人工去除一些與課程明顯無關的灌水評論、明顯能識別出是在線教育提供者以紅包或者減價等方式誘導在線學習者寫下的非真實評論,此后再使用強規(guī)則關聯(lián)算法、情感分析等自然語言處理方法對在線課程評論進行分析;建立綜合評價模型對這五六門同質(zhì)化較高的課程進行一個全面的評價,最終選擇出適合學習者需求的課程。
值得注意的是,整個評論信息挖掘過程都是動態(tài)的,并不僅僅只是適用于某一次在線教育課程的描述或評價。每進行一次在線教育評論的信息挖掘,系統(tǒng)都可以記住本次信息挖掘的結(jié)果,并根據(jù)學習者接受課程選擇之后的真實學習體驗之后的反饋進行信息挖掘的修正,以使信息挖掘的準確度更高、個性化程度更深。
偉大教育家孔子曾言“因材施教”,對在線教育評論的研究有助于實現(xiàn)大數(shù)據(jù)背景下的精準個性化學習路徑挖掘研究。在線教育課程的評論中包含了十分豐富的課程相關信息,比如教授某門英語課程的教師發(fā)音是否標準、某門課程的難度設置是否適合目標學習者等,借助自然語言處理技術都可以對課程進行精準的數(shù)學化描述,再結(jié)合學習者自身對于課程的期待、側(cè)重點為學習者制訂一個獨一無二的學習方案。
同時,國務院所發(fā)布的《促進大數(shù)據(jù)發(fā)展行動綱要》中也明確提出要“探索發(fā)揮大數(shù)據(jù)對變革教育方式、促進教育公平、提升教育質(zhì)量的支撐作用”,在學習者常用的在線學習平臺上都累積了大量的評論數(shù)據(jù),只有將這些評論利用起來,才能真正地發(fā)揮大數(shù)據(jù)對教育方式變革的重要作用,發(fā)揮出大數(shù)據(jù)在教育管理和學習空間的重要作用[1]。
大量關于在線評論的文獻通過實證研究表明,在線商品的評論信息被消費者作為制訂商品購買決策的重要參考,而在線學習資源作為一種特殊的商品也無一例外。如何實現(xiàn)教育公平是教育改革領域長期以來探討的重要話題,20 年以前,讓一個四川省涼山州大山里的學生接受北京小學生所學習的內(nèi)容一般是不可能實現(xiàn)的,而現(xiàn)在通過在網(wǎng)上觀看許多骨干教師分享在MOOC 平臺等上傳的課程,教育公平的實現(xiàn)也有了更多可能。而學習者如何才能從大量的在線課程中甄別出教學質(zhì)量高、課程完整、針對性較強的課程,往往需要借助閱讀其他學習者留下的評論進行判斷。
目前對于在線評論的研究主要集中在手機購買推薦、物流服務影響因素分析等領域[2-3]。針對電商網(wǎng)購平臺的許多售貨者會以發(fā)放紅包,優(yōu)惠價格等方式誘導消費者在購買物品后寫下“非真實好評”的情況,演克武等人[4]以酒店在線預訂平臺作為研究對象,從網(wǎng)站的監(jiān)管是否得力、制定的酒店評價標準是否全面且合理、評論發(fā)表者的個人特性三個方面進行研究,為打擊不良網(wǎng)絡匿名評論、虛假評論提出相應的對策,從而提高線上銷售的可靠性。彭世豪[5]則將對于在線評論的挖掘拓展到了圖書編輯選材領域,主要是利用統(tǒng)計學上常用的K-means 聚類方法來對在線售賣圖書的評論進行挖掘,構(gòu)建出了一個文學類圖書特征自定義詞庫,供編輯參考。王少兵等人[6]在對旅游網(wǎng)站的景點評論進行情感分析時創(chuàng)新性地結(jié)合了領域本體構(gòu)建技術,為游客的出游制定個性化的推薦策略。
這些研究都對本文研究在線課程的評論有著重要啟示作用。以攜程網(wǎng)、螞蜂窩等旅游網(wǎng)站的相關評論為例,首先對于提供的旅游方案而言,它和在線學習課程都屬于非實體商品,所售出的東西不僅與商品本身特性有關,和歷史評價者等因素也有關系;其次教育的本質(zhì)是集體的事情,即使是要為學生提供個性化的學習方案,也應該在共性中找不同,集體學習有利于促進個體的相互學習。而這些旅行出游方案也巧妙地將先前寫下評論的群體智慧融入到了個人的偏好之中。
在線課程的評論所包含的信息可以為后續(xù)學習者的學習提供決策參考,越來越多的科技企業(yè)、人工智能巨頭等也開始逐漸在智慧教育領域發(fā)力,但可以看到目前仍沒有商用的大型系統(tǒng)對在線學習課程的評論進行分析,構(gòu)造出一個基于在線學習課程評論的描述模型,從而幫助在線學習者在有限的學習時間里提高自己的學習效率,倒逼在線教育平臺優(yōu)化服務、提高管理效率。
在線評論一直被視作“網(wǎng)絡口碑”,因為其“一傳十、十傳百”的傳播效率受到了廣泛的關注。一方面,消費者無論是在網(wǎng)絡上購買服務時還是購買產(chǎn)品時,都希望尋找到已經(jīng)獲得此種服務或者產(chǎn)品的用戶的意見和真實購物分享;另一方面,傳統(tǒng)口碑所具備的較大影響力,在網(wǎng)絡空間中也依舊有所體現(xiàn)[7]。周燕等人[8]發(fā)現(xiàn),在線評論的存在形式是決定其有用性的一個非常關鍵的因素。常見的評論形式有文字文本,字數(shù)從幾個字到三十多個字不等;消費者可以通過點亮不同維度的星星顆數(shù)來表明自己對當前產(chǎn)品的態(tài)度,通常星星數(shù)越多代表滿意程度越高。
隨著國家對教育信息化工作的不斷推進,在線教育受到不同領域的關注也越來越多。2013 年是中國在線教育的元年,從業(yè)界逐漸形成共同認知以來,大量的資本注入、技術的涌入、在線教育從業(yè)者的加入、賽道的不斷細分共同推動著在線教育取得巨大發(fā)展。比如2017 年中國融資金額榜首是專注于在線幼兒教育的VIPKID 英語。但是當前的在線教育仍然是較為簡單的模式,更多是將線下課堂所教授的線下課程原封不動地搬運到了網(wǎng)絡之上,這些課程沒有根據(jù)在線教育學習者的需求和在線教育的特點進行精心的設計和內(nèi)容開發(fā),也沒有對學習者的意見給予足夠的重視,對在線課程評論這一重要反饋缺少必要的關注,也就因此缺少了一個根據(jù)學習者的個性化需求推薦課程、提高學習者的學習效率、從而倒逼在線教育不斷提高自己所提供課程的質(zhì)量、壯大企業(yè)的發(fā)展。而學術上,若能將評論信息挖掘的實證研究拓寬到在線教育領域,必定也能推動著評論信息挖掘技術不斷完善,不管是社會價值還是教育意義層面,研究評論信息挖掘在在線教育領域的運用都是勢在必行的。