姚金良等
【摘 要】
本文設計了一種自動評價網(wǎng)絡教學視頻的指標:流行度和質(zhì)量。與已有的人工評價方法不同,本文的評價方法通過教學視頻中各集的播放量來挖掘?qū)W習者對該教學視頻的評價,通過函數(shù)擬合獲得指數(shù)函數(shù)的兩個參數(shù)a和b,分別對應視頻的評價指標:流行度和質(zhì)量。通過網(wǎng)絡真實數(shù)據(jù)進行相關實驗,結果顯示該自動評價指標和方法與人工評價的結果基本一致。
【關鍵詞】 視頻教學;資源評價;自動評價;視頻教學資源
【中圖分類號】 G434 【文獻標識碼】 B 【文章編號】 1009—458x(2015)07—0072—05
一、引言
隨著計算機多媒體技術以及網(wǎng)絡技術的飛速發(fā)展,網(wǎng)絡視頻教學資源成幾何級增長。由于視頻教學資源所具有的多媒體特性與傳統(tǒng)面授方式的相似性,教學視頻已成為當前最為重要的一種教學資源形式,在網(wǎng)上通過視頻進行學習也已經(jīng)成為自主學習的一種重要方式。當前各類網(wǎng)絡教學平臺層出不窮,各種學習社區(qū)內(nèi),網(wǎng)友也分享了大量的視頻教學資源。這些教學視頻大部分來自各種培訓機構、國內(nèi)外知名大學的公開課課程、教師自己制作的視頻課程。近年來,隨著慕課網(wǎng)站的興起,大量的視頻教程被發(fā)布到慕課網(wǎng)站供人們免費學習。
面對如此多的視頻教學資源,如何進行有效的評價,讓學習者能夠快速地找到最好的視頻教學資源就顯得非常重要。一種簡單的評價方式是在上傳視頻資源時,由編輯按資源的各種屬性分別評價,并給出一個總分值。這種人為進行的評價容易受到編輯主觀性的影響,也不能全面地從學習者的角度來評價視頻內(nèi)容的優(yōu)劣,并且是一項非常耗時的工作。另外,有學者提出了基于問卷調(diào)查的方式,該類方式需要發(fā)放調(diào)查問卷,容易受到問卷形式、發(fā)放對象等一些因素的影響,同時也是一項非常耗時的工作[1]。面對視頻資源的急劇增長,僅僅依靠編輯進行人工評價的方式已經(jīng)無法滿足實際的需要,采用自動評價方式是各個學習社區(qū)和視頻網(wǎng)站展示視頻的必然趨勢。當前,一些視頻教學平臺主要根據(jù)視頻播放量進行評價。由于教學視頻一般有很多集,且不同教程的視頻集數(shù)也不一樣,造成以該課程總體播放量進行評價的方式容易導致偏差。在特定時間內(nèi),學習者可能對某一序列課程特別感興趣,學習者會通過不斷地搜索和預覽視頻內(nèi)容來找到最適合自己的視頻教學資源,這也造成了基于視頻播放量的評價方式存在一定的誤差。
還有一些教學視頻網(wǎng)站采用基于協(xié)作的評價方式,根據(jù)已有學習者的“點贊”數(shù)量來確定該教學視頻的質(zhì)量。這是一種易于操 作和容易實現(xiàn)的評價方式,但是很多的學習者不愿意進行積極的評價。筆者分析了好知網(wǎng)上的數(shù)據(jù),學習者評價數(shù)量與視頻瀏覽量的比在0.01左右[2]。如果視頻的評價數(shù)量比較少,那么評價結果就不具有代表性,也易受到噪聲數(shù)據(jù)的影響。
針對上述問題,已有一些學者進行了探討,并提出了相關方法。屈小牛針對教學資源的評價問題提出了一種自動化評價方法:首先建立資源的特征屬性,在其之上建立評價體系,專家和學習者根據(jù)調(diào)查表確定各個屬性的權重,然后通過程序獲取資源的對應屬性值,最后根據(jù)屬性權重和屬性值獲得資源的總體評價[3]。熊玲提出了基于鏈接分析的web教學資源自動評價方法評價面向教學的網(wǎng)站[4],通過構建網(wǎng)站的外鏈數(shù)量進行評價。
本文認為,教學視頻作為學習者遠程學習的一類重要的資源,在學習者的學習過程中起著舉足輕重的作用,教學視頻質(zhì)量的優(yōu)劣直接影響學習者的學習興趣及學習效率。教學視頻的質(zhì)量可能體現(xiàn)在各個方面,包括課程的難易程度、講授內(nèi)容是否新穎、內(nèi)容是否有趣、理論講解是否透徹易懂和獲取的難易程度等。無論從編輯、專家的角度,還是從學習者的角度,根據(jù)上述幾個方面來評價一個教學視頻是非常困難的。本文提出了一種簡單的評價方式:“用腳投票的方式”。這種方式假定:如果學習者認為該視頻資源質(zhì)量不高或者不適合自己,會自動地轉(zhuǎn)移到其他相關教學視頻上。網(wǎng)上學習不同于課堂教學的一大特點就是網(wǎng)上視頻資源極為豐富,并且學習者從一個教學視頻轉(zhuǎn)向另外一個教學視頻非常方便,只需輸入不同的網(wǎng)址就可以,導致學習者可以非常簡單地根據(jù)自身對教學視頻質(zhì)量的評價來確定是否需要繼續(xù)學習該教學視頻資源。
由于網(wǎng)上自主學習者沒有考試、學分、文憑等壓力,其學習主要基于興趣、職業(yè)發(fā)展、課堂輔助學習等需要。這一特點導致網(wǎng)上學習者輟學率較高。筆者認為,在每個教學視頻中存在一定數(shù)量的放棄繼續(xù)學習的行為是一個正常的現(xiàn)象,這一放棄比例在每個教學視頻上基本是一致的。本文將這些方面的信息都通過學習者是否繼續(xù)學習該視頻課程相關聯(lián),假設:一個高質(zhì)量的教學視頻,應該是能讓學習者不斷地繼續(xù)學習下去,直到完成整個課程的內(nèi)容;而一個低質(zhì)量的教學視頻則會讓學習者放棄繼續(xù)學習。這一假設直觀上與實際相符合,為此,本文設計了一種基于各集視頻播放量的評價指標,該指標包括教學視頻的流行度和質(zhì)量兩個指標。本文提出的自動評價方法通過函數(shù)擬合獲得指數(shù)函數(shù)的兩個參數(shù)a和b,分別對應教學視頻的流行度和質(zhì)量。參數(shù)a反映參與該課程的學習者人數(shù),學習人數(shù)越多,該課程越流行。參數(shù)b反映教學視頻各集播放量的衰減因子,學習的人數(shù)隨著時間的推移減少得快,表示該視頻質(zhì)量較低,反之則質(zhì)量較高。
二、基于視頻的網(wǎng)上學習特點
基于教學視頻進行網(wǎng)上學習具有與傳統(tǒng)的面授學習不一樣的新特性。這些新特性既為學習者提供了更多的學習機會,也給學習者提出了更高的要求。通過新特性能觀察到教學視頻的質(zhì)量,通過各集的播放量來進行評價。新特性主要表現(xiàn)在以下幾個方面:
1. 網(wǎng)絡教學視頻的特性
(1)網(wǎng)絡視頻資源極大豐富
筆者以“C語言程序設計”為關鍵詞進行搜索,得到結果如下:在百度視頻搜索引擎中顯示50頁1000個相關視頻;通過優(yōu)酷的搜酷搜索可以得到30個視頻數(shù)大于5的相關欄目;在好知網(wǎng)上有9個整理好的視頻資源;在網(wǎng)易云課堂有12個相關視頻教程。百度和優(yōu)酷上顯示的視頻沒有進行整理,不易瀏覽,而好知網(wǎng)和網(wǎng)易云課堂由發(fā)布者進行了編輯,便于用戶學習和瀏覽??梢姡檎医虒W視頻已經(jīng)不是困難的事情,現(xiàn)在的問題是如何從大量的資源中,發(fā)現(xiàn)最有價值的教學資源。
(2)網(wǎng)絡視頻資源訪問的便利性
當前,網(wǎng)絡視頻資源的訪問變得極為方便,只要擁有網(wǎng)絡,學習者可以在任何時間、任何地點進行視頻的訪問和學習。隨著智能手機的普及,基于移動端的網(wǎng)上視頻資源訪問也成一種主流的方式,例如,好知網(wǎng)有手機應用程序提供下載,可以在手機端進行學習。另外,網(wǎng)上教學視頻是按課程進行組織,一般一個課程由多個視頻構成。
(3)各種各樣的學習功能
以教學視頻為基礎的一些網(wǎng)上學習社區(qū)可以為學習者提供各種學習功能和服務。比如,好知網(wǎng)可以方便地記錄學習者的學習時間、頻率等情況,可以為學習者保存學習時的筆記,并進行學習的提醒等服務。同時,好知網(wǎng)提出了小組的概念,學習者在學習小組可以互相討論問題,構建網(wǎng)上學習環(huán)境,找到相同學習興趣的同伴等,提高學習者的學習興趣。
2. 網(wǎng)絡學習者的特點
(1)網(wǎng)上學習者的興趣多樣
網(wǎng)絡上的學習者不同于在校學生,沒有考試成績、學分的壓力,他們在網(wǎng)上學習的動機主要包括,興趣、職業(yè)發(fā)展的需要、輔助課堂學習等?;谂d趣的學習者關注的常見課程為各種講授棋類的視頻、各種攝影課程的視頻等?;诼殬I(yè)發(fā)展需要的學習者沒有時間去學校進行系統(tǒng)的學習,工作中需要進一步提升自身的能力。這些學習者希望從網(wǎng)絡上學習相關的課程,如職場禮儀、各種技術課程等。輔助課堂學習是為了進一步提高課堂學習的效果。一些積極主動的學習者,在課外學習課堂上的相關課程,作為課堂學習的一個有效補充。學習者一般通過搜索或者同學推薦來獲得相關的教學資源,而視頻教學資源是學習者最容易接受的一種網(wǎng)上學習資源。另外,學習者需要自己確定采用何種學習資料??偟膩碚f,網(wǎng)上學習者都具有明確的學習目的、積極的學習態(tài)度,其主動性非常強。
(2)網(wǎng)上學習者學習時間有限
網(wǎng)絡學習者的另外一個特點是學習者可能沒有特別多的時間。大部分的學習者都有自己的工作,工作和家庭等事情都容易導致學習中斷。另外,網(wǎng)絡學習者沒有學習壓力,其學習是基于興趣,不是來自考試、教師、證書等方面給予的外在的壓力,在沒有外在壓力的情況下,導致學習者在各種事情的擠壓下易于放棄網(wǎng)上學習。
3. 網(wǎng)上學習者學習行為特點
網(wǎng)上學習者喜歡在線觀看視頻的學習方式,這類學習資源都是免費的。該學習方式一般沒有教師指導,稱之為無教師監(jiān)督的自主學習。這類學習行為非常自由,學習者可以在不同的視頻資源之間切換。另外,網(wǎng)上學習者會隨著時間的推移而失去興趣,也會因為課程中的難度而退出學習。網(wǎng)上學習也沒有作業(yè)和測試,對所學知識測試主要依賴于實際中的應用,而不是書面的考試,實際應用的效果直接影響學習者進一步學習該課程的興趣。毫無疑問,在沒有教師監(jiān)督的情況下,學習者完成整個課程內(nèi)容的概率會降低。
從以上三個特點出發(fā),筆者認為,通過教學視頻進行網(wǎng)上學習的學習者會因為各種原因而放棄繼續(xù)學習網(wǎng)上教學視頻。但是,在相同課程的教學視頻上,學習者放棄的比率跟該教學視頻的質(zhì)量相關,教學視頻的質(zhì)量越高,放棄學習的學習者越少。
三、基于播放量的自動評價方法
本文希望能夠找到一種更易于實際應用的網(wǎng)絡教學視頻的自動評價方法。此方法基于以下假設:高質(zhì)量的教學視頻會促進學習者堅持學習完視頻內(nèi)容。也就是說,在相同教學內(nèi)容的條件下,學習完高質(zhì)量的教學視頻的人數(shù)多于學習完低質(zhì)量教學視頻的人數(shù),低質(zhì)量教學視頻導致學習者中途放棄學習的概率更高?;谶@一假設,筆者設計了教學視頻的評價指標和計算方法。
本文建立了一種學習人數(shù)隨著時間而變化的衰減因子指標,用于描述學習該課程的人數(shù)隨時間的變化率。學習人數(shù)減少得越快,表示該課程的質(zhì)量越差;學習人數(shù)下降得越慢,表示該課程是一個高質(zhì)量的教學視頻。學習相同課程,不同教學視頻的學習者流失快慢的比較,可以較好地反映教學視頻的優(yōu)劣。
為了刻畫學習人數(shù)隨時間的衰減過程,本文進行了初步的實驗:2014年10月,選取了好知網(wǎng)上一個視頻教程“食物(靜物)攝影用光和構圖實例”,該課程一共有60個視頻。筆者根據(jù)每集的時間順序,畫出了該課程每集的播放量,見圖1虛線,然后觀察播放量隨時間(視頻序列)的變化。從曲線變化趨勢可以認為其播放量的變化比較符合指數(shù)遞減的分布,因此,筆者再用指數(shù)函數(shù)擬合該數(shù)據(jù)得到指數(shù)函數(shù)的曲線(實線)。圖1中,橫坐標為第幾集視頻,縱坐標為對應的播放量。從圖中可以看到,開始5集播放量都在2,000以上,然后不斷遞減。從圖1中可以發(fā)現(xiàn),真實的播放量衰減過程,與指數(shù)函數(shù)的衰減過程基本一致。但是,不同的教學視頻的衰減速度不一致。
因此,本文通過視頻集中每個視頻的播放量進行指數(shù)函數(shù)的擬合。指數(shù)函數(shù)的公式如下:
[y=a?e-b?x] (1)
在該公式中,參數(shù)b控制指數(shù)函數(shù)的下降速度。因此,參數(shù)b可以作為視頻課程質(zhì)量的評價指標,b越小,播放量下降速度越慢。該衰減因子不易受視頻總體播放量的影響。參數(shù)a反映了視頻總體播放量的數(shù)據(jù),我們用該指標來評價視頻集的流行度。已有的基于視頻點擊量的排序方法容易受到視頻名稱、關鍵詞等影響,并不能真實反映學生對課程的評價。但是,流行度指標不同于視頻瀏覽量,該指標可以應對噪聲的影響。
四、實驗結果與分析
為了測試自動評價指標的有效性,筆者從好知網(wǎng)隨機選擇部分視頻課程作為實驗數(shù)據(jù)的來源[2]。好知網(wǎng)是以虛擬社區(qū)為基石的知識分享在線學習平臺,以興趣和知識需求為紐帶,實現(xiàn)老師和學生、學生和學生之間的知識傳遞,讓教和學的單向推送模式轉(zhuǎn)化為一種多端互動模式。好知網(wǎng)國內(nèi)Alex排名在4,000上下,獲得眾多網(wǎng)友的一致好評,月訪問UV(獨立訪客)達到60萬左右,PV(訪問量)在120萬左右。我們于2014年12月從好知網(wǎng)上選取了“C語言程序設計”的相關課程,其中四個教學視頻最為相關,分別為“邊用邊學C語言”“吉林大學C語言視頻教程”“C語言程序設計(曾怡主講)”和“C語言程序設計(小甲魚系列)”。然后,根據(jù)每個視頻集中每集的播放量,用最小二乘曲線擬合方法,擬合得到指數(shù)函數(shù)的兩個參數(shù)a和b。為了比較筆者提出方法的評價結果與學生真實的評價吻合度,筆者用計算得到的評價結果排序四個視頻,然后與學生的評價結果進行比較,看其是否一致。實驗結果如表1所示。
從實驗數(shù)據(jù)可以看到,上述課程的自動評價結果與學生的評價結果基本一致。另外,其質(zhì)量指標并不受流行度的影響,“C語言程序設計(小甲魚系列)”雖然有較多的人學習,但是視頻質(zhì)量并不高。同時,可以看到學生的評價人數(shù)并不高,存在一定的不穩(wěn)定性。表1數(shù)據(jù)基本驗證了筆者提出的評價方法較好地反映了學習者對視頻教程的評價。
用筆者的教學視頻評價方法,本文對不同類別的教學視頻進行評價。根據(jù)好知網(wǎng)上的視頻分類:攝影、電腦、職場、編程、語言、文化、興趣、生活和公開課,對不同類別隨機選取5個視頻集,通過擬合的指數(shù)函數(shù)參數(shù)a和b的均值來評價不同類別教學視頻的流行度和視頻質(zhì)量。其數(shù)據(jù)如表2所示。
從表2可以看到,根據(jù)學習人數(shù)評價,不同類別課程受到的歡迎程度不一樣。本文方法中的系數(shù)a很好地反映了不同類別的視頻教程的受歡迎程度,正好與學習的人數(shù)成正比關系。學習的人數(shù)是注冊用戶加入該視頻課程進行學習的人數(shù),而一般的非注冊的瀏覽用戶雖然看了視頻,但不是學習用戶。因此,通過本文的評價指標,系數(shù)a可以反映某個視頻教程的受歡迎程度,同時對一些噪聲點擊具有較好的抵抗性;系數(shù)b可以反映相同教學內(nèi)容不同視頻的質(zhì)量。從表2也可以看到,雖然編程相關的課程流行度不是很高,但是其視頻質(zhì)量還是最高的。
另外,為了測試網(wǎng)絡學習者學習保持的一般規(guī)律,消除學習內(nèi)容的影響,筆者對選取的9個類別中每個類別5個視頻集的播放量進行求和。由于每個視頻集中視頻的數(shù)量不一致,筆者選取每個視頻集的前17個視頻進行統(tǒng)計和最小二乘方法擬合,得到的結果如圖2所示(虛線為每集實際播放量,實線為用指數(shù)函數(shù)擬合的結果)。
從圖2可以看出,不考慮教學視頻的內(nèi)容,總體的播放量是成指數(shù)下降。這反映了網(wǎng)絡學習者輟學率的一般規(guī)律。但是,不同視頻類別的輟學率,其指數(shù)變化率不一致;對同一教學內(nèi)容,學習不同的教師講授視頻的學習者存在差別。因此,該指標可用于評價相同內(nèi)容的視頻質(zhì)量。
另外,對于專題性的視頻教程(同一視頻集中不同視頻相關性非常低的視頻教程),本方法不一定適用。例如,好知網(wǎng)中的教程“菁俏妞de化妝教程”。該視頻教程中前三個視頻講授內(nèi)容分別為萬圣節(jié)化妝、萌兔兔妝、圣誕節(jié)派對化妝。第5個視頻則為“五分鐘淡妝”,此視頻獲得了比前面三集多得多的播放量。從中可以發(fā)現(xiàn),對不同集之間相關性弱的視頻集,其播放量并不一定符合按指數(shù)遞減趨勢。
五、總結
本文提出了一種通過對教學視頻集播放量進行統(tǒng)計分析得到教學視頻流行度和質(zhì)量的方法。通過真實的實驗數(shù)據(jù)驗證了這一評價方法與實際的課程評價結果基本一致。由于從學習者的行為角度出發(fā),因此不容易受到噪聲的影響,而且可以通過程序計算自動地獲得評價結果。與已有的方法比較,這一方法無須構建評價標準,能夠根據(jù)每集視頻的播放量來自動評價,從而與互聯(lián)網(wǎng)快速發(fā)布的要求相適應。同時,該方法還可以用于其他類型視頻集的評價,比如電視連續(xù)劇。
應該指出的是,本文的評價方法主要適用于評價開放的視頻課程,并應用于對兩門以上的同類課程進行質(zhì)量比較。而對于有訪問限制、專門用于網(wǎng)絡教學中的網(wǎng)絡視頻課程不一定合適。另外,本課程評價方法特別適合每集具有相關性的視頻教程。
[參考文獻]
[1] 呂生榮. 程序設計基礎教學資源的有效性評價研究[D]. 包頭:內(nèi)蒙古師范大學,2008.
[2] 好知網(wǎng). http://www.howzhi.com.
[3] 屈小牛,數(shù)字教學資源庫質(zhì)量自動評價系統(tǒng)的研究[D]. 成都:四川師范大學,2013.
[4] 熊玲. 基于鏈接分析的Web教學資源自動評價模型研究[D]. 南京:南京師范大學,2013.
收稿日期:2014-11-15
定稿日期:2015-03-14
作者簡介:姚金良,博士,講師;楊冰;韓建平。杭州電子科技大學(310018)。
魏建強,杭州闊知網(wǎng)絡科技有限公司(310018)。
責任編輯 三 川