趙慧瓊 姜 強 趙 蔚(東北師范大學(xué) 計算機科學(xué)與信息技術(shù)學(xué)院,吉林長春 130012)
?
大數(shù)據(jù)學(xué)習(xí)分析的安全與隱私保護(hù)研究*
趙慧瓊姜強【通訊作者】趙蔚
(東北師范大學(xué) 計算機科學(xué)與信息技術(shù)學(xué)院,吉林長春 130012)
摘要:隨著大數(shù)據(jù)時代的來臨,學(xué)習(xí)分析技術(shù)成為了教育信息化的新浪潮,其涉及的倫理道德問題尤其是學(xué)習(xí)分析過程中引發(fā)的一系列數(shù)據(jù)安全與隱私問題也成為了教育領(lǐng)域研究的熱點。為應(yīng)對隱私泄露、訪問權(quán)限模糊、數(shù)據(jù)可信性受威脅等問題,文章以技術(shù)為視角,從數(shù)據(jù)收集、數(shù)據(jù)分析和數(shù)據(jù)解釋等三方面構(gòu)建了數(shù)據(jù)安全與隱私保護(hù)框架,并提出了相關(guān)的數(shù)據(jù)安全與隱私保護(hù)策略,以期提高利用學(xué)習(xí)分析技術(shù)進(jìn)行大數(shù)據(jù)研究的成效,實現(xiàn)學(xué)習(xí)分析技術(shù)挖掘教育大數(shù)據(jù)潛在價值的預(yù)期目標(biāo),充分發(fā)揮大數(shù)據(jù)學(xué)習(xí)分析的研究價值。
關(guān)鍵詞:學(xué)習(xí)分析;大數(shù)據(jù);安全隱私;倫理道德
大數(shù)據(jù)學(xué)習(xí)分析的價值在于利用機器學(xué)習(xí)、數(shù)據(jù)挖掘、回歸分析、可視化技術(shù)等進(jìn)行收集、測量、分析和報告學(xué)習(xí)數(shù)據(jù),理解和優(yōu)化學(xué)習(xí)過程,進(jìn)而真正實現(xiàn)因材施教,使共性教育向個性教育的方向發(fā)展。例如,Knewton教育平臺構(gòu)建了成熟、實時的學(xué)生數(shù)據(jù)分析,能夠細(xì)分知識點,對每個學(xué)生予以單獨分析,通過實時預(yù)測技術(shù)來監(jiān)測學(xué)生的學(xué)習(xí)情形并及時調(diào)整,為學(xué)生下一步的學(xué)習(xí)內(nèi)容和活動提供最適合的引導(dǎo),實施個性化教學(xué)[1];在機器學(xué)習(xí)技術(shù)的支持下,DreamBox Learning能夠記錄學(xué)生的學(xué)習(xí)行為數(shù)據(jù)并將其作為判斷學(xué)生知識能力的依據(jù),同時針對學(xué)習(xí)者的學(xué)習(xí)需求提供個性化的學(xué)習(xí)路徑[2];猿題庫通過智能算法對學(xué)生做題練習(xí)與知識點測評的數(shù)據(jù)進(jìn)行挖掘分析,能夠準(zhǔn)確評估學(xué)生的認(rèn)知能力,然后根據(jù)知識水平進(jìn)行1對1的智能化出題,實現(xiàn)個性化學(xué)習(xí)[3]。此外,國內(nèi)大數(shù)據(jù)領(lǐng)域的領(lǐng)軍專家——周濤教授組建了大數(shù)據(jù)研究中心,運用大數(shù)據(jù)、云計算、學(xué)習(xí)分析等信息技術(shù),結(jié)合特定的機器學(xué)習(xí)、數(shù)據(jù)挖掘算法,著力開展了個性化教育引導(dǎo)、學(xué)生學(xué)習(xí)成績預(yù)測、教學(xué)方式方法改善、重大教育決策制定、教務(wù)教學(xué)管理優(yōu)化等教育大數(shù)據(jù)的相關(guān)基礎(chǔ)理論及應(yīng)用推廣研究。然而,基于大數(shù)據(jù)的學(xué)習(xí)分析技術(shù)應(yīng)用也存在一些不可規(guī)避的風(fēng)險,如數(shù)據(jù)收集過程中存在的安全與隱私問題,涉及倫理道德的挑戰(zhàn),將不利于挖掘教育大數(shù)據(jù)的潛在價值。
國外研究大數(shù)據(jù)學(xué)習(xí)分析技術(shù)的安全與隱私問題起步較早,如美國的《家庭教育權(quán)利和隱私法案》中明確規(guī)定要保護(hù)學(xué)生學(xué)習(xí)活動的隱私;英國開放大學(xué)根據(jù)允許收集和分析學(xué)生數(shù)據(jù)的八項原則,制定了利用學(xué)生數(shù)據(jù)開展學(xué)習(xí)分析的倫理政策。知名的教育家、科學(xué)家、法律學(xué)者和倫理學(xué)者在2014年加州阿西洛馬(Asilomar)會議上制定了關(guān)于學(xué)習(xí)和研究合乎倫理地使用數(shù)據(jù)和技術(shù)的框架,框架的六項原則包括:尊重學(xué)習(xí)者權(quán)利、善行、公正、公開、人性化學(xué)習(xí)以及持續(xù)關(guān)懷[4]。此外,Jones等[5]在MOOC數(shù)據(jù)學(xué)習(xí)分析研究的基礎(chǔ)上,從個體控制、透明性、情境需求、安全性、權(quán)限、數(shù)據(jù)收集限制性及責(zé)任心等七方面深入描述了公平信息慣例和隱私保護(hù),以防止學(xué)生隱私信息泄露;Kay[6]針對學(xué)習(xí)分析技術(shù)產(chǎn)生的倫理道德沖突,明確指出學(xué)習(xí)分析過程需要設(shè)定數(shù)據(jù)的范圍與界限,充分考慮數(shù)據(jù)分析對象的利益與情緒,給予數(shù)據(jù)分析對象選擇性參與或退出的機會,同時依據(jù)存在的風(fēng)險及時調(diào)整應(yīng)對措施,保護(hù)數(shù)據(jù)安全;Willis 等[7]在處理大數(shù)據(jù)學(xué)習(xí)分析技術(shù)的安全與隱私問題時,利用道德推理模式的波特圖式(Potter Box)建立了一個靈活的倫理框架,從定義、價值、原則、忠心四個角度為學(xué)習(xí)分析面臨的倫理道德困境提供了應(yīng)對思路。
與國外相比,國內(nèi)關(guān)于大數(shù)據(jù)學(xué)習(xí)分析技術(shù)的安全與隱私問題研究較少,正處于初步發(fā)展階段。2015年國務(wù)院印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》明確提出要健全大數(shù)據(jù)安全保障體系,強化安全支撐。此外,顧小清等[8]指出學(xué)習(xí)分析技術(shù)存在明顯的倫理問題,有可能因收集分析學(xué)習(xí)者數(shù)據(jù)而侵犯個人隱私,需要尋找學(xué)生隱私與學(xué)習(xí)分析技術(shù)之間的平衡點;楊現(xiàn)民等[9]認(rèn)為有必要從體制、機制、技術(shù)、方法等多個層面加快制定《教育大數(shù)據(jù)安全管理辦法》,進(jìn)而保障教育數(shù)據(jù)安全,保護(hù)教育隱私數(shù)據(jù)不外泄、不被惡意使用;徐鵬等[10]指出教育大數(shù)據(jù)應(yīng)用過程存在隱私與倫理道德限制,建議通過制定相關(guān)的法律制度,避免因?qū)W習(xí)分析技術(shù)應(yīng)用而造成的倫理道德問題;張文青等[11]則從倫理視角研究了學(xué)習(xí)分析技術(shù),通過梳理學(xué)習(xí)分析過程中面臨的個人隱私、數(shù)據(jù)所屬權(quán)和人文關(guān)懷等倫理問題,提出了數(shù)據(jù)測量、收集和分析應(yīng)該遵守相關(guān)的行為規(guī)范。此外,在第七屆“信息資本、產(chǎn)權(quán)與倫理國際學(xué)術(shù)研討會(ICPE-7)”上,來自美國南佛州大學(xué)、日本鶴見大學(xué)、中國臺灣世新大學(xué)和北京大學(xué)等高校的專家學(xué)者主要從理論層面探討了大數(shù)據(jù)時代的數(shù)據(jù)安全與信息隱私等問題,同時深入研討了數(shù)據(jù)資源版權(quán)、公共文化政策等相關(guān)問題,對解決學(xué)習(xí)分析技術(shù)所產(chǎn)生的倫理問題有借鑒意義。
綜上所述,已有的相關(guān)學(xué)習(xí)分析技術(shù)的研究成果比較豐富,但教育大數(shù)據(jù)應(yīng)用存在的隱私、法律保護(hù)權(quán)利及其它倫理道德規(guī)范還缺乏相應(yīng)的政策法規(guī)指導(dǎo),因此有必要制定適當(dāng)?shù)姆芍贫群偷赖乱?guī)范,并利用相關(guān)的安全技術(shù),進(jìn)一步加強對學(xué)習(xí)分析倫理道德問題的研究力度,以期發(fā)揮學(xué)習(xí)分析技術(shù)在教育教學(xué)中的優(yōu)勢。本研究以利用學(xué)習(xí)分析技術(shù)挖掘教育大數(shù)據(jù)的潛在價值為目的,通過梳理學(xué)習(xí)分析技術(shù)面臨的倫理道德挑戰(zhàn),總結(jié)出國外數(shù)據(jù)保護(hù)框架的特點,構(gòu)建了一個技術(shù)視角下的數(shù)據(jù)安全與隱私保護(hù)框架,并提出了相關(guān)的數(shù)據(jù)安全與隱私保護(hù)策略。
隨著大數(shù)據(jù)時代的來臨,教育信息化過程中學(xué)習(xí)者所產(chǎn)生的數(shù)據(jù)越來越多,為了更好地促進(jìn)學(xué)習(xí)者學(xué)習(xí),實現(xiàn)真正意義上的個性化學(xué)習(xí),需要利用學(xué)習(xí)分析技術(shù)分析學(xué)習(xí)者的海量數(shù)據(jù)。但學(xué)習(xí)分析過程因為增加了學(xué)習(xí)者的透明性,故會帶來一系列的倫理道德挑戰(zhàn)。
1個人隱私泄露
在利用學(xué)習(xí)分析技術(shù)分析海量數(shù)據(jù)的過程中,個人隱私很容易泄露,故將學(xué)習(xí)數(shù)據(jù)轉(zhuǎn)變?yōu)樾畔⑴c知識時[12],這些數(shù)據(jù)面臨著嚴(yán)峻的風(fēng)險,處于內(nèi)憂外患的境地。
內(nèi)憂主要指的是擁有學(xué)習(xí)者學(xué)習(xí)數(shù)據(jù)的教育機構(gòu)在處理數(shù)據(jù)的過程中泄露隱私,Smith等[13]指出數(shù)據(jù)在處理過程中引發(fā)的隱私泄露問題包括信息收集、誤用、二次利用和未授權(quán)訪問等四個維度;此外,內(nèi)憂還包括擁有數(shù)據(jù)的教育機構(gòu)將學(xué)習(xí)數(shù)據(jù)出售給第三方、政府機構(gòu)或者同其它教育機構(gòu)共享數(shù)據(jù)[14]。
外患指利用不正當(dāng)手段獲取學(xué)習(xí)數(shù)據(jù)的機構(gòu)或個人,通過學(xué)習(xí)管理系統(tǒng)的漏洞盜取數(shù)據(jù)。比如說,當(dāng)向?qū)W習(xí)者提供適當(dāng)?shù)谋憷麠l件時,這些機構(gòu)或個人會要求學(xué)習(xí)者主動發(fā)布他們的個人信息。一般情況下,如果學(xué)習(xí)者想在學(xué)習(xí)活動過程獲得更多的個性化指導(dǎo),他們便會主動地提供個人信息。所以,個人隱私泄露既可能是教育機構(gòu)或研究者們造成的,也可能是學(xué)習(xí)者本人造成的。個人隱私泄露所帶來的風(fēng)險,可能會危及學(xué)習(xí)者的生理、心理、財產(chǎn)安全等多方面。
2數(shù)據(jù)訪問權(quán)限模糊
在學(xué)習(xí)分析過程中,學(xué)習(xí)者的數(shù)據(jù)可能被用于不同的情景,由于這些數(shù)據(jù)應(yīng)用的范圍比較廣,它們經(jīng)常被不同身份、不同目的的研究機構(gòu)或研究者們訪問,因此必須對學(xué)習(xí)者的學(xué)習(xí)數(shù)據(jù)設(shè)置訪問權(quán)限。
然而,在學(xué)習(xí)者擁有海量學(xué)習(xí)數(shù)據(jù)的前提下,教育機構(gòu)中管理這些數(shù)據(jù)的安全管理員可能因為缺乏相關(guān)的專業(yè)知識,而無法準(zhǔn)確地為研究機構(gòu)或研究者們指定能夠訪問的數(shù)據(jù)范圍,此時若從數(shù)據(jù)利用效率的角度出發(fā),將學(xué)習(xí)數(shù)據(jù)的訪問權(quán)限設(shè)置為所有訪問者均可默認(rèn)授權(quán)訪問是一種極其不理想的方式。研究者為了完成學(xué)習(xí)分析的工作,需要訪問大量的學(xué)習(xí)者學(xué)習(xí)數(shù)據(jù)及個人信息,但能否成功地訪問這些數(shù)據(jù),是取決于學(xué)習(xí)者,還是擁有學(xué)習(xí)者數(shù)據(jù)的教育機構(gòu),還是研究者或研究機構(gòu),對此設(shè)置的訪問權(quán)限并不明確。除此之外,不同類型的學(xué)習(xí)數(shù)據(jù)可能需要不同的訪問權(quán)限,如在學(xué)習(xí)者的學(xué)習(xí)活動過程中,存在學(xué)習(xí)者學(xué)習(xí)瀏覽歷史記錄的訪問權(quán)限;學(xué)期結(jié)束時,存在學(xué)習(xí)者學(xué)習(xí)數(shù)據(jù)時間、區(qū)間的訪問限制??傊?,如何清晰地統(tǒng)一設(shè)置訪問權(quán)限,是學(xué)習(xí)分析過程中面臨的一個重要挑戰(zhàn)。
3數(shù)據(jù)可信性受威脅
利用學(xué)習(xí)分析技術(shù),將學(xué)習(xí)者的海量數(shù)據(jù)轉(zhuǎn)變?yōu)橛袃r值的知識信息,最重要的前提就是要保證數(shù)據(jù)的可信性。美國管理學(xué)家、統(tǒng)計學(xué)家愛德華·戴明曾說:“除了上帝,任何人必須用數(shù)據(jù)說話?!?/p>
但是,數(shù)據(jù)也可能造假、也可能出錯,如果利用偽造或錯誤的數(shù)據(jù)進(jìn)行學(xué)習(xí)分析,往往就會得出錯誤的結(jié)論。由于獲取的學(xué)習(xí)者數(shù)據(jù)是海量的,這使研究者們難以從中鑒別出虛假的數(shù)據(jù),從而導(dǎo)致出現(xiàn)錯誤的判斷。目前,學(xué)習(xí)平臺中學(xué)習(xí)者虛假學(xué)習(xí)行為的產(chǎn)生越來越容易,隨之帶來的負(fù)面影響不可低估;學(xué)習(xí)數(shù)據(jù)在收集的過程中可能會因為人工干預(yù)而使獲得的數(shù)據(jù)產(chǎn)生誤差,利用這些有誤差的學(xué)習(xí)數(shù)據(jù)進(jìn)行分析,也必將影響學(xué)習(xí)者數(shù)據(jù)分析結(jié)果的正確性。此外,所記錄的學(xué)習(xí)者學(xué)習(xí)數(shù)據(jù)可能會因為保存時間過長而失真,或者由于學(xué)習(xí)平臺自身的升級導(dǎo)致數(shù)據(jù)丟失、遺漏,使研究者們收集到的數(shù)據(jù)不能真實地反映學(xué)習(xí)者的學(xué)習(xí)狀態(tài)。因此,收集分析學(xué)習(xí)數(shù)據(jù),要了解數(shù)據(jù)的真實來源、數(shù)據(jù)的傳輸過程和數(shù)據(jù)的處理過程,調(diào)研數(shù)據(jù)的各項可信度,以防止利用錯誤的數(shù)據(jù)得出無意義的分析結(jié)果。
為了更好地解決大數(shù)據(jù)學(xué)習(xí)分析存在的倫理道德問題,首先應(yīng)考慮在學(xué)習(xí)分析過程中如何保護(hù)學(xué)習(xí)者的數(shù)據(jù)安全。對此,國外研究者從不同的視角構(gòu)建了保護(hù)數(shù)據(jù)安全與隱私的框架,如Prinsloo等[15]從社會批判的視角提出了六項原則倫理框架,即道德實踐、學(xué)生代理、學(xué)生身份和性能的動態(tài)構(gòu)造、學(xué)生的多維復(fù)雜現(xiàn)象、透明度和教育大數(shù)據(jù)的使用;Pardo等[16]則從法律的視角確定了四項原則倫理框架,即透明度、訪問權(quán)、學(xué)生控制數(shù)據(jù)、問責(zé)與評估。鑒于此,并結(jié)合學(xué)習(xí)分析過程中遵循的行為規(guī)范,本研究以技術(shù)為視角,從數(shù)據(jù)收集、數(shù)據(jù)分析和數(shù)據(jù)解釋等三方面構(gòu)建了大數(shù)據(jù)學(xué)習(xí)分析的安全與隱私保護(hù)框架,如圖1所示。
圖1 大數(shù)據(jù)學(xué)習(xí)分析的安全與隱私保護(hù)框架
1數(shù)據(jù)收集
學(xué)習(xí)者的數(shù)據(jù)來源比較多樣化,包括學(xué)習(xí)管理系統(tǒng)中的基本信息、學(xué)習(xí)平臺的學(xué)習(xí)行為數(shù)據(jù)和網(wǎng)絡(luò)服務(wù)器的瀏覽數(shù)據(jù)等。因此,學(xué)習(xí)分析過程的第一步便是從各種系統(tǒng)中收集學(xué)習(xí)數(shù)據(jù)。由于學(xué)習(xí)數(shù)據(jù)的來源不同且數(shù)量巨大,故需要借助數(shù)據(jù)溯源技術(shù)和云計算技術(shù)來完成大規(guī)模學(xué)習(xí)數(shù)據(jù)的采集與存儲——利用數(shù)據(jù)溯源技術(shù)的注釋方法對學(xué)習(xí)數(shù)據(jù)進(jìn)行標(biāo)注,進(jìn)而記錄學(xué)習(xí)數(shù)據(jù)的來源與傳輸,之后根據(jù)記錄內(nèi)容,對海量的學(xué)習(xí)數(shù)據(jù)實施溯源追蹤,將同一出處、同一學(xué)習(xí)者的學(xué)習(xí)數(shù)據(jù)存放在一起,以免造成學(xué)習(xí)數(shù)據(jù)的丟失、遺漏等;利用云計算技術(shù)收集、存儲學(xué)習(xí)數(shù)據(jù)時,則可從云計算提供的Iaas、Paas和Saas服務(wù)層面來增強學(xué)習(xí)數(shù)據(jù)的安全與隱私保護(hù)。此外,在使用云計算技術(shù)和數(shù)據(jù)溯源技術(shù)收集數(shù)據(jù)的同時必須堅持知情同意原則,即提前征得學(xué)習(xí)者的同意,以在數(shù)據(jù)收集環(huán)節(jié)更好地保障學(xué)習(xí)者隱私數(shù)據(jù)的安全。
2數(shù)據(jù)分析
數(shù)據(jù)分析是學(xué)習(xí)分析技術(shù)在教育應(yīng)用中的核心環(huán)節(jié),需要利用網(wǎng)絡(luò)分析技術(shù)對學(xué)習(xí)者的數(shù)據(jù)加以分析,并經(jīng)過整合、分類、關(guān)聯(lián)分析等操作,形成分析結(jié)果;或者利用學(xué)習(xí)者數(shù)據(jù)構(gòu)建的用戶模型預(yù)測學(xué)習(xí)者的學(xué)習(xí)情況,生成預(yù)測模型。但若想在數(shù)據(jù)分析過程中高效地保護(hù)學(xué)習(xí)者數(shù)據(jù)的安全,僅靠網(wǎng)絡(luò)分析技術(shù)是不夠的,還必須使用數(shù)據(jù)匿名技術(shù),堅持匿名原則。如利用K-anonymity、I-diversity、T-closeness等匿名保護(hù)技術(shù)可對學(xué)習(xí)數(shù)據(jù)實施匿名處理,而隱藏學(xué)習(xí)者的標(biāo)識和屬性信息可以減少學(xué)習(xí)者的隱私泄露、提高學(xué)習(xí)者數(shù)據(jù)的安全度,從而避免出現(xiàn)因分析數(shù)據(jù)所造成的倫理道德失范問題。
3數(shù)據(jù)解釋
數(shù)據(jù)解釋的目的在于更好地呈現(xiàn)數(shù)據(jù)分析結(jié)果,以便對學(xué)習(xí)者的學(xué)習(xí)活動實施干預(yù),實現(xiàn)個性化的自適應(yīng)學(xué)習(xí)。一方面,數(shù)據(jù)解釋可以通過利用可視化技術(shù)生成學(xué)習(xí)者的學(xué)習(xí)報告,進(jìn)而呈現(xiàn)在學(xué)習(xí)儀表盤上。另一方面,作為學(xué)習(xí)分析過程的最后一個環(huán)節(jié),進(jìn)行數(shù)據(jù)解釋時仍需重視學(xué)習(xí)者的數(shù)據(jù)安全問題,避免出現(xiàn)違反社會倫理道德的行為,而這可以通過數(shù)據(jù)加密技術(shù)來實現(xiàn)。利用數(shù)據(jù)加密算法中的DES密鑰加密算法和RSA公鑰加密算法對數(shù)據(jù)分析結(jié)果進(jìn)行加密處理,可以防止未經(jīng)授權(quán)的機構(gòu)或個人竊取、篡改分析結(jié)果。為保證最終學(xué)習(xí)分析報告的準(zhǔn)確性和合理性,使用可視化技術(shù)和數(shù)據(jù)加密技術(shù)進(jìn)行數(shù)據(jù)解釋時必須堅持公正原則,以規(guī)避對分析結(jié)果利用不當(dāng)而引發(fā)的倫理道德風(fēng)險。
學(xué)習(xí)分析技術(shù)在教育中存在的倫理道德問題向研究者提出了挑戰(zhàn),要求研究者既要利用學(xué)習(xí)分析技術(shù)挖掘教育大數(shù)據(jù)的潛在價值,又要正確地應(yīng)對倫理道德問題。而尋求這兩者利益平衡的途徑之一,是遵守教育機構(gòu)相關(guān)的行為規(guī)范。如Bienknowski等[17]就曾借鑒美國的《家庭教育權(quán)利和隱私法案》展開研究,闡明了數(shù)據(jù)訪問與學(xué)習(xí)者隱私保護(hù)之間的對立關(guān)系。為了解決學(xué)習(xí)分析技術(shù)涉及的倫理道德問題,本研究從數(shù)據(jù)收集和整合的角度出發(fā),針對數(shù)據(jù)安全與隱私保護(hù)問題提出數(shù)據(jù)使用時應(yīng)遵守透明原則、征得學(xué)習(xí)者的知情同意以及提高數(shù)據(jù)質(zhì)量等策略,以期更好地發(fā)揮大數(shù)據(jù)學(xué)習(xí)分析技術(shù)的研究價值。
1遵守透明原則
利用學(xué)習(xí)分析技術(shù)收集學(xué)習(xí)數(shù)據(jù)時,為避免個人隱私的泄露,研究者需要遵守透明原則,提高學(xué)習(xí)者數(shù)據(jù)的透明度。也就是說,在學(xué)習(xí)分析的過程中,學(xué)習(xí)者的哪些數(shù)據(jù)可以被利用、利用的目的與條件、數(shù)據(jù)的訪問權(quán)限及學(xué)習(xí)者個人信息的保護(hù)等都要公開詳細(xì)地予以說明。因為學(xué)習(xí)者在學(xué)習(xí)平臺實施學(xué)習(xí)活動時,往往不會注意自己的學(xué)習(xí)記錄、個人信息是否正在被保存、被收集或被利用。因此,明確告知學(xué)習(xí)者哪些數(shù)據(jù)會被收集使用、收集使用的范圍、使用學(xué)習(xí)數(shù)據(jù)的價值以及學(xué)習(xí)者需要承擔(dān)的風(fēng)險等,才能符合道德決策中自主原則的要求。當(dāng)涉及數(shù)據(jù)的具體操作時,可以通過學(xué)習(xí)網(wǎng)站公告或者以E-mail的形式告知學(xué)習(xí)者。除此之外,教育機構(gòu)也應(yīng)該承擔(dān)起保護(hù)學(xué)習(xí)者學(xué)習(xí)數(shù)據(jù)的責(zé)任,并及時提醒學(xué)習(xí)者注意學(xué)習(xí)管理系統(tǒng)之外存有的風(fēng)險??傊?,提高學(xué)習(xí)者數(shù)據(jù)的透明度,遵守透明原則,有助于降低學(xué)習(xí)分析技術(shù)在教育領(lǐng)域引發(fā)的倫理道德失范風(fēng)險,尤其是能減少學(xué)習(xí)者個人隱私泄露的概率。
2征得學(xué)習(xí)者的知情同意
研究者在進(jìn)行大數(shù)據(jù)學(xué)習(xí)分析時,應(yīng)征得學(xué)習(xí)者的知情同意。Toch[18]在一項關(guān)于社交網(wǎng)絡(luò)隱私風(fēng)險的調(diào)查中發(fā)現(xiàn):周圍的朋友或同學(xué)會看到網(wǎng)上發(fā)布的內(nèi)容,使用戶感覺有潛在的風(fēng)險。而當(dāng)學(xué)習(xí)者得知自己的數(shù)據(jù)會被利用時,為保護(hù)自己真實的學(xué)習(xí)數(shù)據(jù),學(xué)習(xí)者的學(xué)習(xí)活動往往就會呈現(xiàn)出一種虛假的表象。因此,研究者只有取得學(xué)習(xí)者的知情同意、獲得學(xué)習(xí)者的信任,才能保證獲得的數(shù)據(jù)真實,進(jìn)而保證研究的質(zhì)量。但征得學(xué)習(xí)者的知情同意,需要明確數(shù)據(jù)獲取的訪問權(quán)限,否則便有可能會因為學(xué)習(xí)數(shù)據(jù)存在被泄露的情況,而使研究者得不到學(xué)習(xí)者的信任——所以,研究機構(gòu)必須對數(shù)據(jù)訪問權(quán)限不透明這一問題予以高度重視。概括地說,最初的研究計劃要明確規(guī)定數(shù)據(jù)的訪問權(quán)限,清楚地表述出可授權(quán)訪問的學(xué)習(xí)數(shù)據(jù);之后獲取學(xué)習(xí)者的知情同意,以保證學(xué)習(xí)數(shù)據(jù)不會被越權(quán)獲取;最后通過明確清晰的訪問權(quán)限規(guī)定,保證學(xué)習(xí)者數(shù)據(jù)的有限訪問,以避免未經(jīng)授權(quán)的研究者訪問學(xué)習(xí)者的學(xué)習(xí)數(shù)據(jù)。
3提高數(shù)據(jù)質(zhì)量:真實性和完整性
如前文所述,在大數(shù)據(jù)學(xué)習(xí)分析過程中數(shù)據(jù)的可信性受威脅,因此有必要提高學(xué)習(xí)者數(shù)據(jù)的質(zhì)量。一方面,應(yīng)保證學(xué)習(xí)數(shù)據(jù)的真實性。即利用大數(shù)據(jù)分析技術(shù)來識別虛假的學(xué)習(xí)行為,通過分析大量收集的有關(guān)學(xué)習(xí)者的位置、學(xué)習(xí)內(nèi)容和時間等信息,鑒別其學(xué)習(xí)行為真實發(fā)生的可能性。例如,如果學(xué)習(xí)者瀏覽某網(wǎng)頁的時間過長,或者鼠標(biāo)的位置長時間沒有改變,那么該學(xué)習(xí)者學(xué)習(xí)行為的真實性就值得懷疑。另一方面,應(yīng)保證學(xué)習(xí)數(shù)據(jù)的完整性。即收集到的學(xué)習(xí)者數(shù)據(jù)如果因其保留時間跨度較長而失真,為了不影響學(xué)習(xí)分析技術(shù)的效用,便可以將其刪除。如果因其它原因而導(dǎo)致學(xué)習(xí)數(shù)據(jù)丟失、遺漏,則可根據(jù)學(xué)習(xí)數(shù)據(jù)對于研究過程的重要性,來決定是將其刪除還是將其補充完整。總之,不論通過何種方式來保證數(shù)據(jù)的真實性和完整性、提高學(xué)習(xí)者數(shù)據(jù)的質(zhì)量,都將有利于發(fā)揮大數(shù)據(jù)學(xué)習(xí)分析技術(shù)的研究價值。
學(xué)習(xí)分析技術(shù)在教育應(yīng)用中存在的安全與隱私問題,嚴(yán)重阻礙了對教育大數(shù)據(jù)潛在價值的挖掘。本研究根據(jù)教育大數(shù)據(jù)學(xué)習(xí)分析過程出現(xiàn)的倫理道德問題,從技術(shù)層面構(gòu)建了數(shù)據(jù)安全與隱私保護(hù)框架,以增強學(xué)習(xí)者數(shù)據(jù)的保密性和安全性,同時揭示了使用相關(guān)的安全技術(shù)對解決學(xué)習(xí)分析倫理道德問題的重要性;而本研究提出的數(shù)據(jù)安全與隱私保護(hù)策略可以減少學(xué)習(xí)分析過程中的倫理道德風(fēng)險,便于充分發(fā)揮學(xué)習(xí)分析技術(shù)挖掘教育大數(shù)據(jù)的潛在價值。需要指出的是,為更好地應(yīng)對大數(shù)據(jù)學(xué)習(xí)分析面臨的倫理道德挑戰(zhàn),相關(guān)法律制度和道德規(guī)范的制定及實施應(yīng)與大數(shù)據(jù)學(xué)習(xí)分析相關(guān)安全技術(shù)的使用保持同步、互相補充,如此才能有效發(fā)揮教育大數(shù)據(jù)學(xué)習(xí)分析的成效,促進(jìn)個性化學(xué)習(xí)。
參考文獻(xiàn)
[1]Knewton.Knewton’s technical white paper[OL].
[2]DreamBox Learning.DreamBox Learning: Adaptive,engaging,and motivating math[OL].
[3]姜強,趙蔚,王朋嬌,等.基于大數(shù)據(jù)的個性化自適應(yīng)在線學(xué)習(xí)分析模型及實現(xiàn)[J].中國電化教育,2015,(1):85-92.
[4]NMC地平線項目.新媒體聯(lián)盟2015地平線報告高等教育版[J].現(xiàn)代遠(yuǎn)程教育研究,2015,(2):3-22.
[5]Jones M L,Regner L.Users or students? Privacy in university MOOCS[J].Science and Engineering Ethics,2015,(8):1-24.
[6]Kay D.Legal,risk and ethical aspects of analytics in higher education[OL].
[7]Willis J E,Campbell J P,Pistilli M D.Ethics,big data,and analytics: A model for application[OL].
[8]顧小清,張進(jìn)良,蔡慧英.學(xué)習(xí)分析:正在浮現(xiàn)中的數(shù)據(jù)技術(shù)[J].遠(yuǎn)程教育雜志,2012,(1):18-25.
[9]楊現(xiàn)民,唐斯斯,李冀紅.發(fā)展教育大數(shù)據(jù):內(nèi)涵、價值和挑戰(zhàn)[J].現(xiàn)代遠(yuǎn)程教育研究,2016,(1):50-61.
[10]徐鵬,王以寧,劉艷華,等.大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報告解讀及啟示[J].遠(yuǎn)程教育雜志,2013,(6):11-17.
[11]張文青,穆曉靜,傅鋼善.倫理視域下的學(xué)習(xí)分析研究[J].中國教育信息化,2015,(9):3-5.
[12]魏順平.學(xué)習(xí)分析技術(shù):挖掘大數(shù)據(jù)時代下教育數(shù)據(jù)的價值[J].現(xiàn)代教育技術(shù),2013,(2):5-11.
[13]Smith H J,Milberg S J,Burke S J.Information privacy: Measuring individuals’ concerns about organizational practices[J].MIS Ouarterly,1996,(2):167-196.
[14]Smith J,Dinev T,Xu H.Information privacy research: An interdisciplinary review[J].MIS Quarterly,2011,(4):989-1016.
[15]Prinsloo P,Slade S.An evaluation of policy frameworks for addressing ethical considerations in learning analytics[A].Siemens.Learning analytics and knowledge[C].ACM: Leuven,2013:240-244.
[16]Pardo A,Siemens G.Ethical and privacy principles for learning analytics[J].British Journal of Educational Technology,2014,(3):438-450.
[17]Bienknowski M,Feng M,Means B.Enhancing teaching and learning through educational data mining and learning analytics: An issue brief[OL].
[18]Toch E.Personalization and privacy: A survey of privacy risks and remedies in personalization-based systems[J].User Modeling and User-adapted Interaction,2012,(12):203-220.
編輯:小米
Research on Security and Privacy Protection of Big Data Learning Analytics
ZHAO Hui-qiongJIANG Qiang[Corresponding Author]ZHAO Wei
(School of Computer Science and Information Technology,Northeast Normal University,Changchun,Jilin,China 130012)
Abstract:With the advent of big data era,learning analytics has become the new wave of education information.The involved ethical and moral issues especially the data security and privacy issues caused during the process of analytics.To deal with the problems of privacy disclosure,fuzzy access permission and threatened data credibility,this paper has built data security and privacy protection framework from data collection,data analysis and data interpretation.Meanwhile,the relevant strategies of data security and privacy protection were also proposed,in order to improve the effect of using learning analytics to conduct big data research,achieve the expected target of employing learning analytics to tap big data’s e potential value,and fully function the research value of big data learning analytics.
Keywords:learning analytics; big data; security privacy; ethics
收稿日期:2016年1月12日
作者簡介:趙慧瓊,在讀碩士,研究方向為大數(shù)據(jù)學(xué)習(xí)分析,郵箱為zhaohq071@nenu.edu.cn。
*基金項目:本文受教育部人文社會科學(xué)研究規(guī)劃基金“大數(shù)據(jù)支持下的個性化自適應(yīng)學(xué)習(xí)及教育測量研究”(項目編號:15YJA880027)、教育部人文社會科學(xué)研究規(guī)劃基金“基于知識圖譜的開放學(xué)習(xí)資源自主聚合研究”(項目編號:14YJA880103)、“中央高校基本科研業(yè)務(wù)費專項資金”(項目編號:130021049)資助。
【中圖分類號】G40-057
【文獻(xiàn)標(biāo)識碼】A 【論文編號】1009—8097(2016)03—0005—07 【DOI】10.3969/j.issn.1009-8097.2016.03.001