李婧萍
摘? 要:近些年來,“深度學習”頻現(xiàn)于教育界和計算機科學領域,出現(xiàn)了指稱同一但內涵相殊的問題,因此,有必要對這一概念按語境加以區(qū)分,并提出貼切的名稱翻譯方案。經追溯分析可以看出,機器的“深度學習”得名于人類學習,它是一種概念隱喻,其本質是算法及算法規(guī)定下的運算過程,最終的“學習”結果可以預測;人類的深度學習則涉及情感、環(huán)境等因素,是諸多變量共同作用下的復雜心智活動,其結果因人而異。由此可見,譯名不能簡單混用,故提出新的譯名建議,以避免因譯名不當而出現(xiàn)混淆概念的現(xiàn)象。
關鍵詞:深度學習;深層學習;機器學習;術語翻譯
在教育界,深度學習的理念由來已久,從中國的孔子到英國的培根,都多次談到這一問題。美國教育家布盧姆從認知視角歸納出教育目標的六個層級,深度學習又進入了教學法設計。隨著我國2017年最新版課程標準提出培養(yǎng)“核心素養(yǎng)”的育人理念,國內對深度學習的關注度再次上升。核心素養(yǎng)是培養(yǎng)目標,而深度學習是落實途徑。同時,在計算機科學領域,人工智能取得了長足的發(fā)展,“深度學習”的概念亦頻頻出現(xiàn),有時難免會引起與教育界同名概念的混淆和誤解?;诖?,本文聚焦“深度學習”在上述兩個領域的概念實指,深入分析其區(qū)別與聯(lián)系,進而提出區(qū)分譯名的具體方案。
一、教育教學領域的“深度學習”
(一)教育界“深度學習”概念溯源
“學而不思則罔,思而不學則殆”凝聚著先哲孔子的教育思想,一味地讀書學習而不加以思考會陷入迷茫;相反,只思索而不閱讀學習則會充滿疑惑。孔子既否定讀死書的學習方式,也不贊同脫離知識基礎憑空思考,這體現(xiàn)了閱讀輸入加內化反思的深入學習思想。英國著名哲學家弗朗西斯·培根則主張從提出問題、觀察分析到逐一驗證并得出結論的探究式學習方法,這種層層遞進的邏輯分析,也屬于深度學習。兩者都主張深入分析以至內化的學習方式。
當代美國著名心理學家、教育家布盧姆談到學習有深淺層次之分,基于認知學相關理論,布盧姆將教育目標劃分為記憶、理解、應用、分析、評價和創(chuàng)造六個層級。其中,記憶與理解屬于淺層次學習,而應用、分析、評價和創(chuàng)造則屬于深層次學習。各個層級之間相互聯(lián)系、層層遞進,但并無嚴格界限[1](P76)。換言之,淺層學習尚停留在對現(xiàn)有知識信息的消化與吸收層面,而深層學習則蘊含高階思維,意指學習者基于已掌握的知識在遇到問題時能夠發(fā)生知識遷移從而解決實際問題。
教育目標分類學在教育教學領域影響深遠,深度學習(deep Learning)便是在這樣的理論背景下由美國學者Marton & S?lji?于1976年首先倡導的,它是關于學習層次的一個概念,作者基于學生閱讀的實驗,針對孤立記憶和非批判性接受知識的淺層學習(surface Learning)而提出這一觀點[2](P57)。隨后,美國教育改革專家Jensen & Nickelsen詹森闡釋了“深度學習”的過程,作者認為,深度學習是學生基于已有微知識,在教師的指導下,通過自主學習、合作學習或探究學習,將它與其他微知識聯(lián)結起來,并借助相關的訓練來獲得一個完整的、綜合的新知識的過程[3](P12)。
國內教學領域明確使用“深度學習”概念的時間則相對較晚。2005年,隨著教育改革的不斷推進,翻轉課堂、慕課等概念一同被引入中國;2014年,教育部基礎教育課程教材發(fā)展中心在全國多地開展深度學習教學改進項目,這個概念逐漸為教育界特別是基礎教育領域所熟知。
自“深度學習”的名稱被明確提出以后,國內研究特別是中學階段各學科的教育研究,從教學研討到論文撰寫,大都會關涉到這一概念,頗有將其奉為圭臬之勢。同時,深度學習的自然歸宿與2017年最新修訂的普通高中課程標準中的“核心素養(yǎng)”育人目標暗合。于是,以深度學習為主題的發(fā)文量便出現(xiàn)井噴式增長現(xiàn)象。中國知網數據庫該主題下的發(fā)文量,1994年之前每年均在10篇以內,2005年為101篇,至2019年已多達27231篇。需要指出的是,另一個重要驅動力是得益于深度學習在計算機領域的飛速發(fā)展,這一點將在后文詳述。
(二)教育界“深度學習”內涵解讀
有別于重在“傳遞”知識的、以記憶為主的表層學習,亦非流于形式的探究學習,郭華指出,“所謂深度學習,就是指在教師引領下,學生圍繞著具有挑戰(zhàn)性的學習主題,全身心積極參與、體驗成功、獲得發(fā)展的有意義的學習過程。”[4]
盡管教育界對深度學習的闡釋角度不盡相同且各有側重,但仍可發(fā)現(xiàn)深度學習在教育界的概念界定有以下共同點:深度學習是一種蘊含高階思維的、批判性的學習,經常與淺度學習相比較,深度學習之“深”主要體現(xiàn)在學習者對信息的深入加工和對復雜概念的透徹理解層面,其最終目標指向學習者將內化的知識遷移到新環(huán)境中解決問題[5]。基于對國內外相關文獻的梳理分析,我們將教育教學領域深度學習和淺度學習的區(qū)別與聯(lián)系進行了總結,具體如表1所示:
值得注意的是,從學習者角度來衡量,深度和淺度學習之間不存在絕對的邊界,學習者對信息的加工只是在程度上有淺層處理(surfuce-level processing)或深層處理(deep-level processing)之別[6]。從教師教學角度來看,深度學習是一種教育價值觀而并非可供直接套用的具體方法,與之相關的理論多是描述性的,而非規(guī)定性的。其內在原因是學生的學情存在不容忽視的個性差異,教師需要分析不同學生的具體學情,再制定適宜的教學策略,從而促成不同個體進行深度學習[7]。
二、計算機科學領域的“深度學習”
(一)計算機領域“深度學習”概念溯源
在計算機領域,深度學習是機器學習中一種基于對數據進行表征學習的方法。觀測值(如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區(qū)域等[8]。在大數據時代背景下,機器學習領域廣泛研究和開發(fā)機器深度學習,旨在建立、模擬人腦來分析學習的神經網絡,用以解釋數據,如圖像、聲音和文本等。深度學習的便利之處是在于,能夠運用非監(jiān)督式或半監(jiān)督式的特征學習提取高效算法來替代手工獲取特征的過程。
二十世紀四十年代,神經科學研究模仿生物神經網絡,開始構建具有識別和記憶功能的模型與算法。二十世紀六十年代,機器學習尚處于萌芽狀態(tài),從單層感知器逐步發(fā)展到多層感知器。機器學習在二十世紀末進入瓶頸期,原因是當時用于機器訓練的數據量相對較小,難于從少量樣本中提取有價值的特征,反向傳播算法逐漸被放棄。直至2006年,Hinton & Salakhutdinov提出了一種無人監(jiān)督的機器學習方法,主要采取逐層預訓練的方式而成功訓練了深度網絡,重新推動了神經網絡研究[9]。之后,各種深度神經網絡模型應運而生,其中,影響最為深遠的當屬深度卷積神經網絡(Convolutional Neural Network,簡稱“CNN”),它廣泛應用于圖像、音樂、音頻等推薦系統(tǒng)中。從用戶生成的顯性或隱性數據開始,機器通過深度學習模型(如RBM、AE、CNN、RNN、DNN等)對數據加以分析,從而形成用戶隱表示及項目隱表示,進而生成可視化的推薦列表。
由此可以看出,人工智能是為機器賦予類似人的智能,機器學習是一種實現(xiàn)人工智能的方法,而該領域的“深度學習”則是一種實現(xiàn)機器學習的技術。
(二)計算機領域“深度學習”內涵解讀
從技術原理角度來看,所謂機器的“學習”,是指機器通過現(xiàn)有數據對未知條件作出預測和判斷的過程。這種讓計算機自行推理、自主學習的方式,即機器學習[10]。它本質上是計算機運算的過程,是一系列電子信號,既不具備生物神經網絡的化學信號,也不具備人的思維和心理過程。所謂“機器的深度學習”,則是指機器對海量的不同類別的底層數據進行逐級自動分析,能夠從多個隱藏層次中獲取用戶和項目的高層次特征,并最終表示出來。這一過程較少需要或不需要人工干預,大大提升了運算效率。
從應用情況來看,機器的深度學習技術應用范圍廣泛,目前的研究熱點有圖像處理、人臉識別、語音識別、自然語言理解、內容推薦系統(tǒng)的設計等[11]。在圖像處理方面,自動駕駛領域的應用十分普遍,汽車、無人機要實現(xiàn)自動駕駛,攝像頭所記錄的數據就必須能夠迅速被解析成相應的物體,從而成功避開障礙物。監(jiān)控設備則需要人臉識別技術,特別是像素不夠清晰時仍然能有效辨別?;跈C器深度學習技術,2014年,F(xiàn)acebook提出了DeepFace人臉識別算法;2015年,Google提出了FaceNet人臉識別算法;2018年,騰訊則提出了CosFace人臉識別算法并不斷優(yōu)化。在語音識別技術領域,中國科大訊飛處于世界領先水平,它推出的語音轉錄系統(tǒng)甚至可以識別部分方言。此外,各種內容推薦系統(tǒng)的設計也離不開深度學習技術的應用,日常生活中的種種智能推送就是最常見的情形。比如,音樂播放軟件可以根據個人平時喜歡的音樂風格,推送類似的音樂作品;再如,假若用戶經常關注某種商品,其購物車里就會塞滿相應的商品信息,微博、微信平臺也會根據用戶興趣投放相關廣告等。這類網站實現(xiàn)自動推送的原理就是計算機通過復雜運算對大數據進行降級,找到邏輯上并非因果關系、但現(xiàn)象上共現(xiàn)的消費習慣,從而實現(xiàn)廣告的定向投放,以達到盈利目的。
三、深度學習跨領域的互通性
(一)人的學習先于機器學習
可以說,“深度學習”概念在不同領域廣泛使用的現(xiàn)象,已經引起相關領域研究人員的關注。李小濤等從計算機科學的角度,抨擊教育學界誤讀“深度學習”概念,作者指出,深度學習僅指機器學習而不可用以討論人的學習,并稱其原因是緣于教育界盲目求新,受到盲目崇外的功利主義影響而套用概念[12]。對這一觀點,筆者不敢茍同。第一,從哲學角度講,非此即彼的思維方式仍局限在二元論的樊囿之中,很容易使研究者只關注到事物的對立面和矛盾面,卻看不到它們潛在的聯(lián)系,因而所得結論也往往是非此即彼,易流于偏狹。第二,從概念緣起講,機器學習的研究興起于人工智能時代大背景,而人工智能(AI)的全稱為“Artificial Intelligence”,劍橋英語詞典對其定義如下:“the study of how to produce machines that have some of the qualities that the human mind has, such as the ability to understand language, recognize pictures, solve problems, and learn”。由該定義即可清晰看出,人工智能是研究如何制造具有人類某些思維特性的機器,如理解語言、識別圖像、解決問題和學習的能力。反觀劍橋英語詞典對“深度學習(deep Learning)”的定義,則包括兩個義項:一是隸屬教育界的義項:“a complete way of learning something that means you fully understand it and will not forget it”,譯成中文為:“深度學習是一種徹底的學習方式,它意味著學習者能夠完全理解所學知識且不會遺忘”。二是由此衍生出計算機領域義項:“a type of artificial intelligence that uses algorithms (=sets of mathematical instructions or rules) based on the way the human brain operates”,譯成中文為:“深度學習是人工智能的一種,它使用基于人腦運作方式的算法(數學指令或規(guī)則集)”。從詞源角度來看,孰先孰后已不言自明。正如我們不能因為火星被命名為“火星”之后才要承認它的真實存在,我們也不能因為計算機領域“率先”使用了“深度學習”的名稱而否認“深度學習”首先發(fā)生于人的學習這一事實。同時,就其概念本身而言,人工智能(包括機器學習這一子領域)也始于對人腦的模仿。
(二)大數據時代深度學習的雙重迫切性
二十一世紀最顯著的時代特征之一便是信息過載。以往人們獲取信息的方式相對單一,主要來自于紙媒、電視、廣播等傳統(tǒng)媒體。如今人人都可以是一個自媒體,人的社會屬性中增添了網絡用戶的身份。人們每天都在主動獲取或被動接收大量信息,與此同時,又有意或無意地產生著大量數據?,F(xiàn)代觀念認為,信息不等于知識。信息不僅數量龐大,而且有時還真?zhèn)坞y辨,即便對同一事件的描述和報道都難以做到一致,甚至會出現(xiàn)媒體觀點截然相反的情況。在上述形勢之下,如何去偽存真便成為當今人們認知世界的必備素養(yǎng),這就需要對信息進行邏輯加工和深入分析。人們不能依賴機器告知自己哪條消息屬實乃至哪個觀點正確,畢竟企業(yè)的本質是以盈利為目的的,它們往往更在乎用戶的關注度和訪問量。因此,內容投放算法通常會按用戶興趣投其所好,推送的內容自然傾向于單一化、片面化。由此可見,信息接受者若想從中去偽存真,就需要借助深度學習。換言之,只有全方位獲取信息并綜合分析,才能避免自己的觀點被算法塑造的局面。因此,在人機交互加劇的時代,人們比以往更需具備深度學習的能力。
另一方面,從企業(yè)發(fā)展角度來看,在大數據時代,誰能夠率先準確地把握用戶的數據規(guī)律和興趣愛好,誰就可以率先完成定制化服務,也就能率先占領市場。中國是世界上網民數量最多的國家,擁有全球最龐大的用戶數據,這無疑是一大優(yōu)勢。就目前而言,中國的電子商務平臺、電子支付和云計算等已領先于世界其他國家。如何進一步利用好大數據,無疑是技術領域迫切需要關注的課題,從促進國家經濟發(fā)展的角度是如此,從服務世界的角度亦是如此。簡言之,在大數據時代背景下,機器的深度學習目標是在于發(fā)現(xiàn)用戶偏好,發(fā)現(xiàn)用戶共性;而人的深度學習目標則是在于去偽存真,發(fā)展個性。
四、概念譯名的相關思考
從某種意義上來說,對“深度學習”進行深入剖析,也是反思人類自身學習與訓練機器學習的過程。深度學習(deep learning)這一概念同時存在于教育教學和計算機科學領域,并非如某些研究者所說的那樣是由盲目求新而導致的概念混用。我們認為,兩個領域同時存在“深度學習”的根本原因是在于:技術革新讓機器更加智能化,讓人工智能逐漸接近人類智能,包括對信息的分析和加工。盡管如此,機器學習畢竟不同于人的學習,機器處理數據的過程嚴格遵照編程邏輯,沒有情感因素和環(huán)境變量,但人腦對信息進行加工的每一個環(huán)節(jié)都是綜合因素共同作用的結果,因此,在翻譯時仍然有必要對其加以區(qū)分?;蛘咄硕笃浯?,同名概念詞義擴充后有必要區(qū)分各個義項。
為了探求恰切的譯名,基于前文論述,可進一步歸納出機器深度學習與人的深度學習具有以下聯(lián)系與區(qū)別:1.人的學習先于機器學習,機器學習的本質是對人腦學習的模仿,機器學習是帶有修辭性的說法,是將機器運算比作人腦思考的隱喻。2.機器學習是計算機程序的數據運算過程,具有穩(wěn)定性,可準確預測運算結果;人的學習則是蘊含心智和情感變化的綜合信息加工過程,受多重因素影響,具有偶然性和不確定性。3.所謂機器的深度學習實際上是深層次遞推的數據處理過程,可以拆解為具體的層次,且每個層級運算中的變量是確知的;人的深度學習則是指基于學習者現(xiàn)有知識獲取新知識的邏輯性思維過程,無法絕對區(qū)分深淺層次,只能以“度”來模糊化描述。
進一步分析,機器學習中的深度學習可以由具體的算法模型來呈現(xiàn),其“深度”集中體現(xiàn)在機器通過訓練達成了中間過程可以不受人干預而完成運算。也就是說,原始數據經過多個層次的處理,最終以直觀的方式表示出規(guī)律來,縱使層次再多,各層次間也有清晰的邊界?;趯eb of Science數據庫該主題下高引文獻的分析,可以看出,Hinton[13]、LeCun[8]、Young[14]等代表性學者均將機器學習模型稱為“Multilayer generative models(多層的生成模型)”,而將機器的多個處理層表述為“Multiple Processing Layers”,這是因為“Layer”更能揭示其原理與本質。至于這些學術論文標題中出現(xiàn)的“Deep Learning”,則是為了讓標題更為簡潔以及起到隱喻的修辭效果。換言之,機器學習中的深度實際上是“深層”。因此,我們建議,將計算機科學領域的“深度學習”更改為“深層學習”,對應的英文亦更改為“Deep-layered Learning”。實際上,與其說“更改”這個術語的名稱,倒不如說只是將它的表達還原為完整的形式。相應的,正如Mnih等學者所言,人腦對信息的處理是綜合感知“High-dimensional Sensory Inputs”和高層級運算“Hierarchical Sensory Processing Systems”[15]。也就是說,對于人的深入學習,我們既無法將之層級化,也無法嚴格地量化描述其過程。因此,就人的學習而言,繼續(xù)沿用“深度學習”這一概念無疑是貼切妥當的,它也與英文“Deep Learning”完全對應。上述建議或許能為學界提供一定參考,以避免概念誤讀與混同。
五、結語
著名翻譯家嚴復曾對術語的翻譯大加感慨:“一名之立,旬月踟躕。”辜正坤先生亦指出:“一名誤立,可造成相當嚴重的學術后果”[16]。特別是科技術語的翻譯,如果直接按照字面翻譯而不去仔細推敲其概念范疇,則很可能會放大或縮小其本義,甚至會掩蓋詞匯的真正意義,從而導致讀者對這一概念的誤解、誤用。從這個角度來說,如果將計算機科學領域的“deep learning”不假思索、不加限定地直譯為“深度學習”,就會在術語名稱的默許之下“拔高”機器的智能化程度。
厘清概念進而確立譯名只是第一步,學界跨領域合作才是取得突破的必由之路。機器的智能化日益提升,科技的腳步不會就此停歇,那么,機器可以在何種程度上取代人類呢?當下比較主流的觀點認為,目前機器可以代替人們進行具有重復性、規(guī)律性的工作。人區(qū)別于機器的根本特性是在于人類具有創(chuàng)造性,畢竟機器也是由人創(chuàng)造的。不過,這種觀點越來越受到挑戰(zhàn),人工智能已經能夠創(chuàng)作出美妙的音樂,繪制出美麗的風景畫,甚至可以翻譯、作詩等。也正如此,有人已經開始考慮機器創(chuàng)作作品的產權歸屬問題了,它應該是屬于制造機器的人,還是屬于機器或機器賴以分析加工的大數據?既然機器可以把人們從重復、機械的勞動中解脫出來,那么人們就更應該投入更多的精力去關注審美和創(chuàng)造、和平與發(fā)展。從前文的論述可以看出,至少在現(xiàn)階段,所謂的“機器創(chuàng)作”,主要仍是基于對已有數據的拆解與重組,還不能算真正意義上的創(chuàng)造。如果有朝一日機器真的具備了感情,那大概要基于某種特定算法。即使如此,它仍具有規(guī)定性,可以預設、可以運算、可以預測、可以反復驗證,這樣一來,也就喪失了審美意味和自然偶發(fā)的特性。我們認為,除非生物神經網絡和人工神經網絡的邊界進一步模糊,人工智能才有可能實現(xiàn)真正意義上的“創(chuàng)造”,不過,這一假設尚待今后科學發(fā)展的驗證。
參考文獻:
[1][美]洛林·W.安德森等.布盧姆教育目標分類學:分類學視野下的學與教及其測評(修訂本)[M].蔣小平,張琴美,羅晶晶譯.北京:外語教學與研究出版社,2009.
[2]安富海.促進深度學習的課堂教學策略研究[J].課程·教材·教法,2014,(11).
[3][美]Jensen,E. & Nickelsen,L.深度學習的7種有力策略[M].溫暖譯.上海:華東師范大學出版社,2010.
[4]郭華.深度學習及其意義[J].課程·教材·教法, 2016,(11).
[5]張浩,吳秀娟.深度學習的內涵及認知理論基礎探析[J].中國電化教育,2012,(10).
[6]Marton,F(xiàn). & S?lji?,R.On Qualitative Difference in Learning:Ⅰ——Outcome and Process[J].British Journal of Educational Psychology,1976,(1).
[7]嚴燕.人工智能時代英語教學促進學生深度學習路徑探究[J].教學與管理,2019,(27).
[8]LeCun,Y.,Bengio,Y. & Hinton,G.Deep learning[J].Nature,2015,(521).
[9]Hinton,G.E. & Salakhutdinov,R.R.Reducing the dimensionality of data with neural networks[J].Science,2006,(313).
[10]王連柱.機器學習應用于語言智能的研究綜述[J].現(xiàn)代教育技術,2018,(9).
[11]黃立威,江碧濤,呂守業(yè),劉艷博,李德毅.基于深度學習的推薦系統(tǒng)研究綜述[J].計算機學報,2018,(7).
[12]李小濤,陳川,吳新全,王海文.關于深度學習的誤解與澄清[J].電化教育研究,2019,(10).
[13]Hinton,G.E.Learning multiple layers of representation[J].Trends in Cognitive Sciences,2007,(10).
[14]Young,T.,Hazarika,D.,Poria,S. & Cambria,E.Recent Trends in Deep Learning Based Natural Language Processing[J].Ieee Computational Intelligence Magazine,2018,(3).
[15]Mnih,V.,Kavukcuoglu,K.,Silver,D.,et al.Human-level control through deep reinforcement learning[J].Nature,2015,(518).
[16]辜正坤.外來術語翻譯與中國學術問題[J].中國翻譯, 1998,(6).
On “Deep Learning” and Its Translation
Li Jingping
(School of English and International Studies, Beijing Foreign Studies University, Beijing 100089, China)
Abstract:Starting from the phenomenon that “deep learning” is frequently confused in the fields of education and computer science, this paper first traces the concept of “deep learning” in these two fields respectively, and points out that machine learning derives its name from human learning, and is a conceptual metaphor. The article then compares the similarities and differences of the two concepts and concludes that human deep learning involves complex factors such as emotional and environmental factors and is a complex mental activity with many variables, thus its results vary from person to person. Machine deep learning, however, is an operation process based on multi-layered algorithm, in other words, it is controllable and predictable. Finally, the paper puts forward new translated names for this term in order to avoid further confusion between the two concepts.
Key words:deep learning;deep-layered learning;machine learning;term translation