徐靜(鄭州大學(xué)軟件與應(yīng)用科技學(xué)院,河南 鄭州 450003)
深度學(xué)習,作為機器學(xué)習研究中一個新的范疇,其過程是創(chuàng)建和模擬人腦進行分析學(xué)習的神經(jīng)網(wǎng)絡(luò),從而能夠模仿人腦的機制,來讀取和分析數(shù)據(jù)。廣義地說,人工神經(jīng)網(wǎng)絡(luò)更貼近大眾生活的名稱是深度學(xué)習,深度學(xué)習的“深”是指網(wǎng)絡(luò)的深度。在過去深度網(wǎng)絡(luò)的說法并不存在,但隨著Hinton在《科學(xué)》發(fā)表文章指出,如果把神經(jīng)網(wǎng)絡(luò)加深而不是加寬,那么這個網(wǎng)絡(luò)會取得很好的效果。深度學(xué)習就是由這一現(xiàn)象延伸出來的,此后大家也逐漸習慣用深度學(xué)習來建立各種模型并用深度一詞來彰顯模型的特性。
大數(shù)據(jù)+大模型+大平臺,使得深度學(xué)習成為人工智能時代的核心驅(qū)動力之一。從自動販賣機到汽車無人駕駛再到機器翻譯,它們背后所隱藏的深度學(xué)習及其模型也在不斷的被發(fā)掘和研究。目前,關(guān)于深度學(xué)習的研究熱點主要集中在以下方面:
? 深度強化、遷移學(xué)習(感知能力與決策能力的有力結(jié)合,AlphaGo,無人超市值守);
? 深度對偶學(xué)習(對偶框架下的無監(jiān)督學(xué)習)
? 深度遞歸/循環(huán)神經(jīng)網(wǎng)絡(luò)(自然語言處理,如機器翻譯);
? 并行化深度學(xué)習(如基于TensorFlow,Caffe基于算法設(shè)計下的多通路、多分辨深度網(wǎng)絡(luò)搭建與平臺設(shè)計);
? 深度生成網(wǎng)絡(luò)(深度置信網(wǎng)絡(luò),生成式對抗網(wǎng)絡(luò),變分白編碼器,深度貝葉斯網(wǎng)絡(luò));
?基于卷積神經(jīng)網(wǎng)絡(luò)的目標檢測、識別與迫蹤(RCNN,Fast-RCNN,R-FCN,YOLO,SSD等等);
? 傳統(tǒng)模型與深度學(xué)習的融合。
實際上,深度學(xué)習并不是一個全新的名詞,它可以追溯到上世紀40年代。迄今為止,它已經(jīng)經(jīng)歷了三個階段的發(fā)展,但是直到2006年,Hinton等人在機器學(xué)習中的相關(guān)工作使深度學(xué)習又重現(xiàn)大眾眼前并逐漸有復(fù)興之象。近年來伴隨著人工智能的普及已經(jīng)在很多領(lǐng)域取得了重大的突破,也由第一代深度學(xué)習模型演化成了后深度學(xué)習模型。其中深度卷積神經(jīng)網(wǎng)絡(luò)CNN、深度循環(huán)/遞歸神經(jīng)網(wǎng)絡(luò)RNN,LSTM、深度強化學(xué)習深度等等均已經(jīng)在一些具體的現(xiàn)實場景中得到了廣泛地應(yīng)用。
然而,深度學(xué)習在理論上的進展卻遠遠不盡人意。比如說沒有統(tǒng)一的理論可以指導(dǎo)在不同模型中網(wǎng)絡(luò)分多少層或者在不同場景下初始化參數(shù)應(yīng)該如何正確設(shè)置等等。近年來雖然深度學(xué)習已經(jīng)被廣泛應(yīng)用且取得了不可思議的研究成果,但這些研究成果并不能很好地解釋其中所蘊含的各種理論。
其次,目前深度學(xué)習遇到了嚴重的計算瓶頸。在這一方面,很多人都存在一個誤區(qū),研究人員往往執(zhí)著于關(guān)注深度學(xué)習的計算本身。實質(zhì)上,帶寬問題才是在研究深度學(xué)習過程中遇到的最大瓶頸。
另外,深度學(xué)習具有一定的局限性。某種準則下,淺層網(wǎng)絡(luò)不一定比深度學(xué)習運用的深層網(wǎng)絡(luò)性能差。比如說優(yōu)化目標函數(shù),訓(xùn)練深度網(wǎng)絡(luò)在計算和調(diào)試方面成本代價太高,并且對于許多日常預(yù)測問題并沒有任何意義此時運用淺層網(wǎng)絡(luò)就足夠了,在滿足需要的同時更節(jié)約了成本。再比如說我們在一些特定情況下需要的模型,雖然深度網(wǎng)絡(luò)模型預(yù)測或者表征能力相對淺層網(wǎng)絡(luò)更為強大,但卻存在可解釋性差不易理解等問題。
(1)無人駕駛
目前,無人駕駛必須要具備環(huán)境感知、高精度地圖導(dǎo)航和駕駛決策三個部分的能力。首先,環(huán)境感知包括車道線、車輛、行人、交通標志等的自動檢測,使用深度學(xué)習可以訓(xùn)練出一個識別率非常高的分類器從而能夠使環(huán)境感知部分以高精度完成,為駕駛決策模塊提供正確的環(huán)境信息與認知,保證無人駕駛正常的完成。
另外,在高精度地圖的創(chuàng)建與導(dǎo)航方面也會用到深度學(xué)習。高精度地圖基于視覺,運用深度學(xué)習高識別率的特性,通過識別特定的標志(建筑物等)從而定位車輛的位置或者目的地。
最后,駕駛決策部分,運用深度學(xué)習通過試錯與自我修正的方法完成駕駛策略的決策。核心技術(shù)。
(2)無人超市值守
目前,無人超市面向“人與商品”之間發(fā)生的關(guān)系(動作),通過傳感器采集數(shù)據(jù),建立起一個關(guān)于任何商品間動作關(guān)系的大數(shù)據(jù)(人與商品間動作關(guān)系集),進一步使用深度學(xué)習技術(shù)建立人與商品之間的動作判別模型,提高系統(tǒng)反作弊識別能力的同時,結(jié)合超市進出口支付系統(tǒng),完成購物。其中所包含的數(shù)據(jù)獲取結(jié)構(gòu)、模型設(shè)計原則、核心模塊構(gòu)建均采用了深度學(xué)習模型。核心技術(shù)驅(qū)動:基于卷積神經(jīng)網(wǎng)絡(luò)的識別系統(tǒng),例如網(wǎng)絡(luò)模型SSD。
(3)機器翻譯
“翻譯”一詞大家都不陌生,其中翻和譯就表明了其包含兩個部分即編碼和譯碼。編碼階段和譯碼階段均采用了深度學(xué)習,編碼階段:運用深度學(xué)習中的RNN網(wǎng)絡(luò)源語言子句被編碼成一固定長度的輸出隱向量;解碼階段:仍使用RNN把編碼階段輸出的固定長度的隱向量解碼成目標語言子句。
(1)首先是要慶幸我們生活在這個大數(shù)據(jù)的時代。深度學(xué)習本就與大數(shù)據(jù)有著千絲萬縷的聯(lián)系,深度學(xué)習可以從大數(shù)據(jù)中挖掘出全新的有價值的數(shù)據(jù)、知識和規(guī)律從而將這些知識運用到新數(shù)據(jù)上。而我們現(xiàn)有的大數(shù)據(jù)恰恰為深度學(xué)習的發(fā)展創(chuàng)造了極有利的條件。
(2)深度學(xué)習模型具有強大的擬合能力、高密度的計算能力、并且可以海量的訓(xùn)練數(shù)據(jù),它們是深度學(xué)習獲得成功的重要因素。
(3)深度學(xué)習的應(yīng)用范圍非常廣泛,可以滲透應(yīng)用到很多領(lǐng)域。比如說棋類博弈、復(fù)雜函數(shù)擬合、機器編譯等等。
(4)人工智能日益普及,大量智能產(chǎn)品已經(jīng)出現(xiàn)在了人們?nèi)粘5纳町斨星艺诒憷覀兊纳睿祟惾找嬖鲩L的便利需求不斷推動著深度學(xué)習的完善和發(fā)展。
第一,深度學(xué)習可以解決一些不能運用理論完全解釋的問題,也就是說“知其然,不知其所以然”的問題;第二,它能夠針對一些充滿不確定性的問題,不斷的變化,不斷的再學(xué)習。第三,深度學(xué)習還有一個徹底改變傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的作用,它不單單做函數(shù)映射,更主要的是提取那些多層次反復(fù)的模式。一個深度學(xué)習所推動的智能世界正在到來,我們沒有其他選擇,只能雙倍押注,奔赴這未來。