2013年12月,Facebook宣布“深度學習”技術創(chuàng)始人之一,紐約大學教授揚·樂康加盟該公司人工智能實驗室。樂康稱,近年來興起的“深度學習”技術,在圖像識別、自然語言識別等領域得到了極其成功的應用,將對Facebook的未來產生重大影響。至此,Google、百度、微軟、IBM和Facebook等諸多巨頭悉數進軍深度學習領域。
深度學習技術由起源于上世紀50年代的神經元網絡技術發(fā)展而來。大腦的思維分為邏輯思維、直觀思維和靈感思維。神經元網絡模擬直觀思維。單個神經元的結構簡單,功能有限,大量神經元構成的網絡系統(tǒng)可以實現信息的分布式存儲和并行協(xié)同處理。神經網絡是一個具有學習能力的系統(tǒng)。它能夠從環(huán)境中學習,并把學習的結果分布存儲于網絡的突觸連接中。學習過程結束后,神經元網絡就可以對真實數據進行歸類。
早期的神經網絡分為輸入層、處理層和輸出層,模擬少量的神經元,對象復雜就無法識別。另外,系統(tǒng)不能自動學習,需不斷人工干預。上世紀80年代,提出了“深層”神經網絡,處理層由單層變?yōu)槎鄬印?006年又提出了更有效地訓練神經元的新方法,逐層深入學習,理論上可以實現無需人工干預的“無監(jiān)督學習”,學習完成后,系統(tǒng)就可以正確識別圖像和聲音。
2012年,谷歌在其X實驗室建立了有10億個節(jié)點,深度為9層神經元系統(tǒng),向網絡輸入1000萬個YouTube視頻截圖,采用“無監(jiān)督學習”算法,系統(tǒng)用一周時間完成自主學習。完成“深度學習”后的系統(tǒng)成功地識別出了貓臉,準確率比此前的記錄提高70%。
谷歌的貓臉實驗極大地激發(fā)了學界和產業(yè)界對深度學習技術的熱情,微軟、IBM、Facebook和諸多大學都設立專門機構,投入深度學習技術的研發(fā)。2013年1月,百度CEO李彥宏宣布在美國硅谷,毗鄰谷歌總部建立深度學習研究院(IDL)。
兩年來,各家企業(yè)在深度學習技術上獲得諸多令人耳目一新的實用性成績,其成就令人振奮。
2012年,Google在Android上采用深度學習神經網絡,使語音識別的成功率大大提高,尤其是在嘈雜的環(huán)境中,語音搜索結果也顯著改善。一夜之間,智能手機語音識別系統(tǒng)的錯誤率就下降到了25%。2012年12月,微軟亞洲研究院展示了采用深度學習技術的中英即時口譯系統(tǒng),錯誤率僅為7%,發(fā)音十分流暢。
2013年11月,百度深度學習研究院首席科學家張潼在全球軟件開發(fā)大會發(fā)表了大數據及深度學習的演講。他在演講中介紹了百度取得的一些成果。到目前為止,百度已經有超過8項深度學習技術在百度產品上線。語音識別錯誤率降低20-30%,色情圖像識別準確率超過傳統(tǒng)方法100%,用于貼吧圖搜黃反作弊,成效顯著。
深度學習在云計算和大數據日趨成熟的背景下取得了實質性進展。云計算為深度學習提供了平臺,大數據為深度學習提供礦石,深度學習因此才得以在云平臺上,在大數據中淘出黃金。深度學習雖然還處于發(fā)展初期,但它將人類帶到了機器直觀思維的新時代門口,看到了令人難以置信的未來。
在人類信息革命的歷程中,無論是計算機軟件硬件、互聯網、云計算還是大數據,中國本土的IT企都沒趕上趟,僅僅扮演跟隨者的角色。但是在剛剛興起的深度學習技術潮中,本土企業(yè)百度和谷歌、微軟、IBM、Facebook共同站到進了第一梯隊。應該指出。這在中國IT史上將是一個標志性事件。