肖堅
摘要:本文對小樣本類人概念學(xué)習(xí)與大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)進(jìn)行對比分析,文中對大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)、小樣本類人概念學(xué)習(xí)兩者含義、發(fā)展、優(yōu)劣等進(jìn)行了探討,最后對兩者進(jìn)行總體比較。
關(guān)鍵詞:小樣本學(xué)習(xí);類人概念學(xué)習(xí);深度強(qiáng)化學(xué)習(xí);對比
在現(xiàn)代計算機(jī)發(fā)展的過程中,機(jī)器學(xué)習(xí)是現(xiàn)階段較為新穎的領(lǐng)域,但實際上是極為寬泛的概念,大數(shù)據(jù)深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)是其中較為重要的分支,深度強(qiáng)化學(xué)習(xí)則是兩種學(xué)習(xí)算法的融合。小樣本類人概念也是較為新穎的概念,相比于深度強(qiáng)化學(xué)習(xí),其有更多待發(fā)掘的內(nèi)涵。
一、大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)
深度學(xué)習(xí)最初發(fā)展于2006年,是一種機(jī)器學(xué)習(xí)中隱藏建模數(shù)據(jù)分布、多層表達(dá)的算法。換言之,深度學(xué)習(xí)算法能夠?qū)Ψ诸愔行枨蟮牡讓踊蛘吒邔犹卣鞯淖詣犹崛 K陨疃葘W(xué)習(xí)算法對于數(shù)據(jù)特征能夠進(jìn)行更好的進(jìn)行表達(dá),同時因為模型參數(shù)和層次多,容量也極大,能夠進(jìn)行大規(guī)模數(shù)據(jù)表示,對于語音、圖形此類特征不明顯數(shù)據(jù),能夠使用深度學(xué)習(xí)算法進(jìn)行大規(guī)模數(shù)據(jù)訓(xùn)練,效果也能夠保證良好。深度學(xué)習(xí)算法模型中,會把特征與分類器進(jìn)行結(jié)合,形成一個框架,之后使用數(shù)據(jù)進(jìn)行特征的學(xué)習(xí),以此也使得使用中手工提取特征這一工作減少,學(xué)習(xí)算法中的工作量大大降低,因此使用便利、效果良好。深度學(xué)習(xí)算法使得數(shù)據(jù)處理中語音及圖像的識別得到極大推動。
強(qiáng)化學(xué)習(xí)則是一種連續(xù)決策過程,該算法的最大特點就是對任何數(shù)據(jù)都不會進(jìn)行標(biāo)注,只會提供唯一回報函數(shù),這一函數(shù)對當(dāng)前狀態(tài)結(jié)果有著決定性的影響。從數(shù)學(xué)的額角度來看,也是馬爾科夫決策過程。強(qiáng)化學(xué)習(xí)最終的目標(biāo)是使得決策過程中整體回報函數(shù)期望最優(yōu)化。在經(jīng)過神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),深度學(xué)習(xí)算法對于較多實際問題有了解決辦法,比如圖像搜索、人臉識別、色情語言識別、實時翻譯等。強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)的融合,使深度學(xué)習(xí)得到更為長遠(yuǎn)的發(fā)展,比如進(jìn)行游戲深度學(xué)習(xí)網(wǎng)絡(luò)的建立,就能夠在強(qiáng)化學(xué)習(xí)的支持下,實現(xiàn)自己與自己對戰(zhàn),不斷實現(xiàn)自我的進(jìn)化。
二、小樣本類人概念學(xué)習(xí)
深度學(xué)習(xí)在得到開發(fā)前,人工神經(jīng)網(wǎng)絡(luò)也曾風(fēng)靡一時。上世紀(jì)八十年代末,人工神經(jīng)網(wǎng)絡(luò)中應(yīng)用的反向傳播算法出現(xiàn),使得以統(tǒng)計模型為基礎(chǔ)的機(jī)器學(xué)習(xí)得到發(fā)展。此前,有研究人員希望通過BP算法使人工神經(jīng)算法模型從訓(xùn)練中學(xué)習(xí)統(tǒng)計性的規(guī)律,以此使其獲得對未來進(jìn)行預(yù)測的能力。BP算法無法實現(xiàn)這一目標(biāo),所以在上世界九十年代這一浪潮便逐漸平息。但是在BP算法的發(fā)展過程中,也有了更多的新奇思路,使以統(tǒng)計為基礎(chǔ)的機(jī)器學(xué)習(xí)算法和以人工規(guī)則為基礎(chǔ)的系統(tǒng)得到對比,明確了以統(tǒng)計為基礎(chǔ)的機(jī)器學(xué)習(xí)算法在較多方面都擁有先天的優(yōu)勢。但深度學(xué)習(xí)也并非無所不能,科學(xué)進(jìn)步都存在一定兩面性,一方面是優(yōu)勢提升,一方面是限制增大。
在機(jī)器學(xué)習(xí)的整個行業(yè)而言,深度學(xué)習(xí)對于行業(yè)所要求的人工智能需求也是難以達(dá)成的。深度學(xué)習(xí)是以大數(shù)據(jù)為基礎(chǔ),在多層網(wǎng)絡(luò)的處理下實現(xiàn)抽象概念理念,這也說明在進(jìn)行應(yīng)用中,數(shù)據(jù)越多則擁有更好的效果。但是也即是說,在沒有大數(shù)據(jù)支持的情況下,或者數(shù)據(jù)量較小的情況下,便無法進(jìn)行學(xué)習(xí)。人類知識與深度學(xué)習(xí)有一定相似之處,都是通過積累所得,但人類在知識的沒有積累的情況下,也可以根據(jù)形貌進(jìn)行分析、學(xué)習(xí),進(jìn)而模仿。深度學(xué)習(xí)從這一方面來看,與人類智能還存在較大的差距,人類在陌生環(huán)境中可以通過學(xué)習(xí)來對變化進(jìn)行適應(yīng)。所以類人概念學(xué)習(xí)的發(fā)展過程中,對于深度學(xué)習(xí)存在的弊端進(jìn)行改良,可以再沒有大數(shù)據(jù)的情況下自行學(xué)習(xí),這一概念也被研究者稱為小樣本學(xué)習(xí)。
小樣本學(xué)習(xí)早在神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前就已經(jīng)被提出,而關(guān)鍵核心為貝葉斯規(guī)劃學(xué)習(xí),也被稱作BPL方法。該方法是通過參數(shù)先驗分布,使用小樣本數(shù)據(jù)進(jìn)行后驗分布的計算,進(jìn)而得到總體分布。該方法是使用概率進(jìn)行所有形式不確定性的標(biāo)識,通過概率規(guī)則來進(jìn)行推理和學(xué)習(xí)。BPL方法是以人類思維作為基礎(chǔ)的方法,即能夠不依賴大量數(shù)據(jù)來進(jìn)行學(xué)習(xí),只需要小樣本便能迅速進(jìn)行學(xué)習(xí)精髓。拿漢字為例,將一個漢字作為小樣本使用BPL方法進(jìn)行學(xué)習(xí),很快便能夠?qū)W習(xí)到精髓,并寫出該漢字,甚至能夠?qū)⑵渌愃莆淖謱懗?。因為該方法每個訓(xùn)練樣本都能進(jìn)行增量升高或降低一種假設(shè)估計概率,BPL方法也順利達(dá)成視覺圖靈測試要求,而其他算法對于某一假設(shè)和其他任何樣本不統(tǒng)一時,將假設(shè)摒棄。BLP方法在進(jìn)行應(yīng)用中,對于概率初始知識有所要求的,在概率位置的情況下可以根據(jù)數(shù)據(jù)、背景知識、基準(zhǔn)分布假設(shè)來進(jìn)行此類概率的估算。
三、小樣本類人概念學(xué)習(xí)與大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)的對比分析
通過上文對兩個學(xué)習(xí)算法的分析來看,深度學(xué)習(xí)算法在現(xiàn)階段中已經(jīng)獲得重大成功,但是在未來發(fā)展過程中其也具有較大的局限性,最為突出的便是深度學(xué)習(xí)使用的效果是與數(shù)據(jù)量成正比的,同時在較多任務(wù)中表現(xiàn)一般;而BPL方法則對機(jī)器學(xué)習(xí)、認(rèn)知科學(xué)、人工智能有著極大貢獻(xiàn),在未來發(fā)展中也具有一定前景。深度學(xué)習(xí)對于計算機(jī)中的大數(shù)據(jù)處理需求進(jìn)行了滿足,實現(xiàn)大量數(shù)據(jù)中習(xí)得抽象概念;BPL方法使得樣本量小的情況下機(jī)器學(xué)習(xí)實現(xiàn),能夠?qū)π颖具M(jìn)行學(xué)習(xí)、決策。更加形象化的理解,深度學(xué)習(xí)能夠?qū)σ?guī)律、趨勢進(jìn)行分析和預(yù)測,而BPL方法則能當(dāng)機(jī)立斷,舉一反三;深度學(xué)習(xí)與人類閱讀書籍一樣,積累會形成相應(yīng)的判斷能力,BPL方法則是通過個案學(xué)習(xí)來進(jìn)行迅速化的決策。
四、結(jié)論
本文對兩種學(xué)習(xí)算法進(jìn)行了分析和對比,明確了兩種算法自身存在的有點及缺陷:小樣本類人概念學(xué)習(xí)算法具有通過小樣本學(xué)習(xí)迅速決斷的能力,但有一定概率錯誤,尤其在先驗概率為形成的情況下;大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)通過大量數(shù)據(jù)的學(xué)習(xí),來形成判斷能力大,判斷也有錯誤概率,但相對BPL更小,但明顯依賴大數(shù)據(jù)數(shù)量。在應(yīng)用中,兩者并非是互相對立的,反而能夠通過借鑒、互補(bǔ)實現(xiàn)學(xué)習(xí)算法進(jìn)一步發(fā)展。
參考文獻(xiàn)
[1]崔小洛,欒曉飛,基于深度強(qiáng)化學(xué)習(xí)的圖像修復(fù)算法設(shè)計[J].物聯(lián)網(wǎng)技術(shù),2019(06):58-60.
[2]李旭,曹繼征,大數(shù)據(jù)在公安交通管理中的應(yīng)用探討[J].環(huán)球市場,2018(09):166-167.