陳強(qiáng)
摘 要:隨著科技和經(jīng)濟(jì)的持續(xù)進(jìn)步,人工只能技術(shù)已經(jīng)逐漸變成目前我們國(guó)家十分重視的對(duì)象之一?,F(xiàn)如今我們國(guó)家已經(jīng)進(jìn)入了信息化時(shí)代,每個(gè)人在日常生活中都將接觸到大量的信息資訊。早期的信息處理主要通過人工的方式,顯然這一模式現(xiàn)如今已經(jīng)顯得十分過時(shí),無法滿足人們的正常需要。基于這一情況,大數(shù)據(jù)就此誕生,其能夠直接從海量的數(shù)據(jù)資料中提取人們需要的內(nèi)容,不僅高效,而且精確度高。而大數(shù)據(jù)本身有何機(jī)器學(xué)習(xí)之間有著非常重要的聯(lián)系。為此,相關(guān)工作人員理應(yīng)對(duì)于其模型設(shè)計(jì)方面提高重視。本篇文章將闡述機(jī)器學(xué)習(xí)模型的設(shè)計(jì)種類,并低于具體分類方面提出一些合理的見解。
關(guān)鍵詞:大數(shù)據(jù) 機(jī)器學(xué)習(xí) 設(shè)計(jì)方法
引 言
從現(xiàn)階段發(fā)展而言,機(jī)器學(xué)習(xí)一直都屬于人工智能技術(shù)中的一類,主要是指讓電腦能夠像人體的思維模式一樣自主展開知識(shí)學(xué)習(xí),以此提升數(shù)據(jù)的處理速度。這種方式能夠有效幫助大數(shù)據(jù)平臺(tái)完成分析的工作,并且提升計(jì)算的精確性和速率。
一、支持向量機(jī)
早在上世紀(jì)90年代,科學(xué)研究者便創(chuàng)建了支持向量機(jī),又被稱作SVM,其主要是一種全新的機(jī)器學(xué)習(xí)模型,具有很強(qiáng)的學(xué)習(xí)能力,能夠自主完成知識(shí)分析和提取。當(dāng)該模型剛一誕生,便立刻在智能科技領(lǐng)域中掀起了巨大的浪潮,引起了全球媒體的關(guān)注。這一模型主要是在VC維理論的基礎(chǔ)上創(chuàng)建,并將結(jié)構(gòu)風(fēng)險(xiǎn)最小原理融入其中。在實(shí)際操作的時(shí)候,將樣本提供的數(shù)據(jù)作為基礎(chǔ)點(diǎn),以此可以在模型本身的復(fù)雜性特點(diǎn)以及學(xué)習(xí)能力之間能夠找出其中存在的平衡點(diǎn)位置,進(jìn)而確保其效果能夠充分展現(xiàn)出來。由于當(dāng)時(shí)還沒有大數(shù)據(jù)存在,因此該模型往往能夠在小樣本、分線性以及高維模式中得以應(yīng)用,以此完成識(shí)別、檢測(cè)以及翻譯的工作[1]。
目前來看,SVM可以算是全世界應(yīng)用率最高的學(xué)習(xí)模型。例如在愛進(jìn)行線性可分的問題處理時(shí),其可以將其中間隔最大的一個(gè)平面提取出來,以此將兩種完全不同的樣本分開。該平面本身具有很強(qiáng)的泛化能力。線性不可分一直都是一種十分普遍的情況,因此經(jīng)常由于對(duì)偶的問題導(dǎo)致目標(biāo)函數(shù)難以確定。為了處理這一問題,通常需要采取兩種方法,分別是軟間隔優(yōu)化以及核技巧。軟間隔優(yōu)化主要是依靠對(duì)于輸入空間采取一定限制的方式,以此將一些簡(jiǎn)單的錯(cuò)誤全部忽略。但是,如果有線性不可分的問題出現(xiàn),這種方法的效果便無法發(fā)揮。而核技巧主要是通過尋找核函數(shù)的方式,以此促使原本的低維空間全部轉(zhuǎn)變成高位空間,從而使得原來的數(shù)據(jù)全部能可分。這種方法的應(yīng)用范圍同樣有限,因此在實(shí)際操作的時(shí)候,通常需要將這兩種方法結(jié)合在一起共同使用。
二、人工神經(jīng)網(wǎng)絡(luò)
所謂人工神經(jīng)網(wǎng)絡(luò),也就是ANN,其主要是指對(duì)于人體大腦實(shí)際運(yùn)行的方式進(jìn)行學(xué)習(xí),通常也會(huì)被簡(jiǎn)稱為神經(jīng)網(wǎng)絡(luò)。這種方式與數(shù)學(xué)概念中的統(tǒng)計(jì)學(xué)十分相似[2]。
一般而言,此類模型主要具備三方面優(yōu)勢(shì)。其一,其能夠自主完成學(xué)習(xí)任務(wù)。例如,人工神經(jīng)網(wǎng)絡(luò)通過人臉識(shí)別的方式,可以將無數(shù)個(gè)臉部信息輸入到模型機(jī)器之中,此時(shí)網(wǎng)絡(luò)本身便能夠有效掌握這一方面的技能。通常情況下,此類技能在預(yù)測(cè)工作中有著非常好的應(yīng)用效果,以此完成災(zāi)難預(yù)測(cè)以及風(fēng)險(xiǎn)預(yù)測(cè)。其二,其本身具有聯(lián)想存儲(chǔ)的效果,主要依靠?jī)?nèi)部的反饋系統(tǒng),以此完成信息的獲取與分析,進(jìn)而實(shí)現(xiàn)信息反饋。其三,能夠迅速找出具體問題所在,并提出有效的處理措施。如果采取人為的方式,在尋找最佳方案的時(shí)候,往往需要將所有方式全部都嘗試一次,顯然十分浪費(fèi)時(shí)間。然而,計(jì)算機(jī)模型具有很強(qiáng)運(yùn)能力行和計(jì)算速度,促使原本十分復(fù)雜的內(nèi)容逐步簡(jiǎn)單化,進(jìn)而提升工作效率[3]。
相比于支持向量機(jī),人工神經(jīng)網(wǎng)絡(luò)本身具有自己獨(dú)有的優(yōu)勢(shì)。主要體現(xiàn)在對(duì)于非線性問題的處理方面,其效果更加,且擁有良好的適應(yīng)能力,以此對(duì)早期模式在模擬、識(shí)別以及信息處理方面的缺陷,擴(kuò)大具體的應(yīng)用范圍。如果將神經(jīng)網(wǎng)絡(luò)和其他多種不同的模型結(jié)合在一起,可以有效提升信息處理的效率,促使其向人工智能層們的發(fā)展更進(jìn)一步?,F(xiàn)如今信息技術(shù)的發(fā)展速度越來越快,人工神經(jīng)網(wǎng)絡(luò)也找到自身的發(fā)展方向,其實(shí)際運(yùn)行的模式越來越人性化。例如,近些年出現(xiàn)的模糊系統(tǒng)、遺傳算法以及進(jìn)化機(jī)制等,這些都是未來繼續(xù)研究的主要方向。一旦有所突破,數(shù)據(jù)分析的效率將會(huì)進(jìn)一步加快。但是,人工神經(jīng)網(wǎng)絡(luò)同樣有著自身缺陷,因此理應(yīng)將其和其他技術(shù)形式結(jié)合在一起,提取其內(nèi)部?jī)艋瑢⒃闫扇刻岢?,進(jìn)而提升具體應(yīng)用的效果。
三、機(jī)器學(xué)習(xí)模型的分類
在大數(shù)據(jù)背景下,機(jī)器學(xué)習(xí)模型的種類有很多。目前來看,最為常見的便是支持向量機(jī)以及人工神經(jīng)網(wǎng)絡(luò)。從算法的角度思考,模型通??梢苑殖扇N。其一是監(jiān)督學(xué)習(xí),主要是依靠計(jì)算機(jī)從大數(shù)據(jù)之中將相關(guān)信息內(nèi)容全部提取出來,并對(duì)其具體結(jié)果展開驗(yàn)證。這種方式能夠有效增強(qiáng)模型的學(xué)習(xí)能力,從而使其更好地完成后續(xù)的工作。其二是無監(jiān)督學(xué)習(xí),主要是指計(jì)算機(jī)本身基于大數(shù)據(jù)背景,將相關(guān)信息全部截取下來。這種方式的目標(biāo)往往具有一定的不確定性特點(diǎn)。其三是強(qiáng)化學(xué)習(xí),主要是基于沒有大數(shù)據(jù)驗(yàn)證的前提下,以此促使計(jì)算機(jī)完成自主評(píng)估工作。
四、結(jié)束語(yǔ)
綜上所述,在大數(shù)據(jù)背景下,越來越多的機(jī)器學(xué)習(xí)模型不斷出現(xiàn)。為此,相關(guān)人員理應(yīng)對(duì)其優(yōu)勢(shì)和特點(diǎn)展開分析,并將其結(jié)合在一起,以此應(yīng)用到不同的領(lǐng)域之中,進(jìn)而改變?nèi)藗兊纳睢?/p>
參考文獻(xiàn):
[1] 焦嘉烽,李云,JIAOJiafeng,等.大數(shù)據(jù)下的典型機(jī)器學(xué)習(xí)平臺(tái)綜述[J].計(jì)算機(jī)應(yīng)用,2017,37(11):3039-3047.
[2] 菅保霞,姜強(qiáng),趙蔚,等.大數(shù)據(jù)背景下自適應(yīng)學(xué)習(xí)個(gè)性特征模型研究——基于元分析視角[J].遠(yuǎn)程教育雜志,2017,35(4):87-96.
[3] 孫存一,龔六堂,馬達(dá)鉿,盧友明等.大數(shù)據(jù)思維下的利率定價(jià)研究——以機(jī)器學(xué)習(xí)為視角的實(shí)證分析[J].金融理論與實(shí)踐,2017(7):1-5.