摘 要: 本文介紹了人工智能學(xué)科中機(jī)器學(xué)習(xí)的概念、發(fā)展、分類及應(yīng)用情況。
關(guān)鍵詞: 機(jī)器學(xué)習(xí) 人工智能 基本模型
1.引言
“機(jī)器學(xué)習(xí)”是人工智能的重要研究領(lǐng)域之一。機(jī)器學(xué)習(xí)的定義是“系統(tǒng)通過(guò)積累經(jīng)驗(yàn)而改善系統(tǒng)自身的性能”。通俗地說(shuō),就是讓機(jī)器去學(xué)習(xí),利用學(xué)到的知識(shí)來(lái)指導(dǎo)下一步的判斷。最初研究機(jī)器學(xué)習(xí),是讓計(jì)算機(jī)具有學(xué)習(xí)的能力,以實(shí)現(xiàn)智能化。因?yàn)槿藗冋J(rèn)為具有人工智能的系統(tǒng)首先必須具有學(xué)習(xí)能力。機(jī)器學(xué)習(xí)的研究始于神經(jīng)元模型研究,此后又經(jīng)歷了符號(hào)概念獲取、知識(shí)強(qiáng)化學(xué)習(xí)研究階段,至今已發(fā)展到連接學(xué)習(xí)和混合型學(xué)習(xí)研究階段。
2.機(jī)器學(xué)習(xí)系統(tǒng)的基本模型
根據(jù)機(jī)器學(xué)習(xí)的定義,建立如圖1所示的機(jī)器學(xué)習(xí)基本模型。
模型中包含學(xué)習(xí)系統(tǒng)的四個(gè)基本組成環(huán)節(jié)。
環(huán)境和知識(shí)庫(kù)是以某種知識(shí)表示形式表達(dá)的信息的集合,分別代表外界信息來(lái)源和系統(tǒng)具有的知識(shí)。學(xué)習(xí)環(huán)節(jié)和執(zhí)行環(huán)節(jié)代表兩個(gè)過(guò)程。學(xué)習(xí)環(huán)節(jié)處理環(huán)境提供的信息,以便改善知識(shí)庫(kù)中的知識(shí)。執(zhí)行環(huán)節(jié)是整個(gè)機(jī)器學(xué)習(xí)系統(tǒng)的核心。利用知識(shí)庫(kù)中的知識(shí)來(lái)完成某種任務(wù),并把執(zhí)行中獲得的信息送還給學(xué)習(xí)環(huán)節(jié)。
2.1機(jī)器學(xué)習(xí)的分類
很多學(xué)者從不同的角度對(duì)機(jī)器學(xué)習(xí)進(jìn)行了分類,這里簡(jiǎn)單闡述一下繼續(xù)學(xué)習(xí)策略的機(jī)器學(xué)習(xí)的種類。按照學(xué)習(xí)策略的不同,機(jī)器學(xué)習(xí)分為機(jī)械學(xué)習(xí)、歸納學(xué)習(xí)、基于解釋的學(xué)習(xí)、基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和基于遺傳算法的學(xué)習(xí)。
2.1.1機(jī)械學(xué)習(xí)
機(jī)械學(xué)習(xí)(Rote Learning)就是“死記硬背式的學(xué)習(xí)”,靠記憶存儲(chǔ)知識(shí),需要時(shí)檢索已經(jīng)存下來(lái)的知識(shí)使用,不需要計(jì)算和推理。機(jī)械學(xué)習(xí)的模式如下:需要解決的問(wèn)題為{y,y,...,yn},輸入已知信息{x,x,...x}后,解決了該問(wèn)題,于是將記錄對(duì){{x,x,...,x},{y,y,...,y}}存入數(shù)據(jù)庫(kù),以后當(dāng)遇到問(wèn){y,y,...,y}時(shí),檢索數(shù)據(jù)庫(kù),即可得到問(wèn)題{y,y,...,y}的解答是{x,x,...,x}。
能實(shí)現(xiàn)機(jī)械式學(xué)習(xí)算法的系統(tǒng)只需具備兩種基本技能:記憶與檢索。此外,存儲(chǔ)的合理安排,信息的合理結(jié)合,以及檢索最優(yōu)方向的控制也是系統(tǒng)應(yīng)該考慮的問(wèn)題。該算法簡(jiǎn)單、容易實(shí)現(xiàn)、計(jì)算快速,但是由于系統(tǒng)不具備歸納推理的功能,對(duì)每個(gè)不同的問(wèn)題,即使是類似的問(wèn)題,也需要知識(shí)庫(kù)中有不同的記錄。因此占用大量的存儲(chǔ)空間,這是典型的以空間換時(shí)間的算法。
2.1.2歸納學(xué)習(xí)
歸納學(xué)習(xí)是應(yīng)用歸納推理進(jìn)行學(xué)習(xí)的一種方法。歸納學(xué)習(xí)的過(guò)程是由特殊實(shí)例推導(dǎo)出一般情況的過(guò)程,這樣就使類似的問(wèn)題可以利用同樣的方法求解。歸納學(xué)習(xí)的過(guò)程就是示例空間與規(guī)則空間的相互利用與反饋。1974年,Simon和Lea提出了雙空間模型,形象地對(duì)這一執(zhí)行過(guò)程進(jìn)行了描述,如圖2所示。
歸納學(xué)習(xí)算法簡(jiǎn)單,節(jié)省存儲(chǔ)空間,在一段時(shí)間內(nèi)得到了廣泛的應(yīng)用。在應(yīng)用過(guò)程中,該算法逐漸顯現(xiàn)出它的缺點(diǎn):(1)歸納結(jié)論是通過(guò)對(duì)大量的實(shí)例分析得出的,這就要求結(jié)論的得出要有大量實(shí)例作支撐,而這在許多領(lǐng)域都是無(wú)法滿足的。(2)歸納結(jié)論是由不完全訓(xùn)練集得出的,因而其正確性無(wú)法保證,只能使結(jié)論以一定概率成立。(3)該算法通過(guò)對(duì)實(shí)例的分析與對(duì)比得出結(jié)論,對(duì)于信息的重要性與相關(guān)關(guān)系無(wú)法辨別。
2.1.3基于解釋的學(xué)習(xí)
基于解釋的學(xué)習(xí)(Explanation-Based Learning)是運(yùn)用已知相關(guān)領(lǐng)域的知識(shí)及訓(xùn)練實(shí)例,對(duì)某個(gè)目標(biāo)概念進(jìn)行學(xué)習(xí),并通過(guò)后繼的不斷練習(xí),得到目標(biāo)概念的一般化描述。該學(xué)習(xí)的執(zhí)行過(guò)程如圖3所示。
這種方式的學(xué)習(xí)得到一個(gè)領(lǐng)域完善的知識(shí)往往是比較困難的,這就對(duì)該算法提出了更高的要求。為解決知識(shí)不完善領(lǐng)域的問(wèn)題,有以下兩個(gè)研究方向[2]:(1)改進(jìn)該算法使其在不完善的領(lǐng)域理論中依然有效。(2)擴(kuò)充該領(lǐng)域的知識(shí)使其擁有更強(qiáng)的解釋能力。通常情況下,第二種改進(jìn)方法更重要些。
2.1.4基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)
神經(jīng)網(wǎng)絡(luò)是由許多類似神經(jīng)元的節(jié)點(diǎn)和它們之間帶權(quán)的連接組成的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),是為模仿人類大腦的復(fù)雜神經(jīng)結(jié)構(gòu)而建立起來(lái)的抽象數(shù)據(jù)模型,希望相似的拓?fù)浣Y(jié)構(gòu)可以使機(jī)器像人腦一樣進(jìn)行數(shù)據(jù)的分析、存儲(chǔ)與使用。神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的過(guò)程就是不斷修正連接權(quán)的過(guò)程。在網(wǎng)絡(luò)的使用過(guò)程中,對(duì)于特定的輸入模式,神經(jīng)網(wǎng)絡(luò)通過(guò)前向計(jì)算,產(chǎn)生一個(gè)輸出模式,并得到節(jié)點(diǎn)代表的邏輯概念,通過(guò)對(duì)輸出信號(hào)的比較與分析可以得到特定解。在整個(gè)過(guò)程中,神經(jīng)元之間具有一定的冗余性,且允許輸入模式偏離學(xué)習(xí)樣本,因此神經(jīng)網(wǎng)絡(luò)的計(jì)算行為具有良好的并行分布、容錯(cuò)和抗噪能力。
神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法是一種仿真算法,擁有良好的認(rèn)識(shí)模擬能力和有高度的并行分布式處理能力。但神經(jīng)網(wǎng)絡(luò)模型及其參數(shù)設(shè)置難以確定,需要長(zhǎng)時(shí)間的試驗(yàn)摸索過(guò)程。并且,對(duì)于最后得到的神經(jīng)網(wǎng)絡(luò),其反映的知識(shí)往往難以讓人理解。為解決這些問(wèn)題,構(gòu)造神經(jīng)網(wǎng)絡(luò)集成并從神經(jīng)網(wǎng)絡(luò)或神經(jīng)網(wǎng)絡(luò)集成中抽取規(guī)則成為當(dāng)前研究的熱點(diǎn)。
2.1.5基于遺傳算法的學(xué)習(xí)
遺傳算法以自然進(jìn)化和遺傳學(xué)為基礎(chǔ),通過(guò)模擬自然界中生物的繁殖與進(jìn)化過(guò)程,使訓(xùn)練結(jié)果逐漸優(yōu)化。與遺傳過(guò)程類似,在學(xué)習(xí)過(guò)程中,通過(guò)選擇最好結(jié)果并使其組合產(chǎn)生下一代,使“優(yōu)秀的遺傳因子”逐代積累,最后得到最優(yōu)的解。遺傳算法解決了神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中的一個(gè)缺點(diǎn),它不需要知道原始信息而只需知道學(xué)習(xí)的目的即可進(jìn)行,具有很強(qiáng)的并行計(jì)算能力和適應(yīng)能力。此外,遺傳算法采取的隨機(jī)搜索方法提高了該學(xué)習(xí)算法對(duì)全局搜索的能力。遺傳算法的缺點(diǎn)主要體現(xiàn)在三個(gè)方面:無(wú)法確定最終解的全局最優(yōu)性;無(wú)法控制遺傳過(guò)程中變異的方向;無(wú)法有效地確定進(jìn)化終止條件?;谶@三個(gè)缺點(diǎn),有人提出了遺傳算法與其他學(xué)習(xí)算法的結(jié)合,優(yōu)點(diǎn)互補(bǔ)已達(dá)到更好的效果。
3.結(jié)語(yǔ)
機(jī)器學(xué)習(xí)在過(guò)去十幾年中取得了飛速的發(fā)展,目前已經(jīng)成為子領(lǐng)域眾多、內(nèi)涵非常豐富的學(xué)科領(lǐng)域?!案?、更好地解決實(shí)際問(wèn)題”成為機(jī)器學(xué)習(xí)發(fā)展的驅(qū)動(dòng)力。事實(shí)上,過(guò)去若干年中出現(xiàn)的很多新的研究方向,例如半監(jiān)督學(xué)習(xí)、代價(jià)敏感學(xué)習(xí)等,都起源于實(shí)際應(yīng)用中抽象出來(lái)的問(wèn)題,而機(jī)器學(xué)習(xí)的研究進(jìn)展,也很快就在眾多應(yīng)用領(lǐng)域中發(fā)揮作用。機(jī)器學(xué)習(xí)正在逐漸成為基礎(chǔ)性、透明化、無(wú)處不在的支持技術(shù)、服務(wù)技術(shù)。
參考文獻(xiàn):
[1]周志華.機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘[J].
[2]郭亞寧,馮莎莎.機(jī)器學(xué)習(xí)理論研究[J].科技教育創(chuàng)新,2010(14).
[3]于鳳.機(jī)器學(xué)習(xí)方法及其技術(shù)應(yīng)用[J].電腦學(xué)習(xí),2003.</