摘 要:隨著計算機(jī)和網(wǎng)絡(luò)技術(shù)的高速發(fā)展,特別是在這個大數(shù)據(jù)時代,人們對計算機(jī)系統(tǒng)的要求越來越高。以往大部分智能計算機(jī)系統(tǒng)都普遍缺少自我學(xué)習(xí)的功能,如遇到錯誤時不能自動校正;不會通過經(jīng)驗(yàn)改進(jìn)自身的功能;不會自動獲取所需的知識。一個不具有學(xué)習(xí)能力的智能系統(tǒng)算不上是真正的智能系統(tǒng),所以機(jī)器學(xué)習(xí)在現(xiàn)今是一項(xiàng)十分重要的技術(shù)。
關(guān)鍵詞:機(jī)器學(xué)習(xí);人工智能系統(tǒng);機(jī)器學(xué)習(xí)模型
中圖分類號:TP181
機(jī)器學(xué)習(xí)是人工智能的一個子領(lǐng)域,主要關(guān)注于開發(fā)一些讓計算機(jī)可以自動“學(xué)習(xí)”的技術(shù)。更具體說,機(jī)器學(xué)習(xí)是一種用于創(chuàng)建數(shù)據(jù)集分析分析程序的方法。下面筆者就機(jī)器學(xué)習(xí)談?wù)剛€人的看法。
1 機(jī)器學(xué)習(xí)的定義
機(jī)器學(xué)習(xí)是研究計算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。它是人工智能領(lǐng)域的一個重要的分支。
機(jī)器學(xué)習(xí)在人工智能的研究中具有十分重要的地位。因?yàn)橐粋€不具有學(xué)習(xí)能力的智能系統(tǒng)難以稱得上是一個真正的智能系統(tǒng)。但是,以往的智能系統(tǒng)都普遍缺少學(xué)習(xí)能力。例如:它們遇到錯誤時不能自我校正;不會通過經(jīng)驗(yàn)改善自身的性能;它們的推理僅限于演繹而缺少歸納,因而最多能夠證明已存在的事實(shí)、定理,而不能發(fā)現(xiàn)新的定理、定律和規(guī)則等。隨著人工智能的深入發(fā)展,這些局限性表現(xiàn)得愈突出。正是在這種情形下,機(jī)器學(xué)習(xí)逐漸成為人工智能研究的核心之一。它的應(yīng)用已遍及人工智能的各個分支,如專家系統(tǒng)、自動推理、自然語言理解、模式識別、智能機(jī)器人等領(lǐng)域。
學(xué)習(xí)能力是智能行為的一個非常重要的特征,但至今我們對人類學(xué)習(xí)的機(jī)理尚不太清楚。H.A.Simon認(rèn)為,學(xué)習(xí)是系統(tǒng)所作的適應(yīng)性變化,使得系統(tǒng)在下一次完成同樣或類似任務(wù)時更為有效。R.S.Michalski認(rèn)為,學(xué)習(xí)是構(gòu)造或修改對于的經(jīng)歷事物的表示。從事專家系統(tǒng)研制的人們則認(rèn)為學(xué)習(xí)是知識的獲取。這些觀點(diǎn)各有側(cè)重,第一種觀點(diǎn)強(qiáng)調(diào)學(xué)習(xí)的外部行為效果;第二種則強(qiáng)調(diào)學(xué)習(xí)的過程;而第三種主要是從知識工程的實(shí)用性角度出發(fā)的。
機(jī)器學(xué)習(xí)的研究是根據(jù)生理學(xué)、認(rèn)識科學(xué)等對人類學(xué)習(xí)機(jī)理的了解,建立人類學(xué)習(xí)過程的計算模型或認(rèn)知模型;發(fā)展學(xué)習(xí)理論和學(xué)習(xí)方法,研究通用的學(xué)習(xí)算法并進(jìn)行理論上的分析;建立面向任務(wù)的具有特定應(yīng)用的學(xué)習(xí)系統(tǒng)。雖然有不同的研究目標(biāo),但這些研究目標(biāo)相互影響相互促進(jìn)。
2 機(jī)器學(xué)習(xí)模型
機(jī)器學(xué)習(xí)的研究始于50年代中期,經(jīng)過三十多年的發(fā)展,到現(xiàn)在已形成了很多學(xué)習(xí)方法,如機(jī)械學(xué)習(xí)、實(shí)例學(xué)習(xí)、解釋學(xué)習(xí)、類比學(xué)習(xí)、事例學(xué)習(xí)、遺傳學(xué)習(xí)、連接學(xué)習(xí)等。這些學(xué)習(xí)方法可以用一個學(xué)習(xí)模型來描述,如下圖1:
在圖1中,圓圈表示信息體(如觀察的數(shù)據(jù),以及事實(shí)、規(guī)則等知識),方框表示過程。箭頭指示數(shù)據(jù)在學(xué)習(xí)系統(tǒng)中的流向。環(huán)境為學(xué)習(xí)單元提供外界信息源(如經(jīng)驗(yàn)實(shí)例)。學(xué)習(xí)單元利用該信息對知識庫作出改進(jìn)(增加新知識或重新組織已有知識)。執(zhí)行單元利用知識中的知識執(zhí)行任務(wù),任務(wù)執(zhí)行后的信息又反饋給學(xué)習(xí)單元作為進(jìn)一步學(xué)習(xí)的輸入。
學(xué)習(xí)單元的輸入有兩種:一是外界環(huán)境,另一是執(zhí)行后的反饋信息。不同的不學(xué)習(xí)系統(tǒng)有不同的經(jīng)驗(yàn)實(shí)例表示。最簡單的一種是二元特征表示,僅僅描述對象某些屬性的存在與否。另一種是用屬性值表示,每個屬性有一組相互排斥的值。這種屬性表示典型地用在歸納學(xué)習(xí)方法中。還有一種更復(fù)雜的表示關(guān)系或結(jié)構(gòu)表示,描述兩個或多個對象間的關(guān)系。這種關(guān)系或結(jié)構(gòu)信息一般是以謂詞邏輯、語義網(wǎng)絡(luò)等形式表示的。同前兩種表示相比,這種表示具有更強(qiáng)的表示能力,但同時也為作為學(xué)習(xí)中很重要部分的匹配過程帶來了相當(dāng)?shù)膹?fù)雜度,以至影響了它們的使用。分析學(xué)習(xí)主要處理這種關(guān)系表示型的數(shù)據(jù)結(jié)構(gòu)。
知識庫用來存儲知識,包括系統(tǒng)原有的領(lǐng)域知識(這種知識是短期的、相對不穩(wěn)定、變化的)。選擇何種知識表示對學(xué)習(xí)系統(tǒng)的設(shè)計起著非常很重要的作用。機(jī)器學(xué)習(xí)的大部分方法是只存放總結(jié)了以前經(jīng)驗(yàn)普遍性的知識,而分析學(xué)習(xí)中的類比學(xué)習(xí)基于范例的學(xué)習(xí)則是混合了兩種方式。如果知識是后一種表示(以抽象概括的形式存儲),則存在兩種區(qū)別,即是以邏輯的、離散的形式表示,還是以數(shù)值的、連續(xù)的形式表示信息。歸納學(xué)習(xí)和分析學(xué)習(xí)使用的是離散的、邏輯的表示方法,連接學(xué)習(xí)則使用的數(shù)值的、連續(xù)的表示,遺傳學(xué)習(xí)則是兩種表示的結(jié)合。
執(zhí)行單元既是使得學(xué)習(xí)系統(tǒng)具有實(shí)際用途,又是評價學(xué)習(xí)算法性能好壞的關(guān)鍵部分。機(jī)器學(xué)習(xí)研究的很大一部分工作是集中在這樣兩個領(lǐng)域:分類和問題。一個智能主體常常需要將其經(jīng)驗(yàn)或經(jīng)歷的事例進(jìn)行分類標(biāo)記。機(jī)器學(xué)習(xí)至今所作的很大一部分是學(xué)習(xí)分類。該任務(wù)可描述為,給定一個經(jīng)驗(yàn)實(shí)例的某種描述,以及一些已知的類,任務(wù)在于試圖將這些經(jīng)驗(yàn)實(shí)例賦予某個類別。另外,機(jī)器學(xué)習(xí)也常要能解決新問題或進(jìn)行規(guī)劃。
學(xué)習(xí)單元是學(xué)習(xí)系統(tǒng)內(nèi)實(shí)理學(xué)習(xí)算法功能的核心。一般涉及這樣的幾個方面,一種是處理經(jīng)驗(yàn)事例的方式,有漸進(jìn)式和非漸進(jìn)式。另一種是獲取新知識過程中所用的推理方法,主要有歸納法和演繹方法。也有反繹法。
當(dāng)考慮執(zhí)行單元的反饋信息時,還存在兩種相對的學(xué)習(xí)方式,即監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)。前者是指有導(dǎo)師立即給予學(xué)習(xí)者(學(xué)習(xí)單元)關(guān)于其學(xué)習(xí)行為的反饋信息,后者則是學(xué)習(xí)者得自己為自己作出判定,或僅能得到一點(diǎn)很粗略的指導(dǎo)。
3 機(jī)器學(xué)習(xí)的風(fēng)格
目前,機(jī)器學(xué)習(xí)的風(fēng)格主要有歸納學(xué)習(xí)、分析學(xué)習(xí)、遺傳學(xué)習(xí)、連接學(xué)習(xí)等。歸納學(xué)習(xí)從具體實(shí)例出發(fā),通過歸納推理,得到新的概念或知識。歸納學(xué)習(xí)是目前研究得最廣泛的一種符號學(xué)習(xí)方法,包括實(shí)例學(xué)習(xí)、概念聚類、發(fā)現(xiàn)學(xué)習(xí)等。
分析學(xué)習(xí)是利用背景或領(lǐng)域知識,分析很少的典型實(shí)例(通常僅一個),然后通過演繹推導(dǎo),形成新的知識,使得對領(lǐng)域知識的應(yīng)用更為有效。分析學(xué)習(xí)方法的目的在于改進(jìn)系統(tǒng)的效率性能,而同時不犧牲其準(zhǔn)確性和通用性,這不同于歸納學(xué)習(xí)方法。
遺傳學(xué)習(xí)源于模擬生物繁殖中的遺傳變異原則(交換、突變等),以及達(dá)爾文的自然選擇原則(生態(tài)圈中適者生存)。一個概念描述的各種變體或版本對應(yīng)于一個物種的各個個體,這些概念描述的個體在發(fā)生突變和重組后,經(jīng)過某種目標(biāo)函數(shù)(相應(yīng)于自然選擇準(zhǔn)則)的衡量,以決定誰被淘汰而誰可繼續(xù)生存下去。
連接學(xué)習(xí)是在人工神經(jīng)網(wǎng)絡(luò)中,通過樣本訓(xùn)練,修改神經(jīng)元間的連接強(qiáng)度,甚至神經(jīng)網(wǎng)絡(luò)本身的結(jié)構(gòu)的一種學(xué)習(xí)方法。這種學(xué)習(xí)方法和符號學(xué)習(xí)并立而行。它與符號學(xué)習(xí)不同,主要是基于樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)。
機(jī)器學(xué)習(xí)已建立了一定的理論基礎(chǔ)和自己的科學(xué)研究方法,形成了各種研究風(fēng)格以及相應(yīng)的學(xué)習(xí)算法。但是,目前的機(jī)器學(xué)習(xí)風(fēng)格均有其局限性。在了解人類學(xué)習(xí)機(jī)制的基礎(chǔ)上,正結(jié)合具體的應(yīng)用領(lǐng)域,深入開展學(xué)習(xí)風(fēng)格的研究,研究不同的學(xué)習(xí)風(fēng)格的集成,探討新的學(xué)習(xí)方法和算法。
參考文獻(xiàn):
[1]米歇爾.機(jī)器學(xué)習(xí)[M].北京:機(jī)械工業(yè)出版社,2008.
[2]Peter Harrington.機(jī)器學(xué)習(xí)實(shí)戰(zhàn)[M].北京:人民郵電出版社,2013.
[3]Ethem Alpaydin.機(jī)器學(xué)習(xí)導(dǎo)論[M].北京:機(jī)械工業(yè)出版社,2014.
[4]李凡長.機(jī)器學(xué)習(xí)理論及應(yīng)用[M].北京:中國科學(xué)技術(shù)大學(xué)出版社,2009.
[5]威滕.數(shù)據(jù)挖掘?qū)嵱脵C(jī)器學(xué)習(xí)技術(shù)[M].北京:機(jī)械工業(yè)出版社,2006.
作者簡介:陸茂邦(1978.09-),廣東羅定人,學(xué)士學(xué)位,教師,計算機(jī)講師,研究方向:計算機(jī)。
作者單位:肇慶市技師學(xué)院,廣東肇慶 526000