劉娟 胡桂武
摘要:貝葉斯公式是《概率論與數(shù)理統(tǒng)計(jì)》課程中非常重要的公式,它包含著深刻的思想內(nèi)涵。結(jié)合當(dāng)下熱門的人工智能科技案例:語音識(shí)別、機(jī)器翻譯等,探討其背后的數(shù)學(xué)原理——貝葉斯定理。通過理論聯(lián)系實(shí)際的教學(xué)案例來引發(fā)學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生的創(chuàng)新思維能力,達(dá)到教學(xué)質(zhì)量的提高。
關(guān)鍵詞:貝葉斯公式;人工智能;教學(xué)方法
中圖分類號(hào):G642.0? ? ?文獻(xiàn)標(biāo)志碼:A? ? ?文章編號(hào):1674-9324(2019)38-0141-03
貝葉斯公式是概率論與數(shù)理統(tǒng)計(jì)課程中非常有特點(diǎn)的公式,也是課程中的重難點(diǎn)公式之一。它既包含全概率公式,又包含條件概率與乘法公式,同時(shí)也包含對先驗(yàn)概率、后驗(yàn)概率的理解。貝葉斯公式的形式復(fù)雜,綜合性較強(qiáng),在經(jīng)典教材中的應(yīng)用案例相對有限,部分學(xué)生難以深刻理解和正確使用。近年來,大數(shù)據(jù)思維滲透進(jìn)了大學(xué)的各個(gè)專業(yè),人工智能的應(yīng)用也日益興盛,本文結(jié)合身邊熟悉的人工智能科技現(xiàn)象,來引入對貝葉斯公式的探討。通過案例式、啟發(fā)式教學(xué)方法,逐層深入分析,揭示這一神奇數(shù)學(xué)公式背后所蘊(yùn)含的貝葉斯概率思維,有效幫助學(xué)生理解貝葉斯公式的內(nèi)涵。
一、介紹歷史起源,引出問題背景
Thomas Bayes是生活在18世紀(jì)的一位英國神學(xué)家、數(shù)學(xué)家,他的一生中只有兩次發(fā)表過自己的思想,但都與概率論無關(guān)。貝葉斯公式發(fā)表于1763年,它在歷史上最著名的運(yùn)用之一是在二戰(zhàn)期間被用來破解納粹的恩尼格碼密碼。如今,這一原理更是廣泛深入地被運(yùn)用在科學(xué)、技術(shù)、醫(yī)學(xué)等領(lǐng)域。這一公式源于他生前為解決一個(gè)“逆向概率”問題的思考,他本人并沒有將它公開發(fā)表。在他去世后,他的家人委托朋友Richard Price研究貝葉斯的數(shù)學(xué)文章。雖然文章的數(shù)量并不是特別多,不過其中有一篇關(guān)于概率論的論文引起了Price的注意?,F(xiàn)在我們知道那篇文章的題目是“論機(jī)會(huì)游戲中的一個(gè)問題”(An Essay towards Solving a Problem in the Doctrine of Chances)。Price敏感地意識(shí)到貝葉斯這篇文章的結(jié)果很有價(jià)值,在貝葉斯去世兩年后將其整理發(fā)表出來。盡管Price盡了最大努力去宣傳貝葉斯的思想,但效果在當(dāng)時(shí)依然不是很明顯。
貝葉斯公式在剛剛發(fā)現(xiàn)的時(shí)候,并沒有引起概率統(tǒng)計(jì)學(xué)家的重視,也沒有得到廣泛的使用。不過,幾百年后,貝葉斯的手稿逐漸引起了對概率統(tǒng)計(jì)感興趣的數(shù)學(xué)家們的注意和討論。正是在貝葉斯的這篇文章中,我們發(fā)現(xiàn)了現(xiàn)在所謂的貝葉斯定理的一個(gè)敘述:假設(shè)我們面對一組備選假設(shè),每個(gè)假設(shè)都聲稱能解釋同一種現(xiàn)象,但是只有一個(gè)假設(shè)是正確的。貝葉斯定理使我們能夠用數(shù)據(jù)及一些額外的條件,來計(jì)算每個(gè)假設(shè)可能是正確假設(shè)的概率,它能夠幫助我們來確定哪個(gè)假設(shè)更可能是真的。為了讓這一定理更加具體,假設(shè)我們知道一個(gè)箱子里有四個(gè)球,而且下面結(jié)論中有一個(gè)成立:(1)四個(gè)球都是紅色;(2)兩個(gè)紅色、兩個(gè)黑色;(3)一個(gè)紅色、三個(gè)黑色;(4)三個(gè)紅色、一個(gè)黑色?,F(xiàn)在,假設(shè)我們從箱子中取出了一個(gè)紅球,記下顏色,然后把球放回箱子,混合均勻,接著從箱子再取出一個(gè)球,還是紅色。第三次,依舊取出一個(gè)球,記下其顏色,還是紅色,放回去,最后第四次再重復(fù)這個(gè)過程,結(jié)果取出的還是一個(gè)紅色球。已知我們剛剛抽取的四個(gè)球都是紅色,而不是黑色,而且起初我們沒有任何理由傾向任一假定的結(jié)論,那么通過貝葉斯公式,我們可以計(jì)算每個(gè)假設(shè)可能是正確的概率。為此,我們需要引進(jìn)一些符號(hào)。令A(yù)表示某一事件,P(A)表示事件A發(fā)生的概率,計(jì)算A的概率時(shí),我們可以利用一些輔助信息。例如,假設(shè)知道另一事件Bi已經(jīng)發(fā)生。我們可以利用對Bi的了解,重新計(jì)算A發(fā)生的概率。這就是給定Bi時(shí),A的條件概率,記作P(A|Bi)。貝葉斯定理給出已知P(A|Bi)和一些附加信息,來推導(dǎo)計(jì)算P(Bi|A)的方法。
二、理解公式內(nèi)涵,發(fā)掘深刻思想
根據(jù)多年來對概率論與數(shù)理統(tǒng)計(jì)課程教學(xué)效果反饋調(diào)查,許多學(xué)生認(rèn)為這一公式并不直觀,也不太容易記憶?,F(xiàn)行教材中對貝葉斯定理的內(nèi)容一般是放在全概率公式之后,在浙江大學(xué)盛驟等人所編寫的第四版概率論與數(shù)理統(tǒng)計(jì)教材中,通過產(chǎn)品質(zhì)量檢驗(yàn)和醫(yī)學(xué)檢測等例題給出公式的應(yīng)用。學(xué)生已經(jīng)學(xué)習(xí)了條件概率和全概率公式后再接觸貝葉斯公式。由于貝葉斯公式中分子、分母分別涉及概率論與數(shù)理統(tǒng)計(jì)課程中的3個(gè)重要的公式,分別是乘法公式、條件概率公式和全概率公式,具有一定的難度和綜合性,導(dǎo)致許多學(xué)生理解得并不深刻,也不能靈活熟練地使用。
通過對貝葉斯定理的分解,可以得到其核心的思想,概括表示為如下公式:
我們可以從多個(gè)角度對貝葉斯公式進(jìn)行分析。從上面調(diào)整后的表達(dá)式可以知道,當(dāng)面臨不確定性的現(xiàn)象,我們需要對未知進(jìn)行預(yù)測時(shí),應(yīng)首先根據(jù)已有的信息和統(tǒng)計(jì)資料,先給出一個(gè)先驗(yàn)概率,然后在新信息不斷累積、不斷更迭的情況下調(diào)整對未知事件發(fā)生概率的預(yù)測。在我們的日常生活中,常常也會(huì)使用貝葉斯定理的方法來進(jìn)行判斷。例如經(jīng)典的“狼來了”的寓言;又如去到一個(gè)新的城市旅游,如何找到最符合自己口味的餐館;雨季來臨時(shí)看見多云是否會(huì)降雨,等等。這些生活中的判斷,其背后暗藏有貝葉斯定理的思想。不同于經(jīng)典的概率論中的頻率學(xué)派,貝葉斯定理其實(shí)體現(xiàn)了一種新的概率觀,它利用過往已有的信息來逐漸逼近事件發(fā)生概率,告訴我們?nèi)绾卫眯伦C據(jù)修改已有的看法,這是一種啟發(fā)式的概率統(tǒng)計(jì)思維方式。近年來,隨著大數(shù)據(jù)時(shí)代的到來,這一公式所蘊(yùn)含的思想之深刻,遠(yuǎn)遠(yuǎn)超出一般人的想象和認(rèn)知。
三、人工智能背后的神奇公式:貝葉斯公式
人工智能(Artificial Intelligent)簡稱AI,也稱機(jī)器智能,是指由人工制造出來的系統(tǒng)所表現(xiàn)出來的智能,其研究領(lǐng)域包括認(rèn)知建模、知識(shí)學(xué)習(xí)推理、機(jī)器學(xué)習(xí)等。人工智能實(shí)際上是在大量的邏輯運(yùn)算和大量的數(shù)據(jù)輸入處理基礎(chǔ)上進(jìn)行實(shí)現(xiàn),它需要大量的數(shù)據(jù)輸入訓(xùn)練才能使其更加智能化。AI的核心在于算法,好的算法基礎(chǔ)在于概率統(tǒng)計(jì)模型的運(yùn)用,而概率統(tǒng)計(jì)學(xué)科中的貝葉斯定理則為我們提供了一種簡潔但又強(qiáng)大的分析推理框架。2016年的春天,一場AlphaGo與圍棋世界冠軍的人機(jī)對決,將人工智能推到了全世界舞臺(tái)的聚光燈下,從此人工智能變得家喻戶曉,正在對世界經(jīng)濟(jì)、人類生活產(chǎn)生深刻影響。為了順應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展趨勢,培養(yǎng)適應(yīng)時(shí)代發(fā)展的應(yīng)用型數(shù)據(jù)分析人才和統(tǒng)計(jì)人才,高校需要調(diào)整教學(xué)方案,教師需要改進(jìn)教學(xué)方法。傳統(tǒng)的高等教育比較注重理論的教學(xué),重視數(shù)學(xué)基礎(chǔ)和各種統(tǒng)計(jì)方法的推導(dǎo),相對缺乏概率統(tǒng)計(jì)思想的培養(yǎng)和實(shí)際動(dòng)手能力的訓(xùn)練。
下面,從身邊的人工智能科技案例引入貝葉斯定理的教學(xué),探討概率統(tǒng)計(jì)理論是如何應(yīng)用到實(shí)際問題建模的,深入挖掘其背后的數(shù)學(xué)原理,理解這一簡潔但是強(qiáng)大的貝葉斯公式的深刻思想內(nèi)涵。垃圾郵件的識(shí)別、智能手機(jī)自動(dòng)翻譯、Siri的語音識(shí)別等很多AI智能現(xiàn)象的關(guān)鍵算法核心都是貝葉斯公式。
語音識(shí)別。當(dāng)蘋果手機(jī)剛剛推向市場時(shí),其附屬的智能軟件Siri給我們留下了很深刻的印象。現(xiàn)在具有這樣功能的智能手機(jī)或者相關(guān)的智能電子產(chǎn)品越來越常見,也越來越廣泛使用,已經(jīng)走進(jìn)了人們的日常生活。那么如何理解語音識(shí)別現(xiàn)象?在吳軍老師的《數(shù)學(xué)之美》這本書中,就介紹了從統(tǒng)計(jì)語言模型的角度對上面的AI科技現(xiàn)象給出的科學(xué)解釋。首先要想讓電腦能理解人的語言,當(dāng)然不可能真的給電腦安裝上一個(gè)真正的大腦。經(jīng)過很長時(shí)間的探索,科學(xué)家和工程師們才找到了這一領(lǐng)域研究的突破。他們意識(shí)到語言從產(chǎn)生開始,慢慢變成一種上下文相關(guān)的信息表達(dá)方式,因此讓計(jì)算機(jī)處理自然語言,一個(gè)基本的問題就是為自然語言這樣的上下相關(guān)的特點(diǎn)建立數(shù)學(xué)模型。語音識(shí)別其實(shí)也和機(jī)器自動(dòng)翻譯,即輸入一種語言(中文)讓電腦自動(dòng)翻譯為另外一種語言(英文),拼寫糾錯(cuò),垃圾郵件的識(shí)別等AI問題完全類似。簡單來說,語音識(shí)別問題可以理解為如何根據(jù)聽到的語句T,來推測原說話者表達(dá)的語句S。接收到一個(gè)句子T,它最可能在表達(dá)什么意思,即原語句S是什么。用概率論的語言來描述語音識(shí)別問題,也就是說在已知T的條件下,讓條件概率P(S|T)達(dá)到最大。那么在不同的P(原語句S1|接受到語句T),…,P(原語句Sn|接收到語句T)中,我們?nèi)绾巫龀鲞x擇推斷呢?這里核心的處理技巧就是貝葉斯公式。
這個(gè)式子的右端分母,對于不同的預(yù)判原語句S1,…,Sn都是固定一樣的,可以忽略不計(jì)。分子部分的P(原語句S)這一項(xiàng),現(xiàn)在已經(jīng)有非常成熟的方法,可以利用算法在語料庫里去計(jì)算。而分子中的條件概率的計(jì)算則會(huì)相對麻煩一些。我們必須對猜測為可能的原語句S1,原語句S2,…,原語句Sn都計(jì)算P(接收到T|原語句S)*P(原語句S),然后取其中最大的那一項(xiàng),得到的就是最可能的推測。
四、小結(jié)
隨著數(shù)據(jù)驅(qū)動(dòng)時(shí)代的到來,大數(shù)據(jù)催生了大量的數(shù)據(jù)師等新型崗位,企業(yè)對數(shù)據(jù)分析師、算法工程師等人才需求的缺口越來越大。在這樣的背景下,高校必須引入新的培養(yǎng)模式,無論在課程體系,還是實(shí)踐環(huán)節(jié)上;無論在專業(yè)課程設(shè)置,還是人才培養(yǎng)模式等方面的教學(xué)改革都需要緊跟時(shí)代。我們要確定符合時(shí)代發(fā)展的人才培養(yǎng)目標(biāo),優(yōu)化課程設(shè)計(jì),突出培養(yǎng)和應(yīng)用結(jié)合的特點(diǎn),打破現(xiàn)有學(xué)校專業(yè)與市場對數(shù)據(jù)人才需求相對脫節(jié)的壁壘。高校既要重視學(xué)生基本理論和專業(yè)知識(shí)的培養(yǎng),又要專注學(xué)生的數(shù)據(jù)處理、分析能力及行業(yè)實(shí)踐能力的提升,培養(yǎng)出能適應(yīng)大數(shù)據(jù)時(shí)代的應(yīng)用型數(shù)據(jù)分析人才。
參考文獻(xiàn):
[1]百度百科 貝葉斯定理[EB/OL].http://baike.baidu.com/view/1488573.htm.
[2]汪磊.論貝葉斯方法在計(jì)算機(jī)智能化中的應(yīng)用[J].中小企業(yè)管理與科技:下旬刊,2011,(05).
[3]吳軍.數(shù)學(xué)之美[M].北京:人民郵電出版社,2013.
[4]狄萍.基于短語的統(tǒng)計(jì)機(jī)器翻譯的研究[D].蘇州大學(xué),2010.
[5]劉貴容,秦春蓉,林毅.以需求為導(dǎo)向的大數(shù)據(jù)人才定制化培養(yǎng)模式與策略研究[J].中國教育信息化,2018,(12).
[6]賴巧玲,李梅,任麗潔.大數(shù)據(jù)背景下數(shù)理統(tǒng)計(jì)課程的教學(xué)改革與實(shí)踐[J].科教文匯,2019,(1).
Research on Teaching of the Bayesian Formula as an Intelligent Thinking Tool
LIU Juan,HU Gui-wu
(School of Statistics and Mathematics,Guangdong University of Finance &Economics,Guangzhou,Guangdong 510320,China)
Abstract:The Bayesian formula is a very important formula in the course of Probability and Statistics,it contains profound ideological meaning. This paper explores the popular cases of AI technology:speech recognition,spelling correction and shows the mathematical principles Bayesian formula behind them.The studying motivation and innovative thinking ability is stimulated by combining the theory with practice.The teaching effect has been highly improved.
Key words:Bayesian formula;Artificial Intelligence;teaching method