摘 要:馬爾科夫鏈由于其對過去、現(xiàn)在、未來狀態(tài)關(guān)系的物理內(nèi)涵,是實際工程經(jīng)常運用的數(shù)學(xué)概念,多用于對未來狀態(tài)的預(yù)測,廣泛應(yīng)用于態(tài)勢估計、模型構(gòu)建、趨勢預(yù)測等方面中。在高校隨機(jī)過程課程安排中,針對馬爾科夫鏈的教學(xué)內(nèi)容公式化,學(xué)生理解較淺,不利于工程實踐能力培養(yǎng)。該文重點采用案例教學(xué)法,以飛機(jī)目標(biāo)跟蹤預(yù)測實際工程案例為主線,馬爾科夫鏈物理內(nèi)涵實現(xiàn)的課程內(nèi)容為輔線,結(jié)合生活中諸多案例講授本節(jié)課程的教學(xué)重點及其應(yīng)用,激發(fā)學(xué)生對隨機(jī)過程課程的探索興趣,鍛煉學(xué)生自主思考能力。課程強(qiáng)調(diào)理論與實踐相結(jié)合體系,提升學(xué)生運用課程內(nèi)容解決實際問題的能力,并根據(jù)馬爾科夫鏈的物理內(nèi)涵,啟發(fā)學(xué)生保持對未來積極向上、努力拼搏的精神。
關(guān)鍵詞:馬爾科夫鏈;隨機(jī)過程;案例教學(xué)法;目標(biāo)跟蹤預(yù)測案例;課程思政
中圖分類號:G642 文獻(xiàn)標(biāo)志碼:A 文章編號:2096-000X(2024)35-0023-06
Abstract: Markov chains, due to their physical implications regarding the relationships between past, present, and future states, are concepts frequently applied in practical engineering, primarily for future predition. They are widely used in situation estimation, model construction, trend forecasting, and other areas. In the course design for stochastic processes at universities, the teaching content on Markov chains is too formulaic for students to develop a deep understanding and hindering the cultivation of engineering practice skills. This paper focuses on the case-based teaching method, using an engineering example of aircraft target tracking and prediction as the main thread, supplemented by cases from daily life, to explain the concept and physical significance of Markov chains. This approach emphasizes the mathematical content and their applications, encouraging students to think and explore engineering problems independently. The course integrates theory with practice to enhance students' ability to solve real-world problems using theoretical content. Additionally, based on the physical implications of Markov chains, students are guided to maintain a positive and proactive outlook on life, striving for success in the future.
Keywords: Markov chain; stochastic process; case-based teaching method; target tracking prediction case; course moral education
隨機(jī)過程理論作為一門應(yīng)用數(shù)學(xué)學(xué)科,由于在工程實踐中廣泛應(yīng)用,是當(dāng)前高校必選專業(yè)課程之一,具有專業(yè)性強(qiáng)、內(nèi)容抽象深奧、概念知識繁多等特點[1],在傳統(tǒng)“灌輸式”教學(xué)方式中,教師授課“重講,輕應(yīng)用”,導(dǎo)致學(xué)生缺失理論與實際應(yīng)用相聯(lián)系能力,眾多學(xué)生反映這門課程教學(xué)體驗單一、內(nèi)容深奧難懂等問題[2],難以實現(xiàn)提升學(xué)生數(shù)學(xué)理論實際應(yīng)用、概念公理深層次理解的課程教學(xué)目標(biāo)[3]。
馬爾科夫鏈?zhǔn)请S機(jī)過程理論課程中馬爾科夫過程這一章節(jié)的基石,既具備馬爾科夫過程的物理特性與內(nèi)涵,形式上相對簡單,在課程內(nèi)容體系架構(gòu)上,又是馬爾科夫過程的基石,學(xué)生的有效理解有利于課程循序漸進(jìn)、由淺入深[4]。同時,馬爾科夫過程,包括馬爾科夫鏈,具有基于過去狀態(tài)對未來狀態(tài)判定的物理含義[4],在實際生活、科研工程中對未來狀態(tài)的預(yù)測有著廣泛的應(yīng)用與影響[5-7],是本門課程理論應(yīng)用于實際一重大實現(xiàn),在當(dāng)前科研環(huán)境中依舊基于馬爾科夫理論進(jìn)行相關(guān)研究,因此馬爾科夫鏈的學(xué)習(xí)是學(xué)生體會數(shù)學(xué)知識在生活、工程問題中靈活應(yīng)用的關(guān)鍵節(jié)點,引導(dǎo)學(xué)生理解領(lǐng)悟馬爾科夫鏈內(nèi)容內(nèi)涵具有較高的教學(xué)價值。
在實際教學(xué)過程中,課程本身具有強(qiáng)烈的數(shù)學(xué)色彩,使得普遍教學(xué)方法傾向于圍繞數(shù)學(xué)推導(dǎo)進(jìn)行嚴(yán)謹(jǐn)分析。數(shù)學(xué)分析環(huán)節(jié)必不可少,但過于依仗數(shù)學(xué)分析的傳統(tǒng)教學(xué)方式下,學(xué)生容易對課程內(nèi)容產(chǎn)生抵觸心理,而且不利于鍛煉學(xué)生自發(fā)思考、實際應(yīng)用的能力,導(dǎo)致教學(xué)成效甚微。近年來,為激發(fā)學(xué)生學(xué)習(xí)積極性,許多教師將新式教學(xué)方法引入課堂,如比照推演法[8-10]、案例法[2-3,10]、思政法[2,10]等,在課程講授過程中穿插使用,提升了學(xué)生對課程的接受程度。針對隨機(jī)過程數(shù)學(xué)嚴(yán)謹(jǐn)性與應(yīng)用性較強(qiáng)的課程,不能降低對數(shù)學(xué)邏輯推導(dǎo)的比重,同時應(yīng)該靈活運用多種教學(xué)方式,通過讓學(xué)生從實際工程中發(fā)現(xiàn)問題,利用理論知識進(jìn)行分析,最終回到現(xiàn)實中尋找解決方案。
本文以馬爾科夫鏈課程的教學(xué)為研究對象,采用進(jìn)一步演化的案例教學(xué)法,將飛機(jī)目標(biāo)跟蹤預(yù)測這一復(fù)雜工程案例[5-7]貫穿課程主線,結(jié)合比照推演和思想政治引導(dǎo)等教學(xué)手段,力求在理論與實踐結(jié)合的基礎(chǔ)上深化教學(xué)效果。通過穿插比賽、天氣等具有實際參照意義的小案例輔助講解,逐步引導(dǎo)學(xué)生在動態(tài)思考中深入理解馬爾科夫鏈的核心概念和基礎(chǔ)理論,提高其分析和解決現(xiàn)實問題的能力。在教學(xué)設(shè)計上,教學(xué)方式強(qiáng)調(diào)從實際問題出發(fā),通過理論框架的逐步滲透,學(xué)生不僅能掌握馬爾科夫鏈的數(shù)學(xué)基礎(chǔ)與推演方法,還能應(yīng)用這些理論工具于復(fù)雜的工程場景中進(jìn)行預(yù)測與優(yōu)化。與此同時,教學(xué)過程中融入思政教育,利于幫助學(xué)生形成科學(xué)的世界觀、人生觀和價值觀,引導(dǎo)他們在知識學(xué)習(xí)和應(yīng)用過程中樹立積極的社會責(zé)任感和職業(yè)操守。此種教學(xué)模式為高校教師提供了具有創(chuàng)新性和實踐性的教學(xué)參考,對于提高學(xué)生的理論素養(yǎng)和實踐能力,具有廣泛的借鑒意義。
一 教學(xué)內(nèi)容
(一) 目標(biāo)跟蹤預(yù)測案例與馬爾科夫鏈的聯(lián)系
目標(biāo)跟蹤預(yù)測是實際應(yīng)用馬爾科夫鏈的工程任務(wù)之一,是我國維護(hù)國家安全、領(lǐng)土完整的重要手段。以飛機(jī)目標(biāo)為例,為及時阻止可疑目標(biāo)進(jìn)入我國領(lǐng)空,需要在偵查捕獲該目標(biāo)位置、速度等狀態(tài)信息時,預(yù)測其未來狀態(tài),從而進(jìn)行攔截[9]。這一目標(biāo)跟蹤預(yù)測任務(wù)就包含三類信息,以目標(biāo)捕獲的時刻為當(dāng)前時刻,捕獲前為過去狀態(tài)信息,需要預(yù)測的是未來狀態(tài)信息[7]。為保證預(yù)測結(jié)果盡量準(zhǔn)確,一般采用通過提取較多過去狀態(tài)信息進(jìn)行趨勢、規(guī)律分析,提高預(yù)測準(zhǔn)確率;而實際上由于目標(biāo)可能存在來源不明的情況,過去狀態(tài)信息不足,可以通過馬爾科夫鏈這一數(shù)學(xué)概念,明確“目標(biāo)未來時刻位置只與當(dāng)前時刻位置有關(guān),而與過去時刻狀態(tài)無關(guān)”的物理內(nèi)涵從而解決位置預(yù)測的問題。
在本節(jié)課程內(nèi)容全部講授完畢時,重新回顧目標(biāo)跟蹤預(yù)測案例,將馬爾科夫鏈應(yīng)用到目標(biāo)運動狀態(tài)預(yù)測中,對未來某時刻目標(biāo)位置預(yù)測關(guān)聯(lián)簡化到只與最近一次跟蹤所得目標(biāo)信息有關(guān),降低模型復(fù)雜度,構(gòu)建目標(biāo)狀態(tài)模型。最終對比實際軌跡與預(yù)測軌跡結(jié)果,差異較小,以實際案例闡述了馬爾科夫鏈在預(yù)測問題上的應(yīng)用,類推其他工程應(yīng)用實際預(yù)測問題。
(二) 重難點分析
1 重點內(nèi)容
1)轉(zhuǎn)移概率的概念:圍繞由當(dāng)前狀態(tài)去預(yù)測未來狀態(tài)的核心問題,在引入馬爾科夫鏈之后,理解未來狀態(tài)的預(yù)測可以通過馬爾科夫鏈降維,具體是如何進(jìn)行預(yù)測的呢?基于足球比賽結(jié)果預(yù)測、天氣預(yù)測案例,理解基本(一步)轉(zhuǎn)移概率,到k步轉(zhuǎn)移概率,k步轉(zhuǎn)移矩陣的概念;明確條件概率在轉(zhuǎn)移概率中應(yīng)用的內(nèi)涵,明晰步數(shù)與狀態(tài)對應(yīng)關(guān)系。基本轉(zhuǎn)移概率即為已知最近一次的狀態(tài),預(yù)測下一次的狀態(tài);類推到k步轉(zhuǎn)移概率,即為已知最近一次的狀態(tài),預(yù)測k次后的狀態(tài)。這里的“次”就是步數(shù),通常指均勻采樣的時刻;狀態(tài)是隨機(jī)序列狀態(tài)空間中的一種可能。而將k步轉(zhuǎn)移概率以狀態(tài)空間到狀態(tài)空間的形式排列,即形成高維的k步轉(zhuǎn)移矩陣。
2)切普曼-柯爾莫戈羅夫方程及其推導(dǎo)過程:基于轉(zhuǎn)移概率的概念,基本轉(zhuǎn)移概率與k步轉(zhuǎn)移概率存在步數(shù)上的差異。基本轉(zhuǎn)移概率只有一步,忽略步數(shù)與條件概率的表達(dá)方式相同,獲取統(tǒng)計結(jié)論較為容易;而需要轉(zhuǎn)移k步時,迭代次數(shù)增多,難以獲取準(zhǔn)確的統(tǒng)計結(jié)果。引導(dǎo)學(xué)生思考如何獲取k步轉(zhuǎn)移概率,增加中間過渡態(tài),推導(dǎo)得出k步轉(zhuǎn)移概率可以將步數(shù)分為兩組乘積求和的形式,從而得到切普曼-柯爾莫戈羅夫方程。
3)齊次馬爾科夫鏈的概念:在熟悉了馬爾科夫鏈、轉(zhuǎn)移概率、切普曼-柯爾莫戈羅夫方程的數(shù)學(xué)公式后,引入齊次性的概念,一般情況下轉(zhuǎn)移概率是與當(dāng)前時刻、狀態(tài)相關(guān)的條件概率,齊次性的加持使之簡化為與當(dāng)前時刻無關(guān)的條件概率,具有平穩(wěn)轉(zhuǎn)移概率的特性。由于轉(zhuǎn)移概率不受初始時刻約束,齊次k步轉(zhuǎn)移概率與齊次k步轉(zhuǎn)移矩陣均可應(yīng)用切普曼-柯爾莫戈羅夫方程簡化為基本轉(zhuǎn)移概率與基本轉(zhuǎn)移矩陣的冪函數(shù)形式,指數(shù)為步數(shù)k。結(jié)合天氣預(yù)測案例,齊次性可以大大簡化問題難度,將k步預(yù)測降維為一步預(yù)測。雖然齊次馬爾科夫鏈具有預(yù)測問題簡化的能力,但要注意這里的齊次性,即轉(zhuǎn)移概率與時刻無關(guān)的前提條件。
2 難點內(nèi)容
馬爾科夫鏈的概念是由目標(biāo)跟蹤預(yù)測工程實例引出的,對于不熟悉馬爾科夫性的學(xué)生來說,是全新的數(shù)學(xué)概念,通過目標(biāo)跟蹤預(yù)測案例思考如何用目標(biāo)當(dāng)前狀態(tài)科學(xué)合理預(yù)測目標(biāo)未來狀態(tài)的問題,引入概念,明確馬爾科夫性是只考慮最近一次結(jié)果預(yù)測未來結(jié)果的特性,并非純粹無記憶性,也具有無后效性的特征。用數(shù)學(xué)方式表示過去、現(xiàn)在與未來的對應(yīng)時刻與狀態(tài)后,結(jié)合條件概率的定義,得出馬爾科夫鏈的數(shù)學(xué)公式,其物理內(nèi)涵是在離散的時間序列中,定義離散的狀態(tài),未來狀態(tài)只與現(xiàn)在時刻狀態(tài)有關(guān),與過去狀態(tài)無關(guān)。
馬爾科夫鏈的數(shù)學(xué)公式中等式兩側(cè)均為轉(zhuǎn)移概率,過去、現(xiàn)在、未來對應(yīng)到時刻,狀態(tài)為狀態(tài)空間中的一項,轉(zhuǎn)移概率是一個時刻到未來一個時刻狀態(tài)轉(zhuǎn)移的條件概率。為計算時刻相差多個采樣數(shù)后轉(zhuǎn)移概率,即k步轉(zhuǎn)移概率,分為兩次進(jìn)行轉(zhuǎn)移,推導(dǎo)出切普曼-柯爾莫戈羅夫方程,將k步轉(zhuǎn)移概率分解為兩次較低維度轉(zhuǎn)移。引入齊次性后,就可以降為基本轉(zhuǎn)移概率的冪。從數(shù)學(xué)計算角度說明了對未來狀態(tài)預(yù)測所需的當(dāng)前狀態(tài)參量,以及所需的計算方法,作為完整的馬爾科夫鏈課程內(nèi)容講述,以問題引入由果溯因,回答如何預(yù)測未來狀態(tài)的問題。
二 關(guān)鍵教學(xué)環(huán)節(jié)設(shè)計
(一) 目標(biāo)跟蹤預(yù)測案例主線設(shè)計
將目標(biāo)跟蹤預(yù)測案例作為課程主線,從解決工程問題的角度引入核心課程內(nèi)容,引導(dǎo)學(xué)生思考,激發(fā)學(xué)生學(xué)習(xí)興趣,提升學(xué)生工程應(yīng)用能力,促使學(xué)生自發(fā)思考探索,達(dá)成課程學(xué)習(xí)最終目標(biāo)。
主線設(shè)計主要體現(xiàn)在兩方面:首先由目標(biāo)跟蹤預(yù)測案例引入,拋出未來狀態(tài)預(yù)測的解決方法,進(jìn)入課程教學(xué)內(nèi)容;在課程內(nèi)容的重難點隨著問題逐步解決漸漸明確敘述后,重新審視目標(biāo)跟蹤預(yù)測問題,運用課程內(nèi)容,直接給出解決方案,說明其可行性。這樣是以先倒序闡述,后正序說明的方式,梳理目標(biāo)跟蹤預(yù)測案例解決思路,便于學(xué)生理解。
1 預(yù)測案例引入
在課程的開始,引入預(yù)測類問題,如未來的天氣、股價,自動駕駛中的行為預(yù)測、輸入法推測接續(xù)的詞語等等[8]。在諸多的預(yù)測應(yīng)用實例中,選擇科工關(guān)鍵的目標(biāo)跟蹤預(yù)測案例進(jìn)行具體介紹,以飛行目標(biāo)為例,需要關(guān)注三個層面的問題:①目標(biāo)從何處來?在目標(biāo)被探測之前,這些信息是未知的。②目標(biāo)的當(dāng)前狀態(tài)怎樣?目標(biāo)被探測到之后,可以獲取位置、速度等信息。③目標(biāo)下步去哪?也就是最重要的預(yù)測類問題,即雷達(dá)能否用當(dāng)前狀態(tài)的有限信息,求解目標(biāo)跟蹤預(yù)測的問題。
通過具體案例的分析引發(fā)學(xué)生對未來狀態(tài)預(yù)測問題的思考,怎樣才能由目標(biāo)當(dāng)前狀態(tài)預(yù)測目標(biāo)未來狀態(tài)呢?從而引入馬爾科夫鏈這一解決途徑,進(jìn)入課程內(nèi)容敘述。
2 預(yù)測案例應(yīng)用
在對以上教學(xué)重點與難點內(nèi)容完成講授后,未來狀態(tài)預(yù)測問題由馬爾科夫鏈降維到計算參數(shù)量較低的轉(zhuǎn)移概率,證明切普曼-柯爾莫戈羅夫方程得出多步轉(zhuǎn)移概率計算方式,引入齊次性降低計算難度,到此未來狀態(tài)問題從馬爾科夫鏈的方向得到完全的解決方案。重新思考課程開始的目標(biāo)跟蹤預(yù)測案例,明確馬爾科夫鏈在目標(biāo)跟蹤狀態(tài)建模的作用,實現(xiàn)理論基礎(chǔ)在實際工程中的應(yīng)用。
假設(shè)目標(biāo)做一維勻速直線運動,目標(biāo)初始位置為x0,目標(biāo)速度為?淄,根據(jù)牛頓運動方程,目標(biāo)的位置處于x=x0+?淄·t。假設(shè)對目標(biāo)運動情況進(jìn)行離散采樣(時間間隔為T),則目標(biāo)在不同時刻的位置可由下式迭代計算得到[8]
式中位置x的下標(biāo)為時刻。在當(dāng)前案例中,可以認(rèn)為每次采樣目標(biāo)運動狀態(tài)相互獨立,且第k+1時刻目標(biāo)的位置xk+1可僅有由k時刻目標(biāo)位置xk、速度?淄以及采樣間隔T決定,故此過程可以看作是馬爾科夫鏈,可只考慮最近一次采樣目標(biāo)狀態(tài)對未來狀態(tài)預(yù)測的影響。由此,通過牛頓運動方程x=x0+?淄·t建立目標(biāo)離散狀態(tài)模型xk+1=xk+?淄·T。
將目標(biāo)運動狀態(tài)以Xk=[xk,?淄k]T表示,也就是系統(tǒng)狀態(tài);離散狀態(tài)模型可建模為Xk+1=F·Xk,實際中考慮運動過程噪聲可建立運動目標(biāo)模型為Xk+1=F·Xk+Wk,其中F=1 T0 1為狀態(tài)參數(shù)矩陣,Wk=Wk ,xWk ,?淄為服從高斯分布的過程噪聲。在實際應(yīng)用中目標(biāo)狀態(tài)通常延伸到三維空間,此時目標(biāo)運動狀態(tài)可構(gòu)建為Xk=xk,?淄x,yk,?淄y,zk,?淄zT,F(xiàn),Wk維度相應(yīng)上升。估計F,Wk即可預(yù)測得到Xk+1未來狀態(tài)。
實際上由于估計總會出現(xiàn)誤差,工程中常常使用卡爾曼濾波進(jìn)行狀態(tài)與誤差的反饋迭代與更新,使預(yù)測結(jié)果更為準(zhǔn)確。圖1是依據(jù)馬爾科夫鏈構(gòu)建的目標(biāo)運動狀態(tài)模型經(jīng)過卡爾曼濾波后得到的理想軌跡,以及實測飛機(jī)目標(biāo)跟蹤軌跡的示意圖,可以發(fā)現(xiàn)軌跡預(yù)測準(zhǔn)確度較高。隨著轉(zhuǎn)移步數(shù)的增多,誤差也有所增大,因此根據(jù)當(dāng)前狀態(tài)可較準(zhǔn)確預(yù)測到的未來狀態(tài)也是有限的,鼓勵同學(xué)們自發(fā)探索如何進(jìn)一步提高模型構(gòu)建可預(yù)測能力。
圖1 飛機(jī)目標(biāo)理想軌跡與跟蹤軌跡對照示意圖
總體來說,目標(biāo)下一時刻的位置和狀態(tài)只與當(dāng)前時刻的位置和狀態(tài)有關(guān),受過去時刻狀態(tài)影響較小,體現(xiàn)了馬爾科夫鏈無后效性的特征。
(二) 馬爾科夫鏈教學(xué)內(nèi)容輔線設(shè)計
通過主線目標(biāo)跟蹤預(yù)測案例提出的問題,一層一層抽絲剝繭,分析已知量與未知量,逐步將復(fù)雜問題簡單化。以提出問題,分析問題,解決問題,再提出新的問題的方式,站在學(xué)生的思考邏輯中進(jìn)行教學(xué)講授。根據(jù)本課的教學(xué)重點與難點,通過下述問題引入課程關(guān)鍵內(nèi)容:
①如何根據(jù)目標(biāo)當(dāng)前狀態(tài)預(yù)測目標(biāo)未來狀態(tài)?引入馬爾科夫鏈,分析馬爾科夫特性,給出馬爾科夫鏈數(shù)學(xué)定義,降低未來狀態(tài)預(yù)測維度。②根據(jù)馬爾科夫鏈數(shù)學(xué)公式,引入轉(zhuǎn)移概率。轉(zhuǎn)移概率是如何定義的?與哪些參數(shù)有關(guān)?轉(zhuǎn)移概率是特殊的條件概率,與已知狀態(tài)的時刻、未知狀態(tài)時刻和狀態(tài)空間的項有關(guān)。③k步轉(zhuǎn)移概率如何獲???引入狀態(tài)轉(zhuǎn)移過渡時刻,將k步分為兩次轉(zhuǎn)移實現(xiàn),即可將k步轉(zhuǎn)移概率降維到步數(shù)更少的轉(zhuǎn)移概率計算中,得到數(shù)學(xué)公式復(fù)雜的切普曼-柯爾莫戈羅夫方程。④若假設(shè)同一采樣率下隨機(jī)過程的轉(zhuǎn)移概率不受時刻影響,即齊次性條件下,k步轉(zhuǎn)移概率如何獲取?引入齊次性,更新切普曼-柯爾莫戈羅夫方程,得到齊次性馬爾科夫鏈定義,由k步降維為一步的冪函數(shù)。
通過環(huán)環(huán)相扣的問題引導(dǎo),教學(xué)思路利于學(xué)生理解并接受邏輯性、數(shù)學(xué)性較強(qiáng)的課程內(nèi)容,形成思路閉環(huán),明確課程內(nèi)容框架。
1 馬爾科夫鏈
由目標(biāo)跟蹤預(yù)測案例引入,預(yù)先告知學(xué)生馬爾科夫鏈?zhǔn)窃擃A(yù)測問題的解決方案。在講述具體數(shù)學(xué)公式前,先讓學(xué)生理解什么是馬爾科夫,以兩支隊伍足球比賽結(jié)果預(yù)測為例,隨機(jī)過程根據(jù)記憶特性可以分為三類:①純粹隨機(jī)過程:不考慮兩支球隊的過去表現(xiàn)進(jìn)行預(yù)測。②馬爾科夫過程:只考慮兩支球隊最近一次比賽的成績進(jìn)行預(yù)測。③非馬氏過程:考慮兩支球隊過去的諸多成績,或者全部成績,進(jìn)行預(yù)測。
為準(zhǔn)確描述馬爾科夫過程在過去、現(xiàn)在、未來狀態(tài)關(guān)系,具體說明馬爾科夫鏈的定義:馬爾科夫鏈?zhǔn)菭顟B(tài)和時間均為離散值的馬爾科夫過程[2]。設(shè)存在隨機(jī)序列{Xn,n∈N+},其狀態(tài)空間S={a1,a2,…,an},對所有的n∈N+,有:
其定義的主要兩個部分為狀態(tài)a■和時間n,描述了狀態(tài)隨時間變化的規(guī)律??梢钥闯觯魧r間n-1設(shè)為現(xiàn)在,n設(shè)為未來,n-2,n-3,…,1設(shè)為過去,則上式描述的含義為:系統(tǒng)的現(xiàn)在狀態(tài)已知,那么系統(tǒng)未來的狀態(tài)與過去的狀態(tài)無關(guān),只與現(xiàn)在狀態(tài)有關(guān)。這就是馬爾科夫鏈的特性——無后效性。
由定義即可看出馬爾科夫鏈的特性,然而對于初次接觸馬爾科夫過程的學(xué)生來說,理解只局限于其數(shù)學(xué)公式。觀察馬爾科夫鏈表達(dá)式,為進(jìn)行未來狀態(tài)的預(yù)測,對條件概率降維簡化,得到的條件概率叫作轉(zhuǎn)移概率,為明晰轉(zhuǎn)移概率的物理概念,進(jìn)入下一步的課程學(xué)習(xí)。
2 轉(zhuǎn)移概率
將轉(zhuǎn)移概率的定義具體分析為下式
式中:i,j∈S,表示系統(tǒng)從m時刻到n時刻,共經(jīng)過n-m的時間后,狀態(tài)由i轉(zhuǎn)換成j的概率。S為狀態(tài)空間,X為序列,a為對應(yīng)的狀態(tài)。m時刻的狀態(tài)i可以理解為當(dāng)前狀態(tài)是已知條件,因此轉(zhuǎn)移概率的本質(zhì)為條件概率,具有如下的性質(zhì):
pij(m,n)≥0
從m時刻開始,若只轉(zhuǎn)移一步,狀態(tài)由i轉(zhuǎn)換成j,即基本(一步)轉(zhuǎn)移概率定義如下:
從m時刻開始,若轉(zhuǎn)移k步,狀態(tài)由i轉(zhuǎn)換成j,即k步轉(zhuǎn)移概率定義如下:
考慮到整個狀態(tài)空間的轉(zhuǎn)移概率,即可得到k步轉(zhuǎn)移矩陣定義如下:
轉(zhuǎn)移概率可用來描述馬爾科夫鏈不同時刻不同狀態(tài)之間的轉(zhuǎn)移特性,為輔助學(xué)生理解,以天氣預(yù)測案例為例進(jìn)行補充說明。
在這個例子中,我們將天氣可能性,即狀態(tài)空間中的項限制為3種,雨天、雪天、晴天;我們研究的對象是在一段時間內(nèi)每一天的天氣,因此這段時間內(nèi)的天氣就形成了隨機(jī)序列,以1天為采樣間隔。假設(shè)明天的天氣只和今天的天氣有關(guān),和昨天及昨天之前都無關(guān),天氣狀態(tài)序列就形成了一個馬爾科夫鏈,體現(xiàn)了“化繁為簡”的降維思想,將n個時刻的n維問題變成2個時刻的2維問題。定義雨天、雪天、晴天之間的轉(zhuǎn)移概率,從而形成一步轉(zhuǎn)移概率矩陣:
定義矩陣的行表示當(dāng)前狀態(tài),列表示未來狀態(tài),從上到下、從左至右分別為雨天、雪天、晴天狀態(tài)。
若已知今天下雪的概率為0.3,那么明天晴天的概率即可通過0.3×0.1=0.03獲得。通過天氣預(yù)測案例,加深學(xué)生對轉(zhuǎn)移概率的理解。
3 切普曼-柯爾莫戈羅夫方程
從統(tǒng)計學(xué)角度來說,基本轉(zhuǎn)移概率已知,獲取較容易,但k步轉(zhuǎn)移概率由于復(fù)雜度較高,應(yīng)如何求解呢?以天氣預(yù)測為例,如果想知道后天、大后天、未來一周的可能天氣概率,又該如何計算呢?
由上述推導(dǎo)可得出切普曼-柯爾莫戈羅夫方程:
該方程針對馬爾科夫鏈,給出其k步轉(zhuǎn)移概率計算方式,即用兩部分轉(zhuǎn)移概率的乘積求和計算k步轉(zhuǎn)移概率,可逐步分解到一步轉(zhuǎn)移概率進(jìn)行計算。
4 齊次馬爾科夫鏈
學(xué)習(xí)了切普曼-柯爾莫戈羅夫方程后,雖然可以計算k步轉(zhuǎn)移概率,但是在k比較大的情況下,即使使用二分法也要乘積求和多次,計算起來較困難。故引入齊次的概念,簡化計算。
“齊次”的含義是系統(tǒng)的轉(zhuǎn)移概率與時間無關(guān),即具有平穩(wěn)轉(zhuǎn)移概率。與時間無關(guān),則齊次馬爾科夫鏈的定義簡化如下:
在此基礎(chǔ)上,可以根據(jù)其一步轉(zhuǎn)移概率寫出轉(zhuǎn)移概率矩陣:
同樣地,在齊次前提下,轉(zhuǎn)移概率矩陣也與時刻無關(guān)。
在此基礎(chǔ)上引入齊次馬爾可夫鏈滿足的切普曼-柯爾莫戈羅夫方程:
上式表示齊次馬爾科夫鏈可由一步轉(zhuǎn)移概率確定k步轉(zhuǎn)移概率,即可知齊次馬爾科夫鏈的初始分布和轉(zhuǎn)移概率即可確定其有限維分布。
再次回顧天氣預(yù)測案例。已知雨天、雪天、晴天之間的轉(zhuǎn)移概率,第一天下雪,則第五天是晴天的概率是多少?根據(jù)齊次馬爾科夫鏈和一步轉(zhuǎn)移概率定義,求解未來任意一天的氣象狀態(tài)可以由迭代運算分步實現(xiàn),已知一步轉(zhuǎn)移概率可完全確定k步轉(zhuǎn)移概率,即引出切普曼-柯爾莫戈羅夫方程:
由上式可求得氣象預(yù)測問題的五步轉(zhuǎn)移概率:
。
即可知第一天下雪概率0.3,則今天下雪,第五天是晴天的概率為0.294 5,則第五天為晴天的概率是0.3×0.294 5=0.088 35。天氣預(yù)測案例生動形象地加深了學(xué)生對新概念和定理的理解,并通過利用新概念解決問題,形成“學(xué)以致用”的良性循環(huán),進(jìn)一步梳理鞏固馬爾科夫鏈的教學(xué)邏輯鏈。
(三) 馬爾科夫鏈反映出的課程思政
馬爾科夫鏈的本質(zhì)是未來狀態(tài)僅由當(dāng)前狀態(tài)決定,不受過去狀態(tài)影響,是一種有限記憶性,無后效性。工程上經(jīng)常應(yīng)用馬爾科夫鏈進(jìn)行降維操作,簡化或者說弱化過去狀態(tài)對未來狀態(tài)的影響,利用有限的信息進(jìn)行預(yù)測。馬爾科夫鏈的物理內(nèi)涵正如陶淵明所作《歸去來兮辭》中的一句話,“悟已往之不諫,知來者之可追”,過去的錯誤已經(jīng)不可挽回,但未來的事還值得去追尋。過去的狀態(tài)已經(jīng)發(fā)生了,但馬爾科夫鏈告訴我們,把握當(dāng)下的狀態(tài),才是對未來狀態(tài)的最好影響,不要拘泥于遙遠(yuǎn)過去,請放眼充滿可能性的未來。
三 結(jié)束語
為培養(yǎng)學(xué)生應(yīng)用課程理論知識解決工程實際問題的能力,加深學(xué)生對課程知識的理解,本文介紹了以預(yù)測類案例為引導(dǎo)的馬爾科夫鏈教學(xué)方案,課程教學(xué)以目標(biāo)跟蹤預(yù)測問題為主線,結(jié)合球賽預(yù)測、天氣預(yù)測等小案例,將馬爾科夫鏈教學(xué)重點與難點按照倒序的方式,以學(xué)生思考問題的思路逐步剖析并闡述概念與內(nèi)涵,巧妙地將數(shù)學(xué)公式與推導(dǎo)和預(yù)測案例融合在一起,加深學(xué)生對理論知識的思考,培養(yǎng)學(xué)生善于分析問題、解決問題的理論應(yīng)用能力。在此基礎(chǔ)上,針對目標(biāo)跟蹤預(yù)測案例,討論目標(biāo)跟蹤建模中的馬爾科夫特性,明確馬爾科夫鏈在此類預(yù)測案例中的應(yīng)用方法,引導(dǎo)學(xué)生對馬爾科夫特性的深層次思考,培養(yǎng)健康向上、積極進(jìn)取的拼搏觀、價值觀。
本文設(shè)計的教學(xué)方案在幫助學(xué)生熟練掌握馬爾科夫特性的同時,也是一種教學(xué)方案的革新,提升工程案例在課程講解中的比重,將課程內(nèi)容與案例有效結(jié)合,有利于提升學(xué)生對課堂內(nèi)容的掌握程度,提高學(xué)生研習(xí)的積極性與主動性,鍛煉學(xué)生思維,有效實現(xiàn)學(xué)生能力培養(yǎng)。
參考文獻(xiàn):
[1] 楊煉.高校數(shù)學(xué)類課程案例式實驗教學(xué)方法研究[J].教育進(jìn)展,2023(5):2468-2473.
[2] 楊威,曾虹程,門志榮,等.各態(tài)歷經(jīng)性的案例教學(xué)法研究[J].高教學(xué)刊,2024(22):7-11,15.
[3] 江瀅.從“案例舉例”到案例教學(xué)——案例教學(xué)法在我國法學(xué)實踐教學(xué)中的應(yīng)用與完善[J].科教文匯,2024(15):101-104.
[4] 周蔭清.隨機(jī)過程理論[M].北京:電子工業(yè)出版社,2006.
[5] 郭軍,朱凡,劉遠(yuǎn)飛.基于馬爾科夫鏈預(yù)測的多無人機(jī)協(xié)同搜索控制[J].彈箭與制導(dǎo)學(xué)報,2007(5):315-318.
[6] 王澤天,高嶺,高全力.基于改進(jìn)馬爾科夫鏈的移動軌跡預(yù)測方法[J].西安工程大學(xué)學(xué)報,2020,34(2):97-102
[7] 白曉蘭,張振朋,周文全,等.基于采樣隱馬爾可夫模型的移動機(jī)器人路徑規(guī)劃[J].組合機(jī)床與自動化加工技術(shù),2023(7):50-56.
[8] 陳建華,李海燕,張榆鋒,等.《隨機(jī)過程》精品課程建設(shè)與教學(xué)改革探索[J].中國科技信息,2010(18):283-284.
[9] 熊丹,吳傳菊.工科研究生隨機(jī)過程課程教學(xué)改革研究[J].高師理科學(xué)刊,2015,35(1):67-70.
[10] 徐華平.比照推演式教學(xué)方法在工科“隨機(jī)過程理論”課的應(yīng)用[J].高教論壇,2011(11):41-43.