羅新宇, 陳洋卓, 段 斌, 張 佐, 章 兢
(1.湘潭大學(xué) 信息工程學(xué)院,湖南 湘潭 411105;2.清華大學(xué) 自動化系,北京 100084)
智能車競賽是一個集機械、電氣、儀器儀表、電子、計算機、控制等多學(xué)科綜合貫穿始終的面向全國大學(xué)生的具有探索性的工程實踐活動,是教育部倡導(dǎo)的大學(xué)生科技競賽之一.該競賽旨在促進高等學(xué)校素質(zhì)教育,培養(yǎng)大學(xué)生的綜合知識運用能力、基本工程實踐能力和創(chuàng)新意識[1].國內(nèi)外關(guān)于學(xué)科競賽學(xué)習(xí)成果評價的研究很少,文獻[1]分析了復(fù)雜工程問題的特征和解決復(fù)雜工程問題的能力,對每一個指標(biāo)點設(shè)置不同的考核方式來闡述評價學(xué)生解決復(fù)雜工程問題的能力,但是相對煩瑣;文獻[2]從系統(tǒng)設(shè)計類課程層面,培養(yǎng)學(xué)生解決復(fù)雜工程問題的能力,闡述數(shù)據(jù)庫系統(tǒng)設(shè)計課程的具體教學(xué)實踐,包括課程內(nèi)容、課程組織和能力達成評價方法[2];文獻[3]對比賽任務(wù)和規(guī)則、信號處理所起的作用以及建立在比賽基礎(chǔ)上的課程進行了概述[3].如何以學(xué)生為中心,圍繞學(xué)生制定培養(yǎng)目標(biāo),按照畢業(yè)要求配備合格的師資,評價學(xué)生是否具有解決復(fù)雜工程問題的能力已然成為一大挑戰(zhàn).智能車在執(zhí)行任務(wù)的過程中運用了多學(xué)科知識和個人技能,學(xué)生充分運用書本所學(xué)原理、公式、方法,結(jié)合個人技能,從最開始的方案制定到比賽運行,實際上是解決一系列復(fù)雜工程問題.根據(jù)智能車競賽規(guī)則,定義所希望測量的知識、能力和技能,結(jié)合貝葉斯網(wǎng)絡(luò),綜合智能車競賽所體現(xiàn)的學(xué)生知識和能力與畢業(yè)要求能力的相關(guān)關(guān)系,構(gòu)建智能車競賽學(xué)生知識與能力認(rèn)知診斷模型.通過觀察可觀察量和認(rèn)知診斷系統(tǒng)的反饋,對學(xué)生知識的掌握程度和個人技能進行評估.
智能車競賽學(xué)習(xí)成果評估整體框架如圖1所示,智能車競賽需運用電氣、儀器、機械、電子、計算機、控制等多學(xué)科知識綜合[4].整個完成過程涉及構(gòu)思、設(shè)計、實施和運行等模塊,這些模塊具體通過方案制定、理論研究、系統(tǒng)設(shè)計、仿真計算、軟硬件設(shè)計、系統(tǒng)組裝與調(diào)試等過程證據(jù)體現(xiàn).通過觀察運動性能、路徑規(guī)劃、路徑識別、參數(shù)調(diào)整等中間量,作為證據(jù)支撐認(rèn)知診斷模型,經(jīng)過模型的層層反饋,輸出知識和能力熟練度以及所達成的部分畢業(yè)要求能力指標(biāo)點.
學(xué)生傾向于以考試為導(dǎo)向的技能,有足夠的動力去學(xué)習(xí)和創(chuàng)新,獲得在團隊環(huán)境中解決真實的工程問題的機會.智能車競賽從構(gòu)思、設(shè)計、實施到運行,實際上是解決一系列復(fù)雜工程問題的過程.基于12條畢業(yè)要求指標(biāo),對智能車競賽能力概念化分析,以ECD(evidence-centered design)為理論指導(dǎo)[6],根據(jù)智能車競賽過程,設(shè)計任務(wù)模型與結(jié)果數(shù)據(jù).智能車競賽展現(xiàn)的能力對應(yīng)的畢業(yè)要求能力指標(biāo)點如表1所示.
表1 復(fù)雜工程問題與智能車的等價性
為了解學(xué)生參加智能車競賽相關(guān)知識的掌握程度和能力的強弱,以及畢業(yè)要求能力達成情況,以貝葉斯網(wǎng)絡(luò)為基礎(chǔ),構(gòu)建認(rèn)知診斷模型.貝葉斯定理即條件概率推理過程,貝葉斯公式如下:
(1)
其中:p(A|B)稱為后驗概率,即更新數(shù)據(jù)后,A事件發(fā)生的概率;p(A)稱為先驗概率,即在得到新數(shù)據(jù)前事件A的概率;p(B|A)是似然度,在事件A發(fā)生的情況下,事件B發(fā)生的概率;p(B)是標(biāo)準(zhǔn)化常量[8].
貝葉斯網(wǎng)絡(luò)主要由三部分組成:有向無環(huán)圖、先驗概率、條件概率[9].有向無環(huán)圖由節(jié)點Di=(Di1,Di2,…,Din)和有向線段L組成,節(jié)點Di表示貝葉斯網(wǎng)絡(luò)節(jié)點變量,包括父母節(jié)點,子節(jié)點,每個節(jié)點變量有一個或多個狀態(tài)Sj=(Sj1,Sj2,…,Sjm).有向線段L連接父節(jié)點Di與子節(jié)點Di+1,表示父子節(jié)點間的依賴關(guān)系;先驗概率p(Di)是在得到新數(shù)據(jù)前該節(jié)點變量的概率,通常由歷史數(shù)據(jù)決定;條件概率p(Di|Di-1),即用概率估計的形式表示父節(jié)點與子節(jié)點之間的關(guān)聯(lián)程度,在同一個父節(jié)點下,每個子節(jié)點間相互獨立,即
p(D1,D2,…,Dn)=∑p(Dn|D1,D2,…,Dn-1)…p(D2|D1)p(D1) .
(2)
在貝葉斯網(wǎng)絡(luò)中,先驗概率的選擇一直飽受爭議.先驗概率分兩種:第一種客觀先驗,例如扁平先驗,每一種可能狀態(tài)賦以相同的權(quán)重;第二種主觀先驗,根據(jù)歷史數(shù)據(jù)或?qū)<医?jīng)驗,表達個人對先驗的看法[10].常用的先驗概率分布有Gamma分布、Beta分布、高斯分布等.智能車競賽認(rèn)知診斷模型每個節(jié)點變量分為4個狀態(tài)Sj=(Sj1,Sj2,Sj3,Sj4),并把等級轉(zhuǎn)換成數(shù)值,對這些數(shù)值進行分類:S1優(yōu)秀(90~100)、S2良好(75~89)、S3中等(60~74)、S4不及格(60分以下).
2.3.1層次分析法AHP專業(yè)知識和專家經(jīng)驗的引入是公認(rèn)的降低模型內(nèi)在不確定性的最佳解決方案,所以被認(rèn)為是確定CPT(條件概率)的一種重要手段.層次分析法(analytic hierarchy process, AHP)原理即從專家(評分老師)知識經(jīng)驗中訓(xùn)練條件概率信息的貝葉斯網(wǎng)絡(luò)建模方法[11].
表2 專家決策標(biāo)準(zhǔn)
(1) 識別框架.Θ表示節(jié)點Nr的所有可能狀態(tài)概率取值的一個集合,且Θ內(nèi)的各種狀態(tài)互不相容.
(2) 分配函數(shù)、焦元.定義m:2Θ→[0,1],若滿足如下條件:
(3)
稱m(Di)為Θ上的基本概率分配函數(shù),若m(Di)>0,則稱A為m的焦元.
(3) 專家決策標(biāo)準(zhǔn).專家Ek在屬性Cx下推斷的相關(guān)度矩陣:
表3 專家Ek在屬性Cx下推斷的相關(guān)度矩陣
(4)
專家根據(jù)對應(yīng)事件對識別框架的關(guān)聯(lián)程度來給出決策標(biāo)準(zhǔn).
2.3.2Pert分布Pert分布是一種特殊的Beta分布,存在三個參數(shù):最小值a、最可能值b與最大值.
Pert(a,b,c)=Beta(α1,α2)*(c-a)+a,
(5)
由于篇幅有限,以智能車競賽路徑識別環(huán)節(jié)為例.基于復(fù)雜工程問題的特征,對路徑識別環(huán)節(jié)任務(wù)執(zhí)行過程進行歸納.
(1) 工程原理的深入運用和分析.
① 數(shù)據(jù)采集.將賽道信息以數(shù)字量的形式輸入單片機.
② 數(shù)據(jù)處理.對采集到的信息進行處理,去噪聲干擾,濾波分析,路況特征提取.
③ 數(shù)據(jù)控制.控制算法,需要結(jié)合道路元素設(shè)計合理方案.
④ 使用現(xiàn)代工具、傳感器分析和仿真軟件的使用.
(2) 涉及多方面的技術(shù),工程和其他因素的分析和綜合運用,以及相互間沖突的解決.
① 線性調(diào)壓、PWM調(diào)制與接口電路設(shè)計.
② 如何設(shè)計傳感器接口電路與后續(xù)有關(guān)電路聯(lián)系起來.
③ 傳感器的輸出與計算機的匹配問題,選擇器件的問題等.
(3) 創(chuàng)造性抽象模型的建立.
① 數(shù)據(jù)處理.圖像識別存在建模和模式識別.
② 控制本身是基于模型的控制過程.
(4) 非常規(guī)方法的提出和運用.
① 不連續(xù)道路線和路口的道路元素的識別必須依靠某種策略.
② 電感傳感器的溫度系數(shù)需做大量實驗尋找規(guī)律和最佳工作點.
(5) 非標(biāo)準(zhǔn)情況或非規(guī)范情況的解決.
車模在高速運動過程中,所采集的圖像一定有各種非標(biāo)準(zhǔn)情況,對于圖像的處理過程也一定有其獨特的方法.
(6)問題相關(guān)各方利益沖突的調(diào)和與解決.
① 車模的運行精度與速度有矛盾,車模的穩(wěn)定性與速度有矛盾.
② 團隊成員的評分.
(7) 綜合性分析問題的分析與解決.
運行速度控制知識、傳感器知識、轉(zhuǎn)向控制知識等多學(xué)科知識的綜合.
在內(nèi)、外部技術(shù)問題上進行證據(jù)劃分,證據(jù)部分或全部地支撐了畢業(yè)要求能力指標(biāo)1~5條和11條,對應(yīng)于復(fù)雜工程問題的特征,可對智能車路徑識別完成過程中的證據(jù)性總結(jié)為:
(1) 智能車競賽路徑識別環(huán)節(jié)設(shè)計工程原理的深入運用和分析.
(2) 涉及多方面的技術(shù)、工程和其他因素的分析和綜合運用,以及相互間沖突的解決.
(3) 數(shù)據(jù)處理與控制創(chuàng)造性抽象模型的建立.
(4) 非常規(guī)方法的提出和運用.
(5) 非標(biāo)準(zhǔn)情況或非規(guī)范情況的解決.
(6) 問題相關(guān)各方利益沖突的調(diào)和與解決.
(7) 車模綜合性分析問題的分析與解決.
而對于9,10,12條面向從事解決復(fù)雜問題學(xué)生應(yīng)具有的社會能力,我們可以在整個智能車完成過程中羅列新的證據(jù).
(8) 個人與團隊的交流和合作.
① 在組建競賽隊伍時,團隊成員和指導(dǎo)老師通常來自不同一級學(xué)科,不同的專業(yè).
② 團隊成員進行互評打分,路徑識別環(huán)節(jié)設(shè)計時體現(xiàn)團隊協(xié)作能力.
(9) 就復(fù)雜工程問題與業(yè)界同行和社會公眾進行有效溝通和交流.
① 在參加比賽的過程中,會與來自其他學(xué)校的不同隊伍、指導(dǎo)老師進行經(jīng)驗和技術(shù)上的交流.
② 比賽完成后,通常需要撰寫內(nèi)容翔實的技術(shù)報告,總結(jié)整個比賽過程.
根據(jù)上述內(nèi)容,構(gòu)建節(jié)點變量路徑識別證據(jù)模型,如圖2所示.
路徑識別是智能車競賽設(shè)計中的一個重要部分,也是體現(xiàn)學(xué)生知識和能力的一個重要節(jié)點.根據(jù)圖2證據(jù)模型,對路徑識別進行展開,圖3為路徑識別認(rèn)知診斷模型.
路徑識別包括三部分:數(shù)據(jù)采集,數(shù)據(jù)處理,數(shù)據(jù)控制[14-15].路徑識別認(rèn)知診斷模型涉及計算機、控制、電子、電氣、儀器儀表等多學(xué)科知識綜合.具體來說,線性調(diào)壓、PWM驅(qū)動控制運行速度;轉(zhuǎn)向控制知識,即PWM脈寬調(diào)制控制舵盤角位來控制智能車運動方向[7];利用傳感器和電路知識,設(shè)計傳感器接口電路;利用攝像頭采集賽道路徑圖像信息或用傳感器采集賽道信息,對數(shù)據(jù)進行處理和特征提取,編寫程序控制電機轉(zhuǎn)速和舵機擺角[7];最后對團隊合作機制、速度、撰寫技術(shù)報告、障礙躲避等可觀察變量進行測量,通過認(rèn)知診斷模型反饋學(xué)生在路徑識別這一模塊的熟練度和相關(guān)知識掌握程度以及能力強弱.
學(xué)生參加智能車競賽既是培養(yǎng)學(xué)生解決復(fù)雜工程問題的能力,也是培養(yǎng)學(xué)生高階思維能力的過程.高階思維能力包括問題解決能力、元認(rèn)知能力、團隊協(xié)作能力、溝通能力、創(chuàng)造性思維能力五個子能力,問題解決能力與其余四個子能力成正相關(guān),團隊協(xié)作能力與溝通能力成正相關(guān),與創(chuàng)造性思維能力間接性正相關(guān).子能力間相互依賴關(guān)系如圖4所示.
高階思維能力與畢業(yè)要求指標(biāo)點的對應(yīng)關(guān)系如表4所示.
表4 高階思維能力與畢業(yè)要求指標(biāo)點的對應(yīng)關(guān)系
結(jié)合團隊合作機制這一可觀察量,以團隊協(xié)作能力為例.智能車競賽由一個團隊共同運作,通過組內(nèi)成員相互評估考核其他成員的高階思維能力,在一個智能車競賽組中,成員所做的貢獻固然有異,不同貢獻的人考核時得分應(yīng)當(dāng)不同,如何進行合理的打分并使團隊所有隊員都能竭盡全力工作,已然成為一種困境,為了解決這種困境,采用博弈論納什均衡來解決同組成員評分問題.
一個智能車競賽小組由n位學(xué)生組成,i=1,2,…,n,代表同一小組的學(xué)生.每個學(xué)生的效用水平與個人的努力關(guān)聯(lián),ui表示第i個人的效益水平,n維向量u=(u1,…,uI,…,un)為n位學(xué)生的效用水平組合[16];Eui為期望效用,即學(xué)生效用水平的期望值,與戰(zhàn)略發(fā)生的概率和效益水平有關(guān);學(xué)生參加智能車競賽根據(jù)實際情況選擇多種戰(zhàn)略,若n位學(xué)生每人選擇一個戰(zhàn)略,n維向量s=(s1,…,si,…,sn)稱為一個戰(zhàn)略組合,其中si是小組中第i位學(xué)生選擇的戰(zhàn)略[13];最優(yōu)戰(zhàn)略均衡是所有學(xué)生的最優(yōu)戰(zhàn)略的組合,記為s*=(s1*,…,si*,…,sn*)[16].用si*表示第i位學(xué)生在均衡情況下的最優(yōu)戰(zhàn)略,它是i學(xué)生所有可能戰(zhàn)略中使ui或Eui最大化的戰(zhàn)略[5].一般來說,ui是所有參與人的戰(zhàn)略組合函數(shù),i學(xué)生的最優(yōu)戰(zhàn)略通常依賴于其他人的戰(zhàn)略選擇;除i以外其他所有人的戰(zhàn)略組合由向量s-i=(s1,…,si-1,si+1,…,sn)表示,si*是給定s-i情況下第i位學(xué)生的最優(yōu)戰(zhàn)略,即
ui(si*,s-i)≥u(si′,s-i),?si′≠si*.
(6)
對所有i=1,2,…,n,上式成立.
設(shè)n個參與者的戰(zhàn)略式表述博弈G={S1,…,Sn;u1,…,un},戰(zhàn)略組合s*=(s1*,…,si*,…,sn*)是一個納什均衡,如果對于每一個i,si*是給定其他參與人選擇s-i*=(s1*,…,si-1*,si+1*,…,sn*)的情況下第i個參與人的最優(yōu)戰(zhàn)略,即
ui(si*,s-i*)≥ui(si′,s-i*),?si∈Si,
(7)
或者,si為下式最大化時的解:
si*∈arg maxui(s1*,…,si-1*,si,si+1*,…,sn*),i=1,2,…,n.
(8)
若一個競賽團隊由三人組成,參加智能車競賽時,每個人有“工作”和“偷懶”兩種戰(zhàn)略.智能車競賽小組評分機制組員間形成一個G={工作,偷懶;u1,u2,u3}的博弈,該評分博弈存在占優(yōu)戰(zhàn)略均衡.團隊共同得分取決于平均努力程度,即專家意見,第i(i=1,2,3)個人的效益水平ui為小組得分減去個人努力的成本,效益水平用數(shù)值表示,數(shù)值大小與效益水平(收益)成正比,團隊A提交的團隊合作機制如表5所示.
表5 學(xué)生兩難困境
該博弈論存在一個占優(yōu)戰(zhàn)略均衡,滿足:
ui(si*,s-i*)≥ui(si′,s-i*),?si∈Si, ?i.
(9)
例如,當(dāng)A1選擇偷懶時,G={S1,…,Sn;u1,…,un}={{偷懶*,工作,工作;50*,30,30},{偷懶*,偷懶,工作;40*,40,0},{偷懶*,工作,偷懶;40*,0,40},{偷懶*,偷懶,偷懶;10*,10,10}},無論其他成員選擇何種戰(zhàn)略,A1的效益水平最高,“偷懶”都是最優(yōu)戰(zhàn)略.
為了解決兩難困境,團隊B提出一種新的評分機制,根據(jù)對團隊的貢獻大小為學(xué)生評級,排名第一加30分,第二加20分,第三不加分,每個學(xué)生為團隊其他兩位成員評級,如表6所示.
表6 團隊評級情況
若有兩個隊員等級相同,則讓第三個隊員對這兩個隊員重新評級.如表6所示,B1為第一,B2第二,B3第三.修改表5博弈,如表7所示.
表7 帶有獎勵機制的隊員處境
如表7所示,此時“工作”成為占優(yōu)戰(zhàn)略,博弈稱為合作占優(yōu)博弈.B1選擇“工作”戰(zhàn)略,G={S1,…,Sn;u1,…,un}={{工作*,工作,工作;83*,83,83},{工作*,偷懶,工作;75*,50,75},{工作*,工作,偷懶;75*,75,50},{工作*,偷懶,偷懶;50*,30,30}},如圖6所示,團隊合作機制趨于positive,團隊協(xié)作能力相對較強.
每個隊員給同隊成員打分(不包括自己),再利用如下公式計算最終成績.
個人最終成績=小組成績*組內(nèi)人數(shù)*r/100,
(10)
式中:r是互評系數(shù),互評系數(shù)是對團隊成員的打分,即博弈論法評分得分.評價應(yīng)盡量客觀,包括工作量,工作難度,團隊貢獻等的綜合評價,分?jǐn)?shù)越高,貢獻越大.經(jīng)過歸一化處理后,得到互評系數(shù),互評系數(shù)之和為100,小組平均成績由指導(dǎo)老師決定.例如,經(jīng)過上述博弈論評分機制,GB1={工作;90},GB2={工作;90},GB3={工作;90},為3位同學(xué)的戰(zhàn)略和效用水平,小組成員“工作”成績85分,則3位同學(xué)的最終成績?yōu)?/p>
B1:85*3*37.5/100=95.6,
B2:85*3*34.4/100=87.7,
B3:85*3*28.1/100=71.7.
把博弈論用在組內(nèi)互評上的優(yōu)勢:
(1) 從同隊組員那里獲得評分依據(jù).
(2) 沒有給隊員偽造信息提升自己分?jǐn)?shù)的機會.
(3) 消除工作兩難的困境.
某高校2016-2017年全國大學(xué)生“恩智浦”杯智能汽車競賽比賽結(jié)果如表8所示.
表8 某高校2016-2017年“恩智浦”杯智能車競賽比賽結(jié)果
將“國家級”“華南賽區(qū)和省一等獎”“省二、三等獎”“未獲獎”依次設(shè)定為優(yōu)秀、良好、中等、不及格四個等級,則首節(jié)點的先驗概率值如表9所示.在本認(rèn)知診斷模型中,未獲獎不代表考核不及格,只是先驗概率的一種設(shè)定方法.
表9 首節(jié)點的先驗概率
由于篇幅有限,現(xiàn)以父節(jié)點“路徑識別”和子節(jié)點“傳感器知識”之間的條件概率設(shè)置為例,其他節(jié)點間的條件概率同理可得.如表10所示,當(dāng)傳感器知識認(rèn)知能力為優(yōu)秀級別時,與獲得優(yōu)秀級別的路徑識別關(guān)聯(lián)度較高(專家一般給出5、6),而與獲得不及格級別的路徑識別能力檢測關(guān)聯(lián)度不高(專家一般給出2、3).
表10 專家Ek在路徑識別S1(優(yōu)秀)下傳感器知識的相關(guān)度矩陣
注:S1代表優(yōu)秀,S2代表良好,S3代表中等,S4代表不及格.
根據(jù)知識矩陣求出專家E1,E2,E3的基本概率分布如表11所示.
表11 專家E1,E2,E3的BPA分布
對三位專家的基本概率分布取值進行排序,依次得出專家給出的最小值、最可能值、最大值,最后使用泊松分布(Pert)對多個專家進行意見綜合.
利用Pert分布來模擬專家意見,通過AHP分析得出:S1優(yōu)秀、S2良好、S3中等、S4不及格四個等級的條件概率,對三個專家的意見進行排序,得出最低概率,最可能概率,最高概率.在@RISK軟件中調(diào)用函數(shù)Risk Discrete,得到如圖7所示的Pert分布,從而對三位專家意見進行擬合,結(jié)果如表12所示.
表12 專家E1,E2,E3綜合BPA分布
擬合后的專家意見S1S2S3S435.4%23.1%17.0%12.5歸一化處理40.2%26.3%19.3%14.2%
學(xué)生參加智能車競賽,在路徑識別環(huán)節(jié)知識的掌握程度和能力的強弱以及畢業(yè)要求能力指標(biāo)點達成度如圖8所示.各項可觀察量趨于優(yōu)秀時,相關(guān)的知識和能力值也因可觀察量的改變趨于優(yōu)秀.但仿真結(jié)果仍然不是很理想,例如沒有設(shè)定相關(guān)閾值評價學(xué)生的各項達成度,該認(rèn)知診斷模型的結(jié)構(gòu)與參數(shù)需要進一步精煉,這些將在后續(xù)工作中改進.
本文以12條畢業(yè)要求能力指標(biāo)點為依據(jù),基于貝葉斯網(wǎng)絡(luò),并以產(chǎn)出為導(dǎo)向,構(gòu)建了以證據(jù)為中心的智能車競賽路徑識別認(rèn)知診斷模型.依據(jù)智能車競賽的內(nèi)容和規(guī)則,提出一種確定貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)的方法.基于博弈論設(shè)計了團隊合作能力的證據(jù)辨識規(guī)則,避免了成員偽造信息提高自己評級的機會.最后對該認(rèn)知診斷模型進行仿真,得到學(xué)生參加智能車競賽路徑識別模塊包括知識和能力的整體熟練度.