趙小燕,梁瑞宇,童瑩,包永強(qiáng),王青云
摘? 要: 語(yǔ)音信號(hào)處理技術(shù)具有很強(qiáng)的專業(yè)性、先進(jìn)性和實(shí)用性。將項(xiàng)目驅(qū)動(dòng)教學(xué)法應(yīng)用于語(yǔ)音信號(hào)處理課程教學(xué),從項(xiàng)目設(shè)置、項(xiàng)目執(zhí)行和項(xiàng)目評(píng)價(jià)等方面探索其實(shí)施路徑,并以聲源定位為例,闡述教學(xué)實(shí)施過(guò)程。教學(xué)實(shí)踐表明,該模式有效激發(fā)了學(xué)生的學(xué)習(xí)積極性和主動(dòng)性,提升了學(xué)生綜合應(yīng)用知識(shí)的能力,為學(xué)生今后開展科研和開發(fā)工作打下了良好基礎(chǔ)。
關(guān)鍵詞: 語(yǔ)音信號(hào)處理; 項(xiàng)目驅(qū)動(dòng)教學(xué); 聲源定位; 教學(xué)實(shí)施
中圖分類號(hào):G642? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1006-8228(2022)06-112-04
Exploration and application of project-driven teaching method
in the speech signal processing course
Zhao Xiaoyan, Liang Ruiyu, Tong Ying, Bao Yongqiang, Wang Qingyun
(School of Information and Communication Engineering, Nanjing Institute of Technology, Nanjing, Jiangsu 21167, China)
Abstract: The speech signal processing course is highly specialized, advanced and practical. The project-driven teaching method is applied to the teaching of this course, and its implementation path is explored in terms of project setting, project implementation and project evaluation. Taking sound source localization as an example, the teaching implementation process is described. The results of practical teaching show that the mode has effectively simulated students' learning enthusiasm and initiative, improved their ability to comprehensively apply knowledge, and laid a good foundation for students to carry out scientific research and development work in the future.
Key words: speech signal processing; project-driven teaching; sound source localization; teaching implementation
0 引言
語(yǔ)音信號(hào)處理技術(shù)是人類社會(huì)走向智能化的關(guān)鍵技術(shù)之一。語(yǔ)音信號(hào)處理以語(yǔ)音語(yǔ)言學(xué)和數(shù)字信號(hào)處理為基礎(chǔ),與生理學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)、模式識(shí)別和人工智能等學(xué)科有著密切聯(lián)系[1,2]。語(yǔ)音信號(hào)處理是信息工程專業(yè)重要的專業(yè)課,具備專業(yè)性、先進(jìn)性和實(shí)用性。傳統(tǒng)單一的教學(xué)模式(板書、多媒體課件展示等)難以實(shí)現(xiàn)對(duì)學(xué)生自學(xué)能力、理論聯(lián)系實(shí)際的能力、實(shí)踐能力和科研能力的培養(yǎng),加之課程的理論復(fù)雜、內(nèi)容更新快、學(xué)習(xí)難度大,很多學(xué)生的學(xué)習(xí)積極性和主動(dòng)性不高,甚至產(chǎn)生了畏難和厭學(xué)情緒,教學(xué)效果不佳。本文探索在語(yǔ)音信號(hào)處理課程教學(xué)中采用項(xiàng)目驅(qū)動(dòng)教學(xué)法,將教學(xué)內(nèi)容融入實(shí)際工程項(xiàng)目,讓學(xué)生主動(dòng)參與教學(xué)活動(dòng)、自主完成項(xiàng)目。本文以聲源定位為例,闡述具體教學(xué)實(shí)施過(guò)程。實(shí)踐表明,該教學(xué)方法顯著提高了教學(xué)效果。
1 項(xiàng)目驅(qū)動(dòng)教學(xué)法在語(yǔ)音信號(hào)處理過(guò)程中的實(shí)施過(guò)程
語(yǔ)音信號(hào)處理課程的教學(xué)內(nèi)容包括語(yǔ)音信號(hào)處理基礎(chǔ)知識(shí)、分析方法及技術(shù)與應(yīng)用三部分。語(yǔ)音信號(hào)處理基礎(chǔ)知識(shí)包括語(yǔ)音信號(hào)的產(chǎn)生、特性、數(shù)學(xué)模型等;分析方法包括預(yù)處理、倒譜分析、線性預(yù)測(cè)分析、特征參數(shù)估計(jì)等;技術(shù)與應(yīng)用包括語(yǔ)音增強(qiáng)、語(yǔ)音識(shí)別、聲源定位等[3,4]。前兩部分內(nèi)容是本課程的基礎(chǔ)理論,采用傳統(tǒng)教學(xué)模式。第三部分內(nèi)容采用項(xiàng)目驅(qū)動(dòng)教學(xué)模式,教師設(shè)計(jì)與教學(xué)內(nèi)容相關(guān)的實(shí)際項(xiàng)目,引導(dǎo)學(xué)生在完成項(xiàng)目的同時(shí)逐步完成課程內(nèi)容的學(xué)習(xí)[5]。項(xiàng)目驅(qū)動(dòng)教學(xué)法以教師作為教學(xué)主導(dǎo),以學(xué)生作為教學(xué)主體[6]。教師設(shè)計(jì)項(xiàng)目選題,細(xì)化任務(wù)點(diǎn),指導(dǎo)和幫助學(xué)生執(zhí)行項(xiàng)目任務(wù);學(xué)生自主學(xué)習(xí),協(xié)作分工,完成項(xiàng)目任務(wù)。教學(xué)實(shí)施過(guò)程包括項(xiàng)目設(shè)置、項(xiàng)目執(zhí)行和項(xiàng)目評(píng)價(jià)三個(gè)步驟。
1.1 項(xiàng)目設(shè)置
教師設(shè)置與課程相關(guān)的項(xiàng)目選題,將知識(shí)點(diǎn)融入項(xiàng)目的不同環(huán)節(jié)。規(guī)劃項(xiàng)目時(shí)應(yīng)充分考慮項(xiàng)目的專業(yè)性、可實(shí)施性、知識(shí)點(diǎn)覆蓋以及與實(shí)際應(yīng)用的銜接。結(jié)合教學(xué)大綱要求,共設(shè)置了八個(gè)選題,分別是語(yǔ)音增強(qiáng)、語(yǔ)音合成、語(yǔ)音識(shí)別、說(shuō)話人識(shí)別、情感識(shí)別、聲源定位、語(yǔ)音編碼和語(yǔ)音隱藏,涵蓋了本課程第三部分教學(xué)內(nèi)容。以聲源定位為例,教師將項(xiàng)目細(xì)分為四個(gè)環(huán)節(jié):房間聲學(xué)環(huán)境分析、基于時(shí)延差的聲源定位、基于可控波束形成的聲源定位和拓展任務(wù),各環(huán)節(jié)循序漸進(jìn)、環(huán)環(huán)相扣,每一個(gè)環(huán)節(jié)包含若干任務(wù)點(diǎn),內(nèi)容涵蓋了聲源定位主要知識(shí)點(diǎn)和應(yīng)用場(chǎng)景,兼顧理論性和實(shí)用性。學(xué)生組成3-4人的項(xiàng)目小組,自由選擇課題。
1.2 項(xiàng)目執(zhí)行
在項(xiàng)目執(zhí)行階段,學(xué)生帶著任務(wù),先查閱資料、學(xué)習(xí)理論知識(shí);然后分析項(xiàng)目?jī)?nèi)容、分配任務(wù)、制定方案、完成項(xiàng)目;最后提交項(xiàng)目作品、撰寫項(xiàng)目報(bào)告,并進(jìn)行匯報(bào)答辯。在此過(guò)程中,教師需及時(shí)關(guān)注項(xiàng)目進(jìn)展,參與討論,幫助學(xué)生梳理理論知識(shí),指導(dǎo)學(xué)生分析項(xiàng)目?jī)?nèi)容,引導(dǎo)學(xué)生將理論知識(shí)應(yīng)用于項(xiàng)目設(shè)計(jì)開發(fā),同時(shí)提供一些必備的資料,如數(shù)據(jù)庫(kù)、函數(shù)庫(kù)、參考文獻(xiàn)等。以聲源定位為例,學(xué)生查閱文獻(xiàn)資料,自學(xué)聲源定位的理論知識(shí)。然后,教師指導(dǎo)學(xué)生運(yùn)用理論知識(shí)分析該項(xiàng)目的四個(gè)環(huán)節(jié)任務(wù),包括房間聲學(xué)建模理論、時(shí)延差估計(jì)算法、波束形成理論等,逐步引導(dǎo)學(xué)生完善解決方案。最終,學(xué)生自主完成項(xiàng)目?jī)?nèi)容,具體包括:方案設(shè)計(jì)、程序編寫、調(diào)試仿真、結(jié)果分析、成果演示、匯報(bào)答辯等。
1.3 項(xiàng)目評(píng)價(jià)
根據(jù)項(xiàng)目的完成情況進(jìn)行評(píng)價(jià),總結(jié)教學(xué)效果。項(xiàng)目評(píng)價(jià)包括:執(zhí)行情況(50%)、匯報(bào)答辯(30%)、項(xiàng)目報(bào)告(20%)。執(zhí)行情況主要考查方案制定情況、自主學(xué)習(xí)能力、知識(shí)綜合應(yīng)用能力、實(shí)踐動(dòng)手能力、項(xiàng)目完成質(zhì)量。匯報(bào)答辯主要考察學(xué)生的理論知識(shí)掌握程度和語(yǔ)言表達(dá)能力。答辯時(shí)要求學(xué)生匯報(bào)整個(gè)項(xiàng)目流程,演示項(xiàng)目成果,講解其涉及的理論知識(shí)。執(zhí)行情況和匯報(bào)答辯均采用教師評(píng)價(jià)、組間互評(píng)、組內(nèi)互評(píng)相結(jié)合的方式。項(xiàng)目報(bào)告主要考察報(bào)告的完整性、規(guī)范性、準(zhǔn)確性和創(chuàng)新性,報(bào)告內(nèi)容包括課題背景、方案流程、算法原理、實(shí)現(xiàn)過(guò)程、結(jié)果分析、歸納總結(jié)、參考文獻(xiàn)等。
2 “聲源定位”教學(xué)設(shè)計(jì)
以聲源定位為例,說(shuō)明項(xiàng)目驅(qū)動(dòng)教學(xué)法在語(yǔ)音信號(hào)處理課程中的應(yīng)用實(shí)踐。
2.1 房間聲學(xué)環(huán)境分析
建立靈活、合理的房間聲學(xué)模型對(duì)聲源定位算法的運(yùn)行、評(píng)估具有重要的作用[2]。鏡像(Image)法是構(gòu)建室內(nèi)聲學(xué)環(huán)境模型最常用的方法之一,該方法通過(guò)建立房間脈沖響應(yīng)模仿室內(nèi)聲學(xué)環(huán)境。教師幫助學(xué)生梳理房間聲學(xué)理論知識(shí),學(xué)生用MATLAB語(yǔ)言實(shí)現(xiàn)Image算法,完成以下任務(wù):
⑴ 總結(jié)影響房間脈沖響應(yīng)的因素;
⑵ 從房間脈沖響應(yīng)中獲取直達(dá)聲傳播時(shí)間;
⑶ 已知房間環(huán)境和聲源原始信號(hào),模擬傳聲器接收信號(hào)。
圖1是不同混響時(shí)間的房間脈沖響應(yīng)。由圖1可見,混響時(shí)間為0s時(shí),聲學(xué)環(huán)境模型為理想自由聲場(chǎng),聲波經(jīng)過(guò)一段傳播時(shí)間后直達(dá)接收點(diǎn),傳聲器接收信號(hào)中只有直達(dá)聲。隨著混響時(shí)間增大,聲波在室內(nèi)各方向來(lái)回反射又逐漸衰減,接收信號(hào)包含直達(dá)聲和混響聲。后續(xù)“時(shí)延差估計(jì)算法”中所指的“時(shí)延”即指直達(dá)聲的傳播時(shí)間τ,其理論值為τ=d/c,其中d表示聲源到接收點(diǎn)的距離,c表示聲波傳播速度。
圖2是聲源原始語(yǔ)音信號(hào)和傳聲器接收信號(hào),混響時(shí)間為0.3s,信噪比為20dB。具體實(shí)施過(guò)程為:將聲源信號(hào)與房間脈沖響應(yīng)卷積,然后根據(jù)信噪比加上噪聲。學(xué)生可以通過(guò)音頻播放,對(duì)比原始信號(hào)和接收信號(hào)的差異,直觀感受混響時(shí)間對(duì)接收信號(hào)的影響。
該環(huán)節(jié)難度不高,學(xué)生可獨(dú)立完成。通過(guò)上述任務(wù),可以完成以下知識(shí)點(diǎn)的教學(xué):
⑴ 直達(dá)聲、混響聲、混響時(shí)間的概念,影響房間脈沖響應(yīng)的因素;
⑵ 房間聲學(xué)環(huán)境的建模方法;
⑶ 已知房間環(huán)境和聲源原始信號(hào),模擬傳聲器接收信號(hào)。
2.2 基于時(shí)延差的聲源定位
在獲得傳聲器接收信號(hào)的基礎(chǔ)上,引入下一個(gè)教學(xué)內(nèi)容,即如何利用接收信號(hào)實(shí)現(xiàn)聲源定位。定位方法主要有高分辨率譜估計(jì)法、可控波束形成法和基于時(shí)延差的方法?;跁r(shí)延差的定位方法計(jì)算量小、易于實(shí)現(xiàn)、應(yīng)用廣泛,因此項(xiàng)目從該方法入手,任務(wù)要求如下:①利用傳聲器陣列的接收信號(hào),估計(jì)陣元間的時(shí)延差;②根據(jù)時(shí)延差和陣列幾何位置進(jìn)行聲源定位。
基于時(shí)延差定位的第一步是進(jìn)行時(shí)延差估計(jì),其精度決定了定位系統(tǒng)的精度。廣義互相關(guān)法是一種經(jīng)典的時(shí)延差估計(jì)算法,該算法求兩信號(hào)之間的互功率譜,并在頻域內(nèi)給予一定的加權(quán),以抑制噪聲和混響的影響,再反變換到時(shí)域,得到兩信號(hào)之間的互相關(guān)函數(shù),通過(guò)檢測(cè)互相關(guān)函數(shù)的峰值估計(jì)時(shí)延差[2]。圖3為不同加權(quán)的廣義互相關(guān)函數(shù)。學(xué)生調(diào)整混響和噪聲環(huán)境,測(cè)試和分析各加權(quán)函數(shù)對(duì)噪聲和混響的抑制能力?;跁r(shí)延差定位的第二步是根據(jù)測(cè)定的時(shí)延差和陣列幾何位置計(jì)算聲源位置,定位方法有球形插值法、線性相交法、最小二乘擬合法等。學(xué)生根據(jù)實(shí)際情況選擇算法,完成聲源定位任務(wù)。
該環(huán)節(jié)有一定難度,教師需要幫助學(xué)生梳理時(shí)延估計(jì)方法、最小二乘擬合等理論知識(shí),指導(dǎo)學(xué)生進(jìn)行算法特性分析,引導(dǎo)學(xué)生思考如何根據(jù)實(shí)際應(yīng)用場(chǎng)景選擇合適的方法。通過(guò)上述任務(wù),可以完成以下知識(shí)點(diǎn)的教學(xué):
⑴ 廣義互相關(guān)法的概念、步驟;
⑵ 各種加權(quán)函數(shù)的特性;
⑶ 根據(jù)時(shí)延差確定聲源位置的方法。
2.3 基于可控波束形成的聲源定位
基于時(shí)延差的定位算法對(duì)噪聲和混響的魯棒性不強(qiáng)。為提高定位性能,引入下一個(gè)教學(xué)內(nèi)容,即采用可控波束形成法實(shí)現(xiàn)聲源定位,任務(wù)要求如下:
⑴ 實(shí)現(xiàn)可控波束形成聲源定位算法;
⑵ 測(cè)試不同聲學(xué)環(huán)境中可控波束形成法的定位精度和魯棒性;
⑶ 對(duì)比可控波束形成法和基于時(shí)延差定位方法的性能。
波束形成法用聲波的達(dá)到時(shí)延差控制波束方向,使輸出功率最大的波束方位即為聲源的方位。學(xué)生自學(xué)波束形成理論知識(shí),用MATLAB語(yǔ)言實(shí)現(xiàn)相位變換加權(quán)的可控波束形成法。圖4為不同噪聲環(huán)境下,均勻圓陣的波束形成輸出功率。由圖可見,噪聲使空間功率譜呈現(xiàn)較多的局部峰值,對(duì)定位結(jié)果造成影響。
該環(huán)節(jié)有一定難度,教師需要幫助學(xué)生梳理波束形成理論知識(shí),指導(dǎo)學(xué)生比較和評(píng)價(jià)不同算法,總結(jié)各算法的優(yōu)缺點(diǎn)和適用情境。通過(guò)上述任務(wù),可以完成以下知識(shí)點(diǎn)的教學(xué):
⑴ 波束形成的概念和計(jì)算流程;
⑵ 波束形成的輸出功率與廣義互相關(guān)之間的關(guān)系;
⑶ 算法運(yùn)行的評(píng)價(jià)方法。
2.4 拓展任務(wù)
針對(duì)復(fù)雜聲學(xué)環(huán)境下的聲源定位,引導(dǎo)學(xué)生研究以下問題:
⑴ 將傳統(tǒng)定位算法與機(jī)器學(xué)習(xí)相結(jié)合,實(shí)現(xiàn)基于分類機(jī)制的定位;
⑵ 引入子帶的方式實(shí)現(xiàn)多聲源定位。
以上擴(kuò)展任務(wù)可拓寬學(xué)生思路,培養(yǎng)學(xué)生創(chuàng)新思維和科研能力。
3 結(jié)束語(yǔ)
將項(xiàng)目驅(qū)動(dòng)教學(xué)法應(yīng)用于語(yǔ)音信號(hào)處理課程的教學(xué),以教師作為教學(xué)主導(dǎo),把教學(xué)內(nèi)容融入實(shí)際工程項(xiàng)目,讓學(xué)生自主完成項(xiàng)目,從而實(shí)現(xiàn)主動(dòng)學(xué)習(xí)。教學(xué)實(shí)踐表明,該教學(xué)模式取得了很好的教學(xué)效果。首先,學(xué)生學(xué)習(xí)的積極性和主動(dòng)性被激發(fā),師生間的教學(xué)互動(dòng)得到加強(qiáng);第二,學(xué)生實(shí)現(xiàn)了基礎(chǔ)理論知識(shí)與實(shí)際應(yīng)用的銜接,自學(xué)能力、實(shí)踐能力、科研能力、綜合知識(shí)應(yīng)用能力都得到提升;第三,學(xué)生之間的團(tuán)隊(duì)協(xié)作精神得到加強(qiáng);最后,學(xué)生的語(yǔ)言表達(dá)能力得到鍛煉。此教學(xué)模式在信息工程專業(yè)其他課程教學(xué)中具有一定的推廣和借鑒意義。當(dāng)然,該教學(xué)模式還需要不斷完善,如何更好地融入工程教育理念,如何更科學(xué)精確地對(duì)學(xué)生進(jìn)行考核和評(píng)價(jià),如何將人工智能技術(shù)引入到課程教學(xué),這些都需要進(jìn)一步改進(jìn)和探索。
參考文獻(xiàn)(References):
[1] 胡航.現(xiàn)代語(yǔ)音信號(hào)處理[M].電子工業(yè)出版社,2014
[2] 梁瑞宇,趙力,王青云.語(yǔ)音信號(hào)處理(C++版)[M]. 機(jī)械工業(yè),2018
[3] 梁瑞宇,包永強(qiáng),唐閨臣,等.語(yǔ)音信號(hào)處理實(shí)踐課程的教學(xué)研究與改革[J].高教特刊,2019(13):73-75
[4] 王青云,梁瑞宇,趙力,馮月芹,包永強(qiáng).實(shí)時(shí)語(yǔ)音信號(hào)處理教學(xué)與實(shí)驗(yàn)方法研究[J]. 實(shí)驗(yàn)室研究與探索,2019,38(9):186-189
[5] 蘭義華,齊慶磊,張振蓮.項(xiàng)目驅(qū)動(dòng)的學(xué)習(xí)共同體教學(xué)模式在數(shù)據(jù)庫(kù)課程教學(xué)中的探索與實(shí)踐[J]. 計(jì)算機(jī)時(shí)代,2020(10):95-98
[6] 郝中騏,劉莉,史久林,萬(wàn)生鵬.“雙創(chuàng)”背景下光電類課程微項(xiàng)目驅(qū)動(dòng)教學(xué)研究[J].教育教學(xué)論壇,2021(17):148-151