于愷 于方軍
語音識別技術已經(jīng)運用到人們生活的各個領域。目前,語音識別技術常用的有兩種方式,一種是基于本地語音模型庫識別模式,另一種是基于云語音模型庫識別模式。本地語音模型首先要建立模型庫,模型庫的建立需要大量的語音訓練積累,通過采樣生成音頻文件,對比本地模型庫,實現(xiàn)語音識別,這個過程需要學生了解語音信號的提取、聲學模型、隱馬爾科夫(HMM)模型等專業(yè)知識。為了能更好更快地實現(xiàn)語音識別效果,在課程設計時應采用基于云語音模型庫識別模式。
語音識別需要使用麥克風采集聲音。掌控板的主控板帶有麥克風模塊,可以錄音并保存在內存,能夠實現(xiàn)語音的獲取,它還帶有WI-FI無線模塊,無線聯(lián)網(wǎng)后實現(xiàn)語音的云識別。掌控板的OLED屏能夠顯示云識別的信息和內容,且?guī)в?個三色LED燈,可以控制燈的開啟及顏色變化。該項目針對四年級小學生,所以采用學生易懂的mPython圖形化編程軟件完成。教學框架如圖1所示。
● 體驗項目,明確制作目標
語音識別技術中應用最廣的當屬手機語音助手,通過使用語音助手方便了手機信息的獲取和操作。教學中,教師可以先引導學生例舉生活中語音助手的名字,如Siri、天貓精靈、小愛同學等。接著,使用智能音箱控制燈泡的開啟關閉及變色,讓學生總結出智能音箱語音識別的工作過程:智能音箱聽到語音→獲取語音→對獲取的語音進行分析→語音內容為“開燈”或“關燈”→控制開啟和關閉燈。通過體驗項目,讓學生知道語音控制燈開啟和關閉的工作流程。
● 問題引導項目實施
1.確定語音獲取方式
語音識別面臨的第一個問題是掌控板如何能夠獲取到人的語音?學生經(jīng)常使用即時軟件進行溝通,實踐中發(fā)現(xiàn)發(fā)送語音使得信息溝通更加高效。即時通信工具需要按住一個按鈕進行錄音,錄音結束后發(fā)送給他人,他人聽取錄音,然后再反饋。云識別語音信息的方式與此相同,即運用掌控板的麥克風模塊進行錄音,將錄音內容上傳到語音識別平臺。針對錄音方式學生討論出來有兩種方案,一種是掌控板一直錄音,另一種是和即時通信工具一樣設置錄音按鈕,按鈕按下開始錄音,設定錄音時間。綜合討論兩種方案,學生選擇了第二種方案,原因是:第一種方案一直錄音,無法生成錄音文件上傳到云語音識別服務器;第二種方案可以生成錄音片段上傳到云識別服務器,使用按下掌控板A按鈕開始錄音,語音命令需要錄音時間較短,錄制2秒即可。
2.確定識別的方式
人類能進行聽說交流是因為人在幼兒時通過不斷地學習及模仿掌握了語言的發(fā)音及含義,掌控板如何理解語言的意思呢?學生討論出兩種識別方式的方案:一種是讓掌控板學習人類的語言掌握語言的發(fā)音,并能夠實現(xiàn)語音識別;另一種是讓掌控板借助網(wǎng)絡的力量,實現(xiàn)對語音的識別。經(jīng)過討論后學生明確,第一種方案需要創(chuàng)建龐大的語音數(shù)據(jù)庫用于實現(xiàn)語音識別,另外掌控板要分析語音,就需要有高性能的處理能力,掌控板無法滿足要求。第二種方案需要聯(lián)網(wǎng)和云語音識別服務,掌控板能夠連接無線網(wǎng)絡,mPython中自帶語音識別API,所以能夠實現(xiàn)云識別語音。綜上所述,識別方式采用云識別方式。
3.確定語音命令,實現(xiàn)對LED控制
云識別的語音如何控制LED的開啟和關閉?學生已經(jīng)學習了條件語句的使用,只需要將識別的語言內容進行條件判斷,如果滿足條件就執(zhí)行命令,如果不滿足條件就不執(zhí)行。要想查看語音識別的命令是否準確,就要將云識別語音識別后的文字顯示在OLED屏幕,方便程序測試和查找問題。
4.繪制流程圖,規(guī)劃項目實施(如上頁圖2)
5.編程測試,完成項目制作
在程序測試過程中,學生會發(fā)現(xiàn)語音控制燈源項目(如上頁圖3)有很多地方需要改進,如語音錄音時間沒有提示,容易造成識別失敗。因此,學生設計了開機提示——按A鍵開始識別,A鍵按下后屏幕顯示開始錄音,2秒后提示識別結果,并提醒使用者再按A鍵開始語音識別。整個過程是學生作為使用者的思考,程序要等待聯(lián)網(wǎng)后才能夠進行識別操作,所以這里可以設置一個提示,提示設備已經(jīng)聯(lián)網(wǎng)成功,可以進行語音識別,屏幕顯示按A鍵開始識別(如圖4)。識別完成后,語音滿足條件就可以完成操作,學生在整個過程中的思考模式與自身思考模式是相同的,引發(fā)了對人工智能的思考。
● 發(fā)散學生思維,創(chuàng)新語音識別使用
本課主要是講解語音控制機器的執(zhí)行設備,通過語音控制LED燈的開啟和關閉,并擴展到機器能夠聽懂人類的語言,根據(jù)語音完成指令。本課教學結束前,教師可讓學生在原有項目的基礎上進行創(chuàng)新,設計多條命令語言實現(xiàn)對LED燈的控制。學生們知道RGB的LED燈是可以變色的,嘗試增加“黃色”“綠色”“藍色”等語言判斷條件控制燈的顏色變化。每個項目組可以創(chuàng)新1~2個點,然后展示自己的項目成果,進而增強各個項目組之間的反饋交流。在這個過程中學生們分享了成功的喜悅,也分享項目中的困惑,大家在思維碰撞中加深對程序算法的探究。未來,學生若想創(chuàng)造更加智能的語音識別工具,就會嘗試編寫更加復雜的程序,實現(xiàn)對人工智能應用更深入的探究。
● 項目總結
本節(jié)課的教學采用了項目式學習,針對如何實現(xiàn)語音控制燈的探究過程,通過實施項目任務、完成項目制作、改進項目作品這個過程,幫助學生掌握了語音識別功能的云識別語音功能,讓學生對語音助手的工作原理有了一定的了解。
在此過程中,學生發(fā)現(xiàn)最大的問題是語音命令提取不準確,在語音識別授課中會受到外界環(huán)境的影響,如果同時有多名學生在測試語音識別,或環(huán)境噪音嘈雜,就會導致語音識別精度降低,甚至不能識別相應的語音。問題的產(chǎn)生必然會引起學生進一步的深度思考,且做出的作品也會更加完美、實用。另外,教師可以進一步引導學生思考在語音身份識別中,機器如何只聽從特定人員的命令或者設定者的命令,且語音反饋更加人性化?
本論文為淄博市教育科學規(guī)劃2020年度“基于項目式學習的小學AI校本課程開發(fā)與實踐研究”課題(課題批準號:2020ZJY017)成果。