亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        打造私人語音小助手:“看見”你的聲音

        2023-07-13 12:01:26劉梅山東省淄博第一中學(xué)
        中國信息技術(shù)教育 2023年13期
        關(guān)鍵詞:音頻文件看見代碼

        劉梅 山東省淄博第一中學(xué)

        語音交互指的是人與計(jì)算機(jī)設(shè)備通過語音進(jìn)行信息交流的過程,其中兩個(gè)關(guān)鍵過程包括STT(語音轉(zhuǎn)文字)即語音識(shí)別、TTS(文本轉(zhuǎn)語音)即語音合成。本項(xiàng)目帶領(lǐng)學(xué)生通過完整的模型訓(xùn)練流程實(shí)現(xiàn)對(duì)訓(xùn)練指令的語音識(shí)別,并結(jié)合Arduino板實(shí)現(xiàn)模型的本地部署,使語音小助手不僅具有交流對(duì)話的功能,更能根據(jù)訓(xùn)練好的指令完成一系列操作。

        本項(xiàng)目的主題是“看見”你的聲音,那么如何使聲音能夠被“看見”呢?在本項(xiàng)目中主要體現(xiàn)在兩個(gè)方面:一是在數(shù)據(jù)集處理的過程中,通過將音頻信號(hào)轉(zhuǎn)換成波形圖與音譜圖,讓學(xué)生實(shí)現(xiàn)用看的方式直觀理解音頻信號(hào)在圖像維度上的波形特征,并通過將音頻信號(hào)轉(zhuǎn)成音譜圖,使學(xué)生可以利用處理圖像的CNN卷積神經(jīng)網(wǎng)絡(luò)去處理音頻方面的問題,讓計(jì)算機(jī)實(shí)現(xiàn)用“看”的方式去處理“聽”的問題。二是在模型部署階段,除了可以使語音對(duì)話機(jī)器人實(shí)現(xiàn)聊天功能外,還能根據(jù)指令完成一系列可被看到的操作:開關(guān)燈、開關(guān)風(fēng)扇、開關(guān)窗戶、查詢室內(nèi)溫濕度并反饋等。

        ●項(xiàng)目介紹

        1.項(xiàng)目背景

        天貓精靈、小愛音箱等設(shè)備都具備了對(duì)話交流、完成各種指令操作等功能,其核心原理就是語音交互。那么,語音交互是如何實(shí)現(xiàn)的呢?除了對(duì)話交流外還能設(shè)計(jì)哪些功能呢?本項(xiàng)目將對(duì)這些問題進(jìn)行探索,并采集自己的指令音頻打造一個(gè)專屬私人語音小助手。

        2.項(xiàng)目時(shí)長(zhǎng)

        該項(xiàng)目分四部分,共5課時(shí):自主采集音頻指令數(shù)據(jù)(課前)、處理音頻數(shù)據(jù)為語譜圖(1課時(shí));模型訓(xùn)練(1課時(shí));模型轉(zhuǎn)換(1課時(shí));模型部署(2課時(shí))。

        3.項(xiàng)目流程

        因采集音頻需要安靜的環(huán)境,該階段讓學(xué)生在課前完成。學(xué)生2人一組,先利用matplotlib、librosa庫對(duì)采集的音頻信號(hào)進(jìn)行預(yù)處理并批量轉(zhuǎn)成語譜圖;然后搭建CNN卷積神經(jīng)網(wǎng)絡(luò)模型,對(duì)處理好的音頻數(shù)據(jù)進(jìn)行模型訓(xùn)練;接著將訓(xùn)練出的模型封裝,生成onnx模型,實(shí)現(xiàn)本地調(diào)用;最后,利用Arduino板、溫濕度傳感器、LED小燈、風(fēng)扇傳感器等完成硬件部署,實(shí)現(xiàn)語音小助手的制作。

        ●項(xiàng)目實(shí)施

        1.音頻文件采集及處理

        (1)音頻文件采集

        學(xué)生根據(jù)自己的項(xiàng)目需求采集指令音頻。以本項(xiàng)目語音小助手為例,采集7種指令語句,每種指令150條,其中130條用作訓(xùn)練集,20條用于驗(yàn)證集。學(xué)生結(jié)合pyaudio庫,運(yùn)行圖1所示的代碼進(jìn)行音頻錄制。錄制時(shí)只需要設(shè)置好聲道數(shù)、比特率、錄制時(shí)間等即可。

        圖1

        同時(shí),教師要提前配置好機(jī)房環(huán)境,為學(xué)生準(zhǔn)備好半成品模板代碼,鼓勵(lì)學(xué)生積累代碼范例并上傳至自己的學(xué)習(xí)平臺(tái)。例如,pyaudio調(diào)用麥克風(fēng)采集音頻文件、opencv采集圖像文件,學(xué)生將這些經(jīng)常用到的代碼,形成固定的代碼模塊,這樣在下一個(gè)項(xiàng)目中使用時(shí),只要根據(jù)項(xiàng)目主題更改邏輯語句或簡(jiǎn)單參數(shù)即可,進(jìn)而提高課堂效率。

        (2)音頻文件預(yù)處理

        任意選擇兩條不同的語句,利用matplotlib、librosa庫繪制波形圖與音譜圖,圖2為“小梅關(guān)燈”與“屋里好黑”的音頻圖與語譜圖,學(xué)生通過對(duì)比,可以直觀理解兩條語音指令在圖像維度上的特征差異。然后將錄制好的音頻文件批量生成音頻譜圖,為后續(xù)模型訓(xùn)練做好準(zhǔn)備。

        圖2

        利用語音頻譜圖進(jìn)行模型訓(xùn)練有如下優(yōu)勢(shì):①有利于本地機(jī)房環(huán)境下學(xué)生進(jìn)行模型訓(xùn)練,解決了機(jī)房環(huán)境下算力不足的問題。②用處理圖像的神經(jīng)網(wǎng)絡(luò)模型解決音頻問題,大大提高了所生成模型對(duì)音頻文件識(shí)別的準(zhǔn)確率。本項(xiàng)目基于pytorch搭建CNN卷積神經(jīng)網(wǎng)絡(luò),模型預(yù)測(cè)階段識(shí)別準(zhǔn)確率在98%左右。

        (3)批量生成語譜圖

        利用librosa庫,將音頻信息批量轉(zhuǎn)化為語譜圖,核心代碼如下頁圖3所示。

        圖3

        2.模型訓(xùn)練

        CNN卷積網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域發(fā)揮了重要的作用,筆者借助某平臺(tái)搭建了卷積神經(jīng)網(wǎng)絡(luò),對(duì)生成的語音譜圖進(jìn)行模型訓(xùn)練,核心代碼如下頁圖4所示。

        圖4

        3.模型轉(zhuǎn)換

        onnx模型是一種廣泛使用的模型轉(zhuǎn)換文件格式,將訓(xùn)練好的模型文件導(dǎo)出并轉(zhuǎn)換為onnx模型,這樣便可以結(jié)合智能硬件,在本地對(duì)訓(xùn)練出的模型進(jìn)行部署。

        4.模型部署

        在模型部署環(huán)節(jié),教師帶領(lǐng)學(xué)生實(shí)現(xiàn)兩大功能:一是能“聽”會(huì)“說”,即傳統(tǒng)意義上的語音交互功能,通過在代碼中接入圖靈機(jī)器人平臺(tái)API,實(shí)現(xiàn)與小助手對(duì)話交流;二是能“聽”會(huì)“做”,即利用Arduino,結(jié)合LED小燈、風(fēng)扇模塊、舵機(jī)、溫濕度傳感器等智能硬件,讓小助手根據(jù)語音指令完成包括開關(guān)燈在內(nèi)的一系列操作。

        環(huán)節(jié)一:能“聽”會(huì)“說”

        在這一環(huán)節(jié),教師使用識(shí)別出的指令,關(guān)聯(lián)圖靈平臺(tái)API,與圖靈機(jī)器人進(jìn)行對(duì)話,并將返回的文字對(duì)話結(jié)果利用pyttsx3模塊轉(zhuǎn)換成語音進(jìn)行播報(bào),實(shí)現(xiàn)與小助手對(duì)話的功能。學(xué)生兩人一組在圖靈機(jī)器人平臺(tái)注冊(cè)賬號(hào),創(chuàng)建一個(gè)自己的聊天機(jī)器人,記錄下Apikey,這樣便可以在項(xiàng)目中實(shí)現(xiàn)與小機(jī)器人的對(duì)話了。接著,利用訓(xùn)練好的語句進(jìn)行測(cè)試,如“你的名字是什么”,機(jī)器人反饋結(jié)果“我就是人見人愛花見花開的劉小梅呀”。但圖靈平臺(tái)返回的是文字內(nèi)容,還需要利用pyttsx3模塊,將返回得到的結(jié)果轉(zhuǎn)化為語音形式,這一過程又叫做語音合成。核心代碼如圖5所示。

        圖5

        環(huán)節(jié)二:能“聽”會(huì)“做”

        作品只能進(jìn)行對(duì)話交流顯然是不夠的,“小梅同學(xué)”還要具備其他功能,完成更多的任務(wù),如“‘屋里好黑呀’:LED燈亮起”“‘小梅關(guān)燈’:LED燈關(guān)閉”“‘天氣真熱’:風(fēng)扇轉(zhuǎn)動(dòng)”等。以“小梅查詢溫濕度”為例,核心代碼如圖6所示,作品如圖7所示。

        圖6

        圖7

        猜你喜歡
        音頻文件看見代碼
        創(chuàng)世代碼
        創(chuàng)世代碼
        創(chuàng)世代碼
        創(chuàng)世代碼
        基于Android手機(jī)的音頻文件取證技術(shù)研究
        “看見”的力量
        顯微攝影師:帶你“看見”驚艷的“微距世界”
        重新“看見”你
        一款可以幫助盲人“看見”的墨鏡
        提取APP中的音頻文件
        電腦愛好者(2015年5期)2015-09-10 07:22:44
        少妇高潮惨叫久久久久电影69| 无码精品国产午夜| 国产精品久久熟女吞精| 45岁妇女草逼视频播放| 野外亲子乱子伦视频丶| 国产精品一区二区久久| 欧美在线Aⅴ性色| 毛片在线播放亚洲免费中文网| 亚洲 欧美 国产 制服 动漫 | 久久久精品人妻一区二区三区游戏 | 俄罗斯老熟妇色xxxx| 中文字幕无码人妻丝袜| 精品自拍偷拍一区二区三区| 国产毛片av最新视频| 在线综合亚洲欧洲综合网站| 美女一级毛片免费观看97| 国产视频一区二区三区免费| 亚洲综合图色40p| 亚洲国产长腿丝袜av天堂| 春色成人在线一区av| 日本频道一区二区三区| 在办公室被c到呻吟的动态图| 欧美日韩不卡视频合集| 久久精品视频中文字幕无码| 国产亚洲成人精品久久久| 少妇粉嫩小泬喷水视频www| 99er视频| 日韩av一区二区三区在线观看 | 91热久久免费频精品99| 免费不卡无码av在线观看| 久久久精品2019免费观看| 国产毛片A啊久久久久| 国产婷婷成人久久av免费| 鸭子tv国产在线永久播放| 无码国产精品一区二区免费97| 天堂av一区二区麻豆| 国产一区二区精品久久岳| 久久综合给合久久狠狠狠97色69| 亚洲av毛片成人精品| 精品综合一区二区三区| 伊人久久五月丁香综合中文亚洲|