亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于頻譜分析儀的語(yǔ)音識(shí)別及控制軟件系統(tǒng)設(shè)計(jì)

        2024-09-14 00:00:00趙元琪尹永柯王洪君房明
        現(xiàn)代電子技術(shù) 2024年6期
        關(guān)鍵詞:語(yǔ)音識(shí)別

        摘 "要: 隨著數(shù)據(jù)處理技術(shù)的進(jìn)步和人工智能領(lǐng)域的高速發(fā)展,用戶在對(duì)儀器的實(shí)際使用中持續(xù)追求更為高效便捷的操控方式,同時(shí)也相當(dāng)看重使用過(guò)程的靈活性和準(zhǔn)確性,語(yǔ)音數(shù)據(jù)因其實(shí)用性和高效性而被廣泛使用。因此,提出一種基于頻譜分析儀的語(yǔ)音識(shí)別及控制軟件系統(tǒng)。該系統(tǒng)支持Ubuntu 18.04及以上版本操作系統(tǒng),通過(guò)語(yǔ)音指令實(shí)現(xiàn)對(duì)頻譜分析儀的控制,可以實(shí)現(xiàn)語(yǔ)音喚醒、語(yǔ)音錄入及保存、離線語(yǔ)音識(shí)別并轉(zhuǎn)換為文字文本、可執(zhí)行代碼等功能。

        關(guān)鍵詞: 語(yǔ)音識(shí)別; 控制軟件; 頻譜分析儀; Ubuntu; 語(yǔ)音喚醒; 語(yǔ)音聽(tīng)寫(xiě)

        中圖分類(lèi)號(hào): TN911.23?34; TP311.5 " " " " " " " " "文獻(xiàn)標(biāo)識(shí)碼: A " " " " " " " " 文章編號(hào): 1004?373X(2024)06?0027?05

        Design of speech recognition and control software system based on spectrum analyzer

        ZHAO Yuanqi, YIN Yongke, WANG Hongjun, FANG Ming

        (School of Information Science and Engineering, Shandong University, Qingdao 266237, China)

        Abstract: With the advancement of data processing technology and the rapid development of artificial intelligence, user continue to pursue more efficient and convenient control methods in the actual use of instruments, while also placing great importance on the flexibility and accuracy of the use process. Speech data is widely used due to its practicality and efficiency. A speech recognition and control software system based on a spectrum analyzer is proposed. This system can support Ubuntu 18.04 and above operating systems, and control the spectrum analyzer by means of the voice commands. It can achieve functions such as voice wake up, voice input and save, offline voice recognition and conversion to text, and executable code.

        Keywords: speech recognition; control software; spectrum analyzer; Ubuntu; voice wake?up; voice dictation

        0 "引 "言

        近年來(lái),移動(dòng)互聯(lián)網(wǎng)快速普及,語(yǔ)音數(shù)據(jù)因其實(shí)用性和高效性在現(xiàn)代生活中扮演著重要角色[1]?,F(xiàn)如今,語(yǔ)音識(shí)別也已經(jīng)成為智能生活里重要的一部分[2?5]。它可以為個(gè)人語(yǔ)音助手、語(yǔ)音輸入、智能音箱等應(yīng)用場(chǎng)景提供相關(guān)的技術(shù)基礎(chǔ)[6?8],成為一種新的人機(jī)交互方式[9]。但現(xiàn)有的諸如智能音箱、語(yǔ)音助手等端側(cè)產(chǎn)品[10]只支持有限數(shù)量的命令詞識(shí)別,根本不足以滿足頻譜分析儀眾多功能的應(yīng)用需求[11?12]。因此,提出新的、可以更廣泛高效地適用于頻譜分析儀的語(yǔ)音識(shí)別及控制的軟件系統(tǒng)是亟待解決的關(guān)鍵問(wèn)題。

        基于此,本文設(shè)計(jì)開(kāi)發(fā)了一套基于頻譜分析儀的語(yǔ)音識(shí)別及控制軟件,包含語(yǔ)音喚醒、語(yǔ)音錄入及保存、離線語(yǔ)音識(shí)別并轉(zhuǎn)換為文字文本、可執(zhí)行代碼等功能。該系統(tǒng)通過(guò)語(yǔ)音信息最終實(shí)現(xiàn)對(duì)頻譜分析儀等儀器的控制,并滿足頻譜分析儀眾多功能所對(duì)應(yīng)的大量相關(guān)程控指令映射?;陬l譜分析儀的語(yǔ)音識(shí)別及控制軟件系統(tǒng),將儀器的使用智能化,使儀器在實(shí)際使用中更加便捷和高效。

        1 "相關(guān)技術(shù)研究

        1.1 "基本開(kāi)發(fā)技術(shù)

        本文基于科大訊飛SDK[13]開(kāi)發(fā)了一款基于頻譜分析儀的語(yǔ)音識(shí)別及控制軟件,可以部署在頻譜分析儀等大型儀器設(shè)備上,包含語(yǔ)音喚醒、語(yǔ)音錄入并保存、離線語(yǔ)音識(shí)別并轉(zhuǎn)換成文字、SCPI程控指令等功能,支持Ubuntu 18.04及以上版本操作系統(tǒng),通過(guò)自然語(yǔ)言音頻完成對(duì)頻譜分析儀及信號(hào)的操控。

        1.2 "關(guān)鍵技術(shù)

        1.2.1 "離線命令詞識(shí)別

        離線命令詞識(shí)別是基于語(yǔ)法規(guī)則,將與語(yǔ)法一致的自然語(yǔ)言音頻轉(zhuǎn)換為文本輸出的技術(shù)。語(yǔ)法識(shí)別的結(jié)果值域只在語(yǔ)法文件所列出的規(guī)則里,故有很好的匹配率。

        1.2.2 "離線語(yǔ)音聽(tīng)寫(xiě)

        語(yǔ)音聽(tīng)寫(xiě)是基于自然語(yǔ)言處理,將自然語(yǔ)言音頻轉(zhuǎn)換為文本輸出的技術(shù)。語(yǔ)音聽(tīng)寫(xiě)技術(shù)與語(yǔ)法識(shí)別技術(shù)的不同在于,語(yǔ)音聽(tīng)寫(xiě)不需要基于某個(gè)具體的語(yǔ)法文件,其識(shí)別范圍是整個(gè)語(yǔ)種內(nèi)的詞條。

        1.2.3 "語(yǔ)音喚醒

        語(yǔ)音喚醒是通過(guò)辨別輸入的音頻中特定的詞語(yǔ),返回被命中的喚醒結(jié)果,應(yīng)用通過(guò)回調(diào)的結(jié)果,進(jìn)行下一步的處理,如點(diǎn)亮屏幕或與用戶進(jìn)行語(yǔ)音交互等。

        1.2.4 "BNF語(yǔ)法文件

        科大訊飛SDK提供了基礎(chǔ)語(yǔ)法文件規(guī)則,用戶在使用時(shí)可以自定義需要使用的關(guān)鍵詞和相關(guān)的語(yǔ)法文件,設(shè)置語(yǔ)音輸入的語(yǔ)序。本文中所用到的關(guān)鍵詞識(shí)別是基于語(yǔ)法規(guī)則,將與語(yǔ)法一致的自然語(yǔ)言音頻轉(zhuǎn)換為文本輸出的技術(shù)。在第一次使用某語(yǔ)法進(jìn)行識(shí)別時(shí),需先編寫(xiě)一個(gè)語(yǔ)法文件,然后通過(guò)調(diào)用特定接口編譯本地語(yǔ)法文件,以及獲得語(yǔ)法ID,并在會(huì)話時(shí)傳入語(yǔ)法ID以使用該語(yǔ)法。在之后的會(huì)話中,繼續(xù)使用此語(yǔ)法進(jìn)行識(shí)別,無(wú)需再次構(gòu)建。

        1.3 "創(chuàng)新技術(shù)

        1.3.1 "離線場(chǎng)景下的功能實(shí)現(xiàn)

        在現(xiàn)實(shí)環(huán)境當(dāng)中,許多地區(qū)都缺乏基礎(chǔ)的移動(dòng)通信技術(shù)。因此,為滿足在特殊應(yīng)用場(chǎng)景下對(duì)操作指令進(jìn)行語(yǔ)音識(shí)別的操作需求,使系統(tǒng)能夠適應(yīng)海上、高原、偏遠(yuǎn)地區(qū)等無(wú)法穩(wěn)定聯(lián)網(wǎng)的應(yīng)用場(chǎng)景,系統(tǒng)可以直接部署在頻譜分析儀上,并在本地構(gòu)建離線的語(yǔ)法文件和數(shù)據(jù)庫(kù),使系統(tǒng)在語(yǔ)音識(shí)別關(guān)鍵詞過(guò)程中,可以不必連接到云端數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)的上傳下載和調(diào)取,而直接從本地設(shè)備的數(shù)據(jù)庫(kù)中進(jìn)行查詢和調(diào)取來(lái)完成相關(guān)的語(yǔ)音指令,實(shí)現(xiàn)響應(yīng)。

        離線系統(tǒng)不需要頻繁地請(qǐng)求響應(yīng)端口的連接,因此大幅度地提高了系統(tǒng)的響應(yīng)速度和語(yǔ)音識(shí)別效率,加快了語(yǔ)音識(shí)別和語(yǔ)音指令的執(zhí)行進(jìn)程。

        1.3.2 "針對(duì)特殊變量的BNF語(yǔ)法文件處理方法

        在離線狀態(tài)下,只能識(shí)別到語(yǔ)法文件中已經(jīng)定義過(guò)的文字指令,但無(wú)法識(shí)別得到類(lèi)似“25.5”的數(shù)字變量和形如“MHz”“ms”的單位變量。針對(duì)該問(wèn)題,本文提出一種針對(duì)含數(shù)字變量和單位變量的指令識(shí)別的BNF語(yǔ)法文件編寫(xiě)方法和識(shí)別內(nèi)容的處理算法。

        在編寫(xiě)B(tài)NF語(yǔ)法文件時(shí)聲明槽lt;numbergt;、槽lt;numberunitgt;和槽lt;unitgt;,分別用來(lái)存儲(chǔ)形如“零”“一”“二”“兩”“三”“四”“五”“六”“七”“八”“九”的數(shù)字變量,形如“十”“百”“千”“萬(wàn)”的數(shù)字單位和形如“赫茲”“K赫茲”“兆赫茲”“G赫茲”“微秒”“毫秒”“秒”等常用單位。該特定算法包括數(shù)字識(shí)別、漢字與阿拉伯?dāng)?shù)字轉(zhuǎn)換算法、單位識(shí)別轉(zhuǎn)換算法等,解決了實(shí)際使用中可能遇到的帶特殊數(shù)字變量和特殊單位變量類(lèi)指令的動(dòng)態(tài)識(shí)別問(wèn)題,擴(kuò)大了離線命令詞識(shí)別的可識(shí)別命令詞范圍。

        1.3.3 "鎖定語(yǔ)音喚醒及語(yǔ)音識(shí)別狀態(tài)的技術(shù)

        根據(jù)實(shí)際使用需求和使用邏輯,系統(tǒng)需要先進(jìn)行語(yǔ)音喚醒,喚醒成功后再進(jìn)入語(yǔ)音識(shí)別,因此本文提出使用雙線程。為防止線程沖突,軟件設(shè)置兩個(gè)標(biāo)志位,分別用于標(biāo)注是否可被喚醒和是否被喚醒。當(dāng)軟件系統(tǒng)處于不同功能狀態(tài)時(shí),需要服從對(duì)應(yīng)狀態(tài)的執(zhí)行流程。首先等待語(yǔ)音喚醒,語(yǔ)音喚醒成功后將啟動(dòng)軟件系統(tǒng)的使用,3 s內(nèi)如無(wú)語(yǔ)音輸入,則重新等待語(yǔ)音喚醒。當(dāng)處于歷史記錄或歷史指令編輯狀態(tài)時(shí),可繼續(xù)進(jìn)行語(yǔ)音識(shí)別,但如3 s內(nèi)沒(méi)有語(yǔ)音輸入,則退出語(yǔ)音識(shí)別狀態(tài),且不再監(jiān)聽(tīng)語(yǔ)音喚醒關(guān)鍵詞,即不可被喚醒,直到重新返回到主界面,才開(kāi)始重新監(jiān)聽(tīng)喚醒關(guān)鍵詞。當(dāng)處于執(zhí)行對(duì)可執(zhí)行代碼的編輯操作時(shí),既不進(jìn)行語(yǔ)音喚醒的監(jiān)聽(tīng),也不進(jìn)行語(yǔ)音識(shí)別。

        1.3.4 "命令詞功能分級(jí)方法

        由于頻譜分析儀等儀器具有數(shù)量龐大、種類(lèi)繁復(fù)的機(jī)器指令,因此在編寫(xiě)B(tài)NF語(yǔ)法文件時(shí),會(huì)涉及到當(dāng)所要識(shí)別的關(guān)鍵詞數(shù)量龐大時(shí),語(yǔ)音識(shí)別模型存儲(chǔ)和識(shí)別受限的問(wèn)題。因此,本文將數(shù)量龐大的命令詞按照功能層級(jí),有序分類(lèi)至多個(gè)不同的BNF語(yǔ)法文件中。在功能切換時(shí),利用專(zhuān)屬算法,按照切換到的測(cè)量功能編譯與之對(duì)應(yīng)的BNF語(yǔ)法文件,并生成語(yǔ)法ID;同時(shí)會(huì)根據(jù)通常使用的頻次建立優(yōu)先級(jí),將重復(fù)的指令存儲(chǔ)在優(yōu)先級(jí)較高的BNF語(yǔ)法文件當(dāng)中,避免造成存儲(chǔ)冗余。

        這種專(zhuān)屬算法極大程度地緩解了當(dāng)所要識(shí)別的命令詞數(shù)量過(guò)于龐大時(shí),語(yǔ)音識(shí)別模型存儲(chǔ)和識(shí)別受限的問(wèn)題,使系統(tǒng)輕量化,大幅度地提高了響應(yīng)速度。

        1.3.5 "語(yǔ)音指令映射技術(shù)

        頻譜分析儀功能繁多,在不同測(cè)量功能下可能存在同一語(yǔ)音指令對(duì)應(yīng)不同的SCPI程控指令。為了解決這一問(wèn)題,本文將頻譜分析儀的文字指令與SCPI程控指令映射關(guān)系按照功能層級(jí),分別存入與BNF語(yǔ)法文件對(duì)應(yīng)的相關(guān)數(shù)據(jù)表當(dāng)中,然后將上述數(shù)據(jù)表統(tǒng)一存入同一數(shù)據(jù)庫(kù)。

        為了在執(zhí)行測(cè)量功能指令時(shí),系統(tǒng)能夠?qū)εc之對(duì)應(yīng)的數(shù)據(jù)庫(kù)進(jìn)行增刪改查,在功能切換時(shí),本文利用專(zhuān)屬算法將數(shù)據(jù)庫(kù)增刪改查的對(duì)象切換到與測(cè)量功能對(duì)應(yīng)的數(shù)據(jù)表,與按照頻譜分析儀功能層級(jí)分類(lèi)得到的多個(gè)BNF語(yǔ)法文件一一對(duì)應(yīng),使得在擴(kuò)充文字指令與SCPI程控指令映射關(guān)系時(shí)條理結(jié)構(gòu)更加清晰。

        1.3.6 "可執(zhí)行代碼

        語(yǔ)音識(shí)別后的文字指令和調(diào)用的程控指令都存在一定的局限性,并不能直接適用于其他的語(yǔ)言開(kāi)發(fā)??紤]到用戶需求和系統(tǒng)的實(shí)用性,本文提出了可執(zhí)行代碼的功能,可以根據(jù)用戶的實(shí)際使用需要,將歷史語(yǔ)音識(shí)別指令轉(zhuǎn)換成C#、C++、Python等語(yǔ)言下可直接使用的代碼,供用戶后續(xù)編寫(xiě)其他語(yǔ)言的代碼或在其他語(yǔ)言環(huán)境下進(jìn)行軟件開(kāi)發(fā)。指定生成的可執(zhí)行代碼文件,經(jīng)用戶選擇確認(rèn)保存后以文件生成時(shí)間為命名,保存在指定文件路徑下。

        2 "系統(tǒng)設(shè)計(jì)

        2.1 "系統(tǒng)概述

        本文設(shè)計(jì)開(kāi)發(fā)了一套基于頻譜分析儀的語(yǔ)音識(shí)別及控制軟件系統(tǒng),其流程如圖1所示。

        首先喚醒關(guān)鍵詞語(yǔ)音喚醒系統(tǒng),喚醒成功后,用戶實(shí)時(shí)輸入的語(yǔ)音指令將被保存為文件流,系統(tǒng)將對(duì)語(yǔ)音文件進(jìn)行語(yǔ)音輸入信息識(shí)別和處理,轉(zhuǎn)換為文字指令,從BNF語(yǔ)法文件中調(diào)取關(guān)鍵詞,在數(shù)據(jù)庫(kù)中匹配映射到對(duì)應(yīng)的SCPI程控指令并下發(fā)至頻譜分析儀,進(jìn)而操控頻譜分析儀完成語(yǔ)音指令并執(zhí)行對(duì)應(yīng)的操作;再對(duì)頻譜分析儀的反饋內(nèi)容進(jìn)行解析,將文字指令、程控指令和最終的查詢結(jié)果返回到可視化界面,實(shí)現(xiàn)通過(guò)語(yǔ)音完成對(duì)信號(hào)頻譜分析儀的完整操控流程。當(dāng)3 s內(nèi)沒(méi)有檢測(cè)到語(yǔ)音信息輸入,則退出語(yǔ)音識(shí)別,重新進(jìn)入監(jiān)聽(tīng)喚醒關(guān)鍵詞的狀態(tài)當(dāng)中,此外,如果當(dāng)前的界面為展開(kāi)歷史記錄后的界面,則可以繼續(xù)進(jìn)行語(yǔ)音識(shí)別;但如果3 s后沒(méi)有語(yǔ)音輸入,同樣將退出語(yǔ)音識(shí)別,且不再監(jiān)聽(tīng)喚醒關(guān)鍵詞,直到再次檢測(cè)到語(yǔ)音喚醒關(guān)鍵詞,只有當(dāng)前展示的界面不是展開(kāi)歷史記錄的界面,才重新開(kāi)始進(jìn)行語(yǔ)音識(shí)別。

        2.2 "系統(tǒng)界面設(shè)計(jì)

        為了軟件系統(tǒng)本身的美觀性和可視化,本文設(shè)計(jì)了半透明狀態(tài)的展示界面,且始終保持頁(yè)面置于屏幕的最上層,便于用戶使用。

        為了節(jié)省能耗,系統(tǒng)設(shè)置了語(yǔ)音喚醒功能,用戶通過(guò)說(shuō)出指定的喚醒關(guān)鍵詞來(lái)喚醒系統(tǒng)。在用戶進(jìn)行語(yǔ)音喚醒之前,系統(tǒng)將一直處于休眠但監(jiān)聽(tīng)的狀態(tài);在用戶進(jìn)行喚醒之后,將彈出界面,并進(jìn)入語(yǔ)音識(shí)別和相關(guān)控制的功能當(dāng)中。

        在語(yǔ)音識(shí)別界面下面會(huì)跟隨語(yǔ)音輸入狀態(tài)欄,當(dāng)有語(yǔ)音輸入時(shí),語(yǔ)音輸入狀態(tài)欄會(huì)有一定程度的波動(dòng);反之,如果當(dāng)前處于沒(méi)有語(yǔ)音輸入的狀態(tài),則語(yǔ)音輸入狀態(tài)欄沒(méi)有波形的波動(dòng)。

        頻譜分析儀完成相關(guān)命令并生成反饋后,系統(tǒng)將對(duì)反饋內(nèi)容進(jìn)行解析,再將文字指令、程控指令和查詢結(jié)果返回到界面。指令下達(dá)給頻譜分析儀之后,如果任務(wù)完成,將返回已完成的字樣和當(dāng)前的相關(guān)狀態(tài);如果指令未被識(shí)別或未完成,將返回如“未聽(tīng)清,請(qǐng)?jiān)僬f(shuō)一遍”等提示信息。每條語(yǔ)音指令后面會(huì)跟隨一個(gè)狀態(tài),如果發(fā)送成功,則顯示綠色的對(duì)號(hào)樣式。系統(tǒng)語(yǔ)音識(shí)別界面如圖2所示。

        當(dāng)語(yǔ)音識(shí)別和控制任務(wù)結(jié)束后,可以通過(guò)長(zhǎng)按當(dāng)前界面對(duì)歷史記錄進(jìn)行自主選擇和編輯,如轉(zhuǎn)為C#、C++、Python語(yǔ)言對(duì)應(yīng)的可執(zhí)行代碼等功能。系統(tǒng)歷史記錄編輯界面如圖3所示。

        2.3 "系統(tǒng)構(gòu)建

        2.3.1 "系統(tǒng)語(yǔ)音識(shí)別功能實(shí)現(xiàn)

        語(yǔ)音喚醒成功后,系統(tǒng)將語(yǔ)音指令形成語(yǔ)音文件,并儲(chǔ)存在本地,在接收到新文件后會(huì)對(duì)舊文件進(jìn)行覆蓋。之后將得到的文字指令進(jìn)行識(shí)別分割,分別得到指令的文字部分、數(shù)字變量部分和單位變量部分。再用文字部分到數(shù)據(jù)庫(kù)中當(dāng)前測(cè)量功能所對(duì)應(yīng)數(shù)據(jù)表中進(jìn)行匹配,得到該條文字指令所對(duì)應(yīng)的SCPI程控指令。然后將得到的程控指令與前面的數(shù)字變量部分、單位變量部分按照規(guī)定格式進(jìn)行拼接,最終得到頻譜分析儀能夠識(shí)別的程控指令。系統(tǒng)通過(guò)對(duì)頻譜分析儀的反饋內(nèi)容進(jìn)行解析,將文字指令、程控指令和最終的查詢結(jié)果顯示在界面上,完成控制結(jié)果可視化,實(shí)現(xiàn)通過(guò)語(yǔ)音完成對(duì)頻譜分析儀的完整操控流程,并等待下一輪的語(yǔ)音信息輸入。系統(tǒng)可識(shí)別代碼界面如圖4所示。

        2.3.2 "數(shù)據(jù)庫(kù)構(gòu)建

        在將程控指令下發(fā)到頻譜分析儀的同時(shí),語(yǔ)音識(shí)別后的歷史記錄信息將上傳至數(shù)據(jù)庫(kù)當(dāng)中,并按照時(shí)間順序保存指令識(shí)別內(nèi)容及SCPI程控指令記錄。系統(tǒng)界面中將展示最近3條記錄,以提供用戶查詢歷史記錄功能。

        同時(shí),為了滿足“識(shí)別記錄存儲(chǔ)”功能并支持后期增刪查改的要求,系統(tǒng)基于MySQL構(gòu)建了數(shù)據(jù)庫(kù),用于數(shù)據(jù)讀取和存儲(chǔ)。以指定格式的Json串發(fā)送開(kāi)始時(shí)間及結(jié)束時(shí)間,數(shù)據(jù)庫(kù)即可返回該時(shí)間段語(yǔ)音識(shí)別的歷史記錄,方便用戶按時(shí)間條件查詢識(shí)別歷史記錄,來(lái)復(fù)現(xiàn)過(guò)往在頻譜分析儀上的實(shí)驗(yàn)操作。

        2.4 "系統(tǒng)模式

        2.4.1 "操作系統(tǒng)及通信技術(shù)支持

        基于頻譜分析儀的語(yǔ)音識(shí)別及控制軟件系統(tǒng)支持 Ubuntu 18.04及以上版本的操作系統(tǒng),通過(guò)端口號(hào)進(jìn)行數(shù)據(jù)庫(kù)連接,基于TCP協(xié)議的Socket通信進(jìn)行數(shù)據(jù)傳送。

        2.4.2 nbsp;模式及功能支持

        本文所開(kāi)發(fā)的軟件系統(tǒng)支持頻譜分析模式、IQ分析模式和相位噪聲分析模式,以及掃頻分析、信道功率、占用帶寬、鄰道功率、功率統(tǒng)計(jì)、突發(fā)功率、諧波失真、三階交調(diào)、雜散發(fā)射、頻譜發(fā)射模板、IQ分析、相位噪聲分析等10余種功能所包含的程控指令的語(yǔ)音識(shí)別及控制。

        3 "系統(tǒng)部署應(yīng)用

        基于頻譜分析儀的語(yǔ)音識(shí)別及控制軟件開(kāi)發(fā)系統(tǒng),目前已經(jīng)部署在頻譜分析儀等大型儀器上進(jìn)行使用,系統(tǒng)整體性能穩(wěn)定、傳輸實(shí)時(shí)性強(qiáng),從語(yǔ)音命令下達(dá)到頻譜分析儀執(zhí)行命令并返回結(jié)果,整個(gè)過(guò)程延時(shí)不超過(guò)3 s。

        針對(duì)各項(xiàng)功能下的離線語(yǔ)法文件中已經(jīng)定義過(guò)的關(guān)鍵詞,語(yǔ)音識(shí)別的準(zhǔn)確率較高。該系統(tǒng)的應(yīng)用極大程度上提高了儀器的實(shí)用性和操控的靈活性,實(shí)現(xiàn)了儀器的智能化。用戶在使用時(shí),不必再近距離的手動(dòng)操作,也不必通過(guò)按鈕控制頻譜分析儀,而可以通過(guò)語(yǔ)音來(lái)實(shí)現(xiàn)頻譜分析儀的各項(xiàng)功能,完成語(yǔ)音相關(guān)的指令。

        此外,用戶此前的語(yǔ)音命令歷史記錄也按照時(shí)間順序保存在數(shù)據(jù)庫(kù)中,用戶可以通過(guò)時(shí)間條件查詢識(shí)別歷史記錄,復(fù)現(xiàn)過(guò)往在頻譜分析儀上的操作?;陬l譜分析儀的語(yǔ)音識(shí)別及控制軟件開(kāi)發(fā)系統(tǒng)的應(yīng)用,使頻譜分析儀等大型儀器的使用更加便捷化、高效化、智能化,也提高了頻譜分析儀控制的靈活性和準(zhǔn)確性,滿足了用戶在對(duì)儀器的實(shí)際使用中持續(xù)追求更為高效便捷的操控方式的要求。

        4 "結(jié) "語(yǔ)

        基于頻譜分析儀的語(yǔ)音識(shí)別及控制軟件系統(tǒng)是一套通過(guò)語(yǔ)音指令來(lái)對(duì)頻譜分析儀進(jìn)行操控的系統(tǒng),這套系統(tǒng)旨在提供給使用者在對(duì)頻譜分析儀的實(shí)際操控中更為便捷和高效的體驗(yàn)感,使儀器的使用更加智能化。

        目前系統(tǒng)已經(jīng)投入使用,但在實(shí)際需求中,可能也有在其他操作系統(tǒng)環(huán)境下的使用需求,所以已經(jīng)在嘗試構(gòu)建Windows操作系統(tǒng)環(huán)境下的軟件系統(tǒng)開(kāi)發(fā)。隨著后續(xù)頻譜分析儀的升級(jí),將會(huì)新增大量頻譜分析儀所需的操作指令,因此,在語(yǔ)法文件的構(gòu)建上,仍有繼續(xù)擴(kuò)充和優(yōu)化的必要。此外,目前的可執(zhí)行代碼僅支持C#、C++、Python等語(yǔ)音的編譯,之后可以繼續(xù)開(kāi)發(fā)支持如Matlab、Java等其他語(yǔ)言類(lèi)型的可執(zhí)行代碼的編譯。

        注:本文通訊作者為房明。

        參考文獻(xiàn)

        [1] 范永超,韓佳南.基于人工智能的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)與研究[J].數(shù)字通信世界,2022(5):55?57.

        [2] 鄒智敏,劉偉.基于語(yǔ)音識(shí)別的智能家電控制APP的實(shí)現(xiàn)[J].電子技術(shù)與軟件工程,2021(5):59?61.

        [3] 陳希祥,黃伍,李德英.基于語(yǔ)音識(shí)別的智能家居控制系統(tǒng)設(shè)計(jì)[J].自動(dòng)化與儀表,2021,36(7):91?95.

        [4] 高英英,張偉.智能語(yǔ)音識(shí)別功能控制的家居系統(tǒng)[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2022,22(9):88?91.

        [5] SONG Xueya, SUN Shengchao. Voice recognition control system based on cloud computing and IoT sensors [EB/OL]. [2023?01?14]. https://www.hindawi.com/journals/wcmc/2022/4489452/.

        [6] O'SHAUGHNESSY Douglas. Review of analysis methods for speech applications [C]// Speech Communication. [S.l.: s.n.]: 2023: 151.

        [7] 李青云.語(yǔ)音識(shí)別算法及其在嵌入式系統(tǒng)中的應(yīng)用[J].電子技術(shù)與軟件工程,2021(17):81?82.

        [8] NEDJAH N, BONILLA A D, MOURELLE L D M. Automatic speech recognition of Portuguese phonemes using neural networks ensemble [J]. Expert systems with applications, 2023, 229: 120378.

        [9] 屈瑾.基于語(yǔ)音識(shí)別的智能交互系統(tǒng)設(shè)計(jì)[J].自動(dòng)化與儀器儀表,2023(1):221?225.

        [10] 張琴喻.語(yǔ)音助手用戶智能感的研究[D].杭州:浙江大學(xué),2022.

        [11] 郝祥和.基于嵌入式便攜頻譜儀的設(shè)計(jì)與研制[D].成都:電子科技大學(xué),2020.

        [12] 王俊麗.頻譜儀嵌入式操作系統(tǒng)移植及通信模塊的設(shè)計(jì)[D].成都:電子科技大學(xué),2012.

        [13] 韓婷婷.科大訊飛智能語(yǔ)音產(chǎn)品發(fā)展戰(zhàn)略研究[D].貴陽(yáng):貴州大學(xué),2021.

        猜你喜歡
        語(yǔ)音識(shí)別
        空管陸空通話英語(yǔ)發(fā)音模板設(shè)計(jì)與應(yīng)用
        通話中的語(yǔ)音識(shí)別技術(shù)
        面向移動(dòng)終端的語(yǔ)音簽到系統(tǒng)
        淺析智能語(yǔ)音技術(shù)及其應(yīng)用
        語(yǔ)音識(shí)別的SVM模型選擇分析
        農(nóng)業(yè)物聯(lián)網(wǎng)平臺(tái)手機(jī)秘書(shū)功能分析與實(shí)現(xiàn)
        基于LD3320的非特定人識(shí)別聲控?zé)粝到y(tǒng)設(shè)計(jì)
        航天三維可視化系統(tǒng)中語(yǔ)音控制技術(shù)的研究與應(yīng)用
        基于語(yǔ)音識(shí)別的萬(wàn)能遙控器的設(shè)計(jì)
        基于語(yǔ)音技術(shù)的商務(wù)英語(yǔ)移動(dòng)學(xué)習(xí)平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)
        国产日韩亚洲中文字幕| 亚洲精品国产一区二区| 免费人妻无码不卡中文字幕系 | 亚洲人成人无码www影院| 中文字幕精品一区二区2021年| 无码人妻丰满熟妇精品区| 狠狠躁夜夜躁人人爽天天不卡| 日本高清无卡一区二区三区| 一区二区三区四区草逼福利视频| 久久久久88色偷偷| 免费无码黄动漫在线观看| 无码熟妇人妻AV影音先锋| 元码人妻精品一区二区三区9| 亚洲av色香蕉一区二区三区潮| 日本xxxx色视频在线观看免费| 又爽又黄又无遮挡的视频| 国产露脸精品产三级国产av| 国产视频嗯啊啊啊| 人妻秘书被社长浓厚接吻| 在线精品国产亚洲av蜜桃| 五月丁香综合激情六月久久| 亚洲中文有码字幕青青| 亚洲AV无码乱码精品国产草莓| 成人做爰高潮尖叫声免费观看| 精品国产一区二区三区亚洲人| 国产成人精品日本亚洲直播| 亚洲男人在线天堂av| 亚洲毛片一区二区在线| 久久天天躁狠狠躁夜夜av| 长腿校花无力呻吟娇喘的视频| 国产av天堂亚洲国产av麻豆| 国产一区二区三区白浆肉丝| 友田真希中文字幕亚洲| 久久久久人妻精品一区蜜桃| 综合无码综合网站| 亚洲国产不卡免费视频| 亚洲国产精品高清在线| 国产精品兄妹在线观看麻豆| 亚洲av无码资源在线观看| 淫欲一区二区中文字幕| 国产一级黄色录像大片|