亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        訊飛語音輸入法方言識別在新冠疫情防控中的應(yīng)用評估*

        2020-09-04 02:09:36汪高武李晨光楊豆豆
        語言戰(zhàn)略研究 2020年5期
        關(guān)鍵詞:錯誤率輸入法發(fā)音

        汪高武,龐 博,李晨光,楊豆豆

        (北京師范大學 文學院 北京 100875)

        提 要 在各種社會重大突發(fā)事件的應(yīng)急處理中,智能語音技術(shù)能起到彌補人力資源嚴重不足、緊急處理海量信息、有效應(yīng)對風險、降低損失的作用,具有獨特的優(yōu)勢。在2020年新冠肺炎疫情中,全國各地支援湖北,不同方言人群之間的溝通也成為一個問題,這對語音識別技術(shù)提出了要求和挑戰(zhàn)。本文以科大訊飛智能語音輸入法為例,根據(jù)全國多種方言(139個方言點,共283位發(fā)音人)在疫情防控模擬場景下的語音識別材料,對其成效進行了評估和分析,并探討了智能語音技術(shù)的應(yīng)用和發(fā)展。

        一、引 言

        智能語音技術(shù)是人機交互中最為重要的一種,計算機通過語音的交互方式理解、輔助人類(陳鵬2017;王海坤,等2018)。智能語音技術(shù)具有永不疲倦、降低人力成本、智能可擴展等特點,已廣泛應(yīng)用在各種領(lǐng)域,包括醫(yī)療健康(張海波,等2017)、出版?zhèn)髅剑ê簦?016;朱晶晶2016)、教育教學(張筱蘭,王保論2011)、公安警務(wù)(肖益茂,等2018)、呼叫中心(李楓,徐韜2016)、客服質(zhì)檢(林可希2013)等等。其中語音轉(zhuǎn)為文字的技術(shù),幫助人們免于手寫或打字的限制與勞累,為社會做出了很大的貢獻。以科大訊飛智能語音輸入法為例,2019年全國訊飛輸入法用戶語音錄入共計35 560億字,可為用戶節(jié)省8.38億分鐘,接近9.6萬年(中關(guān)村在線2020)。

        隨著社會發(fā)展、人口集中、人力成本越來越高,對智能語音技術(shù)的需求也日益增長。特別是在各種社會重大突發(fā)事件中,智能語音技術(shù)能起到彌補人力資源嚴重不足、緊急處理海量信息、有效應(yīng)對風險、降低損失的作用,具有獨特的優(yōu)勢。重大突發(fā)事件的特點主要有:(1)突破生活常態(tài),意味著新的場景、任務(wù)和交流,以及龐雜的人員聚集重組。人類對某些場景的適應(yīng)性很強,但有些情況,例如不同方言和不同語言之間的障礙,卻不是短時間內(nèi)能適應(yīng)解決的。等適應(yīng)了、學會了,應(yīng)急處理可能又過去了,語言學習就顯得不太劃算。(2)重大突發(fā)事件,特別是重大自然災(zāi)害,往往是人員大量受損、人力資源緊張甚至枯竭的時候,為避免諸如醫(yī)療資源被擠兌甚至“擊穿”的風險,正需要語音智能去幫助溝通、輔助篩查、緩解人力、安撫情緒,減輕醫(yī)療、救援及工作人員的負擔。例如本次疫情中,有智能語音呼梯系統(tǒng)幫助避免電梯按鍵接觸式感染、人工智能輔助醫(yī)療協(xié)助基層醫(yī)生進行疫情篩查防控和防疫知識宣教、智能醫(yī)療助理為一線提供最迫切需求的醫(yī)療服務(wù)和國家基層醫(yī)療培訓(xùn)等各種應(yīng)用(任曉寧2020)。

        在本次疫情中,全國各地支援湖北,方言溝通成為一個問題。為幫助外地援鄂醫(yī)療隊解決醫(yī)患溝通的方言障礙問題,教育部語言文字信息管理司指導(dǎo)組成了“戰(zhàn)疫語言服務(wù)團”,迅速研制了涵蓋湖北九大方言片區(qū)的《抗擊疫情湖北方言通》,為抗擊疫情的醫(yī)護人員及相關(guān)群體提供多維度語言服務(wù)(李宇明2020)??梢灶A(yù)期,將來智能語音技術(shù)會在防疫等重大緊急事件中起到相當?shù)淖饔?。為此,我們也需要對智能語音技術(shù)在這些實際應(yīng)用場景下的性能進行第三方獨立的、非商業(yè)的、科學的評估,為將來國家制定行業(yè)標準、政府采購智能語音技術(shù)產(chǎn)品提供科學依據(jù)和參考,以更好地為社會民生服務(wù)。

        由于歐美國家醫(yī)療健康產(chǎn)業(yè)更為發(fā)達,人力成本也更昂貴,所以對人工智能技術(shù)在健康衛(wèi)生行業(yè)的應(yīng)用和評估也比較多(Johnson et al. 2014),但國內(nèi)對智能語音識別技術(shù)的測試評估比較少(蔣平,吳振國2003)。因此本研究將以語音輸入法對疫情防控場景相關(guān)語料的識別為例,討論智能語音技術(shù)的應(yīng)用情況和表現(xiàn)。智能語音目前有很多家的技術(shù)和產(chǎn)品,選擇以訊飛輸入法為例是因為:首先,訊飛輸入法識別語言種類最多,提供了全國23種漢語方言的識別(其硬件產(chǎn)品“訊飛翻譯機”可提供59種語言翻譯)。其次,訊飛技術(shù)相對較成熟。有醫(yī)療團隊在對兒童發(fā)音評估的研究中,對比了兩種語音識別軟件,發(fā)現(xiàn)其識別率更優(yōu),性能更穩(wěn)定(韓源,等2017)。最后,訊飛輸入法應(yīng)用最為廣泛。在移動互聯(lián)領(lǐng)域,訊飛輸入法用戶達4億,活躍用戶數(shù)1.1億(中國網(wǎng)2016)。同時,科大訊飛被國家科技部列入新一代人工智能開放創(chuàng)新平臺名單,為同行業(yè)唯一(科技部2017)。

        二、研究方法

        (一)語料設(shè)計

        要評估智能語音技術(shù)的應(yīng)用狀況,最佳方案是在防疫工作醫(yī)療實際場景中進行調(diào)查。但為了避免影響防疫工作、增加醫(yī)療人員或患者的負擔,以及避免調(diào)查志愿者感染風險,我們采取部分模擬真實場景的一種體驗方式,讓發(fā)音人(被試)用方言念相關(guān)的語料。語料應(yīng)該涵蓋可能癥狀的描述(例如咳嗽、發(fā)燒、呼吸困難)和相關(guān)的醫(yī)療用語(例如打針、口罩)等。在教育部語言文字信息管理司指導(dǎo)下成立的“戰(zhàn)疫語言服務(wù)團”,根據(jù)語料庫統(tǒng)計和醫(yī)用場景調(diào)研,遴選了156個詞和76個短句(北京日報客戶端2020),應(yīng)用廣泛,較為典型。但根據(jù)我們預(yù)調(diào)查的反饋,其篇幅對于本次的調(diào)查任務(wù)來說還是比較重。經(jīng)過多次反饋和調(diào)整,盡量用較少的文本包含更多的信息,本次調(diào)查研究從中選取了21個跟疫情最為相關(guān)的詞匯(包括癥狀、醫(yī)療、程度副詞、否定副詞),以及20個短句,并對短句加以擴充(加入不同的親屬稱謂、醫(yī)療用語等)和調(diào)整,作為本次調(diào)查研究的語料,具體內(nèi)容請見下文和附錄。

        (二)發(fā)音人情況

        本次調(diào)查研究共有100位志愿者參與,均為學習語言學課程的學生。調(diào)查對象為志愿者自己與其居家隔離親友,共計283位發(fā)音人。年齡從9歲~84歲,平均年齡35.7歲,標準差17.97歲。其中96位男性,187位女性,女性比男性多主要是因為班級學生的性別比例女性占多。有鼻炎、鼻塞現(xiàn)象的3例,牙齒缺失的7例,經(jīng)人耳聽辨錄音,對于發(fā)音沒有太大影響。除了極個別情況(例如帶鼻炎的“發(fā)燒”人耳聽辨無問題,但輸入法識別為“放手”),語音識別也沒有太大問題,屬于可接受范圍。

        (三)實驗步驟

        調(diào)查方法是讓發(fā)音人在自己的手機上下載并安裝訊飛語音輸入法,根據(jù)自己的方言情況,從訊飛輸入法提供的23種方言中選取跟自己最接近的方言。然后讓發(fā)音人用自己的方言,以對應(yīng)普通話詞句的當?shù)乇磉_方式,對著手機說話,由志愿者記錄下方言的文本和訊飛輸入法識別出的文本。然后由志愿者標記語音識別的錯誤之處,并加以分析,填寫到調(diào)查表中。同時保留錄音,以做后期的校對和分析。調(diào)查表收取后,經(jīng)過研究小組的校對和核查,用Python和Matlab編程進行數(shù)據(jù)文件的處理和統(tǒng)計分析。

        三、結(jié)果分析

        (一)基本情況

        本次調(diào)查的發(fā)音人地點有139個,詳細到城區(qū)或鄉(xiāng)鎮(zhèn)。除青海和臺灣外,全國各省市自治區(qū)均有分布,地址為“鄉(xiāng)/鎮(zhèn)”的57個,“市/區(qū)/縣”的82個,城區(qū)略占優(yōu)勢。訊飛輸入法提供的23種“方言”,是一種籠統(tǒng)的、并非學術(shù)意義上的說法,大體相當于23種“地方話”。本次調(diào)查沒有發(fā)音人選擇天津話、蘇州話和合肥話作為識別方言,另外有些發(fā)音人沒有母語方言只會說普通話,所以最終在圖1中列出了20種“方言”和普通話的人數(shù)分布。

        本次研究,是讓發(fā)音人自行從訊飛輸入法提供的23種方言中選取,所以會遇到選擇錯誤的情況。一般人對自己方言的認識,往往是以距離、行政歸屬來判斷,對于語言學里劃分的方言、次方言、片區(qū)等并無太大概念。本次調(diào)查中,有6人選擇了錯誤的方言,占總?cè)藬?shù)的2.1%。例如:104號發(fā)音人是講河南省安陽市內(nèi)黃縣井店鎮(zhèn)的方言,初期選擇了輸入法提供的河南話,實際上安陽話屬晉語邯新片獲濟小片,不屬于中原官話,保留了入聲,跟通常所說到的河南話區(qū)別很大,相比較而言更應(yīng)該選取輸入法提供的山西話(太原)來識別。143號發(fā)音人是講江西省贛州市蓉江新區(qū)潭東鄉(xiāng)的方言,根據(jù)行政歸屬選擇了訊飛提供的江西話(南昌)。實際上,贛州話是一個方言島,市區(qū)是西南官話,周邊都是客家話。這個地點在贛南師范大學黃金校區(qū)附近,經(jīng)錄音聽辨,有入聲,基本上還是客家話。以上都在訊飛提供的23種方言中有更好的選擇,但還有很多方言,只能相對擇優(yōu),選擇其中一種最為靠近的方言,這會嚴重影響識別錯誤率,這些將在下文討論。

        另外,為了解社會大眾對智能語音技術(shù)特別是語音輸入法的認知狀況,本次研究在調(diào)查問卷中設(shè)置了9個相關(guān)的問題,具體情況將另文介紹。總體上看,語音識別技術(shù)還是廣泛進入社會生活、被大眾認知的,但只有很少一部分人(占比16.4%)使用過方言識別的功能。

        (二)識別錯誤分析

        1.錯誤率的判斷標準

        對于智能語音識別(語音輸入法),最重要的衡量指標就是把語音識別成文字的正確率或錯誤率。英語的錯誤率一般用錯詞率,漢語一般用錯字率。通常設(shè)定普通人類錯詞率為5.9%,受過嚴格訓(xùn)練的專業(yè)速記員錯詞率在3%左右。2018年的Pyramidal-FSMN語音識別模型,錯詞率低至2.97%,將全球語音識別準確率紀錄提高到97.03%,超過了受過嚴格訓(xùn)練的專業(yè)人類速記員(Yang et al. 2018)。但無論算法如何改進,只要是基于統(tǒng)計模型,識別正確率都只會無限趨近而不會達到100%。而且這些正確率都是基于特定的數(shù)據(jù)庫,真實場景的正確率實際上會降低,這也是語音識別沒有更為普及的原因。當然相比于自動駕駛、機床操作等對安全有極高要求的領(lǐng)域,語音的識別錯誤相對來講更容易被用戶接受,達到“可信任”水平。

        本次主要研究漢語方言,錯誤率的判斷標準說明如下:(1)因為漢語基本上是一個漢字對應(yīng)一個音節(jié),所以計算錯誤率的時候可以用字符數(shù)或音節(jié)數(shù)計算均可。但日常使用語言當中常常會有英文和數(shù)字,例如這次的語料里就含有英文“CT”和數(shù)字“38”,以及常見的“WC、18、花兒”等,我們這里統(tǒng)一標準,都按字符算成兩個字。(2)“的、地、得”之類的混淆不算錯誤。這3個字的發(fā)音一樣,在短句正文中即使輸入法識別錯誤,對正確意思的理解也幾乎沒有影響,就不計入錯誤。(3)標點符號。一般的情況(例如逗號、句號等)對正確理解影響極小。除了極個別情況,例如問號和句號弄錯。但在本次調(diào)查的語料中,所有的問句都含有疑問詞,例如“要不要緊?”“治得好不?”“在哪兒?”“哪個醫(yī)院?”等,所以對于普通話以及北方方言一般都能識別為問號。但對于有些方言,其疑問方式未必帶有疑問詞,例如云南曲靖方言,“我外婆的病要不要緊?”對應(yīng)的方言表達為“我外婆的病可嚴重?”,就會被輸入法識別為陳述句。所以標點符號的識別錯誤會跟正文字符分開單獨處理。

        2.各方言點的識別錯誤率

        表1是各方言點的識別錯誤率,包括21個孤立詞和20個短句的錯誤率。從表中可以看出,普通話短句的錯誤率為2.5%,達到了宣稱的97%正確率水平。孤立詞的錯誤率稍高,這是正常的,因為缺少上下文環(huán)境,難以區(qū)分同音詞。選擇普通話識別的,大部分是北京人或新疆、黑龍江、內(nèi)蒙古等地的移民家庭成員(特別是已經(jīng)不說方言而以普通話為母語的年輕人)。東北話的識別錯誤率3.1%也比較低,這是因為相對于其他方言,東北方言內(nèi)部一致性更高,差別較小。表1中各方言的排序大致有幾個規(guī)律:

        表1 各方言點識別錯誤率

        (1)北方方言(或者說官話)內(nèi)部一致性相對較高,所以即使我們的發(fā)音人不是恰好在訊飛方言所提供的方言點,區(qū)別也不會很大,其識別錯誤率會相對較低,除了山西話(晉語),絕大部分的短句錯誤率在15%以下。

        (2)南方方言(或者說東南方言)內(nèi)部區(qū)別較大,有的鄰近地區(qū)甚至無法溝通,發(fā)音人所說方言若跟訊飛方言選點不在一處,其識別錯誤率極高,幾乎無法識別。例如,125號發(fā)音人說的是海南省??诘姆窖?,選擇的訊飛方言是閩南語,識別錯誤率高達80%。這可能是因為??诜窖詫儆陂}語瓊文片府城小片,與閩南片差距較大。發(fā)音人還嘗試了選擇粵方言和客家話,準確率都很低。

        (3)南方方言內(nèi)部一致性相對較低,發(fā)音人的分布對錯誤率影響較大。例如選擇貴州話的6位發(fā)音人都是貴陽市區(qū)的,與訊飛輸入法選點(大概率為貴陽市)一致,錯誤率較低。而同為西南官話的武漢話、四川話和云南話錯誤率卻相對較高,這是因為發(fā)音人分布較廣,例如選擇云南話的21位發(fā)音人分屬昆明市、曲靖市、玉溪市和昭通市,與訊飛輸入法的選點“云南話(昆明)”有一定差異,所以錯誤率較高?;浄窖缘膬?nèi)部差異也不小,但在本次調(diào)查中,由于其使用人數(shù)少、分布又集中,所以作為南方方言錯誤率反而較低。

        (4)方言交界地區(qū)的方言點,往往受到臨近多個方言的影響,同時帶有不同方言的特點,按方言歸屬來選擇訊飛輸入法的方言點,錯誤率就會很高。例如,40號發(fā)音人是湖南省株洲市茶陵縣的方言,根據(jù)行政歸屬選擇了訊飛提供的湖南話(長沙),方言劃分上也同是湘語長益片長株潭小片,但錯誤率依舊接近40%。實際上湖南省株洲市茶陵縣處于湖南江西交界地帶,緊鄰江西井岡山,受贛客方言影響較大。同樣的錄音,選擇客家話和江西話,也基本無法識別。所以對于交界地帶受各種方言影響的方言點來說,語音識別很是困難。以上規(guī)律說明,智能語音輸入法如要提高方言特別是南方方言的識別正確率,需要更加細分的方言選點。

        3.具體語句的識別錯誤分析

        本次調(diào)查的語料包括疫情相關(guān)的21個孤立詞和20個短句。雖然在實際生活場景中,也會有單獨詞成句的,但孤立詞因為沒有上下語境,語音識別的難度會高很多。本次調(diào)研選取的21個疫情相關(guān)用語,其平均識別錯誤率如表2所示。錯誤率最高的是“發(fā)麻”,識別出的錯誤結(jié)果有“發(fā)嗎、發(fā)嘛、煩嗎、壞嗎、花馬、喝嘛、號碼、干嘛、干嗎、嘎瑪、福馬、服務(wù)忙、放忙、番麥、砝碼、伐麻、發(fā)息、發(fā)墨、發(fā)膜、發(fā)毛、發(fā)忙、發(fā)碼、發(fā)馬、幫忙、白馬、霸蠻、爸媽、發(fā)墨、丈母娘啊、Fame”等。錯誤率第二的“嘔吐”,在很多方言里的說法為“噦”,這樣的一個單音節(jié)詞是很難被識別出來的,識別錯誤有“哦、敢約、約、干約、干悅、與、原、月、我、暈、約”等等。由于篇幅限制,關(guān)于孤立詞和短句更為具體的錯誤分析將另文討論。

        表2 調(diào)查表中21個孤立詞語的識別錯誤率

        四、討 論

        本研究是以訊飛語音輸入法在疫情防控場景下的識別情況為例,對智能語音技術(shù)在重大突發(fā)事件中應(yīng)用評估的初步探索??梢钥吹剑鐣蟊妼χ悄苷Z音輸入法已經(jīng)有了相當?shù)牧私夂推诖?,訊飛輸入法對于疫情語料的識別,在官話地區(qū)的方言表現(xiàn)較好,可以達到實用水平,而在東南地區(qū)的方言表現(xiàn)較差,需要更加細分的方言選點。由于現(xiàn)實條件的多種限制,本次調(diào)查語料樣本的數(shù)量和部分方言點的發(fā)音人數(shù)量(少于10人)還不太夠,這也使得調(diào)查數(shù)據(jù)有一定的隨機性,導(dǎo)致最終結(jié)果受手機狀況、背景噪音、發(fā)音人狀況、分布等各種因素的影響,這些我們將在下一步的工作中加以改進。其中有兩個問題需要在這里討論一下。

        (一)言語表達方式的問題

        本次實驗的語料是固定的,調(diào)查表里的21個詞語和20個短句,都是普通話的表達方式,但在各個方言里往往會有不同的說法,甚至具體到某個發(fā)音人,表述的方式都可能有所不同。這也跟發(fā)音人的言語轉(zhuǎn)換能力和風格有關(guān),其中老中青不同年齡段發(fā)音人的說法往往就不一樣。例如贛方言某方言點,其老中青三代對“雞蛋”的說法分別是“嘎=子”①此處在字后右上角加等號“=”表示同音字?!半u子”“雞蛋”。一般來說,越年輕的人受普通話影響越多,會用方言的讀音來念普通話的句子(例如有些方言里年輕人不再說“噦”,而只是用方言的讀音來念“嘔吐”),而中老年人會用更為本地方言甚至瀕臨消失的表達方式(常常被認為是特別“土”的表達方式),這對識別錯誤影響會很大。從實際需求來看,在語言應(yīng)急服務(wù)中,以解決方言障礙為目標的主要人群是中老年人,所以我們在調(diào)查和實驗的時候,需要考慮周到,把各年齡階段的老中新派方言表達方式都要涵蓋進來,以更好地應(yīng)社會所需。

        (二)方言的選擇和劃分問題

        漢語方言差異較大,劃分復(fù)雜,給語音識別提出了很大的挑戰(zhàn)。從本次調(diào)查研究可以看出,方言的選擇和劃分對識別結(jié)果影響很大,需要認真對待。(1)從使用者角度來看,需要恰當選擇方言,不僅僅是根據(jù)距離和行政區(qū)劃,還要根據(jù)方言學上的劃分。但普通人一般都不會具備這樣的語言學知識,所以還需要語音技術(shù)(結(jié)合地理定位功能)能夠更加智能地識別方言,這就需要知道并能提取各方言的特征因素(戴慶廈,等2018)。另外,語音識別的錯誤率跟方言間的可懂度、互通度等因素有關(guān),但可懂度不是劃分方言區(qū)屬的唯一依據(jù),也不是最為重要的依據(jù),所以方言區(qū)屬劃分跟語音識別的效果偶爾會出現(xiàn)矛盾,在實際應(yīng)用中應(yīng)當以識別效果為準。(2)從技術(shù)研發(fā)者角度看,需要給出更多的方言點。但方言猶如顏色一樣,界限模糊,可以無限細分。另外,普通話長期形成了規(guī)范的文語對應(yīng),而方言很多時候“考本字”都很困難,分得太細,則語料庫的訓(xùn)練成本會很高。那方言到底要細分到什么地步?好在到了智能信息時代,可以有新的思路。首先是數(shù)據(jù)獲取更為容易,在需求驅(qū)動下,哪個方言點的用戶多、使用頻率高,軟件搜集的數(shù)據(jù)越多,對該地區(qū)方言的劃分就可以更細。所以不一定以方言劃分為唯一標準,而是以識別效果為標準,不降到一定的錯誤率標準,就繼續(xù)細分,達到實用程度為止。其次是用戶參與,現(xiàn)在智能終端普及,人手一機,均可對本家鄉(xiāng)方言的識別結(jié)果加以校正,這種方式可以大大降低成本,使得技術(shù)能更快地進入社會使用。值得注意的是,對于商業(yè)應(yīng)用來講,需要考慮到市場和成本因素,但從社會民生角度來講,需要適當?shù)乇U险Z言“少數(shù)、弱勢”群體的權(quán)益。

        五、展 望

        本次疫情中,語音智能技術(shù)并沒有得到如我們所期望的大規(guī)模應(yīng)用。原因之一是對新生事物要求往往會更高更挑剔。好比自動駕駛技術(shù)已經(jīng)可以比人類司機事故率更低,但只有其安全系數(shù)高出很多倍,才有可能被認可進入大眾生活。語音技術(shù)也是如此,雖然本次調(diào)查表明大眾對語音技術(shù)是期望的,但根據(jù)我們另外一項對159人的調(diào)查,大眾對語音識別技術(shù)依然不滿意,認為需要改進的地方有:準確率低(占比54.09%)、轉(zhuǎn)換速度慢(31.45%)、缺少方言識別(64.15%)、缺少外語識別(29.56%)、無法感知話語中的情感態(tài)度(45.28%)等。語音識別技術(shù)要真正達到實用,進入日常生活,還需要繼續(xù)降低識別錯誤率。目前語音智能技術(shù)(采用深度神經(jīng)網(wǎng)絡(luò))有兩個缺陷:(1)計算量龐大,大量參數(shù)迭代收斂、訓(xùn)練封裝后如果有新的數(shù)據(jù)需要學習,用戶端的簡單設(shè)備就做不到了;(2)模型不可解釋,難以保證下一次不犯同樣的錯誤。有學者提出了深度模糊系統(tǒng)及其快速學習算法可以克服這兩大缺陷,是一個很好的發(fā)展方向(Wang 2003)。另外,人的大腦適應(yīng)性極強,具有很強的泛化能力,但神經(jīng)網(wǎng)絡(luò)無法把學到的東西泛化到和訓(xùn)練集統(tǒng)計規(guī)律稍有區(qū)別的地方。長期以來,語音智能技術(shù)依靠統(tǒng)計模型,很多試圖從規(guī)則知識出發(fā)或者采用兩者結(jié)合的方法都不是很成功。最近的符號主義人工智能提出了一個切實可行的道路,就是利用符號和它的一套操作系統(tǒng),重新把知識和模型教給神經(jīng)網(wǎng)絡(luò)(Marcus 2020)。這些新方法都為降低錯誤率提供了新的發(fā)展方向。

        目前很多語音智能識別技術(shù)的高正確率是基于特定語料庫的,從本次調(diào)查和研究可以看到,智能語音技術(shù)在疫情防控場景下,特別是對方言的識別效果,還是有很大的改進空間。我們期待語言學和計算機領(lǐng)域的學者,不斷探索新思路、新技術(shù),提升智能語音技術(shù),在重大突發(fā)事件中能更好地為社會民生服務(wù)。

        (感謝參與調(diào)查工作的諸位志愿者:白薦楠、陳麗琳、陳璐、陳雯茜、程婭惠、從恩竹、崔澤馨、樊星辰、范婧婕、馮星云、馮驛雯、付羿雨、高凡舒、高山倩、高子庭、關(guān)喬之、郝雨潔、胡硯才、黃悅、賈紫琳、姜啟寧、姜玉郎、金靈、拉姆、李晨光、李吉霞、李康敏、李樂樂、李祺溦、李宛婷、李正、梁霄云、劉晨筱、劉會珠、劉麓基、劉瑞秋、劉一新、劉玉萍、羅會露、羅家淇、馬悅霞、毛翎、歐陽瑞美、潘新宇、龐博、彭曉鈺、彭彥涵、蒲素素、蒲璇妃、陜月、尚鑫欣、邵芊涵、孫建亞、孫銘澤、孫千千、唐銳奇、汪子涵、王春醒、王家琪、王京欣、王曉宇、王雪瑩、王祎琳、王瑜琦、尉然、鮮欣儀、肖開捷、熊莉萍、徐立恒、鄢冉、楊豆豆、楊渙渙、楊子謙、姚安甫、殷王會、尹雪力、袁詩夢、張競兮、張沁萌、張瑞穎、張婷婷、張鈺琪、張鈺揚、張蕓鷺、趙姝忞、趙怡昕、趙玥、周博聞、周婧妍、朱思恒、朱芷妍、曾心怡、鄒雨桐等。并向身體不便特別是手指受傷無法寫字、打字的文字工作者致敬!本調(diào)查為獨立進行,跟任何語音公司,包括科大訊飛,均無利益關(guān)聯(lián)。)

        附錄(調(diào)查表中的20個短句):

        (1)我頭疼,我頭暈。

        (2)我咳嗽,干咳,我咳得出不了氣了。

        (3)我女兒拉肚子,肚子痛。

        (4)我全身酸痛,我沒有力氣。

        (5)我奶奶平時身體還好,沒有什么別的病。

        (6)我外婆的病要不要緊?

        (7)醫(yī)生,我媽媽的病治得好不?

        (8)我爸爸輸液輸完了,要拔針頭。

        (9)我家里有人好像不舒服,還沒確診。

        (10)我想上廁所,廁所在哪兒?

        (11)我老婆吃了飯,還沒有吃藥。

        (12)我爺爺發(fā)燒,燒得很厲害,燒了幾天了。

        (13)我量了體溫,我老公的體溫是38度多。

        (14)我外公做過CT、做過核酸檢測、做過采樣了。

        (15)我昨天到湖北去過一趟,沒有去過武漢。

        (16)我今天應(yīng)該到哪個醫(yī)院、哪個科室去看?。?/p>

        (17)護士,我對青霉素和其他抗生素都不過敏。

        (18)我喉嚨疼、我腰疼、我胸口疼。

        (19)我自己沒事,就是我兒子有點流鼻涕。

        (20)我的頭很疼,都快要炸了。

        猜你喜歡
        錯誤率輸入法發(fā)音
        限制性隨機試驗中選擇偏倚導(dǎo)致的一類錯誤率膨脹*
        Hickory, Dickory, Dock
        要命的輸入法
        正視錯誤,尋求策略
        教師·中(2017年3期)2017-04-20 21:49:49
        百度被訴侵犯商標權(quán)和不正當競爭
        解析小學高段學生英語單詞抄寫作業(yè)錯誤原因
        Playing with h
        Playing with /eI/
        降低學生計算錯誤率的有效策略
        Playing with u_e
        久久人妻av一区二区软件| 无码高清视频在线播放十区| 黑丝美女被内射在线观看| 美女被内射中出在线观看| av天堂午夜精品一区| 亚洲处破女av日韩精品| 亚洲国产99精品国自产拍| 91精品国产色综合久久不| 日韩肥臀人妻中文字幕一区| 亚洲av久久久噜噜噜噜| 99久久免费看少妇高潮a片特黄| 亚洲精品国产二区三区在线| 国产黄色一区二区三区av| 又粗又黑又大的吊av| 久久久久亚洲精品无码网址 | 久久国产精品老人性| 国产精品一区二区久久蜜桃| 丰满人妻被两个按摩师| 最新亚洲精品国偷自产在线| 久久精品国产亚洲AV香蕉吃奶| 侵犯了美丽丰满人妻中文字幕| 伊人久久精品无码二区麻豆| 欧美日韩精品一区二区三区不卡| 亚洲加勒比无码一区二区在线播放 | 国产亚洲精品性爱视频| 亚洲最大av在线精品国产| 免费a级毛片18禁网站app| 中文幕无线码中文字蜜桃| 亚洲av人片在线观看调教| 亚洲最大中文字幕在线| 久久久g0g0午夜无码精品| 亚洲欧洲精品成人久久曰影片| 久久天堂av综合合色| 女优一区二区三区在线观看| 少妇性l交大片| www.久久av.com| 色视频不卡一区二区三区| 猫咪av成人永久网站在线观看| 亚洲精品老司机在线观看| 日韩精品极品在线观看视频| 亚洲国产成人av二区|