鄧家斌
摘? ?要:2018年被稱為人工智能全面落地應(yīng)用的元年,國家先后確立了阿里、百度、騰訊和科大訊飛4家公司為人工智能的4大平臺。其中作為人工智能的重要分支之一的智能機器人也逐漸開始嶄露頭角。文章主要從智能陪護角度出發(fā),探討了陪護機器人交換系統(tǒng)的設(shè)計與實現(xiàn)。
關(guān)鍵詞:智能陪護;人工智能;交互系統(tǒng)
2018年,國家統(tǒng)計局數(shù)據(jù)顯示我國0~14歲的兒童數(shù)量達到2.5億人。尤其是二胎政策全面開放后,預(yù)計我國每年新生嬰兒數(shù)量會逐漸增加。根據(jù)騰訊數(shù)據(jù)實驗室發(fā)布的《2018中國少兒家庭洞察白皮書》估算,中國兒童消費市場的規(guī)模已突破4.5萬億元,與此同時,兒童消費經(jīng)濟也正以年增長率超過30%的速度增長。而未來5年的時間里,兒童智能產(chǎn)品將會有75%的年均增速,迅速成為下一個千億級別的市場。
迄今為止,基于大數(shù)據(jù)技術(shù)的跨平臺學(xué)習(xí)型智能趣味陪護機器人的交互系統(tǒng)研究依然處于初級階段,距離最終目標(biāo)還有很長的路要走,價格也比較高,稍微好一些的品牌動輒上千元,甚至數(shù)千、上萬元不等。高昂的價格和相對不太成熟的技術(shù),已經(jīng)成為迫切需要解決的難題。
1? ? 智能趣味陪護機器人系統(tǒng)的設(shè)計思路
1.1? 算法的核心思想
人機交互的語音通信主要有兩種情況:第一種情況為人類主動,機器受動(Speech Recog,SR)。第二種情況為剛好想法,機器主動說話(回答),即從文本到語音(Text To Speech,TTS)。無論是哪種情況,都牽扯到機器學(xué)習(xí)中語音、語義識別方法。
常見語音識別的方法主要有3種:基于聲道模型和語音知識的方法、基于模板匹配的方法和人工神經(jīng)網(wǎng)絡(luò)的方法。早些年前兩種方法比較盛行,但由于機器學(xué)習(xí)能力較弱,效果不太好。近2~3年來,基于神經(jīng)網(wǎng)絡(luò),尤其是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)發(fā)展迅速,在圖形圖像、語音、語義等方面有了長足的進步,現(xiàn)已經(jīng)成為主流的解決方法,如圖1所示。
1.2? 設(shè)計思想
(1)通過選擇目前已經(jīng)比較成熟的人工語音平臺,將其作為模板,進行修改,使之成為適合本項目的人工智能云系統(tǒng)。能完成一定的語義識別、趣味問答、語音聊天等功能,真正實現(xiàn)人機無障礙溝通。
(2)結(jié)合大數(shù)據(jù)技術(shù),將海量成語、兒歌等寓教于樂,使得學(xué)習(xí)更生趣,讓孩子在享受快樂生活的同時,潛移默化地接受智能化教育。
1.3? 解決方法
(1)底層使用了大數(shù)據(jù)技術(shù):詞典、數(shù)據(jù)集、語料庫、知識圖譜以及外部世界常識性知識等都是語義識別算法模型的基礎(chǔ)。
(2)應(yīng)用層:包括行業(yè)應(yīng)用和智能語音交互系統(tǒng)、技術(shù)應(yīng)用。
(3)核心技術(shù)是神經(jīng)語言程序?qū)W(Neuro-Linguistic Programming,NLP)技術(shù)層:以語言學(xué)、計算機語言等學(xué)科為背景,采用當(dāng)下比較流行和成熟的神經(jīng)網(wǎng)絡(luò)等技術(shù),對簡單的兒童自然語言進行詞語解析、信息抽取、時間因果、情緒判斷等技術(shù)處理,最終讓計算機“懂”人類的自然語言認知,把計算機數(shù)據(jù)轉(zhuǎn)化為自然語言生成。
詞語解析與信息抽取包括分詞、詞性標(biāo)注、命名實體識別、詞義消歧、從給定文本中抽取重要的信息等,如圖2—3所示。
2? ? 結(jié)論
本文通過結(jié)合當(dāng)?shù)仄髽I(yè)的實際生產(chǎn)能力以及現(xiàn)行國內(nèi)類似產(chǎn)品的具體情況和問題,提出了一種基于兒童的在人工智能環(huán)境下的智能趣味人工智能交互系統(tǒng)。通過該交互系統(tǒng),基本實現(xiàn)與幼兒或兒童交流,孩子們可向機器人發(fā)送簡單語音指令,機器人相應(yīng)做出對應(yīng)反饋,甚至可以實現(xiàn)一定機器學(xué)習(xí)等功能。
[參考文獻]
[1]桂林電子科技大學(xué).一種適用于噪聲環(huán)境下的語音識別方法:中國,201910581762.8[P].2019.
[2]周志華.機器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.
[3]張晴晴,劉勇,潘接林,等.基于卷積神經(jīng)網(wǎng)絡(luò)的連續(xù)語音識別[J].工程科學(xué)學(xué)報,2015(9):1212-1217.
[4]劉偉波,曾慶寧,卜玉婷,等.基于雙微陣列與卷積神經(jīng)網(wǎng)絡(luò)的語音識別方法[J].計算機應(yīng)用,2019(11):3268-3273.