近日,清華大學(xué)集成電路學(xué)院教授任天令及合作團隊在智能語音交互方面取得重要進展,其研發(fā)的可穿戴人工喉可以感知喉部發(fā)聲相關(guān)信號,并通過人工智能模型將其識別和合成為語音。這一研究結(jié)果為語音識別與交互系統(tǒng)提供了一條新的技術(shù)途徑,并于日前在線發(fā)表在《自然·機器智能》上。
該研究團隊通過激光直寫技術(shù)在超薄聚酰亞胺薄膜上轉(zhuǎn)化出基于石墨烯的智能可穿戴人工喉(AT),實現(xiàn)了對聲音信號和機械運動的混合模態(tài)的感知,使AT能夠獲得低基頻信號,同時具有抗噪聲的語音感知能力。實驗結(jié)果表明,混合模態(tài)AT能夠檢測基本語音元素(音素、聲調(diào)和單詞),平均準確率達到99.05%。此外,通過集成AI模型,AT識別出了喉切除術(shù)患者含糊說出的日常詞匯,準確率超過90%。