在很多武俠小說(shuō)中,經(jīng)常會(huì)看到一些武林高手雖然站在遠(yuǎn)處,卻能通過(guò)讀唇語(yǔ)知曉別人說(shuō)了什么。時(shí)至今日,這項(xiàng)“特異功能”不再只是武俠小說(shuō)中擁有的情節(jié),下面就來(lái)認(rèn)識(shí)一下這項(xiàng)神奇的唇語(yǔ)識(shí)別技術(shù)吧。
唇語(yǔ)識(shí)別技術(shù)是一項(xiàng)集機(jī)器視覺(jué)與自然語(yǔ)言處理于一體的技術(shù),唇語(yǔ)識(shí)別技術(shù)通過(guò)機(jī)器視覺(jué)技術(shù),從圖像中連續(xù)識(shí)別出人臉,并提取此人連續(xù)的口型變化特征,隨即將連續(xù)變化的特征輸入到唇語(yǔ)識(shí)別模型中,識(shí)別出講話人口型對(duì)應(yīng)的發(fā)音,從而計(jì)算出可能性最大的表達(dá)語(yǔ)句。此外,唇語(yǔ)識(shí)別技術(shù)的精確度研發(fā)基于1萬(wàn)小時(shí)新聞式的唇語(yǔ)節(jié)目,目前英文準(zhǔn)確度已經(jīng)達(dá)到80%,中文準(zhǔn)確度已經(jīng)達(dá)到71%。
唇語(yǔ)識(shí)別技術(shù)在噪音太大或只有攝像頭等無(wú)法準(zhǔn)確捕捉聲音的場(chǎng)合中具有很強(qiáng)的實(shí)用性。在馬路、會(huì)議室、商場(chǎng)等噪音較大的場(chǎng)景里,唇語(yǔ)識(shí)別技術(shù)可以規(guī)避噪聲對(duì)用戶說(shuō)話內(nèi)容獲取的影響,確保語(yǔ)音輸入的準(zhǔn)確率;此外,目前在電梯、馬路等監(jiān)控場(chǎng)景中只有攝像頭,并沒(méi)有麥克風(fēng),通過(guò)唇語(yǔ)識(shí)別技術(shù)可以獲取指定用戶的講話信息,為公共安全提供有效支持。
唇語(yǔ)識(shí)別技術(shù)又可以應(yīng)用于哪些領(lǐng)域呢?場(chǎng)景教育、身份識(shí)別、公共安全、移動(dòng)支付、軍事情報(bào)等領(lǐng)域中都可以應(yīng)用唇語(yǔ)識(shí)別技術(shù)。比如,通過(guò)唇語(yǔ)識(shí)別技術(shù)支持下的口型支付密碼,消費(fèi)者動(dòng)動(dòng)嘴唇就能進(jìn)行支付;而在軍事情報(bào)領(lǐng)域中,唇語(yǔ)識(shí)別技術(shù)則讓遠(yuǎn)距離獲取情報(bào)成為可能;若在公安系統(tǒng)中加入唇語(yǔ)識(shí)別技術(shù),公安人員則可通過(guò)平臺(tái)獲取視頻中犯罪嫌疑人的語(yǔ)言信息,這將極大助力犯罪緝查工作的開(kāi)展。