任俊恒
摘要:隨著家庭智能產(chǎn)品逐漸實(shí)現(xiàn)互聯(lián)互通,傳統(tǒng)的單一產(chǎn)品設(shè)計(jì)思路已經(jīng)不能應(yīng)對這樣一個(gè)完善的系統(tǒng)和新興的用戶需求。物聯(lián)網(wǎng)、語音識(shí)別、云計(jì)算等技術(shù)的發(fā)展為家庭數(shù)字娛樂系統(tǒng)帶來新的發(fā)展機(jī)會(huì)和感官體驗(yàn)。本文對一種以智能語音技術(shù)的個(gè)性化的家庭智能語音數(shù)字娛樂系統(tǒng)進(jìn)行相關(guān)的理論和設(shè)計(jì)研究。
關(guān)鍵詞:家庭數(shù)字娛樂系統(tǒng);語音交互;服務(wù)設(shè)計(jì);物聯(lián)網(wǎng)
一、智能語音技術(shù)在家庭數(shù)字娛樂系統(tǒng)的設(shè)計(jì)原則
1.1以目標(biāo)用戶的需求為中心的原則
在進(jìn)行服務(wù)系統(tǒng)設(shè)計(jì)時(shí)始終以目標(biāo)用戶的需求為導(dǎo)向,滿足用戶的不同需求,除了滿足用戶的基本需求外,還要強(qiáng)調(diào)目標(biāo)用戶的多層次需求,注重實(shí)現(xiàn)人的價(jià)值,將情感、心理等人性化的概念融入到設(shè)計(jì)中去。在智能語音系統(tǒng)的服務(wù)設(shè)計(jì)研究中,主要從滿足不同家庭角色需求各異的角度去探討多需求共存的問題。在家庭數(shù)字娛樂系統(tǒng)的智能語音服務(wù)設(shè)計(jì)研宂中,運(yùn)用以目標(biāo)用戶的需求為中心的原則意在通過前期目標(biāo)用戶研究,將用戶需求轉(zhuǎn)化為產(chǎn)品和服務(wù)的功能要素。在智能語音服務(wù)中,將用戶在語音輸入、語音修正、等待處理以及語音輸出階段的服務(wù)觸點(diǎn)進(jìn)行細(xì)化,優(yōu)化每個(gè)服務(wù)觸點(diǎn)的質(zhì)量,滿足用戶多層次的需求。
1.2聚散重構(gòu)式系統(tǒng)性原則
在進(jìn)行服務(wù)設(shè)計(jì)時(shí),從整體全局視角出發(fā),綜合考慮人、服務(wù)和環(huán)境等要素以及各要素之間的相互關(guān)系,進(jìn)而合理地規(guī)劃系統(tǒng)內(nèi)各要素之間的組合順序、配合程度,最終能夠最大限度地發(fā)揮整體服務(wù)系統(tǒng)性能。聚散重構(gòu)式系統(tǒng)創(chuàng)新是指在系統(tǒng)創(chuàng)新基礎(chǔ)上對智能語音服務(wù)中散落的問題點(diǎn),以及服務(wù)系統(tǒng)中可能涉及到的諸多利益相關(guān)者進(jìn)行分析,并重新建立任務(wù)關(guān)系模型。
1.3多方協(xié)作式原則
在設(shè)計(jì)研究階段,通過對目標(biāo)用戶的研究分析,將用戶對智能語音服務(wù)的使用行為、體驗(yàn)痛點(diǎn)以及期待傳達(dá)給設(shè)計(jì)團(tuán)隊(duì)、技術(shù)人員或客服。在設(shè)計(jì)完成階段,邀請用戶進(jìn)行體驗(yàn),對體驗(yàn)較差的觸點(diǎn)進(jìn)行優(yōu)化后再上線,避免造成損失。在產(chǎn)品和服務(wù)上線后,用戶可以通過產(chǎn)品內(nèi)部的反饋功能將使用體驗(yàn)及時(shí)反饋給工作人員。多方協(xié)作的創(chuàng)新方式將用戶與設(shè)計(jì)團(tuán)隊(duì)連接一起,設(shè)計(jì)團(tuán)隊(duì)能夠挖掘用戶真實(shí)的需求,并為用戶提供更好的服務(wù),實(shí)現(xiàn)服務(wù)價(jià)值最大化。
二、家庭數(shù)字娛樂系統(tǒng)中智能語音相關(guān)技術(shù)介紹
智能語音技術(shù)涉及到多個(gè)學(xué)科的知識(shí),如聲學(xué)、認(rèn)知、模式識(shí)別、人工智能技術(shù)等。智能語音的系統(tǒng)框架包含5個(gè)模塊,如圖1所示。語音識(shí)別模塊負(fù)責(zé)接受用戶的語音輸入并且將其轉(zhuǎn)成文字交給自然語言理解模塊。自然語言理解模塊在理解了用戶輸入的語義之后將特定的表達(dá)輸入對話管理模塊中。對話管理模塊負(fù)責(zé)協(xié)調(diào)各個(gè)模塊的調(diào)用以及維護(hù)當(dāng)前對話狀態(tài),并將特定的回復(fù)方式交由自然語言生成模塊進(jìn)行處理。自然語言生成模塊生成特定回復(fù)文本輸入語音合成模塊。語音合成模塊負(fù)責(zé)將文字以語音的方式輸出給用戶。
三、家庭數(shù)字娛樂智能語音應(yīng)用的系統(tǒng)設(shè)計(jì)
3.1語音為主、視覺為輔的多模態(tài)設(shè)計(jì)
目前,界面交互設(shè)計(jì)覆蓋大多數(shù)人機(jī)交互場景,視覺信息輔助用戶完成系列任務(wù)。在語音識(shí)別、語音合成技術(shù)尚未成熟階段,完全依賴于語音交互卻可能給用戶帶來困擾。語音交互設(shè)計(jì)剝離了界面設(shè)計(jì),摒棄傳統(tǒng)的界面信息指示、引導(dǎo),對用戶和設(shè)計(jì)師都是巨大的挑戰(zhàn)。用戶和產(chǎn)品的語音交互行為主要基于語音進(jìn)行信息的輸入輸出,語音信息具有瞬態(tài)即時(shí)性,復(fù)雜的語音信息輸出會(huì)增加用戶心理認(rèn)知負(fù)荷。例如,通過智能音箱購買電影票時(shí),用戶需要對電影院地理位置、影院音效、商場環(huán)境、電影放映時(shí)間、座位位置等因素進(jìn)行綜合考慮,語音助手完成任務(wù)的鏈路較長,用戶瞬時(shí)記憶能力很難完成訂票服務(wù)。3.2基于用戶使用場景的設(shè)計(jì)
隨著物聯(lián)網(wǎng)技術(shù)以及智能硬件的不斷發(fā)展,智慧家居已經(jīng)逐漸走入人們的視野,家電從冷冰冰的個(gè)體演變成了智慧的系統(tǒng)。語音交互為智能家居系統(tǒng)帶來更方便、更生動(dòng)的交互方式。從空間屬性上可將智慧家居可分為私密空間(臥室場景)、開放空間(客廳場景)和協(xié)作空間(廚房場景)三類場景。用戶在不同的細(xì)分場景下對產(chǎn)品需求各不相同,產(chǎn)品需要提供不同的業(yè)務(wù)邏輯匹配用戶的場景需求。在開放空間,家庭數(shù)字娛樂產(chǎn)品承載著公共互娛的功能屬性,如播放音樂、控制智能家居。產(chǎn)品可根據(jù)周圍環(huán)境的嘈雜程度自適應(yīng)調(diào)整語音輸出的響度,以確保用戶能夠接收到語音信息。開放空間無關(guān)的語音信息較多,產(chǎn)品要能夠屏蔽過濾掉雜音,給予用戶正確的反饋。
3.2合理進(jìn)行界面交互設(shè)計(jì)
在界面交互設(shè)計(jì)中,設(shè)計(jì)師通過視覺設(shè)計(jì)確保圖形、色彩、字體等元素保持一致性,準(zhǔn)確地將產(chǎn)品概念傳達(dá)給用戶。相比于有形的界面設(shè)計(jì)元素,語音交互設(shè)計(jì)元素趨向于無形。響度、音色、音調(diào)、節(jié)奏等元素成為語音交互設(shè)計(jì)的材料。每個(gè)人說話的語氣、咬字、節(jié)奏都是獨(dú)特的,甚至成為個(gè)性標(biāo)簽。語速快、音色脆給人年輕活潑的印象,語速慢、響度低給人沉穩(wěn)可靠的感覺。家庭數(shù)字娛樂產(chǎn)品給人有趣、輕松、智能的印象,產(chǎn)品語音交互設(shè)計(jì)需傳達(dá)一致的聽覺形象。在語音形象設(shè)計(jì)中,需要刻畫產(chǎn)品的擬人畫像,其聽覺形象需要與產(chǎn)品功能屬性保持一致,將語音信息人性化地傳達(dá)給用戶。
3.3?多輪對話的互動(dòng)性設(shè)計(jì)
語音交互因其與人類會(huì)話方式類似而被認(rèn)為是自然交互,因此語音交互也遵循著人類合作式會(huì)話的原則。哲學(xué)家保羅?格里斯認(rèn)為,輪流表達(dá)、上下文和串聯(lián)是合作式會(huì)話的組成部分,即合作原則。語音交互應(yīng)當(dāng)預(yù)判和推測用戶下一步的語音指令和上下語境關(guān)系,以保證用戶和產(chǎn)品輪流表達(dá),傳遞信息。在家居環(huán)境中,遠(yuǎn)場語音交互容易分散用戶注意力,對話應(yīng)該通過關(guān)鍵的語料元素給用戶精準(zhǔn)的語音提示或設(shè)備響應(yīng)。這種串聯(lián)式表達(dá)能夠推進(jìn)會(huì)話進(jìn)程,將上下語境內(nèi)容融合在一起。在人類日常對話中,經(jīng)常略去前文的主語或者賓語,智能硬件在多輪互動(dòng)中聯(lián)系上下語境、讀取用戶的歷史行為記錄以便更好的理解用戶。
四、結(jié)束語
隨著物聯(lián)網(wǎng)、云計(jì)算等計(jì)算機(jī)技術(shù)的發(fā)展,家庭數(shù)字娛樂產(chǎn)品之間的互聯(lián)互通成為可能。對于家庭數(shù)字娛樂系統(tǒng),現(xiàn)階段發(fā)展的最大瓶頸在于行業(yè)之間尚未形成統(tǒng)一的通信標(biāo)準(zhǔn)。在未來智能語音技術(shù)在家庭數(shù)字娛樂系統(tǒng)的發(fā)展實(shí)踐中,相關(guān)應(yīng)用程序?qū)⑨槍Σ煌挠脩粢约坝脩舳鄻踊男枨笤絹碓酵晟?,使用戶的使用體驗(yàn)更加的人性化和智能化。
參考文獻(xiàn):
[1] 人機(jī)語音交互存在的問題研究[J].葉子.科技傳播.2018(01)
[2] 移動(dòng)智能終端的語音交互設(shè)計(jì)原則初探[J].高峰,郁朝陽.工業(yè)設(shè)計(jì)研究.2019(00)
[3] 數(shù)字娛樂產(chǎn)品中的自然交互方式研究[D].譚慧.江南大學(xué)2018(11)
(作者單位:深圳智明創(chuàng)展電子有限公司)