鐘高高
(同方股份有限公司 數(shù)字電視產(chǎn)品中心,廣東 深圳 518058)
基于直播節(jié)目內(nèi)容的語音切換頻道設(shè)計
鐘高高
(同方股份有限公司 數(shù)字電視產(chǎn)品中心,廣東 深圳 518058)
分析了智能電視人機交互的發(fā)展,提出了基于直播節(jié)目內(nèi)容的語音切換頻道系統(tǒng)設(shè)計原則和具體實現(xiàn)方法。該系統(tǒng)通過對智能電視語音控制及與節(jié)目信息服務(wù)器交互的創(chuàng)新設(shè)計,實現(xiàn)了智能電視機基于直播節(jié)目的節(jié)目內(nèi)容信息,而非傳統(tǒng)的頻道號或頻道名稱進行節(jié)目切換,簡化了用戶查找和切換目標節(jié)目的操作,有效提升了智能電視的人機交互體驗。
智能電視;基于直播節(jié)目內(nèi)容;語音控制;節(jié)目信息服務(wù)器
智能電視時代,人機交互方式越來越多樣化,除了傳統(tǒng)的電視遙控器之外,語音控制、手勢識別、人臉識別等交互方式都在智能電視上得到了不同程度的應(yīng)用,各項技術(shù)正在不斷發(fā)展、日益成熟。語音控制功能目前是智能電視人機交互方式中發(fā)展相對成熟的部分,主流智能電視都配備了語音控制功能[1],且適用范圍不斷擴展,盡管如此,語音控制還是有很大的提升空間,例如看直播節(jié)目時,目前雖然可以通過語音輸入頻道名稱“CCTV1”或“湖南衛(wèi)視”來切換,但是無法通過直接呼叫“英超”或“新聞聯(lián)播”等具體節(jié)目來切換頻道。事實上,隨著電視頻道越來越多,用戶不一定知道目標節(jié)目的頻道名稱和頻道號,因此導(dǎo)入基于節(jié)目內(nèi)容的語音控制直播頻道切換,可以使智能電視人機交互更便捷和人性化,提升用戶體驗。
1)必須可以基于節(jié)目內(nèi)容實現(xiàn)語音控制直播頻道切換。用戶只需知道想看的節(jié)目名稱,不需要知道在哪個頻道播放。
2)必須在現(xiàn)有前端硬件上實現(xiàn)。之前因各省網(wǎng)及下屬有線數(shù)字電視運營商技術(shù)標準不統(tǒng)一,國內(nèi)絕大部分有線數(shù)字電視用戶均通過當?shù)赜芯€數(shù)字機頂盒+模擬電視機收看,有線數(shù)字一體機的大規(guī)模普及還很難實現(xiàn)。因此要符合用戶通過有線數(shù)字機頂盒+模擬電視機收看的現(xiàn)實需求,必須在智能模擬電視機+有線數(shù)字機頂盒上實現(xiàn)。
3)后臺搭建和維護必須簡單。雖然截至2012年9月底,全國各省(區(qū)、市)基本完成有線電視網(wǎng)絡(luò)整合,“一省一網(wǎng)”基本實現(xiàn)[2],但省網(wǎng)下各分公司頻道表并不統(tǒng)一,若每張頻道表區(qū)域配備一臺服務(wù)區(qū),則需要上千臺服務(wù)器,因此后臺搭建必須按步驟分區(qū)域?qū)嵤?,先在用戶?shù)量大的重點城市導(dǎo)入,用戶數(shù)量小的城市則后續(xù)視省網(wǎng)整合質(zhì)量導(dǎo)入。
系統(tǒng)流程圖如圖1所示。
2.1 前端硬件配置及功能描述
1)智能電視機
(1)接入互聯(lián)網(wǎng),連接語音識別后臺,接收和識別用戶語音命令。
(2)接入互聯(lián)網(wǎng),連接本地節(jié)目信息服務(wù)器,讀取有線數(shù)字電視節(jié)目信息。
(3)計算和發(fā)出頻道切換語音命令。
圖1 系統(tǒng)流程圖
(4)節(jié)目解碼輸出。
2)智能電視遙控器
(1)預(yù)留學(xué)習(xí)鍵與機頂盒遙控器的頻道0~9數(shù)字鍵對碼[3]。
(2)接收用戶語音指令,傳送給智能電視機。
(3)存儲智能電視機切換頻道語音指令樣本,接收智能電視機頻道切換指令,根據(jù)存儲樣本識別指令并發(fā)送給機頂盒[4-5]。
3)有線數(shù)字電視機頂盒
(1)將有線模擬電視轉(zhuǎn)換為有線數(shù)字電視播出。
(2)接收智能電視遙控器頻道切換指令,完成頻道切換。
4)數(shù)字機頂盒遙控器
(1)作為智能電視遙控器學(xué)習(xí)對象,完成與智能電視遙控器的對碼。
(2)數(shù)字機頂盒開關(guān)機及其他操作。
2.2 系統(tǒng)后臺設(shè)計
1)服務(wù)器配置
第一步,頻道表統(tǒng)一的百萬用戶級區(qū)域,例如天威視訊、歌華有線、東方有線、武漢有線等,每個區(qū)域配置一臺節(jié)目信息服務(wù)器,首先導(dǎo)入本系統(tǒng)。
第二步,頻道表統(tǒng)一的10萬用戶級區(qū)域,例如湖北楚天有線襄陽分公司與宜昌分公司及其下屬縣(市)級分公司,因播控時加入各自本地頻道,導(dǎo)致頻道表統(tǒng)一地區(qū)分割,各自用戶數(shù)僅為10萬級。此類地區(qū)后續(xù)再配置服務(wù)器(襄陽和宜昌及其下屬縣市各配置一臺節(jié)目信息服務(wù)器)來導(dǎo)入本系統(tǒng)。
2)節(jié)目信息錄入
人工收集當?shù)赜芯€數(shù)字電視運營商每周直播節(jié)目信息(頻道號,頻道名稱,節(jié)目名稱,播出時間),首次需要錄入一周的節(jié)目信息,生成EXCEL文件以統(tǒng)一格式命名,例如深圳天威節(jié)目表命名為SZTWEPG,歌華有線為GHYXEPG,最后存儲到節(jié)目信息服務(wù)器。節(jié)目信息獲取及錄入如圖2所示。
圖2 節(jié)目信息獲取及錄入
3)節(jié)目信息更新
首次錄入完成后,往后每天更新第7天的節(jié)目信息以保持實時更新。服務(wù)器只需存儲當天及往后6天的節(jié)目信息,以節(jié)省存儲容量和縮短關(guān)鍵字檢索時間。
4)網(wǎng)絡(luò)配置
服務(wù)器申請固定IP地址,提升連通寬帶速度。服務(wù)器并發(fā)連接數(shù)以所在區(qū)域此電視機保有量及保證短期擴容需求分配,服務(wù)器連接到互聯(lián)網(wǎng)主干線的帶寬同樣以當?shù)卮穗娨暀C保有量和短期擴容需求分配。
2.3 系統(tǒng)實現(xiàn)
1)智能電視遙控器對碼機頂盒遙控器及控制機頂盒
智能電視遙控器預(yù)留10個學(xué)習(xí)鍵,通過學(xué)習(xí)數(shù)字機頂盒遙控器數(shù)字0~9鍵的波形來對碼。智能電視向智能電視遙控器發(fā)出語音切換指令,對碼后的智能電視遙控器直接遙控機頂盒切換頻道,如圖3所示。
圖3 遙控器對碼
2)語音識別實現(xiàn)
智能電視內(nèi)置語音識別系統(tǒng),通過電視遙控器接收和連接語音模型庫識別用戶發(fā)出的語音指令控制電視進行各項操作。實現(xiàn)過程如圖4所示。
圖4 語音識別流程
3)節(jié)目信息服務(wù)器訪問
智能電視收到直播節(jié)目搜索語音指令后通過HTTP協(xié)議[6]訪問節(jié)目信息服務(wù)器。智能電視與服務(wù)器的交互通過HttpGet和HttpPost獲取數(shù)據(jù),采取XML或JSON兩種格式來傳遞數(shù)據(jù)(以Android系統(tǒng)為例)。
4)節(jié)目內(nèi)容搜索
以Android系統(tǒng)為例,首先以XML配置文件來對搜索對話框進行配置:配置一個可處理搜索請求的Activi?ty,創(chuàng)建搜索對話框配置文件,定義用戶執(zhí)行搜索的途徑為語音輸入特定指令,定義可搜索的Activity。配置和定義完成后,收到語音指令,系統(tǒng)調(diào)用搜索對話框,然后通過調(diào)用ACTION_SEARCH Intent傳送“關(guān)鍵字”到用來執(zhí)行搜索的Activity[7]。實現(xiàn)過程如圖5所示。
圖5 搜索執(zhí)行流程
5)系統(tǒng)時間獲取
智能電視連接網(wǎng)絡(luò)利用Calendar函數(shù)或Time函數(shù)(以Android系統(tǒng)為例)獲取精確到分鐘的系統(tǒng)時間,以確定時間段對應(yīng)節(jié)目信息表時間。例如收到用戶語音指令時,獲取到當前時間為“2014.05.13 14:00”,則選定05.13節(jié)目信息表來搜索用戶呼叫的節(jié)目內(nèi)容,減小搜索范圍,縮短檢索時間。系統(tǒng)時間獲取及應(yīng)用流程如圖6所示。
圖6 系統(tǒng)時間獲取及應(yīng)用流程
6)語音指令格式及響應(yīng)
設(shè)定基于直播節(jié)目內(nèi)容的語音切換頻道命令格式,添加“搜索”二字到關(guān)鍵字列表,規(guī)定以“搜索”開頭的命令的特殊跳轉(zhuǎn)方式:作為在直播頻道中搜索節(jié)目內(nèi)容并響應(yīng)搜索結(jié)果的激活指令。例如收到指令“搜索英超”,系統(tǒng)即搜索正在直播英超的頻道并切到此頻道。
同時可以避免其他命令的誤動作(如語音指令為“回主頁”時,智能電視去搜索正在播“回主頁”的頻道而不是執(zhí)行回到主頁面的動作)。語音指令格式及響應(yīng)如圖7所示。
圖7 語音指令格式及響應(yīng)
隨著科技水平的提高,電子產(chǎn)品的人機交互方式越來越多,用戶開始期望系統(tǒng)能夠簡單易用,同時對于那些交互設(shè)計低劣的系統(tǒng)的容忍度越來越差。本系統(tǒng)以簡化為初衷進行交互設(shè)計,必將顯著提升智能電視的用戶體驗。
[1] 鐘高高.清華同方智能電視的創(chuàng)新設(shè)計[J].電視技術(shù),2012,36(24):33-35.
[2] 龐井君.中國廣播電影電視發(fā)展報告(2013)[M].北京:社會科學(xué)文獻出版社,2013.
[3]徐志,何明華,林武,等.一類基于軟件載波的學(xué)習(xí)型遙控器的設(shè)計與實現(xiàn)[J].現(xiàn)代電子技術(shù),2009,33(2):36-38.
[4]趙德波,倪俊偉,趙世樂,等.一種基于語音識別的電視機遙控器設(shè)計與實現(xiàn)[J].甘肅科技,2014,30(6):14-15.
[5] 張先庭.基于SPCE061A語音遙控器的設(shè)計與實現(xiàn)[J].電聲技術(shù),2005,29(11):41-43.
[6]科默.用TCP/IP進行網(wǎng)際互連第一卷:原理、協(xié)議與結(jié)構(gòu)[M].5版.林瑤,張娟,王海,譯.北京:電子工業(yè)出版社,2007.
[7] 姚尚朗,靳巖.Android開發(fā)入門與實戰(zhàn)[M].2版.北京:人民郵電出版社,2013.
Design of Speech Control Channel Sw itching Base on Live Broadcast TV Content
ZHONG Gaogao
(HDTV,THTF,Guangdong Shenzhen 518058,China)
In the view of the development of smart TV’s human-computer interaction,the design principle and implementation method of channel switching system are put forward based on live broadcast TV content.Based on the innovative design of smart TV’s speech control and interaction with the program information server,this system realizes smart TV’s channel switching based on live broadcast TV content,rather than the traditional channel number or channel name,simplifies the operation of program searching and switching,and effectively improves the user experience of smart TV’s human-computer interaction.
smart TV;base on live broadcast TV content;speech control;program information server
TN949.12
A
??健男
2014-06-18
【本文獻信息】鐘高高.基于直播節(jié)目內(nèi)容的語音切換頻道設(shè)計[J].電視技術(shù),2014,38(21).