秦洪花,趙霞
智能電視語音識別技術(shù)專利分析
秦洪花,趙霞
(青島市科學(xué)技術(shù)信息研究所,山東青島266003)
語音交互是智能電視人機交互的重要發(fā)展方向,已成為國內(nèi)外智能電視相關(guān)企業(yè)、機構(gòu)創(chuàng)新競爭的重點。重點研究語音識別交互技術(shù)的國內(nèi)外專利情況,對技術(shù)總體發(fā)展趨勢、國家分布、專利權(quán)人、重點發(fā)明人等進行分析,以期對國內(nèi)企業(yè)知識產(chǎn)權(quán)決策提供支撐。
智能電視;語音交互;語音識別;國際專利;中國專利;專利分析
【本文獻信息】秦洪花,趙霞.智能電視語音識別技術(shù)專利分析[J].電視技術(shù),2015,39(10).
智能電視作為家庭娛樂的中心,正逐步成為計算機、手機之外的第三種信息訪問溝通平臺,是未來彩電行業(yè)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整和轉(zhuǎn)型升級的主要方向[1]。在智能電視各項關(guān)鍵技術(shù)中,人機交互技術(shù)是制約電視智能化發(fā)展和普及的重要瓶頸,已成為國際國內(nèi)智能電視相關(guān)企業(yè)、機構(gòu)創(chuàng)新競爭的重點,成為智能電視專利布局的重要方向[2-3]。
語音交互是目前最被業(yè)界看好的人機交互方式之一,微軟、蘋果、IBM等國際巨頭爭相投以巨資進行研發(fā),三星、松下、創(chuàng)維、長虹、TCL等多個品牌所銷售的智能電視均已植入了語音識別功能,語音識別功能對智能電視多樣性產(chǎn)生了重大影響[4-5]。本文重點研究了語音識別交互技術(shù)的國內(nèi)外專利情況,對技術(shù)總體發(fā)展趨勢、國家分布、專利權(quán)人、重點發(fā)明人等進行分析,以期對國內(nèi)企業(yè)知識產(chǎn)權(quán)決策提供支撐。
本文的專利文獻數(shù)據(jù)主要來自湯森路透的Thomson Innovation德溫特專利數(shù)據(jù)庫和國家知識產(chǎn)權(quán)局中外專利數(shù)據(jù)庫,數(shù)據(jù)統(tǒng)計截止日期為2014年4月1日,檢索結(jié)果為全球共1 555項專利族和599件中國專利,利用TDA等專利分析軟件對這些專利進行分析。
2.1全球語音識別交互技術(shù)進入第二技術(shù)成長期
全球語音識別交互技術(shù)從20世紀(jì)70年代初開始出現(xiàn)首件專利申請以來,經(jīng)歷了20世紀(jì)80年代的技術(shù)孕育期、1996—2000年的第一技術(shù)成長期和2001—2009年的技術(shù)瓶頸期。2010年起,產(chǎn)業(yè)技術(shù)出現(xiàn)新的突破,廠商對于市場價值有了新的認知,競相投入技術(shù)研發(fā),專利申請量與專利權(quán)人數(shù)急速上升,語音識別交互技術(shù)進入第二技術(shù)成長期(見圖1)。
2.2語音控制及語音輸入/輸出是語音交互的研究熱點
語音輸入/輸出、語音數(shù)據(jù)處理系統(tǒng)、語音軟件產(chǎn)品、語音分析系統(tǒng)、語音識別、語音控制是智能電視語音交互的幾大關(guān)鍵技術(shù)。從各項關(guān)鍵技術(shù)的發(fā)展趨勢來看,除語音識別及語音分析技術(shù)專利申請量持續(xù)下滑外,語音輸入/輸出、語音數(shù)據(jù)處理、語音軟件產(chǎn)品、語音控制技術(shù)的專利申請量處于明顯增長態(tài)勢。從語音交互技術(shù)熱點遷移圖中可以看出(見圖2),語音控制技術(shù)成為智能電視語音交互的研究熱點,其次是語音輸入/輸出的研究。
圖1 語音識別交互技術(shù)生命周期圖
圖2 語音交互技術(shù)熱點遷移圖
2.3美國、日本、中國和韓國是主要技術(shù)產(chǎn)出國家
美國、日本、中國和韓國的專利量各占全球?qū)@偭康?7.7%、24.5%、13.3%、13.0%,其他國家合計占11.6%。美國起步最早,20世紀(jì)70年代即開始專利申請,2000年后專利增長迅速,目前仍處快速增長態(tài)勢,其發(fā)展重點是語音輸入/輸出、語音數(shù)據(jù)處理系統(tǒng)及語音軟件產(chǎn)品開發(fā)。日本于20世紀(jì)90年代起開始該領(lǐng)域的技術(shù)探索,2000—2007年期間專利產(chǎn)出量較大,與美國申請量相當(dāng),但2008年以后,專利量開始迅速減少,呈現(xiàn)下滑趨勢。日本的研發(fā)重點是語音輸入/輸出、語音數(shù)據(jù)處理系統(tǒng)。中國和韓國涉足時間較晚,2000年前后開始該領(lǐng)域的專利申請,2010年后專利快速增長,年度申請量已超過日本。韓國側(cè)重于語音輸入/輸出、語音分析系統(tǒng)的研究,中國的研發(fā)重點在于語音輸入/輸出、語音控制技術(shù)。
2.4重點企業(yè)集中于美國、日本和韓國,微軟居全球首位
表1顯示,微軟公司以80項專利申請位居全球首位,其后依次是松下(68項)、三星(64項)和索尼(46項)。在排名前25位公司中,日本公司數(shù)量及專利申請量占全球近四成比例。我國長虹、TCL、康佳、海爾分列全球第18位、20位、21位、24位。
表1 語音交互全球?qū)@暾埲伺琶?/p>
從表2顯示的主要申請人概況來看,三星、LG近3年的申請量占申請總量的比例較大(分別占55%、41%),遠遠超過了微軟、索尼和松下,說明這2家公司在近3年來技術(shù)發(fā)展較快,企業(yè)正在崛起。日本松下近3年專利產(chǎn)出乏力,瀕臨衰退。
表2 語音識別交互技術(shù)主要申請人概況
微軟于1999年首次進行專利申請,主要產(chǎn)出期間在2003—2006年,2004年達最高記錄(16件),其他年均在5件以下,近幾年的年均申請量維持在3~4項,未出現(xiàn)明顯增長。專利技術(shù)主要集中于語音輸入/輸出,語音軟件產(chǎn)品和語音數(shù)據(jù)處理系統(tǒng)。形成了以鄧立博士和宋歌平博士為核心成員的兩個研發(fā)團隊,團隊主要成員概況見表3。
表3 微軟公司語音研究團隊主要成員概況
2.5重要發(fā)明人主要分布于微軟、三星、松下等公司
語音交互技術(shù)發(fā)明人主要分布于微軟、船井電機、三星、韓國電子通信硏究院、松下等公司,主要發(fā)明人情況見表4。
表4 語音識別交互技術(shù)主要發(fā)明人概況
2.6重要專利主要被美國掌握,其次是日本和法國
根據(jù)Innography專利強度統(tǒng)計的全球20項重點專利中有16項來自美國,主要來自微軟、英特爾、IBM、惠普、美國電話電報公司等;其次是來自日本三星、索尼公司,及法國公司Thomson專利授權(quán)公司和阿爾卡特朗訊。全球前10項重點專利見表5。
3.1中國語音識別交互技術(shù)快速發(fā)展
中國語音識別相關(guān)技術(shù)20世紀(jì)90年代中期開始萌芽,經(jīng)歷2000—2007年間的緩慢增長階段后,于2008年起開始出現(xiàn)較快增長。目前專利增長率還比較低,尚處于技術(shù)成長期(見圖3)。
3.2國內(nèi)技術(shù)實力還較為薄弱,廣東申請量居全國首位
國內(nèi)申請人的申請量占中國專利的67.4%,主要由TCL(24件)、長虹(22件)、康佳(18件)、海爾(14件)、海信(13件)、創(chuàng)維(12件)等公司申請。按專利數(shù)量排名依次為廣東(141件)、山東(39件)、北京(33件)、四川(29件)、天津(28件)、上海(23件)、江蘇(19件)、浙江(18件)、臺灣(18件)、福建(14件),廣東省以23.7%獨占鰲頭。山東占中國專利總量的6.5%,排名國內(nèi)第二位。
表5 語音識別交互技術(shù)領(lǐng)域全球重要專利
圖3 語音交互中國專利申請量及增長率年度分布(截圖)
3.3國外來華申請不足中國專利量的四成,主要來自日本、美國、韓國和荷蘭
日本、美國、韓國和荷蘭的申請量,分別占國外申請量的31.4%、25.8%、18.0%、8.8%。來華公司主要有三星(44件)、微軟(20件)、索尼(18件)、飛利浦(17件)、松下(15件)、LG(9件)等,三星公司的申請量居各公司首位,微軟公司授權(quán)數(shù)量(11件)最多。
縱觀全球,智能電視語音識別技術(shù)進入快速發(fā)展期,新技術(shù)不斷涌現(xiàn),全球?qū)@暾埩砍掷m(xù)快速增長。我國相比國外起步晚,雖近幾年專利增長迅速,與美國、日本的專利數(shù)量差距在縮小,但仍存在核心技術(shù)掌握不足,企業(yè)總體技術(shù)實力薄弱,國際專利數(shù)量偏少等系列問題。國內(nèi)企業(yè)應(yīng)充分利用國外技術(shù)尚未大量進入中國市場這一有利條件,抓緊進行新技術(shù)研發(fā),加快國內(nèi)外市場的專利布局,力爭在這場全球電視產(chǎn)業(yè)革命中贏得先機。
[1]高峰.智能電視規(guī)范概述[J].電視技術(shù),2014,38(13):75-78.
[2]王興.淺析智能電視專利中的人機交互技術(shù)[J].集成電路應(yīng)用,2012(10):14-15.
[3]馬亞飛,鄧忠平,黃華松,等.基于智能語音的人機交互方案設(shè)計與實現(xiàn)[J].廣播電視信息,2014(1):67-69.
[4]楊碧玲.手勢和語音識別——智能家電人機交互新趨勢[J].集成電路應(yīng)用,2013(3):32-35.
[5]余華,王治平,趙力.語音信號中情感特征的分析和識別[J].電聲技術(shù),2004,28(3):30-34.
Patent Analysis on Speech Recognition Technology of Smart TV
QIN Honghua,ZHAO Xia
(Qingdao Institute of Scientific&Technical Information,Shandong Qingdao 266003,China)
As the important way to human computer interaction of smart TV,voice interaction has become the focus of innovation and competition for related businesses and organizations of smart TV.The profile of domestic and foreign patents of speech recognition technology in smart TV are analyzed and studied from aspects of overall development trends,technical outputs countries geographic distributions,key technology fields,patent applicants and key inventors and so on.It aims to help enterprises to enhance their intellectual property awareness and provide support for intellectual property decisions.
smart TV;voice interaction;speech recognition;international patents;chinese patents;patent analysis
TN949.2
A
10.16280/j.videoe.2015.10.013
秦洪花(1973—),女,副研究員,主要從事科技情報研究和專利分析工作;
許盈
2014-12-29
青島市2013年度專利分析研究專項(2013Z-08)
趙霞(1966—),女,副研究員,主要從事科技情報研究和專利分析工作。