陳 斌(國家知識產(chǎn)權局專利局專利審查協(xié)作廣東中心,廣州 510530)
?
3D字幕專利技術分析
陳 斌
(國家知識產(chǎn)權局專利局專利審查協(xié)作廣東中心,廣州 510530)
摘 要:3D字幕技術主要涉及3D字幕視差調(diào)整、字幕視差數(shù)據(jù)的傳輸,本文結合相關專利文獻對3D字幕技術進行簡單的分析。
關鍵詞:3D字幕;視差調(diào)整;索尼公司
字幕是電影中不可或缺的元素。3D電影中的字幕不同于傳統(tǒng)2D電影的字幕,3D字幕本身具有一定的立體效果。3D字幕由字幕添加器在合適的立體深度位置疊加原有的3D視頻內(nèi)容從而生成具有3D效果的立體電影。3D字幕的立體效果由3D字幕視差決定。區(qū)別于傳統(tǒng)的2D字幕技術,3D字幕技術主要涉及3D字幕的視差調(diào)整、3D字幕視差數(shù)據(jù)的傳輸。
有兩種類型的字幕可以添加至視頻中:對話字幕(subtitle)和屏幕字幕(caption)。一般而言,對話字幕適用于有聽力的觀眾,屏幕字幕適用于耳聾的觀眾。對話字幕可以將對話翻譯成不同語言,但是很少示出全部音頻。例如,屏幕字幕示出音效(例如,“電話鈴響”和“腳步聲”),而對話字幕則不這樣做。對于屏幕字幕,用戶可以根據(jù)實際需要選擇是否添加。
作為3D電影或者3D視頻中的附加信息或者輔助信息,在應用層面上,早期立體電影往往直接將字幕放置在立體圖像的最前端,字幕始終漂浮在顯示屏的前面,這樣做的好處在于技術簡單,然而面對立體效果不加考慮。隨著人們對立體效果的要求不斷提高以及計算機處理技術的提高,不斷出現(xiàn)新的3D字幕視差調(diào)整的相關技術。下面結合相關專利文獻分析了三種典型的3D字幕視差調(diào)整技術:
2.1將最大視差設置為字幕視差
為了適應不斷變化的3D對象的視差以及不遮擋觀眾對3D對象的觀賞,專利文獻CN101653011A中提出了在與3D內(nèi)容中最大深度值相同的水平處插入字幕,并進一步地公開了逐幀求取最大深度值以及多幀求取最大深度值兩種思路,對于每一個對話字幕,在深度映射中深度值等于最大深度值處添加文本框。由此產(chǎn)生與3D內(nèi)容相結合的文本,其中所述文本不阻礙3D內(nèi)容中的3D效果并且在觀看者觀看時不產(chǎn)生視覺疲勞。
2.2基于聲音數(shù)據(jù)調(diào)整字幕視差
為了增加字幕與視頻內(nèi)容的互動效果,提高字幕的顯示效果,專利文獻CN102111631A中基于接收的音頻數(shù)據(jù)的音頻音量級來自適應地修改3D字幕的視差,從而以更好的效果來顯示3D字幕。通過預先存儲音頻音量級與字幕視差的對應關系值,使得當聲音增大時,字幕更加突出地顯示。與此同時,當聲音大于一閾值時,還將字幕的圖形數(shù)據(jù)相應地改變?yōu)榻档土送该鞫鹊摹⒓t色的圖形數(shù)據(jù),使得以更好的效果顯示3D字幕。
2.3以線性模型的方式傳輸字幕視差數(shù)據(jù)
針對逐幀改變字幕視差而產(chǎn)生的字幕視差數(shù)據(jù)量大的問題,專利文獻CN102783159A通過線性模型來擬合字幕視差變化曲線,具體地,設計數(shù)據(jù)結構[幀間隔,斜率],視差數(shù)據(jù)的序列將預定斜率假設為斜率變化的基準,在每一幀中使用視差數(shù)據(jù),以確定閉合字幕顯示的左、右眼視圖的水平偏移,進而確定感知到的z軸位置。提供用于觀眾在3DTV環(huán)境中觀看字幕的優(yōu)化機制,避免視頻對象可能會出現(xiàn)在字幕前方或者后方;減少用于傳輸視差數(shù)據(jù)的數(shù)據(jù)量,最小化對用于字幕服務的可用帶寬的影響。
索尼公司的專利申請涉及3D字幕視差調(diào)整、字幕數(shù)據(jù)傳輸,在3D字幕技術領域占據(jù)了主導地位。索尼公司的申請?zhí)朠CT/ JP2010/060579(20100622)提出在立體圖像數(shù)據(jù)的接收側(cè),可以使用已經(jīng)根據(jù)圖像內(nèi)的各個物體的遠近感而被施加了視差調(diào)整的重疊信息,從而使得可以在重疊信息的顯示中保持遠近感的一致性。申請?zhí)朩O2011US26291(20110225)提出通過接收由幀間隔與斜率變化的值組成的數(shù)據(jù)結構的視差數(shù)據(jù),從而減少用于傳輸視差數(shù)據(jù)的數(shù)據(jù)量,最小化對用于字幕服務的可用帶寬的影響。申請?zhí)朠CT/ JP2011/071564(20110922)提出字幕的顯示范圍設置以及信息內(nèi)容的設置,從而以最佳狀態(tài)保持關于每個對象的透視的一致性。申請?zhí)朠CT/JP2011/074368(20111021)提出使用具有用于發(fā)送用作3D字幕的管理信息的顯示控制信息的數(shù)據(jù)單元的第二數(shù)據(jù)流和插入數(shù)據(jù)單元中的視差信息,從而在接收側(cè)可以向已經(jīng)疊加在左眼圖像和右眼圖像上的字幕單元施加適當?shù)囊暡睢?/p>
3D字幕的相關專利文獻主要涉及3D字幕視差調(diào)整以及視差數(shù)據(jù)的傳輸,本文結合相關專利文獻分析了幾種典型的3D字幕視差調(diào)整技術,這些技術旨在根據(jù)現(xiàn)有的計算機處理能力以及人們對于立體效果的追求而不斷改進3D字幕的顯示效果。索尼公司的專利申請涉及3D字幕視差調(diào)整、字幕數(shù)據(jù)傳輸,在3D字幕技術領域占據(jù)了主導地位。
參考文獻:
[1]袁敏,趙劍,李偉華等.3D電視技術專利分析[J].電視技術,2013,37(S2).
[2]梁麗.3D字幕技術研究[J].中國優(yōu)秀碩士學位論文全文數(shù)據(jù)庫(電子期刊)信息科技輯,2012(08).
DOI:10.16640/j.cnki.37-1222/t.2016.13.133