劉 越,章文輝
(中國傳媒大學 信息工程學院,北京 100024)
隨著全國高清頻道數(shù)量的不斷增多和相關政策的發(fā)布,人們已經(jīng)完全迎來了高清時代。高清視頻無疑帶來了更逼真的視覺享受,如何獲得更高的聽覺享受,也將逐漸成為另一研究課題。
數(shù)字音頻數(shù)據(jù)流可以通過電纜線單獨傳輸,也可嵌入在數(shù)字視頻SDI流每一行的HBI(行逆程)中的輔助數(shù)據(jù)空間中傳輸。數(shù)字視頻嵌入音頻,并非單獨傳輸音頻數(shù)據(jù),而是將音頻數(shù)據(jù)按照一定格式封裝成數(shù)據(jù)包,在視頻信號的輔助數(shù)據(jù)空間內傳輸。這樣不僅解決了視頻、音頻不同步的問題,也大大節(jié)省了傳輸路線和裝配成本。但是,對于電視臺、影像公司、電影制作公司等傳媒公司,常常需要單獨對數(shù)字音頻進行監(jiān)控和測量。所以,如何實現(xiàn)嵌入數(shù)字音頻的解嵌和分析,也得到越來越多的關注。
鑒于上述問題,筆者設計了基于SMPTE299M標準的HDTV嵌入數(shù)字音頻分析軟件。突破傳統(tǒng)基于硬件的系統(tǒng)設計,采用軟件從HD-SDI抓包文件中提取出一幀音頻數(shù)據(jù),實現(xiàn)非實時分析和檢測,對系統(tǒng)測試、理論研究、實踐教學有著重要意義。
AES/EBU數(shù)字音頻接口標準規(guī)定,音頻數(shù)據(jù)以2的補碼進行編碼,接口可以對取樣頻率為48 kHz、44.1 kHz和32 kHz,量化比特數(shù)為24,20和16的數(shù)字音頻信號進行實時傳輸,并提供輔助信息。
數(shù)字聲音的數(shù)據(jù)按照幀劃分,每個數(shù)據(jù)幀(frame)為64 bit,分為兩個子幀,即Sub-frame 1和Sub-frame 2。每個子幀中的前4 bit為前置碼,用于子幀、幀和塊的同步和識別。每個子幀的后4 bit(V,U,C,P)為輔助數(shù)據(jù),各比特位所代表的功能如表1所示[1-4]。
表1 輔助數(shù)據(jù)[5]
每192個音頻幀(frame)構成1個音頻塊(block)。有3種前置碼X,Y和Z,Z標志每個音頻塊的開始。每個音頻塊中,除了第1個音頻幀的Sub-frame 1的前置碼用Z標識外,其余各幀的Sub-frame 1的前置碼都為X;所有Sub-frame 2的前置碼都用Y表示[6]。AES/EBU音頻與音頻數(shù)據(jù)包之間的關系如圖1所示。
高清隔行掃描行、場定時關系如圖2所示。
高清隔行掃描系統(tǒng),每幀圖像共1125 行。有效視頻區(qū)1080 行,數(shù)字場消隱區(qū)45行。其中,第21~560行為第1場有效視頻區(qū),第584~1123 為第2場有效視頻區(qū);第1124 行、1125 行和l~20行為第1場數(shù)字場消隱區(qū),第561~583行為第2場數(shù)字消隱區(qū)。
HD-SDI信號里,除了有效視頻信號之外,在視頻信號消隱區(qū)里還包含其他信息[8],如有效視頻的起始點SAV和終止點EAV、行數(shù)信息LN、冗余校驗碼CRC、輔助數(shù)據(jù)ANC等信息。數(shù)字音頻信號嵌入在分量數(shù)字視頻格式有效行的輔助數(shù)據(jù)區(qū)中。行消隱期間的取樣708個取樣字,在標準中用“SAV”和“EAV”予以界定。音頻信號嵌入在輔助數(shù)據(jù)ANC內[7]。
HD-SDI即高清串行數(shù)字接口,用于傳輸高清視頻。HD-SDI信號由亮度數(shù)據(jù)流和兩個色差數(shù)據(jù)流復用而成,針對4∶2∶2的樣點結構,亮度信號取樣頻率為13.5 MHz,兩個色差信號取樣頻率為6.75 MHz,以10 bit進行量化,所以基本碼率為1485 Mbit/s。其數(shù)據(jù)流結構如圖3所示(T為取樣周期)。
嵌入到視頻數(shù)據(jù)中的音頻包有2種:音頻控制包(Audio Control Packet,ACP)、音頻數(shù)據(jù)包(Audio Data Packet,ADP)[9]。高清音頻數(shù)據(jù)包支持24位,不存在音頻擴展包。音頻數(shù)據(jù)包的長度是固定的,且每個包只包含每個音頻組中4個通道的各1個音頻數(shù)據(jù)。高清音頻數(shù)據(jù)包中還包含一些額外的數(shù)據(jù)和糾錯數(shù)據(jù)。
音頻數(shù)據(jù)包只在色差數(shù)據(jù)流(Cb/Cr)的行附屬數(shù)據(jù)空間傳輸。在由源視頻格式定義的切換點之后的一行所在的附屬數(shù)據(jù)空間內,不插入音頻數(shù)據(jù)包。音頻數(shù)據(jù)包結構如圖4所示,由附屬數(shù)據(jù)標志(ADF)、數(shù)據(jù)標志符(DID)、數(shù)據(jù)塊序號(DBN)、數(shù)據(jù)計數(shù)(DC)、用戶數(shù)據(jù)字(UDW)及校驗和(CS)組成[6]。
每4個音頻數(shù)據(jù)構成1個音頻組,每個音頻組都對應1個音頻控制包。1個給定的音頻組中的全部音頻通道應具有相同的取樣頻率、取樣相位和同步/異步狀態(tài),這些控制信息都包含在音頻控制包內。
音頻控制包應當每場傳輸一次,因為隔行掃描2場為一幀,所以每幀HD-SDI傳輸2次音頻控制包。音頻控制包在Y并行數(shù)據(jù)流視頻切換點(Video Switching Point)之后第二行的行附屬數(shù)據(jù)空間內傳輸。音頻數(shù)據(jù)包結構如圖5所示,由附屬數(shù)據(jù)標志(ADF)、數(shù)據(jù)標志符(DID)、數(shù)據(jù)塊序號(DBN)、數(shù)據(jù)計數(shù)(DC)、用戶數(shù)據(jù)字(UDW)、校驗和(CS)組成[6]。
軟件設計的系統(tǒng)框圖如圖6所示。大體分為3部分:音頻控制包和音頻數(shù)據(jù)包的提取;音頻控制包和音頻數(shù)據(jù)包格式的分析;音頻數(shù)據(jù)的提取和取補[9]。
為驗證本文所述分析的可行性,按照圖6所示的流程,利用C語言編程實現(xiàn)。數(shù)據(jù)源采用一幀HD-SDI抓包文件,成功實現(xiàn)分析任意行音頻數(shù)據(jù)包和音頻控制包的格式,取出音頻個數(shù)、采樣頻率和嵌入的音頻通道數(shù)。實驗結果如圖7所示。
HD-SDI數(shù)據(jù)量很大,1幀畫面有400多萬個數(shù)據(jù)。限于軟件處理速度,該實驗采取實時讀取、分析的設計思路。每讀取一行便分析一行,對需要的數(shù)據(jù)進行處理、顯示、存儲,不需要的數(shù)據(jù)則直接跳過。音頻數(shù)據(jù)包和音頻控制包以附屬數(shù)據(jù)標志(ADF)即000,3FF,3FF為標志。音頻數(shù)據(jù)包嵌入在輔助數(shù)據(jù)空間中,所以編程實現(xiàn)直接跳過有效視頻區(qū)。音頻控制包只嵌入在視頻切換點之后的第2行的行附屬數(shù)據(jù)空間。以1125 /50/2∶1系統(tǒng)為例,切換點在第7行及第659行,所以只需在Y并行流的第9行及第571行的行附屬數(shù)據(jù)空間內尋找音頻控制包。同時,實驗采用多線程技術,以提高效率。
本文提出的基于SMPTE299的HD-SDI嵌入音頻分析軟件實現(xiàn)簡單,通用性強。隨著高清數(shù)字廣播電視的逐步發(fā)展和高清電視的不斷普及,對嵌入音頻的分析和研究,也將占據(jù)越來越重要的地位。雖然限于軟件的處理速度,只能進行靜態(tài)分析,但其對理論研究、實驗教學、系統(tǒng)測試都具有重要意義,對于高清數(shù)字電視的發(fā)展與變革也有一定推動作用。
[1]王明臣,姜秀華,張永輝.數(shù)字電視與高清晰度電視[M].北京:中國廣播電視出版社,2003.
[2]姜秀華,張永輝.數(shù)字電視廣播原理與應用[M].北京:人民郵電出版社,2007.
[3]Society of Motion Picture and Television Engineers.SMPTE292M-1998 Bit-Serial digital interface for high-definition television systems[S].1998.
[4]國家廣播電影電視總局.GY/T 162-2000高清晰度電視串行接口中作為附屬數(shù)據(jù)信號的24比特數(shù)字音頻格式[S].2000.
[5]SMPTE.ANSI/SMPTE 299M-199724 -Bit digital audio format for hdtv bit-serial interface[S].1997.
[6]HARDING P,SHERRATT R,GUY C.Convergence of standard defi?nition(SD)and high definition(HD)SDI for audio multiplexing and de-multiplexing by implementing modular design[C]//Proc.2004 IEEE International Symposium on Consumer Electronics.[S.l.]:IEEE Press,2004:541-544.
[7]姜秀華,柴劍平,林正豹,等.現(xiàn)代電視原理[M].北京:高等教育出版社,2008.
[8]李寧.HD-SDI信號的特征及檢測方法的提案[J].現(xiàn)代電視技術,2004,(8):35-42.
[9]謝元祿,張春,王志華.基于SMPTE272M標準的音頻加解嵌系統(tǒng)設計[J].電視技術,2008,32(7):10-23.