摘要:數(shù)字信號的頻域變換一直是教學中的難點,原因在于缺少必要的引入。本文給出了頻域變換的引入方法,從學生熟知的笛卡爾坐標開始,經(jīng)過以圖示的方式給出的信號的合成與分解,逐步將學生引入到頻域變換的公式、定理和性質(zhì)上。實踐證明,該引入方法符合學生的認知規(guī)律,顯著提高了教學效果。
關(guān)鍵詞:頻域變換;限失真信源編碼;信息論與編碼理論;信息安全
中圖分類號:G642 文獻標識碼:B
1引言
數(shù)字信號的頻域變換(或者叫做時頻變換),即時域數(shù)據(jù)與頻域數(shù)據(jù)之間的相互轉(zhuǎn)換,在信息安全專業(yè)的“信息論與編碼”,計算機專業(yè)的“數(shù)字信號處理”、“數(shù)字圖像處理”等課程中都涉及到了。這個概念是信息處理理論的基礎(chǔ)概念,透徹理解該概念對于這些專業(yè)的學生,尤其是從事音頻、視頻、圖像等多媒體數(shù)據(jù)處理的研究生來講至關(guān)重要。
然而從作者求學的切身經(jīng)歷以及多年的教學經(jīng)驗,我們感到“頻域變換”這個概念很難理解,學生掌握起來有一定困難。只有找到一個合適的切入點,將此概念與學生熟悉的知識聯(lián)系起來,才能深入淺出,讓學生輕松掌握。
2現(xiàn)有方法及其問題
現(xiàn)有講解方法在介紹了時域離散信號、時域離散系統(tǒng)等概念之后,就開始講頻域變換。頻域變換有很多種,一般從Z變換或者離散付里葉變換(Discrete Fourier Transform,DFT)講起,講解方法如下(以DFT為例):
設(shè)x(n)是一個長度為N的有限長序列,則定義x(n)的N點離散付里葉變換為
1) 理論性過強。無論是講DFT的定義,還是DFT的性質(zhì)、采樣等內(nèi)容,基本上是一個公式接著一個公式,而且公式還都比較復(fù)雜,缺少對公式必要的解釋。這使得很多學生失去了學習興趣,“看不懂”是學生的普遍反映。
2) 缺少必要的引入。一開始就是DFT的定義,那么這個定義是怎么來的呢?為什么會出現(xiàn)這樣一個定義呢?公式中各個變量的作用是什么?有了這個公式有什么好處呢?它都在哪些地方發(fā)揮作用呢?等等一系列的問題都沒有答案。而實際上,知道一個概念的來龍去脈對于理解該概念是大有好處的。
3頻域變換的引入
由于現(xiàn)有的頻域變換講解方法存在一定的問題,因此有必要研究新的講解方法,尤其是引入方法。從學生熟知的內(nèi)容開始,先讓學生有感性認識,然后逐步過渡到公式、定理和性質(zhì)上,這樣才是真正的深入淺出。作者在多年的教學過程中,總結(jié)了一套頻域變換的引入方法,其過程是“笛卡兒坐標#61664;信號的合成與分解#61664;各種常用變換的公式、定理和性質(zhì)”。
3.1笛卡爾坐標
笛卡兒坐標,這是一個在初中就學過的概念,任何一個學生對它都不會感到陌生。在這個簡單概念中就蘊含了頻域變換的基本特點。如圖1所示,講解時按如下步驟進行:
1) 坐標中的那個小黑點就是空域數(shù)據(jù),之所以稱為空域數(shù)據(jù),是因為它是空間中的一個點。在信號處理領(lǐng)域時間和空間不嚴格區(qū)分,因此空域(空間域)數(shù)據(jù)和時域(時間域)數(shù)據(jù)兩個名詞經(jīng)?;煊?。
2) x軸和y軸說白了就是空間中的兩個向量,在頻域變換中把它們叫做“基”,直觀上這兩個基互相垂直,頻域變換中“垂直”叫做正交,因此x軸和y軸就組成了一組正交基。
3) 空間中的小黑點在x軸上的坐標為1,在y軸上的坐標為2,因此它的坐標為(1,2),這段話用頻域變換的語言描述就是空域數(shù)據(jù)在基x上的系數(shù)為1,在基y上的系數(shù)為2,因此(1,2)就是頻域數(shù)據(jù)。
圖1笛卡爾坐標中的時頻變換
這樣,通過笛卡爾坐標這樣一個簡單的例子,使學生對頻域變換中的空域(時域)、頻域、基、正交、系數(shù)等概念有了初步的感性認識。
3.2信號的合成與分解
雖然學生已經(jīng)有了對頻域變換的初步認識,但這種認識建立在笛卡爾坐標之上,離信號處理領(lǐng)域有一定距離,如果此時直接開始講各種常用變換的公式、定理和性質(zhì),學生難以將兩者直接聯(lián)系起來,會破壞學生剛剛建立起來的概念和興趣,因此我們以圖示的方式描述信號的合成與分解,作為頻域變換的第二個引入。如圖2所示,講解時按如下步驟進行:
1)(a)~(d)表示的是四種信號(時域數(shù)據(jù)),橫軸表示的是時間,縱軸表示的是信號的幅度(或者叫做強度)。
2)(a)表示的是一個幅度不隨時間發(fā)生變化的信號,它的強度是5,像這樣的幅度不隨時間發(fā)生變化的信號叫做直流信號。
3)(b)表示的是信號5sin(x),(c)表示的信號是0.5sin(6x),這兩個信號相比較來說:
#61548;(b)變化的慢,是低頻信號;(c)變化的快,是高頻信號。
#61548;(b)的幅度大(為5),表示該信號能量大;(c)的幅度小(為0.5),表示該信號能量小。
4)(d)是將(a)、(b)、(c)三個信號相加之后的信號,叫做(a)、(b)、(c)的合成信號,可以看到該信號的大體趨勢與(b)信號相同,但是在細節(jié)上又不是很平滑,這是由(c)信號造成的,因此我們說低頻分量表示的是信號的主體,而高頻分量表示的是信號的細節(jié)。
5) 信號的合成講完了,反過來考慮信號的分解,(d)信號可以被分解為5、5sin(x)、0.5sin(6x)三個信號,即它可以表示為5+5sin(x)+0.5sin(6x),這其實就是一個頻域變換公式。其中的sin(x)和sin(6x)是一組正交基,之所以兩者正交,是因為兩者的內(nèi)積為0,內(nèi)積為0在笛卡爾坐標中的直觀幾何意義就是互相垂直。5sin(x)中的5是基sin(x)的系數(shù),0.5sin(6x)中的0.5是基sin(6x)的系數(shù)。因此如(e)所示,(d)信號對應(yīng)的頻域數(shù)據(jù)就是(5,5,0.5),其中第一個5是直流分量。
6) 總結(jié)上述過程可以看到,所謂的頻域變換,需要先確定一組正交基,然后將信號用這組正交基表示出來,直流分量和基的系數(shù)放在一起就是頻域數(shù)據(jù)。選擇的正交基不同,就產(chǎn)生了不同的頻域變換。通常,由時域到頻域的變換叫做頻域變換,由頻域到時域的變換叫做逆頻域變換。
講到這里,學生已經(jīng)對信號的頻域變換有了一個定性的基本認識,進一步了解了強度、直流、交流、高頻、低頻、能量、正交、變換、逆變換等概念,在此基礎(chǔ)上就可以定量地講解公式、定理和性質(zhì)了。
4在限失真信源編碼中的應(yīng)用
限失真信源編碼是“信息論和編碼理論”中一個非常重要的內(nèi)容,又叫做有損壓縮,它指的是通過對信號進行編碼來壓縮信號的數(shù)據(jù)量,這種壓縮會引起信號一定程度的失真,但是這種失真被控制在一定的范圍之內(nèi)。限失真信源編碼應(yīng)用范圍非常廣泛,尤其在多媒體編碼領(lǐng)域,像常見的JPEG、MPEG等都屬于限失真信源編碼。有了前面的兩個引入,再講限失真信源編碼原理就比較容易了,如圖3所示。
圖3限失真信源編碼
接著“信號的合成與分解”中的信號(d),該信號經(jīng)過頻域變換之后的數(shù)據(jù)為(5,5,0.5),其中的0.5是高頻分量的系數(shù),前面已經(jīng)講過,高頻分量僅影響信號的細節(jié),因此可以將高頻分量去掉而不影響信號的大體趨勢,對應(yīng)在這三個系數(shù)上就是保留前兩個系數(shù),丟棄高頻系數(shù)0.5,這樣(d)這樣一個比較復(fù)雜的信號就被編碼成了兩個實數(shù)(5,5)。
由(5,5)經(jīng)過逆變換得到被還原后的信號,可以看到被還原后的信號和編碼之前的(d)信號大體趨勢相同,但是被還原后的信號舍棄了細節(jié)。兩者不同,說明編碼過程有失真,但這種失真僅表現(xiàn)在細節(jié)上。
原理講完之后,我們還講了該原理在JPEG中的應(yīng)用。數(shù)碼相機拍攝的照片一般都是“.jpg”格式,該后綴表示采用了JPEG壓縮標準來壓縮照片的數(shù)據(jù)量。JPEG的基本原理與圖3所示的過程基本相同,它采用的頻域變換為離散余弦變換,根據(jù)人眼視覺特點舍棄頻域系數(shù)中人眼感覺不到的系數(shù),被保留下來的系數(shù)保存成“.jpg”文件,當我們看照片的時候,照片瀏覽器對“.jpg”文件進行譯碼,顯示被還原后的信號。不過此時的信號與原始信號相比,質(zhì)量已經(jīng)降低了,不過人眼感覺不到這種差別。
5結(jié)束語
本文中提到的頻域變換的引入是作者結(jié)合自己的科研經(jīng)驗,在教學過程中不斷總結(jié)最終設(shè)計出來的。該引入一經(jīng)在課堂上講解,立刻引起了學生的興趣,大家進行了熱烈的討論,并促使學生主動鉆研課程內(nèi)容,收到了很好的教學效果。
參考文獻
[1] 姜楠. “信息論”課程本科教學探索與實踐[J]. 計算機教育,2007,(24):52-54.
[2] 姜楠. 中美“信息論”課程教學的比較和啟示[J]. 計算機教育,2008,(13):120-122,117.